CN108710948A - 一种基于聚类均衡和权重矩阵优化的迁移学习方法 - Google Patents
一种基于聚类均衡和权重矩阵优化的迁移学习方法 Download PDFInfo
- Publication number
- CN108710948A CN108710948A CN201810378299.2A CN201810378299A CN108710948A CN 108710948 A CN108710948 A CN 108710948A CN 201810378299 A CN201810378299 A CN 201810378299A CN 108710948 A CN108710948 A CN 108710948A
- Authority
- CN
- China
- Prior art keywords
- sample set
- sample
- cluster
- weight matrix
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于聚类均衡和权重矩阵优化的迁移学习方法,包括定义源域样本集和目标域样本集;对源域样本集以及目标域样本集样本的标签重新赋值;对源域样本集和目标域样本集中样本进行降维;对源域样本集中样本进行基于特征的无监督聚类分析;对每个聚类进行均衡处理;为每个聚类学习度量矩阵;根据聚类及度量矩阵,生成权重矩阵;对权重矩阵优化;利用权重矩阵预测目标域样本集中样本的标签。本发明通过无监督的聚类分析方法将源域样本集分为多个不同的聚类,使每个聚类具有相似的属性;同时基于各个聚类生成权重矩阵,并对其进行优化,更符合目标域样本集的实际情况,利用该权重矩阵对目标域样本集的标签进行预测,准确度更高。
Description
技术领域
本发明涉及智能识别技术领域,更具体地说涉及一种迁移学习方法。
背景技术
所述的迁移学习,对于人类来说,就是类似于举一反三的意思,利用已有的知识来学习新的知识,解决新的问题;而在机器学习来说,迁移学习在通俗意义上来讲就是能让现有的模型算法稍加调整即可应用于一个相似的领域和功能的一项技术。
现有的迁移学习主要包括三种类型,基于特征的迁移学习、基于实例的迁移学习以及基于度量的迁移学习。其中,基于特征的迁移学习和基于实例的迁移学习是使用欧氏距离来衡量样本之间的距离,而欧氏距离不能够反应出样本的不同维度之间的关联。基于度量的迁移学习方法虽然考虑了样本的不同维度之间的关联,但这种学习方法和前两种类型一样,样本的类型完全取决于标签的种类,从而忽视了样本特征的本质属性,也就是忽略了不同标签的样本特征之间也可能存在的某些关联。
发明内容
针对上述问题,本发明考虑了样本特征所隐含的本质属性,也就是考虑了不同标签的样本特征之间也可能存在的某种关联,提供一种基于聚类均衡和权重矩阵优化的迁移学习方法,能够将源域知识更好地迁移到目标域。
本发明解决其技术问题的解决方案是:
一种基于聚类均衡和权重矩阵优化的迁移学习方法,包括以下步骤:
步骤A.定义源域样本集DS以及目标域样本集DT,所述目标域样本集DT分为两部分,分别为样本贴有标签的第一样本集DTL以及样本没有贴标签的第二样本集DTU,所述第二样本集DTU的样本数量远大于第一样本集DTL的数量;
步骤B.对所述源域样本集DS以及目标域样本集DT中样本的标签进行重新赋值;
步骤C.对所述源域样本集DS以及目标域样本集DT中的样本进行降维操作;
步骤D.对所述源域样本集DS中的样本进行基于特征的无监督聚类分析,生成若干个聚类;
步骤E.对每个所述聚类进行均衡处理;
步骤F.为每个所述聚类学习一个度量矩阵G;
步骤G.根据所述聚类及其度量矩阵G,以及第一样本集DTL,学习权重矩阵W的初始值;
步骤H.根据所述第一样本集DTL,对所述权重矩阵W进行优化;
步骤I.利用所述权重矩阵W预测第二样本集DTU的样本的标签。
作为上述技术方案的进一步改进,所述步骤C中利用主成分分析法对所述源域样本集DS以及目标域样本集DT中的样本进行降维操作。除此以外还可以采用特征选择法进行降维操作。
作为上述技术方案的进一步改进,所述步骤F包括以下步骤:
步骤F1.针对每个所述聚类,将聚类中的样本顺序随机化;
步骤F2.设置收敛条件,将度量矩阵G初始化为单位矩阵;
步骤F3.设置求解度量矩阵G的目标函数,记为公式1;
其中G0表示单位矩阵,xi和xj是聚类中的样本,S表示xi和xj同类,D表示xi和xj是不同类,所述α和β分别代表第一阈值和第二阈值;
步骤F4.求解所述度量矩阵G的目标函数,直到符合收敛条件。
作为上述技术方案的进一步改进,所述步骤G具体包括以下步骤:
步骤G1.为每个聚类学习出一个基分类器Modeli,其中i表示第i个聚类;
步骤G2.设置所述基分类器Modeli的训练函数,所述训练函数如公式2所示;
Modeli=BaseLearner(Ci,Qi,Gi) 公式2
其中Ci为第i个聚类,Gi为第i个聚类的度量矩阵,Qi表示的是第一样本集DTL中与第i个聚类最近的样本集合;
步骤G3.基于基分类器Modeli的训练函数,利用度量矩阵Gi,对聚类Ci和集合Qi进行特征变换,并对特征进行归一化处理,完成对基分类器Modeli的训练;
步骤G4.利用函数BaseLearnerPred(Ci,Gj,Modelj),求解所有(Ci,Gj)对第一样本集DTL中样本的预测标签,其中1≤i,j≤n,n为聚类的数量,各个(Ci,Gj)的预测准确率形成权重矩阵W的初始值W0。
作为上述技术方案的进一步改进,所述步骤H具体包括以下步骤:
步骤H1.根据所述权重矩阵W的初始值W0,计算第一样本集合DTL中样本的预测标签;
步骤H2.设置损失函数和正则项,所述损失函数如公式3所示;
norm(Lpred*wt-Lreal) 公式3
其中wt是度量矩阵W第t列的值,是步骤H中需要优化的值,Lpred是经过权重矩阵W0计算得到的预测标签,Lreal是真实标签,所述正则项如公式4所示;
norm(wt-b) 公式4
其中b是权重矩阵W0第t列的值;
步骤H3.利用第一样本集合DTL中样本,通过公式5求得wt的最优值;
minimize(lamda*norm(wt-b)+norm(Lpred*wt-Lreal)) 公式5
其中lamda表示平衡因子。
本发明的有益效果是:本发明通过基于特征的无监督聚类分析方法将源域样本集DS分为多个不同的聚类,使每个聚类具有相似的属性;同时基于各个聚类生成权重矩阵,并对其进行优化,更符合目标域样本集的实际情况,利用该权重矩阵对目标域样本集的第二样本集DTU的样本标签进行预测,预测效果更好。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单说明。显然,所描述的附图只是本发明的一部分实施例,而不是全部实施例,本领域的技术人员在不付出创造性劳动的前提下,还可以根据这些附图获得其他设计方案和附图。
图1是本发明的方法流程示意图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。
参照图1,本发明创造公开了一种基于聚类均衡和权重矩阵优化的迁移学习方法,该迁移学习方法可应用于智能机器人场景识别、药品识别以及智能监控等领域。
一种基于聚类均衡和权重矩阵优化的迁移学习方法,包括以下步骤:
步骤A.定义源域样本集DS以及目标域样本集DT,所述目标域样本集DT分为两部分,分别为样本贴有标签的第一样本集DTL以及样本没有贴标签的第二样本集DTU,所述第二样本集DTU的样本数量远大于第一样本集DTL的数量;
步骤B.对所述源域样本集DS以及目标域样本集DT中的样本标签进行重新赋值;
步骤C.对所述源域样本集DS以及目标域样本集DT中的样本进行降维操作;
步骤D.对所述源域样本集DS中的样本进行基于特征的无监督聚类分析,生成若干个聚类;
步骤E.对每个所述聚类进行均衡处理;
步骤F.为每个所述聚类学习一个度量矩阵G;
步骤G.根据所述聚类及其度量矩阵G,以及第一样本集DTL,学习权重矩阵W的初始值;
步骤H.根据所述第一样本集DTL,对所述权重矩阵W进行优化;
步骤I.利用所述权重矩阵W预测第二样本集DTU的样本的标签。
具体地,本发明通过基于特征的无监督聚类分析方法将源域样本集DS分为多个不同的聚类,使每个聚类的样本特征之间具有某种关联;同时基于各个聚类生成权重矩阵,并对其进行优化,更符合目标域样本集的实际情况,利用该权重矩阵对目标域样本集中未知标签的样本的标签进行预测,预测效果更好。
以下对所述迁移学习方法中的各个步骤进行详细说明。
步骤A中,首先定义源域样本集DS以及目标域样本集DT,其中所述目标域样本集DT分为两部分,分别为样本贴有标签的第一样本集DTL以及样本没有贴标签的第二样本集DTU,所述第二样本集DTU的样本数量远大于第一样本集DTL的数量,其中通常第一样本集DTL数量是目标域样本集DT数量的百分之五。实际应用中,本方法所述源域样本集DS以及目标域样本集DT中的样本是服从不同的数据分布,但是第一样本集DTL和第二样本集DTU中样本是服从相同的数据分布,因此当得到第一样本集DTL的预测模型,即可用该预测模型预测第二样本集DTU中的样本。简单的说,本方法是利用源域样本集DS和第一样本集DTL生成初始的预测模型,并用第一样本集DTL对预测模型进行优化,利用优化之后的预测模型对第二样本集DTU中样本进行预测。
步骤B中,对所述源域样本集DS以及目标域样本集DT中的样本标签进行重新赋值,本步骤中重新赋值前,若两个样本的标签是相同的,则重新赋值后这两个样本的标签依旧相同。重新赋值之后的标签是从1到n的整数值。本发明中对各个样本标签重新赋值,目的在于便于在后续步骤中学习、使用具有多分类功能的基分类器。
步骤C中,需要对所述源域样本集DS以及目标域样本集DT中的样本进行降维操作,本发明具体实施例中,具体是利用主成分分析法或者特征选择法对所述源域样本集DS以及目标域样本集DT中的样本进行降维操作,通过以上两种降维函数,可将样本数据从几万维,甚至数百万维降低到几十维,同时保留样本的主要特性。
步骤D中,对所述源域样本集DS中的样本进行基于特征的无监督聚类分析,生成若干个聚类,其中,所生成聚类的数量可视实际情况而定。
步骤E中,对每个所述聚类进行均衡处理。本发明具体实施例中,所述步骤E的具体操作如下:在某个聚类中,假设标签k对应的样本数量最多,记为Sk,对于任意的其他标签y,该聚类中标签为y的样本数量为Sy,该源域样本集DS中标签为y的样本数量为dy,从源域样本集DS中随机抽取min{(Sk-Sy),dy}个标签为y的样本,添加到当前聚类中。进行均衡处理后,同一聚类中的某些样本可能会重复出现,进行均衡处理的目的在于防止某个标签的样本数量过少。
步骤F中,为每个聚类学习一个度量矩阵G,其中本发明具体实施例中,步骤F具体包括以下步骤:
步骤F1.针对每个所述聚类,将聚类中的样本顺序随机化,使得在后续步骤中被选中的样本更具有随机性;
步骤F2.设置收敛条件,将度量矩阵G初始化为单位矩阵,本实施例中,所述收敛条件可以有两种,第一是以迭代次数超过某个阀值作为收敛条件,第二是以度量矩阵的变化幅度小于某个阀值作为收敛条件。本发明实施例优先采用的是以度量矩阵的变化幅度小于某个阀值作为收敛条件;
步骤F3.设置求解度量矩阵G的目标函数,记为公式1;
其中G0表示单位矩阵,xi和xj是聚类中的样本,S表示xi和xj同类,D表示xi和xj是不同类,所述α和β分别代表第一阈值和第二阈值;其中所述度量矩阵的作用是将样本从一个空间转换到另一个空间,在新的空间里,任意两个样本之间的距离都用马氏距离表示,如果两个样本之间的距离小于第一阀值,那么它们就是相似的,如果它们之间的距离大于第二阀值,那么它们就是不相似的,本实施例利用如下公式表示马氏距离,本发明具体实施例中设置第一阈值和第二阈值的过程如下,从某个聚类中,随机选择若干个样本对,将它们之间的距离按从小到大的顺序排列,前5%对应的距离值就是第一阈值,前95%对应的距离值就是第二阈值(通常选取5%、95%为临界点)。例如,如果这100个(假设为100个)距离值都不重复,并且从1到100均匀分布,那么第一阈值为5,第二阈值为95;
步骤F4.求解所述度量矩阵G的目标函数,直到符合收敛条件,获得度量矩阵G。通过公式1,若经过降维后样本维度是50,则求得的度量矩阵G是50*50的矩阵。
步骤G中,根据所述聚类及其度量矩阵G,以及第一样本集DTL,生成权重矩阵W并学习权重矩阵W的初始值,本发明具体实施例中,步骤G具体包括以下步骤:
步骤G1.为每个聚类学习出一个基分类器Modeli,其中i表示第i个聚类;
步骤G2.设置所述基分类器Modeli的训练函数如公式2所示;
Modeli=BaseLearner(Ci,Qi,Gi) 公式2
其中Ci为第i个聚类,Gi为第i个聚类的度量矩阵,Qi表示第一样本集DTL中与聚类i的距离最近的样本集合;其中集合Qi通过以下方法求得,首先计算每个聚类的聚类中心,针对第一样本集DTL,计算第一样本集DTL每个样本到各个聚类中心的欧氏距离,如果某个样本离聚类Ci最近,则将其存入集合Qi中,集合Qi的内容最初为空;
步骤G3.基于基分类器Modeli的训练函数,利用度量矩阵Gi,对聚类Ci和集合Qi进行特征变换,并对特征进行归一化处理,完成对基分类器Modeli的训练;
步骤G4.利用函数BaseLearnerPred(Ci,Gj,Modelj),求解所有(Ci,Gj)对第一样本集DTL中样本的预测标签,其中1≤i,j≤n,n为聚类的数量,各个(Ci,Gj)的预测准确率形成权重矩阵W的初始值W0。
步骤G中,各个聚类Ci以及所有度量矩阵Gj之间形成表1所示关系。
表1
其中表1中,W11、W12……Wnn组成权重矩阵W。
步骤H中,需要对所述权重矩阵W进行优化,目的在于使第一样本集DTL中样本的预测标签与真实标签差异最小,本发明具体实施例中,步骤H具体包括以下步骤:
步骤H1.根据所述权重矩阵W的初始值W0,计算第一样本集合DTL中样本的预测标签;
步骤H2.设置损失函数和正则项,所述损失函数如公式3所示;
norm(Lpred*wt-Lreal) 公式3
其中wt是度量矩阵W第t列的值,是步骤H中需要优化的值,Lpred是经过权重矩阵W0计算得到的预测标签,Lreal是真实标签,所述正则项如公式4所示;
norm(wt-b) 公式4
其中b是权重矩阵W0第t列的值;
步骤H3.利用第一样本集合DTL中样本,通过公式5求得wt的最优值;
minimize(lamda*norm(wt-b)+norm(Lpred*wt-Lreal)) 公式5
其中lamda表示平衡因子。
步骤I中,用所述权重矩阵W预测第二样本集DTU中样本的标签。具体地,在步骤H中,利用第一样本集DTL对权重矩阵进行优化,而由于第一样本集DTL和第二样本集DTU样本数据分布一致,因此优化后的权重矩阵同样适用于预测第二样本集DTU样本的标签。所述第二样本集DTU的每个样本必然和某一个聚类的距离最近。此处以聚类Ci为例子进行说明,假设第一样本集DTL里与聚类Ci最近的样本集为Ri,首先采用函数BaseLearnerPred预测样本集Ri的标签,假设(Ci,Gj)对样本Ri的预测标签为pred(Ri),那么对于同一个聚类Ci,样本集Ri中的每个样本都可以通过如下公式进行预测,pred(Ri)=pred(Ri)+W(Ci,Gj),接着,样本集Ri里的每个样本都使用max函数(以MATLAB软件为例)求解使得pred(Ri)取得最大值的标签序号,最终得到相应的预测值Final(Ri),即Final(Ri)=max(pred(Ri))。因为之前进行了重赋值操作,所以现在最后只需将预测值还原为真实值即可。
以上对本发明的较佳实施方式进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变型或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。
Claims (5)
1.一种基于聚类均衡和权重矩阵优化的迁移学习方法,其特征在于,包括以下步骤:
步骤A.定义源域样本集DS以及目标域样本集DT,所述目标域样本集DT分为两部分,分别为样本贴有标签的第一样本集DTL以及样本没有贴标签的第二样本集DTU,所述第二样本集DTU的样本数量远大于第一样本集DTL的数量;
步骤B.对所述源域样本集DS以及目标域样本集DT中样本的标签进行重新赋值;
步骤C.对所述源域样本集DS以及目标域样本集DT中的样本进行降维操作;
步骤D.对所述源域样本集DS中的样本进行基于特征的无监督聚类分析,生成若干个聚类;
步骤E.对每个所述聚类进行均衡处理;
步骤F.为每个所述聚类学习一个度量矩阵G;
步骤G.根据所述聚类及其度量矩阵G,以及第一样本集DTL,学习权重矩阵W的初始值;
步骤H.根据所述第一样本集DTL,对所述权重矩阵W进行优化;
步骤I.利用所述权重矩阵W预测第二样本集DTU样本的标签。
2.根据权利要求1所述的一种基于聚类均衡和权重矩阵优化的迁移学习方法,其特征在于:所述步骤C中利用主成分分析法对所述源域样本集DS以及目标域样本集DT中的样本进行降维操作。
3.根据权利要求2所述的一种基于聚类均衡和权重矩阵优化的迁移学习方法,其特征在于,所述步骤F包括以下步骤:
步骤F1.针对每个所述聚类,将聚类中的样本顺序随机化;
步骤F2.设置收敛条件,将度量矩阵G初始化为单位矩阵;
步骤F3.设置求解度量矩阵G的目标函数,记为公式1;
其中G0表示单位矩阵,xi和xj是聚类中的样本,S表示xi和xj同类,D表示xi和xj是不同类,所述α和β分别代表第一阈值和第二阈值;
步骤F4.求解所述度量矩阵G的目标函数,直到符合收敛条件。
4.根据权利要求3所述的一种基于聚类均衡和权重矩阵优化的迁移学习方法,其特征在于,所述步骤G包括以下步骤:
步骤G1.为每个聚类学习出一个基分类器Modeli,其中i表示第i个聚类;
步骤G2.设置所述基分类器Modeli的训练函数,所述训练函数如公式2所示;
Modeli=BaseLearner(Ci,Qi,Gi) 公式2
其中Ci为第i个聚类,Gi为第i个聚类的度量矩阵,Qi表示的是第一样本集DTL中与第i个聚类最近的样本集合;
步骤G3.基于基分类器Modeli的训练函数,利用度量矩阵Gi,对聚类Ci和集合Qi进行特征变换,并对特征进行归一化处理,完成对基分类器Modeli的训练;
步骤G4.利用函数BaseLearnerPred(Ci,Gj,Modelj),求解所有(Ci,Gj)对第一样本集DTL中样本的预测标签,其中1≤i,j≤n,n为聚类的数量,各个(Ci,Gj)的预测准确率形成权重矩阵W的初始值W0。
5.根据权利要求4所述的一种基于聚类均衡和权重矩阵优化的迁移学习方法,其特征在于,所述步骤H包括以下步骤:
步骤H1.根据所述权重矩阵W的初始值W0,计算第一样本集合DTL中样本的预测标签;
步骤H2.设置损失函数和正则项,所述损失函数如公式3所示;
norm(Lpred*wt-Lreal) 公式3
其中wt是度量矩阵W第t列的值,是步骤H中需要优化的值,Lpred是经过权重矩阵W0计算得到的预测标签,Lreal是真实标签,所述正则项如公式4所示;
norm(wt-b) 公式4
其中b是权重矩阵W0第t列的值;
步骤H3.利用第一样本集合DTL中样本,通过公式5求得wt的最优值;
minimize(lamda*norm(wt-b)+norm(Lpred*wt-Lreal)) 公式5
其中lamda表示平衡因子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810378299.2A CN108710948B (zh) | 2018-04-25 | 2018-04-25 | 一种基于聚类均衡和权重矩阵优化的迁移学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810378299.2A CN108710948B (zh) | 2018-04-25 | 2018-04-25 | 一种基于聚类均衡和权重矩阵优化的迁移学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108710948A true CN108710948A (zh) | 2018-10-26 |
CN108710948B CN108710948B (zh) | 2021-08-31 |
Family
ID=63866812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810378299.2A Active CN108710948B (zh) | 2018-04-25 | 2018-04-25 | 一种基于聚类均衡和权重矩阵优化的迁移学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108710948B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934281A (zh) * | 2019-03-08 | 2019-06-25 | 电子科技大学 | 一种二分类网络的非监督训练方法 |
CN110009038A (zh) * | 2019-04-04 | 2019-07-12 | 北京百度网讯科技有限公司 | 筛查模型的训练方法、装置及存储介质 |
CN110070535A (zh) * | 2019-04-23 | 2019-07-30 | 东北大学 | 一种基于实例迁移学习的视网膜血管图像分割方法 |
CN110555060A (zh) * | 2019-09-09 | 2019-12-10 | 山东省计算中心(国家超级计算济南中心) | 基于成对样本匹配的迁移学习方法 |
CN111161239A (zh) * | 2019-12-27 | 2020-05-15 | 上海联影智能医疗科技有限公司 | 医学图像分析方法、装置、存储介质及计算机设备 |
CN111209935A (zh) * | 2019-12-26 | 2020-05-29 | 武汉安视感知科技有限公司 | 基于自适应域转移的无监督目标检测方法及系统 |
CN111461191A (zh) * | 2020-03-25 | 2020-07-28 | 杭州跨视科技有限公司 | 为模型训练确定图像样本集的方法、装置和电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060047655A1 (en) * | 2004-08-24 | 2006-03-02 | William Peter | Fast unsupervised clustering algorithm |
US20150116493A1 (en) * | 2013-10-24 | 2015-04-30 | Xerox Corporation | Method and system for estimating gaze direction of vehicle drivers |
CN105023024A (zh) * | 2015-07-23 | 2015-11-04 | 湖北大学 | 一种基于正则化集合度量学习的遥感图像分类方法及系统 |
CN107169511A (zh) * | 2017-04-27 | 2017-09-15 | 华南理工大学 | 基于混合聚类集成选择策略的聚类集成方法 |
US20170270387A1 (en) * | 2016-03-15 | 2017-09-21 | Tata Consultancy Services Limited | Method and system for unsupervised word image clustering |
CN107563410A (zh) * | 2017-08-04 | 2018-01-09 | 中国科学院自动化研究所 | 基于局部类别一致聚类和多任务学习的分类方法及设备 |
CN107944716A (zh) * | 2017-11-29 | 2018-04-20 | 国网江苏省电力有限公司 | 基于学习结果修正的变电站电能计量周期平衡异常诊断方法 |
-
2018
- 2018-04-25 CN CN201810378299.2A patent/CN108710948B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060047655A1 (en) * | 2004-08-24 | 2006-03-02 | William Peter | Fast unsupervised clustering algorithm |
US20150116493A1 (en) * | 2013-10-24 | 2015-04-30 | Xerox Corporation | Method and system for estimating gaze direction of vehicle drivers |
CN105023024A (zh) * | 2015-07-23 | 2015-11-04 | 湖北大学 | 一种基于正则化集合度量学习的遥感图像分类方法及系统 |
US20170270387A1 (en) * | 2016-03-15 | 2017-09-21 | Tata Consultancy Services Limited | Method and system for unsupervised word image clustering |
CN107169511A (zh) * | 2017-04-27 | 2017-09-15 | 华南理工大学 | 基于混合聚类集成选择策略的聚类集成方法 |
CN107563410A (zh) * | 2017-08-04 | 2018-01-09 | 中国科学院自动化研究所 | 基于局部类别一致聚类和多任务学习的分类方法及设备 |
CN107944716A (zh) * | 2017-11-29 | 2018-04-20 | 国网江苏省电力有限公司 | 基于学习结果修正的变电站电能计量周期平衡异常诊断方法 |
Non-Patent Citations (4)
Title |
---|
YIHUI LUO .ECT: "Clustering Ensemble for Unsupervised Feature Selection", 《2009 SIXTH INTERNATIONAL CONFERENCE ON FUZZY SYSTEMS AND KNOWLEDGE DISCOVERY》 * |
刘江涛: "距离度量学习中的类别不平衡问题研究", 《中国优秀硕士学位论文全文数据库》 * |
庄广安: "基于字典学习的无监督迁移聚类及其在SAR图像分割中的应用", 《中国优秀硕士学位论文全文数据库》 * |
曹丽君: "基于迁移学习和特征融合的人脸识别算法的研究", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934281A (zh) * | 2019-03-08 | 2019-06-25 | 电子科技大学 | 一种二分类网络的非监督训练方法 |
CN109934281B (zh) * | 2019-03-08 | 2021-01-26 | 电子科技大学 | 一种二分类网络的非监督训练方法 |
CN110009038A (zh) * | 2019-04-04 | 2019-07-12 | 北京百度网讯科技有限公司 | 筛查模型的训练方法、装置及存储介质 |
CN110070535A (zh) * | 2019-04-23 | 2019-07-30 | 东北大学 | 一种基于实例迁移学习的视网膜血管图像分割方法 |
CN110555060A (zh) * | 2019-09-09 | 2019-12-10 | 山东省计算中心(国家超级计算济南中心) | 基于成对样本匹配的迁移学习方法 |
CN110555060B (zh) * | 2019-09-09 | 2023-05-02 | 山东省计算中心(国家超级计算济南中心) | 基于成对样本匹配的迁移学习方法 |
CN111209935A (zh) * | 2019-12-26 | 2020-05-29 | 武汉安视感知科技有限公司 | 基于自适应域转移的无监督目标检测方法及系统 |
CN111161239A (zh) * | 2019-12-27 | 2020-05-15 | 上海联影智能医疗科技有限公司 | 医学图像分析方法、装置、存储介质及计算机设备 |
CN111161239B (zh) * | 2019-12-27 | 2024-02-27 | 上海联影智能医疗科技有限公司 | 医学图像分析方法、装置、存储介质及计算机设备 |
CN111461191A (zh) * | 2020-03-25 | 2020-07-28 | 杭州跨视科技有限公司 | 为模型训练确定图像样本集的方法、装置和电子设备 |
CN111461191B (zh) * | 2020-03-25 | 2024-01-23 | 杭州跨视科技有限公司 | 为模型训练确定图像样本集的方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108710948B (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710948A (zh) | 一种基于聚类均衡和权重矩阵优化的迁移学习方法 | |
Karaboga et al. | A quick artificial bee colony (qABC) algorithm and its performance on optimization problems | |
CN111753101B (zh) | 一种融合实体描述及类型的知识图谱表示学习方法 | |
Gong et al. | Interactive evolutionary algorithms with decision-maker׳ s preferences for solving interval multi-objective optimization problems | |
Cao et al. | A PSO-based cost-sensitive neural network for imbalanced data classification | |
CN110163262A (zh) | 模型训练方法、业务处理方法、装置、终端及存储介质 | |
CN109784405A (zh) | 基于伪标签学习和语义一致性的跨模态检索方法及系统 | |
Xiang et al. | Incremental few-shot learning for pedestrian attribute recognition | |
He et al. | Algorithm-data driven optimization of adaptive communication networks | |
Rezaei et al. | GuASPSO: a new approach to hold a better exploration–exploitation balance in PSO algorithm | |
CN105260746B (zh) | 一种可扩展的多层集成多标记学习系统 | |
Zhang et al. | UCPSO: A uniform initialized particle swarm optimization algorithm with cosine inertia weight | |
Boney et al. | Semi-supervised and active few-shot learning with prototypical networks | |
Zhou et al. | Expert training: Task hardness aware meta-learning for few-shot classification | |
Wang et al. | Text clustering algorithm based on deep representation learning | |
Luo et al. | A novel sequential switching quadratic particle swarm optimization scheme with applications to fast tuning of PID controllers | |
CN117575672A (zh) | 一种基于时空特征迁移学习的行业电量预测方法、装置 | |
CN108182243A (zh) | 一种基于Spark的分布式进化算法岛模型并行化方法 | |
Patel et al. | Study and analysis of particle swarm optimization for improving partition clustering | |
Zhang et al. | An Algorithm Research for Prediction of Extreme Learning Machines Based on Rough Sets. | |
Gratch | Sequential inductive learning | |
Gong et al. | Interactive Genetic Algorithms with Individual Fitness Not Assigned by Human. | |
CN108875961A (zh) | 一种基于预界机制的在线加权极限学习机方法 | |
Wu et al. | A training-free neural architecture search algorithm based on search economics | |
Sun et al. | Classification and regression-based surrogate model-assisted interactive genetic algorithm with individual's fuzzy fitness |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |