CN102324046A - 结合主动学习的四分类器协同训练方法 - Google Patents
结合主动学习的四分类器协同训练方法 Download PDFInfo
- Publication number
- CN102324046A CN102324046A CN201110257571A CN201110257571A CN102324046A CN 102324046 A CN102324046 A CN 102324046A CN 201110257571 A CN201110257571 A CN 201110257571A CN 201110257571 A CN201110257571 A CN 201110257571A CN 102324046 A CN102324046 A CN 102324046A
- Authority
- CN
- China
- Prior art keywords
- sorter
- training
- sorters
- sample
- study
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种结合主动学习的四分类器协同训练方法,涉及结合主动学习的协同训练,属于机器学习技术领域。本发明在实现过程中使用了四个分类器,及主动学习,对协同训练方法作了进一步的改进。本发明由于采用四个分类器进行协同训练,将三个分类器的判决都一致的样本直接添加到训练集中,可以保证在提高未标记样本置信度的同时,避免引入过多噪声;本发明由于针对难分样本进行主动学习,提高了学习的效果,同时对这类样本的妥善处理有助于修正各分类器的识别函数;本发明由于将三个分类器的判决都不一致的样本作为难分样本,使得进行主动学习的条件要求较高,且实现简单。本发明适用于诸如网页分类、图象处理、人脸识别、入侵监测等应用领域。
Description
技术领域
本发明属于机器学习技术领域,涉及结合主动学习的协同训练,具体是一种结合主动学习的四分类器协同训练方法,可用于提高半监督学习中未标记样本的利用率,进一步提高半监督学习的学习性能。所提出的方法适用于诸如网页分类、图象处理、人脸识别、入侵监测等应用领域。
背景技术
标准协同训练方法是Blum和Mitchell在1998年提出的。他们提出了标准协同训练方法基于如下三个基本假设:(1)属性集可以被划分为两个集合;(2)每一个属性集的子集合都足以训练一个分类器;(3)在给定类标记的情况下,这两个属性集是相互独立的。其中每个属性集构成一个视图,满足上述假设的视图称为充分冗余的视图。然后分别对已标记的样本在这两个属性集上训练分类器,这样得到两个分类器,将这两个分类器应用到未标记样本上,然后选择每个分类器对分类结果置信度高的未标记样本以及该样本的预测标记加入到另一个分类器已标记样本集中进行下一轮的训练,如此迭代。
标准协同训练方法的前提条件比较苛刻,在真实的问题中,满足充分冗余的要求往往很难达到。就Blum和Mitchell所述的网页分类而言,因为网页本身的信息这一视图与超链接上的信息这一视图很难满足条件独立性,而且大多数问题不具有足够大的属性集,因此很难满足该方法有效的前提条件。很多研究人员就尝试放松这三个假设。也有学者提出了使用不同的分类器在整个属性集上训练的方法,训练时,首先利用已标记样本对两个不同的分类器在整个属性集上进行训练,再用这两个分类器互相将自己在未标记样本上置信度较高的标记加入到对方的训练集中去再训练。此后又将集成学习的思想加入到以前的方法中去提高算法性能,基于整个属性集训练一组分类器,利用投票机制对未标记样本进行标记,加入到已标记样本集中再训练,最后的分类结果由一种改进的加权投票机制决定。但是由于上述的方法挑选未标记示例进行标记的过程中以及选择分类器对未见示例进行预测的过程中频繁地使用10倍交叉验证,使得其计算开销很大,因此Z.H.Zhou和M.Li在2005年提出了tri-training的方法,使用三个分类器,如果两个分类器分类结果一致,那么就将该未标记样本加入到已标记样本中去,这样的做法避免了频繁地计算10倍交叉验证,节省了计算开销,同时他们的方法不需要基于冗余的视图。并且他们基于噪音学习理论分析出以较高概率确保这一做法有效的条件,在引入大量未标记样本的情况下,噪声所带来的负面影响可以被抵消。
Tri-Training方法的步骤如下:
输入:未标记数据集Du,已标记数据集(初始训练集)D1,测试集T,某种学习算法L。
输出:分类的错误率。
Step1:随即抽样D1,抽取三次,得到样本数等于|D1|的三个训练集Si,Si,S3,用L训练出分类器C1,C2,C3。
Step2:对于任一个由算法L训练出的分类器Ci(i=1,2,3),维护其独自的训练集Si(i=1,2,3),将满足{x|x∈Du,且Cj(x)=Ck(x),j,k≠i}的无标记样本x加入到Si中。遍历完Du后,得到更新后的Si’。
Step3:对于每个Ci(i=1,2,3),若|Si′|>|Si|,则对Ci利用训练集Si’重新训练,得到分类器Ci’。
Step4:对于每个Ci,若Ci′≠Ci,则转Step2,直到3个分类器都不再更新为止。
Step5:最终的判决结果由这3个分类器的判决结果组合而成。
通过上面的步骤可以看出来,标准的Tri-Training方法,使用的是3个同构的分类器,通过在D1上随机抽取样本大小为|D1|的数据来训练出不同的分类器,训练出三个分类器C1,C2,C3都维护着各自的训练集。遍历未标记数据集Du,对于每一个样本,由其中两个分类器协同对其类别进行判断,如果分类一致就加入到第三个分类器的训练集中,遍历完后在更新后的训练集上使用学习算法重新训练分类器,重复此过程直到分类器都不再更新为止。
在协同训练方法中,扩充训练集的前提是对未标记样本进行标记,该标记的置信度非常重要,如果置信度很低,那会引入很多“噪声”,训练出的分类器性能会降低,用两个分类器对一个未标记样本做判断,判断一致的概率很高,考虑一种极端情况,待标记样本只有两种可能的类别,即使分类器是对样本随机分类的,依然有50%的概率分类一致,因此引入更多的分类器对未标记样本的类别做出判定可以提高被标记样本的置信度,若多个分类器对一个样本的标记一致,则该标记的置信度会更高。另一方面,对于两个分类器判定不一致的未标记样本,传统协同训练方法的做法是舍弃该样本,这样会对未标记样本造成一定程度的浪费,尤其是当两个分类器误识率比较高,数据集的类别比较多时,对于未标记样本类别的判定不一致的可能性会增大。
发明内容
本发明的目的在于克服现有协同训练方法的不足,提出一种结合主动学习的四分类器协同训练方法,避免了在学习过程中引入过多噪声,提高了对标记样本的利用率,实现简单,能够得到更高的识别率。
本发明是一种结合主动学习的四分类器协同训练方法,即CTA(CollaborativeTraining with Active Learning)。为了实现发明目的,本发明的技术方案是:采用四个分类器进行协同训练并结合主动学习技术提高半监督学习性能,操作步骤包括:
(1)选取对数据集敏感的学习算法L;
(2)针对给定的未标记数据集Du、已标记数据集(初始训练集)D1、测试集T及学习算法L,对D1运用Bootstrap技术抽取四次,得到样本数等于|D1|的四个训练集S1,S2,S3,S4,用L训练出分类器C1,C2,C3,C4;
(3)对于任一个由算法L训练出的分类器Ci(i=1,2,3,4),维护其独自的训练集Si(i=1,2,3,4),将满足{x|x∈Du,且Cj(x)=Ck(x)=Cm(x),j,k,m≠i}的无标记样本x加入到Si中,将满足{x|x∈Du,且Cj(x)≠Ck(x)≠Cm(x),j,k,m≠i}的无标记样本x,由主动学习对其类别进行标记后也加入到Si中,遍历完Du后,得到更新后的Si’;
(4)对于每个Ci(i=1,2,3,4),若|Si′|>|Si|,则对Ci利用训练集Si’重新训练,得到分类器Ci’;
(5)对于每个Ci,若Ci’≠Ci,则转(3),直到四个分类器都不再更新为止;
(6)最终的判决结果由四个分类器的判决结果组合而成,输出分类的错误率。
现有的使用三个分器的Tri-Training技术中,在更新每一个分类器的训练集时,对于每一个未标记样本,另外两个分类器判决结果一致的可能性很大,使未标记样本的置信度不够高,会引入许多噪音;在本发明中,使用了四个分类器,提高了未标记样本的置信度,从而避免了引入噪音。
在传统的协同训练方法中,对于两个分类器分类不一致的标记样本,在操作中会舍弃这个样本,在一定程度上造成了对未标记样本的浪费;本发明中采取了对训练集敏感的学习算法,在分类器对未标记样本分类都不一致时,利用主动学习对这样的未标记样本进行标记并加以利用,从而更有效的利用了未标记样本并且有助于修正各分类器的分类函数。
本发明的实现还在于:步骤(3)所述的主动学习对无标记样本x进行标记时,是在实验验证中通过查看原始数据集获取真实类别实现的;这样做可以更有效的利用未标记样本,通过这样的处理有助于修正各分类器的分类函数。
本发明的实现还在于:步骤(3)所述的步骤中使用了四个分类器;根据未标记样本数量和分类器的识别率来选择更合适的分类器数目;使用多个分类器,可以提高未标记样本的置信度,避免引入噪音,以得到更好的分类效果。
本发明的实现还在于:步骤(6)所述的四个分类器的判决结果组合,采用多数投票规则;尽量提高了分类的正确率。
本发明的实现使用了四个分类器,在对每一个分类器的训练集更新的过程中,其它三个分类器的判决结果不一致的情况下,使用了主动学习,有效利用了未标记样本,提高了分类的正确率。与现有技术相比,本发明的有益效果有:
一、本发明由于采用四个基分类器进行协同训练,将三个分类器的判决都一致的样本直接添加到训练集中,可以保证在提高未标记样本置信度的同时,避免引入过多噪声;
二、本发明由于针对难分样本进行主动学习,提高了半监督学习的效果,其本质上就是专家会诊,具有重要的现实意义,同时对这类样本的妥善处理有助于修正各分类器的识别函数;
三、本发明由于将三个分类器的判决都不一致的样本作为难分样本,使得进行主动学习的条件要求较高,且实现简单。
附图说明
图1是本发明的流程框图;
图2是三种半监督学习算法训练出的集成分类器识别率的对比;
图3是本发明的结构框图;
具体实施方式
实施例1:
本发明是一种结合主动学习的四分类器协同训练方法,即CTA方法,以i ris为例,给出CTA方法的实施过程如下:
输入:包含96个样本的未标记数据集Du,包含24个样本的已标记数据集D1,包含30个样本的测试集T。
输出:测试集T上的分类错误率。
①选取对数据集敏感的朴素贝叶斯算法L;
②针对取出的包含96个样本的未标记数据集Du、包含24个样本的已标记数据集(初始训练集)D1、包含30个样本的测试集T及朴素贝叶斯算法L,结合图1对D1运用Bootstrap技术抽取四次,得到样本数等于|D1|的四个训练集S1,S2,S3,S4,用算法L训练出分类器C1,C2,C3,C4;
由于选取了对训练集敏感的朴素贝叶斯学习算法L,这四个分类器的差异性足够大,提高了分类的效果。
③结合图1对于任一个由算法L训练出的分类器Ci(i=1,2,3,4),维护其独自的训练集Si(i=1,2,3,4),将满足{x|x∈Du,且Cj(x)=Ck(x)=Cm(x),j,k,m≠i}的未标记样本x加入到Si中,将满足{x|x∈Du,且Cj(x)≠Ck(x)≠Cm(x),j,k,m≠i}的无标记样本x,由主动学习对未标记样本x进行标记后也加入到Si中,遍历完Du后,得到更新后的Si’。
在这个步骤中使用了四个分类器;在未标记样本数量U一定的情况下,分类器越多,能够有效利用(若干个分类器对无标记样本的分类一致时,这个样本就是叫有效利用)的样本数越少;一方面更多的分类器对一个样本类别标记一致时,该标记的置信度更高,另一方面能够有效利用的样本数越多,训练的分类器识别率越高;根据未标记样本数量和分类器的识别率来选择更合适的分类器数目。
在主动学习对无标记样本x进行标记时,是在实验验证中通过查看原始数据集获取真实类别实现的。
实验中,还统计了在10次实验中CTA方法通过主动学习标记类别的平均次数;iris的未标记样本数目为96,通过主动学习标记类别的平均次数为1.9;可见通过主动学习标记类别的次数是很少的;
④对于每个Ci(i=1,2,3,4),若|Si′|>|Si|,则对Ci利用训练集Si’重新训练,得到分类器Ci’;
⑤对于每个Ci,若Ci’≠Ci,则转(3),直到四个分类器都不再更新为止;
⑥最终的判决结果由四个分类器的判决结果组合而成,输出分类的错误率。
通过使用三种半监督学习算法训练出的集成分类器识别率的对比,如图2所示,CTA方法优于Co-Training方法和Tri-Training方法,学习效果很好,且主动学习的次数很少,表明该方法使用尽可能少的查询获得了强泛化能力,是一种效果良好的半监督学习方法。
实施例2:
结合主动学习的四分类器协同训练方法同实施例1,以thyroid为例,参见图3,具体流程如下:
取出552个数据放入已标记数据集,取出138个数据放入未标记数据集,剩下的数据放放入测试集。在已标记数据集的基础上,用Boostrap方法取出四个大小为552个的训练样本集。用已选取的学习算法对这四个训练样本集分别训练,得出四个分类器。用这四个分类器去判定未标记数据集中的数据,对于一个分类器C来说,如果其他三个分类器的判决结果是相同的,那这个数据被标记为分类器的判决结果,然后加入到分类器C相对应的训练样本集里,如果其他三个分类器的判决结果彼此都不相同,那么用主动学习将这个数据标记后加入到C相对应的训练样本集中。如果分类器对应的训练集有更新,就用新的数据集去重新训练相对应的分类器,然后验证,直到分类器无更新为止。用训练好的四个分类器对测试集的数据进行分类,最后的判决结果以四个分类器的判决结果组合而成。
具体实施方式如例1,通过实验验证,如图2所示,相对于Co-Training方法和Tri-Training方法,CTA方法的学习效果很好;在CTA的10次实验中,未标记样本数为138,主动学习的次数为2.5次,表明本发明使用尽可能少的查询获得了强泛化能力,是一种避免引入噪声,识别率更高,效果良好的半监督学习方法。
实施例3:
结合主动学习的四分类器协同训练方法同实施例1-2,以wine为例,具体实施方式如例1,通过实验验证,如图2所示的wine数据集的结果,CTA方法的学习效果优于Co-Training方法和Tri-Training方法;在CTA的10实验中,未标记样本数为114,主动学习的平均次数为1.7次,表明本发明使用尽可能少的查询获得了强泛化能力,是一种实现简单,识别率更高,效果良好的半监督学习方法。
实施例4:
结合主动学习的四分类器协同训练方法同实施例1-3以heart为例,具体实施方式如例1,通过实验验证,如图2所示的heart数据集的,CTA方法的学习效果优于Co-Training方法和Tri-Training方法;在CTA的10次实验中,未标记样本数为173,由于heart是二分类数据,所以没有使用主动学习,但效果要好于Co-Training方法和Tri-Training方法,表明本发明是一种强泛化性,效果良好的半监督学习方法。
本发明公开了一种结合主动学习的四分类器协同训练方法,涉及结合主动学习的协同训练,属于机器学习技术领域。本发明在实现过程中使用了四个分类器,并且使用了主动学习,对协同训练方法进一步的改进。本发明由于采用四个基分类器进行协同训练,将三个分类器的判决都一致的样本直接添加到训练集中,可以保证在提高未标记样本置信度的同时,避免引入过多噪声;本发明由于针对难分样本进行主动学习,提高了半监督学习的效果,同时对这类样本的妥善处理有助于修正各分类器的识别函数;本发明由于将三个分类器的判决都不一致的样本作为难分样本,使得进行主动学习的条件要求较高,且实现简单。本发明适用于诸如网页分类、图象处理、人脸识别、入侵监测等应用领域。
Claims (4)
1.结合主动学习的四分类器协同训练方法,其特征在于:采用四个分类器进行协同训练并结合主动学习技术提高半监督学习性能,操作步骤包括:
(1)选取对数据集敏感的学习算法L;
(2)针对给定的未标记数据集Du、已标记数据集(初始训练集)D1、测试集T及学习算法L,对D1运用Bootstrap技术抽取四次,得到样本数等于|D1|的四个训练集S1,S2,S3,S4,用算法L对四个训练集分别训练出分类器C1,C2,C3,C4;
(3)对于任一个由算法L训练出的分类器Ci(i=1,2,3,4),维护其独自的训练集Si(i=1,2,3,4),将满足{x|x∈Du,且Cj(x)=Ck(x)=Cm(x),j,k,m≠i}的无标记样本x加入到Si中,将满足{x|x∈Du,且Cj(x)≠Ck(x)≠Cm(x),j,k,m≠i}的无标记样本x,由主动学习对无标记样本x进行标记后也加入到Si中,遍历完Du后,得到更新后的Si’;
(4)对于每个分类器Ci(i=1,2,3,4),若|Si′|>|Si|,则对Ci利用训练集Si’重新训练,得到分类器Ci’;
(5)对于每个分类器Ci,若Ci’≠Ci,则转步骤(3),直到四个分类器都不再更新为止;
(6)最终的判决结果由四个分类器的判决结果组合而成,输出分类的错误率。
2.根据权利要求1所述的结合主动学习的四分类器协同训练方法,其特征在于,步骤(3)所述的主动学习对无标记样本x进行标记时,是在实验验证中通过查看原始数据集获取真实类别实现的。
3.根据权利要求1所述的结合主动学习的四分类器协同训练方法,其特征在于,步骤(3)所述的步骤中使用了四个分类器;根据未标记样本数量和分类器的识别率来选择更合适的分类器数目。
4.根据权利要求1所述的结合主动学习的四分类器协同训练方法,其特征在于,步骤(6)所述的四个分类器的判决结果组合,采用多数投票规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110257571A CN102324046A (zh) | 2011-09-01 | 2011-09-01 | 结合主动学习的四分类器协同训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110257571A CN102324046A (zh) | 2011-09-01 | 2011-09-01 | 结合主动学习的四分类器协同训练方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102324046A true CN102324046A (zh) | 2012-01-18 |
Family
ID=45451785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110257571A Pending CN102324046A (zh) | 2011-09-01 | 2011-09-01 | 结合主动学习的四分类器协同训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102324046A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663264A (zh) * | 2012-04-28 | 2012-09-12 | 北京工商大学 | 桥梁结构健康监测静态参数的半监督协同评估方法 |
CN103426007A (zh) * | 2013-08-29 | 2013-12-04 | 人民搜索网络股份公司 | 一种机器学习分类方法及装置 |
CN103744924A (zh) * | 2013-12-26 | 2014-04-23 | 西安理工大学 | 基于频繁模式的选择性集成分类方法 |
CN104732246A (zh) * | 2015-03-05 | 2015-06-24 | 重庆邮电大学 | 一种半监督协同训练高光谱图像分类方法 |
CN104794500A (zh) * | 2015-05-11 | 2015-07-22 | 苏州大学 | 一种tri-training半监督学习方法及装置 |
CN107978373A (zh) * | 2017-11-23 | 2018-05-01 | 吉林大学 | 一种基于共训练的半监督生物医学事件抽取方法 |
CN109242013A (zh) * | 2018-08-28 | 2019-01-18 | 北京九狐时代智能科技有限公司 | 一种数据标注方法、装置、电子设备及存储介质 |
CN109299744A (zh) * | 2018-10-19 | 2019-02-01 | 合肥非度信息技术有限公司 | 合同公章分类模型的训练方法、系统和识别方法、系统 |
CN109359697A (zh) * | 2018-10-30 | 2019-02-19 | 国网四川省电力公司广元供电公司 | 一种电力设备巡检中使用的图形图像识别方法及巡查系统 |
CN109389180A (zh) * | 2018-10-30 | 2019-02-26 | 国网四川省电力公司广元供电公司 | 一款基于深度学习的电力设备图像识别方法及巡查机器人 |
CN109478229A (zh) * | 2016-08-31 | 2019-03-15 | 富士通株式会社 | 用于字符识别的分类网络的训练装置、字符识别装置及方法 |
WO2019105258A1 (zh) * | 2017-11-30 | 2019-06-06 | 中国银联股份有限公司 | 基于机器学习的数据分类方法及系统 |
CN110135263A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 人像属性模型构建方法、装置、计算机设备和存储介质 |
CN111007068A (zh) * | 2019-11-21 | 2020-04-14 | 中国兵器工业信息中心 | 基于深度学习的黄色培育钻石品级分类方法 |
CN111126504A (zh) * | 2019-12-27 | 2020-05-08 | 西北工业大学 | 多源不完备信息融合图像目标分类方法 |
CN111340261A (zh) * | 2018-12-03 | 2020-06-26 | 北京嘀嘀无限科技发展有限公司 | 判定订单违规行为的方法、系统、计算机设备及存储介质 |
CN111489792A (zh) * | 2020-04-14 | 2020-08-04 | 西安交通大学 | 一种基于半监督学习框架的t细胞受体序列分类方法 |
CN111538852A (zh) * | 2020-04-23 | 2020-08-14 | 北京达佳互联信息技术有限公司 | 多媒体资源处理方法、装置、存储介质及设备 |
CN112219270A (zh) * | 2018-06-05 | 2021-01-12 | 科磊股份有限公司 | 用于缺陷分类器训练的主动学习 |
CN113221115A (zh) * | 2021-07-09 | 2021-08-06 | 四川大学 | 基于协同学习的可视化恶意软件检测方法 |
CN113379000A (zh) * | 2021-07-13 | 2021-09-10 | 四川大学 | 一种自适应更新的网络入侵检测方法 |
US11526802B2 (en) | 2019-06-25 | 2022-12-13 | International Business Machines Corporation | Model training using a teacher-student learning paradigm |
-
2011
- 2011-09-01 CN CN201110257571A patent/CN102324046A/zh active Pending
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663264B (zh) * | 2012-04-28 | 2015-02-25 | 北京工商大学 | 桥梁结构健康监测静态参数的半监督协同评估方法 |
CN102663264A (zh) * | 2012-04-28 | 2012-09-12 | 北京工商大学 | 桥梁结构健康监测静态参数的半监督协同评估方法 |
CN103426007A (zh) * | 2013-08-29 | 2013-12-04 | 人民搜索网络股份公司 | 一种机器学习分类方法及装置 |
CN103426007B (zh) * | 2013-08-29 | 2016-12-28 | 人民搜索网络股份公司 | 一种机器学习分类方法及装置 |
CN103744924A (zh) * | 2013-12-26 | 2014-04-23 | 西安理工大学 | 基于频繁模式的选择性集成分类方法 |
CN104732246A (zh) * | 2015-03-05 | 2015-06-24 | 重庆邮电大学 | 一种半监督协同训练高光谱图像分类方法 |
CN104732246B (zh) * | 2015-03-05 | 2018-04-27 | 重庆邮电大学 | 一种半监督协同训练高光谱图像分类方法 |
CN104794500A (zh) * | 2015-05-11 | 2015-07-22 | 苏州大学 | 一种tri-training半监督学习方法及装置 |
CN109478229A (zh) * | 2016-08-31 | 2019-03-15 | 富士通株式会社 | 用于字符识别的分类网络的训练装置、字符识别装置及方法 |
CN109478229B (zh) * | 2016-08-31 | 2021-08-10 | 富士通株式会社 | 用于字符识别的分类网络的训练装置、字符识别装置及方法 |
CN107978373A (zh) * | 2017-11-23 | 2018-05-01 | 吉林大学 | 一种基于共训练的半监督生物医学事件抽取方法 |
WO2019105258A1 (zh) * | 2017-11-30 | 2019-06-06 | 中国银联股份有限公司 | 基于机器学习的数据分类方法及系统 |
CN112219270A (zh) * | 2018-06-05 | 2021-01-12 | 科磊股份有限公司 | 用于缺陷分类器训练的主动学习 |
CN109242013B (zh) * | 2018-08-28 | 2021-06-08 | 北京九狐时代智能科技有限公司 | 一种数据标注方法、装置、电子设备及存储介质 |
CN109242013A (zh) * | 2018-08-28 | 2019-01-18 | 北京九狐时代智能科技有限公司 | 一种数据标注方法、装置、电子设备及存储介质 |
CN109299744A (zh) * | 2018-10-19 | 2019-02-01 | 合肥非度信息技术有限公司 | 合同公章分类模型的训练方法、系统和识别方法、系统 |
CN109389180A (zh) * | 2018-10-30 | 2019-02-26 | 国网四川省电力公司广元供电公司 | 一款基于深度学习的电力设备图像识别方法及巡查机器人 |
CN109359697A (zh) * | 2018-10-30 | 2019-02-19 | 国网四川省电力公司广元供电公司 | 一种电力设备巡检中使用的图形图像识别方法及巡查系统 |
CN111340261B (zh) * | 2018-12-03 | 2023-07-18 | 北京嘀嘀无限科技发展有限公司 | 判定订单违规行为的方法、系统、计算机设备及存储介质 |
CN111340261A (zh) * | 2018-12-03 | 2020-06-26 | 北京嘀嘀无限科技发展有限公司 | 判定订单违规行为的方法、系统、计算机设备及存储介质 |
CN110135263A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 人像属性模型构建方法、装置、计算机设备和存储介质 |
US11526802B2 (en) | 2019-06-25 | 2022-12-13 | International Business Machines Corporation | Model training using a teacher-student learning paradigm |
CN111007068A (zh) * | 2019-11-21 | 2020-04-14 | 中国兵器工业信息中心 | 基于深度学习的黄色培育钻石品级分类方法 |
CN111007068B (zh) * | 2019-11-21 | 2022-05-13 | 中国兵器工业信息中心 | 基于深度学习的黄色培育钻石品级分类方法 |
CN111126504A (zh) * | 2019-12-27 | 2020-05-08 | 西北工业大学 | 多源不完备信息融合图像目标分类方法 |
CN111489792B (zh) * | 2020-04-14 | 2022-12-09 | 西安交通大学 | 一种基于半监督学习框架的t细胞受体序列分类方法 |
CN111489792A (zh) * | 2020-04-14 | 2020-08-04 | 西安交通大学 | 一种基于半监督学习框架的t细胞受体序列分类方法 |
CN111538852A (zh) * | 2020-04-23 | 2020-08-14 | 北京达佳互联信息技术有限公司 | 多媒体资源处理方法、装置、存储介质及设备 |
CN111538852B (zh) * | 2020-04-23 | 2023-09-05 | 北京达佳互联信息技术有限公司 | 多媒体资源处理方法、装置、存储介质及设备 |
CN113221115A (zh) * | 2021-07-09 | 2021-08-06 | 四川大学 | 基于协同学习的可视化恶意软件检测方法 |
CN113221115B (zh) * | 2021-07-09 | 2021-09-17 | 四川大学 | 基于协同学习的可视化恶意软件检测方法 |
CN113379000A (zh) * | 2021-07-13 | 2021-09-10 | 四川大学 | 一种自适应更新的网络入侵检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102324046A (zh) | 结合主动学习的四分类器协同训练方法 | |
Savchenko | Efficient facial representations for age, gender and identity recognition in organizing photo albums using multi-output ConvNet | |
Veit et al. | Learning from noisy large-scale datasets with minimal supervision | |
CN103299324B (zh) | 使用潜在子标记来学习用于视频注释的标记 | |
Tian et al. | Multimodal deep representation learning for video classification | |
Wang et al. | Relaxed multiple-instance SVM with application to object discovery | |
Gao et al. | Discriminative learning of relaxed hierarchy for large-scale visual recognition | |
Zhao et al. | Adaptive object detection with dual multi-label prediction | |
Hamreras et al. | Content based image retrieval by ensembles of deep learning object classifiers | |
CN110837836A (zh) | 基于最大化置信度的半监督语义分割方法 | |
CN104573669A (zh) | 图像物体检测方法 | |
CN104834940A (zh) | 一种基于支持向量机的医疗影像检查疾病分类方法 | |
CN101877064A (zh) | 图像分类方法及图像分类装置 | |
Wei et al. | Semi-supervised multi-label image classification based on nearest neighbor editing | |
Schinas et al. | CERTH@ MediaEval 2012 Social Event Detection Task. | |
Bitterwolf et al. | Breaking down out-of-distribution detection: Many methods based on ood training data estimate a combination of the same core quantities | |
Zhao et al. | Regional gating neural networks for multi-label image classification. | |
CN103942214B (zh) | 基于多模态矩阵填充的自然图像分类方法及装置 | |
CN109933619A (zh) | 一种半监督分类预测方法 | |
Cogswell et al. | Combining the best of graphical models and convnets for semantic segmentation | |
Gong et al. | Erroneous pixel prediction for semantic image segmentation | |
Ghanmi et al. | Table detection in handwritten chemistry documents using conditional random fields | |
Tran et al. | Triple-sigmoid activation function for deep open-set recognition | |
Mirroshandel et al. | Active learning strategies for support vector machines, application to temporal relation classification | |
Bilik et al. | Toward phytoplankton parasite detection using autoencoders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120118 |