CN108805196B - 用于图像识别的自动增量学习方法 - Google Patents
用于图像识别的自动增量学习方法 Download PDFInfo
- Publication number
- CN108805196B CN108805196B CN201810574578.6A CN201810574578A CN108805196B CN 108805196 B CN108805196 B CN 108805196B CN 201810574578 A CN201810574578 A CN 201810574578A CN 108805196 B CN108805196 B CN 108805196B
- Authority
- CN
- China
- Prior art keywords
- training
- data
- inputting
- labeled
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种用于图像识别的自动增量学习方法,包括:1)读取已标注的若干图像数据并进行处理,使用设计的卷积神经网络,输入处理后的数据进行训练得到预训练模型;2)计算当前预训练模型得到评价标准α,将一部分无标注数据输入到当前预训练模型中,对输出结果应用熵损失函数β进行分类;3)每次得到的新训练数据重新输入到当前的模型中进行训练;优化模型参数,直到无标注数据全部标注或不可再划分则停止迭代。本发明为如何使用少量标注数据和相对较多无标注数据(或者含有干扰的数据)进行图像识别提供了解决方案,既避免大量人工劳动和在某些领域标注数据需要专业知识的困难,又提高了图像的识别精度。
Description
技术领域
本发明属于计算机视觉图像识别领域,特别涉及一种用于图像识别的自动增量学习方法。
背景技术
在图像识别领域中,良好的训练过的神经网络模型已经可以达到很高的识别率,能够区分出图片中的不同物体。目前,对于图像的识别存在以下问题:
1)训练好的模型只能识别已训练过的物体,对于未训练的物体会错误的归到已知类中,并不能将其归到未知类,图像识别的精度不高。
2)每一类物体需要大量人工标注的数据,这些标注工作需要大量的人工劳动,既费时又费事。标注数据还需要较高的专业性。标注数据的缺失导致神经网络缺乏训练,影响后续的工作。
发明内容
本发明的目的在于提供一种用于图像识别的自动增量学习方法,以解决上述技术问题。
为达到上述目的,本发明采用了以下技术方案:
一种用于图像识别的自动增量学习方法,包括以下步骤:
1)预训练卷积神经网络
读取已标注的若干图像数据并进行处理,使用设计的卷积神经网络,输入处理后的数据进行训练得到预训练模型;
2)自动对无标注数据进行标注
计算当前预训练模型得到评价标准α,将一部分无标注数据输入到当前预训练模型中,对输出结果应用熵损失函数β进行分类;
3)迭代全量训练
每次得到的新训练数据重新输入到当前的模型中进行训练;优化模型参数,直到无标注数据全部标注或不可再划分则停止迭代。
进一步的,步骤1)具体包括:首先,读取若干已标注的图像数据进行处理;其次,输入到未经训练的卷积神经网络中;然后,在GPU上进行训练得到预训练模型;并在测试数据集上验证预训练模型识别准确精度。
进一步的,所述读取若干已标注的图像数据进行处理的步骤为:首先,对已经标注图像数据做L2归一化处理;然后,将已标注数据划分为训练集和验证集。
进一步的,所述的卷积神经网络输入维度与训练数据维度大小相同;该卷积神经网络有三个卷积层,一个max-pooling层和一个soft-max层。
进一步的,步骤2)具体包括:首先,计算当前预训练模型,将结果按类别进行累加取平均值并放入数组中得到评价标准α;其次,将一部分无标注数据输入到当前预训练模型中,对输出结果与α中对应类别的值应用熵损失函数β进行分类,若输出值满足结果则对此图像标注对应的类别,并将标注的图像数据加入到当前的训练数据集中。
进一步的,所述评价标准α,α是当前网络对训练集各个类别正确输出的结果取平均值,在网络中α值的个数与要分类的个数是相同的,id表示一个类别,n表示类别的总数,m表示训练集输出中y是id的样本总数,表示在指定id下m个总数中第i个y。
进一步的,应用熵损失函数β进行分类,若计算值β小于1,则满足结果并对此图像标注对应的类别。
进一步的,所述迭代全量训练的步骤为:将新的训练集输入到当前网络中进行训练;训练完成后重新进行α的计算;取另一部分无标注数据进行标注加入到原有训练集;判断无标注数据集是否标注完,若没有标注完则训练过程一直反复,否则停止迭代。
进一步的,所述卷积神经网络的输入维度与训练数据维度大小相同;该卷积神经网络结构不为固定样式,可参考主流方法自行设计,本发明所采用的是根据inception-v4网络结构改进的。
相对于现有技术,本发明具有以下有益效果:
首先,使用少量标注数据和相对较多无标注数据(或者含有干扰的数据)进行图像识别,能避免大量的人工工作。其次,可以自动对无标注数据进行标注,提高了图像识别的精度。
附图说明
图1为图像识别的自动增量学习方法的总体流程图。
图2为计算集合α流程图。
图3为计算β并标注图像流程图。
具体实施方式
下面结合附图对发明作进一步说明。
对于本发明,要求是卷积神经网络预训练模型在验证集的准确率指标达到85%以上,并划分无标注数据,进行多次迭代的全量训练。图1是本发明的总体步骤,显示了用少量标注数据通过本发明的方法提高图像识别精度的三大步骤,卷积神经网络预训练、自动标注没有标注过的图像和重新训练卷积神经网络。
本发明提供一种用于图像识别的自动增量学习方法,包括以下步骤:
步骤一、首先是预训练卷积神经网络,预训练网络主要是将少量已标注的图像数据,输入到未经训练的卷积神经网络中进行训练,然后在测试数据集上验证准确率指标,如指标可以达到85%以上,则继续进行下面的过程,否则需要通过增加标注数据或者修改神经网络结构来提高预训练模型的准确率。预训练模型的具体步骤为:
步骤1,对已经标注图像数据做L2归一化处理;
步骤2,将已标注数据划分为训练集和验证集;训练集占4/5,验证集占1/5;每类已标注图片数量应大于1000,已标注数据总数应大于n*1000,n表示类别总数;
步骤3,设计输入维度与训练数据维度大小相同的卷积神经网络,网络参考DenseNet,ResNext,也可以使用迁移学习的方法;
步骤4,输入步骤2经过归一化处理后的训练数据,在GPU上训练卷积神经网络;
步骤5,训练完成后,获得预训练模型,步骤一完成。
步骤二、用预训练模型自动对无标注图像数据进行标注,在无标注图像数据中既包含了网络可识别的图像类别,也包含了其他干扰图像。自动标注数据主要分为两个步:第一,用训练集数据重新输入目前网络中,然后对输出计算得到评价标准α;第二,将无标注数据集划分,然后将一部分输入到目前网络中,对输出结果应用熵损失函数辨别是否标注,如果标注则将此图像数据集加入到当前的训练集中。具体方式为:
1)评价标准α是当前网络对训练集各个类别正确输出的结果取平均值,在网络中α值的个数与要分类的个数是相同的。这一过程的具体步骤为:
步骤1,将训练数据集重新输入到当前网络中,记录识别正确的输出结果;
步骤2,将步骤1的识别结果按类别进行累加取平均值;
步骤3,将结果都放入到一个数组中得到集合α。
评价标准α,α是当前网络对训练集各个类别正确输出的结果取平均值,在网络中α值的个数与要分类的个数是相同的,id表示一个类别,n表示类别的总数,m表示训练集输出中y是id的样本总数,表示在指定id下m个总数中第i个y。
2)在自动标注时应用到判别函数,它是把前输出与α集合中的正确输出作为输入,输入到本发明所设计的熵损失判断函数中,依据其结果决定是否标注图像,这一过程的具体步骤为:
步骤1,划分无标注数据集,取其中的一部分,将里面的无标注数据逐个输入到预训练模型中得到输出结果;
步骤2,将步骤1的输出结果与集合α中对应类别的值输入到熵损失判断函数中;熵损失函数β,i表示每个类别概率值,yi表示网络输出的sotfmax数组,α(id)i表示α中类别是id的softmax数组的第i位,n表示类别的总数。
步骤3,熵损失判断函数的输出值,如果满足结果则对此图像标注对应的类别;
步骤4,将标注的新图像数据加入到原有的训练数据集中。
步骤三、最后为迭代全量训练,将每次产生的新训练数据重新输入到当前的模型中进行训练,新的训练数据是原有的加上后来标注的。这个训练过程一直反复,直到把划分的无标注数据集全部训练完后停止。这一过程的具体步骤为:
步骤1,将新的训练集输入到当前网络中进行训练;
步骤2,训练完成后重新进行α的计算;
步骤3,取另一部分无标注数据进行标注加入到原有训练集;
步骤4,判断无标注数据集是否标注完,如果没有则回到步骤1继续迭代。
Claims (3)
1.一种用于图像识别的自动增量学习方法,其特征在于,包括以下步骤:
1)预训练卷积神经网络
读取已标注的若干图像数据并进行处理,使用设计的卷积神经网络,输入处理后的数据进行训练得到预训练模型;
2)自动对无标注数据进行标注
计算当前预训练模型得到评价标准α,将一部分无标注数据输入到当前预训练模型中,对输出结果应用熵损失函数β进行分类;
3)迭代全量训练
每次得到的新训练数据重新输入到当前的模型中进行训练;优化模型参数,直到无标注数据全部标注或不可再划分则停止迭代;
步骤1)具体包括:首先,读取若干已标注的图像数据进行处理;其次,输入到未经训练的卷积神经网络中;然后,在GPU上进行训练得到预训练模型;并在测试数据集上验证预训练模型识别准确精度;
所述读取若干已标注的图像数据进行处理的步骤为:首先,对已经标注图像数据做L2归一化处理;然后,将已标注数据划分为训练集和验证集;
所述的卷积神经网络输入维度与训练数据维度大小相同;该卷积神经网络有三个卷积层,一个max-pooling层和一个soft-max层;
步骤2)具体包括:首先,计算当前预训练模型,将结果按类别进行累加取平均值并放入数组中得到评价标准α;其次,将一部分无标注数据输入到当前预训练模型中,对输出结果与α中对应类别的值应用熵损失函数β进行分类,若输出值满足结果则对此图像标注对应的类别,并将标注的图像数据加入到当前的训练数据集中;
所述评价标准α,α是当前网络对训练集各个类别正确输出的结果取平均值,在网络中α值的个数与要分类的个数是相同的,id表示一个类别,n表示类别的总数,m表示训练集输出中y是id的样本总数,表示在指定id下m个总数中第i个y;
2.根据权利要求1所述一种用于图像识别的自动增量学习方法,其特征在于,应用熵损失函数β进行分类,若计算值β小于1,则满足结果并对此图像标注对应的类别。
3.根据权利要求1所述一种用于图像识别的自动增量学习方法,其特征在于,所述迭代全量训练的步骤为:将新的训练集输入到当前网络中进行训练;训练完成后重新进行α的计算;取另一部分无标注数据进行标注加入到原有训练集;判断无标注数据集是否标注完,若没有标注完则训练过程一直反复,否则停止迭代。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810574578.6A CN108805196B (zh) | 2018-06-05 | 2018-06-05 | 用于图像识别的自动增量学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810574578.6A CN108805196B (zh) | 2018-06-05 | 2018-06-05 | 用于图像识别的自动增量学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108805196A CN108805196A (zh) | 2018-11-13 |
CN108805196B true CN108805196B (zh) | 2022-02-18 |
Family
ID=64087406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810574578.6A Active CN108805196B (zh) | 2018-06-05 | 2018-06-05 | 用于图像识别的自动增量学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108805196B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110266938B (zh) * | 2018-12-27 | 2021-11-09 | 全球能源互联网研究院有限公司 | 基于深度学习的变电站设备智能拍摄方法及装置 |
CN109886342A (zh) * | 2019-02-26 | 2019-06-14 | 视睿(杭州)信息科技有限公司 | 基于机器学习的模型训练方法和装置 |
CN109993207B (zh) * | 2019-03-01 | 2022-10-25 | 华南理工大学 | 一种基于目标检测的图像隐私保护方法和系统 |
CN110335250A (zh) * | 2019-05-31 | 2019-10-15 | 上海联影智能医疗科技有限公司 | 网络训练方法、装置、检测方法、计算机设备和存储介质 |
CN110580445B (zh) * | 2019-07-12 | 2023-02-07 | 西北工业大学 | 一种基于GIoU和加权NMS改进的人脸关键点检测方法 |
CN110598033B (zh) * | 2019-08-14 | 2023-03-28 | 中国平安财产保险股份有限公司 | 智能自核验车方法、装置及计算机可读存储介质 |
CN111539309A (zh) * | 2020-04-21 | 2020-08-14 | 广州云从鼎望科技有限公司 | 一种基于ocr的数据处理方法、系统、平台、设备及介质 |
CN114330592B (zh) * | 2022-01-06 | 2023-06-02 | 北京百度网讯科技有限公司 | 模型生成方法、装置、电子设备及计算机存储介质 |
CN116071375B (zh) * | 2023-03-10 | 2023-09-26 | 福建自贸试验区厦门片区Manteia数据科技有限公司 | 图像分割方法和装置、存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318242A (zh) * | 2014-10-08 | 2015-01-28 | 中国人民解放军空军工程大学 | 一种高效的svm主动半监督学习算法 |
CN106991439A (zh) * | 2017-03-28 | 2017-07-28 | 南京天数信息科技有限公司 | 基于深度学习与迁移学习的图像识别方法 |
CN107506822A (zh) * | 2017-07-26 | 2017-12-22 | 天津大学 | 一种基于空间融合池化的深度神经网络方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462066B (zh) * | 2014-12-24 | 2017-10-03 | 北京百度网讯科技有限公司 | 语义角色标注方法及装置 |
CN105550713A (zh) * | 2015-12-21 | 2016-05-04 | 中国石油大学(华东) | 一种持续学习的视频事件检测方法 |
CN105631479B (zh) * | 2015-12-30 | 2019-05-17 | 中国科学院自动化研究所 | 基于非平衡学习的深度卷积网络图像标注方法及装置 |
US10382462B2 (en) * | 2016-07-28 | 2019-08-13 | Cisco Technology, Inc. | Network security classification |
CN107067025B (zh) * | 2017-02-15 | 2020-12-22 | 重庆邮电大学 | 一种基于主动学习的文本数据自动标注方法 |
CN107133570B (zh) * | 2017-04-07 | 2018-03-13 | 武汉睿智视讯科技有限公司 | 一种车辆/行人检测方法及系统 |
CN107153817B (zh) * | 2017-04-29 | 2021-04-27 | 深圳市深网视界科技有限公司 | 行人重识别数据标注方法和装置 |
CN107203511B (zh) * | 2017-05-27 | 2020-07-17 | 中国矿业大学 | 一种基于神经网络概率消歧的网络文本命名实体识别方法 |
CN107273502B (zh) * | 2017-06-19 | 2020-05-12 | 重庆邮电大学 | 一种基于空间认知学习的图像地理标注方法 |
CN107239802B (zh) * | 2017-06-28 | 2021-06-01 | 广东工业大学 | 一种图像分类方法及装置 |
CN107358257B (zh) * | 2017-07-07 | 2019-07-16 | 华南理工大学 | 一种大数据场景下可增量学习的图像分类训练方法 |
CN107563433B (zh) * | 2017-08-29 | 2020-11-17 | 电子科技大学 | 一种基于卷积神经网络的红外小目标检测方法 |
CN107590497A (zh) * | 2017-09-20 | 2018-01-16 | 重庆邮电大学 | 基于深度卷积神经网络的脱机手写汉字识别方法 |
CN107729819B (zh) * | 2017-09-22 | 2020-05-19 | 华中科技大学 | 一种基于稀疏全卷积神经网络的人脸标注方法 |
CN108052959A (zh) * | 2017-11-15 | 2018-05-18 | 南京邮电大学 | 一种提高深度学习图片识别算法鲁棒性的方法 |
-
2018
- 2018-06-05 CN CN201810574578.6A patent/CN108805196B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318242A (zh) * | 2014-10-08 | 2015-01-28 | 中国人民解放军空军工程大学 | 一种高效的svm主动半监督学习算法 |
CN106991439A (zh) * | 2017-03-28 | 2017-07-28 | 南京天数信息科技有限公司 | 基于深度学习与迁移学习的图像识别方法 |
CN107506822A (zh) * | 2017-07-26 | 2017-12-22 | 天津大学 | 一种基于空间融合池化的深度神经网络方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108805196A (zh) | 2018-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108805196B (zh) | 用于图像识别的自动增量学习方法 | |
CN109582793A (zh) | 模型训练方法、客服系统及数据标注系统、可读存储介质 | |
CN108229588B (zh) | 一种基于深度学习的机器学习识别方法 | |
CN108009567B (zh) | 一种结合图像颜色及hog和svm的粪便性状的自动辨别方法 | |
CN109284779A (zh) | 基于深度全卷积网络的物体检测方法 | |
CN109741410A (zh) | 基于深度学习的荧光编码微球图像生成及标注方法 | |
CN106156805A (zh) | 一种样本标签缺失数据的分类器训练方法 | |
CN111239137B (zh) | 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法 | |
CN109214444B (zh) | 基于孪生神经网络和gmm的游戏防沉迷判定系统及方法 | |
CN108596204B (zh) | 一种基于改进型scdae的半监督调制方式分类模型的方法 | |
CN106569954A (zh) | 一种基于kl散度的多源软件缺陷预测方法 | |
CN112488160A (zh) | 图像分类任务的模型训练方法 | |
CN114067233B (zh) | 一种跨模态匹配方法及系统 | |
CN116755753A (zh) | 一种基于代码语言模型的程序缺陷自动修复方法及系统 | |
CN108229692B (zh) | 一种基于双重对比学习的机器学习识别方法 | |
CN114580517A (zh) | 一种图像识别模型的确定方法及装置 | |
CN117392450A (zh) | 一种基于进化多尺度特征学习的钢铁材料质量解析方法 | |
CN109359664A (zh) | 自我学习更新训练样本的高效质检模型构建方法及系统 | |
CN109543571B (zh) | 一种面向复杂产品异形加工特征的智能识别与检索方法 | |
CN113627553B (zh) | 一种用于电能表异常标签识别的图像识别方法及系统 | |
CN109145749B (zh) | 一种跨数据集的面部表情识别模型构建及识别方法 | |
CN108345943B (zh) | 一种基于嵌入编码与对比学习的机器学习识别方法 | |
CN112348106B (zh) | 一种基于关键点学习的乳腺超声影像分类方法 | |
CN110348479A (zh) | 一种基于近邻传播的股票预测方法、系统、装置和介质 | |
CN113033694B (zh) | 一种基于深度学习的数据清洗方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |