CN112308129A - 一种基于深度学习的植物线虫数据自动标注和分类识别方法 - Google Patents
一种基于深度学习的植物线虫数据自动标注和分类识别方法 Download PDFInfo
- Publication number
- CN112308129A CN112308129A CN202011175736.4A CN202011175736A CN112308129A CN 112308129 A CN112308129 A CN 112308129A CN 202011175736 A CN202011175736 A CN 202011175736A CN 112308129 A CN112308129 A CN 112308129A
- Authority
- CN
- China
- Prior art keywords
- plant nematode
- deep learning
- data
- labeling
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000244206 Nematoda Species 0.000 title claims abstract description 101
- 238000002372 labelling Methods 0.000 title claims abstract description 74
- 238000013135 deep learning Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 49
- 230000006870 function Effects 0.000 claims description 10
- 238000005728 strengthening Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 241000894007 species Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的植物线虫数据自动标注和分类识别方法,利用少量人工标注的植物线虫图像训练深度学习网络,并在深度学习网络中添加注意力损失从而强化植物线虫标注区域,再将模型的网络权重用于标注大量非人工标注的植物线虫图像数据,通过数次的植物线虫图像数据标注和训练过程,完成植物线虫识别项目数据集的自动标注,同时得到与此植物线虫识别项目对应的强化模型。本发明能够有效地针对植物线虫数据进行标注,从而提高植物线虫数据的训练效率与植物线虫分类识别的准确率。
Description
技术领域
本发明涉及深度学习图像智能标注和检索技术领域,具体涉及一种基于深度学习网络的植物线虫图像智能标注和分类识别方法。
背景技术
近年来,人工智能和大数据成为了国内外各大领域关注的焦点,其中被广泛关注的深度学习算法已经被成功运用于语音识别,图形识别等各个领域,而随着各行各业不断深入的信息化建设,在医疗,生物,金融,法律等各个领域积累了大量的数据,如何高效率的管理和组织这些图像数据,并对这些数据进行有效标注成为了行业的痛点问题。对于一些不太常见的深度学习数据集,如植物线虫数据集,由于其主要特征集中植物线虫尾部,想要通过现有深度学习分类网络对其进行有效识别必须对其尾部进行标注。现有深度学习标注方法以手工标注为主,但手工标注不仅费时费力,耗费了大量的人力物力,而且随着标注数据的增加,标注错误的可能性也会增大,标注错误的数据甚至会对深度学习训练过程产生负面影响。
发明内容
为了解决以上现有技术存在的缺陷,本发明提出一种基于深度学习网络的植物线虫图像智能标注和分类识别方法,通过在深度学习网络中添加注意力损失,针对植物线虫标注区域进行加强,使得深度学习网络能够着重对标注区域进行学习和训练,然后先对一小部分人工标注的植物线虫数据进行训练得到初始的训练模型,再通过其权重模型自动标注剩余未标注的植物线虫数据,从而完成所有植物线虫数据的智能标注,同时也获得了对应整个植物线虫数据集的智能标注模型,最后将标注好的数据加入深度学习分类网络进行训练得到整个植物线虫数据集分类识别的强化模型。整个训练过程模型会不断的从训练数据集中学习所标注的植物线虫感兴趣区域的特征,不仅很大程度上降低了人工标注植物线虫数据的复杂工作量,也具有一定的可移植性,有利于对更多类似的数据进行标注和识别。
本发明的技术方案是这样实现的:
一种基于深度学习的植物线虫数据自动标注和分类识别方法,利用少量人工标注的植物线虫图像训练深度学习网络,并在深度学习网络中添加注意力损失从而强化植物线虫标注区域,再将模型的网络权重用于标注大量非人工标注的植物线虫图像数据,通过数次的植物线虫图像数据标注和训练过程,完成植物线虫识别项目数据集的自动标注,同时得到与此植物线虫识别项目对应的强化模型。
进一步,基于深度学习的植物线虫数据自动标注和分类识别方法的具体过程为:
S1)首先建立植物线虫识别项目所要标注的图片数据集,通过采集一系列植物线虫的图像,对不同种类的植物线虫数据进行分组,并从每一组植物线虫数据中随机筛选出相同数目的图片组成一组,利用标注工具对该组植物线虫图像的尾部区域进行标注,作为初始的训练数据集。
S2)利用步骤S1)得到的训练数据集,对深度学习网络进行训练,在深度学习网络中添加注意力损失,针对植物线虫标注区域进行加强,使得深度学习网络着重对标注区域进行学习和训练,得到训练模型。
S3)基于训练模型进行重复标注训练,先利用步骤S2)训练好的模型自动标注剩余图片,人工修正错误的标注结果,并将修正后的图片加入到网络的训练集中训练,重复训练修正过程,从而完成所有数据的标注并得到整个植物线虫数据集的智能标注模型。
S4)基于标注数据的植物线虫分类识别,利用步骤S3)得到的标注完成的植物线虫数据集,对深度学习分类网络进行训练,从而得到整个植物线虫数据集分类识别的强化模型。
进一步,所述少量人工标注的植物线虫图像指的是植物线虫数据集中选取的一组图像数据,大量非人工标注的图像数据指的是除人工标注外的其余图像数据。
进一步,在深度学习网络中添加注意力损失指的是:针对植物线虫数据标注部分,在计算损失函数时加大该部分权重,强化深度学习网络对该部分区域的学习。
进一步,所述智能标注模型指的是,所有植物线虫数据加入到含有注意力损失的深度学习网络中训练得到的标注模型。所述强化模型指的是,所有标注好的植物线虫数据加入到深度学习分类网络中训练得到的植物线虫分类识别模型。
本发明主要研究基于深度学习训练计算机学习植物线虫的感兴趣区域并进行提取,从而有效提高标注效率,并基于标注数据提高了植物线虫分类识别准确率。与现有技术相比较,本发明技术方案有以下优点:
1、降低人工标注线虫数据的工作量,人工标注往往费时费力,而且随着标注数据的增加,标注错误的可能性也会增大,利用深度学习网络只需要很少人工标注的植物线虫数据。
2、提高标注效率,通过在深度学习网络中添加注意力损失,针对植物线虫尾部区域进行加强,使得深度学习网络能够着重对标注区域进行学习和训练,提高了标注的准确率及效率。
3、具有一定的可移植性,整个训练过程模型会不断的从训练数据集中学习所标注的图像感兴趣区域的特征,有利于对更多类似的数据进行标注和识别。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于深度学习的植物线虫数据自动标注和分类识别方法的流程示意图;
图2为本发明利用基于深度学习网络训练模型进行植物线虫智能标注的示意图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
如图1所示,基于深度学习的植物线虫数据自动标注和分类识别方法包括以下步骤:
S1)首先建立植物线虫识别项目所要标注的图片数据集,通过采集一系列植物线虫的图像,对不同种类的植物线虫数据进行分组,并从每一组植物线虫数据中随机筛选出相同数目的图片组成一组,利用常用标注工具LabelMe对该组植物线虫图像的尾部区域进行标注,作为初始的训练数据集。
本实例中共采得三类不同的植物线虫数据集,每一类植物线虫数据各有2000张,总共6000张图片,每一类线虫分别取100张图片合成一个小的数据集进行标注,然后对该数据集进行训练,总共标注的图片300张,工作量仅为5%。
S2)利用步骤S1)得到的训练数据集,对深度学习网络进行训练,在深度学习网络中添加注意力损失,针对植物线虫标注区域进行加强,使得深度学习网络着重对标注区域进行学习和训练,得到训练模型。
本实例中,注意力损失指的是针对植物线虫数据标注部分,在计算损失函数时加大该部分权重,强化深度学习网络对该部分区域的学习,Loss权重计算公式如下:
Loss=loss+λ·loss_attention
其中,Loss为深度学习网络总体损失函数,loss为深度学习网络其余部分损失函数,loss_attention为针对数据标注部分的损失函数,λ表示权重,范围在1∶1-10∶1之间。
S3)基于训练模型进行重复标注训练,先利用步骤S2)训练好的模型自动标注剩余图片,人工修正错误的标注结果,并将修正后的图片加入到网络的训练集中训练,重复训练修正过程,从而完成所有数据的标注并得到整个植物线虫数据集的智能标注模型。
本实例中,智能标注模型权重数据保存在以weights为后缀名的文件中,对错误的标注结果采用标注工具重新标注。
S4)基于标注数据进行植物线虫分类识别,利用步骤S3)得到的标注完成的植物线虫数据集,对深度学习分类网络进行训练,从而得到整个植物线虫数据集分类识别的强化模型,强化模型权重数据保存在以weights为后缀名的文件。
本发明的技术方案中,采用的深度学习网络为全卷积神经网络,采用的深度学习分类网络由多个卷积层与全连接层组成。深度学习网络和深度学习分类网络的具体结构是本领域技术人员根据现有技术能够构建的,不属于本发明讨论的内容。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (6)
1.一种基于深度学习的植物线虫数据自动标注和分类识别方法,其特征在于,利用少量人工标注的植物线虫图像训练深度学习网络,并在深度学习网络中添加注意力损失从而强化植物线虫标注区域,再将模型的网络权重用于标注大量非人工标注的植物线虫图像数据,通过数次的植物线虫图像数据标注和训练过程,完成植物线虫识别项目数据集的自动标注,同时得到与此植物线虫识别项目对应的强化模型。
2.根据权利要求1所述的一种基于深度学习网络的植物线虫数据自动标注和分类识别方法,其特征在于包括如下步骤:
步骤(1):建立植物线虫识别项目所要标注的图片数据集
采集一系列植物线虫的图像,对不同种类的植物线虫数据进行分组,并从每一组植物线虫数据中随机筛选出相同数目的图片组成一组,利用标注工具对该组植物线虫图像的尾部区域进行标注,作为初始的训练数据集;
步骤(2):对深度学习网络进行改进
利用步骤(1)利用得到的初始训练数据集,对深度学习网络进行训练,在深度学习网络中添加注意力损失,针对植物线虫标注区域进行加强,使得深度学习网络着重对标注区域进行学习和训练,得到训练模型;
步骤(3):基于训练模型进行重复标注训练
利用训练模型自动标注剩余图片,人工修正错误的标注结果,并将修正后的图片加入到网络的训练集中训练,重复训练修正过程,从而完成所有数据的标注并得到整个植物线虫数据集的智能标注模型;
步骤(4):基于标注数据的植物线虫分类识别
利用步骤(3)得到的标注完成的植物线虫数据集,对深度学习分类网络进行训练,从而得到整个植物线虫数据集分类识别的强化模型。
3.根据权利要求1或2所述的一种基于深度学习网络的植物线虫数据自动标注方法,其特征在于,所述少量人工标注的植物线虫图像指的是植物线虫数据集中选取的一组图像数据,大量非人工标注的植物线虫图像数据指的是除人工标注外的其余图像数据。
4.根据权利要求1或2所述的一种基于深度学习网络的植物线虫数据自动标注方法,其特征在于在深度学习网络中添加注意力损失指的是:针对植物线虫数据标注部分,在计算损失函数时加大该部分权重,强化深度学习网络对该部分区域的学习。
5.根据权利要求1或2所述的一种基于深度学习网络的植物线虫数据自动标注和分类识别方法,其特征在于;
智能标注模型指所有植物线虫数据加入到含有注意力损失的深度学习网络中训练得到的标注模型;
强化模型指所有标注好的植物线虫数据加入到深度学习分类网络中训练得到的植物线虫分类识别模型。
6.根据权利要求4所述的一种基于深度学习网络的植物线虫数据自动标注方法,其特征在于针对植物线虫数据标注部分,在计算损失函数时加大该部分权重,计算公式如下:
Loss=loss+λ·loss_attention
其中,Loss为深度学习网络总体损失函数,loss_attention为针对数据标注部分的损失函数,loss为深度学习网络其余部分损失函数,λ表示权重,范围在1∶1-10∶1之间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011175736.4A CN112308129A (zh) | 2020-10-28 | 2020-10-28 | 一种基于深度学习的植物线虫数据自动标注和分类识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011175736.4A CN112308129A (zh) | 2020-10-28 | 2020-10-28 | 一种基于深度学习的植物线虫数据自动标注和分类识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112308129A true CN112308129A (zh) | 2021-02-02 |
Family
ID=74331856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011175736.4A Pending CN112308129A (zh) | 2020-10-28 | 2020-10-28 | 一种基于深度学习的植物线虫数据自动标注和分类识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112308129A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990341A (zh) * | 2021-04-02 | 2021-06-18 | 中国科学院宁波材料技术与工程研究所 | 基于深度学习的多特征联合的植物线虫检测方法及系统 |
CN113064993A (zh) * | 2021-03-23 | 2021-07-02 | 南京视察者智能科技有限公司 | 一种基于大数据的自动化文本分类标注系统的设计方法、优化方法及标注方法 |
CN113269139A (zh) * | 2021-06-18 | 2021-08-17 | 中电科大数据研究院有限公司 | 一种针对复杂场景的自学习大规模警员图像分类模型 |
CN116596923A (zh) * | 2023-07-17 | 2023-08-15 | 天津市蓟州区民力新能源科技有限公司 | 基于边缘检测的园林植物识别方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033998A (zh) * | 2018-07-04 | 2018-12-18 | 北京航空航天大学 | 基于注意力机制卷积神经网络的遥感影像地物标注方法 |
CN109255044A (zh) * | 2018-08-31 | 2019-01-22 | 江苏大学 | 一种基于YOLOv3深度学习网络的图像智能标注方法 |
WO2019240900A1 (en) * | 2018-06-12 | 2019-12-19 | Siemens Aktiengesellschaft | Attention loss based deep neural network training |
US20200134385A1 (en) * | 2018-10-29 | 2020-04-30 | Fujitsu Limited | Deep learning model used for image recognition and training apparatus of the model and method thereof |
-
2020
- 2020-10-28 CN CN202011175736.4A patent/CN112308129A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019240900A1 (en) * | 2018-06-12 | 2019-12-19 | Siemens Aktiengesellschaft | Attention loss based deep neural network training |
CN109033998A (zh) * | 2018-07-04 | 2018-12-18 | 北京航空航天大学 | 基于注意力机制卷积神经网络的遥感影像地物标注方法 |
CN109255044A (zh) * | 2018-08-31 | 2019-01-22 | 江苏大学 | 一种基于YOLOv3深度学习网络的图像智能标注方法 |
US20200134385A1 (en) * | 2018-10-29 | 2020-04-30 | Fujitsu Limited | Deep learning model used for image recognition and training apparatus of the model and method thereof |
Non-Patent Citations (1)
Title |
---|
卜伟等: "基于图像边缘特征的零件分类与定位算法", 《计量与测试技术》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113064993A (zh) * | 2021-03-23 | 2021-07-02 | 南京视察者智能科技有限公司 | 一种基于大数据的自动化文本分类标注系统的设计方法、优化方法及标注方法 |
CN113064993B (zh) * | 2021-03-23 | 2023-07-21 | 南京视察者智能科技有限公司 | 一种基于大数据的自动化文本分类标注系统的设计方法、优化方法及标注方法 |
CN112990341A (zh) * | 2021-04-02 | 2021-06-18 | 中国科学院宁波材料技术与工程研究所 | 基于深度学习的多特征联合的植物线虫检测方法及系统 |
CN112990341B (zh) * | 2021-04-02 | 2022-08-02 | 中国科学院宁波材料技术与工程研究所 | 基于深度学习的多特征联合的植物线虫检测方法及系统 |
CN113269139A (zh) * | 2021-06-18 | 2021-08-17 | 中电科大数据研究院有限公司 | 一种针对复杂场景的自学习大规模警员图像分类模型 |
CN113269139B (zh) * | 2021-06-18 | 2023-09-26 | 中电科大数据研究院有限公司 | 一种针对复杂场景的自学习大规模警员图像分类模型 |
CN116596923A (zh) * | 2023-07-17 | 2023-08-15 | 天津市蓟州区民力新能源科技有限公司 | 基于边缘检测的园林植物识别方法及系统 |
CN116596923B (zh) * | 2023-07-17 | 2023-09-12 | 天津市蓟州区民力新能源科技有限公司 | 基于边缘检测的园林植物识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308129A (zh) | 一种基于深度学习的植物线虫数据自动标注和分类识别方法 | |
CN112214610B (zh) | 一种基于跨度和知识增强的实体关系联合抽取方法 | |
CN109993100B (zh) | 基于深层特征聚类的人脸表情识别的实现方法 | |
CN111198964B (zh) | 图像检索方法及系统 | |
CN112685504B (zh) | 一种面向生产过程的分布式迁移图学习方法 | |
CN110288007A (zh) | 数据标注的方法、装置及电子设备 | |
CN111428058B (zh) | 基于mcm的智适应复习资源推送方法 | |
CN111861909A (zh) | 一种网络细粒度图像去噪分类方法 | |
CN108052959A (zh) | 一种提高深度学习图片识别算法鲁棒性的方法 | |
CN111581368A (zh) | 一种基于卷积神经网络的面向智能专家推荐的用户画像方法 | |
CN114359199A (zh) | 一种基于深度学习的鱼类计数方法、装置、设备和介质 | |
CN114676769A (zh) | 一种基于视觉Transformer的小样本昆虫图像识别方法 | |
CN112182257A (zh) | 一种基于神经网络的人工智能数据清洗方法 | |
CN114067233B (zh) | 一种跨模态匹配方法及系统 | |
CN113705215A (zh) | 一种基于元学习的大规模多标签文本分类方法 | |
CN113095229B (zh) | 一种无监督域自适应行人重识别系统及方法 | |
CN109344309A (zh) | 基于卷积神经网络堆叠泛化的文档图像分类方法和系统 | |
CN113657473A (zh) | 一种基于迁移学习的Web服务分类方法 | |
CN111984790B (zh) | 一种实体关系抽取方法 | |
CN111191027B (zh) | 一种基于高斯混合分布vae的广义零样本识别方法 | |
CN112100419A (zh) | 一种基于图像检索的单幅天气图像识别方法及系统 | |
CN111737402A (zh) | 题库智能知识点标注系统 | |
CN111507472A (zh) | 一种基于重要性剪枝的精度估计参数搜索方法 | |
CN115936389A (zh) | 一种基于大数据技术的评审专家与评审材料的匹配方法 | |
CN113283243B (zh) | 一种实体与关系联合抽取的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210202 |
|
RJ01 | Rejection of invention patent application after publication |