CN113792630B - 一种基于对比学习的地外探测图像识别方法及系统 - Google Patents
一种基于对比学习的地外探测图像识别方法及系统 Download PDFInfo
- Publication number
- CN113792630B CN113792630B CN202111010548.0A CN202111010548A CN113792630B CN 113792630 B CN113792630 B CN 113792630B CN 202111010548 A CN202111010548 A CN 202111010548A CN 113792630 B CN113792630 B CN 113792630B
- Authority
- CN
- China
- Prior art keywords
- image
- learning
- detector
- image recognition
- recognition model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000001514 detection method Methods 0.000 title description 4
- 230000006870 function Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 2
- 238000012360 testing method Methods 0.000 description 12
- 239000000523 sample Substances 0.000 description 10
- 101100153586 Caenorhabditis elegans top-1 gene Proteins 0.000 description 5
- 101100370075 Mus musculus Top1 gene Proteins 0.000 description 5
- 230000032683 aging Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于对比学习的外星地表图像识别方法及系统,属于图像识别领域,通过搭建图像识别模型,并对该模型进行类间对比学习和相似性学习训练,来识别外星地表图像。本发明能够在不引入额外人类监督的条件下,使模型自适应学习新样本类型与数据域分布,进而兼容未知环境,更加准确地识别外星地表图像,满足探索应用需求。
Description
技术领域
本发明属于图像识别领域,具体设计一种基于对比学习的地外探测图像识别方法及系统。
背景技术
图像识别旨在辨识图像所包含的物体,根据物体将图像分类至一个标签。计算机图像识别方法可以代替人类处理视觉信息,是信息时代的一门重要技术。传统的图像识别模型使用人工设计的特征提取机制及简单的分类器。近年来基于深度学习的图像识别模型采用数据驱动的卷积模型,模型通常在大型数据集上端到端训练。
外星地表图像为地外探测车在外星地表通过相机所收集的图像。与通常的图像识别任务不同,在外星地表探索任务中,模型只能使用探测器当前已拍摄的数据作为训练集,未来拍摄的数据则为测试目标。然而,由于探测器的前行与时间推进造成的环境变化与设备老化,以及探测器并不是以稳定的频率均匀地使用每一个设备进行数据采集,新拍摄数据通常与已有数据存在差异,造成了训练-测试的性能差距。现有图像识别方法无法克服这种训练-测试差异的影响,不满足地外探索的应用需求。
发明内容
针对上述问题,本发明提出了一种基于对比学习的外星地表图像识别方法及系统,能够在不引入额外人类监督的条件下,使模型自适应学习新样本类型与数据域分布,进而兼容未知环境,更加准确地识别外星地表图像,满足探索应用需求。
本发明采用的技术方案如下:
一种基于对比学习的外星地表图像识别方法,包括以下步骤:
搭建图像识别模型,该图像识别模型包含特征提取器、分类检测器、类间对比学习检测器和相似性学习检测器;
搜集有标签和无标签的外星地表图像训练数据集,并输入到图像识别模型进行训练,该图像识别模型通过特征提取器提取外星地表图像的图像特征,通过分类检测器对外星地表图像的图像特征进行分类,通过类间对比学习检测器和相似性学习检测器根据分类后的图像特征分别进行类间对比学习和相似性学习任务目标的预测,以使该图像识别模型自适应学习新样本类型与数据域分布;通过迭代训练优化模型参数,直到该图像识别模型的总损失函数最小为止,得到训练好的图像识别模型;
将待检测的外星地表图像输入到该训练好的图像识别模型中进行分类,该训练好的图像识别模型通过特征提取器提取外星地表图像的图像特征,通过分类检测器根据所述图像特征进行分类,输出分类预测结果。
进一步地,总损失函数由分类交叉熵损失函数、类间对比学习损失函数和相似度学习损失函数组成。
一种基于对比学习的外星地表图像识别系统,包括:
数据采集模块,用于采集外星地表图像,输入到图像识别模型中进行识别;
图像识别模型,包含特征提取器、分类检测器、类间对比学习检测器和相似性学习检测器;特征提取器用于提取外星地表图像的图像特征;分类检测器用于对外星地表图像的图像特征进行分类;类间对比学习检测器和相似性学习检测器用于在训练过程中根据图像特征分别进行类间对比学习和相似性学习任务目标的预测,以使该图像识别模型自适应学习新样本类型与数据域分布;该图像识别模型经过训练后,用于对待检测的外星地表图像的图像特征进行识别和分类;
预训练模块,用于搜集有标签和无标签的外星地表图像训练数据集,并输入到所述图像识别模型进行迭代训练,通过优化模型参数,降低模型的总损失函数,获得训练后的图像识别模型。
与现有技术相比,本发明的积极效果为:
本发明在分类学习任务的基础上,专门设计了同时进行类间对比学习与相似性学习的学习策略,其中类间对比学习使用标签作为辅助的;相似性学习只考虑正例样本,不考虑负样本。类间对比学习可以扩大不同类之间的特征距离,提升模型对不同类别的区分能力。在类间对比学习的辅助下,即便测试图像与训练图像存在较大差异,样本也能被更准确地识别。类间对比学习可以将Top-1准确率由79.28%提升至提升93.82%。相似度学习通过在有标签训练数据的基础上引入额外的无标签数据,扩展模型的泛化性,使得模型对未知测试数据更加鲁棒,由此降低训练-测试的性能差距。在使用类间对比学习的基础上联合使用相似度学习可以将Top-1准确率由93.82%进一步提升至95.86%。
附图说明
图1为本发明实施例所使用的外星地表图像识别网络的训练框架图。
图2为本发明实施例所使用的外星地表图像识别网络的使用框架图。
具体实施方式
为使本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合所附图作详细说明如下。需说明的是,以下实施例所给出的具体层数、模块数、函数数量以及对某些层的设置等都仅是一种较佳的实施方式,而不用于限制,本领域技术人员可以根据实际需要来选取数量和设置某些层,应可理解。
本实施例公开一种外星地表图像识别方法,具体说明如下:
步骤1:搜集外星地表图像,以MSL Surface火星地表图像识别基准测试集为例,进行数据清洗,并标注分类标签,组成有标签的外星地表图像训练数据集。搜集数量更多的外星地表图像,不需要进行数据清洗和标注,组成无标签的外星地表图像训练数据集。
步骤2:搭建图像识别网络框架。
网络结构如图1所示,包含分类特征提取器B、分类检测器Hcls、类间对比学习检测器Hs和相似性学习检测器Hu。分类特征提取器由一个卷积层、若干残差模块以及一个全局平均模块组成;分类检测器包含一个全连接层,输出样本所属类别的概率;类间对比学习检测器和相似性学习检测器均由两层全连接网络构成,其中第一个全连接层后跟随一个线性整流函数(ReLU),最终输出结果为一维特征。
步骤3:训练分类特征提取器B、分类检测器Hcls、类间对比学习检测器Hs和相似性学习检测器Hu。模型的总损失函数项为:
L=λclsLcls+λsLs+λuLu,
式中,λcls、λs和λu是权重项,通常λcls设置为1,λs设置为1,λu设置为0.2。Lcls、Ls和Lu是子训练损失函数。Ls的训练批batch大小为24,Lcls和Lu的训练批batch大小为16。分类检测器Hcls的学习率为0.001,训练分类特征提取器B、类间对比学习检测器Hs和相似性学习检测器Hu的学习率为0.000001。训练遍历训练数据集30轮,在第25轮时,学习率缩小10倍。
1)Lcls为分类交叉熵损失函数:
yc为样本x的标签,正确类的值为1,错误类的值为0;pc=Hcls(B(x))为分类检测器所预测的样本x属于类别c的概率,B(x)是特征提取器B在样本x上提取的特征;M为类别总数。
2)Ls为类间对比学习损失函数:
温度系数τ设置为0.2。给定数据集中的样本xi,对比学习首先生成两个模态d1(xi)和d2(xi),其中d表示同一个随机数据增强操作。所使用的数据增强包含两种类型:形状和像素。形状增强包括翻转、裁剪、缩放大小和旋转,像素增强包括高斯模糊、颜色抖动和降低饱和度。 其中k为1或2。/>表示在经过了dk数据增强的样本xc·上提取的特征。xci和xcj分别代表类别标签为ci和cj的样本。sim(·,·)代表两个归一化向量的相似度:
sim(u,v)=uTv。
3)Lu为相似度学习损失函数:
式中,其中k为1或2。/>表示在经过了dk数据增强的无标签图像xu上提取出的特征。
步骤4:使用阶段,输入待检测外星地表图像x,输出分类预测结果Hcls(B(x))。
对输出的分类预测结果测试可知,能够将通用图像识别模型ResNet-50的Top-1准确率由79.28%提升至95.86%。
相比较于现有特征提取、自学习训练、相似度判断、分类器分类等方法,本发明方法能更加有效地解决地外探测图像识别的问题,这是因为地外行星图像的训练-测试差异是由于“探测器的前行与时间推进造成的环境变化与设备老化,以及探测器并不是以稳定的频率均匀地使用每一个设备进行数据采集”的原因造成的。与常见图像任务的训练-测试差异相比,地外行星图像任务上的训练-测试差异更加复杂。在MSL Surface火星地表图像识别基准测试集的实验结果上,经典的图像分类性能提升技术:Triplet loss、Centerloss、Focal loss、Pseudo labeling,只能分别实现84.87%、82.91%、82.86%、78.64%的Top-1识别准确率,而本发明通用图像识别模型ResNet-50的Top-1准确率由79.28%提升至95.86%,显著提升外星地表图像识别性能。
以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的精神和范围,本发明的保护范围应以权利要求书所述为准。
Claims (10)
1.一种基于对比学习的外星地表图像识别方法,其特征在于,包括以下步骤:
搭建图像识别模型,该图像识别模型包含特征提取器、分类检测器、类间对比学习检测器和相似性学习检测器;
搜集有标签和无标签的外星地表图像训练数据集,并输入到图像识别模型进行训练,该图像识别模型通过特征提取器提取外星地表图像的图像特征,通过分类检测器对外星地表图像的图像特征进行分类,通过类间对比学习检测器和相似性学习检测器根据分类后的图像特征分别进行类间对比学习和相似性学习任务目标的预测,以使该图像识别模型自适应学习新样本类型与数据域分布;通过迭代训练优化模型参数,直到该图像识别模型的总损失函数最小为止,得到训练好的图像识别模型;
将待检测的外星地表图像输入到该训练好的图像识别模型中进行分类,该训练好的图像识别模型通过特征提取器提取外星地表图像的图像特征,通过分类检测器根据所述图像特征进行分类,输出分类预测结果。
2.如权利要求1所述的方法,其特征在于,进行类间对比学习时,首先对数据集中的样本xi进行随机数据增强操作,生成两个模态d1(xi)和d2(xi),其中d表示同一个随机数据增强操作;数据增强操作包含形状增强和像素增强,形状增强包括翻转、裁剪、缩放大小和旋转,像素增强包括高斯模糊、颜色抖动和降低饱和度。
3.如权利要求1所述的方法,其特征在于,迭代训练次数至少为25轮。
4.如权利要求1所述的方法,其特征在于,图像识别模型的总损失函数由分类交叉熵损失函数Lcls、类间对比学习损失函数Ls和相似度学习损失函数Lu组成,表达式为:L=λclsLcls+λsLs+λuLu,其中λcls、λs和λu是权重项。
5.如权利要求4所述的方法,其特征在于,λcls=1,λs=1,λu=0.2;类间对比学习损失函数Ls的训练批batch大小为24,分类交叉熵损失函数Lcls和相似度学习损失函数Lu的训练批batch大小为16。
6.如权利要求4所述的方法,其特征在于,分类交叉熵损失函数Lcls的表达式为:
其中,yc为样本的标签,正确类的值为1,错误类的值为0;pc=Hcls(B(x))为分类检测器所预测的样本属于类别c的概率,B(x)是特征提取器;M为类别总数。
7.如权利要求4所述的方法,其特征在于,类间对比学习损失函数Ls的表达式为:
其中,τ为温度系数;k为1或2,/>表示在经过了dk数据增强的样本xc.上提取的特征;xci和xcj分别表示类别标签为ci和cj的样本;sim(·,·)代表两个归一化向量的相似度,即sim(u,v)=uTv,其中u,v表示两个归一化向量。
8.如权利要求7所述的方法,其特征在于,τ=0.2。
9.如权利要求4所述的方法,其特征在于,相似度学习损失函数Lu的表达式为:
其中,k为1或2,B是特征提取器,Hu是相似性学习检测器,/>表示在经过了dk数据增强的无标签图像xu上提取出的图像特征。
10.一种基于对比学习的外星地表图像识别系统,其特征在于,包括:
数据采集模块,用于采集外星地表图像,输入到图像识别模型中进行识别;
图像识别模型,包含特征提取器、分类检测器、类间对比学习检测器和相似性学习检测器;特征提取器用于提取外星地表图像的图像特征;分类检测器用于对外星地表图像的图像特征进行分类;类间对比学习检测器和相似性学习检测器用于在训练过程中根据图像特征分别进行类间对比学习和相似性学习任务目标的预测,以使该图像识别模型自适应学习新样本类型与数据域分布;该图像识别模型经过训练后,用于对待检测的外星地表图像的图像特征进行识别和分类;
预训练模块,用于搜集有标签和无标签的外星地表图像训练数据集,并输入到所述图像识别模型进行迭代训练,通过优化模型参数,降低模型的总损失函数,获得训练后的图像识别模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111010548.0A CN113792630B (zh) | 2021-08-31 | 2021-08-31 | 一种基于对比学习的地外探测图像识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111010548.0A CN113792630B (zh) | 2021-08-31 | 2021-08-31 | 一种基于对比学习的地外探测图像识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113792630A CN113792630A (zh) | 2021-12-14 |
CN113792630B true CN113792630B (zh) | 2023-11-07 |
Family
ID=78876695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111010548.0A Active CN113792630B (zh) | 2021-08-31 | 2021-08-31 | 一种基于对比学习的地外探测图像识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113792630B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753918A (zh) * | 2020-06-30 | 2020-10-09 | 浙江工业大学 | 一种基于对抗学习的去性别偏见的图像识别模型及应用 |
CN113255793A (zh) * | 2021-06-01 | 2021-08-13 | 之江实验室 | 一种基于对比学习的细粒度舰船识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11062179B2 (en) * | 2017-11-02 | 2021-07-13 | Royal Bank Of Canada | Method and device for generative adversarial network training |
CN110008842A (zh) * | 2019-03-09 | 2019-07-12 | 同济大学 | 一种基于深度多损失融合模型的行人重识别方法 |
-
2021
- 2021-08-31 CN CN202111010548.0A patent/CN113792630B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753918A (zh) * | 2020-06-30 | 2020-10-09 | 浙江工业大学 | 一种基于对抗学习的去性别偏见的图像识别模型及应用 |
CN113255793A (zh) * | 2021-06-01 | 2021-08-13 | 之江实验室 | 一种基于对比学习的细粒度舰船识别方法 |
Non-Patent Citations (1)
Title |
---|
基于深度学习的蝴蝶科级标本图像自动识别;周爱明;马鹏鹏;席天宇;王江宁;冯晋;邵泽中;陶玉磊;姚青;昆虫学报;第60卷(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113792630A (zh) | 2021-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ali et al. | Structural crack detection using deep convolutional neural networks | |
US11657602B2 (en) | Font identification from imagery | |
CN110909820B (zh) | 基于自监督学习的图像分类方法及系统 | |
CN107133569B (zh) | 基于泛化多标记学习的监控视频多粒度标注方法 | |
CN112766334B (zh) | 一种基于伪标签域适应的跨域图像分类方法 | |
CN109902662B (zh) | 一种行人重识别方法、系统、装置和存储介质 | |
US11144799B2 (en) | Image classification method, computer device and medium | |
CN109685065A (zh) | 试卷内容自动分类的版面分析方法、系统 | |
CN115631369A (zh) | 一种基于卷积神经网络的细粒度图像分类方法 | |
CN107545281B (zh) | 一种基于深度学习的单一有害气体红外图像分类识别方法 | |
CN112819837A (zh) | 一种基于多源异构遥感影像的语义分割方法 | |
CN110688966B (zh) | 语义指导的行人重识别方法 | |
WO2020119624A1 (zh) | 一种基于深度学习的类别敏感型边缘检测方法 | |
Singh et al. | CNN based approach for traffic sign recognition system | |
CN114170422A (zh) | 一种煤矿井下图像语义分割方法 | |
CN113936034A (zh) | 一种结合帧间光流的表观运动联合弱小运动目标检测方法 | |
CN111612803B (zh) | 一种基于图像清晰度的车辆图像语义分割方法 | |
CN108960005B (zh) | 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统 | |
CN113538342A (zh) | 一种基于卷积神经网络的铝质气雾罐涂层质量检测方法 | |
Li | A deep learning-based text detection and recognition approach for natural scenes | |
CN117372853A (zh) | 一种基于图像增强和注意力机制的水下目标检测算法 | |
CN110349119B (zh) | 基于边缘检测神经网络的路面病害检测方法和装置 | |
Kajabad et al. | YOLOv4 for urban object detection: Case of electronic inventory in St. Petersburg | |
CN113792630B (zh) | 一种基于对比学习的地外探测图像识别方法及系统 | |
Rani et al. | Object Detection in Natural Scene Images Using Thresholding Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |