CN111914908A - 一种图像识别模型训练方法、图像识别方法及相关设备 - Google Patents
一种图像识别模型训练方法、图像识别方法及相关设备 Download PDFInfo
- Publication number
- CN111914908A CN111914908A CN202010674325.3A CN202010674325A CN111914908A CN 111914908 A CN111914908 A CN 111914908A CN 202010674325 A CN202010674325 A CN 202010674325A CN 111914908 A CN111914908 A CN 111914908A
- Authority
- CN
- China
- Prior art keywords
- image recognition
- training
- feature
- recognition model
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 232
- 238000000034 method Methods 0.000 title claims abstract description 111
- 239000011159 matrix material Substances 0.000 claims abstract description 137
- 238000005259 measurement Methods 0.000 claims abstract description 81
- 238000000605 extraction Methods 0.000 claims abstract description 65
- 238000013507 mapping Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims description 37
- 230000007704 transition Effects 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 21
- 238000012546 transfer Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 7
- 238000013526 transfer learning Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000013508 migration Methods 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011524 similarity measure Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000002939 conjugate gradient method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种图像识别模型训练方法、图像识别方法及相关设备,用于减少训练模型的训练样本。该图像识别模型训练方法包括:通过第一图像识别模型的第一特征提取模块,提取训练集中各样本图像的特征,获得各样本图像的第一特征矩阵;通过所述第一相似度度量模块,对各第一特征矩阵进行映射,获得各第二特征矩阵;并确定每两个第二特征矩阵之间的相似度;调整所述第一相似度度量模块的模型参数,直到训练损失满足目标损失,获得已训练的第一图像识别模型,其中,所述训练损失表示与样本图像目标分类标签相同的样本图像的相似度与样本图像目标分类标签不同的样本图像的相似度之间的误差。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像识别模型训练方法、图像识别方法及相关设备。
背景技术
在图像识别之前,通常需要根据图像识别任务训练一个神经网络模型,然而,训练神经网络模型需要大量的训练样本,这在实际应用中是很难实现的。
随着图像识别准确性的要求的不断提升,图像识别模型的特征提取模块涉及的参数越来越多,在模型应用端对图像识别模型进行迁移学习时,仅基于实际应用时的样本,对特征提取模块进行训练,会导致迁移学习后的图像识别模型产生严重的偏置,因此训练特征提取模块时,除了实际应用时的样本以外,仍然需要较多的迁移学习前的训练样本一同参与对图像识别模型的训练,对于模型应用端来说,获得迁移学习前的训练样本是很难实现的,因此,在训练过程中,仍然存在所需训练样本较多的问题,造成训练效率较低。
发明内容
本申请实施例提供一种图像识别模型训练方法、图像识别方法及相关设备,用于减少训练模型的训练样本。
第一方面,提供一种图像识别模型训练方法,该方法包括:
通过第一图像识别模型的第一特征提取模块,提取训练集中各样本图像的特征,获得各样本图像的第一特征矩阵;其中,所述第一特征提取模块的模型参数是从已训练的第二图像识别模型迁移得到的,所述第一图像识别模型和所述第二图像识别模型用于识别不同的目标;
通过所述第一相似度度量模块,对各第一特征矩阵进行映射,获得各第二特征矩阵,并确定每两个第二特征矩阵之间的相似度;
根据每两个第二特征矩阵之间的相似度,确定所述第一图像识别模型的训练损失;
根据所述训练损失,调整所述第一相似度度量模块的模型参数,直到所述第一图像识别模型的训练损失满足目标损失,获得已训练的第一图像识别模型。
可选的,调整所述第一相似度度量模块的模型参数,包括:
在每一次调整过程中,按照预设调整范围,调整第一相似度度量模块的模型参数。
可选的,所述方法还包括:
在每一次调整过程中,对调整后的第一相似度度量模块的模型参数进行正则化约束。
可选的,第一相似度度量模块的模型参数包括单位矩阵形式的转移矩阵。
可选的,确定每两个第二特征矩阵之间的相似度,包括:
针对每两个第二特征矩阵,确定两个第二特征矩阵之间的余弦相似度。
第二方面,提供一种图像识别方法,包括:
通过已训练的第一图像识别模型,对待处理图像进行识别;其中,已训练的第一图像识别模型是通过第一方面所述的任一方法训练得到的;
获得所述待处理图像的目标分类。
第三方面,提供一种训练图像识别模型的装置,包括:
特征提取模块:用于提取训练集中各样本图像的特征,获得各样本图像的第一特征矩阵;其中,所述特征提取模块的模型参数是从已训练的第二图像识别模型迁移得到的,第一图像识别模型和所述第二图像识别模型用于识别不同的目标;
训练模块:用于通过第一相似度度量模块,对各第一特征矩阵进行映射,获得各第二特征矩阵,并确定每两个第二特征矩阵之间的相似度;以及,根据每两个第二特征矩阵之间的相似度,确定所述第一图像识别模型的训练损失;以及,根据所述训练损失,调整所述第一相似度度量模块的模型参数,直到所述第一图像识别模型的训练损失满足目标损失,获得已训练的第一图像识别模型。
可选的,所述训练模块具体用于:在每一次调整过程中,按照预设调整范围,调整第一相似度度量模块的模型参数。
可选的,所述训练模块还用于:在每一次调整过程中,对调整后的第一相似度度量模块的模型参数进行正则化约束。
可选的,第一相似度度量模块的模型参数包括单位矩阵形式的转移矩阵。
可选的,所述训练模块具体用于:针对每两个第二特征矩阵,确定两个第二特征矩阵之间的余弦相似度。
第四方面,提供一种图像识别装置,包括:
识别模块:用于通过已训练的第一图像识别模型,对待处理图像进行识别;其中,已训练的第一图像识别模型是通过第一方面中任一所述的方法得到的;
获得模块:用于获得所述待处理图像的目标分类。
第五方面,提供一种计算机设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行第一方面或第二方面中任一所述的方法。
第六方面,提供一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行第一方面或第二方面中任一所述的方法。
本申请实施例中,在第一图像识别模型的第一相似度度量模块中,引入了模型参数,通过训练第一相似度度量模块中的模型参数,可以在不改变第一图像识别模型的第一特征提取模块的模型参数的取值的情况下,只对第一相似度度量模块的模型参数进行调整,由于第一特征提取部分的模型参数的数量较多,因此,本申请实施例在对第一图像识别模型进行训练时,调整第一相似度度量模块的模型参数,而不改变特征提取部分的模型参数可以大大降低训练过程中的计算量,降低训练时长,从而提高模型训练的效率。
由于不需要对第一特征提取部分的模型参数进行调整,因此,减少了模型训练过程中需要的训练样本的数量,且,不需要将迁移学习前的训练样本作为迁移学习后的训练样本,进一步减少了模型训练过程中需要的训练样本的数量。
通过迁移已训练的第二图像识别模型的模型参数,获得第一图像识别模型中第一特征提取模块的模型参数和第一图像识别模型中第一相似度度量模块的初始模型参数,使得第一图像识别模型可以基于第二图像识别模型的模型参数进行训练,不需要从随机的模型参数开始,对第一图像识别模型的模型参数进行训练,简化了模型参数的训练过程,在一定程度上,减少了模型训练过程中需要的训练样本的数量。
附图说明
图1为相关技术中训练图像识别模型方法的原理示意图;
图2为本申请实施例提供的图像识别模型训练方法的应用场景;
图3为本申请实施例提供的图像识别模型训练方法涉及的交互示意图一;
图4为本申请实施例提供的图像识别模型训练方法的原理示意图一;图5为本申请实施例提供的图像识别模型的训练过程的流程示意图一;
图6为本申请实施例提供的图像识别模型训练方法的原理示意图二;
图7为本申请实施例提供的图像识别模型的训练过程的流程示意图二;
图8为本申请实施例提供的图像识别模型训练方法涉及的交互示意图二;
图9为本申请实施例的提供的图像识别模型训练装置的结构示意图;
图10为本申请实施例的提供的图像识别装置的结构示意图;
图11为本申请实施例的提供的计算机设备的结构示意图。
具体实施方式
为了使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
下面对本申请实施例中涉及的名词进行解释:
迁移学习:把为针对第一任务训练的模型A的模型参数迁移到执行第二任务的模型B中,在通过针对第二任务的训练样本,对模型B进行微调之后,调整后的模型B可以用于执行第二任务。
另外,本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
请参考图1,为相关技术中训练图像识别模型方法的原理示意图。图像识别模型A包括特征提取模块a和相似度度量模块b,特征提取模块a对第一类样本图像进行特征提取,获得输入的样本图像对应的各特征矩阵,各特征矩阵经过相似度度量模块b进行相似度计算,获得针对第一类样本图像的识别结果。将图像识别模型A的模型参数迁移到图像识别模型B中,图像识别模型B包括特征提取模块101和相似度度量模块103。特征提取模块101对第二类样本图像进行特征提取,获得输入的样本图像对应的各特征矩阵,各特征矩阵经过相似度度量模块103进行相似度计算,获得训练损失,在训练损失不满足目标损失时,确定特征提取模块101中的模型参数调整后的取值,根据模型参数调整后的取值重新利用第二类样本图像,对图像识别模型B进行训练,直到训练损失满足目标损失后,获得已训练的图像识别模型B。
然而,特征提取模块101的模型参数的数量较多,且,随着图像识别过程中,对图像的特征提取模块的要求越来越高,使得特征提取模块的模型参数的数量越来越多。因此,根据相关技术中训练图像识别模型方法,基于迁移学习对图像识别模型进行训练的过程中,仅依据实际应用时的样本,对图像识别模型进行训练时,会导致图像识别模型严重的偏置,因此训练图像识别模型时,除了实际应用时的样本以外,仍然需要较多的迁移学习前的训练样本一同参与训练,对于模型应用端来说,获得迁移学习前的训练样本是很难实现的,因此,在训练过程中,仍然存在所需训练样本较多的问题,造成训练效率较低。
鉴于此,为了减少训练模型时所需训练样本,本申请提供一种图像识别模型训练方法。请参考图2,为一种图像识别的应用场景,该应用场景包括第一训练端201、第二训练端203和模型使用端205,其中,模型使用端205可以包括图像采集装置2051和图像识别装置2052。
第一训练端201基于第一训练集训练得到第二图像识别模型,第一训练集中包括第一目标的样本图像。已训练的第二图像识别模型可以用于识别图像中的第一目标。第二训练端203获得第二图像识别模型的模型参数,并将这些模型参数迁移到第一图像识别模型,并根据第二训练集训练第一图像识别模型,得到已训练的第一图像识别模型。第二训练样本集中包括第二目标的样本图像。已训练的第一图像识别模型可以用于图像中的第二目标。模型使用端205是在第二训练端203完成迁移训练之后,将已训练的图像识别模型应用于图像识别装置2052,从而图像识别装置2052可以对图像采集装置2051采集的待识别图像进行识别。
其中,第一训练端201和第二训练端203可以是同一个设备,也可以是不同的设备;第二训练端203和模型使用端205可以是同一个设备,也可以是不同的设备。图像采集装置2051可以是设置在图像识别装置2052中,或者图像采集装置2051和图像识别装置2052可以是独立设置的。图像采集装置2051可以是摄像头,或者,可以是图像识别装置2052中的接收模块等。图像识别装置2052可以是终端设备,客户端,或者服务器等。第一训练端201、第二训练端203或模型使用端205可以是终端设备,或者,可以是客户端,或者,可以是服务器等。终端设备例如手机、台式计算机或平板电脑等。客户端可以是安装在终端设备中的应用程序,或者,可以是终端设备可以访问的网页,或者,可以是终端设备可以访问的第三方平台等。
第一训练集和第二训练集可以是不同的训练集,或者,可以是相同的训练集,或者,第二训练集可以是第一训练集中的一部分。在一些实际应用场景中,第一训练集和第二训练集一般是不同的训练集,且第一训练集包括的样本图像的数量远远大于第二训练集包括的样本图像的数量。第一训练集中包括第一目标的样本图像,以及各样本图像对应的目标分类标签,第二训练集中包括第二目标的样本图像,以及各样本图像对应的目标分类标签。目标分类标签用于标识样本图像的目标类别。
作为一种实施例,第一目标和第二目标可以是属于相同一级分类的目标中不同的二级分类的目标。其中,一级分类可以理解为父分类,二级分类可以理解为子分类,比如一级分类下可以再划分为多个二级分类。第一目标和第二目标可以是属于相同一级分类的目标中不同的二级分类的目标,例如第一目标和第二目标均是人脸,但是第一目标是A用户对应的人脸,第二目标是B用户对应的人脸;或者,例如第一目标和第二目标均是用户B的人脸,但是第一目标是针对用户B的正脸,第二目标是针对用户B的侧脸;或者,例如第一目标和第二目标均是人体,第一目标是A用户对应的人体,第二目标是B用户对应的人体,等等。
基于图2的应用场景,对训练图像识别模型的方法进行介绍。请参考图3,为本申请涉及的第一训练端201、第二训练端203之间的交互过程示意图。下面结合图3,对该方法进行说明。
S301,第一训练端201获得已训练的第二图像识别模型。
第二图像识别模型可以是第一训练端201基于第一训练集,训练得到的图像识别模型,在训练开始,第二图像识别模型的初始模型参数可以随机生成的。或者,第一训练端201可以从其他设备或者网络资源上获得已训练的图像识别模型。其中,第一训练集可以是通过人工手动标注获得的各样本图像,或者,可以是通过标注程序自动标注获得的各样本图像,或者,可以是通过网络资源上直接下载得到的各样本图像。
作为一种实施例,第二图像识别模型包括第二特征提取模块和第二相似度度量模块。
其中,第二图像识别模型可以用于识别样本图像中的第一目标。第二特征提取模块用于提取图像的特征,第二相似度度量模块用于确定两个图像的特征之间的相似度,进而根据两个图像的特征之间的相似度,确定出图像中的第一目标的类别。
下面对第一训练端201训练第二图像识别模型的过程进行示例:
第一训练端201将样本图像输入第二特征提取模块。第二特征提取模块可以对样本图像进行特征提取,获得样本图像对应的特征矩阵。第一训练端201将特征矩阵输入第二相似度度量模块,通过第二相似度度量模块可以确定两个特征矩阵的相似度,如果两个特征矩阵的相似度大于阈值,则确定两个特征对应的样本图像中目标属于同一个目标分类。根据第一训练集中各样本图像的目标分类标签,以及第二图像识别模型预测出的目标分类,调整第二图像识别模型的模型参数,直到模型满足预设条件,获得已训练的第二图像识别模型。这里的预设条件比如第二图像识别模型的训练损失满足目标损失,或者第二图像识别模型的学习率达到预设学习率等。模型的训练损失可以有多种表达方式,本申请不做限制。
S302,第二训练端203将第二图像识别模型的模型参数迁移到第一图像识别模型中。
第二训练端203将第二图像识别模型的模型参数迁移到第一图像识别模型中,获得待训练的第一图像识别模型。比如,第一图像识别模型和第二图像识别模型为同一结构的图像识别模型,在迁移时,直接将S301中获得的已训练的第二图像识别模型作为未训练的第一图像识别模型。
例如,请参考图4,为第一图像识别模型的一种结构示意图。第一图像识别模型包括第一特征提取模块401和第一相似度度量模块403。第一特征提取模块401包括第二特征提取模块的模型参数,第一相似度度量模块403包括第二相似度度量模块的模型参数。
以图4为例,在迁移第二图像识别模型的模型参数时,可以将第二图像识别模型的第二特征提取模块的模型参数迁移到第一图像识别模型中的第一特征提取模块,将第二图像识别模型的第二相似度度量模块的模型参数迁移到第一图像识别模型中的第一相似度度量模块。
S303,第二训练端203获得各样本图像的第一特征矩阵,并将各第一特征矩阵输入第一相似度度量模块。
第二训练端203将第二图像识别模型的模型参数迁移到第一图像识别模型中之后,第二训练端203可以将第二训练集中的各样本图像输入第一图像识别模型,第一特征提取模块401获得输入的样本图像,并对获得的样本图像进行特征提取。第一特征提取模块401对样本图像进行特征提取之后,第二训练端203可以获得样本图像对应的第一特征矩阵。
作为一种实施例,第一特征提取模块401可以包括多个卷积层,依次通过多个卷积层对样本图像进行处理。比如通过第一个卷积层对样本图像进行特征提取时,可以通过样本图像的像素点与第一卷积核进行卷积的方式,对样本图像进行特征提取。其中,第一卷积核为m×n维的矩阵。样本图像中从1×1位的像素点到m×n位的像素点与第一卷积核进行卷积,获得第一层级的特征矩阵中第一位的取值。在获得第一位的取值之后,第一卷积核可以向右滑动,直到样本图像中所有的像素点均完成特征提取,从而获得第一个卷积层的特征矩阵。再将第一个卷积层的特征矩阵输入下一个卷积层,直到完成所有卷积层的特征提取,获得第一特征矩阵。其中,第一特征矩阵可以只包括最后一个卷积层的特征矩阵,或者,可以包括每一个卷积层的特征矩阵,或者,可以包括部分卷积层的特征矩阵,具体不作限制。
第二训练端203获得各样本图像的第一特征矩阵之后,将各第一特征矩阵输入第一相似度度量模块403。请参考图5,为第一相似度度量模块403确定各第一特征矩阵之间的相似度的一种流程示意图。下面对第一相似度度量模块403确定各第一特征矩阵之间的相似度的方法进行介绍。
S501,第二训练端203对第一特征矩阵进行映射,获得各第二特征矩阵。
由于第二图像识别模型是用于识别第一目标的,如果直接将第二图像识别模型的模型参数迁移到第一图像识别模型中,对样本图像中的第二目标进行识别,可能会出现识别效果不好的情况,因此,需要在将第二图像识别模型的模型参数迁移到第一图像识别模型之后,基于第二训练集对第一图像识别模型进行再训练。为了避免调整第一特征提取模块的模型参数,降低第二训练集的数据量,减少训练过程中的计算量和训练时长,本申请实施例中在第一相似度度量模块403中引入用于映射特征矩阵的模型参数,第二训练端203可以根据第一相似度度量模块403的模型参数,对各第一特征矩阵进行映射,从而,可以通过改变第一相似度度量模块403的模型参数,改变映射后的各第一特征矩阵,从而改变各第一特征矩阵在不同的特征维度上的重要程度,即各第一特征矩阵在不同的特征维度在识别过程中所起的作用。对第一特征矩阵进行映射的方式可以是线性映射的方式,或者也可以采用非线性映射,下面对第一相似度度量模块403中模型参数进行示例说明。
例如,第一相似度度量模块403中的模型参数包括转移矩阵,即采用转移矩阵对第一特征矩阵进行映射。
具体的,第一相似度度量模块403的模型参数包括转移矩阵。转移矩阵用于与第一特征矩阵进行乘法运算,例如第一特征矩阵的大小为1×y,转移矩阵的大小可以是y×y,那么,转移矩阵与第一特征矩阵相乘之后,获得的第二特征矩阵的大小为1×y,与第一特征矩阵的大小相同,或者,转移矩阵的大小不是y×y时,那么获得的第二特征矩阵的大小与第一特征矩阵的大小不同。
通过转移矩阵与第一特征矩阵相乘,可以获得映射后的第一特征矩阵,映射后的第一特征矩阵的大小可以是1×y。第二训练端203将各第一特征矩阵输入第一相似度度量模块403之后,可以通过转移矩阵对每个第一特征矩阵进行映射,获得每个映射后的第一特征矩阵,即第二特征矩阵,以此类推,当第一特征矩阵为多个时,就获得多个第二特征矩阵。
该实施例中,根据第一相似度度量模块403中的转移矩阵,对各第一特征矩阵进行映射,在对第一相似度度量模块403进行训练的过程中,可以通过调整转移矩阵的取值,来调整映射后的第一特征向量的取值,从而达到在不需要改变第一特征提取模型的模型参数的前提下,改变样本图像对应的特征向量的目的。从而,通过调整转移矩阵的取值,可以调整第一特征矩阵中不同特征维度在第一图像识别模型中的重要程度,相较于直接训练第一特征提取模块401,不仅能够使得更加具有针对性的调整第一特征矩阵中不同特征维度的取值,同时避免了基于迁移学习对第一图像识别模型进行训练的过程中,仅依据第二训练集,对特征提取模块进行训练时,导致的第一图像识别模型严重的偏置,避免了第二训练集需要合并部分第一训练集,以稳定第一图像识别模型的情况,减少了训练第一图像识别模型所需的训练样本,从而,降低了训练过程中的计算量,以及训练时长,提高了第一图像识别模型的训练效率。
在对第一相似度度量模块403进行第一次训练时,各第一特征矩阵经过单位矩阵的映射之后,获得的各第二特征矩阵,与各第一特征矩阵的取值相同,即没有改变第一特征提取模块401提取出的各第一特征矩阵,完全继承了第二图像识别模型的识别效果,相较于基于随机的模型参数进行调整的方法,基于第二图像识别模型的识别效果,对转移矩阵进行调整的方式,可以在继承了第二图像识别模型的识别效果的同时,简化了模型参数的调整过程,简化第一图像识别模型的训练过程,提高了第一图像识别模型的训练效率。
作为一种实施例,在对第一图像识别模型进行训练的过程中,第一特征提取模块401可以一次性对所有训练集中所有样本图像进行一次特征提取的过程,第二训练端203获得各样本图像的第一特征矩阵之后,每次训练第一相似度度量模块403时,可以直接使用各样本图像的第一特征矩阵进行训练,不需要每次训练第一特征提取模块401都对各样本图像进行一次特征提取,在一定程度上,减少了训练第一图像识别模型过程中的计算量,减少了训练时长,提高了训练第一图像识别模型的效率。
S502,第二训练端203确定每两个第二特征矩阵的相似度。
在获得各第二特征矩阵之后,第一相似度度量模块403可以确定所有第二特征矩阵中每两个第二特征矩阵的相似度。第一相似度度量模块403确定相似度的方法有多种,下面以确定相似度的方法中的两种为例进行介绍。
方法一:
第一相似度度量模块403确定每两个第二特征矩阵的余弦相似度,获得每两个第二特征矩阵的相似度。
具体的,每两个第二特征矩阵的余弦相似度越大,则每两个第二特征矩阵的相似度越高,每两个第二特征矩阵的余弦相似度越小,则每两个第二特征矩阵的相似度越低。余弦相似度是衡量两个矩阵在向量空间中,方向上的差异,因此,计算两个第二特征矩阵之间的余弦相似度可以更加准确的表示两个第二特征矩阵之间的相似度。
在一种可能的实施例中,第一相似度度量模块403在对每两个第二特征矩阵进行余弦相似度计算之前,或者,在对每两个第二特征矩阵进行余弦相似度计算时,可以对各第二特征矩阵进行归一化处理,获得各归一化处理后的第二特征矩阵。第一相似度度量模块403在对每两个第二特征矩阵进行余弦相似度计算时,可以根据各归一化处理后的第二特征矩阵,计算每两个第二特征矩阵的余弦相似度。从而,第一相似度度量模块403可以先获得每一个第二特征矩阵归一化处理后的结果,在每次对某两个第二特征矩阵进行余弦相似度计算时,可以直接计算两个归一化处理后的第二特征矩阵的余弦相似度,不需要每次都进行归一化计算。从而,简化了第一相似度度量模块403计算各第二特征矩阵的余弦相似度的步骤,提高了各第二特征矩阵的余弦相似度的计算效率。
具体的,请参考公式(1)和公式(2),第一相似度度量模块403对第二特征矩阵x和第二特征矩阵y进行归一化处理,获得归一化处理后的xn和yn。其中,归一化处理可以是除以第二特征矩阵行向量的L2范数。
第一相似度度量模块403根据归一化处理后的第二特征矩阵xn和yn,计算第二特征矩阵x和y的余弦相似度。请参考公式(3):
simcos(x,y)=xn Tyn (3)
作为一种实施例,在第一相似度度量模块引入的用于映射特征矩阵的模型参数为转移矩阵时,将各第一特征矩阵输入第一相似度度量模块,获得各第一特征矩阵中每两个第一特征矩阵的余弦相似度,请参考公式(4):
其中,A表示转移矩阵,a和b表示两个第一特征矩阵,simcos(a,b)表示两个第一特征矩阵a和b的余弦相似度,(A a)表示第一特征矩阵a对应的第二特征矩阵,(A b)表示第一特征矩阵b对应的第二特征矩阵,(A a)n表示对(A a)进行归一化处理后结果,(A b)n表示对(A b)进行归一化处理后的结果。
方法二:
第一相似度度量模块403确定每两个第二特征矩阵的欧式距离,获得每两个第二特征矩阵的相似度。
具体的,每两个第二特征矩阵的欧式距离越大,则每两个第二特征矩阵的相似度越低,每两个第二特征矩阵的欧式距离越小,则每两个第二特征矩阵的相似度越高。欧式距离的具体计算方法请参考公式(5):
其中,x和y表示两个第二特征矩阵,(x-y)T表示矩阵(x-y)的转置,distE(x,y)表示两个第二特征矩阵x和y的欧式距离。
S304,第二训练端203确定第一相似度度量模块403的训练损失是否满足目标损失。
第二训练端203根据每两个第二特征矩阵的相似度,确定第一相似度度量模块403的训练损失,其中,训练损失表示与样本图像目标分类标签相同的样本图像的相似度与样本图像目标分类标签不同的样本图像的相似度之间的误差。
第二训练端203训练第一相似度度量模块403的方法有多种,例如,triplet-based模式等,下面以triplet三元组方法为例进行介绍。
属于相同目标分类标签的样本图像之间的余弦相似度应该是尽可能大,属于不同目标分类标签的样本图像之间的余弦相似度应该是尽可能小,在这样的情况下,获得的模型才能更符合要求。
因此,第一相似度度量模块403的训练损失的计算方法,请参考公式(6):
Loss=(simop-simsa+α)+(1-simsa) (6)
其中,simop表示属于不同目标分类标签的样本图像之间的余弦相似度,simsa表示属于相同目标分类标签的样本图像之间的余弦相似度,α表示相似度simsa和相似度simop之间的差值应该达到的值,(1-simsa)表示属于相同目标分类标签的样本图像之间的余弦相似度应该接近1。
triplet三元组方法训练第一相似度度量模块403,相较于分类学习方法训练第一相似度度量模块403,由于分类学习方法对于每个分类均需要较多的样本图像提高每个分类的类内代表性,因此,triplet三元组方法所需的第二训练集的数据量较少。且,分类学习方法只是保证同一目标的目标特征向各自虚拟的类中心靠近,而不是直接训练这些特征的相似度,而triplet三元组方法可直接训练目标特征的相似度,同一目标的目标特征相似度逼近于相似度上限,不同目标的相似度与同一目标的相似度有较大分差,使得目标的相似度值更具有区分度。
以目标是人脸为例,进行介绍,请参考图6,为第一图像识别模型的一种结构示意图。
例如,第二训练集中包括每个人的至少两张人脸图像,如5张人脸图像人脸A1、人脸A2、人脸A3、人脸B1和人脸B2。
第二训练端203将人脸A1、人脸A2、人脸A3、人脸B1和人脸B2输入第一图像识别模型。第一图像识别模型中的特征提取模块对人脸A1、人脸A2、人脸A3、人脸B1和人脸B2进行特征提取,获得特征A1、特征A2、特征A3、特征B1和特征B2。第二训练端203将特征A1、特征A2、特征A3、特征B1和特征B2输入相似度度量模块。相似度度量模块获得特征A1、特征A2、特征A3、特征B1和特征B2每两个特征之间的相似度。相似度度量模块确定特征A1、特征A2和特征A3中与特征B1或特征B2相似度最大的特征,如特征A2与特征B1之间的相似度最大,记为simop。相似度度量模块基于特征A2,确定特征A1、特征A2和特征A3中,与特征A2相似度最小的特征,如特征A1,记为simsa。相似度度量模块计算训练损失Loss,并确定Loss是否满足目标损失。
S305,若第一相似度度量模块403的训练损失不满足目标损失,则第二训练端203确定第一相似度度量模块403的模型参数调整后的取值。
第二训练端203根据目标损失,确定训练损失是否满足目标损失,如果训练损失满足目标损失,则表示模型的模型参数已经调整完成,此时S305不用执行,直接执行S306。如果训练损失不满足目标损失,那么第二训练端203采用模型优化算法,确定模型参数调整后的取值。将该调整后的取值作为模型参数的取值之后,进入下一次训练。第二训练端203继续调整模型参数,直到训练损失满足目标损失。其中,模型优化算法表示用于在模型训练过程中,优化模型参数的算法,例如梯度下降算法、牛顿法、共轭梯度法和拉格朗日乘数法等。
作为一种实施例,训练损失满足目标损失可以是训练损失稳定在小于目标损失的值,或者,可以是训练损失稳定在目标损失所表示的取值范围内,等等。
作为一种实施例,在采用模型优化算法,确定模型参数调整后的取值时,第二训练端203可以对调整后的模型参数进行限定,使得调整后的模型参数与调整前的模型参数可以保持在某一预设调整范围内,避免了对模型参数进行过度调整的情况,那么,第一特征矩阵在经过第一相似度度量模块403进行映射之后,映射后的第一特征矩阵所表示的各特征的重要性,与映射前的第一特征矩阵所表示的各特征的重要性不会出现过大的差异,训练后的第一图像识别模型针对样本图像的识别不会出现严重偏置,即减少出现过拟合的情况。
由于第一特征提取模块401的模型参数是由第二图像识别模型迁移得到的,因此,根据第一特征提取模块401提取的第一特征矩阵,在没有调整的情况下,在进行目标分类时,第一图像识别模型可以保持第二图像识别模型的识别效果,且,通过微调第一相似度度量模块403的模型参数,对第一特征矩阵中的值进行微调,使得调整后的第一图像识别模型可以适应针对第二目标的识别需求。
以限定第一相似度度量模块403的模型参数调整前的取值,以及第一相似度度量模块403的模型参数调整后的取值在一定范围内为例,计算公式请参考公式(7):
ω‖A-B‖F<ε (7)
其中,A表示模型参数调整后的取值,B表示模型参数调整前的取值,ω表示权重系数,‖A-B‖F表示模型参数调整后的取值与模型参数调整前的取值之间的差值。在第一次对模型参数进行调整时,可以将B设置为模型参数的初始取值,如果模型参数包括转移矩阵,那么可以将转移矩阵的初始取值设置为单位矩阵。
作为一种实施例,如果模型参数包括转移矩阵,那么‖A-B‖F表示转移矩阵A与转移矩阵B之间的距离。模型参数调整后的取值与模型参数调整前的取值之间的差值可以用F范数计算,具体不作限制。
在一种可能的实施例中,可以对确定出的模型参数调整后的取值进行正则化约束,以模型参数为转移矩阵为例进行介绍。
第二训练端203根据模型优化算法,确定转移矩阵调整后的取值之后,可以对转移矩阵调整后的取值进行正则化约束,获得正则化约束后转移矩阵。正则化约束可以是为转移矩阵添加L2正则项,或者,可以是其他正则化约束方法,具体不作限制。对转移矩阵进行正则化约束,使得在每次训练过程中,减少第一图像识别模型过拟合的情况,在一定程度上,提高了训练出的第一图像识别模型的准确性。
S306,若第一相似度度量模块403的训练损失满足目标损失,则第二训练端203获得已训练的第一图像识别模型。
如果训练损失满足目标损失,那么表示模型参数已经调整完成。根据第一相似度度量模块403当前的模型参数的取值,获得已训练的第一相似度度量模块403。根据第一特征提取模块401和第一相似度度量模块403,获得已训练的第一图像识别模型。
作为一种实施例,第一图像识别模型在基于第二训练集完成训练之后,可以基于验证集对已训练的第一图像识别模型进行验证,以验证结果评价模型的训练效果,比如可以以第一图像识别模型的识别准确率来评价模型的训练效果。验证集包括第二目标的样本图像,以及样本图像的目标分类标签。验证集可以是第二训练集的一部分,或者,可以是与第二训练集包括不同的样本图像,或者,可以是模型使用端205所使用的样本图像的数据集等。
具体的,将验证集中的样本图像输入已训练的第一图像识别模型,可以根据已训练的第一图像识别模型输出的目标分类,确定目标分类与验证集中样本图像对应的目标分类标签一致的样本图像占总样本图像的比例,确定第一图像识别模型的识别准确率,或者,可以根据已训练的第一图像识别模型输出的目标分类,确定目标分类与验证集中样本图像对应的目标分类标签不一致的样本图像占目标分类与验证集中样本图像对应的目标分类标签一致的样本图像的比例,确定第一图像识别模型的识别准确率,等等。
作为一种实施例,训练第一相似度度量模块403的方法有很多,例如分类训练、triplet-based模式训练,等等。本申请实施例中以triplet三元组方法为例,对第一相似度度量模块403的训练过程进行介绍,无论是哪种训练方法,均可以采用在第一相似度度量模块403中引入用于映射特征向量的模型参数的思想,对第一相似度度量模块403进行训练,在此不再赘述。
为了更清楚地说明本申请实施例涉及的模型训练过程,下面结合图5,进行示例介绍。
请参考图7,为一次训练过程的流程图。以第二目标为用户对应的人脸,第二训练集包括不同用户对应的人脸样本图像和人脸样本图像对应的用户标签为例。图7中第二训练集包括用户A的人脸样本图像,和用户B的人脸样本图像,那么人脸样本图像即为前述的样本图像,用户A或用户B即为前述的样本图像对应的目标分类标签。
S701,将第二训练集中的人脸样本图像输入第一图像识别模型;
S702,第一特征提取模块401对人脸样本图像进行特征提取,获得第一特征矩阵。
S703,第一相似度度量模块403将各第一特征矩阵的每两个第一特征矩阵,即第一特征矩阵A和第一特征矩阵B,进行映射,获得第二特征矩阵A和第二特征矩阵B。
S704,第一相似度度量模块403计算第二特征矩阵A和第二特征矩阵B的余弦相似度,从而可以获得每两个第二特征矩阵的余弦相似度。
第一相似度度量模块403根据获得的每两个第二特征矩阵的余弦相似度,确定第一图像识别模型的训练损失。如果训练损失满足目标损失,则结束训练,获得已训练的第一图像识别模型;如果训练损失不满足目标损失,则根据优化算法确定用于映射特征矩阵的第一相似度度量模块403的模型参数调整后的取值,并根据第一相似度度量模块403的模型参数调整后的取值,重新训练第一相似度度量模块403,直到训练损失满足目标损失。
基于同一发明构思,本申请实施例还提供一种图像识别方法,请参考图8,为模型使用端205中图像采集装置2051和图像识别装置2052进行图像识别的交互过程图。
S801,图像采集装置2051获得待识别图像。
图像采集装置2051可以实时采集或周期性采集画面,将满足第一条件的指画面作为待识别图像。或者将采集得到每个画面均作为待识别图像。第一条件比如是画面的分辨率满足条件。
作为一种实施例,图像采集装置2051可以在满足第二条件时,获取当前的采集画面,第二条件可以是满足采集周期。
S802,图像识别装置2052获得来自图像采集装置2051的待识别图像。
图像采集装置2051向图像识别装置2052发送待识别图像,图像识别装置2052接收图像采集装置2051发送的待识别图像。
作为一种实施例,图像识别装置2052可以是基于用户的输入操作,获得待识别图像。
S803,图像识别装置2052通过已训练的第一图像识别模型,对待识别图像进行图像识别,获得识别结果。
在第二训练端203完成对第一图像识别模型的训练之后,第二训练端203可以将已训练的第一图像识别模型发送给模型使用端205,模型使用端205可以利用已训练的第一图像识别模型对待识别图像进行识别。已训练的第一图像识别模型用于识别第二目标。模型使用端205可以通过已训练的第一图像识别模型,识别待识别图像中的第二目标。
具体的,图像识别装置2052通过第一图像识别模型的第一特征提取模块401对待识别图像进行特征提取,获得第一特征矩阵。将第一特征矩阵输入第一相似度度量模块403,第一相似度度量模块403获得第一特征矩阵。第一相似度度量模块403对第一特征矩阵进行映射,获得待识别图像对应的第二特征矩阵。通过第一相似度度量模块403确定该待识别图像的第二特征矩阵以及包含第二目标的样本图像的第二特征矩阵之间的相似度,如果两个第二特征矩阵的相似度大于预设阈值,那么确定待识别图像中的目标为第二目标,将样本图像的目标分类标签作为待识别图像的目标分类,从而获得待识别图像的目标分类。
基于同一发明构思,本申请实施例提供一种训练图像识别模型的装置,该装置相当于前文论述的第二训练端201,能够实现前述图像识别模型训练方法对应的功能。请参考图9,该装置包括特征提取模块901和训练模块903,其中:
特征提取模块901:用于提取训练集中各样本图像的特征,获得各样本图像的第一特征矩阵;其中,特征提取模块901的模型参数是从已训练的第二图像识别模型迁移得到的,第一图像识别模型和第二图像识别模型用于识别不同的目标;
训练模块903:用于通过第一相似度度量模块,对各第一特征矩阵进行映射,获得各第二特征矩阵,并确定每两个第二特征矩阵之间的相似度;以及,根据每两个第二特征矩阵之间的相似度,确定第一图像识别模型的训练损失;以及,根据训练损失,调整第一相似度度量模块的模型参数,直到第一图像识别模型的训练损失满足目标损失,获得已训练的第一图像识别模型。
在一种可能的实施例中,训练模块903具体用于:在每一次调整过程中,按照预设调整范围,调整第一相似度度量模块的模型参数。
在一种可能的实施例中,训练模块903还用于:在每一次调整过程中,对调整后的第一相似度度量模块的模型参数进行正则化约束。
在一种可能的实施例中,第一相似度度量模块的模型参数包括单位矩阵形式的转移矩阵。
在一种可能的实施例中,训练模块903具体用于:针对每两个第二特征矩阵,确定两个第二特征矩阵之间的余弦相似度。
基于同一发明构思,本申请实施例提供一种图像识别装置,该装置能够实现前述图像识别的方法对应的功能。该装置相当于前文论述的模型使用端203。请参考图10,该装置包括识别模块1001和获得模块1003,其中:
识别模块1001:用于通过已训练的第一图像识别模型,对待处理图像进行识别;其中,已训练的第一图像识别模型是通过第三方面的装置训练得到的;
获得模块1003:用于获得待处理图像的目标分类。
基于同一发明构思,本申请实施例提供一种计算机设备,该设备能够实现前述图像识别模型训练方法对应的功能,请参考图11,该设备包括:
至少一个处理器1102,以及与至少一个处理器1102连接的存储器1104,本申请实施例中不限定处理器1102与存储器1104之间的具体连接介质,图11中是以处理器1102和存储器1104之间通过总线1100连接为例。总线1100在图11中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1100可以分为地址总线、数据总线、控制总线等,为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。或者,处理器1102也可以称为控制器1101,对于名称不做限制。
在本申请实施例中,存储器1104存储有可被至少一个处理器1102执行的指令,至少一个处理器1102通过执行存储器1104存储的指令,可以执行前文论述的图像识别模型训练方法。处理器1102可以实现图9所示的训练图像识别模型的装置或图10所示的图像识别装置中各个模块的功能。
其中,处理器1102是该设备的控制中心,可以利用各种接口和线路连接整个该设备的各个部分,通过运行或执行存储在存储器1104内的指令以及调用存储在存储器1104内的数据,该设备的各种功能和处理数据。
在一种可能的实施例中,处理器1102可包括一个或多个处理单元,处理器1102可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1102中。在一些实施例中,处理器1102和存储器1104可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
其中,处理器1102可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。
存储器1104作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1104可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器1104是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器1104还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
基于同一发明构思,本申请实施例还提供一种存储介质,该存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行前文论述的图像识别模型训练方法或图像识别方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种图像识别模型训练方法,其特征在于,包括:
通过第一图像识别模型的第一特征提取模块,提取训练集中各样本图像的特征,获得各样本图像的第一特征矩阵;其中,所述第一特征提取模块的模型参数是从已训练的第二图像识别模型迁移得到的,所述第一图像识别模型和所述第二图像识别模型用于识别不同的目标;
通过所述第一相似度度量模块,对各第一特征矩阵进行映射,获得各第二特征矩阵,并确定每两个第二特征矩阵之间的相似度;
根据每两个第二特征矩阵之间的相似度,确定所述第一图像识别模型的训练损失;
根据所述训练损失,调整所述第一相似度度量模块的模型参数,直到所述第一图像识别模型的训练损失满足目标损失,获得已训练的第一图像识别模型。
2.根据权利要求1所述的方法,其特征在于,调整所述第一相似度度量模块的模型参数,包括:
在每一次调整过程中,按照预设调整范围,调整第一相似度度量模块的模型参数。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在每一次调整过程中,对调整后的第一相似度度量模块的模型参数进行正则化约束。
4.根据权利要求1所述的方法,其特征在于,第一相似度度量模块的模型参数包括单位矩阵形式的转移矩阵。
5.根据权利要求1~4任一项所述的方法,其特征在于,确定每两个第二特征矩阵之间的相似度,包括:
针对每两个第二特征矩阵,确定两个第二特征矩阵之间的余弦相似度。
6.一种图像识别方法,其特征在于,包括:
通过已训练的第一图像识别模型,对待处理图像进行识别;其中,已训练的第一图像识别模型是通过权利要求1~5任一项所述的方法训练得到的;
获得所述待处理图像的目标分类。
7.一种训练图像识别模型的装置,其特征在于,包括:
特征提取模块:用于提取训练集中各样本图像的特征,获得各样本图像的第一特征矩阵;其中,所述特征提取模块的模型参数是从已训练的第二图像识别模型迁移得到的,第一图像识别模型和所述第二图像识别模型用于识别不同的目标;
训练模块:用于通过第一相似度度量模块,对各第一特征矩阵进行映射,获得各第二特征矩阵,并确定每两个第二特征矩阵之间的相似度;以及,根据每两个第二特征矩阵之间的相似度,确定所述第一图像识别模型的训练损失;以及,根据所述训练损失,调整所述第一相似度度量模块的模型参数,直到所述第一图像识别模型的训练损失满足目标损失,获得已训练的第一图像识别模型。
8.一种图像识别装置,其特征在于,包括:
识别模块:用于通过已训练的第一图像识别模型,对待处理图像进行识别;其中,已训练的第一图像识别模型是通过权利要求1~6任一所述的方法获得的;
获得模块:用于获得所述待处理图像的目标分类。
9.一种计算机设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如权利要求1~5或6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1~5或6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010674325.3A CN111914908B (zh) | 2020-07-14 | 2020-07-14 | 一种图像识别模型训练方法、图像识别方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010674325.3A CN111914908B (zh) | 2020-07-14 | 2020-07-14 | 一种图像识别模型训练方法、图像识别方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111914908A true CN111914908A (zh) | 2020-11-10 |
CN111914908B CN111914908B (zh) | 2023-10-24 |
Family
ID=73280049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010674325.3A Active CN111914908B (zh) | 2020-07-14 | 2020-07-14 | 一种图像识别模型训练方法、图像识别方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111914908B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112241744A (zh) * | 2020-10-20 | 2021-01-19 | 北京字跳网络技术有限公司 | 图像颜色迁移方法、装置、设备和计算机可读介质 |
CN113434671A (zh) * | 2021-06-23 | 2021-09-24 | 平安国际智慧城市科技股份有限公司 | 数据处理方法、装置、计算机设备及存储介质 |
CN113627361A (zh) * | 2021-08-13 | 2021-11-09 | 北京百度网讯科技有限公司 | 人脸识别模型的训练方法、装置及计算机程序产品 |
CN114359449A (zh) * | 2022-01-13 | 2022-04-15 | 北京大橘大栗文化传媒有限公司 | 一种面部数字资产制作方法 |
CN114417959A (zh) * | 2021-12-06 | 2022-04-29 | 浙江大华技术股份有限公司 | 特征提取的相关方法、目标识别方法、相关设备以及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9111134B1 (en) * | 2012-05-22 | 2015-08-18 | Image Metrics Limited | Building systems for tracking facial features across individuals and groups |
WO2018054283A1 (zh) * | 2016-09-23 | 2018-03-29 | 北京眼神科技有限公司 | 人脸模型的训练方法和装置、人脸认证方法和装置 |
CN108830236A (zh) * | 2018-06-21 | 2018-11-16 | 电子科技大学 | 一种基于深度特征的行人重识别方法 |
CN109753566A (zh) * | 2019-01-09 | 2019-05-14 | 大连民族大学 | 基于卷积神经网络的跨领域情感分析的模型训练方法 |
CN110009052A (zh) * | 2019-04-11 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 一种图像识别的方法、图像识别模型训练的方法及装置 |
CN110457982A (zh) * | 2018-12-28 | 2019-11-15 | 中国科学院合肥物质科学研究院 | 一种基于特征迁移学习的作物病害图像识别方法 |
WO2019232862A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 嘴巴模型训练方法、嘴巴识别方法、装置、设备及介质 |
CN110705406A (zh) * | 2019-09-20 | 2020-01-17 | 五邑大学 | 基于对抗迁移学习的人脸美丽预测方法及装置 |
US20200143248A1 (en) * | 2017-07-12 | 2020-05-07 | Tencent Technology (Shenzhen) Company Limited | Machine learning model training method and device, and expression image classification method and device |
CN111275060A (zh) * | 2018-12-04 | 2020-06-12 | 北京嘀嘀无限科技发展有限公司 | 识别模型更新处理方法、装置、电子设备及存储介质 |
-
2020
- 2020-07-14 CN CN202010674325.3A patent/CN111914908B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9111134B1 (en) * | 2012-05-22 | 2015-08-18 | Image Metrics Limited | Building systems for tracking facial features across individuals and groups |
WO2018054283A1 (zh) * | 2016-09-23 | 2018-03-29 | 北京眼神科技有限公司 | 人脸模型的训练方法和装置、人脸认证方法和装置 |
US20200143248A1 (en) * | 2017-07-12 | 2020-05-07 | Tencent Technology (Shenzhen) Company Limited | Machine learning model training method and device, and expression image classification method and device |
WO2019232862A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 嘴巴模型训练方法、嘴巴识别方法、装置、设备及介质 |
CN108830236A (zh) * | 2018-06-21 | 2018-11-16 | 电子科技大学 | 一种基于深度特征的行人重识别方法 |
CN111275060A (zh) * | 2018-12-04 | 2020-06-12 | 北京嘀嘀无限科技发展有限公司 | 识别模型更新处理方法、装置、电子设备及存储介质 |
CN110457982A (zh) * | 2018-12-28 | 2019-11-15 | 中国科学院合肥物质科学研究院 | 一种基于特征迁移学习的作物病害图像识别方法 |
CN109753566A (zh) * | 2019-01-09 | 2019-05-14 | 大连民族大学 | 基于卷积神经网络的跨领域情感分析的模型训练方法 |
CN110009052A (zh) * | 2019-04-11 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 一种图像识别的方法、图像识别模型训练的方法及装置 |
CN110705406A (zh) * | 2019-09-20 | 2020-01-17 | 五邑大学 | 基于对抗迁移学习的人脸美丽预测方法及装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112241744A (zh) * | 2020-10-20 | 2021-01-19 | 北京字跳网络技术有限公司 | 图像颜色迁移方法、装置、设备和计算机可读介质 |
CN113434671A (zh) * | 2021-06-23 | 2021-09-24 | 平安国际智慧城市科技股份有限公司 | 数据处理方法、装置、计算机设备及存储介质 |
CN113627361A (zh) * | 2021-08-13 | 2021-11-09 | 北京百度网讯科技有限公司 | 人脸识别模型的训练方法、装置及计算机程序产品 |
CN113627361B (zh) * | 2021-08-13 | 2023-08-08 | 北京百度网讯科技有限公司 | 人脸识别模型的训练方法、装置及计算机程序产品 |
CN114417959A (zh) * | 2021-12-06 | 2022-04-29 | 浙江大华技术股份有限公司 | 特征提取的相关方法、目标识别方法、相关设备以及装置 |
CN114359449A (zh) * | 2022-01-13 | 2022-04-15 | 北京大橘大栗文化传媒有限公司 | 一种面部数字资产制作方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111914908B (zh) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914908B (zh) | 一种图像识别模型训练方法、图像识别方法及相关设备 | |
US10936911B2 (en) | Logo detection | |
CN108229479B (zh) | 语义分割模型的训练方法和装置、电子设备、存储介质 | |
US20210035304A1 (en) | Training method for image semantic segmentation model and server | |
TWI721510B (zh) | 雙目圖像的深度估計方法、設備及儲存介質 | |
CN111797893A (zh) | 一种神经网络的训练方法、图像分类系统及相关设备 | |
CN110929622A (zh) | 视频分类方法、模型训练方法、装置、设备及存储介质 | |
WO2021136027A1 (zh) | 相似图像检测方法、装置、设备及存储介质 | |
CN111860398B (zh) | 遥感图像目标检测方法、系统及终端设备 | |
WO2022042123A1 (zh) | 图像识别模型生成方法、装置、计算机设备和存储介质 | |
CN110765860A (zh) | 摔倒判定方法、装置、计算机设备及存储介质 | |
CN111680678B (zh) | 目标区域识别方法、装置、设备及可读存储介质 | |
CN108228684B (zh) | 聚类模型的训练方法、装置、电子设备和计算机存储介质 | |
CN109413510B (zh) | 视频摘要生成方法和装置、电子设备、计算机存储介质 | |
CN111340077B (zh) | 基于注意力机制的视差图获取方法和装置 | |
CN113505797B (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
CN110738236A (zh) | 图像匹配方法、装置、计算机设备及存储介质 | |
CN107590460A (zh) | 人脸分类方法、装置及智能终端 | |
CN111223128A (zh) | 目标跟踪方法、装置、设备及存储介质 | |
CN112232140A (zh) | 人群计数方法、装置、电子设备及计算机存储介质 | |
CN115797735A (zh) | 目标检测方法、装置、设备和存储介质 | |
CN112801107A (zh) | 一种图像分割方法和电子设备 | |
CN111382791A (zh) | 深度学习任务处理方法、图像识别任务处理方法和装置 | |
CN114820755B (zh) | 一种深度图估计方法及系统 | |
CN115798005A (zh) | 基准照片的处理方法及装置、处理器和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |