CN113569070B - 图像检测方法和装置、电子设备、存储介质 - Google Patents
图像检测方法和装置、电子设备、存储介质Info
- Publication number
- CN113569070B CN113569070B CN202110840533.0A CN202110840533A CN113569070B CN 113569070 B CN113569070 B CN 113569070B CN 202110840533 A CN202110840533 A CN 202110840533A CN 113569070 B CN113569070 B CN 113569070B
- Authority
- CN
- China
- Prior art keywords
- preset
- picture
- feature
- image
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 40
- 239000013598 vector Substances 0.000 claims abstract description 77
- 238000013507 mapping Methods 0.000 claims abstract description 64
- 238000012549 training Methods 0.000 claims description 81
- 239000011159 matrix material Substances 0.000 claims description 78
- 238000000605 extraction Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 32
- 238000000034 method Methods 0.000 claims description 19
- 238000011176 pooling Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000000691 measurement method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Abstract
本公开实施例提出了一种图像检测方法和装置、电子设备、存储介质,涉及人工智能技术领域,其中图形检测方法包括:根据预设卷积层生成预设图像比对模型;从图片数据库中提取出待比对图片;根据预设图像比对模型对待比对图片进行特征提取,得到待比对图片对应的待比对特征向量;获取待测试图片,根据预设图像比对模型对待测试图片进行特征提取,得到待测试图片对应的待测试特征向量;根据待比对特征向量和待测试特征向量计算出图像相似度;根据图像相似度从图片数据库中选取出映射图片和映射相似度;输出待测试图片、映射图片和映射相似度。上述图像检测方法,能够支持任意多个类别的图像数据的检测,提高相似图像比对效率,增强图像识别的鉴别性。
Description
技术领域
本公开实施例涉及人工智能技术领域,尤其是涉及一种图像检测方法和装置、电子设备、存储介质。
背景技术
互联网上图像的数据信息日渐庞大,用户对网上图像搜索的要求也在不断提高,而图像搜索引擎的出现,使网上图像信息的搜索变得非常简单。其中,由于商标是企业提供的商品或着服务的显著标志,象征着企业的信誉和可靠度的,是企业日益激烈的市场竞争活动中的重要组成部分,商标必须具有足够的独特性以避免与其他商标发生混淆或冲突。因此,以图搜图的图像搜索引擎成为判断新商标独特性的首选方案。
随着商标的种类和商标图像的多样性越来越广,常规的商标相似性度量方法越来越难以描述商标的相似性。常规的图片相似性比对模型,通常是在模型的最后几层利用全连接层融合图片特征,这种融合特征的方法造成了信息冗余,在相似度比对阶段常出现错误结果。
发明内容
本公开实施例的主要目的在于提出一种图像检测方法,能够支持任意多个类别的图像数据的检测,提高相似图像比对效率,增强图像识别的鉴别性。
为实现上述目的,本公开实施例的第一方面提出了一种图像检测方法,包括:
获取预设卷积层,根据所述预设卷积层生成预设图像比对模型;
从图片数据库中提取出待比对图片;
根据预设图像比对模型对所述待比对图片进行特征提取,得到所述待比对图片对应的待比对特征向量;
获取待测试图片,根据所述预设图像比对模型对所述待测试图片进行特征提取,得到所述待测试图片对应的待测试特征向量;
根据所述待比对特征向量和所述待测试特征向量计算出图像相似度;
根据所述图像相似度从所述图片数据库中选取出映射图片和映射相似度;
输出所述待测试图片、所述映射图片和所述映射相似度。
在一些实施例,所述根据所述预设卷积层生成预设图像比对模型,包括:获取原始比对模型;根据所述预设卷积层对所述原始比对模型进行训练,得到所述预设图像比对模型。
在一些实施例,所述根据所述预设卷积层对所述原始比对模型进行训练,得到所述预设图像比对模型,包括:获取所述原始比对模型的原始特征矩阵;根据所述预设卷积层对所述原始特征矩阵进行修改,得到待训练特征模型;根据所述待训练特征模型提取出损失训练特征;根据所述损失训练特征对所述待训练特征模型的鉴别性组件和多样性组件进行训练,得到所述预设图像比对模型。
在一些实施例,所述根据所述预设卷积层对所述原始特征矩阵进行修改,得到待训练特征模型,包括:根据所述预设卷积层对所述原始特征矩阵的尺寸进行扩充,得到预设特征矩阵;根据所述预设特征矩阵得到所述待训练特征模型。
在一些实施例,所述根据所述损失训练特征对所述待训练特征模型的鉴别性组件和多样性组件进行训练,得到所述预设图像比对模型,包括:根据所述预设特征矩阵生成真实数据矩阵;根据所述损失训练特征和所述真实数据矩阵进行池化处理,得到鉴别性损失函数;获取输入标签,根据所述损失训练特征、所述真实数据矩阵和所述输入标签计算出多样性损失函数;根据所述鉴别性损失函数对所述鉴别性组件进行训练,根据所述多样性损失函数对所述多样性组件进行训练,得到所述预设图像比对模型。
在一些实施例,所述根据所述图像相似度从所述图片数据库中选取出映射图片和映射相似度,包括:获取预设选取要求;若所述图像相似度符合所述预设选取要求,则将所述待比对图片作为所述映射图片,将所述图像相似度作为所述映射相似度。
在一些实施例,在所述获取预设选取要求之后,所述方法还包括:若所述图像相似度不符合所述预设选取要求,则执行所述从图片数据库中提取出待比对图片的步骤。
为实现上述目的,本公开实施例的第二方面提出了图像检测装置,包括:
训练模块,用于获取预设卷积层,根据所述预设卷积层生成预设图像比对模型;
提取模块,用于从图片数据库中提取出待比对图片;
第一特征提取模块,用于根据预设图像比对模型对所述待比对图片进行特征提取,得到所述待比对图片对应的待比对特征向量;
第二特征提取模块,用于获取待测试图片,根据所述预设图像比对模型对所述待测试图片进行特征提取,得到所述待测试图片对应的待测试特征向量;
计算模块,用于根据所述待比对特征向量和所述待测试特征向量计算出图像相似度;
选取模块,用于根据所述图像相似度从所述图片数据库中选取出映射图片和映射相似度;
输出模块,用于输出所述待测试图片、所述映射图片和所述映射相似度。
为实现上述目的,本公开实施例的第三方面提出了一种电子设备,包括:
至少一个存储器;
至少一个处理器;
至少一个程序;
所述程序被存储在存储器中,处理器执行所述至少一个程序以实现本公开如上述第一方面所述的方法。
为实现上述目的,本公开实施例的第四方面提出了一种存储介质,该存储介质是计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行:
如上述第一方面所述的方法。
本公开实施例提出的图像检测方法和装置、电子设备、存储介质,首先通过预设卷积层生成预设图像比对模型,即通过增加一个预设卷积层使预设图像比对模型能够支持任意类别的数据训练,然后采用该预设图像比对模型对待比对图片和待测试图片进行特征提取,得到用于反映待比对图片固有特性的待比对特征向量,和用于反映待测试图片固有特性的待测试特征向量,再计算待比对特征向量和待测试特征向量之间的图像相似度,以判断二者之间的差异程度,进而根据该差异程度从图片数据库中选取出与待测试图片最相似的映射图片及其映射相似度,最后输出导入的待测试图片,以及映射图片和映射相似度,实时反馈检测结果,能够支持任意多个类别的图像数据的检测,提高相似图像比对效率,增强图像识别的鉴别性。
附图说明
图1是本公开实施例的图像检测方法的流程示意图;
图2是本公开实施例的根据预设卷积层训练得到预设图像比对模型的流程示意图;
图3是本公开实施例的对待训练特征模型的鉴别性组件和多样性组件进行训练的流程示意图;
图4是本公开实施例的电子设备的硬件结构示意图。
具体实施方式
为了使本公开实施例的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
除非另有定义,本文所使用的所有的技术和科学术语与属于本公开实施例的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例实施例的目的,不是旨在限制本公开实施例。
首先,对本申请中涉及的若干名词进行解析:
1、MCLoss模型:Mutual-Channel Loss模型,MCLoss模型提出了互信道损失LMC功能,有效的导航模型,聚焦不同的区分区域,而不需要任何细粒度的限定框和标注信息。MCLoss模型包含两个组件:①鉴别性组件(Discriminality),该组件强制特征通道是类对齐的,与特定类对应的每个特征通道应该具有足够的鉴别性;②多样性组件(Diversity),该组件是一种近似的特征通道距离测量方法,用来计算所有信道的相似度。
2、VGG模型:VGG全称是Visual Geometry Group可以应用在人脸识别、图像分类等方面,分别从VGG16~VGG19。
3、BatchNum:Batch number,Batch就是每次送入网络中训练的一部分数据,number为数量,Batch number等同于iterations,即迭代次数。
在实际的应用场景中,由于商标是企业提供的商品或着服务的显著标志,象征着企业的信誉和可靠度的,是企业日益激烈的市场竞争活动中的重要组成部分,商标必须具有足够的独特性以避免与其他商标发生混淆或冲突。因此,以图搜图的图像搜索引擎成为判断新商标独特性的首选方案。
随着商标的种类和商标图像的多样性越来越广,常规的商标相似性度量方法越来越难以描述商标的相似性。常规的图片相似性比对模型,通常是在模型的最后几层利用全连接层融合图片特征,这种融合特征的方法造成了信息冗余,在相似度比对阶段常出现错误结果。
基于此,本公开实施例提供一种图像检测方法和装置、电子设备、存储介质,能够支持任意多个类别的图像数据的检测,提高相似图像比对效率,增强图像识别的鉴别性。
参照图1,根据本公开实施例第一方面实施例的图像检测方法,包括:
步骤S101,获取预设卷积层,根据预设卷积层生成预设图像比对模型。
其中,预设卷积层可以是预先设置的卷积层。卷积层(Convolution)通过卷积操作对输入图像进行降维和特征抽取,对图像做卷积操作其实就是利用卷积核(卷积模板)在图像上滑动,将图像点上的像素灰度值与对应的卷积核上的数值相乘,然后将所有相乘后的值相加作为卷积核中间像素对应的图像上像素的灰度值,并最终滑动完所有图像的过程。预设图像比对模型可以是根据预设卷积层改进MCLoss模型后的数学模型。由于原始的MCLoss模型是基于VGG模型提取图像特征,然后通过鉴别性组件和多样性组件获取特征向量。由于受特征提取层的限制MCLoss模型最多只能支持200个类别,这对于小批量的数据训练时有效的,但对有大量类别的商标图片来说这模型支持的类别数量是远远不够的,因此需要对原始MCLoss模型进行改进。可选的,可以在MCLoss模型训练时通过增加一个预设卷积层,使其能够支持任意类别的数据训练,而在模型预测时新增的卷积层并不会参与到数据运算中去,因而新增了一个预设卷积层的预设图像比对模型并不会影响MCLoss模型预测的结果和效率。
步骤S102,从图片数据库中提取出待比对图片。
其中,图片数据库可以是存储有若干图片的数据库;待比对图片可以是图片数据库中存储的、需要与待测试图片进行比对分析的图片。可选的,图片数据库中可以存储有多张待比对图片,如图片数据库中存储的为若干商标图像,可以通过互联网搜集、拍摄等方式采集商标图像,构建图片数据库。因此可以根据需求从图片数据库中提取出待比对图片,例如可以图片数据库中提取出一张图片作为待比对图片,也可以提取出多张图片作为待比对图片。具体的,以提取出一张图片作为待比对图片为例,可以是从图片数据库中随机选取一张图片作为待比对图片,与待测试图片进行比对分析,若待比对图片和待测试图片的相似度不高,则可以再行从图片数据库中随机选取出另一张图片作为待比对图片,依次循环图片数据库中的所有图片;以提取多张图片作为待比对图片为例,可以提取出图片数据库中所有图片作为待比对图片,与待测试图片分别进行比对分析。
步骤S103,根据预设图像比对模型对所待比对图片进行特征提取,得到待比对图片对应的待比对特征向量。
其中,待比对特征向量可以是待比对图片对应的特征向量,特征向量是在某个线性变换下方向不变(也可以说具有保角性),其大小不变或乘以某个缩放因子的非零向量。线性变换的主特征向量是最大特征值对应的特征向量。由于改进后的预设图像比对模型能够支持任意类别的图像数据训练,所以可以通过预设图像比对模型对待比对图片进行特征向量的提取,得到待比对特征向量,以得到待比对图片中不变的向量,从而可以更好地描述待比对图片的特性。可选的,设待比对图片是从图片数据库中随机提取的某一张商标图像,则可以根据预设图像比对模型,提取出该商标图像的特征,然后经过预设图像比对模型中的鉴别性组件和多样性组件提取出特征向量,得到待比对图片对应的待比对特征向量。
步骤S104,获取待测试图片,根据预设图像比对模型对待测试图片进行特征提取,得到待测试图片对应的待测试特征向量。
其中,待测试图片可以是需要进行检测的新的图片,即不属于图片数据库中的图片;待测试特征向量可以是待测试图片对应的特征向量。对待测试图片进行检测,可以是对待测试图片与待比对图片的相似度进行检测,以判断待测试图片与待比对图片是否相似。由于改进后的预设图像比对模型能够支持任意类别的图像数据训练,所以可以通过预设图像比对模型对待测试图片进行特征向量的提取,得到待测试特征向量,以得到待测试图片中不变的向量,从而可以更好地描述待测试图片的特性。可选的,设待测试图片是不属于图片数据库的某一张商标图像,则可以根据预设图像比对模型,提取出该商标图像的特征,然后经过预设图像比对模型中的鉴别性组件和多样性组件提取出特征向量,得到待测试图片对应的待测试特征向量。
步骤S105,根据待比对特征向量和待测试特征向量计算出图像相似度。
其中,图像相似度可以是待比对特征向量和待测试特征向量之间的相似程度。可选的,对待测试图片进行检测,可以是对待测试图片与图片数据库中的待比对图片的相似程度进行检测,因此可以将待测试特征向量和待比对特征向量相比较,判断二者的相似程度。具体的,可以采用图像相似度计算方法计算出待比对特征向量和待测试特征向之间的相似程度,例如,可以根据需求选取余弦距离(或余弦相似度)、直方图距离、平均哈希算法、欧几里得距离、曼哈顿距离、明可夫斯基距离中的一种方式进行计算,若选取余弦距离的方式进行计算,则可以根据待比对特征向量和待测试特征向量,采用余弦距离的相似度计算方式计算出图像相似度。
步骤S106,根据图像相似度从图片数据库中选取出映射图片和映射相似度。
其中,映射图片可以是图片数据库中与待测试图片相似度最高的待比对图片;映射相似度可以是待测试图片与映射图片之间的图像相似度。可选的,以每次随机从图片数据库中提取出一张图片作为待比对图片为例,可以依次计算出每一张待比对图片和待测试图片之间的图像相似度,并选取出图像相似度最高的待比对图片作为映射图片,即得到图片数据库中与待测试图片最相似的一张图片,该映射图片与待测试图片之间的图像相似度即为映射相似度。
步骤S107,输出待测试图片、映射图片和映射相似度。
可选的,在选取出图片数据中与待测试图片最为相似的映射图片之后,可以返回输入的待测试图片、映射图片和映射相似度,实时反馈图像检测结果,还可以供用户查阅图像检测结果是否有误。在一些具体的实施例中,还可以获取用户对图像检测结果的评价,以便对图像检测方法进行进一步改进,提高检测精度。
上述图像检测方法,首先通过预设卷积层生成预设图像比对模型,即通过增加一个预设卷积层使预设图像比对模型能够支持任意类别的数据训练,然后采用该预设图像比对模型对待比对图片和待测试图片进行特征提取,得到用于反映待比对图片固有特性的待比对特征向量、用于反映待测试图片固有特性的待测试特征向量,再计算待比对特征向量和待测试特征向量之间的图像相似度,以判断二者之间的差异程度,进而根据该差异程度从图片数据库中选取出与待测试图片最相似的映射图片及其映射相似度,最后输出导入的待测试图片,以及映射图片和映射相似度,实时反馈检测结果,能够支持任意多个类别的图像数据的检测,提高相似图像比对效率,增强图像识别的鉴别性。
在一些实施例,根据预设卷积层生成预设图像比对模型,包括:
获取原始比对模型;
根据预设卷积层对原始比对模型进行训练,得到预设图像比对模型。
其中,原始比对模型可以是用于进行特征提取的特征提取器,即特征提取网络模型。可选的,原始比对模型可以是MCLoss模型,原始的MCLoss模型是基于VGG模型提取图像特征,然后通过鉴别性组件和多样性组件获取特征向量。
可选的,原始比对模型为MCLoss模型,而MCLoss模型是基于VGG模型提取图像特征。由于VGG模型在全链接层之前输出的特征矩阵的的尺寸是固定的,使得原始比对模型在对批量数据进行训练时会受特征提取层的限制,例如受特征提取层的限制MCLoss模型最多只能支持200个类别,该原始比对模型远远不够支持有大量类别的商标图片的特征提取。可选的,可以在原始比对模型的特征提取层和全链接层之间增加一个卷积层(即预设卷积层),扩充提取特征后的特征通道数,不改变原始MCLoss模型的输入和输出结构。进而通过输入训练数据集及其对应的标注类别,数据标注过程中相同的图片是属于同一个类别的,类别可以使用不相同的图片名字命名或者是以序列数据0,1,2…表示,即可以根据训练数据集和标注类别对原始比对模型进行更新,得到预设图像比对模型,可以实现训练任意多个类别的数据并且不影响模型的预测结果。
请参照图2,在一些实施例,根据预设卷积层对原始比对模型进行训练,得到预设图像比对模型,包括:
步骤S401,获取原始比对模型的原始特征矩阵;
步骤S402,根据预设卷积层对原始特征矩阵进行修改,得到待训练特征模型;
步骤S403,根据待训练特征模型提取出损失训练特征;
步骤S404,根据损失训练特征对待训练特征模型的鉴别性组件和多样性组件进行训练,得到预设图像比对模型。
其中,原始特征矩阵可以是原始比对模型在全链接层之前输出的特征矩阵。由于VGG模型在全链接层之前输出的特征矩阵的尺寸是固定尺寸,所以原始比对模型最多只能支持有限类别的数据。可选的,若VGG模型在全链接层之前输出的特征矩阵的尺寸是固定的(B,14, 14, 600),其中B为BatchNum;CN为ClassNum,是指最后一个全连接层所分出的类个数;则可以得到原始特征矩阵及原始特征矩阵的尺寸(B,14, 14, 600)。
其中,待训练特征模型可以是需要进行训练的MCLoss模型。为扩充原始比对模型的提取特征后的特征通道数,可以在原始比对模型的特征提取层和全链接层之间增加一个预设卷积层,使其能够支持任意类别的数据训练。可选的,设原始特征矩阵的尺寸(B,14,14, 600),通过增加一个预设卷积层将原始特征矩阵的尺寸变为(B, 14, 14, CN*3),即在原始特征矩阵的最后一个维度通过卷积操作做扩充,得到待训练特征模型,方便后面两个loss函数(包括鉴别性损失函数和多样性损失函数)的计算。
其中,损失训练特征可以是通过预设卷积层提取的特征。可选的,在对原始特征矩阵进行修改之后,可以通过预设卷积层提取出损失训练特征,用于计算待训练特征模型的损失函数。
可选的,待训练特征模型的损失函数包括鉴别性损失函数和多样性损失函数,可以根据鉴别性损失函数对待训练特征模型的鉴别性组件进行训练,可以根据多样性损失函数对待训练模型的多样性组件进行训练。具体的,在计算的时候,使用预设卷积层提取的特征(即损失训练特征)与输入label(标签)进行计算,不改变原始MCLoss模型的输入和输出结构,对待训练特征模型进行迭代,得到训练好的预设图像比对模型。通过对原始比对模型的原始特征矩阵进行修改,扩充提取特征后的特征通道数,使其能够支持任意类别的数据训练。
在一些实施例,根据预设卷积层对原始特征矩阵进行修改,得到待训练特征模型,包括:
根据预设卷积层对原始特征矩阵的尺寸进行扩充,得到预设特征矩阵;
根据预设特征矩阵得到待训练特征模型。
其在,预设特征矩阵可以对原始特征矩阵的尺寸进行扩充后所得的特征矩阵。可选的,设原始特征矩阵的尺寸为(B,14, 14, 600),可以通过增加一个预设卷积层将原始特征矩阵的尺寸变为(B, 14, 14, CN*3),只是在矩阵的最后一个维度通过卷积操作做扩充,得到预设特征矩阵。
由于VGG模型在全链接层之前输出的特征矩阵的的尺寸是固定的(B,14, 14,600),而MCLoss模型在计算loss的时候,VGG模型输出的特征矩阵的最后一个维度与训练数据label的数量是对应的,增加一个预设卷积层就是为了将VGG模型输出的特征矩阵的最后一个维度扩大到与训练数据label的数量相对应的程度,修改后就不再限制训练类别数量。因此,可以将扩充后所得的预设特征矩阵作为待训练特征模型的特征矩阵,得到待训练特征模型。
请参照图3,在一些实施例,根据损失训练特征对待训练特征模型的鉴别性组件和多样性组件进行训练,得到预设图像比对模型,包括:
步骤S501,对损失训练特征进行池化处理,得到鉴别性损失函数;
步骤S502,根据预设特征矩阵生成真实数据矩阵;
步骤S503,获取输入标签,根据损失训练特征、真实数据矩阵和输入标签计算出多样性损失函数;
步骤S504,根据鉴别性损失函数对鉴别性组件进行训练,根据多样性损失函数对多样性组件进行训练,得到预设图像比对模型。
可选的,可以对预设卷积层提取的损失训练特征做最大池化处理,然后计算池化后的均值作为一个鉴别性loss,得到鉴别性损失函数。
其中,真实数据矩阵可以是初始值为0或1的mask矩阵,mask矩阵是一个由0和1组成的矩阵,mask矩阵即用以指示哪些是真正的数据,哪些是无效的数据。可选的,设预设特征矩阵的尺寸为(B, 14, 14, CN*3),其中B为BatchNum, CN为ClassNum,可以根据BatchNum和ClassNum生成一个初始值为0或1的mask矩阵,矩阵尺寸为(batchnum,classname*3, 1, 1),由此得到真实数据矩阵。
其中,输入标签(lable),输入标签可以为iput输入框元素定义标注。可选的,可以先将提取的损失训练特征与生成的mask矩阵进行点乘,然后对点乘结果分别做最大池化和平均池化,然将结果与对应的输入label计算交叉熵作为多样性loss,得到多样性损失函数。
可选的,可以返回鉴别性loss和多样性loss,并根据鉴别性loss对鉴别性组件进行训练、根据多样性loss对多样性组件进行训练,得到训练好的模型,作为预设图像比对模型。通过分别计算出鉴别性损失函数和多样性损失函数,并返回两个loss分别对鉴别性组件和多样性组件进行训练,得到训练好的预设图像比对模型,在不改变原始MCLoss模型的输入和输出结构的基础上,而在模型预测时新增的卷积层并不会参与到数据运算中,相较于原始比对模型而言,并不会增长过多的权重参数,而且不会影响模型预测的结果和效率。
在一些实施例,根据图像相似度从图片数据库中选取出映射图片和映射相似度,包括:
获取预设选取要求;
若图像相似度符合预设选取要求,则将待比对图片作为所述映射图片,将图像相似度作为映射相似度。
其中,预设选取要求可以根据需求设置。例如,设需要从图片数据库中获取与待测试图片最相似的图片,则可以设预设选取要求为选取图像相似度最大的待比对图片为映射图片。
可选的,可以将待测试图片与待比对图片一一进行比较,计算出图像相似度,再根据预设选取要求,将图像相似度最大的待比对图片作为映射图片,从而可以检测出与待测试图片最相似的图片及其相似度。
在一些实施例,在获取预设选取要求之后,图像检测方法还包括:
若图像相似度不符合预设选取要求,则执行从图片数据库中提取出待比对图片的步骤。
可选的,设预设选取要求为选取图像相似度最大的待比对图片为映射图片,若某一待比对图片与待测试图片之间的图像相似度较小、不符合预设选取要求,则返回至从图片数据库中提取出待比对图片的步骤,重新从图片数据库中提取出其他待比对图片,直至选取出图像相似度最大的待比对图片作为映射图片。
在一具体的应用场景,在MCLoss模型训练时通过增加一个卷积层、使得MCLoss模型可以训练任意多个类别的数据并且不影响模型的预测结果,并根据改进后的MCLoss模型进行商标相似性鉴别的方法,包括以下步骤:
第一步,对原始MCLoss模型进行改进,得到改进后的MCLoss模型。
原始的MCLoss模型是基于VGG模型提取图像特征,然后通过鉴别性组件和多样性组件获取特征向量。由于受特征提取层的限制,原始MCLoss模型最多只能支持200个类别,这对于小批量的数据训练时有效的,但对有大量类别的商标图片来说具有很大的局限性。因此,可以在MCLoss模型中增加一个卷积层,使其能够支持任意类别的数据训练。具体的,首先,可以在原始MCLoss模型的特征提取层和全链接层之间增加一个卷积层,根据该层卷积层将在全链接层之前输出的特征矩阵的尺寸(B,14, 14, 600)扩充为(B, 14, 14, CN*3),其中B为BatchNum, CN为ClassNum,方便后续鉴别性loss和多样性loss的计算。其次,在计算MC损失函数的时候,使用该层卷积层提取特征,得到损失训练特征,并对损失训练特征做最大池化处理,然后计算池化后的均值作为一个鉴别性loss;再根据BatchNum和ClassNum生成一个初始值为0或1的mask矩阵,矩阵尺寸为(batchnum,classname*3, 1,1),将损失训练特征与生成的mask矩阵点乘,然后对点乘结果分别做最大池化和平均池化,将结果与对应的输入label计算交叉熵作为多样性loss,返回鉴别性loss和多样性loss。最后,根据返回的两个loss对原始MCLoss模型进行迭代更新,不改变原始MCLoss模型的输入和输出结构,得到训练好的改进MCLoss模型。由于改进MCLoss模型在计算loss的时候VGG模型输出的特征矩阵的最后一个维度与训练数据label的数量是对应的,增加一个卷积层就是为了将VGG模型输出的特征矩阵的最后一个维度扩大到与训练数据label的数量相对应的程度,修改后的MCLoss模型就不再限制训练类别数量。
第二步,通过改进MCLoss模型提取图片数据库里所有图片的特征向量并保存。
第三步,导入一张待测试图片到改进MCLoss模型,通过改进MCLoss模型提取出待测试图片的特征向量。
第四步,将待测试图片的特征向量与图片数据库中的所有图片的特征向量相比较,并找出相似度最大的一个特征向量。
第五步,根据相似度最大的特征向量映射到图片数据库中的图片,得到与待测试图片最相似的映射图片。
第六步,输出待测试图片、映射图片及其图像相似度值。
本公开实施例的技术方案,能够支持任意多个类别的图像数据的检测,提高相似图像比对效率,增强图像识别的鉴别性。
本公开实施例还提供一种图像检测装置,可以实现上述图像检测方法,该装置包括:
训练模块,用于获取预设卷积层,根据所述预设卷积层生成预设图像比对模型;
提取模块,用于从图片数据库中提取出待比对图片;
第一特征提取模块,用于根据预设图像比对模型对所述待比对图片进行特征提取,得到所述待比对图片对应的待比对特征向量;
第二特征提取模块,用于获取待测试图片,根据所述预设图像比对模型对所述待测试图片进行特征提取,得到所述待测试图片对应的待测试特征向量;
计算模块,用于根据所述待比对特征向量和所述待测试特征向量计算出图像相似度;
选取模块,用于根据所述图像相似度从所述图片数据库中选取出映射图片和映射相似度;
输出模块,用于输出所述待测试图片、所述映射图片和所述映射相似度。
本公开实施例提出的图像检测装置,通过实现上述图像检测方法,能够支持任意多个类别的图像数据的检测,提高相似图像比对效率,增强图像识别的鉴别性。
本公开实施例还提供了一种电子设备,包括:
至少一个存储器;
至少一个处理器;
至少一个程序;
所述程序被存储在存储器中,处理器执行所述至少一个程序以实现本公开实施上述的图像检测方法。该电子设备可以为包括手机、平板电脑、个人数字助理(PersonalDigital Assistant,简称PDA)、销售终端(Point of Sales,简称POS)、车载电脑等任意智能终端。
请参阅图4,图4示意了另一实施例的电子设备的硬件结构,电子设备包括:
处理器601,可以采用通用的CPU(CentralProcessingUnit,中央处理器)、微处理器、应用专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本公开实施例所提供的技术方案;
存储器602,可以采用ROM(ReadOnlyMemory,只读存储器)、静态存储设备、动态存储设备或者RAM(RandomAccessMemory,随机存取存储器)等形式实现。存储器602可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器602中,并由处理器601来调用执行本公开实施例的图像检测方法;
输入/输出接口603,用于实现信息输入及输出;
通信接口604,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信;和
总线605,在设备的各个组件(例如处理器601、存储器602、输入/输出接口603和通信接口604)之间传输信息;
其中处理器601、存储器602、输入/输出接口603和通信接口604通过总线605实现彼此之间在设备内部的通信连接。
本公开实施例还提供了一种存储介质,该存储介质是计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行上述图像检测方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本公开实施例描述的实施例是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。
本领域技术人员可以理解的是,图1、2、3中示出的技术方案并不构成对本公开实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上参照附图说明了本公开实施例的优选实施例,并非因此局限本公开实施例的权利范围。本领域技术人员不脱离本公开实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本公开实施例的权利范围之内。
Claims (5)
1.一种图像检测方法,其特征在于,包括:
获取预设卷积层,根据所述预设卷积层生成预设图像比对模型;
从图片数据库中提取出待比对图片;
根据所述预设图像比对模型对所述待比对图片进行特征提取,得到所述待比对图片对应的待比对特征向量;
获取待测试图片,根据所述预设图像比对模型对所述待测试图片进行特征提取,得到所述待测试图片对应的待测试特征向量;
根据所述待比对特征向量和所述待测试特征向量计算出图像相似度;
根据所述图像相似度从所述图片数据库中选取出映射图片和映射相似度;
输出所述待测试图片、所述映射图片和所述映射相似度;
其中,所述根据所述图像相似度从所述图片数据库中选取出映射图片和映射相似度,包括:
获取预设选取要求;
若所述图像相似度符合所述预设选取要求,则将所述待比对图片作为所述映射图片,将所述图像相似度作为所述映射相似度;
其中,所述根据所述预设卷积层生成预设图像比对模型,包括:
获取原始比对模型;
根据所述预设卷积层对所述原始比对模型进行训练,得到所述预设图像比对模型;
其中,所述根据所述预设卷积层对所述原始比对模型进行训练,得到所述预设图像比对模型,包括:
获取所述原始比对模型的原始特征矩阵;
根据所述预设卷积层对所述原始特征矩阵进行修改,得到待训练特征模型;
根据所述待训练特征模型提取出损失训练特征;
根据所述损失训练特征对所述待训练特征模型的鉴别性组件和多样性组件进行训练,得到所述预设图像比对模型;
其中,所述根据所述预设卷积层对所述原始特征矩阵进行修改,得到待训练特征模型,包括:
根据所述预设卷积层对所述原始特征矩阵的尺寸进行扩充,得到预设特征矩阵;
根据所述预设特征矩阵得到所述待训练特征模型;
其中,所述根据所述损失训练特征对所述待训练特征模型的鉴别性组件和多样性组件进行训练,得到所述预设图像比对模型,包括:
对所述损失训练特征进行池化处理,得到鉴别性损失函数;
根据所述预设特征矩阵生成真实数据矩阵;
获取输入标签,根据所述损失训练特征、所述真实数据矩阵和所述输入标签计算出多样性损失函数;
根据所述鉴别性损失函数对所述鉴别性组件进行训练,根据所述多样性损失函数对所述多样性组件进行训练,得到所述预设图像比对模型。
2.根据权利要求1所述的方法,其特征在于,在所述获取预设选取要求之后,所述方法还包括:
若所述图像相似度不符合所述预设选取要求,则执行所述从图片数据库中提取出待比对图片的步骤。
3.一种图像检测装置,其特征在于,包括:
训练模块,用于获取预设卷积层,根据所述预设卷积层生成预设图像比对模型;
提取模块,用于从图片数据库中提取出待比对图片;
第一特征提取模块,用于根据预设图像比对模型对所述待比对图片进行特征提取,得到所述待比对图片对应的待比对特征向量;
第二特征提取模块,用于获取待测试图片,根据所述预设图像比对模型对所述待测试图片进行特征提取,得到所述待测试图片对应的待测试特征向量;
计算模块,用于根据所述待比对特征向量和所述待测试特征向量计算出图像相似度;
选取模块,用于根据所述图像相似度从所述图片数据库中选取出映射图片和映射相似度;
输出模块,用于输出所述待测试图片、所述映射图片和所述映射相似度;
其中,所述选取模块,用于根据所述图像相似度从所述图片数据库中选取出映射图片和映射相似度,包括:
获取预设选取要求;
若所述图像相似度符合所述预设选取要求,则将所述待比对图片作为所述映射图片,将所述图像相似度作为所述映射相似度;
其中,所述训练模块,用于根据所述预设卷积层生成预设图像比对模型,包括:
获取原始比对模型;
根据所述预设卷积层对所述原始比对模型进行训练,得到所述预设图像比对模型;
其中,所述根据所述预设卷积层对所述原始比对模型进行训练,得到所述预设图像比对模型,包括:
获取所述原始比对模型的原始特征矩阵;
根据所述预设卷积层对所述原始特征矩阵进行修改,得到待训练特征模型;
根据所述待训练特征模型提取出损失训练特征;
根据所述损失训练特征对所述待训练特征模型的鉴别性组件和多样性组件进行训练,得到所述预设图像比对模型;
其中,所述根据所述预设卷积层对所述原始特征矩阵进行修改,得到待训练特征模型,包括:
根据所述预设卷积层对所述原始特征矩阵的尺寸进行扩充,得到预设特征矩阵;
根据所述预设特征矩阵得到所述待训练特征模型;
其中,所述根据所述损失训练特征对所述待训练特征模型的鉴别性组件和多样性组件进行训练,得到所述预设图像比对模型,包括:
对所述损失训练特征进行池化处理,得到鉴别性损失函数;
根据所述预设特征矩阵生成真实数据矩阵;
获取输入标签,根据所述损失训练特征、所述真实数据矩阵和所述输入标签计算出多样性损失函数;
根据所述鉴别性损失函数对所述鉴别性组件进行训练,根据所述多样性损失函数对所述多样性组件进行训练,得到所述预设图像比对模型。
4.电子设备,其特征在于,包括:
至少一个处理器,以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行所述指令时实现如权利要求1至2任一项所述的图像检测方法。
5.存储介质,所述存储介质为计算机可读存储介质,其特征在于,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至2任一项所述的图像检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110840533.0A CN113569070B (zh) | 2021-07-24 | 图像检测方法和装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110840533.0A CN113569070B (zh) | 2021-07-24 | 图像检测方法和装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113569070A CN113569070A (zh) | 2021-10-29 |
CN113569070B true CN113569070B (zh) | 2024-07-02 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875076A (zh) * | 2018-07-10 | 2018-11-23 | 重庆大学 | 一种基于Attention机制和卷积神经网络的快速商标图像检索方法 |
CN110569901A (zh) * | 2019-09-05 | 2019-12-13 | 北京工业大学 | 一种基于通道选择的对抗消除弱监督目标检测方法 |
CN112861656A (zh) * | 2021-01-21 | 2021-05-28 | 平安科技(深圳)有限公司 | 商标相似性检测方法、装置、电子设备和存储介质 |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875076A (zh) * | 2018-07-10 | 2018-11-23 | 重庆大学 | 一种基于Attention机制和卷积神经网络的快速商标图像检索方法 |
CN110569901A (zh) * | 2019-09-05 | 2019-12-13 | 北京工业大学 | 一种基于通道选择的对抗消除弱监督目标检测方法 |
CN112861656A (zh) * | 2021-01-21 | 2021-05-28 | 平安科技(深圳)有限公司 | 商标相似性检测方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110472090B (zh) | 基于语义标签的图像检索方法以及相关装置、存储介质 | |
CA3066029A1 (en) | Image feature acquisition | |
CN107590154B (zh) | 基于图像识别的物体相似度判定方法和装置 | |
CN111461164B (zh) | 样本数据集的扩容方法及模型的训练方法 | |
CN113657087B (zh) | 信息的匹配方法及装置 | |
CN110210480B (zh) | 文字识别方法、装置、电子设备和计算机可读存储介质 | |
CN107291774B (zh) | 错误样本识别方法和装置 | |
CN110929764A (zh) | 图片审核方法和装置,电子设备及存储介质 | |
CN110807110A (zh) | 结合局部和全局特征的图片搜索方法、装置及电子设备 | |
US9875386B2 (en) | System and method for randomized point set geometry verification for image identification | |
CN110059212A (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
CN112819073A (zh) | 分类网络训练、图像分类方法、装置和电子设备 | |
CN109741380B (zh) | 纺织品图片快速匹配方法和装置 | |
CN110659892A (zh) | 物品总价获取方法、装置、计算机设备和存储介质 | |
US11580721B2 (en) | Information processing apparatus, control method, and program | |
CN111222558B (zh) | 图像处理方法及存储介质 | |
CN113569070B (zh) | 图像检测方法和装置、电子设备、存储介质 | |
CN111581487B (zh) | 一种信息处理方法及装置 | |
CN114004674A (zh) | 模型训练方法、商品推送方法、装置和电子设备 | |
CN114821234A (zh) | 网络训练及目标检测方法、装置、设备及存储介质 | |
CN113569070A (zh) | 图像检测方法和装置、电子设备、存储介质 | |
CN111626437A (zh) | 对抗样本检测方法、装置、设备及计算机刻度存储介质 | |
CN112990377B (zh) | 视觉类别的发现方法及装置、电子设备、存储介质 | |
CN117058432B (zh) | 图像查重方法、装置、电子设备及可读存储介质 | |
CN117745370A (zh) | 一种商品匹配方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |