WO2021036309A1

WO2021036309A1 - 图像识别方法、装置、计算机装置及存储介质

Info

Publication number: WO2021036309A1
Application number: PCT/CN2020/086768
Authority: WO
Inventors: 刘利
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-08-26
Filing date: 2020-04-24
Publication date: 2021-03-04
Also published as: CN110689046A

Abstract

本申请提供一种图像识别方法，包括：获取查询图像和多个参考图像；将查询图像与每个参考图像组成图像对，提取图像对的相似性特征；以图像对为节点构造完全图；计算每两个参考图像的相似性得分，根据每两个参考图像的相似性得分确定完全图中每两个参考图像对应的边的权值；将图像对的相似性特征通过消息网络映射为消息特征；根据消息特征与边的权值更新图像对的相似性特征；根据更新后的相似性特征计算图像对的相似性得分；根据相似性得分确定与查询图像匹配的参考图像。本申请还提供一种图像识别装置、计算机装置和计算机可读存储介质。本申请利用参考图像之间的相似性信息更新查询图像与参考图像的相似性特征，提高图像识别的准确度。

Description

图像识别方法、装置、计算机装置及存储介质

本申请要求于2019年8月26日提交中国专利局、申请号为201910792041.1，发明名称为“图像识别方法、装置、计算机装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能的图像识别技术领域，尤其涉及一种图像识别方法、装置、计算机装置及计算机可读存储介质。

背景技术

目前在将查询图像与参考图像进行匹配时，往往只考虑查询图像与参考图像之间的相似性，而忽略了参考图像之间的相似性。发明人发现如果查询图像与参考图像之间的相似性计算不佳，则影响图像匹配的准确度。

发明内容

鉴于以上内容，有必要提供一种图像识别方法、装置、计算机装置及计算机可读存储介质，利用参考图像之间的相似性信息进行图像识别，提高图像识别的准确度。

本申请的第一方面提供一种图像识别方法，所述方法包括：获取查询图像和多个参考图像；将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。

本申请的第二方面提供一种图像识别装置，所述装置包括：获取模块，用于获取查询图像和多个参考图像；提取模块，用于将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；构造模块，用于以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；第一确定模块，用于计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；映射模块，用于将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；更新模块，用于根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；计算模块，用于根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；第二确定模块，用于根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。

本申请的第三方面提供一种计算机装置，其包括：一个或多个处理器；存储器；一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个计算机程序配置用于执行一种图像识别方法，其中，所述图像识别方法包括以下步骤：获取查询图像和多个参考图像；将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。

本申请的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现一种图像识别方法，其中，所述图像识别方法包括以下步骤：获取查询图像和多个参考图像；将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。

由以上技术方案看出，本申请利用参考图像之间的相似性信息更新查询-参考图像对的相似性特征，提高图像识别的准确度。

附图说明

图1是本申请实施例提供的图像识别方法的流程图；

图2是本申请实施例提供的图像识别装置的功能模块图；

图3是本申请实现图像识别的较佳实施例的计算机装置的结构示意图。

具体实施方式

图1为本申请实施例提供的图像识别方法的流程图。所述图像识别方法应用于计算机装置中，用于将查询图像与参考图像进行匹配。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。

S11，获取查询图像和多个参考图像。

查询图像是需要识别的图像，参考图像是已知的图像。所述方法从多个参考图像中识别出与查询图像包含相同内容(例如物体或人物)的图像。例如，当需要进行物体识别时，所述查询图像是包含未知物体的图像，所述多个参考图像是包含已知物体的图像，本方法从所述多个参考图像中识别出与所述查询图像包含相同物体的参考图像。又如，当需要进行人物识别时，所述查询图像是包含未知人物的图像，所述多个参考图像是包含已知人物的图像，本方法从所述多个参考图像中识别出与所述查询图像包含相同人物的图像。

可以从外部设备接收所述查询图像。例如，获取外部摄像头拍摄的监控图像，将外部摄像头拍摄的监控图像作为所述查询图像。

或者，所述计算机装置可以包括摄像头，可以控制所述计算机装置的内置摄像头拍摄图像，将所述内置摄像头拍摄的图像作为所述查询图像。

或者，可以读取所述计算机装置预先存储的图像，将读取的预先存储的图像作为所述查询图像。

或者，可以从网络中下载图像，将下载的图像作为所述查询图像。

可以从预设的图像库中获取所述多个参考图像。例如，在进行人物识别时，可以从人像库中获取所述多个参考图像。

S12，将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征。

本实施例中，将所述查询图像与每个参考图像进行配对，组成多个查询-参考图像对。

可以利用基于残差网络的孪生神经网络来提取每个查询-参考图像对的相似性特征。

优选地，所述提取每个查询-参考图像对的相似性特征包括：

将所述查询-参考图像对输入基于残差网络的孪生神经网络，得到所述查询图像的特征图和所述查询-参考图像对中的参考图像的特征图；

将所述查询图像的特征图与所述参考图像的特征图相减，得到第一特征图；

将所述第一特征图逐元素进行平方操作，得到第二特征图；

将所述第二特征图进行批量归一化处理，得到所述查询-参考图像对的相似性特征。

其中，所述基于残差网络的孪生神经网络是两个连体的共享权值的神经网络，其中一个以所述查询图像为输入，另外一个以所述查询-参考图像对中的参考图像为输入。

本实施例中，预先使用查询-参考样本图像对对所述孪生神经网络进行训练。查询-参考样本图像对是查询样本图像和参考样本图像组成的图像对。每个查询-参考样本图像对具有标签，表示查询-参考样本图像对中的查询样本图像与参考样本图像是否包含相同内容。若查询样本图像与参考样本图像包含相同内容(例如为同一人物)，所述标签可以为1。若查询样本图像与参考样本图像包含不同内容(例如为不同人物)，所述标签可以为0。

在对所述孪生神经网络进行训练时，提取查询-参考样本图像对的相似性特征，将查询-参考样本图像对的相似性特征输入线性分类器，得到查询-参考样本图像对的相似性得分，根据所述相似性得分与查询-参考样本图像对的标签计算损失函数，调整所述孪生神经网络的参数，使损失函数最小化。其中所述线性分类器可以是非线性作用函数，即sigmoid函数，公式为f(x)＝1/(1+e ^-x)。所述损失函数可以为:

其中d _i是第i个查询-参考样本图像对的相似性特征，F()表示线性分类器，y _i表示第i个查询-参考样本图像对的标签。

S13，以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点。

完全图是每对节点之间都连接有一条边的简单图，也就是完全图中的节点两两相连。

本实施例中，所述完全图的每个节点代表一个查询-参考图像对，所述完全图的每条边对应两个参考图像，代表两个参考图像之间的关系。

S14，计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值。

在本实施例中，所述计算所述多个参考图像中每两个参考图像之间的相似性得分包括：

对所述两个参考图像按照同样的划分方法进行区域划分；

计算所述两个参考图像的每个区域的每个像素点的对数相对RGB坐标；

根据所述两个参考图像的每个区域的每个像素点的对数相对RGB坐标对所述两个参考图像的每个区域内的像素点进行聚类，得到所述两个参考图像的每个区域的聚类中心；

根据所述两个参考图像的每个区域的聚类中心确定所述两个参考图像之间的相似性得分。

可以将所述两个参考图像各自划分为上下两个区域或者左右两个区域。也可以将所述两个参考图像各自划分为多于两个区域，例如各自划分为三个区域或四个区域。

红色分量为R _i、绿色分量为G _i、蓝色分量为Bi的像素点i的对数相对RGB坐标为(x _i,y _i)，其

中，

可以取以e为底的对数，即

或者，可以取以其他值为底的对数，例如取以10为底的对数。

可以使用GMM(Gaussian Mixture Model，高斯混合模型)或K-Means算法对所述两个参考图像的每个区域内的像素点进行聚类，得到所述两个参考图像的每个区域的聚类中心。

可以计算所述两个参考图像的每个区域的聚类中心的距离，根据所述两个参考图像的每个区域的聚类中心的距离确定所述两个参考图像之间的相似度。可以将所述两个参考图像的每个区域的聚类中心的距离的加权和作为所述两个参考图像之间的相似度。所述两个参考图像的每个区域的聚类中心的距离可以是欧氏距离、曼哈顿距离、马氏距离等。

在另一实施例中，可以将所述两个参考图像分别输入神经网络提取特征，根据所述两个参考图像的特征计算所述两个参考图像之间的相似性得分。例如，将所述两个参考图像分别输入第一深度残差网络和第二深度残差网络，从所述第一深度残差网络得到所述两个参考图像的整体特征，从所述第二深度残差网络得到所述两个参考图像的局部特征，根据所述两个参考图像的整体特征和局部特征计算所述两个参考图像之间的相似性得分。

本实施例中，所述完全图中所述两个参考图像对应的边的权值可以表示为：

其中，S(g _i,g _j)为参考图像i、j的相似度。

在另一实施例中，可以将所述多个参考图像中的每两个参考图像组成参考图像对，提取每个参考图像对的相似性特征，将每个参考图像对的相似性特征输入线性分类器，得到每个参考图像对的相似度得分。提取每个参考图像对的相似性特征可以参考S12。

S15，将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征。

消息网络是一种神经网络。在本实施例中，所述消息网络由全连接层、批量归一化层以及激活层构成。

第i个查询-参考图像对的相似性特征表示为d _i，第i个查询-参考图像对的消息特征表示为t _i，t _i＝F(d _i)，i＝1,2,…N(表示有N个参考图像)。

优选地，所述将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征包括：

所述消息网络的全连接层对所述查询-参考图像对的相似性特征进行分类，得到分类后的相似性特征；

所述消息网络的批量归一化层对所述分类后的相似性特征进行批量归一化处理，得到归一化处理后的相似性特征；

所述消息网络的激活层将所述归一化处理后的相似性特征中的线性因素转换为非线性因素，得到所述查询-参考图像对的消息特征。

本实施例中，所述消息网络的全连接层对查询-参考图像对的相似性特征进行分类，使得相似度高的相似性特征进入所述消息网络的下一层，即批量归一化层。所述消息网络中的批量归一化层利用小批量上的均值和标准差，不断调整所述消息网络的中间输出，使得整个消息网络在各层的中间输出的数值更稳定。所述消息网络中的激活层通过激活函数将上一层(即批量归一化层)传递下来的相似性特征中的线性因素转换为非线性因素，解决线性因素不能解决的问题。

本实施例中，可以使用两个消息网络将每个查询-参考图像对的相似性特征映射为消息特征。例如，在由全连接层、批量归一化层以及激活层构成的消息网络之后再连接一个由全连接层、批量归一化层以及激活层构成的消息网络。通过两层消息网络可以提取出更加准确的深度特征信息。

S16，根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征。

根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征，就是根据所述完全图对每个节点与其他节点的连接关系对每个查询-参考图像对的相似性特征进行更新。对于所述完全图中的每个节点，以该节点相连的其他节点对应的查询-参考图像对的消息特征作为该节点的输入特征，将该节点对应的查询-参考图像对的相似性特征更新为所有输入特征与原来的相似性特征的加权融合，即

其中

表示更新后的第i个相似性特征，

表示更新前的第i个相似性特征，

表示来自节点j的消息特征，α表示平衡融合特征和原始特征的加权参数。

查询-参考图像对的相似性特征可以迭代更新如下：

S17，根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分。

本实施例中，可以将每个查询-参考图像对更新后的相似性特征输入线性分类器，得到每个查询-参考图像对的相似性得分。

所述线性分类器可以是非线性作用函数，即sigmoid函数，公式为f(x)＝1/(1+e ^-x)。

S18，根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。

优选地，所述根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像包括：

将所述多个参考图像中相似性得分最高的参考图像确定为与所述查询图像相匹配的图像；或者

将所述多个参考图像中相似性得分高于预设值的参考图像确定为与所述查询图像相匹配的图像。

例如，有20个参考图像，将20个参考图像中相似性得分最高的参考图像确定为与所述查询图像相匹配的图像，或者，将20个参考图像中相似性得分高于0.9的参考图像确定为与所述查询图像相匹配的图像。

本申请的图像识别方法获取查询图像和多个参考图像；将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。本方法利用参考图像之间的相似性信息更新查询-参考图像对的相似性特征，提高图像识别的准确度。

如图2所示，图2为本申请实施例提供一种图像识别装置的功能模块图。图像识别装置20包括获取模块210、提取模块220、构造模块230、第一确定模块240、映射模块250、更新模块260、计算模块270以及第二确定模块280。本申请所称的模块是指一种能够被计算机装置的处理器所执行并且能够完成固定功能的一系列计算机程序段，其存储在计算机装置的存储器中。

所述获取模块210，用于获取查询图像和多个参考图像。

所述提取模块220，用于将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征。

优选地，所述提取模块提取每个查询-参考图像对的相似性特征，具体用于：

将所述第一特征图逐元素进行平方操作，得到第二特征图；

所述构造模块230，用于以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点。

所述第一确定模块240，用于计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值。

在本实施例中，所述计算模块计算所述多个参考图像中每两个参考图像之间的相似性得分，具体用于：

对所述两个参考图像按照同样的划分方法进行区域划分；

中，

可以取以e为底的对数，即

可以计算所述两个参考图像的每个区域的聚类中心的距离,根据所述两个参考图像的每个区域的聚类中心的距离确定所述两个参考图像之间的相似度。可以将所述两个参考图像的每个区域的聚类中心的距离的加权和作为所述两个参考图像之间的相似度。所述两个参考图像的每个区域的聚类中心的距离可以是欧氏距离、曼哈顿距离、马氏距离等。

其中，S(g _i,g _j)为参考图像i、j的相似度。

在另一实施例中，可以将所述多个参考图像中的每两个参考图像组成参考图像对，提取每个参考图像对的相似性特征，将每个参考图像对的相似性特征输入线性分类器，得到每个参考图像对的相似度得分。提取每个参考图像对的相似性特征可以参考提取模块220提取每个查询-参考图像对的相似性特征。

所述映射模块250，用于将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征。

优选地，所述映射模块将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征，具体用于：

所述更新模块260，用于根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征。

其中

表示更新后的第i个相似性特征，

表示更新前的第i个相似性特征，

查询-参考图像对的相似性特征可以迭代更新如下：

所述计算模块270，用于根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分。

所述第二确定模块280，用于根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。

优选地，所述第二确定模块根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像，具体用于：

本申请的图像识别装置20获取查询图像和多个参考图像；将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。本申请的图像识别装置20利用参考图像之间的相似性信息更新查询-参考图像对的相似性特征，提高图像识别的准确度。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取计算机可读存储介质中。上述软件功能模块存储在一个计算机可读存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。

如图3所示，是本申请实现图像识别方法的较佳实施例的计算机装置3的结构示意图。在本实施例中，计算机装置3包括至少一个发送装置31、至少一个存储器32、至少一个处理器33、至少一个接收装置34以及至少一个通信总线。其中，所述通信总线用于实现这些组件之间的连接通信。

所述计算机装置3是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。所述计算机装置3还可包括网络设备和/或用户设备。其中，所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。

所述计算机装置3可以是，但不限于任何一种可与用户通过键盘、触摸板或声控设备等方式进行人机交互的电子产品，例如，平板电脑、智能手机、监控设备等终端。

所述计算机装置3所处的网络包括，但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network，VPN)等。

其中，所述接收装置34和所述发送装置31可以是有线发送端口，也可以为无线设备，例如包括天线装置，用于与其他设备进行数据通信。

所述存储器32用于存储程序代码。所述存储器32可以是内存条、TF卡(Trans-flash Card)、智能媒体卡(smart media card)、安全数字卡(secure digital card)、快闪存储器卡(flash card)等储存设备。

所述处理器33可以包括一个或者多个微处理器、数字处理器。所述处理器33可调用存储器32中存储的程序代码以执行相关的功能。例如，图2中所述的各个模块是存储在所述存储器32中的程序代码，并由所述处理器33所执行，以实现一种图像识别方法。所述处理器33又称中央处理器(CPU，Central Processing Unit)，是一块超大规模的集成电路，是运算核心(Core)和控制核心(Control Unit)。

在一个实施例中，本申请还提出了一种存储有计算机可读指令的存储介质，所述存储介质为易失性存储介质或非易失性存储介质，该计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：获取查询图像和多个参考图像；将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种图像识别方法，其中，所述方法包括：

获取查询图像和多个参考图像；

将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；

以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；

计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；

将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；

根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；

根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；

根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。
如权利要求1所述的方法，其中，所述提取每个查询-参考图像对的相似性特征包括：

将所述查询-参考图像对输入基于残差网络的孪生神经网络，得到所述查询图像的特征图和所述查询-参考图像对中的参考图像的特征图；

将所述查询图像的特征图与所述参考图像的特征图相减，得到第一特征图；

将所述第一特征图逐元素进行平方操作，得到第二特征图；

将所述第二特征图进行批量归一化处理，得到所述查询-参考图像对的相似性特征。
如权利要求1所述的方法，其中，所述完全图中所述两个参考图像对应的边的权值为：

其中S(g _i,g _j)为参考图像i、j的相似度。
如权利要求1所述的方法，其中，所述将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征包括：

通过所述消息网络的全连接层对所述查询-参考图像对的相似性特征进行分类，得到分类后的相似性特征；

通过所述消息网络的批量归一化层对所述分类后的相似性特征进行批量归一化处理，得到归一化处理后的相似性特征；

通过所述消息网络的激活层将所述归一化处理后的相似性特征中的线性因素转换为非线性因素，得到所述查询-参考图像对的消息特征。
如权利要求1所述的方法，其中，所述根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像包括：

将所述多个参考图像中相似性得分最高的参考图像确定为与所述查询图像相匹配的图像；或者

将所述多个参考图像中相似性得分高于预设值的参考图像确定为与所述查询图像相匹配的图像。
如权利要求1-5中任一项所述的方法，其中，所述计算所述多个参考图像中每两个参考图像之间的相似性得分包括：

对所述两个参考图像按照同样的划分方法进行区域划分；

计算所述两个参考图像的每个区域的每个像素点的对数相对RGB坐标；

根据所述两个参考图像的每个区域的每个像素点的对数相对RGB坐标对所述两个参考图像的每个区域内的像素点进行聚类，得到所述两个参考图像的每个区域的聚类中心；

根据所述两个参考图像的每个区域的聚类中心确定所述两个参考图像之间的相似性得分。
如权利要求1-5中任一项所述的方法，其中，所述计算所述多个参考图像中每两个参考图像之间的相似性得分包括：

将所述两个参考图像分别输入第一深度残差网络和第二深度残差网络，从所述第一深度残差网络得到所述两个参考图像的整体特征，从所述第二深度残差网络得到所述两个参考图像的局部特征；

根据所述两个参考图像的整体特征和局部特征计算所述两个参考图像之间的相似性得分。
一种图像识别装置，其中，所述装置包括：

获取模块，用于获取查询图像和多个参考图像；

提取模块，用于将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；

构造模块，用于以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；

第一确定模块，用于计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；

映射模块，用于将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；

更新模块，用于根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；

计算模块，用于根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；

第二确定模块，用于根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。
一种计算机装置，其中，包括：

一个或多个处理器；

存储器；

一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个计算机程序配置用于执行一种图像识别方法；其中，所述图像识别方法包括以下步骤：

获取查询图像和多个参考图像；

将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；

以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；

计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；

将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；

根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；

根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；

根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。
如权利要求9所述的计算机装置，其中，所述提取每个查询-参考图像对的相似性特征包括：

将所述查询-参考图像对输入基于残差网络的孪生神经网络，得到所述查询图像的特征图和所述查询-参考图像对中的参考图像的特征图；

将所述查询图像的特征图与所述参考图像的特征图相减，得到第一特征图；

将所述第一特征图逐元素进行平方操作，得到第二特征图；

将所述第二特征图进行批量归一化处理，得到所述查询-参考图像对的相似性特征。
如权利要求9所述的计算机装置，其中，所述完全图中所述两个参考图像对应的边的权值为：

其中S(g _i,g _j)为参考图像i、j的相似度。
如权利要求9所述的计算机装置，其中，所述将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征包括：

通过所述消息网络的全连接层对所述查询-参考图像对的相似性特征进行分类，得到分类后的相似性特征；

通过所述消息网络的批量归一化层对所述分类后的相似性特征进行批量归一化处理，得到归一化处理后的相似性特征；

通过所述消息网络的激活层将所述归一化处理后的相似性特征中的线性因素转换为非线性因素，得到所述查询-参考图像对的消息特征。
如权利要求9所述的计算机装置，其中，所述根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像包括：

将所述多个参考图像中相似性得分最高的参考图像确定为与所述查询图像相匹配的图像；或者

将所述多个参考图像中相似性得分高于预设值的参考图像确定为与所述查询图像相匹配的图像。
如权利要求9-13中任一项所述的计算机装置，其中，所述计算所述多个参考图像中每两个参考图像之间的相似性得分包括：

对所述两个参考图像按照同样的划分方法进行区域划分；

计算所述两个参考图像的每个区域的每个像素点的对数相对RGB坐标；

根据所述两个参考图像的每个区域的每个像素点的对数相对RGB坐标对所述两个参考图像的每个区域内的像素点进行聚类，得到所述两个参考图像的每个区域的聚类中心；

根据所述两个参考图像的每个区域的聚类中心确定所述两个参考图像之间的相似性得分。
如权利要求9-13中任一项所述的计算机装置，其中，所述计算所述多个参考图像中每两个参考图像之间的相似性得分包括：

将所述两个参考图像分别输入第一深度残差网络和第二深度残差网络，从所述第一深度残差网络得到所述两个参考图像的整体特征，从所述第二深度残差网络得到所述两个参考图像的局部特征；

根据所述两个参考图像的整体特征和局部特征计算所述两个参考图像之间的相似性得分。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现一种图像识别方法，其中，所述图像识别方法包括以下步骤：

获取查询图像和多个参考图像；

将所述查询图像与每个参考图像组成查询-参考图像对，提取每个查询-参考图像对的相似性特征；

以所述查询-参考图像对为节点构造完全图，每个参考图像对应一个节点；

计算所述多个参考图像中每两个参考图像之间的相似性得分，根据所述两个参考图像之间的相似性得分确定所述完全图中所述两个参考图像对应的边的权值；

将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征；

根据每个查询-参考图像对的消息特征与所述完全图中每条边的权值更新每个查询-参考图像对的相似性特征；

根据每个查询-参考图像对更新后的相似性特征计算每个查询-参考图像对的相似性得分；

根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像。
如权利要求16所述的计算机可读存储介质，其中，所述提取每个查询-参考图像对的相似性特征包括：

将所述查询-参考图像对输入基于残差网络的孪生神经网络，得到所述查询图像的特征图和所述查询-参考图像对中的参考图像的特征图；

将所述查询图像的特征图与所述参考图像的特征图相减，得到第一特征图；

将所述第一特征图逐元素进行平方操作，得到第二特征图；

将所述第二特征图进行批量归一化处理，得到所述查询-参考图像对的相似性特征。
如权利要求16所述的计算机可读存储介质，其中，所述完全图中所述两个参考图像对应的边的权值为：

其中S(g _i,g _j)为参考图像i、j的相似度。
如权利要求16所述的计算机可读存储介质，其中，所述将每个查询-参考图像对的相似性特征通过消息网络映射为消息特征包括：

通过所述消息网络的全连接层对所述查询-参考图像对的相似性特征进行分类，得到分类后的相似性特征；

通过所述消息网络的批量归一化层对所述分类后的相似性特征进行批量归一化处理，得到归一化处理后的相似性特征；

通过所述消息网络的激活层将所述归一化处理后的相似性特征中的线性因素转换为非线性因素，得到所述查询-参考图像对的消息特征。
如权利要求16所述的计算机可读存储介质，其中，所述根据每个查询-参考图像对的相似性得分从所述多个参考图像中确定与所述查询图像相匹配的图像包括：

将所述多个参考图像中相似性得分最高的参考图像确定为与所述查询图像相匹配的图像；或者

将所述多个参考图像中相似性得分高于预设值的参考图像确定为与所述查询图像相匹配的图像。