CN111798376A

CN111798376A - 图像识别方法、装置、电子设备及存储介质

Info

Publication number: CN111798376A
Application number: CN202010650042.5A
Authority: CN
Inventors: 李驰; 刘岩
Original assignee: Taikang Insurance Group Co Ltd
Current assignee: Taikang Insurance Group Co Ltd
Priority date: 2020-07-08
Filing date: 2020-07-08
Publication date: 2020-10-20
Anticipated expiration: 2040-07-08
Also published as: CN111798376B

Abstract

本发明实施例提供了一种图像识别方法、装置、电子设备及计算机可读存储介质，属于计算机技术领域，该图像识别方法包括：根据终端发送的图像获取多张待处理图像，对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像；通过训练好的分类模型对所述拼接纹理图像进行识别分类，得到用于表示所述拼接纹理图像对应的多张待处理图像的分类相似度的分类结果；根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景。本发明实施例的技术方案能够提高图像场景识别的准确性。

Description

图像识别方法、装置、电子设备及存储介质

技术领域

本发明实施例涉及计算机技术领域，具体而言，涉及一种图像识别方法、图像识别装置、电子设备及计算机可读存储介质。

背景技术

在进行图像检索的过程中，可以通过相似场景图像的比对方式来执行。

相关技术中，对每张图像进行特征提取生成图像指纹，然后比较不同图像的图像指纹，来确定图像场景是否相似。例如为了保留结构去掉细节，去除大小、横纵比的差异，把图片统一缩放进行哈希编码生成哈希特征值。或者是提取图像的纹理特征，并进行特征向量的比对完成相似场景图像的判别。

上述方式，在复杂场景图像比对时，轻微的光线变化就有可能导致图像相似性比对判别失败，因此具有一定的局限性，且稳定性较差。并且，需要提取每张图像的纹理特征，处理效率较低且准确性较差。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本发明实施例的目的在于提供一种图像识别方法、图像识别装置、电子设备及计算机可读存储介质，进而至少在一定程度上克服识别结果不准确的问题。

本发明实施例的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本发明的实践而习得。

根据本发明实施例的一个方面，提供一种图像识别方法，包括：根据终端发送的图像获取多张待处理图像，对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像；通过训练好的分类模型对所述拼接纹理图像进行识别分类，得到用于表示所述拼接纹理图像对应的多张待处理图像的分类相似度的分类结果；根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景，并将所述分类结果发送至终端进行显示。

在本发明的一种示例性实施例中，所述对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像，包括：对所述多张待处理图像进行光照归一化处理，得到多张光照图像；将所述多张光照图像按照预设方向进行缩放拼接处理，得到一张拼接图像；对所述拼接图像进行特征提取得到所述拼接图像的纹理特征，以生成所述拼接纹理图像。

在本发明的一种示例性实施例中，所述对所述多张待处理图像进行光照归一化处理，得到多张光照图像，包括：对所述多张待处理图像进行伽马变换，得到变换后的图像；对所述变换后的图像做高斯差分滤波，获取滤波后的图像；将所述滤波后的图像进行直方图均衡化，以得到所述多张光照图像。

在本发明的一种示例性实施例中，所述将所述多张光照图像按照预设方向进行缩放拼接处理，得到一张拼接图像，包括：将多张所述光照图像采用双线性差值缩放至相同尺寸，得到多张缩放图像；对所述多张缩放图像按照所述预设方向进行拼接，生成所述拼接图像。

在本发明的一种示例性实施例中，所述对所述拼接图像进行特征提取得到所述拼接图像的纹理特征，以生成所述拼接纹理图像，包括：在预设窗口内，以窗口的中心像素的像素值为阈值，将相邻的多个像素的灰度值与窗口中心的像素值表示的阈值进行比较，得到比较结果；根据比较结果确定相邻的每个像素点的标记值，并根据每个像素点的标记值确定所述中心像素的纹理特征值，以将纹理特征值作为所述中心像素对应的纹理图像的像素值；在所述拼接图像中以预设窗口进行滑动，得到每个像素点对应的纹理图像的像素值，直至得到所有像素点对应的纹理图像的像素值为止，以生成所述拼接纹理图像。

在本发明的一种示例性实施例中，所述方法还包括：通过对多张样本图像进行光照处理，并对多张样本光照图像进行缩放拼接处理获取样本拼接纹理图像，并确定所述样本拼接纹理图像的标签；将所述样本拼接纹理图像输入至一机器学习模型进行预测，得到预测标签，并以所述样本拼接纹理图像的所述标签为训练目标，对所述机器学习模型的参数进行调整，得到所述训练好的分类模型。

在本发明的一种示例性实施例中，所述根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景，包括：若所述分类结果大于或等于分类阈值，则确定所述多张待处理图像属于相同场景；若所述分类结果小分类阈值，则确定所述多张待处理图像属于不同场景。

根据本发明的一个方面，提供一种图像识别装置，包括：图像拼接模块，用于根据终端发送的图像获取多张待处理图像，并对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像；图像分类模块，用于通过训练好的分类模型对所述拼接纹理图像进行识别分类，得到用于表示所述拼接纹理图像对应的多张待处理图像的分类相似度的分类结果；场景识别模块，用于根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景，并将所述分类结果发送至终端进行显示。

根据本发明的一个方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如上述任意一项所述的图像识别方法。

根据本发明的一个方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的图像识别方法。

本发明实施例提供的图像识别方法、装置、电子设备和计算机可读存储介质中，一方面，通过对所述多张待处理图像对应的经过光照处理的光照图像进行拼接处理，并在拼接图像的基础上提取纹理特征，以将所述多张待处理图像转换为一张拼接纹理图像，能够避免光照对图像识别的干扰性和影响，避免了应用范围的局限性，能够应用于各种场景，增加了普适性和识别过程的稳定性、鲁棒性。另一方面，由于是通过训练好的分类模型来对拼接纹理图像进行识别分类，得到分类结果，进而根据分类结果对多张待处理图像所属的场景进行识别，以确定是否属于相同场景。采用分类的思想进行图像比对判断多个待处理图像中的场景是否相似，避免了传统图像比对方法中对图像的特征提取以及特征相似性度量，并且将待处理图像拼接成一个图像进行分类，提高了识别效率和识别精准度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示意性示出了用于实现本发明实施例的图像识别方法的系统架构图；

图2示意性示出了本发明实施例的图像识别方法的流程示意图；

图3示意性示出了本发明实施例的获取拼接纹理图像的流程示意图；

图4示意性示出了本发明实施例的提取纹理特征的流程示意图；

图5示意性示出了本发明实施例的模型训练的处理流程图；

图6示意性示出了本发明实施例的卷积神经网络模型的结构示意图；

图7示意性示出了本发明实施例的整体流程示意图；

图8示意性示出了根据本发明实施例的图像识别装置的框图；

图9示意性示出了用来实现上述图像识别方法的电子设备的框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本发明将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本发明的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本发明的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

图1示出了可以应用本发明实施例的技术方案的示例性系统架构的示意图。

如图1所示，系统架构100可以包括第一端101、网络102、第二端103。其中，第一端101可以是客户端，例如可以为智能手机、电脑、平板电脑等能够使用应用程序的终端。网络102用以在第一端101和第二端103之间提供通信链路的介质，网络102可以包括各种连接类型，例如有线通信链路、无线通信链路等等，在本发明实施例中，第一端101和第二端103之间的网络102可以是有线通信链路，例如可以通过串口连接线提供通信链路，也可以是无线通信链路，通过无线网络提供通信链路。第二端103可以是具有数据处理功能的服务器或者是客户端，例如便携式计算机、台式计算机、智能手机等具有数据处理功能的终端设备，用于对第一端上传的待处理图像进行处理。

本发明实施例中，第一端可以响应于用户操作，打开其上安装的应用程序，以通过应用程序上传图像从而得到多张待处理图像。第二端获取第一端上传的待处理图像，并从本身的存储器中获取待处理图像组成多张待处理图像。进一步地，第二端可以对多张待处理图像对应的经过光照处理的光照图像进行拼接处理，以将所述多张待处理图像转换为一张拼接纹理图像；并且通过训练好的分类模型来对拼接纹理图像进行识别分类，得到用于表示分类相似度的分类结果；根据分类结果对所述多张待处理图像所属的场景进行识别，确定多张待处理图像是否属于相同场景。进一步地，服务器在识别出多张待处理图像是否属于同一场景后，可以将其分类结果以标签的形式显示在第一端的操作界面上，并且可以通过第一端的操作界面展示一些提示信息。

应该理解，图1中的第一端、网络和第二端的数目仅仅是示意性的。

需要说明的是，本发明实施例所提供的图像识别方法可以完全由第二端执行，相应地，图像识别装置可设置于第二端103中。

本发明实施例中首先提出一种图像识别方法，该图像识别方法可以应用于各种需要对不同的图像进行场景识别，以判断不同的图像是否相同的场景中。例如可以应用于财务影像检索场景，稽核影像核查场景或者是其他场景。该图像识别方法的执行主体可以为服务器，参考图2所示，该图像识别方法可以包括以下步骤：

在步骤S210中，根据终端发送的图像获取多张待处理图像，对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像；

在步骤S220中，通过训练好的分类模型对所述拼接纹理图像进行识别分类，得到用于表示所述拼接纹理图像对应的多张待处理图像的分类相似度的分类结果；

在步骤S230中，根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景，并将所述分类结果发送至终端进行显示。

在本发明的示例实施例所提供的技术方案中，一方面，通过对所述多张待处理图像对应的经过光照处理的光照图像进行拼接处理，以将多张待处理图像转换为一张拼接纹理图像，能够避免光照对图像识别的干扰性和影响，避免了应用范围的局限性，增加了普适性和识别过程的稳定性、鲁棒性。另一方面，由于是通过训练好的分类模型来对拼接纹理图像进行识别分类，以得到分类结果，进而根据分类结果对多张待处理图像所属的场景进行识别，以确定是否属于相同场景。采用分类的思想进行图像比对判断多个待处理图像中的场景是否相似，避免了传统图像比对方法中对图像的特征提取以及特征相似性度量，并且将待处理图像拼接成一个图像进行分类，提高了识别效率和识别精准度。

接下来，结合附图对本发明实施例中的图像识别方法进行进一步解释说明。

在步骤S210中，根据终端发送的图像获取多张待处理图像，对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像。

本发明实施例中，待处理图像指的是待比对的图像。待处理图像可以为终端上传的图像，也可以为终端上传的图像以及从服务器获取的历史图像。当为终端上传的图像以及从服务器获取的历史图像时，待处理图像可以为用于执行同一操作行为的终端上传的所有图像和历史图像。例如，当前报销图像与历史报销图像。举例而言，在文件报销场景中，用户会使用图像等文件来进行报销。为了避免重复报销，因此需要在当前报销的图像文件与历史的报销影像文件进行比对，如果出现相似场景的图像则进行提醒。待处理图像的数量可以为多张，具体数量可以根据实际场景需求进行设定，本发明实施例中以多张待处理图像为两张待处理图像为例进行说明，即一张终端上传的图像以及一张历史图像。

在获取到多张待处理图像后，可以对待处理图像进行光照处理以得到光照图像，进而对经过光照处理的光照图像进行缩放拼接处理得到拼接图像，进而可以对拼接图像进行纹理特征提取，以将多张待处理图像由独立的图像拼接成一张整体的拼接纹理图像。其中，光照处理用于剔除光照对图像识别操作的影响，光照处理具体可以为光照归一化处理。

图3中示意性示出了获取拼接纹理图像的流程示意图，参考图3中所示，主要包括以下步骤：

在步骤S310中，对所述多张待处理图像进行光照归一化处理，得到多张光照图像。

本步骤中，如果图像中存在光照不均匀的情况，则会影响图像处理的效果和准确性，因此可以对图像进行光照归一化处理，以避免对图像处理的影响。基于此，可以分别对每一张待处理图像进行光照归一化处理，生成对应的多张光照图像，即光照图像与待处理图像一一对应。本发明实施例中，光照归一化处理的过程可以包括以下步骤：步骤一、对所述多张待处理图像进行伽马变换，得到变换后的图像；步骤二、对所述变换后的图像做高斯差分滤波，获取滤波后的图像；步骤三、将所述滤波后的图像进行直方图均衡化，以得到所述多张所述光照图像。

具体地，可以将待处理图像记作I_input。首先，对待处理图像I_input做伽马变换I_input-gama＝I_inputγ得到变换后的图像。其中，用于伽马变换的伽马系数可选范围为0.1～0.4，本发明实施例中以伽马系数为0.25为例进行说明。

其次，对变换后的图像做高斯差分滤波，具体可以按照公式(1)来执行高斯差分滤波得到滤波后的图像。其中，高频系数的可选范围为0.2～0.6，低频系数的可选范围为1～5，本发明实施例中以高频系数为0.5，低频系数为2为例进行说明。

再次，对滤波后的图像做直方图均衡化I_image-li＝F_EQ(I_image-dog)，完成对图像光照归一化的处理，从而得到多张光照图像。在进行直方图均衡化时，直方图均衡化像素映射可以采用公式(2)：

其中，n是滤波后的图像中像素的总和，n_k是当前灰度级的像素个数，L是滤波后的图像中可能的灰度级总数。

在步骤S320中，将所述多张光照图像按照预设方向进行缩放拼接处理，得到一张拼接图像。

本步骤中，在将多张待处理图像处理为多张光照图像后，可以对多张光照图像进行拼接处理，得到一张拼接图像。具体地，首先，可以将多张所述光照图像进行缩放处理，即采用双线性差值缩放至相同尺寸，得到多张缩放图像；然后，对所述多张缩放图像按照预设方向进行拼接，生成所述拼接图像。其中，为了保证图像尺寸的统一，可以将光照图像缩放至相同尺寸，以便于后续处理。相同尺寸的具体数值可以根据实际需求进行设定，此处不做限定。在将光照图像缩放后，可以对所有的缩放图像按照水平方向或者是垂直方向所表示的预设方向进行拼接处理，得到拼接图像。

具体地，对光照归一化后的多张光照图像I_image-li1，I_image-li2，采用双线性差值统一缩放到相同尺寸，得到缩放图像I'_image-li1，I'_image-li2。其中，相同尺寸可以为w*h大小，双线性差值方法公式可以如公式(3)所示：

其中，f(Q_mn)表示在点(x_m,y_n)的像素值。

在对多张光照图像I_image-li1，I_image-li2缩放至相同尺寸得到多张缩放图像后，可以将缩放图像I'_image-li1，I'_image-li2按照预设方向进行拼接，得到拼接图像。预设方向可以为水平方向，例如将相同尺寸w*h大小的缩放图像进行水平拼接，从而拼接成一个整体的(2*w)*h大小的拼接图像I_{combine-image}。即，将两个独立的缩放图像按照左右顺序进行排列，生成一个整体的拼接图像。需要说明的是，预设方向也可以为竖直方向，且进行拼接时不对缩放图像的顺序进行限定。

在步骤S330中，对所述拼接图像进行特征提取得到所述拼接图像的纹理特征，以生成所述拼接纹理图像。

本发明实施例中，纹理特征刻画了图像中重复出现的局部模式与他们的排列规则，常用于图像分类和场景识别。纹理特征反映了图像本身的属性，有助于将不同的图像区别开来。纹理描述图像像素点与图像领域之间的灰度空间的分布关系，是图像像素点灰度级或颜色的某种变化，不会因为光照强弱而改变图像的视觉变化。

在得到拼接图像之后，可以对拼接图像进行特征提取得到纹理特征，以获取拼接纹理图像。具体地，可以按照LBP(Local binary patterns，局部二值模式)算法在拼接图像中来提取纹理特征。LBP特征，是一种用来描述图像局部纹理特征的算子。

图4中示意性示出了提取拼接图像中的纹理特征的流程图，参考图4中所示，主要包括以下步骤：

在步骤S410中，在预设窗口内，以窗口的中心像素的像素值为阈值，将相邻的多个像素的灰度值与窗口中心的像素值表示的阈值进行比较，得到比较结果；

在步骤S420中，根据比较结果确定相邻的每个像素点的标记值，并根据每个像素点的标记值确定所述中心像素的纹理特征值，以将纹理特征值作为所述中心像素对应的纹理图像的像素值；

在步骤S430中，在所述拼接图像中以预设窗口进行滑动，得到每个像素点对应的纹理图像的像素值，直至得到所有像素点对应的纹理图像的像素值为止，以生成所述拼接纹理图像。

本发明实施例中，预设窗口可以根据实际需求进行设定，此处以预设窗口为3*3为例进行说明。相邻的多个像素指的是与中心像素相邻的8个像素。标记值用于表示某一个相邻像素的像素值是否大于中心像素的像素值。纹理特征值根据标记值组合以及转化得到。

具体地，在3*3的预设窗口内w_3*3，以窗口的中心像素的像素值I_x,y为阈值，将相邻的8个像素的灰度值与其进行比较，得到相邻像素的像素值大于阈值或者是小于阈值的比较结果。若比较结果为某一相邻像素值大于中心像素的像素值，则该相邻像素点的位置被标记为1，即其标记值为1，否则为0。按照上述方式，可以将相邻的8个像素标记为8个标记值，并将8个标记值进行组合从而可产生8位二进制数B₁,B₂,...B₈。进一步地，可以将8位二进制数B₁,B₂,...B₈转成一位0～255的十进制数I'_x,y，即得到该预设窗口内中心像素的LBP值，作为该中心像素的纹理特征值。并且，可以将该纹理特征值作为该中心像素对应的纹理图像的像素值。

在拼接图像I_{combine-image}中以3*3的预设窗口滑动，生成的每一个像素点的纹理特征值则作为该点纹理图像的像素值，从而可以得到每个像素点对应的纹理图像的像素值，直至完成在拼接图像中全图的窗口滑动，即可生成拼接纹理图像I_lbp-image。

需要说明的是，如果拼接图像尺寸较大，还可以将拼接图像拆分为多个像素区域，对每个像素区域逐一提取其纹理特征，最后进行组合即可。

图4中的技术方案，通过LBP特征算子进行纹理特征提取，简化了操作步骤，减少了数据量，提高了效果。并且，本发明实施例中，提取的是整体的拼接图像的纹理特征，避免了传统图像比对方法中对每一个图像的特征进行提取以及特征相似性度量，提高了特征提取效率以及相似度度量效率，也提高拼接纹理图像的准确性。

接下来，在步骤S220中，通过训练好的分类模型对所述拼接纹理图像进行识别分类，得到用于表示所述拼接纹理图像对应的多张待处理图像的分类相似度的分类结果。

本发明实施例中，为了提高图像识别的效率和准确性，可以通过训练好的分类模型来对多张待处理图像对应的拼接纹理图像进行识别处理，以得到对于拼接纹理图像的分类结果。此处的分类结果可以用于评价表示拼接纹理图像中包含的多张待处理图像是否属于同一场景或者是否相同。

具体地，为了提高识别的准确性，首先可以对机器学习模型进行训练，得到训练好的机器学习模型作为训练好的分类模型，来对拼接纹理图像进行识别分类。

图5中示意性示出了模型训练的流程图，参考图5中所示，主要包括以下步骤：

在步骤S510中，对多张样本图像进行光照处理，并对多张样本光照图像进行缩放拼接处理获取样本拼接纹理图像，并确定所述样本拼接纹理图像的标签。

本步骤中，样本图像指的是已经确定了是否属于同一场景或者是否相同的图像。可以对样本图像与上述待处理图像进行相同的处理操作得到对应的样本拼接纹理图像，从而制作数据样本集。具体地，可以对多张样本图像进行光照处理，即光照归一化处理，得到多张样本光照图像；将多张样本光照图像进行缩放拼接处理，得到一张样本拼接图像；对样本拼接图像进行特征提取得到纹理特征，以生成样本拼接纹理图像。其中，可以对多张样本图像进行伽马变换，再做高斯差分滤波，再进行直方图均衡化，以执行光照归一化处理并得到多张样本光照图像。进一步地，将多张样本光照图像采用双线性差值缩放至相同尺寸，得到多张缩放样本图像；对多张缩放样本图像按照预设方向进行拼接得到样本拼接图像。例如按照水平方向进行水平拼接，生成一张样本拼接图像；或者是按照竖直方向进行竖直拼接生成一张样本拼接图像。需要说明的是，对缩放样本图像进行拼接的方向需要与对待处理图像对应的缩放图像进行拼接的方向一致。然后，基于LBP算法从样本拼接图像中提取纹理特征，以生成样本拼接纹理图像。通过上述方式，可以得到多张样本拼接纹理图像，进而根据多张样本拼接纹理图像来生成数据样本集。

在生成样本拼接纹理图像的同时，可以对每一个样本拼接纹理图像进行标记，以得到其中包含的两个样本图像是否属于同一场景的标签。具体而言，若拼接的两张样本图像是相同场景，则该样本拼接纹理图像的样本标记为类别“1”，即标签为1；若拼接的两张样本图像不是相同场景，则样本标记为类别“0”，即标签为0。此处的样本拼接纹理图像的标签可以是人工标定的。

在步骤S520中，将所述样本拼接纹理图像输入至一机器学习模型进行预测，得到预测标签，并以所述样本拼接纹理图像的所述标签为训练目标，对所述机器学习模型的参数进行调整，得到所述训练好的分类模型。

本步骤中，机器学习模型可以为卷积神经网络模型，也可以为其他任意类型的能够用于分类识别的模型，此处以卷积神经网络模型为例进行说明。

图6中示意性示出了卷积神经网络模型的结构图，参考图6中所示，该网络结构包括6个卷积池化层、3个全连接层、1个用于输出分类结果的Softmax层。每个卷积池化层均包括2个卷积层以及1个池化层，该卷积层的卷积核大小均为3*3，且其步长为2，步进为1；池化层均为最大池化。全连接层1包括全连接层以及激活函数层，其中的全连接为1024维向量，激活函数层使用Relu激活函数，可以表示为f(x)＝max(0,x)。全连接层2包括全连接层以及激活函数层，其中的全连接为512维向量，激活函数层使用Relu激活函数。全连接层3仅包括全连接层，为256维向量。Softmax层的Softmax函数可以用公式(4)表示：

具体而言，输入层输入三通道图像，即将样本拼接纹理图像输入至一机器学习模型的输入层，通过6个卷积池化层进行卷积操作，再通过3个全连接层进行全连接处理、再通过1个Softmax层得到对于样本拼接纹理图像的预测标签。接下来，判断预测标签与对应的人工标定的标签是否相同，若不同，可以该样本拼接纹理图像的人工标定的标签为训练目标，不断调整卷积神经网络模型的参数，直至样本拼接纹理图像的预测标签与对应的人工标定的标签一致为止，并将二者一致时的参数作为卷积神经网络模型的参数，得到训练好的卷积神经网络模型作为训练好的分类模型，以提高模型的准确性和稳定性，从而提高图像识别的准确性。

模型应用过程中，在得到训练好的分类模型之后，可以将多张待处理图像输入至训练好的分类模型，以便于通过训练好的分类模型来对多张待处理图像进行卷积操作，从其中提取多张待处理图像对应的拼接纹理图像的特征数据，进一步通过特征数据对拼接纹理图像进行分类识别，以确定拼接纹理图像的分类结果。此处的分类结果指的是拼接纹理图像中包含的多个待处理图像的分类相似度，即多个待处理图像之间的相似度。举例而言，分类结果可以采用0～1的浮点数来表示分类相似度，且数值越大相似度越大，例如0.9或者是0.5等等。

本发明实施例中，通过训练好的分类模型来对多张待处理图像拼接成的拼接纹理图像来进行分类识别，由于分类模型训练过程中，通过光照归一化避免了光照对图像识别的干扰性和影响，因此得到分类模型更准确。采用分类的思想进行图像比对判断多个待处理图像中的场景是否相似，避免了传统图像比对方法中对图像的特征提取以及特征相似性度量，并且将待处理图像拼接成一个图像进行分类，提高了识别效率和识别精准度。

本发明实施例中，可以根据分类结果与分类阈值的对比结果来确定多张待处理图像是否属于相同场景。分类阈值可以根据实际需求进行设定，例如可以设置为0.5或者是0.8等等，此处以分类阈值为0.8为例进行说明。

如果对比结果为分类结果大于或者是等于分类阈值，则可以认为拼接纹理图像对应的多张待处理图像属于相似图像，且属于相同场景。如果对比结果为分类结果小于分类阈值，则可以认为多张待处理图像不属于相似图像，因此不属于相同场景。

在确定出分类结果后，服务器可以将分类结果发送至终端进行展示。在一些核查应用场景中，可以对用户进行提醒，以便于辅助用户重新进行验证，从而避免重复提交等问题，提高了处理准确性。

图7中示意性示出了整体流程图，主要包括模型训练和模型应用两部分，其中，具体包括以下步骤：

在步骤S701中，对多张样本图像进行光照归一化处理；

在步骤S702中，两张图像水平拼接；

在步骤S703中，局部二值模式纹理图像提取，制作样本图像的标签；

在步骤S704中，构建多层卷积神经网络模型，进行模型训练；

在步骤S705中，生成训练好的分类模型，完成模型训练部分，并转至步骤S710；

在步骤S706中，对多张待处理图像进行光照归一化处理；

在步骤S707中，两张待处理图像水平拼接；

在步骤S708中，局部二值模式纹理图像提取；

在步骤S709中，拼接纹理图像输入至训练好的分类模型；

在步骤S710中，对输入的图像进行分类；

在步骤S711中，分类结果大于或等于分类阈值属于相同场景，分类结果小于分类阈值不属于相同场景。

通过图7中的技术方案，避免了传统图像比对方法对图像的特征提取以及特征相似性度量，并且将待处理图像拼接成一个图像进行分类，提高了识别效率和识别精准度。

基于上述内容，在财务报销影像比对场景中，用户可以通过终端上的应用程序(例如邮件、即时通信工具或者是内部系统)等上传一些图像，终端可以将这些图像发送至服务器。服务器接收到这些图像并对这些图像进行对比，或者是对这些图像与服务器中存储的历史图像按照训练好的分类模型进行对比。如果出现相似场景的图像则提醒复核人员重点核对，以提高复核准确性。

本发明实施例中，还提供了一种图像识别装置800，参考图8中所示，该图像识别装置800主要包括以下模块：

图像拼接模块801，用于根据终端发送的图像获取多张待处理图像，对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像；

图像分类模块802，用于通过训练好的分类模型对所述拼接纹理图像进行识别分类，得到用于表示所述拼接纹理图像对应的多张待处理图像的分类相似度的分类结果；

场景识别模块803，用于根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景，并将所述分类结果发送至终端进行显示。

在本发明的一种示例性实施例中，图像拼接模块包括：归一化处理模块，用于对所述多张待处理图像进行光照归一化处理，得到多张光照图像；拼接模块，用于将所述多张光照图像按照预设方向进行缩放拼接处理，得到一张拼接图像；特征提取模块，用于对所述拼接图像进行特征提取得到纹理特征，以生成所述拼接纹理图像。

在本发明的一种示例性实施例中，归一化处理模块包括：变换模块，用于对所述多张待处理图像进行伽马变换，得到变换后的图像；滤波模块，用于对所述变换后的图像做高斯差分滤波，获取滤波后的图像；均衡化模块，用于将所述滤波后的图像进行直方图均衡化，以得到所述多张光照图像。

在本发明的一种示例性实施例中，拼接模块包括：图像缩放模块，用于将多张所述光照图像采用双线性差值缩放至相同尺寸，得到多张缩放图像；拼接控制模块，用于对所述多张缩放图像按照所述预设方向进行拼接，生成所述拼接图像。

在本发明的一种示例性实施例中，特征提取模块包括：比较模块，用于在预设窗口内，以窗口的中心像素的像素值为阈值，将相邻的多个像素的灰度值与窗口中心的像素值表示的阈值进行比较，得到比较结果；像素值确定模块，用于根据比较结果确定相邻的每个像素点的标记值，并根据每个像素点的标记值确定所述中心像素的纹理特征值，以将纹理特征值作为所述中心像素对应的纹理图像的像素值；拼接纹理图像生成模块，用于在所述拼接图像中以预设窗口进行滑动，得到每个像素点对应的纹理图像的像素值，直至得到所有像素点对应的纹理图像的像素值为止，以生成所述拼接纹理图像。

在本发明的一种示例性实施例中，所述装置还包括：样本获取模块，用于对多张样本图像进行光照处理，并对多张样本光照图像进行缩放拼接处理获取样本拼接纹理图像，并确定所述样本拼接纹理图像的标签；模型训练模块，用于将所述样本拼接纹理图像输入至一机器学习模型进行预测，得到预测标签，并以所述样本拼接纹理图像的所述标签为训练目标，对所述机器学习模型的参数进行调整，得到所述训练好的分类模型。

在本发明的一种示例性实施例中，场景识别模块包括：第一识别模块，用于若所述分类结果大于或等于分类阈值，则确定所述多张待处理图像属于相同场景；第二识别模块，用于若所述分类结果小分类阈值，则确定所述多张待处理图像属于不同场景。

需要说明的是，本发明实施例的图像识别装置的各个功能模块与上述图像识别方法的示例实施例的步骤相同，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，尽管在附图中以特定顺序描述了本发明中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

在本发明的示例性实施例中，还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

下面参照图9来描述根据本发明的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图9所示，电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于：上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930、显示单元940。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元910执行，使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如，所述处理单元910可以执行如图2中所示的步骤。

存储单元920可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)9201和/或高速缓存存储单元9202，还可以进一步包括只读存储单元(ROM)9203。

存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204，这样的程序模块9205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线930可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备900也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备900交互的设备通信，和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且，电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器960通过总线930与电子设备900的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备900使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本发明实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明实施方式的图像识别方法。

在本发明的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。

根据本发明的实施方式的用于实现上述方法的程序产品，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

用于执行本发明操作的程序代码可以以一种或多种程序设计语言的任意组合来编写，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其他实施例。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由权利要求指出。

Claims

1.一种图像识别方法，其特征在于，包括：

根据终端发送的图像获取多张待处理图像，对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像；

通过训练好的分类模型对所述拼接纹理图像进行识别分类，得到用于表示所述拼接纹理图像对应的多张待处理图像的分类相似度的分类结果；

根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景，并将所述分类结果发送至终端进行显示。

2.根据权利要求1所述的图像识别方法，其特征在于，所述对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像，包括：

对所述多张待处理图像进行光照归一化处理，得到多张光照图像；

将所述多张光照图像按照预设方向进行缩放拼接处理，得到一张拼接图像；

对所述拼接图像进行特征提取得到所述拼接图像的纹理特征，以生成所述拼接纹理图像。

3.根据权利要求2所述的图像识别方法，其特征在于，所述对所述多张待处理图像进行光照归一化处理，得到多张光照图像，包括：

对所述多张待处理图像进行伽马变换，得到变换后的图像；

对所述变换后的图像做高斯差分滤波，获取滤波后的图像；

将所述滤波后的图像进行直方图均衡化，以得到所述多张光照图像。

4.根据权利要求2所述的图像识别方法，其特征在于，所述将所述多张光照图像按照预设方向进行缩放拼接处理，得到一张拼接图像，包括：

将多张所述光照图像采用双线性差值缩放至相同尺寸，得到多张缩放图像；

对所述多张缩放图像按照所述预设方向进行拼接，生成所述拼接图像。

5.根据权利要求2所述的图像识别方法，其特征在于，所述对所述拼接图像进行特征提取得到所述拼接图像的纹理特征，以生成所述拼接纹理图像，包括：

在预设窗口内，以窗口的中心像素的像素值为阈值，将相邻的多个像素的灰度值与窗口中心的像素值表示的阈值进行比较，得到比较结果；

根据比较结果确定相邻的每个像素点的标记值，并根据每个像素点的标记值确定所述中心像素的纹理特征值，以将纹理特征值作为所述中心像素对应的纹理图像的像素值；

在所述拼接图像中以预设窗口进行滑动，得到每个像素点对应的纹理图像的像素值，直至得到所有像素点对应的纹理图像的像素值为止，以生成所述拼接纹理图像。

6.根据权利要求1所述的图像识别方法，其特征在于，所述方法还包括：

对多张样本图像进行光照处理，并对多张样本光照图像进行缩放拼接处理获取样本拼接纹理图像，并确定所述样本拼接纹理图像的标签；

将所述样本拼接纹理图像输入至一机器学习模型进行预测，得到预测标签，并以所述样本拼接纹理图像的所述标签为训练目标，对所述机器学习模型的参数进行调整，得到所述训练好的分类模型。

7.根据权利要求1所述的图像识别方法，其特征在于，所述根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景，包括：

若所述分类结果大于或等于分类阈值，则确定所述多张待处理图像属于相同场景；

若所述分类结果小分类阈值，则确定所述多张待处理图像属于不同场景。

8.一种图像识别装置，其特征在于，包括：

图像拼接模块，用于根据终端发送的图像获取多张待处理图像，对所述多张待处理图像对应的经过光照处理的光照图像进行缩放拼接处理得到拼接图像，并对所述拼接图像进行纹理特征提取，以将所述多张待处理图像转换为一张拼接纹理图像；

图像分类模块，用于通过训练好的分类模型对所述拼接纹理图像进行识别分类，得到用于表示所述拼接纹理图像对应的多张待处理图像的分类相似度的分类结果；

场景识别模块，用于根据所述分类结果对所述拼接纹理图像对应的多张待处理图像所属的场景进行识别，确定所述多张待处理图像是否属于相同场景，并将所述分类结果发送至终端进行显示。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1至7中任一项所述的图像识别方法。

10.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任意一项所述的图像识别方法。