CN112749576A

CN112749576A - 图像识别方法和装置、计算设备以及计算机存储介质

Info

Publication number: CN112749576A
Application number: CN202110254547.4A
Authority: CN
Inventors: 钟子宏
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-03-09
Filing date: 2021-03-09
Publication date: 2021-05-04
Anticipated expiration: 2041-03-09
Also published as: CN112749576B

Abstract

本申请描述了一种图像识别方法，可应用的场景包括但不限于支付、车联、驾驶、社交等场景。所述方法包括：获取目标图像对应的多个子图像，其中，所述多个子图像中的每一个是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据；确定所述多个子图像中每个子图像的特征信息；基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息；基于所述目标图像的图像特征信息识别所述目标图像。

Description

图像识别方法和装置、计算设备以及计算机存储介质

技术领域

本公开涉及图像处理的技术领域，尤其涉及图像识别方法和装置、计算设备以及计算机存储介质。

背景技术

随着计算机技术和移动互联网应用的不断发展，图像识别技术被广泛采用在各种领域，例如信息获取、对象识别、账号登录以及扫码支付等领域。作为示例，二维码图像被近些年来被广泛使用在支付领域，而对二维码图像的识别则典型地牵涉到图像识别技术。

在进行图像识别时，通常首先需要获取待识别的图像（例如，通过诸如移动终端这样的扫描设备进行扫描而获取）。然而，出于扫描技术或者扫描环境等因素的限制，可能需要对待识别的图像进行近距离扫描，然而这可能导致扫描设备的扫描区域无法完全覆盖待识别图像，进而导致无法完整准确地获取到待识别图像的图像特征信息，影响了对所述待识别图像的识别准确度，降低了用户体验。

发明内容

有鉴于此，本公开提供了图像识别方法和装置、计算设备以及计算机存储介质，期望克服上面提到的部分或全部缺陷以及其它可能的缺陷。

根据本公开的第一方面，提供了一种图像识别方法，包括：获取目标图像对应的多个子图像，其中，所述多个子图像中的每一个是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据；确定所述多个子图像中每个子图像的特征信息；基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息；基于所述目标图像的图像特征信息识别所述目标图像。

在一些实施例中，所述多个子图像具有相同大小的尺寸。

在一些实施例中，获取目标图像对应的多个子图像，包括：获取针对所述目标图像连续扫描得到的图像数据；对所述图像数据进行抽取，以得到与目标图像的各个区域对应的多个区域图像；对所述多个区域图像进行切分，以得到所述具有相同大小的尺寸的多个子图像。

在一些实施例中，所述确定所述多个子图像中每个子图像的特征信息，包括：基于所述多个子图像在所述目标图像中的位置信息确定所述多个子图像对应的卷积核权重矩阵；基于所述卷积核权重矩阵对所述多个子图像进行图像处理，以确定所述多个子图像中每个子图像的特征信息。

在一些实施例中，所述基于所述多个子图像在所述目标图像中的位置信息确定所述多个子图像对应的卷积核权重矩阵包括：基于所述多个子图像在所述目标图像中的位置信息，确定与所述多个子图像在目标图像中的位置坐标相关的坐标矩阵；采用二维高斯函数对所述坐标矩阵进行计算，得到所述多个子图像对应的卷积核权重矩阵。

在一些实施例中，所述基于所述卷积核权重矩阵对所述多个子图像进行图像处理，以确定所述多个子图像中每个子图像的特征信息，包括：针对所述多个子图像中的每个子图像，基于所述卷积核权重矩阵，对所述每个子图像进行平滑处理；对所述平滑处理后的每个子图像进行特征提取，以得到所述每个子图像的特征信息。

在一些实施例中，基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息，包括：基于所述多个子图像在所述目标图像中的位置信息，将所述多个子图像的特征信息进行特征拼接以得到所述目标图像对应的图像特征信息矩阵；基于所述图像特征信息矩阵构建去重卷积核矩阵，其中去重卷积核矩阵中的每个元素对应于相应位置的子图像，并且包括所述相应位置的子图像的特征信息中重复特征出现的比率；基于所述去重卷积核矩阵，对所述图像特征信息矩阵进行卷积处理，得到所述目标图像的图像特征信息。

在一些实施例中，所述比率包括所述相应位置的子图像的特征信息中出现的重复特征的个数与所述相应位置的子图像中的特征的个数之比，其中所述相应位置的子图像的特征信息中出现的重复特征的个数包括所述相应位置的子图像的特征信息与所述多个子图像中所述相应位置的子图像的相邻子图像的特征信息间重复的特征的个数。

在一些实施例中，所述目标图像包括二维码图像。

在一些实施例中，基于所述目标图像的图像特征信息识别所述目标图像，还包括：将所述图像特征信息输入扫码支付模块进行信息验证。

根据本公开的第二方面，提供了一种图像识别装置，包括：子图像获取模块，其被配置成获取目标图像对应的多个子图像，其中，所述多个子图像中的每一个是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据；特征信息确定模块，其被配置成确定所述多个子图像中每个子图像的特征信息；重复特征去除模块，其被配置成基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息；目标图像识别模块，其被配置成基于所述目标图像的图像特征信息识别所述目标图像。

根据本公开的第三方面，提供了一种计算设备，包括处理器；以及存储器，配置为在其上存储有计算机可执行指令，当计算机可执行指令被处理器执行时执行如上面所述的任意方法。

根据本公开的第四方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，当所述计算机可执行指令被执行时，执行如上面所述的任意方法。

在本公开要求保护的图像识别方法和装置中，通过首先获取目标图像对应的多个子图像，并且确定所述多个子图像的特征信息，然后对每个子图像的特征信息进行去重处理，从而确保能够得到完整、准确、不重复的图像特征信息，进而保证了对图像特征信息识别的准确性。由此，解决了现有技术中对扫描设备的扫描距离的限制，提升了图像的识别准确度以及提高了用户的体验度。

根据下文描述的实施例，本公开的这些和其它优点将变得清楚，并且参考下文描述的实施例来阐明本公开的这些和其它优点。

附图说明

现在将更详细并且参考附图来描述本公开的实施例，其中：

图1示出了根据本公开的实施例的技术方案可以实施在其中的示例性应用场景；

图2图示了根据本公开的一个实施例的一种图像识别方法的示意性流程图；

图3图示了根据本公开的一个实施例的确定子图像的特征信息的方法的示意性流程图；

图4图示了根据本公开的一个实施例的对多个子图像中的每个子图像的特征信息进行去重处理的方法的示意性流程图；

图5图示了根据本公开的一个实施例的对二维码图像进行识别的示意图；

图6图示了根据本公开的一个实施例的确定二维码子图像的特征信息的示意图；

图7图示了根据本公开的一个实施例的对二维码子图像的特征信息进行处理的示意图；

图8图示了根据本公开的一个实施例的对目标图像对应的图像特征信息矩阵进行去重处理的示意图；

图9以目标图像为二维码为例图示了对二维码图像进行图像识别的示例性流程图；

图10示出了根据本公开的一个实施例的用于图像识别装置的示例性结构框图；

图11图示了一个示例系统，其包括代表可以实现本文描述的各种技术的一个或多个系统和/或设备的示例计算设备。

具体实施方式

下面的描述提供了本公开的各种实施例的特定细节，以便本领域的技术人员能够充分理解和实施本公开的各种实施例。应当理解，本公开的技术方案可以在没有这些细节中的一些细节的情况下被实施。在某些情况下，本公开并没有示出或详细描述一些熟知的结构或功能，以避免这些不必要的描述使对本公开的实施例的描述模糊不清。在本公开中使用的术语应当以其最宽泛的合理方式来理解，即使其是结合本公开的特定实施例被使用的。

首先，对本申请实施例中涉及的部分用语进行说明，以便于本领域技术人员理解。

二维码：采用某种特定的几何图形按一定规律在平面（二维方向上）分布的、黑白相间的、记录数据符号信息的图形。二维码图像是指包括二维码图形的图像。

连续扫描：一种使用扫描设备对同一图像的各个区域基于一定顺序进行扫描的操作。该过程也可理解为针对图像进行连续录像。在所述图像为二维码图像的情况下，也可以称为连续扫码。

二维高斯函数：一种形如

的函数，σ是x、y的方差，当σ=1时，称该二维高斯函数为标准二维高斯函数，即

。

高斯卷积核：采用二维高斯函数将权重数据映射到高维空间形成的卷积核，利用其可以更加容易区分数据。

特征去重：将重复特征经过一系列运算（加、减、乘、除、卷积等）操作达到将重复特征平滑的方法。

特征拼接：将特征按照一定顺序运算，进行连接的操作。

卷积神经网络（Convolutional Neural Networks, CNN）是一类包含卷积计算且具有深度结构的前馈神经网络（Feedforward Neural Networks，FNN），是深度学习（deeplearning，DL）的代表算法之一。卷积神经网络由一个或多个卷积层和顶端的全连接层（对应经典的神经网络）组成，还包括关联权重和池化层。

人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。

在本申请提供的技术方案中，主要涉及计算机视觉技术。计算机视觉技术(Computer Vision, CV)是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。本申请提供的技术方案主要涉及图像处理和图像识别技术。

图1图示了根据本公开的实施例的技术方案可以实施在其中的示例性应用场景100。如图1所示，所示应用场景包括终端110、服务器120，所述终端110通过网络130与服务器120通信地耦合在一起。

作为示例，所述终端110例如可以作为扫描设备对目标图像进行扫描以得到针对目标图像的图像数据，并将所得到的图像数据通过网络130发送到服务器120。所述目标图像例如可以是常见的二维码图像。二维码又称二维条码，常见的二维码为QR Code（QuickResponse），是用某种特定的几何图形按一定规律在平面（二维方向上）分布的、记录数据符号信息的图形。

作为示例，服务器120例如可以基于所述图像数据获取目标图像对应的多个子图像，所述多个子图像中的每一个是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据。然后，服务器120可以确定所述多个子图像中每个子图像的特征信息，并且基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息。最后，服务器120可以基于所述目标图像的图像特征信息识别所述目标图像。

上面描述的场景仅仅是本公开的实施例可以被实施在其中的一个示例，并不是限制性的。例如，在一些实施例性场景中，也可能在终端110上可以实现对目标图像的识别过程。例如，所述终端110可以作为扫描设备对目标图像进行扫描以得到针对目标图像的图像数据并将所得到的图像数据保存到终端后台。终端110可以基于保存到后台的所述图像数据获取目标图像对应的多个子图像，所述多个子图像中的每一个是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据。然后，终端可以确定所述多个子图像中每个子图像的特征信息，并且基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息。最后，终端可以基于所述目标图像的图像特征信息识别所述目标图像。可选地，所述终端可以将识别到的目标图像的信息发送到服务器120，以供服务器处理或者进行信息验证等等。

应当指出，终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载设备等，但并不局限于此。服务器120可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。所述网络130例如可以是广域网（WAN）、局域网（LAN）、无线网络、公用电话网、内联网以及本领域的技术人员熟知的任何其它类型的网络。

图2图示了根据本公开的一个实施例的一种图像识别方法200的示意性流程图。所述图像识别方法例如可以由如图1所示的终端110或者服务器120实施。如图2所示，所述方法200包括如下步骤。

在步骤210，获取目标图像对应的多个子图像，其中所述多个子图像中的每一个子图像是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据。所述目标图像可以是任何类型的图像。特别地，所述目标图像可以是如上面所述的二维码图像。所述多个子图像中的每一个是所述目标图像的一部分可以直观理解为所述多个子图像中的每个子图像对应于所述目标图像中的特定位置处的一部分图像。所述多个子图像作为整体包括所述目标图像的全部图像数据可以被直观地理解为所述多个子图像可以完全拼接出所述目标图像。

在一些实施例中，所述多个子图像具有相同大小的尺寸，这可以减少后续图像处理的复杂度。在这种情况下，在获取目标图像对应的多个子图像时，可以首先获取针对所述目标图像连续扫描得到的图像数据；然后对所述图像数据进行抽取，以得到与目标图像的各个区域对应的多个区域图像；最后对所述多个区域图像进行切分，以得到所述具有相同大小的尺寸的多个子图像。

作为示例，对所述目标图像的连续扫描例如是由扫描设备执行的。所述扫描设备例如可以是任何合适的设备，例如，如上面所述的终端、摄像机、专业扫描终端等等，并且可以以任何合适的方式对所述目标图像进行连续扫描。这里的连续扫描可以理解为针对图像的连续拍摄或者录像的过程。以二维码图像为例，可以使用二维码扫描设备以从左到右、从上到下的移动方式对二维码进行连续扫描，这里也可以称为连续扫码。

在获取到扫描设备连续扫描得到的图像数据后，可以从所述图像数据中抽取与目标图像的各个区域对应的多个区域图像。以二维码图像为例，可以将二维码图像划分为多个相同大小的区域进行图像抽取，例如划分成9个（这不是限制性的，其它数目也是适用的）相同大小的区域。然后，从图像数据中抽取与这9个区域对应的区域图像，也即抽取到的区域图像包括这9个区域中的二维码信息的图像。

然后，对所述多个区域图像进行切分，以得到所述具有相同大小的尺寸的多个子图像。继续上面的二维码图像的例子，通过切分可以得到具有相同大小的尺寸的多个二维码子图像。图5图示了根据本公开的一个实施例的对二维码图像进行识别的直观示意图。如图5所示，扫描设备通过扫描设备的扫描窗口510对二维码图像520进行从左到右、从上到下的连续扫描得到图像数据，从图可见所述扫码窗口510不能完全覆盖所述二维码图像510。然后，对所述图像数据进行抽取并对抽取得到的9个区域图像进行切分，可以得到如具有相同大小的尺寸的9个二维码子图像，如在530处示出的。所述9个二维码子图像中的每一个都是所述二维码图像的一部分，并且所述9个二维码子图像作为整体包括所述二维码图像的全部图像数据。

在步骤220，确定所述多个子图像中每个子图像的特征信息。作为示例，可以采用常用的卷积神经网络分别对所述多个子图像进行图像处理，以提取出所述每个子图像的特征信息。一个基本的卷积神经网络通常包括输入层、卷积层、池化层、全连接层、输出层，其中，卷积层用于对输入的图像数据（各个子图像）进行特征提取，其内部包含多个卷积核，组成卷积核的每个元素都对应一个权重系数。权重系数可以根据需要进行设定或者训练。在卷积层中包含激励函数，在实施时可以采用线性整流函数、Sigmoid函数和双曲正切函数等。池化层用于在卷积层进行特征提取后，获取卷积层输出的特征图进行特征选择和信息过滤。全连接层的作用则是对提取的特征进行非线性组合以得到输出。输出层用于输出全连接层得到的特征，即各个子图像的特征信息。

在步骤230，基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息。由于在获取多个子图像的过程中，由于划分精度的问题，不同的子图像、尤其是相邻的子图像间很容易存在特征重复的现象，从而影响对整体目标图像的识别效果。如图5中所示，所述9个二维码子图像存在特征重复的部分，这些重复的部分为在540处的虚线围成的部分。因此，在确定目标图像的图像特征信息时，有必要对所述多个子图像中的每个子图像的特征信息进行去重处理，以便得到所述目标图像的完整的图像特征信息，所述目标图像的完整的图像特征信息可以直观理解为550处所示出的完整二维码的特征信息。

基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，从而较好地衡量重复特征占整体特征的比例，能够在对重复特征起到较好的平滑作用的同时突出重复特征的重要性，从而提高目标图像的识别进度。

在步骤240，基于所述目标图像的图像特征信息识别所述目标图像。以所述目标图像为二维码图像为例，可以基于二维码图像的图像特征信息实现对所述二维码图像的识别。在一些实施例中，可以将所述图像特征信息输入扫码支付模块进行信息验证。若验证通过，则可调用银行或第三方支付通道完成款项支付，从而完成整个扫码过程。

考虑到在进行图像识别时，由于扫描设备对待识别的图像进行近距离扫描，可能导致扫描设备的扫描区域无法完全覆盖待识别图像，进而导致无法完整准确地获取到待识别图像的图像特征信息，影响了对所述待识别图像的识别准确度并且降低了用户体验，本公开的实施例在获取到目标图像对应的多个子图像后，对所述多个子图像中每个子图像进行图像处理以提取其中的特征信息，然后基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息，进而基于图像特征信息进行目标图像的识别。由此，解决了现有技术中对扫描设备的扫描距离的限制，提升了图像的识别准确度以及提高了用户的体验度。

图3图示了根据本公开的一个实施例的确定参照图2描述的所述多个子图像中每个子图像的特征信息的方法300的示意性流程图。如图3所示，所述方法包括步骤310-320。

在步骤310，基于所述多个子图像在所述目标图像中的位置信息确定所述多个子图像对应的卷积核权重矩阵。所述多个子图像在所述目标图像中的位置信息可以有效表征所述多个子图像在原图像中的位置或者区域。利用多个子图像在所述目标图像中的位置信息构建卷积核权重矩阵，可以有效地通过卷积核权重矩阵反映子图像在目标图像中的位置信息，从而有利于确保后续特征提取时图像信息的完整性和图像特征信息中位置信息的正确性。可以以任何合适的方式来基于所述多个子图像在所述目标图像中的位置信息构建或确定所述卷积核权重矩阵，这里不做具体限定。

在一些实施例中，可以首先基于所述多个子图像在所述目标图像中的位置信息，确定与所述多个子图像在目标图像中的位置坐标相关的坐标矩阵，然后采用二维高斯函数对所述坐标矩阵进行计算，得到所述多个子图像对应的卷积核权重矩阵。

以上面所述的9个二维码子图像为例，可以采用左（-1）、中（0）、右（1）；上（-1）、中（0）、下（1）表示二维码子图像在二维码图像中的位置。因此，各二维码子图像在二维码图像中的位置信息分别为：左上（-1，-1）、中上（0，-1）、右上（1，-1）；左中（-1，0）、中中（0，0）、右中（1，0）；左下（-1，1）、中下（0，1）、右下（1，1），由此可以确定与所述多个子图像在目标图像中的位置坐标相关的坐标矩阵为如下：

（-1，-1）	（0，-1）	（1，-1）
			（-1,0）	（0,0）	（1,0）
（-1,1）	（0,1）	（1,1）

接着，可以采用采用二维高斯函数对所述坐标矩阵进行计算，得到多个二维码子图像对应的卷积核权重矩阵。

具体地，二维高斯函数可以表示如下公式（1）：

　　　　　公式（1）

采用公式（1）所示的二维高斯函数对所述坐标矩阵进行计算（即二维坐标中的第一个坐标值作为x值，第二个坐标值作为y值进行计算），可以得到如下的卷积核权重矩阵：

0.07511	0.12384	0.07511
			0.12384	0.20418	0.12384
0.07511	0.12384	0.07511

从上述卷积核权重矩阵可见，多个二维码子图像对应的卷积核权重矩阵的权重之和为1。

在步骤320，基于所述卷积核权重矩阵对所述多个子图像进行图像处理，以确定所述多个子图像中每个子图像的特征信息。作为示例，可以使用如上面所述的卷积神经网络结合所述卷积核权重矩阵对所述多个子图像进行图像处理，以确定所述多个子图像中每个子图像的特征信息，当然这不是限制性的。

在一些实施例中，可以首先针对所述多个子图像中的每个子图像，基于所述卷积核权重矩阵，对所述每个子图像进行平滑处理；然后，对所述平滑处理后的每个子图像进行特征提取，以得到所述每个子图像的特征信息。

作为示例，为了处理和描述方便，可以对所述多个子图像进行编号，当然编号的步骤不是必须的，而且编号的方式也不是限制性的。以上面的二维码图像为例，可以基于预设方式对多个二维码子图像进行编号。具体地，在编号时，可以采用与连续扫描的方式相同的顺序进行，如从左到右、从上到下的顺序。如图6所示，假设二维码图像如上所述被切分为9个二维码子图像时，可以按照图像1表示左上位置的二维码子图像、图像2表示中上位置的二维码子图像、图像3表示右上位置的二维码子图像、图像4表示左中位置的二维码子图像、图像5表示中中位置的二维码子图像、图像6表示右中位置的二维码子图像、图像7表示左下位置的二维码子图像、图像8表示中下位置的二维码子图像、图像9表示右下位置的二维码子图像等来对所述多个二维码子图像进行编号。不同的编号表征二维码子图像所在二维码图像中的不同位置。

接着，可以基于所述卷积核权重矩阵对所述各个带编号的子图像进行卷积计算，以便实现对每个子图像的平滑处理。所述卷积核权重矩阵例如可以是上面所述的二维高斯卷积核权重矩阵这不是限制性的。如上面所述，这可以在确保不丢失特征信息的情况下，有效平滑特征信息。

然后，对所述平滑处理后的每个子图像进行特征提取，以得到所述每个子图像的特征信息。在对各个子图像进行编号后，可以采用卷积神经网络对平滑处理后的各子图像进行卷积操作，从中提取各个子图像对应的特征信息。如图6所示，以二维码图像为例，图像1特征为二维码图像中左上位置的二维码子图像（即图像1）对应的特征信息......图像5特征为二维码图像中中位置的二维码子图像对应的特征信息......图像9特征为二维码图像中右下位置的二维码子图像对应的特征信息。

在本公开的实施例中，采用多个子图像在目标图像中的位置信息构建与所述多个子图像在目标图像中的位置坐标相关的坐标矩阵，可以有效通过坐标矩阵反映各个子图像在目标图像中的位置信息，确保图像信息的完整性和图像特征信息中位置信息的正确性。采用二维高斯函数作用于坐标矩阵，得到卷积核权重矩阵，进而在后续采用卷积神经网络对各个子图像进行特征提取时，可以在确保不丢失特征信息的情况下，有效平滑特征信息。

图4图示了根据本公开的一个实施例的对参照图2描述的所述多个子图像中的每个子图像的特征信息进行去重处理的方法400的示意性流程图。如图4所示，所述方法包括步骤410-430。

在步骤410中，基于所述多个子图像在所述目标图像中的位置信息，将所述多个子图像的特征信息进行特征拼接以得到所述目标图像对应的图像特征信息矩阵。以上面的二维码图像为例，可以按照所述编号（其表示各个二维码子图像的位置信息）按序将所述多个二维码子图像的特征信息进行特征拼接，以得到所述二维码图像对应的图像特征信息矩阵。

作为示例，图7图示了根据本公开的一个实施例的对二维码子图像的特征信息进行处理的示意图。如图7所示，可以分三组进行特征信息的特征拼接。第一组为图像1对应的特征信息、图像2对应的特征信息、图3对应的特征信息进行特征拼接，从而得到拼接后的特征R1；第二组为图像4对应的特征信息、图像5对应的特征信息、图像6对应的特征信息进行拼接，从而得到拼接后的特征信息R2；第三组为图像7对应的特征信息、图像8对应的特征信息、图像9对应的特征信息进行拼接，从而得到拼接后的特征信息R3。

在进行上述三组的特征信息拼接后，再基于从上到下的顺序进行拼接，可以得到完整的二维码图像对应的图像特征信息矩阵RR。当然，这样的分组拼接方式并不是必需的，可以不进行分组拼接，也可以以其他分组的方式进行拼接。

在步骤420，基于所述图像特征信息矩阵构建去重卷积核矩阵，其中卷积核矩阵中的每个元素对应于相应位置的子图像，并且包括所述相应位置的子图像的特征信息中重复特征出现的比率。也就是，所述去重卷积核矩阵中的元素与相应位置的子图像一一对应。

重复特征出现的比率可以以任何合适的方式被确定。在一些实施例中，所述比率可以被确定为包括所述相应位置的子图像的特征信息中出现的重复特征的个数与所述相应位置的子图像中的特征的个数之比，其中所述相应位置的子图像的特征信息中出现的重复特征的个数包括所述相应位置的子图像的特征信息与所述多个子图像中所述相应位置的子图像的相邻子图像的特征信息间重复的特征的个数。

作为示例，假设所述多个子图像的中的每个子图像的特征信息为3行3列的特征矩阵，这可以在确定每个子图像的特征信息时被预先确定，例如可以通过调节用于提取特征信息的卷积神经网络的网络结构或参数而确定。当然，特征矩阵的大小这里近似作为示例，而不是限制性的。因此，在步骤410拼接得到的所述目标图像对应的图像特征信息矩阵RR为9行9列的图像特征信息矩阵，如图8中的810所示。

在这种情况下，去重卷积核矩阵可以被构建为3行3列卷积核矩阵，如下所示：

其中，

表示第i个子图像的特征信息中重复特征出现的比率，

第i个子图像的特征信息中出现重复特征的个数，由于每个子图像的特征信息为3行3列的特征矩阵，因此，每个特征矩阵中有9个特征值，即

。

假设图像1、图像2、图像4对应的特征信息分别为如下所示：

2	1	5
			4	10	0
3	2	6

图像1；

5	7	12
			0	9	8
6	1	1

图像2；

3	2	6
			1	10	0
6	2	8

图像4。

基于图像1、图像2、图像4对应的特征信息，可以确定图像1的特征信息中出现的重复特征为（3，2，6，0，5），因此图像1的特征信息中出现的重复特征的个数

为5，从而可以确定

=5/9。

在步骤430，基于所述去重卷积核矩阵，对所述图像特征信息矩阵进行卷积处理，得到所述目标图像的图像特征信息。这里可以以任何合适的方式对所述图像特征信息矩阵进行卷积处理，以得到所述目标图像的图像特征信息，这不是限制性的。

作为示例，可以将所述去重卷积核矩阵与所述图像特征信息矩阵每个子图像对应的特征信息进行卷积，以得到所述目标图像的图像特征信息。以上面所述二维码图像为例，如图8所示，将构建的3行3列的去重卷积核矩阵820分别与图像1-9的特征信息（也即9行9列的图像特征信息矩阵，其中每个子图像的特征信息为3行3列的特征矩阵）810进行卷积（即这里的卷积步长为3），以得到二维码图像对应的图像特征信息830。

在本公开的实施例中，提供了一种高效准确的去重方法，其可以基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，从而得到目标图像的图像特征信息，使得所得到的图像特征信息能够较好地衡量重复特征占整体特征的比例，在对重复特征起到较好的平滑作用的同时突出重复特征的重要性。

图9以目标图像为二维码为例图示了对二维码图像进行图像识别的示例性流程图，这可以被视为参照图2描述的图像识别方法的一个具体示例。

在步骤910，使用二维码扫码设备以从左到右、从上到下的移动方式对二维码进行连续扫码，并将扫码得到的二维码图像数据存储在后台。在步骤920，从后台存储的所述二维码图像数据中抽取与二维码的各个区域对应的多个区域图像，并对所述多个区域图像进行切分，以获取到所述多个二维码子图像，例如得到如上面所述的具有相同尺寸的9个二维码子图像，这例如与参照图2描述的步骤210的实施方式是基本相同的。

接着，在步骤930，可以对所述多个二维码子图像进行图像处理。例如，首先可以基于所述多个二维码子图像在所述完整二维码图像中的位置信息，确定与所述多个二维码子图像在二维码图像中的位置坐标相关的坐标矩阵；然后，采用二维高斯函数对所述坐标矩阵进行计算，得到所述多个二维码子图像对应的卷积核权重矩阵。然后，针对所述多个二维码子图像中的每个二维码子图像，利用所述卷积核权重矩阵对所述每个二维码子图像进行平滑处理，并且例如利用卷积神经网络对所述平滑处理后的每个二维码子图像进行特征提取，以得到所述每个二维码子图像的特征信息，这例如与参照图2描述的步骤220以及参照图3描述的方法300的实施方式是基本相同的。

在步骤940，可以基于所述多个二维码子图像子图像在所二维码图像中的位置，按序将所述多个二维码子图像的特征信息进行特征拼接以得到所述目标图像对应的图像特征信息矩阵，如上面810所示的。在步骤950，可以基于所述图像特征信息矩阵构建去重卷积核矩阵，其中去重卷积核矩阵中的每个元素对应于相应位置的二维码子图像，并且包括所述对应的二维码子图像的特征信息中重复特征出现的比率；然后，基于所述去重卷积核矩阵，对所述图像特征信息矩阵进行卷积处理，得到所述二维码图像的图像特征信息。这例如与参照图2描述的步骤230以及参照图4描述的方法400的实施方式是基本相同的。

最后，在步骤960，可以基于所述二维码图像的图像特征信息识别所述二维码图像。在一些实施例中，可以将所述图像特征信息输入扫码支付模块进行信息验证。若验证通过，则可调用银行或第三方支付通道完成款项支付，从而完成整个扫码和识别过程。这例如与参照图2描述的步骤240的实施方式是基本相同的。

图10示出了根据本公开的一个实施例的用于图像识别装置1000的示例性结构框图。如图10所示，所述装置1000包括子图像获取模块1010、特征信息确定模块1020、重复特征去除模块1030、目标图像识别模块1040。

子图像获取模块1010被配置成获取目标图像对应的多个子图像，其中，所述多个子图像中的每一个是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据。所述目标图像可以是任何类型的图像。特别地，所述目标图像可以是如上面所述的二维码图像。

在一些实施例中，所述多个子图像具有相同大小的尺寸，这可以减少后续图像处理的复杂度。在这种情况下，子图像获取模块1010被配置成获取针对所述目标图像连续扫描得到的图像数据；对所述图像数据进行抽取，以得到与目标图像的各个区域对应的多个区域图像；对所述多个区域图像进行切分，以得到所述具有相同大小的尺寸的多个子图像。

特征信息确定模块1020被配置成确定所述多个子图像中每个子图像的特征信息。作为示例，可以采用常用的卷积神经网络分别对所述多个子图像进行图像处理，以提取出所述每个子图像的特征信息。

重复特征去除模块1030被配置成基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息。基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，从而较好地衡量重复特征占整体特征的比例，能够在对重复特征起到较好的平滑作用的同时突出重复特征的重要性，从而提高目标图像的识别进度。

目标图像识别模块1040被配置成基于所述目标图像的图像特征信息识别所述目标图像。在一些实施例中，目标图像识别模块1040还可以被配置成将所述图像特征信息输入扫码支付模块进行信息验证。若验证通过，则可调用银行或第三方支付通道完成款项支付，从而完成整个扫码过程。

图11图示了示例系统1100，其包括代表可以实现本文描述的各种技术的一个或多个系统和/或设备的示例计算设备1110。计算设备1110可以是例如服务提供商的服务器、与服务器相关联的设备、片上系统、和/或任何其它合适的计算设备或计算系统。上面参照图10描述的图像识别装置1000可以采取计算设备1110的形式。替换地，图像识别装置1000可以以应用1116的形式被实现为计算机程序。

如图示的示例计算设备1110包括彼此通信耦合的处理系统1111、一个或多个计算机可读介质1112以及一个或多个I/O接口1113。尽管未示出，但是计算设备1110还可以包括系统总线或其他数据和命令传送系统，其将各种组件彼此耦合。系统总线可以包括不同总线结构的任何一个或组合，所述总线结构诸如存储器总线或存储器控制器、外围总线、通用串行总线、和/或利用各种总线架构中的任何一种的处理器或局部总线。还构思了各种其他示例，诸如控制和数据线。

处理系统1111代表使用硬件执行一个或多个操作的功能。因此，处理系统1111被图示为包括可被配置为处理器、功能块等的硬件元件1114。这可以包括在硬件中实现为专用集成电路或使用一个或多个半导体形成的其它逻辑器件。硬件元件1114不受其形成的材料或其中采用的处理机构的限制。例如，处理器可以由（多个）半导体和/或晶体管（例如，电子集成电路（IC））组成。在这样的上下文中，处理器可执行指令可以是电子可执行指令。

计算机可读介质1112被图示为包括存储器/存储装置1115。存储器/存储装置1115表示与一个或多个计算机可读介质相关联的存储器/存储容量。存储器/存储装置1115可以包括易失性介质（诸如随机存取存储器（RAM））和/或非易失性介质（诸如只读存储器（ROM）、闪存、光盘、磁盘等）。存储器/存储装置1115可以包括固定介质（例如，RAM、ROM、固定硬盘驱动器等）以及可移动介质（例如，闪存、可移动硬盘驱动器、光盘等）。计算机可读介质1112可以以下面进一步描述的各种其他方式进行配置。

一个或多个I/O接口1113代表允许用户使用各种输入设备向计算设备1110输入命令和信息并且可选地还允许使用各种输出设备将信息呈现给用户和/或其他组件或设备的功能。输入设备的示例包括键盘、光标控制设备（例如，鼠标）、麦克风（例如，用于语音输入）、扫描仪、触摸功能（例如，被配置为检测物理触摸的容性或其他传感器）、相机（例如，可以采用可见或不可见的波长（诸如红外频率）将不涉及触摸的运动检测为手势）等等。输出设备的示例包括显示设备（例如，监视器或投影仪）、扬声器、打印机、网卡、触觉响应设备等。因此，计算设备1110可以以下面进一步描述的各种方式进行配置以支持用户交互。

计算设备1110还包括应用1116。应用1116可以例如是图像识别装置1000的软件实例，并且与计算设备1110中的其他元件相组合地实现本文描述的技术。

本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。一般地，这些模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元素、组件、数据结构等。本文所使用的术语“模块”，“功能”和“组件”一般表示软件、固件、硬件或其组合。本文描述的技术的特征是与平台无关的，意味着这些技术可以在具有各种处理器的各种计算平台上实现。

所描述的模块和技术的实现可以存储在某种形式的计算机可读介质上或者跨某种形式的计算机可读介质传输。计算机可读介质可以包括可由计算设备1110访问的各种介质。作为示例而非限制，计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。

与单纯的信号传输、载波或信号本身相反，“计算机可读存储介质”是指能够持久存储信息的介质和/或设备，和/或有形的存储装置。因此，计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或以适用于存储信息（诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据）的方法或技术实现的存储设备之类的硬件。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字通用盘（DVD）或其他光学存储装置、硬盘、盒式磁带、磁带，磁盘存储装置或其他磁存储设备，或其他存储设备、有形介质或适于存储期望信息并可以由计算机访问的制品。

“计算机可读信号介质”是指被配置为诸如经由网络将指令发送到计算设备1110的硬件的信号承载介质。信号介质典型地可以将计算机可读指令、数据结构、程序模块或其他数据体现在诸如载波、数据信号或其它传输机制的调制数据信号中。信号介质还包括任何信息传递介质。术语“调制数据信号”是指这样的信号，该信号的特征中的一个或多个被设置或改变，从而将信息编码到该信号中。作为示例而非限制，通信介质包括诸如有线网络或直接连线的有线介质以及诸如声、RF、红外和其它无线介质的无线介质。

如前所述，硬件元件1114和计算机可读介质1112代表以硬件形式实现的指令、模块、可编程器件逻辑和/或固定器件逻辑，其在一些实施例中可以用于实现本文描述的技术的至少一些方面。硬件元件可以包括集成电路或片上系统、专用集成电路（ASIC）、现场可编程门阵列（FPGA）、复杂可编程逻辑器件（CPLD）以及硅中的其它实现或其他硬件设备的组件。在这种上下文中，硬件元件可以作为执行由硬件元件所体现的指令、模块和/或逻辑所定义的程序任务的处理设备，以及用于存储用于执行的指令的硬件设备，例如，先前描述的计算机可读存储介质。

前述的组合也可以用于实现本文所述的各种技术和模块。因此，可以将软件、硬件或程序模块和其它程序模块实现为在某种形式的计算机可读存储介质上和/或由一个或多个硬件元件1114体现的一个或多个指令和/或逻辑。计算设备1110可以被配置为实现与软件和/或硬件模块相对应的特定指令和/或功能。因此，例如通过使用处理系统的计算机可读存储介质和/或硬件元件1114，可以至少部分地以硬件来实现将模块实现为可由计算设备1110作为软件执行的模块。指令和/或功能可以由一个或多个制品（例如，一个或多个计算设备1110和/或处理系统1111）可执行/可操作以实现本文所述的技术、模块和示例。

在各种实施方式中，计算设备1110可以采用各种不同的配置。例如，计算设备1110可以被实现为包括个人计算机、台式计算机、多屏幕计算机、膝上型计算机、上网本等的计算机类设备。计算设备1110还可以被实现为包括诸如移动电话、便携式音乐播放器、便携式游戏设备、平板计算机、多屏幕计算机等移动设备的移动装置类设备。计算设备1110还可以实现为电视类设备，其包括具有或连接到休闲观看环境中的一般地较大屏幕的设备。这些设备包括电视、机顶盒、游戏机等。

本文描述的技术可以由计算设备1110的这些各种配置来支持，并且不限于本文所描述的技术的具体示例。功能还可以通过使用分布式系统、诸如通过如下所述的平台1122而在“云”1120上全部或部分地实现。

云1120包括和/或代表用于资源1124的平台1122。平台1122抽象云1120的硬件（例如，服务器）和软件资源的底层功能。资源1124可以包括在远离计算设备1110的服务器上执行计算机处理时可以使用的应用和/或数据。资源1124还可以包括通过因特网和/或通过诸如蜂窝或Wi-Fi网络的订户网络提供的服务。

平台1122可以抽象资源和功能以将计算设备1110与其他计算设备连接。平台1122还可以用于抽象资源的分级以提供遇到的对于经由平台1122实现的资源1124的需求的相应水平的分级。因此，在互连设备实施例中，本文描述的功能的实现可以分布在整个系统1100内。例如，功能可以部分地在计算设备1110上以及通过抽象云1120的功能的平台1122来实现。

应当理解，为清楚起见，参考不同的功能单元对本公开的实施例进行了描述。然而，将明显的是，在不偏离本公开的情况下，每个功能单元的功能性可以被实施在单个单元中、实施在多个单元中或作为其它功能单元的一部分被实施。例如，被说明成由单个单元执行的功能性可以由多个不同的单元来执行。因此，对特定功能单元的参考仅被视为对用于提供所描述的功能性的适当单元的参考，而不是表明严格的逻辑或物理结构或组织。因此，本公开可以被实施在单个单元中，或者可以在物理上和功能上被分布在不同的单元和电路之间。

将理解的是，尽管第一、第二、第三等术语在本文中可以用来描述各种设备、元件、部件或部分，但是这些设备、元件、部件或部分不应当由这些术语限制。这些术语仅用来将一个设备、元件、部件或部分与另一个设备、元件、部件或部分相区分。

尽管已经结合一些实施例描述了本公开，但是其不旨在被限于在本文中所阐述的特定形式。相反，本公开的范围仅由所附权利要求来限制。附加地，尽管单独的特征可以被包括在不同的权利要求中，但是这些可以可能地被有利地组合，并且包括在不同权利要求中不暗示特征的组合不是可行的和/或有利的。特征在权利要求中的次序不暗示特征必须以其工作的任何特定次序。此外，在权利要求中，词“包括”不排除其它元件，并且术语“一”或“一个”不排除多个。权利要求中的附图标记仅作为明确的例子被提供，不应该被解释为以任何方式限制权利要求的范围。

Claims

1.一种图像识别方法，包括：

获取目标图像对应的多个子图像，其中，所述多个子图像中的每一个是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据；

确定所述多个子图像中每个子图像的特征信息；

基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息；

基于所述目标图像的图像特征信息识别所述目标图像。

2.根据权利要求1所述的方法，其中，所述多个子图像具有相同大小的尺寸。

3.根据权利要求2所述的方法，其中，获取目标图像对应的多个子图像，包括：

获取针对所述目标图像连续扫描得到的图像数据；

对所述图像数据进行抽取，以得到与目标图像的各个区域对应的多个区域图像；

对所述多个区域图像进行切分，以得到所述具有相同大小的尺寸的多个子图像。

4.根据权利要求1所述的方法，其中，所述确定所述多个子图像中每个子图像的特征信息，包括：

基于所述多个子图像在所述目标图像中的位置信息确定所述多个子图像对应的卷积核权重矩阵；

基于所述卷积核权重矩阵对所述多个子图像进行图像处理，以确定所述多个子图像中每个子图像的特征信息。

5.根据权利要求4所述的方法，其中，所述基于所述多个子图像在所述目标图像中的位置信息确定所述多个子图像对应的卷积核权重矩阵包括：

基于所述多个子图像在所述目标图像中的位置信息，确定与所述多个子图像在目标图像中的位置坐标相关的坐标矩阵；

采用二维高斯函数对所述坐标矩阵进行计算，得到所述多个子图像对应的卷积核权重矩阵。

6.根据权利要求4所述的方法，其中，所述基于所述卷积核权重矩阵对所述多个子图像进行图像处理，以确定所述多个子图像中每个子图像的特征信息，包括：

针对所述多个子图像中的每个子图像，基于所述卷积核权重矩阵，对所述每个子图像进行平滑处理；

对所述平滑处理后的每个子图像进行特征提取，以得到所述每个子图像的特征信息。

7.根据权利要求1所述的方法，其中，基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息，包括：

基于所述多个子图像在所述目标图像中的位置信息，将所述多个子图像的特征信息进行特征拼接以得到所述目标图像对应的图像特征信息矩阵；

基于所述图像特征信息矩阵构建去重卷积核矩阵，其中去重卷积核矩阵中的每个元素对应于相应位置的子图像，并且包括所述相应位置的子图像的特征信息中重复特征出现的比率；

基于所述去重卷积核矩阵，对所述图像特征信息矩阵进行卷积处理，得到所述目标图像的图像特征信息。

8.根据权利要求7所述的方法，其中，所述比率包括所述相应位置的子图像的特征信息中出现的重复特征的个数与所述相应位置的子图像中的特征的个数之比，其中所述相应位置的子图像的特征信息中出现的重复特征的个数包括所述相应位置的子图像的特征信息与所述多个子图像中所述相应位置的子图像的相邻子图像的特征信息间重复的特征的个数。

9.根据权利要求1所述的方法，其中，所述目标图像包括二维码图像。

10.根据权利要求9所述的方法，其中，基于所述目标图像的图像特征信息识别所述目标图像，还包括：

将所述图像特征信息输入扫码支付模块进行信息验证。

11.一种图像识别装置，包括：

子图像获取模块，其被配置成获取目标图像对应的多个子图像，其中，所述多个子图像中的每一个是所述目标图像的一部分，并且所述多个子图像作为整体包括所述目标图像的全部图像数据；

特征信息确定模块，其被配置成确定所述多个子图像中每个子图像的特征信息；

重复特征去除模块，其被配置成基于在所述多个子图像的特征信息中出现的重复特征，对所述多个子图像中的每个子图像的特征信息进行去重处理，以得到所述目标图像的图像特征信息；

目标图像识别模块，其被配置成基于所述目标图像的图像特征信息识别所述目标图像。

12.根据权利要求11所述的装置，其中，其中，所述多个子图像具有相同大小的尺寸。

13.根据权利要求2所述的装置，其中，所述子图像获取模块被进一步配置成：

获取针对所述目标图像连续扫描得到的图像数据；

14.一种计算设备，包括

存储器，其被配置成存储计算机可执行指令；

处理器，其被配置成当所述计算机可执行指令被处理器执行时执行如权利要求1-10中的任一项所述的方法。

15.一种计算机可读存储介质，其存储有计算机可执行指令，当所述计算机可执行指令被执行时，执行如权利要求1-10中的任一项所述的方法。