CN113516486A

CN113516486A - 图像识别方法、装置、设备和存储介质

Info

Publication number: CN113516486A
Application number: CN202110374184.8A
Authority: CN
Inventors: 李晨阳; 罗斌; 刘伟; 汪彪
Original assignee: Alibaba Singapore Holdings Pte Ltd
Current assignee: Alibaba Innovation Co
Priority date: 2021-04-07
Filing date: 2021-04-07
Publication date: 2021-10-19

Abstract

本发明实施例提供一种图像识别方法、装置、设备和存储介质，该方法包括：获取包含目标对象的图像，确定图像中的特征区域，特征区域对应于目标第一特征类别。将特征区域输入到与目标第一特征类别对应的分类模型中，以通过分类模型输出特征区域对应的第二特征类别，第二特征类别是目标第一特征类别的子类别。根据第二特征类别和目标对象对应的参考特征信息，确定目标对象的真伪。当需要对比如酒瓶等物体进行真伪等质量检测时，使用本方案，可以高效、准确地实现对该酒瓶进行真伪等质量检测。

Description

图像识别方法、装置、设备和存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种图像识别方法、装置、设备和存储介质。

背景技术

物品真伪鉴别是日常生活中经常面对的问题。传统的鉴别方式多是采用人工的方式。需要鉴别的物品上一般会设置有一种或多种特征，有经验的鉴定人员通过鉴别这些特征实现对该物品的真伪鉴别。

人工鉴别的方式，需鉴定人员的专业素养要求很高，费时费力，准确度依赖于个人经验。

发明内容

本发明实施例提供一种图像识别方法、装置、设备和存储介质，可以方便、准确地完成目标对象的真伪鉴别。

第一方面，本发明实施例提供一种图像识别方法，该方法包括：

获取包含目标对象的图像；

确定所述图像中的特征区域，所述特征区域对应于目标第一特征类别；

将所述特征区域输入到与所述目标第一特征类别对应的分类模型中，以通过所述分类模型输出所述特征区域对应的第二特征类别，所述第二特征类别是所述目标第一特征类别的子类别；

根据所述第二特征类别和所述目标对象对应的参考特征信息，确定所述目标对象的真伪。

第二方面，本发明实施例提供一种图像识别装置，该装置包括：

获取模块，用于获取包含目标对象的图像；

识别模块，用于确定所述图像中的特征区域，所述特征区域对应于目标第一特征类别；以及，将所述特征区域输入到与所述目标第一特征类别对应的分类模型中，以通过所述分类模型输出所述特征区域对应的第二特征类别，所述第二特征类别是所述目标第一特征类别的子类别；

鉴别模块，用于根据所述第二特征类别和所述目标对象对应的参考特征信息，确定所述目标对象的真伪。

第三方面，本发明实施例提供一种电子设备，包括：存储器、处理器；其中，所述存储器上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器至少可以实现如第一方面所述的图像识别方法。

第四方面，本发明实施例提供了一种非暂时性机器可读存储介质，所述非暂时性机器可读存储介质上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器至少可以实现如第一方面所述的图像识别方法。

第五方面，本发明实施例提供一种图像识别方法，该方法包括：

接收用户设备调用目标服务接口的请求；

利用所述目标服务接口对应的处理资源执行如下步骤：

获取包含目标对象的图像；

根据所述第二特征类别和所述目标对象对应的参考特征信息，确定所述目标对象的真伪；

向所述用户设备反馈所述目标对象的真伪确定结果。

第六方面，本发明实施例提供一种图像识别方法，该方法包括：

获取立体容器对应的图像；

确定所述图像中的特征区域，其中，所述特征区域对应于第一特征类别；

确定与所述特征区域对应的第二特征类别，所述第二特征类别是所述第一特征类别的子类别；

根据所述第二特征类别和所述立体容器对应的参考特征信息，确定所述立体容器的质量判断结果；

展现所述质量判断结果。

可选地，所述确定所述图像中的特征区域后，还包括：展现所述图像中的特征区域。

可选地，所述确定与所述特征区域对应的第二特征类别后，还包括：展现与所述特征区域对应的第二特征类别。

可选地，所述获取立体容器对应的图像包括：获取通过计算设备拍摄所述立体容器得到的所述图像。

可选地，所述方法还包括：

在计算设备上显示立体容器识别的操作界面；

在所述操作界面上显示图像获取按钮，其中，用户通过所述图像获取按钮控制所述计算设备的拍摄功能；

在所述操作界面上显示第一特征类别输出组件、第二特征类别输出组件，其中，所述第一特征类别输出组件、所述第二特征类别输出组件分别用于展现所述第一特征类别和所述第二特征类别；

在所述操作界面上显示质量结果输出组件，其中，所述质量结果输出组件用于展现所述立体容器的质量判断结果。

在上述本发明实施例提供的图像识别方案中，将需要识别真伪的目标对象的特征组织为两种维度：大类特征和小类特征，某一大类特征下可以包括一种或多种小类特征。比如，年份这个大类特征下可以包括多种具体的年度(小类特征)。另外，将目标对象的真实的各种小类特征信息注册为参考特征信息，以提供出真伪鉴别的比较标准。

当需要识别目标对象的真伪时，对目标对象进行拍照得到包含目标对象的图像，之后，首先提取出图像中对应于目标第一特征类别(一种大类特征)的特征区域，再将该特征区域输入到与目标第一特征类别对应的分类模型中，以通过分类模型输出该特征区域对应的第二特征类别(小类特征)，第二特征类别是目标第一特征类别的子类别。之后，将识别出的第二特征类别与目标对象对应的参考特征信息进行比对，以确定目标对象的真伪。通过该方案，可以实现对目标对象真伪的高效、准确鉴别。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种图像识别方法的流程图；

图2为本发明实施例提供的一种图像识别场景的示意图；

图3为本发明实施例提供的另一种图像识别方法的流程图；

图4为本发明实施例提供的另一种图像识别场景的示意图；

图5为本发明实施例提供的一种模型训练方法的流程图；

图6为本发明实施例提供的一种模型训练原理的示意图；

图7为本发明实施例提供的一种图像识别方法的应用示意图；

图8a为本发明实施例提供的另一种图像识别方法的流程图；

图8b为本发明实施例提供的一种立体容器识别的操作界面的示意图；

图9为本发明实施例提供的一种图像识别装置的结构示意图；

图10为与图9所示实施例提供的图像识别装置对应的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义，“多种”一般包含至少两种。

取决于语境，如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

另外，下述各方法实施例中的步骤时序仅为一种举例，而非严格限定。

本发明实施例提供的图像识别方法可以由一电子设备来执行，该电子设备可以是诸如PC机、笔记本电脑、智能手机等终端设备，也可以是服务器。该服务器可以是包含一独立主机的物理服务器，或者也可以为虚拟服务器，或者也可以为云端的服务器或服务器集群。

图1为本发明实施例提供的一种图像识别方法的流程图，如图1所示，该方法可以包括如下步骤：

101、获取包含目标对象的图像。

102、确定图像中的特征区域，特征区域对应于目标第一特征类别。

103、将特征区域输入到与目标第一特征类别对应的分类模型中，以通过分类模型输出特征区域对应的第二特征类别，第二特征类别是目标第一特征类别的子类别。

104、根据第二特征类别和目标对象对应的参考特征信息，确定目标对象的真伪。

目标对象可以是任一种物体，为完成目标对象的真伪的鉴别，目标对象表面需要设有一种或多种用于防伪的特征，比如特定的图案、文字等。

比如，目标对象是某品牌的一种商品，商品外包装上的商标图案、文字，可以作为鉴别该商品真伪的特征。

实际应用中，为增加造假难度，一款商品可能会随着时间的变化而更新用于防伪的特征。比如：某商品，2018年生产的商品的外包装上以特定的字体样式写有2018年的字样，并且在外包装上还印有一个双眼睁开的猫头鹰的图案。在2020年对该商品的外包装进行了更新：在外包装上以另一种特定的字体样式写有2020年的字样，并且，外包装上印有一个左眼睁开右眼闭合的猫头鹰图案。

在上述举例的情形下，用户需要进行真伪鉴别的目标对象可能是2018年生产的，也可能是2020年生产的，为实现对这种目标对象的真伪鉴别，可以预先收集并存储目标对象对应的各种参考特征信息，比如上述举例中2018年和2020年的两款商品各自对应的用于防伪的各种特征信息。

本发明实施例中所说的目标对象对应的参考特征信息可以包括目标对象对应的多组特征信息，其中，每组特征信息对应于目标对象不同时期采用的防伪特征。比如，在上述举例中，目标对象是一种商品，这种商品对应的两组特征信息对应于这种商品在2018年和2020年分别开始采用的防伪特征。

另外，参考特征信息可以是以文字形式描述的防伪特征在视觉上所呈现的特点。比如，在上述举例中可以得到由如下两组特征信息构成的商品的参考特征信息：

[2018年，猫头鹰双眼睁开]，[2020年，猫头鹰左眼睁开右眼闭合]。

当然，可以理解的是，与一种防伪特征对应的特征信息中可以更佳详细地描述出这种防伪特征在视觉上呈现的特点，上述两组特征信息仅为简单的举例。比如，实际上，对应于“2018年”这个防伪特征，除了2018年这个文字内容外，还可以描述出文字的字体、大小、颜色、在商品外包装上的位置等其他视觉特点。

基于已经收集的目标对象的参考特征信息，便可以自动地对用户提供的目标对象进行真伪鉴别。

首先，对目标对象进行拍照，得到包含目标对象的图像，之后，对该图像进行特征的分类识别，以从图像中提取出该目标对象实际具有的各类特征，进而将提取到的各类特征与参考特征信息进行对比，以确定用户提供的目标对象的真伪。

本发明实施例中，对图像的特征分类识别过程经过两个阶段：粗定位阶段和精分类阶段。在粗定位阶段，定位出图像中的各个特征区域，再通过精分类阶段，对每个特征区域进行特征识别。这里的特征区域是指目标对象的防伪特征所在的区域，因此也可以称为防伪特征区域。

另外，需要说明的是，在本发明实施例中，在目标对象随时间的变化其防伪特征的视觉特点随之变化的情形下，对不同时间阶段采用的防伪特征采用了两级管理方式：第一级类别、第二级类别。

简单来说，第一级类别，相当于是对目标对象在不同时期采用的各种防伪特征按照属性维度进行了分组，每个分组对应于一种第一级类别。举例来说，比如上述举例中2018年和2020年分别生成的某种商品，在商品外包装上分别写有“2018年”和“2020年”的字样，这两种文字都对应于年份这个属性维度，所以可以设定“年份”这个第一级类别。同理，在不同年份生产的商品外包装上分别印有“双眼睁开的猫头鹰图案”和“左眼睁开右眼闭合的猫头鹰图案”，这两种图案都对应于猫头鹰图案这个属性维度，所以可以设定“猫头鹰图案”这个第一级类别。

本文中，第一级类别可以由不同的第一特征类别组成，在上述举例中，多个第一特征类别包括：年份、猫头鹰图案。

第二级类别是相应第一级类别的子类别(如果将第一级类别类比于是一级类目，那么第二级类别就是二级类目)。比如，“年份”这个第一特征类别下可以包括“2018年”和“2020年”这两个子类别；“猫头鹰图案”这个第一特征类别下可以包括“双眼睁开的猫头鹰图案”和“左眼睁开右眼闭合的猫头鹰图案”这两个子类别。

本文中，第二级类别可以由不同的第二特征类别组成。在上述举例中，多个第二特征类别包括：2018年、2020年、双眼睁开的猫头鹰图案、左眼睁开右眼闭合的猫头鹰图案。

可以理解的是，目标对象上的防伪特征实际上是对应于第二级类别的，只是，在本发明实施例中，识别包含目标对象的图像中包含的特征类别的过程中，首先进行第一级类别的识别，之后再进行第二级类别的识别。

第一级类别的识别可以采用定位模型实现，第二级类别的识别可以采用分类模型实现，通过使用这两个模型分两个阶段完成图像的特征类别的识别，可以使得识别结果更加准确可靠，下文中会详细说明原因。

对于步骤102，可以将拍得的包含目标对象的图像输入到定位模型中，以通过定位模型输出该图像中包含的各个特征区域以及每个特征区域对应的第一特征类别。由于后续对每个特征区域的处理过程都是一样的，因此，仅以其中的对应于目标第一特征类别的特征区域为例进行说明。当然，如果目标对象的防伪特征仅一个，那么从图像中识别出的特征区域将只是对应于目标第一特征类别的特征区域。

针对对应于目标第一特征类别的特征区域来说，从图像中截取出该特征区域，之后，将该特征区域输入到与目标第一特征类别对应的分类模型中，以通过该分类模型输出该特征区域对应的第二特征类别。

需要说明的是，本发明实施例中，针对不同的第一特征类别，预先训练有与之一一对应的分类模型。比如，针对“年份”这个第一特征类别，存在与之对应的一个分类模型，用于识别与“年份”这个第一特征类别对应的特征区域内包含的第二特征类别：2018年、2020年。

在定位模型和分类模型训练完之后，可以存储有定位模型能够识别的各个第一特征类别，并建立第一特征类别与分类模型之间的对应关系，根据该对应关系可以确定与目标第一特征类别对应的分类模型。

在得到对应于目标第一特征类别的特征区域中包含的第二特征类别后，可以根据该第二特征类别和目标对象的参考特征信息，确定用户当前提供的目标对象的真伪。简单来说，如果识别出的第二特征类别与参考特征信息中描述的特征信息相匹配，则认为目标对象是真的，反之，若不匹配则是假的。

如前文中所示，目标对象的防伪特征可能不止一种，那么第一特征类别的数量也将是多个。上述目标第一特征类别可以是这预设的多种第一特征类别中的任一种。基于此，通过定位模型可以从图像中定位出多个特征区域，这多个特征区域分别对应于不同的第一特征类别。针对每个特征区域都通过与之对应的分类模型进行其对应的第二特征类别的识别，最终，可以根据这多个特征区域各自对应的第二特征类别和参考特征信息确定目标对象的真伪。

具体来说，如果目标对象的参考特征信息中仅包含一组特征信息，那么识别出的多个第二特征类别都与这一组特征信息匹配，那么确定目标对象是真的，反之，如果其中一个第二特征类别与这一组特征信息中的对应一个特征信息不匹配，即确定目标对象是假的。

举例来说，如果在图像中识别出如下两种第二特征类别：2018年，双眼未都睁开的猫头鹰图案。而假设参考特征信息中的一组特征信息是：2018年，双眼睁开的猫头鹰图案。由于猫头鹰图案的这个特征与参考特征信息中的描述不匹配，所以确定用户需要鉴别的目标对象是假的。

如前文所述，目标对象对应的参考特征信息中可能包含多组特征信息，对应于不同时期采用的一组组防伪特征。此时，可以先在参考特征信息中确定当前采用的一组特征信息，之后将识别出的多个第二特征类别对应地与这组特征信息中包含的各特征信息对比，以确定目标对象的真伪。

其中，可以从多个第二特征类别中确定一个目标第二特征类别，在参考特征信息中确定与该目标第二特征类别匹配的一组特征信息作为当前使用的一组特征信息，之后，根据这一组特征信息与多个第二特征类别确定目标对象的真伪。

可以理解的是，上述目标第二特征类别相当于是一种索引，用于据此在参考特征信息中锁定一组特征信息。可以根据目标对象不同时期采用的防伪特征之间显著差异的特征作为目标第二特征类别的选定依据。比如，在上述2018年和2020年分别生产的商品的情形下，外包装上的年份字样显著不同，可以将年份对应的这两个第二特征类别作为索引。如果从图像中识别出的是2018年，则据此选定包含2018年这个特征的一组特征信息作为当前使用的一组特征信息。

综上，在本发明实施例中，通过预先注册用于鉴别某对象真伪的参考特征信息，对需要鉴别的对象进行拍照得到其图像，通过两阶段方式从图像中识别出该对象的特征类别，并与参考特征信息对比以自动完成该对象的真伪鉴别，实现简单、准确度高。

为便于理解，结合图2示例性说明一种图像识别场景。

在图2中，假设用户需要鉴别真伪的是报销发票，并假设报销发票的防伪特征包括图中示意的公章和领导签字。假设预先注册的参考特征信息为如下两组文字内容：某某公司专用发票，李某某。其中，李某某是领导签名，某公司专用发票是公章图案中包含的文字。

用户对需要进行真伪鉴别的一张报销发票进行拍照，得到图2中示意的图像，之后，对图像进行特征区域的提取，提取出特征区域A1和特征区域A2，这两个特征区域对应于两种不同的第一特征类别。特征区域A1输入到与之对应的分类模型B1中，分类模型B1输出特征区域A1中包含的第二特征类别：某某公司专用发票。同理，特征区域A2输入到与之对应的分类模型B2中，分类模型B2输出特征区域A2中包含的第二特征类别：李某某。

对比得到的第二特征类别与参考特征信息，发现提取到的第二特征类别与参考特征信息都匹配，从而确定当前鉴别的报销发票为真。

除了上述举例的商品、票据的真伪鉴别场景外，以上本发明实施例提供的图像识别方法还可以适用于很多需要进行某对象的真伪鉴别的应用场景中，比如画的真伪鉴别，等等。

以上举例的需要被鉴别的目标对象多为二维的平面物体，实际应用中，目标对象也可以是立体物体，如酒瓶等罐状物体。针对立体物体的真伪鉴别，可以采用如图3所示实施例提供的方案。

图3为本发明实施例提供的另一种图像识别方法的流程图，如图3所示，该方法包括如下步骤：

301、获取对目标对象进行不同视角的拍摄得到的多个图像，该目标对象为立体物体。

本实施例中假设需要鉴别真伪的目标对象是一种立体物体，比如是一种类似圆柱形的物体或者是一种类似立方体的物体。在该目标对象的正面、背面、底面、顶部等位置可以分别设有不同的防伪特征。从单一视角拍摄得到的图像难以覆盖目标对象表面的各种特征，从而难以基于单一视角对目标对象的真伪做出正确判断。因此，本实施例中通过对目标对象进行多视角的拍摄，通过拍摄多个视角的图像以覆盖目标对象上的所有特征信息。

实际应用中，可选地，可以将目标对象放置在一个可以旋转的装置上，控制该装置旋转，保持相机以同一位姿在装置每旋转一个角度后对目标对象进行一次拍摄，得到一个图像。比如，如果每次旋转30度，在完整地旋转完360度之后，可以拍得目标对象的12个图像，即12个视角的图像。

可以理解的是，对目标对象进行多视角拍摄得到的多个图像中，可能有部分图像中会包含相同的特征信息，比如可能其中有几张图像中都包含相同的某个文字内容。

302、确定多个图像包含的多个特征区域，多个特征区域对应于预设的多种第一特征类别。

303、将多个图像中对应于目标第一特征类别的至少一个特征区域输入到目标第一特征类别对应的分类模型中，以通过分类模型输出所述至少一个特征区域各自对应的第二特征类别。

其中，目标第一特征类别是多种第一特征类别中的任一种。

在获得目标对象的多个图像后，针对每个图像，都进行第一特征类别的特征区域的识别以及每个特征区域对应的第二特征类别的识别。

简单来说，将多个图像分别输入到定位模型中，定位模型会分别输出每个图像中包含的特征区域以及特征区域对应的第一特征类别。一个图像中可能不包含特征区域，也可能包含不止一个特征区域。之后，将对应于同一第一特征类别的特征区域输入到与该第一特征类别对应的分类模型中，以通过该分类模型输出其对应的第二特征类别。

为便于理解和描述，结合图4来示例性说明本实施例提供的方案的执行过程。在图4中，假设目标对象是一个酒瓶，多视角拍摄到的多个图像为图像1、图像2和图像3，并假设从图像1中识别出对应于第一特征类别C1的特征区域Q1，以及对应于第一特征类别C2的特征区域Q2；从图像2中识别出对应于第一特征类别C1的特征区域Q3；从图像3中识别出对应于第一特征类别C3的特征区域Q4，以及对应于第一特征类别C2的特征区域Q5。

由此可知，对应于第一特征类别C1的特征区域包括：特征区域Q1、特征区域Q3；对应于第一特征类别C2的特征区域包括：特征区域Q2、特征区域Q5；对应于第一特征类别C3的特征区域包括：特征区域Q4。

如图4中所示，假设与第一特征类别C1对应的是分类模型M1，与第一特征类别C2对应的是分类模型M2，与第一特征类别C3对应的是分类模型M3。

如图4中所示，假设将特征区域Q1、特征区域Q3分别输入到分类模型M1中可以得到特征区域Q1对应的第二特征类别C11，以及特征区域Q3对应的第二特征类别C12，其中，第二特征类别C11与第二特征类别C12可能相同也可能不同。将特征区域Q2、特征区域Q5分别输入到分类模型M2中可以得到特征区域Q2对应的第二特征类别C21，以及特征区域Q5对应的第二特征类别C22，其中，第二特征类别C21与第二特征类别C22可能相同也可能不同。将特征区域Q4分别输入到分类模型M3中可以得到特征区域Q4对应的第二特征类别C31。

304、根据所述至少一个特征区域各自对应的第二特征类别的置信度，确定与目标第一特征类别对应的目标第二特征类别，根据多个目标第二特征类别和所述参考特征信息，确定目标对象的真伪，多个目标第二特征类别与多个第一特征类别对应。

当目标第一特征类别为第一特征类别C1时，与第一特征类别C1对应的至少一个特征区域为特征区域Q1和特征区域Q3，特征区域Q1和特征区域Q3各自对应的第二特征类别是：第二特征类别C11与第二特征类别C12。

实际应用中，分类模型M1在输出第二特征类别C11与第二特征类别C12的同时，还可以输出这两个特征识别结果各自对应的置信度，比如第二特征类别C11与第二特征类别C12对应的置信度分别为：p1、p2。可以根据这两个置信度最终确定目标对象上与第一特征类别C1对应的目标第二特征类别是什么。比如，确定第一特征类别C1对应的目标第二特征类别是：第一特征类别C1对应的上述两个特征区域各自对应的第二特征类别中置信度最高的第二特征类别。假设p1大于p2，则确定第一特征类别C1对应的目标第二特征类别是第二特征类别C11。

当然，可以理解的是，上述根据置信度确定目标第二特征类别的方式，仅在第二特征类别C11与第二特征类别C12不同的时候采用，如果两者相同，那么可以不用比较置信度了。

同理，对于第一特征类别C2对应的目标第二特征类别以及对于第一特征类别C3对应的目标第二特征类别的确定，可以采用上述确定方式确定。

如图4中所示，假设第一特征类别C1对应的目标第二特征类别是第二特征类别C11，第一特征类别C2对应的目标第二特征类别是第二特征类别C21，第一特征类别C3对应的目标第二特征类别是第二特征类别C31。

可以基于这三种目标第二特征类别与目标对象的参考特征信息确定目标对象的真伪。如前文所述，可以在参考特征信息中确定出当前采用的一组特征信息，对应地比较得到的各个目标第二特征类别与其中的特征信息，以确定目标对象的真伪。

以上实施例中提到，对图像进行特征识别的过程中，需要使用到定位模型和分类模型，下面结合以下实施例介绍这两个模型的训练过程。

图5为本发明实施例提供的一种模型训练方法的流程图，如图5所示，该训练方法可以包括如下步骤：

501、获取由多个训练样本图像构成的第一训练样本集。

502、采用第一训练样本集对定位模型进行训练，定位模型用于识别训练样本集中分别对应于多种第一特征类别的特征区域。

503、从第一训练样本集中获取由对应于目标第一特征类别的特征区域构成的第二训练样本集，目标第一特征类别是多种第一特征类别中的任一种。

504、采用第二训练样本集训练与目标第一特征类别对应的分类模型。

本发明实施例中训练的定位模型和分类模型是服务于目标对象的真伪鉴别任务的，因此，第一训练样本集中包含的若干训练样本图像可以是通过对大量的目标对象进行图像采集得到的。

定位模型用于实现对各种类别的特征区域的初步定位，可以采用全部训练样本图像来对定位模型进行训练。

为进行定位模型的训练，需要对每个训练样本图像进行如下监督信息的标注：标注每个训练样本图像中各特征区域的位置以及类别标签。类别标签即为上文中所说的多个第一特征类别。在该监督信息的监督下，对定位模型进行训练。

之后，为了训练与每种第一特征类别对应的分类模型，首先，需要收集每种分类模型对应的训练样本集，之后，对训练样本集中的训练样本图像进行监督信息的标注，以在监督信息的监督下，进行该分类模型的训练。

以多种第一特征类别中的任一第一特征类别(称为目标第一特征类别)为例，可以从第一训练样本集中获取由对应于目标第一特征类别的特征区域构成的第二训练样本集。

可选地，可以将第一训练样本集中的各个训练样本图像分别输入到训练至收敛的定位模型中，由定位模型输出每个训练样本图像中包含的特征区域以及特征区域对应的第一特征类别。根据定位模型的输出结果，收集对应于目标第一特征类别的各个特征区域，由这些特征区域图像构成第二训练样本集，以训练与目标第一特征类别对应的分类模型。

对第二训练样本集中的每个训练样本图像进行如下监督信息的标注：标注每个训练样本图像对应的类别标签，第二训练样本集对应的类别标签集由目标第一特征类别下包含的多个子类别(即多个第二特征类别)构成。比如，目标第一特征类别为：年份，目标第一特征类别下包含如下两个第二特征类别：2018年、2020年。

为了能够更加直观地理解上述模型训练过程，结合图6来示例性说明。在图6中，假设初始收集了训练样本图像1～训练样本图像N这N个训练样本图像，N大于1，这N个训练样本图像构成第一训练样本集，基于这N个训练样本图像完成定位模型的训练。之后，根据定位模型对每个训练样本图像的第一类别特征的识别结果，得到对应于第一特征类别C1的K1个训练样本图像，对应于第一特征类别C2的K2个训练样本图像，对应于第一特征类别C3的K3个训练样本图像。之后，根据上述K1个训练样本图像训练与第一特征类别C1对应的分类模型M1，根据上述K2个训练样本图像训练与第一特征类别C2对应的分类模型M2，根据上述K3个训练样本图像训练与第一特征类别C3对应的分类模型M3。

目前，采用神经网络模型来实现图像识别已经成为一种主流趋势。本发明实施例中提供的定位模型和分类模型都可以采用神经网络模型来实现。

比如，定位模型可以采用卷积神经网络(Convolutional Neural Networks,简称CNN)模型、基于区域的卷积神经网络(Regions with Convolutional Neural Networks,简称RCNN)模型、faster RCNN模型、(Single Shot Multibox Detector，简称SSD)模型等实现。分类模型可以采用残差网络(ResNet)模型、VGG模型等实现。

通过本发明实施例提供的由粗到精的双阶段训练方式，可以缓解模型训练时的样本不平衡现象，提升特征识别精度。其中，由粗到精的双阶段训练方式是指先基于全部训练样本图像训练定位模型，以通过训练好的定位模型将训练样本图像按照第一级类别(即多个第一特征类别)进行分组，之后，分别使用每组训练样本图像训练对应的一个分类模型。

为理解样本不平衡现象，先假设如果仅采用一阶段训练方式直接训练一个用于识别输入图像中包含的各个特征(对应于上述各个第二特征类别)的模型，假设称为特征识别模型，同时假设目标对象是一个立体物体，对收集到的大量目标对象采用多视角拍摄的方式进行拍摄，那么每个立体物体可以拍得多个图像，对所有立体物体拍得的全部图像作为训练样本集。在该训练样本集中，每种第二特征类别对应的训练样本图像的数量是不平衡的。

举例说明该不平衡现象：假设对一个立体物体X进行多视角拍摄得到12个图像，这12个图像中可能仅有3个图像中包含第二特征类别d1的特征，但是却有9个图像中都包含第二特征类别d2的特征；对另一个立体物体Y进行多视角拍摄得到12个图像，这12个图像中可能仅有4个图像中包含第二特征类别d3的特征，但是却有8个图像中都包含第二特征类别d2的特征。比如，第二特征类别d1为2018年，第二特征类别d2为双眼睁开的猫头鹰图案，第二特征类别d3为2020年。

由于与第二特征类别d1对应的训练样本图像数量，以及与第二特征类别d3对应的训练样本图像数量都远小于与第二特征类别d2对应的训练样本图像数量，在训练特征识别模型的过程中，可能最终使得特征识别模型对样本数量少的第二特征类别d1和第二特征类别d3不具有良好的识别能力。这就产生了由于不同的第二特征类别所对应的训练样本图像数量的不平衡导致的模型识别精度低的问题。

而在本发明实施例中，通过双阶段的训练方式可以克服该问题，仍结合上述举例来说明原因：

对立体物体X和立体物体Y拍得的24个图像，都作为定位模型的训练样本图像，由于训练样本图像数量充足，可以保证定位模型的训练精度。由于在定位模型训练阶段，对立体物体X和立体物体Y所呈现的多种第二特征类别按照属性维度进行了分组，即设定多个第一特征类别，一个第一特征类别对应于一个属性维度，该属性维度对应的各个第二特征类别都归属于这个第一特征类别的子类别。因此，经过定位模型的特征区域的识别，对于上述24个图像，可以得到对应于第一特征类别F1的7个图像，对应于第一特征类别F2的17个图像。其中，假设第一特征类别F1对应于年份这个属性，其子类别包括上述举例的第二特征类别d1和第二特征类别d3；第一特征类别F2对应于猫头鹰图案这个属性，其子类别包括上述举例的第二特征类别d2。

之后，采用一种第一特征类别训练一个对应的分类模型的方式，起到隔离不同第一特征类别的特征的效果，使得一个分类模型的训练仅需要专注于对应于同一大类特征(第一特征类别)的识别。另外，将对应于同一大类特征的所有特征区域作为相应分类模型的训练样本图像，可以使得该分类模型获得更加多的训练样本图像数量，且更能聚焦于不同特征区域的差异部分的学习，保证分类模型的训练精度。在上述举例中，可以将对应于第一特征类别F1的7个图像作为训练与第一特征类别F1对应的分类模型的训练样本图像，将对应于第一特征类别F2的17个图像作为训练与第一特征类别F2对应的分类模型的训练样本图像。

如前文所述，本发明提供的图像识别方法可以在云端来执行，在云端可以部署有若干计算节点，每个计算节点中都具有计算、存储等处理资源。在云端，可以组织由多个计算节点来提供某种服务，当然，一个计算节点也可以提供一种或多种服务。云端提供该服务的方式可以是对外提供服务接口，用户调用该服务接口以使用相应的服务。服务接口包括软件开发工具包(Software Development Kit，简称SDK)、应用程序接口(ApplicationProgramming Interface，简称API)等形式。

针对本发明实施例提供的方案，云端可以提供有图像识别服务的服务接口，用户通过用户设备调用该图像识别服务接口，以向云端触发调用该图像识别服务接口的请求。云端确定响应该请求的计算节点，利用该计算节点中的处理资源执行如下步骤：

向所述用户设备反馈所述目标对象的真伪确定结果。

图像识别服务接口利用处理资源执行信息识别处理的详细过程可以参考前述其他实施例中的相关说明，在此不赘述。实际应用中，上述请求中可以直接携带有包含目标对象的图像，云端从该请求中解析出包含目标对象的图像。

为便于理解，结合图7来示例性说明。在图7中，用户想要鉴别目标对象的真伪，对目标对象拍摄得到图像，在用户设备E1中调用图像识别服务接口，以向云端计算节点E2发送调用请求，该调用请求中包括目标对象的图像。该调用请求中还可以携带有目标对象的标识，以用于云端计算节点E2根据此标识获取目标对象对应的参考特征信息。本实施例中假设云端计算节点E2在接收到调用请求后，从中解析出目标对象的图像，并对图像进行特征识别处理。特征识别处理过程参考前述实施例中的介绍，在此不赘述。之后，云端计算节点E2将基于识别出的特征和参考特征信息得到的鉴别结果反馈给用户设备E1，用户设备E1输出鉴别结果。

图8a为本发明实施例提供的另一种图像识别方法的流程图，如图8a所示，该方法可以包括如下步骤：

801、获取立体容器对应的图像。

802、确定图像中的特征区域，其中，所述特征区域对应于第一特征类别。

803、确定与特征区域对应的第二特征类别，第二特征类别是第一特征类别的子类别。

804、根据第二特征类别和立体容器对应的参考特征信息，确定立体容器的质量判断结果,展现质量判断结果。

本实施例中的立体容器可以是任何材质的瓶子、桶、罐等。实际应用中，常见的瓶子比如包括酒瓶、奶瓶、装护肤品的瓶子、调料瓶、水桶、储钱罐，等等。

在立体容器的外表面上会设有一个或多个用于防伪的特征，上述特征区域即是分别包含这些防伪特征的区域。

如前述其他实施例中的介绍，当立体容器外表面上在不同位置(如正面、侧面、底面等)上设有防伪特征时，可以对瓶子进行多视角的拍摄，得到不同视角对应的图像，结合从这多张图像中识别出的特征类别进行该立体容器的质量鉴别。

其中，质量鉴别包含上述其他实施例中所说的真伪鉴别，但不限于此。比如，假设预先获得了某种立体容器的N种参考特征，N大于1，是某个立体容器进行拍摄得到其对应的图像后，从该图像中最终识别出K种特征与对应的参考特征匹配，那么可以认为这个立体容器的质量判定结果为：合格概率为K/N，K大于或等于0。

实际应用中，本实施例提供的图像识别方案可以由某个应用程序来执行，当某用户想要鉴别一个立体容器的质量时，可以在自己的比如手机终端、平板电脑等计算设备中安装该应用程序，以使用该计算设备完成这个立体容器的质量检测任务。

可选地，该应用程序可以提供立体容器识别的操作界面，用户通过该操作界面完成立体容器的质量检测相关操作以及查看检测过程中得到的各种数据和最终的质量判断结果。

结合图8b示例性说明该操作界面的组成。

如图8b所示，当用户想要对某个立体容器进行质量检测时，操作自己的诸如手机、平板电脑等计算设备，在计算设备上显示立体容器识别的操作界面801A。在该操作界面801A上可以显示有图像获取按钮802A、第一特征类别输出组件802B、第二特征类别输出组件802C、质量结果输出组件802D。

实际应用中，这些按钮和组件可以设置在同一界面中，也可以考虑用户操作的便捷性而设置在不同界面中，或者还可以将这些按钮和组件始终置顶显示。显示位置和显示方式不在本实施例中进行严格限定，本实施例中仅强调应用程序中可以包含这些按钮、组件。

另外，在操作界面801A中可以包含上述按钮、组件中的全部或部分，比如可以只包含其中的图像获取按钮802A和质量结果输出组件802D，不以此为限。当然，还可以包含其他相关组件。

当用户需要对立体容器进行拍摄时，用户点击图像获取按钮802A以控制计算设备的拍摄功能启动，以通过计算设备的摄像头完成立体容器的拍摄，得到立体容器对应的图像，并显示在操作界面801A中。

应用程序之后对用户上传的图像进行特征识别处理，先后得到特征区域及其对应的第一特征类别，以及特征区域对应的第二特征类别。

在得到上述特征区域后，可以在操作界面801A中显示出该特征区域，以提供给用户查看。特征区域的显示位置可以靠近用户拍摄的原始的图像，以便用户对比查看。

另外，还可以通过第一特征类别输出组件802B和第二特征类别输出组件802C分别展示识别出的第一特征类别和第二特征类别。

在基于识别出的第二特征类别和立体容器的参考特征信息完成该立体容器的质量检测后，还可以通过质量结果输出组件802D展现该立体容器的质量判断结果。当质量检测的目的是进行真伪检测时，该质量判断结果可以是真或假的指示信息；当质量检测的目的是进行合格概率的判断时，该质量判断结果可以是合格概率。

本实施例提供的方案的具体执行过程可以参考前述其他实施例中的相关说明，在此不赘述。

以下将详细描述本发明的一个或多个实施例的图像识别装置。本领域技术人员可以理解，这些装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。

图9为本发明实施例提供的一种图像识别装置的结构示意图，如图9所示，该装置包括：获取模块11、识别模块12、鉴别模块13。

获取模块11，用于获取包含目标对象的图像。

识别模块12，用于确定所述图像中的特征区域，所述特征区域对应于目标第一特征类别；以及，将所述特征区域输入到与所述目标第一特征类别对应的分类模型中，以通过所述分类模型输出所述特征区域对应的第二特征类别，所述第二特征类别是所述目标第一特征类别的子类别。

鉴别模块13，用于根据所述第二特征类别和所述目标对象对应的参考特征信息，确定所述目标对象的真伪。

可选地，所述目标第一特征类别是预设的多种第一特征类别中的任一种，鉴别模块13具体可以用于：根据所述图像中的多个特征区域各自对应的第二特征类别和所述参考特征信息，确定所述目标对象的真伪，所述多个特征区域分别对应于不同的第一特征类别。

可选地，鉴别模块13具体可以用于：在所述参考特征信息中确定与目标第二特征类别匹配的一组特征信息，所述目标第二特征类别是所述多个特征区域各自对应的第二特征类别中的一种；根据所述一组特征信息与所述多个特征区域各自对应的第二特征类别，确定所述目标对象的真伪。

可选地，获取模块11具体可以用于：获取对所述目标对象进行不同视角的拍摄得到的多个图像，所述目标对象为立体物体。

基于此，可选地，识别模块12具体用于：将所述多个图像中对应于所述目标第一特征类别的至少一个特征区域输入到所述分类模型中，以通过所述分类模型输出所述至少一个特征区域各自对应的第二特征类别，所述目标第一特征类别是预设的多种第一特征类别中的任一种。

鉴别模块13具体用于：根据所述至少一个特征区域各自对应的第二特征类别的置信度，确定与所述目标第一特征类别对应的目标第二特征类别；根据多个目标第二特征类别和所述参考特征信息，确定所述目标对象的真伪，所述多个目标第二特征类别与所述多个第一特征类别对应。

其中，鉴别模块13具体用于：确定与所述目标第一特征类别对应的目标第二特征类别为：所述至少一个特征区域各自对应的第二特征类别中置信度最高的第二特征类别。

可选地，所述装置还包括：训练模块，用于获取由多个训练样本图像构成的第一训练样本集；采用所述第一训练样本集对定位模型进行训练，所述定位模型用于识别所述训练样本集中分别对应于多种第一特征类别的特征区域；从所述第一训练样本集中获取由对应于目标第一特征类别的特征区域构成的第二训练样本集，所述目标第一特征类别是所述多种第一特征类别中的任一种；采用所述第二训练样本集训练与所述目标第一特征类别对应的所述分类模型。

图9所示装置可以执行前述实施例中提供的图像识别方法，详细的执行过程和技术效果参见前述实施例中的描述，在此不再赘述。

在一个可能的设计中，上述图9所示图像识别装置的结构可实现为一电子设备，如图10所示，该电子设备可以包括：处理器21、存储器22。其中，存储器22上存储有可执行代码，当所述可执行代码被处理器21执行时，使第一处理器21至少可以实现如前述实施例中提供的图像识别方法。

可选地，该电子设备中还可以包括通信接口23，用于与其他设备进行通信。

另外，本发明实施例提供了一种非暂时性机器可读存储介质，所述非暂时性机器可读存储介质上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器至少可以实现如前述实施例中提供的模型训练方法。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现，当然也可以通过硬件和软件结合的方式来实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种图像识别方法，其特征在于，包括：

获取包含目标对象的图像；

2.根据权利要求1所述的方法，其特征在于，所述目标第一特征类别是预设的多种第一特征类别中的任一种；

所述根据所述第二特征类别和所述目标对象对应的参考特征信息，确定所述目标对象的真伪，包括：

根据所述图像中的多个特征区域各自对应的第二特征类别和所述参考特征信息，确定所述目标对象的真伪，所述多个特征区域分别对应于不同的第一特征类别。

3.根据权利要求2所述的方法，其特征在于，所述根据所述图像中的多个特征区域各自对应的第二特征类别和所述参考特征信息，确定所述目标对象的真伪，包括：

在所述参考特征信息中确定与目标第二特征类别匹配的一组特征信息，所述目标第二特征类别是所述多个特征区域各自对应的第二特征类别中的一种；

根据所述一组特征信息与所述多个特征区域各自对应的第二特征类别，确定所述目标对象的真伪。

4.根据权利要求1所述的方法，其特征在于，所述获取包含目标对象的图像，包括：

获取对所述目标对象进行不同视角的拍摄得到的多个图像，所述目标对象为立体物体。

5.根据权利要求4所述的方法，其特征在于，所述将所述特征区域输入到与所述目标第一特征类别对应的分类模型中，以通过所述分类模型输出所述特征区域对应的第二特征类别，包括：

将所述多个图像中对应于所述目标第一特征类别的至少一个特征区域输入到所述分类模型中，以通过所述分类模型输出所述至少一个特征区域各自对应的第二特征类别，所述目标第一特征类别是预设的多种第一特征类别中的任一种。

6.根据权利要求5所述的方法，其特征在于，所述根据所述第二特征类别和所述目标对象对应的参考特征信息，确定所述目标对象的真伪，包括：

根据所述至少一个特征区域各自对应的第二特征类别的置信度，确定与所述目标第一特征类别对应的目标第二特征类别；

根据多个目标第二特征类别和所述参考特征信息，确定所述目标对象的真伪，所述多个目标第二特征类别与所述多个第一特征类别对应。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取由多个训练样本图像构成的第一训练样本集；

采用所述第一训练样本集对定位模型进行训练，所述定位模型用于识别所述训练样本集中分别对应于多种第一特征类别的特征区域；

从所述第一训练样本集中获取由对应于目标第一特征类别的特征区域构成的第二训练样本集，所述目标第一特征类别是所述多种第一特征类别中的任一种；

采用所述第二训练样本集训练与所述目标第一特征类别对应的所述分类模型。

8.一种图像识别方法，其特征在于，包括：

接收用户设备调用目标服务接口的请求；

利用所述目标服务接口对应的处理资源执行如下步骤：

获取包含目标对象的图像；

向所述用户设备反馈所述目标对象的真伪确定结果。

9.一种图像识别装置，其特征在于，包括：

获取模块，用于获取包含目标对象的图像；

10.一种电子设备，其特征在于，包括：存储器、处理器；其中，所述存储器上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1至7中任一项所述的图像识别方法。

11.一种非暂时性机器可读存储介质，其特征在于，所述非暂时性机器可读存储介质上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1至7中任一项所述的图像识别方法。

12.一种图像识别方法，其特征在于，包括：

获取立体容器对应的图像；

展现所述质量判断结果。