CN106874845B

CN106874845B - 图像识别的方法和装置

Info

Publication number: CN106874845B
Application number: CN201611265153.4A
Authority: CN
Inventors: 邹博; 齐智峰; 刘玉洁; 周玲武
Original assignee: Neusoft Corp
Current assignee: Neusoft Corp
Priority date: 2016-12-30
Filing date: 2016-12-30
Publication date: 2021-03-26
Anticipated expiration: 2036-12-30
Also published as: CN106874845A

Abstract

本公开涉及一种图像识别的方法和装置，该方法包括：获取待识别物品的物品图像；沿物品图像的图像中心按照多个旋转角度旋转物品图像得到的多个旋转图像；通过预设分类模型从多个旋转图像中，确定出第一图像标记以及第一图像标记对应的置信度，其中，第一图像标记用于标示多个旋转图像中属于目标类别的待识别物品的图像；置信度表示第一图像标记标示出的待识别物品属于目标类别的可信度；根据置信度和第一图像标记在物品图像中确定目标图像标记，其中，目标图像标记用于标记物品图像中确定属于目标类别的待识别物品的图像。

Description

图像识别的方法和装置

技术领域

本公开涉及图像处理领域，具体地，涉及一种图像识别的方法和装置。

背景技术

随着经济的发展，往返于贸易港口、火车站、航空站等海关监管区域的旅客、商品越来越多，而在旅客行李中隐藏的危险物品和走私物品不仅严重威胁着旅客的生命财产安全，更危害了国家安全和利益。

目前国内的安检系统主要依靠安检工作人员通过人眼进行识别，其中，旅客的行李或者包裹在通过传送带或安检门时，透过X射线扫描出的图像会出现在与设备连接的显示屏幕上，安检人员通过观察屏幕上的图像、色块等对其中的危险物品或者走私物品进行识别。

但是，由于现有方法是由人工操作的，因此，在对危险物品或者走私物品进行识别难免存在漏检或者错检的问题，从而无法准确的识别危险物品或者走私物品。

发明内容

本公开的目的是提供一种图像识别的方法和装置，能够准确识别待识别物品的图像。

为了实现上述目的，本公开提供一种图像识别的方法，包括：获取待识别物品的物品图像；沿所述物品图像的图像中心按照多个旋转角度旋转所述物品图像得到的多个旋转图像；通过预设分类模型从所述多个旋转图像中，确定出第一图像标记以及所述第一图像标记对应的置信度，其中，所述第一图像标记用于标示所述多个旋转图像中属于目标类别的待识别物品的图像；所述置信度表示所述第一图像标记标示出的待识别物品属于所述目标类别的可信度；根据所述置信度和所述第一图像标记在所述物品图像中确定目标图像标记，其中，所述目标图像标记用于标记所述物品图像中确定属于所述目标类别的待识别物品的图像。

可选地，所述根据所述置信度和所述第一图像标记在所述物品图像中标记出目标物品图像包括：获取所述第一图像标记所在旋转图像对应的旋转方向；确定与所述旋转方向相反的反转方向；沿所述第一图像标记所在旋转图像的图像中心由所述反转方向按照所述旋转角度旋转所述第一图像标记，并将旋转后的第一图像标记叠加到所述物品图像上；根据旋转后的第一图像标记和所述置信度在所述物品图像中标记出目标物品图像。

可选地，所述第一图像标记包括图像标记框，所述根据旋转后的第一图像标记和所述置信度在所述物品图像中标记出目标物品图像包括：确定所述图像标记框中是否包括存在交集的图像标记框；在所述图像标记框中包括存在交集的图像标记框时，从存在交集的图像标记框中确定置信度最大的第一标记框；根据所述第一标记框与第二标记框的交集确定匹配值；所述第二标记框为存在交集的图像标记框中除所述第一标记框之外的其他标记框；在所述匹配值大于或者等于预设匹配值时，确定所述第一标记框为所述目标标记框且所述第二标记框不是所述目标标记框；在所述匹配值小于所述预设匹配值时，确定所述第一标记框和所述第二标记框都为所述目标标记框。

可选地，所述根据所述第二标记框与所述第一标记框的交集确定匹配值包括：获取所述第二标记框与所述第一标记框的交集的第一面积；获取所述第二标记框与所述第一标记框的并集的第二面积；根据所述第一面积和所述第二面积通过以下公式确定所述匹配值；

其中，P为所述匹配值，S1为所述第一面积，S2为所述第二面积。

可选地，所述根据所述置信度和所述第一图像标记在所述物品图像中标记出目标物品图像包括：从所述第一图像标记中确定第二图像标记；所述第二图像标记为所述第一图像标记中置信度大于或者等于预设阈值的图像标记；根据所述置信度和所述第二图像标记在所述物品图像中标记出目标物品图像。

本公开提供一种图像识别的装置，包括：获取模块，用于获取待识别物品的物品图像；旋转模块，用于沿所述物品图像的图像中心按照多个旋转角度旋转所述物品图像得到的多个旋转图像；处理模块，用于通过预设分类模型从所述多个旋转图像中，确定出第一图像标记以及所述第一图像标记对应的置信度，其中，所述第一图像标记用于标示所述多个旋转图像中属于目标类别的待识别物品的图像；所述置信度表示所述第一图像标记标示出的待识别物品属于所述目标类别的可信度；确定模块，用于根据所述置信度和所述第一图像标记在所述物品图像中确定目标图像标记，其中，所述目标图像标记用于标记所述物品图像中确定属于所述目标类别的待识别物品的图像。

可选地，所述确定模块包括：反转子模块，用于获取所述第一图像标记所在旋转图像对应的旋转方向，并确定与所述旋转方向相反的反转方向，沿所述第一图像标记所在旋转图像的图像中心由所述反转方向按照所述旋转角度旋转所述第一图像标记，并将旋转后的第一图像标记叠加到所述物品图像上；确定子模块，用于根据旋转后的第一图像标记和所述置信度在所述物品图像中标记出目标物品图像。

可选地，所述第一图像标记包括图像标记框，所述确定子模块，用于确定所述图像标记框中是否包括存在交集的图像标记框；在所述图像标记框中包括存在交集的图像标记框时，从存在交集的图像标记框中确定置信度最大的第一标记框；根据所述第一标记框与第二标记框的交集确定匹配值；所述第二标记框为存在交集的图像标记框中除所述第一标记框之外的其他标记框；在所述匹配值大于或者等于预设匹配值时，确定所述第一标记框为所述目标标记框且所述第二标记框不是所述目标标记框；在所述匹配值小于所述预设匹配值时，确定所述第一标记框和所述第二标记框都为所述目标标记框。

可选地，所述确定子模块，用于获取所述第二标记框与所述第一标记框的交集的第一面积，获取所述第二标记框与所述第一标记框的并集的第二面积，并根据所述第一面积和所述第二面积通过以下公式确定所述匹配值；

可选地，所述确定模块，用于从所述第一图像标记中确定第二图像标记；所述第二图像标记为所述第一图像标记中置信度大于或者等于预设阈值的图像标记，并根据所述置信度和所述第二图像标记在所述物品图像中标记出目标物品图像。

通过上述技术方案，获取待识别物品的物品图像；沿该物品图像的图像中心按照多个旋转角度旋转该物品图像得到的多个旋转图像；通过预设分类模型从该多个旋转图像中，确定出第一图像标记以及该第一图像标记对应的置信度，其中，该第一图像标记用于标示该多个旋转图像中属于目标类别的待识别物品的图像；该置信度表示该第一图像标记标示出的待识别物品属于该目标类别的可信度；根据该置信度和该第一图像标记在该物品图像中确定目标图像标记，其中，该目标图像标记用于标记该物品图像中确定属于该目标类别的待识别物品的图像。这样，通过对获取的图像进行旋转，得到不同旋转角度下的多个旋转图像，并根据得到的多个旋转图像对待识别物品进行识别，从而通过不同角度的旋转图像准确的识别出目标类别的物品。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是本公开实施例提供一种图像识别的方法的流程示意图；

图2是本公开实施例提供另一种图像识别的方法的流程示意图；

图3是本公开实施例提供一种旋转图像的示意图；

图4是本公开实施例提供一种旋转图像上的图像标记框的示意图；

图5是本公开实施例提供一种最小矩形框的示意图；

图6是本公开实施例提供一种图像识别的装置的结构示意图；

图7是本公开实施例提供另一种图像识别的装置的结构示意图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

本公开实施例可以应用于安检场景，在该场景下，旅客的行李或者包裹在进行安检时，安检设备通过X射线获取到该行李或者包裹的图像，从而通过获取的图像识别危险物品和走私物品；本公开通过对获取的图像进行旋转，得到不同旋转角度下的多个旋转图像，并根据得到的多个旋转图像对旅客行李或者包裹中的物品进行识别，从而通过不同角度的旋转图像准确的识别危险物品和走私物品。

下面，结合具体实施例对本公开进行详细说明。

图1为本公开实施例提供的一种图像识别的方法，如图1所示，该方法包括：

S101、获取待识别物品的物品图像。

其中，该待识别物品可以是旅客行李中的物品，这些物品可以是日常生活中的日用品，如洗漱用品、衣服、鞋等物品，也可以是一些危险物品或者违禁物品，如刀具和枪等物品。

S102、沿该物品图像的图像中心按照多个旋转角度旋转该物品图像得到的多个旋转图像。

其中，该图像中心可以是该物品图像的中心点。

在本步骤中，可以沿该物品图像的图像中心点将该物品图像按照预设旋转步长进行多次旋转，得到该多个旋转图像。

S103、通过预设分类模型从该多个旋转图像中，确定出第一图像标记以及该第一图像标记对应的置信度。

其中，该第一图像标记用于标示该多个旋转图像中属于目标类别的待识别物品的图像；该置信度表示该第一图像标记标示出的待识别物品属于该目标类别的可信度。

这里，该目标类别可以是属于危险物品或者违禁物品的物品，如刀具或者枪等物品。

在本实施例中，图像标记可以是图像标记框，如矩形框或者圆形框等，以便框出标记的图像，该图像标记还可以以反色的形式进行标记，即将标记的图像的颜色设置为与旋转图像的背景色不同的颜色，以便通过颜色区分标记的图像和该旋转图像中的其他图像，当然，上述图像标记只是举例说明，不作限定。

S104、根据该置信度和该第一图像标记在该物品图像中确定目标图像标记。

其中，该目标图像标记用于标记该物品图像中确定属于该目标类别的待识别物品的图像。

这样，通过对获取的图像进行旋转，得到不同旋转角度下的多个旋转图像，并根据得到的多个旋转图像对待识别物品进行识别，从而通过不同角度的旋转图像准确的识别出目标类别的物品。

图2为本公开实施例提供一种图像识别的方法，如图2所示，本实施例中的图像标记是以图像标记框为例进行说明的，该图像标记框可以是一个矩形框，从而框出被标记物品的图像，方便安检人员查看，这里的矩形框只是举例说明，本公开对此不作限定，还可以是其他形状的框，如圆形框等；该方法包括：

S201、获取待识别物品的物品图像。

在本步骤中，旅客行李或者包裹在通过传送带或者安检门时，可以通过X射线采集到该物品图像。

S202、沿该物品图像的图像中心按照多个旋转角度旋转该物品图像得到的多个旋转图像。

其中，该图像中心可以是该物品图像的中心点。

需要说明的是，为了确保得到的旋转图像能够在更大范围的角度下呈现不同角度的待识别物品的姿态，在本实施例中，该旋转的次数可以通过计算360度与该预设旋转步长的比值得到，这样，得到的多个旋转图像刚好是该物品图像旋转一周后的图像，从而使得得到的旋转图像中的待识别物品的姿态可以对应360度的不同的方向，进而增加后续对目标类别的待识别物品的识别的准确性。

这里，按照上述旋转的次数得到的多个旋转图像可以不包括初始获取的物品图像，而在按照360度与该预设旋转步长的比值计算出的次数进行旋转时，最后一次旋转的旋转图像与初始获取的物品图像相同，因此，该旋转的次数还可以通过在计算360度与该预设旋转步长的比值后减去1得到，且得到的多个旋转图像包括初始获取的物品图像，但是，采用这种旋转次数的计算方式能够减少一次旋转次数，从而减轻数据处理的负担。

另外，由于得到不同角度下的旋转图像越多，则在旋转图像中的待识别物品的图像呈现的角度越多，对于后续对目标类别的待识别物品的识别越准确，因此，理论上，该预设旋转步长可以设置的越小，则旋转多次后得到的旋转图像的数量越多，但是，考虑到获取的旋转图像越多，计算量越大，数据处理的负担越重，从而降低了对目标类别的待识别物品的识别效率，因此，在本实施例中，该预设旋转步长可以设置为60度，则对应的旋转次数可以5次(即计算360度与60度的比值后减1)，从而得到6个旋转图像(其中得到的旋转图像包括初始的物品图像)。

示例地，如图3所示，原始的物品图像为a，将该原始的物品图像沿物品图像的中心向逆时针方向进行旋转，每次旋转60度(相当于预设旋转步长为60度)，这样，将图像a逆时针旋转60度得到图像b，再将图像b逆时针旋转60度得到图像c，再将图像c逆时针旋转60度得到图像d，再将图像d逆时针旋转60度得到图像e，再将图像e逆时针旋转60度得到图像f，这样，旋转5次后，即可得到图像b、图像c、图像d、图像e以及图像f，则该多个旋转图像即为图像a、图像b、图像c、图像d、图像e以及图像f。

当然，上述预设旋转步长的设置只是举例说明，本公开对此不作限定，具体的设置可以综合考虑对目标类别的待识别物品识别的准确率以及数据处理的负担进行设置，例如，该预设旋转步长还可以设置为30度等。

S203、将多个旋转图像作为预设分类模型的输入，得到第一图像标记框以及该第一图像标记框对应的置信度。

其中，该第一图像标记框用于标记该多个旋转图像中属于目标类别的待识别物品的图像；该置信度表示该第一图像标记框标记出的待识别物品属于该目标类别的可信度。

在本步骤中，通过该预设分类模型即可将属于目标类别的待识别物品识别出来，并通过第一图像标记框标记该待识别物品的物品图像。

该预设模型可以通过选用已训练好的深度卷积神经网络模型进行初始化，然后利用已经搜集好的X射线图像样本进行训练，生成该预设分类模型，在本实施例中，该深度卷积神经网络模型可以选用VGG(Visual Geometry Group视觉几何组)网络模型。上述模型训练的具体过程与现有的神经网络模型的训练过程相同，不再赘述。

示例地，上述每个旋转图像通过该预设模型得到的图像标记框如图4中的加粗的黑框所示，由图4可以看出，在不同的旋转角度下，识别出的属于目标类别的图像并不完全相同(有的有两个黑框，有的只有一个黑框)，因此，如果只采用一张图像就确定属于目标类别的待识别物品，很容易造成漏检或者错检的问题，因此，本公开根据多个旋转图像并通过后续步骤对待识别物品进行识别，从而通过不同角度的旋转图像准确的识别出目标类别的物品。

S204、获取该第一图像标记框所在旋转图像对应的旋转方向，确定与该旋转方向相反的反转方向，并沿该第一图像标记框所在旋转图像的图像中心由该反转方向按照该旋转角度旋转该第一图像标记框，并将旋转后的第一图像标记框叠加到该物品图像上。

本步骤相当于根据第一图像标记框所在旋转图像的旋转方向和旋转角度，将该第一图像标记框进行逆旋转，以便将全部第一图像标记框叠加到初始获取的物品图像上。

例如，若旋转图像是沿图像中心向逆时针方向旋转60度得到的，则在本步骤中，可以将该第一图像标记框沿该第一图像标记框所在旋转图像的图像中心向顺时针方向旋转60度。

需要说明的是，由于旋转后的第一图像标记框可能相对于水平方向是倾斜的，这样，后续安检人员可能无法直观的观察到该图像标记框标记的待识别物品，因此，为了解决上述问题，在本公开另一实施例中，可以在得到旋转后的第一图像标记框后，根据该第一图像标记框四个角对应的坐标得到该第一图像标记框外接的最小矩形框，并将该最小矩形框作为该第一图像标记框，如图4所示，A为第一图像标记框，由图5可以看出，该第一图像标记框相对水平方向是倾斜的，则得到的外接的最小矩形框即为B，这样，能够将倾斜的第一图像标记框调整为端正的标记框，以方便后续安检人员更直观的查看该第一图像标记框标示的物品。

S205、确定该第一图像标记框中是否包括存在交集的图像标记框。

在本步骤中，可以通过确定第一图像标记框中任一标记框上的点的坐标是否落在另一标记框的图像范围内来确定图像标记框之间是否存在交集，若落在图像范围内，则确定两个图像标记框之间存在交集，若未落在图像范围内，则确定两个标记框之间不存在交集。

在确定第一图像标记框中包括存在交集的图像标记框时，执行步骤S206至步骤S208；

这里，在两个图像标记框存在交集时，相当于存在两种可能的情况，一种情况是这两个图像标记框对应的待识别物品是同一物品，另一种情况是这两个图像标记框对应的待识别物品是不同物品，但两个物品离得非常近，因此，通过步骤S206至步骤S208进行进一步处理，以确定第一图像标记框中包括存在交集的图像标记框对应的待识别物品是否是同一物品。

在确定图像标记框中不包括存在交集的图像标记框时，执行步骤S210和步骤S211。

这里，即可确定每个图像标记框标记的物品图像对应的待识别物品都是不同的物品。

S206、从存在交集的图像标记框中确定置信度最大的第一标记框。

在本步骤中，在得到存在交集的图像标记框以及对应的置信度后，可以按照从大到小的顺序对该置信度进行排序，从而在存在交集的图像标记框中确定置信度最大的第一标记框。

S207、根据该第一标记框与第二标记框的交集确定匹配值。

其中，该第二标记框为存在交集的图像标记框中除第一标记框外的其他标记框。

在一种可能的实现方式中，可以通过以下步骤确定该匹配值：

S1、获取该第一标记框与该第二标记框的交集的第一面积。

其中，由于第一标记框和第二标记框的四个角的坐标已知，因此，可以通过第一标记框和第二标记框的四个角的坐标得到交集部分的顶点的坐标，从而根据得到的坐标得到该第一标记框与该第二标记框的交集的第一面积。

S2、获取该第二标记框与该第一标记框的并集的第二面积。

其中，该第二面积可以分别根据第一标记框和第二标记框的四个角的坐标得到第一标记框标记的图像范围的面积以及第二标记框标记的图像范围的面积，并将得到的两个面积相加，由于相加后相当于将第二标记框与该第一标记框的交集的面积加了两次，因此还需要减去交集部分的面积，即可得到该第二面积。

S3、根据该第一面积和该第二面积通过以下公式确定该匹配值；

其中，P为该匹配值，S1为该第一面积，S2为该第二面积。

S208、确定该匹配值是否大于或者等于预设匹配值。

在确定该匹配值大于或者等于预设匹配值时，执行步骤S209和步骤S211；

这里，可以认为该第一标记框标记的物品图像对应的待识别物品和该第二标记框标记的物品图像对应的待识别物品是同一物品。

在确定该匹配值小于该预设匹配值时，执行步骤S210和步骤S211。

这里，可以认为该第一标记框标记的物品图像对应的待识别物品和该第二标记框标记的物品图像对应的待识别物品是不同物品，只是两个物品的位置离得非常近。

S209、确定该第一标记框为目标标记框且该第二标记框不是该目标标记框。

其中，该目标标记框用于标记该物品图像中确定属于目标类别的待识别物品的图像。

该目标类别可以是属于危险物品或者违禁物品的物品，如刀具或者枪等物品。

S210、确定该第一标记框和该第二标记框都为该目标标记框。

S211、在确定该目标标记框对应的置信度大于或者等于预设阈值时，输出包含该目标标记框的物品图像。

其中，该物品图像可以输出至安检人员所使用的终端(如电脑等)上，并通过终端显示给安检人员，安检人员通过该终端即可根据输出的物品图像确定目标标记框标记的物品的类别(如刀具或者枪等)和置信度。

需要说明的是，本步骤S211是在确定了目标标记框之后，确定该目标标记框对应的置信度大于或者等于预设阈值，但是考虑到数据处理的负担，在本公开另一实施例中，在得到第一图像标记框以及该第一图像标记框对应的置信度(即步骤S203)后，即可从第一图像标记框中确定第二图像标记框，该第二图像标记框为该第一图像标记框中置信度大于或者等于预设阈值的标记框，则在后续步骤中对第一图像标记框的相关处理都可以替换为对该第二图像标记框的处理，此时，在本步骤中，则无需确定目标标记框对应的置信度是否大于或者等于预设阈值，直接输出包含该目标标记框的物品图像即可，这样，相当于在对图像标记框进行处理之前，先将置信度相对较低的图像标记框去除，从而能够在后续步骤对图像标记框的处理过程中，减少运算量，降低数据处理的负担。

在输出包含该目标标记框的物品图像时，为了进一步提醒安检人员关注输出的物品图像，还可以发出提示信息，以提示安检人员通过终端查看物品图像。

采用上述方法，通过对获取的图像进行旋转，得到不同旋转角度下的多个旋转图像，并根据得到的多个旋转图像对待识别物品进行识别，从而通过不同角度的旋转图像准确的识别出目标类别的物品。

图6为本公开实施例提供的一种图像识别的装置，如图6所示，该装置包括：

获取模块601，用于获取待识别物品的物品图像；

旋转模块602，用于沿该物品图像的图像中心按照多个旋转角度旋转该物品图像得到的多个旋转图像；

处理模块603，用于通过预设分类模型从该多个旋转图像中，确定出第一图像标记以及该第一图像标记对应的置信度，其中，该第一图像标记用于标示该多个旋转图像中属于目标类别的待识别物品的图像；该置信度表示该第一图像标记标示出的待识别物品属于该目标类别的可信度；

确定模块604，用于根据该置信度和该第一图像标记在该物品图像中确定目标图像标记，其中，该目标图像标记用于标记该物品图像中确定属于该目标类别的待识别物品的图像。

可选地，如图7所示，该确定模块604包括：

反转子模块6041，用于获取该第一图像标记所在旋转图像对应的旋转方向，并确定与该旋转方向相反的反转方向，沿该第一图像标记所在旋转图像的图像中心由该反转方向按照该旋转角度旋转该第一图像标记，并将旋转后的第一图像标记叠加到该物品图像上；

确定子模块6042，用于根据旋转后的第一图像标记和该置信度在该物品图像中标记出目标物品图像。

可选地，该第一图像标记包括图像标记框，该确定子模块6042，用于确定该图像标记框中是否包括存在交集的图像标记框；在该图像标记框中包括存在交集的图像标记框时，从存在交集的图像标记框中确定置信度最大的第一标记框；根据该第一标记框与第二标记框的交集确定匹配值；该第二标记框为存在交集的图像标记框中除该第一标记框之外的其他标记框；在该匹配值大于或者等于预设匹配值时，确定该第一标记框为该目标标记框且该第二标记框不是该目标标记框；在该匹配值小于该预设匹配值时，确定该第一标记框和该第二标记框都为该目标标记框。

可选地，该确定子模块6042，用于获取该第二标记框与该第一标记框的交集的第一面积，获取该第二标记框与该第一标记框的并集的第二面积，并根据该第一面积和该第二面积通过以下公式确定该匹配值；

其中，P为该匹配值，S1为该第一面积，S2为该第二面积。

可选地，该确定模块604，用于从该第一图像标记中确定第二图像标记；该第二图像标记为该第一图像标记中置信度大于或者等于预设阈值的图像标记，并根据该置信度和该第二图像标记在该物品图像中标记出目标物品图像。

需要说明的是，所属本领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置的具体工作过程和描述，可以参考前述方法实施例中的对应过程，在此不再赘述。

采用上述装置，通过对获取的图像进行旋转，得到不同旋转角度下的多个旋转图像，并根据得到的多个旋转图像对待识别物品进行识别，从而通过不同角度的旋转图像准确的识别出目标类别的物品。

本发明实施例还提供一种安检设备，该安检设备包括上述图像识别的装置。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

1.一种图像识别的方法，其特征在于，包括：

获取待识别物品的物品图像；

沿所述物品图像的图像中心按照多个旋转角度旋转所述物品图像得到的多个旋转图像；

通过预设分类模型从所述多个旋转图像中，确定出第一图像标记以及所述第一图像标记对应的置信度，其中，所述第一图像标记用于标示所述多个旋转图像中属于目标类别的待识别物品的图像；所述置信度表示所述第一图像标记标示出的待识别物品属于所述目标类别的可信度；所述预设分类模型为通过图像样本对神经网络模型进行训练后获取到的训练好的神经网络模型；

根据所述置信度和所述第一图像标记在所述物品图像中确定目标图像标记，其中，所述目标图像标记用于标记所述物品图像中确定属于所述目标类别的待识别物品的图像；

所述根据所述置信度和所述第一图像标记在所述物品图像中标记出目标物品图像包括：

获取所述第一图像标记所在旋转图像对应的旋转方向；

确定与所述旋转方向相反的反转方向；

沿所述第一图像标记所在旋转图像的图像中心由所述反转方向按照所述旋转角度旋转所述第一图像标记，并将旋转后的第一图像标记叠加到所述物品图像上；

根据旋转后的第一图像标记和所述置信度在所述物品图像中标记出目标物品图像；

所述第一图像标记包括图像标记框，在所述根据旋转后的第一图像标记和所述置信度在所述物品图像中标记出目标物品图像前，所述方法还包括：

根据所述图像标记框的四个角对应的坐标，获取所述图像标记框外接的最小矩形框；

将所述最小矩形框作为所述图像标记框。

2.根据权利要求1所述的方法，其特征在于，所述根据旋转后的第一图像标记和所述置信度在所述物品图像中标记出目标物品图像包括：

确定所述图像标记框中是否包括存在交集的图像标记框；

在所述图像标记框中包括存在交集的图像标记框时，从存在交集的图像标记框中确定置信度最大的第一标记框；

根据所述第一标记框与第二标记框的交集确定匹配值；所述第二标记框为存在交集的图像标记框中除所述第一标记框之外的其他标记框；

在所述匹配值大于或者等于预设匹配值时，确定所述第一标记框为目标标记框且所述第二标记框不是目标标记框；

在所述匹配值小于所述预设匹配值时，确定所述第一标记框和所述第二标记框都为目标标记框。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第二标记框与所述第一标记框的交集确定匹配值包括：

获取所述第二标记框与所述第一标记框的交集的第一面积；

获取所述第二标记框与所述第一标记框的并集的第二面积；

根据所述第一面积和所述第二面积通过以下公式确定所述匹配值；

4.根据权利要求1所述的方法，其特征在于，所述根据所述置信度和所述第一图像标记在所述物品图像中标记出目标物品图像包括：

从所述第一图像标记中确定第二图像标记；所述第二图像标记为所述第一图像标记中置信度大于或者等于预设阈值的图像标记；

根据所述置信度和所述第二图像标记在所述物品图像中标记出目标物品图像。

5.一种图像识别的装置，其特征在于，包括：

获取模块，用于获取待识别物品的物品图像；

旋转模块，用于沿所述物品图像的图像中心按照多个旋转角度旋转所述物品图像得到的多个旋转图像；

处理模块，用于通过预设分类模型从所述多个旋转图像中，确定出第一图像标记以及所述第一图像标记对应的置信度，其中，所述第一图像标记用于标示所述多个旋转图像中属于目标类别的待识别物品的图像；所述置信度表示所述第一图像标记标示出的待识别物品属于所述目标类别的可信度；所述预设分类模型为通过图像样本对神经网络模型进行训练后获取到的训练好的神经网络模型；

确定模块，用于根据所述置信度和所述第一图像标记在所述物品图像中确定目标图像标记，其中，所述目标图像标记用于标记所述物品图像中确定属于所述目标类别的待识别物品的图像；

所述确定模块包括：

反转子模块，用于获取所述第一图像标记所在旋转图像对应的旋转方向，并确定与所述旋转方向相反的反转方向，沿所述第一图像标记所在旋转图像的图像中心由所述反转方向按照所述旋转角度旋转所述第一图像标记，并将旋转后的第一图像标记叠加到所述物品图像上；

确定子模块，用于根据旋转后的第一图像标记和所述置信度在所述物品图像中标记出目标物品图像；

所述第一图像标记包括图像标记框，所述装置还包括：

矩阵框获取模块，用于根据所述图像标记框的四个角对应的坐标，获取所述图像标记框外接的最小矩形框；

标记框确定模块，用于将所述最小矩形框作为所述图像标记框。

6.根据权利要求5所述的装置，其特征在于，所述确定子模块，用于确定所述图像标记框中是否包括存在交集的图像标记框；在所述图像标记框中包括存在交集的图像标记框时，从存在交集的图像标记框中确定置信度最大的第一标记框；根据所述第一标记框与第二标记框的交集确定匹配值；所述第二标记框为存在交集的图像标记框中除所述第一标记框之外的其他标记框；在所述匹配值大于或者等于预设匹配值时，确定所述第一标记框为目标标记框且所述第二标记框不是目标标记框；在所述匹配值小于所述预设匹配值时，确定所述第一标记框和所述第二标记框都为目标标记框。

7.根据权利要求6所述的装置，其特征在于，所述确定子模块，用于获取所述第二标记框与所述第一标记框的交集的第一面积，获取所述第二标记框与所述第一标记框的并集的第二面积，并根据所述第一面积和所述第二面积通过以下公式确定所述匹配值；

8.根据权利要求5所述的装置，其特征在于，所述确定模块，用于从所述第一图像标记中确定第二图像标记；所述第二图像标记为所述第一图像标记中置信度大于或者等于预设阈值的图像标记，并根据所述置信度和所述第二图像标记在所述物品图像中标记出目标物品图像。