WO2022266996A1

WO2022266996A1 - 物体检知方法及物体检知装置

Info

Publication number: WO2022266996A1
Application number: PCT/CN2021/102347
Authority: WO
Inventors: 贾书军; 李想; 曙光; 王迎春; 张烨
Original assignee: 烟台创迹软件有限公司
Priority date: 2021-06-25
Filing date: 2021-06-25
Publication date: 2022-12-29
Also published as: CN117616468A; JP2024522881A

Abstract

一种物体检知方法和装置，该方法包括：图像获取步骤，获取包含物体的图像；第1检知步骤，使用矩形的第1检知框来检知图像中的物体；检知框设定步骤，设定与所检知的物体对应的非矩形的第2检知框；及第2检知步骤，使用第2检知框来检知物体。

Description

物体检知方法及物体检知装置

技术领域

本发明涉及一种从图像检知物体的物体检知方法及物体检知装置。

背景技术

随着智能零售时代的到来，货架的位置、商品的数量或商品的放置位置等信息对零售企业来说非常重要。并且，掌握货架上的商品的动向在确定销售活动和管理政策上具有重要意义。为了使人们不去货架上就能够掌握该货架上的商品的动向，需要检知及识别货架上的商品，并准确地掌握货架上的商品陈列信息。

在专利文献1中，公开有商品的检知方法的一例。在专利文献1中，公开有获取陈列商品的图像并检知图像中的商品，根据各商品的空间位置关系，截取各商品的图像并进行商品的分类。

专利文献1：中国专利申请公开第110738123号说明书

在专利文献1中，成为使用长方形或正方形等的矩形的框来截取各商品的图像的结构。但是，有时根据获取商品的图像时的摄影角度等，图像内的商品的外形变形而变得不是矩形。此时，有时在所截取的图像中不包含应检知的商品的一部分或包含除了应检知的商品以外的图像，从而导致商品的检知精度降低。

发明内容

本发明用于解决如上所述的课题，其目的在于获得能够提高物体的检知精度的物体检知方法及物体检知装置。

本发明所涉及的物体检知方法包括：图像获取步骤，获取包含物体的图像；第1检知步骤，使用矩形的第1检知框来检知图像中的物体；检知框设定步骤，设定与所检知的物体对应的非矩形的第2检知框；及第2检知步骤，使用第2检知框来检知物体。

本发明所涉及的物体检知装置具备：图像获取部，获取包含物体的图像；第1检知部，使用矩形的第1检知框来检知图像中的物体；检知框设定部，设定与所检知的物体对应的非矩形的第2检知框；及第2检知部，使用第2检知框来检知物体。

发明效果

根据本发明的物体检知方法及物体检知装置，通过使用与所检知的物体对应的非矩形的第2检知框来检知物体，能够提高物体的检知精度。

附图说明

图1是实施方式1所涉及的物体信息获取系统的概略结构图。

图2是实施方式1所涉及的物体信息获取系统的控制框图。

图3是实施方式1所涉及的物体信息获取处理的流程图。

图4是由摄影装置2拍摄的货架的正面图像的一例。

图5是实施方式1所涉及的物体检知处理的流程图。

图6是基于实施方式1所涉及的第1检知部的检知结果的一例。

图7是基于实施方式1所涉及的第2检知部的检知结果的一例。

图8是实施方式2所涉及的物体信息获取处理的流程图。

具体实施方式

以下，参考附图对本发明的实施方式的物体检知方法及物体检知装置进行说明。另外，在各图中，对相同或相等的部分标注相同符号，并适当省略或简化其说明。并且，关于各图中所记载的结构，其形状、大小及配置等能够在本发明的范围内适当变更。

实施方式1.

图1是实施方式1所涉及的物体信息获取系统100的概略结构图。本实施方式的物体信息获取系统100为如下系统：在超市等零售商店中使用，并且自动检知及识别作为容纳于商店内的货架S上的商品的物体P并获取容纳于货架S上的物体P的信息。物体信息获取系统100由处理装置1和摄影装置2构成。处理装置1为具备CPU及存储器的PC或云上的服务器等。摄影装置2为设置于商店的天花板或墙壁上且拍摄货架S的正面图像的照相机。处理装置1和摄影装置2通过有线或无线连接为可通信。由摄影装置2拍摄的图像发送至处理装置1。

图2是实施方式1所涉及的物体信息获取系统100的控制框图。处理装置1具有：物体检知部10，从图像检知物体P；物体识别部20，识别所检知的物体P；及存储部30。物体检知部10及物体识别部20为通过由CPU执行程序来实现的功能部。或者，物体检知部10及物体识别部20也可以通过专用处理电路来实现。

物体检知部10具有图像获取部11、第1检知部12、检知框设定部13及第2检知部14。图像获取部11获取由摄影装置2拍摄的图像并发送至第1检知部12。第1检知部12利用使用了深度学习的SSD(Single Shot Multibox Detector：目标检知算法)等算法来检知所获取的图像中的物体P。在第1检知部12中，使用矩形的第1检知框F1来进行物体P的检知。

检知框设定部13设定与由第1检知部12检知的物体P对应的非矩形的第2检知框F2。第2检知部14使用由检知框设定部13设定的第2检知框F2来检知物体P，并将检知结果发送至物体识别部20。

物体识别部20根据货架信息及商品信息来识别由物体检知部10的第2检知部14检知的图像中所包含的物体P。在物体识别部20中，通过使用了已知的机器学习的算法来识别物体P的种类及商品名称。

存储部30例如为RAM、ROM或闪存等易失性或非易失性的存储器。存储部30存储由物体检知部10及物体识别部20执行的程序及在程序中所使用的各种参数以及货架信息、商品信息、检知框数据及检知历史等。货架信息包含商店内的各货架S的位置、容纳于各货架S上的商品的分类、各货架S的节数及尺寸、各货架S上的检知框的数量。商品信息包含商品的种类及名称等识别信息。检知框数据为成为由检知框设定部13设定的第2检知框F2的候选的多个非矩形的检知框的数据。

图3是实施方式1所涉及的物体信息获取处理的流程图。本处理由处理装置1定期执行。首先，进行系统的初始化(S1)。其中，对物体信息获取处理的各参数设定初始值。参数为检知框的数量、每一节货架能够检知的最大检知框数、货架的最大节数、检知框的种类等。然后，由摄影装置2拍摄货架S的正面图像，并由处理装置1的图像获取部11获取(S2)。

然后，物体检知部10根据所获取的图像执行物体检知处理(S3)。由此，检知图像中所包含的多个物体P。若通过物体检知处理检知到物体P，则由物体识别部20执行物体识别处理(S4)。由此，能够识别所检知的物体P，并获取容纳于货架S上的物体P的信息。所获取的物体P的信息被发送至管理服务器等，并用于掌握销售数据或商品管理等中。

接着，对本实施方式的物体检知处理进行说明。图4是由摄影装置2拍摄的货架S的正面图像的一例。其中，在通常的物体检知的算法中，使用长方形或正方形的矩形的检知框来进行物体检知。但是，在将摄影装置2设置于天花板或墙壁的上方且从上方拍摄货架S的图像的情况下，如图4所示，图像内的物体P的外形从矩形变形。因此，在本实施方式的物体检知处理中，在将检知物体的检知框设定为适合图像的变形的检知框之后，进行图像的检知。

图5是实施方式1所涉及的物体检知处理的流程图。在本处理中，首先根据所获取的图像，由第1检知部12进行第1检知(S31)。其中，使用矩形的第1检知框F1来检知物体P。图6是基于实施方式1所涉及的第1检知部12的检知结果的一例。

接着，通过检知框设定部13将存储于存储部30中的多个非矩形的检知框应用于所检知的各物体P，并获取每个检知框的可靠度(S32)。多个非矩形的检知框的形状为平行四边形、梯形、圆形或椭圆形等。并且，每个形状包含多个尺寸的框。然后，使非矩形的检知框的中心坐标与包含通过第1检知所检知的物体P的矩形的第1检知框F1的中心坐标一致，并获取非矩形的检知框的可靠度。关于每个检知框的可靠度，根据将多个非矩形的检知框应用于物体P时的、检知框内的物体P的面积的大小(物体P与非矩形的检知框的共用部位的面积的大小)或检知框内的除了物体P以外的面积的大小(物体P与非矩形的检知框的不共用部位的面积的大小)来获取。具体而言，检知框内的物体P的面积越大，可靠度越高，并且检知框内的除了物体P以外的面积越小，可靠度越高。换言之，物体P的面积与检知框的面积的比例越高，可靠度越高。

接着，检知框设定部13进行多个非矩形的检知框的过滤(S33)。其中，从候选中排除多个非矩形的检知框中的可靠度低于预先设定的阈值的检知框。然后，检知框设定部13针对每个物体P获取可靠度为阈值以上的多个非矩形的检知框的中心坐标(S34)。检知框设定部13使用所获取的中心坐标来进行图像中的每个物体P的轮廓检知，并获取物体P的轮廓的位置信息(S35)。关于物体P的轮廓检知，可以使用边缘检测等已知的轮廓检知算法。其中，对多个非矩形的检知框的中心坐标中的每一个进行物体P的轮廓检知。另外，通过在步骤S33中过滤可靠度低的检知框，能够抑制发生非矩形的检知框的中心坐标位于物体P的外部而无法检知物体P的轮廓的异常。

检知框设定部13将非矩形的检知框与物体P的轮廓进行比较(S36)。然后，将包含物体P的所有轮廓的非矩形的检知框设定为第2检知框F2(S37)。对每个物体P进行步骤S36及步骤S37，从而设定与各物体P对应的第2检知框F2。所设定的第2检知框F2的形状及位置存储于存储部30中。其中，在包含物体P的所有轮廓的非矩形的检知框存在多个的情况下，将可靠度最高的检知框作为第2检知框F2。如上所述，可靠度根据物体P的面积与检知框的面积的比例来求出。并且，在可靠度最高的检知框存在多个的情况下，选择任意一个作为第2检知框F2。此时，使用计算重叠面积的重复检知算法，若彼此重叠面积的比例为阈值以上，则判断为相同，从而可以仅留下一个。由此，针对每个物体P选择最佳的检知框。

然后，由第2检知部14进行第2检知(S38)。在第2检知中，使用所设定的第2检知框F2来检知物体P。图7是基于实施方式1所涉及的第2检知部14的检知结果的一例。

如图7所示，通过进行本实施方式的物体检知处理，能够使用沿物体P的外形的第2检知框F2来进行物体P的检知。由此，即使在由于摄影角度的影响等而图像中的物体P 变形的情况下，也能够抑制检知不到物体P的一部分的情况及检知除了物体P以外的物体的情况，从而能够提高物体P的检知精度。尤其，对于容纳于货架S上的商品等密集配置的物体P，通过使用沿物体的外形的检知框，不仅提高精度，并且还提高检知速度。

另外，在物体检知处理中，为了进一步提高检知精度，可以进行下述处理。如图4所示，根据货架S上的物体P的位置，物体P的变形即物体P的倾斜度不同。例如，配置于货架S的右侧的物体P与配置于左侧的物体P的倾斜度不同。因此，检知框设定部13可以将在步骤S33中进行了过滤的多个非矩形的检知框聚集在物体P在货架S的位置上，将倾斜度与相同集群内的其他检知框不同的检知框检测为错误，并从候选中排除。或者，检知框设定部13可以从摄影装置2的位置信息估计物体P的倾斜度，将具有与所估计的倾斜度不同的倾斜度的非矩形的检知框检测为错误，并从候选中排除。而且，检知框设定部13可以根据货架信息将大于货架尺寸的非矩形的检知框检测为错误，并从候选中排除。

实施方式2.

图8是实施方式2所涉及的物体信息获取处理的流程图。本实施方式中的物体信息获取系统100的结构与实施方式1相同。

在本实施方式的物体信息获取处理中，与实施方式1同样地实施初始化(S1)及图像的获取(S2)。然后，物体检知部10根据检知历史来判断本次的检知是否为再检知(S11)。再检知是指如下情况：过去对货架S进行了物体检知并存储有对货架S的物体的第2检知框F2。在本次的检知不是再检知的情况即为第一次检知的情况下(S11：“否”)，与实施方式1同样地执行物体检知处理(S3)及物体识别处理(S4)。

另一方面，在本次的检知为再检知的情况下(S11：“是”)，获取在上次进行检知时由摄影装置2获取的图像与本次由摄影装置2拍摄的图像的差分(S12)。然后，对差分区域执行物体检知处理(S3)及物体识别处理(S4)。即，在本实施方式中，仅对自上次存在变更的区域进行物体P的检知及物体P的识别，并且其他区域中的物体P的信息被设为与上次相同。

根据本实施方式，通过仅对存在变化的区域进行物体检知处理及物体识别处理，能够实现再检知时的处理负担的减轻及处理速度的提高。

以上为实施方式的说明，但是上述实施方式能够变形及组合。例如，在实施方式1中，由检知框设定部13进行图5的步骤S32～S36的处理来设定了第2检知框F2，但是并不限定于此。例如，检知框设定部13可以从摄影装置2的位置信息估计物体P的倾斜度，并将具有所估计的倾斜度的非矩形的检知框设定为第2检知框F2。或者，检知框设定部13可以将在图5的步骤S32中所获取的可靠度最高的检知框设定为第2检知框F2。或者，检知框设定部13可以进行由第1检知部12检知的物体P的轮廓检知，将存储于存储部30中的多个非矩形的检知框与物体P的轮廓进行比较，并将包含物体P的轮廓的检知框设定为第2检知框F2。

并且，物体检知部10可以将矩形的第1检知框F1作为第2检知框F2的候选之一，并进行图5的步骤S32～S36的处理。在第1检知框F1包含物体P的所有轮廓且可靠度高于非矩形的检知框的情况下，物体检知部10将第1检知框F1作为第2检知框F2。或者，物体检知部10可以将与第1检知框F1的大小不同的矩形的检知框作为第2检知框F2的候选，并进行图5的步骤S32～S36的处理。

并且，上述实施方式从零售店的商店的货架S的图像检知作为商品的物体P，但是并不限定于此，能够应用于从包含多个物体的图像检知物体的方法。

而且，在上述实施方式中，处理装置1被设为具有物体检知部10和物体识别部20的结构，但是可以分体构成具有物体检知部10的物体检知装置与具有物体识别部20的物体识别装置。

符号说明

1-处理装置，2-摄影装置，10-物体检知部，11-图像获取部，12-第1检知部，13-检知框设定部，14-第2检知部，20-物体识别部，30-存储部，100-物体信息获取系统，F1-第1检知框，F2-第2检知框，P-物体，S-货架。

Claims

一种物体检知方法，其包括：

图像获取步骤，获取包含物体的图像；

第1检知步骤，使用矩形的第1检知框来检知所述图像中的所述物体；

检知框设定步骤，设定与所检知的所述物体对应的非矩形的第2检知框；及

第2检知步骤，使用所述第2检知框来检知所述物体。
根据权利要求1所述的物体检知方法，其中，

所述检知框设定步骤包括：

将多个非矩形的检知框应用于在所述第1检知步骤中所检知的所述物体的步骤；

获取所述多个非矩形的检知框中的每一个的可靠度的步骤；及

从所述第2检知框的候选中排除所述多个非矩形的检知框中的所述可靠度小于预先设定的阈值的检知框的步骤。
根据权利要求2所述的物体检知方法，其中，

所述检知框设定步骤包括：

获取所述可靠度为所述阈值以上的检知框的中心坐标的步骤；

使用所述中心坐标来进行所述物体的轮廓的检知的步骤；及

将所述检知框与所述物体的所述轮廓进行比较，并将包含所述物体的所有所述轮廓的检知框设定为所述第2检知框的步骤。
根据权利要求2所述的物体检知方法，其中，

所述检知框设定步骤包括将应用于所述物体的所述多个非矩形的检知框聚集在所述物体的位置上并从所述第2检知框的候选中排除倾斜度与相同集群内的其他检知框不同的检知框的步骤。
根据权利要求2所述的物体检知方法，其中，

所述检知框设定步骤包括从拍摄所述图像的摄影装置的位置信息估计所述物体的倾斜度并从所述第2检知框的候选中排除具有与所估计的倾斜度不同的倾斜度的非矩形的检知框的步骤。
根据权利要求1所述的物体检知方法，其中，

所述检知框设定步骤包括：

进行所述物体的轮廓的检知的步骤；及

将多个非矩形的检知框与所述物体的所述轮廓进行比较，并将包含所述物体的所有所述轮廓的检知框设定为所述第2检知框的步骤。
根据权利要求1所述的物体检知方法，其中，

所述检知框设定步骤包括从拍摄所述图像的摄影装置的位置信息估计所述物体的倾斜度并将具有所估计的倾斜度的非矩形的检知框设定为所述第2检知框的步骤。
根据权利要求1所述的物体检知方法，其中，

所述检知框设定步骤包括：

将多个非矩形的检知框应用于在所述第1检知步骤中所检知的所述物体的步骤；

获取所述多个非矩形的检知框中的每一个的可靠度的步骤；及

将所述可靠度最高的检知框设定为所述第2检知框的步骤。
根据权利要求1至8中任一项所述的物体检知方法，其还具备判定是否为再检知的步骤，

在为所述再检知的情况下，对上次的图像与本次的图像的差分区域实施所述第1检知步骤、所述检知框设定步骤及所述第2检知步骤。
根据权利要求1至9中任一项所述的物体检知方法，其中，

所述第2检知框为平行四边形或梯形。
一种物体检知装置，其具备：

图像获取部，获取包含物体的图像；

第1检知部，使用矩形的第1检知框来检知所述图像中的所述物体；

检知框设定部，设定与所检知的所述物体对应的非矩形的第2检知框；及

第2检知部，使用所述第2检知框来检知所述物体。