CN116128954B

CN116128954B - 一种基于生成网络的商品布局识别方法、装置及存储介质

Info

Publication number: CN116128954B
Application number: CN202211732422.9A
Authority: CN
Inventors: 马春春; 梁鹏文
Original assignee: Shanghai Qiangtong Intelligent Technology Co ltd
Current assignee: Shanghai Qiangtong Intelligent Technology Co ltd
Priority date: 2022-12-30
Filing date: 2022-12-30
Publication date: 2023-12-05
Anticipated expiration: 2042-12-30
Also published as: CN116128954A

Abstract

本申请公开了一种基于生成网络的商品布局识别方法、装置及存储介质，其中该方法，包括：获取地堆图片；将一个随机向量输入训练好的生成网络，生成商品框数据，其中所述随机向量为随机生成的、服从正态分布的向量；对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长，其中所述真实的商品框数据通过所述地堆图片获得；将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型。从而，后续可以使用训练好的回归模型端对端的直接预测地堆的周长面积等指标，提升了地堆各指标的计算准确率。并且，基于生成网络生成商品框数据，节省了大量的人力物力。

Description

一种基于生成网络的商品布局识别方法、装置及存储介质

技术领域

本申请涉及商品布局识别技术领域，特别是涉及一种基于生成网络的商品布局识别方法、装置及存储介质。

背景技术

在零售行业，需要对一些地堆的表面积，周长等指标进行估算。现有的地堆识别技术方案为：提取图片识别结果的地堆场景，计算地堆底层的投影边；根据所述投影边判断所述地堆场景的类型，为不同类型匹配不同方法计算得到分层投影线；根据所述分层投影线中的最长投影线计算地堆面积。但是，由于地堆形状十分复杂，根据图片识别结果计算地堆投影边准确率低，也很难根据投影边准确判断出地堆场景的类型，导致最终计算所得到的地堆面积以及周长等指标误差较大。

针对上述的现有技术中存在的地堆各指标的计算准确率低的技术问题，目前尚未提出有效的解决方案。

发明内容

本发明的实施例提供了一种基于生成网络的商品布局识别方法、装置及存储介质，以至少解决现有技术中存在的地堆各指标的计算准确率低的技术问题。

根据本发明实施例的一个方面，提供了一种基于生成网络的商品布局识别方法，包括：获取地堆图片；将一个随机向量输入训练好的生成网络，生成商品框数据，其中所述随机向量为随机生成的、服从正态分布的向量；对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长，其中所述真实的商品框数据通过所述地堆图片获得；将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型。

可选地，通过以下方式对生成网络进行训练：将一个随机向量输入生成网络的生成器，生成商品框信息，其中所述商品框信息包括商品框的坐标、高度和宽度；根据生成器生成的商品框信息，将对应的商品框画到一个空白背景上，得到生成图片，作为负样本；根据人工标注的真实的商品框信息，将对应的商品框画到另一个空白背景上，得到真实图片，作为正样本；将两种样本通过生成网络的分类器分类，判别当前图片是真实图片或者生成图片。

可选地，该方法还包括：获取待识别商品布局的目标地堆图片；使用训练好的回归模型，对目标地堆图片进行识别，确定目标地堆图片中地堆的面积和周长。

可选地，采用LSTM网络作为生成器，每个LSTM单元接收上层单元的隐层输出作为输入，输出一个标注框数据或者停止标志。

根据本发明实施例的另一个方面，还提供了一种基于生成网络的商品布局识别装置，包括：第一获取模块，用于获取地堆图片；生成模块，用于将一个随机向量输入训练好的生成网络，生成商品框数据，其中所述随机向量为随机生成的、服从正态分布的向量；确定模块，用于对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长，其中所述真实的商品框数据通过所述地堆图片获得；训练模块，用于将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型。

可选地，所述装置还包括训练模块，用于通过以下方式对生成网络进行训练：将一个随机向量输入生成网络的生成器，生成商品框信息，其中所述商品框信息包括商品框的坐标、高度和宽度；根据生成器生成的商品框信息，将对应的商品框画到一个空白背景上，得到生成图片，作为负样本；根据人工标注的真实的商品框信息，将对应的商品框画到另一个空白背景上，得到真实图片，作为正样本；将两种样本通过生成网络的分类器分类，判别当前图片是真实图片或者生成图片。

可选地，所述装置还包括：第二获取模块，用于获取待识别商品布局的目标地堆图片；识别模块，用于使用训练好的回归模型，对目标地堆图片进行识别，确定目标地堆图片中地堆的面积和周长。

根据本发明实施例的另一个方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时由处理器执行以上任意一项所述的方法。

根据本发明实施例的另一个方面，还提供了一种电子设备，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述可执行指令以实现以上任意一项所述的方法。

在本发明实施例中，首先获取地堆图片，然后将一个随机向量输入训练好的生成网络，生成商品框数据，其次对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长，最后将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型。从而，后续可以使用训练好的回归模型端对端的直接预测地堆的周长面积等指标，提升了地堆各指标的计算准确率。并且，基于生成网络生成商品框数据，节省了大量的人力物力。进而解决了现有技术中存在的地堆各指标的计算准确率低的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是用于实现根据本发明实施例1所述的方法的计算设备的硬件结构框图；

图2是根据本发明实施例1所述的基于生成网络的商品布局识别方法的流程示意图；

图3是根据本发明实施例1所述的地堆图片的示意图；

图4是根据本发明实施例1所述的生成器的网络示意图；

图5是根据本发明实施例1所述的分类器的网络示意图；

图6是根据本发明实施例1所述的将生成的商品框数据画到空白背景上的一个示意图；

图7是根据本发明实施例1所述的标注有商品框的地堆图片的示意图；以及

图8是根据本发明实施例2所述的基于生成网络的商品布局识别装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本实施例，提供了一种基于生成网络的商品布局识别方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示出了一种用于实现基于生成网络的商品布局识别方法的计算设备的硬件结构框图。如图1所示，计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算设备还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本发明实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器可用于存储应用软件的软件程序以及模块，如本发明实施例中的基于生成网络的商品布局识别方法对应的程序指令/数据存储装置，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的基于生成网络的商品布局识别方法。存储器可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中，传输装置包括一个网络适配器(NetworkInterfaceController，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算设备的用户界面进行交互。

此处需要说明的是，在一些可选实施例中，上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是，图1仅为特定具体实例的一个实例，并且旨在示出可存在于上述计算设备中的部件的类型。

在上述运行环境下，根据本实施例，提供了一种基于生成网络的商品布局识别方法。图2示出了该方法的流程示意图，参考图2所示，该方法包括：

S202：获取地堆图片。

在本发明实施例中，可以通过拍摄得到一些地堆图片，如图3所示。

S204：将一个随机向量输入训练好的生成网络，生成商品框数据，其中所述随机向量为随机生成的、服从正态分布的向量。

在本发明实施例中，考虑到地堆标注数据较少，很难得到大量的标注好的数据框，因此可以使用一个随机向量作为输入，训练好的生成网络会不断的输出标注框的数据。其中随机向量为随机生成的、服从正态分布的向量。例如但不限于为，将一个随机向量输入生成网络之后，生成网络会首先生成(100,60,30,20)的商品框数据，代表在坐标(100,60)处有一个宽为30，高为20的商品框，然后生成网络会继续输出(200,19,100,40)的商品框数据，依次类推，直到生成网络输出了“STOP”，代表所有商品框生成完成。

通过这种方式，可以生成大量的地堆标注框数据，从而为后续回归模型的训练提供数据支撑。

在本发明实施例中，生成网络包括生成器和分类器。其中，图4示出了生成器的网络示意图，图5示出了分类器的网络示意图。由于需要输出不定长的标注框数据，因此采用LSTM网络作为生成器，每个LSTM单元接收上层单元的隐层输出作为输入，然后输出一个标注框数据或者停止标志，参见图4所示。生成器生成的商品框为一个长度为4的向量，其中每个值分别代表：商品框左上角x坐标，商品框左上角y坐标，商品框宽度，商品框高度，如(100,60,20,20)。

进一步地，将生成器生成的商品框画到一个全黑背景的图片上，得到生成图片，作为负样本，如图6所示。为了保证输入的一致性，也将人工标注得到的图片商品框画到一个全黑背景的图片上，得到真实图片，作为正样本。将两种样本通过分类器分类。分类器仅仅判别图片是真实图片还是生成器生成的假图片，不对周长面积等进行计算。通过这种方式，实现了生成网络进行对抗训练。生成网络完成训练后，可以应用生成网络的生成器，根据拍摄得到的少量的地堆图片，生成大量的地堆标注框数据，节省了大量的人力物力。

S206：对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长。

在本发明实施例中，人工标注指的是给一张地堆图片，由人来估算这个地堆的周长和面积。为了解决通过规则对地堆面积周长测算不准确的问题，本发明需要通过人工标注的方式确定生成的商品框数据以及真实的商品框数据的地堆面积和周长，以作为标准答案，为后续回归模型的训练提供数据支撑。

需要特别说明的是，由于商品框是平面的，整张地堆照片上的多个框组成的集合是立体的，因此可以通过这多个商品框来推算出地堆的形态，从而确定出地堆的周长和面积。其中，带有商品框的地堆图片如图7所示。

S208：将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型。

在本发明实施例中，使用回归模型来训练，回归模型的输入是生成器生成的商品框数据，将人工标注的周长面积作为标准答案来训练回归模型。因为有人估算的周长面积作为标准答案，所以回归模型能够学着去估算地堆的周长面积。从而，可以将商品框数据及标注的面积周长作为训练集训练回归模型，端对端的预测地堆的面积和周长。

在本发明实施例中，完成回归模型的训练后，可以获取待识别商品布局的目标地堆图片，然后使用训练好的回归模型，对目标地堆图片进行识别，确定目标地堆图片中地堆的面积和周长。通过这种方式，保证了预测的面积和周长的准确性，从而提升了地堆各指标的计算准确率。

从而，本发明提出的基于生成网络的商品布局识别方法，首先获取地堆图片，然后将一个随机向量输入训练好的生成网络，生成商品框数据，其次对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长，最后将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型。从而，后续可以使用训练好的回归模型端对端的直接预测地堆的周长面积等指标，提升了地堆各指标的计算准确率。并且，基于生成网络生成商品框数据，节省了大量的人力物力。进而解决了现有技术中存在的地堆各指标的计算准确率低的技术问题。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

图7示出了根据本实施例所述的基于生成网络的商品布局识别装置700，该装置700与根据实施例1所述的方法相对应。参考图7所示，该装置500包括：第一获取模块710，用于获取地堆图片；生成模块720，用于将一个随机向量输入训练好的生成网络，生成商品框数据，其中所述随机向量为随机生成的、服从正态分布的向量；确定模块730，用于对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长；训练模块740，用于将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型。

从而根据本实施例，首先获取地堆图片，然后将一个随机向量输入训练好的生成网络，生成商品框数据，其中所述随机向量为随机生成的、服从正态分布的向量，其次对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长，最后将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型。从而，后续可以使用训练好的回归模型端对端的直接预测地堆的周长面积等指标，提升了地堆各指标的计算准确率。并且，基于生成网络生成商品框数据，节省了大量的人力物力。进而解决了现有技术中存在的地堆各指标的计算准确率低的技术问题。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于生成网络的商品布局识别方法，其特征在于，包括：

获取地堆图片；

将一个随机向量输入训练好的生成网络，生成商品框数据，其中所述随机向量为随机生成的、服从正态分布的向量；

对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长，其中所述真实的商品框数据通过所述地堆图片获得；

将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型，包括：将一个随机向量输入生成网络的生成器，生成商品框信息，其中所述商品框信息包括商品框的坐标、高度和宽度；根据生成器生成的商品框信息，将对应的商品框画到一个空白背景上，得到生成图片，作为负样本；根据人工标注的真实的商品框信息，将对应的商品框画到另一个空白背景上，得到真实图片，作为正样本；将两种样本通过生成网络的分类器分类，判别当前图片是真实图片或者生成图片，其中，所述生成器采用LSTM网络，每个LSTM单元接收上层单元的隐层输出作为输入，输出一个标注框数据或者停止标志；

获取待识别商品布局的目标地堆图片；使用训练好的回归模型，对目标地堆图片进行识别，确定目标地堆图片中地堆的面积和周长。

2.一种基于生成网络的商品布局识别装置，其特征在于，包括：

第一获取模块，用于获取地堆图片；

生成模块，用于将一个随机向量输入训练好的生成网络，生成商品框数据，其中所述随机向量为随机生成的、服从正态分布的向量；

确定模块，用于对生成的商品框数据以及真实的商品框数据进行人工标注，确定地堆面积和周长，其中所述真实的商品框数据通过所述地堆图片获得；

训练模块，用于将生成的商品框数据作为输入数据，将人工标注的地堆面积和周长作为答案，训练预设的回归模型，包括：将一个随机向量输入生成网络的生成器，生成商品框信息，其中所述商品框信息包括商品框的坐标、高度和宽度；根据生成器生成的商品框信息，将对应的商品框画到一个空白背景上，得到生成图片，作为负样本；根据人工标注的真实的商品框信息，将对应的商品框画到另一个空白背景上，得到真实图片，作为正样本；将两种样本通过生成网络的分类器分类，判别当前图片是真实图片或者生成图片，其中，所述生成器采用LSTM网络，每个LSTM单元接收上层单元的隐层输出作为输入，输出一个标注框数据或者停止标志；

3.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时由处理器执行权利要求1所述的方法。

4.一种电子设备，其特征在于，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述可执行指令以实现上述权利要求1所述的方法。