CN116128954B - 一种基于生成网络的商品布局识别方法、装置及存储介质 - Google Patents
一种基于生成网络的商品布局识别方法、装置及存储介质 Download PDFInfo
- Publication number
- CN116128954B CN116128954B CN202211732422.9A CN202211732422A CN116128954B CN 116128954 B CN116128954 B CN 116128954B CN 202211732422 A CN202211732422 A CN 202211732422A CN 116128954 B CN116128954 B CN 116128954B
- Authority
- CN
- China
- Prior art keywords
- commodity
- picture
- pile
- commodity frame
- frame data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 24
- 238000004364 calculation method Methods 0.000 abstract description 12
- 239000000463 material Substances 0.000 abstract description 5
- 238000012545 processing Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Geometry (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Document Processing Apparatus (AREA)
Abstract
本申请公开了一种基于生成网络的商品布局识别方法、装置及存储介质,其中该方法,包括:获取地堆图片;将一个随机向量输入训练好的生成网络,生成商品框数据,其中所述随机向量为随机生成的、服从正态分布的向量;对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长,其中所述真实的商品框数据通过所述地堆图片获得;将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型。从而,后续可以使用训练好的回归模型端对端的直接预测地堆的周长面积等指标,提升了地堆各指标的计算准确率。并且,基于生成网络生成商品框数据,节省了大量的人力物力。
Description
技术领域
本申请涉及商品布局识别技术领域,特别是涉及一种基于生成网络的商品布局识别方法、装置及存储介质。
背景技术
在零售行业,需要对一些地堆的表面积,周长等指标进行估算。现有的地堆识别技术方案为:提取图片识别结果的地堆场景,计算地堆底层的投影边;根据所述投影边判断所述地堆场景的类型,为不同类型匹配不同方法计算得到分层投影线;根据所述分层投影线中的最长投影线计算地堆面积。但是,由于地堆形状十分复杂,根据图片识别结果计算地堆投影边准确率低,也很难根据投影边准确判断出地堆场景的类型,导致最终计算所得到的地堆面积以及周长等指标误差较大。
针对上述的现有技术中存在的地堆各指标的计算准确率低的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明的实施例提供了一种基于生成网络的商品布局识别方法、装置及存储介质,以至少解决现有技术中存在的地堆各指标的计算准确率低的技术问题。
根据本发明实施例的一个方面,提供了一种基于生成网络的商品布局识别方法,包括:获取地堆图片;将一个随机向量输入训练好的生成网络,生成商品框数据,其中所述随机向量为随机生成的、服从正态分布的向量;对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长,其中所述真实的商品框数据通过所述地堆图片获得;将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型。
可选地,通过以下方式对生成网络进行训练:将一个随机向量输入生成网络的生成器,生成商品框信息,其中所述商品框信息包括商品框的坐标、高度和宽度;根据生成器生成的商品框信息,将对应的商品框画到一个空白背景上,得到生成图片,作为负样本;根据人工标注的真实的商品框信息,将对应的商品框画到另一个空白背景上,得到真实图片,作为正样本;将两种样本通过生成网络的分类器分类,判别当前图片是真实图片或者生成图片。
可选地,该方法还包括:获取待识别商品布局的目标地堆图片;使用训练好的回归模型,对目标地堆图片进行识别,确定目标地堆图片中地堆的面积和周长。
可选地,采用LSTM网络作为生成器,每个LSTM单元接收上层单元的隐层输出作为输入,输出一个标注框数据或者停止标志。
根据本发明实施例的另一个方面,还提供了一种基于生成网络的商品布局识别装置,包括:第一获取模块,用于获取地堆图片;生成模块,用于将一个随机向量输入训练好的生成网络,生成商品框数据,其中所述随机向量为随机生成的、服从正态分布的向量;确定模块,用于对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长,其中所述真实的商品框数据通过所述地堆图片获得;训练模块,用于将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型。
可选地,所述装置还包括训练模块,用于通过以下方式对生成网络进行训练:将一个随机向量输入生成网络的生成器,生成商品框信息,其中所述商品框信息包括商品框的坐标、高度和宽度;根据生成器生成的商品框信息,将对应的商品框画到一个空白背景上,得到生成图片,作为负样本;根据人工标注的真实的商品框信息,将对应的商品框画到另一个空白背景上,得到真实图片,作为正样本;将两种样本通过生成网络的分类器分类,判别当前图片是真实图片或者生成图片。
可选地,所述装置还包括:第二获取模块,用于获取待识别商品布局的目标地堆图片;识别模块,用于使用训练好的回归模型,对目标地堆图片进行识别,确定目标地堆图片中地堆的面积和周长。
可选地,采用LSTM网络作为生成器,每个LSTM单元接收上层单元的隐层输出作为输入,输出一个标注框数据或者停止标志。
根据本发明实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
根据本发明实施例的另一个方面,还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述可执行指令以实现以上任意一项所述的方法。
在本发明实施例中,首先获取地堆图片,然后将一个随机向量输入训练好的生成网络,生成商品框数据,其次对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长,最后将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型。从而,后续可以使用训练好的回归模型端对端的直接预测地堆的周长面积等指标,提升了地堆各指标的计算准确率。并且,基于生成网络生成商品框数据,节省了大量的人力物力。进而解决了现有技术中存在的地堆各指标的计算准确率低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是用于实现根据本发明实施例1所述的方法的计算设备的硬件结构框图;
图2是根据本发明实施例1所述的基于生成网络的商品布局识别方法的流程示意图;
图3是根据本发明实施例1所述的地堆图片的示意图;
图4是根据本发明实施例1所述的生成器的网络示意图;
图5是根据本发明实施例1所述的分类器的网络示意图;
图6是根据本发明实施例1所述的将生成的商品框数据画到空白背景上的一个示意图;
图7是根据本发明实施例1所述的标注有商品框的地堆图片的示意图;以及
图8是根据本发明实施例2所述的基于生成网络的商品布局识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,提供了一种基于生成网络的商品布局识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示出了一种用于实现基于生成网络的商品布局识别方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本发明实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本发明实施例中的基于生成网络的商品布局识别方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的基于生成网络的商品布局识别方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
在上述运行环境下,根据本实施例,提供了一种基于生成网络的商品布局识别方法。图2示出了该方法的流程示意图,参考图2所示,该方法包括:
S202:获取地堆图片。
在本发明实施例中,可以通过拍摄得到一些地堆图片,如图3所示。
S204:将一个随机向量输入训练好的生成网络,生成商品框数据,其中所述随机向量为随机生成的、服从正态分布的向量。
在本发明实施例中,考虑到地堆标注数据较少,很难得到大量的标注好的数据框,因此可以使用一个随机向量作为输入,训练好的生成网络会不断的输出标注框的数据。其中随机向量为随机生成的、服从正态分布的向量。例如但不限于为,将一个随机向量输入生成网络之后,生成网络会首先生成(100,60,30,20)的商品框数据,代表在坐标(100,60)处有一个宽为30,高为20的商品框,然后生成网络会继续输出(200,19,100,40)的商品框数据,依次类推,直到生成网络输出了“STOP”,代表所有商品框生成完成。
通过这种方式,可以生成大量的地堆标注框数据,从而为后续回归模型的训练提供数据支撑。
可选地,通过以下方式对生成网络进行训练:将一个随机向量输入生成网络的生成器,生成商品框信息,其中所述商品框信息包括商品框的坐标、高度和宽度;根据生成器生成的商品框信息,将对应的商品框画到一个空白背景上,得到生成图片,作为负样本;根据人工标注的真实的商品框信息,将对应的商品框画到另一个空白背景上,得到真实图片,作为正样本;将两种样本通过生成网络的分类器分类,判别当前图片是真实图片或者生成图片。
可选地,采用LSTM网络作为生成器,每个LSTM单元接收上层单元的隐层输出作为输入,输出一个标注框数据或者停止标志。
在本发明实施例中,生成网络包括生成器和分类器。其中,图4示出了生成器的网络示意图,图5示出了分类器的网络示意图。由于需要输出不定长的标注框数据,因此采用LSTM网络作为生成器,每个LSTM单元接收上层单元的隐层输出作为输入,然后输出一个标注框数据或者停止标志,参见图4所示。生成器生成的商品框为一个长度为4的向量,其中每个值分别代表:商品框左上角x坐标,商品框左上角y坐标,商品框宽度,商品框高度,如(100,60,20,20)。
进一步地,将生成器生成的商品框画到一个全黑背景的图片上,得到生成图片,作为负样本,如图6所示。为了保证输入的一致性,也将人工标注得到的图片商品框画到一个全黑背景的图片上,得到真实图片,作为正样本。将两种样本通过分类器分类。分类器仅仅判别图片是真实图片还是生成器生成的假图片,不对周长面积等进行计算。通过这种方式,实现了生成网络进行对抗训练。生成网络完成训练后,可以应用生成网络的生成器,根据拍摄得到的少量的地堆图片,生成大量的地堆标注框数据,节省了大量的人力物力。
S206:对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长。
在本发明实施例中,人工标注指的是给一张地堆图片,由人来估算这个地堆的周长和面积。为了解决通过规则对地堆面积周长测算不准确的问题,本发明需要通过人工标注的方式确定生成的商品框数据以及真实的商品框数据的地堆面积和周长,以作为标准答案,为后续回归模型的训练提供数据支撑。
需要特别说明的是,由于商品框是平面的,整张地堆照片上的多个框组成的集合是立体的,因此可以通过这多个商品框来推算出地堆的形态,从而确定出地堆的周长和面积。其中,带有商品框的地堆图片如图7所示。
S208:将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型。
在本发明实施例中,使用回归模型来训练,回归模型的输入是生成器生成的商品框数据,将人工标注的周长面积作为标准答案来训练回归模型。因为有人估算的周长面积作为标准答案,所以回归模型能够学着去估算地堆的周长面积。从而,可以将商品框数据及标注的面积周长作为训练集训练回归模型,端对端的预测地堆的面积和周长。
可选地,该方法还包括:获取待识别商品布局的目标地堆图片;使用训练好的回归模型,对目标地堆图片进行识别,确定目标地堆图片中地堆的面积和周长。
在本发明实施例中,完成回归模型的训练后,可以获取待识别商品布局的目标地堆图片,然后使用训练好的回归模型,对目标地堆图片进行识别,确定目标地堆图片中地堆的面积和周长。通过这种方式,保证了预测的面积和周长的准确性,从而提升了地堆各指标的计算准确率。
从而,本发明提出的基于生成网络的商品布局识别方法,首先获取地堆图片,然后将一个随机向量输入训练好的生成网络,生成商品框数据,其次对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长,最后将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型。从而,后续可以使用训练好的回归模型端对端的直接预测地堆的周长面积等指标,提升了地堆各指标的计算准确率。并且,基于生成网络生成商品框数据,节省了大量的人力物力。进而解决了现有技术中存在的地堆各指标的计算准确率低的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图7示出了根据本实施例所述的基于生成网络的商品布局识别装置700,该装置700与根据实施例1所述的方法相对应。参考图7所示,该装置500包括:第一获取模块710,用于获取地堆图片;生成模块720,用于将一个随机向量输入训练好的生成网络,生成商品框数据,其中所述随机向量为随机生成的、服从正态分布的向量;确定模块730,用于对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长;训练模块740,用于将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型。
可选地,所述装置还包括训练模块,用于通过以下方式对生成网络进行训练:将一个随机向量输入生成网络的生成器,生成商品框信息,其中所述商品框信息包括商品框的坐标、高度和宽度;根据生成器生成的商品框信息,将对应的商品框画到一个空白背景上,得到生成图片,作为负样本;根据人工标注的真实的商品框信息,将对应的商品框画到另一个空白背景上,得到真实图片,作为正样本;将两种样本通过生成网络的分类器分类,判别当前图片是真实图片或者生成图片。
可选地,所述装置还包括:第二获取模块,用于获取待识别商品布局的目标地堆图片;识别模块,用于使用训练好的回归模型,对目标地堆图片进行识别,确定目标地堆图片中地堆的面积和周长。
可选地,采用LSTM网络作为生成器,每个LSTM单元接收上层单元的隐层输出作为输入,输出一个标注框数据或者停止标志。
从而根据本实施例,首先获取地堆图片,然后将一个随机向量输入训练好的生成网络,生成商品框数据,其中所述随机向量为随机生成的、服从正态分布的向量,其次对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长,最后将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型。从而,后续可以使用训练好的回归模型端对端的直接预测地堆的周长面积等指标,提升了地堆各指标的计算准确率。并且,基于生成网络生成商品框数据,节省了大量的人力物力。进而解决了现有技术中存在的地堆各指标的计算准确率低的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种基于生成网络的商品布局识别方法,其特征在于,包括:
获取地堆图片;
将一个随机向量输入训练好的生成网络,生成商品框数据,其中所述随机向量为随机生成的、服从正态分布的向量;
对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长,其中所述真实的商品框数据通过所述地堆图片获得;
将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型,包括:将一个随机向量输入生成网络的生成器,生成商品框信息,其中所述商品框信息包括商品框的坐标、高度和宽度;根据生成器生成的商品框信息,将对应的商品框画到一个空白背景上,得到生成图片,作为负样本;根据人工标注的真实的商品框信息,将对应的商品框画到另一个空白背景上,得到真实图片,作为正样本;将两种样本通过生成网络的分类器分类,判别当前图片是真实图片或者生成图片,其中,所述生成器采用LSTM网络,每个LSTM单元接收上层单元的隐层输出作为输入,输出一个标注框数据或者停止标志;
获取待识别商品布局的目标地堆图片;使用训练好的回归模型,对目标地堆图片进行识别,确定目标地堆图片中地堆的面积和周长。
2.一种基于生成网络的商品布局识别装置,其特征在于,包括:
第一获取模块,用于获取地堆图片;
生成模块,用于将一个随机向量输入训练好的生成网络,生成商品框数据,其中所述随机向量为随机生成的、服从正态分布的向量;
确定模块,用于对生成的商品框数据以及真实的商品框数据进行人工标注,确定地堆面积和周长,其中所述真实的商品框数据通过所述地堆图片获得;
训练模块,用于将生成的商品框数据作为输入数据,将人工标注的地堆面积和周长作为答案,训练预设的回归模型,包括:将一个随机向量输入生成网络的生成器,生成商品框信息,其中所述商品框信息包括商品框的坐标、高度和宽度;根据生成器生成的商品框信息,将对应的商品框画到一个空白背景上,得到生成图片,作为负样本;根据人工标注的真实的商品框信息,将对应的商品框画到另一个空白背景上,得到真实图片,作为正样本;将两种样本通过生成网络的分类器分类,判别当前图片是真实图片或者生成图片,其中,所述生成器采用LSTM网络,每个LSTM单元接收上层单元的隐层输出作为输入,输出一个标注框数据或者停止标志;
获取待识别商品布局的目标地堆图片;使用训练好的回归模型,对目标地堆图片进行识别,确定目标地堆图片中地堆的面积和周长。
3.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1所述的方法。
4.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述可执行指令以实现上述权利要求1所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211732422.9A CN116128954B (zh) | 2022-12-30 | 2022-12-30 | 一种基于生成网络的商品布局识别方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211732422.9A CN116128954B (zh) | 2022-12-30 | 2022-12-30 | 一种基于生成网络的商品布局识别方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116128954A CN116128954A (zh) | 2023-05-16 |
CN116128954B true CN116128954B (zh) | 2023-12-05 |
Family
ID=86311196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211732422.9A Active CN116128954B (zh) | 2022-12-30 | 2022-12-30 | 一种基于生成网络的商品布局识别方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116128954B (zh) |
Citations (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451607A (zh) * | 2017-07-13 | 2017-12-08 | 山东中磁视讯股份有限公司 | 一种基于深度学习的典型人物的身份识别方法 |
CN108764313A (zh) * | 2018-05-17 | 2018-11-06 | 西安电子科技大学 | 基于深度学习的超市商品识别方法 |
CN108898141A (zh) * | 2018-06-14 | 2018-11-27 | 中山大学 | 基于图像检测的商品货架分割和层信息统计方法 |
CN109711474A (zh) * | 2018-12-24 | 2019-05-03 | 中山大学 | 一种基于深度学习的铝材表面缺陷检测算法 |
CN109784172A (zh) * | 2018-12-14 | 2019-05-21 | 上海扩博智能技术有限公司 | 商场中地堆商品占地面积估算方法、系统、设备及介质 |
CN109902636A (zh) * | 2019-03-05 | 2019-06-18 | 上海扩博智能技术有限公司 | 商品识别模型训练方法、系统、设备及存储介质 |
CN109919045A (zh) * | 2019-02-18 | 2019-06-21 | 北京联合大学 | 基于级联卷积网络的小尺度行人检测识别方法 |
WO2019229733A1 (en) * | 2018-06-01 | 2019-12-05 | DeepCube LTD. | Mimicking a neural network without the original training dataset |
CN111028224A (zh) * | 2019-12-12 | 2020-04-17 | 广西医准智能科技有限公司 | 数据标注、模型训练和图像处理方法、装置及存储介质 |
CN111241947A (zh) * | 2019-12-31 | 2020-06-05 | 深圳奇迹智慧网络有限公司 | 目标检测模型的训练方法、装置、存储介质和计算机设备 |
CN111260755A (zh) * | 2020-01-19 | 2020-06-09 | 金陵科技学院 | 基于深度学习与数字图像处理的数字扎染图案生成方法 |
CN111368935A (zh) * | 2020-03-17 | 2020-07-03 | 北京航天自动控制研究所 | 一种基于生成对抗网络的sar时敏目标样本增广方法 |
CN111444973A (zh) * | 2020-03-31 | 2020-07-24 | 西安交通大学 | 一种无人零售购物台商品检测方法 |
CN111476302A (zh) * | 2020-04-08 | 2020-07-31 | 北京工商大学 | 基于深度强化学习的Faster-RCNN目标物体检测方法 |
CN111931836A (zh) * | 2020-07-31 | 2020-11-13 | 上海商米科技集团股份有限公司 | 获取神经网络训练图像的方法和装置 |
CN111985464A (zh) * | 2020-08-13 | 2020-11-24 | 山东大学 | 面向法院判决文书的多尺度学习的文字识别方法及系统 |
WO2020236596A1 (en) * | 2019-05-17 | 2020-11-26 | Nvidia Corporation | Motion prediction using one or more neural networks |
CN112200115A (zh) * | 2020-10-21 | 2021-01-08 | 平安国际智慧城市科技股份有限公司 | 人脸识别训练方法、识别方法、装置、设备及存储介质 |
WO2021017261A1 (zh) * | 2019-08-01 | 2021-02-04 | 平安科技(深圳)有限公司 | 识别模型训练方法、图像识别方法、装置、设备及介质 |
CN112597798A (zh) * | 2020-11-23 | 2021-04-02 | 广州创品知识产权服务有限公司 | 一种使用神经网络鉴别商品真伪的方法 |
CN113033516A (zh) * | 2021-05-25 | 2021-06-25 | 中国科学院地理科学与资源研究所 | 对象识别统计方法及装置、电子设备、存储介质 |
EP3843011A1 (de) * | 2019-12-23 | 2021-06-30 | Aicura Medical GmbH | System und verfahren zur qualitätszusicherung von datenbasierten modellen |
CN113065591A (zh) * | 2021-03-30 | 2021-07-02 | 上海商汤智能科技有限公司 | 目标检测方法及装置、电子设备和存储介质 |
CN113076900A (zh) * | 2021-04-12 | 2021-07-06 | 华南理工大学 | 基于深度学习的试卷卷头学生信息自动检测方法 |
CN113520317A (zh) * | 2021-07-05 | 2021-10-22 | 汤姆飞思(香港)有限公司 | 基于oct的子宫内膜检测分析方法、装置、设备及存储介质 |
CN113591811A (zh) * | 2021-09-28 | 2021-11-02 | 湖南大学 | 零售货柜商品搜索识别方法、系统及计算机可读存储介质 |
CN113591850A (zh) * | 2021-08-05 | 2021-11-02 | 广西师范大学 | 基于计算机视觉鲁棒性目标检测的两阶段商标检测法 |
CN113780270A (zh) * | 2021-03-23 | 2021-12-10 | 京东鲲鹏(江苏)科技有限公司 | 目标检测方法和装置 |
CN114004674A (zh) * | 2021-10-29 | 2022-02-01 | 京东科技信息技术有限公司 | 模型训练方法、商品推送方法、装置和电子设备 |
WO2022021955A1 (zh) * | 2020-07-30 | 2022-02-03 | 推想医疗科技股份有限公司 | 图像分割方法及装置、图像分割模型的训练方法及装置 |
CN114140465A (zh) * | 2021-01-20 | 2022-03-04 | 赛维森(广州)医疗科技服务有限公司 | 基于宫颈细胞切片图像的自适应的学习方法和学习系统 |
CN114219401A (zh) * | 2021-12-17 | 2022-03-22 | 建信金融科技有限责任公司 | 录入商品信息的方法、装置、设备、介质及程序产品 |
CN114358249A (zh) * | 2021-12-30 | 2022-04-15 | 浙江大华技术股份有限公司 | 目标识别模型训练、目标识别方法及装置 |
CN114494823A (zh) * | 2021-12-29 | 2022-05-13 | 山东师范大学 | 零售场景下的商品识别检测计数方法及系统 |
CN114708426A (zh) * | 2022-04-20 | 2022-07-05 | 北京市商汤科技开发有限公司 | 目标检测方法、模型训练方法、装置、设备及存储介质 |
CN114912972A (zh) * | 2022-04-06 | 2022-08-16 | 刘二松 | 基于区块链的网络推广营销平台及其方法 |
CN115272652A (zh) * | 2022-07-29 | 2022-11-01 | 东南大学 | 基于多元回归和自适应焦点损失的密集物体图像检测方法 |
CN115393639A (zh) * | 2022-08-16 | 2022-11-25 | 广州市玄武无线科技股份有限公司 | 商品智能打标方法、系统、终端设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11557390B2 (en) * | 2018-04-30 | 2023-01-17 | Elekta, Inc. | Radiotherapy treatment plan modeling using generative adversarial networks |
-
2022
- 2022-12-30 CN CN202211732422.9A patent/CN116128954B/zh active Active
Patent Citations (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451607A (zh) * | 2017-07-13 | 2017-12-08 | 山东中磁视讯股份有限公司 | 一种基于深度学习的典型人物的身份识别方法 |
CN108764313A (zh) * | 2018-05-17 | 2018-11-06 | 西安电子科技大学 | 基于深度学习的超市商品识别方法 |
WO2019229733A1 (en) * | 2018-06-01 | 2019-12-05 | DeepCube LTD. | Mimicking a neural network without the original training dataset |
CN108898141A (zh) * | 2018-06-14 | 2018-11-27 | 中山大学 | 基于图像检测的商品货架分割和层信息统计方法 |
CN109784172A (zh) * | 2018-12-14 | 2019-05-21 | 上海扩博智能技术有限公司 | 商场中地堆商品占地面积估算方法、系统、设备及介质 |
CN109711474A (zh) * | 2018-12-24 | 2019-05-03 | 中山大学 | 一种基于深度学习的铝材表面缺陷检测算法 |
CN109919045A (zh) * | 2019-02-18 | 2019-06-21 | 北京联合大学 | 基于级联卷积网络的小尺度行人检测识别方法 |
CN109902636A (zh) * | 2019-03-05 | 2019-06-18 | 上海扩博智能技术有限公司 | 商品识别模型训练方法、系统、设备及存储介质 |
WO2020236596A1 (en) * | 2019-05-17 | 2020-11-26 | Nvidia Corporation | Motion prediction using one or more neural networks |
WO2021017261A1 (zh) * | 2019-08-01 | 2021-02-04 | 平安科技(深圳)有限公司 | 识别模型训练方法、图像识别方法、装置、设备及介质 |
CN111028224A (zh) * | 2019-12-12 | 2020-04-17 | 广西医准智能科技有限公司 | 数据标注、模型训练和图像处理方法、装置及存储介质 |
EP3843011A1 (de) * | 2019-12-23 | 2021-06-30 | Aicura Medical GmbH | System und verfahren zur qualitätszusicherung von datenbasierten modellen |
CN111241947A (zh) * | 2019-12-31 | 2020-06-05 | 深圳奇迹智慧网络有限公司 | 目标检测模型的训练方法、装置、存储介质和计算机设备 |
CN111260755A (zh) * | 2020-01-19 | 2020-06-09 | 金陵科技学院 | 基于深度学习与数字图像处理的数字扎染图案生成方法 |
CN111368935A (zh) * | 2020-03-17 | 2020-07-03 | 北京航天自动控制研究所 | 一种基于生成对抗网络的sar时敏目标样本增广方法 |
CN111444973A (zh) * | 2020-03-31 | 2020-07-24 | 西安交通大学 | 一种无人零售购物台商品检测方法 |
CN111476302A (zh) * | 2020-04-08 | 2020-07-31 | 北京工商大学 | 基于深度强化学习的Faster-RCNN目标物体检测方法 |
WO2022021955A1 (zh) * | 2020-07-30 | 2022-02-03 | 推想医疗科技股份有限公司 | 图像分割方法及装置、图像分割模型的训练方法及装置 |
CN111931836A (zh) * | 2020-07-31 | 2020-11-13 | 上海商米科技集团股份有限公司 | 获取神经网络训练图像的方法和装置 |
CN111985464A (zh) * | 2020-08-13 | 2020-11-24 | 山东大学 | 面向法院判决文书的多尺度学习的文字识别方法及系统 |
CN112200115A (zh) * | 2020-10-21 | 2021-01-08 | 平安国际智慧城市科技股份有限公司 | 人脸识别训练方法、识别方法、装置、设备及存储介质 |
CN112597798A (zh) * | 2020-11-23 | 2021-04-02 | 广州创品知识产权服务有限公司 | 一种使用神经网络鉴别商品真伪的方法 |
CN114140465A (zh) * | 2021-01-20 | 2022-03-04 | 赛维森(广州)医疗科技服务有限公司 | 基于宫颈细胞切片图像的自适应的学习方法和学习系统 |
CN113780270A (zh) * | 2021-03-23 | 2021-12-10 | 京东鲲鹏(江苏)科技有限公司 | 目标检测方法和装置 |
CN113065591A (zh) * | 2021-03-30 | 2021-07-02 | 上海商汤智能科技有限公司 | 目标检测方法及装置、电子设备和存储介质 |
CN113076900A (zh) * | 2021-04-12 | 2021-07-06 | 华南理工大学 | 基于深度学习的试卷卷头学生信息自动检测方法 |
CN113033516A (zh) * | 2021-05-25 | 2021-06-25 | 中国科学院地理科学与资源研究所 | 对象识别统计方法及装置、电子设备、存储介质 |
CN113520317A (zh) * | 2021-07-05 | 2021-10-22 | 汤姆飞思(香港)有限公司 | 基于oct的子宫内膜检测分析方法、装置、设备及存储介质 |
CN113591850A (zh) * | 2021-08-05 | 2021-11-02 | 广西师范大学 | 基于计算机视觉鲁棒性目标检测的两阶段商标检测法 |
CN113591811A (zh) * | 2021-09-28 | 2021-11-02 | 湖南大学 | 零售货柜商品搜索识别方法、系统及计算机可读存储介质 |
CN114004674A (zh) * | 2021-10-29 | 2022-02-01 | 京东科技信息技术有限公司 | 模型训练方法、商品推送方法、装置和电子设备 |
CN114219401A (zh) * | 2021-12-17 | 2022-03-22 | 建信金融科技有限责任公司 | 录入商品信息的方法、装置、设备、介质及程序产品 |
CN114494823A (zh) * | 2021-12-29 | 2022-05-13 | 山东师范大学 | 零售场景下的商品识别检测计数方法及系统 |
CN114358249A (zh) * | 2021-12-30 | 2022-04-15 | 浙江大华技术股份有限公司 | 目标识别模型训练、目标识别方法及装置 |
CN114912972A (zh) * | 2022-04-06 | 2022-08-16 | 刘二松 | 基于区块链的网络推广营销平台及其方法 |
CN114708426A (zh) * | 2022-04-20 | 2022-07-05 | 北京市商汤科技开发有限公司 | 目标检测方法、模型训练方法、装置、设备及存储介质 |
CN115272652A (zh) * | 2022-07-29 | 2022-11-01 | 东南大学 | 基于多元回归和自适应焦点损失的密集物体图像检测方法 |
CN115393639A (zh) * | 2022-08-16 | 2022-11-25 | 广州市玄武无线科技股份有限公司 | 商品智能打标方法、系统、终端设备及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
Segmentation and quantification of infarction without contrast agents via spatiotemporal generative adversarial learning;Xu, Chenchu等;《Medical image analysis》;第59卷;1-14 * |
基于粗粒度密度图的航拍图像目标检测算法研究;段成真;《中国优秀硕士学位论文全文数据库 信息科技辑》(第3期);I138-2093 * |
Also Published As
Publication number | Publication date |
---|---|
CN116128954A (zh) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021082635A1 (zh) | 一种关注区域检测方法、装置、可读存储介质及终端设备 | |
US11443133B2 (en) | Computer vision system for industrial equipment gauge digitization and alarms | |
CN109165645A (zh) | 一种图像处理方法、装置以及相关设备 | |
CN108416902A (zh) | 基于差异识别的实时物体识别方法和装置 | |
CN110672189A (zh) | 体重估计方法、装置、系统和存储介质 | |
CN109272546B (zh) | 一种鱼苗长度测量方法及系统 | |
CN108198172B (zh) | 图像显著性检测方法和装置 | |
CN111178355A (zh) | 印章识别方法、装置和存储介质 | |
CN112258507B (zh) | 互联网数据中心的目标对象检测方法、装置和电子设备 | |
CN111008561A (zh) | 一种牲畜的数量确定方法、终端及计算机存储介质 | |
CN115131283A (zh) | 目标对象的缺陷检测、模型训练方法、装置、设备及介质 | |
CN112348737A (zh) | 模拟图像生成的方法、电子设备及存储介质 | |
CN108647264A (zh) | 一种基于支持向量机的图像自动标注方法及装置 | |
CN113569852A (zh) | 语义分割模型的训练方法、装置、电子设备及存储介质 | |
CN114782769A (zh) | 训练样本的生成方法、装置、系统及目标对象的检测方法 | |
CN117237755A (zh) | 目标检测模型训练方法及装置、图像检测方法及装置 | |
CN108764248B (zh) | 图像特征点的提取方法和装置 | |
CN118097682A (zh) | 水印文字识别方法、装置、非易失性存储介质及电子设备 | |
CN111914863B (zh) | 目标检测方法、装置、终端设备及计算机可读存储介质 | |
CN116128954B (zh) | 一种基于生成网络的商品布局识别方法、装置及存储介质 | |
CN114359676B (zh) | 训练目标检测模型和构建样本集的方法、装置及存储介质 | |
CN112183594A (zh) | 票据图像的处理方法和装置、存储介质及电子设备 | |
CN113160414B (zh) | 货物余量自动识别方法、装置、电子设备以及计算机可读介质 | |
CN117333892A (zh) | 题干和答案的识别方法、装置、可读存储介质及终端设备 | |
CN114359767A (zh) | 产品数据的处理方法、装置、存储介质和处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |