CN113869264A - 一种商品识别方法、识别系统、存储介质和服务器 - Google Patents
一种商品识别方法、识别系统、存储介质和服务器 Download PDFInfo
- Publication number
- CN113869264A CN113869264A CN202111182652.8A CN202111182652A CN113869264A CN 113869264 A CN113869264 A CN 113869264A CN 202111182652 A CN202111182652 A CN 202111182652A CN 113869264 A CN113869264 A CN 113869264A
- Authority
- CN
- China
- Prior art keywords
- commodity
- database
- identification
- feature
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种商品识别方法、识别系统、存储介质和服务器,属于智能零售的图形处理技术领域,方法包括构建商品特征提取模型M、特征提取获得商品特征数据库F、以及采用商品特征提取模型M和商品特征数据库F对新商品识别。当新零售场景中的商品进行品类更新时,只需要对对应的商品品类特征数据库进行删除/增加操作即可完成整个商品模型的更新。相比于商品模式分类方法,在后续应用中,简单易操作、模型更新所需数据更少、易实现及技术迭代成本低;可以更好适用于新零售中的商品品类快速扩张及品类快速迭代更新等难点场景。因此,本发明提供的方案极大地提升了商品识别性能,进行提升了新零售行业的效率。
Description
技术领域
本发明涉及智能零售领域的图像处理技术,具体涉及一种商品识别方法、识别系统、存储介质和服务器。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术或先有技术。
随着新零售的发展,以人工智能为支撑的商品识别技术,在其中发挥越来越重要的作用,对商品的整个生命周期产生影响。在整个商品生命周期中,又以无人零售的商品智能识别为广大人民所直接接触。而在无人零售中,商品智能识别的技术体验直接反应到人民的客户体验当中,如何快速实时、准确地识别出商品,是提升用户体验的重要前提。
在现代市场经济环境下,商品研发、生产及销售高速迭代发展,品类成千上万,同一品类版本更新周期非常短,这对商品识别模型带来了极大挑战,特别是商品识别模型的商品品类容量扩大和商品识别模型与商品销售同步更新的问题更加突出,这两方面的问题直接影响着新零售的扩大发展与用户体验。
因此,如何提升商品识别模型中商品品类容量扩大及模型更新的性能,成为目前最需要解决的问题。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种商品识别方法、识别系统、存储介质和服务器,其能解决商品识别模型品类容量扩大及模型更新性能差的问题。以期提升商品识别模型品类容量扩大及模型更新性能。
设计原理:利用互联网大数据,收集大量已有商品数据,采用深度学习技术,学习得到商品特征提取模型。然后,对每个新零售场景商品的各个品类,进行数据采集,并用商品特征提取模型进行特征提取,得到对应商品品类特征数据库。在新零售端,当商品进入数据采集装置时,先对商品进行数据采集,再用特征提取模型进行特征提取,然后,以1:N的搜索匹配的方法,得到商品的分类,完成商品识别。当新零售场景中的商品进行品类更新时,只需要对对应的商品品类特征数据库进行删除/增加操作即可完成整个商品模型的更新。
总体方案:为了解决上述问题,本申请的总体设计方案如下。
一种商品识别方法,方法包括以下步骤:
S1、构建商品数据库D,学习训练得到商品特征提取模型M;
S2、通过商品特征提取模型M对零售场景下商品品类进行特征提取,得到C个商品特征数据库F;
S3、采用商品特征提取模型M和商品特征数据库F对新商品识别;
S4、重复步骤S3,直至所有新商品识别完毕,完成整个新零售商品识别周期。
进一步的,步骤S1包括:
S11、收集商品图像数据,记为商品数据库D
S12、用深度学习算法对商品数据库D进行学习训练,得到商品特征提取模型M,则输出商品特征向量维度为a∈RN*1,其中,N=512。
进一步的,步骤S2包括:对新零售中单一场景下的所有商品品类C,按品类采集一次数据,用商品特征提取模型M对每个品类进行特征提取,得到C个商品特征数据库F,F∈RN *C。
进一步的,步骤S3包括:
S31、待识别商品T的数据采集,用商品特征提取模型M对待识别商品T进行特征提取,得到商品特征t∈RN*1;
S32、对待识别商品T,以1:C的方法,用特征t在商品特征数据库F中进行搜索匹配,即1VS1相似度匹配的方法,进行与数据库内所有类别C进行1:1匹配,总计C次匹配识别,得到C个相似度识别置信度结果。然后,求最大相似度:得到商品类别完成商品识别,其中,id为最终识别得到的商品类别ID号,Fi为第i个商品类别的特征,cos为求两个特征相似度的函数。
进一步的,商品识别方法包括:商品品类进行更新,若减少品类,则将对应的商品从商品特征数据库F中删除;若增加品类,则将对应的商品增加到商品特征数据库F中;如此会得到新特征数据库F'∈RN*C,同时更新商品类别C得到C',其中F'为特征矩阵,N为每类商品的特征长度,C'为商品总类别数。
本发明还提供了一种识别系统,识别系统包括:
图像获取单元,包括网络获取和采用摄像设备图像采集两种方式获取商品图像信息;
图像预处理单元,通过图像处理软件对获取的商品图像预处理;
商品识别单元,包括商品特征提取模块、特征对比模块和商品判定模块;
结果输出单元,用于显示商品识别单元判定的商品识别结果。
相比现有技术,本发明的有益效果在于:本发明中的商品识别方法,相比于商品模式分类方法,在后续应用中,简单易操作、模型更新所需数据更少、易实现及技术迭代成本低;可以更好适用于新零售中的商品品类快速扩张及品类快速迭代更新等难点场景。因此,本发明提供的方案极大地提升了商品识别性能,进行提升了新零售行业的效率。
附图说明
图1为本发明商品识别方法的流程图;
图2为本发明商品识别系统的示意图;
图3为商品特征提取模型M的架构图;
图4为一个示例的商品识别示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
第一实施例
一种商品识别方法,参见图1,方法包括以下步骤:
S1、构建商品数据库D,学习训练得到商品特征提取模型M,商品特征提取模型M如图3所示;进一步的,步骤S1包括:
S11、收集商品图像数据,记为商品数据库D;
具体的,一种方式为通过互联网收集已有的大量免费的商品图像数据,记为商品数据库D;
S12、用深度学习算法对商品数据库D进行学习训练,得到商品特征提取模型M,则输出商品特征向量维度为a∈RN*1,其中,N=512。
其中,所述深度学习算法采用深度ResNet101。
S2、通过商品特征提取模型M对零售场景下商品品类进行特征提取,得到C个商品特征数据库F;进一步的,步骤S2包括:对新零售中单一场景下的所有商品品类C,按品类采集一次数据,用商品特征提取模型M对每个品类进行特征提取,得到C个商品特征数据库F,F∈RN*C。
S3、采用商品特征提取模型M和商品特征数据库F对新商品识别;进一步的,步骤S3包括:
S31、待识别商品T的数据采集,用商品特征提取模型M对待识别商品T进行特征提取,得到商品特征t∈RN*1;
S32、对待识别商品T,以1:C的方法,用特征t在商品特征数据库F中进行搜索匹配,即1VS1相似度匹配的方法,进行与数据库内所有类别C进行1:1匹配,总计C次匹配识别,得到C个相似度识别置信度结果。然后,求最大相似度:得到商品类别完成商品识别,其中,id为最终识别得到的商品类别ID号,Fi为第i个商品类别的特征,cos为求两个特征相似度的函数。
S4、重复步骤S3,直至所有新商品识别完毕,完成整个新零售商品识别周期。
进一步的,为了应对新商品的引入和商品的淘汰,商品识别方法还包括商品品类更新:
②若减少品类,则将对应的商品从商品特征数据库F中删除;
②若增加品类,则将对应的商品增加到商品特征数据库F中;
如此,得到新特征数据库F'∈RN*C',同时更新商品类别C得到C',其中F'为特征矩阵,N为每类商品的特征长度,C'为商品总类别数。
一个饮料类商品的识别示例,参照上述步骤,整体过程如图4,基于商品特征提取模型,提取商品的特征,计算相似度,最终实现商品的识别。
第二实施例
本发明还提供了一种采用前述商品识别方法的识别系统,参见图2,所述识别系统包括:
图像获取单元,包括网络获取和采用摄像设备图像采集两种方式获取商品图像信息;
图像预处理单元,通过图像处理软件对获取的商品图像预处理;
商品识别单元,包括商品特征提取模块、特征对比模块和商品判定模块;
结果输出单元,用于显示商品识别单元判定的商品识别结果。
第三实施例
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,当计算机指令在计算机上运行时,使得所述计算机执行前述的商品识别方法。
其中,所述方法请参见前述部分的详细介绍,此处不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、VisualBasic、Fortran2003、Perl、COBOL2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
第四实施例
一种服务器,包括存储器和处理器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述服务器执行前述的商品识别方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种商品识别方法,其特征在于,方法包括以下步骤:
S1、构建商品数据库D,学习训练得到商品特征提取模型M;
S2、通过商品特征提取模型M对零售场景下商品品类进行特征提取,得到C个商品特征数据库F;
S3、采用商品特征提取模型M和商品特征数据库F对新商品识别;
S4、重复步骤S3,直至所有新商品识别完毕,完成整个新零售商品识别周期。
2.根据权利要求1所述的商品识别方法,其特征在于,步骤S1包括:
S11、收集商品图像数据,记为商品数据库D;
S12、用深度学习算法对商品数据库D进行学习训练,得到商品特征提取模型M,则输出商品特征向量维度为a∈RN*1,其中,N=512。
3.根据权利要求2所述的商品识别方法,其特征在于,步骤S2包括:
对新零售中单一场景下的所有商品品类C,按品类采集一次数据,用商品特征提取模型M对每个品类进行特征提取,得到C个商品特征数据库F,F∈RN*C。
5.根据权利要求1所述的商品识别方法,其特征在于,商品识别方法包括:
商品品类进行更新,若减少品类,则将对应的商品从商品特征数据库F中删除;若增加品类,则将对应的商品增加到商品特征数据库F中;如此会得到新特征数据库F'∈RN*C',同时更新商品类别C得到C',其中F'为特征矩阵,N为每类商品的特征长度,C'为商品总类别数。
6.一种采用权利要求1-5任一项所述商品识别方法的识别系统,其特征在于,识别系统包括:
图像获取单元,包括网络获取和采用摄像设备图像采集两种方式获取商品图像信息;
图像预处理单元,通过图像处理软件对获取的商品图像预处理;
商品识别单元,包括商品特征提取模块、特征对比模块和商品判定模块;
结果输出单元,用于显示商品识别单元判定的商品识别结果。
7.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机指令,当计算机指令在计算机上运行时,使得所述计算机执行权利要求1-5中任意一项所述的商品识别方法。
8.一种服务器,其特征在于:所述服务器包括存储器和处理器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述服务器执行权利要求1-5中任一项所述的商品识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111182652.8A CN113869264A (zh) | 2021-10-11 | 2021-10-11 | 一种商品识别方法、识别系统、存储介质和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111182652.8A CN113869264A (zh) | 2021-10-11 | 2021-10-11 | 一种商品识别方法、识别系统、存储介质和服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113869264A true CN113869264A (zh) | 2021-12-31 |
Family
ID=78999005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111182652.8A Pending CN113869264A (zh) | 2021-10-11 | 2021-10-11 | 一种商品识别方法、识别系统、存储介质和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113869264A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115375403A (zh) * | 2022-08-30 | 2022-11-22 | 广州市玄武无线科技股份有限公司 | 基于商品特征的快速建模方法、系统、设备及存储介质 |
CN116245619A (zh) * | 2023-05-12 | 2023-06-09 | 广州市玄武无线科技股份有限公司 | 商品向量嵌入方法、商品相似度评估方法及商品陈列方法 |
-
2021
- 2021-10-11 CN CN202111182652.8A patent/CN113869264A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115375403A (zh) * | 2022-08-30 | 2022-11-22 | 广州市玄武无线科技股份有限公司 | 基于商品特征的快速建模方法、系统、设备及存储介质 |
CN116245619A (zh) * | 2023-05-12 | 2023-06-09 | 广州市玄武无线科技股份有限公司 | 商品向量嵌入方法、商品相似度评估方法及商品陈列方法 |
CN116245619B (zh) * | 2023-05-12 | 2023-08-15 | 广州市玄武无线科技股份有限公司 | 商品向量嵌入方法、商品相似度评估方法及商品陈列方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108694225B (zh) | 一种图像搜索方法、特征向量的生成方法、装置及电子设备 | |
CN102414680B (zh) | 利用跨域知识的语义事件检测 | |
US8358856B2 (en) | Semantic event detection for digital content records | |
JP5749279B2 (ja) | アイテム関連付けのための結合埋込 | |
CN112700408B (zh) | 模型训练方法、图像质量评估方法及装置 | |
CN113869264A (zh) | 一种商品识别方法、识别系统、存储介质和服务器 | |
CN110555399A (zh) | 手指静脉识别方法、装置、计算机设备及可读存储介质 | |
CN105608471A (zh) | 一种鲁棒直推式标签估计及数据分类方法和系统 | |
CN111090763A (zh) | 一种图片自动标签方法及装置 | |
CA2922296A1 (en) | System and method for clustering data | |
WO2022241803A1 (zh) | 基于注意力机制的目标内特征检测系统、方法和存储介质 | |
US10489681B2 (en) | Method of clustering digital images, corresponding system, apparatus and computer program product | |
US20210149924A1 (en) | Clustering of data records with hierarchical cluster ids | |
US20220114490A1 (en) | Methods and systems for processing unstructured and unlabelled data | |
CN115115825B (zh) | 图像中的对象检测方法、装置、计算机设备和存储介质 | |
CN116484231A (zh) | 异常抱团投标、围标行为识别方法、装置、设备及介质 | |
CN110209863B (zh) | 用于相似图片检索的方法与设备 | |
CN113656700A (zh) | 基于多相似度一致矩阵分解的哈希检索方法 | |
CN108268598A (zh) | 一种基于视频图像数据的分析系统及分析方法 | |
JP6160143B2 (ja) | 画像処理装置、画像処理方法及び設備 | |
CN110209895B (zh) | 向量检索方法、装置和设备 | |
CN117251777A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN114328844A (zh) | 一种文本数据集管理方法、装置、设备及存储介质 | |
CN107909091A (zh) | 一种基于稀疏低秩回归模型的图像记忆度预测方法 | |
CN103312938A (zh) | 视频处理装置、视频处理方法以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |