CN109784385A - 一种商品自动识别方法、系统、装置及存储介质 - Google Patents
一种商品自动识别方法、系统、装置及存储介质 Download PDFInfo
- Publication number
- CN109784385A CN109784385A CN201811633640.0A CN201811633640A CN109784385A CN 109784385 A CN109784385 A CN 109784385A CN 201811633640 A CN201811633640 A CN 201811633640A CN 109784385 A CN109784385 A CN 109784385A
- Authority
- CN
- China
- Prior art keywords
- commodity
- image
- several
- labeled data
- characteristic pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013136 deep learning model Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 25
- 230000008901 benefit Effects 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 41
- 238000012360 testing method Methods 0.000 claims description 15
- 238000013527 convolutional neural network Methods 0.000 claims description 14
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 238000013135 deep learning Methods 0.000 claims 2
- 238000005516 engineering process Methods 0.000 description 14
- 230000009286 beneficial effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种商品自动识别方法、系统、装置及存储介质,其通过获取第一商品图像后,将第一商品图像输入至训练好的深度学习模型进行特征图提取处理后,得到所述第一商品图像的特征图,从所述特征图中获取所述第一商品图像的商品位置标注数据,接着所述深度学习模型利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型。可见,本发明实施例具有智能自动化程度高、投入设备购买成本低、处理效率高且识别准确的优点,可广泛应用于自动化零售领域中。
Description
技术领域
本发明涉及数据识别处理技术,尤其涉及一种商品自动识别方法、系统、装置及存储介质。
背景技术
技术词解释:
RFID:Radio Frequency Identification,即射频识别技术,又称无线射频识别,是一种通信技术,可通过无线电讯号识别特定目标并读写相关数据,而无需识别系统与特定目标之间建立机械或光学接触。
随着科学技术的发展,越来越多的场景都逐渐实现了自动化或半自动化,而在新零售的背景下,自动化零售近年来也受到了广泛的关注。新零售的概念是基于对商业三要素——人、货、场的重构,从过去以商家、生产商为中心,转为以满足消费者的需求为中心,重新组合零售行业的逻辑和链条。而人工智能技术可以服务整个新零售业态,从人、货、场的角度出发,可以有针对性地服务每一个商业元素;同时,用人工智能商品识别技术“合纵连横”服务新零售业态也能产生规模效应整体提升行业效率。
目前,新零售的商品识别环节主要利用条码识别和RFID射频识别技术,其中:1、使用条码识别技术,其主要通过对每个商品包装增加条码印刷标记,极大地方便了商品的流通,现在每一件商品上几乎都设有其对应的条码,然而,由于条码印刷位置的不确定性和随机性,结算时往往需要人工寻找条码来辅助机器对条码的识别,自动化程度低;2、使用RFID射频识别技术,其与条码类似,需要对每个商品贴上RFID标签,每个标签都有其特定的编号与特定的商品一一对应,并通过无线信号通讯便能对商品进行识别,虽然其解决了接触式识别的问题,但是由于无线信号之间的干扰,同时进行多个商品的识别,这仍然有很高的错误率,而且其需要对每件商品贴上RFID标签,RFID标签造价较高而导致使用RFID技术的投入成本高,且具有难以回收等缺点,这样则难以满足商品利润的对等条件,因此无法得到广泛的应用。因此由此可见,设计一种识别准确、自动化程度高且成本低的商品识别方案是目前迫切需要解决的问题。
发明内容
有鉴于此,本发明实施例的目的是提供一种商品自动识别方法、系统、装置及存储介质。
第一方面,本发明实施例提供了一种商品自动识别方法,包括以下步骤:
获取第一商品图像;
将所述第一商品图像输入至训练好的深度学习模型进行特征图提取处理后,得到所述第一商品图像的特征图;
从所述特征图中获取所述第一商品图像的商品位置标注数据;
所述深度学习模型利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型。
进一步,所述从所述特征图中获取所述第一商品图像的商品位置标注数据这一步骤,其包括:
将所述第一商品图像输入区域候选网络进行处理后,输出若干个矩形框候选结果以及每一个矩形框候选结果包含商品的概率;
将对应最大所述概率的矩形框候选结果作为所述第一商品图像的商品位置标注数据。
进一步,所述利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型这一步骤,其包括:
从所述特征图中获取得到所述图像块对应的图像特征;
根据获取得到的图像特征,获取得到与所述图像特征最接近的商品类型后,输出所述获取得到的商品类型。
进一步,所述获取第一商品图像这一步骤,其包括:
获取第一摄像头拍摄得到的原始商品图像;
对所述原始商品图像进行增强处理后得到所述第一商品图像。
进一步,还包括深度学习模型的训练步骤,所述深度学习模型的训练步骤包括:
获取第二摄像头在不同角度下拍摄得到的若干个第二商品图像;
获取第三摄像头在不同角度下拍摄得到的若干个第三商品图像;
获取第四摄像头在不同角度下拍摄得到的若干个第四商品图像;
获取若干个第二商品图像的商品位置标注数据、若干个第三商品图像的商品位置标注数据以及若干个第四商品图像的商品位置标注数据;
将若干个第二商品图像、若干个第二商品图像的商品位置标注数据、若干个第三商品图像以及若干个第三商品图像的商品位置标注数据作为训练样本,将若干个第四商品图像以及若干个第四商品图像的商品位置标注数据作为测试样本;
利用所述训练样本、所述测试样本来对深度学习模型进行训练。
进一步,所述深度学习模型为卷积神经网络模型。
第二方面,本发明实施例提供了一种商品自动识别系统,包括:
第一获取模块,用于获取第一商品图像;
第二获取模块,用于将所述第一商品图像输入至训练好的深度学习模型进行特征图提取处理后,得到所述第一商品图像的特征图;
第三获取模块,用于从所述特征图中获取所述第一商品图像的商品位置标注数据;
第一处理模块,用于所述深度学习模型利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型。
第三方面,本发明实施例提供了一种商品自动识别装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述一种商品自动识别方法。
第四方面,本发明实施例提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述一种商品自动识别方法。
第五方面,本发明实施例提供了一种商品自动识别系统,包括图像采集设备以及与所述图像采集设备连接的计算机设备;其中,
所述图像采集设备,用于对商品进行拍摄;
所述计算机设备包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述一种商品自动识别方法。
上述本发明实施例中的一个或多个技术方案具有如下优点:本发明实施例获取得到第一商品图像后,通过使用深度学习模型,从而根据第一商品图像的商品位置标注数据以及利用深度学习模型而提取得到的第一商品图像的特征图,来实现商品类型的识别,这样相较于传统的条码识别技术,本发明实施例在进行商品识别时无需依赖人工寻找条码来辅助机器对条码的识别,智能自动化程度高,而且相较于RFID射频识别技术,本发明实施例无需购买大量的RFID标签,大大节省了设备投入购买成本,利于自动化零售的推广和使用,还有由于本发明实施例采用了深度学习模型来实现商品的识别,因此具有高的识别准确率。
附图说明
图1是本发明实施例一种商品自动识别方法的一具体实施例步骤流程示意图;
图2是本发明实施例一种商品自动识别系统的一具体实施例结构框图;
图3是本发明实施例一种商品自动识别装置的一具体实施例结构框图;
图4是本发明实施例一种商品自动识别系统的另一具体实施例结构框图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
如图1所示,本发明实施例提供了一种商品自动识别方法,其包括的步骤如下所示。
S101、获取第一商品图像。
具体地,对于所述第一商品图像,其可直接为摄像头拍摄得到的原始商品图像,也可以为对摄像头拍摄得到的原始商品图像进行图像预处理后得到的商品图像(其中,所述的图像预处理可包括但不限于有图像滤波、去躁、形态学图像处理等),前者具有步骤简易、处理效率高的优点,而后者则具有令识别准确度提高的优点。因此,对于获取何种商品图像作为所述第一商品图像,这可根据实际情况来进行设置选取。
S102、将所述第一商品图像输入至训练好的深度学习模型进行特征图提取处理后,得到所述第一商品图像的特征图。
具体地,所述深度学习模型中的卷积层主要用于对输入的图像进行特征提取后得到对应的特征图,也就是说,所述第一商品图像的特征图是从深度学习模型的卷积层中提取得到的。而利用训练好的深度学习模型来进行图像的特征图提取,这样提取出的特征会比较准确,而且这样能够利用所述深度学习模型来结合后续得到的商品位置标注数据,从而进行目标商品类型分类,即商品类别识别,大大提高从图像中自动识别目标商品类型的准确度。
S103、从所述特征图中获取所述第一商品图像的商品位置标注数据。
具体地,对于所述商品位置标注数据,其指的是用于标注目标前景(即商品)在第一商品图像的特征图上所处的位置数据,通常其所表示的标注形态为一个矩形框(即边界框),那么所述标注数据则表示了该矩形框的大小尺寸以及其在第一商品图像的特征图上所处的位置,这样按照所述商品位置标注数据,便能得到在第一商品图像的特征图上由该矩形框所框住的图像区域,即所述商品位置标注数据所对应的图像块,而所述由该矩形框所框住的图像区域,其为图像内容中涵盖有商品的图像块。其中,对于所述商品位置标注数据,其可通过人为方式进行标注而获取得到,也可通过训练机器学习模型来对输入的商品图像进行处理后而获取得到,本实施例中暂不做过多的限定。
S104、所述深度学习模型利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型。
具体地,由于深度学习模型在利用所述特征图在进行商品类型分类(即目标商品类型的识别),采用了所述商品位置标注数据,这样便能针对第一商品图像中含有商品的图像块进行商品类型识别,这样不仅处理效率更高,而且由于商品在图像中的占比较小,背景的面积范围很大,若直接对图片进行识别则会引入大量背景冗余信息,会对目标识别造成不良的影响,因此结合了商品位置标注数据来实现目标商品分类,能够大大提高商品识别准确率。
由上述可得,通过使用本发明实施例,只要对商品进行图像拍摄,便能利用深度学习模型且结合商品位置标注数据,从而对商品图像进行准确且快速的目标类型识别处理,以实现商品类型的识别,这样相较于传统的商品识别技术,本发明实施例的方案具有智能自动化程度高、投入设备购买成本低、处理效率高且识别准确的优点。
进一步作为本实施例的优选实施方式,所述从所述特征图中获取所述第一商品图像的商品位置标注数据这一步骤S103,其包括:
S1031、将所述第一商品图像输入区域候选网络RPN进行处理后,输出若干个矩形框候选结果以及每一个矩形框候选结果包含商品的概率;
S1032、将对应最大所述概率的矩形框候选结果作为所述第一商品图像的商品位置标注数据。
具体地,对于所述区域候选网络RPN,其在Faster RCNN算法中,主要用于从卷积层提取到的特征图中提取若干个候选框(即矩形框候选结果),并且计算得到每一个矩形框候选结果包含商品的概率,也就是说,将第一商品图像输入至训练好的RPN进行处理过程中,会利用滑动窗口和anchor机制从而在第一商品图像的特征图上提取对应的若干个候选框,并且计算出每个候选框所包含商品的概率,然后,会将概率最大的候选框作为所需获取的商品位置标注数据。可见,利用RPN技术来获取得到商品位置标注数据,能进一步实现智能自动化程度,提高处理效率,而且由于RPN也是一个机器学习模型,因此能够进一步提高商品位置标注数据的获取准确度,同时具有适用性强的优点,对商品的图像拍摄没有太多的限制,更有利于后续的推广和使用。
进一步作为本实施例的优选实施方式,所述利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型这一步骤S104,其包括:
S1041、从所述特征图中获取得到所述图像块对应的图像特征;
S1042、根据获取得到的图像特征,获取得到与所述图像特征最接近的商品类型后,输出所述获取得到的商品类型。
具体地,所述商品位置标注数据表示了边界框在第一商品图像的特征图上所处的定位位置,而该边界框所框处的图像区域即为所述的图像块,因此,从第一商品图像的特征图中能够得到所述图像块所包含的图像特征;然后,由于每个商品类型都具有各自所对应的类型特征,因此找出与所述图像特征最接近的类型特征所对应的商品类型,便是所需识别出的商品类型。
进一步作为本实施例的优选实施方式,所述获取第一商品图像这一步骤S101,其包括:
S1011、获取第一摄像头拍摄得到的原始商品图像;
S1012、对所述原始商品图像进行增强处理后得到所述第一商品图像。
可见,在本实施例中通过对第一摄像头拍摄得到的原始商品图像进行增强处理后才得到所需获得的第一商品图像,这样能够进一步提高后续对所述第一商品图像进行商品识别的准确度。
进一步作为本实施例的优选实施方式,还包括深度学习模型的训练步骤S100,所述深度学习模型的训练步骤S100包括:
S1001、获取第二摄像头在不同角度下拍摄得到的若干个第二商品图像;
S1002、获取第三摄像头在不同角度下拍摄得到的若干个第三商品图像;
S1003、获取第四摄像头在不同角度下拍摄得到的若干个第四商品图像;
其中,对于所述的不同角度,其可以是对摄像头进行不同角度的调整从而对商品进行拍摄,以拍摄得到不同角度下的商品图像,又或者可以是摄像头的拍摄角度不变,而通过改变商品的摆放姿势,以拍摄得到不同角度下的商品图像;例如,准备100种不同的商品,放第一个商品,将其摆成角度一,然后三个不同位置的摄像头(即所述第二摄像头、第三摄像头和第四摄像头)均对此商品进行拍摄,从而获取此时的商品图像;接着,将商品摆成角度二,三个摄像头均获取此时的商品图像;这样摆放四个不同角度,分别获取图像;之后将商品一换为商品二,继续操作,以此类推,直到对100种不同的商品进行图像拍摄完毕为止;
S1004、获取若干个第二商品图像的商品位置标注数据、若干个第三商品图像的商品位置标注数据以及若干个第四商品图像的商品位置标注数据;
S1005、将若干个第二商品图像、若干个第二商品图像的商品位置标注数据、若干个第三商品图像以及若干个第三商品图像的商品位置标注数据作为训练样本,将若干个第四商品图像以及若干个第四商品图像的商品位置标注数据作为测试样本;
其中,对于所述第二商品图像、第三商品图像和第四商品图像它们的商品位置标注数据,其获取方式可以与所述第一商品图像的商品位置标注数据的获取方式相同或者不相同,通常优选地,选择获取方式相同会更好;
S1006、利用所述训练样本、所述测试样本来对深度学习模型进行训练;
具体地,利用所述训练样本来对深度学习模型进行训练,利用测试样本来对深度学习模型进行测试,直到所述深度学习模型所输出的预测值在允许的误差范围内为止,这才结束所述深度学习模型的训练。
进一步作为本实施例的优选实施方式,所述深度学习模型为卷积神经网络模型。其中,若所述商品位置标注数据的获取方式是通过RPN来实现的,那么所述卷积神经网络模型则具体为Faster RCNN。
以下结合具体优选实施例来对本发明做更进一步的详细阐述。
在本具体优选实施例中,优选采用了Faster RCNN来实现商品的自动识别,因此,本发明实施例的具体实现步骤如下所示。
S201、对区域候选网络RPN进行预训练。
在本实施例中利用公开的COCO数据集对RPN进行预训练,使其具有判断物体大致位置以及是不是对象的能力,具体地,所述RPN对输入的图像进行处理后,会输出一组矩形框候选结果以及每一个矩形框包含对象的概率,其中,若图像中的目标对象为商品时,那么所述每一个矩形框包含对象的概率即为每一个矩形框包含商品的概率,若图像中的目标对象为动物时,那么所述每一个矩形框包含对象的概率即为每一个矩形框包含动物的概率,如此类推。而对于所述的COCO数据集(Common Objects in Context),其是一个大型且具有丰富的物体检测、分割和字幕的数据集,共有150万个对象实例和80个对象类别,压缩包大小约为25GB,不仅利用操作使用,而且可满足RPN对训练样本的需求。
由于输入所述卷积神经网络的训练图像容易存在光照变化以及镜面反射等容易降低识别准确度的问题,而且商品在图像中所占的面积较小,背景面积范围很大,若直接对输入的图片进行识别则会引入大量背景冗余信息,因此,确定对象(即商品)的位置对后续的识别处理来说将有很大帮助;而若直接使用传统的阈值分割等方法来实现对象位置的定位,则会存在因背景光照的变化以及镜面反射问题而不能很好地将前景对象(即商品)分离出来的情况,识别准确率和可靠性得不到保证。因此在本实施例中,首先利用公开的数据集对RPN进行训练,然后利用训练完成后的模型,对输入的商品训练图像中的商品位置进行预测,同时将预测结果作为标签对商品位置进行预标注,即得到输入的商品训练图像的商品位置标注数据,以实现了利用训练好的RPN对训练样本进行预标注的功能,从而减弱背景带来的影响,以及背景光照的变化以及镜面反射问题为商品识别所带来的不良影响,不仅提高了处理效率,而且大大提高了识别准确率。
S202、对卷积神经网络Faster RCNN进行训练。
具体地,利用上述RPN的预标注处理以及各种图像增强处理方法,可生成大量用于训练的数据,以实现Faster RCNN卷积神经网络进行分类和回归的训练。
在本实施例的卷积神经网络训练中,主要是利用自主采集的商品训练数据集来对所述卷积神经网络来进行训练,其中,所述训练数据的采集过程具体包括:
首先,获取第二摄像头在不同角度下拍摄得到的若干个第二商品图像,获取第三摄像头在不同角度下拍摄得到的若干个第三商品图像,以及获取第四摄像头在不同角度下拍摄得到的若干个第四商品图像;
具体地,采集图像使用3个不同位置的摄像头对商品进行拍摄,从而采集得到商品的图像数据;在拍摄时,通过4次改变商品的摆放姿势,使得每个摄像头拍摄的图片都包含4个不同的视角,其中,2个摄像头(即第二摄像头和第三摄像头)采集的图像作为训练样本,另外1个摄像头(即第三摄像头)采集的图像则作为测试样本,也就是说,每种商品包含有8张训练图像和4张测试图像,并且利用它们来对卷积神经网络的训练时,会先输入RPN进行预标注,此时则会得到这8张训练图像和4张测试图像所对应的商品位置标注数据(即获取若干个第二商品图像的商品位置标注数据、若干个第三商品图像的商品位置标注数据以及若干个第四商品图像的商品位置标注数据),那么则相当于所述训练图像与对应的商品位置标注数据为训练样本,即将若干个第二商品图像、若干个第二商品图像的商品位置标注数据、若干个第三商品图像以及若干个第三商品图像的商品位置标注数据作为训练样本,而所述测试图像和对应的商品位置标注数据为测试样本,即将若干个第四商品图像以及若干个第四商品图像的商品位置标注数据作为测试样本,那么利用它们来对卷积神经网络来进行训练,能够令所述卷积神经网络对输入的图像进行检测,框出商品的位置以进行商品类型的识别。
S203、利用训练好的RPN和Faster RCNN来对待测试的图片进行商品类型预测。
优选地,在本实施例中所述步骤S203的实现步骤如下所示。
S2031、获取第一摄像头拍摄得到的原始商品图像,然后对所述原始商品图像进行增强处理后得到所述第一商品图像。
具体地,首先通过摄像头采集商品的图像后,通过旋转、缩放等方式对采集得到的商品图像进行数据增强,以得到所需得到的待测商品图像,其中,所述缩放方式具体为将输入图片的大小统一缩放为800×600的分辨率的图片。
S2032、将所述第一商品图像输入至训练好的Faster RCNN进行特征图提取处理后,得到所述第一商品图像的特征图;
S2033、将所述第一商品图像输入区域候选网络RPN进行处理后,输出若干个矩形框候选结果以及每一个矩形框候选结果包含商品的概率,将对应最大所述概率的矩形框候选结果作为所述第一商品图像的商品位置标注数据。
具体地,将800×600分辨率的待测商品图像输入至RPN,RPN从待测商品图像的特征图中进行候选框的提取,即进行区域提取,从而输出一组矩形框(即候选框)候选结果以及每一个矩形框中包含对象的概率,然后将概率最大的矩形框候选结果作为待测商品图像的商品位置标注数据。
S2034、Faster RCNN从所述特征图中获取得到所述图像块对应的图像特征,然后根据获取得到的图像特征,获取得到与所述图像特征最接近的商品类型后,输出所述获取得到的商品类型。即根据卷积神经网络Faster RCNN提取到的特征图和RPN输出的结果,对目标商品进行分类,概率最大的即为所预测商品类别,最后输出最终的识别结果。
由上述可得,本发明实施例所具有的优点包括有:
1、与条码技术相比,本发明实施例不需要人工的辅助,实现了新零售的自动化;
2、与RFID射频识别技术相比,本发明实施例主要由软件实现,仅需要购买图像采集设备和计算机设备便可,无需购买大量RFID电子标签,节约投入购买成本,非常有利于自动化零售后续推广和普及实用;
3、本发明实施例采用了目标检测算法来实现商品的自动识别,通过Faster RCNN算法来对商品位置的预标注,将商品的大致位置定位出来,再进行网络训练,以消除背景对识别效果的影响,这样本方案能够对商品,尤其是小商品,进行有效的商品类型检测,大大提高了商品识别的准确率。
如图2所示,本发明实施例还提供了一种商品自动识别系统,包括:
第一获取模块,用于获取第一商品图像;
第二获取模块,用于将所述第一商品图像输入至训练好的深度学习模型进行特征图提取处理后,得到所述第一商品图像的特征图;
第三获取模块,用于从所述特征图中获取所述第一商品图像的商品位置标注数据;
第一处理模块,用于所述深度学习模型利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型。
进一步作为本实施例的优选实施方式,所述第三获取模块包括:
区域提取子模块,用于将所述第一商品图像输入区域候选网络进行处理后,输出若干个矩形框候选结果以及每一个矩形框候选结果包含商品的概率;
区域选定子模块,用于将对应最大所述概率的矩形框候选结果作为所述第一商品图像的商品位置标注数据。
进一步作为本实施例的优选实施方式,所述第一处理模块包括:
获取子模块,用于从所述特征图中获取得到所述图像块对应的图像特征;
分类子模块,用于根据获取得到的图像特征,获取得到与所述图像特征最接近的商品类型后,输出所述获取得到的商品类型。
进一步作为本实施例的优选实施方式,所述第一获取模块包括:
第一采集子模块,用于获取第一摄像头拍摄得到的原始商品图像;
图像处理子模块,用于对所述原始商品图像进行增强处理后得到所述第一商品图像。
进一步作为本实施例的优选实施方式,还包括用于深度学习模型训练的训练模块,所述训练模块包括:
第二采集子模块,用于获取第二摄像头在不同角度下拍摄得到的若干个第二商品图像;
第三采集子模块,用于获取第三摄像头在不同角度下拍摄得到的若干个第三商品图像;
第四采集子模块,用于获取第四摄像头在不同角度下拍摄得到的若干个第四商品图像;
数据获取子模块,用于获取若干个第二商品图像的商品位置标注数据、若干个第三商品图像的商品位置标注数据以及若干个第四商品图像的商品位置标注数据;
样本获取子模块,用于将若干个第二商品图像、若干个第二商品图像的商品位置标注数据、若干个第三商品图像以及若干个第三商品图像的商品位置标注数据作为训练样本,将若干个第四商品图像以及若干个第四商品图像的商品位置标注数据作为测试样本;
训练子模块,用于利用所述训练样本、所述测试样本来对深度学习模型进行训练。
进一步作为本实施例的优选实施方式,所述深度学习模型为卷积神经网络模型。
可见,上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
如图3所示,本发明实施例还提供了一种商品自动识别装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述方法实施例所述的商品自动识别方法步骤。
可见,上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
此外,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行上述方法实施例所述的商品自动识别方法步骤。同样地,上述方法实施例中的内容均适用于本存储介质实施例中,本存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
如图4所示,本发明实施例还提供了一种商品自动识别系统,包括图像采集设备以及与所述图像采集设备连接的计算机设备;其中,
所述图像采集设备,用于对商品进行拍摄;
所述计算机设备包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述方法实施例所述的商品自动识别方法步骤。
具体地,对于所述图像采集设备,其主要通过摄像头来实现,并且其可具体包括至少一个摄像头;而对于所述计算机设备,其可为不同类型的电子设备,包含但不限于有台式电脑、手提电脑等终端。
可见,上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种商品自动识别方法,其特征在于,包括以下步骤:
获取第一商品图像;
将所述第一商品图像输入至训练好的深度学习模型进行特征图提取处理后,得到所述第一商品图像的特征图;
从所述特征图中获取所述第一商品图像的商品位置标注数据;
所述深度学习模型利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型。
2.根据权利要求1所述一种商品自动识别方法,其特征在于,所述从所述特征图中获取所述第一商品图像的商品位置标注数据这一步骤,其包括:
将所述第一商品图像输入区域候选网络进行处理后,输出若干个矩形框候选结果以及每一个矩形框候选结果包含商品的概率;
将对应最大所述概率的矩形框候选结果作为所述第一商品图像的商品位置标注数据。
3.根据权利要求1所述一种商品自动识别方法,其特征在于,所述利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型这一步骤,其包括:
从所述特征图中获取得到所述图像块对应的图像特征;
根据获取得到的图像特征,获取得到与所述图像特征最接近的商品类型后,输出所述获取得到的商品类型。
4.根据权利要求1所述一种商品自动识别方法,其特征在于,所述获取第一商品图像这一步骤,其包括:
获取第一摄像头拍摄得到的原始商品图像;
对所述原始商品图像进行增强处理后得到所述第一商品图像。
5.根据权利要求1-4任一项所述一种商品自动识别方法,其特征在于,还包括深度学习模型的训练步骤,所述深度学习模型的训练步骤包括:
获取第二摄像头在不同角度下拍摄得到的若干个第二商品图像;
获取第三摄像头在不同角度下拍摄得到的若干个第三商品图像;
获取第四摄像头在不同角度下拍摄得到的若干个第四商品图像;
获取若干个第二商品图像的商品位置标注数据、若干个第三商品图像的商品位置标注数据以及若干个第四商品图像的商品位置标注数据;
将若干个第二商品图像、若干个第二商品图像的商品位置标注数据、若干个第三商品图像以及若干个第三商品图像的商品位置标注数据作为训练样本,将若干个第四商品图像以及若干个第四商品图像的商品位置标注数据作为测试样本;
利用所述训练样本、所述测试样本来对深度学习模型进行训练。
6.根据权利要求1-4任一项所述一种商品自动识别方法,其特征在于,所述深度学习模型为卷积神经网络模型。
7.一种商品自动识别系统,其特征在于,包括:
第一获取模块,用于获取第一商品图像;
第二获取模块,用于将所述第一商品图像输入至训练好的深度学习模型进行特征图提取处理后,得到所述第一商品图像的特征图;
第三获取模块,用于从所述特征图中获取所述第一商品图像的商品位置标注数据;
第一处理模块,用于所述深度学习模型利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型。
8.一种商品自动识别装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-6任一项所述一种商品自动识别方法。
9.一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-6任一项所述一种商品自动识别方法。
10.一种商品自动识别系统,其特征在于,包括图像采集设备以及与所述图像采集设备连接的计算机设备;其中,
所述图像采集设备,用于对商品进行拍摄;
所述计算机设备包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-6任一项所述一种商品自动识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811633640.0A CN109784385A (zh) | 2018-12-29 | 2018-12-29 | 一种商品自动识别方法、系统、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811633640.0A CN109784385A (zh) | 2018-12-29 | 2018-12-29 | 一种商品自动识别方法、系统、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109784385A true CN109784385A (zh) | 2019-05-21 |
Family
ID=66498899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811633640.0A Pending CN109784385A (zh) | 2018-12-29 | 2018-12-29 | 一种商品自动识别方法、系统、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109784385A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175590A (zh) * | 2019-05-31 | 2019-08-27 | 北京华捷艾米科技有限公司 | 一种商品识别方法及装置 |
CN110321797A (zh) * | 2019-05-31 | 2019-10-11 | 苏宁云计算有限公司 | 商品识别方法和装置 |
CN110705360A (zh) * | 2019-09-05 | 2020-01-17 | 上海零眸智能科技有限公司 | 一种人机结合高效处理分类数据的方法 |
CN110795992A (zh) * | 2019-09-11 | 2020-02-14 | 北京云迹科技有限公司 | 训练数据的获取方法、商品识别方法及对应装置 |
CN111640125A (zh) * | 2020-05-29 | 2020-09-08 | 广西大学 | 基于Mask R-CNN的航拍图建筑物检测和分割方法及装置 |
CN112115950A (zh) * | 2020-09-28 | 2020-12-22 | 郭杰 | 酒标识别方法、酒品信息管理方法、装置、设备及存储介质 |
WO2021068842A1 (zh) * | 2019-10-10 | 2021-04-15 | 深圳盈达信息科技有限公司 | 一种射频识别终端及其使用方法 |
CN112686220A (zh) * | 2021-03-10 | 2021-04-20 | 浙江口碑网络技术有限公司 | 商品识别方法及装置、计算设备、计算机存储介质 |
CN114267139A (zh) * | 2021-12-13 | 2022-04-01 | 湖南省金河计算机科技有限公司 | 一种基于物联网的智能pos机系统及其控制方法和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106504233A (zh) * | 2016-10-18 | 2017-03-15 | 国网山东省电力公司电力科学研究院 | 基于Faster R‑CNN的无人机巡检图像电力小部件识别方法及系统 |
CN108121986A (zh) * | 2017-12-29 | 2018-06-05 | 深圳云天励飞技术有限公司 | 目标检测方法及装置、计算机装置和计算机可读存储介质 |
CN108256580A (zh) * | 2018-01-19 | 2018-07-06 | 中山市宾哥网络科技有限公司 | 基于深度学习的商品图像标注方法及其装置 |
CN108447061A (zh) * | 2018-01-31 | 2018-08-24 | 深圳市阿西莫夫科技有限公司 | 商品信息处理方法、装置、计算机设备和存储介质 |
-
2018
- 2018-12-29 CN CN201811633640.0A patent/CN109784385A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106504233A (zh) * | 2016-10-18 | 2017-03-15 | 国网山东省电力公司电力科学研究院 | 基于Faster R‑CNN的无人机巡检图像电力小部件识别方法及系统 |
CN108121986A (zh) * | 2017-12-29 | 2018-06-05 | 深圳云天励飞技术有限公司 | 目标检测方法及装置、计算机装置和计算机可读存储介质 |
CN108256580A (zh) * | 2018-01-19 | 2018-07-06 | 中山市宾哥网络科技有限公司 | 基于深度学习的商品图像标注方法及其装置 |
CN108447061A (zh) * | 2018-01-31 | 2018-08-24 | 深圳市阿西莫夫科技有限公司 | 商品信息处理方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
胡正委: "基于深度学习的超市商品图像识别方法研究", 《万方数据》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175590A (zh) * | 2019-05-31 | 2019-08-27 | 北京华捷艾米科技有限公司 | 一种商品识别方法及装置 |
CN110321797A (zh) * | 2019-05-31 | 2019-10-11 | 苏宁云计算有限公司 | 商品识别方法和装置 |
CN110705360A (zh) * | 2019-09-05 | 2020-01-17 | 上海零眸智能科技有限公司 | 一种人机结合高效处理分类数据的方法 |
CN110795992A (zh) * | 2019-09-11 | 2020-02-14 | 北京云迹科技有限公司 | 训练数据的获取方法、商品识别方法及对应装置 |
WO2021068842A1 (zh) * | 2019-10-10 | 2021-04-15 | 深圳盈达信息科技有限公司 | 一种射频识别终端及其使用方法 |
US11797789B2 (en) | 2019-10-10 | 2023-10-24 | Shenzhen Idata Technology Company Ltd. | RFID terminal and method of using the same |
CN111640125A (zh) * | 2020-05-29 | 2020-09-08 | 广西大学 | 基于Mask R-CNN的航拍图建筑物检测和分割方法及装置 |
CN111640125B (zh) * | 2020-05-29 | 2022-11-18 | 广西大学 | 基于Mask R-CNN的航拍图建筑物检测和分割方法及装置 |
CN112115950A (zh) * | 2020-09-28 | 2020-12-22 | 郭杰 | 酒标识别方法、酒品信息管理方法、装置、设备及存储介质 |
CN112686220A (zh) * | 2021-03-10 | 2021-04-20 | 浙江口碑网络技术有限公司 | 商品识别方法及装置、计算设备、计算机存储介质 |
CN112686220B (zh) * | 2021-03-10 | 2021-06-22 | 浙江口碑网络技术有限公司 | 商品识别方法及装置、计算设备、计算机存储介质 |
CN114267139A (zh) * | 2021-12-13 | 2022-04-01 | 湖南省金河计算机科技有限公司 | 一种基于物联网的智能pos机系统及其控制方法和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109784385A (zh) | 一种商品自动识别方法、系统、装置及存储介质 | |
Dubey et al. | Fruit and vegetable recognition by fusing colour and texture features of the image using machine learning | |
Haddad et al. | Multifeature, sparse-based approach for defects detection and classification in semiconductor units | |
Xu et al. | Design of smart unstaffed retail shop based on IoT and artificial intelligence | |
CN111797653A (zh) | 基于高维图像的图像标注方法和装置 | |
CN107808126A (zh) | 车辆检索方法及装置 | |
CN110222582B (zh) | 一种图像处理方法和相机 | |
CN109871821A (zh) | 自适应网络的行人重识别方法、装置、设备及存储介质 | |
CN108073940B (zh) | 一种非结构化环境中的3d目标实例物体检测的方法 | |
Chen et al. | Edge-glued wooden panel defect detection using deep learning | |
CN112149690A (zh) | 一种基于生物图像特征识别的溯源方法和溯源系统 | |
Geng et al. | An improved helmet detection method for YOLOv3 on an unbalanced dataset | |
Shankar et al. | A framework to enhance object detection performance by using YOLO algorithm | |
Luo et al. | RBD-Net: robust breakage detection algorithm for industrial leather | |
Gregory et al. | A computer vision pipeline for automatic large-scale inventory tracking | |
Calefati et al. | Reading meter numbers in the wild | |
Shishkin et al. | Implementation of yolov5 for detection and classification of microplastics and microorganisms in marine environment | |
CN113850167A (zh) | 一种基于边缘计算与机器深度学习的商品识别方法及系统 | |
Maheshwari et al. | Bilingual text detection in natural scene images using invariant moments | |
Dai et al. | Retracted: efficient object analysis by leveraging deeply-trained object proposals prediction model | |
Yin et al. | A real-time vehicle logo detection method based on improved YOLOv2 | |
Liu et al. | Research on human pose estimation and object detection in the field of unmanned retail | |
CN111259843B (zh) | 基于视觉稳定特征分类配准的多媒体导航仪测试方法 | |
Zheng | Pipeline Multitype Artifact Recognition Method Based on Inception_Resnet _V2 Structure Improving SSD Network | |
Yi et al. | Research on fruit recognition method based on improved yolov4 algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190521 |
|
RJ01 | Rejection of invention patent application after publication |