CN112307967A - 一种商品识别模型训练优化方法 - Google Patents
一种商品识别模型训练优化方法 Download PDFInfo
- Publication number
- CN112307967A CN112307967A CN202011193578.5A CN202011193578A CN112307967A CN 112307967 A CN112307967 A CN 112307967A CN 202011193578 A CN202011193578 A CN 202011193578A CN 112307967 A CN112307967 A CN 112307967A
- Authority
- CN
- China
- Prior art keywords
- commodity
- training
- identification
- character
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明公开了一种商品识别模型训练优化方法,包括如下步骤商品识别训练样本中增加颜色特征采集,对样本集图像上的商品特征进行选择行框选、标注,包括颜色信息,形成训练集,进行深度学习训练,得到商品识别模型;采集待识别商品上的字符信息并进一步形成OCR字符识别训练样本集,形成OCR字符识别训练样本集;OCR字符识别训练得到识别模型;利用得到的商品识别模型和OCR字符识别模型进行商品识别;本发明通过增加商品外包装颜色特征进行商品识别模型训练和采集商品外包装上的字符信息进行OCR字符识别训练得到识别模型辅助商品识别,进一步的优化了识别模型,大大的提高了识别正确率。
Description
技术领域
本发明涉及一种商品识别模型训练优化方法,属于智能终端结算类产品技术领域。
背景技术
无人售卖超市、无人售货机等新型的商品售卖方式的出现,是人工智能、移动支付等技术发展的产物,不仅能够使新技术得到应用,也为消费者提供了方便和便捷,减少了排队结算、人员聚集,提高了商品售卖的效率;商品结算是该种售卖方式的关键环节,正确识别商品决定了一个售卖流程是否成功;随着深度学习技术、计算硬件的发展,深度学习训练是目前商品识别的主要应用手段,利用摄像头对待识别商品进行多角度的拍摄得到初始的样本集,然后对拍摄到的图像进行平移、仿射、模糊、噪声等多种图像处理方法进行处理,增加样本集的多样性,然后对样本中的特征进行框选、标注,建立深度学习模型训练框架进行训练,得到识别模型,对模型进行测试、进一步优化等,得到识别正确率更高的模型;虽然,深度学习框架不断发展,样本采集、处理方式的多样性使训练样本集不断扩充,但绝大多数的商品识别训练仍有其提高的空间,存在不足之处。
发明内容
针对上述存在的技术问题,本发明的目的是:提出了一种商品识别模型训练优化方法,增加对商品外包装颜色的采样和外包装上的字符识别来丰富商品识别的手段。
本发明的技术解决方案是这样实现的:一种商品识别模型训练优化方法,包括如下步骤,
商品识别训练样本中增加颜色特征采集,对待识别商品进行多角度、不同光照拍摄得到初始样本集,通过平移、噪声多种图像处理方法对初始样本集进行补充,对样本集图像上的商品特征进行选择行框选、标注,包括颜色信息,形成训练集,进行深度学习训练,得到商品识别模型;
采集待识别商品上的字符信息并进一步形成OCR字符识别训练样本集,对待识别商品上具有决定性信息的字符进行采集,对字符信息进行整理并将每个字符形成字符图像,对字符图像进行变换,增加字符的字体种类,形成OCR字符识别训练样本集;
OCR字符识别训练得到识别模型,利用得到的OCR字符识别训练样本集进行深度学习训练,得到OCR字符识别模型;
利用得到的商品识别模型和OCR字符识别模型进行商品识别,进行商品识别时,首先将待识别商品的图像上采集到的文字信息提取出来利用OCR字符识别模型得到一个识别结果,看是否能够通过文字识别得到商品结果,若不能得到良好的文字信息,然后再利用商品识别模型进行商品识别得到最终的识别结果。
优选的,在进行商品识别时,先识别出颜色,然后在该颜色的商品中再进一步进行识别。
优选的,文字信息包括字符种类、字体大小和字体变换。
优选的,商品上具有决定性信息的字符包含商品的品牌、口味信息。
优选的,对样本集图像上的商品特征进行图像进行处理时,不对图像进行灰度变化。
由于上述技术方案的运用,本发明与现有技术相比具有下列优点:
本发明的一种商品识别模型训练优化方法,通过增加商品外包装颜色特征进行商品识别模型训练和采集商品外包装上的字符信息进行OCR字符识别训练得到识别模型辅助商品识别,进一步的优化了识别模型,大大的提高了识别正确率。
附图说明
下面结合附图对本发明技术方案作进一步说明:
附图1为本发明的一种商品识别模型训练优化方法的流程示意图。
具体实施方式
下面结合附图来说明本发明。
如附图1所示为本发明所述的一种商品识别模型训练优化方法,包括如下步骤,
商品识别训练样本中增加颜色特征采集,对待识别商品进行多角度、不同光照拍摄得到初始样本集,通过平移、噪声多种图像处理方法对初始样本集进行补充,对样本集图像上的商品特征进行选择行框选、标注,包括颜色信息,不对图像进行灰度变化形成训练集,进行深度学习训练,得到商品识别模型;例如可口可乐一般是红黑色为主,百事可乐一般是蓝色为主,当识别到该种商品是蓝色时,如果最终结果有几个待选项,就可以选择百事可乐的选项;
采集待识别商品上的字符信息并进一步形成OCR字符识别训练样本集,对待识别商品上具有决定性信息的字符进行采集,商品上具有决定性信息的字符包含商品的品牌、口味信息,对字符信息进行整理并将每个字符形成字符图像,对字符图像进行变换,增加字符的字体种类,形成OCR字符识别训练样本集;
OCR字符识别训练得到识别模型,利用得到的OCR字符识别训练样本集进行深度学习训练,得到OCR字符识别模型;
利用得到的商品识别模型和OCR字符识别模型进行商品识别,进行商品识别时,先识别出颜色,然后在该颜色的商品中再进一步进行识别,首先将待识别商品的图像上采集到的文字信息提取出来利用OCR字符识别模型得到一个识别结果,文字信息包括字符种类、字体大小和字体变换,看是否能够通过文字识别得到商品结果,若不能得到良好的文字信息,然后再利用商品识别模型进行商品识别得到最终的识别结果。
本发明的一种商品识别模型训练优化方法,通过增加商品外包装颜色特征进行商品识别模型训练和采集商品外包装上的字符信息进行OCR字符识别训练得到识别模型辅助商品识别,进一步的优化了识别模型,大大的提高了识别正确率。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并加以实施,并不能以此限制本发明的保护范围,凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围内。
Claims (5)
1.一种商品识别模型训练优化方法,其特征在于:包括如下步骤,
商品识别训练样本中增加颜色特征采集,对待识别商品进行多角度、不同光照拍摄得到初始样本集,通过平移、噪声多种图像处理方法对初始样本集进行补充,对样本集图像上的商品特征进行选择行框选、标注,包括颜色信息,形成训练集,进行深度学习训练,得到商品识别模型;
采集待识别商品上的字符信息并进一步形成OCR字符识别训练样本集,对待识别商品上具有决定性信息的字符进行采集,对字符信息进行整理并将每个字符形成字符图像,对字符图像进行变换,增加字符的字体种类,形成OCR字符识别训练样本集;
OCR字符识别训练得到识别模型,利用得到的OCR字符识别训练样本集进行深度学习训练,得到OCR字符识别模型;
利用得到的商品识别模型和OCR字符识别模型进行商品识别,进行商品识别时,首先将待识别商品的图像上采集到的文字信息提取出来利用OCR字符识别模型得到一个识别结果,看是否能够通过文字识别得到商品结果,若不能得到良好的文字信息,然后再利用商品识别模型进行商品识别得到最终的识别结果。
2.如权利要求1所述的一种商品识别模型训练优化方法,其特征在于:在进行商品识别时,先识别出颜色,然后在该颜色的商品中再进一步进行识别。
3.如权利要求1所述的一种商品识别模型训练优化方法,其特征在于:文字信息包括字符种类、字体大小和字体变换。
4.如权利要求1所述的一种商品识别模型训练优化方法,其特征在于:商品上具有决定性信息的字符包含商品的品牌、口味信息。
5.如权利要求1所述的一种商品识别模型训练优化方法,其特征在于:对样本集图像上的商品特征进行图像进行处理时,不对图像进行灰度变化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011193578.5A CN112307967A (zh) | 2020-10-30 | 2020-10-30 | 一种商品识别模型训练优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011193578.5A CN112307967A (zh) | 2020-10-30 | 2020-10-30 | 一种商品识别模型训练优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112307967A true CN112307967A (zh) | 2021-02-02 |
Family
ID=74333096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011193578.5A Pending CN112307967A (zh) | 2020-10-30 | 2020-10-30 | 一种商品识别模型训练优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112307967A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506400A (zh) * | 2021-07-05 | 2021-10-15 | 深圳市点购电子商务控股股份有限公司 | 自动售货方法、装置、计算机设备和存储介质 |
CN114463359A (zh) * | 2022-01-30 | 2022-05-10 | 深圳创维-Rgb电子有限公司 | 投屏显示方法、装置、电子设备及可读存储介质 |
-
2020
- 2020-10-30 CN CN202011193578.5A patent/CN112307967A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506400A (zh) * | 2021-07-05 | 2021-10-15 | 深圳市点购电子商务控股股份有限公司 | 自动售货方法、装置、计算机设备和存储介质 |
CN114463359A (zh) * | 2022-01-30 | 2022-05-10 | 深圳创维-Rgb电子有限公司 | 投屏显示方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105046196B (zh) | 基于级联卷积神经网络的前车车辆信息结构化输出方法 | |
CN109165623B (zh) | 基于深度学习的水稻病斑检测方法及系统 | |
CN104408449B (zh) | 智能移动终端场景文字处理方法 | |
CN112307967A (zh) | 一种商品识别模型训练优化方法 | |
CN101807257A (zh) | 图像标签信息识别方法 | |
CN104881770A (zh) | 一种快递单信息识别系统和方法 | |
CN106339657B (zh) | 基于监控视频的秸秆焚烧监测方法、装置 | |
WO2023083280A1 (zh) | 一种场景文本识别方法和装置 | |
CN111860390A (zh) | 一种电梯候梯人数检测统计方法、装置、设备及介质 | |
CN111027631B (zh) | 高压耐张线夹压接缺陷判别的x射线影像分类识别方法 | |
CN109948696A (zh) | 一种多语言场景字符识别方法及系统 | |
CN110796022B (zh) | 一种基于多流形耦合映射的低分辨人脸识别方法 | |
CN109086772A (zh) | 一种扭曲粘连字符图片验证码的识别方法及系统 | |
CN113591866A (zh) | 基于db与crnn的特种作业证件检测方法及系统 | |
CN113096085A (zh) | 基于两阶段卷积神经网络的集装箱表面损伤检测方法 | |
CN114140665A (zh) | 一种基于改进YOLOv5的密集小目标检测方法 | |
JP2012150552A (ja) | 物体認識処理装置及び物体認識処理方法 | |
CN106645180A (zh) | 检查基板玻璃缺陷的方法、现场终端及服务器 | |
CN106650798A (zh) | 一种结合深度学习与稀疏表示的室内场景识别方法 | |
CN210161172U (zh) | 一种基于深度学习的瓶罐类垃圾识别分类机器人 | |
CN108427954B (zh) | 一种标牌信息采集与识别系统 | |
CN114049368A (zh) | 一种“iid+参树网”智能工业设计软件 | |
CN111414855B (zh) | 基于端到端回归模型的电线杆标牌目标检测及识别方法 | |
CN110766001B (zh) | 基于cnn和rnn的银行卡卡号定位与端到端识别方法 | |
CN116596891A (zh) | 基于半监督多任务检测的木地板颜色分类及缺陷检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |