CN113537191A - 一种烟盒喷码提取及识别方法 - Google Patents
一种烟盒喷码提取及识别方法 Download PDFInfo
- Publication number
- CN113537191A CN113537191A CN202110734438.2A CN202110734438A CN113537191A CN 113537191 A CN113537191 A CN 113537191A CN 202110734438 A CN202110734438 A CN 202110734438A CN 113537191 A CN113537191 A CN 113537191A
- Authority
- CN
- China
- Prior art keywords
- cigarette case
- code spraying
- extraction
- picture
- identification method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000019504 cigarettes Nutrition 0.000 title claims abstract description 46
- 238000000605 extraction Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000005507 spraying Methods 0.000 claims abstract description 42
- 238000001228 spectrum Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000013140 knowledge distillation Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 239000007921 spray Substances 0.000 claims description 2
- 239000013589 supplement Substances 0.000 claims description 2
- 241000208125 Nicotiana Species 0.000 abstract description 7
- 235000002637 Nicotiana tabacum Nutrition 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41J—TYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
- B41J3/00—Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
- B41J3/407—Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed for marking on special material
- B41J3/4073—Printing on three-dimensional objects not being in sheet or web form, e.g. spherical or cubic objects
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41J—TYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
- B41J3/00—Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
- B41J3/44—Typewriters or selective printing mechanisms having dual functions or combined with, or coupled to, apparatus performing other functions
- B41J3/445—Printers integrated in other types of apparatus, e.g. printers integrated in cameras
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41M—PRINTING, DUPLICATING, MARKING, OR COPYING PROCESSES; COLOUR PRINTING
- B41M3/00—Printing processes to produce particular kinds of printed work, e.g. patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Manufacturing & Machinery (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开一种烟盒喷码提取及识别方法,包括以下步骤:调取烟盒图片;对烟盒图片进行全光谱色灯AI图像增强;输出图像增强后的清晰烟盒图片;对清晰烟盒图片进行OCR识别提取喷码。本发明能够精准提取烟盒包装图片中正确位置的喷码并对其进行识别,有效解决了执法人员抄录、审查32位喷码的工作量繁重问题,使得烟草专卖部门能够对大量烟草进行抽查,大幅提高了相关部门的工作效率。
Description
技术领域
本发明应用于喷码识别领域,具体是一种烟盒喷码提取及识别方法。
背景技术
随着烟草专卖部门查获涉烟违法案件量的不断增加,办案过程中越来越多的呈现出卷烟数量大、卷烟品牌多、32位喷码不清晰等问题,执法人员抄录、审查32位喷码的工作工作变得十分繁重。而目前案件现场处置,仍依赖执法人员大量手工作业,当执法人员发现涉烟违法行为后,需要对卷烟进行手工分类、抄录32位喷码、人工审查喷码数据等。而大量的手工作业也造成了卷烟喷码抄录出错、人工审查效率低、来源地信息填写错误等众多问题。然而,现有算法中没有针对卷烟专用32位激光防伪码特点进行设计的高效的复杂场景识别方法。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种烟盒喷码提取及识别方法。
为解决上述技术问题,本发明的一种烟盒喷码提取及识别方法,包括以下步骤:
调取烟盒图片;
对烟盒图片进行全光谱色灯AI图像增强;
输出图像增强后的清晰烟盒图片;
对清晰烟盒图片进行OCR识别提取喷码。
作为一种可能的实施方式,进一步的,全光谱色灯AI图像增强具体为利用全光谱色灯预测算法同时进行双折射滤光和多色补光处理。
作为一种可能的实施方式,进一步的,所述对清晰烟盒图片进行OCR识别提取喷码步骤具体包括:
S1,输入处理后的清晰烟盒图片,并进行预处理;
S2,对预处理后的图片进行特征提取;
S3,将提取出的特征图分别进行字符识别操作和文本对象区分操作;
S4,将字符识别结果喂入区分出的文本对象获得classify word;
S5,将获得的classify word通过双向的LSTM网络处理为正确顺序喷码;
S6,输出结果。
作为一种可能的实施方式,进一步的,所述步骤S1中的预处理包括高斯降噪和边缘锐化处理。
作为一种可能的实施方式,进一步的,所述步骤S2中的特征提取具体包括如下步骤:
S21,利用GoogleNet进行多尺度的特征提取;
S22,利用两个沙漏网络进行特征再提取得到特征图。
作为一种可能的实施方式,进一步的,所述步骤S3中的字符识别操作具体包括:
S31,使用seglink算法对整体编码文本做定位处理;
S32,使用直方图阈值分割法,将整体编码里的每一个单独字符区分开;
S33,将每一个单独字符经过Resnet识别,softmax归一化处理,输出其分类。
作为一种可能的实施方式,进一步的,所述步骤S3中的文本对象区分操作具体为:
获取特征图上所有带文本的区域对象;
对带文本的区域对象进行区分,提取出喷码位置对区域对象作为输出对象。
作为一种可能的实施方式,进一步的,所述步骤S5还包括:检测喷码位数和字符逻辑是否符合预设数值。
作为一种可能的实施方式,进一步的,在执行所述步骤S6之前,还包括如下步骤:利用带有知识蒸馏的softmax对喷码进行归一化。
本发明采用以上技术方案,具有以下有益效果:本发明能够精准提取烟盒包装图片中正确位置的喷码并对其进行识别,有效解决了执法人员抄录、审查32位喷码的工作量繁重问题,使得烟草专卖部门能够对大量烟草进行抽查,大幅提高了相关部门的工作效率。
附图说明
下面结合附图与具体实施方式对本发明做进一步详细的说明:
图1为本发明进行OCR识别提取喷码的原理流程简图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述。
如图1所示,本发明提供了一种烟盒喷码提取及识别方法,包括以下步骤:
调取烟盒图片;
对烟盒图片进行全光谱色灯AI图像增强;其中全光谱色灯AI图像增强具体为利用全光谱色灯预测算法同时进行双折射滤光和多色补光处理。
输出图像增强后的清晰烟盒图片;
对清晰烟盒图片进行OCR识别提取喷码,其步骤具体包括:
S1,输入处理后的清晰烟盒图片,并进行包括高斯降噪和边缘锐化的预处理后生成input_1;
S2,对预处理后的图片进行特征提取,具体包括了:S21,利用GoogleNet进行多尺度的特征提取;S22,利用两个沙漏网络进行特征再提取得到特征图feature_3。
S3,将提取出的特征图feature_3经过两个分支操作,分别进行字符识别操作和文本对象区分操作;其中的字符识别操作具体包括:S31,使用seglink算法对整体编码文本做定位处理;S32,使用直方图阈值分割法,将整体编码里的每一个单独字符区分开;S33,将每一个单独字符经过Resnet识别,softmax归一化处理,输出其分类。其中,文本对象区分操作具体为:获取特征图上所有带文本的区域对象;对带文本的区域对象进行区分,提取出喷码位置对区域对象作为输出对象。
S4,将字符识别结果喂入区分出的文本对象获得classify word;
S5,将获得的classify word通过双向的LSTM网络处理为正确顺序喷码,分析其相邻喷码,最后生成整体级的输出;同时,检测喷码位数和字符逻辑是否符合预设数值。
S6,利用带有知识蒸馏的softmax对喷码进行归一化,可以通过控制参数实现软硬分类,避免过拟合,最后输出结果。
以上所述为本发明的实施例,对于本领域的普通技术人员而言,根据本发明的教导,在不脱离本发明的原理和精神的情况下凡依本发明申请专利范围所做的均等变化、修改、替换和变型,皆应属本发明的涵盖范围。
Claims (9)
1.一种烟盒喷码提取及识别方法,其特征在于,包括以下步骤:
调取烟盒图片;
对烟盒图片进行全光谱色灯AI图像增强;
输出图像增强后的清晰烟盒图片;
对清晰烟盒图片进行OCR识别提取喷码。
2.根据权利要求1所述的一种烟盒喷码提取及识别方法,其特征在于:全光谱色灯AI图像增强具体为利用全光谱色灯预测算法同时进行双折射滤光和多色补光处理。
3.根据权利要求1所述的一种烟盒喷码提取及识别方法,其特征在于:所述对清晰烟盒图片进行OCR识别提取喷码步骤具体包括:
S1,输入处理后的清晰烟盒图片,并进行预处理;
S2,对预处理后的图片进行特征提取;
S3,将提取出的特征图分别进行字符识别操作和文本对象区分操作;
S4,将字符识别结果喂入区分出的文本对象获得classify word;
S5,将获得的classify word通过双向的LSTM网络处理为正确顺序喷码;
S6,输出结果。
4.根据权利要求3所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S1中的预处理包括高斯降噪和边缘锐化处理。
5.根据权利要求4所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S2中的特征提取具体包括如下步骤:
S21,利用GoogleNet进行多尺度的特征提取;
S22,利用两个沙漏网络进行特征再提取得到特征图。
6.根据权利要求5所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S3中的字符识别操作具体包括:
S31,使用seglink算法对整体编码文本做定位处理;
S32,使用直方图阈值分割法,将整体编码里的每一个单独字符区分开;
S33,将每一个单独字符经过Resnet识别,softmax归一化处理,输出其分类。
7.根据权利要求6所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S3中的文本对象区分操作具体为:
获取特征图上所有带文本的区域对象;
对带文本的区域对象进行区分,提取出喷码位置对区域对象作为输出对象。
8.根据权利要求7所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S5还包括:检测喷码位数和字符逻辑是否符合预设数值。
9.根据权利要求8所述的一种烟盒喷码提取及识别方法,其特征在于:在执行所述步骤S6之前,还包括如下步骤:利用带有知识蒸馏的softmax对喷码进行归一化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110734438.2A CN113537191B (zh) | 2021-06-30 | 2021-06-30 | 一种烟盒喷码提取及识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110734438.2A CN113537191B (zh) | 2021-06-30 | 2021-06-30 | 一种烟盒喷码提取及识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113537191A true CN113537191A (zh) | 2021-10-22 |
CN113537191B CN113537191B (zh) | 2023-12-29 |
Family
ID=78126310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110734438.2A Active CN113537191B (zh) | 2021-06-30 | 2021-06-30 | 一种烟盒喷码提取及识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113537191B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001084336A (ja) * | 1999-09-16 | 2001-03-30 | Fujitsu Ltd | 文字認識装置及びその方法とプログラム記録媒体 |
CN106709531A (zh) * | 2017-01-20 | 2017-05-24 | 中国烟草总公司郑州烟草研究院 | 一种多过程匹配烟用材料使用物质识别方法及装置 |
CN110956510A (zh) * | 2019-12-30 | 2020-04-03 | 深圳爱莫科技有限公司 | 自动化烟草营销rpa方法及系统 |
CN112434544A (zh) * | 2020-12-09 | 2021-03-02 | 广东烟草阳江市有限责任公司 | 一种条烟编码检测识别方法及装置 |
-
2021
- 2021-06-30 CN CN202110734438.2A patent/CN113537191B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001084336A (ja) * | 1999-09-16 | 2001-03-30 | Fujitsu Ltd | 文字認識装置及びその方法とプログラム記録媒体 |
CN106709531A (zh) * | 2017-01-20 | 2017-05-24 | 中国烟草总公司郑州烟草研究院 | 一种多过程匹配烟用材料使用物质识别方法及装置 |
CN110956510A (zh) * | 2019-12-30 | 2020-04-03 | 深圳爱莫科技有限公司 | 自动化烟草营销rpa方法及系统 |
CN112434544A (zh) * | 2020-12-09 | 2021-03-02 | 广东烟草阳江市有限责任公司 | 一种条烟编码检测识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113537191B (zh) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102750541B (zh) | 一种文档图像分类识别方法及装置 | |
Agrawal et al. | Automated bank cheque verification using image processing and deep learning methods | |
CN105654072A (zh) | 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法 | |
CN110889402A (zh) | 一种基于深度学习的营业执照内容识别方法及系统 | |
CN110532564B (zh) | 一种基于cnn和lstm混合模型的应用层协议在线识别方法 | |
CN111882446A (zh) | 一种基于图卷积网络的异常账户检测方法 | |
CN114997169B (zh) | 一种实体词识别方法、装置、电子设备及可读存储介质 | |
CN116702069B (zh) | 一种基于状态感知的介质销毁的方法 | |
CN110543475A (zh) | 一种基于机器学习的财务报表数据自动识别和分析方法 | |
CN110543844A (zh) | 一种政务元数据pdf文件的元数据抽取方法 | |
CN108038484A (zh) | 空心验证码快速识别方法 | |
Jha et al. | Automation of cheque transaction using deep learning and optical character recognition | |
Yindumathi et al. | Analysis of image classification for text extraction from bills and invoices | |
CN112364837A (zh) | 一种基于目标检测和文本识别的票据信息识别方法 | |
CN112307842B (zh) | 用于列车运行监控记录文件匹配的视频识别系统及方法 | |
CN114821725A (zh) | 一种基于神经网络的矿工人脸识别系统 | |
CN116524725B (zh) | 一种智能驾驶的交通标志图像数据识别系统 | |
Karanje et al. | Survey on text detection, segmentation and recognition from a natural scene images | |
CN113537191A (zh) | 一种烟盒喷码提取及识别方法 | |
CN112508000A (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
CN115543915A (zh) | 人事档案目录自动化建库方法及系统 | |
CN104915682A (zh) | 一种豆科种子识别系统及方法 | |
CN113361330A (zh) | 一种电子文档自动识别系统及方法 | |
Khan et al. | Enhanced car number plate recognition (ECNPR) system by improving efficiency in preprocessing steps | |
CN114677552A (zh) | 用于深度学习的指纹细节数据库标注方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |