CN113537191A - 一种烟盒喷码提取及识别方法 - Google Patents

一种烟盒喷码提取及识别方法 Download PDF

Info

Publication number
CN113537191A
CN113537191A CN202110734438.2A CN202110734438A CN113537191A CN 113537191 A CN113537191 A CN 113537191A CN 202110734438 A CN202110734438 A CN 202110734438A CN 113537191 A CN113537191 A CN 113537191A
Authority
CN
China
Prior art keywords
cigarette case
code spraying
extraction
picture
identification method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110734438.2A
Other languages
English (en)
Other versions
CN113537191B (zh
Inventor
苏胜
谢鸿
叶锋
施予
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Gabenon Information Technology Co ltd
Original Assignee
Fujian Gabenon Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Gabenon Information Technology Co ltd filed Critical Fujian Gabenon Information Technology Co ltd
Priority to CN202110734438.2A priority Critical patent/CN113537191B/zh
Publication of CN113537191A publication Critical patent/CN113537191A/zh
Application granted granted Critical
Publication of CN113537191B publication Critical patent/CN113537191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J3/00Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
    • B41J3/407Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed for marking on special material
    • B41J3/4073Printing on three-dimensional objects not being in sheet or web form, e.g. spherical or cubic objects
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J3/00Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
    • B41J3/44Typewriters or selective printing mechanisms having dual functions or combined with, or coupled to, apparatus performing other functions
    • B41J3/445Printers integrated in other types of apparatus, e.g. printers integrated in cameras
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41MPRINTING, DUPLICATING, MARKING, OR COPYING PROCESSES; COLOUR PRINTING
    • B41M3/00Printing processes to produce particular kinds of printed work, e.g. patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Manufacturing & Machinery (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开一种烟盒喷码提取及识别方法,包括以下步骤:调取烟盒图片;对烟盒图片进行全光谱色灯AI图像增强;输出图像增强后的清晰烟盒图片;对清晰烟盒图片进行OCR识别提取喷码。本发明能够精准提取烟盒包装图片中正确位置的喷码并对其进行识别,有效解决了执法人员抄录、审查32位喷码的工作量繁重问题,使得烟草专卖部门能够对大量烟草进行抽查,大幅提高了相关部门的工作效率。

Description

一种烟盒喷码提取及识别方法
技术领域
本发明应用于喷码识别领域,具体是一种烟盒喷码提取及识别方法。
背景技术
随着烟草专卖部门查获涉烟违法案件量的不断增加,办案过程中越来越多的呈现出卷烟数量大、卷烟品牌多、32位喷码不清晰等问题,执法人员抄录、审查32位喷码的工作工作变得十分繁重。而目前案件现场处置,仍依赖执法人员大量手工作业,当执法人员发现涉烟违法行为后,需要对卷烟进行手工分类、抄录32位喷码、人工审查喷码数据等。而大量的手工作业也造成了卷烟喷码抄录出错、人工审查效率低、来源地信息填写错误等众多问题。然而,现有算法中没有针对卷烟专用32位激光防伪码特点进行设计的高效的复杂场景识别方法。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种烟盒喷码提取及识别方法。
为解决上述技术问题,本发明的一种烟盒喷码提取及识别方法,包括以下步骤:
调取烟盒图片;
对烟盒图片进行全光谱色灯AI图像增强;
输出图像增强后的清晰烟盒图片;
对清晰烟盒图片进行OCR识别提取喷码。
作为一种可能的实施方式,进一步的,全光谱色灯AI图像增强具体为利用全光谱色灯预测算法同时进行双折射滤光和多色补光处理。
作为一种可能的实施方式,进一步的,所述对清晰烟盒图片进行OCR识别提取喷码步骤具体包括:
S1,输入处理后的清晰烟盒图片,并进行预处理;
S2,对预处理后的图片进行特征提取;
S3,将提取出的特征图分别进行字符识别操作和文本对象区分操作;
S4,将字符识别结果喂入区分出的文本对象获得classify word;
S5,将获得的classify word通过双向的LSTM网络处理为正确顺序喷码;
S6,输出结果。
作为一种可能的实施方式,进一步的,所述步骤S1中的预处理包括高斯降噪和边缘锐化处理。
作为一种可能的实施方式,进一步的,所述步骤S2中的特征提取具体包括如下步骤:
S21,利用GoogleNet进行多尺度的特征提取;
S22,利用两个沙漏网络进行特征再提取得到特征图。
作为一种可能的实施方式,进一步的,所述步骤S3中的字符识别操作具体包括:
S31,使用seglink算法对整体编码文本做定位处理;
S32,使用直方图阈值分割法,将整体编码里的每一个单独字符区分开;
S33,将每一个单独字符经过Resnet识别,softmax归一化处理,输出其分类。
作为一种可能的实施方式,进一步的,所述步骤S3中的文本对象区分操作具体为:
获取特征图上所有带文本的区域对象;
对带文本的区域对象进行区分,提取出喷码位置对区域对象作为输出对象。
作为一种可能的实施方式,进一步的,所述步骤S5还包括:检测喷码位数和字符逻辑是否符合预设数值。
作为一种可能的实施方式,进一步的,在执行所述步骤S6之前,还包括如下步骤:利用带有知识蒸馏的softmax对喷码进行归一化。
本发明采用以上技术方案,具有以下有益效果:本发明能够精准提取烟盒包装图片中正确位置的喷码并对其进行识别,有效解决了执法人员抄录、审查32位喷码的工作量繁重问题,使得烟草专卖部门能够对大量烟草进行抽查,大幅提高了相关部门的工作效率。
附图说明
下面结合附图与具体实施方式对本发明做进一步详细的说明:
图1为本发明进行OCR识别提取喷码的原理流程简图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述。
如图1所示,本发明提供了一种烟盒喷码提取及识别方法,包括以下步骤:
调取烟盒图片;
对烟盒图片进行全光谱色灯AI图像增强;其中全光谱色灯AI图像增强具体为利用全光谱色灯预测算法同时进行双折射滤光和多色补光处理。
输出图像增强后的清晰烟盒图片;
对清晰烟盒图片进行OCR识别提取喷码,其步骤具体包括:
S1,输入处理后的清晰烟盒图片,并进行包括高斯降噪和边缘锐化的预处理后生成input_1;
S2,对预处理后的图片进行特征提取,具体包括了:S21,利用GoogleNet进行多尺度的特征提取;S22,利用两个沙漏网络进行特征再提取得到特征图feature_3。
S3,将提取出的特征图feature_3经过两个分支操作,分别进行字符识别操作和文本对象区分操作;其中的字符识别操作具体包括:S31,使用seglink算法对整体编码文本做定位处理;S32,使用直方图阈值分割法,将整体编码里的每一个单独字符区分开;S33,将每一个单独字符经过Resnet识别,softmax归一化处理,输出其分类。其中,文本对象区分操作具体为:获取特征图上所有带文本的区域对象;对带文本的区域对象进行区分,提取出喷码位置对区域对象作为输出对象。
S4,将字符识别结果喂入区分出的文本对象获得classify word;
S5,将获得的classify word通过双向的LSTM网络处理为正确顺序喷码,分析其相邻喷码,最后生成整体级的输出;同时,检测喷码位数和字符逻辑是否符合预设数值。
S6,利用带有知识蒸馏的softmax对喷码进行归一化,可以通过控制参数实现软硬分类,避免过拟合,最后输出结果。
以上所述为本发明的实施例,对于本领域的普通技术人员而言,根据本发明的教导,在不脱离本发明的原理和精神的情况下凡依本发明申请专利范围所做的均等变化、修改、替换和变型,皆应属本发明的涵盖范围。

Claims (9)

1.一种烟盒喷码提取及识别方法,其特征在于,包括以下步骤:
调取烟盒图片;
对烟盒图片进行全光谱色灯AI图像增强;
输出图像增强后的清晰烟盒图片;
对清晰烟盒图片进行OCR识别提取喷码。
2.根据权利要求1所述的一种烟盒喷码提取及识别方法,其特征在于:全光谱色灯AI图像增强具体为利用全光谱色灯预测算法同时进行双折射滤光和多色补光处理。
3.根据权利要求1所述的一种烟盒喷码提取及识别方法,其特征在于:所述对清晰烟盒图片进行OCR识别提取喷码步骤具体包括:
S1,输入处理后的清晰烟盒图片,并进行预处理;
S2,对预处理后的图片进行特征提取;
S3,将提取出的特征图分别进行字符识别操作和文本对象区分操作;
S4,将字符识别结果喂入区分出的文本对象获得classify word;
S5,将获得的classify word通过双向的LSTM网络处理为正确顺序喷码;
S6,输出结果。
4.根据权利要求3所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S1中的预处理包括高斯降噪和边缘锐化处理。
5.根据权利要求4所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S2中的特征提取具体包括如下步骤:
S21,利用GoogleNet进行多尺度的特征提取;
S22,利用两个沙漏网络进行特征再提取得到特征图。
6.根据权利要求5所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S3中的字符识别操作具体包括:
S31,使用seglink算法对整体编码文本做定位处理;
S32,使用直方图阈值分割法,将整体编码里的每一个单独字符区分开;
S33,将每一个单独字符经过Resnet识别,softmax归一化处理,输出其分类。
7.根据权利要求6所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S3中的文本对象区分操作具体为:
获取特征图上所有带文本的区域对象;
对带文本的区域对象进行区分,提取出喷码位置对区域对象作为输出对象。
8.根据权利要求7所述的一种烟盒喷码提取及识别方法,其特征在于:所述步骤S5还包括:检测喷码位数和字符逻辑是否符合预设数值。
9.根据权利要求8所述的一种烟盒喷码提取及识别方法,其特征在于:在执行所述步骤S6之前,还包括如下步骤:利用带有知识蒸馏的softmax对喷码进行归一化。
CN202110734438.2A 2021-06-30 2021-06-30 一种烟盒喷码提取及识别方法 Active CN113537191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110734438.2A CN113537191B (zh) 2021-06-30 2021-06-30 一种烟盒喷码提取及识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110734438.2A CN113537191B (zh) 2021-06-30 2021-06-30 一种烟盒喷码提取及识别方法

Publications (2)

Publication Number Publication Date
CN113537191A true CN113537191A (zh) 2021-10-22
CN113537191B CN113537191B (zh) 2023-12-29

Family

ID=78126310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110734438.2A Active CN113537191B (zh) 2021-06-30 2021-06-30 一种烟盒喷码提取及识别方法

Country Status (1)

Country Link
CN (1) CN113537191B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084336A (ja) * 1999-09-16 2001-03-30 Fujitsu Ltd 文字認識装置及びその方法とプログラム記録媒体
CN106709531A (zh) * 2017-01-20 2017-05-24 中国烟草总公司郑州烟草研究院 一种多过程匹配烟用材料使用物质识别方法及装置
CN110956510A (zh) * 2019-12-30 2020-04-03 深圳爱莫科技有限公司 自动化烟草营销rpa方法及系统
CN112434544A (zh) * 2020-12-09 2021-03-02 广东烟草阳江市有限责任公司 一种条烟编码检测识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084336A (ja) * 1999-09-16 2001-03-30 Fujitsu Ltd 文字認識装置及びその方法とプログラム記録媒体
CN106709531A (zh) * 2017-01-20 2017-05-24 中国烟草总公司郑州烟草研究院 一种多过程匹配烟用材料使用物质识别方法及装置
CN110956510A (zh) * 2019-12-30 2020-04-03 深圳爱莫科技有限公司 自动化烟草营销rpa方法及系统
CN112434544A (zh) * 2020-12-09 2021-03-02 广东烟草阳江市有限责任公司 一种条烟编码检测识别方法及装置

Also Published As

Publication number Publication date
CN113537191B (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
CN102750541B (zh) 一种文档图像分类识别方法及装置
Agrawal et al. Automated bank cheque verification using image processing and deep learning methods
CN105654072A (zh) 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
CN110889402A (zh) 一种基于深度学习的营业执照内容识别方法及系统
CN110532564B (zh) 一种基于cnn和lstm混合模型的应用层协议在线识别方法
CN111882446A (zh) 一种基于图卷积网络的异常账户检测方法
CN114997169B (zh) 一种实体词识别方法、装置、电子设备及可读存储介质
CN116702069B (zh) 一种基于状态感知的介质销毁的方法
CN110543475A (zh) 一种基于机器学习的财务报表数据自动识别和分析方法
CN110543844A (zh) 一种政务元数据pdf文件的元数据抽取方法
CN108038484A (zh) 空心验证码快速识别方法
Jha et al. Automation of cheque transaction using deep learning and optical character recognition
Yindumathi et al. Analysis of image classification for text extraction from bills and invoices
CN112364837A (zh) 一种基于目标检测和文本识别的票据信息识别方法
CN112307842B (zh) 用于列车运行监控记录文件匹配的视频识别系统及方法
CN114821725A (zh) 一种基于神经网络的矿工人脸识别系统
CN116524725B (zh) 一种智能驾驶的交通标志图像数据识别系统
Karanje et al. Survey on text detection, segmentation and recognition from a natural scene images
CN113537191A (zh) 一种烟盒喷码提取及识别方法
CN112508000A (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
CN115543915A (zh) 人事档案目录自动化建库方法及系统
CN104915682A (zh) 一种豆科种子识别系统及方法
CN113361330A (zh) 一种电子文档自动识别系统及方法
Khan et al. Enhanced car number plate recognition (ECNPR) system by improving efficiency in preprocessing steps
CN114677552A (zh) 用于深度学习的指纹细节数据库标注方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant