CN116824566A - 一种产品包装的生产日期识别方法、系统、设备及介质 - Google Patents
一种产品包装的生产日期识别方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN116824566A CN116824566A CN202310596882.1A CN202310596882A CN116824566A CN 116824566 A CN116824566 A CN 116824566A CN 202310596882 A CN202310596882 A CN 202310596882A CN 116824566 A CN116824566 A CN 116824566A
- Authority
- CN
- China
- Prior art keywords
- data
- product
- text
- date
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000007418 data mining Methods 0.000 claims abstract description 33
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000012937 correction Methods 0.000 claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 238000013075 data extraction Methods 0.000 claims abstract description 8
- 238000004891 communication Methods 0.000 claims description 23
- 238000001914 filtration Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 11
- 238000005065 mining Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012856 packing Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 11
- 238000012549 training Methods 0.000 abstract description 6
- 238000004806 packaging method and process Methods 0.000 abstract description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1463—Orientation detection or correction, e.g. rotation of multiples of 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种产品包装的生产日期识别方法、系统、设备及介质,所述方法包括以下步骤:采集待识别产品的产品信息,基于产品信息创建待识别数据;对待识别数据进行数据校正,对校正后的待识别数据进行日期数据挖掘,得到有效文本数据;对有效文本数据进行日期数据提取处理,得到待识别产品的生产日期信息;本发明能够基于OCR算法以及数据挖掘逻辑,对产品包装的生产日期进行精准识别,具有较高的识别准确率,较快的识别速度,且无需额外的训练流程,具有较高的适用性、便捷性和应用价值。
Description
技术领域
本发明涉及文字识别技术领域,特别是涉及一种产品包装的生产日期识别方法、系统、设备及介质。
背景技术
目前,产品包装生产日期识别是计算机视觉图像技术在工业场景中的一种应用。产品包装生产日期识别技术要求能够将产品生产日期从复杂背景中提取并识别出来,在物流管理、物资管理以及自动售货等领域中得到广泛应用。
现有技术中的产品包装生产日期识别方法,包括基于图像特征的方法和基于深度学习的方法;
其中,基于图像特征的方法通常利用计算机视觉库,对图像进行一系列的预处理操作,包括去噪、倾斜校正、二值化处理以及轮廓提取等,进而将文字与背景分离开来;然后把整体的文字分割成单独的字符,利用传统的图像特征算法来识别字符;该方法的弊端为:识别准确率比较低,当图片清晰度不高、背景比较复杂或者包装上有其他文字时,很难进行准确的日期识别;
其中,基于深度学习的方法主要利用OCR以及自然语言处理算法,自动提取图像特征以及文本特征来识别,无需复杂的预处理流程;但是,该方法依赖大量的真实图片数据进行模型训练,而一般的工业场景下,产品包装数据比较缺乏,同样会影响识别的准确率。
发明内容
本发明的目的在于,针对现有技术中的上述问题,提供一种产品包装的生产日期识别方法、系统、设备及介质,进而解决现有技术中产品包装生产日期识别准确率较低,操作较为复杂的问题。
为解决上述技术问题,本发明的具体技术方案如下:
一方面,本发明提供一种产品包装的生产日期识别方法,包括以下步骤:
采集待识别产品的产品信息,基于所述产品信息创建待识别数据;
对所述待识别数据进行数据校正,对校正后的所述待识别数据进行日期数据挖掘,得到有效文本数据;
对所述有效文本数据进行日期数据提取处理,得到所述待识别产品的生产日期信息。
作为一种改进的方案,所述采集待识别产品的产品信息,包括:
拍摄所述待识别产品的外包装图片;
将所述外包装图片作为所述产品信息。
作为一种改进的方案,所述基于所述产品信息创建待识别数据,包括:
调用OCR算法识别所述外包装图片中的文字数据;
确认所述文字数据在所述外包装图片中的图片区域;
对所述图片区域进行截取,得到截取区域;
将所述截取区域作为所述待识别数据。
作为一种改进的方案,所述对所述待识别数据进行数据校正,包括:
识别所述截取区域中的文字方向;
根据所述文字方向,对所述截取区域进行旋转校正处理;
所述文字方向,包括:九十度以内的倾斜文字图片、旋转九十度的文字图片以及旋转一百八十度的文字图片。
作为一种改进的方案,所述对校正后的所述待识别数据进行日期数据挖掘,得到有效文本数据,包括:
按行识别校正后的所述截取区域中的文本数据,得到文本行数据;
存储所述文本行数据,并对所述文本行数据进行有效数据挖掘,得到所述有效文本数据。
作为一种改进的方案,所述将所述文本行数据进行有效数据挖掘,得到所述有效文本数据,包括:
设定年份挖掘范围;
按照所述年份挖掘范围,对所述文本行数据进行读取;
若读取的所述文本行数据中包含所述年份挖掘范围内的任一年份,则设定该文本行数据作为所述有效文本数据。
作为一种改进的方案,所述对所述有效文本数据进行日期数据提取处理,得到所述待识别产品的生产日期信息,包括:
设定文本过滤项;
对所述有效文本数据中与所述文本过滤项相匹配的文字或符号进行移除;
设定移除与所述文本过滤项相匹配的文字或符号后的所述有效文本数据为所述生产日期信息。
另一方面,本发明还提供一种产品包装的生产日期识别系统,包括:
数据采集模块、数据挖掘处理模块和数据筛选提取模块;
所述数据采集模块,用于采集待识别产品的产品信息,基于所述产品信息创建待识别数据;
所述数据挖掘处理模块,用于对所述待识别数据进行数据校正,对校正后的所述待识别数据进行日期数据挖掘,得到有效文本数据;
所述数据筛选提取模块,用于对所述有效文本数据进行日期数据提取处理,得到所述待识别产品的生产日期信息。
另一方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述产品包装的生产日期识别方法的步骤。
另一方面,本发明还提供一种计算机设备,所述计算机设备包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中:
所述存储器,用于存放计算机程序;
所述处理器,用于通过运行所述存储器上所存放的程序来执行所述产品包装的生产日期识别方法的步骤。
本发明技术方案的有益效果是:
本发明所述的产品包装的生产日期识别方法,可以实现基于OCR算法以及数据挖掘逻辑,对产品包装的生产日期进行精准识别,具有较高的识别准确率,较快的识别速度,且无需额外的训练流程,具有较高的适用性、便捷性和应用价值。
本发明所述的产品包装的生产日期识别系统,可以通过数据采集模块、数据挖掘处理模块和数据筛选提取模块的相互配合,进而实现本发明所述的产品包装的生产日期识别方法。
本发明所述的计算机可读存储介质,可以实现引导数据采集模块、数据挖掘处理模块和数据筛选提取模块进行配合,进而实现本发明所述的产品包装的生产日期识别方法,且本发明所述的计算机可读存储介质还有效提高所述产品包装的生产日期识别方法的可操作性。
本发明所述的计算机设备,可以实现存储并执行所述计算机可读存储介质,进而实现本发明所述的产品包装的生产日期识别方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1所述产品包装的生产日期识别方法的流程示意图;
图2是本发明实施例2所述产品包装的生产日期识别系统的架构示意图;
图3是本发明实施例4所述计算机设备的结构示意图;
附图中的标记说明如下:
1501、处理器;1502、通信接口;1503、存储器;1504、通信总线。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
在本发明的描述中,需要说明的是,本发明所描述的实施例是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
本实施例提供一种产品包装的生产日期识别方法,如图1所示,包括以下步骤:
本方法中,主要进行产品包装中文字的提取,以及提取文字中有效生产日期数据的挖掘,进而实现高精准性且无需模型训练的产品生产日期识别,具体如下:
首先拍摄待识别产品的外包装的正面图片(可选择带有生产日期的一面或外包装的每一面);
采用OCR算法识别出所拍摄的外包装图片中的文字数据,在此过程中,先进行图片中的文字检测,把文本所在的区域从外包装的图片中进行截取,本方法中以一行文字对应一个截取区域为准;截取后,按照文本方向进行截取图片的分类,其中文本方向包括但不限于:存在小角度倾斜的文字图片、旋转90度的文字图片、旋转180度的的文字图片;对应上述图片,分别进行对应方向的旋转,实现图片中文字为正确状态,即图片文字方向校正;校正后,进行文本识别,识别出每个区域中的文本,由于图片以行划分,最终得到的应为若干文本行;将得到的若干文本行按行进行数据存储;
以上完成文本的识别,后续进行存储的文本行中生产日期数据的挖掘识别;其中,由于生产日期都包含完整的四位数的年份信息,例如2022,2023等;因此,在本申请中设定与具体需求相符合的年份范围,例如:2020-2050;按照该年份范围,对存储的所有文本行都进行循环遍历匹配;若一个文本行中包含2020-2050中的某一年份,例如2021,那么此文本行即为有效文本行,需要把该文本行提取,作为生产日期所在文本行;
当然,得到的文本行中还存在一些无效信息;因此,需要进行文本的无效文字过滤,其中过滤的内容包括但不限于除日期以外的文字及符号,例如:“生产日期”、“:”、“-”、“.”等;按照此方式,进行文本过滤,剩余的文本内容中仅为阿拉伯数据,例如“202301”,“2023121”,“20230101”;对于剩余的数据中,通常有6位、7位或8位的日期格式,此时就要对应不同格式进行年月日的拆分;例如,将上述“202301”,“2023121”,“20230101”,分别拆分:2023年1月;2023年1月21日;2023年1月1日;此时完成产品外包装的生产日期精准识别,无需较高的算力要求,也无需识别模型的复杂训练,便捷度和适用性较高。
实施例2
本实施例基于与实施例1中所述的一种产品包装的生产日期识别方法相同的发明构思,提供一种产品包装的生产日期识别系统,如图2所示,包括:数据采集模块、数据挖掘处理模块和数据筛选提取模块;
所述数据采集模块,用于采集待识别产品的产品信息,基于所述产品信息创建待识别数据;
作为一种实施方式,所述采集待识别产品的产品信息,包括:所述数据采集模块拍摄所述待识别产品的外包装图片;所述数据采集模块将所述外包装图片作为所述产品信息。
作为一种实施方式,所述基于所述产品信息创建待识别数据,包括:所述数据采集模块调用OCR算法识别所述外包装图片中的文字数据;所述数据采集模块确认所述文字数据在所述外包装图片中的图片区域;所述数据采集模块对所述图片区域进行截取,得到截取区域;所述数据采集模块将所述截取区域作为所述待识别数据。
所述数据挖掘处理模块,用于对所述待识别数据进行数据校正,对校正后的所述待识别数据进行日期数据挖掘,得到有效文本数据;
作为一种实施方式,所述对所述待识别数据进行数据校正,包括:所述数据挖掘处理模块识别所述截取区域中的文字方向;所述数据挖掘处理模块根据所述文字方向,对所述截取区域进行旋转校正处理;所述文字方向,包括:九十度以内的倾斜文字图片、旋转九十度的文字图片以及旋转一百八十度的文字图片。
作为一种实施方式,所述对校正后的所述待识别数据进行日期数据挖掘,得到有效文本数据,包括:所述数据挖掘处理模块按行识别校正后的所述截取区域中的文本数据,得到文本行数据;所述数据挖掘处理模块存储所述文本行数据,并对所述文本行数据进行有效数据挖掘,得到所述有效文本数据。
作为一种实施方式,所述将所述文本行数据进行有效数据挖掘,得到所述有效文本数据,包括:所述数据挖掘处理模块设定年份挖掘范围;所述数据挖掘处理模块按照所述年份挖掘范围,对所述文本行数据进行读取;若读取的所述文本行数据中包含所述年份挖掘范围内的任一年份,则所述数据挖掘处理模块设定该文本行数据作为所述有效文本数据。
所述数据筛选提取模块,用于对所述有效文本数据进行日期数据提取处理,得到所述待识别产品的生产日期信息。
作为一种实施方式,所述对所述有效文本数据进行日期数据提取处理,得到所述待识别产品的生产日期信息,包括:所述数据筛选提取模块设定文本过滤项;所述数据筛选提取模块对所述有效文本数据中与所述文本过滤项相匹配的文字或符号进行移除;所述数据筛选提取模块设定移除与所述文本过滤项相匹配的文字或符号后的所述有效文本数据为所述生产日期信息。
实施例3
本实施例提供一种计算机可读存储介质,包括:
所述存储介质用于储存将上述实施例1所述的产品包装的生产日期识别方法实现所用的计算机软件指令,其包含用于执行上述为所述产品包装的生产日期识别方法所设置的程序;具体的,该可执行程序可以内置在实施例2所述的产品包装的生产日期识别系统中,这样,产品包装的生产日期识别系统就可以通过执行内置的可执行程序实现所述实施例1所述的产品包装的生产日期识别方法。
此外,本实施例具有的计算机可读存储介质可以采用一个或多个可读存储介质的任意组合,其中,可读存储介质包括电、光、电磁、红外线或半导体的系统、装置或器件,或者以上任意组合。
实施例4
本实施例提供一种电子设备,如图3所示,电子设备可以包括:处理器1501、通信接口1502、存储器1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。
存储器1503,用于存放计算机程序;
处理器1501,用于执行存储器1503上所存放的计算机程序时,实现上述实施例1中所述产品包装的生产日期识别方法的步骤。
作为本发明的一种实施方式,上述终端提到的通信总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
作为本发明的一种实施方式,通信接口用于上述终端与其他设备之间的通信。
作为本发明的一种实施方式,存储器可以包括随机存取存储器(Random AccessMemory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为本发明的一种实施方式,上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
区别于现有技术,采用本申请一种产品包装的生产日期识别方法、系统、设备及介质,可以基于OCR算法以及数据挖掘逻辑,对产品包装的生产日期进行精准识别,具有较高的识别准确率,较快的识别速度,且无需额外的训练流程,具有较高的适用性、便捷性和应用价值。
应理解,在本文的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本文实施例的实施过程构成任何限定。
还应理解,在本文实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种产品包装的生产日期识别方法,其特征在于,包括以下步骤:
采集待识别产品的产品信息,基于所述产品信息创建待识别数据;
对所述待识别数据进行数据校正,对校正后的所述待识别数据进行日期数据挖掘,得到有效文本数据;
对所述有效文本数据进行日期数据提取处理,得到所述待识别产品的生产日期信息。
2.根据权利要求1所述的一种产品包装的生产日期识别方法,其特征在于:
所述采集待识别产品的产品信息,包括:
拍摄所述待识别产品的外包装图片;
将所述外包装图片作为所述产品信息。
3.根据权利要求2所述的一种产品包装的生产日期识别方法,其特征在于:
所述基于所述产品信息创建待识别数据,包括:
调用OCR算法识别所述外包装图片中的文字数据;
确认所述文字数据在所述外包装图片中的图片区域;
对所述图片区域进行截取,得到截取区域;
将所述截取区域作为所述待识别数据。
4.根据权利要求3所述的一种产品包装的生产日期识别方法,其特征在于:
所述对所述待识别数据进行数据校正,包括:
识别所述截取区域中的文字方向;
根据所述文字方向,对所述截取区域进行旋转校正处理;
所述文字方向,包括:九十度以内的倾斜文字图片、旋转九十度的文字图片以及旋转一百八十度的文字图片。
5.根据权利要求4所述的一种产品包装的生产日期识别方法,其特征在于:
所述对校正后的所述待识别数据进行日期数据挖掘,得到有效文本数据,包括:
按行识别校正后的所述截取区域中的文本数据,得到文本行数据;
存储所述文本行数据,并对所述文本行数据进行有效数据挖掘,得到所述有效文本数据。
6.根据权利要求5所述的一种产品包装的生产日期识别方法,其特征在于:
所述将所述文本行数据进行有效数据挖掘,得到所述有效文本数据,包括:
设定年份挖掘范围;
按照所述年份挖掘范围,对所述文本行数据进行读取;
若读取的所述文本行数据中包含所述年份挖掘范围内的任一年份,则设定该文本行数据作为所述有效文本数据。
7.根据权利要求6所述的一种产品包装的生产日期识别方法,其特征在于:
所述对所述有效文本数据进行日期数据提取处理,得到所述待识别产品的生产日期信息,包括:
设定文本过滤项;
对所述有效文本数据中与所述文本过滤项相匹配的文字或符号进行移除;
设定移除与所述文本过滤项相匹配的文字或符号后的所述有效文本数据为所述生产日期信息。
8.一种产品包装的生产日期识别系统,其特征在于,包括:数据采集模块、数据挖掘处理模块和数据筛选提取模块;
所述数据采集模块,用于采集待识别产品的产品信息,基于所述产品信息创建待识别数据;
所述数据挖掘处理模块,用于对所述待识别数据进行数据校正,对校正后的所述待识别数据进行日期数据挖掘,得到有效文本数据;
所述数据筛选提取模块,用于对所述有效文本数据进行日期数据提取处理,得到所述待识别产品的生产日期信息。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述产品包装的生产日期识别方法的步骤。
10.一种计算机设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中:
所述存储器,用于存放计算机程序;
所述处理器,用于通过运行所述存储器上所存放的程序来执行权利要求1~7中任一项所述产品包装的生产日期识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310596882.1A CN116824566A (zh) | 2023-05-25 | 2023-05-25 | 一种产品包装的生产日期识别方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310596882.1A CN116824566A (zh) | 2023-05-25 | 2023-05-25 | 一种产品包装的生产日期识别方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116824566A true CN116824566A (zh) | 2023-09-29 |
Family
ID=88115783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310596882.1A Pending CN116824566A (zh) | 2023-05-25 | 2023-05-25 | 一种产品包装的生产日期识别方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116824566A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117195081A (zh) * | 2023-11-07 | 2023-12-08 | 广东工业大学 | 基于文本挖掘的餐饮外卖包装废弃物核算方法 |
-
2023
- 2023-05-25 CN CN202310596882.1A patent/CN116824566A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117195081A (zh) * | 2023-11-07 | 2023-12-08 | 广东工业大学 | 基于文本挖掘的餐饮外卖包装废弃物核算方法 |
CN117195081B (zh) * | 2023-11-07 | 2024-02-27 | 广东工业大学 | 基于文本挖掘的餐饮外卖包装废弃物核算方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008809B (zh) | 表格数据的获取方法、装置和服务器 | |
CN106503703B (zh) | 使用终端设备来识别信用卡号码和到期日期的系统和方法 | |
EP2572317B1 (en) | Recognition of digital images | |
CN109409377B (zh) | 图像中文字的检测方法及装置 | |
CN109117773B (zh) | 一种图像特征点检测方法、终端设备及存储介质 | |
CN111680690B (zh) | 一种文字识别方法及装置 | |
CN107403128B (zh) | 一种物品识别方法及装置 | |
CN114119676B (zh) | 基于多特征信息融合的目标检测跟踪识别方法和系统 | |
CN110647882A (zh) | 图像校正方法、装置、设备及存储介质 | |
CN110751146B (zh) | 文本区域检测方法、装置、电子终端和计算机可读存储介质 | |
CN108717744B (zh) | 识别金融单据上的印章序号的方法、装置及终端设备 | |
CN113420756B (zh) | 证件图像的识别方法和装置、存储介质及电子装置 | |
CN116824566A (zh) | 一种产品包装的生产日期识别方法、系统、设备及介质 | |
CN112541443B (zh) | 发票信息抽取方法、装置、计算机设备及存储介质 | |
US10380416B2 (en) | Date identifying apparatus, date identifying method, and computer-readable recording medium | |
CN112001200A (zh) | 识别码识别方法、装置、设备、存储介质和系统 | |
CN109508571B (zh) | 一种条空定位方法、装置、电子设备及存储介质 | |
CN109508716B (zh) | 一种图像文字的定位方法及装置 | |
CN112052702A (zh) | 一种识别二维码的方法和装置 | |
CN110647895A (zh) | 一种基于登录框图像的钓鱼页面识别方法及相关设备 | |
CN109087439B (zh) | 票据校验方法、终端设备、存储介质及电子设备 | |
CN108268868B (zh) | 身份证图像的倾斜值获取方法及装置、终端、存储介质 | |
CN109389628A (zh) | 图像配准方法、设备和存储介质 | |
CN111598090B (zh) | 印刷电路板上标记的识别方法、装置、设备及存储介质 | |
CN113191189A (zh) | 人脸活体检测方法、终端设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |