CN114677701A - 一种数据识别方法、装置、设备及存储介质 - Google Patents

一种数据识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114677701A
CN114677701A CN202210239208.3A CN202210239208A CN114677701A CN 114677701 A CN114677701 A CN 114677701A CN 202210239208 A CN202210239208 A CN 202210239208A CN 114677701 A CN114677701 A CN 114677701A
Authority
CN
China
Prior art keywords
target
image
area
information
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210239208.3A
Other languages
English (en)
Inventor
代华锋
高爽笑
荣刚
孙伟
赵兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LCFC Hefei Electronics Technology Co Ltd
Original Assignee
LCFC Hefei Electronics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LCFC Hefei Electronics Technology Co Ltd filed Critical LCFC Hefei Electronics Technology Co Ltd
Priority to CN202210239208.3A priority Critical patent/CN114677701A/zh
Publication of CN114677701A publication Critical patent/CN114677701A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了一种数据识别方法、装置、设备及存储介质,方法主要包括:获取目标图像;所述目标图像进行图像识别,得到图像识别结果,所述图像识别结果包括多个目标区域和所述目标区域的数据信息;根据所述数据信息,对所述多个目标区域进行分类,得到所述目标区域的分类结果;根据所述分类结果,对所述多个目标区域的数据信息进行分类匹配,生成数据识别结果。由此,能够针对目标图像实现自动化识别,有效解决图像位置检测过程中由于图像打印偏移导致图像位置检测不准确的问题,由此,显著提升图像数据识别准确率进而有效提高目标区域的数据信息识别准确率。

Description

一种数据识别方法、装置、设备及存储介质
技术领域
本公开涉及计算机视觉技术领域,尤其涉及一种数据识别方法、装置、设备及存储介质。
背景技术
笔记本电脑外包箱上常需要贴附各种配置单标签,标签上记载了关于该笔记本的各种信息,所以包装箱标签的检测十分重要。在标签检测的过程中待检测内容很多很复杂,且都有被检测的必要。现有技术的操作是通过前置的人工测量或者自动化的图像匹配文字识别等手段进行建模,依据建模得到的数据在固定区域截取固定的子图像进行相应的检测。但在标签的打印端常出现打印偏移的现象,导致原先依据测量所得的位置数据不再具有准确性。
发明内容
本公开提供了一种数据识别方法、装置、设备及存储介质,以至少解决现有技术中存在的以上技术问题。
根据本公开的第一方面,提供了一种数据识别方法,所述方法包括:获取目标图像;对所述目标图像进行图像识别,得到图像识别结果,所述图像识别结果包括多个目标区域和所述目标区域的数据信息;根据所述数据信息,对所述多个目标区域进行分类,得到所述目标区域的分类结果;根据所述分类结果,对所述多个目标区域的数据信息进行分类匹配,生成数据识别结果。
在一可实施方式中,所述获取目标图像包括:获取原始图像;对所述原始图像进行预处理,得到目标图像。
在一可实施方式中,所述对所述目标图像进行图像识别,包括:使用图像检测模型,对所述目标图像进行目标识别,得到多个目标区域;对所述目标区域进行类别识别、位置识别以及内容识别。
在一可实施方式中,所述图像检测模型采用以下操作得到:获取多个样本图像,所述样本图像包括多个样本区域;对所述样本图像的多个样本区域进行数据信息标注,确定所述多个样本图像的数据信息;根据所述多个样本图像的数据信息,对神经网络进行训练,得到所述图像检测模型。
在一可实施方式中,所述根据所述分类结果,对所述多个目标区域的数据信息进行分类匹配,生成数据识别结果,包括:根据所述分类结果,将所述目标区域的数据信息与预设信息模板中与所述目标区域的分类结果一致的区域的数据信息进行遍历匹配,生成数据识别结果;其中,所述预设信息模板包括多个预设目标区域以及所述预设目标区域的数据信息。
在一可实施方式中,所述将所述目标区域的数据信息与预设信息模板中与所述目标区域的分类结果一致的区域的数据信息进行遍历匹配,包括:将目标区域的面积信息与预设信息模板中与所述目标区域的分类结果一致的区域的面积信息进行匹配,并根据预设面积阈值确定所述目标区域的面积匹配结果;在所述目标区域的面积匹配结果不符合预设面积条件的情况下,将目标区域的位置信息与预设信息模板中与所述目标区域的分类结果一致的区域的位置信息进行匹配,并根据预设位置阈值确定所述目标区域的位置匹配结果。
在一可实施方式中,所述将所述目标区域的数据信息与预设信息模板中与所述目标区域的分类结果一致的区域的数据信息进行遍历匹配,包括:将目标区域的内容信息与预设信息模板中与所述目标区域的分类结果一致的区域的内容信息进行匹配,确定所述目标区域的内容匹配结果。
根据本公开的第二方面,提供了一种数据识别装置,所述装置包括:获取模块,用于获取目标图像;识别模块,用于对所述目标图像进行图像识别,得到图像识别结果,所述图像识别结果包括多个目标区域和所述目标区域的数据信息;分类模块,用于根据所述数据信息,对所述多个目标区域进行分类,得到所述目标区域的分类结果;匹配模块,用于根据所述分类结果,对所述多个目标区域的数据信息进行分类匹配,生成数据识别结果。
根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
本公开的一种数据识别方法,通过直接对图像进行识别,得到多个目标区域及目标区域的数据信息之后,直接按照目标区域的类别,对目标区域进行分类匹配从而得到图像数据识别结果的自动化识别的方案,能够针对目标图像实现自动化识别,有效解决图像位置检测过程中由于图像打印偏移导致图像位置检测不准确的问题,由此,显著提升图像数据识别准确率,进而有效提高目标区域的数据信息识别准确率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本公开实施例数据识别方法的流程示意图;
图2示出了本公开实施例数据识别方法中预处理前和预处理后的图像;
图3示出了本公开实施例数据识别方法中XML文档形式的预设信息模板的示意图;
图4示出了本公开另一实施例数据识别装置的示意图。
具体实施方式
为使本公开的目的、特征、优点能够更加的明显和易懂,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而非全部实施例。基于本公开中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
现有的外包装箱体贴附着标签图像,标签图像通常贴附在箱体的正面或两侧面。这些标签图像的大小、形状,以及种类繁多。在产品生产过程中,标签打印偏移等现象常有发生,严重影响了外包箱标签的美观和信息完整性,所以包装箱标签的检测十分重要。
目前,标签检测的方法通常是通过前置的人工测量或者自动化的图像匹配文字识别等手段进行建模,依据建模得到的数据在固定区域截取固定的子图像进行相应的检测。但打印和建模容易出现偏差,而打印偏差就可能影响到标签的后续识别。基于此,本申请提供了一种数据识别方法,来解决标签打印偏移对标签识别产生影响的问题。
图1示出了本公开实施例数据识别方法的流程示意图。
如图1所示,本公开实施例数据识别方法主要包括:步骤S101,获取目标图像;步骤S102,对目标图像进行图像识别,得到图像识别结果,图像识别结果包括多个目标区域和目标区域的数据信息;步骤S103,根据数据信息,对多个目标区域进行分类,得到目标区域的分类结果;步骤S104,根据分类结果,对多个目标区域的数据信息进行分类匹配,生成数据识别结果。
在步骤S101,获取目标图像。
在本公开这一实施例中,目标图像可以包括设备的多个信息的标签图像,也可以是其他图像,在这里不作太多的限定。这里,目标图像的获取方式同样可以基于扫描的方式获取,也可以采用图像采集装置获取,例如:摄像机等,还可以基于图像特征提取方式或者图像识别方式进行获取。
在本公开一实施方式中,在对目标图像进行图像识别之前,可以首先获取原始图像,然后对原始图像进行预处理,得到目标图像。
图2示出了本公开实施例数据识别方法预处理前和预处理后的图像。
在本发明这一实施例中,在获取到原始图像后,首先对原始图像进行黑白二值化处理,之后通过找轮廓的方式找到目标图像的具体轮廓,并通过在轮廓内进行线扫描的方式得到四条边框线,最后通过求四条线交点的方式截取出具体的目标图像。
参考图2,以标签为例,首先可以通过图像获取的方式获取到一张如图2(a)所示的原始标签图像,之后利用上述方法对图2(a)进行预处理便得到了预处理后的标签图像2(b)。在步骤S102,对目标图像进行图像识别,得到图像识别结果,图像识别结果包括多个目标区域和目标区域的数据信息。
举例说明,在获取到目标图像后会对目标图像进行识别,识别出目标图像中的多个目标区域,这里目标区域可以为识别出的标签中的多个黑色区域,如条码、文字、图片等。其中,目标区域的数据信息用于指示目标图像的内容信息、位置信息、尺寸信息以及类别信息等。
在本公开一实施方式中,对目标图像进行图像识别的具体操作可以包括:使用图像检测模型,对目标图像进行目标识别,得到多个目标区域;对目标区域进行类别识别、位置识别以及内容识别。
举例说明,获取到目标图像后,需要利图像检测模型对目标图像进行扫描,扫描出多个目标区域。在扫描出多个目标区域后,对多个目标区域进行分类得到多个目标区域的类别,在对多个目标区域进行分类的过程中,同时对多个目标区域进行位置识别得到目标区域的位置信息,在所有目标区域的类别信息以及位置信息均被识别出来后对多个目标区域进行内容识别,来得到多个目标区域对应的内容信息。
在本公开一实施方式中,图像检测模型可以为基于掩膜的区域卷积神经网络MaskR-CNN,Mask R-CNN可以同时对多类物体做检测和分割,Mask R-CNN主要包括三个分支,分别为classification分支,用来对目标分类;bounding box regression分支,用来定位物体;mask分支,用来对框内的物体做实例分割。需要说明的是,这里不对图像检测模型作具体限定,只要是能实现相同作用的模型均可,例如Faster R-CNN等。
举例说明,在利用Mask R-CNN对目标图像进行识别的过程中,首先对目标图像进行卷积,提取出待处理图像的特征,然后根据目标图像的特征,利用三个分支识别分割出目标图像中的的多个目标区域,并返回每个目标区域的数据信息,这里数据信息可以包括目标区域的面积、位置、类别及内容。如此,通过端到端的神经网络,在将目标图像输入网络模型后便可以直接输出目标图像中的目标区域的位置、类别、内容等信息,提高了目标图像的识别效率。
在本公开一实施方式中,还可以将目标图像作为三份来输入到图像检测模型,来进一步加快目标图像的识别速度。
举例说明,在对目标图像识别的过程中,需要对目标图像进行类别识别、位置识别以及内容识别,而这三种识别分别需要图像检测模型中的三个网络来分别进行。如此,将目标图像作为三份来输入到图像检测模型便可以对应的使模型中的三个网络分支并行计算,从而加快了对目标图像的识别效率。
在本公开一实施方式中,图像检测模型采用以下操作得到:首先获取多个包括多个样本区域的样本图像;之后对样本图像的多个样本区域进行数据信息标注,确定多个样本图像的数据信息;最后根据多个样本图像的数据信息,对神经网络进行训练,得到图像检测模型。
举例说明,在训练图像检测模型的过程中,首先获取多个样本图像,并对样本图像进行标注,这里的标注包括将目标图像中的多个目标区域框出来,并对多个目标区域进行数据信息标注,这里,数据信息标注可以为位置标注、类别标注以及内容标注等。之后将标注后的样本图像输入到卷积神经网络提取图像的特征,并将提取的特征分别做分类训练、定位训练以及内容识别训练。具体的模型训练过程,现有技术均可实现,因此,在此不在赘述。在步骤S103,根据数据信息,对多个目标区域进行分类,得到目标区域的分类结果。
举例说明,在对目标图像进行识别后可以识别出多个目标区域,可以根据目标区域的类别信息对多个目标区域进行分类。
具体的,假设检测的目标图像为标签,在对标签进行识别后,可以识别出种类别的目标区域,如类别为条码的目标区域,类别为图片的目标区域以及类别为文字的目标区域等。而这时便需要根据目标区域的类别信息,将同一类别的目标区域分类到一起,以便后续处理。
在步骤S104,根据分类结果,对多个目标区域的数据信息进行分类匹配,生成数据识别结果。
举例说明,在将目标图像中的多个目标区域按照类别区分开来后,就得到了多个不同类别的目标区域集,每个目标区域集中的目标区域属于同一类别。接下来,分别对不同目标区域集中的目标区域进行匹配操作,就生成了目标图像的数据识别结果。
具体的,以标签为例,对识别后的标签进行分类,可以得到文字目标区域集、图片目标区域集以及条码目标区域集。在进一步匹配操作中,需要分别针对文字区域集、图片目标区域集以及条码目标区域集中的目标区域进行匹配操作,最终得到标签的数据识别结果。需要说明的是,在这里只是以标签为例作为示例性说明,具体不做限定。
在本公开一实施方式中,在根据分类结果,将目标区域的数据信息与预设信息模板中与目标区域的分类结果一致的区域的数据信息进行遍历匹配之前,还需要建立预设信息模板。
图3示出了本公开实施例数据识别方法中XML文档形式的预设信息模板的示意图。
参考图3,预设信息模板以XML的格式存在。
在本公开一实施方式中,预设信息模板可以通过人工测绘的方式预先配置。
举例说明,首先获取多个样本图像,之后将样本图像中的黑色区域框出,并用测量的形式测出多个目标区域的数据信息,如面积、位置等信息,并将这些信息做成表格,之后通过规则来将表格转换成XML格式的文档来生成信息模板。
在本公开一实施方式中,预设信息模板还可以通过自动化生成的方式预先配置。
举例说明,首先获取样本图像,并通过形态学变换的方式让样本图像中的黑色区域生长并形成连通域,再通过寻找连通域轮廓的方式得到每个连通域的面积,并利用像素精度计算连通域的位置。之后对每个连通域进行识别,如果识别为文字则进一步识别文字内容,如果识别为图像则进一步提取图像特征,最后将识别出来的数据转换成以XML文档形式存在的预设信息模板。
需要说明的是,具体的预设信息模板的形成过程还可以采用其他适用的方式实现,在此不在赘述。
在本公开一实施方式中,根据分类结果,对多个目标区域的数据信息进行分类匹配,并生成数据识别结果的过程,包括:根据分类结果,将目标区域的数据信息与预设信息模板中与目标区域的分类结果一致的区域的数据信息进行遍历匹配,生成数据识别结果;其中,预设信息模板包括多个预设目标区域以及预设目标区域的数据信息。
举例说明,在将目标图像的多个目标区域进行分类后,可以得到多个不同类别的目标区域集,在进行遍历匹配的过程中,需要将不同类别的目标区域集分开进行遍历匹配。以一个类别的目标区域集遍历匹配的过程为例,具体的遍历匹配过程可以为:首先对此区域目标集中的每个目标区域进行遍历,并按照遍历的顺序将目标区域的数据信息与预设信息模板中与该目标区域集属于同一类别的区域的数据信息进行匹配,并得到目标区域的数据识别结果。如此,通过将多个目标区域的数据信息与预先建立的信息模板的信息进行相关性匹配从而进行识别结果的判定,不再依赖现有技术中利用模板信息进行固定位置截取从而在进行识别的方案,而是将模板作为匹配对象,有效的针对了打印偏移导致的图像数据识别不准确的情况,使得图像内容识别更具有鲁棒性。
在一可实施方式中,对目标区域的数据信息进行遍历匹配的过程,可以包括:将目标区域的面积信息与预设信息模板中与目标区域的分类结果一致的区域的面积信息进行匹配,并根据预设面积阈值确定目标区域的面积匹配结果;在目标区域的面积匹配结果不符合预设面积条件的情况下,再将目标区域的位置信息与预设信息模板中与目标区域的分类结果一致的区域的位置信息进行匹配,并根据预设位置阈值确定目标区域的位置匹配结果。
在本发明这一实施例中,目标图像包括多个目标区域,在对目标图像的多个目标区域进行分类后,可以得到多个目标区域集,以得到三个目标区域集为例,三个目标区域集可以为第一分类集、第二分类集以及第三分类集,这三个分类集分别代表不同类别的区域,如第一分类集可以代表文字类型、第二分类集可以代表条码类型以及第三分类集可以代表图片分类集。在接下来的匹配过程中需要将第一分类集、第二分类集以及第三分类集分开来与预设信息模板进行分类匹配。以第一分类为例进行说明,首先对第一分类集进行遍历,并按照遍历的顺序,将第一分类集中的每一个目标区域的面积信息与预设信息模板中与第一分类集类别相同的区域的面积信息进行匹配。在对第一分类集中所有目标区域均进行面积匹配操作后,便可以根据预设面积阈值得到每个目标区域集的面积匹配结果。由于在实际应用中,可能出现多个目标区域面积相同的情况,这样就会使一个目标区域的面积信息和预设信息模板中的很多个面积信息均能够匹配上,此时便需要在将这些目标区域的位置信息与预设模板中与这些目标区域属于同类别的区域的位置信息进行匹配,并根据预设位置阈值得到位置匹配结果。如此,按照上述针对第一分类集的匹配方法也同样将第二分类集和第三分类集内的目标区域进面积匹配操作和位置匹配操作,便能够得到目标图像的识别结果了。
在本公开一实施方式中,预设面积阈值可以根据预设信息模板的建模精度n以及目标图像的像素精度PPM得到,预设面积阈值可以为:n*n*PPM。
具体的,由于对区域进行框选的过程中,由于打印偏移的情况可能会出现框选出的面积不准确的问题,相应的在匹配过程中,便可以设定一个阈值来避免打印偏移导致的面积框选不准确的问题。
在本公开一实施方式中,可以根据信息模板建立过程中的情况,设定信息模板的建模精度。
具体的,由于建立信息模板时,存在一些情况导致模板中的位置信息也不准确。如果是由人工来建立信息模板,在重新建立模板时,由于每次用于打印的纸张的位置不断变化,可能导致人工每次建立的信息模板中某些区域的位置会发生变化情况,此时便要通过设立建模精度来避免人工建立模板过程中,模板中各区域位置不断变化的问题。
其中,还有一种情况是,在用图像处理的方式自动化生成信息模板的过程中,获取的样本图像存在打印偏移的情况,而如果发生打印偏移的情况,在对某一区域进行框选时便可能导致框选内容不准确,这时便要在建立模板时,设定一个建模精度,来避免对图像中内容框选部完整的问题。
举例说明,以标签为例,标签中字体比较多,也比较密集,在切边时,为了避免打印偏移的情况导致切边后字体不完整的问题,需要设定一个精度,来避免打印偏移情况下导致的切边后字体不完整的问题,一般来讲精度可设定为2毫米左右。这里需要说明的是,具体的信息模板的建模精度确定的过程现有技术均可实现,因此,不在赘述。
在本公开一实施方式中,预设位置阈值为信息模板中最小区域的宽以及高的一半,预设位置阈值可以为:min(W,H)/2。
具体的,以其中一个目标区域为例,假定该目标区域的位置为(X,Y),为了避免打印偏移导致的位置不准确,则可设定X方面对应的阈值为信息模板中最小区域的宽的一半,设定Y方面对应的阈值为信息模板中最小区域的高的一半。由此,通过设定阈值的方式,有效针对打印偏移的情况,使得图像内容识别更具有鲁棒性。
在本公开一实施方式中,在将目标图像内的目标区域进行完位置匹配操作后,如果还存在一个目标区域的位置信息对应预设信息模板中多个区域的位置信息的情况下,则说明此时的目标图像可能出现打印偏移等现象,则判定该目标图像不合格。
具体的,在图像识别的过程中,首先要确定框出来的位置及面积均准确,才能进行下一步的数据识别。而在将目标图像中的目标区域进行面积匹配以及位置匹配后,仍然出现与预设信息模板不能匹配的情况,则代表图像可能出现打印偏移等情况,则直接判定图像为不合格,不再进行内容信息识别。如此,提前将不合格的图像识别出来,减少了后续针对不合格图像的内容识别工作量,提高了图像数据识别的效率。
在一可实施方式中,将目标区域的数据信息与预设信息模板中与目标区域的分类结果一致的区域的数据信息进行遍历匹配,包括:将目标区域的内容信息与预设信息模板中与目标区域的分类结果一致的区域的内容信息进行匹配,确定目标区域的内容匹配结果。
具体的,对目标图像中的多个目标区域进行完面积匹配以及位置匹配后,需要进一步进行目标区域的内容识别,来通过内容识别确定图像相应的区域内容打印是否正确,进一步提高了图像识别的准确性。
图4示出了本公开另一实施例数据识别装置的示意图。
参考图4,基于上文电子设备的放电方法,本公开实施例还提供了一种数据识别装置40,该装置40包括:获取模块401,用于获取目标图像;识别模块402,用于对待检测图像进行图像识别,得到图像识别结果,图像识别结果包括多个目标区域和目标区域的数据信息;分类模块403,用于根据数据信息,对多个目标区域进行分类,得到目标区域的分类结果;匹配模块404,用于根据分类结果,对多个目标区域的数据信息进行分类匹配,生成数据识别结果。
在本公开一实施方式中,装置40还包括:原始图像获取模块,用于获取原始图像;预处理模块,用于对原始图像进行预处理,得到目标图像。
在本公开一实施方式中,识别模块402包括:第一识别模块,用于使用图像检测模型,用于对待检测图像进行目标识别,得到多个目标区域;第二识别模块,用于对目标区域进行类别识别、位置识别以及内容识别。
在本公开一实施方式中,识别模块402还包括:样本图像获取模块,用于获取多个样本图像,样本图像包括多个样本区域;信息标注模块,用于对样本图像的多个样本区域进行数据信息标注,确定多个样本图像的数据信息;模型训练模块,用于根据多个样本图像的数据信息,对神经网络进行训练,得到图像检测模型。
在本公开一实施方式中,匹配模块404还用于根据分类结果,将目标区域的数据信息与预设信息模板中与目标区域的分类结果一致的区域的数据信息进行遍历匹配,生成数据识别结果;其中,预设信息模板包括多个预设目标区域以及预设目标区域的数据信息。
在本公开一实施方式中,匹配模块404包括:面积匹配模块,用于将目标区域的面积信息与预设信息模板中与目标区域的分类结果一致的区域的面积信息进行匹配,并根据预设面积阈值确定目标区域的面积匹配结果;位置匹配模块,用于在目标区域的面积匹配结果不符合预设面积条件的情况下,将目标区域的位置信息与预设信息模板中与目标区域的分类结果一致的区域的位置信息进行匹配,并根据预设位置阈值确定目标区域的位置匹配结果。
在本公开一实施方式中,匹配模块404还包括:内容匹配模块,用于将目标区域的内容信息与预设信息模板中与目标区域的分类结果一致的区域的内容信息进行匹配,确定目标区域的内容匹配结果。
这里需要指出的是:以上针对数据识别装置实施例的描述与前述方法实施例的描述是类似的,具有同前述方法实施例相似的有益效果,因此不做赘述。对于本申请的这一实施例数据识别装置实施例的描述尚未披露的技术细节,请参照本申请前述方法实施例的描述而理解,为节约篇幅,因此不再赘述。
进一步,基于如上文数据识别方法,本公开实施例还提供一种电子设备。
同理,基于上数据识别方法,本公开实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器至少执行如下所述的操作步骤:步骤S101,获取目标图像;步骤S102,对目标图像进行图像识别,得到图像识别结果,图像识别结果包括多个目标区域和目标区域的数据信息;步骤S103,根据数据信息,对多个目标区域进行分类,得到目标区域的分类结果;步骤S104,根据分类结果,对多个目标区域的数据信息进行分类匹配,生成数据识别结果。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本公开所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本公开这一实施例方案的目的。
另外,在本公开各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本公开上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本公开各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种数据识别方法,其特征在于,所述方法包括:
获取目标图像;
对所述目标图像进行图像识别,得到图像识别结果,所述图像识别结果包括多个目标区域和所述目标区域的数据信息;
根据所述数据信息,对所述多个目标区域进行分类,得到所述目标区域的分类结果;
根据所述分类结果,对所述多个目标区域的数据信息进行分类匹配,生成数据识别结果。
2.根据权利要求1所述方法,其特征在于,所述获取目标图像,包括:
获取原始图像;
对所述原始图像进行预处理,得到目标图像。
3.根据权利要求1所述方法,其特征在于,所述对所述目标图像进行图像识别,包括:
使用图像检测模型,对所述目标图像进行目标识别,得到多个目标区域;
对所述目标区域进行类别识别、位置识别以及内容识别。
4.根据权利要求3述的方法,其特征在于,所述图像检测模型采用以下操作得到:
获取多个样本图像,所述样本图像包括多个样本区域;
对所述样本图像的多个样本区域进行数据信息标注,确定所述多个样本图像的数据信息;
根据所述多个样本图像的数据信息,对神经网络进行训练,得到所述图像检测模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述分类结果,对所述多个目标区域的数据信息进行分类匹配,生成数据识别结果,包括:
根据所述分类结果,将所述目标区域的数据信息与预设信息模板中与所述目标区域的分类结果一致的区域的数据信息进行遍历匹配,生成数据识别结果;
其中,所述预设信息模板包括多个预设目标区域以及所述预设目标区域的数据信息。
6.根据权利要求5所述方法,其特征在于,所述将所述目标区域的数据信息与预设信息模板中与所述目标区域的分类结果一致的区域的数据信息进行遍历匹配,包括:
将目标区域的面积信息与预设信息模板中与所述目标区域的分类结果一致的区域的面积信息进行匹配,并根据预设面积阈值确定所述目标区域的面积匹配结果;
在所述目标区域的面积匹配结果不符合预设面积条件的情况下,将目标区域的位置信息与预设信息模板中与所述目标区域的分类结果一致的区域的位置信息进行匹配,并根据预设位置阈值确定所述目标区域的位置匹配结果。
7.根据权利要求5所述方法,其特征在于,所述将所述目标区域的数据信息与预设信息模板中与所述目标区域的分类结果一致的区域的数据信息进行遍历匹配,包括:
将目标区域的内容信息与预设信息模板中与所述目标区域的分类结果一致的区域的内容信息进行匹配,确定所述目标区域的内容匹配结果。
8.一种数据识别装置,其特征在于,所述装置包括:
获取模块,用于获取目标图像;
识别模块,用于对所述目标图像进行图像识别,得到图像识别结果,所述图像识别结果包括多个目标区域和所述目标区域的数据信息;
分类模块,用于根据所述数据信息,对所述多个目标区域进行分类,得到所述目标区域的分类结果;
匹配模块,用于根据所述分类结果,对所述多个目标区域的数据信息进行分类匹配,生成数据识别结果。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
10.一种存储有计算机指令的计算机可读存储介质,其特征在于,
所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
CN202210239208.3A 2022-03-11 2022-03-11 一种数据识别方法、装置、设备及存储介质 Pending CN114677701A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210239208.3A CN114677701A (zh) 2022-03-11 2022-03-11 一种数据识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210239208.3A CN114677701A (zh) 2022-03-11 2022-03-11 一种数据识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114677701A true CN114677701A (zh) 2022-06-28

Family

ID=82072006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210239208.3A Pending CN114677701A (zh) 2022-03-11 2022-03-11 一种数据识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114677701A (zh)

Similar Documents

Publication Publication Date Title
TWI631514B (zh) Method and system for marking recognition based on mobile terminal
CN111650220B (zh) 一种基于视觉的图文缺陷检测方法
US7970213B1 (en) Method and system for improving the recognition of text in an image
US6996295B2 (en) Automatic document reading system for technical drawings
JP6366024B2 (ja) 画像化された文書からテキストを抽出する方法及び装置
US11978193B2 (en) Label data processing system
CN110210470B (zh) 商品信息图像识别系统
CN114037672A (zh) 一种图像缺陷的检测方法、装置及计算机可读介质
CN110135225B (zh) 样本标注方法及计算机存储介质
CN110807454B (zh) 基于图像分割的文字定位方法、装置、设备及存储介质
CN111461133B (zh) 快递面单品名识别方法、装置、设备及存储介质
CN111259980B (zh) 标注数据的处理方法和装置
US11593591B2 (en) Optical character recognition systems and methods
CN113063802A (zh) 一种印刷标签缺陷检测方法及其装置
CN110533660B (zh) 一种电子产品外壳丝印缺陷的检测方法
CN112861861B (zh) 识别数码管文本的方法、装置及电子设备
CN114677701A (zh) 一种数据识别方法、装置、设备及存储介质
CN115797945A (zh) 一种文本识别对比与图像对比相结合的标签检测方法
US11756321B2 (en) Information processing apparatus and non-transitory computer readable medium
JP4867894B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
CN113822196B (zh) 一种方便复制传播的omr运输面单制作及识别方法
US11354890B2 (en) Information processing apparatus calculating feedback information for partial region of image and non-transitory computer readable medium storing program
CN114140391B (zh) 基于机器视觉实现板载显示屏模块快速检测的方法
CN117711004A (zh) 一种基于图像识别的表格文档信息抽取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination