CN113485618A - 自定义识别模板的生成方法、证件的识别方法以及装置 - Google Patents

自定义识别模板的生成方法、证件的识别方法以及装置 Download PDF

Info

Publication number
CN113485618A
CN113485618A CN202110756421.7A CN202110756421A CN113485618A CN 113485618 A CN113485618 A CN 113485618A CN 202110756421 A CN202110756421 A CN 202110756421A CN 113485618 A CN113485618 A CN 113485618A
Authority
CN
China
Prior art keywords
sample image
target sample
field
target
reference field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110756421.7A
Other languages
English (en)
Inventor
江姗
詹明捷
张捷
梁鼎
史荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Sensetime Lingang Intelligent Technology Co Ltd
Original Assignee
Shanghai Sensetime Lingang Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Sensetime Lingang Intelligent Technology Co Ltd filed Critical Shanghai Sensetime Lingang Intelligent Technology Co Ltd
Priority to CN202110756421.7A priority Critical patent/CN113485618A/zh
Publication of CN113485618A publication Critical patent/CN113485618A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Character Input (AREA)

Abstract

本公开提供了一种自定义识别模板的生成方法、证件的识别方法以及装置,其中,自定义识别模板的生成方法包括:获取目标对象的目标样本图像;响应于选定操作,分别得到待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域;建立所述第一区域与所述第二区域在所述目标样本图像中的相对位置关系;基于所述相对位置关系、以及所述参考字段,生成所述目标对象的识别模板。这样,可以灵活生成自定义的识别模板,且该识别模板生成过程,使得用户可以自定义需要识别的字段,摆脱了通用模板不能对所有类型的图像进行识别的局限,具有更强的灵活性。

Description

自定义识别模板的生成方法、证件的识别方法以及装置
技术领域
本公开涉及图像处理技术领域,具体而言,涉及一种自定义识别模板的生成方法、证件的识别方法以及装置、计算机设备及存储介质。
背景技术
光学字符识别(Optical Character Recognition,OCR)可以将图像中示出的文字转换为文本格式,以使图像中的文字可以进行进一步的文字处理。利用OCR技术可以快速对图像进行文字识别。
发明内容
本公开实施例至少提供一种自定义识别模板的生成方法、证件的识别方法以及装置、计算机设备及存储介质。
第一方面,本公开实施例提供了一种自定义识别模板的生成方法,包括:获取目标对象的目标样本图像;响应于选定操作,分别得到待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域;建立所述第一区域与所述第二区域在所述目标样本图像中的相对位置关系;基于所述相对位置关系、以及所述参考字段,生成所述目标对象的识别模板。
这样,可以灵活生成自定义的识别模板,且该识别模板生成过程,使得用户可以自定义需要识别的字段,摆脱了通用模板不能对所有类型的图像进行识别的局限,具有更强的灵活性。
一种可选的实施方式中,所述获取目标对象的目标样本图像,包括:获取所述目标对象的原始样本图像;基于为所述原始样本图像确定所述目标对象的角点在所述原始样本图像中的位置信息,对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
这样,得到的目标样本图像中的字段可以基于原始样本图像向目标样本图像的矫正过程,将其朝向矫正为正向,更有利于后续对目标样本图像中的字段的识别。
一种可选的实施方式中,所述获取目标对象的目标样本图像,包括:获取所述目标对象的原始样本图像;确定至少一个定位字段在所述原始样本图像中的第三区域;基于所述第三区域,确定所述原始样本图像的形变信息;基于所述形变信息对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
一种可选的实施方式中,所述确定至少一个定位字段在所述原始样本图像中的第三区域,包括:对所述原始样本图像进行文字识别,并基于所述文字识别的结果,得到所述至少一个定位字段在所述原始样本图像中的所述第三区域。
这样,得到的目标样本图像可以重新矫正为正常显示字体大小的形式,从而使得后续在对目标样本图像中的字段进行识别时,减少错误识别的情况发生。
一种可选的实施方式中,所述第二区域包括多个;不同的所述第二区域分布在所述目标样本图像中的不同方位。
这样,可以首先在目标样本图像的整体上确定其中的部分字段的具体位置,以用于对其他字段的定位,在保证准确性的同时,可以尽量较少处理计算量,并能够提高处理效率。
一种可选的实施方式中,确定参考字段在所述目标样本图像中的第二区域,包括:响应于对所述目标样本图像的第一选定操作,基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域。
一种可选的实施方式中,所述基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域,包括:对所述第一选定操作在所述目标样本图像中选定的区域对应的第一子图像进行字符识别,得到所述参考字段、以及所述参考字段中的各个字符在所述目标样本图像中的第一位置信息;基于所述参考字段中的各个字符在所述目标样本图像中的第一位置信息,确定所述第二区域。
这样,由于第一子图像相较于目标样本图像而言,图像大小较小,其中包含的参考字段也更容易识别,因此可以利用较少的算力较快的确定参考字段在目标样本图像中的实际位置,并且确定得到的参考字段在目标样本图像中的实际位置也较为准确。
一种可选的实施方式中,确定参考字段在所述目标样本图像中的第二区域,包括:对所述目标样本图像进行字符识别,得到多个备选字段、以及各备选字段在所述目标样本图像中的第二位置信息;响应于将所述备选字段中的目标备选字段确定为所述参考字段,基于所述参考字段在所述目标样本图像中的第二位置信息,确定所述参考字段在所述目标样本图像中的第二区域。
这样,用户可以简单的通过选择或者键入文字的方式确定备选字段,并相应的确定参考字段在参考字段在目标样本图像中的第二区域,这种方式对用户而言更为简便。
一种可选的实施方式中,确定与所述参考字段对应的待识别字段在所述目标样本图像中的第一区域,包括:响应于对所述目标样本图像的第二选定操作,基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域。
一种可选的实施方式中,所述基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域,包括:对所述第二选定操作在所述目标样本图像中选定的区域进行扩增处理,得到所述第一区域。
这样,对于不能确定待识别字段最大字符数的情况,即使用户在目标样本图像中选定待识别字段时选定的区域较小,实际确定的自定义识别模板也可以较为完整的将待识别字段识别出。
第二方面,本公开实施例还提供一种证件的识别方法,包括:获取待识别证件的待识别图像;利用根据本公开实施例提供的识别模板的生成方法确定的与所述待识别证件对应的识别模板,对所述待识别图像进行信息识别,得到所述待识别图像中与各个参考字段分别对应的目标识别字段。
一种可选的实施方式中,所述识别方法还包括:基于各个所述参考字段在所述待识别图像中的位置,展示所述参考字段和所述参考字段对应的目标识别字段中的至少一项;或者,基于生成所述识别模板时,对所述参考字段、或者与所述参考字段对应的待识别字段的选定顺序,展示所述参考字段和/或所述参考字段对应的目标识别字段中的至少一项。
第三方面,本公开实施例还提供一种自定义识别模板的生成装置,包括:第一获取模块,用于获取目标对象的目标样本图像;确定模块,用于响应于选定操作,分别得到待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域;建立模块,用于建立所述第一区域与所述第二区域在所述目标样本图像中的相对位置关系;生成模块,用于基于所述相对位置关系、以及所述参考字段,生成所述目标对象的识别模板。
一种可选的实施方式中,所述第一获取模块在获取目标对象的目标样本图像时,用于:获取所述目标对象的原始样本图像;基于为所述原始样本图像确定所述目标对象的角点在所述原始样本图像中的位置信息,对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
一种可选的实施方式中,所述第一获取模块在获取目标对象的目标样本图像时,用于:获取所述目标对象的原始样本图像;确定至少一个定位字段在所述原始样本图像中的第三区域;基于所述第三区域,确定所述原始样本图像的形变信息;基于所述形变信息对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
一种可选的实施方式中,所述第一获取模块在确定至少一个定位字段在所述原始样本图像中的第三区域时,用于:对所述原始样本图像进行文字识别,并基于所述文字识别的结果,得到所述至少一个定位字段在所述原始样本图像中的所述第三区域。
一种可选的实施方式中,所述第二区域包括多个;不同的所述第二区域分布在所述目标样本图像中的不同方位。
一种可选的实施方式中,所述确定模块在确定参考字段在所述目标样本图像中的第二区域时,用于:响应于对所述目标样本图像的第一选定操作,基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域。
一种可选的实施方式中,所述确定模块在基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域时,用于:对所述第一选定操作在所述目标样本图像中选定的区域对应的第一子图像进行字符识别,得到所述参考字段、以及所述参考字段中的各个字符在所述目标样本图像中的第一位置信息;基于所述参考字段中的各个字符在所述目标样本图像中的第一位置信息,确定所述第二区域。
一种可选的实施方式中,所述确定模块在确定参考字段在所述目标样本图像中的第二区域时,用于:对所述目标样本图像进行字符识别,得到多个备选字段、以及各备选字段在所述目标样本图像中的第二位置信息;响应于将所述备选字段中的目标备选字段确定为所述参考字段,基于所述参考字段在所述目标样本图像中的第二位置信息,确定所述参考字段在所述目标样本图像中的第二区域。
一种可选的实施方式中,所述确定模块在确定与所述参考字段对应的待识别字段在所述目标样本图像中的第一区域时,用于:响应于对所述目标样本图像的第二选定操作,基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域。
一种可选的实施方式中,所述确定模块在所述基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域时,用于:对所述第二选定操作在所述目标样本图像中选定的区域进行扩增处理,得到所述第一区域。
第四方面,本公开实施例还提供一种证件的识别装置,包括:第二获取模块,用于获取待识别证件的待识别图像;识别模块,用于利用根据本公开实施例提供的识别模板的生成方法确定的与所述待识别证件对应的识别模板,对所述待识别图像进行信息识别,得到所述待识别图像中与各个参考字段分别对应的目标识别字段。
一种可选的实施方式中,所述识别装置还包括展示模块,用于:基于各个所述参考字段在所述待识别图像中的位置,展示所述参考字段和所述参考字段对应的目标识别字段中的至少一项;或者,基于生成所述识别模板时,对所述参考字段、或者与所述参考字段对应的待识别字段的选定顺序,展示所述参考字段和/或所述参考字段对应的目标识别字段中的至少一项。
第五方面,本公开可选实现方式还提供一种计算机设备,处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述机器可读指令被所述处理器执行时执行上述第一方面,或第二方面中任一种可能的实施方式中的步骤。
第六方面,本公开可选实现方式还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被运行时执行上述第一方面,或第二方面中任一种可能的实施方式中的步骤。
关于上述识别模板的生成装置、证件的识别装置、计算机设备、及计算机可读存储介质的效果描述参见上述识别模板的生成方法、以及证件的识别方法的说明,这里不再赘述。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种自定义识别模板的生成方法的流程图;
图2示出了本公开实施例所提供的一种通行证的具体示例图;
图3示出了本公开实施例所提供的一种确定原始样本图像的形变信息时的示意图;
图4示出了本公开实施例所提供的一种确定第二区域时的示意图;
图5示出了本公开实施例所提供的一种向用户提供的界面示意图;
图6示出了本公开实施例所提供的一种证件的识别方法的具体流程图;
图7示出了本公开实施例所提供的一种待识别证件的待识别图像的示意图;
图8示出了本公开实施例所提供的一种自定义识别模板的生成装置的示意图;
图9示出了本公开实施例所提供的一种证件的识别装置的示意图;
图10示出了本公开实施例所提供的一种计算机设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
经研究发现,利用OCR技术可以将图像中示出的文字转换为文本格式,以使图像中的文字可以进行进一步的文字处理,因此其可以应用于对证件上包含的文字的识别。在利用OCR技术对证件进行文字识别时,由于不同证件对应的版面格式不同,并且其中包含的内容也不尽相同,导致通用的识别模板仅能对特定的图像进行文字识别,导致灵活性差的问题。
上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
基于上述研究,本公开提供了一种自定义识别模板的生成方法,针对不同类型的识别图像,利用本公开实施例提供的生成方法,可以灵活生成自定义的识别模板,且该识别模板生成过程,使得用户可以自定义需要识别的字段,摆脱了通用模板不能对所有类型的图像进行识别的局限,具有更强的灵活性。
应注意到:在本公开实施例中,相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种自定义识别模板的生成方法进行详细介绍,本公开实施例所提供的生成方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该生成方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面对本公开实施例提供的生成方法加以说明。
参见图1所示,为本公开实施例提供的一种自定义识别模板的生成方法的流程图,所述方法包括步骤S101~S104,其中:
S101:获取目标对象的目标样本图像;
S102:响应于选定操作,分别得到待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域;
S103:建立所述第一区域与所述第二区域在所述目标样本图像中的相对位置关系;
S104:基于所述相对位置关系、以及所述参考字段,生成所述目标对象的识别模板。
本公开实施例通过获取对象的目标样本图像,并响应于选定操作确定得待识别字段、以及参考字段分别在目标样本图像中的第一区域和第二区域,可以进一步的建立第一区域和第二区域之间的相对位置关系,从而能够根据相对位置关系和参考字段,生成针对于目标对象的识别模板。这样,利用本公开实施例提供的生成方法,可以灵活生成自定义的识别模板,且该识别模板生成过程,使得用户可以自定义需要识别的字段,摆脱了通用模板不能对所有类型的图像进行识别的局限,具有更强的灵活性。
另外,在本公开实施例中,由于是通过建立待识别字段对应的第一区域、和参考字段对应的第二区域之间的相对位置关系,根据该位置关系生成的识别模板,因此在利用该识别模板对目标对象进行识别时,具有更高的识别精度。
下面对上述S101~S104加以详细说明。
针对上述S101,目标对象例如可以包括形状固定、且包含位置相对固定的字段的非表格文档。示例性的,目标对象例如可以包括身份证、通行证、资格证、票据、表单等具有固定通用版式的对象。
下面,以目标对象包括通行证为例进行说明。参见图2所示,为本公开实施例提供的一种通行证的具体示例图。在图2示出的通行证中,包含有固定字段,包括通信证上方示出的证件名“XXX园区通行证”、通行证右侧的警示信息“个人证件,请勿外借”、通行证右下角的提示信息“XXX园区内有效”、以及个人相关信息(图2中虚线框示出的部分)。其中个人相关信息包括“个人照片”指示上方的照片、以及在照片右侧示出的包括“姓名”、“性别”、“所属公司”、“职务”的指示信息。在不同的指示信息后还示出有个人具体信息,包括“姓名”字段后示出的“王某”、“性别”字段后示出的“女”、“所属公司”字段后示出的“科技公司”、以及“职务字段”后示出的“技术人员”。
在具体实施中,在获取目标对象的目标样本图像时,例如可以采用但不限于下述(A1)以及(A2)中至少一种:
(A1):获取所述目标对象的原始样本图像;基于为所述原始样本图像确定所述目标对象的角点在所述原始样本图像中的位置信息,对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
在该种情况下,目标对象的原始样本图像例如可以包括用户在利用相机、扫描仪等图像扫描工具对目标对象进行图像采集后获取的一帧图像。由于在对目标对象进行扫描时,人为的操作或设备成像效果等会影响目标对象对应的原始样本图像的朝向,使其中的字段相较于正向以倾斜一定角度的方向呈现出。而对于正向放置的原始样本图像,由于在进行字符识别时,在对正向的字段进行识别时的效果更好,因此在获取到原始样本图像时,还可以根据目标对象的角点在原始样本图像中的位置信息,对原始图像进行矫正,以使原始样本图像矫正为正向的方向。此时,由于其中显示出的字段也为正向,因此在进行字符识别时更容易,也更精准。其中,目标对象的角点指的可以是目标对象的顶点、目标对象中的线条交叉点或是指定的点等。
具体地,在利用目标对象的角点在原始样本图像中的位置信息,对原始样本图像进行矫正时,例如可以先确定目标对象中的多个角点。由于目标对象通常表现为诸如矩形等规则多边形,因此以矩形为例,可以将目标对象的四个顶点作为确定的四个角点,或者从四个角点选取任意三个角点,以将目标对象转向至正向,从而便于进行字符识别。
以利用目标对象的三个角点在原始样本图像中的位置信息对原始样本图像进行矫正为例,在确定三个角点的位置信息后,可以利用三个角点、以及为目标对象预设的图像模板,确定将三个角点投影至在图像模板中与该三个角点对应的模板角点位置处,然后利用投影关系将将原始样本图像投影至图像模板中,得到原始样本图像对应目标样本图像。
这样,得到的目标样本图像中的字段可以基于原始样本图像向目标样本图像的矫正过程,将其朝向矫正为正向,更有利于后续对目标样本图像中的字段的识别。
(A2):获取所述目标对象的原始样本图像;确定至少一个定位字段在所述原始样本图像中的第三区域;基于所述第三区域,确定所述原始样本图像的形变信息;基于所述形变信息对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
在该种情况下,由于在扫描目标对象时,目标对象在摆放时并不与扫描的方向水平,导致在扫描时出现“近大远小”的字体呈现效果。因此在对原始样本图像进行字符识别时,可能会因为相邻字段的字体大小不同,造成仅对其中显示出的字体较大的字段进行识别,而无法对其中显示出的字体较小的字段进行识别;或者,也可能出现仅将其中的多个字体较大的字段连续识别出的情况。因此,可以利用在原始样本图像反应出的形变信息对原始样本图像进行矫正,以确定目标样本图像。
在具体实施中,获取目标对象的原始样本图像的方式可以参见上述(A1)中获取原始样本图像的方式,在此不再重复赘述。
在确定至少一个定位字段在原始样本图像中的第三区域时,例如可以采用下述方式:对所述原始样本图像进行文字识别,并基于所述文字识别的结果,得到所述至少一个定位字段在所述原始样本图像中的所述第三区域。
其中,文字识别例如可以采用OCR。
在对原始样本图像进行文字识别时,例如可以正确的确定其中的部分文字,如图2中示出的字体较大的字段“XXX园区通信证”。另外,为了更准确地利用定位字段对原始样本图像进行矫正,因此还可以再选取其他的定位字段,例如图2中示出的“XXX园区内有效”等。
以定位字段中包括的“XXX园区通信证”为例,在原始样本图像中可以确定其对应的第三区域。参见图3所示,为本公开实施例提供的一种确定原始样本图像的形变信息时的示意图。其中,在图3中(a)示出了在原始样本图像中示出的定位字段的示意图。
示例性的,在确定该定位字段在原始样本图像中的第三区域时,例如可以直接获得图3中(a)示出的最小矩形框31,并进一步确定可以包围定位字段的最小四边形框,也即图3中(b)示出的包围框32,并将包围框32包围的区域作为第三区域。此处,该第三区域可以反映出原始样本图像的形变信息。利用第三区域对应包围框的多个顶点的位置信息,例如可以根据与上述根据目标对象的角点在原始样本图像的角点的位置信息对原始样本图像进行矫正的方式,确定第三区域与在图像模板中对应区域的投影关系,也即原始样本图像的形变信息。在确定原始样本图像的形变信息后,即可以根据形变信息对原始样本图像进行矫正,得到原始样本图像对应的目标样本图像。
此处,若确定多个定位字段,则利用其他定位字段对原始样本图像进行矫正,确定目标样本图像的方式与上述列举出的定位字段对应的矫正过程相似,在此不再赘述。
这样,得到的目标样本图像可以重新矫正为正常显示字体大小的形式,从而使得后续在对目标样本图像中的字段进行识别时,减少错误识别的情况发生。
此处,上述(A1)以及(A2)仅为示出的部分获取目标对象的目标样本图像的示例,具体地可以根据实际情况确定,在此不做出限定。
针对上述S102,在确定目标样本图像后,还可以响应于选定操作,确定待识别字段在目标样本图像中的第一区域、以及参考字段在目标样本图像中的第二区域。
具体地,在确定目标样本图像后,可以向用户显示该目标样本图像,并相应的为用户提供指示信息,以帮助用户根据目标样本图像选定待识别字段、以及参考字段。
示例性的,可以为用户提供选定工具,利用该选定工具,以使用户可以在示出的目标样本图像中相应的框选出所需的待识别字段,并为用户提供相关的调整工具,通过对选定框的位置、和/或大小进行调整,以实现对框选出的待识别字段进行进一步的调整。另外,还可以为用户提供文本输入框,以使用户可以通过键入字段的方式确定参考字段。具体地可以参见下述说明,在此不再赘述。
在本公开实施例中,选定的参考字段在目标样本图像中的所述第二区域例如可以包括多个;不同的所述第二区域分布在所述目标样本图像中的不同方位。
在一种可能的情况下,参考字段的数量例如可以三个,或三个以上。此处,由于利用三个参考字段所在的第二区域即可以确定目标样本图像所在平面进行匹配,因此在选取参考字段时可以仅选取三个。在另一种可能的实施方式中,也可以根据待识别字段的数量确定选定的参考字段的数量,例如在存在四个待识别字段的情况下,相应的选取四个参考字段,这样在利用参考字段生成针对于目标对象的识别模板的过程中,可以直接建立参考字段与对应的待识别字段所在区域的相对位置关系,在确定识别模板时更容易。
另外,参考字段例如可以分布在目标样本图像中的不同方位。示例性的,参考字段例如可以分布在目标样本图像中的上侧、下侧、左侧、以及右侧;又或者,参考字段可以分布在目标样本图像中的左上侧、右上侧、左下侧、以及右下侧。在一种可能的情况下,目标样本图像中可能在部分区域内不存在参考字段,例如在图2中示出的通信证中,若选取分布在目标样本图像中的上侧、下侧、左侧、以及右侧位置处的参考字段,则仅能选取到上侧位置的字段“XXX园区通行证”、右侧位置的字段“个人证件,请勿外借”、以及下侧位置的字段“XXX园区内有效”。此时,为了使参考字段可以更好的表达在目标样本图像中的位置,因此可以选取更接近左侧的参考字段“个人照片”。
也即,针对图2中示出的通信证对应的目标样本图像,可以确定选定的参考字段包括四个,例如可以包括在通行证上侧的字段“XXX园区通行证”、接近左下侧的字段“个人照片”、右侧的字段“个人证件,请勿外借”、以及右下侧的字段“XXX园区内有效”。
在一种可能的情况下,利用分布在目标样本图像中不同方位的多个参考字段,可以进一步的对目标样本图像中多个字段进行定位。这样,可以首先在目标样本图像的整体上确定其中的部分字段的具体位置,以用于对其他字段的定位,在保证准确性的同时,可以尽量较少处理计算量,并能够提高处理效率。
在另一种可能的情况下,若目标样本图像中未包含有在各个方位上的参考字段,例如在图2中未包括边缘位置示出的字段“个人证件,请勿外借”以及字段“XXX园区内有效”,而仅包括有个人相关信息指示的部分,则可以将该区域中边界部分的字段或者字符作为参考字段,例如个人相关信息中的“个人照片”、“姓名”、“职务”等。这样,对于各方位字段较少的目标样本图像而言,也可以在一定程度上保证定位的准确性。
另外,针对输出字段“姓名”、“性别”对应的信息,例如字段“王某”、字段“女”的情况,以字段“姓名”后所需输出的字段“王某”为例,在选取参考字段包括“姓名”的情况下,由于字段“姓名”与待输出的字段“王某”在目标样本图像中的距离更近,且相关性更强,因此可以将“姓名”作为参考字段,并相应的选取“王某”作为参考字段,这样在后续确定待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域之间的相对位置关系时,确定的相对位置关系的表达也更简单。
下面,以选取待识别字段包括“王某”、选取参考字段包括“姓名”为例进行说明。
在确定参考字段在目标样本图像中的第二区域时,例如可以采用包括但不限于下述(B1)以及(B2)两种不同的方式:
(B1):响应于对所述目标样本图像的第一选定操作,基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域。
在具体实施中,利用可以采用下述方式确定第二区域:对所述第一选定操作在所述目标样本图像中选定的区域对应的第一子图像进行字符识别,得到所述参考字段、以及所述参考字段中的各个字符在所述目标样本图像中的第一位置信息;基于所述参考字段中的各个字符在所述目标样本图像中的第一位置信息,确定所述第二区域。
示例性的,可以为用户提供可以对目标样本图像进行选定、并可以更改大小的选定工具。用户在对目标样本图像中的参考字段的选定操作,即为第一选定操作。响应于第一选定操作,可以确定用户选定的区域,并相应的对该选定出的区域对应的第一自图像进行字符识别。
参见图4所示,为本公开实施例提供的一种确定第二区域时的示意图。用户在对目标样本图像41进行选定时,例如可以利用选定框,框选出目标样本图像41中的区域42。
此处,由于在目标样本图像中的字体大小可能不同,若参考字段的字体较小,则在对其进行选定时,可能会较大程度的选定出目标样本图像的其他部分,例如在目标样本图像中显示出的背景图像。在这种情况下,无论是采用图像识别的方式、或者文字识别确定参考字段所在的第二区域的方式,都可能会因为背景图像中显示的图案或者水印文字而造成干扰。另外,由于不同字段之间的行距也可能不同,因此在对目标样本图像中的参考字段进行选定时,可能会出现在选定不同的字段时,部分选定区域的重叠,导致无法准确的选定出参考字段所在的第二区域,进而导致无法准确的确定参考字段在目标样本图像中的实际位置。
因此,在选定出区域42后,可以对选定出的区域42对应的第一子图像进行字符识别,以得到参考字段。这样,由于通过第一选定操作确定的第一子图像中,参考字段占比较大,因此在利用字符识别的方式确定参考字段时,可以较为容易的识别出参考字段。
另外,通过识别出的参考字段,可以进一步的确定参考字段中各个字符在目标样本图像中的第一位置信息。这样,通过各个字符在目标样本图像中的第一位置信息,可以确定参考字段在目标样本图像中的第二区域。其中,第二区域例如可以包括根据各个字符对应的第一位置信息为参考字段确定的最小包围框,比如最小外接矩形。
这样,由于第一子图像相较于目标样本图像而言,图像尺寸较小,其中包含的参考字段也更容易识别,因此可以利用较少的算力较快的确定参考字段在目标样本图像中的实际位置,并且确定得到的参考字段在目标样本图像中的实际位置也较为准确。
(B2):对所述目标样本图像进行字符识别,得到多个备选字段、以及各备选字段在所述目标样本图像中的第二位置信息;响应于将所述备选字段中的目标备选字段确定为所述参考字段,基于所述参考字段在所述目标样本图像中的第二位置信息,确定所述参考字段在所述目标样本图像中的第二区域。
在具体实施中,例如可以对目标样本图像中直接进行字符识别。由于在进行字符识别后,可以确定在目标样本图像中不同位置对应的字段,也即多个备选字段、以及各备选字段在目标样本图像中的第二位置信息。
在确定多个备选字段的情况下,还可以将该多个备选字段向用户展示。用户可以选择其中的一个或多个备选字段作为目标备选字段,并将其作为参考字段。或者,也可以通过向用户展示文本输入框的形式,用户通过文本输入框,可以输出所需的目标备选字段,这样也就可以响应于用户的操作确定参考字段。
示例性的,参见图5所示,为本公开实施例提供的一种向用户提供的界面示意图。在图5展示的界面中,包括示出的目标样本图像41,以及目标样本图像41对应的参考字段输入界面51。在输入界面51中可以相应的选取参考字段,具体的示出了两个参考字段的展示框,包括有参考字段1对应的展示框52、以及参考字段2对应的展示框53。以展示框52为例,其中还包括可以输入字段的输入框521、以及对应的字段类型选择框522。其中,用户可以根据示出的目标样本图像41,相应的在输入框521中输入参考字段,例如字段“姓名”,并相应的选择该字段对应的字段类型,例如字段类型选择框522示出的“常规全字符”。响应于用户在字段类型选择框522中选择的字段类型,可以根据该字段类型对输入字段的输入框521中输入的字段进行相应类型的识别,效率更高,且识别的准确度也会相应提高。
在确定参考字段后,即可以根据在对目标样本图像进行识别时确定的各备选字段在目标样本图像中的第二位置信息,确定其中选定为参考字段的备选字段对应的第二位置信息。然后,依据与上述(B1)相似的方式,可以根据第二位置信息确定参考字段在所述目标样本图像中的第二区域,具体地在此不再重复赘述。
这样,用户可以简单的通过选择或者键入文字的方式确定备选字段,并相应的确定参考字段在参考字段在目标样本图像中的第二区域,这种方式对用户而言更为简便。
在本公开另一实施例中,还提供了一种确定与所述参考字段对应的待识别字段在所述目标样本图像中的第一区域的方法。具体地,例如可以采用下述方式:响应于对所述目标样本图像的第二选定操作,基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域。
与上述(B1)中说明的对目标样本图像的第一选定操作类似,可以通过为用户提供另一可以对目标样本图像进行选定、并可以更改大小的选定工具,以使用户可以在目标样本图像中选定出参考字段对应的待识别字段在所述目标样本图像中的区域。
示例性的,参见图4所示,其中示出了在选定参考字段“姓名”对应的待识别字段时,选定出目标样本图像41中的区域43。
此处,对于目标样本图像中示出的参考字段,例如“姓名”,在与目标对象的版面相同的其他对象对应的图像中,若不考虑在印制与目标对象相对应的其他对象时的印刷错误,在其他对象对应的图像中,相同位置处也存在字段“姓名”,且在对应的图像中占据的第二区域也是相同的。而对于参考字段对应的待识别字段在不同的对象中可能是不同的,例如张三用户持有的证件上参考字段“姓名”对应的待识别字段为“张三”;而Sam Zhang用户持有的证件上参考字段“姓名”对应的待识别字段为“Sam Zhang”。
在该种情况下,为了避免在用户在目标样本图像中选定的区域较小,不能支持后续在将其换为字符数较多的待识别字段的识别,因此还可以对所述第二选定操作在所述目标样本图像中选定的区域进行扩增处理,得到所述第一区域。这样,对于不能确定待识别字段最大字符数的情况,即使用户在目标样本图像中选定待识别字段时选定的区域较小,实际确定的自定义识别模板也可以较为完整的将待识别字段识别出。
针对上述S103,在确定第一区域以及第二区域后,即可以相应的确定第一区域与第二区域在目标样本图像中的相对位置关系。
以图4中示出的目标样本图像41为例,在本示例中,目标样本图像41中示出了待识别字段在所述目标样本图像中的第一区域43、以及参考字段在所述目标样本图像中的第二区域42。由于第一区域43和第二区域42的位置可以确定,因此可以直接根据第一区域43和第二区域42分别在目标样本图像41中的位置信息,确定第一区域43与第二区域42在目标样本图像中的相对位置关系。
示例性的,由于第一区域43和第二区域42例如可以为矩形,因此可以建立第一区域43中的四个角点与第二区域43中的四个角点之间的位置对应关系,作为目标样本图像中的相对位置关系。具体地可以根据实际情况确定,在此不再赘述。
这样,利用确定该相对位置关系生成的识别模板,可以根据相对位置关系确定待识别字段的位置,也可以适用于以相同版面示出的其他对象对应图像的识别。
针对上述S104,在确定相对位置关系、以及参考字段后,即可以相应的生成目标对象的识别模板。
在具体实施中,在生成识别模板时,例如可以生成结构化的识别模板。其中,在该识别模板中包括主键(key)以及键值(value),构成key-value数据对,即键值对。其中,key例如可以包括上述说明的参考字段,例如图2中示出的目标样本图像中包含的字段“姓名”、“性别”、“所属公司”、以及“职务”;与上述key对应的value,例如可以包括图2中示出的目标样本图像中包含的字段“王某”、“女”、“科技公司”、以及“技术人员”。其中,用户可以自行设置key,例如可以在上述S102中确定第一区域的步骤中,用户可以仅确定所需的参考字段对应的第二区域;然后根据用户在选定时的第二选定操作,确定多个key。
示例性的,确定的识别模板M1例如可以输出key中包括的“姓名”、“性别”、以及“所属公司”分别对应的图像中对应的value,而不输出“职务”对应的字段。
这样,生成的目标对象的识别模板可以仅输出用户设置的多个key对应的value,或者将多个用户设置的key-value数据对输出,在保证可以输出的数据的准确性的同时,也可以利用识别模板还可以进一步的对图像中的相关信息进行筛选。
基于同一发明构思,本公开实施例中还提供了与自定义识别模板的生成方法对应的证件的识别方法。
参见图6所示,为本公开实施例提供的一种证件的识别方法的具体流程图,包括:
S601:获取待识别证件的待识别图像;
S602:利用根据本公开实施例提供的识别模板的生成方法确定的与所述待识别证件对应的识别模板,对所述待识别图像进行信息识别,得到所述待识别图像中与各个参考字段分别对应的目标识别字段。
本公开实施例提供的证件的识别方法,由于采用的识别模板在对图像进行信息识别时准确性较高,因此在对待识别图像进行信息识别时,可以更准确的得到待识别图像中各个参考字段分别对应的目标识别字段。
针对上述S601,承接上述图1中说明的自定义识别模板的生成方法中列举出的示例,待识别证件例如可以包括与目标对象相同版式的证件。参见图7所示,为本公开实施例提供的一种待识别证件的待识别图像的示意图。
以上述图1对应的实施例中生成的识别模板M1为例,在利用M1对图6中示出的待识别图像进行识别时,例如可以相应的输出字段“姓名”以及对应的字段“赵某某”、字段“性别”以及对应的字段“男”、字段“所属公司”以及对应的字段“网络公司”。在示出上述字段时,例如可以以表格的形式输出,或者直接以文本的形式输出。
在具体实施中,在展示所述参考字段和/或所述参考字段对应的目标识别字段时,可以包括但不限于下述(C1)以及(C2)两种不同的方式:
(C1):基于各个所述参考字段在所述待识别图像中的位置,展示所述参考字段和所述参考字段对应的目标识别字段中的至少一项。
在该种情况下,在确定参考字段后,可以根据参考字段在待识别图像中的位置,相应的确定参考字段、和/或所述参考字段对应的目标识别字段的展示顺序。
以图7示出的待识别图像为例,若确定的参考字段包括“姓名”、“性别”、“所属公司”,依据从由上之下、由左至右的顺序,可以确定在展示参考字段时按照“姓名”、“性别”、“所属公司”的顺序进行展示;或者,也可以将字段“姓名”以及对应的字段“赵某某”、字段“性别”以及对应的字段“男”、字段“所属公司”以及对应的字段“网络公司”顺序展示。
这样,在展示参考字段、和/或所述参考字段对应的目标识别字段时,可以根据待识别证件的待识别图像示出的多个字段的展示逻辑进行展示,与直接向用户呈现待识别证件的待识别图像的方式更为相近。
(C2):基于生成所述识别模板时,对所述参考字段、或者与所述参考字段对应的待识别字段的选定顺序,展示所述参考字段和/或所述参考字段对应的目标识别字段中的至少一项。
在该种情况下,例如可以根据上述图1对应的实施例中的第二选定操作,确定用户在选定多个待识别字段时的选定顺序。以利用图2示出的目标样本图像生成的识别模板为例,若在选定多个待识别字段时,在先选定字段“所属公司”、然后选定字段“姓名”、最后选定字段“性别”的情况下,在展示图7所示的待识别图像对应的参考字段和/或所述参考字段对应的目标识别字段时,例如可以依次展示“网络公司”、“赵某某”、以及“男”;或者,依次展示字段“所属公司”以及对应的字段“网络公司”、“姓名”以及对应的字段“赵某某”、字段“性别”以及对应的字段“男”。
这样,在展示参考字段、和/或所述参考字段对应的目标识别字段时,还可以根据用户的实际展示需求,按照一定的顺序展示出待识别证件中的相关信息。
进一步,利用本公开实施例提供的证件的识别方法,可以准确且快速的筛选并识别出在待识别图像中的信息,在所需识别的待识别图像数量较大时,相较于人工确认的方式而言,其可以较为高效的完成对证件中信息的识别任务。并且,按照一定的形式进行输出,也减少了后续人工排版、整理的工作。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与自定义识别模板的生成方法对应的自定义识别模板的生成装置,由于本公开实施例中的自定义识别模板的生成装置解决问题的原理与本公开实施例上述自定义识别模板的生成方法相似,因此自定义识别模板的生成装置的实施可以参见自定义识别模板的生成方法的实施,重复之处不再赘述。
参照图8所示,为本公开实施例提供的一种自定义识别模板的生成装置的示意图,所述装置包括:第一获取模块81、确定模块82、建立模块83、以及生成模块84;其中,
第一获取模块81,用于获取目标对象的目标样本图像;确定模块82,用于响应于选定操作,分别得到待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域;建立模块83,用于建立所述第一区域与所述第二区域在所述目标样本图像中的相对位置关系;生成模块84,用于基于所述相对位置关系、以及所述参考字段,生成所述目标对象的识别模板。
一种可选的实施方式中,所述第一获取模块81在获取目标对象的目标样本图像时,用于:获取所述目标对象的原始样本图像;基于为所述原始样本图像确定所述目标对象的角点在所述原始样本图像中的位置信息,对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
一种可选的实施方式中,所述第一获取模块81在获取目标对象的目标样本图像时,用于:获取所述目标对象的原始样本图像;确定至少一个定位字段在所述原始样本图像中的第三区域;基于所述第三区域,确定所述原始样本图像的形变信息;基于所述形变信息对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
一种可选的实施方式中,所述第一获取模块81在确定至少一个定位字段在所述原始样本图像中的第三区域时,用于:对所述原始样本图像进行文字识别,并基于所述文字识别的结果,得到所述至少一个定位字段在所述原始样本图像中的所述第三区域。
一种可选的实施方式中,所述第二区域包括多个;不同的所述第二区域分布在所述目标样本图像中的不同方位。
一种可选的实施方式中,所述确定模块82在确定参考字段在所述目标样本图像中的第二区域时,用于:响应于对所述目标样本图像的第一选定操作,基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域。
一种可选的实施方式中,所述确定模块82在基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域时,用于:对所述第一选定操作在所述目标样本图像中选定的区域对应的第一子图像进行字符识别,得到所述参考字段、以及所述参考字段中的各个字符在所述目标样本图像中的第一位置信息;基于所述参考字段中的各个字符在所述目标样本图像中的第一位置信息,确定所述第二区域。
一种可选的实施方式中,所述确定模块82在确定参考字段在所述目标样本图像中的第二区域时,用于:对所述目标样本图像进行字符识别,得到多个备选字段、以及各备选字段在所述目标样本图像中的第二位置信息;响应于将所述备选字段中的目标备选字段确定为所述参考字段,基于所述参考字段在所述目标样本图像中的第二位置信息,确定所述参考字段在所述目标样本图像中的第二区域。
一种可选的实施方式中,所述确定模块82在确定与所述参考字段对应的待识别字段在所述目标样本图像中的第一区域时,用于:响应于对所述目标样本图像的第二选定操作,基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域。
一种可选的实施方式中,所述确定模块82在所述基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域时,用于:对所述第二选定操作在所述目标样本图像中选定的区域进行扩增处理,得到所述第一区域。
基于同一发明构思,本公开实施例中还提供了与证件的识别方法对应的证件的识别装置,由于本公开实施例中的证件的识别装置解决问题的原理与本公开实施例上述证件的识别方法相似,因此证件的识别装置的实施可以参见证件的识别方法的实施,重复之处不再赘述。
参照图9所示,为本公开实施例提供的一种证件的识别装置的示意图,所述识别装置包括:第二获取模块91、识别模块92;其中,
第二获取模块91,用于获取待识别证件的待识别图像;
识别模块92,用于利用根据本公开实施例提供的识别模板的生成方法确定的与所述待识别证件对应的识别模板,对所述待识别图像进行信息识别,得到所述待识别图像中与各个参考字段分别对应的目标识别字段。
一种可选的实施方式中,所述识别装置还包括展示模块93,用于:基于各个所述参考字段在所述待识别图像中的位置,展示所述参考字段和所述参考字段对应的目标识别字段中的至少一项;或者,基于生成所述识别模板时,对所述参考字段、或者与所述参考字段对应的待识别字段的选定顺序,展示所述参考字段和/或所述参考字段对应的目标识别字段中的至少一项。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本公开实施例还提供了一种计算机设备,如图10所示,为本公开实施例提供的计算机设备结构示意图,包括:
处理器10和存储器20;所述存储器20存储有处理器10可执行的机器可读指令,处理器10用于执行存储器20中存储的机器可读指令,所述机器可读指令被处理器10执行时,处理器10执行下述步骤:
获取目标对象的目标样本图像;响应于选定操作,分别得到待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域;建立所述第一区域与所述第二区域在所述目标样本图像中的相对位置关系;基于所述相对位置关系、以及所述参考字段,生成所述目标对象的识别模板。
或者,处理器10执行下述步骤:
获取待识别证件的待识别图像;利用根据本公开实施例提供的识别模板的生成方法确定的与所述待识别证件对应的识别模板,对所述待识别图像进行信息识别,得到所述待识别图像中与各个参考字段分别对应的目标识别字段。
上述存储器20包括内存210和外部存储器220;这里的内存210也称内存储器,用于暂时存放处理器10中的运算数据,以及与硬盘等外部存储器220交换的数据,处理器10通过内存210与外部存储器220进行数据交换。
上述指令的具体执行过程可以参考本公开实施例中所述的自定义识别模板的生成方法、以及证件的识别方法的步骤,此处不再赘述。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的自定义识别模板的生成方法、以及证件的识别方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的自定义识别模板的生成方法、以及证件的识别方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (16)

1.一种自定义识别模板的生成方法,其特征在于,包括:
获取目标对象的目标样本图像;
响应于选定操作,分别得到待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域;
建立所述第一区域与所述第二区域在所述目标样本图像中的相对位置关系;
基于所述相对位置关系、以及所述参考字段,生成所述目标对象的识别模板。
2.根据权利要求1所述的生成方法,其特征在于,所述获取目标对象的目标样本图像,包括:
获取所述目标对象的原始样本图像;
基于为所述原始样本图像确定所述目标对象的角点在所述原始样本图像中的位置信息,对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
3.根据权利要求1或2所述的生成方法,其特征在于,所述获取目标对象的目标样本图像,包括:
获取所述目标对象的原始样本图像;
确定至少一个定位字段在所述原始样本图像中的第三区域;
基于所述第三区域,确定所述原始样本图像的形变信息;
基于所述形变信息对所述原始样本图像进行矫正,得到所述原始样本图像对应的所述目标样本图像。
4.根据权利要求3所述的生成方法,其特征在于,所述确定至少一个定位字段在所述原始样本图像中的第三区域,包括:
对所述原始样本图像进行文字识别,并基于所述文字识别的结果,得到所述至少一个定位字段在所述原始样本图像中的所述第三区域。
5.根据权利要求1-4任一项所述的生成方法,其特征在于,所述第二区域包括多个;不同的所述第二区域分布在所述目标样本图像中的不同方位。
6.根据权利要求1-5任一项所述的生成方法,其特征在于,确定参考字段在所述目标样本图像中的第二区域,包括:
响应于对所述目标样本图像的第一选定操作,基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域。
7.根据权利要求6所述的生成方法,其特征在于,所述基于所述第一选定操作在所述目标样本图像中选定的区域,确定所述第二区域,包括:
对所述第一选定操作在所述目标样本图像中选定的区域对应的第一子图像进行字符识别,得到所述参考字段、以及所述参考字段中的各个字符在所述目标样本图像中的第一位置信息;
基于所述参考字段中的各个字符在所述目标样本图像中的第一位置信息,确定所述第二区域。
8.根据权利要求1-5任一项所述的生成方法,其特征在于,确定参考字段在所述目标样本图像中的第二区域,包括:
对所述目标样本图像进行字符识别,得到多个备选字段、以及各备选字段在所述目标样本图像中的第二位置信息;
响应于将所述备选字段中的目标备选字段确定为所述参考字段,基于所述参考字段在所述目标样本图像中的第二位置信息,确定所述参考字段在所述目标样本图像中的第二区域。
9.根据权利要求1-8任一项所述的生成方法,其特征在于,确定与所述参考字段对应的待识别字段在所述目标样本图像中的第一区域,包括:
响应于对所述目标样本图像的第二选定操作,基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域。
10.根据权利要求9所述的生成方法,其特征在于,所述基于所述第二选定操作在所述目标样本图像中选定的区域,确定所述第一区域,包括:
对所述第二选定操作在所述目标样本图像中选定的区域进行扩增处理,得到所述第一区域。
11.一种证件的识别方法,其特征在于,包括:
获取待识别证件的待识别图像;
利用根据权利要求1-10任一项所述的识别模板的生成方法确定的与所述待识别证件对应的识别模板,对所述待识别图像进行信息识别,得到所述待识别图像中与各个参考字段分别对应的目标识别字段。
12.根据权利要求11所述的证件的识别方法,其特征在于,还包括:
基于各个所述参考字段在所述待识别图像中的位置,展示所述参考字段和所述参考字段对应的目标识别字段中的至少一项;
或者,
基于生成所述识别模板时,对所述参考字段、或者与所述参考字段对应的待识别字段的选定顺序,展示所述参考字段和/或所述参考字段对应的目标识别字段中的至少一项。
13.一种识别模板的生成装置,其特征在于,包括:
第一获取模块,用于获取目标对象的目标样本图像;
确定模块,用于响应于选定操作,分别得到待识别字段在所述目标样本图像中的第一区域,以及参考字段在所述目标样本图像中的第二区域;
建立模块,用于建立所述第一区域与所述第二区域在所述目标样本图像中的相对位置关系;
生成模块,用于基于所述相对位置关系、以及所述参考字段,生成所述目标对象的识别模板。
14.一种证件的识别装置,其特征在于,包括:
第二获取模块,用于获取待识别证件的待识别图像;
识别模块,用于利用根据权利要求1-10任一项所述的识别模板的生成方法确定的与所述待识别证件对应的识别模板,对所述待识别图像进行信息识别,得到所述待识别图像中与各个参考字段分别对应的目标识别字段。
15.一种计算机设备,其特征在于,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述处理器执行如权利要求1至10任一项所述的识别模板的生成方法的步骤,或者执行如权利要求11至12任一项所述的证件的识别方法的步骤。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被计算机设备运行时,所述计算机设备执行如权利要求1至10任一项所述的识别模板的生成方法的步骤,或者执行如权利要求11至12任一项所述的证件的识别方法的步骤。
CN202110756421.7A 2021-07-05 2021-07-05 自定义识别模板的生成方法、证件的识别方法以及装置 Withdrawn CN113485618A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110756421.7A CN113485618A (zh) 2021-07-05 2021-07-05 自定义识别模板的生成方法、证件的识别方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110756421.7A CN113485618A (zh) 2021-07-05 2021-07-05 自定义识别模板的生成方法、证件的识别方法以及装置

Publications (1)

Publication Number Publication Date
CN113485618A true CN113485618A (zh) 2021-10-08

Family

ID=77940750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110756421.7A Withdrawn CN113485618A (zh) 2021-07-05 2021-07-05 自定义识别模板的生成方法、证件的识别方法以及装置

Country Status (1)

Country Link
CN (1) CN113485618A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116861865A (zh) * 2023-06-26 2023-10-10 江苏常熟农村商业银行股份有限公司 Excel数据处理方法、装置、设备及存储介质
CN117669529A (zh) * 2024-02-01 2024-03-08 腾讯科技(深圳)有限公司 数据处理方法、装置、设备以及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209909A (zh) * 2020-01-13 2020-05-29 百度在线网络技术(北京)有限公司 资质识别模板构建方法、装置、设备和存储介质
CN111931784A (zh) * 2020-09-17 2020-11-13 深圳壹账通智能科技有限公司 票据识别方法、系统、计算机设备与计算机可读存储介质
CN112669515A (zh) * 2020-12-28 2021-04-16 上海斑马来拉物流科技有限公司 票据图像识别方法、装置、电子设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209909A (zh) * 2020-01-13 2020-05-29 百度在线网络技术(北京)有限公司 资质识别模板构建方法、装置、设备和存储介质
CN111931784A (zh) * 2020-09-17 2020-11-13 深圳壹账通智能科技有限公司 票据识别方法、系统、计算机设备与计算机可读存储介质
CN112669515A (zh) * 2020-12-28 2021-04-16 上海斑马来拉物流科技有限公司 票据图像识别方法、装置、电子设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116861865A (zh) * 2023-06-26 2023-10-10 江苏常熟农村商业银行股份有限公司 Excel数据处理方法、装置、设备及存储介质
CN117669529A (zh) * 2024-02-01 2024-03-08 腾讯科技(深圳)有限公司 数据处理方法、装置、设备以及介质
CN117669529B (zh) * 2024-02-01 2024-04-30 腾讯科技(深圳)有限公司 数据处理方法、装置、设备以及介质

Similar Documents

Publication Publication Date Title
US8634659B2 (en) Image processing apparatus, computer readable medium storing program, and image processing method
CN113485618A (zh) 自定义识别模板的生成方法、证件的识别方法以及装置
JP6808330B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2007241356A (ja) 画像処理装置および画像処理プログラム
JP2017156920A (ja) 画像処理装置及び画像処理プログラム
US20080018950A1 (en) Image reading apparatus, image reading method, and image reading program
JP2013150321A (ja) 画像コーナーを修正する方法及び装置並びに画像処理設備
CN113487702A (zh) 一种模板生成、图片识别方法及装置
JP7035656B2 (ja) 情報処理装置及びプログラム
JP5618719B2 (ja) 画像処理装置、その方法およびプログラム
TWI656783B (zh) 可校正複印位置的複印設備及複印方法
JP6540597B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2006184415A (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2018098705A (ja) 画像処理装置及びその制御方法並びにプログラム
JP2021119669A (ja) 画像処理装置
JP2017199288A (ja) 画像処理装置、画像処理方法及びプログラム
JP5612974B2 (ja) セリフチェック装置、セリフチェック方法、及びプログラム
CN111401365A (zh) Ocr图像自动生成方法及装置
JP6639257B2 (ja) 情報処理装置及びその制御方法
US20220301326A1 (en) Ocr target area position acquisition system, computer-readable non-transitory recording medium storing ocr target area position acquisition program, hard copy, hard copy generation system, and computer-readable non-transitory recording medium storing hard copy generation program
KR102352726B1 (ko) 종이로 인쇄된 진료비 영수증을 전자 문서로 변환할 수 있는 전자 장치 및 그 동작 방법
WO2022024835A1 (ja) 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル
JP2005234776A (ja) 画像歪み補正処理装置と画像歪み補正方法
JP2017069826A (ja) 画像形成装置、及びプログラム
JP6617420B2 (ja) 画像処理装置および画像形成装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20211008

WW01 Invention patent application withdrawn after publication