CN111209909B - 资质识别模板构建方法、装置、设备和存储介质 - Google Patents

资质识别模板构建方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111209909B
CN111209909B CN202010033391.2A CN202010033391A CN111209909B CN 111209909 B CN111209909 B CN 111209909B CN 202010033391 A CN202010033391 A CN 202010033391A CN 111209909 B CN111209909 B CN 111209909B
Authority
CN
China
Prior art keywords
qualification
key field
information
area
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010033391.2A
Other languages
English (en)
Other versions
CN111209909A (zh
Inventor
宋烈金
崔燕
岳爱珍
黄雪原
张琳琳
申宇林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010033391.2A priority Critical patent/CN111209909B/zh
Publication of CN111209909A publication Critical patent/CN111209909A/zh
Application granted granted Critical
Publication of CN111209909B publication Critical patent/CN111209909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本申请实施例公开了一种资质识别模板构建方法、装置、设备和存储介质,涉及数据采集技术领域。具体实现方案为:对资质样本图像进行字符识别,得到字符内容和字符位置信息;基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域;根据所述关键字段区域和所述信息值区域,构建资质识别模板。本申请实施例通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。

Description

资质识别模板构建方法、装置、设备和存储介质
技术领域
本申请实施例涉及图像处理技术领域,尤其涉及数据采集技术领域,具体涉及一种资质识别模板构建方法、装置、设备和存储介质。
背景技术
随着市场的发展,越来越多的场景需要进行资质的认证。在基于图像识别模板的资质认证场景中,由于资质种类多、版本更新换代频繁等因素,目前采用的人工为各类或各版本的资质证书个性化定制图像识别模板的方式,导致模板迭代更新周期长,人工研发成本高,不能快速适应市场的快速发展。
发明内容
本申请实施例提供了一种资质识别模板构建方法、装置、设备和存储介质,能够快速构建各类或各版本的资质识别模板,提高资质识别模板构建和更新效率,降低开发成本。
第一方面,本申请实施例提供了一种资质识别模板构建方法,包括:
对资质样本图像进行字符识别,得到字符内容和字符位置信息;
基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域;
根据所述关键字段区域和所述信息值区域,构建资质识别模板。
上述申请中的一个实施例具有如下优点或有益效果:通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。
可选的,所述基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域,包括:
基于所述字符内容和所述字符位置信息,根据关键字段信息进行关键字匹配,确定所述资质样本图像中的关键字段区域;
根据所述关键字段区域,以及所述资质样本图像所属资质类别的信息值填充方式,确定所述关键字段区域关联的信息值区域。
上述申请中的一个实施例具有如下优点或有益效果:在资质认证场景中,待识别的关键字段与其后相应的信息值具有关联关系,鉴于字段的固定性,可以在确定关键字段区域之后,根据资质样本图像所属资质类别的信息值填充方式,确定关键字段区域关联的信息值区域,以用于识别关键字段区域中的字段,以及识别信息值中的具体填充信息。
可选的,所述基于所述字符内容和所述字符位置信息,根据关键字段信息进行关键字匹配,确定所述资质样本图像中的关键字段区域,包括:
将所述关键字段信息与所述字符内容进行匹配,得到所述资质样本图像中相匹配的目标关键字;
根据所述资质样本图像中字符之间的相对位置,对所述目标关键字进行组合,得到组合字符串;
根据所述组合字符串和所述字符位置信息,确定所述资质样本图像中的关键字段区域。
上述申请中的一个实施例具有如下优点或有益效果:鉴于资质样本图像中的字符内容都是独立存在的,因此通过对目标关键字的组合拼接,将与关键字段信息完全匹配的组合字符串所在的区域确定为关键字段区域,提高了关键字段区域的检测准确率,避免任一关键字的识别错误导致关键字段区域的未识别。
可选的,所述根据所述组合字符串和所述字符位置信息,确定所述资质样本图像中的关键字段区域,包括:
确定所述组合字符串与所述关键字段信息之间的匹配度;
若根据所述匹配度以及匹配度阈值,检测到所述组合字符串与所述关键字段信息部分匹配成功,则根据所述资质样本图像所属资质类别的排版规则,确定所述组合字符串中所缺失的字符的位置;
根据所述组合字符串中的字符位置信息,以及所述组合字符串中所缺失的字符的位置,确定所述资质样本图像中的关键字段区域。
上述申请中的一个实施例具有如下优点或有益效果:在关键字段区域检测的过程中,通过将组合字符串与关键字段信息进行相似度检测,以对关键字段部分匹配成功即缺少字符的组合字符串进行位置补全处理,以得到完整的关键字段区域,避免任一关键字的识别错误导致关键字段区域的未识别。
可选的,所述根据所述关键字段区域,以及所述资质样本图像所属资质类别的信息值填充方式,确定所述关键字段区域关联的信息值区域,包括:
根据所述资质样本图像所属资质类别中字段与信息值之间的相对位置关系,确定所述关键字段区域关联的候选信息值;
根据所述关键字段区域与所述候选信息值的字符大小,从所述候选信息值中确定目标信息值;
根据所述目标信息值和所述字符位置信息,确定所述信息值区域。
上述申请中的一个实施例具有如下优点或有益效果:基于确定的关键字段区域,结合关键字段对应的信息值的位置及样式特点,能够检测到关键字段区域关联的信息值区域。
可选的,所述根据所述目标信息值和所述字符位置信息,确定所述信息值区域,包括:
将所述目标信息值所在的区域,以及与所述目标信息值相邻的至少一行资质样本图像区域,确定为所述信息值区域。
上述申请中的一个实施例具有如下优点或有益效果:鉴于资质证书中存在信息值打印偏移的情况,可以利用资质证书中的空白位置,估算出信息值的最大区域,以提高信息值的提取率。
可选的,所述根据所述关键字段区域和所述信息值区域,构建资质识别模板,包括:
从所述资质样本图像中抽取所述关键字段区域和所述信息值区域,得到候选资质识别模板;
根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并,得到所述资质样本图像所属资质类别的资质识别模板。
上述申请中的一个实施例具有如下优点或有益效果:在资质识别模板构建过程中,每一个资质样本图像都可以抽取构建得到一个候选资质识别模板,由于众多资质样本图像同属于同一类型资质,因此通过不同候选资质识别模板之间相似度的检测以及相似候选资质识别模板的合并,可以得到一类资质下的至少一个最优资质识别模板。
可选的,所述根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并,包括:
若检测到至少两个候选资质识别模板的待识别区域之间的交并比大于交并比阈值,则确定所述至少两个候选资质识别模板中的待识别区域相似;其中,所述待识别区域包括关键字段区域和信息值区域;
若所述至少两个候选资质识别模板中的待识别区域均相似,则将所述至少两个候选资质识别模板合并。
上述申请中的一个实施例具有如下优点或有益效果:通过对不同候选资质识别模板中的待识别区域进行逐一比对,能够找到模板中待识别区域均相似的至少两个候选资质识别模板,以进行相似模板合并。
可选的,在所述根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并之前,还包括:
若根据所述关键字段信息,检测到所述候选资质识别模板中缺少任一关键字段的关键字段区域,则去除所述候选资质识别模板。
上述申请中的一个实施例具有如下优点或有益效果:在相似模板合并之前,过滤去除关键字段检测不全的候选资质识别模板,以减少相似模板合并的计算量。
可选的,在所述根据所述关键字段区域和所述信息值区域,构建资质识别模板之后,还包括:
将待识别资质图像与所述资质识别模板进行匹配,从所述资质识别模板中,选择所述待识别资质图像的目标资质识别模板;
将所述目标资质识别模板中的待识别区域,向所述待识别资质图像映射,得到资质信息区域;其中,所述待识别区域包括关键字段区域和信息值区域;
对所述资质信息区域进行字符识别,得到资质图像信息,用于资质认证。
上述申请中的一个实施例具有如下优点或有益效果:在资质认证的资质信息检测过程中,通过选择形状及位置最佳的目标资质识别模板,从而利用目标资质识别模板从待识别资质图像中确定资质信息区域,能够从资质信息区域中快速识别出资质图像信息,避免了待识别资质图像中内容的全部遍历,提高了资质图像信息提取效率和准确率。
第二方面,本申请实施例提供了一种资质识别模板构建装置,包括:
字符识别模块,用于对资质样本图像进行字符识别,得到字符内容和字符位置信息;
区域确定模块,用于基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域;
模板构建模块,用于根据所述关键字段区域和所述信息值区域,构建资质识别模板。
第三方面,本申请实施例提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例所述的资质识别模板构建方法。
第四方面,本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请任意实施例所述的资质识别模板构建方法。
上述申请中的一个实施例具有如下优点或有益效果:通过对大量的资质样本图像进行字符识别,得到资质样本图像中的一个个字符内容和字符位置信息,基于字符内容和字符位置信息,确定资质样本图像中的关键字段区域以及信息值区域,从而从资质样本图像中抽取关键字段区域以及信息值区域,构成资质识别模板。本申请实施例通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的一种资质识别模板构建方法的流程图;
图2是根据本申请第二实施例的一种资质识别模板构建方法的流程图;
图3是根据本申请第二实施例的资质识别模板构建的示例图;
图4是根据本申请第三实施例的一种资质识别模板构建方法的流程图;
图5是根据本申请第三实施例的资质识别模板构建的示例图;
图6是根据本申请第四实施例的一种资质识别模板构建方法的流程图;
图7是根据本申请第五实施例的资质图像信息采集流程图;
图8是根据本申请第五实施例的基于模板的资质图像信息采集的流程图;
图9是根据本申请第五实施例的资质识别模板匹配的示例图;
图10是根据本申请第六实施例的一种资质识别模板构建装置的结构示意图;
图11是用来实现本申请实施例的资质识别模板构建方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
第一实施例
图1是根据本申请第一实施例的一种资质识别模板构建方法的流程图,本实施例可适用于对于资质这种样式繁多、标准不统一、打印方式灵活的证书,基于资质样本图像构建资质识别模板,用于提取资质图像信息进行资质认证的情况,该方法可由一种资质识别模板构建装置来执行,该装置采用软件和/或硬件的方式实现,优选是配置于电子设备中,例如终端或服务器。如图1所示,该方法具体包括如下:
S110、对资质样本图像进行字符识别,得到字符内容和字符位置信息。
在本申请具体实施例中,资质认证是指个人和机构通过提交代表本身身份的资质图像,由认证平台验证资质图像中的信息与个人或机构的信息是否一致,判定该认证需求能否通过。资质可以包括生活中的任何资质证书,例如事业单位法人证书、教师资格证书等。其中,资质证书可以是基于国家统一的格式标准,由国家颁发的;还可以是各个机构颁发的,相应的,不同的机构之间具有不同的格式标准。
本实施例中,可以预先确定待构建资质识别模板的至少一种资质类型,收集待构建资质识别模板的至少一种资质类型的大量资质证书,通过拍照或扫描等图像采集方式,得到大量资质证书所转换的资质样本图像;或者,通过互联网下载或截取大量资质证书的资质样本图像。其中,在采集到大量资质样本图像之后,可以首先对资质样本图像进行去噪、角度校正、不完整样本过滤等预处理操作,以得到较为清晰、完整、角度一致的资质样本图像,作为训练集供资质识别模板构建使用。
本实施例中,字符内容是指资质样本图像中所识别出来的一个个单一的字符。其中,本实施例不对字符识别技术进行限制,任何可以实现字符识别的技术或算法都可以应用于本实施例中,例如光学字符识别技术(Optical Character Recognition,OCR)。
相应的,可以预先对所有资质样本图像构建统一的坐标系,在识别出资质样本图像中的字符内容之后,确定每个字符在资质样本图像中的位置坐标作为字符位置信息。其中,本实施例不对字符位置信息的表示方式进行限定,任何可以表示字符位置的方式都可以应用于本实施例中。但值得注意的是,在资质认证场景中,优选采用统一的坐标系以及坐标表示方式,例如全部以图像坐上角为坐标原点构建坐标系。
具体的,可以以至少一种新增资质或者版本更新的至少一种资质,作为待构建资质识别模板的目标资质,采集目标资质下大量的资质样本图像,经过预处理得到训练集。通过字符识别技术对训练集中每一个资质样本图像进行字符识别,得到资质样本图像中的字符内容,以及每个字符的字符位置信息。
示例性的,假设《事业单位法人证书》的资质版本发生更新,需要构建新的资质识别模板,则以《事业单位法人证书》为目标资质,采集大量《事业单位法人证书》的资质样本图像,通过字符识别得到每一个资质样本图像中的字符内容,例如得到字符“法”、“定”、“人”等字符内容,以及每个字符的位置。
S120、基于字符内容和字符位置信息,确定资质样本图像中的关键字段区域以及信息值区域。
在本申请具体实施例中,关键字段区域是指待识别的关键字段在资质样本图像中所占据的区域。其中,字段是指资质证书中固有的数据项,在统一的标准下,其位置、样式是固定不变的,不依赖于证书所填充信息的不同而改变。关键字段是指资质认证过程中所需验证的字段,关键字段可以包括资质证书中的全部字段,也可以只是资质证书中的部分字段。
示例性的,假设《事业单位法人证书》中包括“统一社会信用代码”、“名称”、“法人代表”、“住所”以及“业务范围”等字段,其中在资质认证过程中,仅对“统一社会信用代码”、“名称”和“法人代表”进行验证即可,因此将这三个字段作为待验证的关键字段。
本实施例中,基于资质样本图像中识别出来的字符内容,确定资质样本图像中的关键字段,基于资质样本图像中确定的字符位置信息,确定关键字段所占据的位置区域为关键字段区域。
可选的,基于字符内容和字符位置信息,根据关键字段信息进行关键字匹配,确定资质样本图像中的关键字段区域。本实施例中,关键字段信息是指根据资质认证需求,预先确定的所需验证的字段。
示例性的,以待构建资质识别模板的至少一种资质为目标资质,可以根据资质认证需求,预先确定目标资质中待验证的关键字段信息,通过将关键字段信息与资质样本图像中的字符内容进行匹配,得到资质样本图像中相匹配的目标关键字。根据资质样本图像中字符之间的相对位置,对目标关键字进行组合,得到组合字符串。确定组合字符串与关键字段信息之间的匹配度,若根据匹配度以及匹配度阈值,检测到组合字符串与关键字段信息部分匹配成功,则根据资质样本图像所属资质类别的排版规则,确定组合字符串中所缺失的字符的位置。最终根据组合字符串中的字符位置信息,以及组合字符串中所缺失的字符的位置,补全得到完整的关键字段应有的位置区域,确定资质样本图像中的关键字段区域。
相应的,与字段对应,在颁发资质时,会通过打印等方式,在空白资质证书的字段旁填充个人或者机构的具体信息值。因此,信息值区域是指待识别的关键字段关联的信息值在资质样本图像中所占据的区域。其中,对于不同类别的资质证书,信息值与字段的位置关系可能存在区别。通常在字段的右侧填充信息值,也存在少许证书在字段的下侧或其他位置填充信息值。由于信息值是后期填充至资质证书中的,因此不同资质证书中的信息值的位置可能存在少许偏移,且不同资质证书中信息值的内容是不同的。
可选的,根据关键字段区域,以及资质样本图像所属资质类别的信息值填充方式,确定关键字段区域关联的信息值区域。本实施例中,信息值填充方式可以至少包括资质证书中信息值的填充位置,以及所填充字符的字符大小等。其中,若某一资质是国家统一颁发的,则该资质中的信息填充方式基于国家标准;若某一资质是不同机构颁发的,则该资质中的信息填充方式可能随着颁发机构的不同而不同。
本实施例中,可以预先确定资质样本图像所属资质类别的信息值填充方式,基于关键字段区域,根据资质样本图像所属资质类别中字段与信息值之间的相对位置关系,确定关键字段区域关联的候选信息值。鉴于信息值通常是采用与字段字符大小相同尺寸的字符打印方式进行填充,或者采用小于字段字符大小的指定字号进行填充,因此可以根据关键字段区域与候选信息值的字符大小,从候选信息值中确定目标信息值。从而根据目标信息值和字符位置信息,确定信息值区域。其中鉴于打印偏移的情况,考虑到资质证书中相邻字段之间存在空行,因此还可以将目标信息值所在的区域,以及与目标信息值相邻的至少一行资质样本图像区域,确定为信息值区域,以估算得到信息值的最大区域,防止对信息值的漏检。
其中,本实施例不对区域的表示方式进行限定,任何能够表示区域所占据范围的方式都可以应用于本实施例中。例如,利用区域的左上角位置坐标和右下角位置坐标来表示区域所占据的资质图像范围。
S130、根据关键字段区域和信息值区域,构建资质识别模板。
在本申请具体实施例中,关键字段区域以及关键字段区域关联的信息值区域可以共同作为待识别区域,根据待识别区域的位置和大小等信息,构建资质识别模板。相应的,资质识别模板中限定了各个待识别区域的位置和大小等信息,根据资质识别模板,可以快速在待识别资质图像中定位待识别区域,以供直接提取相应的资质图像信息。
具体的,根据对每一个资质样本图像中待识别区域的检测,可以相应的生成该资质样本图像的候选资质识别模板。其中,对于关键字段检测不全的候选资质识别模板,例如关键字段信息中包括3个关键字段,而该候选资质识别模板中可包括2个关键字段区域,则可以过滤去除掉该候选资质识别模板。由于众多资质样本图像同属于同一类型资质,因此可以通过不同候选资质识别模板之间相似度的检测以及相似候选资质识别模板的合并,可以得到一类资质下的至少一个最优资质识别模板。
本实施例的技术方案,通过对大量的资质样本图像进行字符识别,得到资质样本图像中的一个个字符内容和字符位置信息,基于字符内容和字符位置信息,确定资质样本图像中的关键字段区域以及信息值区域,从而从资质样本图像中抽取关键字段区域以及信息值区域,构成资质识别模板。本申请实施例通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。
第二实施例
图2是根据本申请第二实施例的一种资质识别模板构建方法的流程图,本实施例在上述第一实施例的基础上,进一步对关键字段区域以及信息值区域的检测过程进行解释说明,能够在通过关键字匹配以及字符位置信息确定关键字段区域时,对关键字段区域进行补全;能够在通过资质样本图像所属资质类别的信息值填充方式确定信息值区域时,根据字段与信息值之间的相对位置关系以及字符大小等特点,筛选出合适的信息值。如图2所示,该方法具体包括如下:
S210、对资质样本图像进行字符识别,得到字符内容和字符位置信息。
S220、将关键字段信息与字符内容进行匹配,得到资质样本图像中相匹配的目标关键字。
在本申请具体实施例中,将关键字段信息中的各个关键字,与资质样本图像中的各个字符进行关键字匹配,得到与关键字段信息中的关键字相匹配的字符作为目标关键字。
示例性的,假设“法定代表人”为关键字段信息中的一个待识别的关键字段,将关键字段中的各个字符“法”、“定”、“代”、“表”和“人”,分别与资质样本图像中的各个字符进行关键字匹配,得到资质样本图像中与这5个关键字相匹配的字符内容作为目标关键字。
S230、根据资质样本图像中字符之间的相对位置,对目标关键字进行组合,得到组合字符串。
在本申请具体实施例中,通常资质证书中都采用由右向左的常规撰写的方式,极少数资质证书采用由上至下的撰写方式。因此可以预先确定资质样本图像所属资质类别的文字撰写方式,根据资质样本图像中字符之间的相对位置,将相邻的目标关键字进行组合拼接,得到组合字符串。其中,基于资质样本图像中字符的识别效果,若字符全部识别出来,则组合字符串可以构成完整的关键字段;若字符存在偏差,例如错误或未识别出,则组合字符串可能只是对应关键字段中的部分。
示例性的,假设资质样本图像中,通过匹配得到了“定”、“代”、“表”、“人”、“名”和“称”这至少六个目标关键字,且“定”、“代”、“表”和“人”这四个目标关键字位置上相邻,“名”和“称”这两个目标关键字位置上相邻。因此通过组合可以得到组合字符串“定代表人”和“名称”。
S240、根据组合字符串和字符位置信息,确定资质样本图像中的关键字段区域。
在本申请具体实施例中,对于能够构成完整关键字段的组合字符串,可以根据组合字符串中每个字符的字符位置信息,将组合字符串所占据的位置区域确定为关键字段区域。对于不能够构成完整关键字段的组合字符串,为了模板构建的完整性,可以估算组合字符串中所缺少的字符的位置,以补全得到完整的关键字段区域。
可选的,确定组合字符串与关键字段信息之间的匹配度;若根据匹配度以及匹配度阈值,检测到组合字符串与关键字段信息部分匹配成功,则根据资质样本图像所属资质类别的排版规则,确定组合字符串中所缺失的字符的位置;根据组合字符串中的字符位置信息,以及组合字符串中所缺失的字符的位置,确定资质样本图像中的关键字段区域。
本实施例中,可以预先确定匹配度阈值,即可以将组合字符串与关键字段信息进行匹配,确定两者的匹配度,若检测到组合字符串与关键字段信息之间的匹配度大于匹配度阈值,则确定组合字符串与关键字段信息,即组合字符串属于待识别的关键字。
进一步的,在确定组合字符串是否构成完整的关键字段的过程中,若检测到组合字符串与关键字段信息之间的匹配度为100%,则可以直接确定组合字符串就是完整的关键字段。若检测到匹配度大于匹配度阈值且小于100%,即组合字符串与关键字段信息部分匹配成功,则需要进一步估算出相对于关键字段信息,该组合字符串中所缺失的字符的位置。具体的,可以根据组合字符串与关键字段信息之间的关键字匹配,确定组合字符串中所缺失的字符。根据资质样本图像所属资质类别的排版规则,例如字段字符大小以及字符间距等规则,估算出缺失字符的位置。从而将缺失字符的位置与组合字符串所占据的位置区域连接起来,共同作为完整的关键字段区域。
示例性的,假设匹配度阈值为70%,在上述组合字符串为“定代表人”的示例中,组合字符串“定代表人”与关键字段“法定代表人”的匹配度为80%,即70%<80%<100%,检测到组合字符串与关键字段信息部分匹配成功。进而根据《事业单位法人证书》中的文字间隔和文字大小,在字符“定”之前估算字符“法”的位置,并与组合字符串“定代表人”共同构成完整的关键字段,确定完整的关键字段区域。
S250、根据资质样本图像所属资质类别中字段与信息值之间的相对位置关系,确定关键字段区域关联的候选信息值。
在本申请具体实施例中,对于不同类别的资质证书,信息值与字段的位置关系可能存在区别。通常在字段的右侧填充信息值,也存在少许证书在字段的下侧或其他位置填充信息值。可以预先确定资质样本图像所属资质类别中字段与信息值之间的相对位置关系,根据相对位置关系,从资质样本图像中,将与关键字段区域符合相对位置关系的至少一个字符内容,确定为该关键字段区域关联的候选信息值。其中,由于打印偏移等错位情况,候选信息值可能包括两个或多个。
S260、根据关键字段区域与候选信息值的字符大小,从候选信息值中确定目标信息值。
在本申请具体实施例中,鉴于信息值通常是采用与字段字符大小相同尺寸的字符打印方式进行填充,或者采用小于字段字符大小的指定字号进行填充,因此可以关键字段区域中字符的大小,以及候选信息值的字符大小,从候选信息值中确定目标信息值。
S270、根据目标信息值和字符位置信息,确定信息值区域。
在本申请具体实施例中,目标信息值通常为连续的字符串,可以根据目标信息值中各字符的字符位置,确定目标信息值所占据的位置区域为信息值区域。
可选的,将目标信息值所在的区域,以及与目标信息值相邻的至少一行资质样本图像区域,确定为信息值区域。
本实施例中,鉴于打印偏移的情况,且考虑到资质证书中相邻字段之间存在空行,因此还可以根据目标信息值所占据的位置区域,确定与目标信息值相邻前一行资质样本图像区域和/或后一行资质样本图像区域,共同作为信息值区域,以得到信息值的最大区域,防止后期对于信息值的漏检。
S280、根据关键字段区域和信息值区域,构建资质识别模板。
示例性的,图3为资质识别模板构建的示例图。假设《事业单位法人证书》的资质版本发生更新,需要构建新的资质识别模板,其中关键字段信息包括“统一社会信用代码”、“名称”和“法人代表”。如图3所示,所呈现的包括一个资质样本图像310,对该资质样本图像310进行字符识别,得到如图320中的字符内容和字符位置信息。根据关键字段信息进行关键字匹配和组合,得到如图330中的关键字段区域331和信息值区域332。其中,关键字段区域331与其关联的信息值区域332共同构成一个待识别区域,如图340。通常从资质样本图像中抽取全部的待识别区域,得到资质识别模板350。
本实施例的技术方案,根据资质样本图像中文字识别得到的字符内容和字符位置信息,与关键字段信息进行关键字匹配得到目标关键字,基于目标关键字组合得到的组合字符串,判断与完整关键字段之间的匹配度,从而确定完整的关键字段区域以及对应的信息值区域,构成候选资质识别模板,并通过相似模板合并得到最终的资质识别模板。本申请实施例通过对关键字段区域的补全处理,以及信息值区域的选择和扩充,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,以及避免任一关键信息的漏检,提高资质识别模板构建效率以及信息识别准确率,降低开发成本。
第三实施例
图4是根据本申请第三实施例的一种资质识别模板构建方法的流程图,本实施例在上述第一实施例的基础上,进一步对资质识别模板的构建进行解释说明,能够对候选资质识别模板进行合并,得到同一类资质的至少一个最优的资质识别模板。如图4所示,该方法具体包括如下:
S410、对资质样本图像进行字符识别,得到字符内容和字符位置信息。
S420、基于字符内容和字符位置信息,确定资质样本图像中的关键字段区域以及信息值区域。
S430、从资质样本图像中抽取关键字段区域和信息值区域,得到候选资质识别模板。
在本申请具体实施例中,通过对每一个资质样本图像的区域检测,以及区域的抽取,每一个资质样本图像都能够对应得到一个候选资质识别模板。
S440、根据至少两个候选资质识别模板之间的相似度,对候选资质识别模板进行合并,得到资质样本图像所属资质类别的资质识别模板。
在本申请具体实施例中,鉴于全部资质样本图像或众多资质样本图像都属于一种资质类别,且上述获得的候选资质模板较多,如果全部用于资质图像匹配,需要耗费很大的计算成本以及占据较大的存储空间。因此可以通过不同候选资质识别模板之间的相似性,过滤掉相似的候选资质识别模板,得到一类资质的至少一个最优的资质识别模板。
可选的,若检测到至少两个候选资质识别模板的待识别区域之间的交并比大于交并比阈值,则确定至少两个候选资质识别模板中的待识别区域相似;其中,待识别区域包括关键字段区域和信息值区域;若至少两个候选资质识别模板中的待识别区域均相似,则将至少两个候选资质识别模板合并。
本实施例不对模板之间相似度的计算方式进行限定,任何可以实现图像相似度的计算方式都可以应用于本实施例中。例如,可以采用SIFT算法(Scale-invariant featuretransform,尺度不变特征变换),基于SIFT算法能够对两张图像中本质相同但图像呈现有所区别的特征点进行转换的特性,首先抽取候选资质识别模板中的特征点,然后利用特征点对任意至少两个候选资质识别模板进行匹配,通过将第一个候选资质识别模板中的待识别区域,利用SIFT算法映射到第二个候选资质识别模板中。基于第二个候选资质识别模板中的映射区域以及第二个候选资质识别模板中的待识别区域进行交并比(Intersectionover Union,IoU)计算,得到第二个候选资质识别模板中映射区域与待识别区域之间交集与并集之比。如果IoU大于交并比阈值,则确定两个候选资质识别模板中的这一待识别区域相似。进而若候选资质识别模板中的全部待识别区域都相似,则确定两个候选资质识别模板相似。去掉相似的候选资质识别模板,保留互不相似的候选资质识别模板。
可选的,在根据至少两个候选资质识别模板之间的相似度,对候选资质识别模板进行合并之前,若根据关键字段信息,检测到候选资质识别模板中缺少任一关键字段的关键字段区域,则去除候选资质识别模板。
本实施例中,为了避免不必要的计算,可以在计算不同候选资质识别模板的相似度之前,首先对每一个候选资质识别模板进行可用性检测。即若基于字符的识别和区域的检测后,候选资质识别模板中并没有检测出全部的关键字段对应的待识别区域,因此可以视为这样的候选资质识别模板不可用,去除该候选资质识别模板。例如,预先确定了关键字段信息中包括3个关键字段,而某个候选资质识别模板中只包括其中的2个关键字段对应的待识别区域,因此去除该候选资质识别模板。
示例性的,图5为资质识别模板构建的示例图。在上述示例中,假设《事业单位法人证书》的资质版本发生更新,需要构建新的资质识别模板,其中关键字段信息包括“统一社会信用代码”、“名称”和“法人代表”。如图5所示,所呈现的包括两个资质样本图像,对每一个资质样本图像进行资质识别模板抽取,每一个资质样本图像都能够得到一个候选资质识别模板,对不同的候选资质识别模板进行合并,得到最终的资质识别模板。
本实施例的技术方案,通过对大量的资质样本图像进行字符识别,得到资质样本图像中的一个个字符内容和字符位置信息,基于字符内容和字符位置信息,确定资质样本图像中的关键字段区域以及信息值区域,从而从每一个资质样本图像中抽取关键字段区域以及信息值区域,构成候选资质识别模板,通过不同候选资质识别模板之间相似度的计算,对相似的候选资质识别模板进行合并,得到一类资质至少一个最优的资质识别模板。本申请实施例通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。
第四实施例
图6是根据本申请第四实施例的一种资质识别模板构建方法的流程图,如图6所示,该方法具体包括如下:
S601、对资质样本图像进行字符识别,得到字符内容和字符位置信息。
S602、将关键字段信息与字符内容进行匹配,得到资质样本图像中相匹配的目标关键字。
S603、根据资质样本图像中字符之间的相对位置,对目标关键字进行组合,得到组合字符串。
S604、确定组合字符串与关键字段信息之间的匹配度。
S605、若根据匹配度以及匹配度阈值,检测到组合字符串与关键字段信息部分匹配成功,则根据资质样本图像所属资质类别的排版规则,确定组合字符串中所缺失的字符的位置。
S606、根据组合字符串中的字符位置信息,以及组合字符串中所缺失的字符的位置,确定资质样本图像中的关键字段区域。
S607、根据资质样本图像所属资质类别中字段与信息值之间的相对位置关系,确定关键字段区域关联的候选信息值。
S608、根据关键字段区域与候选信息值的字符大小,从候选信息值中确定目标信息值。
S609、将目标信息值所在的区域,以及与目标信息值相邻的至少一行资质样本图像区域,确定为信息值区域。
S610、从资质样本图像中抽取关键字段区域和信息值区域,得到候选资质识别模板。
S611、若根据关键字段信息,检测到候选资质识别模板中缺少任一关键字段的关键字段区域,则去除候选资质识别模板。
S612、若检测到至少两个候选资质识别模板的待识别区域之间的交并比大于交并比阈值,则确定至少两个候选资质识别模板中的待识别区域相似;其中,待识别区域包括关键字段区域和信息值区域。
S613、若至少两个候选资质识别模板中的待识别区域均相似,则将至少两个候选资质识别模板合并。
本实施例的技术方案,通过对大量的资质样本图像进行字符识别,得到资质样本图像中的一个个字符内容和字符位置信息,基于字符内容和字符位置信息,确定资质样本图像中的关键字段区域以及信息值区域,从而从资质样本图像中抽取关键字段区域以及信息值区域,构成资质识别模板。本申请实施例通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。
第五实施例
图7是根据本申请第五实施例的资质图像信息采集流程图,本实施例在上述第一实施例的基础上,在构建资质识别模板之后,进一步对资质图像信息采集过程进行解释说明,能够快速识别出资质图像信息。如图7所示,该方法具体包括如下:
S710、对资质样本图像进行字符识别,得到字符内容和字符位置信息。
S720、基于字符内容和字符位置信息,确定资质样本图像中的关键字段区域以及信息值区域。
S730、根据关键字段区域和信息值区域,构建资质识别模板。
S740、将待识别资质图像与资质识别模板进行匹配,从资质识别模板中,选择待识别资质图像的目标资质识别模板。
在本申请具体实施例中,待识别资质图像是指当前需要进行资质认证的资质图像。资质识别模板可以仅为待识别资质图像所属资质类别的至少一个模板,也可以为所有的资质识别模板。在资质图像信息采集的过程中,可以首先从资质识别模板集中筛选出待识别资质图像所属资质类别的至少一个资质识别模板。若筛选出的资质识别模板只有一个,则可以直接利用该资质识别模板对待识别资质图像进行资质图像信息采集。若筛选出的资质识别模板为多个,例如包含该资质类别下不同版本对应的资质识别模板,则可以将待识别资质图像与筛选出的多个资质识别模板进行匹配,以从资质识别模板中,选择出与待识别资质图像的形状和位置匹配最佳的目标资质识别模板。
本实施例不对模板的匹配方式进行限定,任何能够实现模板匹配的方式都可以应用于本实施例中。例如,基于SIFT算法能够对两张图像中本质相同但图像呈现有所区别的特征点进行转换的特性,可以采用SIFT算法进行模板匹配。首先抽取待识别资质图像和资质识别模板中的特征点,待识别资质图像中的特征点,与资质识别模板中对应的特征点构成匹配对。假设以待识别资质图像中的特征点A作为基础点,在待识别资质图像中,特征点A可以与其他任意两个特征点构成角度。依据对应关系,在资质识别模板中基于特征点A’也形成角度。若待识别资质图像中存在多数角度,与资质识别模板中对应的角度之间的偏差超过误差阈值,则将特征点A与A’的匹配对视为错误匹配对,并过滤掉。从而基于剩余正确的匹配对构建得到透视变化矩阵,利用透视变化矩阵将资质识别模板映射到待识别资质图像上,得到形状及位置匹配最佳的最佳匹配模板。
S750、将目标资质识别模板中的待识别区域,向待识别资质图像映射,得到资质信息区域;其中,待识别区域包括关键字段区域和信息值区域。
在本申请具体实施例中,将目标资质识别模板中的待识别区域,映射到识别资质图像中,以待识别资质图像中的映射区域作为包含待识别资质信息的资质信息区域,裁剪得到资质信息区域。
S760、对资质信息区域进行字符识别,得到资质图像信息,用于资质认证。
在本申请具体实施例中,采用字符识别技术例如OCR技术,对资质信息区域进行字符识别,得到资质图像信息,并存入数据库中供资质认证使用。
示例性的,图8为基于模板的资质图像信息采集的流程图。如图8所示,基于资质样本图像集进行模板的抽取和合并,生成资质识别模板集。基于资质识别模板集对待识别资质图像进行模板匹配,得到资质图像信息并入库。
示例性的,图9为资质识别模板匹配的示例图。如图9所示,通过资质识别模板的匹配,将选择的目标资质识别模板映射到待识别资质图像中,通过映射区域的裁剪和字符识别,得到资质图像信息。
本实施例的技术方案,在构建得到的资质识别模板的基础上,通过资质识别模板的匹配,将选择的目标资质识别模板映射到待识别资质图像中,通过映射区域的裁剪和字符识别,得到资质图像信息,供资质认证使用。本申请实施例在资质认证的资质信息检测过程中,通过选择形状及位置最佳的目标资质识别模板,从而利用目标资质识别模板从待识别资质图像中确定资质信息区域,能够从资质信息区域中快速识别出资质图像信息,避免了待识别资质图像中内容的全部遍历,提高了资质图像信息提取效率和准确率。
第六实施例
图10是根据本申请第六实施例的一种资质识别模板构建装置的结构示意图,本实施例可适用于对于资质这种样式繁多、标准不统一、打印方式灵活的证书,基于资质样本图像构建资质识别模板,用于提取资质图像信息进行资质认证的情况,该装置可实现本申请任意实施例所述的资质识别模板构建方法。该装置1000具体包括如下:
字符识别模块1010,用于对资质样本图像进行字符识别,得到字符内容和字符位置信息;
区域确定模块1020,用于基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域;
模板构建模块1030,用于根据所述关键字段区域和所述信息值区域,构建资质识别模板。
可选的,所述区域确定模块1020具体用于:
基于所述字符内容和所述字符位置信息,根据关键字段信息进行关键字匹配,确定所述资质样本图像中的关键字段区域;
根据所述关键字段区域,以及所述资质样本图像所属资质类别的信息值填充方式,确定所述关键字段区域关联的信息值区域。
可选的,所述区域确定模块1020具体用于:
将所述关键字段信息与所述字符内容进行匹配,得到所述资质样本图像中相匹配的目标关键字;
根据所述资质样本图像中字符之间的相对位置,对所述目标关键字进行组合,得到组合字符串;
根据所述组合字符串和所述字符位置信息,确定所述资质样本图像中的关键字段区域。
可选的,所述区域确定模块1020具体用于:
确定所述组合字符串与所述关键字段信息之间的匹配度;
若根据所述匹配度以及匹配度阈值,检测到所述组合字符串与所述关键字段信息部分匹配成功,则根据所述资质样本图像所属资质类别的排版规则,确定所述组合字符串中所缺失的字符的位置;
根据所述组合字符串中的字符位置信息,以及所述组合字符串中所缺失的字符的位置,确定所述资质样本图像中的关键字段区域。
可选的,所述区域确定模块1020具体用于:
根据所述资质样本图像所属资质类别中字段与信息值之间的相对位置关系,确定所述关键字段区域关联的候选信息值;
根据所述关键字段区域与所述候选信息值的字符大小,从所述候选信息值中确定目标信息值;
根据所述目标信息值和所述字符位置信息,确定所述信息值区域。
可选的,所述区域确定模块1020具体用于:
将所述目标信息值所在的区域,以及与所述目标信息值相邻的至少一行资质样本图像区域,确定为所述信息值区域。
可选的,所述模板构建模块1030具体用于:
从所述资质样本图像中抽取所述关键字段区域和所述信息值区域,得到候选资质识别模板;
根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并,得到所述资质样本图像所属资质类别的资质识别模板。
可选的,所述模板构建模块1030具体用于:
若检测到至少两个候选资质识别模板的待识别区域之间的交并比大于交并比阈值,则确定所述至少两个候选资质识别模板中的待识别区域相似;其中,所述待识别区域包括关键字段区域和信息值区域;
若所述至少两个候选资质识别模板中的待识别区域均相似,则将所述至少两个候选资质识别模板合并。
可选的,所述模板构建模块1030具体用于:
在所述根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并之前,若根据所述关键字段信息,检测到所述候选资质识别模板中缺少任一关键字段的关键字段区域,则去除所述候选资质识别模板。
进一步的,所述装置1000还包括资质图像信息采集模块1040,具体用于:
在所述根据所述关键字段区域和所述信息值区域,构建资质识别模板之后,将待识别资质图像与所述资质识别模板进行匹配,从所述资质识别模板中,选择所述待识别资质图像的目标资质识别模板;
将所述目标资质识别模板中的待识别区域,向所述待识别资质图像映射,得到资质信息区域;其中,所述待识别区域包括关键字段区域和信息值区域;
对所述资质信息区域进行字符识别,得到资质图像信息,用于资质认证。
本实施例的技术方案,通过各个功能模块之间的相互配合,实现了训练集的构建、字符信息的识别、关键字的匹配、关键字段区域的确定、信息值区域的确定、候选资质识别模板的生成、模板的合并、模板的匹配以及资质图像信息的采集等功能。本申请实施例通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。
第七实施例
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图11所示,是根据本申请实施例的资质识别模板构建方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图11所示,该电子设备包括:一个或多个处理器1101、存储器1102,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置,诸如,耦合至接口的显示设备,其上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作,例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统。图11中以一个处理器1101为例。
存储器1102即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的资质识别模板构建方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的资质识别模板构建方法。
存储器1102作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的资质识别模板构建方法对应的程序指令/模块,例如,附图10所示的字符识别模块1010、区域确定模块1020、模板构建模块1030和资质图像信息采集模块1040。处理器1101通过运行存储在存储器1102中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的资质识别模板构建方法。
存储器1102可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据资质识别模板构建方法的电子设备的使用所创建的数据等。此外,存储器1102可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1102可选包括相对于处理器1101远程设置的存储器,这些远程存储器可以通过网络连接至资质识别模板构建方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
资质识别模板构建方法的电子设备还可以包括:输入装置1103和输出装置1104。处理器1101、存储器1102、输入装置1103和输出装置1104可以通过总线或者其他方式连接,图11中以通过总线连接为例。
输入装置1103可接收输入的数字或字符信息,以及产生与资质识别模板构建方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1104可以包括显示设备、辅助照明装置和触觉反馈装置等,其中,辅助照明装置例如发光二极管(Light Emitting Diode,LED);触觉反馈装置例如,振动电机等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、LED显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuit,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序,也称作程序、软件、软件应用、或者代码,包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置,例如,磁盘、光盘、存储器、可编程逻辑装置(Programmable Logic Device,PLD),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置,例如,阴极射线管(Cathode Ray Tube,CRT)或者LCD监视器;以及键盘和指向装置,例如,鼠标或者轨迹球,用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈,例如,视觉反馈、听觉反馈、或者触觉反馈;并且可以用任何形式,包括声输入、语音输入或者、触觉输入,来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统,例如,数据服务器,或者实施在包括中间件部件的计算系统,例如,应用服务器、或者实施在包括前端部件的计算系统,例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互,或者实施在包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信,例如,通信网络,来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。
另外,在资质认证场景中,待识别的关键字段与其后相应的信息值具有关联关系,鉴于字段的固定性,可以在确定关键字段区域之后,根据资质样本图像所属资质类别的信息值填充方式,确定关键字段区域关联的信息值区域,以用于识别关键字段区域中的字段,以及识别信息值中的具体填充信息。
另外,鉴于资质样本图像中的字符内容都是独立存在的,因此通过对目标关键字的组合拼接,将与关键字段信息完全匹配的组合字符串所在的区域确定为关键字段区域,提高了关键字段区域的检测准确率,避免任一关键字的识别错误导致关键字段区域的未识别。
另外,在关键字段区域检测的过程中,通过将组合字符串与关键字段信息进行相似度检测,以对关键字段部分匹配成功即缺少字符的组合字符串进行位置补全处理,以得到完整的关键字段区域,避免任一关键字的识别错误导致关键字段区域的未识别。
另外,基于确定的关键字段区域,结合关键字段对应的信息值的位置及样式特点,能够检测到关键字段区域关联的信息值区域。
另外,在资质识别模板构建过程中,鉴于资质证书中存在信息值打印偏移的情况,可以利用资质证书中的空白位置,估算出信息值的最大区域,以提高信息值的提取率。
另外,在资质识别模板构建过程中,每一个资质样本图像都可以抽取构建得到一个候选资质识别模板,由于众多资质样本图像同属于同一类型资质,因此通过不同候选资质识别模板之间相似度的检测以及相似候选资质识别模板的合并,可以得到一类资质下的至少一个最优资质识别模板。
另外,通过对不同候选资质识别模板中的待识别区域进行逐一比对,能够找到模板中待识别区域均相似的至少两个候选资质识别模板,以进行相似模板合并。
另外,在相似模板合并之前,过滤去除关键字段检测不全的候选资质识别模板,以减少相似模板合并的计算量。
另外,在资质认证的资质信息检测过程中,通过选择形状及位置最佳的目标资质识别模板,从而利用目标资质识别模板从待识别资质图像中确定资质信息区域,能够从资质信息区域中快速识别出资质图像信息,避免了待识别资质图像中内容的全部遍历,提高了资质图像信息提取效率和准确率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (12)

1.一种资质识别模板构建方法,其特征在于,包括:
对资质样本图像进行字符识别,得到字符内容和字符位置信息;
基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域;
根据所述关键字段区域和所述信息值区域,构建资质识别模板,包括:
从所述资质样本图像中抽取所述关键字段区域和所述信息值区域,得到候选资质识别模板;
根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并,得到所述资质样本图像所属资质类别的资质识别模板。
2.根据权利要求1所述的方法,其特征在于,所述基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域,包括:
基于所述字符内容和所述字符位置信息,根据关键字段信息进行关键字匹配,确定所述资质样本图像中的关键字段区域;
根据所述关键字段区域,以及所述资质样本图像所属资质类别的信息值填充方式,确定所述关键字段区域关联的信息值区域。
3.根据权利要求2所述的方法,其特征在于,所述基于所述字符内容和所述字符位置信息,根据关键字段信息进行关键字匹配,确定所述资质样本图像中的关键字段区域,包括:
将所述关键字段信息与所述字符内容进行匹配,得到所述资质样本图像中相匹配的目标关键字;
根据所述资质样本图像中字符之间的相对位置,对所述目标关键字进行组合,得到组合字符串;
根据所述组合字符串和所述字符位置信息,确定所述资质样本图像中的关键字段区域。
4.根据权利要求3所述的方法,其特征在于,所述根据所述组合字符串和所述字符位置信息,确定所述资质样本图像中的关键字段区域,包括:
确定所述组合字符串与所述关键字段信息之间的匹配度;
若根据所述匹配度以及匹配度阈值,检测到所述组合字符串与所述关键字段信息部分匹配成功,则根据所述资质样本图像所属资质类别的排版规则,确定所述组合字符串中所缺失的字符的位置;
根据所述组合字符串中的字符位置信息,以及所述组合字符串中所缺失的字符的位置,确定所述资质样本图像中的关键字段区域。
5.根据权利要求2所述的方法,其特征在于,所述根据所述关键字段区域,以及所述资质样本图像所属资质类别的信息值填充方式,确定所述关键字段区域关联的信息值区域,包括:
根据所述资质样本图像所属资质类别中字段与信息值之间的相对位置关系,确定所述关键字段区域关联的候选信息值;
根据所述关键字段区域与所述候选信息值的字符大小,从所述候选信息值中确定目标信息值;
根据所述目标信息值和所述字符位置信息,确定所述信息值区域。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标信息值和所述字符位置信息,确定所述信息值区域,包括:
将所述目标信息值所在的区域,以及与所述目标信息值相邻的至少一行资质样本图像区域,确定为所述信息值区域。
7.根据权利要求1所述的方法,其特征在于,所述根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并,包括:
若检测到至少两个候选资质识别模板的待识别区域之间的交并比大于交并比阈值,则确定所述至少两个候选资质识别模板中的待识别区域相似;其中,所述待识别区域包括关键字段区域和信息值区域;
若所述至少两个候选资质识别模板中的待识别区域均相似,则将所述至少两个候选资质识别模板合并。
8.根据权利要求1所述的方法,其特征在于,在所述根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并之前,还包括:
若根据关键字段信息,检测到所述候选资质识别模板中缺少任一关键字段的关键字段区域,则去除所述候选资质识别模板。
9.根据权利要求1所述的方法,其特征在于,在所述根据所述关键字段区域和所述信息值区域,构建资质识别模板之后,还包括:
将待识别资质图像与所述资质识别模板进行匹配,从所述资质识别模板中,选择所述待识别资质图像的目标资质识别模板;
将所述目标资质识别模板中的待识别区域,向所述待识别资质图像映射,得到资质信息区域;其中,所述待识别区域包括关键字段区域和信息值区域;
对所述资质信息区域进行字符识别,得到资质图像信息,用于资质认证。
10.一种资质识别模板构建装置,其特征在于,包括:
字符识别模块,用于对资质样本图像进行字符识别,得到字符内容和字符位置信息;
区域确定模块,用于基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域;
模板构建模块,用于根据所述关键字段区域和所述信息值区域,构建资质识别模板;
所述模板构建模块,具体用于:
从所述资质样本图像中抽取所述关键字段区域和所述信息值区域,得到候选资质识别模板;
根据至少两个候选资质识别模板之间的相似度,对所述候选资质识别模板进行合并,得到所述资质样本图像所属资质类别的资质识别模板。
11. 一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的资质识别模板构建方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的资质识别模板构建方法。
CN202010033391.2A 2020-01-13 2020-01-13 资质识别模板构建方法、装置、设备和存储介质 Active CN111209909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010033391.2A CN111209909B (zh) 2020-01-13 2020-01-13 资质识别模板构建方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010033391.2A CN111209909B (zh) 2020-01-13 2020-01-13 资质识别模板构建方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111209909A CN111209909A (zh) 2020-05-29
CN111209909B true CN111209909B (zh) 2023-08-18

Family

ID=70790104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010033391.2A Active CN111209909B (zh) 2020-01-13 2020-01-13 资质识别模板构建方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111209909B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011254B (zh) * 2021-02-04 2023-11-07 腾讯科技(深圳)有限公司 一种视频数据处理方法、计算机设备及可读存储介质
CN113485618A (zh) * 2021-07-05 2021-10-08 上海商汤临港智能科技有限公司 自定义识别模板的生成方法、证件的识别方法以及装置
CN113934384B (zh) * 2021-09-26 2024-02-09 金蝶软件(中国)有限公司 数据渲染方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6687404B1 (en) * 1997-06-20 2004-02-03 Xerox Corporation Automatic training of layout parameters in a 2D image model
CN108052491A (zh) * 2017-11-22 2018-05-18 李晓妮 一种证件文档的自动处理方法和装置
CN109325414A (zh) * 2018-08-20 2019-02-12 阿里巴巴集团控股有限公司 证件信息的提取方法、装置和文本信息的提取方法
CN109492643A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 基于ocr的证件识别方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6687404B1 (en) * 1997-06-20 2004-02-03 Xerox Corporation Automatic training of layout parameters in a 2D image model
CN108052491A (zh) * 2017-11-22 2018-05-18 李晓妮 一种证件文档的自动处理方法和装置
CN109325414A (zh) * 2018-08-20 2019-02-12 阿里巴巴集团控股有限公司 证件信息的提取方法、装置和文本信息的提取方法
CN109492643A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 基于ocr的证件识别方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111209909A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
US20210201182A1 (en) Method and apparatus for performing structured extraction on text, device and storage medium
JP7299939B2 (ja) テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
CN111753727B (zh) 用于提取结构化信息的方法、装置、设备及可读存储介质
EP3437019B1 (en) Optical character recognition in structured documents
CN111209909B (zh) 资质识别模板构建方法、装置、设备和存储介质
JP6938228B2 (ja) 計算機、文書識別方法、及びシステム
US10127199B2 (en) Automatic measure of visual similarity between fonts
CN107885430B (zh) 一种音频播放方法、装置、存储介质及电子设备
CN105930159A (zh) 一种基于图像的界面代码生成的方法及系统
CN111507354B (zh) 信息抽取方法、装置、设备以及存储介质
CN114332887A (zh) 一种图像处理方法、装置、计算机设备和存储介质
CN111753717B (zh) 用于提取文本的结构化信息的方法、装置、设备及介质
CN113343740B (zh) 表格检测方法、装置、设备和存储介质
US20200387553A1 (en) Digitization of technical documentation driven by machine learning
EP3855353A2 (en) Image table extraction method and apparatus, electronic device, and storage medium
CN111415298B (zh) 图像拼接方法、装置、电子设备及计算机可读存储介质
JP7389824B2 (ja) オブジェクト識別方法と装置、電子機器及び記憶媒体
CN113627439A (zh) 文本结构化处理方法、处理装置、电子设备以及存储介质
US10614125B1 (en) Modeling and extracting elements in semi-structured documents
CN111985459A (zh) 表格图像校正方法、装置、电子设备和存储介质
CN112749576B (zh) 图像识别方法和装置、计算设备以及计算机存储介质
US10509986B2 (en) Image similarity determination apparatus and image similarity determination method
JP2020087112A (ja) 帳票処理装置および帳票処理方法
US20220044048A1 (en) System and method to recognise characters from an image
WO2021151274A1 (zh) 图像文档处理方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant