CN112818852A - 印章校验方法、装置、设备及存储介质 - Google Patents

印章校验方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112818852A
CN112818852A CN202110137872.2A CN202110137872A CN112818852A CN 112818852 A CN112818852 A CN 112818852A CN 202110137872 A CN202110137872 A CN 202110137872A CN 112818852 A CN112818852 A CN 112818852A
Authority
CN
China
Prior art keywords
seal
character
stamp
result
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110137872.2A
Other languages
English (en)
Inventor
冯晓锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eye Control Technology Co Ltd
Original Assignee
Shanghai Eye Control Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eye Control Technology Co Ltd filed Critical Shanghai Eye Control Technology Co Ltd
Priority to CN202110137872.2A priority Critical patent/CN112818852A/zh
Publication of CN112818852A publication Critical patent/CN112818852A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明实施例公开了一种印章校验方法、装置、设备及存储介质。包括:从数据表单对应的图像中提取印章区域;对所述印章区域进行字符分割,获得印章包含的字符块;对所述印章包含的字符块分别进行字符识别,获得识别结果;将所述识别结果与所述数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。本发明实施例提供的印章校验方法,对印章进行字符分割后再进行字符识别,可以提高字符识别的准确性,从而可以印章校验的效率。

Description

印章校验方法、装置、设备及存储介质
技术领域
本发明实施例涉及印章识别技术领域,尤其涉及一种印章校验方法、装置、设备及存储介质。
背景技术
目前,常见的数据表单中都会出现印章,其中,红章最为常见。校验数据表单中的关键内容和印章中的信息是否一致非常重要。
相关技术中,在印章识别时,一方面会借助像素多颜色空间特征,使用支持向量机(Support Vector Machine,SVM)进行分类,该方法需要预先训练SVM模型,且需要计算各个颜色空间的特征;另一方面会借助分割算法,得到红章区域。这两种方法一方面会耗时较大,另一方面依赖于模型的准确率,并且需要人工处理训练数据。
发明内容
本发明实施例提供一种印章校验方法、装置、设备及存储介质,可以提高印章校验的效率。
第一方面,本发明实施例提供了一种印章校验方法,包括:
从数据表单对应的图像中提取印章区域;
对所述印章区域进行字符分割,获得印章包含的字符块;其中,所述字符块包括定位结果和类别结果;
对所述印章包含的字符块分别进行字符识别,获得识别结果;
将所述识别结果与所述数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
进一步地,对所述印章区域进行字符分割,获得印章包含的字符块,包括:
将所述印章区域输入设定字符分割模型中,获得各字符块的定位结果及类别结果;其中,定位结果为字符所在字符块的中心位置,类别结果用于表征字符的序号。
进一步地,从数据表单对应的图像中提取印章区域,包括:
将数据表单对应的图像转换为二值图;
根据所述二值图提取前景区域,所述前景区域包括印章;
根据所述前景区域各像素点的坐标信息及颜色空间特征从数据表单对应的图像中提取印章;
确定所述印章的第一外接矩形,获得印章区域;
其中,所述印章区域为所述第一外接矩形包含的区域。
进一步地,在对所述印章包含的字符块分别进行字符识别,获得识别结果之前,还包括:
获取所述印章对应的第二外接矩形;
根据所述第二外接矩形对所述印章进行矫正。
进一步地,根据所述印章的第二外接矩形对所述印章进行矫正,包括:
若所述印章的第二外接矩形为长方形,则旋转所述印章区域,使得所述第二外接矩形的长边与水平方向平行,短边与竖直方向平行;
若所述印章的第二外接矩形为正方形,则根据相邻字符块的距离确定目标文本;
根据所述目标文本包含的字符个数确定印章当前中心线方向;
根据所述当前中心线方向和所述竖直方向确定旋转角度;
根据所述旋转角度旋转所述印章区域,使得所述当前中心线方向和所述竖直方向平行。
进一步地,在旋转所述印章区域之后,还包括:
获取旋转后的印章中类别结果为设定类别的字符块的定位信息;
根据所述定位信息判断旋转后的印章是否倒置;
若所述印章倒置,则继续将印章旋转180度。
进一步地,对所述印章包含的字符分别进行字符识别,获得识别结果,包括:
将各字符块分别进行旋转,以矫正各字符;
将矫正的字符按照所述类别结果依次输入设定分类模型,获得识别结果。
进一步地,若所述识别结果与所述数据表单中的关键信息的比对结果为不一致,则基于矫正后的印章返回执行对所述印章包含的字符块分别进行字符识别的操作;
若比对结果仍为不一致,则产生提醒信息,以提示进行人工校验。
第二方面,本发明实施例还提供了一种印章校验装置,包括:
印章区域提取模块,用于从数据表单对应的图像中提取印章区域;
字符分割模块,用于对所述印章区域进行字符分割,获得印章包含的字符块;其中,所述字符块包括定位结果和类别结果。
识别结果获取模块,用于对所述印章包含的字符块分别进行字符识别,获得识别结果;
校验模块,用于将所述识别结果与所述数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例所述的印章校验方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所述的印章校验方法。
本发明实施例公开了一种印章校验方法、装置、设备及存储介质。从数据表单对应的图像中提取印章区域;对印章区域进行字符分割,获得印章包含的字符块;对印章包含的字符块分别进行字符识别,获得识别结果;将识别结果与数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。本发明实施例提供的印章校验方法,对印章进行字符分割后再进行字符识别,可以提高字符识别的准确性,从而可以印章校验的效率。
附图说明
图1是本发明实施例一中的一种印章校验方法的流程图;
图2是本发明实施例一种的印章外接矩形的示例图;
图3是本发明实施例一中的数据表单对应的图像转换的二值图;
图4是本发明实施例二中的一种的印章校验方法的流程图;
图5a是本发明实施例二中矫正正圆形印章的示例图;
图5b是本发明实施例二中的印章矫正后的示例图;
图6是本发明实施例三中的一种的印章校验方法的流程图;
图7是本发明实施例四中的一种印章校验装置的结构示意图;
图8是本发明实施例五中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种印章校验方法的流程图,本实施例可适用于对数据表单中的印章进行校验的情况,该方法可以由印章校验装置来执行,该装置可由硬件和/或软件组成,并一般可集成在具有印章校验功能的设备中。如图1所示,该方法具体包括如下步骤:
步骤110,从数据表单对应的图像中提取印章区域。
其中,数据表单可以理解为合同、票据、公文及报告等正式文档。数据表单对应的图像可以是通过对盖章后的正式文档进行扫描或者拍照获得的。印章的类别可以包括:1、圆形红章,上弧为单位,中央嵌入镰刀、锤子、五角星,有时下方还会出现编号;2、圆形红章,上弧为单位,专用章内容放在章的下边作横排;3、椭圆形红章,企业名称自左而右环行,或自左而右横排。
本实施例中,数据表单对应的图像为彩色图像,印章通常为红色。从数据表单对应的图像中提取印章区域的方式可以是,基于颜色空间特征中红色的取值范围从数据表单对应的图像中提取颜色落入红色取值范围的像素点,这些像素点组成的图像即为印章,并确定印章的第一外接矩形,从而获得印章区域。其中,印章区域可以理解为由第一外接矩形包围印章形成的区域。
其中,第一外接矩形可以理解为可以将印章完全围起来的矩形,且该矩形的横边与水平方向并行,竖边与竖直方向平行。示例性的,如图2所示,椭圆为印章,实线对应的矩形为第一外接矩形,虚线对应的矩形为第二外接矩形,即最小外接矩形。
可选的,从数据表单对应的图像中提取印章区域的方式还可以是:将数据表单对应的图像转换为二值图;根据二值图提取前景区域;根据前景区域各像素点的坐标信息及颜色空间特征从数据表单对应的图像中提取印章;确定印章的第一外接矩形,获得印章区域。
其中,前景区域包括印章以及数据表单中的文字,背景区域为数据表单中的空白区域。印章区域为第一外接矩形包含的区域。示例性的,图3为数据表单对应的图像转换的二值图,如图3所示,在二值化转换过程中,印章对应的像素点会被转换为白色,其他区域的像素点会被转化为黑色。将白色像素点围成的区域提取出来,即为包含印章的前景区域。本实施例中,在获得前景区域后,根据前景区域各像素点的坐标信息对数据表单对应的图像进行截取,基于颜色空间特征中红色(以红章为例)的取值范围从对截取出的图像中提取颜色落入红色取值范围的像素点,从而获得印章,最后确定印章的第一外接矩形,获得印章区域。先根据二值图提取前景区域,然后根据前景区域提取印章区域,可以提高印章提取的效率。
步骤120,对印章区域进行字符分割,获得印章包含的字符块。
其中,所述字符块包括定位结果和类别结果。定位结果为字符块的中心位置,类别结果用于表征字符的序号。本实施例中,对印章区域进行字符分割的方式可以是:将印章区域输入设定字符分割模型中,获得各字符的定位结果及类别结果。
其中,字符的序号可以理解为按照顺时针或者逆时针字符的排序号。例如图3中的印章包含的字符为“福建浩远建设工程有限公司”,若按照顺时针算,“远”的类别为“4”。设定字符分割模型可以是基于psenet分割网络构建的网络。
具体的,设定字符分割模型的训练方式可以是:基于步骤110的方法从多个数据表单样本中分别提取印章区域。基于提取的印章区域构建训练数据,构建的方式是:对印章区域中的字符添加定位信息及类别信息等标签,其中类别信息通过印章内容的顺序确定,即字符的序号。然后对添加标签的印章区域进行旋转、亮度变换等操作,以增加字符分割模型的多样性。最后基于训练样本对字符分割网络进行训练,待模型收敛后,获得设定字符分割模型。
其中,设定字符分割网络可以是psenet网络。需要说明的是,字符块的获取方式可以为,将第一外接矩形包含的印章区域送入psenet网络得到字符级文本定位结果,使用psenet对输入印章图像进行分割,得到每个字符块的定位结果和类别结果,根据其定位结果可以求得每个字符的字符块。
步骤130,对印章包含的字符块分别进行字符识别,获得识别结果。
本实施例中,在对印章区域进行字符分割后,可以将分割后的印章区域输入设定分类模型中进行字符识别,获得识别结果。
步骤140,将识别结果与数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
其中,数据表单的关键信息可以预先存储的信息,或者基于图像识别技术识别出的信息。
本实施例的技术方案,从数据表单对应的图像中提取印章区域;对印章区域进行字符分割,获得印章包含的字符块;对印章包含的字符块分别进行字符识别,获得识别结果;将识别结果与数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。本发明实施例提供的印章校验方法,对印章进行字符分割后再进行字符识别,可以提高字符识别的准确性,从而可以印章校验的效率。
实施例二
图4是本发明实施例二提供的一种的印章校验方法的流程图,以上述实施例为基础,该方法包括如下步骤:
步骤210,从数据表单对应的图像中提取印章区域。
步骤220,对印章区域进行字符分割,获得印章包含的字符块。
步骤230,根据印章的第二外接矩形对印章进行矫正。
其中,第二外接矩形可以理解为印章的最小外接矩形。对印章进行矫正可以理解为使印章以摆正的角度显示。
本实施例中,根据印章的第二外接矩形对印章进行矫正的方式可以是:若印章的第二接矩形为长方形,则旋转印章区域,使得第二外接矩形的长边与水平方向平行,短边与竖直方向平行。
其中,印章的第二外接矩形为长方形,则表明印章为椭圆。
可选的,在旋转印章区域之后,还包括如下步骤:获取旋转后的印章中类别结果为设定类别的字符块的定位结果;根据定位结果判断旋转后的印章是否倒置;若印章倒置,则继续将印章旋转180度。
其中,设定类别可以是序号“1”。具体的,在第二外接矩形的长边与水平方向平行,短边与竖直方向平行之后,还需要根据类别结果为“1”的字符的定位结果来确定印章是否倒置。若字符是按照顺时针排序,则矫正后的印章中类别结果为“1”的字符的定位结果应该在左下角的位置,若类别结果为“1”的字符的位置信息在右下角的位置,则标明印章倒置,需要将印章区域继续旋转180度,获得最终矫正后的印章。
本实施例中,根据印章的最小外接矩形对印章进行矫正的方式可以是:若印章的最小外接矩形为正方形,则根据相邻字符块的距离确定目标文本;根据目标文本包含的字符个数确定印章当前中心线方向;根据当前中心线方向和竖直方向确定旋转角度;根据旋转角度旋转印章区域,使得当前中心线方向和竖直方向平行。其中,根据每个字符块的定位结果得到每个字符块的中心点,以相邻中心点的距离确定为所述相邻字符块的距离。
优选的,印章的最小外接矩形为正方形,则表明印章为圆形。根据相邻字符块的距离确定目标文本的方式可以是,将相邻字符块的距离均小于设定长度的字符划分为一组,若印章中包含两组或两组以上字符,则将字符个数最多的一组确定为目标文本。本实施例中,目标文本中各字符对应的字符块中点可以连接为一条弧线或者直线,将弧线或者直线的中点与印章中心点相连,获得印章当前中心线方向。当前中心线方向和竖直方向之间的夹角为旋转角度,将印章区域向竖直方向旋转确定出的旋转角度,获得矫正后的印章。示例性的,图5a-图5b为本实施例中矫正正圆形印章的示例图。如图5a所示,根据相邻字符块的距离确定的目标文本为“某某某科技股份有限公司”,该目标文本的中点为“股”字所在字符块的中点,将该中点与圆形章的中点相连获得当前中心线,当前中心线与竖直线的夹角为旋转角度,将图5a的印章顺时针旋转该角度,获得图5b矫正后的印章。
可选的,在旋转印章区域之后,还包括如下步骤:获取旋转后的印章中类别结果为设定类别的字符块的定位结果;根据定位结果判断旋转后的印章是否倒置;若印章倒置,则继续将印章旋转180度。
其中,设定类别可以是序号“1”。具体的,圆形印章矫正后,还需要根据类别结果为“1”的字符的定位结果来确定印章是否倒置。若字符是按照顺时针排序,则矫正后的印章中类别结果为“1”的字符的位置信息在左下角的位置,若类别结果为“1”的字符的位置信息在右下角的位置,则表面该印章倒置,需要继续将印章区域继续旋转180度,获得最终矫正后的印章。
步骤240,对印章包含的字符块分别进行字符识别,获得识别结果。
步骤250,将识别结果与数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
可选的,若识别结果与数据表单中的关键信息的比对结果为不一致,则基于矫正后的印章返回执行对印章包含的字符分别进行字符识别,获得识别结果的操作;
若比对结果仍为不一致,则产生提醒信息,以提示进行人工校验。
本实施例的技术方案,根据印章的最小外接矩形对印章进行矫正,对矫正后的印章包含的字符分别进行字符识别,获得识别结果。先对印章进行矫正然后再字符识别,可以提高字符识别的准确性。
实施例三
图6是本发明实施例三提供的一种的印章校验方法的流程图,以上述实施例为基础,该方法包括如下步骤:
步骤410,从数据表单对应的图像中提取印章区域。
步骤420,对印章区域进行字符分割,获得印章包含的字符块。
步骤430,根据印章的第二外接矩形对印章进行矫正。
步骤440,将各字符块分别进行旋转,以矫正各字符。
其中,矫正字符可以理解为使字符以摆正的角度显示。具体的,将各字符所在的字符块分别进行旋转,以矫正各字符的方式可以是:对于每个字符,控制字符对应的字符块旋转,使得字符的中心线与竖直方向平行。
步骤450,将矫正的字符按照类别结果依次输入设定分类模型,获得识别结果。
其中,分类模型的训练方式可以是:收集印章中的单个字符的分割结果作为训练数据集,并使用数据拓增方式增加训练数据的多样性。采用拓增后的训练数据迭代训练分类模型,待分类模型收敛后,训练结束。
根据矫正后的字符按照类别结果一次输入设定分类模型中,取得分最高的类别作为第一识别结果。将第一识别结果按照pasenet的类别信息标签,将所有的类别结果进行合并得到第二识别结果,所述第二识别结果为最终的识别结果。
本实施例中,基于分类模型实现字符识别,可以提高字符识别的准确性。
步骤460,将识别结果与数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
其中,关键信息可以是数据表单对应的单位或者公司名称等,以图3为例,数据表单的关键信息可以是“浩远建设”。
本实施例的技术方案,将各字符所在的字符块分别进行旋转,以矫正各字符,将矫正的字符按照类别结果依次输入设定分类模型,获得识别结果。对字符矫正后再进行识别,可以提高识别准确率。
实施例四
图7是本发明实施例四提供的一种印章校验装置的结构示意图。如图7所示,该装置包括:
印章区域提取模块510,用于从数据表单对应的图像中提取印章区域;
字符分割模块520,用于对印章区域进行字符分割,获得印章包含的字符块;
识别结果获取模块530,用于对印章包含的字符块分别进行字符识别,获得识别结果;
校验模块540,用于将识别结果与数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
可选的,字符分割模块520,还用于:
将印章区域输入设定字符分割模型中,获得各字符块的定位结果及类别结果;其中,定位结果为字符所在字符块的中心位置,类别结果用于表征字符的序号。
可选的,印章区域提取模块510,还用于:
将数据表单对应的图像转换为二值图;
根据二值图提取前景区域,前景区域包括印章;
根据前景区域各像素点的坐标信息及颜色空间特征从数据表单对应的图像中提取印章;
确定印章的第一外接矩形,获得印章区域;印章区域为第一外接矩形包含的区域。
可选的,还包括:矫正模块,用于:
获取所述印章对应的第二外接矩形;
根据第二外接矩形对印章进行矫正。
可选的,矫正模块,还用于:
若印章的第二外接矩形为长方形,则旋转印章区域,使得第二外接矩形的长边与水平方向平行,短边与竖直方向平行;
若印章的第二外接矩形为正方形,则根据相邻字符的距离确定目标文本;
根据目标文本包含的字符个数确定印章当前中心线方向;
根据当前中心线方向和竖直方向确定旋转角度;
根据旋转角度旋转印章区域,使得当前中心线方向和竖直方向平行。
可选的,识别结果获取模块530,还用于:
将各字符块分别进行旋转,以矫正各字符;
将矫正的字符按照类别结果依次输入设定分类模型,获得识别结果。
可选的,校验模块540,还用于:若识别结果与数据表单中的关键信息的比对结果为不一致,则基于矫正后的印章返回执行对印章包含的字符分别进行字符识别,获得识别结果的操作;
若比对结果仍为不一致,则产生提醒信息,以提示进行人工校验。
上述装置可执行本发明前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明前述所有实施例所提供的方法。
实施例五
图8为本发明实施例五提供的一种计算机设备的结构示意图。图8示出了适于用来实现本发明实施方式的计算机设备312的框图。图8显示的计算机设备312仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备312是典型的印章校验功能的计算设备。
如图8所示,计算机设备312以通用计算设备的形式表现。计算机设备312的组件可以包括但不限于:一个或者多个处理器316,存储装置328,连接不同系统组件(包括存储装置328和处理器316)的总线318。
总线318表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备312典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备312访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置328可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)330和/或高速缓存存储器332。计算机设备312可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统334可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线318相连。存储装置328可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块326的程序336,可以存储在例如存储装置328中,这样的程序模块326包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块326通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备312也可以与一个或多个外部设备314(例如键盘、指向设备、摄像头、显示器324等)通信,还可与一个或者多个使得用户能与该计算机设备312交互的设备通信,和/或与使得该计算机设备312能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口322进行。并且,计算机设备312还可以通过网络适配器320与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器320通过总线318与计算机设备312的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备312使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器316通过运行存储在存储装置328中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的印章校验方法。
实施例六
本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理装置执行时实现如本发明实施例中的印章校验方法。
本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:从数据表单对应的图像中提取印章区域;对所述印章区域进行字符分割,获得印章包含的字符块;对所述印章包含的字符块分别进行字符识别,获得识别结果;将所述识别结果与所述数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种印章校验方法,其特征在于,包括:
从数据表单对应的图像中提取印章区域;
对所述印章区域进行字符分割,获得印章包含的字符块;其中,所述字符块包括定位结果和类别结果;
对所述印章包含的字符块分别进行字符识别,获得识别结果;
将所述识别结果与所述数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
2.根据权利要求1所述的方法,其特征在于,对所述印章区域进行字符分割,获得印章包含的字符块,包括:
将所述印章区域输入设定字符分割模型中,获得各字符块的定位结果及类别结果;其中,定位结果为字符所在字符块的中心位置,类别结果用于表征字符的序号。
3.根据权利要求1所述的方法,其特征在于,从数据表单对应的图像中提取印章区域,包括:
将所述数据表单对应的图像转换为二值图;
根据所述二值图提取前景区域,所述前景区域包括印章;
根据所述前景区域各像素点的坐标信息及颜色空间特征从所述数据表单对应的图像中提取印章;
确定所述印章的第一外接矩形,获得印章区域;
其中,所述印章区域为所述第一外接矩形包含的区域。
4.根据权利要求1所述的方法,其特征在于,在对所述印章包含的字符块分别进行字符识别,获得识别结果之前,还包括:
获取所述印章对应的第二外接矩形;
根据所述第二外接矩形对所述印章进行矫正。
5.根据权利要求4所述的方法,其特征在于,根据所述印章的第二外接矩形对所述印章进行矫正,包括:
若所述印章的第二外接矩形为长方形,则旋转所述印章区域,使得所述第二外接矩形的长边与水平方向平行,短边与竖直方向平行;
若所述印章的第二外接矩形为正方形,则根据相邻字符块的距离确定目标文本;
根据所述目标文本包含的字符个数确定印章当前中心线方向;
根据所述当前中心线方向和所述竖直方向确定旋转角度;
根据所述旋转角度旋转所述印章区域,使得所述当前中心线方向和所述竖直方向平行。
6.根据权利要求1所述的方法,其特征在于,对所述印章包含的字符分别进行字符识别,获得识别结果,包括:
将各字符块分别进行旋转,以矫正各字符;
将矫正的字符按照所述类别结果依次输入设定分类模型,获得识别结果。
7.根据权利要求1-6任一所述的方法,其特征在于,若所述识别结果与所述数据表单中的关键信息的比对结果为不一致,则基于矫正后的印章返回执行对所述印章包含的字符块分别进行字符识别的操作;
若比对结果仍为不一致,则产生提醒信息,以提示进行人工校验。
8.一种印章校验装置,其特征在于,包括:
印章区域提取模块,用于从数据表单对应的图像中提取印章区域;
字符分割模块,用于对所述印章区域进行字符分割,获得印章包含的字符块;其中,所述字符块包括定位结果和类别结果;
识别结果获取模块,用于对所述印章包含的字符块分别进行字符识别,获得识别结果;
校验模块,用于将所述识别结果与所述数据表单中的关键信息进行比对,若比对结果为一致,则校验通过。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的印章校验方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的印章校验方法的步骤。
CN202110137872.2A 2021-02-01 2021-02-01 印章校验方法、装置、设备及存储介质 Pending CN112818852A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110137872.2A CN112818852A (zh) 2021-02-01 2021-02-01 印章校验方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110137872.2A CN112818852A (zh) 2021-02-01 2021-02-01 印章校验方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112818852A true CN112818852A (zh) 2021-05-18

Family

ID=75861226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110137872.2A Pending CN112818852A (zh) 2021-02-01 2021-02-01 印章校验方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112818852A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269102A (zh) * 2021-05-28 2021-08-17 中邮信息科技(北京)有限公司 一种印章信息识别方法、装置、计算机设备和存储介质
CN113378821A (zh) * 2021-07-02 2021-09-10 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质
CN116757886A (zh) * 2023-08-16 2023-09-15 南京尘与土信息技术有限公司 数据分析方法及分析装置
CN117037190A (zh) * 2023-10-10 2023-11-10 北京惠朗时代科技有限公司 一种基于数据分析的印章识别管理系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269102A (zh) * 2021-05-28 2021-08-17 中邮信息科技(北京)有限公司 一种印章信息识别方法、装置、计算机设备和存储介质
CN113378821A (zh) * 2021-07-02 2021-09-10 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质
CN116757886A (zh) * 2023-08-16 2023-09-15 南京尘与土信息技术有限公司 数据分析方法及分析装置
CN116757886B (zh) * 2023-08-16 2023-11-28 南京尘与土信息技术有限公司 数据分析方法及分析装置
CN117037190A (zh) * 2023-10-10 2023-11-10 北京惠朗时代科技有限公司 一种基于数据分析的印章识别管理系统
CN117037190B (zh) * 2023-10-10 2023-12-15 北京惠朗时代科技有限公司 一种基于数据分析的印章识别管理系统

Similar Documents

Publication Publication Date Title
CN108229299B (zh) 证件的识别方法和装置、电子设备、计算机存储介质
CN112818852A (zh) 印章校验方法、装置、设备及存储介质
CN110942074B (zh) 字符切分识别方法、装置、电子设备、存储介质
US10163007B2 (en) Detecting orientation of textual documents on a live camera feed
US11017498B2 (en) Ground truth generation from scanned documents
US20230045715A1 (en) Text detection method, text recognition method and apparatus
CN114724133B (zh) 文字检测和模型训练方法、装置、设备及存储介质
CN111209856B (zh) 发票信息的识别方法、装置、电子设备及存储介质
CN112396032A (zh) 书写检测方法、装置、存储介质及电子设备
WO2020175806A1 (ko) 글자 인식 장치 및 이에 의한 글자 인식 방법
CN111414889B (zh) 基于文字识别的财务报表识别方法及装置
CN113283445A (zh) 一种图像处理方法、装置和计算机设备
CN109141457B (zh) 导航评估方法、装置、计算机设备和存储介质
CN111291758B (zh) 用于识别印章文字的方法和装置
CN113128496B (zh) 一种从图像中提取结构化数据的方法、装置和设备
CN114429628A (zh) 图像处理方法、装置、可读存储介质及电子设备
CN114049646A (zh) 一种银行卡识别方法、装置、计算机设备及存储介质
CN112966671A (zh) 一种合同检测方法、装置、电子设备及存储介质
CN114049686A (zh) 签名识别模型训练方法、装置及电子设备
CN112801960A (zh) 图像处理方法及装置、存储介质、电子设备
CN111476090A (zh) 水印识别方法和装置
WO2020000966A1 (zh) 无线访问接入点信息的生成方法、设备和计算机可读介质
CN112434698A (zh) 字符识别方法、装置、电子设备及存储介质
CN111383193A (zh) 图像修复方法和装置
CN115273113B (zh) 表格类文本语义识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination