CN113076795A - 一种带印章的表格协议书图像自动审核方法 - Google Patents

一种带印章的表格协议书图像自动审核方法 Download PDF

Info

Publication number
CN113076795A
CN113076795A CN202110174219.3A CN202110174219A CN113076795A CN 113076795 A CN113076795 A CN 113076795A CN 202110174219 A CN202110174219 A CN 202110174219A CN 113076795 A CN113076795 A CN 113076795A
Authority
CN
China
Prior art keywords
image
seal
preset
contents
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110174219.3A
Other languages
English (en)
Inventor
曹菁
李育
韩宇
张秋彤
瞿兴晨
熊一定
陈康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu United Credit Reference Co ltd
Original Assignee
Jiangsu United Credit Reference Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu United Credit Reference Co ltd filed Critical Jiangsu United Credit Reference Co ltd
Priority to CN202110174219.3A priority Critical patent/CN113076795A/zh
Publication of CN113076795A publication Critical patent/CN113076795A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种带印章的表格协议书图像自动审核方法,包括以下步骤:S1:判定原始图像是否含有印章且位置正确,如满足继续进行文字识别;S2:根据预先设置的文本检测算法SegLink确定文本框位置,然后使用预先设置的文字识别算法CRNN识别文本内容;S3:对能够检测到关键字的图像再根据文本框的角度进行微调,至表格横向框线处于水平位置,然后识别表格所有单元格内容,判断是否完备;S4:对于不满足以上任意一个条件的图像判为内容不完备,并不通过审核;S5:比对识别出的单元格内容和预设值是否相同,若相同,通过卷积神经网络识别,作极坐标变换,再比对其预设内容是否一致,若一致,则判断为通过审核,本发明解决现有的人工审核低效、费时的问题。

Description

一种带印章的表格协议书图像自动审核方法
技术领域
本发明涉及文字识别和图像识别技术领域,具体涉及一种带印章的表格协议书图像自动审核方法。
背景技术
在企业征信信息授权的过程中,协议书是十分重要的且具备法律效力的契约性文书,在现有的征信体系下,在国有综合征信平台上进行企业注册需要按照模板填写并提交加盖公司印章的协议书,由相关部门负责人核实企业名称、企业法人、联系电话、公司印章等信息,同一省份不同地级市下属的企业数量庞大,因此协议书审核的工作量相应变大,继续使用人工方式会出现效率低下且审核时间过长等问题,结合文字识别和印章识别技术,直接根据图像完成协议书内容审核,极大程度缩短了时间开销以及减少了人力成本。
发明内容
为解决上述问题,本发明公开了一种带印章的表格协议书图像自动审核方法,所述方法包括以下步骤:
S1:根据预设的印章颜色、形状和位置判定原始图像是否含有印章且位置正确,如满足条件则,继续对协议书进行文字识别;
S2:根据预先设置的文本检测算法SegLink确定文本框位置,然后使用预先设置的文字识别算法CRNN识别文本内容,根据文本内容是否包含协议书中数据项的标题输出结果,对于未识别到关键字的结果,考虑到图像采集方式不同造成识别结果不理想,本方法采用多次重复识别确保识别效果最佳,根据文本内容是否包含定义的内容关键字,如果其不包含预定义的内容关键字,可能是因为图像位置不正,则对图像进行不超过三次的90度旋转,直到能够识别到关键字;
S3:对能够检测到关键字的图像再根据文本框的角度进行微调,至表格横向框线处于水平位置,然后识别表格所有单元格内容,根据预设规则识别表格必填项的名称和内容,判断是否完备;
S4:对于不满足以上任意一个条件的图像判为内容不完备,并不通过审核;
S5:对内容完备的表格进行正确性检查,包括比对识别出的单元格内容和预设值是否相同,若相同,则通过yolov3卷积神经网络识别并截取印章,作极坐标变换,再通过预设的文字识别模型获取印章内容,比对其预设内容是否一致,若一致,则判断为通过审核。
作为本发明的一种改进,所述S1中首先对整张图像进行颜色检测,筛选出不含印章的图像,对于满足情况的图像,对图像截半后进行二次颜色检测,判断印章是否在指定区域,然后根据红色或蓝色对应的印章类型最终确定进入下一步审核的图像。
作为本发明的一种改进,所述S1中颜色检测将图由RGB模型改为HSV模型,其中H表示色调,S表示饱度,V表示亮度,相比于常用的RGB,HSV模型更符合人描述和解释颜色的方式,根据红色和蓝色的取值范围,确定图像中是否包含红色和蓝色的区域。
作为本发明的一种改进,所述红色取值范围为H(156-180)、S(43-255)、V(46-255),蓝色的取值范围为H(0-10)、S(43-255)、V(46-255),像素点阈值为100。
作为本发明的一种改进,所述S1中所述协议书印章颜色为红色或蓝色,包括圆形红色的公司印章以及方形蓝色的法人印章,另外根据协议书模板,重要信息包括基本信息以及印章集中在上半部分,下半部分为协议条款,不属于需要检测的范围,所以截取图像上半部分,根据预设的印章颜色、形状和位置判定原始图像是否含有印章且位置正确。
作为本发明的一种改进,协议书图像采集方式为拍照或扫描录入,在进行最终文字识别之前根据检测算法SegLink输出的文本框角度,利用旋转算法进行对图像进行调整。
作为本发明的一种改进,超过100个像素点则表示图像中包含有红色或蓝色的区域。
本发明的有益效果是:本发明提供的带印章的表格协议书图像的自动审核方法,结合文字识别和印章识别技术,实现表格内容完备性检测(是否包含印章,表格内容是否填写完整),识别表格文字内容以及印章文字内容,然后根据规则完成协议书审核,在短时间内审核十万级的图像,解决现有的人工审核低效、费时的实际问题。
附图说明
图1为本发明所述的审核方法流程图。
图2为运用yolov3卷积神经网络识别网络结构示意图。
图3为运用文字识别网络结构示意图。
图4为协议书模板图像示例图。
图5为文字识别神经网络的输出数据的示意图。
图6为印章识别神经网络的训练流程示意图。
图7为印章识别神经网络的输出数据示意图。
图8为极坐标变换后圆形印章示意图。
具体实施方式
下面结合附图1-8和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
实施例:如图1所示,所述方法包括以下步骤:
S1:根据预设的印章颜色、形状和位置判定原始图像是否含有印章且位置正确,如满足条件则,继续对协议书进行文字识别;
S2:根据预先设置的文本检测算法SegLink确定文本框位置,然后使用预先设置的文字识别算法CRNN识别文本内容,根据文本内容是否包含定义的内容关键字,如果其不包含预定义的内容关键字,则对图像进行不超过三次的90度旋转,直到能够识别到关键字;
S3:对能够检测到关键字的图像再根据文本框的角度进行微调,至表格横向框线处于水平位置,然后识别表格所有单元格内容,根据预设规则识别表格必填项的名称和内容,判断是否完备;
S4:对于不满足以上任意一个条件的图像判为内容不完备,并不通过审核;
S5:对内容完备的表格进行正确性检查,包括比对识别出的单元格内容和预设值是否相同,若相同,则通过yolov3卷积神经网络识别并截取印章,作极坐标变换,再通过预设的文字识别模型获取印章内容,比对其预设内容是否一致,若一致,则判断为通过审核。
如图4所示,示例性的示出了原始图像(协议书模板图像)的一个具体实例,其中包括的信息有:协议书标题、授权企业名称、统一社会信用代码、法定代表人姓名、法定代表人联系电话、企业印章签章处、日期等企业信息,根据现有的技术完全可以替代人工审核方式,应用本方法实现自动审核。其中,公司印章形状规定为红色或蓝色圆形,根据协议书模板,重要信息包括基本信息以及印章集中在上半部分,下半部分为协议条款,不属于需要检测的范围,所以截取图像上半部分,然后根据预设的印章颜色、形状和位置判定原始图像是否含有印章且位置正确。
由于协议书图片为人工拍摄上传,必然存在文本框多方向性的问题,所以采用一种可以检测任意角度文本的检测算法SegLink,将原来的四个参数(x,y,w,h),参数x,y,w,h分别指中心点横坐标、中心点纵坐标、矩形宽度、矩形高度,指定一个目标的位置替换为五个参数(x,y,w,h,θ),这个θ表示文本框的旋转角度,具体网络结构如图2所示,以VGG16作为骨干网络,将其中的全连接层(fc6,fc7)替换成卷积层(conv6,conv7),后面再加上4个卷积层(conv8,conv9,conv10,conv11),目的是提取更深的特征,然后将conv4_3,conv7,conv8_2,conv9_2,conv10_2,conv11这6个层的feature map(特征图)拿出来做卷积得到segment(切片)和link(链接),为了做多尺度下的目标检测,即大的feature map擅长做小物体的检测,而小的feature map则擅长检测大物体,conv4到conv11的尺寸依次减少1/2,在segment(切片)检测上,每个feature map(特征图)经过卷积后输出的通道数为7,其中两个表示segment是否为文字的置信度值为(0,1),剩下的五个为segment相对于对应位置的defaultbox的五个偏移量,在link检测中,主要存在两种情况,一种是层内链接检测、另一种是跨层链接检测,其中,层内链接检测表示在同一featuremap中,每一个segment与其相临的8领域内的segment链接情况,而跨层链接用于检测同一文本的segment在不同层被重复检测造成冗余的问题,当所有segment都被检测出来后,通过融合规则,得到最终的文本行。
为了保证识别的准确性,将检测出的文本框根据其角度θ进行调整,然后输出预先设定的文字识别网络进行识别,网络结构如图3所示,网络结构包含三部分,从下到上依次为:卷积层,使用CNN,作用是从输入图像中提取特征序列,循环层,使用RNN,作用是预测从卷积层获取的特征序列的标签(真实值)分布,转录层,使用CTC,作用是把从循环层获取的标签分布通过去重整合等操作转换成最终的识别结果,以上述方法检测出的文本图像为例,输入100*32归一化高度的词条图像,基于7层CNN提取特征图,把特征图按列切分(Map-to-Sequence),每一列的512维特征,输入到两层各256单元的双向LSTM进行分类,在训练过程中,通过CTC损失函数的指导,实现字符位置与类标的近似软对齐,最后输出结果,图5所示为文字识别输出数据的示意图。
具体地,本公开通过特定的深度卷积神经网络模型,能够对圆形印章的外切正方形进行识别。其中,训练图像为多个包含圆形印章的协议书图像,通过人工标注的方式,对每一个样本中圆形印章的位置形如(x,y,w,h),标签(label)等以xml文件的形式保存,本方法采用的模型为yolov3,训练流程图如图6所示,上半部分所示过程是使用卷积神经网络对图片提取特征,随着网络不断向前传播,使用步幅大于1的卷积或者池化,使得特征图的尺寸越来越小,每个像素点会代表更加抽象的特征模式,直到输出特征图,其尺寸减小为原图的1/32,下半部分描述了生成候选区域的过程,首先将原图划分成多个小方块,每个小方块的大小是32×32,然后以每个小方块为中心分别生成一系列锚框,整张图片都会被锚框覆盖到,在每个锚框的基础上产生一个与之对应的预测框,根据锚框和预测框与图片上物体真实框之间的位置关系,即是相交面积的大小,对这些预测框进行标注。最后,将特征图和预测标签建立关联,创建损失函数,开启端到端的训练过程,图7所示为印章识别输出数据示意图。
具体地,利用yolov3印章识别,获取印章中心点的位置坐标(x,y)和半径r,然后将直角坐标系转化为极坐标系,文字转正,文字转正之后二值化图片,分别进行水平和垂直方向的投影,根据投影后黑色像素和白色像素的统计情况,设定阈值判断字符的位置,根据位置坐标,画出矩形框,然后使用预先设定的文字识别模型进行文字识别。
所述S1中首先对整张图像进行颜色检测,筛选出不含印章的图像,对于满足情况的图像,对图像截半后进行二次颜色检测,判断印章是否在指定区域,然后根据红色或蓝色对应的印章类型最终确定进入下一步审核的图像,所述S1中颜色检测将图由RGB模型改为HSV模型,其中H表示色调,S表示饱度,V表示亮度,根据红色和蓝色的取值范围,确定图像中是否包含红色和蓝色的区域,所述红色取值范围为H(156-180)、S(43-255)、V(46-255),蓝色的取值范围为H(0-10)、S(43-255)、V(46-255),像素点阈值为100,超过100个像素点则表示图像中包含有红色或蓝色的区域,所述S1中所述协议书印章颜色为红色或蓝色,包括圆形红色的公司印章以及方形蓝色的法人印章,协议书图像采集方式为拍照或扫描录入,在进行最终文字识别之前根据检测算法SegLink输出的文本框角度,利用旋转算法对图像进行调整。
最后应说明的是:以上所述的实施例仅用于说明本发明的技术方案,而非对其限制,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或全部技术特征进行等同替换,而这些修改或替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (7)

1.一种带印章的表格协议书图像自动审核方法,其特征在于,所述方法包括以下步骤:
S1:根据预设的印章颜色、形状和位置判定原始图像是否含有印章且位置正确,如满足条件则,继续对协议书进行文字识别;
S2:根据预先设置的文本检测算法SegLink确定文本框位置,然后使用预先设置的文字识别算法CRNN识别文本内容,根据文本内容是否包含定义的内容关键字,如果其不包含预定义的内容关键字,则对图像进行不超过三次的90度旋转,直到能够识别到关键字;
S3:对能够检测到关键字的图像再根据文本框的角度进行微调,至表格横向框线处于水平位置,然后识别表格所有单元格内容,根据预设规则识别表格必填项的名称和内容,判断是否完备;
S4:对于不满足以上任意一个条件的图像判为内容不完备,并不通过审核;
S5:对内容完备的表格进行正确性检查,包括比对识别出的单元格内容和预设值是否相同,若相同,则通过yolov3卷积神经网络识别并截取印章,作极坐标变换,再通过预设的文字识别模型获取印章内容,比对其预设内容是否一致,若一致,则判断为通过审核。
2.根据权利要求1所述的带有印章的表格协议书图像自动审核方法,其特征在于,所述S1中首先对整张图像进行颜色检测,筛选出不含印章的图像,对于颜色检测通过的图像,对图像截半后进行二次颜色检测,判断印章是否在指定区域,然后根据红色或蓝色对应的印章类型最终确定进入下一步审核的图像。
3.根据权利要求2所述的带有印章的表格协议书图像自动审核方法,其特征在于,所述S1中颜色检测将图由RGB模型改为HSV模型,其中H表示色调,S表示饱度,V表示亮度,根据红色和蓝色的取值范围,确定图像中是否包含红色和蓝色的区域。
4.根据权利要求3所述的带有印章的表格协议书图像自动审核方法,其特征在于,所述红色取值范围为H(156-180)、S(43-255)、V(46-255),蓝色的取值范围为H(0-10)、S(43-255)、V(46-255),像素点阈值为100。
5.根据权利要求1所述的带有印章的表格协议书图像自动审核方法,其特征在于,所述S1中所述协议书印章颜色为红色或蓝色,包括圆形红色的公司印章以及方形蓝色的法人印章。
6.根据权利要求1所述的带有印章的表格协议书图像自动审核方法,其特征在于,协议书图像采集方式为拍照或扫描录入,在进行最终文字识别之前根据检测算法SegLink输出的文本框角度,利用旋转算法对图像进行调整。
7.根据权利要求4所述的带有印章的表格协议书图像自动审核方法,其特征在于,超过100个像素点则表示图像中包含有红色或蓝色的区域。
CN202110174219.3A 2021-02-09 2021-02-09 一种带印章的表格协议书图像自动审核方法 Pending CN113076795A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110174219.3A CN113076795A (zh) 2021-02-09 2021-02-09 一种带印章的表格协议书图像自动审核方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110174219.3A CN113076795A (zh) 2021-02-09 2021-02-09 一种带印章的表格协议书图像自动审核方法

Publications (1)

Publication Number Publication Date
CN113076795A true CN113076795A (zh) 2021-07-06

Family

ID=76609944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110174219.3A Pending CN113076795A (zh) 2021-02-09 2021-02-09 一种带印章的表格协议书图像自动审核方法

Country Status (1)

Country Link
CN (1) CN113076795A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113591849A (zh) * 2021-08-02 2021-11-02 国泰新点软件股份有限公司 基于签章识别的文件评审方法、装置、设备和存储介质
CN113627423A (zh) * 2021-07-08 2021-11-09 广州广电运通金融电子股份有限公司 圆形印章字符识别方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627423A (zh) * 2021-07-08 2021-11-09 广州广电运通金融电子股份有限公司 圆形印章字符识别方法、装置、计算机设备和存储介质
CN113591849A (zh) * 2021-08-02 2021-11-02 国泰新点软件股份有限公司 基于签章识别的文件评审方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN100565559C (zh) 基于连通分量和支持向量机的图像文本定位方法和装置
CN105095892A (zh) 基于图像处理的学生文档管理系统
CN102567300A (zh) 图片文档的处理方法及装置
CN109726717A (zh) 一种车辆综合信息检测系统
CN105740774A (zh) 一种图像的文本区域定位方法及装置
CN112836650B (zh) 一种质量检验报告扫描图像表格语义解析方法与系统
CN106919910B (zh) 一种基于hog-cth组合特征的交通标志识别方法
CN113076795A (zh) 一种带印章的表格协议书图像自动审核方法
CN114155527A (zh) 一种场景文本识别方法和装置
CN112434699A (zh) 手写汉字或偏旁、笔划的自动提取及智能评分系统
CN111160328A (zh) 一种基于语义分割技术的交通标线自动提取的方法
CN112446259A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN110119742A (zh) 一种集装箱号的识别方法、装置及移动终端
US5761385A (en) Product and method for extracting image data
Zhu et al. Detection for triangle traffic sign based on neural network
CN113392819B (zh) 一种批量化学术图像自动分割标注装置和方法
CN112053407A (zh) 一种交通执法影像中基于ai技术的车道线自动检测方法
CN109741315A (zh) 一种基于深度强化学习的无参考图像质量客观评价方法
CN113298767A (zh) 一种能克服反光现象的围棋图谱可靠识别方法
CN111414855B (zh) 基于端到端回归模型的电线杆标牌目标检测及识别方法
CN116612398A (zh) 基于ctpn算法的无人机巡检照片杆塔号牌文字识别方法
CN116912872A (zh) 图纸识别方法、装置、设备及可读存储介质
CN115063805A (zh) 图像识别方法、答题批改方法及相关装置、设备和介质
CN114639110A (zh) 一种智能批阅方法和系统
CN112052698A (zh) 一种基于调查问卷的隐私保护设计方法、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination