CN113901883A - 基于深度学习的印章识别方法、系统及存储介质 - Google Patents

基于深度学习的印章识别方法、系统及存储介质 Download PDF

Info

Publication number
CN113901883A
CN113901883A CN202111078051.2A CN202111078051A CN113901883A CN 113901883 A CN113901883 A CN 113901883A CN 202111078051 A CN202111078051 A CN 202111078051A CN 113901883 A CN113901883 A CN 113901883A
Authority
CN
China
Prior art keywords
seal
image
character
identified
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111078051.2A
Other languages
English (en)
Inventor
吴运祥
马凤强
梁延灼
刘琛
安晓博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202111078051.2A priority Critical patent/CN113901883A/zh
Publication of CN113901883A publication Critical patent/CN113901883A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于深度学习的印章识别方法、系统及存储介质,属于机器视觉技术领域,本发明要解决的技术问题为印章识别场景少、印章扇形文字矫正效果差及文字识别准确率低,技术方案为:获取待识别图像,使用目标检测模型检测待识别图像中印章,获取待识别图像中印章对应的坐标信息及印章类型;根据待识别图像中印章对应的坐标信息,裁剪出待识别印章图像;使用图像旋转角度分类模型识别待识别印章图像的旋转角度,根据旋转角度将待识别印章图像矫正;使用文字检测模型检测矫正后的待识别印章图像中的文字,获取文字的坐标信息,根据文字坐标信息裁剪处待识别文字图像;根据获得的印章类型,使用文字识别模型识别待识别文字图像获取印章识别结果。

Description

基于深度学习的印章识别方法、系统及存储介质
技术领域
本发明涉及机器视觉技术领域,具体地说是一种基于深度学习的印章识别方法、系统及存储介质。
背景技术
目前对于政企事项中的合同、票据等文件的审核,由稽核人员通过人工审核的方式完成,审核内容主要涉及检查是否在合同中使用合同专用章,用章规范是否正确;印章主体文字是否与合同中企业名称保持一致;合同内容是否与审批一致等。现阶段政务服务审批系统无法自动验证合同专用章的信息以及规范性,无法准确定位印章的位置与类别信息。
针对政务服务审批等系统面临的问题,印章识别对于实现系统对印章核验环节的自动化与智能化,提高工作人员工作效率,降低审核时间,提升用户满意度具有重要意义。
目前现有方案大多针对圆形印章进行识别,场景大多为票据或者合同文件,存在识别场景少、文字识别准确率低等问题。对于印章中扇形文字一般采用直接使用文字识别模型识别或者先进行极坐标变换然后再使用文字识别模型识别的方案,但是针对椭圆印章进行极坐标变换效果一般,转换后的图像文字出现缺失、扭曲等现象,导致文字识别效果较差。
发明内容
本发明的技术任务是提供一种基于深度学习的印章识别方法、系统及存储介质,来解决印章识别场景少、印章扇形文字矫正效果差及文字识别准确率低的问题。
本发明的技术任务是按以下方式实现的,一种基于深度学习的印章识别方法,该方法具体如下:
获取待识别图像,使用目标检测模型检测待识别图像中印章,获取待识别图像中印章对应的坐标信息及印章类型;其中,待识别图像包括圆形印章、椭圆形印章、矩形印章及正方形印章;
根据待识别图像中印章对应的坐标信息,裁剪出待识别印章图像;
使用图像旋转角度分类模型识别待识别印章图像的旋转角度,根据旋转角度将待识别印章图像矫正;
使用文字检测模型检测矫正后的待识别印章图像中的文字,获取文字的坐标信息,根据文字坐标信息裁剪处待识别文字图像;
根据获得的印章类型,使用文字识别模型识别待识别文字图像获取印章识别结果。
作为优选,根据获得的印章类型,使用文字识别模型识别待识别文字图像获取印章识别结果具体如下:
判断印章类型是圆形或椭圆形印章还是矩形或正方形印章:
若是圆形或椭圆形印章,则判断待识别文字图像是否为扇形文字图像:
若是扇形文字图像,则对扇形文字图像进行矫正,具体为:
采用角点检测算法和薄板函数模型将扇形文字图像展平呈水平文字图像,再使用文字识别模型识别展平后的文字图像获得扇形文字图像中的文字内容;
若非扇形文字图像,则使用文字识别模型识别非扇形文字图像获得非扇形文字图像中的文字内容;
若是矩形或正方形印章,则直接使用文字识别模型识别文字图像的矩形或正方形印章中的文字内容。
更优地,所述角点检测算法具体如下:
选择包围扇形文字轮廓线上任意点的局部支撑区域,利用在局部支撑区域内近似角度计算方法计算轮廓线上每一点的尖锐度变量值,尖锐度变量值计算公式如下:
Figure BDA0003262940610000021
其中,Pi表示轮廓上的点;Pi-k表示Pi的k个有序前点;Pi+k表示Pi的k个有序后点;尖锐度变量值越大,表明角度越尖锐;
根据尖锐度变量值选择候选角点,具体为:设定任一点的尖锐度变量值(sharp)大于阈值T时,标记为候选角点;
通过非极大抑制条件筛选出真正的角点,以便借助真正的角点使用薄板函数模型(Thin Plate Spline,TPS)将扇形文字展平:扇形文字轮廓的角点位于扇形文字的起始与结束位置的端点处,共计四个像素点,扇形文字起始位置与结束位置分别有两个角点。
更优地,薄板函数模型用于对图像进行几何纠正,能够对扇形弯曲文字进行矫正;具体如下:
基于角点检测算法获取到的四个角点,将原始扇形文字图片的角点与矫正后的扇形文字图像的端点建立映射关系,从文字起始左上角的角点按照顺时针方向四个角点的坐标依次为(x1,y1)、(x2,y2)、(x3,y3)及(x4,y4),分别映射到0,0)、(w,0)、(w,h)及(0,h);其中,w为文字矫正后的宽度;h为文字高度;
薄板函数模型(Thin Plate Spline,TPS)根据映射关系将原始扇形文字图像矫正成水平文字图像。
作为优选,待识别图像的场景包括票据、合同、证照及红头文件;
目标检测模型采用Faster R-CNN、FPN、YOLOv5、SSD或RetinaNet;
文字检测模型采用PAN、PSENet或SPCNet;
文字识别模型采用Rosetta、CRNN、STAR-Net或RARE;文字识别模型采用CRNN网络结构,包括,
卷积层,用于从输入图像中提取特征序列;
循环层,用于预测从卷积层获取的特征序列的标签分布;
转录层,用于把从循环层获取的标签分布通过去重整合等操作转换成最终的识别结果。
更优地,目标检测模型采用YOLOv5,YOLOv5的组成具体如下:
①、Backbone:在不同图像细粒度上聚合并形成图像特征的卷积神经网络;
②、Neck:一系列混合和组合图像特征的网络层,并将图像特征传递到输出层;
③、Output:对图像特征进行预测,生成边界框与印章类别,其中边界框为印章在图像中的左上角与右下角x、y像素坐标,印章类别为圆形或椭圆形或矩形或正方形;
图像旋转角度分类模型采用VGGNet、ResNet或GoogLeNet,使用ResNet50网络判断印章的旋转角度时,旋转角度类别按照顺时针方向共划分为36种,每10度为一个类别,即0、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340和350。
更优地,文字检测模型采用PAN,PAN是基于实例分割的文字检测算法,检测速度快而且精度高;PAN由Resnet18、特征金字塔增强模块(Feature Pyramid Enhance Module,PFEM)和特征融合模块(Feature Fusion Module,FFM)组成;Resnet18作为主干网络,用于提取图像深层特征,特征金字塔增强模块呈级联结构且计算量小,连接在Resnet18后面让不同尺寸的特征更深、更具表征能力;在特征金字塔增强模块后面,使用特征融合模块将不同深度的特征金字塔增强模块所产生的特征融合为最终用于分割任务的特征,最后通过预测出的特征参数分割出不同的文字实例,每个文字实例被若干个(x,y)像素坐标点形成的点集连接而成的闭合多边形曲线(轮廓线)分割。
一种基于深度学习的印章识别系统,该系统包括,
印章目标检测模块,用于获取待识别图像,通过目标检测模型检测待识别图像中的印章,获取待识别图像中全部印章图像,同时识别每个印章对应的类型及待识别图像中印章对应的坐标信息;并根据待识别图像中印章对应的坐标信息,裁剪出待识别印章图像;其中,印章类型包括圆形印章、椭圆形印章、矩形印章和正方形印章;
印章倾斜矫正模块,用于使用图像旋转角度分类模型识别待识别印章图像的旋转角度,根据旋转角度将待识别印章图像矫正;
印章文字检测模块,用于使用文字检测模型检测矫正后的待识别印章图像中的文字,获取文字的坐标信息,根据文字坐标信息裁剪处待识别文字图像;
印章扇形文字矫正模块,用于将扇形文字图像采用角点检测算法与薄板函数模型展平成水平文字图像;
印章文字识别模块,根据获得的印章类型,使用文字识别模型识别待识别文字图像获取印章识别结果。
一种电子设备,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上述的基于深度学习的印章识别方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行时,实现如上述的基于深度学习的印章识别方法。
本发明的基于深度学习的印章识别方法、系统及存储介质具有以下优点:
(一)本发明解决了印章识别场景少、印章扇形文字矫正效果差、文字识别准确率低的问题,可以应用于政务服务审批系统印章核验环节,对于提高工作人员工作效率,降低审核时间,提升用户满意度具有重要意义;
(二)本发明通过印章目标检测模型实现了任意场景下对圆形、椭圆形、矩形与正方形印章的检测,针对圆形印章与椭圆形印章采用角点检测算法与薄板函数模实现扇形文字图像的展平,相比于直接对扇形文字区域图像进行识别,印章识别结果更加准确,文字识别率更高。
附图说明
下面结合附图对本发明进一步说明。
附图1为基于深度学习的印章识别方法的流程框图;
附图2为基于深度学习的印章识别系统的结构框图;
附图3为实施例3的流程框图。
具体实施方式
参照说明书附图和具体实施例对本发明的基于深度学习的印章识别方法、系统及存储介质作以下详细地说明。
实施例1:
如附图1所示,本发明的基于深度学习的印章识别方法,该方法具体如下:
S1、获取待识别图像,使用目标检测模型检测待识别图像中印章,获取待识别图像中印章对应的坐标信息及印章类型;其中,待识别图像包括圆形印章、椭圆形印章、矩形印章及正方形印章;待识别图像的场景包括票据、合同、证照及红头文件;
S2、根据待识别图像中印章对应的坐标信息,裁剪出待识别印章图像;
S3、使用图像旋转角度分类模型识别待识别印章图像的旋转角度,根据旋转角度将待识别印章图像矫正;
S4、使用文字检测模型检测矫正后的待识别印章图像中的文字,获取文字的坐标信息,根据文字坐标信息裁剪处待识别文字图像;
S5、判断印章类型是圆形或椭圆形印章还是矩形或正方形印章:
①、若是圆形或椭圆形印章,则执行步骤S6;
②、若是矩形或正方形印章,则跳转至步骤S8;
S6、判断待识别文字图像是否为扇形文字图像:
①、若是扇形文字图像,则执行步骤S7;
②、若非扇形文字图像,则跳转至步骤S8;
S7、对扇形文字图像进行矫正:采用角点检测算法和薄板函数模型将扇形文字图像展平呈水平文字图像;
S8、使用文字识别模型识别非扇形文字图像(矩形或正方形印章)或展平后的文字图像获得文字内容;
本实施例步骤S7中的角点检测算法具体如下:
S701-1、选择包围扇形文字轮廓线上任意点的局部支撑区域,利用在局部支撑区域内近似角度计算方法计算轮廓线上每一点的尖锐度变量值,尖锐度变量值计算公式如下:
Figure BDA0003262940610000071
其中,Pi表示轮廓上的点;Pi-k表示Pi的k个有序前点;Pi+k表示Pi的k个有序后点;尖锐度变量值越大,表明角度越尖锐;
S701-2、根据尖锐度变量值选择候选角点,具体为:设定任一点的尖锐度变量值(sharp)大于阈值T时,标记为候选角点;
S701-3、通过非极大抑制条件筛选出真正的角点,以便借助真正的角点使用TPS将扇形文字展平:扇形文字轮廓的角点位于扇形文字的起始与结束位置的端点处,共计四个像素点,扇形文字起始位置与结束位置分别有两个角点。
本实施例步骤S7中的薄板函数模型用于对图像进行几何纠正,能够对扇形弯曲文字进行矫正;具体如下:
S702-1、基于角点检测算法获取到的四个角点,将原始扇形文字图片的角点与矫正后的扇形文字图像的端点建立映射关系,从文字起始左上角的角点按照顺时针方向四个角点的坐标依次为(x1,y1)、(x2,y2)、(x3,y3)及(x4,y4),分别映射到0,0)、(w,0)、(w,h)及(0,h);其中,w为文字矫正后的宽度;h为文字高度;
S702-2、TPS根据映射关系将原始扇形文字图像矫正成水平文字图像。
本实施例步骤S1中的目标检测模型采用Faster R-CNN、FPN、YOLOv5、SSD或RetinaNet;目标检测模型采用YOLOv5,YOLOv5的组成具体如下:
①、Backbone:在不同图像细粒度上聚合并形成图像特征的卷积神经网络;
②、Neck:一系列混合和组合图像特征的网络层,并将图像特征传递到输出层;
③、Output:对图像特征进行预测,生成边界框与印章类别,其中边界框为印章在图像中的左上角与右下角x、y像素坐标,印章类别为圆形或椭圆形或矩形或正方形;
本实施例步骤S3中的图像旋转角度分类模型采用VGGNet、ResNet或GoogLeNet,Resnet是残差网络(Residual Network)的缩写,该系列网络广泛用于图像分类以及作为计算机视觉任务主干经典神经网络的一部分,典型的网络有Resnet18、Resnet34、Resnet50,Resnet101等。使用ResNet50网络判断印章的旋转角度时,旋转角度类别按照顺时针方向共划分为36种,每10度为一个类别,即0、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340和350。
本实施例步骤S4中的文字检测模型采用PAN、PSENet或SPCNet;文字检测模型采用PAN,PAN是基于实例分割的文字检测算法,检测速度快而且精度高;PAN由Resnet18、特征金字塔增强模块(Feature Pyramid Enhance Module,PFEM)和特征融合模块(FeatureFusion Module,FFM)组成;Resnet18作为主干网络,用于提取图像深层特征,特征金字塔增强模块呈级联结构且计算量小,连接在Resnet18后面让不同尺寸的特征更深、更具表征能力;在特征金字塔增强模块后面,使用特征融合模块将不同深度的特征金字塔增强模块所产生的特征融合为最终用于分割任务的特征,最后通过预测出的特征参数分割出不同的文字实例,每个文字实例被若干个(x,y)像素坐标点形成的点集连接而成的闭合多边形曲线(轮廓线)分割。
本实施例中步骤S8中的文字识别模型采用Rosetta、CRNN、STAR-Net或RARE;文字识别模型采用CRNN网络结构,包括,
卷积层,用于从输入图像中提取特征序列;
循环层,用于预测从卷积层获取的特征序列的标签分布;
转录层,用于把从循环层获取的标签分布通过去重整合等操作转换成最终的识别结果。
实施例2:
如附图2所示,本发明的基于深度学习的印章识别系统,该系统包括,
印章目标检测模块,用于获取待识别图像,通过目标检测模型检测待识别图像中的印章,获取待识别图像中全部印章图像,同时识别每个印章对应的类型及待识别图像中印章对应的坐标信息;并根据待识别图像中印章对应的坐标信息,裁剪出待识别印章图像;其中,印章类型包括圆形印章、椭圆形印章、矩形印章和正方形印章;
印章倾斜矫正模块,用于使用图像旋转角度分类模型识别待识别印章图像的旋转角度,根据旋转角度将待识别印章图像矫正;
印章文字检测模块,用于使用文字检测模型检测矫正后的待识别印章图像中的文字,获取文字的坐标信息,根据文字坐标信息裁剪处待识别文字图像;
印章扇形文字矫正模块,用于将扇形文字图像采用角点检测算法与薄板函数模型展平成水平文字图像;
印章文字识别模块,根据获得的印章类型,使用文字识别模型识别待识别文字图像获取印章识别结果。
该系统的工作过程具体如下:
(1)、接收待识别图像,通过印章目标检测模块获取图像中的印章图像及其对应的印章类型;
(2)、通过印章倾斜矫正模块将旋转的印章矫正,使得印章中的文字保持水平;
(3)、通过印章文字检测模块检测印章图像中的文字,获取印章中的文字区域图像;
(4)、针对扇形文字区域图像,采用印章扇形文字矫正模块对其进行矫正,将扇形文字展平;
(5)、印章文字识别模块对所有文字区域图像进行文字识别,获得印章识别结果。
实施例3:以盖有铁道工程总部医院专用章的介绍信为例
(一)、获取介绍信图像作为待识别图像;
(二)、使用目标检测模型YOLOv5检测步骤(一)获取的待识别图像中的印章;具体为:将待识别图像输入到YOLOv5模型后,YOLOv5模型预测出印章在图像中的坐标像素信息,即生成介绍信中印章的边界框,边界框为印章在图像中的左上角与右下角x、y像素坐标;并识别出待识别图像中的印章类型为圆形印章;
(三)、根据获取的待识别图像的印章像素坐标信息,在步骤(一)获取的待识别图像上裁剪出待识别印章图像;
(四)、裁剪出的待识别印章图像中的文字可能存在倾斜,需要对印章图像进行一定角度的旋转,将印章图像矫正;使用图像分类模型Resnet50判断印章的旋转角度,根据旋转角度将印章图像矫正;Resnet50将印章图像预测为类别10,则印章图像需要逆时针旋转10度;
(五)、使用文字检测模型PAN检测步骤(四)倾斜矫正后的印章图像中的文字,获取文字的坐标信息;
(六)、根据步骤(五)获取的像素坐标信息,在步骤(四)倾斜矫正后的印章图像上裁剪出待识别文字图像;
(七)根据获取到的圆形印章类型,均采用角点检测算法与薄板函数模型(ThinPlate Spline,TPS)对圆形印章中的扇形文字图像进行矫正,将扇形文字图像展平成水平文字图像;
①、对于本实施例来说,需要检测出包围扇形文字轮廓的多边形曲线的角点,以便借助角点使用TPS将扇形文字展平,该角点位于扇形文字起始与结束位置的端点处,共计四个像素点,文字起始位置与结束位置分别有两个角点。再通过非极大值抑制筛选出真正的角点。
②、基于角点检测算法获取到的四个角点,将原始图片的角点与矫正后的文字图像的端点建立映射关系,四个角点(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)(从文字起始左上角的角点按照顺时针方向)分别映射到(0,0)、(w,0)、(w,h)、(0,h),w为文字矫正后的宽度,h为文字高度,TPS根据映射关系将扇形文字图像矫正成水平文字图像。
(八)、使用文字识别模型CRNN识别展平后的文字图像中的文字内容:文字识别结果及其置信度分别为“铁道工程总部医院”:0.99091464,“专用章”:0.9997423。
实施例4:
本发明实施例还提供了一种电子设备,包括:存储器和一个处理器;
其中,存储器存储计算机执行指令;
一个处理器执行所述存储器存储的计算机执行指令,使得一个处理器执行本发明任一项所述的基于深度学习的印章识别方法。
实施例5:
本发明实施例还提供了一种计算机可读存储介质,其中存储有多条指令,指令由处理器加载,使处理器执行本发明任一实施例中的基于深度学习的印章识别方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于深度学习的印章识别方法,其特征在于,该方法具体如下:
获取待识别图像,使用目标检测模型检测待识别图像中印章,获取待识别图像中印章对应的坐标信息及印章类型;其中,待识别图像包括圆形印章、椭圆形印章、矩形印章及正方形印章;
根据待识别图像中印章对应的坐标信息,裁剪出待识别印章图像;
使用图像旋转角度分类模型识别待识别印章图像的旋转角度,根据旋转角度将待识别印章图像矫正;
使用文字检测模型检测矫正后的待识别印章图像中的文字,获取文字的坐标信息,根据文字坐标信息裁剪处待识别文字图像;
根据获得的印章类型,使用文字识别模型识别待识别文字图像获取印章识别结果。
2.根据权利要求1所述的基于深度学习的印章识别方法,其特征在于,根据获得的印章类型,使用文字识别模型识别待识别文字图像获取印章识别结果具体如下:
判断印章类型是圆形或椭圆形印章还是矩形或正方形印章:
若是圆形或椭圆形印章,则判断待识别文字图像是否为扇形文字图像:
若是扇形文字图像,则对扇形文字图像进行矫正,具体为:
采用角点检测算法和薄板函数模型将扇形文字图像展平呈水平文字图像,再使用文字识别模型识别展平后的文字图像获得扇形文字图像中的文字内容;
若非扇形文字图像,则使用文字识别模型识别非扇形文字图像获得非扇形文字图像中的文字内容;
若是矩形或正方形印章,则直接使用文字识别模型识别文字图像的矩形或正方形印章中的文字内容。
3.根据权利要求2所述的基于深度学习的印章识别方法,其特征在于,所述角点检测算法具体如下:
选择包围扇形文字轮廓线上任意点的局部支撑区域,利用在局部支撑区域内近似角度计算方法计算轮廓线上每一点的尖锐度变量值,尖锐度变量值计算公式如下:
Figure FDA0003262940600000021
其中,Pi表示轮廓上的点;Pi-k表示Pi的k个有序前点;Pi+k表示Pi的k个有序后点;尖锐度变量值越大,表明角度越尖锐;
根据尖锐度变量值选择候选角点,具体为:设定任一点的尖锐度变量值大于阈值T时,标记为候选角点;
通过非极大抑制条件筛选出真正的角点,以便借助真正的角点使用薄板函数模型将扇形文字展平:扇形文字轮廓的角点位于扇形文字的起始与结束位置的端点处,共计四个像素点,扇形文字起始位置与结束位置分别有两个角点。
4.根据权利要求3所述的基于深度学习的印章识别方法,其特征在于,薄板函数模型用于对图像进行几何纠正,能够对扇形弯曲文字进行矫正;具体如下:
基于角点检测算法获取到的四个角点,将原始扇形文字图片的角点与矫正后的扇形文字图像的端点建立映射关系,从文字起始左上角的角点按照顺时针方向四个角点的坐标依次为(x1,y1)、(x2,y2)、(x3,y3)及(x4,y4),分别映射到0,0)、(w,0)、(w,h)及(0,h);其中,w为文字矫正后的宽度;h为文字高度;
TPS根据映射关系将原始扇形文字图像矫正成水平文字图像。
5.根据权利要求1所述的基于深度学习的印章识别方法,其特征在于,待识别图像的场景包括票据、合同、证照及红头文件;
目标检测模型采用Faster R-CNN、FPN、YOLOv5、SSD或RetinaNet;
文字检测模型采用PAN、PSENet或SPCNet;
文字识别模型采用Rosetta、CRNN、STAR-Net或RARE;文字识别模型采用CRNN网络结构,包括,
卷积层,用于从输入图像中提取特征序列;
循环层,用于预测从卷积层获取的特征序列的标签分布;
转录层,用于把从循环层获取的标签分布通过去重整合等操作转换成最终的识别结果。
6.根据权利要求5所述的基于深度学习的印章识别方法,其特征在于,目标检测模型采用YOLOv5,YOLOv5的组成具体如下:
①、Backbone:在不同图像细粒度上聚合并形成图像特征的卷积神经网络;
②、Neck:一系列混合和组合图像特征的网络层,并将图像特征传递到输出层;
③、Output:对图像特征进行预测,生成边界框与印章类别,其中边界框为印章在图像中的左上角与右下角x、y像素坐标,印章类别为圆形或椭圆形或矩形或正方形;
图像旋转角度分类模型采用VGGNet、ResNet或GoogLeNet,使用ResNet50网络判断印章的旋转角度时,旋转角度类别按照顺时针方向共划分为36种,每10度为一个类别,即0、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340和350。
7.根据权利要求5所述的基于深度学习的印章识别方法,其特征在于,文字检测模型采用PAN,PAN是基于实例分割的文字检测算法;PAN由Resnet18、特征金字塔增强模块和特征融合模块组成;Resnet18作为主干网络,用于提取图像深层特征,特征金字塔增强模块呈级联结构且计算量小,连接在Resnet18后面让不同尺寸的特征更深、更具表征能力;在特征金字塔增强模块后面,使用特征融合模块将不同深度的特征金字塔增强模块所产生的特征融合为最终用于分割任务的特征,最后通过预测出的特征参数分割出不同的文字实例,每个文字实例被若干个(x,y)像素坐标点形成的点集连接而成的闭合多边形曲线分割。
8.一种基于深度学习的印章识别系统,其特征在于,该系统包括,
印章目标检测模块,用于获取待识别图像,通过目标检测模型检测待识别图像中的印章,获取待识别图像中全部印章图像,同时识别每个印章对应的类型及待识别图像中印章对应的坐标信息;并根据待识别图像中印章对应的坐标信息,裁剪出待识别印章图像;其中,印章类型包括圆形印章、椭圆形印章、矩形印章和正方形印章;
印章倾斜矫正模块,用于使用图像旋转角度分类模型识别待识别印章图像的旋转角度,根据旋转角度将待识别印章图像矫正;
印章文字检测模块,用于使用文字检测模型检测矫正后的待识别印章图像中的文字,获取文字的坐标信息,根据文字坐标信息裁剪处待识别文字图像;
印章扇形文字矫正模块,用于将扇形文字图像采用角点检测算法与薄板函数模型展平成水平文字图像;
印章文字识别模块,根据获得的印章类型,使用文字识别模型识别待识别文字图像获取印章识别结果。
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一所述的基于深度学习的印章识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行时,实现如权利要求1至7中任一所述的基于深度学习的印章识别方法。
CN202111078051.2A 2021-09-15 2021-09-15 基于深度学习的印章识别方法、系统及存储介质 Pending CN113901883A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111078051.2A CN113901883A (zh) 2021-09-15 2021-09-15 基于深度学习的印章识别方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111078051.2A CN113901883A (zh) 2021-09-15 2021-09-15 基于深度学习的印章识别方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN113901883A true CN113901883A (zh) 2022-01-07

Family

ID=79028296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111078051.2A Pending CN113901883A (zh) 2021-09-15 2021-09-15 基于深度学习的印章识别方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113901883A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155546A (zh) * 2022-02-07 2022-03-08 北京世纪好未来教育科技有限公司 一种图像矫正方法、装置、电子设备和存储介质
CN115273123A (zh) * 2022-09-26 2022-11-01 山东豸信认证服务有限公司 一种票据识别方法、装置、设备及计算机存储介质
CN117975492A (zh) * 2024-03-29 2024-05-03 南昌航空大学 一种矩形印章文字识别方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155546A (zh) * 2022-02-07 2022-03-08 北京世纪好未来教育科技有限公司 一种图像矫正方法、装置、电子设备和存储介质
CN114155546B (zh) * 2022-02-07 2022-05-20 北京世纪好未来教育科技有限公司 一种图像矫正方法、装置、电子设备和存储介质
CN115273123A (zh) * 2022-09-26 2022-11-01 山东豸信认证服务有限公司 一种票据识别方法、装置、设备及计算机存储介质
CN115273123B (zh) * 2022-09-26 2023-02-10 山东豸信认证服务有限公司 一种票据识别方法、装置、设备及计算机存储介质
CN117975492A (zh) * 2024-03-29 2024-05-03 南昌航空大学 一种矩形印章文字识别方法
CN117975492B (zh) * 2024-03-29 2024-06-07 南昌航空大学 一种矩形印章文字识别方法

Similar Documents

Publication Publication Date Title
CN111401371B (zh) 一种文本检测识别方法、系统及计算机设备
CN111680688B (zh) 字符识别方法及装置、电子设备、存储介质
CN113901883A (zh) 基于深度学习的印章识别方法、系统及存储介质
CN111259878A (zh) 一种检测文本的方法和设备
WO2021237909A1 (zh) 一种表格还原方法、装置、设备及存储介质
CN113033543B (zh) 曲形文本识别方法、装置、设备及介质
WO2022156178A1 (zh) 图像目标对比方法、装置、计算机设备及可读存储介质
CN111191649A (zh) 一种识别弯曲多行文本图像的方法与设备
CN111507957B (zh) 身份证图片转换方法、装置、计算机设备及存储介质
CN111353549A (zh) 图像标签的核验方法及装置、电子设备、存储介质
CN112396047B (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN112418180A (zh) 表格数据提取方法、装置、设备及计算机存储介质
CN111160395A (zh) 图像识别方法、装置、电子设备和存储介质
CN116416626B (zh) 圆形印章数据的获取方法、装置、设备及存储介质
CN113887375A (zh) 一种文本识别方法、装置、设备及存储介质
CN113936288A (zh) 倾斜文本方向分类方法、装置、终端设备和可读存储介质
CN110008960A (zh) 一种检测字符片段完整性的方法及终端
CN114241463A (zh) 签名验证方法、装置、计算机设备和存储介质
CN113537184A (zh) Ocr模型训练方法、装置、计算机设备、存储介质
CN113762455A (zh) 检测模型训练方法、单字检测方法、装置、设备及介质
CN110135425B (zh) 样本标注方法及计算机存储介质
CN114926829A (zh) 一种证件检测方法、装置、电子设备及存储介质
CN115424254A (zh) 车牌识别方法、系统、设备及存储介质
CN114821062A (zh) 基于图像分割的商品识别方法及装置
CN110414845B (zh) 针对目标交易的风险评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination