CN112686255A - 基于霍夫变换的印章识别方法、装置、设备和存储介质 - Google Patents

基于霍夫变换的印章识别方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112686255A
CN112686255A CN202011633048.8A CN202011633048A CN112686255A CN 112686255 A CN112686255 A CN 112686255A CN 202011633048 A CN202011633048 A CN 202011633048A CN 112686255 A CN112686255 A CN 112686255A
Authority
CN
China
Prior art keywords
seal
trained
target
picture
report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011633048.8A
Other languages
English (en)
Inventor
谭瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Saiante Technology Service Co Ltd
Original Assignee
Shenzhen Saiante Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Saiante Technology Service Co Ltd filed Critical Shenzhen Saiante Technology Service Co Ltd
Priority to CN202011633048.8A priority Critical patent/CN112686255A/zh
Publication of CN112686255A publication Critical patent/CN112686255A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请涉及人工智能技术领域,提供了一种基于霍夫变换的印章识别方法、装置、设备和存储介质,获取待审核报告;将所述待审核报告转换为图片格式,得到目标待审核报告;通过预设的霍夫变换圆形检测算法检测每页所述目标待审核报告是否存在印章;若存在,对所述印章进行剪切,得到目标印章图片;将所述目标印章图片输入预先训练完成的印章识别模式中进行识别,输出识别结果;其中,所述印章识别模型基于VGG16网络模型训练而成。通过本申请提供的基于霍夫变换的印章识别方法、装置、设备和存储介质,能够准确的识别印章。

Description

基于霍夫变换的印章识别方法、装置、设备和存储介质
技术领域
本申请涉及人工智能的技术领域,特别涉及一种基于霍夫变换的印章识别方法、装置、设备和存储介质。
背景技术
对于一些项目,流程较长,每个流程完成后盖有对应的印章,如财政部P项目的项目报告上盖有多个印章,物有所值报告审核通过的印章、财承报告审核通过的印章以及实施方案审核通过的印章等,财政P项目主管部门需要对这些印章进行审核,印章审核的时候大多是采用人工进行核实,核实对应扫描文件中是否加印对应的公章。该核实场景涉及人力成本巨大,需要从上传的众多文件中找到对应文件,并打开文件依次检测每个页面是否有印章,如果发现印章需进一步确定该印章是否是对应的印章。为了降低人力成本,目前存在的印章识别,大多基于传统神经网络,基于传统神经网络的印章识别在特征处理上较弱,因此准确率较低。
发明内容
本申请的主要目的为提供一种基于霍夫变换的印章识别方法、装置、设备和存储介质,旨在解决目前印章识别的准确率较低的技术问题。
为实现上述目的,本申请提供了一种基于霍夫变换的印章识别方法,包括以下步骤:
获取待审核报告;
将所述待审核报告转换为图片格式,得到目标待审核报告;
通过预设的霍夫变换圆形检测算法检测每页所述目标待审核报告是否存在印章;
若存在,对所述印章进行剪切,得到目标印章图片;
将所述目标印章图片输入预先训练完成的印章识别模式中进行识别,输出识别结果;其中,所述印章识别模型基于VGG16网络模型训练而成。
进一步地,所述将所述待审核报告转换为图片格式的步骤,包括:
将所述待审核报告扫描为PDF版本;
将所述PDF版本的所述待审核报告转换为预设尺寸大小的图片格式;
对所述图片格式的所述待审核报告采用加权平均法做灰度处理。
进一步地,所述对所述印章进行剪切的步骤,包括:
获取所述印章在所述目标待审核报告的中心点的坐标和所述印章的半径;
根据所述坐标和半径进行剪切。
进一步地,所述根据所述坐标和半径进行剪切,得到目标印章图片的步骤,包括:
以所述印章的中心为所述目标印章图片的中心,以所述半径的预设倍数作为所述目标印章图片的边长进行剪切,得到所述目标印章图片;其中,所述预设倍数大于等于1。
进一步地,所述将所述目标印章图片输入预先训练完成的印章识别模型中进行识别的步骤之前,包括:
获取若干待训练图片;
对所述待训练图片做数据增强处理,得到若干目标待训练图片;
对若干所述目标待训练图片进行分类,并设定相应的分类标签;
将带有所述分类标签的目标待训练图片划分为训练样本集和验证样本集;
将所述训练样本集中所述目标待训练图片输入至VGG16网络模型中进行训练;
按照预设概率将神经网络单元丢弃,并将所述VGG16网络模型的每层神经网络单元的输出数据进行归一化处理,得到目标输出;
将所述目标输出输入到引入L2正则的损失函数中计算损失值,当所述损失值小于损失阈值时停止训练;
将所述验证样本集中的所述目标待训练图片输入至训练后的所述VGG16网络模型进行验证,并计算验证的准确率,当所述准确率大于所准确率阈值时,得到训练完成的所述印章识别模型。
进一步地,所述对所述待训练图片做数据增强处理,得到若干目标待训练图片的步骤,包括:
将若干所述待训练图片进行复制,得到若干待训练图片副本;
将若干所述第一预设比例的所述待训练图片副本添加高斯白噪声;以及,
将若干所述第二预设比例的所述待训练图片副本做旋转处理。
本申请还提供一种基于霍夫变换的印章识别装置,包括:
第一获取单元,用于获取待审核报告;
转换单元,用于将所述待审核报告转换为图片格式,得到目标待审核报告;
检测单元,用于通过预设的霍夫变换圆形检测算法检测每页所述目标待审核报告是否存在印章;
剪切单元,用于若存在,对所述印章进行剪切,得到目标印章图片;
识别单元,用于将所述目标印章图片输入预先训练完成的印章识别模式中进行识别,输出识别结果;其中,所述印章识别模型基于VGG16网络模型训练而成。
进一步地,所述转换单元,包括:
扫描子单元,用于将所述待审核报告扫描为PDF版本;
转换子单元,用于将所述PDF版本的所述待审核报告转换为预设尺寸大小的图片格式;
灰度处理子单元,用于对所述图片格式的所述待审核报告采用加权平均法做灰度处理。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的基于霍夫变换的印章识别方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的基于霍夫变换的印章识别方法的步骤。
本申请提供的基于霍夫变换的印章识别方法、装置、设备和存储介质,通过霍夫变换能够准确的识别到印章的位置,再根据位置进行剪切,得到目标印章图片,目标印章图片中包括了很少的其他文字或图形,因此将目标印章图片输入到印章识别模型中能降低其他文字或图形的干扰,提高印章识别的准确性,且印章识别模型是基于VGG16网络模型训练而成的,印章识别模型的准确率更高。
附图说明
图1是本申请一实施例中基于霍夫变换的印章识别方法步骤示意图;
图2是本申请一实施例中基于霍夫变换的印章识别装置结构框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本方案提供的一种基于霍夫变换的印章识别方法,包括以下步骤:
步骤S1,获取待审核报告;
步骤S2,将所述待审核报告转换为图片格式,得到目标待审核报告;
步骤S3,通过预设的霍夫变换圆形检测算法检测每页所述目标待审核报告是否存在印章;
步骤S4,若存在,对所述印章进行剪切,得到目标印章图片;
步骤S5,将所述目标印章图片输入预先训练完成的印章识别模式中进行识别,输出识别结果;其中,所述印章识别模型基于VGG16网络模型训练而成。
本实施例中,如上述步骤S1-S2所述,上述待审核报告为需要核实报告中是否加印有对应公章的报告。将待审核报告扫描为PDF版本上传,再将待审核报告转换为图片格式,待审核报告通常为多页,每一页转换为一个对应的图片,便于后续对待审核报告进行处理。
如上述步骤S3-S5所述,通过霍夫变换去检测是否存在印章,公章多为圆形,通过霍夫变换圆形检测算法能准确检测到图片中是否存在圆形,即是否存在印章,若存在,对该页目标待审核报告的印章进行裁剪。目标印章图片中包括了整个印章,但其他文字或图形又很少,降低其他文字或图形的干扰,提高印章识别的准确率。印章识别模型基于VGG16网络模型训练而成,VGG16网络模型包括13个卷积层和3个全连接层,具有巨大的参数量,但巨大的参数量使得VGG16具有很强的拟合能力,VGG16网络模型的卷积层均采用相同的卷积核参数,卷积层均表示为conv3-XXX,其中conv3说明该卷积层采用的卷积核的尺寸(kernelsize)是3,即宽和高均为3,3*3是很小的卷积核尺寸,结合其它参数(步幅stride=1,填充方式padding=same),这样就能够使得每一个卷积层(张量)与前一层(张量)保持相同的宽和高。XXX代表卷积层的通道数。池化层均采用相同的池化核参数,池化层的参数均为2×;VGG16网络模型是由若干卷积层和池化层堆叠(stack)的方式构成,比较容易形成较深的网络结构。具有简单、学习能力强的优点,在3V100GPU上采用具有较强拟合能力的深度学习网络VGG16模型进行训练及识别,识别准确率达到97.2%,是浅层网络难以达到的效果,通过VGG16网络模型训练得到的印章识别模型能够准确的识别出印章的种类。
在一实施例中,所述将所述待审核报告转换为图片格式的步骤,包括:
步骤S21,将所述待审核报告扫描为PDF版本;
步骤S22,将所述PDF版本的所述待审核报告转换为预设尺寸大小的图片格式;
步骤S23,对所述图片格式的所述待审核报告采用加权平均法做灰度处理。
本实施例中,如上述步骤S21-S22所述,将待审核报告扫描成PDF版本,每一页为单独的一张图片。采用python中的fitz工具包将一个PDF文件转换的图片存放在内存中。具体的,通过线性变换的方式将PDF版本转换为统一尺寸的图片格式;
Figure BDA0002880537400000051
Figure BDA0002880537400000052
Figure BDA0002880537400000053
其中,A为标准图片的宽度,Pwidth为原图片宽度,P′width为转换后图片宽度,Pheight为原图片高度,P′height为转换后图片高度。
如上述步骤S23所述,将图片灰度化处理后转换为二维灰度图像,进一步的,由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,可采用加权平均法做灰度处理,具体公式如下所示:
Gray=0.299*R+0.578*G+0.123*B
其中,R、G、B为三维图片的三个分量,各分量的系数根据人体对颜色敏感度设置。
在一实施例中,所述对所述印章进行剪切的步骤S4,包括:
步骤S41,获取所述印章在所述目标待审核报告的中心点的坐标和所述印章的半径;
步骤S42,根据所述坐标和半径进行剪切。
本实施例中,如上述步骤S41-S42所述,采用霍夫变换圆形检测算法检测是否存在印章时,会计算出印章中心点的坐标及印章的半径,具体的,对输入的目标待审核报告进行边缘检测,获取边界点,即前景点。假如目标待审核报告中存在圆形,那么其轮廓必定属于前景点,进行坐标变换,由笛卡尔坐标系转换到霍夫坐标系,即由x-y坐标系转换到a-b坐标系。写成如下形式(a-x)2+(b-y)2=r2。那么x-y坐标系中圆形边界上的一点对应到a-b坐标系中即为一个圆;x-y坐标系中一个圆形边界上有很多个点,对应到a-b坐标系中就会有很多个圆。由于原图像中这些点都在同一个圆形上,那么转换后a,b必定也满足a-b坐标系下的所有圆形的方程式。直观表现为这许多点对应的圆都会相交于一个点,那么这个交点就可能是圆心(a,b)。统计局部交点处圆的个数,取每一个局部最大值,就可以获得原图像中对应的圆形的圆心坐标(a,b),一旦在某一个r下面检测到圆,那么r的值也就随之确定。本实施例中,通过霍夫变换圆形检测能够准确的检测到印章并计算得到印章的圆心坐标及半径,再根据印章中心点的坐标和半径进行剪切,能够准确的得到包括印章的目标印章图片。
在一实施例中,所述根据所述坐标和半径进行剪切,得到目标印章图片的步骤S42,包括:
步骤S421,以所述印章的中心为所述目标印章图片的中心,以所述半径的预设倍数作为所述目标印章图片的边长进行剪切,得到所述目标印章图片;其中,所述预设倍数大于等于1。
本实施例中,如上述步骤S421所述,将检测到的印章所在区域的图片剪切出来,需要计算出待剪切区域的坐标位置,本提案剪切的为正方形,在另一实施例中,可剪切成圆形。因此,需要计算:
Xmin=max(x-1.5*r,0)
Xmax=min(x+1.5*r,width)
Ymin=max(y-1.5*r,0)
Ymax=min(y+1.5*r,heigth)
其中,max()函数表示返回更大的参数,min()函数表示返回更小的参数。采用OpenCV剪切识别圆形1.5倍半径距离为边长的正方形图片,对边缘图像采用最大边缘距离剪切。
本实施例中,如果将整页待审核报告都输入到印章识别模型中,会存在大量干扰数据,印章在整页待审核报告中的特征本身就很小,直接作为输入,印章识别率非常低,通过将目标印章图片从待审核报告中剪切下来,减少待审核报告中的其他文字或图标对印章识别的干扰。
在一实施例中,所述将所述目标印章图片输入预先训练完成的印章识别模型中进行识别的步骤S5之前,包括:
步骤S51,获取若干待训练图片;
步骤S52,对所述待训练图片做数据增强处理,得到若干目标待训练图片;
步骤S53,对若干所述目标待训练图片进行分类,并设定相应的分类标签;
步骤S54,将带有所述分类标签的目标待训练图片划分为训练样本集和验证样本集;
步骤S55,将所述训练样本集中所述目标待训练图片输入至VGG16网络模型中进行训练;
步骤S56,按照预设概率将神经网络单元丢弃,并将所述VGG16网络模型的每层神经网络单元的输出数据进行归一化处理,得到目标输出;
步骤S57,将所述目标输出输入到引入L2正则的损失函数中计算损失值,当所述损失值小于损失阈值时停止训练;
步骤S58,将所述验证样本集中的所述目标待训练图片输入至训练后的所述VGG16网络模型进行验证,并计算验证的准确率,当所述准确率大于所准确率阈值时,得到训练完成的所述印章识别模型。
本实施例中,若干待训练图片具有正确的分类结果,将待训练图片整理成相应的类别,并设置相应的分类标签,如财政印章、人民政府印章、其他印章等,分类标签为0、1、2。将待训练图片随机分为训练样本集和验证样本集用于后续网络模型训练学习。将训练样本集的目标待训练图片输入到VGG16网络模型中进行训练,在训练的过程中,按照一定的概率将一部分神经网络单元暂时从网络中丢弃,相当于从原始的网络中找到一个更瘦的网络,强迫一个神经单元,和随机挑选出来的其他神经单元共同工作,减弱了神经元节点间的联合适应性,增强了泛化能力。当单个待训练图片输入到某一层,将该层的所有神经元的输出进行归一化,使得网络中每层输入数据的分布相对稳定,加速模型学习速度。再将最终输出的目标输出输入到损失函数中计算损失值,上述损失函数引入L2正则,即在损失函数中加上a||w||2,其中,a为大于零调整系数,w为网络参数,其目的是对损失函数增加一个惩罚项,限制某些参数的更新力度(使得参数更倾向于选择更小的值),从而起到防止过拟合的效果。将验证样本集中的各个目标待训练图片输入至训练后的印章识别模型中进行验证,再计算验证的准确率,当准确率大于预设的一个准确率阈值时,才得到训练完成的印章识别模型。
在一实施例中,所述对所述待训练图片做数据增强处理,得到若干目标待训练图片的步骤S52,包括:
步骤S51,将若干所述待训练图片进行复制,得到若干待训练图片副本;
步骤S521,将若干所述第一预设比例的所述待训练图片添加高斯白噪声;
步骤S522,将若干所述第二预设比例的所述待训练图片做旋转处理。
本实施例中,将待训练图片进行复制,得到若干个待训练图片副本,待训练图片副本同样经过了灰度处理,灰度处理后的待训练图片副本是一个二维数组,添加高斯白噪声就是给该二维数组每个元素加上一个满足高斯分布(均值为0,方差为1)的随机值。具有多张待训练图片副本,第一预设比例和第二预设比例可由用户自主设置,第一预设比例和第二预设比例大于0且小于等于1,如第一预设比例为50%,第二预设比例为50%,随机选择若干待训练图片中50%的待训练图片副本添加高斯白噪声,将剩余的50%的待训练图片副本做旋转处理,具体包括支持上下、左右翻转,逆时针90、180、270等角度的旋转。在另一实施例中,第二预设比例的待训练图片副本可由未添加高斯白噪声和添加高斯白噪声的待训练图片副本中随机选择得到,即最开始具有20张待训练图片副本,10张待训练图片副本添加高斯白噪声,再从20张最原始的待训练图片副本加10张添加了高斯白噪声的待训练图片副本中选择50%的待训练图片副本,即15张待训练图片副本做旋转处理。再将经过数据增强的待训练图片副本和待训练图片共同作为目标待训练图片。本实施例中,通过数据增强处理能够得到更多的目标待训练图片,通过更多的目标待训练图片输入到VGG16网络模型中进行训练,有利于提高印章识别模型的准确性。
参见图2,本申请一实施例提供了一种基于霍夫变换的印章识别装置,包括:
第一获取单元10,用于获取待审核报告;
转换单元20,用于将所述待审核报告转换为图片格式,得到目标待审核报告;
检测单元30,用于通过预设的霍夫变换圆形检测算法检测每页所述目标待审核报告是否存在印章;
剪切单元40,用于若存在,对所述印章进行剪切,得到目标印章图片;
识别单元50,用于将所述目标印章图片输入预先训练完成的印章识别模式中进行识别,输出识别结果;其中,所述印章识别模型基于VGG16网络模型训练而成。
一实施例中,所述转换单元20,包括:
扫描子单元,用于将所述待审核报告扫描为PDF版本;
转换子单元,用于将所述PDF版本的所述待审核报告转换为预设尺寸大小的图片格式;
灰度处理子单元,用于对所述图片格式的所述待审核报告采用加权平均法做灰度处理。
在一实施例中,所述剪切单元40,包括:
获取子单元,用于获取所述印章在所述目标待审核报告的中心点的坐标和所述印章的半径;
剪切子单元,用于根据所述坐标和半径进行剪切。
在一实施例中,所述剪切子单元,包括
剪切模块,用于以所述印章的中心为所述目标印章图片的中心,以所述半径的预设倍数作为所述目标印章图片的边长进行剪切,得到所述目标印章图片;其中,所述预设倍数大于等于1。
在一实施例中,所述基于霍夫变换的印章识别装置,还包括:
第二获取单元,用于获取若干待训练图片;
数据增强单元,用于对所述待训练图片做数据增强处理,得到若干目标待训练图片;
分类单元,用于对若干所述目标待训练图片进行分类,并设定相应的分类标签;
划分单元,用于将带有所述分类标签的目标待训练图片划分为训练样本集和验证样本集;
训练单元,用于将所述训练样本集中所述目标待训练图片输入至VGG16网络模型中进行训练;
丢弃单元,用于按照预设概率将神经网络单元丢弃,并将所述VGG16网络模型的每层神经网络单元的输出数据进行归一化处理,得到目标输出;
第二计算单元,用于将所述目标输出输入到引入L2正则的损失函数中计算损失值,当所述损失值小于损失阈值时停止训练;
验证单元,用于将所述验证样本集中的所述目标待训练图片输入至训练后的所述VGG16网络模型进行验证,并计算验证的准确率,当所述准确率大于所准确率阈值时,得到训练完成的所述印章识别模型。
在一实施例中,所述数据增强单元,包括:
复制子单元,用于将若干所述待训练图片进行复制,得到若干待训练图片副本;
添加子单元,用于将若干所述第一预设比例的所述待训练图片添加高斯白噪声;
旋转处理子单元,用于将若干所述第二预设比例的所述待训练图片做旋转处理。
在本实施例中,上述各个单元、子单元、模块的具体实现请参照上述方法实施例中所述,在此不再进行赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待审核报告、印章识别模型等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于霍夫变换的印章识别方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于霍夫变换的印章识别方法。
综上所述,为本申请实施例中提供的基于霍夫变换的印章识别方法、装置、设备和存储介质,获取待审核报告;将所述待审核报告转换为图片格式,得到目标待审核报告;通过预设的霍夫变换圆形检测算法检测每页所述目标待审核报告是否存在印章;若存在,对所述印章进行剪切,得到目标印章图片;将所述目标印章图片输入预先训练完成的印章识别模式中进行识别,输出识别结果;其中,所述印章识别模型基于VGG16网络模型训练而成。通过本申请提供的基于霍夫变换的印章识别方法、装置、设备和存储介质,通过霍夫变换能够准确的识别到印章的位置,再根据位置进行剪切,得到目标印章图片,目标印章图片中包括了很少的其他文字或图形,因此将目标印章图片输入到印章识别模型中能降低其他文字或图形的干扰,提供印章识别的准确性,且印章识别模型是基于VGG16网络模型训练而成的,印章识别模型的准确率更高。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种基于霍夫变换的印章识别方法,其特征在于,包括以下步骤:
获取待审核报告;
将所述待审核报告转换为图片格式,得到目标待审核报告;
通过预设的霍夫变换圆形检测算法检测每页所述目标待审核报告是否存在印章;
若存在,对所述印章进行剪切,得到目标印章图片;
将所述目标印章图片输入预先训练完成的印章识别模式中进行识别,输出识别结果;其中,所述印章识别模型基于VGG16网络模型训练而成。
2.根据权利要求1所述的基于霍夫变换的印章识别方法,其特征在于,所述将所述待审核报告转换为图片格式的步骤,包括:
将所述待审核报告扫描为PDF版本;
将所述PDF版本的所述待审核报告转换为预设尺寸大小的图片格式;
对所述图片格式的所述待审核报告采用加权平均法做灰度处理。
3.根据权利要求1所述的基于霍夫变换的印章识别方法,其特征在于,所述对所述印章进行剪切的步骤,包括:
获取所述印章在所述目标待审核报告的中心点的坐标和所述印章的半径;
根据所述坐标和半径进行剪切。
4.根据权利要求3所述的基于霍夫变换的印章识别方法,其特征在于,所述根据所述坐标和半径进行剪切,得到目标印章图片的步骤,包括:
以所述印章的中心为所述目标印章图片的中心,以所述半径的预设倍数作为所述目标印章图片的边长进行剪切,得到所述目标印章图片;其中,所述预设倍数大于等于1。
5.根据权利要求1所述的基于霍夫变换的印章识别方法,其特征在于,所述将所述目标印章图片输入预先训练完成的印章识别模型中进行识别的步骤之前,包括:
获取若干待训练图片;
对所述待训练图片做数据增强处理,得到若干目标待训练图片;
对若干所述目标待训练图片进行分类,并设定相应的分类标签;
将带有所述分类标签的目标待训练图片划分为训练样本集和验证样本集;
将所述训练样本集中所述目标待训练图片输入至VGG16网络模型中进行训练;
按照预设概率将神经网络单元丢弃,并将所述VGG16网络模型的每层神经网络单元的输出数据进行归一化处理,得到目标输出;
将所述目标输出输入到引入L2正则的损失函数中计算损失值,当所述损失值小于损失阈值时停止训练;
将所述验证样本集中的所述目标待训练图片输入至训练后的所述VGG16网络模型进行验证,并计算验证的准确率,当所述准确率大于所准确率阈值时,得到训练完成的所述印章识别模型。
6.根据权利要求5所述的基于霍夫变换的印章识别方法,其特征在于,所述对所述待训练图片做数据增强处理,得到若干目标待训练图片的步骤,包括:
将若干所述待训练图片进行复制,得到若干待训练图片副本;
将若干所述第一预设比例的所述待训练图片副本添加高斯白噪声;以及,
将若干所述第二预设比例的所述待训练图片副本做旋转处理。
7.一种基于霍夫变换的印章识别装置,其特征在于,包括:
第一获取单元,用于获取待审核报告;
转换单元,用于将所述待审核报告转换为图片格式,得到目标待审核报告;
检测单元,用于通过预设的霍夫变换圆形检测算法检测每页所述目标待审核报告是否存在印章;
剪切单元,用于若存在,对所述印章进行剪切,得到目标印章图片;
识别单元,用于将所述目标印章图片输入预先训练完成的印章识别模式中进行识别,输出识别结果;其中,所述印章识别模型基于VGG16网络模型训练而成。
8.根据权利要求7所述的基于霍夫变换的印章识别装置,其特征在于,所述转换单元,包括:
扫描子单元,用于将所述待审核报告扫描为PDF版本;
转换子单元,用于将所述PDF版本的所述待审核报告转换为预设尺寸大小的图片格式;
灰度处理子单元,用于对所述图片格式的所述待审核报告采用加权平均法做灰度处理。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的基于霍夫变换的印章识别方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的基于霍夫变换的印章识别方法的步骤。
CN202011633048.8A 2020-12-31 2020-12-31 基于霍夫变换的印章识别方法、装置、设备和存储介质 Pending CN112686255A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011633048.8A CN112686255A (zh) 2020-12-31 2020-12-31 基于霍夫变换的印章识别方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011633048.8A CN112686255A (zh) 2020-12-31 2020-12-31 基于霍夫变换的印章识别方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112686255A true CN112686255A (zh) 2021-04-20

Family

ID=75456178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011633048.8A Pending CN112686255A (zh) 2020-12-31 2020-12-31 基于霍夫变换的印章识别方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112686255A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113361547A (zh) * 2021-06-30 2021-09-07 深圳证券信息有限公司 一种签章识别方法、装置、设备及可读存储介质
CN114913089A (zh) * 2022-05-13 2022-08-16 华设设计集团股份有限公司 一种基于多尺度霍夫变换的印章提取方法
CN116468060A (zh) * 2023-04-23 2023-07-21 创新奇智(上海)科技有限公司 一种dpm码处理方法、装置、存储介质及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292823A (zh) * 2017-08-20 2017-10-24 平安科技(深圳)有限公司 电子装置、发票分类的方法及计算机可读存储介质
CN109299744A (zh) * 2018-10-19 2019-02-01 合肥非度信息技术有限公司 合同公章分类模型的训练方法、系统和识别方法、系统
CN109460757A (zh) * 2018-11-16 2019-03-12 上海中信信息发展股份有限公司 印章位置识别方法及装置
CN110443250A (zh) * 2019-07-31 2019-11-12 天津车之家数据信息技术有限公司 一种合同印章的类别识别方法、装置和计算设备
CN111950355A (zh) * 2020-06-30 2020-11-17 深圳市雄帝科技股份有限公司 印章识别方法、装置及电子设备
CN112037077A (zh) * 2020-09-03 2020-12-04 平安健康保险股份有限公司 基于人工智能的印章识别方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292823A (zh) * 2017-08-20 2017-10-24 平安科技(深圳)有限公司 电子装置、发票分类的方法及计算机可读存储介质
CN109299744A (zh) * 2018-10-19 2019-02-01 合肥非度信息技术有限公司 合同公章分类模型的训练方法、系统和识别方法、系统
CN109460757A (zh) * 2018-11-16 2019-03-12 上海中信信息发展股份有限公司 印章位置识别方法及装置
CN110443250A (zh) * 2019-07-31 2019-11-12 天津车之家数据信息技术有限公司 一种合同印章的类别识别方法、装置和计算设备
CN111950355A (zh) * 2020-06-30 2020-11-17 深圳市雄帝科技股份有限公司 印章识别方法、装置及电子设备
CN112037077A (zh) * 2020-09-03 2020-12-04 平安健康保险股份有限公司 基于人工智能的印章识别方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘玉芳: "人工智能前沿技术丛书 计算智能导论", vol. 1, 30 September 2019, 西安电子科技大学出版社, pages: 297 - 298 *
谢能付: "智能农业", vol. 1, 31 May 2005, 中国铁道出版社, pages: 68 - 69 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113361547A (zh) * 2021-06-30 2021-09-07 深圳证券信息有限公司 一种签章识别方法、装置、设备及可读存储介质
CN114913089A (zh) * 2022-05-13 2022-08-16 华设设计集团股份有限公司 一种基于多尺度霍夫变换的印章提取方法
CN116468060A (zh) * 2023-04-23 2023-07-21 创新奇智(上海)科技有限公司 一种dpm码处理方法、装置、存储介质及设备
CN116468060B (zh) * 2023-04-23 2024-01-19 创新奇智(上海)科技有限公司 一种dpm码处理方法、装置、存储介质及设备

Similar Documents

Publication Publication Date Title
CN111860670B (zh) 域自适应模型训练、图像检测方法、装置、设备及介质
CN112686255A (zh) 基于霍夫变换的印章识别方法、装置、设备和存储介质
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN110083723B (zh) 一种小熊猫个体识别方法、设备及计算机可读存储介质
WO2021143088A1 (zh) 多证件类型同步检测方法、装置、计算机设备及存储介质
CN112926564B (zh) 图片分析方法、系统、计算机设备和计算机可读存储介质
CN112633354B (zh) 路面裂缝检测方法、装置、计算机设备和存储介质
WO2022134354A1 (zh) 车损检测模型训练、车损检测方法、装置、设备及介质
CN110956080A (zh) 一种图像处理方法、装置、电子设备及存储介质
CN114549928B (zh) 图像增强处理方法、装置、计算机设备及存储介质
CN111144425B (zh) 检测拍屏图片的方法、装置、电子设备及存储介质
CN113222055A (zh) 一种图像分类方法、装置、电子设备及存储介质
Wu et al. A Siamese template matching method for SAR and optical image
CN113221897B (zh) 图像矫正方法、图像文本识别方法、身份验证方法及装置
CN110070017B (zh) 一种人脸假眼图像生成方法及装置
CN116229528A (zh) 一种活体掌静脉检测方法、装置、设备及存储介质
CN112784836A (zh) 一种文本图形偏移角度预测及其校正方法
CN111950415A (zh) 一种图像检测方法和装置
Martynenko The intelligent decision support system for identification of cultural values
CN111507420A (zh) 轮胎信息获取方法、装置、计算机设备和存储介质
US20230069960A1 (en) Generalized anomaly detection
CN116612272A (zh) 一种图像处理智能数字化的检测系统及其检测方法
KR102615510B1 (ko) 객체 위치 검출 장치, 객체 위치 검출 방법 및 객체 위치 검출 방법을 실행시키도록 기록매체에 저장된 컴퓨터 프로그램
CN112699809B (zh) 痘痘类别识别方法、装置、计算机设备及存储介质
WO2023173546A1 (zh) 文本识别模型的训练方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination