CN117437649A - 文件签章方法、装置、计算机设备及存储介质 - Google Patents

文件签章方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN117437649A
CN117437649A CN202311617425.2A CN202311617425A CN117437649A CN 117437649 A CN117437649 A CN 117437649A CN 202311617425 A CN202311617425 A CN 202311617425A CN 117437649 A CN117437649 A CN 117437649A
Authority
CN
China
Prior art keywords
target
signature
signed
file
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311617425.2A
Other languages
English (en)
Inventor
刘亚奇
朱云龙
刘建雄
李孟泽
袁小芬
张洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glodon Co Ltd
Original Assignee
Glodon Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glodon Co Ltd filed Critical Glodon Co Ltd
Priority to CN202311617425.2A priority Critical patent/CN117437649A/zh
Publication of CN117437649A publication Critical patent/CN117437649A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本发明涉及文件编辑技术领域,公开了一种文件签章方法、装置、计算机设备及存储介质。该方法包括:获取待签章的目标文件;识别所述目标文件对应的一个或多个目标签章类型;获取所述目标文件中的一个或多个待签章位置的信息;在所述待签章位置使用对应的所述目标签章类型的签章完成签章。本发明能够有效提高用户文件签章效率,还能够避免错盖、漏盖风险。

Description

文件签章方法、装置、计算机设备及存储介质
技术领域
本发明涉及文件编辑技术领域,具体涉及一种文件签章方法、装置、计算机设备及存储介质。
背景技术
电子签章是电子签名的一种表现形式。它本质上是利用图像处理技术将电子签名操作转化为与纸质文件盖章操作相同的可视效果,同时利用电子签名技术保障电子信息的真实性,完整性和签名人的不可否认性。
例如,在招投标应用中,需要对电子标书PDF文件进行签字签章,以达到防篡改,保障文件真实性的目的。目前通常做法是,需要人工操作来完成签章,不仅效率低,而且容易出错。
发明内容
有鉴于此,本发明提供了一种文件签章方法、装置、计算机设备及存储介质,以解决人工进行电子签章不仅效率低而且易出错的问题。
第一方面,本发明提供了一种文件签章方法,该方法包括:
获取待签章的目标文件;
识别目标文件对应的一个或多个目标签章类型;
获取目标文件中的一个或多个待签章位置的信息;
在待签章位置使用对应的目标签章类型的签章完成签章。
本实施例提供的文件签章方法,可以自动识别签章类型,因此不需要人工浏览文件来判断需要签什么类型的章,提高了签章效率,还避免了在一份文件需要签多个章的情况下,人工签章时容易遗漏掉其中的一个或多个章的问题,也可以避免人工签章时签错章的问题。
在一种可选的实施方式中,上述识别目标文件对应的一个或多个目标签章类型,包括:
基于目标文件得到目标信息;
将目标信息输入至目标检测模型;
基于目标检测模型的输出确定目标文件对应的目标签章类型。
在一种可选的实施方式中,基于目标检测模型的输出确定目标文件对应的目标签章类型之前,还包括:
识别目标文件中的第一关键字;
根据第一关键字确定目标文件对应的第一目标签章类型;
基于目标检测模型的输出确定目标文件对应的目标签章类型,包括:
基于目标检测模型的输出确定目标文件对应的第二目标签章类型;
基于第一目标签章类型和第二目标签章类型,确定目标文件对应的目标签章类型。
在一种可选的实施方式中,将目标信息输入至目标检测模型之前,还包括:
获取各签章类型的训练样本,并获取训练样本对应的签章类型作为标注;
选取部分训练样本形成训练集,另选部分训练样本形成验证集;
建立待训练检测模型;
配置训练参数;
利用训练集中的训练样本对待训练检测模型进行训练;
使用验证集对每次迭代训练后的待训练检测模型进行评估得到评估结果;
将评估结果最优的待训练检测模型作为目标检测模型。
在一种可选的实施方式中,获取目标文件中的一个或多个待签章位置的信息,包括:
识别目标文件中的第二关键字并获取第二关键字在目标文件中的目标位置;
基于目标位置确定待签章位置。
在一种可选的实施方式中,第二关键字包括第一部分关键字与第二部分关键字,目标位置包括第一部分关键字所在的第一目标位置和第二部分关键字所在的第二目标位置;
基于目标位置确定待签章位置,包括:
基于第一目标位置和第二目标位置获取第一部分关键字与第二部分关键字之间的间隔的尺寸;
若间隔的尺寸大于预设阈值,则基于间隔的中心位置确定待签章位置;
若间隔的尺寸小于或等于预设阈值,则基于第一位置确定签章位置,第一位置为在后的第二部分关键字的右侧。
在一种可选的实施方式中,在待签章位置使用对应的目标签章类型的签章完成签章,包括:
获取签章类型的签章的坐标原点与中心之间的偏移量;
根据偏移量和待签章位置的中心位置计算签章坐标;
基于签章坐标进行签章。
在一种可选的实施方式中,每一待签章位置的信息包括待签章位置在目标文件中的页码以及待签章位置在目标文件页面中的签章坐标;
在待签章位置使用对应的目标签章类型的签章完成签章,包括:
根据页码和签章坐标在对应的一个或多个待签章位置完成签章。
在一种可选的实施方式中,在待签章位置使用对应的目标签章类型的签章完成签章,包括:
判断待签章位置之间的间距是否小于第一预设距离;
若存在间距小于第一预设距离的第一待签章位置和第二待签章位置,则将第一待签章位置向远离第二待签章位置移动第二预设距离和/或将第二待签章位置向远离第一待签章位置移动第三预设距离。
第二方面,本发明提供了一种文件签章装置,该装置包括:
文件获取模块,用于获取待签章的目标文件;
签章类型识别模块,用于识别目标文件对应的一个或多个目标签章类型;
签章位置获取模块,用于获取目标文件中的一个或多个待签章位置的信息;
签章模块,用于在待签章位置使用对应的目标签章类型的签章完成签章。
第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的文件签章方法。
第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的文件签章方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的文件签章方法的流程示意图;
图2是根据本发明实施例的另一文件签章方法的流程示意图;
图3是根据本发明实施例的又一文件签章方法的流程示意图;
图4是根据本发明实施例的文件签章装置的结构框图;
图5是本发明实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,人工对电子文件进行电子签章时,需要人工识别各文件的签章类型,然后调出相应的签章图片,通过鼠标等将签章图片移动至签章位置,然后微调签章图片的位置以使得签章位置更加合适,最后完成签章。但是,这种人工签章方式不仅费时、效率低,容易出错,还容易遗漏,举例来说,如果一份文件需要签多个章,那么人工签章时就有可能漏签其中的一个或多个章。为此,本发明实施例提供了一种文件签章方法。
根据本发明实施例,提供了一种文件签章方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种文件签章方法,可用于计算机设备,图1是根据本发明实施例的文件签章方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,获取待签章的目标文件。具体可以根据用户触发的签章请求加载并解析目标文件。
需要签章的文件一般是图片、便携式文档格式(Portable Document Format,PDF)等不可编辑文件。
步骤S102,识别目标文件对应的一个或多个目标签章类型。
这里的目标文件一般是指单一文件,不包括多种文件集合在一起的文件,例如可以是单一的证件,而不是多种证件放在一起组成的文件。具体的识别目标签章类型的方法,例如可以是通过识别文件的类型来确定需要加盖的章的类型,而文件类型可以通过识别文件的标题或内容关键字来确定,也可以直接通过识别文件里跟盖章相关的关键词(例如“盖单位公章”)来确定要加盖的章的类型。
签章类型例如可以包括:单位公章、法定代表人名章、法定代表人手写签名等。
一个目标文件可能既需要盖单位公章也需要法定代表人名章,因此,一个文件对应的目标签章类型不一定只有一个。
步骤S103,获取目标文件中的一个或多个待签章位置的信息。
具体地,可以自动识别文件中的待签章位置,可以通过签章相关的关键字来识别。
也可以基于用户的手动点击的位置确定待签章位置,此时用户可以通过鼠标在文件中的点击操作来确定待签章位置,但是并不直接完成签章操作。具体地,当识别到该文件需要签某一类型的章时,可以将该文件显示在显示器上,并且显示“请点击确认签章位置”之类的提醒,当然也可以不显示提醒,然后等待客户选择签章位置的操作。
另外,对于某一些文件,可以直接根据文件类型确定签章位置,例如标书中的营业执照、身份证、企业资质等级、职称证书、学历证书等证件类的复印件文件,签章位置一般都是左上角。
步骤S102和步骤S103之间的顺序不限,还可以同时进行。
步骤S104,在待签章位置使用对应的目标签章类型的签章完成签章。具体可以通过调用目标签章类型对应的签章控件来完成签章。
本实施例提供的文件签章方法,可以自动识别签章类型,因此不需要人工浏览文件来判断需要签什么类型的章,提高了签章效率,还避免了在一份文件需要签多个章的情况下,人工签章时容易遗漏掉其中的一个或多个章的问题,也可以避免人工签章时签错章的问题。
对于电子标书这样的,一份文档中有多个需要签章的文件,而且标书动辄几百页甚至上千页,人工签章时需要一页一页浏览文档,找出其中需要签章的文件,再在签章位置进行签章,这种情况下,还可能遗漏掉文档中需要签章的文件。也就是说,有可能文档中有一份文件需要签章,但是人工在对整份文档进行签章的过程中只对其他文件进行了签章,漏掉了该文件。为解决这一问题,在本发明的一些可选具体实施方式中,步骤S101,即获取待签章的目标文件包括:
获取待签章文档;具体可以根据用户触发的签章请求加载并解析待签章文档。
识别待签章文档中的待签章文件作为待签章的目标文件。具体可以根据文件类型、文件标题和/或文件关键字等确定是否是需要签章的文件。
在本实施例中提供了一种文件签章方法,可用于计算机设备,图2是根据本发明实施例的文件签章方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取待签章的目标文件。详细请参见图1所示实施例的步骤S101,在此不再赘述。
步骤S202,识别目标文件对应的一个或多个目标签章类型。
在一些可选的具体实施方式中,识别目标文件对应的一个或多个目标签章类型,包括:
步骤S2021,基于目标文件得到目标信息;目标信息例如可以是字符和字符在目标文件中的坐标,对于图片文件也可以是对其进行base64编码后得到的信息。
步骤S2022,将目标信息输入至目标检测模型;
步骤S2023,基于目标检测模型的输出确定目标文件对应的目标签章类型。
另一些可选的具体实施方式中,基于目标检测模型的输出确定目标文件对应的目标签章类型之前,还包括:
步骤S20201,识别目标文件中的第一关键字;具体地,可以利用光学字符识别(Optical Character Recognition,OCR)模型识别文件中的关键字。
步骤S20202,根据第一关键字确定目标文件对应的第一目标签章类型;这一步骤也可以由OCR模型实现。
基于目标检测模型的输出确定目标文件对应的目标签章类型,包括:
步骤S20231,基于目标检测模型的输出确定目标文件对应的第二目标签章类型;
步骤S20232,基于第一目标签章类型和第二目标签章类型,确定目标文件对应的目标签章类型。具体来说,如果第一目标签章类型和第二目标签章类型一致,那么就将该类型确定为目标文件对应的签章类型。如果不一致,那么可以根据预先确定的置信度来确定目标文件对应的签章类型,即如果关键字识别的置信度高就把第一目标签章类型作为目标文件对应的签章类型,如果目标检测模型的置信度高,就将第二目标签章类型作为目标文件对应的签章类型。
本实施例中,在使用人工智能模型识别文件对应的签章类型的基础上,还利用OCR模型来识别文件中的关键字并基于关键字识别文件对应的签章类型,然后综合两种识别结果来最终确定文件的签章类型,从而提高了签章类型识别的置信度。
本实施例中,可以将训练好的目标检测模型和OCR模型进行云端部署,然后添加模型预测验证策略,整体作为web服务,对外提供预测接口。在识别目标文件对应的一个或多个目标签章类型时,调用预测接口,接口内部调用目标检测模型基于目标信息预测签章类型。其中,模型预测验证策略用于对比两个模型的识别结果,然后基于预设的规则输出最终的预测结果。
一些可选的具体实施方式中,将目标信息输入至目标检测模型之前,还包括:
步骤1:获取各签章类型的训练样本,并获取训练样本对应的签章类型作为标注;
由于实际签章时的文件可能是图片文件,也可能是PDF文件,因此,这里收集训练样本时也会同时收集图片文件和PDF文件,还可以把图片文件的训练样本转成PDF文件,作为PDF文件样本,或者将PDF文件样本转成图片文件样本。
当然,输入的文件格式不一样,会对模型的要求较高,因此为了简化目标检测模型,可以将训练样本统一成PDF文件或图片文件。后续使用模型时也需要将输入文件统一成PDF文件或图片文件。
另外,对于图片文件的训练样本,需要通过按比例缩放将尺寸统一。
为了使得模型能够准确识别各种签章类型,在收集训练样本时可以按照要签章类型分别准备训练样本,然后将每个类型的训练样本放置于一个文件夹中,便于标注。
在标注之前可以定义各签章类型的编码。对于图片文件的样本,在标注时可以使用标注工具labelme进行标注。标注的内容包括签章类型的编码。标注完成之后,使用飞桨(即PaddlX,一种产业级深度学习框架)提供的脚本将使用labelme标注后的文件转换为PascalVOC格式,最终生成两个文件夹,JPEGImages、Annotations,分别存储图片文件和标注数据文件。相应地,本实施例使用PaddlX对模型进行微调训练。
步骤2:选取部分训练样本形成训练集,另选部分训练样本形成验证集;具体地,在构建训练集和验证集时,可以先创建数据集,然后定义数据集名称,最后导入标注好的数据集文件,即导入图片文件和标注数据文件。
步骤3:建立待训练检测模型;例如,基于FasterRCNN模型(更快的RCNN模型,RCNN:Region-CNN,区域卷积神经网络)构建检测模型。
步骤4:配置训练参数;具体是对训练过程中使用的一些超参数进行统一配置,比如主干网络(Backbone)、迭代次数(Epoch)、学习率(Learning Rate)、批大小(Batch Size)等。
步骤5:利用训练集中的训练样本对待训练检测模型进行训练;具体可以使用图形处理器(GPU)进行训练,训练过程中可观测训练进度、训练集损失函数(loss)等指标。
步骤6:使用验证集对每次迭代训练后的待训练检测模型进行评估得到评估结果;评估结果可以包括bbox_map值。
步骤7:将评估结果最优的待训练检测模型作为目标检测模型。具体可以将bbox_map值最优的Epoch模型发布为可用于预测的模型文件。
最后,可以将训练好的检测模型,即bbox_map值最优的Epoch模型,作为目标检测模型进行云端部署,作为web服务,对外提供预测接口。在识别目标文件对应的一个或多个目标签章类型时,调用预测接口,接口内部调用目标检测模型基于目标信息预测签章类型。
步骤S203,获取目标文件中的一个或多个待签章位置的信息。详细请参见图1所示实施例的步骤S103,在此不再赘述。
步骤S204,在待签章位置使用对应的目标签章类型的签章完成签章。详细请参见图1所示实施例的步骤S104,在此不再赘述。
在本实施例中提供了一种文件签章方法,可用于计算机设备,图3是根据本发明实施例的文件签章方法的流程图,如图3所示,该流程包括如下步骤:
步骤S301,获取待签章的目标文件。详细请参见图1所示实施例的步骤S101,在此不再赘述。
步骤S302,识别目标文件对应的一个或多个目标签章类型。
详细请参见图1所示实施例的步骤S102或图2所示实施例的步骤S202,在此不再赘述。
步骤S303,获取目标文件中的一个或多个待签章位置的信息。
一些具体的实施方式中,步骤S303,获取目标文件中的一个或多个待签章位置的信息,可以包括:
步骤S3031,识别目标文件中的第二关键字并获取第二关键字在目标文件中的目标位置;第二关键字例如可以是:企业名称(盖公章)。
步骤S3032,基于目标位置确定待签章位置。
具体地,第二关键字包括第一部分关键字与第二部分关键字,目标位置包括第一部分关键字所在的第一目标位置和第二部分关键字所在的第二目标位置;
基于目标位置确定待签章位置,包括:
基于第一目标位置和第二目标位置获取第一部分关键字与第二部分关键字之间的间隔的尺寸;
举例来说,第二关键字的具体形式可以是:“企业名称(盖公章):”,也可能是:“企业名称:__________________________(盖公章)”,其中,“企业名称”是第一部分关键字,“盖公章”是第二部分关键字。下横线是用来填具体的企业名称的,第一种形式的第二关键字的后面也可以有下横线。在获取第一部分关键字与第二部分关键字之间的间隔的尺寸时,可以先确定出第一部分关键字和第二部分关键字的最小矩形包围框,可以通过左上角坐标和矩形的宽和高来表示,或者通过左上角坐标和右下角坐标来表示。第一部分关键字和第二部分关键字的最小矩形包围框可以通过盒子算法来确定。
若间隔的尺寸大于预设阈值,则基于间隔的中心位置确定待签章位置;如果第一部分关键字与第二部分关键字之间的间隔较大,说明间隔内是需要填写具体的企业名称或法人代表等,那么相应的章就得盖在间隔内具体的企业名称或法人代表字上。预设阈值可以是两个字符或文字的宽度值。
若间隔的尺寸小于或等于预设阈值,则基于第一位置确定签章位置,第一位置为在后的第二部分关键字的右侧。如果第一部分关键字与第二部分关键字之间的间隔较小,例如小于两个字符的宽度,说明间隔内无法填写具体的企业名称或法人代表等,具体的企业名称或法人代表等就得填写在在后的第二部分关键字的右边,那么相应的章就得盖在第二部分关键字的右边。预设阈值可以是两个字符或文字的宽度值。如果签章时是以章的中心点为准,那么在确定签章位置时将第二部分关键字的右侧边向右偏移预设距离的位置作为签章位置,该预设距离根据目标签章类型的签章的尺寸确定。
步骤S304,在待签章位置使用对应的目标签章类型的签章完成签章。一些可选的具体实施方式中,在待签章位置使用对应的目标签章类型的签章完成签章,包括:
获取签章类型的签章的坐标原点与中心之间的偏移量;
根据偏移量和待签章位置的中心位置计算签章坐标;
基于签章坐标进行签章。
一般电子签章时是以章的左上角为签章的坐标原点,而在确定签章位置时一般以章的中心为坐标原点,也就是说,是基于章的中心来确定签章位置的。因此,在实际签章时需要计算签章的中心与章的左上角之间的偏移量。然后基于偏移量计算签章坐标,在签章时将签章的坐标原点与签章坐标重合,完成签章的定位。
一些具体的实施方式中,每一待签章位置的信息包括待签章位置在目标文件中的页码以及待签章位置在目标文件页面中的签章坐标;
基于目标签章类型在待签章位置完成签章,包括:
根据页码和签章坐标在对应的一个或多个待签章位置完成签章。
对于一份文件中有多处需要签章的场景,本实施例提供的签章方法,可以一次性识别出该文件中所有需要签章的页面,并且确定出具体的签章位置的坐标,从而可以一次性地对一份文件中位于不同页的所有需要签章的位置进行签章。具体地,在获取到所有的待签章位置在目标文件中的页码以及在目标文件页面中的签章坐标之后,可以调取电子签章控件,一次性将所有待签章位置所在的页码和坐标传输给电子签章控件,电子签章控件生成数字签名,完成所有待签章位置的签名。尤其对于标书这样的页数很多、需要签章的地方也很多的文件,可以大大提升签章的效率和准确度。
一些可选的具体实施方式,在待签章位置使用对应的目标签章类型的签章完成签章,包括:
判断待签章位置之间的间距是否小于第一预设距离;具体地,若待签章位置是以其在目标文件页面中的相对位置坐标表示,那么需要先判断是否存在位于同一页的两个或以上的待签章位置,若存在位于同一页的两个或以上的待签章位置,则进一步判断这些待签章位置之间的间距是不是小于第一预设距离。
若存在间距小于第一预设距离的第一待签章位置和第二待签章位置,则将第一待签章位置向远离第二待签章位置移动第二预设距离和/或将第二待签章位置向远离第一待签章位置移动第三预设距离。第二预设距离和第三预设距离根据第一待签章位置和第二待签章位置对应的目标签章类型的章的尺寸确定。
在本实施例中还提供了一种文件签章装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种文件签章装置,如图4所示,包括:
文件获取模块401,用于获取待签章的目标文件;
签章类型识别模块402,用于识别目标文件对应的一个或多个目标签章类型;
签章位置获取模块403,用于获取目标文件中的一个或多个待签章位置的信息;
签章模块404,用于在待签章位置使用对应的目标签章类型的签章完成签章。
在一些可选的实施方式中,签章类型识别模块402包括:
信息获取单元,用于基于目标文件得到目标信息;
传输单元,用于将目标信息输入至目标检测模型;
签章类型确定单元,用于基于目标检测模型的输出确定目标文件对应的目标签章类型。
在一些可选的实施方式中,签章类型识别模块402还包括:
第一关键字识别单元,用于识别目标文件中的第一关键字;
第一目标签章类型确定单元,用于根据第一关键字确定目标文件对应的第一目标签章类型;
签章类型确定单元,用于基于目标检测模型的输出确定目标文件对应的第二目标签章类型;基于第一目标签章类型和第二目标签章类型,确定目标文件对应的目标签章类型。
在一些可选的实施方式中,该装置还包括:
样本获取模块,用于获取各签章类型的训练样本,并获取训练样本对应的签章类型作为标注;
数据集选取模块,用于选取部分训练样本形成训练集,另选部分训练样本形成验证集;
模型建立模块,用于建立待训练检测模型;
参数配置模块,用于配置训练参数;
训练模块,用于利用训练集中的训练样本对待训练检测模型进行训练;
评估模块,用于使用验证集对每次迭代训练后的待训练检测模型进行评估得到评估结果;
模型筛选模块,用于将评估结果最优的待训练检测模型作为目标检测模型。
在一些可选的实施方式中,签章位置获取模块403包括:
第二关键字位置获取单元,用于识别目标文件中的第二关键字并获取第二关键字在目标文件中的目标位置;
待签章位置确定单元,用于基于目标位置确定待签章位置。
在一些可选的实施方式中,第二关键字包括第一部分关键字与第二部分关键字,目标位置包括第一部分关键字所在的第一目标位置和第二部分关键字所在的第二目标位置;
待签章位置确定单元,包括:
间隔尺寸获取子单元,用于基于第一目标位置和第二目标位置获取第一部分关键字与第二部分关键字之间的间隔的尺寸;
第一待签章位置确定子单元,用于在间隔的尺寸大于预设阈值的情况下,基于间隔的中心位置确定待签章位置;
第二待签章位置确定子单元,用于在间隔的尺寸小于或等于预设阈值的情况下,基于第一位置确定签章位置,第一位置为在后的第二部分关键字的右侧。
在一些可选的实施方式中,签章模块404包括:
偏移量获取单元,用于获取签章类型的签章的坐标原点与中心之间的偏移量;
签章坐标计算单元,用于根据偏移量和待签章位置的中心位置计算签章坐标;
签章单元,用于基于签章坐标进行签章。
在一些可选的实施方式中,每一待签章位置的信息包括待签章位置在目标文件中的页码以及待签章位置在目标文件页面中的签章坐标;
签章模块404,用于根据页码和签章坐标在对应的一个或多个待签章位置完成签章。
在一些可选的实施方式中,签章模块404包括:
判断单元,用于判断待签章位置之间的间距是否小于第一预设距离;
调整单元,用于在存在间距小于第一预设距离的第一待签章位置和第二待签章位置的情况下,将第一待签章位置向远离第二待签章位置移动第二预设距离和/或将第二待签章位置向远离第一待签章位置移动第三预设距离。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例中的文件签章装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路)电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
本发明实施例还提供一种计算机设备,具有上述图4所示的文件签章装置。
请参阅图5,图5是本发明可选实施例提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,存储器20存储有可由至少一个处理器10执行的指令,以使至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (12)

1.一种文件签章方法,其特征在于,所述方法包括:
获取待签章的目标文件;
识别所述目标文件对应的一个或多个目标签章类型;
获取所述目标文件中的一个或多个待签章位置的信息;
在所述待签章位置使用对应的所述目标签章类型的签章完成签章。
2.根据权利要求1所述的方法,其特征在于,所述识别所述目标文件对应的一个或多个目标签章类型,包括:
基于所述目标文件得到目标信息;
将所述目标信息输入至目标检测模型;
基于所述目标检测模型的输出确定所述目标文件对应的目标签章类型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标检测模型的输出确定所述目标文件对应的目标签章类型之前,还包括:
识别所述目标文件中的第一关键字;
根据所述第一关键字确定所述目标文件对应的第一目标签章类型;
所述基于所述目标检测模型的输出确定所述目标文件对应的目标签章类型,包括:
基于所述目标检测模型的输出确定所述目标文件对应的第二目标签章类型;
基于所述第一目标签章类型和所述第二目标签章类型,确定所述目标文件对应的所述目标签章类型。
4.根据权利要求2所述的方法,其特征在于,所述将所述目标信息输入至目标检测模型之前,还包括:
获取各签章类型的训练样本,并获取所述训练样本对应的签章类型作为标注;
选取部分所述训练样本形成训练集,另选部分所述训练样本形成验证集;
建立待训练检测模型;
配置训练参数;
利用所述训练集中的所述训练样本对所述待训练检测模型进行训练;
使用所述验证集对每次迭代训练后的所述待训练检测模型进行评估得到评估结果;
将所述评估结果最优的所述待训练检测模型作为所述目标检测模型。
5.根据权利要求1所述的方法,其特征在于,所述获取所述目标文件中的一个或多个待签章位置的信息,包括:
识别所述目标文件中的第二关键字并获取所述第二关键字在所述目标文件中的目标位置;
基于所述目标位置确定所述待签章位置。
6.根据权利要求5所述的方法,其特征在于,所述第二关键字包括第一部分关键字与第二部分关键字,所述目标位置包括所述第一部分关键字所在的第一目标位置和所述第二部分关键字所在的第二目标位置;
所述基于所述目标位置确定所述待签章位置,包括:
基于所述第一目标位置和所述第二目标位置获取所述第一部分关键字与所述第二部分关键字之间的间隔的尺寸;
若所述间隔的尺寸大于预设阈值,则基于所述间隔的中心位置确定所述待签章位置;
若所述间隔的尺寸小于或等于所述预设阈值,则基于第一位置确定签章位置,所述第一位置为在后的所述第二部分关键字的右侧。
7.根据权利要求6所述的方法,其特征在于,所述在所述待签章位置使用对应的所述目标签章类型的签章完成签章,包括:
获取所述签章类型的签章的坐标原点与中心之间的偏移量;
根据所述偏移量和所述待签章位置的中心位置计算签章坐标;
基于所述签章坐标进行签章。
8.根据权利要求1-7中任一项所述的方法,其特征在于,每一所述待签章位置的信息包括所述待签章位置在所述目标文件中的页码以及所述待签章位置在所述目标文件页面中的签章坐标;
所述在所述待签章位置使用对应的所述目标签章类型的签章完成签章,包括:
根据所述页码和所述签章坐标在对应的一个或多个所述待签章位置完成签章。
9.根据权利要求8所述的方法,其特征在于,所述在所述待签章位置使用对应的所述目标签章类型的签章完成签章,包括:
判断所述待签章位置之间的间距是否小于第一预设距离;
若存在间距小于所述第一预设距离的第一待签章位置和第二待签章位置,则将所述第一待签章位置向远离所述第二待签章位置移动第二预设距离和/或将所述第二待签章位置向远离所述第一待签章位置移动第三预设距离。
10.一种文件签章装置,其特征在于,所述装置包括:
文件获取模块,用于获取待签章的目标文件;
签章类型识别模块,用于识别所述目标文件对应的一个或多个目标签章类型;
签章位置获取模块,用于获取所述目标文件中的一个或多个待签章位置的信息;
签章模块,用于在所述待签章位置使用对应的所述目标签章类型的签章完成签章。
11.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至9中任一项所述的文件签章方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至9中任一项所述的文件签章方法。
CN202311617425.2A 2023-11-29 2023-11-29 文件签章方法、装置、计算机设备及存储介质 Pending CN117437649A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311617425.2A CN117437649A (zh) 2023-11-29 2023-11-29 文件签章方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311617425.2A CN117437649A (zh) 2023-11-29 2023-11-29 文件签章方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN117437649A true CN117437649A (zh) 2024-01-23

Family

ID=89558410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311617425.2A Pending CN117437649A (zh) 2023-11-29 2023-11-29 文件签章方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN117437649A (zh)

Similar Documents

Publication Publication Date Title
CN111476227B (zh) 基于ocr的目标字段识别方法、装置及存储介质
CN111652232B (zh) 票据识别方法及装置、电子设备和计算机可读存储介质
US20180267946A1 (en) Techniques and systems for storing and protecting signatures and images in electronic documents
CN111639648B (zh) 证件识别方法、装置、计算设备和存储介质
CN111310750B (zh) 一种信息处理方法、装置、计算设备及介质
US20210390299A1 (en) Techniques to determine document recognition errors
CN111931771B (zh) 票据内容识别方法、装置、介质及电子设备
CN113673500A (zh) 证件图像识别方法、装置、电子设备及存储介质
CN112417899A (zh) 文字翻译方法、装置、计算机设备和存储介质
CN113360737B (zh) 页面内容采集方法、装置、电子设备和可读介质
CN112990142B (zh) 一种基于ocr的视频导图生成方法、装置、设备及存储介质
CN112418206B (zh) 基于位置检测模型的图片分类方法及其相关设备
CN117115823A (zh) 一种篡改识别方法、装置、计算机设备和存储介质
CN112560855A (zh) 图像信息提取方法、装置、电子设备及存储介质
CN116774973A (zh) 数据渲染方法、装置、计算机设备及存储介质
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
CN116453125A (zh) 基于人工智能的数据录入方法、装置、设备及存储介质
CN111368709A (zh) 图片文本的识别方法、装置、设备及可读存储介质
CN109409362A (zh) 基于tesseract引擎的图片敏感词检测和定位方法和装置
CN117437649A (zh) 文件签章方法、装置、计算机设备及存储介质
CN113936187A (zh) 文本图像合成方法、装置、存储介质及电子设备
CN114140649A (zh) 票据分类方法、票据分类装置、电子设备和存储介质
CN112580334A (zh) 一种文案处理方法、装置、服务器及存储介质
CN113283231A (zh) 获取签章位的方法、设置系统、签章系统及存储介质
CN112396057A (zh) 一种字符识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination