CN113434912B - 一种材料合规性校验方法及装置 - Google Patents
一种材料合规性校验方法及装置 Download PDFInfo
- Publication number
- CN113434912B CN113434912B CN202110976748.5A CN202110976748A CN113434912B CN 113434912 B CN113434912 B CN 113434912B CN 202110976748 A CN202110976748 A CN 202110976748A CN 113434912 B CN113434912 B CN 113434912B
- Authority
- CN
- China
- Prior art keywords
- signature
- features
- picture
- role
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Bioethics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Collating Specific Patterns (AREA)
Abstract
本申请提供一种材料合规性校验方法及装置,所述方法包括:获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域;针对所述每个目标检测结果,执行以下操作:从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色;根据确定出的角色,确定与所述角色相关联的签名数据库;将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规。通过以上技术方案,可以自动的完成对材料合规性的校验,极大的提高了材料的审核效率,有效的降低了人力成本。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种材料合规性校验方法及装置。
背景技术
随着信息化的发展,用户在使用电子政务系统提交材料时,通常可以使用电子材料替代传统的纸质的书面材料,这样既节约了资源,又提高了政务的处理效率。
然而,对材料的审核环节仍由人工负责,当材料总量过大时,很容易出现材料积压导致的处理效率低下的问题,而加大人手又会增加人力成本。
例如,行政执法机关在向人民法院申请行政非诉案件的强制执行申请时,通常是进行批量申请,向法院提交了大量的案件材料,导致法院对材料是否符合法院规定的校验成为了一项人力成本高、处理效率低的工作。
发明内容
有鉴于此,为解决材料合规性校验效率低下,人力成本过高的问题,本申请提供一种材料合规性校验方法及装置。
具体地,本申请是通过如下技术方案实现的:
第一方面,本申请提出一种材料合规性校验方法,该方法包括:
获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域;
针对所述每个目标检测结果,执行以下操作:
从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色;
根据确定出的角色,确定与所述角色相关联的签名数据库;其中,所述签名数据库至少包括签名者的签名图片;
将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规。
第二方面,本申请还提出一种材料合规性校验装置,该装置包括:
多目标检测单元,用于获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域;
角色分类单元,用于从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色;
签名数据库确定单元,用于根据确定出的角色,确定与所述角色相关联的签名数据库;其中,所述签名数据库至少包括签名者的签名图片;
匹配单元,用于将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规。
本申请的实施例提供的技术方案可以包括以下有益效果:
通过多目标检测确定材料中的签名,再根据提取到的签名所在区域的特征确定签名对应的角色,将签名与角色库中的签名进行匹配,根据匹配的结果确定材料是否合规。通过以上技术方案,可以自动的完成对材料合规性的校验,极大的提高了材料的审核效率,有效的降低了人力成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
图1是本申请一示例性实施例示出的一种材料合规性校验方法的流程图;
图2是本申请一示例性实施例示出的一种材料的示意图;
图3是本申请一示例性实施例示出的一种确定签名对应的角色的流程图;
图4是本申请一示例性实施例示出的另一种材料的示意图;
图5是本申请一示例性实施例示出的一种印章所在区域的示意图;
图6是本申请一示例性实施例示出的一种的材料合规性校验装置所在电子设备的硬件结构图;
图7是本申请一示例性实施例示出的一种材料合规性校验装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
目前,虽然提交电子材料在一定程度上提高了材料的审核效率,但由于仍采用人工审核的方式,在面对大量材料时,即使增加人手进行处理,也很难显著提高效率,最终既费时又费力。
其中,材料中通常会出现签名、印章等待校验的关键信息,审核人员需要验证签名是否签名者本人的真实签名、签名者是否具有对该材料签名的权限、印章是否与材料的核发单位的印章一致等信息,人工的检索和比对耗费了大量的时间,而材料中往往不止一个签名或印章,这就更加大了每个材料的工作量。
有鉴于此,本申请提供一种从材料的图像中获取若干签名,再确定签名对应的角色,并将获取到的签名与角色关联的签名库进行匹配,实现自动对材料合规性进行校验的技术方案。
在实现时,获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域;
例如,根据预先训练的多目标检测模型,将输入的材料的图像,按照类别划分成多个区域,并在材料的图像中,框选出若干签名所在区域,得到签名的图片。
针对所述每个目标检测结果,执行以下操作:
从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色;
例如,可以从各框选出的签名所在区域中,提取各区域中的文本特征,以及图片特征,再基于所述文本特征和所述图片特征构建组合特征,将所述组合特征作为所述角色分类模型的输入,确定各签名分别对应的角色。
根据确定出的角色,确定与所述角色相关联的签名数据库;其中,所述签名数据库至少包括签名者的签名图片;
将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规;
例如,可以将签名的图片以及签名数据库中的签名图片输入至相似度匹配模型,进行相似度计算,并根据相似度计算的结果确定签名的图片是否与确定出的签名数据库中的签名图片匹配,如果检测到的签名都匹配,则确定该材料合规,如果有签名出现不匹配,则确定该材料不合规。
在以上技术方案中,通过多目标检测确定材料中的签名,再根据提取到的签名所在区域的特征确定签名对应的角色,将签名与角色库中的签名进行匹配,根据匹配的结果确定材料是否合规。通过以上技术方案,可以自动的完成对材料合规性的校验,极大的提高了材料的审核效率,有效的降低了人力成本。
接下来对本申请实施例进行详细说明。
请参见图1,图1是本申请一示例性实施例示出的一种材料合规性校验方法的流程图,如图1所示,包括以下步骤:
步骤101:获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域;
针对所述每个目标检测结果,执行以下操作:
步骤102:从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色;
步骤103:根据确定出的角色,确定与所述角色相关联的签名数据库;其中,所述签名数据库至少包括签名者的签名图片;
步骤104:将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规。
其中,所述材料中至少包括待校验的若干签名,所述若干签名分别来自具有特定角色的签名者。
例如,在一份材料中,可能需要多个特定角色的人员对材料进行签名,从而使得材料生效,如当事人签名、询问人签名、审核人签名等。
值得说明的是,通常材料可以分为多种类型,例如行政处罚决定书、不予受理决定书等,通常各类型的材料,规定了需要哪些角色的签名者的签名,或者哪些单位的印章。
在一个例子中,可以根据材料的标题内容,确定该材料中待校验的对象。
另外,材料可以是电子材料,也可以是对纸质材料经扫描后得到的材料。
例如,材料可以是word、PDF文件,包含了通过手写板输入的签名,或者插入了预先制作好的手写签名;
又如,材料可以是书面材料的扫描文件,包含了签名者在书面材料上签名的笔迹。
为了输入的图像能够有一个较好的图像识别效果,需要对图像进行处理,例如,可以通过重新调整尺寸的方式,将不同尺寸的图像以统一的尺寸大小输入至多目标检测模型。
值得说明的是,为了对图像有一个较好的处理效果,除了对图像的尺寸进行调整外,还可以对图像进行优化,例如对图像的亮度、对比度、饱和度进行调整,本申请对此不做限定,本领域技术人员可以根据实际需要自行选择。
需要说明的是,本申请需要对材料中出现的签名进行合规性校验,对于何种材料、何种签名本申请不做限定,均可采用本申请提供的方法。
在本实施例中,获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果。
具体的,可以先将待校验的材料转换成图像,再将图像输入至预先训练好的多目标检测模型,通过图像识别技术,输出多目标检测的结果。
对于多页的材料,通过转换会得到多张图像,可以将这些图像进行标号之后,再分别输入至预先训练好的多目标检测模型中。
其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域。
在一个例子中,签名的图片是多目标检测模型输出的,从材料的图像中截取的签名的笔迹的图片,签名所在的区域则是签名的图片在图像中的坐标或者相对位置。
值得说明的是,多目标检测的结果可以是材料中的不同类别的元素,以及这些元素在图像中的坐标。例如,材料中包含的不同类别的元素可以是签名、印章、手印、图片、标题以及文本等。
而对材料的图像进行多目标检测后,可以得到哪些类型的结果,与多目标检测模型的训练过程有关,可以通过人工对材料的图像中各个组成元素进行标注,进行人为的分类,再用标注后的图像进行模型训练,得到训练好的多目标检测模型。
例如,对于标注后的样本图像,可以使用mobile net v3对图像的特征进行提取,再使用yolo v3进行目标检测和目标分类的训练,得到训练好的多目标检测模型。对于具体的训练过程,在此不做不限定,本领域技术人员可以根据实际需要选择合适的神经网络对模型进行训练。
通过上述过程,可以得到预设了特定类型的检测对象的多目标检测模型,根据输入的图像,输出多目标检测的结果,即特定类型的检测对象。
在一个例子中,请参见图2,图2是本申请一示例性实施例示出的一种材料的示意图,如图2所示,将图2输入至多目标检测模型之后,可以检测到图2中的多个签名的图片,并用方形框选出这些签名所在的区域。
值得说明的是,图2中出现的马赛克是申请人出于对隐私信息的保护而添加的,并不影响图2作为本方案的示意图,并且在实际对图像进行识别时,图像中例如签名或者签章所在区域并没有这种马赛克,特此说明。并且,图4和图5也基于相似的理由进行了同样的处理,后续不再赘述。
进一步的,当对多目标检测模型进行训练时,可以调整模型的输出,使得模型可以输出图2中待检测的印章,并用方形框选出印章所在的区域。
在示出的一种实施方式中,所述材料还包括待校验的印章;所述多目标检测的结果还包括所述印章的图片,以及所述印章所在区域。
例如,图2中共检测到4处签名所在区域,以及两处印章所在区域,对于图2所示的材料的图像,需要对这些签名和印章分别进行合规性校验。
另外,图2中的笔迹除手写的签名外,还有例如“同意进行处理”等意见性描述的笔迹,为避免被误检测,在多目标检测模型训练时,可以基于手写笔迹的长度,或者笔迹签名是否有类似“当事人:”、“审核人:”之类的用于指示签名对应的角色的文本,辅助判断是手写的签名还是手写的意见等,本申请对此不做限定,本领域技术人员可以根据实际需要自行设定。
在本实施例中,针对所述每个目标检测结果,可以从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色。
例如,在确定出若干签名的图片,以及若干签名所在区域之后,可以提取若干签名所在区域的图片特征,将图片特征输入至预先训练好的角色分类模型,从而确定若干签名分别对应的角色。
其中,为获得更多维度的特征,可以增加提取的特征的类型。
在示出的一种实施方式中,所述若干签名所在区域中包括用于指示所述签名对应的角色的文本;
例如,在签名图片的前面,有指示签名对应的角色的“当事人”、“审核人”以及“询问人”等文本信息。
进一步的,可以提取所述签名所在区域中的文本特征,以及所述签名所在区域的图片特征,并基于所述文本特征和所述图片特征构建组合特征,将所述组合特征作为所述角色分类模型的输入。
例如,可以提取审核人签名所在区域的文本特征,即审核人,以及提取该区域的图片特征,即签名图片,并将文本特征和图片特征通过合并的方式构建组合特征,将组合特征输入至训练好的角色分类模型,从而确定该签名图片对应的角色为审核人。
然而,有些情况下,需要将大量的纸质的书面材料通过扫描转换成电子材料,在这个扫描转换过程中,很可能出现信息丢失的情况,例如,“审核人”可能被遮挡,或者出现不清晰的情况,导致提取到的文本特征不全面或者提取不到文本特征,最终导致签名的角色确定出现偏差。
但是,由于这些材料通常有一些固定的模版,或者对于格式有着某些固定的要求,即材料中各个元素的位置布局几乎是固定的,具有着某些规律。例如,标题所在区域、印章所在区域、以及各角色的签名所在的区域等。因此,可以利用材料的布局信息辅助判断签名对应的角色。
在示出的一种实施方式中,可以提取所述材料的图像的布局特征;
进一步的,提取所述签名所在区域中的文本特征、所述签名所在区域的图片特征以及所述签名所在区域的位置特征,并基于所述布局特征、文本特征、所述图片特征和所述位置特征构建组合特征,将所述组合特征作为所述角色分类模型的输入。
具体的,可以将材料的图像输入至卷积神经网络,提取材料的布局特征;再分别提取所述若干签名所在区域中的文本特征、所述若干签名所在区域的图片特征以及所述若干签名所在区域的位置特征,并基于所述布局特征、文本特征、所述图片特征和所述位置特征构建组合特征,将所述组合特征作为所述角色分类模型的输入。
其中,角色分类模型可以通过卷积神经网络训练获得。
例如,对于审核人签名所在的区域,根据该区域的文本,即审核人的文本特征以及所在的位置特征,以及该区域的图片,即签名图片的特征以及签名图片所在的位置特征,结合材料的图像中的布局特征,确定该签名所在区域在该材料中属于哪个角色。
举例来说,请参见图3,图3是本申请一示例性实施例示出的一种确定签名对应的角色的流程图,如图3所示,包括以下步骤:
步骤301:输出对图像的多目标检测结果。
具体的,在将材料的图像输入至预先训练好的多目标检测模型之后,可以输出对于签名、印章、标题、文本的检测结果,即类似于图2中的各个方形框。
其中,可以将检测结果表示为{Ci,X1i,Y1i,X2i,Y2i},C表示检测结果的类别,(X1,Y1) 、(X2,Y2) 分别表示检测结果中的方形区域左上角坐标,以及右下角坐标,标号i表示材料中上全部检测结果的编号。
步骤302:对图像中的文本信息进行文字识别。
具体的,需要对包含文本内容的区域进行文字识别,即,对除签名图片、印章图片之外的,标题和文本所在区域进行文字识别,得到文字识别的结果。
其中,文字识别的结果可以表示为{Wi,X1i,Y1i,X2i,Y2i},W表示包含文本内容的区域的文本信息,(X1,Y1) 、(X2,Y2) 分别表示包含文本内容区域中左上角坐标,以及右下角坐标,标号i表示材料中对文本区域的编号。
值得说明的是,签名所在区域也可以包括文本,例如在签名的笔迹之前,有指示签名对应的角色的文本,同样的,在进行多目标检测时,也会输出这部分文本的检测结果,并在进一步进行文字识别时,输出文字识别的结果。
步骤303:提取图像中的布局特征。
具体的,在完成上述对图像的多目标检测的结果进行处理之后,可以将材料经过转换后的图像,进行进一步处理,得到尺寸统一的图像,然后对图像进行多通道卷积计算,获取图像的特征。
例如,对图像进行卷积计算的参数可以是wc,hc,C,Cout,其中,C表示输入图像的通道数,例如,RGB格式的彩色图像通道数为3,w、h分别表示卷积核的宽度和高度,而Cout表示使用卷积计算的卷积核数,而out为一个正整数。
经过上述卷积计算,可以再针对Cout维度的所有维度分别进行计算;其中,每个维度分别对应的特征可以用Fcn表示,Fcn为一个w*h的矩阵,n的值为 1,2,3……out;
继续举例,在使用以下公式分别进行各个维度的计算时,可以用j表示当前计算的维度,用k表示所有的维度,j的值为 1,2,3……out,k的值为 1,2,3……out;
进一步的,在计算出所有维度分别对应的Fc1,Fc2,Fc3……Fcn之后,可以进行特征融合,得到图像的特征F。
步骤304:提取图像中的文本特征。
接下来,可以获取上述多目标检测结果中对于文本内容的处理结果,即对类别为标题和文本的文字识别结果,以及签名所在区域的文本的文字识别结果。
进一步的,可以将文字识别的结果,即文本内容和所在区域的坐标,输入嵌入模型,得到材料的图像中标题和文本的嵌入特征。嵌入模型可以是多种类型的模型,本申请对此不做限定,本领域技术人员可以自行选择。
例如,对于文字识别结果中的文本内容,可以通过词向量进行处理,将文本内容转换为向量;对于坐标也可以进行向量化处理,将四个坐标值转换为向量;再对向量化后的文本内容和坐标值进行融合,得到最终标题和文本对应的嵌入特征。其中,对于向量化处理所采用的算法,本申请不做限定,本领域技术人员可以根据需要自行选择。
其中,为保证坐标值的统一,可以预先规定图像的尺寸,在获取到材料的图像之后,先检测图像的宽和高,如果超出预设尺寸,则进行等比例压缩,从而规整了各图像的坐标信息。
步骤305:将图像的布局特征和文本特征融合。
具体的,可以将上述图像的特征和上述标题和文本对应的特征进行融合,并通过计算映射到更高维度,得到新的可以表示更多含义的特征Ff。
例如,可以基于多头注意力计算,进行维度转换。对于采用何种方式计算,本申请不做限定,本领域技术人员可以自行选择。
步骤306:提取图像中的签名特征。
具体的,可以获取上述多目标检测结果中的签名图片,以及签名所在区域的坐标进行向量化处理,提取签名图片的特征,以及签名所在区域的位置特征。
例如,可以对签名图片进行向量化处理,将图片转换为向量;对于签名所在区域的坐标也可以进行向量化处理,将四个坐标值转换为向量;再对向量化后的签名图片和坐标值输入至卷积神经网络,得到签名对应的特征。其中,对于向量化处理所采用的算法,本申请不做限定,本领域技术人员可以根据需要自行选择。
步骤307:将图像中的签名特征与前述特征融合。
具体的,将上述签名对应的特征,和将图像的布局特征和文本特征融合后的特征Ff进行融合,得到用于对签名进行分类的特征Fclass。
步骤308:确定签名对应的角色。
具体的,可以对Fclass进行softmax操作,将签名的分类结果以概率的形式展现,概率最高的结果就是签名对应的角色。
例如,假设进行softmax操作之后,得到对当前签名进行分类的结果为:审核人=0.7,询问人=0.2,当事人=0.1,则可以确定当前签名对应的角色为审核人。
在本实施例中,根据确定出的角色,确定与所述角色相关联的签名数据库。其中,所述签名数据库至少包括签名者的签名图片。
具体的,可以预先设置各个角色对应的签名数据库,并在数据库中存储该角色的签名者的签名图片,在确定出角色之后,就可以直接确定出该角色相关联的签名数据库。
在本实施例中,将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规。
具体的,在确定出签名对应的角色之后,可以确定出与签名对应的角色相关联的签名数据库,将签名图片与角色签名数据库中的签名图片进行特征比对,当比对结果为一致时,可以确定该签名是由位于角色签名数据库的签名者签署,即该签名符合规定。当各个签名都通过匹配时,确定该材料符合规定。
例如,当确定当前签名对应的角色是审核人之后,可以将当前签名的图片与审核人这个角色相关联的签名数据库中的签名图片进行特征比对,如果签名数据库中有与当前签名一致的签名图片,说明当前签名确实是由审核人所签署的。
在示出的一种实施方式中,可以将所述签名的图片以及所述签名数据库中的签名图片输入至相似度匹配模型,进行相似度计算,并根据相似度计算的结果确定所述签名的图片是否与确定出的所述签名数据库中的签名图片匹配。
例如,可以预先将角色的签名数据库中的签名图片输入至相似度匹配模型,输出用于描述签名数据库中签名图片的特征的集合,再将材料的图像中检测到的签名图片输入至相似度匹配模型,输出描述签名图片的特征,与集合中的特征进行相似度计算;其中,相似度计算的输出值可介于0~1之间,输出值越小,表明相似度越高。
进一步的,如果相似度计算的输出值接近于0,说明签名图片与签名数据库中的签名图片具有高度的相似性,可以确定该签名图片由签名数据库中的签名者所签署。当若干签名都通过匹配时,可以确定该材料符合规定;如果没有通过匹配,则该材料不符合规定。
另外,还可以输出用于提示不合规的签名对应的角色的提示信息,例如,当审核人的签名图片未匹配到相应的审核人时,可以提示为:审核人不存在。
在示出的一种实施方式中,所述签名数据库还包括签名者的签名权限信息;
进一步的,可以获取所述签名对应的签名者的签名权限信息,基于所述签名权限信息确定所述材料是否合规。
具体的,在角色签名数据库中可以为签名者分配对材料签名的权限,还可以为签名者分配对不同类型的材料的签名权限,也可以根据签名者的职位分配不同的签名权限,本申请对此不做限定,本领域技术人员可以根据需要自行设定。
例如,可以在获取材料时,确定材料的类型,然后在确定出签名所属的角色之后,根据角色相关联的签名数据库判断该签名对应的签名者是否具有对该类型的材料签名的权限。
又如,可以根据签名数据库中记载的签名者的职位,确定该签名者是否拥有对该材料进行签名的权限。
其中,还可以基于多目标检测确定材料的标题区域,根据标题区域的文本内容确定材料的类型。
除上述对签名的合规性校验之外,对于印章的合规性校验也是常见的需求。
在示出的一种实施方式中,将所述印章的图片与印章数据库中的印章图片进行匹配,根据匹配的结果确定所述材料是否合规。
具体的,在基于多目标检测模型确定出印章的图片之后,可以将印章的图片与印章数据库中的印章图片进行特征比对,当比对结果为一致时,可以确定该印章为正确的印章,该材料符合规定。
在示出的一种实施方式中,可以对所述材料的标题、正文进行文字识别,根据所述文字识别的结果确定所述印章的核发单位,将所述印章的图片与印章数据库中所述核发单位的印章图片进行匹配,以确定所述印章是否为所述核发单位的印章。
值得说明的是,在对印章进行合规性判断时,不光要判断印章是否为真实的印章,还需要判断印章与材料是否对应。
具体的,可以对材料的标题、正文进行文字识别,通过关键词识别确定印章的核发单位,再将该印章的图片与印章数据库中保存的该核发单位的印章图片进行匹配,来确定该印章是否为该核发单位的印章。
例如,可以将材料的标题、正文输入信息抽取模型,输出标题、正文中涉及的核发单位。其中,对于确定核发单位所使用的模型,本申请不做限定,本领域技术人员可以根据需要自行选择。
举例来说,请参见图4,图4是本申请一示例性实施例示出的另一种材料的示意图,如图4所示,可以将该材料的图像输入至多目标检测模型,确定出材料的标题区域,以及印章所在区域,再根据该材料的标题的文本内容可以确定该材料的核发单位,然后将印章的图片和印章数据库中保存的该核发单位的印章图片进行特征比对,确定该印章的图片是否真实有效。
需要说明的是,在对印章的图片进行特征比对时,也可以进行相似度计算,可以参照前述签名图片相似度计算的过程,在此不再赘述。
在示出的一种实施方式中,可以判断所述印章所在的区域是否对所述材料中的内容产生了遮挡,以确定所述材料是否合规。
请参见图5,图5是本申请一示例性实施例示出的一种印章所在区域的示意图,如图5所示,图5中在使用电子印章时,由于未设置透明模式,导致印章对材料的其他区域产生了遮挡,这种情况是不符合规定的。
具体的,当确定出材料中的印章时,可以判断印章的图片的透明度,从而确定印章所在的区域是否对材料中的内容产生了遮挡,如果图片的透明度达到阈值,则未产生遮挡,满足材料合规性要求。
在以上技术方案中,通过多目标检测确定材料中的签名,再根据提取到的签名所在区域的特征确定签名对应的角色,将签名与角色库中的签名进行匹配,根据匹配的结果确定材料是否合规。通过以上技术方案,可以自动的完成对材料合规性的校验,极大的提高了材料的审核效率,有效的降低了人力成本。
与上述方法实施例相对应,本申请还提供了装置的实施例。
与上述方法实施例相对应,本申请还提供了一种材料合规性校验装置的实施例。本申请的材料合规性校验装置的实施例可以应用在电子设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图6所示,为本申请一示例性实施例示出的一种的材料合规性校验装置所在电子设备的硬件结构图,除了图6所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该电子设备的实际功能,还可以包括其他硬件,对此不再赘述。
请参见图7,图7是本申请一示例性实施例示出的一种材料合规性校验装置的框图,如图7所示,所述材料合规性校验装置700可以应用在前述图6所示的电子设备中,包括:
多目标检测单元701,用于获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域;
角色分类单元702,用于从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色;
签名数据库确定单元703,用于根据确定出的角色,确定与所述角色相关联的签名数据库;其中,所述签名数据库至少包括签名者的签名图片;
匹配单元704,用于将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规。
在一实施例中,所述签名数据库还包括签名者的签名权限信息;
进一步的,所述匹配单元704:
获取所述签名对应的签名者的签名权限信息,基于所述签名权限信息确定所述材料是否合规。
在一实施例中,所述匹配单元704进一步:
将所述签名的图片以及所述签名数据库中的签名图片输入至相似度匹配模型,进行相似度计算,并根据相似度计算的结果确定所述签名的图片是否与确定出的所述签名数据库中的签名图片匹配。
在一实施例中,所述签名所在区域中包括用于指示所述签名对应的角色的文本;
进一步的,所述角色分类单元702:
提取所述签名所在区域中的文本特征,以及所述签名所在区域的图片特征,并基于所述文本特征和所述图片特征构建组合特征,将所述组合特征作为所述角色分类模型的输入。
在一实施例中,所述装置还包括:
布局特征提取单元,用于提取所述材料的图像的布局特征;
进一步的,所述角色分类单元702:
提取所述签名所在区域中的文本特征、所述签名所在区域的图片特征以及所述签名所在区域的位置特征,并基于所述布局特征、文本特征、所述图片特征和所述位置特征构建组合特征,将所述组合特征作为所述角色分类模型的输入。
在一实施例中,所述材料还包括待校验的印章;所述多目标检测的结果还包括所述印章的图片,以及所述印章所在区域。
在一实施例中,所述匹配单元704进一步:
将所述印章的图片与印章数据库中的印章图片进行匹配,根据匹配的结果确定所述材料是否合规。
在一实施例中,所述匹配单元704进一步:
对所述材料的标题、正文进行文字识别,根据所述文字识别的结果确定所述印章的核发单位,将所述印章的图片与印章数据库中所述核发单位的印章图片进行匹配,以确定所述印章是否为所述核发单位的印章。
在一实施例中,所述匹配单元704进一步:
判断所述印章所在的区域是否对所述材料中的内容产生了遮挡,以确定所述材料是否合规。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同/相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于客户端设备实施例、装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的装置、装置、模块或模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
与上述方法实施例相对应,本说明书还提供了一种电子设备的实施例。该电子设备包括:处理器以及用于存储机器可执行指令的存储器;其中,处理器和存储器通常通过内部总线相互连接。在其他可能的实现方式中,所述设备还可能包括外部接口,以能够与其他设备或者部件进行通信。
在本实施例中,通过读取并执行所述存储器存储的与用户身份验证逻辑对应的机器可执行指令,所述处理器被促使:
获取所述材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,所述多目标检测的结果至少包括所述若干签名的图片,以及所述若干签名所在区域;
分别从所述若干签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述若干签名分别对应的角色;
将所述若干签名的图片分别与所述若干签名对应的角色相关联的签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (9)
1.一种材料合规性校验方法,所述材料至少包括待校验的若干签名,所述若干签名分别来自具有特定角色的签名者,所述方法包括:
获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域;
针对所述每个目标检测结果,执行以下操作:
从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色;根据确定出的角色,确定与所述角色相关联的签名数据库;其中,所述签名数据库至少包括签名者的签名图片;
将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规;
所述方法还包括:提取所述材料的图像的布局特征;
所述从所述签名所在区域中提取预设类型的特征,包括:
提取所述签名所在区域中的文本特征、所述签名所在区域的图片特征以及所述签名所在区域的位置特征,并基于所述布局特征、文本特征、所述图片特征和所述位置特征构建组合特征,将所述组合特征作为所述角色分类模型的输入。
2.根据权利要求1所述的方法,所述签名数据库还包括签名者的签名权限信息;
所述确定所述材料是否合规,包括:
获取所述签名对应的签名者的签名权限信息,基于所述签名权限信息确定所述材料是否合规。
3.根据权利要求1所述的方法,所述将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规,包括:
将所述签名的图片以及所述签名数据库中的签名图片输入至相似度匹配模型,进行相似度计算,并根据相似度计算的结果确定所述签名的图片是否与确定出的所述签名数据库中的签名图片匹配。
4.根据权利要求1所述的方法,所述签名所在区域中包括用于指示所述签名对应的角色的文本;
所述从所述签名所在区域中提取预设类型的特征,包括:
提取所述签名所在区域中的文本特征,以及所述签名所在区域的图片特征,并基于所述文本特征和所述图片特征构建组合特征,将所述组合特征作为所述角色分类模型的输入。
5.根据权利要求1所述的方法,所述材料还包括待校验的印章;所述多目标检测的结果还包括所述印章的图片,以及所述印章所在区域。
6.根据权利要求5所述的方法,所述确定所述材料是否合规,包括:
将所述印章的图片与印章数据库中的印章图片进行匹配,根据匹配的结果确定所述材料是否合规。
7.根据权利要求6所述的方法,所述将所述印章的图片与印章数据库中的印章图片进行匹配,包括:
对所述材料的标题、正文进行文字识别,根据所述文字识别的结果确定所述印章的核发单位,将所述印章的图片与印章数据库中所述核发单位的印章图片进行匹配,以确定所述印章是否为所述核发单位的印章。
8.根据权利要求7所述的方法,所述确定所述材料是否合规,包括:
判断所述印章所在的区域是否对所述材料中的内容产生了遮挡,以确定所述材料是否合规。
9.一种材料合规性校验装置,所述材料至少包括待校验的若干签名,所述若干签名分别来自具有特定角色的签名者,所述装置包括:
多目标检测单元,用于获取待校验材料的图像,将所述图像输入至多目标检测模型,并输出多目标检测的结果;其中,每个目标检测的结果至少包括所述签名的图片,以及所述签名所在区域;
角色分类单元,用于从所述签名所在区域中提取预设类型的特征,并输入至角色分类模型,以确定所述签名对应的角色;
签名数据库确定单元,用于根据确定出的角色,确定与所述角色相关联的签名数据库;其中,所述签名数据库至少包括签名者的签名图片;
匹配单元,用于将所述签名的图片与确定出的所述签名数据库中的签名图片进行匹配,根据匹配的结果确定所述材料是否合规;
所述装置还包括:提取所述材料的图像的布局特征;
所述从所述签名所在区域中提取预设类型的特征,包括:
提取所述签名所在区域中的文本特征、所述签名所在区域的图片特征以及所述签名所在区域的位置特征,并基于所述布局特征、文本特征、所述图片特征和所述位置特征构建组合特征,将所述组合特征作为所述角色分类模型的输入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110976748.5A CN113434912B (zh) | 2021-08-24 | 2021-08-24 | 一种材料合规性校验方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110976748.5A CN113434912B (zh) | 2021-08-24 | 2021-08-24 | 一种材料合规性校验方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113434912A CN113434912A (zh) | 2021-09-24 |
CN113434912B true CN113434912B (zh) | 2021-12-24 |
Family
ID=77797773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110976748.5A Active CN113434912B (zh) | 2021-08-24 | 2021-08-24 | 一种材料合规性校验方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113434912B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116092099B (zh) * | 2023-01-18 | 2023-08-18 | 黑龙江省公安厅 | 一种多目标行政执法文书信息完整性识别检测方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100594511C (zh) * | 2007-11-02 | 2010-03-17 | 北京大学 | 圆形印章的印鉴图像检索方法 |
CN109190351A (zh) * | 2018-09-19 | 2019-01-11 | 宁辛 | 基于移动终端的在线签名者身份认证系统、设备及方法 |
CN109446900A (zh) * | 2018-09-21 | 2019-03-08 | 平安科技(深圳)有限公司 | 证件真伪验证方法、装置、计算机设备及存储介质 |
US11003889B2 (en) * | 2018-10-22 | 2021-05-11 | International Business Machines Corporation | Classifying digital documents in multi-document transactions based on signatory role analysis |
US11106891B2 (en) * | 2019-09-09 | 2021-08-31 | Morgan Stanley Services Group Inc. | Automated signature extraction and verification |
CN111178290A (zh) * | 2019-12-31 | 2020-05-19 | 上海眼控科技股份有限公司 | 一种签名验证方法和装置 |
CN111932363B (zh) * | 2020-08-10 | 2023-09-26 | 中国工商银行股份有限公司 | 授权书的识别审核方法、装置、设备及系统 |
CN112115921A (zh) * | 2020-09-30 | 2020-12-22 | 北京百度网讯科技有限公司 | 一种真伪鉴别方法、装置以及电子设备 |
CN112580108B (zh) * | 2020-12-10 | 2024-04-19 | 深圳证券信息有限公司 | 签名和印章完整性验证方法及计算机设备 |
CN112597327A (zh) * | 2020-12-24 | 2021-04-02 | 交控科技股份有限公司 | 一种工单系统电子签名检验方法及系统 |
-
2021
- 2021-08-24 CN CN202110976748.5A patent/CN113434912B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113434912A (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107798299B (zh) | 票据信息识别方法、电子装置及可读存储介质 | |
US10133921B2 (en) | Methods and apparatus for capturing, processing, training, and detecting patterns using pattern recognition classifiers | |
CN112464781B (zh) | 基于图神经网络的文档图像关键信息提取及匹配方法 | |
CN110264288A (zh) | 基于信息识别技术的数据处理方法及相关装置 | |
CN109871845B (zh) | 证件图像提取方法及终端设备 | |
CN111476268A (zh) | 翻拍识别模型训练、图像识别方法、装置、设备及介质 | |
CN111222433B (zh) | 自动人脸稽核方法、系统、设备及可读存储介质 | |
US11144752B1 (en) | Physical document verification in uncontrolled environments | |
CN110675940A (zh) | 病理图像标注方法、装置、计算机设备及存储介质 | |
CN111046858B (zh) | 一种基于图像的动物物种细分类方法、系统及介质 | |
CN114359553B (zh) | 一种基于物联网的签章定位方法、系统及存储介质 | |
CN109754059A (zh) | 翻拍图像识别方法、装置、计算机设备和存储介质 | |
CN113434912B (zh) | 一种材料合规性校验方法及装置 | |
Benalcazar et al. | Synthetic ID card image generation for improving presentation attack detection | |
CN111382791B (zh) | 深度学习任务处理方法、图像识别任务处理方法和装置 | |
CN112396047A (zh) | 训练样本生成方法、装置、计算机设备和存储介质 | |
CN112257396A (zh) | 一种基于人工智能技术的手机端辅助填表方法 | |
CN111291636A (zh) | 电子签章有效识别方法、装置、系统及存储介质 | |
CN109376618A (zh) | 图像处理方法、装置及电子设备 | |
CN112699646A (zh) | 数据处理方法、装置、设备及介质 | |
CN115115552B (zh) | 图像矫正模型训练及图像矫正方法、装置和计算机设备 | |
CN116168407A (zh) | 一种身份证影像质量检验方法及系统 | |
CN113254396B (zh) | 一种多部门的案件协同管理系统 | |
CN114399626A (zh) | 图像处理方法、装置、计算机设备、存储介质及程序产品 | |
CN112434547B (zh) | 一种用户身份稽核方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |