CN118097702A - 风险检测方法、装置、计算机设备和存储介质 - Google Patents

风险检测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN118097702A
CN118097702A CN202410352637.0A CN202410352637A CN118097702A CN 118097702 A CN118097702 A CN 118097702A CN 202410352637 A CN202410352637 A CN 202410352637A CN 118097702 A CN118097702 A CN 118097702A
Authority
CN
China
Prior art keywords
image
detected
text
result
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410352637.0A
Other languages
English (en)
Inventor
杨佳敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202410352637.0A priority Critical patent/CN118097702A/zh
Publication of CN118097702A publication Critical patent/CN118097702A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Image Analysis (AREA)

Abstract

本申请涉及一种风险检测方法、装置、计算机设备、存储介质和计算机程序产品,涉及人工智能技术领域。所述方法包括:获取待检测图像,根据文字识别模型对待检测图像进行文本定位和识别,得到待检测图像中包含的文本内容;依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和文本内容,对待检测图像进行有效性检测,得到有效性结果;基于印章检测模型和文本内容对待检测图像进行检测,得到印章检测结果;根据有效性结果和印章检测结果确定待检测图像的风险检测结果。采用本方法能够提高风险检测的效率。

Description

风险检测方法、装置、计算机设备和存储介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种风险检测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着金融业务的发展,金融机构中各渠道业务量剧增,金融业务合同的用印数量随之增加。用印不规范易导致合同法律效力丧失、合同文本被恶意篡改等问题频发,因此需要对合同文档进行风险检测。
传统方法中,主要通过将合同文档进行扫描,得到合同归档的扫描件,然后,通过人工检查的方式,对扫描件进行人工筛查,实现合同文档的风险检测。
然而,传统人工筛查的方法,由于待检测的合同文档数量较大,通过人工筛查的方式进行合同文档风险检测的方法效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种风险检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种风险检测方法,包括:
获取待检测图像,根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容;
依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果;
基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果;
根据所述有效性结果和所述印章检测结果确定所述待检测图像的风险检测结果。
在其中一个实施例中,所述文字识别模型包括文本定位算法和文本识别算法;
所述根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容,包括:
根据所述文字识别模型中的文本定位算法,对所述待检测图像进行预测处理,得到所述待检测图像中包含的文本图像对应的文本边界框;
根据所述文字识别模型中的所述文本识别算法和所述文本边界框中包含的文本图像进行识别处理,得到所述待检测图像中包含的文本内容。
在其中一个实施例中,所述依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果,包括:
根据无效影像识别模型对所述待检测图像的图像内容进行识别,得到图像识别结果;
根据下划线空白识别模型、签名检测模型和所述文本内容对所述待检测图像的内容进行识别,得到内容识别结果;
根据所述图像识别结果和所述内容识别结果,确定所述待检测图像的有效性结果。
在其中一个实施例中,所述根据下划线空白识别模型、签名检测模型和所述文本内容对所述待检测图像的内容进行识别,得到内容识别结果,包括:
根据下划线空白识别模型和所述文本内容对所述待检测图像中包含的下划线内容进行检测,得到要素内容结果;
根据签名检测模型对所述待检测图像进行识别,确定所述待检测图像中的第一目标位置是否存在签名;
若所述第一目标位置存在所述签名,根据所述签名检测模型确定所述签名的呈现形式,并基于所述呈现形式确定签名内容结果;
基于所述要素内容结果和所述签名内容结果确定内容识别结果。
在其中一个实施例中,所述基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果,包括:
根据印章检测模型和所述文本内容对所述待检测图像进行印章识别,确定所述待检测图像的第二目标位置中目标印章的第一存在性结果;
对所述待检测图像中包含的三元素进行识别,并根据三元素识别结果确定所述待检测图像的第二目标位置中目标印章的第二存在性结果;
基于所述第一存在性结果和所述第二存在性结果确定印章检测结果。
在其中一个实施例中,所述对所述待检测图像中包含的三元素进行识别,并根据三元素识别结果确定所述待检测图像的第二目标位置中目标印章的第二存在性结果之后,所述方法还包括:
根据目标检测模型对所述待检测图像进行检测,得到所述待检测图像中包含的待检测印章;
基于预留印章库中的预留印章与所述待检测印章进行对比,确定所述待检测印章的真实性。
第二方面,本申请还提供了一种风险检测装置,包括:
获取模块,用于获取待检测图像,根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容;
第一检测模块,用于依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果;
第二检测模块,用于基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果;
确定模块,用于根据所述有效性结果和所述印章检测结果确定所述待检测图像的风险检测结果。
在其中一个实施例中,所述文字识别模型包括文本定位算法和文本识别算法;
所述获取模块具体用于根据所述文字识别模型中的文本定位算法,对所述待检测图像进行预测处理,得到所述待检测图像中包含的文本图像对应的文本边界框;
根据所述文字识别模型中的所述文本识别算法和所述文本边界框中包含的文本图像进行识别处理,得到所述待检测图像中包含的文本内容。
在其中一个实施例中,所述第一检测模块具体用于根据无效影像识别模型对所述待检测图像的图像内容进行识别,得到图像识别结果;
根据下划线空白识别模型、签名检测模型和所述文本内容对所述待检测图像的内容进行识别,得到内容识别结果;
根据所述图像识别结果和所述内容识别结果,确定所述待检测图像的有效性结果。
在其中一个实施例中,所述第一检测模块具体用于根据下划线空白识别模型和所述文本内容对所述待检测图像中包含的下划线内容进行检测,得到要素内容结果;
根据签名检测模型对所述待检测图像进行识别,确定所述待检测图像中的第一目标位置是否存在签名;
若所述第一目标位置存在所述签名,根据所述签名检测模型确定所述签名的呈现形式,并基于所述呈现形式确定签名内容结果;
基于所述要素内容结果和所述签名内容结果确定内容识别结果。
在其中一个实施例中,所述第二检测模块具体用于根据印章检测模型和所述文本内容对所述待检测图像进行印章识别,确定所述待检测图像的第二目标位置中目标印章的第一存在性结果;
对所述待检测图像中包含的三元素进行识别,并根据三元素识别结果确定所述待检测图像的第二目标位置中目标印章的第二存在性结果;
基于所述第一存在性结果和所述第二存在性结果确定印章检测结果。
在其中一个实施例中,所述装置还包括:
第三检测模块,用于根据目标检测模型对所述待检测图像进行检测,得到所述待检测图像中包含的待检测印章;
对比模块,用于基于预留印章库中的预留印章与所述待检测印章进行对比,确定所述待检测印章的真实性。
第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待检测图像,根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容;
依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果;
基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果;
根据所述有效性结果和所述印章检测结果确定所述待检测图像的风险检测结果。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待检测图像,根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容;
依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果;
基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果;
根据所述有效性结果和所述印章检测结果确定所述待检测图像的风险检测结果。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待检测图像,根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容;
依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果;
基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果;
根据所述有效性结果和所述印章检测结果确定所述待检测图像的风险检测结果。
上述风险检测方法、装置、计算机设备、存储介质和计算机程序产品,通过文字识别模型对待检测影像进行定位和识别以获取文本内容,并根据无效影像识别模型、下划线空白识别模型和印章检测模型进行不同维度的风险检测,实现对待检测影像进行快速、准确的风险检测,高效识别出可能存在的风险因素,提高风险检测的效率。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中风险检测方法的流程示意图;
图2为一个实施例中文本识别步骤的流程示意图;
图3为一个实施例中有效性检测步骤的流程示意图;
图4为一个实施例中有效性检测步骤中要素内容和签名内容的检测流程示意图;
图5为一个实施例中印章检测步骤的流程示意图;
图6为另一个实施例中检测印章真实性步骤的流程示意图;
图7为一个具体的实施例中风险检测方法的示例的流程示意图;
图8为一个实施例中风险检测装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种风险检测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤102,获取待检测图像,根据文字识别模型对待检测图像进行文本定位和识别,得到待检测图像中包含的文本内容。
本申请实施例中,待检测图像可以为包含金融机构业务合同的扫描图像,其中,金融机构业务合同中一般包括企业用印等。终端首先获取待检测的图像,然后利用文字识别模型对图像进行处理,识别和定位其中的文本内容,以便后续的有效性检测和印章检测。具体地,终端获取待检测图像,根据文字识别模型对待检测图像进行文本定位和识别,得到待检测图像中包含的文本内容。终端首先从文档管理系统或扫描仪中获取待检测图像,然后利用文字识别模型,例如,OCR(Optical Character Recognition,光学字符识别)或者基于深度学习的文字识别模型,对图像进行处理,定位和识别其中的文本内容,转换成可进一步处理的结构化文本数据。
步骤104,依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和文本内容,对待检测图像进行有效性检测,得到有效性结果。
本申请实施例中,终端通过无效影像识别模型、下划线空白识别模型、签名检测模型以及文本内容,按顺序或并行处理,对待检测图像进行有效性检测,识别出无效影像、下划线空白、签名等可能影响有效性的内容,并最终得出有效性结果。具体地,终端首先通过无效影像识别模型,例如,基于图像处理技术的算法,检测图像中的空白页或干扰内容,判断是否为无效影像;接着利用下划线空白识别模型,例如,基于深度学习的图像识别模型,检测图像中是否存在下划线空白以及其他可能的无效内容;然后使用签名检测模型,例如,基于识别或图像特征的算法,对签名进行检测;最后结合文字识别的结果,综合分析图像的有效性,得到有效性结果。
步骤106,基于印章检测模型和文本内容对待检测图像进行检测,得到印章检测结果。
本申请实施例中,终端利用印章检测模型结合文本内容对待检测图像进行检测,以识别图像中是否存在印章,并得出印章检测结果,用于确认合同的真实性和完整性。具体地,终端通过印章检测模型,例如,基于图像特征的算法或深度学习模型,检测图像中是否存在印章,并结合文字识别的结果,获取文本内容,通过验证待检测图像中需要盖章的位置是否存在印章,来验证待检测图像的真实性和完整性。
步骤108,根据有效性结果和印章检测结果确定待检测图像的风险检测结果。
本申请实施例中,终端将有效性结果和印章检测结果综合分析,可以结合预先定义的风险评估标准,对待检测图像进行风险检测,确定待检测图像中包含的业务合同的风险等级,并根据风险等级输出相应的警示。
上述风险检测方法中,通过文字识别模型对待检测影像进行定位和识别以获取文本内容,并根据无效影像识别模型、下划线空白识别模型和印章检测模型进行不同维度的风险检测,实现对待检测影像进行快速、准确的风险检测,高效识别出可能存在的风险因素,提高风险检测的效率。
在一个示例性的实施例中,文字识别模型包括文本定位算法和文本识别算法,如图2所示,步骤102包括步骤202至步骤204。其中:
步骤202,根据文字识别模型中的文本定位算法,对待检测图像进行预测处理,得到待检测图像中包含的文本图像对应的文本边界框。
本申请实施例中,文字识别模型由文字定位和文字识别两个核心算法组合而成。文字定位算法可以为CRAFT(Character Region Awareness for Text Detection,一种自然场景文本检测算法)、FastRCNN(Fast Region-based Convolutional Network method,快速基于区域的卷积网络方法)等文本检测模型,定位图像中的文本区域,并生成对应的文本边界框,以辅助后续的文本识别处理,得到待检测图像中包含的文本图像对应的文本边界框。然后使用泛化能力较强的文本识别算法,例如,CRNN(Convolutional RecurrentNeural Network,用于端到端地对不定长的文本序列识别算法)文本识别算法,实现复杂版式背景条件下手写和印刷混合识别,最终,终端识别待检测图像中的甲方、乙方、冒号、下划线等关键部分,缩小或定位到具体的影像识别范围,进一步提升识别效率。
步骤204,根据文字识别模型中的文本识别算法和文本边界框中包含的文本图像进行识别处理,得到待检测图像中包含的文本内容。
本申请实施例中,终端根据文字识别模型中的文本识别算法和文本边界框中包含的文本图像进行识别处理,得到待检测图像中包含的文本内容。具体地,终端会基于文本边界框中的文本图像,利用文字识别算法,例如,CRNN(卷积循环神经网络),对文本图像进行识别处理,从而得到待检测图像中包含的文本内容,该文本内容则可用于后续的有效性检测。
本实施例中,通过文本定位算法,可以准确地检测图像中的文本区域,生成文本边界框,可以识别到更多甚至边缘模糊的文本,提高了文本定位的准确性增强了文本识别的精度,同时,通过先定位再识别的流程,可以节省计算资源,并通过对特定区域进行识别,避免了对整个图像进行分析,缩短了处理时间,加速了处理速度。
在一个示例性的实施例中,如图3所示,步骤104包括步骤302至步骤306。其中:
步骤302,根据无效影像识别模型对待检测图像的图像内容进行识别,得到图像识别结果。
本申请实施例中,无效影像识别模型可以为ResNet50网络,即深度残差网络,通过将全局训练,分成多个block来训练,使得每个block误差最小,从而达到整体误差最小。终端基于ImageNet(该ImageNet库用于视觉对象识别软件研究的大型可视化数据库)库的预训练模型权重对图像进行训练,识别出一些特定图像,检测图像中是否包含空白页、模糊图像、或其他无效内容,并给出相应的识别结果,例如,终端如果识别出身份证、结婚证、营业执照图像,则直接忽略,说明该待检测图像为正常图像;如果识别出空白纸、高拍仪(影像归档拍照设备)底座图像,则判定该待检测图像是无效影像,说明归档有误。
步骤304,根据下划线空白识别模型、签名检测模型和文本内容对待检测图像的内容进行识别,得到内容识别结果。
本申请实施例中,终端将结合下划线空白识别模型、文本内容和签名检测模型的识别结果,对待检测图像的内容进行深入识别,判断图像中是否存在下划线空白或签名信息,并给出相应的识别结果。终端使用RETINANET(一种目标检测算法)算法建立模型,将下划线和空白部分当做目标物进行检测,同时排除下划线上有“/”或“—”等符号的图像。当下划线上有“/”或“—”等符号,说明对须填写内容的位置做了划除处理,该部分内容可以不存在文本内容,为正常情况。此外,终端还会使用签名检测模型对待检测图像进行分析,以检测图像中是否包含签名信息,确定待检测图像中的签名信息是否正确。
步骤306,根据图像识别结果和内容识别结果,确定待检测图像的有效性结果。
本申请实施例中,终端将综合考虑图像识别结果和内容识别结果,结合预先定义的有效性判定标准,最终确定待检测图像的有效性结果,即判断该图像是否有效,是否符合规定的标准和要求。其中,有效性判断标准可以是在图像识别结果和内容识别结果均正常的情况下,将有效性结果确定为待检测图像有效;在图像识别结果或内容识别结果中任意一项存在问题的情况下,将有效性结果确定为待检测图像无效,提示用户该待检测图像存在问题,输出存在风险的提示信息。
本实施例中,通过无效影像识别模型、下划线空白识别模型和签名检测模型对待检测图像进行识别处理,可以全面地分析和识别待检测图像,从而为判断待检测图像的有效性提供更为准确和全面的数据支持。
在一个示例性的实施例中,如图4所示,步骤304包括步骤402至步骤408。其中:
步骤402,根据下划线空白识别模型和文本内容对待检测图像中包含的下划线内容进行检测,得到要素内容结果。
本申请实施例中,终端首先使用下划线空白识别模型和文本内容识别模型对待检测图像进行分析。通过下划线空白识别模型,终端检测到图像中存在下划线部分,并通过文本内容识别模型识别了下划线下方的文字内容。例如,终端识别到下划线部分位于图像底部,下方文字为“Total: $100.00”或“Total: —— ”。
步骤404,根据签名检测模型对待检测图像进行识别,确定待检测图像中的第一目标位置是否存在签名。
本申请实施例中,终端可以使用RETINANET算法,识别图像中是否存在手工签名,并输出签名的位置坐标。其中,终端可以结合通用文字识别模型,确定第一目标位置,在待检测图像包含的合同签署页乙方签字处判别是否存在手工签名,进而查找出乙方未签字或用印刷体代替签字、合同要素不完整的影像。
在一个可选的实施例中,终端可以通过模板匹配的方式来寻找待检测图像中的第一目标位置,终端将待检测图像与预设的模板进行匹配,通过在待检测图像上移动模板,并计算每个位置与模板的相似度,从而找到与模板最匹配的位置。当终端找到与模板最匹配的区域时,即可确定第一目标位置在待检测图像中的位置,该位置即为终端认为可能存在签名的区域,系统将在这个位置进行进一步的签名检测。然后,终端使用签名检测模型来分析图像,并确定第一目标位置是否存在签名。终端,进一步应用签名检测模型来确定签名的呈现形式,即确定该签名的呈现形式为手写签名或印刷体代替。
步骤406,若第一目标位置存在签名,根据签名检测模型确定签名的呈现形式,并基于呈现形式确定签名内容结果。
本实施例中,终端综合要素内容结果和签名内容结果,确定最终的内容识别结果,首先判断第一目标位置是否存在签名,在该第一目标位置不存在签名的情况下,直接将当前待检测图像的签名内容结果确定为缺少签名,输出风险提示信息。当第一目标位置存在签名的情况下,终端根据签名检测模型进一步确定该第一目标位置的签名的呈现形式,在该签名的呈现形式为手写签名的情况下,终端将该签名内容结果确定为正常,说明该待检测图像中的业务合同的签名属实,当前待检测图像中包含的业务合同不存在风险;若该签名的呈现形式为印刷体的情况下,终端可以将该当前签名确定为无效签名,并输出风险提示信息。
步骤408,基于要素内容结果和签名内容结果确定内容识别结果。
本申请实施例中,只有在要素内容结果和签名内容结果都通过验证的情况下,终端才会将内容识别结果确定为验证通过,说明下划线对应的内容不为空白,且签名的存在和内容也都符合要求,只有在这两方面都验证通过的情况下,终端才会最终确定待检测图像的内容识别结果为验证通过。
本实施例中,将确保要素内容和签名内容的准确性和完整性,只有在双重验证通过的情况下才会确定最终的内容识别结果为验证通过,双重验证的机制可以提高风险检测的准确性和可靠性。
在一个示例性的实施例中,如图5所示,步骤106包括步骤502至步骤506。其中:
步骤502,根据印章检测模型和文本内容对待检测图像进行印章识别,确定待检测图像的第二目标位置中目标印章的第一存在性结果。
本申请实施例中,印章检测模型可以基于RETINANET算法构建,终端使用印章检测模型对待检测图像进行分析,并结合文字识别模型得到的文本内容,在合同签署页甲方、乙方盖章处判别是否存在印章,进而查找出未完成双方用印操作、合同要素不完整的影像。具体地,终端对候选区域应用印章检测模型,识别出可能的印章位置,并确定第二目标位置中目标印章的第一存在性结果,即系统初步判断在第二目标位置是否存在印章。
步骤504,对待检测图像中包含的三元素进行识别,并根据三元素识别结果确定待检测图像的第二目标位置中目标印章的第二存在性结果。
本申请实施例中,在印章检测模型的基础上,终端可以叠加对彩色图像的三元素识别(RGB),识别出黑色像素(R:0;G:0;B:0)、红色像素(R:255;G:0;B:0),将待检测图像中的文字和图章予以区分,从而在识别图章是否存在的场景上,进一步确定待检测图像的第二目标位置中目标印章的第二存在性结果。
可选的,终端可以基于识别出的黑色像素和红色像素的像素分布或者固定位置的像素信息进行区分。例如,文字通常会包含黑色像素,而图章可能包含红色像素或者混合的颜色像素。通过区分这些像素,终端可以确定文字和图章的位置和边界,在确定了图章的位置后,终端可以根据图章的边界和像素分布情况来判断图章是否完整。包括计算图章的轮廓、检查图章内部的颜色分布等。若图章的轮廓完整且颜色分布符合预期,则可以确定图章是完整的。
步骤506,基于第一存在性结果和第二存在性结果确定印章检测结果。
本申请实施例中,终端根据第一存在性结果和第二存在性结果,综合判断印章的存在性,只有在第一存在性结果为该第二目标位置存在印章,且第二存在性结果为该第二目标位置存在印章,终端将印章检测结果为检测通过。在第一存在性结果或第二存在性结果中任意一个的结果为不存在印章,则印章检测结果确定为存在风险,终端输出印章存在风险的提示信息。
本实施例中,通过印章检测模型和文本内容对待检测图像中的印章进行识别和判断,综合利用不同模型和信息的方法能够提高印章检测的准确性和可靠性,从而为保证针对待检测图像进行风险检测的准确性。
在一个示例性的实施例中,如图6所示,步骤504之后,包括步骤602至步骤604。其中:
步骤602,根据目标检测模型对待检测图像进行检测,得到待检测图像中包含的待检测印章。
本申请实施例中,终端使用目标检测模型对待检测图像进行分析和识别,以确定图像中可能包含的待检测印章。目标检测模型可以准确地找到待检测图像中的目标物体,即印章的位置和形状。通过目标检测模型的分析结果,终端能够在待检测图像中标定出待检测印章的位置和边界框,为后续的处理做准备。
步骤604,基于预留印章库中的预留印章与待检测印章进行对比,确定待检测印章的真实性。
本申请实施例中,确定了待检测图像中的印章后,终端将通过与预留印章库中的预留印章进行对比,以确定待检测印章的真实性。具体地,终端会对待检测印章与预留印章库中的印章进行特征对比,比如印章形状、文字内容等,来判断待检测印章是否为真实有效的印章。
基于对比结果,终端将确定待检测印章的真实性,并输出相应的判断结果。如果待检测印章与预留印章库中的印章相符,终端将确认印章的真实性为真实,否则可能会标记该第二目标位置的印章为有问题或不合规的印章。
本实施例中,通过将待检测印章与预留印章库中的印章进行对比来确定印章的真实性,筛选出真实有效的印章,并提高印章识别的准确性和可靠性。
在一个具体地实施例中,如图7所示,提供了一种风险检测的示例,包括:
步骤701,输入合同等电子文档;
步骤702,根据文字识别模型对电子文档进行文本定位和识别,得到电子文档中包含的文本内容(例如,甲方、乙方、下划线等关键要素);
步骤703,根据无效影像识别模型对电子文档的图像内容进行识别,确定电子文档是否为空白纸等无效影像;若电子文档为空白纸等无效影像,执行步骤704;若电子文档不为空白纸等无效影像,执行步骤705;
步骤704,输出提示无效影像的信息;
步骤705,根据下划线空白识别模型对电子文档的内容进行识别,检测电子文档是否存在下划线空白的情况;若电子文档存在下划线空白的情况,执行步骤706;若电子文档不存在下划线空白的情况,执行步骤707;
步骤706,基于下划线空白识别模型的结果输出提示确实印章、日期空白或要素空白的提示词;
步骤707,基于文本内容包含的下划线位置,确定盖章范围,并根据印章检测模型识别盖章范围的印章是否完整和文字是否有效;若盖章范围的印章不完整或文字无效,执行步骤708;若盖章范围的印章完整且文字有效,执行步骤709;
步骤708,输出提示印章无效的信息;
步骤709,根据签名检测模型在目标位置确定是否存在手工签名;在目标位置不存在手工签名的情况下,执行步骤710;在目标位置存在手工签名的情况下,执行步骤711;
步骤710,输出提示无效签名的信息;
步骤711,识别结束,输出提示电子文档的风险检测通过的信息。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的风险检测方法的风险检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个风险检测装置实施例中的具体限定可以参见上文中对于风险检测方法的限定,在此不再赘述。
在一个示例性的实施例中,如图8所示,提供了一种风险检测装置800,包括:获取模块801、第一检测模块802、第二检测模块803和确定模块804,其中:
获取模块801,用于获取待检测图像,根据文字识别模型对待检测图像进行文本定位和识别,得到待检测图像中包含的文本内容;
第一检测模块802,用于依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和文本内容,对待检测图像进行有效性检测,得到有效性结果;
第二检测模块803,用于基于印章检测模型和文本内容对待检测图像进行检测,得到印章检测结果;
确定模块804,用于根据有效性结果和印章检测结果确定待检测图像的风险检测结果。
在其中一个实施例中,文字识别模型包括文本定位算法和文本识别算法;
获取模块801具体用于根据文字识别模型中的文本定位算法,对待检测图像进行预测处理,得到待检测图像中包含的文本图像对应的文本边界框;
根据文字识别模型中的文本识别算法和文本边界框中包含的文本图像进行识别处理,得到待检测图像中包含的文本内容。
在其中一个实施例中,第一检测模块802具体用于根据无效影像识别模型对待检测图像的图像内容进行识别,得到图像识别结果;
根据下划线空白识别模型、签名检测模型和文本内容对待检测图像的内容进行识别,得到内容识别结果;
根据图像识别结果和内容识别结果,确定待检测图像的有效性结果。
在其中一个实施例中,第一检测模块802具体用于根据下划线空白识别模型和文本内容对待检测图像中包含的下划线内容进行检测,得到要素内容结果;
根据签名检测模型对待检测图像进行识别,确定待检测图像中的第一目标位置是否存在签名;
若第一目标位置存在签名,根据签名检测模型确定签名的呈现形式,并基于呈现形式确定签名内容结果;
基于要素内容结果和签名内容结果确定内容识别结果。
在其中一个实施例中,第二检测模块803具体用于根据印章检测模型和文本内容对待检测图像进行印章识别,确定待检测图像的第二目标位置中目标印章的第一存在性结果;
对待检测图像中包含的三元素进行识别,并根据三元素识别结果确定待检测图像的第二目标位置中目标印章的第二存在性结果;
基于第一存在性结果和第二存在性结果确定印章检测结果。
在其中一个实施例中,该装置800还包括:
第三检测模块,用于根据目标检测模型对待检测图像进行检测,得到待检测图像中包含的待检测印章;
对比模块,用于基于预留印章库中的预留印章与待检测印章进行对比,确定待检测印章的真实性。
上述风险检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文字识别模型、无效影像识别模型、下划线空白识别模型和签名检测模型。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种风险检测方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待检测图像,根据文字识别模型对待检测图像进行文本定位和识别,得到待检测图像中包含的文本内容;
依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和文本内容,对待检测图像进行有效性检测,得到有效性结果;
基于印章检测模型和文本内容对待检测图像进行检测,得到印章检测结果;
根据有效性结果和印章检测结果确定待检测图像的风险检测结果。
在一个实施例中,文字识别模型包括文本定位算法和文本识别算法,处理器执行计算机程序时还实现以下步骤:
根据文字识别模型中的文本定位算法,对待检测图像进行预测处理,得到待检测图像中包含的文本图像对应的文本边界框;
根据文字识别模型中的文本识别算法和文本边界框中包含的文本图像进行识别处理,得到待检测图像中包含的文本内容。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据无效影像识别模型对待检测图像的图像内容进行识别,得到图像识别结果;
根据下划线空白识别模型、签名检测模型和文本内容对待检测图像的内容进行识别,得到内容识别结果;
根据图像识别结果和内容识别结果,确定待检测图像的有效性结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据下划线空白识别模型和文本内容对待检测图像中包含的下划线内容进行检测,得到要素内容结果;
根据签名检测模型对待检测图像进行识别,确定待检测图像中的第一目标位置是否存在签名;
若第一目标位置存在签名,根据签名检测模型确定签名的呈现形式,并基于呈现形式确定签名内容结果;
基于要素内容结果和签名内容结果确定内容识别结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据印章检测模型和文本内容对待检测图像进行印章识别,确定待检测图像的第二目标位置中目标印章的第一存在性结果;
对待检测图像中包含的三元素进行识别,并根据三元素识别结果确定待检测图像的第二目标位置中目标印章的第二存在性结果;
基于第一存在性结果和第二存在性结果确定印章检测结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据目标检测模型对待检测图像进行检测,得到待检测图像中包含的待检测印章;
基于预留印章库中的预留印章与待检测印章进行对比,确定待检测印章的真实性。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种风险检测方法,其特征在于,所述方法包括:
获取待检测图像,根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容;
依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果;
基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果;
根据所述有效性结果和所述印章检测结果确定所述待检测图像的风险检测结果。
2.根据权利要求1所述的方法,其特征在于,所述文字识别模型包括文本定位算法和文本识别算法;
所述根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容,包括:
根据所述文字识别模型中的文本定位算法,对所述待检测图像进行预测处理,得到所述待检测图像中包含的文本图像对应的文本边界框;
根据所述文字识别模型中的所述文本识别算法和所述文本边界框中包含的文本图像进行识别处理,得到所述待检测图像中包含的文本内容。
3.根据权利要求1所述的方法,其特征在于,所述依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果,包括:
根据无效影像识别模型对所述待检测图像的图像内容进行识别,得到图像识别结果;
根据下划线空白识别模型、签名检测模型和所述文本内容对所述待检测图像的内容进行识别,得到内容识别结果;
根据所述图像识别结果和所述内容识别结果,确定所述待检测图像的有效性结果。
4.根据权利要求3所述的方法,其特征在于,所述根据下划线空白识别模型、签名检测模型和所述文本内容对所述待检测图像的内容进行识别,得到内容识别结果,包括:
根据下划线空白识别模型和所述文本内容对所述待检测图像中包含的下划线内容进行检测,得到要素内容结果;
根据签名检测模型对所述待检测图像进行识别,确定所述待检测图像中的第一目标位置是否存在签名;
若所述第一目标位置存在所述签名,根据所述签名检测模型确定所述签名的呈现形式,并基于所述呈现形式确定签名内容结果;
基于所述要素内容结果和所述签名内容结果确定内容识别结果。
5.根据权利要求1所述的方法,其特征在于,所述基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果,包括:
根据印章检测模型和所述文本内容对所述待检测图像进行印章识别,确定所述待检测图像的第二目标位置中目标印章的第一存在性结果;
对所述待检测图像中包含的三元素进行识别,并根据三元素识别结果确定所述待检测图像的第二目标位置中目标印章的第二存在性结果;
基于所述第一存在性结果和所述第二存在性结果确定印章检测结果。
6.根据权利要求5所述的方法,其特征在于,所述对所述待检测图像中包含的三元素进行识别,并根据三元素识别结果确定所述待检测图像的第二目标位置中目标印章的第二存在性结果之后,所述方法还包括:
根据目标检测模型对所述待检测图像进行检测,得到所述待检测图像中包含的待检测印章;
基于预留印章库中的预留印章与所述待检测印章进行对比,确定所述待检测印章的真实性。
7.一种风险检测装置,其特征在于,所述装置包括:
获取模块,用于获取待检测图像,根据文字识别模型对所述待检测图像进行文本定位和识别,得到所述待检测图像中包含的文本内容;
第一检测模块,用于依次通过无效影像识别模型、下划线空白识别模型、签名检测模型和所述文本内容,对所述待检测图像进行有效性检测,得到有效性结果;
第二检测模块,用于基于印章检测模型和所述文本内容对所述待检测图像进行检测,得到印章检测结果;
确定模块,用于根据所述有效性结果和所述印章检测结果确定所述待检测图像的风险检测结果。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202410352637.0A 2024-03-26 2024-03-26 风险检测方法、装置、计算机设备和存储介质 Pending CN118097702A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410352637.0A CN118097702A (zh) 2024-03-26 2024-03-26 风险检测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410352637.0A CN118097702A (zh) 2024-03-26 2024-03-26 风险检测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN118097702A true CN118097702A (zh) 2024-05-28

Family

ID=91150488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410352637.0A Pending CN118097702A (zh) 2024-03-26 2024-03-26 风险检测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN118097702A (zh)

Similar Documents

Publication Publication Date Title
US20210124919A1 (en) System and Methods for Authentication of Documents
KR101122854B1 (ko) 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치
Van Beusekom et al. Text-line examination for document forgery detection
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
US11023708B2 (en) Within document face verification
CN111626124B (zh) Ocr图像样本生成、印刷体验证方法、装置、设备及介质
US11144752B1 (en) Physical document verification in uncontrolled environments
Jain et al. Passive classification of source printer using text-line-level geometric distortion signatures from scanned images of printed documents
CN108830275B (zh) 点阵字符、点阵数字的识别方法及装置
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
US10867170B2 (en) System and method of identifying an image containing an identification document
CN112396047B (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN111814716A (zh) 印章去除方法、计算机设备和可读存储介质
CN111160395A (zh) 图像识别方法、装置、电子设备和存储介质
JP2019079347A (ja) 文字種推定システム、文字種推定方法、および文字種推定プログラム
US20160371543A1 (en) Classifying document images based on parameters of color layers
CN113496115B (zh) 文件内容比对方法和装置
Thaiparnit et al. Tracking vehicles system based on license plate recognition
CN118097702A (zh) 风险检测方法、装置、计算机设备和存储介质
CN111626244B (zh) 图像识别方法、装置、电子设备和介质
KR100957508B1 (ko) 광학 문자 인식 시스템 및 방법
CN113610090A (zh) 印章图像识别分类方法、装置、计算机设备和存储介质
CN112287763A (zh) 图像处理方法、装置、设备及介质
Gayer et al. Fast and accurate deep learning model for stamps detection for embedded devices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination