CN117668227A - 一种审核保函文本的方法、系统、设备及介质 - Google Patents

一种审核保函文本的方法、系统、设备及介质 Download PDF

Info

Publication number
CN117668227A
CN117668227A CN202311640145.3A CN202311640145A CN117668227A CN 117668227 A CN117668227 A CN 117668227A CN 202311640145 A CN202311640145 A CN 202311640145A CN 117668227 A CN117668227 A CN 117668227A
Authority
CN
China
Prior art keywords
warranty
text
word
checked
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311640145.3A
Other languages
English (en)
Inventor
李琤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jianxin Rongtong Co ltd
Original Assignee
Jianxin Rongtong Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jianxin Rongtong Co ltd filed Critical Jianxin Rongtong Co ltd
Priority to CN202311640145.3A priority Critical patent/CN117668227A/zh
Publication of CN117668227A publication Critical patent/CN117668227A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种审核保函文本的方法、系统、设备及介质,用于提高保函文本的审核效率,该方法包括:获取待审核保函文本和保函文本库;根据待审核保函文本的内容信息,确定待审核保函文本的分类标签;根据待审核保函文本的分类标签和保函文本库,确定标签匹配保函文本集;根据标签匹配保函文本集中各个标签匹配保函文本的内容信息和待审核保函文本的内容信息,确定各个待匹配相似度;待匹配相似度为标签匹配保函文本与待审核保函文本的相似度;待匹配相似度的数量与标签匹配保函文本的数量相同;将各个待匹配相似度与预设相似度进行比对;若各个待匹配相似度中的任意一个待匹配相似度大于预设相似度,则待审核保函文本通过审核。

Description

一种审核保函文本的方法、系统、设备及介质
技术领域
本申请涉及数据处理技术领域,特别是一种审核保函文本的方法、系统、设备及介质。
背景技术
保函是一种由具备特定资质的主体为公司或个人用户进行开具的用于信用担保的凭证,具有作用特定、数量庞大、使用频率高等特点。但是现有技术对保函文本的审核效率较低。因此,如何提高保函文本的审核效率,成为当前所需解决的技术问题。
发明内容
鉴于上述问题,本发明的目的在于提供一种审核保函文本的方法、系统、设备及介质,以提高保函文本的审核效率,具体方案如下:
第一方面,本申请实施例公开了一种审核保函文本的方法,所述方法包括:
获取待审核保函文本和保函文本库;所述保函文本库中包含多个目标保函文本;所述目标保函文本为已通过审核的保函文本;
根据所述待审核保函文本的内容信息,确定所述待审核保函文本的分类标签;
根据所述待审核保函文本的分类标签和所述保函文本库,确定标签匹配保函文本集;所述标签匹配保函文本集中包括至少一个标签匹配保函文本;所述标签匹配保函文本为,所述保函文本库中与所述待审核保函文本具有相同分类标签的目标保函文本;
根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度;所述待匹配相似度为所述标签匹配保函文本与所述待审核保函文本的相似度;所述待匹配相似度的数量与所述标签匹配保函文本的数量相同;
将所述各个待匹配相似度与所述预设相似度进行比对;若所述各个待匹配相似度中的任意一个待匹配相似度大于所述预设相似度,则所述待审核保函文本通过审核。
可选的,所述获取待审核保函文本和保函文本库,包括:
获取待处理业务信息;所述待处理业务信息包括所述待审核保函文本,以及所述待审核保函文本的开立结构信息;
根据所述待审核保函文本的开立机构信息,从各个预设保函文本库中选择与所述待审核保函文本具有相同开立机构信息的预设保函文本库,作为所述保函文本库。
可选的,所述根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度,包括:
对所述待审核保函文本的内容信息进行分词,得到第一分词集合;
对所述各个标签匹配保函文本的内容信息进行分词,得到多个第二分词集合;所述第二分词集合为所述标签匹配保函文本的内容信息中所包含分词的集合;
将所述第一分词集合和所述多个第二分词集合进行合并,得到比对分词集合;
根据所述第一分词集合和所述比对分词集合,确定第一词频;所述第一词频为所述第一分词集合中的各个分词在所述比对分词集合中的词频;
根据所述多个第二分词集合和所述比对分词集合,确定多个第二词频;所述第二词频为所述第二分词集合中的各个分词在所述比对分词集合中的词频;
根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度。
可选的,所述根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度,包括:
对所述第一词频进行向量化,得到第一分词向量集合;
分别对所述多个第二词频进行向量化,得到多个第二分词向量集合;
根据所述第一分词向量集合和所述多个第二分词向量集合,确定所述各个待匹配相似度。
可选的,在所述待审核保函文本通过审核之后,所述方法还包括:
将所述待匹配相似度大于所述预设相似度的标签匹配保函文本,在显示界面中展示。
第二方面,本申请实施例公开了一种审核保函文本的系统,所述系统包括:
获取模块,用于获取待审核保函文本和保函文本库;所述保函文本库中包含多个目标保函文本;所述目标保函文本为已通过审核的保函文本;
确定模块,用于根据所述待审核保函文本的内容信息,确定所述待审核保函文本的分类标签;
所述确定模块,还用于根据所述待审核保函文本的分类标签和所述保函文本库,确定标签匹配保函文本集;所述标签匹配保函文本集中包括至少一个标签匹配保函文本;所述标签匹配保函文本为,所述保函文本库中与所述待审核保函文本具有相同分类标签的目标保函文本;
所述确定模块,还用于根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度;所述待匹配相似度为所述标签匹配保函文本与所述待审核保函文本的相似度;所述待匹配相似度的数量与所述标签匹配保函文本的数量相同;
比对模块,用于将所述各个待匹配相似度与所述预设相似度进行比对;若所述各个待匹配相似度中的任意一个待匹配相似度大于所述预设相似度,则所述待审核保函文本通过审核。
可选的,所述获取模块,具体用于:
获取待处理业务信息;所述待处理业务信息包括所述待审核保函文本,以及所述待审核保函文本的开立结构信息;
根据所述待审核保函文本的开立机构信息,从各个预设保函文本库中选择与所述待审核保函文本具有相同开立机构信息的预设保函文本库,作为所述保函文本库。
可选的,所述确定模块,包括:
分词单元,用于对所述待审核保函文本的内容信息进行分词,得到第一分词集合;
所述分词单元,还用于对所述各个标签匹配保函文本的内容信息进行分词,得到多个第二分词集合;所述第二分词集合为所述标签匹配保函文本的内容信息中所包含分词的集合;
合并单元,用于将所述第一分词集合和所述多个第二分词集合进行合并,得到比对分词集合;
确定单元,用于根据所述第一分词集合和所述比对分词集合,确定第一词频;所述第一词频为所述第一分词集合中的各个分词在所述比对分词集合中的词频;
所述确定单元,还用于根据所述多个第二分词集合和所述比对分词集合,确定多个第二词频;所述第二词频为所述第二分词集合中的各个分词在所述比对分词集合中的词频;
所述确定单元,还用于根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度。第三方面,本申请实施例公开了一种终端设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述任意一种审核保函文本的方法。
第四方面,本申请实施例公开了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任意一种审核保函文本的方法。
相对于现有技术,本申请具有以下有益效果:
通过获取待审核保函文本和保函文本库,根据待审核保函文本的内容信息,确定待审核保函文本的分类标签。根据待审核保函文本的分类标签和保函文本库,确定标签匹配保函文本集。根据标签匹配保函文本集中各个标签匹配保函文本的内容信息和待审核保函文本的内容信息,确定各个待匹配相似度,将各个待匹配相似度与预设相似度进行比对,若各个待匹配相似度中的任意一个待匹配相似度大于预设相似度,则待审核保函文本通过审核。由于目标保函文本为已通过审核的保函文本,所以当保函文本库中存在与待审核保函文本具有相同标签,且内容信息与待审核保函文本的内容信息相似度较高的目标保函文本时,该待审核保函文本同样为能够通过审核的保函文本,无需再对该待审核保函文本进行审核。从而通过将待审核保函文本与保函文本库中的目标保函文本的标签和相似度进行比较,快速确定出待审核保函文本是否能够直接通过审核,以提高审核效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种审核保函文本的方法的流程示意图;
图2为本申请实施例提供的一种审核保函文本的系统的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,本申请本申请实施例公开了一种审核保函文本的方法,该方法包括:
S101:获取待审核保函文本和保函文本库;保函文本库中包含多个目标保函文本;目标保函文本为已通过审核的保函文本。
获取保函文本库以及待审核保函文本,保函文本库包括多个已经通过审核的目标保函文本,不同的保函文本库包含不同的目标保函文本。待审核保函文本为当前存在审核需求的保函文本。
在一种可选的实施例中,上述步骤S101,具体包括:
获取待处理业务信息;待处理业务信息包括待审核保函文本,以及待审核保函文本的开立结构信息;
根据待审核保函文本的开立机构信息,从各个预设保函文本库中选择与待审核保函文本具有相同开立机构信息的预设保函文本库,作为保函文本库。
获取待处理业务信息,待处理业务信息至少包括待审核保函文本,以及待审核保函文本的开立结构信息。每个预设保函文本库对应不同的开立机构,从多个预设保函文本库中,选择与待审核保函文本的开立机构相同的预设保函文本库作为保函文本库。
如开立机构包括开立机构A和开立机构B,则预设保函文本库包括预设保函文本库a、以及预设保函文本库b,预设保函文本库a中的各个目标保函文本的开立机构均为A,预设保函文本库b中的各个目标保函文本的开立机构均为B。当获取到的待处理业务信息中待审核保函文本的开立机构为开立机构A时,则将预设保函文本库a作为保函文本库。
需要说明的是,每个待处理业务信息中只包括一个开立机构,且预设保函文本库中的各个保函文本的开立机构均相同。
S102:根据待审核保函文本的内容信息,确定待审核保函文本的分类标签。
对待审核保函文本的内容信息进行分析,以确定待审核保函文本所对应的分类标签。如,将确定出的待审核保函文本输入至预先训练好的预设标签分类模型中,使预设标签分类模型基于待审核保函文本中的内容信息,为待审核保函文本打上分类标签。
S103:根据待审核保函文本的分类标签和保函文本库,确定标签匹配保函文本集;标签匹配保函文本集中包括至少一个标签匹配保函文本;标签匹配保函文本为,保函文本库中与待审核保函文本具有相同分类标签的目标保函文本。
保函文本库中的各个目标保函文本为,已经根据目标保函文本的内容信息进行分类和打标后的保函文本。将待审核保函文本的分类标签,和保函文本库中的各个目标保函文本的分类标签进行匹配。若待审核保函文本的分类标签与目标保函文本的分类标签完全一致,则将该目标保函文本作为标签匹配保函文本。若保函文本库中不存在与待审核保函文本的分类标签一致的目标保函文本,则该待审核保函文本无法直接通过审核,可通过人工进行审核。
如,当待审核保函文本的分类标签为第一类别和第二类别,保函文本库包括两个目标保函文本,第一个目标保函文本的分类标签为第一类别,第二个目标保函文本的分类标签为第一类别和第二类别,则第二个目标保函文本为标签匹配保函文本。
需要说明的是,在确定出标签匹配保函文本后,还可对标签匹配保函文本进行预排序。如,按照各个标签匹配保函文本的处理期限由近到远的顺序,对各个标签匹配保函文本进行预排序。
S104:根据标签匹配保函文本集中各个标签匹配保函文本的内容信息和待审核保函文本的内容信息,确定各个待匹配相似度;待匹配相似度为标签匹配保函文本与待审核保函文本的相似度;待匹配相似度的数量与标签匹配保函文本的数量相同。
将待审核保函文本的内容信息与各个标签匹配保函文本的内容信息进行比对,得到待审核保函文本的内容信息与各个标签匹配保函文本的内容信息的相似度。将待审核保函文本的内容信息与各个标签匹配保函文本的内容信息的相似度作为各个待匹配相似度,即待审核保函文本与各个标签匹配保函文本的相似度,从而确定出标签匹配保函文本集中的各个保函文本与待审核保函文本之间的相似度,便于后续根据相似度确定出无需审核的保函文本。
需要说明的是,在确定出各个待比对相似度之后,可按照待比对相似度由高到低的顺序对待比对相似度进行排序。
在一种可选的实施例中,上述步骤S104,具体包括:
对待审核保函文本的内容信息进行分词,得到第一分词集合;
对各个标签匹配保函文本的内容信息进行分词,得到多个第二分词集合;第二分词集合为标签匹配保函文本的内容信息中所包含分词的集合;
将第一分词集合和多个第二分词集合进行合并,得到比对分词集合;
根据第一分词集合和比对分词集合,确定第一词频;第一词频为第一分词集合中的各个分词在比对分词集合中的词频;
根据多个第二分词集合和比对分词集合,确定多个第二词频;第二词频为第二分词集合中的各个分词在比对分词集合中的词频;
根据第一词频和多个第二词频,确定各个待匹配相似度。
通过预先训练好的预设分词模型,对待审核保函文本的内容信息和各个标签匹配保函文本的内容信息进行分词,得到第一分词集合和多个第二分词集合,第二分词集合与标签匹配保函文本的内容信息相对应,标签匹配保函文本的数量与第二分词集合的数量相同。确定出待审核保函文本中各个分词在比对分词集合中的词频,作为第一词频,确定出各个标签匹配保函文本中各个分词在对比分词集合中的词频,将标签匹配保函文本中各个分词在对比分词集合中的词频作为第二词频,得到多个第二词频。
在一种可选的实施例中,根据第一词频和多个第二词频,确定各个待匹配相似度,包括:
对第一词频进行向量化,得到第一分词向量集合;
对多个第二词频进行向量化,得到多个第二分词向量集合;
根据第一分词向量集合和多个第二分词向量集合,确定各个待匹配相似度。
将第一词频向量化,得到第一分词向量集合。对多个第二词频分别进行向量化,得到多个第二分词向量集合。通过计算余弦相似性判断第一分词向量集合,与各个第二分词向量集合之间的相似度。余弦相似性的计算方式为cos sim=1-spatial distancecosine。其中,spatial distance cosine为用于计算余弦相似性的函数,cos sim为余弦相似性。
需要说明的是,本申请实施例中的比对分词集合,还可根据当前所需比对相似度的标签匹配保函文本和待审核保函文本进行确定。如,从各个标签匹配保函文本中,确定出当前所需进行相似度匹配的一个标签匹配保函文本,对该标签匹配保函文本进行分词,得到第三分词集合,将第三分词集合与第一分词集合进行合并,得到比对分词集合。根据第三分词集合和比对分词集合,确定第三词频,第三词频为第三分词集合中的各个分词在比对分词集合中的词频。对第三词频记性向量化,得到第三分词向量集合,根据第一分词向量集合和第三分词向量集合,确定当前标签匹配保函文本与待审核保函文本的相似度。并继续从尚未进行相似度比对的标签匹配保函文本中,确定出当前所需进行相似度匹配的标签匹配保函文本,与待审核保函文本进行相似度比对,直至各个标签匹配保函文本均与目标保函文本进行相似度匹配。
S105:将各个待匹配相似度与预设相似度进行比对;若各个待匹配相似度中的任意一个待匹配相似度大于预设相似度,则待审核保函文本通过审核。
在确定出各个待匹配相似度之后,获取预设相似度,将各个待匹配相似度与预设相似度进行比对。若任意一个待匹配相似度大于或等于预设相似度,则该待审核保函文本为无需审核的保函文本,该待审核保函文本通过审核。若各个待匹配相似度均小于预设相似度,则该待审核保函文本为需要审核的保函文本,可通过人工进行审核。
将与目标保函文本相似度较高的标签匹配保函文本作为无需审核的保函文本。当比对分词集合由第一分词集合和多个第二分词集合合并生成时,获取第一预设相似度,将第一预设相似度与待比对相似度进行比对,若任意一个待比对相似度大于或等于第一预设相似度,则该待审核保函文本为无需审核的保函文本。
当比对分词集合由第一分词集合和第三分词集合合并生成时,获取第二预设相似度,将第二预设相似度与各个待比对相似度进行比对,若任意一个待比对相似度大于或等于第二预设相似度,则该待审核保函文本为无需审核的保函文本。
需要说明的是,在将各个待比对相似度与预设相似度进行比对时,由于各个待比对相似度按照从高到低的顺序进行排序。所以可按照排序顺序依次进行待比对相似度与预设相似度的比对,若任意一个待比对相似度,小于预设相似度,则该待比对相似度之后的待比对相似度,均小于预设相似度,无需再对后续待比对相似度进行逐一比对,从而提高比对效率。
在一种可选的实施例中,在待审核保函文本通过审核之后,方法还包括:
将待匹配相似度大于预设相似度的标签匹配保函文本,在显示界面中展示。
将待匹配相似度大于预设相似度的标签匹配保函文本,在显示界面中展示。若存在多个待匹配相似度大于预设相似度的标签匹配保函文本,则将多个待匹配相似度对应的标签匹配保函文本,按照待匹配相似度由高到低的顺序进行排序,并在显示界面中展示,以使比对结果更加清晰。
通过获取待审核保函文本和保函文本库,根据待审核保函文本的内容信息,确定待审核保函文本的分类标签。根据待审核保函文本的分类标签和保函文本库,确定标签匹配保函文本集。根据标签匹配保函文本集中各个标签匹配保函文本的内容信息和待审核保函文本的内容信息,确定各个待匹配相似度,将各个待匹配相似度与预设相似度进行比对,若各个待匹配相似度中的任意一个待匹配相似度大于预设相似度,则待审核保函文本通过审核。由于目标保函文本为已通过审核的保函文本,所以当保函文本库中存在与待审核保函文本具有相同标签,且内容信息与待审核保函文本的内容信息相似度较高的目标保函文本时,该待审核保函文本同样为能够通过审核的保函文本,无需再对该待审核保函文本进行审核。从而通过将待审核保函文本与保函文本库中的目标保函文本的标签和相似度进行比较,快速确定出待审核保函文本是否能够直接通过审核,以提高审核效率。
如图2所示,本申请实施例公开了一种审核保函文本的系统,该系统包括:
获取模块201,用于获取待审核保函文本和保函文本库;保函文本库中包含多个目标保函文本;目标保函文本为已通过审核的保函文本;
确定模块202,用于根据待审核保函文本的内容信息,确定待审核保函文本的分类标签;
确定模块202,还用于根据待审核保函文本的分类标签和保函文本库,确定标签匹配保函文本集;标签匹配保函文本集中包括至少一个标签匹配保函文本;标签匹配保函文本为,保函文本库中与待审核保函文本具有相同分类标签的目标保函文本;
确定模块202,还用于根据标签匹配保函文本集中各个标签匹配保函文本的内容信息和待审核保函文本的内容信息,确定各个待匹配相似度;待匹配相似度为标签匹配保函文本与待审核保函文本的相似度;待匹配相似度的数量与标签匹配保函文本的数量相同;
比对模块203,用于将各个待匹配相似度与预设相似度进行比对;若各个待匹配相似度中的任意一个待匹配相似度大于预设相似度,则待审核保函文本通过审核。
在一种可选的实施例中,获取模块201,具体用于:
获取待处理业务信息;待处理业务信息包括待审核保函文本,以及待审核保函文本的开立结构信息;
根据待审核保函文本的开立机构信息,从各个预设保函文本库中选择与待审核保函文本具有相同开立机构信息的预设保函文本库,作为保函文本库。
在一种可选的实施例中,确定模块202,包括:
分词单元,用于对待审核保函文本的内容信息进行分词,得到第一分词集合;
分词单元,还用于对各个标签匹配保函文本的内容信息进行分词,得到多个第二分词集合;第二分词集合为标签匹配保函文本的内容信息中所包含分词的集合;
合并单元,用于将第一分词集合和多个第二分词集合进行合并,得到比对分词集合;
确定单元,用于根据第一分词集合和比对分词集合,确定第一词频;第一词频为第一分词集合中的各个分词在比对分词集合中的词频;
确定单元,还用于根据多个第二分词集合和比对分词集合,确定多个第二词频;第二词频为第二分词集合中的各个分词在比对分词集合中的词频;
确定单元,还用于根据第一词频和多个第二词频,确定各个待匹配相似度。
在一种可选的实施例中,确定模块202,包括:
向量化单元,用于对第一词频进行向量化,得到第一分词向量集合;
向量化单元,还用于分别对多个第二词频进行向量化,得到多个第二分词向量集合;
确定单元,用于根据第一分词向量集合和多个第二分词向量集合,确定各个待匹配相似度。
在一种可选的实施例中,上述系统还包括展示模块:
展示模块,用于将待匹配相似度大于预设相似度的标签匹配保函文本,在显示界面中展示。
通过获取待审核保函文本和保函文本库,根据待审核保函文本的内容信息,确定待审核保函文本的分类标签。根据待审核保函文本的分类标签和保函文本库,确定标签匹配保函文本集。根据标签匹配保函文本集中各个标签匹配保函文本的内容信息和待审核保函文本的内容信息,确定各个待匹配相似度,将各个待匹配相似度与预设相似度进行比对,若各个待匹配相似度中的任意一个待匹配相似度大于预设相似度,则待审核保函文本通过审核。由于目标保函文本为已通过审核的保函文本,所以当保函文本库中存在与待审核保函文本具有相同标签,且内容信息与待审核保函文本的内容信息相似度较高的目标保函文本时,该待审核保函文本同样为能够通过审核的保函文本,无需再对该待审核保函文本进行审核。从而通过将待审核保函文本与保函文本库中的目标保函文本的标签和相似度进行比较,快速确定出待审核保函文本是否能够直接通过审核,以提高审核效率。
本申请实施例还提供了一种终端设备,设备包括处理器以及存储器:存储器用于存储程序代码,并将程序代码传输给处理器;处理器用于根据程序代码中的指令执行上述任意一种审核保函文本的方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现上述任意一种审核保函文本的方法。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种审核保函文本的方法,其特征在于,所述方法包括:
获取待审核保函文本和保函文本库;所述保函文本库中包含多个目标保函文本;所述目标保函文本为已通过审核的保函文本;
根据所述待审核保函文本的内容信息,确定所述待审核保函文本的分类标签;
根据所述待审核保函文本的分类标签和所述保函文本库,确定标签匹配保函文本集;所述标签匹配保函文本集中包括至少一个标签匹配保函文本;所述标签匹配保函文本为,所述保函文本库中与所述待审核保函文本具有相同分类标签的目标保函文本;
根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度;所述待匹配相似度为所述标签匹配保函文本与所述待审核保函文本的相似度;所述待匹配相似度的数量与所述标签匹配保函文本的数量相同;
将所述各个待匹配相似度与所述预设相似度进行比对;若所述各个待匹配相似度中的任意一个待匹配相似度大于所述预设相似度,则所述待审核保函文本通过审核。
2.根据权利要求1所述的方法,其特征在于,所述获取待审核保函文本和保函文本库,包括:
获取待处理业务信息;所述待处理业务信息包括所述待审核保函文本,以及所述待审核保函文本的开立结构信息;
根据所述待审核保函文本的开立机构信息,从各个预设保函文本库中选择与所述待审核保函文本具有相同开立机构信息的预设保函文本库,作为所述保函文本库。
3.根据权利要求1所述的方法,其特征在于,所述根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度,包括:
对所述待审核保函文本的内容信息进行分词,得到第一分词集合;
对所述各个标签匹配保函文本的内容信息进行分词,得到多个第二分词集合;所述第二分词集合为所述标签匹配保函文本的内容信息中所包含分词的集合;
将所述第一分词集合和所述多个第二分词集合进行合并,得到比对分词集合;
根据所述第一分词集合和所述比对分词集合,确定第一词频;所述第一词频为所述第一分词集合中的各个分词在所述比对分词集合中的词频;
根据所述多个第二分词集合和所述比对分词集合,确定多个第二词频;所述第二词频为所述第二分词集合中的各个分词在所述比对分词集合中的词频;
根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度,包括:
对所述第一词频进行向量化,得到第一分词向量集合;
分别对所述多个第二词频进行向量化,得到多个第二分词向量集合;
根据所述第一分词向量集合和所述多个第二分词向量集合,确定所述各个待匹配相似度。
5.根据权利要求1所述的方法,其特征在于,在所述待审核保函文本通过审核之后,所述方法还包括:
将所述待匹配相似度大于所述预设相似度的标签匹配保函文本,在显示界面中展示。
6.一种审核保函文本的系统,其特征在于,所述系统包括:
获取模块,用于获取待审核保函文本和保函文本库;所述保函文本库中包含多个目标保函文本;所述目标保函文本为已通过审核的保函文本;
确定模块,用于根据所述待审核保函文本的内容信息,确定所述待审核保函文本的分类标签;
所述确定模块,还用于根据所述待审核保函文本的分类标签和所述保函文本库,确定标签匹配保函文本集;所述标签匹配保函文本集中包括至少一个标签匹配保函文本;所述标签匹配保函文本为,所述保函文本库中与所述待审核保函文本具有相同分类标签的目标保函文本;
所述确定模块,还用于根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度;所述待匹配相似度为所述标签匹配保函文本与所述待审核保函文本的相似度;所述待匹配相似度的数量与所述标签匹配保函文本的数量相同;
比对模块,用于将所述各个待匹配相似度与所述预设相似度进行比对;若所述各个待匹配相似度中的任意一个待匹配相似度大于所述预设相似度,则所述待审核保函文本通过审核。
7.根据权利要求6所述的系统,其特征在于,所述获取模块,具体用于:
获取待处理业务信息;所述待处理业务信息包括所述待审核保函文本,以及所述待审核保函文本的开立结构信息;
根据所述待审核保函文本的开立机构信息,从各个预设保函文本库中选择与所述待审核保函文本具有相同开立机构信息的预设保函文本库,作为所述保函文本库。
8.根据权利要求6所述的系统,其特征在于,所述确定模块,包括:
分词单元,用于对所述待审核保函文本的内容信息进行分词,得到第一分词集合;
所述分词单元,还用于对所述各个标签匹配保函文本的内容信息进行分词,得到多个第二分词集合;所述第二分词集合为所述标签匹配保函文本的内容信息中所包含分词的集合;
合并单元,用于将所述第一分词集合和所述多个第二分词集合进行合并,得到比对分词集合;
确定单元,用于根据所述第一分词集合和所述比对分词集合,确定第一词频;所述第一词频为所述第一分词集合中的各个分词在所述比对分词集合中的词频;
所述确定单元,还用于根据所述多个第二分词集合和所述比对分词集合,确定多个第二词频;所述第二词频为所述第二分词集合中的各个分词在所述比对分词集合中的词频;
所述确定单元,还用于根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度。
9.一种终端设备,其特征在于,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述权利要求1-5中任意一项所述的一种审核保函文本的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述权利要求1-5中任意一项所述的一种审核保函文本的方法。
CN202311640145.3A 2023-12-01 2023-12-01 一种审核保函文本的方法、系统、设备及介质 Pending CN117668227A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311640145.3A CN117668227A (zh) 2023-12-01 2023-12-01 一种审核保函文本的方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311640145.3A CN117668227A (zh) 2023-12-01 2023-12-01 一种审核保函文本的方法、系统、设备及介质

Publications (1)

Publication Number Publication Date
CN117668227A true CN117668227A (zh) 2024-03-08

Family

ID=90067539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311640145.3A Pending CN117668227A (zh) 2023-12-01 2023-12-01 一种审核保函文本的方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN117668227A (zh)

Similar Documents

Publication Publication Date Title
CN110781276B (zh) 文本抽取方法、装置、设备及存储介质
CN110163478B (zh) 一种合同条款的风险审查方法及装置
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN111460250B (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN107274291B (zh) 跨平台的估值表解析方法、存储介质及应用服务器
US10482170B2 (en) User interface for contextual document recognition
US11182605B2 (en) Search device, search method, search program, and recording medium
CN110427375B (zh) 字段类别的识别方法及装置
CN110796153A (zh) 一种训练样本的处理方法、装置
CN111581346A (zh) 一种事件抽取方法和装置
US20230394865A1 (en) Methods and systems for performing data capture
CN117150138A (zh) 一种基于高维空间映射的科技资源组织方法及系统
CN117113403A (zh) 一种数据脱敏的方法、装置、电子设备及存储介质
CN111582647A (zh) 用户数据处理方法、装置及电子设备
CN116578700A (zh) 日志分类方法、日志分类装置、设备及介质
CN117668227A (zh) 一种审核保函文本的方法、系统、设备及介质
CN113836297B (zh) 文本情感分析模型的训练方法及装置
CN113222624B (zh) 一种反窃电智能分析方法及系统
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
CN115098619A (zh) 资讯去重方法、装置、电子设备及计算机可读取存储介质
CN114663903B (zh) 文本资料的分类方法、装置、设备及存储介质
CN115017872B (zh) 智能标注pdf文件中表格的方法、装置及电子设备
CN111507236B (zh) 文件处理方法、系统、装置及介质
CN116303909B (zh) 一种电子投标文件与条款的匹配方法、设备及介质
CN110795941B (zh) 一种基于外部知识的命名实体识别方法、系统及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination