CN113590823A - 一种合同审批方法、装置、存储介质及电子设备 - Google Patents

一种合同审批方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN113590823A
CN113590823A CN202110872691.4A CN202110872691A CN113590823A CN 113590823 A CN113590823 A CN 113590823A CN 202110872691 A CN202110872691 A CN 202110872691A CN 113590823 A CN113590823 A CN 113590823A
Authority
CN
China
Prior art keywords
contract
target
keywords
approval
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110872691.4A
Other languages
English (en)
Inventor
余佩颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN202110872691.4A priority Critical patent/CN113590823A/zh
Publication of CN113590823A publication Critical patent/CN113590823A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents

Abstract

本申请公开了一种合同审批方法、装置、存储介质及电子设备。其中方法包括:获取待审批的目标合同;基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;确定所述目标合同的合同类型;至少基于与所述合同类型对应的审批规则对各所述关键词进行审批,获得所述目标合同的审批结果。本申请通过利用目标神经网络语言模型对合同文件进行关键词提取来获得若干关键词,然后利用预设的、与合同类型对应的审批规则来对关键词进行审批,由此能够提高合同的审批速率,解决了合同审批耗费大量人力和时间的问题。

Description

一种合同审批方法、装置、存储介质及电子设备
技术领域
本申请涉及人工智能技术领域,尤其涉及一种合同审批方法、装置、存储介质及电子设备。
背景技术
企业在签署合同过程中,合同文件通常由人工来审批,或者仅对合同文件进行线上录入,后续关于合同的审批仍然需要人工来完成,耗费大量的人力和时间,审批效率较低,并且人工审核有时会漏检一些难以发现的问题,例如跨级签署等,因此会造成对合同文件的审批不够准确的问题。此外由于是人工对合同进行管理,因此在合同签署后,无法对合同内的数据进行统计分析,例如无法对合同金额进行统计,也无法统计出履约情况较差的企业,无法为企业规避风险。
发明内容
有鉴于此,本申请提供了一种合同审批方法、装置、存储介质及电子设备,主要目的在于解决目前存在的人工审批合同不够准确、审批效率低的问题。
为解决上述问题,本申请提供一种合同审批方法,包括:
获取待审批的目标合同;
基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;
确定所述目标合同的合同类型;
至少基于与所述合同类型对应的审批规则对各所述目标关键词进行审批,获得所述目标合同的审批结果。
可选的,所述目标神经网络语言模型的训练方法包括:
获取若干合同类型的语料样本;
获取与各所述语料样本对应的关键词,以获得关键词集合;
基于所述语料样本以及所述关键词集合进行神经网络语言模型的训练,获得所述目标神经网络语言模型。
可选的,所述基于K均值聚类算法对所述关键词进行筛选,具体包括:
基于K均值聚类算法计算各所述关键词与聚类中心之间的距离;
基于各所述关键词与聚类中心之间的距离对各所述关键词进行筛选,获得所述若干目标关键词。
可选的,在对各所述目标关键词进行审批之后,所述方法还包括:
按照预定的显示方式对未通过审批的关键词按照预设显示规则显示,以进行提示可选的,所述在筛选获得目标关键词后,所述方法还包括:
获取所述目标关键词位于所述目标合同中的位置信息;
建立各目标关键词与位置信息的映射关系,获得映射关系表;
在目标关键词审批未通过的情况下,基于所述目标关键词查找所述映射关系表,获得与目标关键词对应的位置信息,
基于所述位置信息、按照预定的显示方式对所述目标合同中的相应位置的关键词进行显示。
可选的,在对各所述目标关键词进行审批之前,所述方法还包括:
基于预定的关键词类型以及所述目标关键词的关键词类型确定待获取的遗漏关键词的关键词类型;
基于所述遗漏关键词的关键词类型获取遗漏的遗漏关键词,以基于与所述合同类型对应的审批规则对各所述目标关键词以及所述遗漏关键词进行审批。
可选的,在获得所述目标合同之后,所述方法还包括:
基于所述目标合同的格式确定目标存储位置,以对所述目标合同进行存储。
为解决上述问题,本申请提供一种合同审批装置,包括:
获取模块,用于获取待审批的目标合同;
提取模块,用于基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
筛选模块,用于基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;
确定模块,用于确定所述目标合同的合同类型;
审批模块,用于至少基于与所述合同类型对应的审批规则对各所述目标关键词进行审批,获得所述目标合同的审批结果
为解决上述问题,本申请提供一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器在执行所述存储器上的计算机程序时实现上述任一项所述合同审批方法的步骤。
为解决上述问题,本申请提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述合同审批方法的步骤。
本申请中的合同审批方法、装置、存储介质及电子设备,通过利用目标神经网络语言模型对合同文件进行关键词提取来获得若干关键词,并利用基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词,然后利用预设的、与合同类型对应的审批规则来对关键词进行审批,由此能够提高合同的审批速率,解决了合同审批耗费大量人力和时间的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例一种合同审批方法的流程图;
图2为本申请又一实施例一种合同审批的流程图;
图3为本申请一实施例合同审理的流程图;
图4为本申请实施例中获取目标关键的流程图;
图5为本申请另一实施例一种合同审批装置的结构框图。
具体实施方式
此处参考附图描述本申请的各种方案以及特征。
应理解的是,可以对此处申请的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本申请的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且与上面给出的对本申请的大致描述以及下面给出的对实施例的详细描述一起用于解释本申请的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本申请的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本申请进行了描述,但本领域技术人员能够确定地实现本申请的很多其它等效形式。
当结合附图时,鉴于以下详细说明,本申请的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本申请的具体实施例;然而,应当理解,所申请的实施例仅仅是本申请的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本申请模糊不清。因此,本文所申请的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本申请。
本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本申请的相同或不同实施例中的一个或多个。
本申请实施例提供一种合同审批方法,如图1所示,包括如下步骤:
步骤S101,获取待审批的目标合同;
本步骤在具体实施过程中,可以从预定的平台系统来获取待审批的目标合同,也可以接收人工录入或人工上传的合同附件来作为目标合同。目标合同的格式可以为文本格式,也可以为图片格式,例如可以为:word格式、pdf格式、text格式、jpg格式、png格式等。本步骤中,当目标合同为非word格式时,可以对非word格式的目标合同进行格式转换,以此来获得word格式的合同文件。
步骤S102,基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
本步骤在具体实施过程中,具体可以使用自然语言处理模型来对目标合同进行信息提取,获得若干语料,例如根据文件段落、标点符号等来对合同文件进行划分,获得一个个语句,以此来作为预料,然后再利用预先训练获得的目标神经网络语言模型对各语料/语句进行关键词提取,由此获得若干关键词。
步骤S103,基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;
步骤S104,确定所述目标合同的合同类型;
本步骤中,合同类型具体可以包括如下任意一种:总部合同类型以及非总部合同类型。当然也可以根据实际需要来细化合同类型,例如合同类型还可以细化为租赁类合同、买卖合同、技术合同、建设工程合同、承揽合同等等。
步骤S105,至少基于与所述合同类型对应的审批规则对各所述目标关键词进行审批,获得所述目标合同的审批结果。
本步骤在具体实施过程中,可以预先建立合同类型与审批规则的对应关系,然后当确定合同类型后,就可以通过查找该对应关系来快速的确定相应的审批规则,利用该审批规则对目标关键词进行审核,以此来获得审批结果。
本申请中的合同审批方法,通过利用目标神经网络语言模型对合同文件进行关键词提取来获得若干关键词,利用K均值聚类算法对所述关键词进行筛选,获得若干目标关键词,然后利用预设的、与合同类型对应的审批规则来对关键词进行审批,由此能够提高合同的审批速率,解决了合同审批耗费大量人力和时间的问题。
本申请又一实施例提供一种合同审批方法,如图2所示,包括如下步骤:
步骤S201,获取若干合同类型的语料样本;获取与各所述语料样本对应的关键词,以获得关键词集合;基于所述语料样本以及所述关键词集合进行神经网络语言模型的训练,获得所述目标神经网络语言模型;
本步骤中,具体可以从若干个合同文件来获得用于进行模型训练的语料样本,即语句;然后获取预料样本中的关键词。模型训练时具体是使用NNLM基于浅层词嵌入的预训练模型使用
Figure BDA0003189308370000061
进行训练,其中wt表示词序列中第t个单词,
Figure BDA0003189308370000062
表示第1个关键到t个关键词的子序列,P表示概率,即输入第1个词到第t-1个词的子序列预测得到关键词wt的概率,f表示计算条件的概率分布。通过上述训练模型进行预测,最后得到候选的关键词,将候选关键词转换成词向量文件,然后进一步对候选关键词进行筛选。例如将合同中包含关键词承保方、甲方、乙方、合同金额等语句抽取出来,对这些词语进行切分以及去除没有实际意义的词句,例如将“合同承保方为中国平安财产保险股份有限公司,保险期限从xxxx到xxxx,承保金额为xxxx元(人民币)”,这个句子最终拆分成“承保方为中国平安财产保险股份有限公司”和“承保金额为xxxx元”。具体的,模型原理如下:1、模型输入:首先从语料库中搜集一系列长度为n的文本序列(wt,wt-1,...,wt-n+1),然后组成训练集D,语料库是在合同领域搜集的文本语料以此来作为训练数据,同时获取相应的关键词集合以作为词典。然后基于训练数据和词典进行模型训练。首先对单个语句序列进行计算,也可以说是单个样本,比如:w1…wt其中wt∈V,V是所有单词的集合(即词典)Vi表示词典中的第i个单词。2、模型参数:NNLM的目标是训练如下模型,该模型的意思是当给定一段序列时,由其前面的(t-1)个词预测第n个词的概率。
Figure BDA0003189308370000071
其中,wt表示词序列中第t个单词,
Figure BDA0003189308370000072
表示从第1个词到第t个词组成的子序列。模型需要满足的如下两个约束条件:
限制条件一:f(wt,wt-1,...,wt-n+2,wt-n+1)>0,该限制条件表示通过神经网络模型得到的每个概率值均要大于0。
限制条件二:
Figure BDA0003189308370000073
该限制条件表示:神经网络模型最终得到的输出是针对每t-1个词的输入来预测下一个,也即是第t个词是什么。因此模型的实际输出是一个向量,该向量的每一个分量依次对应下一个词为词典中某个词的概率。所以|v|维的概率值中必定有一个最大的概率,而其他的概率较小。本步骤通过上述的方式来进行模型训练就可以获得最终的目标神经网络模型,后续就可以利用该神经网络模型来进行关键词提取。
步骤S202,获取待审批的目标合同;
步骤S203,基于所述目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
步骤S204,基于K均值聚类算法计算各所述关键词与聚类中心之间的距离;基于各所述关键词与聚类中心之间的距离对各所述关键词进行筛选,获得目标关键词;
本步骤中,为了使得获取到的关键词更加合理准确,因此可以进一步对各关键词进行筛选,以此来获得目标关键词。即首先会随机选择初始的聚类中心,使用词向量文件对各关键词进行转换,获得各关键词的词向量表示,然后使用k-means聚类算法即使用K均值聚类算法,计算各所述关键词与该初始聚类中心之间的距离,然后根据各关键词与聚类中心之间的聚类对各关键词进行分类,获得若干聚类簇,接着基于各聚类簇计算平均值,以作为新的聚类中心,然后计算各个关键词与聚类中心的距离,最后根据各关键词与聚类中心的距离来对关键词进行筛选,以获得目标关键词。例如,筛选获得的关键词包括“合同”、“金额”、“我方A有限责任公司”、“他方B有限责任公司”、“生效日期2020年1月1日”、“到期日期2021年1月1日”、“合同总额100万人民币”、“签字日期2020年12月1日”、“盖章日期2020年12月1日”以及“用印对象:甲”等等,然后确定聚类中心为“合同”“金额”,分别计算各关键词与这两个聚类中心的聚类,经过多次迭代后,得出所有关键词与聚类中想的聚类,将与聚类中心聚类最近的Topk(顶部)作为最终选定的目标关键词,例如最终得出关键词包括:“我方A有限责任公司”、“他方B有限责任公司”、“生效日期2020年1月1日”、“到期日期2021年1月1日”、“合同总额100万人民币”以及“用印对象:甲”。
步骤S205,确定所述目标合同的合同类型;
本步骤中,合同类型具体可以包括如下任意一种:总部合同类型以及非总部合同类型。当然也可以根据实际需要来细化合同类型,例如合同类型还可以为租赁类合同、买卖合同、技术合同、建设工程合同、承揽合同等等。
步骤S206,基于与所述合同类型对应的审批规则对各所述目标关键词进行审批,获得所述目标合同的审批结果。
本步骤中以合同类型包括总部合同类型以及非总部合同类型为例,那么审批规则可以包括与总部合同类型对应的第一审批规则,以及与非总部合同类型对应的第二审批规则。
具体的,第一审批规则可以包括如下任意一种或几种:对签署主体进行审核,判断所述签署主体是否为总部名称;对签署金额进行审核,判断所述签署金额是否小于第一预定值;对用印对象进行审核,判断所述用印对象是否为预定的第一用印对象;对他方信息进行审核,判断所述他方信息对应的信誉是否良好。
所述第二审批规则可以包括如下任意一种或几种:对签署主体进行审核,判断所述签署主体是否为下级机构名称;对签署金额进行审核,判断所述签署金额是否小于第二预定值;对用印对象进行审核,判断所述用印对象是否为预定的第二用印对象;对他方信息进行审核,判断所述他方信息对应的信誉是否良好。
例如当确定合同类型为非总部合同类型,进而确定审批规则为第二审批规则,且获得如下目标关键词时:“我方A有限责任公司”、“他方B有限责任公司”、“生效日期2020年1月1日”、“到期日期2021年1月1日”、“合同总额100万人民币”以及“用印对象:甲”,就可以对上述目标关键进行审批,例如审批“我方A有限责任公司”是否为下级机构名称,如果不是下级机构的名称则确定签署主体错误、签署主体审批未通过。审批“合同总额100万人民币”是否小于第二预定值,例如审批其是否小于500万,其小于500万则确定合同总额审批通过。审批“用印对象:甲”是否为预定的第二用印对象,如其为预定的第二用印对象,则用印对象审批通过。审批他方“他方B有限责任公司”信息对应的信誉,判断“他方B有限责任公司”的信誉是否良好,若良好则他方信誉审批通过。
本实施例在具体实施过程中,具体可以根据历史合同的履约情况来确定签署过合约的他方企业/单位的信誉,然后建立他方企业/单位与信誉的对应关系,由此就可以通过查找该对应关系来快速获得他方的信誉情况。具体的,还可以对信誉进行等级划分,例如可以将出现拖欠尾款、一直未支付的企业/单位的信誉设置为较差,将出现拖欠尾款、但已支付的企业/单位的信誉设置为一般,将按照合约规定进行支付的企业/单位的信誉设置为良好。这样在进行信誉审批时,就可以根据不同的信誉等级获得不同的审批结果,例如对信誉等级为较差的企业/单位的审批不通过,对信誉等级为一般的企业/单位的审批通过、且按照预定的提示方式进行风险提示,对信誉等级为良好的企业/单位的审批通过。
本实施例在具体实施过程中,在获得各关键的审批结果后,可以按照预定的显示方式对未通过审批的关键词进行突出显示,以进行提示。例如按照预定的字体颜色对未通过的关键词进行显示,以此来使得用户能够有针对性的对合同文件的相关内容进行审核或修改,提高了合同文件的审批效率。
本实施例中,为了使得用户能够快速的找到合同文件中需要进一步确认、修改相关内容的具体位置,即确定审批未通过的关键词在合同文件中的具体位置,本申请在提取获得各关键词之后,还可以进一步获取到各关键词的位于目标合同中的位置信息,由此在对各关键词筛选获得目标关键词时,就可以直接获得各目标目标关键词位于所述目标合同中的位置信息;建立各目标关键词与位置信息的映射关系,获得映射关系表;在目标关键词审批未通过的情况下,基于所述目标关键词查找所述映射关系表,获得与目标关键词对应的位置信息,基于所述位置信息、按照预定的显示方式对所述目标合同中的相应位置的关键词进行显示。例如当审批“合同总额600万人民币”不小于预定的500万人民币时,则可以确定合同总额审批不通过,此时,则可以通过查找映射关系表来“合同总额600万人民币”在目标合同中的位置信息,例如确定“合同总额600万人民币”位于目标合同的第3页中的第2行,则可以直接对目标合同的相应位置进行突出显示,例如按照预定的文字颜色对第3页中的第2行的文字进行显示,或者按照预定的底纹颜色对第3页中的第2行的背景进行显示,以此来使得用于快速找到需要进行修改的文件位置。
本实施例在具体实施过程中,为了使得最终的审批结果更加准确,还可以通过人工来获取遗漏的遗漏关键词。具体的是基于预定的关键词类型以及所述目标关键词的关键词类型确定待获取的遗漏关键词的关键词类型;然后基于所述遗漏关键词的关键词类型获取遗漏的遗漏关键词,以基于与所述合同类型对应的审批规则对各所述目标关键词以及所述遗漏关键词进行审批。即预先会设定需要获得的待审批的关键词类型,例如关键词类型可以包括合同金额、我方名称、他方名称等等,当获得的目标关键词的关键词类型只包括合同金额以及我方名称、少于预定的关键词类型时,则说明获取的目标关键词缺失,由此就可以确定待获取的遗漏关键词的关键词类型为他方名称,然后进一步获取遗漏关键词。例如,获取到目标关键词之后可以将目标关键词填入到审批模板,当获得的目标关键词类型少于预定的关键词类型时,即审批模板中存在未填充的位置时,则说明关键词提取缺失。由此可以有人工根据缺失的关键词的关键词类型来获取遗漏的关键词,然后将获取到的遗漏关键词填充至审批模板的相应位置,由此就可以根据审批规则来对审批模板中的各关键词进行审批,获得审批结果。本实施例中通过由人工来获取遗漏关键词为后续对关键词的审批奠定了基础,为后续基于关键词快速的对目标合同进行审批提供了保障。本实施例中为了使得最终的审批结果更加准确,在获得审批结果之后,还可以由人工来进行复审。通过只对审批通过的合同进行复审,能够降低工作人员的工作量,在保证合同文件准确的同时提高了合同的审批速率。
本实施例在具体实施过程中,在获得所述目标合同之后,还可以基于所述目标合同的格式确定所述目标合同的存储位置,以对所述目标合同进行存储。本实施例中,不同格式类型的合同文件设置有不同的存储位置,并建立格式和存储位置的对应关系,例如word格式的合同文件可以设置存储位置为A,PDF格式的合同文件可以设置存储位置为B,这样就可以将同一格式的目标合同存储在同一位置,以此来对目标合同进行备份,避免了由于出现错误导致目标合同丢失、需要重新上传合同的问题。并且在后续人工需要查看目标合同时,能够根据合同的格式快速确定其存储位置、以快速的找到目标合同。
本实施例中当目标合同审批通过后,还可以根据提取获得的目标关键词中的用印对象,来对目标合同进行盖章、签字。用印完成后还可以进行合同归,将合同统一存放在第一预定位置,例如还可以根据合同类型、合同涉及金额大小来对合同进行分类存储。
为了对上述实施例做进一步解释,以下结合图3和图4所示对合同审批的流程进行具体说明。在合同录入开始后执行步骤S1选择目标合同的类型。然后执行步骤S2上传合同附件。具体可以对合同附件进行识别来获得文本文件,然后对文本文件类型的合同利用目标神经网络模型来进行AI拆解,即执行步骤S3对合同内容进行AI拆解,以此来获得若干关键词,然后执行步骤S4对关键词进行筛选来获得若干目标关键词,具体的获取目标关键词的具体流程可以如图4所示,首先S41进行模型训练,然后利用词向量文件来对目标合同进行处理,S42获得预处理文本,然后利用训练获得的模型对预处理文本进行关键词提取,S43获得若干候选关键词,利用词向量文件对候选关键词进行转换,S44得到候选关键词的词向量表示,S45利用K-MEANS聚类方法获取聚类中心,计算各候选关键词与聚类中心之间的距离,S46根据候选关键词与聚类中心的对曼哈顿距离对候选关键词进行排序,S47选取Top-K作为最后的目标关键词,即选取距离小于预定值的候选关键词作为最后的目标关键词。在拆解成功并筛选完成的情况下执行步骤S5自动填充合同要素,即将获得目标关键词填充至预定审批中的各目标位置,在未拆解成功或未获得全部目标关键词的情况下则执行步骤S6,自动填充部分关键词,余下进行手动填充。然后执行步骤S7合同提交并进行规则校验,即将填充有目标关键词的审批目标提交至相应的审核模块,以利用与目标合同类型对应的审批规矩对审批目标中的各目标关键词进行审批。若审批失败,则返回,将合同的流程推到上传合同附件的节点处。若审批成功,则执行步骤S8进入复审,例如可以由人工来对审批合格的合同文件进行复审。若复审失败将合同的流程推到上传合同附件的节点处。复审通过则执行步骤S9进行合同用印,然后执行步骤S10合同归档、步骤S11履约,步骤S12数据统计分析直至结束。在具体实施过程中,在履约过程中还可以进一步统一对进行中的合同进行管理,例如根据合同类型、合同涉及的金额来对合同文件进行分类存储。在履约完成后还可以进一步对数据统计分析,确定出履约情况差的企业,以在后续与该企业合作时进行风险提醒。
为解决上述技术问题,本申请另一实施例提供一种合同审批装置,如图5所示,包括:
获取模块1,用于获取待审批的目标合同;
提取模块2,用于基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
筛选模块3,用于基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;
确定模块4,用于确定所述目标合同的合同类型;
审批模块5,用于至少基于与所述合同类型对应的审批规则对各所述关键词进行审批,获得所述目标合同的审批结果
本实施例中的合同审批装置还包括模型训练模块,所述模型训练模块用于:获取合同类型的若干语料样本;获取与各所述语料样本对应的关键词,以获得关键词集合;基于所述语料样本以及所述关键词集合进行神经网络语言模型的训练,获得所述目标神经网络语言模型。
本实施例中的筛选模块具体用于:基于K均值聚类算法计算各所述关键词与聚类中心之间的距离;基于各所述关键词与聚类中心之间的距离对各所述关键词进行筛选,获得目标关键词,以基于与所述合同类型对应的审批规则对各所述目标关键词进行审批。
本实施例中,所述合同类型包括如下任意一种:总部合同类型以及非总部合同类型;所述审批规则包括与总部合同类型对应的第一审批规则以及与非总部合同类型对应的第二审批规则。所述第一审批规则包括如下任意一种或几种:对签署主体进行审核,判断所述签署主体是否为总部名称;对签署金额进行审核,判断所述签署金额是否小于第一预定值;对用印对象进行审核,判断所述用印对象是否为预定的第一用印对象;对他方信息进行审核,判断所述他方信息对应的信誉是否良好;所述第二审批规则包括如下任意一种或几种:对签署主体进行审核,判断所述签署主体是否为下级机构名称;对签署金额进行审核,判断所述签署金额是否小于第二预定值;对用印对象进行审核,判断所述用印对象是否为预定的第二用印对象;对他方信息进行审核,判断所述他方信息对应的信誉是否良好。
具体的,本实施例中的合同审批装置还包括显示模块,所述显示模块用于:按照预定的显示方式对未通过审批的关键词进行突出显示,以进行提示。
具体的,本实施例中的合同审批装置还包括位置提示模块,所述位置提示模块具体用于:获取所述目标关键词位于所述目标合同中的位置信息;建立各目标关键词与位置信息的映射关系,获得映射关系表;在目标关键词审批未通过的情况下,基于所述目标关键词查找所述映射关系表,获得与目标关键词对应的位置信息,基于所述位置信息、按照预定的显示方式对所述目标合同中的相应位置的关键词进行显示。
本实施例中,合同审批装置还包括复审模块,所述复审模块具体用于:基于预定的关键词类型以及所述目标关键词的关键词类型确定待获取的遗漏关键词的关键词类型;基于所述遗漏关键词的关键词类型获取遗漏的遗漏关键词,以基于与所述合同类型对应的审批规则对各所述目标关键词以及所述遗漏关键词进行审批。
本实施例中还包括存储模块,所述存储模块具体用于:基于所述目标合同的格式确定目标存储位置,以对所述目标合同进行存储。
本申请通过对合同文件进行关键词提取来获得若干关键词,并利用基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词,然后利用预设的、与合同类型对应的审批规则来对关键词进行审批,由此能够提高合同的审批速率,解决了合同审批耗费大量人力和时间的问题。
本申请又一实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下方法步骤:
步骤一、获取待审批的目标合同;
步骤二、基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
步骤三、基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;
步骤四、确定所述目标合同的合同类型;
步骤五、至少基于与所述合同类型对应的审批规则对各所述关键词进行审批,获得所述目标合同的审批结果。
上述方法步骤的具体实施过程可参见上述任意合同审批方法的实施例,本实施例在此不再重复赘述。
本申请通过对合同文件进行关键词提取来获得若干关键词,并利用基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词,然后利用预设的、与合同类型对应的审批规则来对关键词进行审批,由此能够提高合同的审批速率,解决了合同审批耗费大量人力和时间的问题。
本申请又一实施例提供一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现下方法的步骤:
步骤一、获取待审批的目标合同;
步骤二、基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
步骤三、基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;
步骤四、确定所述目标合同的合同类型;
步骤五、至少基于与所述合同类型对应的审批规则对各所述关键词进行审批,获得所述目标合同的审批结果。
上述方法步骤的具体实施过程可参见上述任意合同审批方法的实施例,本实施例在此不再重复赘述。
本申请通过对合同文件进行关键词提取来获得若干关键词,并利用基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词,然后利用预设的、与合同类型对应的审批规则来对关键词进行审批,由此能够提高合同的审批速率,解决了合同审批耗费大量人力和时间的问题。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (10)

1.一种合同审批方法,其特征在于,包括:
获取待审批的目标合同;
基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;
确定所述目标合同的合同类型;
基于与所述合同类型对应的审批规则对各所述目标关键词进行审批,获得所述目标合同的审批结果。
2.如权利要求1所述的方法,其特征在于,所述目标神经网络语言模型的训练方法包括:
获取若干合同类型的语料样本;
获取与各所述语料样本对应的关键词,以获得关键词集合;
基于所述语料样本以及所述关键词集合进行神经网络语言模型的训练,获得所述目标神经网络语言模型。
3.如权利要求1所述的方法,其特征在于,所述基于K均值聚类算法对所述关键词进行筛选,具体包括:
基于K均值聚类算法计算各所述关键词与聚类中心之间的距离;
基于各所述关键词与聚类中心之间的距离对各所述关键词进行筛选,获得所述若干目标关键词。
4.如权利要求1所述的方法,其特征在于,在对各所述目标关键词进行审批之后,所述方法还包括:
按照预定的显示方式对未通过审批的关键词按照预设显示规则显示,以进行提示。
5.如权利要求3所述的方法,其特征在于,在筛选获得目标关键词后,所述方法还包括:
获取所述目标关键词位于所述目标合同中的位置信息;
建立各目标关键词与位置信息的映射关系,获得映射关系表;
在目标关键词审批未通过的情况下,基于所述目标关键词查找所述映射关系表,获得与目标关键词对应的位置信息,
基于所述位置信息、按照预定的显示方式对所述目标合同中的相应位置的关键词进行显示。
6.如权利要求3所述的方法,其特征在于,在对各所述目标关键词进行审批之前,所述方法还包括:
基于预定的关键词类型以及所述目标关键词的关键词类型确定待获取的遗漏关键词的关键词类型;
基于所述遗漏关键词的关键词类型获取遗漏的遗漏关键词,以基于与所述合同类型对应的审批规则对各所述目标关键词以及所述遗漏关键词进行审批。
7.如权利要求1所述的方法,其特征在于,在获得所述目标合同之后,所述方法还包括:
基于所述目标合同的格式确定目标存储位置,以对所述目标合同进行存储。
8.一种合同审批装置,其特征在于,包括:
获取模块,用于获取待审批的目标合同;
提取模块,用于基于预设的目标神经网络语言模型对所述目标合同进行关键词提取,获得若干关键词;
筛选模块,用于基于K均值聚类算法对所述关键词进行筛选,获得若干目标关键词;
确定模块,用于确定所述目标合同的合同类型;
审批模块,用于至少基于与所述合同类型对应的审批规则对各所述关键词进行审批,获得所述目标合同的审批结果。
9.一种电子设备,其特征在于,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现上述1-7任一项所述合同审批方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述1-7任一项所述合同审批方法的步骤。
CN202110872691.4A 2021-07-30 2021-07-30 一种合同审批方法、装置、存储介质及电子设备 Pending CN113590823A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110872691.4A CN113590823A (zh) 2021-07-30 2021-07-30 一种合同审批方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110872691.4A CN113590823A (zh) 2021-07-30 2021-07-30 一种合同审批方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN113590823A true CN113590823A (zh) 2021-11-02

Family

ID=78252631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110872691.4A Pending CN113590823A (zh) 2021-07-30 2021-07-30 一种合同审批方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113590823A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115497178A (zh) * 2022-11-21 2022-12-20 山东双仁信息技术有限公司 一种停车场外来车辆管理方法及系统
CN117132244A (zh) * 2023-10-26 2023-11-28 国网浙江省电力有限公司 用于智慧合规管理系统的分类处理方法、装置及存储介质
CN117422428A (zh) * 2023-12-19 2024-01-19 尚恰实业有限公司 一种基于人工智能的机器人自动审批方法及系统
CN117436815A (zh) * 2023-11-17 2024-01-23 北京九思协同软件有限公司 基于自然语言大模型的流程智能审批方法
CN117495314A (zh) * 2024-01-02 2024-02-02 尚恰实业有限公司 一种基于机器学习的自动化审批方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115497178A (zh) * 2022-11-21 2022-12-20 山东双仁信息技术有限公司 一种停车场外来车辆管理方法及系统
CN117132244A (zh) * 2023-10-26 2023-11-28 国网浙江省电力有限公司 用于智慧合规管理系统的分类处理方法、装置及存储介质
CN117132244B (zh) * 2023-10-26 2024-01-09 国网浙江省电力有限公司 用于智慧合规管理系统的分类处理方法、装置及存储介质
CN117436815A (zh) * 2023-11-17 2024-01-23 北京九思协同软件有限公司 基于自然语言大模型的流程智能审批方法
CN117422428A (zh) * 2023-12-19 2024-01-19 尚恰实业有限公司 一种基于人工智能的机器人自动审批方法及系统
CN117422428B (zh) * 2023-12-19 2024-03-08 尚恰实业有限公司 一种基于人工智能的机器人自动审批方法及系统
CN117495314A (zh) * 2024-01-02 2024-02-02 尚恰实业有限公司 一种基于机器学习的自动化审批方法及系统
CN117495314B (zh) * 2024-01-02 2024-04-02 尚恰实业有限公司 一种基于机器学习的自动化审批方法及系统

Similar Documents

Publication Publication Date Title
CN113590823A (zh) 一种合同审批方法、装置、存储介质及电子设备
CN110765770A (zh) 一种合同自动生成方法及装置
CN108876166A (zh) 财务风险验证处理方法、装置、计算机设备及存储介质
CN110377631B (zh) 案件信息处理方法、装置、计算机设备和存储介质
CN110362542B (zh) 核电站文件编码方法、装置、计算机设备和存储介质
CN110362798B (zh) 裁决信息检索分析方法、装置、计算机设备和存储介质
CN112035595A (zh) 医疗领域中审核规则引擎的构建方法、装置和计算机设备
CN110866836A (zh) 计算机执行的医疗保险立案审核方法和装置
CN110674250A (zh) 一种文本匹配方法、装置、计算机系统及可读存储介质
US20160246795A1 (en) Forensic system, forensic method, and forensic program
CN111767390A (zh) 技能词评估方法及装置、电子设备、计算机可读介质
CN113297852B (zh) 一种医学实体词的识别方法和装置
CN113256383B (zh) 保险产品的推荐方法、装置、电子设备及存储介质
KR102280490B1 (ko) 상담 의도 분류용 인공지능 모델을 위한 훈련 데이터를 자동으로 생성하는 훈련 데이터 구축 방법
US11461616B2 (en) Method and system for analyzing documents
CN113269179B (zh) 数据处理方法、装置、设备及存储介质
CN113240325B (zh) 数据处理方法、装置、设备及存储介质
CN115829722A (zh) 信用风险评分模型的训练方法及信用风险评分方法
CN111652767B (zh) 用户画像构建方法、装置、计算机设备和存储介质
CN113779998A (zh) 业务信息的结构化处理方法、装置、设备及存储介质
CN114580398A (zh) 文本信息提取模型生成方法、文本信息提取方法和装置
CN113591480A (zh) 电力计量的命名实体识别方法、装置和计算机设备
CN116991983B (zh) 一种面向公司资讯文本的事件抽取方法及系统
CN112988957B (zh) 案件预判结果生成方法、装置、电子设备
CN117195004B (zh) 一种融合行业分类和wvLDA主题模型的政策匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination