CN114003692A - 合同文本信息的处理方法、装置、计算机设备及存储介质 - Google Patents
合同文本信息的处理方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114003692A CN114003692A CN202111275428.3A CN202111275428A CN114003692A CN 114003692 A CN114003692 A CN 114003692A CN 202111275428 A CN202111275428 A CN 202111275428A CN 114003692 A CN114003692 A CN 114003692A
- Authority
- CN
- China
- Prior art keywords
- contract
- audited
- standard
- text
- clauses
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 9
- 230000010365 information processing Effects 0.000 title description 3
- 238000006243 chemical reaction Methods 0.000 claims abstract description 56
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000012216 screening Methods 0.000 claims abstract description 18
- 238000004590 computer program Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 9
- 238000012550 audit Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 4
- 239000010931 gold Substances 0.000 description 4
- 229910052737 gold Inorganic materials 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及数据处理领域,揭示了一种合同文本信息的处理方法、装置、计算机设备及存储介质,其中方法包括:获取待审核合同文本;根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息确定所述待审核合同文本的合同分类;从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本;将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款;基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。本申请能够提高合同文本的审核效率以及风险识别准确率。
Description
技术领域
本申请涉及到数据处理领域,特别是涉及到一种合同文本信息的处理方法、装置、计算机设备及存储介质。
背景技术
目前对于企业来说,企业用户要完成一份符合法律、业务要求的合同,需要在已有合同模板的基础上,完成具体业务数据的填充,从而形成一份合同文件,用户需要花费大量的精力和时间在查找合同模板,填写相关业务数据,并提交给相关人员进行审核,多次确认修改后才可以生成一份可用的合同文件,而目前对于合同文件的审核,往往需要相关人员进行校对、审核,或者利用文本软件自带的检查工具,对合同信息进行文字及格式的审核,而无法对合同的内容进行审核,尤其是审核当前合同使用的模板是否符合企业标准,是否符合法律相关标准,导致目前合同文本是否符合指定标准的审核效率低,并且,当合同不符合指定标准,无法快速地对合同进行修正,导致合同文本的错误修正的效率低,合同文本标准化的准确度低。
发明内容
本申请的主要目的为提供一种合同文本信息的处理方法、装置、计算机设备及存储介质,旨在解决目前合同文本的标准审核及修正的效率低,准确度低的问题。
为了实现上述发明目的,本申请提出一种合同文本信息的处理方法,包括:
获取待审核合同文本;
根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息确定所述待审核合同文本的合同分类;
从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本;
将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款;
基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。
进一步地,所述从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款,包括:
获取待审核合同文本中的待审核条款及所述待审核条款的文本信息;
根据所述文本信息从所述合同标准范本确定标准条款;
将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款。
进一步地,所述风险合同条款包括差异合同条款与错误合同条款;所述将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款,包括:
将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于第一预设值,将所述待审核条款确定为差异合同条款;
若所述待审核条款与所述标准条款的差异度大于第二预设值,将所述待审核条款确定为错误合同条款。
进一步地,所述基于预配置的转化规则将所述风险合同条款转化为标准条款之前,还包括:
获取所述风险合同条款中的差异信息;
获取所述差异信息对应的标准条款的标准信息;
将所述差异信息与所述标准信息关联输出展示,并在接收到转化指令后基于预配置的转化规则将所述风险合同条款转化为标准条款。
进一步地,所述根据所述项目信息确定所述待审核合同文本的合同分类,包括:
获取所述项目信息的第一内容特征;
获取若干个所述项目信息的组合内容特征;
根据所述第一内容特征与所述组合内容特征确定所述待审核合同文本的合同分类。
进一步地,所述基于预配置的转化规则将所述风险合同条款转化为标准条款,包括:
识别所述风险合同条款的语义,提取所述风险合同条款的包含第一实体信息及所述第一实体信息对应的第一数值;
识别所述标准条款的语义,提取所述标准条款中与所述第一实体信息对应的第二实体信息;
将所述标准条款中的所述第二实体信息的数据值配置为所述第一数值,得到标准条款。
进一步地,所述根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,还包括:
获取所述待审核合同文本的应用领域;
获取所述应用领域的先验知识数据;
将所述自然语言算法配置所述先验知识数据,得到具有先验知识数据的自然语言算法;
根据所述具有先验知识数据的自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息。
本申请还提供一种合同文本信息的处理装置,包括:
数据获取模块,用于获取待审核合同文本;
合同分类模块,用于根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息确定所述待审核合同文本的合同分类;
合同匹配模块,用于从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本;
异常筛选模块,用于提将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款;
合同转化模块,用于基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述合同文本信息的处理方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述合同文本信息的处理方法的步骤。
本申请例提供了一种针对合同文本信息进行风险识别及审核的方法,首先获取待审核合同文本,根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息获取确定所述待审核合同文本的合同分类,再从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本,将所述合同标准范本与所述待审核合同文本进行比较,具体的,将所述待审核合同文本的每一条待审核条款与对应的合同标准范本的标准条款进行比较,当所述待审核条款与所述标准条款的差异度大于预设值时,确定所述待审核条款为风险合同条款,从而从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款,基于预配置的转化规则将所述风险合同条款转化为标准条款,将所述标准条款的主体内容替换所述风险合同条款的主体内容,再将所述风险条款中的具体数值内容填入所述标准条款的主体内容中,完成将所述风险合同条款转化为标准条款,当所述待审核合同文本的风险合同条款转化为标准条款之后,根据所述待审核合同文本及所述标准条款生成转化合同,即根据非风险合同条款与标准条款生成转化合同,得到准确、符合预设法律要求的合同文本,提高合同文本的审核效率以及提高不同分类下的合同的风险识别准确率,从而提高合同文本的标准审核及修正的效率、及合同文本内容的准确性。
附图说明
图1为本申请合同文本信息的处理方法的一实施例流程示意图;
图2为本申请合同文本信息的处理装置的一实施例结构示意图;
图3为本申请计算机设备的一实施例结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种合同文本信息的处理方法,包括步骤S10-S50,对于所述合同文本信息的处理方法的各个步骤的详细阐述如下,所述合同文本信息的处理方法可以由内置有相应功能的应用程序完成,例如内置于应用程序中的“合同审核”功能,通过该功能使得应用程序能够完成合同中的条款审核,所述应用程序可以运行于终端设备上或运行于云端服务器中,因此,所述合同文本信息的处理方法也可以理解为由运行所述应用程序的终端设备或云端服务器完成。
S10、获取待审核合同文本。
本实施例应用于合同文本的起草、识别及管理中,随着数字化的不断发展,企业需要制定不同业务要求下的符合法律的合同文本,当用户起草了合同后,需要对合同进行审核,此时将合同上传至应用了本合同文本信息的处理方法的审核系统上,审核系统可以依据本方法对合同进行审核,将待审核的合同定义为待审核合同文本。所述待审核合同文本包括不同格式的合同文件,包括pdf、jpg、png、doc、docx等格式的待审核合同文本,为了应对不同格式的合同文件,若所述待审核合同文本为pdf、jpg格式的合同文件,采用ocr识别技术识别所述待审核合同文本,将所述待审核合同文本转为文本格式的文件,以准确地对所述待审核合同文本进行识别,审核。
S20、根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息获取确定所述待审核合同文本的合同分类。
本实施例中,在得到待审核合同文本之后,为了准确地识别所述待审核合同文本的分类,根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的不同部分的信息,例如前序部分、正文部分,结尾部分,签名部分,其中,正文部分又包含甲方责任部分,甲方权利部分,乙方责任部分,乙方权利部分,每一不同的部分定义为不同的项目信息,根据识别到的项目信息确定待审核合同文本的合同分类。具体的,通过配置自然语言算法模型,然后对不同的合同文本的样本进行识别训练,使得训练好的自然语言算法模型具有对整个合同文本的内容进行识别和分类的能力,能够识别出合同文本中包含的不同项目信息以及根据项目信息对合同文本进行分类。在一种实施方式中,对于合同文本中包含的项目信息的识别与确定,通过对不同项目信息拼接后的合同文本样本进行识别训练,首先,采集多份独立的项目信息数据样本,然后将至少两份不同的所述项目信息数据样本进行拼接组合,得到合同文本样本,再使用自然语言算法模型预测合同文本样本中包含的不同项目信息的数量,基于自然语言算法模型预测的项目信息数据的数量与拼接的合同文本样本包含的项目信息的数量对所述自然语言算法模型进行训练,使得训练好的自然算法语言模型具有对整个合同文本的内容进行识别和分类的能力,从而使用自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息数据,提高了对待审核合同文本中的文本内容的识别效果,再根据识别得到的项目信息确定待审核合同文本的合同分类。
S30、从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本。
本实施例中,在获取所述待审核合同文本的合同分类之后,不同分类的合同在合同知识库中配置了该分类的标准合同,定义为合同标准范本,所述合同标准范本基于多份样本合同进行机器学习,采用工程化方法综合运用规则、智能算法识别样本合同包含的主体固定内容框架,然后提取内容框架中的各个合同要素,再拆分各个合同要素中的合同条款,然后识别所述合同条款,提取多个样本合同中同一合同条款的统一特征信息,确定为标准条款,再基于所述标准条款生成该合同分类下的合同标准范本,并将所述合同标准范本与所述合同分类关联存储至合同知识库,得到预配置的合同知识库,从而便可从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本。在一种实施方式中,所述合同标准范本通过机器学习得到,具体包括获取样本合同,识别样本合同包含的主体固定内容框架,提取内容框架中的各个合同要素,拆分各个合同要素中的合同条款,提取多个样本合同中同一合同条款的统一特征信息,根据所述统一特征信息确定标准条款;基于所述标准条款生成该合同分类下的合同标准范本,然后将所述合同标准范本与所述和合同分类关联存储至合同知识库,从而生成合同标准范本,然后在对每一次的合同进行修改时,保留所述合同的历史修改信息,从而提高合同文本信息的追溯。
S40、将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款。
本实施例中,在从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本之后,将所述合同标准范本与所述待审核合同文本进行比较,具体的,将所述待审核合同文本的每一条待审核条款与对应的合同标准范本的标准条款进行比较,当所述待审核条款与所述标准条款的差异度大于预设值时,确定所述待审核条款为风险合同条款,从而从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款。
S50、基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。
本实施例中,在从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款后,基于预配置的转化规则将所述风险合同条款转化为标准条款,即将所述标准条款的主体内容替换所述风险合同条款的主体内容,在一种实施方式中,获取所述风险合同条款中导致所述差异度大于预设值的单词或短句,具体的,将所述风险合同条款进行语义拆分,拆分成多个部分的风险单词或风险短句,然后将标准条款也进行语义拆分,拆分成多个部分的标准单词或标准短句,再将所述风险单词与所述标准单词逐一进行比较,以及将风险短句与标准短句逐一进行比较,确定导致所述差异度大于预设值的单词或短句,确定为目标风险单词或目标风险短句,然后将对应的标准单词替换所述目标风险单词或将标准短句替换所述目标风险短句,从而完成风险合同条款的转换,再将所述风险条款中的具体数值内容填入所述标准条款中,完成将所述风险合同条款转化为标准条款,当所述待审核合同文本的风险合同条款转化为标准条款之后,根据所述待审核合同文本及所述标准条款生成转化合同,即根据非风险合同条款与标准条款生成转化合同,得到准确、符合预设法律要求的合同文本,提高合同文本的审核效率以及提高不同分类下的合同的风险识别准确率。
本实施例提供了一种针对合同文本信息进行风险识别及审核的方法,首先获取待审核合同文本,根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息获取确定所述待审核合同文本的合同分类,再从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本,将所述合同标准范本与所述待审核合同文本进行比较,具体的,将所述待审核合同文本的每一条待审核条款与对应的合同标准范本的标准条款进行比较,当所述待审核条款与所述标准条款的差异度大于预设值时,确定所述待审核条款为风险合同条款,从而从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款,基于预配置的转化规则将所述风险合同条款转化为标准条款,将所述标准条款的主体内容替换所述风险合同条款的主体内容,再将所述风险条款中的具体数值内容填入所述标准条款的主体内容中,完成将所述风险合同条款转化为标准条款,当所述待审核合同文本的风险合同条款转化为标准条款之后,根据所述待审核合同文本及所述标准条款生成转化合同,即根据非风险合同条款与标准条款生成转化合同,得到准确、符合预设法律要求的合同文本,提高合同文本的审核效率以及提高不同分类下的合同的风险识别准确率,从而提高合同文本的标准审核及修正的效率、及合同文本内容的准确性。
在一个实施例中,所述从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款,包括:
获取待审核合同文本中的待审核条款及所述待审核条款的文本信息;
根据所述文本信息从所述合同标准范本确定标准条款;
将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款。
本实施例中,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款的具体实施方式,所述待审核合同文本中包含若干条合同条款,将其定义为待审核条款,通过逐条地对待审核合同文本中的条款进行审核,具体的,获取待审核合同文本中的待审核条款及所述待审核条款的文本信息,所述文本信息标记了该条款所属的框架及要素信息,根据所述文本信息可以确定在所述合同标准范本中对应的标准条款,从而根据所述文本信息从所述合同标准范本确定标准条款,将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款,通过逐一进行比较,从而对待审核合同文本中每一条待审核条款进行审核,提高待审核合同文本中待审核条款的审核效率与准确率。
在一个实施例中,所述风险合同条款包括差异合同条款与错误合同条款;所述将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款,包括:
将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于第一预设值,将所述待审核条款确定为差异合同条款;
若所述待审核条款与所述标准条款的差异度大于第二预设值,将所述待审核条款确定为错误合同条款。
本实施例中,在将所述待审核条款与所述标准条款进行比较,确定待审核条款是否为风险合同条款的过程中,将所述风险合同条款定义包括差异合同条款与错误合同条款;然后将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于第一预设值,将所述待审核条款确定为差异合同条款,其中,所述差异合同条款定义为所述待审核条款与标准条款存在错别字或者表达方式的差异,而该待审核条款的整体语义与标准条款无差;另外,若所述待审核条款与所述标准条款的差异度大于第二预设值,将所述待审核条款确定为错误合同条款,当待审核条款与所述标准条款的差异度超过一定值后,则确定待审核条款为错误条款,即该错误条款不满足预设的法律要求,通过对不同差异度的划分,快速地识别出差异合同条款与错误合同条款,并可以将识别到的差异点和错误点进行自动处理,完成对待审核合同文本的替换,从而提高待审核合同文本中各个合同条款审核的效率及准确率。
在一个实施例中,所述基于预配置的转化规则将所述风险合同条款转化为标准条款之前,还包括:
获取所述风险合同条款中的差异信息;
获取所述差异信息对应的标准条款的标准信息;
将所述差异信息与所述标准信息关联输出展示,并在接收到转化指令后基于预配置的转化规则将所述风险合同条款转化为标准条款。
本实施例中,在基于预配置的转化规则将所述风险合同条款转化为标准条款之前,获取所述风险合同条款中的差异信息,即通过将风险合同条款与标准合同条款相比较,识别出将风险合同条款与标准合同条款具有差异的部分,然后获取所述差异信息对应的标准条款的标准信息,具体的,通过语义识别将风险合同条款与标准合同条款进行拆分,得到不同部分的内容信息,将所述风险合同条款中的内容信息定义为第一信息,将标准条款中的内容信息定义为标准信息,其中,同意部分的第一信息与标准信息相对应,然后获取所述风险合同条款中导致差异度大于预设值的第一信息作为差异信息,再基于该第一信息对应的部分确定所述标准条款中标准信息,然后将所述差异信息与所述标准信息关联输出展示,当需要对所述风险合同条款进行转化为标准条款时,将所述差异信息与所述标准信息关联输出展示进行预览,进一步的,在接收到用户的转化指令后,基于预配置的转化规则将所述风险合同条款转化为标准条款,在一种实施方式中,将所述标准信息替换所述差异信息,从而将所述风险合同条款转化为标准条款,提高风险合同条款的差异信息的浏览效率。
在一个实施例中,所述根据所述项目信息确定所述待审核合同文本的合同分类,包括:
获取所述项目信息的第一内容特征;
获取若干个所述项目信息的组合内容特征;
根据所述第一内容特征与所述组合内容特征确定所述待审核合同文本的合同分类。
本实施例中,根据所述项目信息确定所述待审核合同文本的合同分类的一个具体实施例为,通过机器学习确定不同分类合同的特征信息,所述特征信息包括合同中每一个项目信息的内容特征,以及合同中不同项目信息之间的内容的组合特征,然后获取所述项目信息的第一内容特征,以及获取若干个所述项目信息的组合内容特征,具体的,通过识别项目信息的主题,根据所述主题确定所述项目信息的特征作为第一内容特征,再将识别得到的至少两个项目信息的第一内容特征进行组合,得到组合内容特征,将所述第一内容特征与所述组合内容特征与基于机器学习得到的特征信息进行比对,当所述第一内容特征与所述组合内容特征符合某一合同分类的特征信息时,便可以确定待审核合同文本的合同分类,从而通过不同的项目信息的内容特征及内容特征组合快速地确定待审核合同文本的合同分类,提高分类识别的准确率与效率。
在一个实施例中,所述基于预配置的转化规则将所述风险合同条款转化为标准条款,包括:
识别所述风险合同条款的语义,提取所述风险合同条款的包含第一实体信息及所述第一实体信息对应的第一数值;
识别所述标准条款的语义,提取所述标准条款中与所述第一实体信息对应的第二实体信息;
将所述标准条款中的所述第二实体信息的数据值配置为所述第一数值,得到标准条款。
本实施例中,在基于预配置的转化规则将所述风险合同条款转化为标准条款的过程中,先识别所述风险合同条款的语义,根据所述语义提取所述风险合同条款的包含第一实体信息及所述第一实体信息对应的第一数值,即提取风险合同条款中具有数据值的部分,如违规金为50000,其中,“违规金”为第一实体信息,所述“50000”为第一实体信息“违规金”的第一数值,再识别所述标准条款的语义,提取所述标准条款中与所述第一实体信息对应的第二实体信息,通过识别所述标准条款的语义,确定标准条款中与所述第一实体信息相对应的部分,如与第一实体信息“违规金”对应的第二实体信息为“违约金”,然后将所述标准条款中的所述第二实体信息的数据值配置为所述第一数值,得到标准条款,完成标准条款的转化,从而提高合同审核及条款修改的效率。
在一个实施例中,所述根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,还包括:
获取所述待审核合同文本的应用领域;
获取所述应用领域的先验知识数据;
将所述自然语言算法配置所述先验知识数据,得到具有先验知识数据的自然语言算法;
根据所述具有先验知识数据的自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息。
本实施例中,在根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息的过程中,不同领域的合同具有不同的专属名词,为了准确地识别出待审核合同文本中包含的项目信息,获取所述待审核合同文本的应用领域,例如应用于医疗领域的合同,应用于房产领域的合同,然后获取所述应用领域的先验知识数据,所述先验知识数据通过采集该应用领域下的单词库及数据类型统计而得到,然后将所述自然语言算法配置所述先验知识数据,得到具有先验知识数据的自然语言算法,再根据所述具有先验知识数据的自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,通过配置有对应专属名词的先验知识数据的自然语言算法,能够快速、准确地识别出所述审核合同文本的内容,确定所述审核合同文本包含的项目信息,从而合同审核的准确率与效率。
参照图2,本申请还提供一种合同文本信息的处理装置,包括:
数据获取模块10,用于获取待审核合同文本;
合同分类模块20,用于根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息确定所述待审核合同文本的合同分类;
合同匹配模块30,用于从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本;
异常筛选模块40,用于提将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款;
合同转化模块50,用于基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。
如上所述,可以理解地,本申请中提出的所述合同文本信息的处理装置的各组成部分可以实现如上所述合同文本信息的处理方法任一项的功能。
在一个实施例中,所述从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款,包括:
获取待审核合同文本中的待审核条款及所述待审核条款的文本信息;
根据所述文本信息从所述合同标准范本确定标准条款;
将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款。
在一个实施例中,所述风险合同条款包括差异合同条款与错误合同条款;所述将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款,包括:
将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于第一预设值,将所述待审核条款确定为差异合同条款;
若所述待审核条款与所述标准条款的差异度大于第二预设值,将所述待审核条款确定为错误合同条款。
在一个实施例中,所述基于预配置的转化规则将所述风险合同条款转化为标准条款之前,还包括:
获取所述风险合同条款中的差异信息;
获取所述差异信息对应的标准条款的标准信息;
将所述差异信息与所述标准信息关联输出展示,并在接收到转化指令后基于预配置的转化规则将所述风险合同条款转化为标准条款。
在一个实施例中,所述根据所述项目信息确定所述待审核合同文本的合同分类,包括:
获取所述项目信息的第一内容特征;
获取若干个所述项目信息的组合内容特征;
根据所述第一内容特征与所述组合内容特征确定所述待审核合同文本的合同分类。
在一个实施例中,所述基于预配置的转化规则将所述风险合同条款转化为标准条款,包括:
识别所述风险合同条款的语义,提取所述风险合同条款的包含第一实体信息及所述第一实体信息对应的第一数值;
识别所述标准条款的语义,提取所述标准条款中与所述第一实体信息对应的第二实体信息;
将所述标准条款中的所述第二实体信息的数据值配置为所述第一数值,得到标准条款。
在一个实施例中,所述根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,还包括:
获取所述待审核合同文本的应用领域;
获取所述应用领域的先验知识数据;
将所述自然语言算法配置所述先验知识数据,得到具有先验知识数据的自然语言算法;
根据所述具有先验知识数据的自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是移动终端,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和显示装置及输入装置。其中,该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的输入装置用于接收用户的输入。该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质。该存储介质存储有操作系统、计算机程序和数据库。该计算机设备的数据库用于存放数据。该计算机程序被处理器执行时以实现一种合同文本信息的处理方法。
上述处理器执行上述的合同文本信息的处理方法,包括:获取待审核合同文本;根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息确定所述待审核合同文本的合同分类;从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本;将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款;基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。
所述计算机设备提供了一种针对合同文本信息进行风险识别及审核的方法,首先获取待审核合同文本,根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息获取确定所述待审核合同文本的合同分类,再从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本,将所述合同标准范本与所述待审核合同文本进行比较,具体的,将所述待审核合同文本的每一条待审核条款与对应的合同标准范本的标准条款进行比较,当所述待审核条款与所述标准条款的差异度大于预设值时,确定所述待审核条款为风险合同条款,从而从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款,基于预配置的转化规则将所述风险合同条款转化为标准条款,将所述标准条款的主体内容替换所述风险合同条款的主体内容,再将所述风险条款中的具体数值内容填入所述标准条款的主体内容中,完成将所述风险合同条款转化为标准条款,当所述待审核合同文本的风险合同条款转化为标准条款之后,根据所述待审核合同文本及所述标准条款生成转化合同,即根据非风险合同条款与标准条款生成转化合同,得到准确、符合预设法律要求的合同文本,提高合同文本的审核效率以及提高不同分类下的合同的风险识别准确率,从而提高合同文本的标准审核及修正的效率、及合同文本内容的准确性。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被所述处理器执行时实现一种合同文本信息的处理方法,包括步骤:获取待审核合同文本;根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息确定所述待审核合同文本的合同分类;从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本;将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款;基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。
所述计算机可读存储介质提供了一种针对合同文本信息进行风险识别及审核的方法,首先获取待审核合同文本,根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息获取确定所述待审核合同文本的合同分类,再从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本,将所述合同标准范本与所述待审核合同文本进行比较,具体的,将所述待审核合同文本的每一条待审核条款与对应的合同标准范本的标准条款进行比较,当所述待审核条款与所述标准条款的差异度大于预设值时,确定所述待审核条款为风险合同条款,从而从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款,基于预配置的转化规则将所述风险合同条款转化为标准条款,将所述标准条款的主体内容替换所述风险合同条款的主体内容,再将所述风险条款中的具体数值内容填入所述标准条款的主体内容中,完成将所述风险合同条款转化为标准条款,当所述待审核合同文本的风险合同条款转化为标准条款之后,根据所述待审核合同文本及所述标准条款生成转化合同,即根据非风险合同条款与标准条款生成转化合同,得到准确、符合预设法律要求的合同文本,提高合同文本的审核效率以及提高不同分类下的合同的风险识别准确率,从而提高合同文本的标准审核及修正的效率、及合同文本内容的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。
非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围。
凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种合同文本信息的处理方法,其特征在于,包括:
获取待审核合同文本;
根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息确定所述待审核合同文本的合同分类;
从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本;
将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款;
基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。
2.根据权利要求1所述的合同文本信息的处理方法,其特征在于,所述从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款,包括:
获取待审核合同文本中的待审核条款及所述待审核条款的文本信息;
根据所述文本信息从所述合同标准范本确定标准条款;
将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款。
3.根据权利要求2所述的合同文本信息的处理方法,其特征在于,所述风险合同条款包括差异合同条款与错误合同条款;所述将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于预设值,将所述待审核条款确定为风险合同条款,包括:
将所述待审核条款与所述标准条款进行比较,若所述待审核条款与所述标准条款的差异度大于第一预设值,将所述待审核条款确定为差异合同条款;
若所述待审核条款与所述标准条款的差异度大于第二预设值,将所述待审核条款确定为错误合同条款。
4.根据权利要求1所述的合同文本信息的处理方法,其特征在于,所述基于预配置的转化规则将所述风险合同条款转化为标准条款之前,还包括:
获取所述风险合同条款中的差异信息;
获取所述差异信息对应的标准条款的标准信息;
将所述差异信息与所述标准信息关联输出展示,并在接收到转化指令后基于预配置的转化规则将所述风险合同条款转化为标准条款。
5.根据权利要求1所述的合同文本信息的处理方法,其特征在于,所述根据所述项目信息确定所述待审核合同文本的合同分类,包括:
获取所述项目信息的第一内容特征;
获取若干个所述项目信息的组合内容特征;
根据所述第一内容特征与所述组合内容特征确定所述待审核合同文本的合同分类。
6.根据权利要求1所述的合同文本信息的处理方法,其特征在于,所述基于预配置的转化规则将所述风险合同条款转化为标准条款,包括:
识别所述风险合同条款的语义,提取所述风险合同条款的包含第一实体信息及所述第一实体信息对应的第一数值;
识别所述标准条款的语义,提取所述标准条款中与所述第一实体信息对应的第二实体信息;
将所述标准条款中的所述第二实体信息的数据值配置为所述第一数值,得到标准条款。
7.根据权利要1所述的合同文本信息的处理方法,其特征在于,所述根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,还包括:
获取所述待审核合同文本的应用领域;
获取所述应用领域的先验知识数据;
将所述自然语言算法配置所述先验知识数据,得到具有先验知识数据的自然语言算法;
根据所述具有先验知识数据的自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息。
8.一种合同文本信息的处理装置,其特征在于,包括:
数据获取模块,用于获取待审核合同文本;
合同分类模块,用于根据自然语言算法识别所述待审核合同文本,获取所述待审核合同文本包含的项目信息,根据所述项目信息确定所述待审核合同文本的合同分类;
合同匹配模块,用于从预配置的合同知识库中获取与所述合同分类相匹配的合同标准范本;
异常筛选模块,用于提将所述合同标准范本与所述待审核合同文本进行比较,从所述待审核合同文本中筛选出与所述合同标准范本的差异度大于预设值的风险合同条款;
合同转化模块,用于基于预配置的转化规则将所述风险合同条款转化为标准条款,根据所述待审核合同文本及所述标准条款生成转化合同。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述合同文本信息的处理方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述合同文本信息的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111275428.3A CN114003692A (zh) | 2021-10-29 | 2021-10-29 | 合同文本信息的处理方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111275428.3A CN114003692A (zh) | 2021-10-29 | 2021-10-29 | 合同文本信息的处理方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114003692A true CN114003692A (zh) | 2022-02-01 |
Family
ID=79925439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111275428.3A Pending CN114003692A (zh) | 2021-10-29 | 2021-10-29 | 合同文本信息的处理方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114003692A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116384387A (zh) * | 2023-01-04 | 2023-07-04 | 深圳擎盾信息科技有限公司 | 一种自动化合同审查的方法及装置 |
CN116976683A (zh) * | 2023-09-25 | 2023-10-31 | 江铃汽车股份有限公司 | 一种合同条款自动审核方法、系统、存储介质及设备 |
-
2021
- 2021-10-29 CN CN202111275428.3A patent/CN114003692A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116384387A (zh) * | 2023-01-04 | 2023-07-04 | 深圳擎盾信息科技有限公司 | 一种自动化合同审查的方法及装置 |
CN116976683A (zh) * | 2023-09-25 | 2023-10-31 | 江铃汽车股份有限公司 | 一种合同条款自动审核方法、系统、存储介质及设备 |
CN116976683B (zh) * | 2023-09-25 | 2024-02-27 | 江铃汽车股份有限公司 | 一种合同条款自动审核方法、系统、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685056B (zh) | 获取文档信息的方法及装置 | |
WO2021042503A1 (zh) | 信息分类抽取方法、装置、计算机设备和存储介质 | |
US20110270858A1 (en) | File type recognition analysis method and system | |
CN113282955B (zh) | 隐私政策中隐私信息提取方法、系统、终端及介质 | |
CN114003692A (zh) | 合同文本信息的处理方法、装置、计算机设备及存储介质 | |
CN111680634A (zh) | 公文文件处理方法、装置、计算机设备及存储介质 | |
CN110472209B (zh) | 基于深度学习的表格生成方法、装置和计算机设备 | |
CN115357699A (zh) | 文本抽取方法、装置、设备及存储介质 | |
CN112380848B (zh) | 文本生成方法、装置、设备及存储介质 | |
CN111241270A (zh) | 一种简历处理方法及装置 | |
CN112418813A (zh) | 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质 | |
CN113449083B (zh) | 作业安全管理方法、装置、设备及存储介质 | |
CN115482075A (zh) | 财务数据的异常分析方法、装置、电子设备及存储介质 | |
CN113722421B (zh) | 一种合同审计方法和系统,及计算机可读存储介质 | |
CN114154480A (zh) | 信息提取方法、装置、设备和存储介质 | |
CN113157949A (zh) | 事件信息的抽取方法、装置、计算机设备及存储介质 | |
CN112466324A (zh) | 一种情绪分析方法、系统、设备及可读存储介质 | |
CN111027319A (zh) | 自然语言时间词的解析方法、装置和计算机设备 | |
CN117034864B (zh) | 可视化标注方法、装置、计算机设备以及存储介质 | |
CN113342931B (zh) | 基于大数据的用户需求分析方法、装置、设备及存储介质 | |
CN114398492B (zh) | 一种在数字领域的知识图谱构建方法、终端及介质 | |
CN113868419B (zh) | 基于人工智能的文本分类方法、装置、设备及介质 | |
US20230236802A1 (en) | Intelligent industry compliance reviewer | |
CN117851561A (zh) | 一种基于产品文档的筛选式采编方法、系统及电子设备 | |
CN114049078A (zh) | 基于人工智能的项目申报审核方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |