CN115809653A - 一种智能合同审核方法及系统 - Google Patents
一种智能合同审核方法及系统 Download PDFInfo
- Publication number
- CN115809653A CN115809653A CN202211454201.XA CN202211454201A CN115809653A CN 115809653 A CN115809653 A CN 115809653A CN 202211454201 A CN202211454201 A CN 202211454201A CN 115809653 A CN115809653 A CN 115809653A
- Authority
- CN
- China
- Prior art keywords
- contract
- comparison
- extraction
- auditing
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及智能合同审核的技术领域,尤其是涉及一种智能合同审核方法及系统。其通过收集、定义知识抽取要素,预编排模型抽取策略,批量自动化抽取、对比审查,工作人员可以根据实际需要自主抽取内容进行标注,自定义文档的标注文本对比规则,可以进行文档内部对比、多份文档对比,同时系统自主进行模型训练,实现模型自主迭代,从而通过智能化手段来全面自动审核,防范疏漏和风险,统一审查标准,从而解决公司人工审查合同工作量大、错误难以避免的现状,提升合同审查精度,提高合同审查效率。
Description
技术领域
本发明涉及智能合同审核的技术领域,尤其是涉及一种智能合同审核方法及系统。
背景技术
根据国网公司相关管理相关要求,物资采购、信息化等项目合同均需上传经法系统,经过多级审核后,方可开展后续相关工作。目前,合同在上传经法系统前,均为人工填写、人工审核,人为操作难免会出现疏忽错漏,如合同含税金额计算错误、主体上下文名称不一致、合同模板故意修改等问题,从而造成审查返工、发票重开、合同多次修改等情况,导致项目建设迟滞。
发明内容
本发明的目的是提供一种智能合同审核系统,其通过智能化手段来全面自动审核,防范疏漏和风险,统一审查标准,从而解决公司人工审查合同工作量大、错误难以避免的现状,提升合同审查精度,提高合同审查效率。
本发明的上述发明目的是通过以下技术方案得以实现的:
一种智能合同审核方法,包括如下步骤:
S1:知识抽取模型的构建
针对模板固定内容,采用正则表达式的方法进行知识抽取,针对文档自定义部分和非固定版面部分采用命名实体识别和事件抽取模型进行知识抽取,针对标点符号及文本纠错采用全文模型检测;
S2:文本审核策略的构建
开发三个对比任务,抽取合同与中标通知书、合同与保密协议、技术规范书与招标文件中相对应的要素并进行对比;
S3:完成自动化对比程序监测
通过编排的知识模型抽取、内容对比策略,根据当年合同审查工作进度要求进行自动化对比程序的启动、监测工作,抽样校验抽取内容、对比结果的准确性;
S4:数据分析与模型训练
进行对比审核结果的分析并将结果展示,并将分析结果传送到数据库进行模型数据迭代。
优选地,所述方法采用的技术架构包括服务展现层、应用服务层、数据访问层和平台支撑层,所述服务展现层采用Vue前端架构和ECharts 报表实现,所述应用服务层包括服务交互和业务员应用服务,服务交互可通过RESTful、Webservice和API网关实现,所述数据访问层主要用到数据库访问驱动,平台支撑层主要采用FASTDFS分布式文件系统、Pytorch深度学习框架、Redis数据库和mysql数据库。
优选地,所述步骤S2中的合同抽取要素包括合同编号、项目名称、委托方、受托方、签订日期、签订地点、项目负责人、合同价格小写、合同价格大写、不含税价小写、不含税价大写、增值税税率、增值税税额、首付款、验收款及质保金的时间、支付金额比例、支付金额大写、支付金额小写和项目经理兼安全员。
优选地,所述步骤S2中的中标通知书抽取要素包括受托方、招标编号、含税总价、招标人、招标代理机构、采购项名称、项目单位、分项报价和投标人。
优选地,所述步骤S2中的技术规范书抽取要素包括项目单位、部署方式、实施范围和表格内容解读。
优选地,所述步骤S2中的招标文件抽取要素包括项目单位、部署方式和实施范围。
优选地,所述步骤S2中的保密协议抽取要素包括合同编号、委托方、受托方、签订日期、签订地点、委托方、受托方、项目名称、甲方地址、乙方地址。
本发明还公开了一种智能合同审核系统,包括合同模版管理模块、抽取模型管理模块、合同审核任务管理模块、数据分析模块和系统管理模块,合同模版管理模块包括待审核的合同类型、标签、合同模版、标注和对比规则配置的管理,所述抽取模型管理模块用于加载抽取规则、模型训练以及加载模型,所述合同审核任务管理模块用于创建对比任务、上传对比文件进行审核,选择预创建的对比任务模板,根据标注的信息,拿到模型返回的结果进行数据分析,根据建立的对比的类型进行数据的比较,将结果储存到数据库,所述数据分析模块用于查看审核结果,进行数据展示,所述系统管理模块用于管理系统账号、角色和权限。
优选地,所述合同类型的管理用于管理需审合同的类型及附件名,对文件各种类型进行维护,在上传文档时选择对应的类型进行上传;所述标签的管理用于维护合同内抽取项的标注名,配置或修改合同内进行标注时所用到标签,提供模型算法训练所用;所述合同模版的管理用于选择合同类型,子类型上传模版文件,以此模板为标准,可进行标注抽取作为此类合同的对比数据;所述标注的管理用于进行内容抽取项的标注,对内容进行分类的标注;所述对比规则配置的管理用于根据选择的文档,将已标注的信息展示列表,选择想要对比的信息和对比的规则,进行多个文件之间对比规则的配置。
综上所述,本发明的有益技术效果为:
通过收集、定义知识抽取要素,预编排模型抽取策略,批量自动化抽取、对比审查,工作人员可以根据实际需要自主抽取内容进行标注,自定义文档的标注文本对比规则,可以进行文档内部对比、多份文档对比,同时系统自主进行模型训练,实现模型自主迭代,从而通过智能化手段来全面自动审核,防范疏漏和风险,统一审查标准,从而解决公司人工审查合同工作量大、错误难以避免的现状,提升合同审查精度,提高合同审查效率。
附图说明
图1是本发明的整体结构流程图;
图2是抽取模型管理模块流程图;
图3是合同审核任务管理模块流程图;
图4是合同类型管理流程图;
图5是标签管理流程图;
图6是合同模板管理流程图;
图7是标注管理流程图;
图8是对比规则配置管理流程图。
具体实施方式
参考图1-图8,本发明公开的一种智能合同审核方法,包括如下步骤:
S1:知识抽取模型的构建
针对模板固定内容,采用正则表达式的方法进行知识抽取;针对文档自定义部分和非固定版面部分采用命名实体识别和事件抽取模型进行知识抽取,命名实体识别是指利用BERT+CRF技术,在文本中识别出特殊对象,这些对象的语义类别通常在识别前被预定义好,预定义类别如人、地址、组织;事件抽取和实体识别都属于信息抽取,采用BERT+BiLSTM+CRF技术,只是抽取的粒度不同,简单来说事件抽取就是把一段文字中的关键信息提取出来,然后填入我们预先设置好的表格中;针对标点符号及文本纠错采用全文模型检测,文本纠错是判断一段文本描述中是否出现错别字、标点符号导致语言描述不通顺,对这种情况进行修正,使用的模型是SoftMaskedBert,由于还未积累合同相关样本数据,目前采用公网数据的预训练模型精度较差,后续需要通过样本积累进行模型迭代提高纠错精度。
S2:文本审核策略的构建
开发三个对比任务,抽取合同与中标通知书、合同与保密协议、技术规范书与招标文件中相对应的要素并进行对比,合同抽取要素包括合同编号、项目名称、委托方、受托方、签订日期、签订地点、项目负责人、合同价格小写、合同价格大写、不含税价小写、不含税价大写、增值税税率、增值税税额、首付款、验收款及质保金的时间、支付金额比例、支付金额大写、支付金额小写和项目经理兼安全员。中标通知书抽取要素包括受托方、招标编号、含税总价、招标人、招标代理机构、采购项名称、项目单位、分项报价和投标人。技术规范书抽取要素包括项目单位、部署方式、实施范围和表格内容解读。招标文件抽取要素包括项目单位、部署方式和实施范围。保密协议抽取要素包括合同编号、委托方、受托方、签订日期、签订地点、委托方、受托方、项目名称、甲方地址、乙方地址。
S3:完成自动化对比程序监测
通过编排的知识模型抽取、内容对比策略,根据当年合同审查工作进度要求进行自动化对比程序的启动、监测工作,抽样校验抽取内容、对比结果的准确性。
S4:数据分析与模型训练
进行对比审核结果的分析并将结果展示,并将分析结果传送到数据库进行模型数据迭代。数据通过知识抽取模型进行解析抽取,存入数据缓存Redis中,并通过文本审核和自动化对比程序对抽取的结果进行对比识别,识别数据一份存入数据缓存Redis,一份提供模型迭代,对比结果数据存入mysql中。
该方法采用的技术架构包括服务展现层、应用服务层、数据访问层和平台支撑层,服务展现层采用Vue前端架构和ECharts 报表实现。服务器开发技术采用JDK-1.8、Springboot、Spring、SpringMVC。数据访问技术采用MyBatis、JDBC Template、Druid 。应用服务层包括服务交互和业务员应用服务,服务交互可通过RESTful、Webservice和API网关实现,数据访问层主要用到数据库访问驱动JDBC,平台支撑层主要采用FASTDFS分布式文件系统、Pytorch深度学习框架、Redis数据库和mysql数据库。
本发明还公开了一种智能合同审核系统,包括合同模版管理模块、抽取模型管理模块、合同审核任务管理模块、数据分析模块和系统管理模块。合同模版管理模块包括待审核的合同类型、标签、合同模版、标注和对比规则配置的管理。
合同类型的管理用于管理需审合同的类型及附件名,对文件各种类型进行维护,在上传文档时选择对应的类型进行上传。合同类型下设有新增合同类型和合同类型列表,新增合同类型包括合同类型命名和新增合同子文件名,合同类型列表包括类型列表和删除合同类型。实施员进行操作,进行合同类型的信息维护,上传合同模板到服务器,实施员对数据进行标标注抽取形成抽取的标签,使用文档选择标签配置对比的任务模板。用户可在进行对比时选择对比任务的模板,上传对应的需审合同进行内容的对比,等待任务执行完成后可查看对比的结果。
标签的管理用于维护合同内抽取项的标注名,配置或修改合同内进行标注时所用到标签,提供模型算法训练所用。标签管理包括创建标签组、创建标签和删除标签。实施员操作,进行标签数据维护,添加标注文档所需标签,删除标注时无用标签,避免数据冗余。
合同模版的管理用于选择合同类型,子类型上传模版文件,以此模板为标准,可进行标注抽取作为此类合同的对比数据。合同模版包括选择合同类型、上传文件和删除文件。实施员操作,选择合同类型、上传或删除附件,储存数据库和文件服务器,查看已上传的各类模板文件。
标注的管理用于进行内容抽取项的标注,对内容进行分类的标注,例:原文、标题、触发词、实体类别等标签对上传的模板进行标注。标注管理包括选择文件、新建抽取、标注和保存,标注又包括选择原文、选择触发词和选择标签。实施员操作,进行合同正文内容标注,按照不同的标签将合同段落进行标注,形成此合同的标注信息,点击保存储存到数据库,便于创建对比任务模板,模型训练,上传对比。
对比规则配置的管理用于根据选择的文档,将已标注的信息展示列表,选择想要对比的信息和对比的规则,进行多个文件之间对比规则的配置。对比规则配置管理包括选择文件、创建对比任务、选择对比目标、选择对比类型以及选择对比标签。实施员操作,选择文件创建对比任务、配置对比类型,形成一个完整的对比任务,可对此对比任务模板下的每条任务进行删除,增加多条对比任务。
抽取模型管理模块用于加载抽取规则、模型训练以及加载模型。抽取模型管理包括加载抽取规则、训练模型和加载模型。合同审核任务管理模块用于创建对比任务、上传对比文件进行审核,选择预创建的对比任务模板,根据标注的信息,拿到模型返回的结果进行数据分析,根据建立的对比的类型进行数据的比较,将结果储存到数据库。合同审核任务管理模块下设创建审核任务、选择对比类型和上传对比文件。合同审核员创建对比任务,页面刷新,根据此条对比任务的状态判断是否对比结束,当此对比任务结束后,在列表中查看对比的结果。数据分析模块用于查看审核结果,进行数据展示。数据分析模块包括查看数据和数据显示。合同审核员操作,选择对应的文档上传到系统中,上传后等待系统对上传的两份合同进行对比,等待对比结束后,在列表中可查看对比的结果,根据对比结果作为参考。系统管理模块用于管理系统账号、角色和权限。系统管理模块下设角色管理和用户管理,角色管理包括新增角色和删除角色,用户管理包括创建用户、选择用户和删除用户。
显然,上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而这些属于本发明的精神所引伸出的显而易见的变化或变动仍处于本发明的保护范围之中。
Claims (9)
1.一种智能合同审核方法,其特征在于:包括如下步骤:
S1:知识抽取模型的构建
针对模板固定内容,采用正则表达式的方法进行知识抽取,针对文档自定义部分和非固定版面部分采用命名实体识别和事件抽取模型进行知识抽取,针对标点符号及文本纠错采用全文模型检测;
S2:文本审核策略的构建
开发三个对比任务,抽取合同与中标通知书、合同与保密协议、技术规范书与招标文件中相对应的要素并进行对比;
S3:完成自动化对比程序监测
通过编排的知识模型抽取、内容对比策略,根据当年合同审查工作进度要求进行自动化对比程序的启动、监测工作,抽样校验抽取内容、对比结果的准确性;
S4:数据分析与模型训练
进行对比审核结果的分析并将结果展示,并将分析结果传送到数据库进行模型数据迭代。
2.根据权利要求1所述的一种智能合同审核方法,其特征在于:所述方法采用的技术架构包括服务展现层、应用服务层、数据访问层和平台支撑层,所述服务展现层采用Vue前端架构和ECharts 报表实现,所述应用服务层包括服务交互和业务员应用服务,服务交互可通过RESTful、Webservice和API网关实现,所述数据访问层主要用到数据库访问驱动,平台支撑层主要采用FASTDFS分布式文件系统、Pytorch深度学习框架、Redis数据库和mysql数据库。
3.根据权利要求1所述的一种智能合同审核方法,其特征在于:所述步骤S2中的合同抽取要素包括合同编号、项目名称、委托方、受托方、签订日期、签订地点、项目负责人、合同价格小写、合同价格大写、不含税价小写、不含税价大写、增值税税率、增值税税额、首付款、验收款及质保金的时间、支付金额比例、支付金额大写、支付金额小写和项目经理兼安全员。
4.根据权利要求1所述的一种智能合同审核方法,其特征在于:所述步骤S2中的中标通知书抽取要素包括受托方、招标编号、含税总价、招标人、招标代理机构、采购项名称、项目单位、分项报价和投标人。
5.根据权利要求1所述的一种智能合同审核方法,其特征在于:所述步骤S2中的技术规范书抽取要素包括项目单位、部署方式、实施范围和表格内容解读。
6.根据权利要求1所述的一种智能合同审核方法,其特征在于:所述步骤S2中的招标文件抽取要素包括项目单位、部署方式和实施范围。
7.根据权利要求1所述的一种智能合同审核方法,其特征在于:所述步骤S2中的保密协议抽取要素包括合同编号、委托方、受托方、签订日期、签订地点、委托方、受托方、项目名称、甲方地址、乙方地址。
8.一种智能合同审核系统,其特征在于:包括合同模版管理模块、抽取模型管理模块、合同审核任务管理模块、数据分析模块和系统管理模块,所述合同模版管理模块包括待审核的合同类型、标签、合同模版、标注和对比规则配置的管理,所述抽取模型管理模块用于加载抽取规则、模型训练以及加载模型,所述合同审核任务管理模块用于创建对比任务、上传对比文件进行审核,选择预创建的对比任务模板,根据标注的信息,拿到模型返回的结果进行数据分析,根据建立的对比的类型进行数据的比较,将结果储存到数据库,所述数据分析模块用于查看审核结果,进行数据展示,所述系统管理模块用于管理系统账号、角色和权限。
9.根据权利要求8所述的一种智能合同审核系统,其特征在于:所述合同类型的管理用于管理需审合同的类型及附件名,对文件各种类型进行维护,在上传文档时选择对应的类型进行上传;所述标签的管理用于维护合同内抽取项的标注名,配置或修改合同内进行标注时所用到标签,提供模型算法训练所用;所述合同模版的管理用于选择合同类型,子类型上传模版文件,以此模板为标准,可进行标注抽取作为此类合同的对比数据;所述标注的管理用于进行内容抽取项的标注,对内容进行分类的标注;所述对比规则配置的管理用于根据选择的文档,将已标注的信息展示列表,选择想要对比的信息和对比的规则,进行多个文件之间对比规则的配置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211454201.XA CN115809653A (zh) | 2022-11-21 | 2022-11-21 | 一种智能合同审核方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211454201.XA CN115809653A (zh) | 2022-11-21 | 2022-11-21 | 一种智能合同审核方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115809653A true CN115809653A (zh) | 2023-03-17 |
Family
ID=85483650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211454201.XA Pending CN115809653A (zh) | 2022-11-21 | 2022-11-21 | 一种智能合同审核方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115809653A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116451660A (zh) * | 2023-04-11 | 2023-07-18 | 浙江法之道信息技术有限公司 | 一种法律文本专业性审查与智能批注系统 |
CN116703337A (zh) * | 2023-08-08 | 2023-09-05 | 金现代信息产业股份有限公司 | 一种基于人工智能技术的项目文档审查系统及方法 |
US11928438B1 (en) | 2023-07-07 | 2024-03-12 | Northern Trust Corporation | Computing technologies for large language models |
-
2022
- 2022-11-21 CN CN202211454201.XA patent/CN115809653A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116451660A (zh) * | 2023-04-11 | 2023-07-18 | 浙江法之道信息技术有限公司 | 一种法律文本专业性审查与智能批注系统 |
CN116451660B (zh) * | 2023-04-11 | 2023-09-19 | 浙江法之道信息技术有限公司 | 一种法律文本专业性审查与智能批注系统 |
US11928438B1 (en) | 2023-07-07 | 2024-03-12 | Northern Trust Corporation | Computing technologies for large language models |
CN116703337A (zh) * | 2023-08-08 | 2023-09-05 | 金现代信息产业股份有限公司 | 一种基于人工智能技术的项目文档审查系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10546351B2 (en) | System and method for automatic generation of reports based on electronic documents | |
US20210295438A1 (en) | Processing securities-related information | |
CN115809653A (zh) | 一种智能合同审核方法及系统 | |
US11593592B2 (en) | Intelligent payment processing platform system and method | |
Spilnyk et al. | Accounting and financial reporting system in the digital economy | |
US20050182736A1 (en) | Method and apparatus for determining contract attributes based on language patterns | |
CN110929969A (zh) | 一种供应商的评价方法及装置 | |
US20120303494A1 (en) | Methods and apparatus for on-line analysis of financial accounting data | |
US7596500B1 (en) | System and method for processing import/export transactions | |
US20240062235A1 (en) | Systems and methods for automated processing and analysis of deduction backup data | |
US11636418B2 (en) | Currency reduction for predictive human resources synchronization rectification | |
Matthies | A text mining approach for extracting lessons learned from project documentation: An illustrative case study | |
CN116629770A (zh) | 一种基于图形化识别技术的供应商资料审核方法及系统 | |
CN116340338A (zh) | 一种合同数据库自动匹配方法及系统 | |
US20190155887A1 (en) | Methods and devices for enabling computers to automatically enter information into a unified database from heterogeneous documents | |
US8838543B2 (en) | Archiving system that facilitates systematic cataloguing of archived documents for searching and management | |
JP2003296554A (ja) | 取引先要項システム | |
kumar Choudhary et al. | Designing the Process of Stores Management for Implementing ERP in Manufacturing Organization: Case Study | |
Asif et al. | Business intelligence solution for food industry | |
Yu et al. | Improving aircraft maintenance, repair, and overhaul: A novel text mining approach | |
Nöbauer et al. | Feature-based reuse in the ERP domain: An industrial case study | |
US20230052950A1 (en) | Pre-coded automatic docketing | |
Karnik et al. | Machine Intelligence for integrated workover operations | |
Hadiwinata et al. | Business Intelligence Dashboard Visualization on Information Systems for Online Verification of Invoice Documents and Requests for Goods or Services | |
MINEA et al. | AUTOMATED (SEMANTICS DRIVEN) DATA RETRIEVAL FROM FISCAL DOCUMENTS: A COMPREHENSIVE APPROACH |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |