CN106844337A - 一种合同缺失条款自动扫描方法及系统 - Google Patents
一种合同缺失条款自动扫描方法及系统 Download PDFInfo
- Publication number
- CN106844337A CN106844337A CN201611265389.8A CN201611265389A CN106844337A CN 106844337 A CN106844337 A CN 106844337A CN 201611265389 A CN201611265389 A CN 201611265389A CN 106844337 A CN106844337 A CN 106844337A
- Authority
- CN
- China
- Prior art keywords
- contract
- keyword
- clause
- discrimination
- logical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种合同缺失条款自动扫描方法及系统,方法包括通过大量合同样本,采用语义识别技术和关键词提取技术,提取每类合同共同具有的必备条款;提取样本合同必备条款的核心关键词语,对合同进行识别。本方法采用关键词和关键词组合逻辑计算的方法,通过采用人工智能语义识别技术,对合同每个条款的语义进行识别,识别率非常高,达到了实际应用的要求;提高了对于合同条款描述语义的识别率,使合同法律风险智能识别达到实际应用的阶段。
Description
技术领域
本发明属于信息化服务技术领域,尤其是涉及一种合同缺失条款自动扫描方法及系统。
背景技术
在市场经济中,公司日常经营中合同扮演了越来越重要的角色,如何在日常经营中防范合同风险显得尤为重要。合同风险包括了合同的管理风险和合同的法律风险,合同的管理风险是从合同的管理职能出发,而法律风险则是从合同文本的完备性和有效性出发,深入研究各种条款的设计技巧。随着人工智能技术的飞速发展,在国外,采用计算机技术的人工智能合同法律风险自动识别的研究已经取得了初步成果;在国内,由于汉语的语义自动识别与英文有着巨大的差异,采用人工智能技术的合同法律风险识别研究还处于起步阶段。
由于某一类别的合同具有共同特定的关键条款,通过采用计算机人工智能技术实现合同对于某类合同必备关键条款的自动扫描和识别。
现有技术的缺点:
1、目前国内对于合同法律风险自动识别的研究中,由于汉语表述方式非常丰富,对于合同中固定条款的识别比较困难,识别率比较低。
2、由于汉语的语言结构与英文不同,目前也无法直接借鉴国外的成功经验。
发明内容
有鉴于此,本发明旨在提出一种合同缺失条款自动扫描方法,针对合同中法律条款描述的特殊性,具有针对性的识别出具有典型特征的法律条款描述方式,达到识别合同中某类合同所必需具备的条款,并给出具有针对性的风险提示。
为达到上述目的,本发明的技术方案是这样实现的:
一种合同缺失条款自动扫描方法,包括如下步骤:
(1)通过大量合同样本,采用语义识别技术和关键词提取技术,提取每类合同共同具有的必备条款及必备条款的核心关键词;
(2)通过大量合同样本进行深度学习,进行关键词的逻辑运算和组合,找出识别率最高的关键词组合方式。
进一步的,所述步骤(2)具体包括如下步骤:
(201)将关键词的所有可能出现的组合进行逻辑与运算,并在样本合同中进行比较;
(202)如果提升了整体合同的识别率,则保留该关键词设置;如果降低了整体合同的识别率,则取消该关键词设置;
(203)对关键词进行逻辑与非组合,并在样本合同中进行比较,保留可以提升识别率的逻辑组合;
(204)根据保留的关键词及其逻辑运算方式识别合同条款。
相对于现有技术,本发明所述的一种合同缺失条款自动扫描方法具有以下优势:本方法采用关键词和关键词组合逻辑计算的方法,通过采用人工智能语义识别技术,对合同每个条款的语义进行识别,识别率非常高,达到了实际应用的要求;提高了对于合同条款描述语义的识别率,使合同法律风险智能识别达到实际应用的阶段。
本发明的另一目的在于提出一种合同缺失条款自动扫描系统,针对合同中法律条款描述的特殊性,具有针对性的识别出具有典型特征的法律条款描述方式,达到识别合同中某类合同所必需具备的条款,并给出具有针对性的风险提示。
为达到上述目的,本发明的技术方案是这样实现的:
一种合同缺失条款自动扫描系统,包括
用于通过大量合同样本,采用语义识别技术和关键词提取技术,提取每类合同共同具有的必备条款及必备条款的核心关键词的提取模块;
用于通过大量合同样本进行深度学习,进行关键词的逻辑运算和组合,找出识别率最高的关键词组合方式的识别模块。
进一步的,所述识别模块包括
用于将关键词的所有可能出现的组合进行逻辑与运算,并在样本合同中进行比较的比较模块;
用于如果提升了整体合同的识别率,则保留该关键词设置;如果降低了整体合同的识别率,则取消该关键词设置的关键词设置模块;
用于对关键词进行逻辑与非组合,并在样本合同中进行比较,保留可以提升识别率的逻辑组合保留模块;
用于根据保留的关键词及其逻辑运算方式识别合同条款的合同识别模块。
本发明所述的一种合同缺失条款自动扫描系统与上述一种合同缺失条款自动扫描方法的有益效果相同,在此不再赘述。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例所述的一种合同缺失条款自动扫描方法的流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
如图1所示,一种合同缺失条款自动扫描方法具体步骤如下:
(1)通过大量合同样本,采用语义识别技术和关键词提取技术,提取每类合同共同具有的必备条款及必备条款的核心关键词;
例如:经过对1000份样本合同关键词的提取,对于“加工定作合同”类合同中具有的必备条款包括“原材料供应”、“运输方式”等。
将所有同类合同的同类条款进行关键词提取。
例如:“加工定作合同”类合同中,对于“原材料供应”条款中,包括了“零件供应方”、“原料”、“供应”、“提供xxx原材料”等核心关键词。
(2)通过大量合同样本进行深度学习,进行关键词的逻辑运算和组合,找出识别率最高的关键词组合方式。
对于某类合同的条款中具有的核心关键词,在其他条款中也会出现,但其表达的含义有不同。例如“验材料供应”条款中,会出现“甲方提供xxxx原材料”的描述,其中对原材料的描述并不确定。因此,可以采用“提供”和“原材料”与逻辑运算,这样可以准确判定属于“原材料供应”条款。
将关键词的所有可能出现的逻辑运算组合,在1000份样本合同中进行比较,对于整体合同的识别率是提升了还是下降了。如果是提升了,就会保留该关键词设置,反之,即取消该关键词设置。
对关键词进行逻辑与非组合,再次对1000份样本合同进行测试,对不同逻辑运算的结果进行比较,保留可以提升识别率的逻辑组合。
经过多次大样本的自动测试,保留其中可以提升识别率的关键词及其逻辑运算方式,即可找出识别合同条款的对于关键词。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种合同缺失条款自动扫描方法,其特征在于:包括如下步骤:
(1)通过大量合同样本,采用语义识别技术和关键词提取技术,提取每类合同共同具有的必备条款及必备条款的核心关键词;
(2)通过大量合同样本进行深度学习,进行关键词的逻辑运算和组合,找出识别率最高的关键词组合方式。
2.根据权利要求1所述的一种合同缺失条款自动扫描方法,其特征在于:所述步骤(2)具体包括如下步骤:
(201)将关键词的所有可能出现的组合进行逻辑与运算,并在样本合同中进行比较;
(202)如果提升了整体合同的识别率,则保留该关键词设置;如果降低了整体合同的识别率,则取消该关键词设置;
(203)对关键词进行逻辑与非组合,并在样本合同中进行比较,保留可以提升识别率的逻辑组合;
(204)根据保留的关键词及其逻辑运算方式识别合同条款。
3.一种合同缺失条款自动扫描系统,其特征在于:包括
用于通过大量合同样本,采用语义识别技术和关键词提取技术,提取每类合同共同具有的必备条款及必备条款的核心关键词的提取模块;
用于通过大量合同样本进行深度学习,进行关键词的逻辑运算和组合,找出识别率最高的关键词组合方式的识别模块。
4.根据权利要求3所述的一种合同缺失条款自动扫描系统,其特征在于:所述识别模块包括
用于将关键词的所有可能出现的组合进行逻辑与运算,并在样本合同中进行比较的比较模块;
用于如果提升了整体合同的识别率,则保留该关键词设置;如果降低了整体合同的识别率,则取消该关键词设置的关键词设置模块;
用于对关键词进行逻辑与非组合,并在样本合同中进行比较,保留可以提升识别率的逻辑组合保留模块;
用于根据保留的关键词及其逻辑运算方式识别合同条款的合同识别模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611265389.8A CN106844337A (zh) | 2016-12-30 | 2016-12-30 | 一种合同缺失条款自动扫描方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611265389.8A CN106844337A (zh) | 2016-12-30 | 2016-12-30 | 一种合同缺失条款自动扫描方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106844337A true CN106844337A (zh) | 2017-06-13 |
Family
ID=59117446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611265389.8A Pending CN106844337A (zh) | 2016-12-30 | 2016-12-30 | 一种合同缺失条款自动扫描方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106844337A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800784A (zh) * | 2018-12-11 | 2019-05-24 | 平安科技(深圳)有限公司 | 基于神经网络的合同核对方法及装置 |
CN110069594A (zh) * | 2019-03-07 | 2019-07-30 | 平安科技(深圳)有限公司 | 合同确认方法、装置、电子设备及存储介质 |
TWI708203B (zh) * | 2019-02-22 | 2020-10-21 | 華南商業銀行股份有限公司 | 契約風險評估系統及契約風險評估方法 |
CN112287668A (zh) * | 2020-10-29 | 2021-01-29 | 杭州尚尚签网络科技有限公司 | 基于机器学习的两阶段合同必备条款缺失风险预警方法 |
TWI759861B (zh) * | 2019-02-22 | 2022-04-01 | 華南商業銀行股份有限公司 | 契約風險評估系統及契約風險評估方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886063A (zh) * | 2014-03-18 | 2014-06-25 | 国家电网公司 | 一种文本检索方法和装置 |
CN105426360A (zh) * | 2015-11-12 | 2016-03-23 | 中国建设银行股份有限公司 | 一种关键词抽取方法及装置 |
-
2016
- 2016-12-30 CN CN201611265389.8A patent/CN106844337A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886063A (zh) * | 2014-03-18 | 2014-06-25 | 国家电网公司 | 一种文本检索方法和装置 |
CN105426360A (zh) * | 2015-11-12 | 2016-03-23 | 中国建设银行股份有限公司 | 一种关键词抽取方法及装置 |
Non-Patent Citations (1)
Title |
---|
张知临: "工商网上违法广告智能识别关键技术研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800784A (zh) * | 2018-12-11 | 2019-05-24 | 平安科技(深圳)有限公司 | 基于神经网络的合同核对方法及装置 |
CN109800784B (zh) * | 2018-12-11 | 2024-03-19 | 平安科技(深圳)有限公司 | 基于神经网络的合同核对方法及装置 |
TWI708203B (zh) * | 2019-02-22 | 2020-10-21 | 華南商業銀行股份有限公司 | 契約風險評估系統及契約風險評估方法 |
TWI759861B (zh) * | 2019-02-22 | 2022-04-01 | 華南商業銀行股份有限公司 | 契約風險評估系統及契約風險評估方法 |
CN110069594A (zh) * | 2019-03-07 | 2019-07-30 | 平安科技(深圳)有限公司 | 合同确认方法、装置、电子设备及存储介质 |
CN110069594B (zh) * | 2019-03-07 | 2023-10-10 | 平安科技(深圳)有限公司 | 合同确认方法、装置、电子设备及存储介质 |
CN112287668A (zh) * | 2020-10-29 | 2021-01-29 | 杭州尚尚签网络科技有限公司 | 基于机器学习的两阶段合同必备条款缺失风险预警方法 |
CN112287668B (zh) * | 2020-10-29 | 2024-01-23 | 杭州尚尚签网络科技有限公司 | 基于机器学习的两阶段合同必备条款缺失风险预警方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106844337A (zh) | 一种合同缺失条款自动扫描方法及系统 | |
BR112019003144A2 (pt) | sistema e método de classificação de partículas biológicas | |
CN105045847B (zh) | 一种从文本信息中提取中文机构单位名称的方法 | |
CN109492549A (zh) | 一种训练样本集处理、模型训练方法及系统 | |
CN106156083A (zh) | 一种领域知识处理方法及装置 | |
CN103366231A (zh) | 一种合同风险信息自动处理方法及装置 | |
CN110555206A (zh) | 一种命名实体识别方法、装置、设备及存储介质 | |
CN111177322A (zh) | 一种领域知识图谱的本体模型构建方法 | |
CN105869640A (zh) | 识别针对当前页面中的实体的语音控制指令的方法和装置 | |
CN105912629A (zh) | 一种智能问答方法及装置 | |
CN104268134A (zh) | 一种主客观分类器构建方法和系统 | |
CN109446345A (zh) | 核电文件校验处理方法以及系统 | |
CN109508458A (zh) | 法律实体的识别方法及装置 | |
CN107465643A (zh) | 一种深度学习的网络流量分类方法 | |
CN110298030A (zh) | 语义分析模型准确度的校验方法、装置、存储介质及设备 | |
CN113793214B (zh) | 一种解决小微企业信贷授信风险控制和管理方法及装置 | |
CN103853746A (zh) | 词库生成方法及其系统、输入法及输入系统 | |
CN106446124A (zh) | 一种基于网络关系图的网站分类方法 | |
CN106844554A (zh) | 一种合同分类自动识别方法及系统 | |
CN105868269A (zh) | 基于区域卷积神经网络的精确图像检索方法 | |
CN101655911A (zh) | 基于免疫抗体网络的模式识别方法 | |
CN105573968A (zh) | 基于规则的文本标引方法 | |
CN110942063A (zh) | 证件文字信息获取方法、装置以及电子设备 | |
CN105183806A (zh) | 一种不同平台间识别同一用户的方法与系统 | |
Shivram et al. | Data sufficiency for online writer identification: A comparative study of writer-style space vs. Feature space models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170613 |