CN110096681A - 合同条款分析方法、装置、设备及可读存储介质 - Google Patents
合同条款分析方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN110096681A CN110096681A CN201910205784.4A CN201910205784A CN110096681A CN 110096681 A CN110096681 A CN 110096681A CN 201910205784 A CN201910205784 A CN 201910205784A CN 110096681 A CN110096681 A CN 110096681A
- Authority
- CN
- China
- Prior art keywords
- contract terms
- contract
- analyzed
- terms
- default
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 61
- 239000013598 vector Substances 0.000 claims abstract description 182
- 239000011159 matrix material Substances 0.000 claims description 29
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims 1
- 230000004048 modification Effects 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 16
- 238000011156 evaluation Methods 0.000 abstract description 5
- 238000012545 processing Methods 0.000 abstract description 5
- 230000000875 corresponding effect Effects 0.000 description 89
- 238000010586 diagram Methods 0.000 description 10
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种合同条款分析方法,包括基于词向量模型对待分析合同条款进行训练;基于匹配句子向量以及词向量确定所述待分析合同条款对应的句子向量;计算待分析合同条款与各个预设合同条款之间的相似度;确定待分析合同条款中是否存在满足预设条件的目标合同条款;若存在,则基确定目标合同条款的标签信息。本发明还公开了一种合同条款分析装置、设备及可读存储介质。本发明通过数据处理技术对合同文本进行处理,能够根据合同条款数据库准确得到待分析合同的目标合同条款,进而确定目标合同条款的标签信息,以实现对待评价合同进行整体评价,以挖掘待评价合同中的不合理条款,从而减少待评价合同所导致的潜在威胁和损失。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种合同条款分析方法、装置、设备及可读存储介质。
背景技术
随着经济社会的飞速发展,每个人在工作和生活中都不可避免的会接触合同文本,例如聘用入职、房屋出租、房屋求租、二手房买卖、外出旅游等等。合同的交易对方既包括个人,也包括企业法人等。合同文本的形式既包括即时手写合同,也包括交易对方预先准备好的合同范本。尤其是在面对房屋买卖中介机构、旅游服务公司、房屋租赁中介机构等各种机构时,由于这些机构有意或无意的会在合同范本中隐藏一些对用户不甚公平的合同条款。面对这些不甚合理的合同文本,大多数用户难以全部发现这些文本中的不合理条款,从而为用户带来许多潜在的威胁和损失。
目前,现有的合同分析方案或文献中,大多关注于合同条款生成,利用合同模板技术帮助用户生成空白合同。而针对合同的识别分析,往往针对单一的合同条款,而对合同文本整体的可用性没有进行分析,进而无法得到合同文本的整体评价,导致合同文本存在潜在的风险。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种合同条款分析方法、装置、设备及可读存储介质,旨在解决现有的合同识别难以对合同文本进行整体评价的技术问题。
为实现上述目的,本发明提供一种合同条款分析方法,所述合同条款分析方法包括以下步骤:
获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量;
基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量;
基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度;
基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款;
若存在,则在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息,并将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端。
进一步地,所述获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练的步骤包括:
对所述待分析合同进行文本切割,以获得所述待分析合同的合同条款;
对所述合同条款进行清洗操作,去除所述合同条款中的重复条款,以获得所述待分析合同条款;
基于预设停用词,对所述待分析合同条款进行停用词过滤操作,以获得合同条款信息;
基于词向量模型对所述合同条款信息进行训练,以获得所述待分析合同条款对应的词向量。
进一步地,所述基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度的步骤包括:
基于所述条款信息,通过Tf-idf算法,计算所述待分析合同条款与所述预设合同条款之间的Tf-idf值;
将各个Tf-idf值中预设数量的最大的Tf-idf值,所对应的预设合同条款的预设句子向量中作为目标句子向量;
基于所述句子向量以及所述目标句子向量,计算所述待分析合同条款,与所述目标句子向量对应的目标合同条款之间的相似度。
进一步地,基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量的步骤包括:
计算匹配句子向量中的词向量与所述词向量之间的相似度,基于所述相似度生成相似词矩阵,其中,所述相似词矩阵中的每一行的元素为同一词向量与匹配句子向量中的词向量之间的相似度,所述相似词矩阵中每一列的元素为同一待分析合同条款的词向量与匹配句子向量中的词向量之间的相似度;
基于所述相似词矩阵的每一列元素中的最大相似度,生成所述句子向量。
进一步地,所述基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款的步骤包括:
确定所述待分析合同条款中是否存在相似度大于预设相似度的合同条款;
若存在,则确定所述待分析合同条款中存在满足预设条件的目标合同条款,其中,相似度大于预设相似度的合同条款为所述目标合同条款。
进一步地,所述在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息的步骤包括:
确定所述目标合同条款中,是否存在相似合同条款,其中,所述相似合同条款对应的相似度中,大于预设相似度的个数为多个;
若存在,则基于大于预设相似度的相似度、以及大于预设相似度的相似度对应的预设合同条款的风险评分确定所述相似合同条款的标签信息。
进一步地,所述将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端的步骤包括:
采用最长公共子序列算法或者最长公共子串算法,基于所述目标合同条款对应的预设合同条款,对所述目标合同条款进行标注操作;
将所述标签信息以及标注后的所述目标合同条款发送至所述终端。
此外,为实现上述目的,本发明还提供一种合同条款分析装置,所述合同条款分析装置包括:
获取模块,用于获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量;
第一确定模块,用于基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量;
计算模块,用于基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度;
第二确定模块,用于基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款;
发送模块,用于若存在,则在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息,并将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端,其中,所述标签信息包括目标合同条款的风险评分以及修改建议信息
此外,为实现上述目的,本发明还提供一种合同条款分析设备,所述合同条款分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的合同条款分析程序,所述合同条款分析程序被所述处理器执行时实现前述的合同条款分析方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有合同条款分析程序,所述合同条款分析程序被处理器执行时实现前述的合同条款分析方法的步骤。
本发明通过获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量,接着基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量,而后基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度,然后基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款,最后若存在,则在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息,并将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端,通过数据处理技术对合同文本进行处理,能够根据合同条款数据库准确得到待分析合同的目标合同条款,进而确定目标合同条款的标签信息,以实现对待评价合同进行整体评价,以挖掘待评价合同中的不合理条款,从而减少待评价合同所导致的潜在威胁和损失。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中合同条款分析设备的结构示意图;
图2为本发明合同条款分析方法第一实施例的流程示意图;
图3为本发明合同条款分析方法第二实施例中获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练的步骤的细化流程示意图;
图4为本发明合同条款分析方法第三实施例中基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度的步骤的细化流程示意图;
图5为本发明合同条款分析方法第四实施例中基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量的步骤的细化流程示意图;
图6为本发明合同条款分析方法第五实施例中基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款的步骤的细化流程示意图;
图7为本发明合同条款分析方法第六实施例中在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息的步骤的细化流程示意图;
图8为本发明合同条款分析方法第七实施例中将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端的步骤的细化流程示意图;
图9为本发明合同条款分析装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境中合同条款分析设备的结构示意图。
如图1所示,该合同条款分析设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的合同条款分析设备结构并不构成对合同条款分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及合同条款分析程序。
在图1所示的合同条款分析设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的合同条款分析程序,并执行以下合同条款分析方法的各个实施例中的操作。
本发明还提供一种合同条款分析方法,参照图2,图2为本发明合同条款分析方法第一实施例的流程示意图。
在本实施例中,该合同条款分析方法包括:
步骤S100,获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量;
在本实施例中,用户可通过移动终端或者PC将需要进行评价的合同文本上传至合同条款分析装置,例如,通过移动终端的APP将合同文本上传至合同条款分析装置。
在接收到待分析合同时合同条款分析装置对该待分析合同进行文本切割,以获得该待分析合同的合同条款,其中,若该待分析合同为图片格式的合同数据,则先对合同数据进行OCR识别得到合同文本,而后进行文本切割,例如,采用现有的文本切割算法进行文本切割,以确保切割后的数据均为一条完整的合同条款,比如,切割后的数据中包括一个句号。而后对所述合同条款进行清洗操作,去除所述合同条款中的重复条款,以获得所述待分析合同条款。
在获取到待分析合同条款时,基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量,具体地,基于预设停用词,对待分析合同条款进行停用词过滤操作,以整定待分析合同条款中的停用词,获得待分析合同条款信息,即去除清洗后的待分析合同条款中的停用词,而后基于词向量模型对所述异常条款信息进行训练,以获得所述待分析合同条款对应的词向量。
步骤S200,基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量;
在获取到待分析合同条款对应的词向量时,获取匹配句子向量,其中该匹配句子向量为预先设置的各个词语所构成的句子向量,该匹配句子向量的元素为词表中各个词语的词向量,该匹配句子向量为M维向量,M为词表的长度即词表中词语的数量,例如,M为100000,也就是该匹配句子向量所对应的词语的数量,其中,词表中的词语为合同文本中可能出现的所有词语(可以为除连词、介词以及无法律意义的词之外的词语)。而后基于词向量确定待分析合同条款对应的句子向量,具体地,分别基于待分析合同条款中各个条款的词向量确定该条款对应的句子向量。
步骤S300,基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度;
在本实施例中,在获取到待分析合同条款对应的句子向量时,基于句子向量以及合同条款数据库中预设合同条款的预设句子向量,计算待分析合同条款与各个预设合同条款之间的相似度,具体地,遍历待分析合同条款,确定当前遍历的待分析合同条款,并遍历合同条款数据库中各个预设合同条款,计算当前遍历的预设合同条款的预设句子向量、与当前遍历的待分析合同条款的句子向量之间的相似度,其中,该相似度为句子向量与预设句子向量之间的余弦值,具体采用余弦公式计算得到。
步骤S400,基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款;
在本实施例中,在获取到待分析合同条款与各个预设合同条款之间的相似度时,基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款,具体地,确定所述待分析合同条款中是否存在相似度大于预设相似度的合同条款,若存在,则确定所述待分析合同条款中存在满足预设条件的目标合同条款,其中,相似度大于预设相似度的合同条款为目标合同条款。
步骤S500,若存在,则在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息,并将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端。
其中,若该目标合同条款包括多条,则该标签信息包括目标合同条款中的各个合同条款为正常合同条款还是异常合同条款,以及目标合同条款中异常合同条款的风险评分以及修改建议信息;若该目标合同条款仅包括一条,则该标签信息包括目标合同条款为正常合同条款还是异常合同条款,若为异常合同条款,则该标签信息还包括风险评分以及修改建议信息。
在本实施例中,若待分析合同条款中存在满足预设条件的目标合同条款,在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息。例如,对于一条目标合同条款,在获取到其对应的目标风险条款的标签信息时,可以将该标签信息作为该目标合同条款的标签信息。若其对应的目标风险条款包括多条,则可将其余目标风险条款之间相似度最大的风险条款的标签信息作为该目标合同条款的标签信息;或者,若该标签信息包括风险评分,且每一条目标风险条款之间的风险评分存在差异,则基于每一条目标风险条款对应的相似度以及风险评分计算目标合同条款的风险评分,并将多个目标风险条款所对应的不同的修改建议信息作为该目标合同条款的修改建议信息,基于计算得到的风险评分以及修改建议信息生成标签信息。
最后将标签信息以及目标合同条款发送至待分析合同对应的终端,以通过终端展示目标合同条款以及对应的标签信息,便于用户根据标签信息中的修改建议信息修改待分析合同条款中的目标合同条款。
在其他实施例中,还可以在待分析合同条款中标记目标合同条款,在目标合同条款的相应位置标注对应的标签信息,将标注后的待分析合同发送至该终端。另外,还可以获取与该待分析合同对应的合同主体,匹配的合同模板,根据合同模板确定该待分析合同是否存在缺失条款,具体地,若待分析合同条款的条款主题中包括合同模板中所有的必要合同条款所对应的条款主题,则该待分析合同不存在缺失条款,否则,该待分析合同条款的条款主题中不包括的必要合同条款所对应的条款主题,为缺失条款的条款主题,进而确定待分析合同的缺失条款。在标注后的待分析合同中标记缺失条款,并将标记缺失条款后的待分析合同发送至该终端。
需要说明的是,在进行合同条款分析之前,需要创建合同条款数据库,具体地,接收并存储合同条款信息,该合同条款信息包括:正常合同条款、正常合同条款的评分值,异常合同条款(风险合同条款)、异常合同条款的评分值以及修改建议信息。
还可采用LR模型(逻辑回归)对合同条款信息进行训练,以将合同条款信息的打分结果映射到0-1的区间内,例如,对于某一合同条款信息,其评分为80(百分制),则训练后的分值为0.8。其中,LR模型是在线性回归的基础上,把特征进行线性组合,再把组合的结果通过一层sigmoid函数映射成结果是1或是0的概率,逻辑回归模型是一个分类模型,对生成的结果是0或1的概率进行建模,通过采用最大似然估计的方法最大化似然函数,采用梯度上升的方法得到使似然函数最大的参数。其中,如果存在多个打分结果的条款,则将多个打分结果的均值作为该条款的最终打分结果。
对于各个合同条款信息,基于预设停用词,对合同条款信息进行停用词过滤操作,基于词向量模型对过滤后的合同条款信息进行训练,以获得合同条款信息对应的词向量;计算匹配句子向量中的词向量与合同条款信息的词向量之间的相似度,基于所述相似度生成相似词矩阵,其中,所述相似词矩阵中的每一行的元素为同一词向量与匹配句子向量中的词向量之间的相似度,所述相似词矩阵中每一列的元素为同一异常条款的词向量与匹配句子向量中的词向量之间的相似度;基于所述相似词矩阵的每一列元素中的最大相似度,生成所述句子向量,进而得到合同条款信息中各个条款的句子向量,最后将合同条款信息作为预设合同条款,将合同条款信息对应的句子向量作为预设句子向量,生成合同条款数据库。
需要说明的是,该合同条款信息的句子向量的确定方式与待分析合同条款的句子向量确定方式类似,在此不在赘述。
利用合同条款以及相关特征,进行文本分类(Text Categorization)处理,以确定每一条异常条款所属的类别及该类别所对应的关键词,针对不同的类别的风险条款设置不同的规则进行识别,例如违约金类别会提示合同中的金额不得大于某个比率,如果合同中没有金额则会提示金额的合法范围,以供参考。
根据预设合同条款对应的修改建议信息以及评分信息生成预设合同条款的标签信息,最后,根据预设合同条款、标签信息、预设句子向量、预设合同条款所属的类别及该类别所对应的关键词建立合同数据库。
本实施例提出的合同条款分析方法,通过获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量,接着基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量,而后基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度,然后基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款,最后若存在,则在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息,并将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端,通过数据处理技术对合同文本进行处理,能够根据合同条款数据库准确得到待分析合同的目标合同条款,进而确定目标合同条款的标签信息,以实现对待评价合同进行整体评价,以挖掘待评价合同中的不合理条款,从而减少待评价合同所导致的潜在威胁和损失。
基于第一实施例,提出本发明合同条款分析方法的第二实施例,参照图4,在本实施例中,步骤S100包括:
步骤S110,对所述待分析合同进行文本切割,以获得所述待分析合同的合同条款;
步骤S120,对所述合同条款进行清洗操作,去除所述合同条款中的重复条款,以获得所述待分析合同条款;
步骤S130,基于预设停用词,对所述待分析合同条款进行停用词过滤操作,以获得合同条款信息;
步骤S140,基于词向量模型对所述合同条款信息进行训练,以获得所述待分析合同条款对应的词向量。
在本实施例中,在接收到待分析合同时合同条款分析装置对该待分析合同进行文本切割,以获得该待分析合同的合同条款,其中,若该待分析合同为图片格式的合同数据,则先对合同数据进行OCR识别得到合同文本,而后进行文本切割,例如,采用现有的文本切割算法进行文本切割,以确保切割后的数据均为一条完整的合同条款,比如,切割后的数据中包括一个句号。而后对所述合同条款进行清洗操作,去除所述合同条款中的重复条款,以获得所述待分析合同条款。
在获取到待分析合同条款时,基于预设停用词,对待分析合同条款进行停用词过滤操作,以整定待分析合同条款中的停用词,获得待分析合同条款信息,即去除清洗后的待分析合同条款中的停用词,具体地,遍历待分析合同条款,若当前遍历的待分析合同条款中存在与预设停用词库中的停用词一致的词,则将当前遍历的待分析合同条款中与预设停用词库中的停用词一致的词去除。其中,该预设停用词库中存储有预设停用词,该预设停用词包括不具有法律意义的专属停用词,以及包括连词、介词等在内的常规停用词。
在获得合同条款信息时,基于词向量模型对合同条款信息进行训练,以获得所述待分析合同条款对应的词向量,其中,该词向量为合同条款信息中各个词语所对应的向量。该词向量模型主要是使用CBOW和SKIP假设进行训练的,以将整定停用词后的合同条款中计算机无法识别的词语转换成计算机可识别的向量;例如,采用Word2Vec对整定停用词后的合同条款进行训练,该Word2Vec是用于产生词向量的神经网络模型,包括CBOW和SKIP两种方式。
本实施例提出的合同条款分析方法,通过对所述待分析合同进行文本切割,以获得所述待分析合同的合同条款,接着对所述合同条款进行清洗操作,去除所述合同条款中的重复条款,以获得所述待分析合同条款,而后基于预设停用词,对所述待分析合同条款进行停用词过滤操作,以获得合同条款信息,然后基于词向量模型对所述异常条款信息进行训练,以获得所述待分析合同条款对应的词向量,通过对待分析合同的合同条款进行清洗以及过滤,能够确保词向量与待分析合同的实质内容相关,使得词向量中不包括待分析合同实质内容无关的词向量,确保合同分析的效率以及准确性。
基于第一实施例,提出本发明合同条款分析方法的第三实施例,参照图5,在本实施例中,步骤S300包括:
步骤S310,基于所述合同条款信息,通过Tf-idf算法,计算所述待分析合同条款与所述预设合同条款之间的Tf-idf值;
步骤S320,将各个Tf-idf值中预设数量的最大的Tf-idf值,所对应的预设合同条款的预设句子向量中作为目标句子向量;
步骤S330,基于所述句子向量以及所述目标句子向量,计算所述待分析合同条款,与所述目标句子向量对应的目标合同条款之间的相似度。
在本实施例中,在获取到句子向量时,首先基于合同条款信息,通过Tf-idf算法,计算所述待分析合同条款与所述预设合同条款之间的Tf-idf值,具体地,依次遍历待分析合同条款,对于当前遍历的待分析合同条款,而后遍历预设合同条款,得到当前遍历的预设合同条款,并遍历当前遍历的待分析合同条款的条款信息中各个词语,计算当前遍历的词语与当前遍历的预设合同条款之间的Tf值以及idf值,计算Tf值与idf值的乘积,在条款信息中各个词语遍历完成时,计算各个词语对应的Tf值与idf值的乘积的均值,以获得当前遍历的待分析合同条款与当前遍历的预设合同条款之间的Tf-idf值。在所述预设合同条款遍历完成时,得到当前遍历的待分析合同条款与各个预设合同条款之间的Tf-idf值,在待分析合同条款遍历完成时,得到各个待分析合同条款分别与各个预设合同条款之间的Tf-idf值。
需要说明的是,Tf值指的是某一个给定的词语在该文件中出现的频率,Tf值为该词语在预设合同条款中的出现次数,除以预设合同条款中所有词语的出现次数之和。idf值具体为:预设合同条款的总数量,除以包括该词语的预设合同条款的数目,再将得到的商取以10为底的对数得到。
在获取到待分析合同条款与所述预设合同条款之间的Tf-idf值时,将各个Tf-idf值中预设数量的最大的Tf-idf值,所对应的预设合同条款的预设句子向量中作为目标句子向量,并基于所述句子向量以及所述目标句子向量,计算所述待分析合同条款,与所述目标句子向量对应的目标合同条款之间的相似度,进而能够减少待分析合同条款的相似度计算次数,提高相似度计算的效率。
本实施例提出的合同条款分析方法,通过基于所述条款信息,通过Tf-idf算法,计算所述待分析合同条款与各个所述预设合同条款之间的Tf-idf值,接着将各个Tf-idf值中预设数量的最大的Tf-idf值,所对应的预设合同条款的预设句子向量中作为目标句子向量,而后基于所述句子向量以及所述目标句子向量,计算所述待分析合同条款,与所述目标句子向量对应的目标合同条款之间的相似度,通过Tf-idf值对预设合同条款筛选,能够排除与待分析合同条款关联系数低的预设合同条款,进而能够减少待分析合同条款的相似度计算次数,提高相似度计算的效率。
基于第一实施例,提出本发明合同条款分析方法的第四实施例,参照图5,在本实施例中,步骤S200包括:
步骤S210,计算匹配句子向量中的词向量与所述词向量之间的相似度,基于所述相似度生成相似词矩阵,其中,所述相似词矩阵中的每一行的元素为同一词向量与匹配句子向量中的词向量之间的相似度,所述相似词矩阵中每一列的元素为同一待分析合同条款的词向量与匹配句子向量中的词向量之间的相似度;
步骤S220,基于所述相似词矩阵的每一列元素中的最大相似度,生成所述句子向量。
在本实施例中,在确定待分析合同条款的词向量时,获取匹配句子向量,其中该匹配句子向量为预先设置的各个词语所构成的句子向量,该匹配句子向量的元素为词表中各个词语的词向量,该匹配句子向量为M维向量,M为词表的长度即词表中词语的数量,例如,M为100000,也就是该匹配句子向量所对应的词语的数量,其中,词表中的词语为合同文本中可能出现的所有词语(可以为除连词、介词以及无法律意义的词之外的词语)。
在获取到匹配句子向量时,计算匹配句子向量中的词向量与所述词向量之间的相似度,基于所述相似度生成相似词矩阵,其中,所述相似词矩阵中的每一行的元素为同一词向量与匹配句子向量中的词向量之间的相似度,所述相似词矩阵中每一列的元素为同一待分析合同条款的词向量与匹配句子向量中的词向量之间的相似度。该相似词矩阵为M*N矩阵,其中,M为词表的长度,N为相似词的个数即合同条款信息中的词语数量。而后基于相似词矩阵的每一列元素中的最大相似度,生成所述句子向量
具体地,可依次遍历待分析合同条款,确定当前遍历的待分析合同条款的合同条款信息中词语的数量,该词语的数量即为相似词矩阵中的列数N,计算匹配句子向量中的词向量与当前遍历的待分析合同条款对应的词向量之间的相似度,基于该相似度生成当前遍历的待分析合同条款的相似词矩阵,其中,该相似词矩阵中的每一行的元素为当前遍历的待分析合同条款对应的所有词向量中的同一个词向量、与匹配句子向量中的词向量之间的相似度。在得到当前遍历的待分析合同条款的相似词矩阵时,分别比较该相似词矩阵中的每一列的元素,以确定每一列元素的最大相似度,并将各列的最大相似度作为一个一维向量的元素,该一维向量即为当前遍历的待分析合同条款的句子向量。
本实施例提出的合同条款分析方法,通过计算匹配句子向量中的词向量与所述词向量之间的相似度,基于所述相似度生成相似词矩阵,接着基于所述相似词矩阵的每一列元素中的最大相似度,生成所述句子向量,能够根据相似词矩阵准确得到待分析合同条款的句子向量,以便于能够根据句子向量准确确定待分析合同条款所对应的目标合同条款,进而提高对待分析合同条款进行分析的准确性,提高合同分析的效率及准确性。
基于第一实施例,提出本发明合同条款分析方法的第五实施例,参照图6,在本实施例中,步骤S400包括:
步骤S410,确定所述待分析合同条款中是否存在相似度大于预设相似度的合同条款;
步骤S420,若存在,则确定所述待分析合同条款中存在满足预设条件的目标合同条款,其中,相似度大于预设相似度的合同条款为所述目标合同条款。
在本实施例中,在获取到待分析合同条款与各个预设合同条款之间的相似度时,确定所述待分析合同条款中是否存在相似度大于预设相似度的合同条款,若存在,则确定所述待分析合同条款中存在满足预设条件的目标合同条款,其中,相似度大于预设相似度的合同条款为目标合同条款。
例如,预设相似度为70%,在一待分析合同条款与一预设合同条款之间的相似度大于70%,该待分析合同条款满足预设条件。
本实施例提出的合同条款分析方法,通过确定所述待分析合同条款中是否存在相似度大于预设相似度的合同条款;接着若存在,则确定所述待分析合同条款中存在满足预设条件的目标合同条款,能够根据相似度准确确定目标合同条款,进而提高对待分析合同条款进行分析的准确性,提高合同分析的效率及准确性。
基于第五实施例,提出本发明合同条款分析方法的第六实施例,参照图7,在本实施例中,步骤S500包括:
步骤S510,确定所述目标合同条款中,是否存在相似合同条款,其中,所述相似合同条款对应的相似度中,大于预设相似度的个数为多个;
步骤S520,若存在,则基于大于预设相似度的相似度、以及大于预设相似度的相似度对应的预设合同条款的风险评分,确定所述相似合同条款的标签信息。
在本实施例中,在得到目标合同条款时,确定目标合同条款中是否存在,大于预设相似度的个数为多个的相似合同条款,具体的,遍历目标合同条款,确定当前遍历的目标合同条款的相似度中大于预设相似度的个数,若该个数为多个,则当前遍历的目标合同条款为相似合同条款。
在确定相似合同条款时,基于大于预设相似度的相似度、以及大于预设相似度的相似度对应的预设合同条款的风险评分,确定所述相似合同条款的标签信息。具体的,基于该相似合同条款对应的预设合同条款的相似度以及风险评分计算目标合同条款的风险评分,分别将各个大于预设相似度的相似度乘以该相似度对应的风险评分得到目标评分,计算各个目标评分的均值作为该相似合同条款的标签信息中的风险评分,并将多个目标风险条款所对应的不同的修改建议信息作为该目标合同条款的修改建议信息,基于计算得到的风险评分以及修改建议信息生成标签信息。
本实施例提出的合同条款分析方法,通过确定所述目标合同条款中,是否存在相似合同条款,接着若存在,则基于大于预设相似度的相似度、以及大于预设相似度的相似度对应的预设合同条款的风险评分确定所述相似合同条款的标签信息,在目标合同条款中存在相似合同条款,能够准确得到该相似合同条款的标签信息,进一步提高了合同分析的准确性。
基于上述实施例,提出本发明合同条款分析方法的第七实施例,参照图8,在本实施例中,步骤S500包括:
步骤S530,采用最长公共子序列算法或者最长公共子串算法,基于所述目标合同条款对应的预设合同条款,对所述目标合同条款进行标注操作;
步骤S540,将所述标签信息以及标注后的所述目标合同条款发送至所述终端。
在本实施例中,在获取到目标合同条款的标签信息时,采用最长公共子序列或者最长公共子串算法,基于所述目标合同条款对应的预设合同条款,对所述目标合同条款进行标注操作,并将标签信息以及标注后的所述目标合同条款发送至终端,以使终端显示该标签信息以及标注后的目标合同条款,进而使用户及时了解该目标合同条款存在潜在风险的原因,以便于根据标签信息中的修改建议信息修改该目标合同条款。
具体地,若采用最长公共子序列算法对所述目标合同条款进行标注时,遍历目标合同条款,基于当前遍历的目标合同条款的词向量、以及对应的预设合同条款的词向量,确定目标合同条款与预设合同条款之间相同的词语,在当前遍历的目标合同条款中标注该词语以及各个词语之间的词。
若采用最长公共子串算法对目标合同条款进行标注时,遍历目标合同条款,基于当前遍历的目标合同条款的词向量、以及对应的预设合同条款的词向量,先确定目标合同条款与预设合同条款之间相同的词语,确定相同的词语中是否存在相邻的词语,若存在相邻的词语,则确定相邻的词语中最长的词语串(即最长公共子串),而后在当前遍历的目标合同条款中标注最长公共子串。
需要说明的是,在其他实施例中,还可以在待分析合同条款中标记目标合同条款,在目标合同条款的相应位置标注对应的标签信息,并采用最长公共子序列算法或者最长公共子串算法对目标合同条款进行标注,将标注后的待分析合同发送至该终端。
本实施例提出的合同条款分析方法,通过采用最长公共子序列或者最长公共子串算法,基于所述目标合同条款对应的预设合同条款,对所述目标合同条款进行标注操作,接着将所述标签信息以及标注后的所述目标合同条款发送至所述终端,通过对目标合同条款进行标注,能够使用户直观查看目标合同条款中存在潜在风险的位置,以便于根据标签信息中的修改建议信息修改该目标合同条款,进一步提高用户体验。
参照图9,图9为本发明合同条款分析装置一实施例的功能模块示意图。
本实施例中,合同条款分析装置包括:
获取模块10,用于获取模块,用于获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量;
第一确定模块20,用于基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量;
计算模块30,用于基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度;
第二确定模块40,用于基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款;
发送模块50,用于若存在,则在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息,并将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端,其中,所述标签信息包括目标合同条款的风险评分以及修改建议信息。
需要说明的是,合同条款分析装置的各个实施例与上述合同条款分析方法的各实施例基本相同,在此不再详细赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有合同条款分析程序,所述合同条款分析程序被处理器执行时实现如上述中任一项所述的合同条款分析方法的步骤。
本发明计算机可读存储介质具体实施例与上述合同条款分析方法的各实施例基本相同,在此不再详细赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种合同条款分析方法,其特征在于,所述合同条款分析方法包括以下步骤:
获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量;
基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量;
基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度;
基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款;
若存在,则在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息,并将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端。
2.如权利要求1所述的合同条款分析方法,其特征在于,所述获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练的步骤包括:
对所述待分析合同进行文本切割,以获得所述待分析合同的合同条款;
对所述合同条款进行清洗操作,去除所述合同条款中的重复条款,以获得所述待分析合同条款;
基于预设停用词,对所述待分析合同条款进行停用词过滤操作,以获得合同条款信息;
基于词向量模型对所述合同条款信息进行训练,以获得所述待分析合同条款对应的词向量。
3.如权利要求2所述的合同条款分析方法,其特征在于,所述基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度的步骤包括:
基于所述条款信息,通过Tf-idf算法,计算所述待分析合同条款与所述预设合同条款之间的Tf-idf值;
将各个Tf-idf值中预设数量的最大的Tf-idf值,所对应的预设合同条款的预设句子向量中作为目标句子向量;
基于所述句子向量以及所述目标句子向量,计算所述待分析合同条款,与所述目标句子向量对应的目标合同条款之间的相似度。
4.如权利要求1所述的合同条款分析方法,其特征在于,基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量的步骤包括:
计算匹配句子向量中的词向量与所述词向量之间的相似度,基于所述相似度生成相似词矩阵,其中,所述相似词矩阵中的每一行的元素为同一词向量与匹配句子向量中的词向量之间的相似度,所述相似词矩阵中每一列的元素为同一待分析合同条款的词向量与匹配句子向量中的词向量之间的相似度;
基于所述相似词矩阵的每一列元素中的最大相似度,生成所述句子向量。
5.如权利要求1所述的合同条款分析方法,其特征在于,所述基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款的步骤包括:
确定所述待分析合同条款中是否存在相似度大于预设相似度的合同条款;
若存在,则确定所述待分析合同条款中存在满足预设条件的目标合同条款,其中,相似度大于预设相似度的合同条款为所述目标合同条款。
6.如权利要求5所述的合同条款分析方法,其特征在于,所述在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息的步骤包括:
确定所述目标合同条款中,是否存在相似合同条款,其中,所述相似合同条款对应的相似度中,大于预设相似度的个数为多个;
若存在,则基于大于预设相似度的相似度、以及大于预设相似度的相似度对应的预设合同条款的风险评分确定所述相似合同条款的标签信息。
7.如权利要求1至6任一项所述的合同条款分析方法,其特征在于,所述将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端的步骤包括:
采用最长公共子序列算法或者最长公共子串算法,基于所述目标合同条款对应的预设合同条款,对所述目标合同条款进行标注操作;
将所述标签信息以及标注后的所述目标合同条款发送至所述终端。
8.一种合同条款分析装置,其特征在于,所述合同条款分析装置包括:
获取模块,用于获取待分析合同的待分析合同条款,并基于词向量模型对所述待分析合同条款进行训练,以获得所述待分析合同条款对应的词向量;
第一确定模块,用于基于匹配句子向量以及所述词向量确定所述待分析合同条款对应的句子向量;
计算模块,用于基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待分析合同条款与各个所述预设合同条款之间的相似度;
第二确定模块,用于基于所述相似度,确定所述待分析合同条款中是否存在满足预设条件的目标合同条款;
发送模块,用于若存在,则在合同条款数据库中,基于所述目标合同条款对应的预设合同条款确定所述目标合同条款的标签信息,并将所述标签信息以及所述目标合同条款发送至待分析合同对应的终端,其中,所述标签信息包括目标合同条款的风险评分以及修改建议信息。
9.一种合同条款分析设备,其特征在于,所述合同条款分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的合同条款分析程序,所述合同条款分析程序被所述处理器执行时实现如权利要求1至7中任一项所述的合同条款分析方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有合同条款分析程序,所述合同条款分析程序被处理器执行时实现如权利要求1至7中任一项所述的合同条款分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910205784.4A CN110096681B (zh) | 2019-03-16 | 2019-03-16 | 合同条款分析方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910205784.4A CN110096681B (zh) | 2019-03-16 | 2019-03-16 | 合同条款分析方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110096681A true CN110096681A (zh) | 2019-08-06 |
CN110096681B CN110096681B (zh) | 2023-11-17 |
Family
ID=67443389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910205784.4A Active CN110096681B (zh) | 2019-03-16 | 2019-03-16 | 合同条款分析方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110096681B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111209375A (zh) * | 2020-01-13 | 2020-05-29 | 中国科学院信息工程研究所 | 一种通用的条款与文档匹配方法 |
CN111241230A (zh) * | 2019-12-31 | 2020-06-05 | 中国南方电网有限责任公司 | 一种基于文本挖掘识别串标风险的方法及系统 |
CN111814457A (zh) * | 2020-05-30 | 2020-10-23 | 国网上海市电力公司 | 一种电网工程合同文本生成方法 |
CN112464660A (zh) * | 2020-11-25 | 2021-03-09 | 平安医疗健康管理股份有限公司 | 文本分类模型构建方法以及文本数据处理方法 |
CN117252690A (zh) * | 2023-11-17 | 2023-12-19 | 杭州钱袋数字科技有限公司 | 一种贷款合同在线签订方法与系统 |
US11880650B1 (en) * | 2020-10-26 | 2024-01-23 | Ironclad, Inc. | Smart detection of and templates for contract edits in a workflow |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5383943B1 (ja) * | 2013-06-06 | 2014-01-08 | 株式会社野村総合研究所 | 契約書分析システム、プログラム及び方法 |
CN108519972A (zh) * | 2018-03-26 | 2018-09-11 | 北京北大英华科技有限公司 | 一种合同条款的法律风险判定方法、装置及计算机设备 |
CN108628825A (zh) * | 2018-04-10 | 2018-10-09 | 平安科技(深圳)有限公司 | 文本信息相似度匹配方法、装置、计算机设备及存储介质 |
CN109447105A (zh) * | 2018-09-10 | 2019-03-08 | 平安科技(深圳)有限公司 | 合同审核方法、装置、计算机设备和存储介质 |
-
2019
- 2019-03-16 CN CN201910205784.4A patent/CN110096681B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5383943B1 (ja) * | 2013-06-06 | 2014-01-08 | 株式会社野村総合研究所 | 契約書分析システム、プログラム及び方法 |
CN108519972A (zh) * | 2018-03-26 | 2018-09-11 | 北京北大英华科技有限公司 | 一种合同条款的法律风险判定方法、装置及计算机设备 |
CN108628825A (zh) * | 2018-04-10 | 2018-10-09 | 平安科技(深圳)有限公司 | 文本信息相似度匹配方法、装置、计算机设备及存储介质 |
CN109447105A (zh) * | 2018-09-10 | 2019-03-08 | 平安科技(深圳)有限公司 | 合同审核方法、装置、计算机设备和存储介质 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111241230A (zh) * | 2019-12-31 | 2020-06-05 | 中国南方电网有限责任公司 | 一种基于文本挖掘识别串标风险的方法及系统 |
CN111209375A (zh) * | 2020-01-13 | 2020-05-29 | 中国科学院信息工程研究所 | 一种通用的条款与文档匹配方法 |
CN111209375B (zh) * | 2020-01-13 | 2023-01-17 | 中国科学院信息工程研究所 | 一种通用的条款与文档匹配方法 |
CN111814457A (zh) * | 2020-05-30 | 2020-10-23 | 国网上海市电力公司 | 一种电网工程合同文本生成方法 |
US11880650B1 (en) * | 2020-10-26 | 2024-01-23 | Ironclad, Inc. | Smart detection of and templates for contract edits in a workflow |
CN112464660A (zh) * | 2020-11-25 | 2021-03-09 | 平安医疗健康管理股份有限公司 | 文本分类模型构建方法以及文本数据处理方法 |
CN112464660B (zh) * | 2020-11-25 | 2023-02-07 | 深圳平安医疗健康科技服务有限公司 | 文本分类模型构建方法以及文本数据处理方法 |
CN117252690A (zh) * | 2023-11-17 | 2023-12-19 | 杭州钱袋数字科技有限公司 | 一种贷款合同在线签订方法与系统 |
CN117252690B (zh) * | 2023-11-17 | 2024-02-23 | 杭州钱袋数字科技有限公司 | 一种贷款合同在线签订方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110096681B (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110096681A (zh) | 合同条款分析方法、装置、设备及可读存储介质 | |
Li et al. | Contextual recommendation based on text mining | |
US10642975B2 (en) | System and methods for automatically detecting deceptive content | |
CN105393264B (zh) | 人机交互学习中的交互区段提取 | |
US8676730B2 (en) | Sentiment classifiers based on feature extraction | |
CN114238573B (zh) | 基于文本对抗样例的信息推送方法及装置 | |
CN107391760A (zh) | 用户兴趣识别方法、装置及计算机可读存储介质 | |
CN107688870B (zh) | 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置 | |
US9418145B2 (en) | Method and system for visualizing documents | |
CN104471568A (zh) | 对自然语言问题的基于学习的处理 | |
CN110263248A (zh) | 一种信息推送方法、装置、存储介质和服务器 | |
CN104350490A (zh) | 用于组织与产品相关的数据的方法、装置以及计算机可读介质 | |
CN102789449B (zh) | 对评论文本进行评价的方法和装置 | |
CN107844533A (zh) | 一种智能问答系统及分析方法 | |
WO2012096388A1 (ja) | 意外性判定システム、意外性判定方法およびプログラム | |
Verma et al. | A novel approach for text summarization using optimal combination of sentence scoring methods | |
WO2019242453A1 (zh) | 信息处理方法及装置、存储介质、电子装置 | |
Suchacka et al. | A k-nearest neighbors method for classifying user sessions in e-commerce scenario | |
CN113343012A (zh) | 一种新闻配图方法、装置、设备及存储介质 | |
MacEachren et al. | HEALTH GeoJunction: place-time-concept browsing of health publications | |
CN113821588A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
JP2022035314A (ja) | 情報処理装置及びプログラム | |
Shaik et al. | Recurrent neural network with emperor penguin-based Salp swarm (RNN-EPS2) algorithm for emoji based sentiment analysis | |
CN110083809A (zh) | 合同条款相似度计算方法、装置、设备及可读存储介质 | |
CN107291686B (zh) | 情感标识的辨识方法和情感标识的辨识系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |