CN110119440A - 合同自动生成方法、装置、计算机设备及存储介质 - Google Patents

合同自动生成方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110119440A
CN110119440A CN201910302069.2A CN201910302069A CN110119440A CN 110119440 A CN110119440 A CN 110119440A CN 201910302069 A CN201910302069 A CN 201910302069A CN 110119440 A CN110119440 A CN 110119440A
Authority
CN
China
Prior art keywords
keyword
contract
law
remaining
articles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910302069.2A
Other languages
English (en)
Inventor
王盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201910302069.2A priority Critical patent/CN110119440A/zh
Publication of CN110119440A publication Critical patent/CN110119440A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种合同自动生成方法、装置、计算机设备及存储介质,该方法包括:当接收到审核请求时,向客户端发送合同填写指令,获取合同条款,和获取合同类别,然后获取合同类别对应的目标法律的法律条款,接下来采用预设的自然语言处理算法,对合同条款和法律条款进行自动准确地关键字提取,得到精准的合同关键字和法律关键字,最后若合同关键字与法律关键字相匹配,则确定目标合同审核通过,并将其确定为制定好的合同,若合同关键字与法律关键字不相匹配,则确定目标合同审核未通过,并对合同条款进行修正,并根据修正后的合同条款确定出制定好的合同,采用自动审核找出不准确的合同条款,并对其修正,提高生成合同的准确性和自动化水平。

Description

合同自动生成方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种合同自动生成方法、装置、计算机设备及存储介质。
背景技术
目前,随着人们的法律意识的不断提高,很多公司越来越重视合同的法律效应。
针对创业公司,通常情况下,在创业初期时,因为创业公司的人力和财力往往不充足,导致创业公司缺乏法律人员,所以导致创业公司自身制定出的合同常常存在各种各样的漏洞,从而导致合同生成的准确率低下。
因此,寻找一种准确的合同生成方法成为本领域技术人员亟需解决的问题。
发明内容
本发明实施例提供一种合同自动生成方法、装置、计算机设备及存储介质,以解决因采用人工方式制定合同,导致生成合同的准确率低下的问题。
一种合同自动生成方法,包括:
若接收到请求方在客户端针对目标合同发起的审核请求,则向所述客户端发送合同填写指令;
获取所述请求方通过所述合同填写指令上传的所述目标合同的待审核的合同条款;
获取所述目标合同的预先已确定的合同类别;
从预设的法律条款数据库中,获取所述合同类别对应的目标法律的法律条款;
采用预设的自然语言处理算法,对所述合同条款进行关键字提取,得到所述合同条款对应的合同关键字;
采用所述预设的自然语言处理算法,对所述法律条款进行关键字提取,得到所述法律条款对应的法律关键字;
采用预设的匹配方式,对所述合同关键字与所述法律关键字进行匹配,得到关键字匹配结果;
若所述关键字匹配结果为所述合同关键字与所述法律关键字相匹配,则确定所述目标合同审核通过,并将所述目标合同确定为制定好的合同;
若所述关键字匹配结果为所述合同关键字与所述法律关键字不相匹配,则确定所述目标合同审核未通过,并根据所述法律条款对所述合同条款进行修正,得到修正后的所述合同条款,并将由修正后的所述合同条款组合成的合同确定为所述制定好的合同。
一种合同自动生成装置,包括:
请求接收模块,用于若接收到请求方在客户端针对目标合同发起的审核请求,则向所述客户端发送合同填写指令;
合同条款获取模块,用于获取所述请求方通过所述合同填写指令上传的所述目标合同的待审核的合同条款;
类别获取模块,用于获取所述目标合同的预先已确定的合同类别;
法律条款获取模块,用于从预设的法律条款数据库中,获取所述合同类别对应的目标法律的法律条款;
合同关键字提取模块,用于采用预设的自然语言处理算法,对所述合同条款进行关键字提取,得到所述合同条款对应的合同关键字;
法律关键字提取模块,用于采用所述预设的自然语言处理算法,对所述法律条款进行关键字提取,得到所述法律条款对应的法律关键字;
关键字匹配模块,用于采用预设的匹配方式,对所述合同关键字与所述法律关键字进行匹配,得到关键字匹配结果;
审核结果确定模块,用于若所述关键字匹配结果为所述合同关键字与所述法律关键字相匹配,则确定所述目标合同审核通过,并将所述目标合同确定为制定好的合同;
条款修正模块,用于若所述关键字匹配结果为所述合同关键字与所述法律关键字不相匹配,则确定所述目标合同审核未通过,并根据所述法律条款对所述合同条款进行修正,得到修正后的所述合同条款,并将由修正后的所述合同条款组合成的合同确定为所述制定好的合同。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述合同自动生成方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述合同自动生成方法的步骤。
上述合同自动生成方法、装置、计算机设备及存储介质中,当接收到请求方在客户端针目标合同发起的审核请求时,向客户端发送合同填写指令,首先自动地获取请求方通过合同填写指令上传的目标合同的待审核的合同条款,和自动地获取目标合同的预先已确定的合同类别,然后从预设的法律条款数据库中,自动快速地获取合同类别对应的目标法律的法律条款,提高了获取条款的效率,接下来采用预设的自然语言处理算法,对合同条款和法律条款进行自动准确地关键字提取,得到精准的合同关键字和精准的法律关键字,保证了合同关键字和法律关键字的准确性,最后若合同关键字与法律关键字相匹配,则确定目标合同审核通过,并将目标合同确定为制定好的合同,若合同关键字与法律关键字不相匹配,则确定目标合同审核未通过,并根据法律条款对合同条款进行修正,得到修正后的合同条款,并将由修正后的合同条款组合成的合同确定为制定好的合同,通过采用自动审核找出不准确的合同条款,并对其自动地加以修正,从而提高生成合同的准确性和自动化水平。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中合同自动生成方法的一应用环境示意图;
图2是本发明一实施例中合同自动生成方法的一流程图;
图3是本发明一实施例中合同自动生成方法中步骤S70的一流程图;
图4是本发明一实施例中合同自动生成方法中步骤S708的一流程图;
图5是本发明一实施例中合同自动生成方法中步骤S90的一流程图;
图6是本发明一实施例中合同自动生成方法中步骤S60的一流程图;
图7是本发明一实施例中合同自动生成装置的一示意图;
图8是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的合同自动生成方法,可应用如图1的应用环境中,该应用环境包括服务端和客户端,其中,客户端通过有线网络或无线网络与服务端进行通信。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务端或者是多个服务端组成的服务端集群来实现。客户端用于发送针对目标合同的审核请求和上传待审核的合同条款,服务端用于接收该审核请求,并对该合同条款进行自动审核,并当该合同条款为不准确的条款时,自动地对其进行修正。
在一实施例中,如图2所示,提供一种合同自动生成方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
S10、若接收到请求方在客户端针对目标合同发起的审核请求,则向客户端发送合同填写指令。
具体地,通常请求方在客户端的审核请求申请页面上点击审核申请按钮,比如该审核申请按钮为悬浮按钮,然后该客户端生成一个针对目标合同的审核请求发送到服务端,当服务端接收到该审核请求时,向该客户端发送合同填写指令。其中,该请求方是指请求审核该目标合同的自然人或机构,比如请求方为“张三”或“A公司”,该目标合同是指待审核的合同。该审核请求为用于要求审核该目标合同的请求。该合同填写指令为用于上传待审核合同条款的指令,其中,该合同条款为该目标合同中的条款。
例如,假设该目标合同为“劳动合同”,该请求方位“张三”,该客户端为智能手机,则“张三”在该智能手机中的审核请求申请页面上点击审核申请按钮,然后该智能手机便生成一个针对“劳动合同”的审核请求发送到服务端,当服务端接收到该救援请求时,向该智能手机发送合同填写指令。
需要说明的是,该客户端可以为智能手机或平板电脑,该合同填写指令可以为一个填写界面等,该客户端和该合同填写指令的具体内容,可以根据实际应用进行设定,此处不做限制。
S20、获取请求方通过合同填写指令上传的目标合同的待审核的合同条款。
具体地,当客户端接收到服务端发来的合同填写指令,且该目标合同为电子文档时,该请求方便在该客户端通过该合同填写指令,将该目标合同的待审核的合同条款上传至服务端,当该客户端接收到服务端发来的合同填写指令,且该目标合同为纸质文档时,该请求方首先在该客户端采用预设的文字识别工具对该目标合同的待审核的合同条款进行识别,得到识别后的合同条款,然后将该识别后的合同条款上传至服务端,接下来服务端便获取该合同条款,以便后续对该合同条款进行审核。其中,本步骤S20中的合同条款的内容与步骤S10中的合同条款的内容一致,此处不做阐述。
例如,继续以步骤S10中的例子进行说明,假设该合同条款为“试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超出六个月。”,该预设的文字识别工具为捷速ocr文字识别软件,当智能手机接收到服务端发来的合同填写指令,且该目标合同为电子文档时,“张三”便在该智能手机通过该合同填写指令,将“试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超出六个月。试用期包括在合同期限内”上传至服务端,当该智能手机接收到服务端发来的合同填写指令,且该目标合同为纸质文档时,“张三”首先在该智能手机采用捷速ocr文字识别软件对“试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超出六个月。”进行识别,得到识别后的“试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超出六个月。”,然后将识别后的“试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超出六个月。”上传至服务端,接下来服务端便获取“试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超出六个月。”,以便后续对“试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超出六个月。”进行审核。
S30、获取目标合同的预先已确定的合同类别。
在本实施例中,每份目标合同都存在预先已确定的合同类别,该合同类别是指专门为目标合同而设置的类型,比如该合同类别为“民事合同”、“行政合同”或“劳动合同”等。该合同类别专门存储于类别数据库中,处于随时可以调用的状态。
具体地,在类别数据库中获取该目标合同对应的预先已确定的合同类别的存储路径,然后根据该存储路径提取该合同类别。
例如,该类别数据库为MySQL数据库,该目标合同对应的预先已确定的合同类别的存储路径为“C:\Program Files\MySQL\MySQL Server 5.0\data\”,首先在MySQL数据库中获取“C:\Program Files\MySQL\MySQL Server 5.0\data\”,然后根据该“C:\ProgramFiles\MySQL\MySQL Server 5.0\data\”提取该合同类别。
需要说明的是,该类别数据库可以为SQL数据库或oracle数据库等,该类别数据库的具体内容,可以根据实际应用进行设定,此处不做限制。
S40、从预设的法律条款数据库中,获取合同类别对应的目标法律的法律条款。
在本实施例中,该合同类别存在对应的目标法律,比如“劳动合同”存在对应的目标法律为“劳动法”。该目标法律下存在对应的法律条款,比如“劳动法”下存在对应的法律条款“劳动合同可以约定试用期。试用期最长不得超过六个月。”,其中,该法律条款专门存储于预设的法律条款数据库中,处于随时可以调用的状态。
具体地,在预设的法律条款数据库中获取该合同类别对应的目标法律下的法律条款的存储路径,然后根据该存储路径提取该法律条款。
需要说明的是,该预设的法律条款数据库可以为SQL数据库或oracle数据库等,该预设的法律条款数据库的具体内容,可以根据实际应用进行设定,此处不做限制。
S50、采用预设的自然语言处理算法,对合同条款进行关键字提取,得到合同条款对应的合同关键字。
在本实施例中,自然语言处理算法是指能实现人与计算机之间用自然语言进行有效通信的方法。
具体地,采用预设的自然语言处理算法对步骤20中获取到的合同条款进行提取,得到合同关键字,其中,该合同关键字是指专门为合同条款而设置的关键字。
例如,继续以步骤S20中的例子进行说明,假设预设的自然语言处理算法为隐马尔可夫模型,则采用隐马尔可夫模型对“试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超出六个月。”进行提取,得到合同关键字为“试用期”、“六个月”、“在合同期限内”、“不得”和“超出”。
需要说明的是,该预设的自然语言处理算法可以为隐马尔可夫模型或马尔科夫链模型,还可以为其他模型,该预设的自然语言处理算法的具体内容,可以根据实际应用进行设定,此处不做限制。
进一步地,采用预设的自然语言处理算法对步骤20中获取到的合同条款进行提取,得到合同关键字具体包括:首先对该合同条款进行分词处理,得到子合同条款,然后对子合同条款进行去除停用词,得到去除停用词后的子合同条款,接下来获取去除停用词后的子合同条款对应的词频和逆文档频率,再接下来根据该词频与该逆文档频率确定该子合同条款对应的重要值,最后当该重要值大于或等于预设的属性阈值时,确定大于或等于预设的属性阈值的重要值对应的子合同条款为合同关键字。
S60、采用预设的自然语言处理算法,对法律条款进行关键字提取,得到法律条款对应的法律关键字。
具体地,采用预设的自然语言处理算法,对该法律条款进行关键字提取,得到法律条款对应的法律关键字。其中,本步骤S60的预设的自然语言处理算法的内容与步骤S50的预设的自然语言处理算法的内容一致,此处不再阐述。
例如,假设该预设的自然语言处理算法为隐马尔可夫模型,该法律条款为“劳动合同可以约定试用期。试用期最长不得超过六个月。”,则采用该隐马尔可夫模型,对“劳动合同可以约定试用期。试用期最长不得超过六个月。”进行关键字提取,得到“劳动合同可以约定试用期。试用期最长不得超过六个月。”对应的法律关键字为“约定”、“试用期”、“不得”、“超过”和“六个月”。
S70、采用预设的匹配方式,对合同关键字与法律关键字进行匹配,得到关键字匹配结果。
在本实施例中,预设的匹配方式可以为字符匹配方式。
具体地,采用字符匹配方式,对该合同关键字的字符与该法律关键字的字符进行匹配,得到关键字匹配结果,也即,当该合同关键字的字符与该法律关键字的字符一致时,该关键字匹配结果为该合同关键字与该法律关键字相匹配,当该合同关键字的字符与该法律关键字的字符不一致时,该关键字匹配结果为该合同关键字与该法律关键字不相匹配。
其中,该关键字匹配结果为对该合同关键字与该法律关键字进行匹配而得到的结果。
S80、若关键字匹配结果为合同关键字与法律关键字相匹配,则确定目标合同审核通过,并将目标合同确定为制定好的合同。
具体地,若该关键字匹配结果为该合同关键字与该法律关键字相匹配,则确定该目标合同审核通过,并将该目标合同确定为制定好的合同。
例如,假设该目标合同为“劳动合同”,若该关键字匹配结果为该合同关键字与该法律关键字相匹配,则确定“劳动合同”审核通过,并将“劳动合同”确定为制定好的合同。
S90、若关键字匹配结果为合同关键字与法律关键字不相匹配,则确定目标合同审核未通过,并根据法律条款对合同条款进行修正,得到修正后的合同条款,并将由修正后的合同条款组合成的合同确定为制定好的合同。
具体地,若该关键字匹配结果为该合同关键字与该法律关键字不相匹配,则确定该目标合同审核未通过,并根据该法律条款对该合同条款进行修正,得到修正后的合同条款,并将由修正后的合同条款组合成的合同确定为制定好的合同。
例如,继续以步骤S90中的例子进行说明,若该关键字匹配结果为该合同关键字与该法律关键字不相匹配,则确定“劳动合同”审核未通过,并根据该法律条款对该合同条款进行修正,得到修正后的合同条款,并将由修正后的合同条款组合成的合同确定为制定好的合同。
在图2对应的实施例中,通过上述步骤S10至步骤S90,当接收到请求方在客户端针目标合同发起的审核请求时,向客户端发送合同填写指令,首先自动地获取请求方通过合同填写指令上传的目标合同的待审核的合同条款,和自动地获取目标合同的预先已确定的合同类别,然后从预设的法律条款数据库中,自动快速地获取合同类别对应的目标法律的法律条款,提高了获取条款的效率,接下来采用预设的自然语言处理算法,对合同条款和法律条款进行自动准确地关键字提取,得到精准的合同关键字和精准的法律关键字,保证了合同关键字和法律关键字的准确性,最后若合同关键字与法律关键字相匹配,则确定目标合同审核通过,并将目标合同确定为制定好的合同,若合同关键字与法律关键字不相匹配,则确定目标合同审核未通过,并根据法律条款对合同条款进行修正,得到修正后的合同条款,并将由修正后的合同条款组合成的合同确定为制定好的合同,通过采用自动审核找出不准确的合同条款,并对其自动地加以修正,从而提高生成合同的准确性和自动化水平。
在一具体实施例中,如图3所示,步骤S70,即,采用预设的匹配方式,对合同关键字与法律关键字进行匹配,得到关键字匹配结果,具体包括如下步骤:
S701、当在合同关键字中查询到每个法律关键字的字符时,确定关键字匹配结果为合同关键字与法律关键字相匹配。
具体地,当在步骤S50中所提取到的合同关键字中查询到每个法律关键字的字符时,确定该关键字匹配结果为该合同关键字与该法律关键字相匹配。
例如,假设步骤S50中所提取到的合同关键字为“试用期”、“不得”、“超过”、“六个月”和“约定”,法律关键字为“试用期”、“不得”、“超过”和“六个月”,显然在“试用期”、“不得”、“超过”、“六个月”和“约定”中可以查询到“试用期”、“不得”、“超过”和“六个月”,则确定关键字匹配结果为合同关键字与法律关键字相匹配。
S702、当在合同关键字中未查询到每个法律关键字的字符时,将在合同关键字中查询到的法律关键字确定为已查询关键字。
具体地,当在步骤S50中所提取到的合同关键字中未查询到每个法律关键字的字符时,将在该合同关键字中查询到的法律关键字确定为已查询关键字,其中,该已查询关键字为在该合同关键字中已经查询到的法律关键字。
例如,假设步骤S50中所提取到的合同关键字为“试用期”、“不得”、“超出”、“六个月”和“约定”,法律关键字为“试用期”、“不得”、“超过”和“六个月”,显然在“试用期”、“不得”、“超出”、“六个月”和“约定”中未查询到“超过”,在“试用期”、“不得”、“超出”、“六个月”和“约定”中查询到“试用期”、“不得”和“六个月”,则将“试用期”、“不得”和“六个月”确定为已查询关键字。
S703、统计已查询关键字的关键字数量。
具体地,统计步骤S702中确定出的已查询关键字的关键字数量,其中,该关键字数量为步骤S702中确定出的已查询关键字的数量。
例如,继续以步骤S702中的例子进行说明,经过统计“试用期”、“不得”和“六个月”的关键字数量为3。
S704、当关键字数量与法律关键字的关键字总数量之间的数量比值大于或等于预设的关键字占比阈值时,将在合同关键字中除已查询关键字之外的关键字确定为剩余合同关键字。
具体地,服务端首先统计该法律关键字的关键字总数量,然后计算该关键字数量与该关键字总数量之间的数量比值,当该数量比值大于或等于预设的关键字占比阈值时,将在该合同关键字中除该已查询关键字之外的关键字确定为剩余合同关键字。
例如,继续以步骤S702和步骤S703中的例子进行说明,假设该预设的关键字占比阈值为经过统计“试用期”、“不得”、“超过”和“六个月”的关键字总数量为4,该关键字数量为3,则该关键字数量与该关键字总数量之间的数量比值为显然大于则将在“试用期”、“不得”、“超过”和“六个月”中除“试用期”、“不得”和“六个月”之外的关键字,也即“超过”,确定为剩余合同关键字。
S705、统计剩余合同关键字的剩余合同关键字数量。
具体地,服务端统计该剩余合同关键字的剩余合同关键字数量,其中,该剩余合同关键字数量为该剩余合同关键字的数量。
例如,继续以步骤S704中的例子进行说明,经过统计“超过”的剩余合同关键字数量为1。
S706、当剩余合同关键字数量等于零时,确定关键字匹配结果为合同关键字与法律关键字不相匹配。
具体地,当该剩余合同关键字数量等于零时,也即当该剩余合同关键字不存在时,因为该剩余合同关键字不存在,则代表没有剩余法律关键字与该剩余合同关键字进行匹配,即代表该剩余法律关键字与该剩余合同关键字不相匹配,所以可以确定该关键字匹配结果为合同关键字与法律关键字不相匹配,其中,该剩余法律关键字为在该法律关键字中除该已查询关键字之外的关键字。
S707、当剩余合同关键字数量大于零时,将在法律关键字中除已查询关键字之外的关键字确定为剩余法律关键字。
具体地,该剩余合同关键字数量满足不同的条件,则执行不同的步骤,当该剩余合同关键字数量大于零时,也即,当该剩余合同关键字存在时,将在该法律关键字中除该已查询关键字之外的关键字确定为剩余法律关键字,本步骤S707中剩余法律关键字的内容与步骤S706中剩余法律关键字的内容一致,此处不再阐述。
S708、采用相似度匹配方式,对剩余法律关键字与剩余合同关键字进行匹配,得到剩余匹配结果。
具体地,因为在步骤S701和步骤S702中的匹配方式为文本匹配方式,也即在合同关键字的文字中查询法律关键字的文字是否存在,当在合同关键字的文字中查询不到法律关键字的文字时,但是剩余法律关键字与剩余合同关键字之间的语义可能相近,所以从相似度匹配上来讲,剩余法律关键字与剩余合同关键字有可能是匹配的,因此需要采用相似度匹配方式,对该剩余法律关键字的字符与该剩余合同关键字的字符进行匹配,得到剩余匹配结果,也即,计算该剩余法律关键字与该剩余合同关键字之间的相似度值,根据该相似度值和预设的剩余阈值,确定出该剩余匹配结果。
其中,该剩余匹配结果可以为该剩余法律关键字与该剩余合同关键字相匹配,或者为该剩余法律关键字与该剩余合同关键字不相匹配。
例如,假设该剩余法律关键字为“试用期”,该剩余合同关键字为“试用期限”,且采用余弦相似度计算方法,计算“试用期”与“试用期限”之间的相似度为0.8,预设的剩余阈值为0.6,显然0.8大于0.6,也即该相似度大于该剩余阈值,则剩余法律关键字“试用期”与剩余合同关键字“试用期限”相匹配。
S709、当剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配时,确定关键字匹配结果为合同关键字与法律关键字相匹配。
具体地,当该剩余匹配结果为该剩余法律关键字与该剩余合同关键字相匹配时,确定该关键字匹配结果为该合同关键字与该法律关键字相匹配。
S710、当数量比值小于预设的关键字占比阈值,或者剩余匹配结果为剩余法律关键字与剩余合同关键字不相匹配时,确定关键字匹配结果为合同关键字与法律关键字不相匹配。
具体地,当该数量比值小于该预设的关键字占比阈值,或者该剩余匹配结果为该剩余法律关键字与该剩余合同关键字不相匹配时,确定该关键字匹配结果为该合同关键字与该法律关键字不相匹配。
例如,继续以步骤S704中的例子进行说明,假设该预设的关键字占比阈值为显然小于则确定该关键字匹配结果为该合同关键字与该法律关键字不相匹配,或者该剩余匹配结果为该剩余法律关键字与该剩余合同关键字不相匹配时,确定该关键字匹配结果为该合同关键字与该法律关键字不相匹配。
在图3对应的实施例中,通过上述步骤S701至步骤S710,当在合同关键字中查询到每个法律关键字的字符时,也即,当每个法律关键字在合同关键字中都存在时,确定关键字匹配结果为合同关键字与法律关键字相匹配,当在合同关键字中未查询到每个法律关键字的字符,且在合同关键字中查询到的法律关键字的关键字数量与法律关键字的关键字总数量之间的数量比值大于或等于预设的关键字占比阈值时,也即,当有部分法律关键字在合同关键字中不存在,且在合同关键字中存在的法律关键字在法律关键字的总数量中的占比大于预设的占比阈值时,统计在合同关键字中除已查询关键字之外的关键字的剩余合同关键字数量,当剩余合同关键字数量等于零时,也即,代表该剩余合同关键字数量不存在,所以剩余法律关键字肯定与剩余合同关键字不相匹配,因此可以直接确定关键字匹配结果为合同关键字与法律关键字不相匹配,当剩余合同关键字数量大于零,且剩余法律关键字与剩余合同关键字相匹配时,确定关键字匹配结果为合同关键字与法律关键字相匹配,当数量比值小于预设的关键字占比阈值,或者剩余匹配结果为剩余法律关键字与剩余合同关键字不相匹配时,确定关键字匹配结果为合同关键字与法律关键字不相匹配,首先根据法律关键字满足不同的条件,灵活地执行对应的不同的分支步骤,因为省去了执行不必要的步骤,所以可以加快确定出关键字匹配结果的速度,同时根据在合同关键字中存在的法律关键字在法律关键字的总数量中的占比满足不同的条件,灵活地执行对应的不同的处理步骤,加快了确定剩余匹配结果的速度,进一步提高了确定出关键字匹配结果的效率和灵活性。
在一具体实施例中,如图4所示,步骤S708,即,采用相似度匹配方式,对剩余法律关键字与剩余合同关键字进行匹配,得到剩余匹配结果,具体包括如下步骤:
S7081、计算每个剩余法律关键字与每个剩余合同关键字的相似度值,得到每个剩余法律关键字对应的N个剩余相似度值,其中,N为剩余合同关键字的数量。
具体地,计算每个剩余法律关键字与每个剩余合同关键字的余弦相似度值,得到每个剩余法律关键字对应的N个剩余相似度值,其中,N为剩余合同关键字的数量,该剩余相似度值为该剩余法律关键字对应的余弦相似度值。
例如,假设剩余法律关键字为“不得”和“超过”,剩余合同关键字为“不能”、“超出”和“约定”,则计算“不得”与“不能”、“超出”和“约定”的余弦相似度值,和计算“超过”与“不能”、“超出”和“约定”的余弦相似度值。
S7082、针对每个剩余法律关键字,当在该剩余法律关键字对应的N个剩余相似度值中,存在至少一个剩余相似度值大于或等于预设的剩余阈值时,确定该剩余法律关键字与剩余合同关键字相匹配。
具体地,针对每个剩余法律关键字,当在该剩余法律关键字对应的N个剩余相似度值中,存在至少一个剩余相似度值大于或等于预设的剩余阈值时,确定该剩余法律关键字与剩余合同关键字相匹配。
例如,继续以步骤S7081中的例子进行说明,假设“不得”与“不能”的剩余相似度值为0.8、“不得”与“超出”的剩余相似度值为0.3,“不得”与“约定”的剩余相似度值为0.4,预设的剩余阈值为0.7,显然0.8大于0.7,0.3和0.4小于0.7,则确定该剩余法律关键字与剩余合同关键字相匹配。
S7083、当每个剩余法律关键字均与剩余合同关键字相匹配时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配。
具体地,当每个剩余法律关键字均与剩余合同关键字相匹配时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配。
例如,继续以步骤S7081中的例子进行说明,假设剩余法律关键字“不得”和“超过”与剩余合同关键字“不能”、“超出”和“约定”相匹配,则确定剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配。
S7084、当存在至少一个剩余法律关键字与剩余合同关键字不相匹配时,统计与剩余合同关键字相匹配的剩余法律关键字的匹配数量。
具体地,当存在至少一个剩余法律关键字与该剩余合同关键字不相匹配时,统计与该剩余合同关键字相匹配的剩余法律关键字的匹配数量,其中,该匹配数量为与该剩余合同关键字相匹配的剩余法律关键字的数量。
S7085、当匹配数量与剩余法律关键字的法律总数量之间的比值大于或等于预设的匹配占比阈值时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配。
具体地,服务端首先统计该剩余法律关键字的法律总数量,然后计算该匹配数量与剩余法律关键字的法律总数量之间的比值,当该比值大于或等于预设的匹配占比阈值时,确定该剩余匹配结果为该剩余法律关键字与该剩余合同关键字相匹配,其中,该法律总数量为总共的剩余法律关键字的数量。
例如,假设剩余法律关键字为“不得”和“超过”,剩余合同关键字为“超出”和“约定”,“不得”与“超出”和“约定”不相匹配,该预设的匹配占比阈值为“超过”与“超出”相匹配,则经过统计“超过”的匹配数量为1,“不得”和“超过”的法律总数量为2,计算得到该匹配数量与该法律总数量之间的比值为显然该比值与该预设的匹配占比阈值相等,则确定该剩余匹配结果为该剩余法律关键字与该剩余合同关键字相匹配。
S7086、当匹配数量与剩余法律关键字的法律总数量之间的比值小于预设的匹配占比阈值时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字不相匹配。
具体地,当该匹配数量与该剩余法律关键字的法律总数量之间的比值小于预设的匹配占比阈值时,确定该剩余匹配结果为该剩余法律关键字与该剩余合同关键字不相匹配。
例如,继续以步骤S7085中的例子进行说明,假设预设的匹配占比阈值为显然小于则确定该剩余匹配结果为该剩余法律关键字与该剩余合同关键字不相匹配。
在图4对应的实施例中,通过上述步骤S7081至步骤S7086,计算每个剩余法律关键字与每个剩余合同关键字的相似度值,得到每个剩余法律关键字对应的N个剩余相似度值,同时,该余弦相似度方法反应了两个数据的凝聚力,也即,该余弦相似度方法能够准确地计算两个数据的相似度,因此保证了剩余相似度值的准确性,针对每个剩余法律关键字,当在每个剩余法律关键字对应的剩余相似度值均大于或等于预设的剩余阈值时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配,当存在至少一个剩余法律关键字与剩余合同关键字不相匹配,与剩余合同关键字相匹配的剩余法律关键字在剩余法律关键字的法律总数量中的占比大于或等于预设的匹配占比阈值时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配,当匹配数量与剩余法律关键字的法律总数量之间的比值小于预设的匹配占比阈值时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字不相匹配。也即,根据剩余法律关键字的不同的数量,执行不同的处理步骤,省去多余的执行步骤,加快了确定出剩余匹配结果的速度,从而提高了确定出剩余匹配结果的效率。
在一具体实施例中,如图5所示,步骤S90,即,根据法律条款对合同条款进行修正,得到修正后的合同条款,具体包括如下步骤:
S901、采用法律关键字对应的法律条款,对与法律关键字不相匹配的合同关键字对应的合同条款进行替换,得到替换后的合同条款作为修正后的合同条款。
具体地,服务端首先选定与该法律关键字不相匹配的合同关键字对应的合同条款,然后将采用该法律关键字对应的法律条款,对已选定的合同条款进行替换,得到替换后的合同条款作为修正后的合同条款。
例如,假设该法律关键字为“每日工作时间”、“八小时”和“四十四小时”,“每日工作时间”、“八小时”和“四十四小时”对应的法律条款为“国家实行劳动者每日工作时间不超过八小时、平均每周工作时间不超过四十四小时的工时制度。”,该合同关键字为“每日工作时间”、“12小时”和“80小时”,“每日工作时间”、“12小时”和“80小时”对应的合同条款为“甲方安排乙方每日工作时间不超过12小时,平均每周不超过80小时。”,“每日工作时间”、“12小时”和“80小时”与“每日工作时间”、“八小时”和“四十四小时”不相匹配,则首先选定“甲方安排乙方每日工作时间不超过12小时,平均每周不超过80小时。”,然后将“国家实行劳动者每日工作时间不超过八小时、平均每周工作时间不超过四十四小时的工时制度。”替换已选定的“甲方安排乙方每日工作时间不超过12小时,平均每周不超过80小时。”。
S902、对与法律关键字相匹配的合同关键字对应的合同条款保持不变,得到保持后的合同条款作为修正后的合同条款。
具体地,服务器首先采用预设的保护机制对与法律关键字相匹配的合同关键字对应的合同条款进行保护,也即,该合同条款处于只读状态,以防止被篡改,得到保护后的合同条款,然后将该保护后的合同条款确定为修正后的合同条款,加强了条款的安全性。其中,该预设的保护机制可以为加密机制等。
例如,继续以步骤S701中的例子进行说明,假设合同关键字“试用期”、“不得”、“超过”、“六个月”和“约定”对应的合同条款为“甲方与乙方约定试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超过六个月。”,则服务器首先采用加密机制对“甲方与乙方约定试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超过六个月。”进行保护,也即,“甲方与乙方约定试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超过六个月。”处于只读状态,以防止被篡改,得到保护后的“甲方与乙方约定试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超过六个月。”,然后将保护后的“甲方与乙方约定试用期为2018年5月1日至2018年10月31日,试用期包括在合同期限内,试用期不得超过六个月。”确定为修正后的合同条款。
在图5对应的实施例中,通过上述步骤S901和步骤S902,当该法律关键字与该合同关键字不相匹配时,采用法律关键字对应的法律条款,对与法律关键字不相匹配的合同关键字对应的合同条款进行自动快速地替换,得到替换后的合同条款作为修正后的合同条款,当该法律关键字与该合同关键字相匹配时,对与法律关键字相匹配的合同关键字对应的合同条款进行保持不变,便得到保持后的合同条款作为修正后的合同条款,无需执行多余的操作,提高了修正合同条款的效率。
在一具体实施例中,如图6所示,步骤S60,即,采用预设的自然语言处理算法,对法律条款进行关键字提取,得到法律关键字,具体包括如下步骤:
S601、采用预设的分词工具对法律条款进行分词处理,得到每个子法律条款。
在本实施例中,分词为将连续的字序列按照一定的规范重新组合成词序列的过程。
具体地,通常该法律条款为一段话或一句话,为了得到子法律条款,需要采用预设的分词工具对该法律条款进行分词处理,得到简介化的每个子法律条款,也即得到每个单独的词。
例如,假设该法律条款为“劳动合同可以约定试用期。试用期最长不得超过六个月。”,则采用中科院汉语分词系统对“劳动合同可以约定试用期。试用期最长不得超过六个月。”进行分词处理,得到“劳动合同”、“可以”、“的”、“约定”、“试用期”、“最长”、“不得”、“超过”和“六个月”。
需要说明的是,预设的分词工具的具体内容,可以根据实际应用进行设定,此处不做限制。
S602、采用预设的停用词去除工具对每个子法律条款进行去除停用词,得到去除停用词后的每个子法律条款。
在本实施例中,停用词为在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据之前或之后会自动过滤掉某些字或词,如“的”、“是”和“在”。
具体地,服务端采用预设的停用词去除工具对每个子法律条款进行去除停用词,得到去除停用词后的每个子法律条款。
例如,继续以步骤S601中的例子进行说明,假设该预设的停用词去除工具为Nltk去除停用词工具,则服务端采用Nltk去除停用词工具对“劳动合同”、“可以”、“的”、“约定”、“试用期”、“最长”、“不得”、“超过”和“六个月”进行去除停用词,得到“劳动合同”、“约定”、“试用期”、“最长”、“不得”、“超过”和“六个月”。
需要说明的是,预设的停用词去除工具的具体内容,可以根据实际应用进行设定,此处不做限制。
S603、在预设的语料数据库中,获取去除停用词后的每个子法律条款对应的词频。
在本实施例中,预设的语料数据库存储了各个子法律条款,处于随时可以调用的状态。
具体地,在该预设的语料数据库中获取去除停用词后的每个子法律条款对应的词频的存储路径,然后根据该存储路径提取该词频。其中,该词频是指该子法律条款在该语料数据库中出现的次数,比如,继续以步骤S602中的例子进行说明,“试用期”的词频为0.6。
需要说明的是,需要说明的是,该子法律条款对应的词频越大,代表该子法律条款在该语料数据库中出现的次数越高,反之,该子法律条款对应的词频越低,代表该子法律条款在该语料数据库中出现的次数越低。
S604、在预设的语料数据库中,获取去除停用词后的每个子法律条款对应的逆文档频率。
在本实施例中,该预设的语料数据库存储了各个预设的文件,处于随时可以调用的状态。
具体地,针对每个子法律条款,在该预设的语料数据库中,先获取包含该法律条款之文件的文件数目,然后获取文件的总数目,最后将该总数目除以该文件数目,再将得到的商取对数,从而得到该法律条款对应的逆文档频率,比如,继续以步骤S502中的例子进行说明,假设“试用期”一词在1000份文件出现过,而文件的总数目是10000000份的话,经过计算其逆向文件频率为9.21。其中,该逆文档频率是指该子法律条款的普遍重要性的度量。
需要说明的是,该子法律条款对应的逆文档频率越大,代表该子法律条款的普遍重要性越高,反之该子法律条款对应的逆文档频率越低,代表该子法律条款的普遍重要性越低。
S605、针对去除停用词后的每个子法律条款,将词频与逆文档频率的乘积确定为该子法律条款对应的重要值,其中,重要值为去除后的每个子法律条款在法律条款中的重要程度对应的值。
具体地,针对去除停用词后的每个子法律条款,将词频与逆文档频率的乘积确定为该子法律条款对应的重要值,其中,重要值为去除后的每个子法律条款在法律条款中的重要程度对应的值。
例如,继续以步骤S603和步骤S604中的例子进行说明,“试用期”的词频为0.6,“试用期”的逆向文件频率为9.21,经过计算0.6与9.21的乘积为5.526,则将5.526确定为“试用期”的重要值。
S606、判断每个重要值是否大于或等于预设的条款阈值。
具体地,判断每个子法律条款对应的重要值是否大于或等于预设的条款阈值。例如,假设子法律条款分别“试用期”和“劳动合同”,“试用期”对应的重要值为6.5,“劳动合同”对应的重要值为4,预设的条款阈值为5.5,显然“试用期”对应的重要值大于预设的条款阈值。
S607、当重要值大于或等于预设的条款阈值时,确定大于或等于预设的条款阈值的重要值对应的子法律条款为法律关键字。
具体地,当该重要值大于或等于该预设的条款阈值时,确定大于或等于该预设的条款阈值的重要值对应的子法律条款为法律关键字,其中,本步骤S607中法律关键字的内容与步骤S60中法律关键字的内容一致,此处不再阐述。。
例如,继续以步骤S606中的例子进行说明,“试用期”对应的重要值大于预设的条款阈值,则确定“试用期”为法律关键字。
在图6对应的实施例中,通过上述步骤S601至步骤S607,先准确地将法律条款分成单独的子法律条款,然后对每个子法律条款进行去除停用词,得到去除干扰的停用词后的子法律条款,避免了存在干扰的子法律条款,接下来准确地计算每个子法律条款对应的词频,也即准确地计算每个子法律条款在该语料数据库中出现的次数,然后准确地计算每个子法律条款对应的逆文档频率,也即准确地计算每个子法律条款的普遍重要性,因为该子法律条款的次数越高,代表该子法律条款在该语料数据库中越重要,同时该子法律条款的普遍重要性越高,代表该子法律条款的普遍性越重要,因此根据词频和逆文档频率,可以准确地计算出每个子法律条款的重要值,提高了重要值的计算准确性,最后根据重要值和预设的条款阈值,自动地确定该子法律条款是否为法律关键字,提高了确定出法律关键字的准确率和自动化水平。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种合同自动生成装置,该合同自动生成装置与上述实施例中合同自动生成方法一一对应。如图7所示,该合同自动生成装置包括请求接收模块701、合同条款获取模块702、类别获取模块703、法律条款获取模块704、合同关键字提取模块705、法律关键字提取模块706、关键字匹配模块707、审核结果确定模块708和条款修正模块709。各功能模块详细说明如下:
请求接收模块701,用于若接收到请求方在客户端针对目标合同发起的审核请求,则向客户端发送合同填写指令;
合同条款获取模块702,用于获取请求方通过合同填写指令上传的目标合同的待审核的合同条款;
类别获取模块703,用于获取目标合同的预先已确定的合同类别;
法律条款获取模块704,用于从预设的法律条款数据库中,获取合同类别对应的目标法律的法律条款;
合同关键字提取模块705,用于采用预设的自然语言处理算法,对合同条款进行关键字提取,得到合同条款对应的合同关键字;
法律关键字提取模块706,用于采用预设的自然语言处理算法,对法律条款进行关键字提取,得到法律条款对应的法律关键字;
关键字匹配模块707,用于采用预设的匹配方式,对合同关键字与法律关键字进行匹配,得到关键字匹配结果;
审核结果确定模块708,用于若关键字匹配结果为合同关键字与法律关键字相匹配,则确定目标合同审核通过,并将目标合同确定为制定好的合同;
条款修正模块709,用于若关键字匹配结果为合同关键字与法律关键字不相匹配,则确定目标合同审核未通过,并根据法律条款对合同条款进行修正,得到修正后的合同条款,并将由修正后的合同条款组合成的合同确定为制定好的合同。
进一步地,关键字匹配模块707包括:
关键字匹配结果确定子模块7071,用于当在合同关键字中查询到每个法律关键字的字符时,确定关键字匹配结果为合同关键字与法律关键字相匹配;
已查询关键字确定子模块7072,用于当在合同关键字中未查询到每个法律关键字的字符时,将在合同关键字中查询到的法律关键字确定为已查询关键字;
关键字数量统计子模块7073,用于统计已查询关键字的关键字数量;
剩余合同关键字确定子模块7074,用于当关键字数量与法律关键字的关键字总数量之间的数量比值大于或等于预设的关键字占比阈值时,将在合同关键字中除已查询关键字之外的关键字确定为剩余合同关键字;
剩余合同关键字数量统计子模块7075,用于统计剩余合同关键字的剩余合同关键字数量;
第一关键字不匹配结果确定子模块7076,用于当剩余合同关键字数量等于零时,确定关键字匹配结果为合同关键字与法律关键字不相匹配;
剩余法律关键字确定子模块7077,用于当剩余合同关键字数量大于零时,将在法律关键字中除已查询关键字之外的关键字确定为剩余法律关键字;
剩余关键字匹配子模块7078,用于采用相似度匹配方式,对剩余法律关键字与剩余合同关键字进行匹配,得到剩余匹配结果;
关键字相匹配结果确定子模块7079,用于当剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配时,确定关键字匹配结果为合同关键字与法律关键字相匹配;
第二关键字不匹配结果确定子模块70710,用于当数量比值小于预设的关键字占比阈值,或者剩余匹配结果为剩余法律关键字与剩余合同关键字不相匹配时,确定关键字匹配结果为合同关键字与法律关键字不相匹配。
进一步地,剩余关键字匹配子模块7078包括:
剩余相似度值计算子模块70781,用于计算每个剩余法律关键字与每个剩余合同关键字的相似度值,得到每个剩余法律关键字对应的N个剩余相似度值,其中,N为剩余合同关键字的数量;
法律关键字相匹配结果子模块70782,用于针对每个剩余法律关键字,当在该剩余法律关键字对应的N个剩余相似度值中,存在至少一个剩余相似度值大于或等于预设的剩余阈值时,确定该剩余法律关键字与剩余合同关键字相匹配;
第一剩余相匹配结果确定子模块70783,用于当每个剩余法律关键字均与剩余合同关键字相匹配时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配;
匹配数量统计子模块70784,用于当存在至少一个剩余法律关键字与剩余合同关键字不相匹配时,统计与剩余合同关键字相匹配的剩余法律关键字的匹配数量;
第一剩余相匹配结果确定子模块70785,用于当匹配数量与剩余法律关键字的法律总数量之间的比值大于或等于预设的匹配占比阈值时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字相匹配;
剩余不匹配结果确定子模块70786,用于当匹配数量与剩余法律关键字的法律总数量之间的比值小于预设的匹配占比阈值时,确定剩余匹配结果为剩余法律关键字与剩余合同关键字不相匹配。
进一步地,条款修正模块709包括:
替换子模块7091,用于采用法律关键字对应的法律条款,对与法律关键字不相匹配的合同关键字对应的合同条款进行替换,得到替换后的合同条款作为修正后的合同条款;
保持子模块7092,用于对与法律关键字相匹配的合同关键字对应的合同条款保持不变,得到保持后的合同条款作为修正后的合同条款。
进一步地,法律关键字提取模块706包括:
分词子模块7061,用于采用预设的分词工具对法律条款进行分词处理,得到每个子法律条款;
去除子模块7062,用于采用预设的停用词去除工具对每个子法律条款进行去除停用词,得到去除停用词后的每个子法律条款;
词频获取子模块7063,用于在预设的语料数据库中,获取去除停用词后的每个子法律条款对应的词频;
频率获取子模块7064,用于在预设的语料数据库中,获取去除停用词后的每个子法律条款对应的逆文档频率;
重要值确定子模块7065,用于针对去除停用词后的每个子法律条款,将词频与逆文档频率的乘积确定为该子法律条款对应的重要值,其中,重要值为去除后的每个子法律条款在法律条款中的重要程度对应的值;
判断子模块7066,用于判断每个重要值是否大于或等于预设的条款阈值;
法律关键字确定子模块7067,用于当重要值大于或等于预设的条款阈值时,确定大于或等于预设的条款阈值的重要值对应的子法律条款为法律关键字。
关于合同自动生成装置的具体限定可以参见上文中对于合同自动生成方法的限定,在此不再赘述。上述合同自动生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储合同自动生成方法所涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种合同自动生成方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例合同自动生成方法的步骤,例如图2所示的步骤S10至步骤S90。或者,处理器执行计算机程序时实现上述实施例中合同自动生成装置的各模块/单元的功能,例如图7所示模块701至模块709的功能。为避免重复,这里不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中合同自动生成方法,或者,该计算机程序被处理器执行时实现上述装置实施例中合同自动生成装置中各模块/单元的功能。为避免重复,这里不再赘述。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种合同自动生成方法,其特征在于,所述合同自动生成方法包括:
若接收到请求方在客户端针对目标合同发起的审核请求,则向所述客户端发送合同填写指令;
获取所述请求方通过所述合同填写指令上传的所述目标合同的待审核的合同条款;
获取所述目标合同的预先已确定的合同类别;
从预设的法律条款数据库中,获取所述合同类别对应的目标法律的法律条款;
采用预设的自然语言处理算法,对所述合同条款进行关键字提取,得到所述合同条款对应的合同关键字;
采用所述预设的自然语言处理算法,对所述法律条款进行关键字提取,得到所述法律条款对应的法律关键字;
采用预设的匹配方式,对所述合同关键字与所述法律关键字进行匹配,得到关键字匹配结果;
若所述关键字匹配结果为所述合同关键字与所述法律关键字相匹配,则确定所述目标合同审核通过,并将所述目标合同确定为制定好的合同;
若所述关键字匹配结果为所述合同关键字与所述法律关键字不相匹配,则确定所述目标合同审核未通过,并根据所述法律条款对所述合同条款进行修正,得到修正后的所述合同条款,并将由修正后的所述合同条款组合成的合同确定为所述制定好的合同。
2.如权利要求1所述的合同自动生成方法,其特征在于,所述采用预设的匹配方式,对所述合同关键字与所述法律关键字进行匹配,得到关键字匹配结果包括:
当在所述合同关键字中查询到每个所述法律关键字的字符时,确定所述关键字匹配结果为所述合同关键字与所述法律关键字相匹配;
当在所述合同关键字中未查询到每个所述法律关键字的字符时,将在所述合同关键字中查询到的所述法律关键字确定为已查询关键字;
统计所述已查询关键字的关键字数量;
当所述关键字数量与所述法律关键字的关键字总数量之间的数量比值大于或等于预设的关键字占比阈值时,将在所述合同关键字中除所述已查询关键字之外的关键字确定为剩余合同关键字;
统计所述剩余合同关键字的剩余合同关键字数量;
当所述剩余合同关键字数量等于零时,确定所述关键字匹配结果为所述合同关键字与所述法律关键字不相匹配;
当所述剩余合同关键字数量大于零时,将在所述法律关键字中除所述已查询关键字之外的关键字确定为剩余法律关键字;
采用相似度匹配方式,对所述剩余法律关键字与所述剩余合同关键字进行匹配,得到剩余匹配结果;
当所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字相匹配时,确定所述关键字匹配结果为所述合同关键字与所述法律关键字相匹配;
当所述数量比值小于所述预设的关键字占比阈值,或者所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字不相匹配时,确定所述关键字匹配结果为所述合同关键字与所述法律关键字不相匹配。
3.如权利要求2所述的合同自动生成方法,其特征在于,所述采用相似度匹配方式,对所述剩余法律关键字与所述剩余合同关键字进行匹配,得到剩余匹配结果包括:
计算每个所述剩余法律关键字与每个所述剩余合同关键字的相似度值,得到每个所述剩余法律关键字对应的N个剩余相似度值,其中,N为所述剩余合同关键字的数量;
针对每个所述剩余法律关键字,当在该剩余法律关键字对应的N个剩余相似度值中,存在至少一个所述剩余相似度值大于或等于预设的剩余阈值时,确定该剩余法律关键字与所述剩余合同关键字相匹配;
当每个所述剩余法律关键字均与所述剩余合同关键字相匹配时,确定所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字相匹配;
当存在至少一个所述剩余法律关键字与所述剩余合同关键字不相匹配时,统计与所述剩余合同关键字相匹配的所述剩余法律关键字的匹配数量;
当所述匹配数量与所述剩余法律关键字的法律总数量之间的比值大于或等于预设的匹配占比阈值时,确定所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字相匹配;
当所述匹配数量与所述剩余法律关键字的法律总数量之间的比值小于所述预设的匹配占比阈值时,确定所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字不相匹配。
4.如权利要求1所述的合同自动生成方法,其特征在于,所述根据所述法律条款对所述合同条款进行修正,得到修正后的所述合同条款包括:
采用所述法律关键字对应的所述法律条款,对与所述法律关键字不相匹配的所述合同关键字对应的所述合同条款进行替换,得到替换后的所述合同条款作为所述修正后的所述合同条款;
对与所述法律关键字相匹配的所述合同关键字对应的所述合同条款保持不变,得到保持后的所述合同条款作为所述修正后的所述合同条款。
5.如权利要求1至4中任一项所述的合同自动生成方法,其特征在于,所述采用所述预设的自然语言处理算法,对所述法律条款进行关键字提取,得到法律关键字包括:
采用预设的分词工具对所述法律条款进行分词处理,得到每个子法律条款;
采用预设的停用词去除工具对每个所述子法律条款进行去除停用词,得到去除停用词后的每个所述子法律条款;
在预设的语料数据库中,获取所述去除停用词后的每个所述子法律条款对应的词频;
在所述预设的语料数据库中,获取所述去除停用词后的每个所述子法律条款对应的逆文档频率;
针对所述去除停用词后的每个所述子法律条款,将所述词频与所述逆文档频率的乘积确定为该子法律条款对应的所述重要值,其中,所述重要值为去除后的每个所述子法律条款在所述法律条款中的重要程度对应的值;
判断每个所述重要值是否大于或等于预设的条款阈值;
当所述重要值大于或等于所述预设的条款阈值时,确定大于或等于所述预设的条款阈值的所述重要值对应的所述子法律条款为所述法律关键字。
6.一种合同自动生成装置,其特征在于,所述合同自动生成装置包括:
请求接收模块,用于若接收到请求方在客户端针对目标合同发起的审核请求,则向所述客户端发送合同填写指令;
合同条款获取模块,用于获取所述请求方通过所述合同填写指令上传的所述目标合同的待审核的合同条款;
类别获取模块,用于获取所述目标合同的预先已确定的合同类别;
法律条款获取模块,用于从预设的法律条款数据库中,获取所述合同类别对应的目标法律的法律条款;
合同关键字提取模块,用于采用预设的自然语言处理算法,对所述合同条款进行关键字提取,得到所述合同条款对应的合同关键字;
法律关键字提取模块,用于采用所述预设的自然语言处理算法,对所述法律条款进行关键字提取,得到所述法律条款对应的法律关键字;
关键字匹配模块,用于采用预设的匹配方式,对所述合同关键字与所述法律关键字进行匹配,得到关键字匹配结果;
审核结果确定模块,用于若所述关键字匹配结果为所述合同关键字与所述法律关键字相匹配,则确定所述目标合同审核通过,并将所述目标合同确定为制定好的合同;
条款修正模块,用于若所述关键字匹配结果为所述合同关键字与所述法律关键字不相匹配,则确定所述目标合同审核未通过,并根据所述法律条款对所述合同条款进行修正,得到修正后的所述合同条款,并将由修正后的所述合同条款组合成的合同确定为所述制定好的合同。
7.如权利要求6所述的合同自动生成装置,其特征在于,所述关键字匹配模块包括:
关键字匹配结果确定子模块,用于当在所述合同关键字中查询到每个所述法律关键字的字符时,确定所述关键字匹配结果为所述合同关键字与所述法律关键字相匹配;
已查询关键字确定子模块,用于当在所述合同关键字中未查询到每个所述法律关键字的字符时,将在所述合同关键字中查询到的所述法律关键字确定为已查询关键字;
关键字数量统计子模块,用于统计所述已查询关键字的关键字数量;
剩余合同关键字确定子模块,用于当所述关键字数量与所述法律关键字的关键字总数量之间的数量比值大于或等于预设的关键字占比阈值时,将在所述合同关键字中除所述已查询关键字之外的关键字确定为剩余合同关键字;
剩余合同关键字数量统计子模块,用于统计所述剩余合同关键字的剩余合同关键字数量;
第一关键字不匹配结果确定子模块,用于当所述剩余合同关键字数量等于零时,确定所述关键字匹配结果为所述合同关键字与所述法律关键字不相匹配;
剩余法律关键字确定子模块,用于当所述剩余合同关键字数量大于零时,将在所述法律关键字中除所述已查询关键字之外的关键字确定为剩余法律关键字;
剩余关键字匹配子模块,用于采用相似度匹配方式,对所述剩余法律关键字与所述剩余合同关键字进行匹配,得到剩余匹配结果;
关键字相匹配结果确定子模块,用于当所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字相匹配时,确定所述关键字匹配结果为所述合同关键字与所述法律关键字相匹配;
第二关键字不匹配结果确定子模块,用于当所述数量比值小于所述预设的关键字占比阈值,或者所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字不相匹配时,确定所述关键字匹配结果为所述合同关键字与所述法律关键字不相匹配。
8.如权利要求6至7中任一项所述的合同自动生成装置,其特征在于,所述剩余关键字匹配子模块包括:
剩余相似度值计算子模块,用于计算每个所述剩余法律关键字与每个所述剩余合同关键字的相似度值,得到每个所述剩余法律关键字对应的N个剩余相似度值,其中,N为所述剩余合同关键字的数量;
法律关键字相匹配结果子模块,用于针对每个所述剩余法律关键字,当在该剩余法律关键字对应的N个剩余相似度值中,存在至少一个所述剩余相似度值大于或等于预设的剩余阈值时,确定该剩余法律关键字与所述剩余合同关键字相匹配;
第一剩余相匹配结果确定子模块,用于当每个所述剩余法律关键字均与所述剩余合同关键字相匹配时,确定所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字相匹配;
匹配数量统计子模块,用于当存在至少一个所述剩余法律关键字与所述剩余合同关键字不相匹配时,统计与所述剩余合同关键字相匹配的所述剩余法律关键字的匹配数量;
第一剩余相匹配结果确定子模块,用于当所述匹配数量与所述剩余法律关键字的法律总数量之间的比值大于或等于预设的匹配占比阈值时,确定所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字相匹配;
剩余不匹配结果确定子模块,用于当所述匹配数量与所述剩余法律关键字的法律总数量之间的比值小于所述预设的匹配占比阈值时,确定所述剩余匹配结果为所述剩余法律关键字与所述剩余合同关键字不相匹配。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的合同自动生成方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的合同自动生成方法。
CN201910302069.2A 2019-04-16 2019-04-16 合同自动生成方法、装置、计算机设备及存储介质 Pending CN110119440A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910302069.2A CN110119440A (zh) 2019-04-16 2019-04-16 合同自动生成方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910302069.2A CN110119440A (zh) 2019-04-16 2019-04-16 合同自动生成方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN110119440A true CN110119440A (zh) 2019-08-13

Family

ID=67521001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910302069.2A Pending CN110119440A (zh) 2019-04-16 2019-04-16 合同自动生成方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110119440A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705955A (zh) * 2019-08-22 2020-01-17 阿里巴巴集团控股有限公司 合同检测方法以及装置
CN111178718A (zh) * 2019-12-19 2020-05-19 海南大学 公平竞争审查方法、服务器、系统及存储介质
CN111932412A (zh) * 2020-09-04 2020-11-13 汪宏杰 合同起草及修订方法、装置、存储介质及设备
CN116644728A (zh) * 2023-05-09 2023-08-25 三峡高科信息技术有限责任公司 一种基于条款数字化的合同生成方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229896A1 (en) * 2005-04-11 2006-10-12 Howard Rosen Match-based employment system and method
US8447758B1 (en) * 2010-02-03 2013-05-21 Metajure, Inc. System and method for identifying documents matching a document metaprint
CN109447105A (zh) * 2018-09-10 2019-03-08 平安科技(深圳)有限公司 合同审核方法、装置、计算机设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229896A1 (en) * 2005-04-11 2006-10-12 Howard Rosen Match-based employment system and method
US8447758B1 (en) * 2010-02-03 2013-05-21 Metajure, Inc. System and method for identifying documents matching a document metaprint
CN109447105A (zh) * 2018-09-10 2019-03-08 平安科技(深圳)有限公司 合同审核方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
天明;: "不符合法律规定的条款即使约定了也属无效", 当代矿工, no. 01, 22 January 2009 (2009-01-22) *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705955A (zh) * 2019-08-22 2020-01-17 阿里巴巴集团控股有限公司 合同检测方法以及装置
CN110705955B (zh) * 2019-08-22 2023-03-07 创新先进技术有限公司 合同检测方法以及装置
CN111178718A (zh) * 2019-12-19 2020-05-19 海南大学 公平竞争审查方法、服务器、系统及存储介质
CN111932412A (zh) * 2020-09-04 2020-11-13 汪宏杰 合同起草及修订方法、装置、存储介质及设备
CN116644728A (zh) * 2023-05-09 2023-08-25 三峡高科信息技术有限责任公司 一种基于条款数字化的合同生成方法及系统
CN116644728B (zh) * 2023-05-09 2023-11-03 三峡高科信息技术有限责任公司 一种基于条款数字化的合同生成方法及系统

Similar Documents

Publication Publication Date Title
CN110119440A (zh) 合同自动生成方法、装置、计算机设备及存储介质
CN110765770A (zh) 一种合同自动生成方法及装置
CN109447105A (zh) 合同审核方法、装置、计算机设备和存储介质
WO2021114810A1 (zh) 基于图结构的公文推荐方法、装置、计算机设备及介质
CN109740143A (zh) 基于机器学习的句子距离映射方法、装置和计算机设备
WO2020119419A1 (zh) 基于图像识别的测试方法、装置、计算机设备及存储介质
WO2021043076A1 (zh) 网络发布数据处理方法、装置、计算机设备和存储介质
CN108960058B (zh) 发票校验方法、装置、计算机设备及存储介质
CN110362542B (zh) 核电站文件编码方法、装置、计算机设备和存储介质
JP2015505629A (ja) 情報検索を行う方法及びサーバ
CN110471694A (zh) 注释信息处理方法、装置、计算机设备及存储介质
CN116663525B (zh) 一种文档审核方法、装置、设备及存储介质
CN110008309A (zh) 一种短语挖掘方法及装置
CN110362798A (zh) 裁决信息检索分析方法、装置、计算机设备和存储介质
CN108182633A (zh) 贷款数据处理方法、装置、计算机设备和存储介质
CN109508964A (zh) 项目建立方法、装置、计算机设备和存储介质
CN108959507A (zh) 合同审阅方法及设备、计算机可读存储介质
CN109740129A (zh) 基于区块链的报表生成方法、装置、设备及可读存储介质
CN109325868A (zh) 问卷数据处理方法、装置、计算机设备和存储介质
CN109325042A (zh) 处理模版获取方法、表格处理方法、装置、设备及介质
CN110956031A (zh) 文本相似度匹配的方法、装置及系统
CN110134846A (zh) 文本的专有名词处理方法、装置和计算机设备
CN110377618A (zh) 裁决结果分析方法、装置、计算机设备和存储介质
CN110532359A (zh) 法律条文查询方法、装置、计算机设备和存储介质
CN106919587A (zh) 应用程序搜索系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination