CN113312455A - 一种基于知识蒸馏的合同智能审核方法及装置 - Google Patents

一种基于知识蒸馏的合同智能审核方法及装置 Download PDF

Info

Publication number
CN113312455A
CN113312455A CN202110695446.0A CN202110695446A CN113312455A CN 113312455 A CN113312455 A CN 113312455A CN 202110695446 A CN202110695446 A CN 202110695446A CN 113312455 A CN113312455 A CN 113312455A
Authority
CN
China
Prior art keywords
auditing
data
audit
audited
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110695446.0A
Other languages
English (en)
Inventor
高强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dingtai Zhiyuan Technology Co ltd
Original Assignee
Beijing Dingtai Zhiyuan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dingtai Zhiyuan Technology Co ltd filed Critical Beijing Dingtai Zhiyuan Technology Co ltd
Priority to CN202110695446.0A priority Critical patent/CN113312455A/zh
Publication of CN113312455A publication Critical patent/CN113312455A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于知识蒸馏的合同智能审核方法及装置。其中,该方法包括:获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出。本发明解决了现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。

Description

一种基于知识蒸馏的合同智能审核方法及装置
技术领域
本发明涉及数据智能审核领域,具体而言,涉及一种基于知识蒸馏的合同智能审核方法及装置。
背景技术
随着智能化的不断发展,在当今的社会中人们利用智能化手段增加了学习、工作、生活的质量和效率,通过智能化手段可以给人们带来不同于传统处理方法的技术效果。
目前,在进行合同文本等文本数据审核的时候,通常利用合同文本中的数据与预设的规则结构数据进行审核和比对,并根据预设的规则得到比对审核结果,从而达到审查合同文本数据的目的,但是传统的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于知识蒸馏的合同智能审核方法及装置,以至少解决现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。
根据本发明实施例的一个方面,提供了一种基于知识蒸馏的合同智能审核方法,包括:获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出。
可选的,在所述获取目标审核参数之前,所述方法还包括:根据所述合同文本的类型,选择所述目标审核参数。
可选的,在所述将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:训练所述审核模型。
可选的,所述训练所述审核模型包括:将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。
根据本发明实施例的另一方面,还提供了一种基于知识蒸馏的合同智能审核装置,包括:获取模块,用于获取目标审核参数;识别模块,用于根据所述目标审核参数,识别合同文本中的待审核数据;审核模块,用于将所述待审核数据输入至审核模型中,生成审核结果;输出模块,用于将所述审核结果输出。
可选的,所述装置还包括:选择模块,用于根据所述合同文本的类型,选择所述目标审核参数。
可选的,所述装置还包括:训练模块,用于训练所述审核模型。
可选的,所述训练模块包括:训练单元,用于将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。
根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行一种基于知识蒸馏的合同智能审核方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行一种基于知识蒸馏的合同智能审核方法。
在本发明实施例中,采用获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出的方式,解决了现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种基于知识蒸馏的合同智能审核方法的流程图;
图2是根据本发明实施例的一种基于知识蒸馏的合同智能审核装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了根据本发明实施例的一种基于知识蒸馏的合同智能审核方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一
图1是根据本发明实施例的一种基于知识蒸馏的合同智能审核方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取目标审核参数。
具体的,本发明实施例为了实现基于知识蒸馏的合同审核过程,首先需要获取目标审核参数,目标审核参数用于识别合同文本中的待审核数据,用于提取合同文本中的需要进行审核的内容,因此目标审核参数可以是用户预先根据不同合同文本定制的参数标准矩阵。
可选的,在所述获取目标审核参数之前,所述方法还包括:根据所述合同文本的类型,选择所述目标审核参数。
具体的,为了根据不同合同文本选择合适的目标审核参数,在所述获取目标审核参数之前,所述方法还包括:根据所述合同文本的类型,选择所述目标审核参数。
步骤S104,根据所述目标审核参数,识别合同文本中的待审核数据。
具体的,为了识别合同文本中的待审核数据,需要根据上述目标审核参数,来对合同文本中的语句进行识别,并将识别之后的数据内容作为待审核数据进行存储,并发送至以后需审核模型中进行分析和处理。
步骤S106,将所述待审核数据输入至审核模型中,生成审核结果。
具体的,待审核数据的输入需要根据审核模型的建立来实现,审核模型可以是根据知识蒸馏的算法和理论构建的,知识蒸馏的目的是将一个高精度且笨重的teacher转换为一个更加紧凑的student。具体思路是:提高teacher模型softmax层的temperature参数获得一个合适的soft target集合,然后对要训练的student模型,使用同样的temperature参数值匹配teacher模型的soft target集合,作为student模型总目标函数的一部分,以诱导student模型的训练,实现知识的迁移。
可选的,在所述将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:训练所述审核模型。
可选的,所述训练所述审核模型包括:将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。
具体的,为了将审核模型进行完善和成熟,在将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:训练所述审核模型。训练审核模型需要大量的历史数据,因此需要将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。
步骤S108,将所述审核结果输出。
具体的,当本发明实施例得到审核结果之后,需要将审核结果进行输出,其中,审核结果的输出可以是展示审核结果以便让用户可以针对合同文本的审核结果进行分析和利用。
通过上述实施例,解决了现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。
实施例二
图2是根据本发明实施例的一种基于知识蒸馏的合同智能审核装置的结构框图,如图2所示,该装置包括:
获取模块20,用于获取目标审核参数。
具体的,本发明实施例为了实现基于知识蒸馏的合同审核过程,首先需要获取目标审核参数,目标审核参数用于识别合同文本中的待审核数据,用于提取合同文本中的需要进行审核的内容,因此目标审核参数可以是用户预先根据不同合同文本定制的参数标准矩阵。
可选的,所述装置还包括:选择模块,用于根据所述合同文本的类型,选择所述目标审核参数。
具体的,为了根据不同合同文本选择合适的目标审核参数,在所述获取目标审核参数之前,所述方法还包括:根据所述合同文本的类型,选择所述目标审核参数。
识别模块22,用于根据所述目标审核参数,识别合同文本中的待审核数据。
具体的,为了识别合同文本中的待审核数据,需要根据上述目标审核参数,来对合同文本中的语句进行识别,并将识别之后的数据内容作为待审核数据进行存储,并发送至以后需审核模型中进行分析和处理。
审核模块24,用于将所述待审核数据输入至审核模型中,生成审核结果。
具体的,待审核数据的输入需要根据审核模型的建立来实现,审核模型可以是根据知识蒸馏的算法和理论构建的,知识蒸馏的目的是将一个高精度且笨重的teacher转换为一个更加紧凑的student。具体思路是:提高teacher模型softmax层的temperature参数获得一个合适的soft target集合,然后对要训练的student模型,使用同样的temperature参数值匹配teacher模型的soft target集合,作为student模型总目标函数的一部分,以诱导student模型的训练,实现知识的迁移。
可选的,所述装置还包括:训练模块,用于训练所述审核模型。
可选的,所述训练模块包括:训练单元,用于将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。
具体的,为了将审核模型进行完善和成熟,在将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:训练所述审核模型。训练审核模型需要大量的历史数据,因此需要将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。
输出模块26,用于将所述审核结果输出。
具体的,当本发明实施例得到审核结果之后,需要将审核结果进行输出,其中,审核结果的输出可以是展示审核结果以便让用户可以针对合同文本的审核结果进行分析和利用。
根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行一种基于知识蒸馏的合同智能审核方法。
具体的,上述方法包括:获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出。
根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行一种基于知识蒸馏的合同智能审核方法。
具体的,上述方法包括:获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出。
通过上述实施例,解决了现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于知识蒸馏的合同智能审核方法,其特征在于,包括:
获取目标审核参数;
根据所述目标审核参数,识别合同文本中的待审核数据;
将所述待审核数据输入至审核模型中,生成审核结果;
将所述审核结果输出。
2.根据权利要求1所述的方法,其特征在于,在所述获取目标审核参数之前,所述方法还包括:
根据所述合同文本的类型,选择所述目标审核参数。
3.根据权利要求1所述的方法,其特征在于,在所述将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:
训练所述审核模型。
4.根据权利要求3所述的方法,其特征在于,所述训练所述审核模型包括:
将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。
5.一种基于知识蒸馏的合同智能审核装置,其特征在于,包括:
获取模块,用于获取目标审核参数;
识别模块,用于根据所述目标审核参数,识别合同文本中的待审核数据;
审核模块,用于将所述待审核数据输入至审核模型中,生成审核结果;
输出模块,用于将所述审核结果输出。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
选择模块,用于根据所述合同文本的类型,选择所述目标审核参数。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
训练模块,用于训练所述审核模型。
8.根据权利要求7所述的装置,其特征在于,所述训练模块包括:
训练单元,用于将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行权利要求1至4中任意一项所述的方法。
10.一种电子装置,其特征在于,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行权利要求1至4中任意一项所述的方法。
CN202110695446.0A 2021-06-23 2021-06-23 一种基于知识蒸馏的合同智能审核方法及装置 Pending CN113312455A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110695446.0A CN113312455A (zh) 2021-06-23 2021-06-23 一种基于知识蒸馏的合同智能审核方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110695446.0A CN113312455A (zh) 2021-06-23 2021-06-23 一种基于知识蒸馏的合同智能审核方法及装置

Publications (1)

Publication Number Publication Date
CN113312455A true CN113312455A (zh) 2021-08-27

Family

ID=77379801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110695446.0A Pending CN113312455A (zh) 2021-06-23 2021-06-23 一种基于知识蒸馏的合同智能审核方法及装置

Country Status (1)

Country Link
CN (1) CN113312455A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766430A (zh) * 2018-12-17 2019-05-17 深圳壹账通智能科技有限公司 合同审核方法、装置、计算机设备和存储介质
CN110705952A (zh) * 2019-08-15 2020-01-17 平安信托有限责任公司 一种合同审核方法及装置
CN110795939A (zh) * 2019-10-15 2020-02-14 腾讯科技(深圳)有限公司 文本处理方法、装置
CN111506702A (zh) * 2020-03-25 2020-08-07 北京万里红科技股份有限公司 基于知识蒸馏的语言模型训练方法、文本分类方法及装置
CN112101573A (zh) * 2020-11-16 2020-12-18 智者四海(北京)技术有限公司 一种模型蒸馏学习方法、文本查询方法及装置
CN112183670A (zh) * 2020-11-05 2021-01-05 南开大学 一种基于知识蒸馏的少样本虚假新闻检测方法
CN112487182A (zh) * 2019-09-12 2021-03-12 华为技术有限公司 文本处理模型的训练方法、文本处理方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766430A (zh) * 2018-12-17 2019-05-17 深圳壹账通智能科技有限公司 合同审核方法、装置、计算机设备和存储介质
CN110705952A (zh) * 2019-08-15 2020-01-17 平安信托有限责任公司 一种合同审核方法及装置
CN112487182A (zh) * 2019-09-12 2021-03-12 华为技术有限公司 文本处理模型的训练方法、文本处理方法及装置
CN110795939A (zh) * 2019-10-15 2020-02-14 腾讯科技(深圳)有限公司 文本处理方法、装置
CN111506702A (zh) * 2020-03-25 2020-08-07 北京万里红科技股份有限公司 基于知识蒸馏的语言模型训练方法、文本分类方法及装置
CN112183670A (zh) * 2020-11-05 2021-01-05 南开大学 一种基于知识蒸馏的少样本虚假新闻检测方法
CN112101573A (zh) * 2020-11-16 2020-12-18 智者四海(北京)技术有限公司 一种模型蒸馏学习方法、文本查询方法及装置

Similar Documents

Publication Publication Date Title
CN107220845B (zh) 用户复购概率预测/用户质量确定方法、装置及电子设备
CN112346567B (zh) 基于ai的虚拟交互模型生成方法、装置及计算机设备
CN108009673A (zh) 基于深度学习的新型负荷预测方法和装置
CN107452385A (zh) 一种基于语音的数据评价方法及装置
CN109800413A (zh) 新闻事件的识别方法、装置、设备及可读存储介质
CN110647456B (zh) 一种存储设备的故障预测方法、系统及相关装置
CN112217207A (zh) 一种暂态电压稳定裕度预测方法及装置
CN109033220A (zh) 标注数据的自动选取方法、系统、设备和存储介质
TWI674517B (zh) 資訊交互的方法及裝置
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN113255079A (zh) 一种基于人工智能的包装设计方法及装置
CN112836807A (zh) 一种基于神经网络的数据处理方法及装置
CN108920377A (zh) 一种日志回放测试方法、系统、装置及可读存储介质
CN113705792A (zh) 基于深度学习模型的个性化推荐方法、装置、设备及介质
CN110966731A (zh) 调节工作参数的方法
CN113312455A (zh) 一种基于知识蒸馏的合同智能审核方法及装置
CN113313615A (zh) 一种对企业司法风险进行量化评分定级的方法及装置
CN113312902A (zh) 一种对合同文本的智能审核校验方法及装置
CN114090797A (zh) 一种基于智能推荐的组件检索方法及装置
CN115935267A (zh) 负荷数据的辨识方法、装置以及存储介质
CN111126503B (zh) 一种训练样本的生成方法和装置
CN111428130A (zh) 一种知识蒸馏过程中增强文本数据的方法及装置
CN113806223A (zh) 一种软件评价方法及装置
CN113312422A (zh) 一种基于深度学习的新闻媒体数据智能结构化方法及装置
CN110210205A (zh) 登录状态的确定方法、装置、计算机设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination