CN116384382A - 一种基于多轮交互的自动化长篇合同要素识别方法及装置 - Google Patents
一种基于多轮交互的自动化长篇合同要素识别方法及装置 Download PDFInfo
- Publication number
- CN116384382A CN116384382A CN202310009945.9A CN202310009945A CN116384382A CN 116384382 A CN116384382 A CN 116384382A CN 202310009945 A CN202310009945 A CN 202310009945A CN 116384382 A CN116384382 A CN 116384382A
- Authority
- CN
- China
- Prior art keywords
- contract
- element identification
- contract element
- model
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000003993 interaction Effects 0.000 title claims abstract description 26
- 230000015654 memory Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 230000007774 longterm Effects 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明适用长篇合同要素识别技术领域,提供了一种基于多轮交互的自动化长篇合同要素识别方法及装置,方法包括:步骤二、合同文本按照预设的切片长度按先后顺序依次进行切片,包括一个头部片段和多个非头部片段;步骤三、将头部片段输入第一AI模型进行合同要素识别并输出合同要素识别结果;步骤四、按先后顺序选取下一个非头部片段与上一个合同要素识别结果一起输入第二AI模型进行合同要素识别并输出新的合同要素识别结果;步骤五、重复步骤四直至多个非头部片段均被输入第二AI模型与上一个合同要素识别结果一起进行合同要素识别;步骤六、输出第一AI模型和第二AI模型每次进行合同要素识别输出的合同要素识别结果;从而提高了长篇合同要素识别的准确率。
Description
技术领域
本发明属于长篇合同要素识别技术领域,尤其涉及一种基于多轮交互的自动化长篇合同要素识别方法及装置。
背景技术
随着人工智能技术的不断深入和普及,越来越多的人工智能技术出现在现代社会生活中。国家出台了一系列扶持人工智能在法律领域发展的政策,推动了人工智能在法律领域的快速发展。作为提高信息化水平的一部分,合同智能管理,其中合同要素自动识别能力的建立是提高工作效率和实施信息化的关键。合同要素自动识别是基于合同,按照一定的程序,利用相应的逻辑规则,对合同中的关键要素进行识别,构建合同的结构化信息。合同要素的识别是智能合同管理中最基本的问题。
目前,在合同领域,关于要素识别模型本身的专利并不多,但在通用实体识别领域有一些相关的方法。目前主流的通用实体识别方法将其定义为序列标注任务,设计了基于序列标注的算法模型,是一种将合同中的要素定义为一种实体,然后运用序列标注算法进行实体识别的一种方式和方法。
然而,相比于通用领域而言合同领域的文本一般较长,会有2000字到5000字等长篇合同出现。传统的序列标注算法在处理这种数据的时候会遇到一个长文处理的问题,若要对整个合同文本进行建模需要大量的内存,且合同文本越长所需的内存越大,是不可控的,通常的做法是对长文本进行切片,切片的长度是可控的,例如512个字作为一个切片,通过对每个切片独立进行要素识别,最后将所有切片的识别结果一起输出,这样一来内存的消耗便是可控的,但是对于模型而言每个切片之间是独立的,这便带来了“上下文依赖”缺失的问题,举例说明:在合同首部约定了甲方是买方,但因为对合同文本进行了切片,导致了在合同尾部切片文本段落中出现了“甲方”时,模型并不知道甲方指的是买方,如若要识别尾部落款中买方的详细信息,容易出现与合同首部抽取的要素信息不一致的错误。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种基于多轮交互的自动化长篇合同要素识别方法及装置,旨在解决由于现有技术无法提供一种有效的基于多轮交互的自动化长篇合同要素识别方法,导致对于长篇合同要素识别不准确、用户体验不佳的问题。
一方面,本发明提供了一种基于多轮交互的自动化长篇合同要素识别方法,所述方法包括下述步骤:
步骤一、输入合同文本;
步骤二、所述合同文本按照预设的切片长度按先后顺序依次进行切片,包括一个头部片段和多个非头部片段;
步骤三、将所述头部片段输入第一AI模型进行合同要素识别并输出合同要素识别结果;
步骤四、按先后顺序选取下一个所述非头部片段与上一个所述合同要素识别结果一起输入第二AI模型进行合同要素识别并输出新的合同要素识别结果;
步骤五、重复步骤四直至多个所述非头部片段均被输入所述第二AI模型与上一个所述合同要素识别结果一起进行合同要素识别;
步骤六、输出所述第一AI模型和所述第二AI模型每次进行合同要素识别输出的所述合同要素识别结果。
进一步地,所述合同要素识别包括:
将所述头部片段或所述非头部片段输入至文本特征表示层、或和将所述合同要素识别结果输入至所述文本特征表示层;
所述文本特征表示层利用第一神经网络分别对输入的所述头部片段或所述非头部片段、和所述合同要素识别结果进行表示及学习并将结果分别输入至特征融合层。
进一步地,所述特征融合层对文本特征表示层输出的所述头部片段或所述非头部片段、和所述合同要素识别结果进行交互式建模学习并输入至模型层进行第二神经网络学习。
进一步地,所述模型层输出对所述合同要素识别的最终结果。
另一方面,本发明还提供了一种基于多轮交互的自动化长篇合同要素识别装置,所述装置包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的基于多轮交互的自动化长篇合同要素识别方法。
另一方面,本发明还提供了一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的基于多轮交互的自动化长篇合同要素识别方法。
另一方面,本发明还提供了一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行上述的基于多轮交互的自动化长篇合同要素识别方法。
本发明的有益效果在于:步骤一、输入合同文本;步骤二、合同文本按照预设的切片长度按先后顺序依次进行切片,包括一个头部片段和多个非头部片段;步骤三、将头部片段输入第一AI模型进行合同要素识别并输出合同要素识别结果;步骤四、按先后顺序选取下一个非头部片段与上一个合同要素识别结果一起输入第二AI模型进行合同要素识别并输出新的合同要素识别结果;步骤五、重复步骤四直至多个非头部片段均被输入第二AI模型与上一个合同要素识别结果一起进行合同要素识别;步骤六、输出第一AI模型和第二AI模型每次进行合同要素识别输出的合同要素识别结果;通过代入上个片段的合同要素,避免了对合同进行切片造成的合同要素识别丢失的问题,从而提高了长篇合同要素识别的准确率,进而提高了用户体验。
附图说明
图1是本发明实施例一提供的基于多轮交互的自动化长篇合同要素识别方法的实现流程图;
图2是本发明实施例一提供的基于多轮交互的自动化长篇合同要素识别方法的合同要素识别流程时序图;
图3是本发明实施例一提供的基于多轮交互的自动化长篇合同要素识别方法的AI模型结构图;
图4是本发明实施例二提供的基于多轮交互的自动化长篇合同要素识别装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1至图3示出了本发明实施例一提供的基于多轮交互的自动化长篇合同要素识别方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
步骤S101、输入合同文本。
步骤S102、合同文本按照预设的切片长度按先后顺序依次进行切片,包括一个头部片段和多个非头部片段;
在本发明的实施例中,按先后顺序依次进行切片避免顺序混乱内容不相关联。
步骤S103、将头部片段输入第一AI模型进行合同要素识别并输出合同要素识别结果。
步骤S104、按先后顺序选取下一个非头部片段与上一个合同要素识别结果一起输入第二AI模型进行合同要素识别并输出新的合同要素识别结果;
在本发明的实施例中,第一AI模型与第二AI模型相同。
步骤S105、重复步骤S104直至多个非头部片段均被输入第二AI模型与上一个合同要素识别结果一起进行合同要素识别;
在本发明的实施例中,避免分片导致上下文关联的合同要素未被识别到。
步骤S106、输出第一AI模型和第二AI模型每次进行合同要素识别输出的合同要素识别结果。
在本发明的实施例中,整个流程分为以下几步:
1、输入合同文本T。
2、对合同文本按固定长度切片,例如512个字,得到n个合同文本切片:T1、T2.....Tn。
3、将合同文本切片T1输入AI模型进行要素识别,将识别结果收集到结果集合B中,B可以是空集合。
4、选取下一个合同切片Ti,将Ti和结果集合B一起输入AI模型,进行要素识别,将识别结果添加到结果集合B中。
5、重复第4步,直到所有的合同切片全部都输入过AI模型。
6、从结果集合B中输出所有的要素识别结果。
在本发明的实施例中,步骤一、输入合同文本;步骤二、合同文本按照预设的切片长度按先后顺序依次进行切片,包括一个头部片段和多个非头部片段;步骤三、将头部片段输入第一AI模型进行合同要素识别并输出合同要素识别结果;步骤四、按先后顺序选取下一个非头部片段与上一个合同要素识别结果一起输入第二AI模型进行合同要素识别并输出新的合同要素识别结果;步骤五、重复步骤四直至多个非头部片段均被输入第二AI模型与上一个合同要素识别结果一起进行合同要素识别;步骤六、输出第一AI模型和第二AI模型每次进行合同要素识别输出的合同要素识别结果;通过代入上个片段的合同要素,避免了对合同进行切片造成的合同要素识别丢失的问题,从而提高了长篇合同要素识别的准确率,进而提高了用户体验。
进一步地,合同要素识别包括:
将头部片段或非头部片段输入至文本特征表示层、或和将合同要素识别结果输入至文本特征表示层;其中,如图3所示,合同文本输入层:合同的文本从这里输入到模型中;已经识别出的要素的文本输入层:上文中如果有已经识别出的要素信息,则以文本的形式从这里输入到模型中。
文本特征表示层利用第一神经网络分别对输入的头部片段或非头部片段、和合同要素识别结果进行表示及学习并将结果分别输入至特征融合层;其中,文本特征表示层也叫文本嵌入层,利用神经网络对输入的文本进行特征的表示以及学习;常用的特征表示手段有利用卷积神经网络、长短期记忆神经网络以及BERT模型等。
进一步地,特征融合层对文本特征表示层输出的头部片段或非头部片段、和合同要素识别结果进行交互式建模学习并输入至模型层进行第二神经网络学习;其中,对来来自于合同文本输入层以及要素文本输入层的特征进行交互式建模,同时进行学习。常用的做法有直接将向量拼接、投影到同一个向量空间等。
进一步地,模型层输出对合同要素识别的最终结果;其中,模型层由神经网络模型构成,对输入的数据进行学习;在本发明中,采用的多层Transformer神经网络模型;如图3所示,还包括输出层:输出要素抽取模型的最终结果,从图中可以看出,该模型只有一个输出Output1。
实施例二:
图4示出了本发明实施例二提供的一种基于多轮交互的自动化长篇合同要素识别装置,如图4所示,装置10包括:
一个或多个处理器110以及存储器120,图4中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图4中以通过总线连接为例。
处理器110用于完成装置10的各种控制逻辑,其可以为通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、单片机、ARM(Acorn RISCMachine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或任何其它这种配置。
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的基于多轮交互的自动化长篇合同要素识别方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行装置10的各种功能应用以及数据处理,即实现上述方法实施例中的……方法。
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储根据装置10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至装置10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中基于多轮交互的自动化长篇合同要素识别方法,例如,执行以上描述的图1中的方法步骤S101至步骤S106。
实施例三:
本发明实施例三提供了一种非易失性计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的方法步骤S101至步骤S106。
作为示例,非易失性存储介质能够包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(RAM)。通过说明丽非限制,RAM可以以诸如同步RAM(SRAM)、动态RAM、(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)以及直接Rambus(兰巴斯)RAM(DRRAM)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器组件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。
实施例四:
本发明实施例四提供了一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被处理器执行时,使所述处理器执行上述方法实施例的基于多轮交互的自动化长篇合同要素识别方法。例如,执行以上描述的图1中的方法步骤S101至步骤S106。
以上所描述的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存在于计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机电子设备(可以是个人计算机,服务器,或者网络电子设备等)执行各个实施例或者实施例的某些部分的方法。
已经在本文中在本说明书和附图中描述的内容包括能够提供基于多轮交互的自动化长篇合同要素识别方法及装置的示例。当然,不能够出于描述本公开的各种特征的目的来描述元件和/或方法的每个可以想象的组合,但是可以认识到,所公开的特征的许多另外的组合和置换是可能的。因此,显而易见的是,在不脱离本公开的范围或精神的情况下能够对本公开做出各种修改。此外,或在替代方案中,本公开的其他实施例从对本说明书和附图的考虑以及如本文中所呈现的本公开的实践中可能是显而易见的。意图是,本说明书和附图中所提出的示例在所有方面被认为是说明性的而非限制性的。尽管在本文中采用了特定术语,但是它们在通用和描述性意义上被使用并且不用于限制的目的。
Claims (7)
1.一种基于多轮交互的自动化长篇合同要素识别方法,其特征在于,所述方法包括下述步骤:
步骤一、输入合同文本;
步骤二、所述合同文本按照预设的切片长度按先后顺序依次进行切片,包括一个头部片段和多个非头部片段;
步骤三、将所述头部片段输入第一AI模型进行合同要素识别并输出合同要素识别结果;
步骤四、按先后顺序选取下一个所述非头部片段与上一个所述合同要素识别结果一起输入第二AI模型进行合同要素识别并输出新的合同要素识别结果;
步骤五、重复步骤四直至多个所述非头部片段均被输入所述第二AI模型与上一个所述合同要素识别结果一起进行合同要素识别;
步骤六、输出所述第一AI模型和所述第二AI模型每次进行合同要素识别输出的所述合同要素识别结果。
2.如权利要求1所述的方法,其特征在于,所述合同要素识别包括:
将所述头部片段或所述非头部片段输入至文本特征表示层、或和将所述合同要素识别结果输入至所述文本特征表示层;
所述文本特征表示层利用第一神经网络分别对输入的所述头部片段或所述非头部片段、和所述合同要素识别结果进行表示及学习并将结果分别输入至特征融合层。
3.如权利要求2所述的方法,其特征在于,所述特征融合层对文本特征表示层输出的所述头部片段或所述非头部片段、和所述合同要素识别结果进行交互式建模学习并输入至模型层进行第二神经网络学习。
4.如权利要求3所述的方法,其特征在于,所述模型层输出对所述合同要素识别的最终结果。
5.一种基于多轮交互的自动化长篇合同要素识别装置,其特征在于,所述装置包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4任一项所述的基于多轮交互的自动化长篇合同要素识别方法。
6.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-4任一项所述基于多轮交互的自动化长篇合同要素识别方法。
7.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行权利要求1-4任一项所述的基于多轮交互的自动化长篇合同要素识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310009945.9A CN116384382B (zh) | 2023-01-04 | 2023-01-04 | 一种基于多轮交互的自动化长篇合同要素识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310009945.9A CN116384382B (zh) | 2023-01-04 | 2023-01-04 | 一种基于多轮交互的自动化长篇合同要素识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116384382A true CN116384382A (zh) | 2023-07-04 |
CN116384382B CN116384382B (zh) | 2024-03-22 |
Family
ID=86964473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310009945.9A Active CN116384382B (zh) | 2023-01-04 | 2023-01-04 | 一种基于多轮交互的自动化长篇合同要素识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116384382B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110012349A (zh) * | 2019-06-04 | 2019-07-12 | 成都索贝数码科技股份有限公司 | 一种端到端的新闻节目结构化方法及其结构化框架体系 |
CN111651960A (zh) * | 2020-06-01 | 2020-09-11 | 杭州尚尚签网络科技有限公司 | 一种从合同简体迁移到繁体的光学字符联合训练及识别方法 |
CN112069296A (zh) * | 2020-11-11 | 2020-12-11 | 杭州天谷信息科技有限公司 | 一种对pdf文件的合同要素的识别方法 |
WO2021042521A1 (zh) * | 2019-09-04 | 2021-03-11 | 平安科技(深圳)有限公司 | 一种合同自动生成方法、计算机设备及计算机非易失性存储介质 |
CN113961710A (zh) * | 2021-12-21 | 2022-01-21 | 北京邮电大学 | 基于多模态分层融合网络的细粒度化论文分类方法及装置 |
KR20220073432A (ko) * | 2020-11-26 | 2022-06-03 | 주식회사 리걸인사이트 | 계약서 리스크 분석 방법 및 장치 |
CN114625860A (zh) * | 2022-03-25 | 2022-06-14 | 达而观信息科技(上海)有限公司 | 一种合同条款的识别方法、装置、设备及介质 |
CN114758341A (zh) * | 2022-03-16 | 2022-07-15 | 北京易道博识科技有限公司 | 一种智能化合同图像识别与合同要素抽取方法及装置 |
WO2022227211A1 (zh) * | 2021-04-30 | 2022-11-03 | 平安科技(深圳)有限公司 | 基于Bert的篇章的多意图识别方法、设备及可读存储介质 |
CN115309910A (zh) * | 2022-07-20 | 2022-11-08 | 首都师范大学 | 语篇要素和要素关系联合抽取方法、知识图谱构建方法 |
-
2023
- 2023-01-04 CN CN202310009945.9A patent/CN116384382B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110012349A (zh) * | 2019-06-04 | 2019-07-12 | 成都索贝数码科技股份有限公司 | 一种端到端的新闻节目结构化方法及其结构化框架体系 |
WO2021042521A1 (zh) * | 2019-09-04 | 2021-03-11 | 平安科技(深圳)有限公司 | 一种合同自动生成方法、计算机设备及计算机非易失性存储介质 |
CN111651960A (zh) * | 2020-06-01 | 2020-09-11 | 杭州尚尚签网络科技有限公司 | 一种从合同简体迁移到繁体的光学字符联合训练及识别方法 |
CN112069296A (zh) * | 2020-11-11 | 2020-12-11 | 杭州天谷信息科技有限公司 | 一种对pdf文件的合同要素的识别方法 |
KR20220073432A (ko) * | 2020-11-26 | 2022-06-03 | 주식회사 리걸인사이트 | 계약서 리스크 분석 방법 및 장치 |
WO2022227211A1 (zh) * | 2021-04-30 | 2022-11-03 | 平安科技(深圳)有限公司 | 基于Bert的篇章的多意图识别方法、设备及可读存储介质 |
CN113961710A (zh) * | 2021-12-21 | 2022-01-21 | 北京邮电大学 | 基于多模态分层融合网络的细粒度化论文分类方法及装置 |
CN114758341A (zh) * | 2022-03-16 | 2022-07-15 | 北京易道博识科技有限公司 | 一种智能化合同图像识别与合同要素抽取方法及装置 |
CN114625860A (zh) * | 2022-03-25 | 2022-06-14 | 达而观信息科技(上海)有限公司 | 一种合同条款的识别方法、装置、设备及介质 |
CN115309910A (zh) * | 2022-07-20 | 2022-11-08 | 首都师范大学 | 语篇要素和要素关系联合抽取方法、知识图谱构建方法 |
Non-Patent Citations (2)
Title |
---|
RODRIGUZE GONZALEZ 等: "Logical structure identifier and provision classifier of procurement contracts in Spanish", 《BIBLIOTECA FACULTAD DE INFORMATICA》, pages 1 - 119 * |
张晓芳 等: "基于深度学习的合同分类及要素抽取模型", 《智能计算机与应用》, vol. 12, no. 8, pages 123 - 128 * |
Also Published As
Publication number | Publication date |
---|---|
CN116384382B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220405480A1 (en) | Text sentiment analysis method based on multi-level graph pooling | |
Mehtab et al. | Stock price prediction using CNN and LSTM-based deep learning models | |
Kim et al. | Forecasting stock prices with a feature fusion LSTM-CNN model using different representations of the same data | |
CN108256052A (zh) | 基于tri-training的汽车行业潜在客户识别方法 | |
CN106528845A (zh) | 基于人工智能的检索纠错方法及装置 | |
CN109918653B (zh) | 确定文本数据的关联话题及模型的训练方法、装置和设备 | |
CN112115352A (zh) | 基于用户兴趣的会话推荐方法及系统 | |
CN108509484A (zh) | 分类器构建及智能问答方法、装置、终端及可读存储介质 | |
Dowson | The policy graph decomposition of multistage stochastic programming problems | |
CN109408811A (zh) | 一种数据处理方法及服务器 | |
CN111309887B (zh) | 一种训练文本关键内容提取模型的方法和系统 | |
CN110188422B (zh) | 一种基于网络数据提取节点的特征向量的方法及装置 | |
CN109726664A (zh) | 一种智能表盘推荐方法、系统、设备及存储介质 | |
US20190228297A1 (en) | Artificial Intelligence Modelling Engine | |
CN113127604A (zh) | 基于评论文本的细粒度物品推荐方法及系统 | |
CN115982467A (zh) | 一种去偏化用户多兴趣推荐方法、装置及存储介质 | |
Jie | RETRACTED ARTICLE: Precision and intelligent agricultural decision support system based on big data analysis | |
CN116384382B (zh) | 一种基于多轮交互的自动化长篇合同要素识别方法及装置 | |
Bashir et al. | Hesitant probabilistic fuzzy preference relations in decision making | |
CN111898766B (zh) | 基于自动机器学习的以太坊燃料限制预测方法及装置 | |
CN112184056B (zh) | 基于卷积神经网络的数据特征提取方法及系统 | |
CN108170657A (zh) | 一种自然语言长文本生成方法 | |
CN107451866A (zh) | 一种利用气象数据预测商品的销售数据的方法及装置 | |
CN113469819A (zh) | 基金产品的推荐方法、相关装置及计算机存储介质 | |
Frieze et al. | Online purchasing under uncertainty |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |