CN111931515A - 基于合同纠纷判决书的合同条款效力分析方法及装置 - Google Patents
基于合同纠纷判决书的合同条款效力分析方法及装置 Download PDFInfo
- Publication number
- CN111931515A CN111931515A CN202010798773.4A CN202010798773A CN111931515A CN 111931515 A CN111931515 A CN 111931515A CN 202010798773 A CN202010798773 A CN 202010798773A CN 111931515 A CN111931515 A CN 111931515A
- Authority
- CN
- China
- Prior art keywords
- contract
- text information
- text
- effectiveness
- clause
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 179
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000000605 extraction Methods 0.000 claims description 37
- 230000011218 segmentation Effects 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 description 22
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000010200 validation analysis Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/188—Electronic negotiation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Machine Translation (AREA)
Abstract
本申请提供一种基于合同纠纷判决书的合同条款效力分析方法及装置。该方法包括:获取本院认为文本,本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;将本院认为文本进行分割获得多个文本信息块;利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。本申请实施例通过利用合同效力分析语义模型和条款效力分析语义模型对本院认为文本进行分析,得到合同纠纷判决书中涉及的合同效力和条款效力,不需要人工从合同纠纷判决书中的合同效力和条款效力进行标注,节省了人力的同时,提高了效力分析的效率。
Description
技术领域
本申请涉及文本抽取技术领域,具体而言,涉及一种基于合同纠纷判决书的合同条款效力分析方法及装置。
背景技术
对于合同纠纷的判决书来说,其包括了很多内容,包括原告信息、被告信息、本院查明、本院认为、判决结果等信息。在本院认为对应的文本中,包括了判决的合同是否有效、合同中某些条款是否有效等。这些信息会是比较受关注的信息,因此,为了便于人们从中快速提取出有用的信息,现有技术中,一般是通过人工将关键的信息标注出来,可以用不同颜色的字体,或加粗、加下划线的方式进行标注。但是通过人工标注的方式一方面会耗费大量的人力,另一方面,其对信息的提取效率较低。
发明内容
本申请实施例的目的在于提供一种基于合同纠纷判决书的合同条款效力分析方法及装置,用以解决现有技术中通过人工进行关键信息的提取耗费大量的人力及提取效率低的问题。
第一方面,本申请实施例提供一种基于合同纠纷判决书的合同条款效力分析方法,包括:获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;将所述本院认为文本进行分割,获得多个文本信息块;利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据;利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。
本申请实施例通过利用合同效力分析语义模型对本院认为文本中合同效力进行分析,利用条款效力分析语义模型对本院认为中的条款效力进行分析,不需要人工对本院认为文本中的合同效力和条款效力进行标注,节省了人力的同时,提高了效力分析的效率。
进一步地,所述获取本院认为文本,包括:获取合同纠纷判决书;利用目录抽取语义模型对所述合同纠纷判决书进行信息抽取,获得多个目录对应的起始位置信息;其中,多个目录包括本院认为目录;根据所述本院认为目录对应的起始位置信息和本院认为目录的下一个目录对应的起始位置信息从所述合同纠纷判决书中获得所述本院认为文本。
本申请实施例通过目录抽取语义模型从合同纠纷判决书中准确地获取本院认为目录对应的文本信息,而不需要对整个判决书进行分析,提高了分析效率。
进一步地,所述将所述本院认为文本进行整句分割,包括:利用整句符号对所述本院认为文本进行分割。
进一步地,在获得合同效力分析结果后,所述方法还包括:若合同纠纷判决书中只包括一个合同名称,则将所述合同效力分析结果与所述合同名称关联;若合同纠纷判决书中包括多个合同名称,则从每个文本信息块中提取所述文本信息块对应的目标合同名称,并将所述目标合同名称分别与所述合同纠纷判决书中本院查明目录文本中的合同名称进行匹配,将所述合同效力分析结果与匹配成功的合同名称进行关联。
本申请实施例通过将合同效力分析结果与合同名称进行关联,从而能够获知哪个合同有效,哪个合同无效。
进一步地,所述利用条款效力分析语义模型对每一文本信息块进行分析,包括:分别对每一文本信息块进行条款分类,获得有分类标签的文本信息块;利用条款效力分析语义模型对有分类标签的文本信息块进行分析。
本申请实施例先对每一文本信息块进行条款分类,然后只对有分类标签的文本信息块进行条款效力分析,避免了对不是条款的文本进行分析,从而提高了分析效率。
进一步地,在利用条款效力分析语义模型对有分类标签的文本信息块进行分析之后,所述方法还包括:利用同时包含条款效力分析结果和分类标签的文本信息块对本院认为文本对应的文本信息块进行分组,获每一文本信息组中的条款效力分析结果赋值给对应文本信息组中只包含有分类标签的文本信息块,并将同时包含条款效力分析结果和分类标签的文本信息块的内容作为对应文本信息组中只包含分类标签的文本信息块对应的条款效力认定依据。
本申请实施例通过利用同时包括条款的分类标签和条款效力分析结果的文本信息块,对只包含分类标签的文本信息块赋值条款效力分析结果,以及作为只包含分类标签的文本信息块的条款效力依据,以实现对具备条款分类的文本信息块进行条款效力分析。
进一步地,在将每一文本信息组中的条款效力分析结果赋值给对应文本信息组中只包含有分类标签的文本信息块之后,所述方法还包括:获取文本信息块对应的条款分类的分类标签,根据所述分类标签将所述文本信息块对应的条款效力分析结果与所述合同纠纷判决书中包括的本院查明目录对应的文本信息中的条款明细进行关联。
本申请实施例通过将条款效力分析结果与条款明细进行关联,使得用户更加清楚、便捷地获知本院查明中的条款明细对应的条款效力分析结果。
第二方面,本申请实施例提供一种基于合同纠纷判决书的合同条款效力分析装置,包括:文本获取模块,用于获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;文本分割模块,用于将所述本院认为文本进行分割,获得多个文本信息块;合同效力分析模块,用于合同效力利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据;条款效力分析模块,用于利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果;所述条款效力分析结果包括条款效力分析结果以及条款效力认定依据。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的方法。
第四方面,本申请实施例提供一种非暂态计算机可读存储介质,包括:所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的方法。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种合同条款效力分析方法流程示意图;
图2为本申请实施例提供的一种合同效力要素体系结构示意图;
图3为本申请实施例提供的一种条款分类示意图;
图4本申请实施例提供的装置结构示意图;
图5为本申请实施例提供的电子设备实体结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
可以理解的是,本申请实施例提供的基于合同纠纷判决书的合同条款效力分析方法可以应用于终端设备(也可以称为电子设备)以及服务器;其中终端设备具体可以为智能手机、平板电脑、计算机、个人数字助理(Personal Digital Assitant,PDA)等;服务器具体可以为应用服务器,也可以为Web服务器。
一份完整的合同纠纷判决书中包含了多项内容,例如:文件首部、诉讼方当事人信息、诉讼方代理人信息、被诉讼方当事人信息、被诉讼方代理人信息、审理过程、诉讼方诉请、被诉讼方辩称、本院查明、争议焦点、本院认为、判决结果、文件尾部、依据法律法条内容。可以理解的是,上述内容并非一定全部包含。其最重要的两部分内容为本院查明和本院认为,其中,本院查明是对涉及到的一份或多份合同内容的事实情况。而本院认为是针对合同中的条款的法院审判观点与过程信息说明信息。
因此,本院查明中涉及到了合同的基本信息(合同名称、签订时间等)以及合同条款内容,本院认为中涉及了在本院查明中涉及到的各个合同对应的条款是否有效的分析。由于一份判决书中的内容太多,很难从中梳理出合同基本信息、合同条款内容、合同条款效力之间的对应关系。
因此,本申请实施例提供一种合同条款效力分析方法,并将获得的本院认为中的合同条款效力与本院查明中对应的合同基本信息和合同条款内容关联起来,从而解决现有技术中通过人工进行关键信息的提取耗费大量的人力及提取效率低的问题。
在介绍合同条款效力分析之前,本申请实施例先对本院查明中的合同相关信息进行抽取,具体为:
先从合同判决书中将本院查明对应的文本信息抽取出来,然后利用合同基本信息抽取模型对本院查明对应的文本信息进行抽取,可以获得至少一个合同基本信息。可以理解的是,获得合同基本信息的数量与判决书中涉及到的合同的数量一致,且合同基本信息中包括合同名称和签订时间。
根据合同基本信息对本院查明对应的文本信息进行划分,获得对应的合同信息块,即合同基本信息的数量与合同信息块的数量一致。
在获得合同信息块之后,利用合同条款抽取模型对每个合同信息块进行抽取,获得每个合同信息块中的合同条款内容。
在获得合同条款内容后,还可以对合同条款内容进行分类。对于合同来说,可以预先将其条款划分为:借款本金、借期内利率、逾期利率、还款方式、违约金、保证担保、抵押、借款期限、保证期间、诉讼费用、还款计划、债权转让、债务重组、冲抵和合同生效日期等类别。每个条款分类都对应至少一条抽取规则,利用各个类别的抽取规则对获得的合同条款内容进行匹配,若某个条款分类的抽取规则与某个合同条款内容相匹配,则说明该合同条款内容的类别为该条款分类。图1为本申请实施例提供的一种合同条款效力分析方法流程示意图,如图1所示,该方法包括:
步骤101:获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息。
为了便于合同信息的抽取,可以为一份合同纠纷判决书构建多个目录,例如可以包括本院认为目录、本院查明目录等。本院认为文本是指本院认为目录对应的文本信息,在该本院认为文本中,示出了法院针对涉及到的相关合同约定是否有效的认定。
步骤102:将所述本院认为文本进行分割,获得多个文本信息块。
在具体的实施过程中,为了实现细粒度的效力分析,提高分析的准确性,可以将本院认为文本进行分割,具体分割方式可以是根据整句符号进行分割,整句符号可以包括句号,还可以包括分号。即利用文本中出现的句号和/或分号对本院认为文本进行分割,从而获得多个文本信息块。因此,一个文本信息块就是一个完整的句子。
步骤103:利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据。
在具体的实施过程中,发明人通过学习合同纠纷一审判决书的本院认为目录文本内容,针对性学习该类信息结构特征,挖掘并设计合同纠纷判决书中合同效力要素体系结构,如图2所示,该要素体系结构包括:合同效力有效、合同效力无效、合同效力认定依据、条款效力有效、条款效力无效以及条款效力认定依据,以及条款分类等。
合同效力分析语义模型用于对本院认为文本中判定合同效力是否有效以及确定合同效力认定的依据。因此,合同效力分析语义模型包括判定合同效力有效的语义模型、判定合同效力无效的语义模型以及合同效力认定依据的语义模型。上述各种语义模型都是预先创建好的。仍以图2为例,在图2的右侧显示了部分合同效力无效的抽取表达式。由于不同的判决书撰写人员,其撰写判决书的用词习惯不同,因此,为了能够准确、全面的从本院认为文本中找出合同效力分析结果,需要预先创建多种抽取表达式,然后分别使用多种抽取表达式对本院认为中的每一文本信息块进行分析,从而获得合同效力分析结果。优选地,抽取表达式可以由一个或一个以上的如ZL 201410155830.1公开的概念表达式,与一种或者多种语义算子组合构成。合同效力认定依据的语义模型用来从本院认为文本中抽取判定合同效力是否有效所依据的法条。
例如:若某一文本信息块与合同效力无效模型中的一个抽取表达式相匹配,则说明该文本信息块中包含的合同为无效合同。若某一文本信息块与合同效力有效模型中的一个抽取表达式相匹配,则说明该文本信息块中包含的合同为有效合同。
步骤104:利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。
在具体的实施过程中,条款效力分析语义模型中包括条款效力有效的语义模型、条款效力无效的语义模型。同样地,上述各语义模型均为预先创建的,且每种语义模型对应的抽取表达式的数量为至少一个,用以适配不同判决书的不同用语,从而提高对条款效力分析的全面性和准确性。
条款效力有效的语义模型用于从本院认为文本中抽取包含有效条款的文本信息块,条款效力无效的语义模型用于从本院认为文本中抽取包含无效条款的文本信息块。
例如:若条款效力有效的语义模型中的某一条抽取表达式与某一文本信息块相匹配,则说明该文本信息块中的条款是有效条款;若条款效力无效的语义模型中的某一条抽取表达式与某一文本信息块相匹配,则说明该文本信息块中的条款是无效条款。
应当说明的是,合同效力分析语义模型中的各个抽取表达式和条款效力分析语义模型中的各个抽取表达式可以根据实际情况进行增加、删除和修改。
本申请实施例通过利用合同效力分析语义模型对本院认为文本中合同效力进行分析,得到合同纠纷判决书中涉及的合同效力和条款效力,利用条款效力分析语义模型对本院认为中的条款效力进行分析,不需要人工对合同纠纷判决书中的合同效力和条款效力进行标注,节省了人力的同时,提高了效力分析的效率。
在上述实施例的基础上,所述获取本院认为文本,包括:
获取合同纠纷判决书;
利用目录抽取语义模型对所述合同纠纷判决书进行信息抽取,获得多个目录对应的起始位置信息;其中,多个目录包括本院认为目录;
根据所述本院认为目录对应的起始位置信息和本院认为目录的下一个目录对应的起始位置信息从所述合同纠纷判决书中获得所述本院认为文本。
在具体的实施过程中,终端设备获取合同纠纷判决书的方式可以是通过从互联网上下载获得,也可以是接收其他终端发送的,本申请实施例对合同纠纷判决书的获得方式不做限定。
目录抽取语义模型为预先创建的一系列抽取表达,是发明人通过学习判决书的数据组成结构特征、组成元素上下文顺序关系构建的。并且,目录抽取语义模型能够实现对目标的自动识别、定位合同纠纷判决书中各个目录信息的起始位置信息。
将本院认为目录对应的起始位置信息及本院认为目标的下一个目录对应的起始位置信息之间的文本作为本院认为文本。
可以理解的是,若本院认为目录为合同纠纷判决书中的最后一个目录,则将本院认为目录的起始位置信息开始到合同纠纷判决书的最后作为本院认为文本。
本申请实施例通过目录抽取语义模型从合同纠纷判决书中准确地获取本院认为目录对应的文本信息,而不需要对整个判决书进行分析,提高了分析效率。
在上述实施例的基础上,在获得合同效力分析结果后,所述方法还包括:
若合同纠纷判决书中只包括一个合同名称,则将所述合同效力分析结果与所述合同名称关联;
若合同纠纷判决书中包括多个合同名称,则从每个文本信息块中提取所述文本信息块对应的目标合同名称,并将所述目标合同名称分别与所述合同纠纷判决书中本院查明目录文本中的合同名称进行匹配,将所述合同效力分析结果与匹配成功的合同名称进行关联。
在具体的实施过程中,合同纠纷判决书中还包括了本院查明目录对应的文本,为了能够将本院认为文本中的合同效力分析结果与本院查明目录对应的文本中所涉及的合同名称进行关联起来,从而清楚表示本院查明目录对应的文本中所涉及的合同以及条款是否有效,可以进行如下处理:在利用合同效力分析语义模型获得对应的合同效力分析结果后,可以获得判定合同有效的文本信息块有哪些,判定合同无效的文本信息块有哪些。一般来说,本院认为文本会以“A某和B某签订的XX合同合法有效”,“A某和C某签订的XX合同无效”这样的表述方式进行撰写。因此,对于合同效力有效或合同效力无效的文本信息块中会包括合同的名称,所以可以从文本信息块中获取该合同名称。如果合同纠纷判决书中只包括一个合同名称,则直接将该合同效力分析结果与该合同名称相关联。如果合同纠纷判决书中包括多个合同名称,则同样地从文本信息块中提取对应的目标合同名称,并将目标合同名称与合同纠纷判决书中本院查明目录对应文本中所包含的所有合同名称进行匹配,将合同效力分析结果与目标合同名称相匹配的合同名称进行关联。
另外,如果文本信息块中的目标合同名称与合同纠纷判决书中本院查明目录文本中的所有合同名称都无法匹配,则可能存在合同纠纷判决书中本院查明目录文本中的合同名称是全称,而目标合同名称是简称。为了提高匹配成功率,可以利用合同类型进行匹配。即,将与目标合同名称对应的合同类型一致的合同名称作为与目标合同名称相匹配的合同名称。例如:目标合同名称的合同类型为借款合同,而本院查明中包括一个合同名称为“关于XXXX的借款合同”,这个合同的合同类型也是借款合同,那么可以将目标合同名称与该合同名称认为是同一份合同,因此,可以将目标合同名称对应的合同效力分析结果与“关于XXXX的借款合同”进行关联。可以理解的是,合同类型可以采用合同类型语义模型对每个合同名称进行匹配,从而确定合同名称对应的合同类型。
应当说明的是,合同纠纷判决书中包含的合同名称的数量可以通过对本院查明目录对应的文本进行合同基础要素提取,从而获取本院查明中所提到的所有的合同名称。
本申请实施例通过将合同效力分析结果与对应的合同名称进行关联,从而能够让用户快速获知本院查明中提到的合同名称是否为有效合同。
在上述实施例的基础上,所述利用条款效力分析语义模型对每一文本信息块进行分析,包括:
分别对每一文本信息块进行条款分类,获得有分类标签的文本信息块;
利用条款效力分析语义模型对有分类标签的文本信息块进行分析。
在具体的实施过程中,由于本院认为本文中有的文本信息块是在对合同效力进行判决,有的是总结性话术,还有的是对条款效力进行判决。为了能够提高对条款效力分析的效率,减少计算量,在进行条款效力分析之前,分别对每个文本信息块进行条款分类。其中,条款可以分成多个类别,如图3所示,包括:借款本金、借期内利率、逾期利率、还款方式、违约金、保证担保、抵押、借款期限、保证期间、诉讼费用、还款计划、债权转让、债务重组等。可以理解的是,图3中只是示出了部分条款分类的分类标签,具体分类还可以根据实际情况进行增加。每种分类标签包括至少一种抽取表达式,用来对每个文本信息块是否属于条款内容,以及属于哪个条款类别进行判定。图3右侧给出了违约金对应的部分抽取表达式。如果没有条款类别的抽取表达式与该文本信息块相匹配,则可以认定为该文本信息块不是对条款效力的判决,后续不再对该文本信息块进行条款效力的分析。
在获得有分类标签的文本信息块之后,利用条款效力分析语义模型对有分类标签的文本信息块进行条款效力分析。其中,条款效力分析语义模型中包括至少一条抽取表达式,抽取表达式用于从文本信息块中抽取信息,从而根据抽取结果确定文本信息块中条款的效力,并且抽取表达式为预先创建的。利用条款效力分析语义模型中的各抽取表达式与有分类标签的文本信息块进行匹配,从而可以获得文本信息块对应的条款效力分析结果。可以理解的是,文本信息块有分类标签则说明该文本信息块中包含合同条款,没有分类标签的文本信息块中不包含合同条款。
在上述实施例的基础上,在利用条款效力分析语义模型对有分类标签的文本信息块进行分析之后,所述方法还包括:
利用同时包含条款效力分析结果和分类标签的文本信息块对本院认为文本对应的文本信息块进行分组,获得多个文本信息组;其中,每个文本信息组包括至少一个文本信息块;
将每一文本信息组中的条款效力分析结果赋值给对应文本信息组中只包含有分类标签的文本信息块,并将同时包含条款效力分析结果和分类标签的文本信息块的内容作为对应文本信息组中只包含分类标签的文本信息块对应的条款效力认定依据。
在具体的实施过程中,一般来说,只有分类标签的文本信息块也应该有对应的条款效力分析结果。因此,为了能够给只包含分类标签的文本信息块补充完整信息,可以利用同时包含条款效力分析结果和分类标签的文本信息块作为本院认为文本信息块对所述本院认为文本对应的所有的文本信息块进行分组,获得多个文本信息组。具体的分组方式为,所有的文本信息块,向后归并到距离自己最近的,同时包含条款效力分析结果和分类标签的文本信息块。例如:本院认为文本包括A、B、C、D、E和F五个文本信息块,若B和E这两个文本信息块中同时包含条款效力分析结果和分类标签,则将B和E作为本院认为信息块,以B和E作为分割线,将本院认为文本进行划分,A和B为一组;C、D和E为一组。F可以自动视为一组,也可以丢弃。其中,每个文本信息组包括了至少一个文本信息块,且至少一个文本信息块中有一个文本信息块既有条款效力分析结果,又有对应的分类标签。
在分组完成后,针对每一个文本信息组,将里面既有条款效力分析结果,又有对应的分类标签的文本信息块作为目标文本信息块。将只包含分类标签的文本信息块,用目标文本信息块的条款效力分析结果为其赋值。例如,由于本院认为撰写方式不同,可能会将多个条款一起进行效力的说明,例如:条款一、条款二和条款三有效。通过条款效力分析后可以获得条款三有效的结果,而条款一和条款二则没有对应的条款效力分析结果。因此,为了能够为每一条款都进行条款效力的赋值,可以将条款三对应的条款效力分析结果赋值给条款一和条款二。并且将同时包含条款效力分析结果和分类标签的文本信息块的内容作为该文本信息组中每一个文本信息块对应的条款效力分析依据。
本申请实施例通过利用同时包括分类标签和条款效力分析结果的文本信息块,对只包含分类标签的文本信息块赋值条款效力分析结果,并利用同时包括分类标签和条款效力分析结果的文本信息块的内容作为条款效力认定依据,以获得完整的分类标签和条款效力分析结果。
在上述实施例的基础上,在将每一文本信息组中的条款效力分析结果赋值给对应文本信息组中只包含有分类标签的文本信息块后,为了能够将合同纠纷判决书中本院认为文本中对条款效力的分析结果与本院查明目录对应的文本中涉及到的相同的条款明细进行关联,本申请实施例可以利用分类标签将其进行关联,即,从合同纠纷判决书中的本院查明目录对应的文本信息中获取与本院认为文本中分类标签相同的条款明细,并将该条款明细与分类标签对应的条款效力分析结果进行关联。
应当说明的是,本院查明目录为合同纠纷判决书中的目录之一,可以预先利用条款明细抽取语义模型从本院查明目录对应的文本信息中抽取出条款明细。
本申请实施例通过将条款效力分析结果与条款明细进行关联,使得用户更加清楚、便捷地获知本院查明中的条款明细对应的条款效力分析结果。
图4本申请实施例提供的装置结构示意图,该装置可以是电子设备上的模块、程序段或代码。应理解,该装置与上述图1方法实施例对应,能够执行图1方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括:文本获取模块401、文本分割模块402、合同效力分析模块403和条款效力分析模块404,其中:
文本获取模块401用于获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;文本分割模块402用于将所述本院认为文本进行分割,获得多个文本信息块;合同效力分析模块403用于合同效力利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据;条款效力分析模块404用于利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。
在上述实施例的基础上,文本获取模块401具体用于:
获取合同纠纷判决书;
利用目录抽取语义模型对所述合同纠纷判决书进行信息抽取,获得多个目录对应的起始位置信息;其中,多个目录包括本院认为目录;
根据所述本院认为目录对应的起始位置信息和本院认为目录的下一个目录对应的起始位置信息从所述合同纠纷判决书中获得所述本院认为文本。
在上述实施例的基础上,文本分割模块402具体用于:
利用整句符号对所述本院认为文本进行分割。
在上述实施例的基础上,该装置还包括合同关联模块,用于:
若合同纠纷判决书中只包括一个合同名称,则将所述合同效力分析结果与所述合同名称关联;
若合同纠纷判决书中包括多个合同名称,则从每个文本信息块中提取所述文本信息块对应的目标合同名称,并将所述目标合同名称分别与所述合同纠纷判决书中本院查明目录文本中的合同名称进行匹配,将所述合同效力分析结果与匹配成功的合同名称进行关联。
在上述实施例的基础上,条款效力分析模块404具体用于:
分别对每一文本信息块进行条款分类,获得有分类标签的文本信息块;
利用条款效力分析语义模型对有分类标签的文本信息块进行分析。
在上述实施例的基础上,该装置还包括条款效力补充模块,用于:
利用同时包含条款效力分析结果和分类标签的文本信息块对本院认为文本对应的文本信息块进行分组,获得多个文本信息组;其中,每个文本信息组包括至少一个文本信息块;
将每一文本信息组中的条款效力分析结果赋值给对应文本信息组中只包含有分类标签的文本信息块,并将同时包含条款效力分析结果和分类标签的文本信息块的内容作为对应文本信息组中只包含分类标签的文本信息块对应的条款效力认定依据。
在上述实施例的基础上,该装置还包括条款关联模块,用于:
获取文本信息块对应的条款分类的分类标签,根据所述分类标签将所述文本信息块对应的条款效力分析结果与所述合同纠纷判决书中包括的本院查明目录对应的文本信息中的条款明细进行关联。
综上所述,本申请实施例通过利用合同效力分析语义模型对本院认为文本中合同效力进行分析,利用条款效力分析语义模型对本院认为中的条款效力进行分析,不需要人工从本院认为文本中的合同效力和条款效力进行标注,节省了人力的同时,提高了效力分析的效率。
图5为本申请实施例提供的电子设备实体结构示意图,如图5所示,所述电子设备,包括:处理器(processor)501、存储器(memory)502和总线503;其中,
所述处理器501和存储器502通过所述总线503完成相互间的通信;
所述处理器501用于调用所述存储器502中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;将所述本院认为文本进行分割,获得多个文本信息块;利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据;利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。
处理器501可以是一种集成电路芯片,具有信号处理能力。上述处理器501可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器502可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)等。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;将所述本院认为文本进行分割,获得多个文本信息块;利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据;利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;将所述本院认为文本进行分割,获得多个文本信息块;利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据;利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于合同纠纷判决书的合同条款效力分析方法,其特征在于,包括:
获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;
将所述本院认为文本进行分割,获得多个文本信息块;
利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据;
利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。
2.根据权利要求1所述的方法,其特征在于,所述获取本院认为文本,包括:
获取合同纠纷判决书;
利用目录抽取语义模型对所述合同纠纷判决书进行信息抽取,获得多个目录对应的起始位置信息;其中,多个目录包括本院认为目录;
根据所述本院认为目录对应的起始位置信息和本院认为目录的下一个目录对应的起始位置信息从所述合同纠纷判决书中获得所述本院认为文本。
3.根据权利要求1所述的方法,其特征在于,所述将所述本院认为文本进行分割,包括:
利用整句符号对所述本院认为文本进行分割。
4.根据权利要求1所述的方法,其特征在于,在获得合同效力分析结果后,所述方法还包括:
若合同纠纷判决书中只包括一个合同名称,则将所述合同效力分析结果与所述合同名称关联;
若合同纠纷判决书中包括多个合同名称,则从每个文本信息块中提取所述文本信息块对应的目标合同名称,并将所述目标合同名称分别与所述合同纠纷判决书中本院查明目录文本中的合同名称进行匹配,将所述合同效力分析结果与匹配成功的合同名称进行关联。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述利用条款效力分析语义模型对每一文本信息块进行分析,包括:
分别对每一文本信息块进行条款分类,获得有分类标签的文本信息块;
利用条款效力分析语义模型对有分类标签的文本信息块进行分析。
6.根据权利要求5所述的方法,其特征在于,在利用条款效力分析语义模型对有分类标签的文本信息块进行分析之后,所述方法还包括:
利用同时包含条款效力分析结果和分类标签的文本信息块对本院认为文本对应的文本信息块进行分组,获得多个文本信息组;其中,每个文本信息组包括至少一个文本信息块;
将每一文本信息组中的条款效力分析结果赋值给对应文本信息组中只包含有分类标签的文本信息块,并将同时包含条款效力分析结果和分类标签的文本信息块的内容作为对应文本信息组中只包含分类标签的文本信息块对应的条款效力认定依据。
7.根据权利要求6所述的方法,其特征在于,在将每一文本信息组中的条款效力分析结果赋值给对应文本信息组中只包含有分类标签的文本信息块之后,所述方法还包括:
获取文本信息块对应的条款分类的分类标签,根据所述分类标签将所述文本信息块对应的条款效力分析结果与所述合同纠纷判决书中包括的本院查明目录对应的文本信息中的条款明细进行关联。
8.一种基于合同纠纷判决书的合同条款效力分析装置,其特征在于,包括:
文本获取模块,用于获取本院认为文本,所述本院认为文本为合同纠纷判决书中的本院认为目录对应的文本信息;
文本分割模块,用于将所述本院认为文本进行分割,获得多个文本信息块;
合同效力分析模块,用于合同效力利用合同效力分析语义模型对每一文本信息块进行分析,获得合同效力分析结果;所述合同效力分析结果包括合同效力结果以及合同效力认定依据;
条款效力分析模块,用于利用条款效力分析语义模型对每一文本信息块进行分析,获得条款效力分析结果。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-7任一项所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被计算机运行时,使所述计算机执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010798773.4A CN111931515B (zh) | 2020-08-10 | 2020-08-10 | 基于合同纠纷判决书的合同条款效力分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010798773.4A CN111931515B (zh) | 2020-08-10 | 2020-08-10 | 基于合同纠纷判决书的合同条款效力分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111931515A true CN111931515A (zh) | 2020-11-13 |
CN111931515B CN111931515B (zh) | 2024-06-28 |
Family
ID=73307315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010798773.4A Active CN111931515B (zh) | 2020-08-10 | 2020-08-10 | 基于合同纠纷判决书的合同条款效力分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931515B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590131A (zh) * | 2017-10-16 | 2018-01-16 | 北京神州泰岳软件股份有限公司 | 一种规范文书处理方法、装置及系统 |
CN107608948A (zh) * | 2017-10-16 | 2018-01-19 | 北京神州泰岳软件股份有限公司 | 一种文本信息抽取模型的构建方法及装置 |
CN108334500A (zh) * | 2018-03-05 | 2018-07-27 | 上海思贤信息技术股份有限公司 | 一种基于机器学习算法的裁判文书标注方法及装置 |
CN109033249A (zh) * | 2018-07-05 | 2018-12-18 | 北京神州泰岳软件股份有限公司 | 公检法领域结构化文书的信息提取方法、装置及存储介质 |
CN111027307A (zh) * | 2018-09-21 | 2020-04-17 | 北京国双科技有限公司 | 一种裁判文书中影响判决结果的内容的判定方法和装置 |
CN111161105A (zh) * | 2019-12-27 | 2020-05-15 | 中科鼎富(北京)科技发展有限公司 | 一种处理法院观点的方法、装置、存储介质和电子设备 |
CN111222326A (zh) * | 2020-01-15 | 2020-06-02 | 中科鼎富(北京)科技发展有限公司 | 裁判文书的信息抽取方法及装置 |
CN111274354A (zh) * | 2020-01-15 | 2020-06-12 | 中科鼎富(北京)科技发展有限公司 | 一种裁判文书结构化方法及装置 |
WO2020119075A1 (zh) * | 2018-12-10 | 2020-06-18 | 平安科技(深圳)有限公司 | 通用文本信息提取方法、装置、计算机设备和存储介质 |
-
2020
- 2020-08-10 CN CN202010798773.4A patent/CN111931515B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590131A (zh) * | 2017-10-16 | 2018-01-16 | 北京神州泰岳软件股份有限公司 | 一种规范文书处理方法、装置及系统 |
CN107608948A (zh) * | 2017-10-16 | 2018-01-19 | 北京神州泰岳软件股份有限公司 | 一种文本信息抽取模型的构建方法及装置 |
CN108334500A (zh) * | 2018-03-05 | 2018-07-27 | 上海思贤信息技术股份有限公司 | 一种基于机器学习算法的裁判文书标注方法及装置 |
CN109033249A (zh) * | 2018-07-05 | 2018-12-18 | 北京神州泰岳软件股份有限公司 | 公检法领域结构化文书的信息提取方法、装置及存储介质 |
CN111027307A (zh) * | 2018-09-21 | 2020-04-17 | 北京国双科技有限公司 | 一种裁判文书中影响判决结果的内容的判定方法和装置 |
WO2020119075A1 (zh) * | 2018-12-10 | 2020-06-18 | 平安科技(深圳)有限公司 | 通用文本信息提取方法、装置、计算机设备和存储介质 |
CN111161105A (zh) * | 2019-12-27 | 2020-05-15 | 中科鼎富(北京)科技发展有限公司 | 一种处理法院观点的方法、装置、存储介质和电子设备 |
CN111222326A (zh) * | 2020-01-15 | 2020-06-02 | 中科鼎富(北京)科技发展有限公司 | 裁判文书的信息抽取方法及装置 |
CN111274354A (zh) * | 2020-01-15 | 2020-06-12 | 中科鼎富(北京)科技发展有限公司 | 一种裁判文书结构化方法及装置 |
Non-Patent Citations (1)
Title |
---|
刘稳;王锦;李锐;游景扬;陈建峡;: "法院判决书关键信息抽取系统设计与实现", 湖北工业大学学报, no. 01, 15 February 2018 (2018-02-15), pages 65 - 69 * |
Also Published As
Publication number | Publication date |
---|---|
CN111931515B (zh) | 2024-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110069623B (zh) | 摘要文本生成方法、装置、存储介质和计算机设备 | |
CN112632989B (zh) | 一种合同文本中风险信息的提示方法、装置及设备 | |
CN108763380B (zh) | 商标识别检索方法、装置、计算机设备和存储介质 | |
CN113312461A (zh) | 基于自然语言处理的智能问答方法、装置、设备及介质 | |
CN110765889B (zh) | 法律文书的特征提取方法、相关装置及存储介质 | |
CN110609998A (zh) | 一种电子文档信息的数据提取方法、电子设备及存储介质 | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
CN113268615A (zh) | 资源标签生成方法、装置、电子设备及存储介质 | |
CN113360768A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
CN111428480A (zh) | 简历识别方法、装置、设备及存储介质 | |
CN116796726A (zh) | 简历解析方法、装置、终端设备及介质 | |
CN115599885A (zh) | 文档全文检索方法、装置、计算机设备、存储介质及产品 | |
CN111191153A (zh) | 一种信息技术咨询服务展示装置 | |
CN112765965A (zh) | 文本多标签分类方法、装置、设备和存储介质 | |
CN111898378A (zh) | 政企客户的行业分类方法和装置、电子设备、存储介质 | |
CN111931479B (zh) | 基于合同纠纷判决书的信息抽取方法及装置 | |
CN112800771A (zh) | 文章识别方法、装置、计算机可读存储介质和计算机设备 | |
CN111931515B (zh) | 基于合同纠纷判决书的合同条款效力分析方法及装置 | |
CN113254623B (zh) | 数据处理方法、装置、服务器、介质及产品 | |
CN114706948A (zh) | 新闻处理方法、装置、存储介质以及电子设备 | |
CN106815592B (zh) | 文本数据处理方法及装置和错别字识别方法及装置 | |
CN110825847B (zh) | 目标人物间亲密度识别方法、装置、电子设备及存储介质 | |
CN114067343A (zh) | 一种数据集的构建方法、模型训练方法和对应装置 | |
CN113901817A (zh) | 文档分类方法、装置、计算机设备和存储介质 | |
CN113806311A (zh) | 基于深度学习的文件分类方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |