CN111784505A - 一种借贷纠纷判决书提取方法及装置 - Google Patents
一种借贷纠纷判决书提取方法及装置 Download PDFInfo
- Publication number
- CN111784505A CN111784505A CN202010613381.6A CN202010613381A CN111784505A CN 111784505 A CN111784505 A CN 111784505A CN 202010613381 A CN202010613381 A CN 202010613381A CN 111784505 A CN111784505 A CN 111784505A
- Authority
- CN
- China
- Prior art keywords
- extraction
- content
- target
- content block
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 328
- 238000000034 method Methods 0.000 claims abstract description 63
- 238000013145 classification model Methods 0.000 claims abstract description 20
- 238000000638 solvent extraction Methods 0.000 claims abstract description 9
- 230000014509 gene expression Effects 0.000 claims description 91
- 238000000926 separation method Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 9
- 238000013461 design Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Technology Law (AREA)
- Accounting & Taxation (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种借贷纠纷判决书提取方法及装置,用于实现判决书内重要内容的提取并结构化输出。本发明实施例方法包括:从借贷纠纷判决书中获取目标内容块,识别目标内容块中的分隔符;将目标内容块分隔成x个目标子内容;匹配目标抽取模型,目标分类模型包含目标抽取体系,目标抽取体系包含多个抽取节点,每个抽取节点对应目标内容块的一个目标子内容,目标抽取模型用于使用抽取节点进行内容抽取并输出;将经过分隔后的x个目标子内容输入目标抽取模型,并将抽取结果输出。通过先定位至目标内容并整块获取,再通过预先设计的抽取模型对该目标内容中的句子进行逐一抽取,将结果按序输出实现了判决书内重要内容的提取并结构化输出。
Description
技术领域
本发明涉及文本处理领域,具体涉及一种借贷纠纷判决书提取方法及装置。
背景技术
判决书,是指法院根据判决写成的文书,是法律界常用的一种应用写作文体,在形式上具备规范性、创新性、公开性、法律性和准确性的特点。
法院以及律所需要对判决书进行存档,由于判决书内容较多,有一些机构会采取保存源文件的同时,又提取判决书内较为重要的数据进行分类存档,以方便如果需要提取数据时,可以较为直接的观察到该判决书中各种数据,例如本金、利息、支付律师费等数据。
目前有机构采取标注的方法对重要数据进行提示,可以是人为标注也可以通过建立模型进行标注,人为标注的缺点就是工作量较大,而建立标注模型,模型需要分析判决书内容并对判决书内容进行标注,处理逻辑较为复杂。
发明内容
本发明实施例提供了一种借贷纠纷判决书提取方法及装置,用于实现判决书内重要内容的提取并结构化输出。
本发明实施例第一方面提供了一种借贷纠纷判决书提取方法,包括:
从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种;
识别所述目标内容块中的分隔符;
根据所述分隔符将所述目标内容块分隔成x个目标子内容;
根据所述目标内容块的主题匹配目标抽取模型,所述目标分类模型包含目标抽取体系,所述目标抽取体系包含多个抽取节点,每个抽取节点对应所述目标内容块的一个目标子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述目标抽取模型用于使用抽取节点逐一对所述目标子内容进行内容抽取并输出;
将所述经过分隔后的x个目标子内容输入目标抽取模型,接收所述目标抽取模型的抽取结果,并将所述抽取结果输出。
可选地,所述从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种,包括:
根据第一预设表达式获取所述诉讼请求内容块的起始位置,所述第一预设表达式根据诉讼请求内容块的起始内容进行建立;
根据第二预设表达式获取所述争议焦点内容块的起始位置,所述第二预设表达式根据争议焦点内容块的起始内容进行建立;
根据第三预设表达式获取所述法院观点内容块的起始位置,所述第一预设表达式根据诉讼请求内容块的起始内容进行建立;
根据第四预设表达式获取所述法院观点内容块的结束位置,所述第一预设表达式根据诉讼请求内容块的结束内容进行建立;
划分所述诉讼请求内容块的起始位置至所述争议焦点内容块的起始位置作为诉讼请求内容块;
划分所述争议焦点内容块的起始位置至所述法院观点内容块的起始位置作为争议焦点内容块;
划分所述法院观点内容块的起始位置至所述法院观点内容块的结束位置作为法院观点内容块。
可选地,在所述从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种之前,包括:
建立所述目标内容抽取体系,所述抽取体系由目标分类模型内抽取节点的名称以及所述抽取节点内的抽取表达式组成,所述目标内容抽取体系根据目标内容文本的表达方式建立。
可选地,当所述目标内容块为诉讼请求内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示请求赔偿的内容。
可选地,当所述目标内容块为争议焦点内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示事实判定的内容。
可选地,当所述目标内容块为法院观点内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示法院判定结果的内容。
可选地,所述根据分隔符将所述诉讼请求内容块分隔成x个诉讼请求子内容包括:
判断所述诉讼请求内容块中是否存在项目分隔符;
若存在,则根据所述项目分隔符将所述诉讼请求内容块分割成x个诉讼请求子内容;
若不存在,则获取诉讼请求内容块中的整句分隔符号,并根据所述整句分隔符号将所述诉讼请求内容块分割成x个诉讼请求子内容。
可选地,所述根据分隔符将所述争议焦点内容块分隔成x个争议焦点子内容包括:
判断所述争议焦点内容块中是否存在项目分隔符;
若存在,则根据所述项目分隔符将所述争议焦点内容块分割成x个争议焦点子内容;
若不存在,则获取所述争议焦点中的整句分隔符号,并根据所述整句分隔符号将所述争议焦点内容块分割成x个争议焦点子内容。
可选地,所述根据分隔符将所述法院观点内容块分隔成x个法院观点子内容包括:
获取所述法院观点内容块中的整句分隔符号,并根据所述整句分隔符号将所述法院观点内容块分割成x个法院观点子内容。
本发明第二方面提供了一种判决书内容提取的装置,包括:
获取单元,用于从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种;
处理单元,用于识别所述目标内容块中的分隔符;
所述处理单元,还用于根据所述分隔符将所述目标内容块分隔成x个目标子内容;
所述处理单元,还用于根据所述目标内容块的主题匹配目标抽取模型,所述目标分类模型包含目标抽取体系,所述目标抽取体系包含多个抽取节点,每个抽取节点对应所述目标内容块的一个目标子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述目标抽取模型用于使用抽取节点逐一对所述目标子内容进行内容抽取并输出;
输出单元,用于将所述经过分隔后的x个目标子内容输入目标抽取模型,并接收所述目标抽取模型的抽取结果,并将所述抽取结果输出。
本申请实施例第三方面提供了一种计算机装置,包括:
处理器、存储器、输入输出设备以及总线;
所述处理器、存储器、输入输出设备分别与所述总线相连;
所述处理器用于执行如前述实施例任一项所述的方法。
本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如前述实施例所述方法的步骤。
从以上技术方案可以看出,本申请实施例具有以下优点:获取判决书中的诉讼请求内容块,识别所述诉讼请求内容块中的分隔符,根据所述分隔符将所述诉讼请求内容块分隔成x个诉讼请求子内容,根据所述诉讼请求内容块匹配诉讼请求子抽取模型,所述诉讼请求分类模型包含诉讼请求抽取体系,所述诉讼请求抽取体系包含多个抽取节点,每个抽取节点对应所述诉讼请求内容块的一个子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述诉讼请求子抽取模型用于使用抽取节点逐一对所述诉讼请求子内容进行内容抽取并输出,将所述经过分隔后的x个诉讼请求子内容输入诉讼请求子抽取模型,并接收所述诉讼请求子抽取模型的诉讼请求抽取结果,并将所述诉讼请求抽取结果输出。其中,通过先定位至目标内容并整块获取,再通过预先设计的抽取模型对该目标内容中的句子进行逐一抽取,将结果按序输出实现了判决书内重要内容的提取并结构化输出。
附图说明
图1为本申请实施例中一种判决书内容提取的方法实施例的一个示意图;
图2为本申请实施例中一种判决书内容提取的方法实施例的另一个示意图;
图3为本申请实施例中一种判决书内容提取的方法实施例的另一个示意图;
图4为本申请实施例中一种判决书内容提取的方法实施例的另一个示意图;
图5为本申请实施例中一种判决书内容提取的方法实施例的另一个示意图;
图6为本申请实施例中一种判决书内容提取的方法实施例的另一个示意图;
图7为本申请实施例中一种判决书内容提取的方法实施例的另一个示意图;
图8为本申请实施例中一种判决书内容提取的方法实施例的另一个示意图;
图9为本申请实施例中一种判决书内容提取的装置实施例的一个示意图;
图10为本申请实施例中一种计算机装置的一个示意图。
具体实施方式
本发明实施例提供了一种借贷纠纷判决书提取方法及装置,用于实现判决书内重要内容的提取并结构化输出。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明中说明书对于方案的介绍以企业借贷纠纷判决书为例,根据企业借贷纠纷判决书中可能出现的内容以及情况对方案的流程进行介绍。
为了便于理解,下面对本申请实施例中的具体流程进行描述,请参阅图1,本申请实施例中一种判决书内容提取的方法的一个实施例包括:
101、从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种;
具体地,本申请提取判决书内容具体包括提取判决书中的诉讼请求、争议焦点以及法院观点三部分的内容块。由于判决书中的内容块开头具有规范性,可根据每一种内容块起始部分的固定表达方式设计出抽取表达式,即可根据该抽取表达式在一般的判决书中定位到该内容块的起始位置,并根据该内容块的下一内容块的起始位置获取该内容块的完整内容,如果以诉讼请求为例,根据诉讼请求起始部分的固定表达方式设计出抽取表达式,即可根据该抽取表达式在一般的判决书中定位到该内容块的起始位置,再根据在判决书中位于诉讼请求下一部分的争议焦点部分的起始位置定位到诉讼请求的结束位置,从而可以根据该诉讼请求的起始位置与结束位置获取诉讼请求内容块。
102、识别所述目标内容块中的分隔符;
具体地,内容块中一般包含较多信息,例如一份判决书内的诉讼请求内容块中可以包括偿还本金、偿还利息、承担诉讼费以及支付违约金等等,在进行内容提取时如果对诉讼请求内容块的全文进行提取会导致同时处理的数据量较大,从而可能出现提取出错误信息的问题。本实施例根据判决书的规范形式,其不同的内容之间例如对于本金的诉讼请求以及对于利息的诉讼请求在判决书内一般会采用分隔符进行分隔,具体地分隔符可以为“1、”与“1)”等一般在文件内表示项目分隔的符号,也可以为“。”或者“;”表示句子分隔的符号。
103、根据所述分隔符将所述目标内容块分隔成x个目标子内容;
具体地,根据上述识别到的分隔符将目标内容块内容分割成对应数量的子内容。由于子内容是根据分隔符进行划分的,所以分隔出的子内容与分隔符内容的数量相等,即x的大小与识别到的分隔符的数量一致,且每个子内容中都包含一个的具体的目标内容。如果以诉讼请求内容块为例,那么第一个分隔符所划分出来的子内容可以为关于偿还本金的诉讼请求,第二个分隔符所划分出来的子内容可以为关于偿还利息的诉讼请求。
104、根据所述目标内容块的主题匹配目标抽取模型,所述目标分类模型包含目标抽取体系,所述目标抽取体系包含多个抽取节点,每个抽取节点对应所述目标内容块的一个目标子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述目标抽取模型用于使用抽取节点逐一对所述目标子内容进行内容抽取并输出;
本实施例中,获取到目标内容块后,可以根据该内容块的主体匹配对应的抽取模型,例如为诉讼请求内容块匹配对应的诉讼请求子抽取模型以进行诉讼请求部分内容的抽取,下面从诉讼请求内容块、争议焦点内容块以及法院观点内容块三方面进行介绍:
具体地,本申请为实现对诉讼请求内容块的抽取设计诉讼请求子抽取模型,诉讼请求子抽取模型根据诉讼请求抽取体系设计而成,所述诉讼请求抽取体系包含多个抽取节点,每个抽取节点对应所述诉讼请求内容块的一个子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述诉讼请求子抽取模型用于使用抽取节点逐一对所述诉讼请求子内容进行内容抽取并输出。
进一步地,为了在具体使用过程中可以覆盖到诉讼请求中可能出现的子内容,诉讼请求抽取体系是根据大量企业借贷纠纷判决书内容中的诉讼请求部分进行设计而成,可以包括企业借贷纠纷判决书内容诉讼请求部分可能出现的所有诉讼请求。本申请的诉讼请求抽取体系根据每个可能会出现的诉讼请求子内容对应设计一个抽取节点,每个抽取节点对应该具体的诉讼请求内容块设计多种抽取表达式,以保证不出现数据遗漏的情况。
具体地,本申请为实现对争议焦点内容块的抽取设计争议焦点子抽取模型,争议焦点子抽取模型根据争议焦点抽取体系设计而成,所述争议焦点抽取体系包含多个抽取节点,每个抽取节点对应所述争议焦点内容块的一个子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述争议焦点子抽取模型用于使用抽取节点逐一对所述争议焦点子内容进行内容抽取并输出。
进一步地,为了在具体使用过程中可以覆盖争议焦点中能够出现的子内容,争议焦点抽取体系是根据大量企业借贷纠纷判决书内容中的争议焦点部分进行设计而成,可以包括企业借贷纠纷判决书内容争议焦点部分能够出现的所有争议焦点,本申请的争议焦点抽取体系根据每个可能会出现的争议焦点子内容对应设计一个抽取节点,每个抽取节点对应该具体的争议焦点内容块设计多种抽取表达式,以保证不出现数据遗漏的情况。
具体地,本申请为实现对法院观点内容块的抽取设计法院观点子抽取模型,法院观点子抽取模型根据法院观点抽取体系设计而成,所述法院观点抽取体系包含多个抽取节点,每个抽取节点对应所述法院观点内容块的一个子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述法院观点子抽取模型用于使用抽取节点逐一对所述法院观点子内容进行内容抽取并输出。
进一步地,为了在具体使用过程中可以覆盖法院观点中能够出现的子内容,法院观点抽取体系是根据大量企业借贷纠纷判决书内容中的法院观点部分进行设计而成,可以包括企业借贷纠纷判决书内容法院观点部分能够出现的所有法院观点,本申请的法院观点抽取体系根据每个可能会出现的法院观点子内容对应设计一个抽取节点,每个抽取节点对应该具体的法院观点内容块设计多种抽取表达式,以保证不出现数据遗漏的情况。
优选地,抽取表达式可以由一个或一个以上的如ZL201410155830.1公开的概念表达式,与一种或者多种语义算子组合构成。
105、将所述经过分隔后的x个目标子内容输入目标抽取模型,接收所述目标抽取模型的抽取结果,并将所述抽取结果输出。
本实施例中,对于已被分隔符所分隔开的多个子内容,将该多个子内容逐一输入至目标抽取模型,目标抽取模型为每个子内容与该子内容主题所匹配的抽取模型,以进行内容的抽取。
具体地,以诉讼请求内容块为例,将经过分隔符分隔后的诉讼请求内容块的多个子内容输入诉讼请求子抽取模型后,诉讼请求子抽取模型使用包含的所有抽取节点对每个子内容进行逐一抽取,具体的节点抽取过程中,每个节点使用包含的多个抽取表达式对每个子内容进行抽取,如果抽取节点在处理某一个子内容存在具体的抽取结果时,则认为该子内容与该抽取节点内容相符,进而将该抽取结果输出。
本发明实施例中,从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种,识别所述目标内容块中的分隔符,根据所述分隔符将所述目标内容块分隔成x个目标子内容,根据所述目标内容块的主题匹配目标抽取模型,所述目标分类模型包含目标抽取体系,所述目标抽取体系包含多个抽取节点,每个抽取节点对应所述目标内容块的一个目标子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述目标抽取模型用于使用抽取节点逐一对所述目标子内容进行内容抽取并输出,将所述经过分隔后的x个目标子内容输入目标抽取模型,接收所述目标抽取模型的抽取结果,并将所述抽取结果输出。其中,通过先定位至目标内容并整块获取,再通过预先设计的抽取模型对该目标内容中的句子进行逐一抽取,将结果按序输出实现了判决书内重要内容的提取并结构化输出。
本申请实施例中,基于图1所述实施例,对诉讼请求、争议焦点以及法院观点的内容划分进行进一步的介绍,具体请参见图2,本申请实施例中一种判决书内容提取的方法的另一个实施例包括:
201、根据第一预设表达式获取所述诉讼请求内容块的起始位置,所述第一预设表达式根据诉讼请求内容块的起始内容进行建立;
具体地,获取诉讼请求的内容可以为通过在企业借贷关系判决书中定位到诉讼请求内容块的起始位置以及结束位置,并将两个位置之间的内容作为诉讼请求内容块,具体地,由于企业借贷关系判决书中诉讼请求部分的起始位置表达方式都具有一定的规范性,根据该固定的表达方式设计表达式,并根据该表达式定位到该起始位置即可。
202、根据第二预设表达式获取所述争议焦点内容块的起始位置,所述第二预设表达式根据争议焦点内容块的起始内容进行建立;
具体地,获取争议焦点的内容可以为通过在企业借贷关系判决书中定位到争议焦点内容块的起始位置以及结束位置,并将两个位置之间的内容作为争议焦点内容块,具体地,由于企业借贷关系判决书中诉讼请求部分的起始位置表达方式都具有一定的规范性,根据该固定的表达方式设计表达式,并根据该表达式定位到该起始位置即可。
203、根据第三预设表达式获取所述法院观点内容块的起始位置,所述第一预设表达式根据诉讼请求内容块的起始内容进行建立;
具体地,获取法院观点的内容可以为通过在企业借贷关系判决书中定位到法院观点内容块的起始位置以及结束位置,并将两个位置之间的内容作为法院观点内容块,具体地,由于企业借贷关系判决书中法院观点部分的起始位置表达方式都具有一定的规范性,根据该固定的表达方式设计表达式,并根据该表达式定位到该起始位置即可。
204、根据第四预设表达式获取所述法院观点内容块的结束位置,所述第一预设表达式根据诉讼请求内容块的结束内容进行建立;
具体地,企业借贷关系判决书中法院观点的下一部分为判定结果部分,本申请定位到法院观点结束位置的方法为定位到判定结果的起始位置的方法,即根据判定结果部分内容的固定表达方式设计抽取表达式,并使用该抽取表达式定位到该判定结果内容的起始部分,并将该判定结果内容的起始部分作为法院观点内容块的结束部分。
205、划分所述诉讼请求内容块的起始位置至所述争议焦点内容块的起始位置作为诉讼请求内容块,划分所述争议焦点内容块的起始位置至所述法院观点内容块的起始位置作为争议焦点内容块,划分所述法院观点内容块的起始位置至所述法院观点内容块的结束位置作为法院观点内容块。
具体地,由于在企业借贷关系判决书中,诉讼请求、争议焦点、法院观点以及判定结果的顺序是一定地,所以当定位到上述诉讼请求、争议焦点、法院观点以及判定结果的起始位置时,诉讼请求内容块的起始位置至所述争议焦点内容块的起始位置即为诉讼请求部分的全部内容,争议焦点内容块的起始位置至所述法院观点内容块的起始位置即为争议焦点部分的全部内容,法院观点内容块的起始位置至所述法院观点内容块的结束位置即为法院观点部分的全部内容。
本申请实施例中,基于图1所述实施例,对诉讼请求、争议焦点以及法院观点的抽取体系进行进一步的介绍,具体请参见图3,本申请实施例中一种判决书内容提取的方法的另一个实施例包括:
301、建立所述目标内容抽取体系,所述抽取体系由目标分类模型内抽取节点的名称以及所述抽取节点内的抽取表达式组成,所述目标内容抽取体系根据目标内容文本的表达方式建立。
具体地,为了使得在实际的企业借贷关系判决书内容提取的过程中不存在遗漏数据的情况,本申请通过学习大量企业借贷纠纷判决书内容中的诉讼请求部分设计出诉讼请求抽取节点列表,并根据每个抽取节点对应的诉讼请求的具体内容设计多种抽取表达式,对应一个诉讼请求的具体内容在抽取体系中的体现即为一个抽取节点以及多个抽取表达式;通过学习大量企业借贷纠纷判决书内容中的争议焦点部分设计出争议焦点抽取节点列表,并根据每个抽取节点对应的争议焦点的具体内容设计多种抽取表达式,对应一个争议焦点的具体内容在抽取体系中的体现即为一个抽取节点以及多个抽取表达式;学习大量企业借贷纠纷判决书内容中的法院观点部分设计出法院观点抽取节点列表,并根据每个抽取节点对应的法院观点的具体内容设计多种抽取表达式,对应一个法院观点的具体内容在抽取体系中的体现即为一个抽取节点以及多个抽取表达式。
本申请实施例中,基于图1所述实施例,对三种内容块内容上的区别进行进一步的介绍,具体请参见图4,本申请实施例中一种判决书内容提取的方法的另一个实施例包括:
401、当所述目标内容块为诉讼请求内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示请求赔偿的内容。
具体地,诉讼请求内容块所包含的内容可以表示企业借贷纠纷判决书中主张赔偿的部分,示例性地,可以包括:偿还本金、偿还利息、支付律师费、支付违约金、承担涉案费、支付保证金等内容,根据该部分主张赔偿的内容设计对应的节点,共同组成了诉讼请求子抽取模型。
402、当所述目标内容块为争议焦点内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示事实判定的内容。
具体地,争议焦点内容块所包含的内容可以表示企业借贷纠纷判决书中事实判定的部分,即诉讼双方的正义点,示例性地,可以包括:还款人认定、诉讼时效问题、优先受偿权问题、逾期利息计算问题等内容,根据该部分事实判定的内容设计对应的节点,共同组成了诉讼请求子抽取模型。
403、当所述目标内容块为法院观点内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示法院判定结果的内容。
具体地,法院观点内容块所包含的内容可以表示企业借贷纠纷判决书中法院判定结果的部分,示例性地,可以包括:借贷合同有效、不属于违约行为、承担违约责任、不承担违约责任等内容,根据该不分法院判定结果的内容设计对应的节点,共同组成了法院观点子抽取模型。
本申请实施例中,基于图1所述实施例,对将诉讼请求内容块分割成多个诉讼请求子内容的过程进行进一步的介绍,具体请参见图5,本申请实施例中一种判决书内容提取的方法的另一个实施例包括:
501、判断所述诉讼请求内容块中是否存在项目分隔符;
具体地,诉讼请求内容块中包含较多信息,例如一份判决书内的诉讼请求内容块中可以包括偿还本金、偿还利息、承担诉讼费以及支付违约金等等,在进行内容提取时如果对诉讼请求内容块的全文进行提取会导致同时处理的数据量较大,从而可能会出现提取出错误信息的问题,根据判决书的规范形式,不同的内容之间例如对于本金的诉讼请求以及对于利息的诉讼请求在判决书内一般采用分隔符进行分隔,具体地分隔符可以为“1、”与“1)”等一般在文件内表示项目分隔的符号,也可以为“。”或者“;”表示句子分隔的符号。
进一步地,为了保证内容抽取时的正确率更高,可以将诉讼请求内容块分隔成多个诉讼请求子内容再进行逐一抽取,根据判决书的表达方式,根据项目分隔符号所分隔的一般每个项目符号所对应的内容均包含判决书内较为重要的信息,即每个项目分隔符号后面的内容一般都可以通过抽取模型抽取到具体的结果进而输出。
502、若存在,则根据所述项目分隔符将所述诉讼请求内容块分割成x个诉讼请求子内容;
具体地,当判断出当前诉讼请求内容块中存在形如“1、”与“1)”的项目分隔符号时,便根据该项目分隔符号将诉讼请求分割成多个子内容,以使得诉讼请求子抽取模型对每个分割后的子内容进行逐一处理。
503、若不存在,则获取诉讼请求内容块中的整句分隔符号,并根据所述整句分隔符号将所述诉讼请求内容块分割成x个诉讼请求子内容。
具体地,因为在企业借贷关系判决书中,如果“偿还本金”“偿还利息”被视为判决书中的一个信息点,那么根据判决书的表达方式来看,每一个整句不会存在两个或两个以上的信息点,所以当诉讼请求内容块中不含有形如“1、”与“1)”的项目分隔符号,那么则根据“。”或者“;”可以表示句子分隔的符号对诉讼请求内容块进行内容分割。
本申请实施例中,基于图1所述实施例,对将争议焦点内容块分割成多个争议焦点子内容的过程进行进一步的介绍,具体请参见图6,本申请实施例中一种判决书内容提取的方法的另一个实施例包括:
601、判断所述争议焦点内容块中是否存在项目分隔符;
具体地,争议焦点内容块中包含较多信息,例如一份判决书内的争议焦点内容块中可以包括还款人认定、担保人认定以及诉讼时效问题等等,在进行内容提取时如果对争议焦点内容块的全文进行提取会导致同时处理的数据量较大,从而可能会出现提取出错误信息的问题,根据判决书的规范形式,不同的内容之间例如对于还款人认定的内容以及对于担保人认定的内容在判决书内一般采用分隔符进行分隔,具体地分隔符可以为“1、”与“1)”等一般在文件内表示项目分隔的符号,也可以为“。”或者“;”表示句子分隔的符号。
进一步地,为了保证内容抽取时的正确率更高,可以将争议焦点内容块分隔成多个争议焦点子内容再进行逐一抽取,根据判决书的表达方式,根据项目分隔符号所分隔的一般每个项目符号所对应的内容均包含判决书内较为重要的信息,即每个项目分隔符号后面的内容一般都可以通过抽取模型抽取到具体的结果进而输出。
602、若存在,则根据所述项目分隔符将所述争议焦点内容块分割成y个争议焦点子内容;
具体地,当判断出当前争议焦点内容块中存在形如“1、”与“1)”的项目分隔符号时,便根据该项目分隔符号将争议焦点分割成多个子内容,以使得争议焦点子抽取模型对每个分割后的子内容进行逐一处理。
603、若不存在,则获取所述争议焦点中的整句分隔符号,并根据所述整句分隔符号将所述争议焦点内容块分割成y个争议焦点子内容。
具体地,因为在企业借贷关系判决书中,如果“欠款数额”,“担保人认定”被视为判决书中的一个信息点,那么根据判决书的表达方式来看,每一个整句不会存在两个或两个以上的信息点,所以当争议焦点内容块中不含有形如“1、”与“1)”的项目分隔符号,那么则根据“。”或者“;”可以表示句子分隔的符号对争议焦点内容块进行内容分割。
本申请实施例中,基于图1所述实施例,对将法院观点内容块分割成多个法院观点子内容的过程进行进一步的介绍,具体请参见图7,本申请实施例中一种判决书内容提取的方法的另一个实施例包括:
701、获取所述法院观点内容块中的整句分隔符号,并根据所述整句分隔符号将所述法院观点内容块分割成z个法院观点子内容。
具体地,法院观点与上述的诉讼请求以及争议焦点的内容形式存在一定差别,法院观点内容块在判决书内一般不以项目的形式存在,而是以句子的形式进行观点的陈述,所以在对法院观点内容块进行分隔时,直接获取“。”或者“;”等可以表示句子分隔的符号对法院观点内容块进行内容分割,获取多个法院观点的子内容。
本申请实施例中,基于图1所述实施例,对将抽取结果进行输出的过程进行进一步的介绍,具体请参见图8,本申请实施例中一种判决书内容提取的方法的另一个实施例包括:
801、将所述诉讼请求子抽取模型中存在诉讼请求抽取结果的抽取节点与所述第一抽取结果进行匹配输出;
具体地,将经过分割后的多个诉讼请求子内容逐一输入诉讼请求子抽取模型之后,诉讼请求子抽取模型使用包含的多个抽取节点逐一对该输入的诉讼请求子内容进行抽取,由于诉讼请求子抽取模型所包含的抽取节点是经过对判决书的大量学习之后概括得来,可能会出现诉讼请求子抽取模型的抽取节点中包括,但是当前进行内容提取的诉讼请求内容块中不包括的情况。例如,某一个具体的企业借贷关系判决书中诉讼请求内容块中不包括“支付误工费”、“支付手续费”以及“支付交通费”等诉求,但是诉讼请求子抽取模型中却包括对应上述三个内容的抽取节点,那么处理过程中对应上述三个内容的抽取节点就抽取不到任何结果,最后抽取模型结果的输出就是先筛选出存在抽取结果的抽取节点,并将该抽取结果与抽取节点的名称输出。
802、将所述争议焦点子抽取模型中存在争议焦点抽取结果的抽取节点与所述第二抽取结果进行匹配输出;
具体地,将经过分割后的多个争议焦点子内容逐一输入争议焦点子抽取模型之后,诉争议焦点子抽取模型使用包含的多个抽取节点逐一对该输入的争议焦点子内容进行抽取,由于争议焦点子抽取模型所包含的抽取节点是经过对判决书的大量学习之后概括得来,可能会出现争议焦点子抽取模型的抽取节点中包括,但是当前进行内容提取的争议焦点内容块中不包括的情况。例如,某一个具体的企业借贷关系判决书中诉讼请求内容块中不包括“抵押担保是否有效问题”、“法律关系的界定”以及“债券问题”等诉求,但是争议焦点子抽取模型中却包括对应上述三个内容的抽取节点,那么处理过程中对应上述三个内容的抽取节点就抽取不到任何结果,最后抽取模型结果的输出就是先筛选出存在抽取结果的抽取节点,并将该抽取结果与抽取节点的名称输出。
803、将所述法院观点子抽取模型中存在法院观点抽取结果的抽取节点与所述第三抽取结果进行匹配输出。
具体地,将经过分割后的多个法院观点子内容逐一输入法院观点子抽取模型之后,法院观点子抽取模型使用包含的多个抽取节点逐一对该输入的法院观点子内容进行抽取,由于法院观点子抽取模型所包含的抽取节点是经过对判决书的大量学习之后概括得来,可能会出现法院观点子抽取模型的抽取节点中包括,但是当前进行内容提取的诉讼请求内容块中不包括的情况。例如,某一个具体的企业借贷关系判决书中诉讼请求内容块中不包括“支付部分违约金”、“支付全部违约金”以及“承担抵押担保责任”等诉求,但是法院观点子抽取模型中却包括对应上述三个内容的抽取节点,那么处理过程中对应上述三个内容的抽取节点就抽取不到任何结果,最后抽取模型结果的输出就是先筛选出存在抽取结果的抽取节点,并将该抽取结果与抽取节点的名称输出。
上面对本申请实施例中的方法部分进行了介绍,下面从虚拟装置的角度对本申请实施例进行说明。
获取单元901,用于从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种;
处理单元902,用于识别所述目标内容块中的分隔符;
所述处理单元902,还用于根据所述分隔符将所述目标内容块分隔成x个目标子内容;
所述处理单元902,还用于根据所述目标内容块的主题匹配目标抽取模型,所述目标分类模型包含目标抽取体系,所述目标抽取体系包含多个抽取节点,每个抽取节点对应所述目标内容块的一个目标子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述目标抽取模型用于使用抽取节点逐一对所述目标子内容进行内容抽取并输出;
输出单元903,用于将所述经过分隔后的x个目标子内容输入目标抽取模型,并接收所述目标抽取模型的抽取结果,并将所述抽取结果输出。
下面从实体装置的角度对本申请实施例中的计算机装置进行描述,请参阅图10,本申请实施例中计算机装置的一个实施例包括:
该计算机装置1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,CPU)1001(例如,一个或一个以上处理器)和存储器1005,该存储器1005中存储有一个或一个以上的应用程序或数据。
其中,存储器1005可以是易失性存储或持久存储。存储在存储器605的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1001可以设置为与存储器1005通信,在智能终端1000上执行存储器1005中的一系列指令操作。
该计算机装置1000还可以包括一个或一个以上电源1002,一个或一个以上有线或无线网络接口1003,一个或一个以上输入输出接口1004,和/或,一个或一个以上操作系统,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。
可以理解的是,在本申请的各种实施例中,上述各步骤的序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种借贷纠纷判决书提取方法,其特征在于,包括:
从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种;
识别所述目标内容块中的分隔符;
根据所述分隔符将所述目标内容块分隔成x个目标子内容;
根据所述目标内容块的主题匹配目标抽取模型,所述目标分类模型包含目标抽取体系,所述目标抽取体系包含多个抽取节点,每个抽取节点对应所述目标内容块的一个目标子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述目标抽取模型用于使用抽取节点逐一对所述目标子内容进行内容抽取并输出;
将所述经过分隔后的x个目标子内容输入目标抽取模型,接收所述目标抽取模型的抽取结果,并将所述抽取结果输出。
2.根据权利要求1所述的方法,其特征在于,所述从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种,包括:
根据第一预设表达式获取所述诉讼请求内容块的起始位置,所述第一预设表达式根据诉讼请求内容块的起始内容进行建立;
根据第二预设表达式获取所述争议焦点内容块的起始位置,所述第二预设表达式根据争议焦点内容块的起始内容进行建立;
根据第三预设表达式获取所述法院观点内容块的起始位置,所述第一预设表达式根据诉讼请求内容块的起始内容进行建立;
根据第四预设表达式获取所述法院观点内容块的结束位置,所述第一预设表达式根据诉讼请求内容块的结束内容进行建立;
划分所述诉讼请求内容块的起始位置至所述争议焦点内容块的起始位置作为诉讼请求内容块;
划分所述争议焦点内容块的起始位置至所述法院观点内容块的起始位置作为争议焦点内容块;
划分所述法院观点内容块的起始位置至所述法院观点内容块的结束位置作为法院观点内容块。
3.根据权利要求1所述的方法,其特征在于,在所述从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种之前,包括:
建立所述目标内容抽取体系,所述抽取体系由目标分类模型内抽取节点的名称以及所述抽取节点内的抽取表达式组成,所述目标内容抽取体系根据目标内容文本的表达方式建立。
4.根据权利要求3所述的方法,其特征在于,当所述目标内容块为诉讼请求内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示请求赔偿的内容。
5.根据权利要求3所述的方法,其特征在于,当所述目标内容块为争议焦点内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示事实判定的内容。
6.根据权利要求3所述的方法,其特征在于,当所述目标内容块为法院观点内容块时,所述目标分类模型内抽取节点用于抽取企业借贷纠纷中表示法院判定结果的内容。
7.根据权利要求1所述的方法,其特征在于,所述根据分隔符将所述诉讼请求内容块分隔成x个诉讼请求子内容包括:
判断所述诉讼请求内容块中是否存在项目分隔符;
若存在,则根据所述项目分隔符将所述诉讼请求内容块分割成x个诉讼请求子内容;
若不存在,则获取诉讼请求内容块中的整句分隔符号,并根据所述整句分隔符号将所述诉讼请求内容块分割成x个诉讼请求子内容。
8.根据权利要求1所述的方法,其特征在于,所述根据分隔符将所述争议焦点内容块分隔成x个争议焦点子内容包括:
判断所述争议焦点内容块中是否存在项目分隔符;
若存在,则根据所述项目分隔符将所述争议焦点内容块分割成x个争议焦点子内容;
若不存在,则获取所述争议焦点中的整句分隔符号,并根据所述整句分隔符号将所述争议焦点内容块分割成x个争议焦点子内容。
9.根据权利要求1所述的方法,其特征在于,所述根据分隔符将所述法院观点内容块分隔成x个法院观点子内容包括:
获取所述法院观点内容块中的整句分隔符号,并根据所述整句分隔符号将所述法院观点内容块分割成x个法院观点子内容。
10.一种借贷纠纷判决书提取的装置,其特征在于,包括:
获取单元,用于从借贷纠纷判决书中获取目标内容块,所述目标内容块为诉讼请求内容块、争议焦点内容块、法院观点内容块中的一种;
处理单元,用于识别所述目标内容块中的分隔符;
所述处理单元,还用于根据所述分隔符将所述目标内容块分隔成x个目标子内容;
所述处理单元,还用于根据所述目标内容块的主题匹配目标抽取模型,所述目标分类模型包含目标抽取体系,所述目标抽取体系包含多个抽取节点,每个抽取节点对应所述目标内容块的一个目标子内容,所述抽取节点包含抽取表达式列表,所述抽取表达式列表包含多个抽取表达式,所述目标抽取模型用于使用抽取节点逐一对所述目标子内容进行内容抽取并输出;
输出单元,用于将所述经过分隔后的x个目标子内容输入目标抽取模型,并接收所述目标抽取模型的抽取结果,并将所述抽取结果输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010613381.6A CN111784505A (zh) | 2020-06-30 | 2020-06-30 | 一种借贷纠纷判决书提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010613381.6A CN111784505A (zh) | 2020-06-30 | 2020-06-30 | 一种借贷纠纷判决书提取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111784505A true CN111784505A (zh) | 2020-10-16 |
Family
ID=72760859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010613381.6A Pending CN111784505A (zh) | 2020-06-30 | 2020-06-30 | 一种借贷纠纷判决书提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111784505A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160140210A1 (en) * | 2014-11-19 | 2016-05-19 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for automatic identification of potential material facts in documents |
WO2017113645A1 (zh) * | 2015-12-30 | 2017-07-06 | 百度在线网络技术(北京)有限公司 | 信息提取方法和装置 |
WO2020052184A1 (zh) * | 2018-09-10 | 2020-03-19 | 平安科技(深圳)有限公司 | 裁判文书处理方法、装置、计算机设备和存储介质 |
CN111222326A (zh) * | 2020-01-15 | 2020-06-02 | 中科鼎富(北京)科技发展有限公司 | 裁判文书的信息抽取方法及装置 |
CN111259631A (zh) * | 2020-01-15 | 2020-06-09 | 中科鼎富(北京)科技发展有限公司 | 一种裁判文书结构化方法及装置 |
CN111274354A (zh) * | 2020-01-15 | 2020-06-12 | 中科鼎富(北京)科技发展有限公司 | 一种裁判文书结构化方法及装置 |
CN111291548A (zh) * | 2020-02-12 | 2020-06-16 | 中科鼎富(北京)科技发展有限公司 | 一种从法院文书获取信息的方法及装置 |
CN111310446A (zh) * | 2020-01-15 | 2020-06-19 | 中科鼎富(北京)科技发展有限公司 | 裁判文书的信息抽取方法及装置 |
-
2020
- 2020-06-30 CN CN202010613381.6A patent/CN111784505A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160140210A1 (en) * | 2014-11-19 | 2016-05-19 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for automatic identification of potential material facts in documents |
WO2017113645A1 (zh) * | 2015-12-30 | 2017-07-06 | 百度在线网络技术(北京)有限公司 | 信息提取方法和装置 |
WO2020052184A1 (zh) * | 2018-09-10 | 2020-03-19 | 平安科技(深圳)有限公司 | 裁判文书处理方法、装置、计算机设备和存储介质 |
CN111222326A (zh) * | 2020-01-15 | 2020-06-02 | 中科鼎富(北京)科技发展有限公司 | 裁判文书的信息抽取方法及装置 |
CN111259631A (zh) * | 2020-01-15 | 2020-06-09 | 中科鼎富(北京)科技发展有限公司 | 一种裁判文书结构化方法及装置 |
CN111274354A (zh) * | 2020-01-15 | 2020-06-12 | 中科鼎富(北京)科技发展有限公司 | 一种裁判文书结构化方法及装置 |
CN111310446A (zh) * | 2020-01-15 | 2020-06-19 | 中科鼎富(北京)科技发展有限公司 | 裁判文书的信息抽取方法及装置 |
CN111291548A (zh) * | 2020-02-12 | 2020-06-16 | 中科鼎富(北京)科技发展有限公司 | 一种从法院文书获取信息的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377759B (zh) | 事件关系图谱构建方法及装置 | |
CN106776897B (zh) | 一种用户画像标签确定方法及装置 | |
CN109325121B (zh) | 用于确定文本的关键词的方法和装置 | |
CN111400392A (zh) | 多源异构数据处理方法及装置 | |
WO2020077350A1 (en) | Adaptable systems and methods for discovering intent from enterprise data | |
CN111222308A (zh) | 案件判决书生成方法、装置、电子设备 | |
CN110489559A (zh) | 一种文本分类方法、装置及存储介质 | |
CN109960719A (zh) | 一种文件处理方法和相关装置 | |
Candaş et al. | Automated identification of vagueness in the FIDIC silver book conditions of contract | |
CN111178701A (zh) | 一种基于特征衍生技术的风险控制方法方法、装置和电子设备 | |
CN110782232A (zh) | 业务流程可视化配置方法、装置、电子设备及存储介质 | |
US9442918B2 (en) | Perspective data management for common features of multiple items | |
CN111784505A (zh) | 一种借贷纠纷判决书提取方法及装置 | |
CN112784015B (zh) | 信息识别方法和装置、设备、介质和程序 | |
CN113569929B (zh) | 基于小样本扩展的互联网服务提供方法、装置及电子设备 | |
US11120204B2 (en) | Comment-based article augmentation | |
CN111753538A (zh) | 离婚纠纷裁判文书要素提取方法及装置 | |
CN114443803A (zh) | 一种文本信息挖掘方法、装置、电子设备和存储介质 | |
CN111143559A (zh) | 基于三元组的词云展示方法及装置 | |
KR100769465B1 (ko) | 카테고리 매칭을 이용한 질의어 매칭 방법 및 질의어 매칭시스템 | |
Tschirschwitz et al. | A dataset for analysing complex document layouts in the digital humanities and its evaluation with krippendorff’s alpha | |
CN111311197A (zh) | 差旅数据处理方法及装置 | |
CN111352988B (zh) | 针对法务信息的大数据仓库存储、分析、提取系统 | |
CN111859977B (zh) | 一种语义分析方法、装置、电子设备及存储介质 | |
CN117435561A (zh) | 政策文件解读方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |