CN111401047A - 法律文书的争议焦点生成方法、装置及计算机设备 - Google Patents
法律文书的争议焦点生成方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN111401047A CN111401047A CN201811635959.7A CN201811635959A CN111401047A CN 111401047 A CN111401047 A CN 111401047A CN 201811635959 A CN201811635959 A CN 201811635959A CN 111401047 A CN111401047 A CN 111401047A
- Authority
- CN
- China
- Prior art keywords
- dispute focus
- dispute
- legal document
- case elements
- legal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种法律文书的争议焦点生成方法、装置及计算机设备,对于未包含预定争议焦点信息的当前法律文书,将提取该当前法律文书包含的案件要素,按照预先构建的案件要素与争议焦点之间的关联关系,自动生成当前法律文书的争议焦点,解决了传统方案依赖文本内容描述,导致法律文书中未直接描述争议焦点信息的情况下,无法生成该法律文书的争议焦点的技术问题。
Description
技术领域
本申请涉及数据处理技术领域,更具体地说是涉及一种法律文书的争议焦点生成方法、装置及计算机设备。
背景技术
在司法领域,法官在开庭中必须要归纳双方的争议焦点,然后法庭调查围绕双方争议的焦点展开,可见,准确归纳案件的争议焦点,是法官庭审和书写裁判文书的关键步骤。
目前,通常是在人工查看司法案例后,根据经验整理争议焦点,并对整理出的争议焦点进行关键词总结,当需要对案件的法律文书进行争议焦点归纳时,直接在法律文书“本院认为”段落进行关键词匹配,得到该法律文书的争议焦点,帮助法官进行案件的后续处理。
但是,现有的这种争议焦点生成方法中,用来进行关键词总结的争议焦点来源案件有限,导致预先整理出的争议焦点不够全面,降低了通过关键词匹配方式得到的法律文书的争议焦点的准确性。且对于未明确描述争议焦点信息的法律文书,这种关键词匹配的方式,将无法生成这类法律文书的争议焦点。
发明内容
鉴于上述问题,本申请提供一种克服上述问题或者至少部分地解决上述问题的法律文书的争议焦点生成方法、装置及计算机设备。
为了解决上述问题,本申请提供了以下技术方案:
一种法律文书的争议焦点生成方法,所述方法包括:
检测当前法律文书是否包含预定争议焦点信息;
如果否,提取所述当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点。
可选的,所述案件要素与争议焦点之间的关联关系的构建过程包括:
提取现有法律文书包含的多个案件要素;
筛选现有法律文书中具有预定争议焦点信息的样本法律文书;
提取所述样本法律文书包含的多条争议焦点;
构建所述多个案件要素与所述多条争议焦点之间的关联关系。
可选的,所述构建所述多个案件要素与所述多条争议焦点之间的关联关系,包括:
根据每条争议焦点关联到的案件要素,对所述多个案件要素和所述多条争议焦点进行组合,得到所述争议焦点与至少一个所述案件要素的关联关系。
可选的,所述利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点,包括:
若提取到的案件要素的数量为多个,确定所述多个案件要素之间的案件要素组合;
依据已构建的案件要素与争议焦点之间的关联关系,获取与确定任意一个案件要素或所述案件要素组合对应的争议焦点,并将获取的争议焦点作为所述当前法律文书的争议焦点。
可选的,所述提取现有法律文书包含的多种案件要素,包括:
对现有法律文书进行语义分段,得到所述现有法律文书的多个语义段落;
提取多个语义段落各自包含的案件要素;
按照所述多个语义段落,对提取的案件要素进行分类,并对分类结果进行存储。
可选的,提取所述样本法律文书包含的多条争议焦点,包括:
通过文本解析方式,从所述样本法律文本中提取多条争议焦点信息;
检测每一条争议焦点信息是否符合争议焦点要求;
如果符合,将所述争议焦点信息作为一条争议焦点进行存储;
若不符合,对所述争议焦点信息进行拆分处理,得到所述争议焦点信息包含的多条争议焦点,并对所述多条争议焦点进行存储。
可选的,所述筛选现有法律文书中具有预定争议焦点信息的样本法律文书,包括:
对现有法律文书进行预定争议焦点信息的全文检索,得到样本法律文书;
所述提取所述样本法律文书包含的多条争议焦点,包括:
利用正则表达式对所述样本法律文书进行拆条处理,得到符合争议焦点要求的多条争议焦点。
一种法律文书的争议焦点生成装置,所述装置包括:
检测模块,用于检测当前法律文书是否包含预定争议焦点数据;
获取模块,用于在所述检测模块的检测结果为否的情况下,提取所述当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
生成模块,用于利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点。
一种存储介质,其上存储有程序,所述程序被处理器执行,实现如上所述的法律文书的争议焦点生成方法的各步骤。
一种计算机设备,所述计算机设备包括:
通信接口;
存储器,用于存储实现如上所述的法律文书的争议焦点生成方法的程序;
处理器,用于加载并执行所述存储器存储的程序,所述程序用于:
检测当前法律文书是否包含预定争议焦点信息;
如果否,获取已构建的案件要素与争议焦点之间的关联关系;
提取所述当前法律文书包含的案件要素;
利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点。
借由上述技术方案,本申请提供的法律文书的争议焦点生成方法,对于未包含预定争议焦点信息的当前法律文书,本实施例将提取从中包含的案件要素,进而利用提取到的案件要素,按照预先构建的案件要素与争议焦点之间的关联关系,自动生成该法律文书的争议焦点,解决了传统方案依赖文本内容描述,导致法律文书中未直接描述争议焦点信息的情况下,无法生成该法律文书的争议焦点的技术问题。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的一种法律文书的争议焦点生成方法的流程示意图;
图2示出了本申请实施例提供的法律文书的争议焦点生成方法中,案件要素与争议焦点之间的关联关系的一种构建过程的流程示意图;
图3示出了本申请实施例提供的法律文书的争议焦点生成方法中,案件要素与争议焦点之间的关联关系的另一种构建过程的流程示意图;
图4示出了本申请实施例提供的另一种法律文书的争议焦点生成方法的流程示意图;
图5示出了本申请实施例提供的又一种法律文书的争议焦点生成方法的流程示意图;
图6示出了本申请实施例提供的一种法律文书的争议焦点生成装置的结构示意图;
图7示出了本申请实施例提供的另一种法律文书的争议焦点生成装置的结构示意图;
图8示出了本申请实施例提供的另一种法律文书的争议焦点生成装置的结构示意图;
图9示出了本申请实施例提供的又一种法律文书的争议焦点生成装置的结构示意图;
图10示出了本申请实施例提供的一种计算机设备的硬件结构示意图。
具体实施方式
本申请的发明人经过反复试验研究,提出利用案件要素自动生成争议焦点的争议焦点生成方法,具体可以先基于文本解析技术挖掘出案件要素,再通过案件要素不同方式的组合,以及案件要素与争议焦点之间的关联关系,实现争议焦点的自动生成。
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,为本申请实施例提供的一种法律文书的争议焦点生成方法的流程示意图,该方法可以应用于计算机设备,该计算机设备可以是终端或服务器,如图1所示,该方法可以包括但并不局限于以下步骤:
步骤S11,检测当前法律文书中是否包含预定争议焦点信息,如果包含,进入步骤S12;如果未包含;执行步骤S13;
本实施例实际应用中,法律文书的格式通常有一定规范要求,若其包含了争议焦点的描述内容,通常对该描述内容的格式也会有一定要求,因此,本实施例可以直接筛选当前法律文书是否包含符合预定格式要求的内容,即预定争议焦点信息,通过这种方式来检测当前法律文书是否包含直观的争议焦点描述内容。
如,可以检测是否包含“具有的争议内容如下:……”,“存在……等争议焦点内容”,“本院认为……”等等预定格式,此时,可以直接从这些内容中确定当前法律文书的争议焦点,简单方便。
其中,争议焦点可以是法官归纳并经过当事人认可的关于证据、事实和法律适用争议的关键问题,既是庭审的主要内容,也是制作裁判文书的主线,方便组织证据认定、事实认定和说理部分的论述内容。可见,对于不同案件来说,其争议焦点内容往往是不同,本申请对争议焦点的格式及内容不做限定。
另外,需要说明,本申请对如何确定预定争议焦点信息的方式也不做限定,即对上述预定格式的格式内容不做限定,如其可以根据当前法律文书的具体类型或出具方等因素确定。
步骤S12,提取该预定争议焦点信息,生成当前法律文书的争议焦点;
继上文分析,本实施例可以直接将符合预定格式的提取出来,即实现对预定争议焦点信息的提取,进而据此得到当前法律文书的争议焦点,具体实现方法本申请不做限定。
步骤S13,提取当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
在实际应用中,由于并不是所有的法律文书都会明确标注哪部分描述的争议焦点内容,很多法律文书并未采用固定格式撰写,这就导致采用上文描述的方式,无法直接提取当前法律文书中的争议焦点。
这种情况下,发明人通过对法律文书的争议焦点进行研究,发现争议焦点与法律文书包含的案件要素有很大关系,此处案件要素可以是对案件的当事人诉请、抗辩、基本事实、证据等数据的特征信息,进行概况和提炼,形成的裁判要件。因此,发明人认为在确定法律文书包含的案件要素后,能够由此得知该法律文书的争议焦点。
基于此,本实施例可以通过对现有的法律文书包含的案件要素及争议焦点进行分析,预先构建的案件要素与争议焦点之间的关联关系,这样,在无法从当前法律文书直接检测出预定争议焦点信息,即在当前法律文书并未明确描述争议焦点信息的情况下,本实施例可以提取当前法律文书包含的案件要素,以便按照预先构建的案件要素与争议焦点之间的关联关系,生成当前法律文书的争议焦点信息,具体实现过程本实施例不做限定。
可选的,本实施例可以采用语义分析技术,从当前法律文书中提取案件要素,具体提取方法不作限定。而关于预先构建的案件要素与争议焦点之间的关联关系,通常可以是多个案件要素与多条争议焦点之间的关联关系,更具体地说,可以表示一条争议焦点与至少一个案件要素之间的关联关系。
可见,该争议焦点与案件要素之间的关联关系并不是固定的一一对应关系,可以通过将案件要素按照不同方式组合后,确定与组合后的案件要素之间的关联关系等等,具体实现过程可以参照下文具体实施例的描述,但并不局限于本文实施例描述的该关联关系的构建方法。
步骤S14,利用提取到的案件要素,按照该关联关系,生成当前法律文书的争议焦点。
在提取当前法律文书包含的所有案件要素后,能够直接利用预先构建的案件要素与争议焦点之间的关联关系,查询与当前法律文书包含的案件要素关联的争议焦点,即可得到当前法律文书的争议焦点,解决了传统方案依赖文本内容描述,导致法律文书中未直接描述争议焦点信息的情况下,无法生成该法律文书的争议焦点的技术问题。
在本申请另一可选实施例中,参照图2,为本申请实施例提供的另一种法律文书的争议焦点生成方法的流程示意图,该方法可以应用于计算机设备,本实施例主要是对上文实施例的案件要素和争议焦点之间的关联关系的构建过程进行描述,如图2所示,该方法可以包括但并不局限于以下步骤:
步骤S21,提取现有法律文书包含的多个案件要素;
其中,本实施例该案件要素的类别可以基于现有法律文书的语义段落确定,也就是说,本实施例可以采用语义分析技术,提取每一个现有法律文书中各语义段落包含的案件要素,之后,可以按照案件要素所属语义段落,归纳得到现有法律文书包含的多种案件要素。
步骤S22,筛选现有法律文书中具有预定争议焦点信息的样本法律文书;
为了能够从不具有预定争议焦点信息的法律文书中,快速且准确提取出争议焦点,本实施例可以从现有法律文书中,选择具有预定争议焦点信息的法律文书为样本法律文书,进行后续处理。
其中,关于如何确定哪些法律文书具有预定生意焦点信息,可以结合上文对预定争议焦点信息的描述,如筛选具有采用预定格式的描述内容的法律文书作为样本法律文书等等,本实施例不再详述。
步骤S23,提取该样本法律文书包含的多条争议焦点;
由于该样本法律文书中包含预定争议焦点信息,如上述步骤S12的描述内容,本实施例能够直接从中生成每一个样本法律文书包含的至少一条争议焦点。
步骤S24,构建多个案件要素与多条争议焦点之间的关联关系。
本实施例对该如何构建多种案件要素与多条争议焦点之间的关联关系的实现方法不做限定,构建的该关联关系可以表示每一条争议焦点与至少一个案件要素的关联关系。
综上,本实施例可以利用现有的法律文书包含的案件要素和争议焦点,构建案件要素与争议焦点之间的关联关系,这样,当需要对未包含预定争议焦点信息的法律文书,生成其争议焦点时,就能够直接利用该关联关系生成。可见,本实施例提供的该关联关系的构建方法,为争议焦点的可靠生成奠定了基础,保证了生成争议焦点的准确性及完整性。
进一步地,本申请可以对上文可选实施例描述的,构建案件要素与争议焦点之间的关联关系的实现过程进行细化,但并不局限于本文描述的细化方案,如图3所示,该方法可以包括:
步骤S31,对现有法律文书进行语义分段,得到该现有法律文书的多个语义段落;
本实施例可以利用智能文书解析系统,对现有法律文书进行分段,实现对该现有法律文书中各类案件要素的数据范围界定,此时,得到的现有法律文书的语义段落可以包括诉请段、抗辩段、事实认定段、裁判结果段等段落。
需要说明,本实施例对如何实现对法律文书的语义段落划分的实现过程不做限定。
可选的,本申请可以领域预先训练得到的分段模块,对现有法律文书内容进行分析,确定该现有法律文书包含的多个语义段落。其中,该分段模型可以基于LSTM(LongShort-TermMemory,长短期记忆网络)算法,对样本数据进行训练得到,具体实现过程本实施例不做详述。
本实施例在此简单说明分段模块对法律文书的处理过程,首先,得到法律文书包含的所有句子后,可以根据词袋将句子转换成2000维的词向量,其中每个句子中最多包含50个词,之后,对该2000维的词向量进行降维处理,得到512维的词向量,此时可以利用LSTN算法再转换成256维度的句子向量,进一步转换为256维度的段落向量,经过LSTM对256维度的段落向量的运算,输出实现端对端模型的概率,由此确定各句子之间的分段,即得到法律文书的多个语义段落。
步骤S32,提取多个语义段落各自包含的案件要素;
可选的,本实施例可以通过不同的解析规则、语义分析等方法,解析各语义段落中包含的案件要素,由于法律文书中不同语义段落描述的内容不同,因此,从不同语义段落提取案件要素采用的提取方法可以不同,本实施例对此不做限定。
举例说明,本实施例以民事“离婚纠纷”案件要素抽取及归类为例:
在诉请段,可以利用正则匹配方式,得到该诉请段的解析规则,即“(双方|被告|原、被告|都|原告).{0,30}(?<!不|没有|非|没)(同意|自愿)[^。]{0,10}离婚”,从而按照该解析规则,从法律文书的诉请段提取“自愿离婚”要素。
在答辩段,利用正则匹配的方式,得到该答辩段的解析规则,即“(?<!(二)|(二)实施)(家庭暴力|家暴|殴打|拳打脚踢)”,从而按照该解析规则,从法律文书的答辩段提取“家庭暴力”要素;
在事实认定段,利用正则和语义分析方式,得到该事实认定段的解析规则,即“(称|提出|主张|存在|实施|遭受|受到|被|构成).{0,15}(家暴|家庭暴力|殴打).*损害赔偿”的规则,提取出因遭受家庭暴力造成损害赔偿的案件要素;
在裁判结果段,利用正则匹配的方式,得到该裁判结果段的解析规则,及“判决.*离婚.{0,5}不予(支持|准许)”,提取出“判决不准离婚”的要素。
需要说明,对于步骤S32的具体实现方法,并不局限于上文描述的正则匹配方式,可以根据实际需要确定,即便是采用正则匹配方式,本实施例对提取案件要素的解析规则内容也不限定,通常可以结合法律文书的类型及其内容确定。
步骤S33,按照这多个语义段落,对提取的案件要素进行分类,并对分类结果进行存储;
本实施例实际应用中,按照上述处理方式,从各现有法律文书的各个语义段落中,提取出所包含的案件要素后,可以根据各案件要素分布的语义段落,进行分类处理,如下文表1所示的案件要素分类方式,但并不局限于此。
表1
本实施例中,可以将提取出的多个案件要素分为如上表1所示的五类,并对得到的分类结果以及不同类型的案件要素进行存储。简单来说,案件要素从哪个语义段落提取,可以将该案件要素归为该语义段落对应的案件要素类别。
可选的,本实施例可以提取要素值、要素名称和类别存储至数据库,数据库存储这些数据的存储方式不作限定。其中,要素值可以是利用文本解析、语义分析等技术,从法律文书中抽取的原文内容(如案件要素的具体内容),可以用于原文高亮,以突出整个法律文书中案件要素内容,但并不局限于这种状态调整方式,还可以增加下划线、字体加粗和/或斜体、放大等等。
步骤S34,对现有法律文书进行预定争议焦点信息的全文检索,得到样本法律文书;
本实施例中,可以采用全文检索方式,从现有的法律文书中,抽取样本法律文书。也就是说,可以全文检索预定争议焦点信息,锁定争议焦点,筛选出样本法律文书。
可见,该样本法律文书中记录有法官明确书写案件争议焦点的内容,可以采用预定格式的检索方式,和/或“争议焦点”关键词全文检索方式,实现对现有法律文书的检索。本实施例的现有法律文书可以是已结案的裁判文书等。
步骤S35,通过文本解析方式,从该样本法律文本中提取多条争议焦点信息;
步骤S36,检测每一条争议焦点信息是否符合争议焦点要求,如果符合,进入步骤S37;如果不符合,进入步骤S38;
在确定样本法律文书后,本实施例可以通过解析规则、文本解析技术抽取争议焦点,此时,本实施例为了确保能够得到独立的争议焦点,实现对每条争议焦点的独立存储,本实施例可以检测提取的每条争议焦点信息是否符合争议焦点要求,即检测各争议焦点信息内容是否规则,如一句话中是否最多包含一条争议焦点信息,如果出现多条争议焦点信息写在一句话中等情况,可以认为这几条争议焦点不符合争议焦点要求,需要对其做进一步处理。
步骤S37,将该争议焦点信息作为一条争议焦点进行存储;
步骤S38,对该争议焦点信息进行拆分处理,得到争议焦点信息包含的多条争议焦点,并对所述多条争议焦点进行存储;
对于本实施例提供的如上文描述的,从样本法律文件提取多条争议焦点的业务规则具体可以如下,但并不局限于下文描述的实现方式:
本实施例可以对样本法律文书进行全文检索,得到正则表达式,通常情况下,正则表达式是在法律文书的一个分句中,如(争议|诉讼|诉争|争执).{0,10}焦点.{0,10}[::是为有即]|焦点(一|二|三|四|五|六|七|八|九).{0,10}{::},输出正则表达后的句子,即得到样本法律文本中包含争议焦点的句子。
之后,在搜索范围内,根据结构序号进行拆条,即对包含多个争议焦点的句子进行拆条。对于撰写不规范的法律文书,可能会没有结构序号,这种情况下,可以以问号为拆条处理的分割点,具体的,在对法律文书进行全文检索可以检索法律文书中下个分句是否包含问号,如果包含问号,就可以按照上段描述的规则,对法律文书进行处理,即以问号为分割进行拆条,输出正则表达式匹配值之后,匹配值所在自然段中所有以问号为分割的字符,如果没有问号,输出正则表达式之后,本分句结束的字符。
利用正则表达式完成对样本法律文书的拆条处理后,对于拆条后的内容,可以按照标准争议焦点字典规则,根据不同案由将字典关键词在每条争议焦点原文上进行匹配,如果匹配,输出对应字典值,由此得到标准争议焦点,或据此进行争议焦点分类。
需要注意的是,按照上文描述的业务规则对样本法律文书进行处理后,最后输出的可以是争议焦点原文,还可以进一步对原文进行去重处理后再输出,此时可以由每条争议焦点原文的属性输出对应的标准争议焦点;且在得到字典值后,经过去重后输出,若包括多个字典值,可以分条输出,实现争议焦点分类。其中,若字典不包含案由,对应属性可以不做输出。
本实施例中,按照标准争议焦点字典规则进行上述处理过程中,该规则可以包括:若得到多个关键词,这多个关键词均为且得关系;若得到多个关键词和单个关键词,优先匹配多个关键词;若长词包含短词,优先匹配长词,但并不局限于本文列举的规则内容。
在本申请另一可选实施例,本实施例可以直接利用正则表达式对样本法律文书进行拆条处理,得到符合争议焦点要求的多条争议焦点,关于利用正则表达式进行拆条处理的实现过程,与上文描述的处理过程类似,本实施例不再赘述。
其中,上文描述的拆条处理,可以是按照一定规则,对法律文书中的句子进行分割,以使分割后的每一个分句包含独立的一条争议焦点。如上述以问号为分割,实现对法律文书的拆条处理,但并不局限于此。
步骤S39,根据每条争议焦点关联到的案件要素,对多个案件要素和多条争议焦点进行组合,得到争议焦点与至少一个所述案件要素的关联关系。
本实施例实际应用中,按照上文描述的方式,得到现有法律文书中的案件要素和争议焦点后,可以由业务专家团队对这两部分搭建关联关系,如采用“或”、“且”、“非”等关系词进行组合,得到案件要素与争议焦点之间的关联关系,本实施例对步骤S39的具体实现过程不做限定,并不局限于这种专家人工构建方式。
综上所述,参照图4所示的流程示意图,本实施例利用文本解析技术、NLP(NaturalLanguage Processing,自然语言处理)技术(如上述语义分析部分采用的技术),实现对现有法律文书的语义分段,得到不同语义段落(即诉请段、抗辩段、事实认定段、裁判结果段)对应的不同类型的案件要素,即诉请要素、抗辩要素、事实要素、裁判要素;并且,利用文本解析方式,从具有明确书写争议焦点的样本法律文书中,提取出能够独立存储的多条争议焦点(即为标准争议焦点),之后,利用每个争议焦点涉及到的案件要素,利用关联词,对提取的多个案件要素进行组合,形成争议焦点与案件要素或其组合的关联关系,这样,在今后应用中,对于无明确争议焦点描述的法律文书,能够直接利用该关联关系,快速且准确生成争议焦点。
可选的,基于上文描述的各实施例的处理方法,参照图5,为本申请实施例提供的又一种法律文书的争议焦点生成方法的流程示意图,该方法可以包括:
步骤S41,检测当前法律文书是否包含预定争议焦点信息;
步骤S42,如果检测结果为否,获取已构建的案件要素与争议焦点之间的关联关系;
其中,关于步骤S41和步骤S42的具体实现方法,可以参照上文实施例相应部分的描述,本实施例不再赘述。
步骤S43,提取当前法律文书包含的多个案件要素,并确定多个案件要素之间的案件要素组合;
如上文描述的案件要素和争议焦点之间的关联关系的构建过程的描述,通常情况下,一条争议焦点可以对应一个案件要素组合,即一条争议焦点可能会涉及到多个案件要素,因此,本实施例从当前法律文书提取出多个案件要素后,可以按照预设的关联关系,确定这多个案件要素之间的案件要素组合,也可以得到这多个案件要素能够存在的所有案件要素组合,本实施例对此不做限定。
步骤S44,依据已构建的案件要素与争议焦点之间的关联关系,获取与确定任意一个案件要素或案件要素组合对应的争议焦点,并将获取的争议焦点作为当前法律文书的争议焦点。
可见,本实施例得到当前法律文书包含的多个案件要素,以及这多个案件要素生成的案件要素组合后,可以直接由此查询已构建的案件要素与争议焦点之间的关联关系,获取与当前法律文书对应的任意一个案件要素或案件要素组合所关联的争议焦点,即为该当前法律文书的争议焦点。所以说,本实施例提供的方法,解决了文本信息抽取依赖文本内容描述的限制,对于未直接描述争议焦点信息的法律文书,也能够自动生成争议焦点,提高了争议焦点生成效率、准确性及完整性。
参照图6,为本申请实施例提供的一种法律文书的争议焦点生成装置的结构示意图,该装置可以应用于计算机设备,该计算机设备可以是终端或服务器,如图6所示,该装置可以包括:
检测模块11,用于检测当前法律文书是否包含预定争议焦点数据;
获取模块12,用于在所述检测模块的检测结果为否的情况下,提取当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
生成模块13,用于利用提取到的案件要素,按照该关联关系,生成所述当前法律文书的争议焦点。
可选的,如图7所示,该生成模块13可以包括:
案件要素组合单元131,用于在提取到的案件要素的数量为多个的情况下,确定这多个案件要素之间的案件要素组合;
争议焦点生成单元132,用于依据已构建的案件要素与争议焦点之间的关联关系,获取与确定任意一个案件要素或所述案件要素组合对应的争议焦点,并将获取的争议焦点作为所述当前法律文书的争议焦点。
可见,本实施例对于未明确描述争议焦点信息的法律文书,也能够利用构建的案件要素和争议焦点之间的关联关系,自动生成该法律文书的争议焦点,解决了传统争议焦点生成方法的局限性,保证各种法律文本都能够自动快速且准确生成可靠地争议焦点。
可选的,如图8所示,为了构建案件要素与争议焦点之间的关联关系,本申请提供的装置还可以包括:
案件要素提取模块14,用于提取现有法律文书包含的多个案件要素;
其中,该案件要素的类别可以基于现有法律文书的语义段落确定,具体实现过程可以参照上文方法实施例相应部分的描述。
可选的,如图9所示,该案件要素提取模块14可以包括:
分段单元141,用于对现有法律文书进行语义分段,得到所述现有法律文书的多个语义段落;
案件要素提取单元142,用于提取多个语义段落各自包含的案件要素;
分类存储单元143,用于按照所述多个语义段落,对提取的案件要素进行分类,并对分类结果进行存储。
样本筛选模块15,用于筛选现有法律文书中具有预定争议焦点信息的样本法律文书;
可选的,具体可以用于对现有法律文书进行预定争议焦点信息的全文检索,得到样本法律文书,具体实现过程可以参照上文方法实施例相应部分的描述。
争议焦点提取模块16,用于提取所述样本法律文书包含的多条争议焦点;
在本实施例实际应用中,争议焦点提取模块16可以用于利用正则表达式对样本法律文书进行拆条处理,得到符合争议焦点要求的多条争议焦点。
可选的,参照图9所示的结构示意图,该争议焦点提取模块16可以包括:
争议焦点信息提取单元161,用于通过文本解析方式,从所述样本法律文本中提取多条争议焦点信息;
检测单元162,用于检测每一条争议焦点信息是否符合争议焦点要求;
存储单元163,用于在检测单元的检测结果为符合的情况下,将所述争议焦点信息作为一条争议焦点进行存储;
拆分处理单元164,用于在检测单元的检测结果为不符合的情况下,对争议焦点信息进行拆分处理,得到争议焦点信息包含的多条争议焦点,并对这多条争议焦点进行存储。
关于如图9所示的该争议焦点提取模块16包含的各功能单元所实现的功能,可以参照上述方法实施例相应部分的描述。
构建模块17,用于构建所述多个案件要素与所述多条争议焦点之间的关联关系。
在本实施例中,该构建模块17可以包括:
第一构建单元,用于根据每条争议焦点关联到的案件要素,对所述多个案件要素和所述多条争议焦点进行组合,得到争议焦点与至少一个所述案件要素的关联关系。
上述法律文书的争议焦点生成装置可以包括处理器和存储器,上述检测模块、获取模块、生成模块、案件要素提取模块、样本筛选模块、争议焦点提取模块和构建模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来利用已构建的案件要素与争议焦点之间的关联关系,对未包含预定争议焦点信息的法律文书,自动生成争议焦点,解决了传统焦点生成方法因依赖文书信息内容的限制,保证了所生成的争议焦点的完整性及效率。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。
本申请实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述法律文书的争议焦点生成方法。
本申请实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述法律文书的争议焦点生成方法。
本申请实施例提供了一种计算机设备,如图10所示的该计算机设备的硬件结构示意图,该计算机设备可以包括通信接口21、存储器22以及处理器23、存储器中存储有能够在处理器上运行的程序,处理器执行程序时实现以下步骤:
检测当前法律文书是否包含预定争议焦点信息;
如果否,提取所述当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
利用提取到的案件要素,按照关联关系,生成所述当前法律文书的争议焦点。
可选的,处理器执行程序时还可以实现以下步骤:
提取现有法律文书包含的多个案件要素;
筛选现有法律文书中具有预定争议焦点信息的样本法律文书;
提取所述样本法律文书包含的多条争议焦点;
构建所述多个案件要素与所述多条争议焦点之间的关联关系。
可选的,处理器执行程序时还可以实现以下步骤:
根据每条争议焦点关联到的案件要素,对所述多个案件要素和所述多条争议焦点进行组合,得到所述争议焦点与至少一个所述案件要素的关联关系。
可选的,处理器执行程序时还可以实现以下步骤:
若提取到的案件要素的数量为多个,确定多个案件要素之间的案件要素组合;
依据已构建的案件要素与争议焦点之间的关联关系,获取与确定任意一个案件要素或所述案件要素组合对应的争议焦点,并将获取的争议焦点作为所述当前法律文书的争议焦点。
可选的,处理器执行程序时还可以实现以下步骤:
对现有法律文书进行语义分段,得到所述现有法律文书的多个语义段落;
提取多个语义段落各自包含的案件要素;
按照所述多个语义段落,对提取的案件要素进行分类,并对分类结果进行存储。
可选的,处理器执行程序时还可以实现以下步骤:
通过文本解析方式,从所述样本法律文本中提取多条争议焦点信息;
检测每一条争议焦点信息是否符合争议焦点要求;
如果符合,将所述争议焦点信息作为一条争议焦点进行存储;
若不符合,对所述争议焦点信息进行拆分处理,得到所述争议焦点信息包含的多条争议焦点,并对所述多条争议焦点进行存储。
可选的,处理器执行程序时还可以实现以下步骤:
对现有法律文书进行预定争议焦点信息的全文检索,得到样本法律文书;
利用正则表达式对所述样本法律文书进行拆条处理,得到符合争议焦点要求的多条争议焦点。
本文中的计算机设备可以是服务器,或如PC、PAD、手机等终端等等,本申请对该计算机设备的产品类型不做限定。
本申请还提供了一种计算机程序产品,当在计算机设备上执行时,适于执行初始化有如下方法步骤的程序:
检测当前法律文书是否包含预定争议焦点信息;
如果否,提取所述当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点。
可选的,计算机产品还可以适用于执行初始化有如下方法步骤的程序:
提取现有法律文书包含的多个案件要素;
筛选现有法律文书中具有预定争议焦点信息的样本法律文书;
提取所述样本法律文书包含的多条争议焦点;
构建所述多个案件要素与所述多条争议焦点之间的关联关系。
可选的,计算机产品还可以适用于执行初始化有如下方法步骤的程序:
根据每条争议焦点关联到的案件要素,对所述多种案件要素和所述多条争议焦点进行组合,得到所述争议焦点与至少一个所述案件要素的关联关系。
可选的,计算机产品还可以适用于执行初始化有如下方法步骤的程序:
若提取到的案件要素的数量为多个,确定多个案件要素之间的案件要素组合;
依据已构建的案件要素与争议焦点之间的关联关系,获取与确定任意一个案件要素或所述案件要素组合对应的争议焦点,并将获取的争议焦点作为所述当前法律文书的争议焦点。
可选的,计算机产品还可以适用于执行初始化有如下方法步骤的程序:
对现有法律文书进行语义分段,得到所述现有法律文书的多个语义段落;
提取多个语义段落各自包含的案件要素;
按照所述多个语义段落,对提取的案件要素进行分类,并对分类结果进行存储。
可选的,计算机产品还可以适用于执行初始化有如下方法步骤的程序:
通过文本解析方式,从所述样本法律文本中提取多条争议焦点信息;
检测每一条争议焦点信息是否符合争议焦点要求;
如果符合,将所述争议焦点信息作为一条争议焦点进行存储;
若不符合,对所述争议焦点信息进行拆分处理,得到所述争议焦点信息包含的多条争议焦点,并对所述多条争议焦点进行存储。
可选的,计算机产品还可以适用于执行初始化有如下方法步骤的程序:
对现有法律文书进行预定争议焦点信息的全文检索,得到样本法律文书;
利用正则表达式对所述样本法律文书进行拆条处理,得到符合争议焦点要求的多条争议焦点。
需要注意,本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、计算机设备、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以预定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种法律文书的争议焦点生成方法,其特征在于,所述方法包括:
检测当前法律文书是否包含预定争议焦点信息;
如果否,提取所述当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点。
2.根据权利要求1所述的方法,其特征在于,所述案件要素与争议焦点之间的关联关系的构建过程包括:
提取现有法律文书包含的多个案件要素;
筛选现有法律文书中具有预定争议焦点信息的样本法律文书;
提取所述样本法律文书包含的多条争议焦点;
构建所述多个案件要素与所述多条争议焦点之间的关联关系。
3.根据权利要求2所述的方法,其特征在于,所述构建所述多个案件要素与所述多条争议焦点之间的关联关系,包括:
根据每条争议焦点关联到的案件要素,对提取的多个案件要素与所述多条争议焦点进行组合,得到所述争议焦点与至少一个案件要素的关联关系。
4.根据权利要求1~3任意一项所述的方法,其特征在于,所述利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点,包括:
若提取到的案件要素的数量为多个,确定所述多个案件要素之间的案件要素组合;
依据已构建的案件要素与争议焦点之间的关联关系,获取与确定任意一个案件要素或所述案件要素组合对应的争议焦点,并将获取的争议焦点作为所述当前法律文书的争议焦点。
5.根据权利要求2所述的方法,其特征在于,所述提取现有法律文书包含的多个案件要素,包括:
对现有法律文书进行语义分段,得到所述现有法律文书的多个语义段落;
提取多个语义段落各自包含的案件要素;
按照所述多个语义段落,对提取的案件要素进行分类,并对分类结果进行存储。
6.根据权利要求2所述的方法,其特征在于,提取所述样本法律文书包含的多条争议焦点,包括:
通过文本解析方式,从所述样本法律文本中提取多条争议焦点信息;
检测每一条争议焦点信息是否符合争议焦点要求;
如果符合,将所述争议焦点信息作为一条争议焦点进行存储;
若不符合,对所述争议焦点信息进行拆分处理,得到所述争议焦点信息包含的多条争议焦点,并对所述多条争议焦点进行存储。
7.根据权利要求2所述的方法,其特征在于,所述筛选现有法律文书中具有预定争议焦点信息的样本法律文书,包括:
对现有法律文书进行预定争议焦点信息的全文检索,得到样本法律文书;
所述提取所述样本法律文书包含的多条争议焦点,包括:
利用正则表达式对所述样本法律文书进行拆条处理,得到符合争议焦点要求的多条争议焦点。
8.一种法律文书的争议焦点生成装置,其特征在于,所述装置包括:
检测模块,用于检测当前法律文书是否包含预定争议焦点数据;
获取模块,用于在所述检测模块的检测结果为否的情况下,提取所述当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
生成模块,用于利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点。
9.一种存储介质,其上存储有程序,其特征在于,所述程序被处理器执行,实现如权利要求1~7任意一项所述的法律文书的争议焦点生成方法的各步骤。
10.一种计算机设备,其特征在于,所述计算机设备包括:
通信接口;
存储器,用于存储实现如权利要求1~7任意一项所述的法律文书的争议焦点生成方法的程序;
处理器,用于加载并执行所述存储器存储的程序,所述程序用于:
检测当前法律文书是否包含预定争议焦点信息;
如果否,提取所述当前法律文书包含的案件要素,并获取已构建的案件要素与争议焦点之间的关联关系;
利用提取到的案件要素,按照所述关联关系,生成所述当前法律文书的争议焦点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811635959.7A CN111401047A (zh) | 2018-12-29 | 2018-12-29 | 法律文书的争议焦点生成方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811635959.7A CN111401047A (zh) | 2018-12-29 | 2018-12-29 | 法律文书的争议焦点生成方法、装置及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111401047A true CN111401047A (zh) | 2020-07-10 |
Family
ID=71430168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811635959.7A Pending CN111401047A (zh) | 2018-12-29 | 2018-12-29 | 法律文书的争议焦点生成方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111401047A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858834A (zh) * | 2020-07-30 | 2020-10-30 | 平安国际智慧城市科技股份有限公司 | 基于ai的案件争议焦点确定方法、装置、设备及介质 |
CN112365372A (zh) * | 2020-10-09 | 2021-02-12 | 银江股份有限公司 | 一种面向裁判文书的质量检测及评估方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100332520A1 (en) * | 2005-10-04 | 2010-12-30 | Qiang Lu | Systems, Methods, and Interfaces for Extending Legal Search Results |
CN108241621A (zh) * | 2016-12-23 | 2018-07-03 | 北京国双科技有限公司 | 法律知识的检索方法及装置 |
CN108280149A (zh) * | 2018-01-04 | 2018-07-13 | 东南大学 | 一种基于多维度分类标签的医患纠纷类案件推荐方法 |
CN108427667A (zh) * | 2017-02-15 | 2018-08-21 | 北京国双科技有限公司 | 一种法律文书的分段方法及装置 |
WO2018224028A1 (zh) * | 2017-06-09 | 2018-12-13 | 北京国双科技有限公司 | 获取裁判文书焦点的方法和装置 |
-
2018
- 2018-12-29 CN CN201811635959.7A patent/CN111401047A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100332520A1 (en) * | 2005-10-04 | 2010-12-30 | Qiang Lu | Systems, Methods, and Interfaces for Extending Legal Search Results |
CN108241621A (zh) * | 2016-12-23 | 2018-07-03 | 北京国双科技有限公司 | 法律知识的检索方法及装置 |
CN108427667A (zh) * | 2017-02-15 | 2018-08-21 | 北京国双科技有限公司 | 一种法律文书的分段方法及装置 |
WO2018224028A1 (zh) * | 2017-06-09 | 2018-12-13 | 北京国双科技有限公司 | 获取裁判文书焦点的方法和装置 |
CN109033105A (zh) * | 2017-06-09 | 2018-12-18 | 北京国双科技有限公司 | 获取裁判文书焦点的方法和装置 |
CN108280149A (zh) * | 2018-01-04 | 2018-07-13 | 东南大学 | 一种基于多维度分类标签的医患纠纷类案件推荐方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858834A (zh) * | 2020-07-30 | 2020-10-30 | 平安国际智慧城市科技股份有限公司 | 基于ai的案件争议焦点确定方法、装置、设备及介质 |
CN111858834B (zh) * | 2020-07-30 | 2023-12-01 | 平安国际智慧城市科技股份有限公司 | 基于ai的案件争议焦点确定方法、装置、设备及介质 |
CN112365372A (zh) * | 2020-10-09 | 2021-02-12 | 银江股份有限公司 | 一种面向裁判文书的质量检测及评估方法及系统 |
CN112365372B (zh) * | 2020-10-09 | 2024-01-12 | 银江技术股份有限公司 | 一种面向裁判文书的质量检测及评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10146862B2 (en) | Context-based metadata generation and automatic annotation of electronic media in a computer network | |
US8126897B2 (en) | Unified inverted index for video passage retrieval | |
CN109508458B (zh) | 法律实体的识别方法及装置 | |
CN107085583B (zh) | 一种基于内容的电子文档管理方法及装置 | |
CN110888990A (zh) | 文本推荐方法、装置、设备及介质 | |
CN111125086B (zh) | 获取数据资源的方法、装置、存储介质及处理器 | |
CN107463548A (zh) | 短语挖掘方法及装置 | |
KR101607468B1 (ko) | 콘텐츠에 대한 키워드 태깅 방법 및 시스템 | |
CN109101551B (zh) | 一种问答知识库的构建方法及装置 | |
CN108228612B (zh) | 一种提取网络事件关键词以及情绪倾向的方法及装置 | |
CN109359201B (zh) | 多媒体教学资源的编码、存储方法及其设备 | |
KR20220134695A (ko) | 인공지능 학습 모델을 이용한 저자 식별 시스템 및 그 방법 | |
CN112148701A (zh) | 一种文件检索的方法及设备 | |
CN112035723A (zh) | 资源库的确定方法和装置、存储介质及电子装置 | |
CN112015907A (zh) | 一种学科知识图谱快速构建方法、装置及存储介质 | |
CN103823868B (zh) | 一种面向在线百科的事件识别方法和事件关系抽取方法 | |
CN108345694B (zh) | 一种基于主题数据库的文献检索方法及系统 | |
CN111401047A (zh) | 法律文书的争议焦点生成方法、装置及计算机设备 | |
CN111881695A (zh) | 一种审计知识的检索方法及装置 | |
CN115760495A (zh) | 一种实现法律案例自动标签化的方法及装置 | |
CN110968691B (zh) | 司法热点确定方法及装置 | |
CN113468377A (zh) | 一种视频与文献关联整合方法 | |
CN114417860A (zh) | 一种信息检测方法、装置及设备 | |
CN107203616A (zh) | 视频文件的标注方法和装置 | |
CN107943965B (zh) | 相似文章检索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |