CN109359175A - 电子装置、诉讼数据处理的方法及存储介质 - Google Patents
电子装置、诉讼数据处理的方法及存储介质 Download PDFInfo
- Publication number
- CN109359175A CN109359175A CN201811043749.9A CN201811043749A CN109359175A CN 109359175 A CN109359175 A CN 109359175A CN 201811043749 A CN201811043749 A CN 201811043749A CN 109359175 A CN109359175 A CN 109359175A
- Authority
- CN
- China
- Prior art keywords
- sentence
- central issue
- judgement
- document
- judgement document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 238000004321 preservation Methods 0.000 claims description 4
- 235000013399 edible fruits Nutrition 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000009412 basement excavation Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 239000000571 coke Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种电子装置、诉讼数据处理的方法及存储介质,该方法包括:获取预定类型诉讼的裁判文书,分析得到争议焦点句,并获取争议焦点;基于预先建立的证据清单中的争议焦点与证据名称的对应关系、在每一裁判文书中获取的争议焦点,对裁判文书进行分析,获得该裁判文书中与所获取的争议焦点匹配的有效证据信息;基于在每一裁判文书中获取到的焦点语句对对应的裁判文书进行解析,以获得判决语句;基于该裁判文书的判决语句获取对应的判决结果,建立争议焦点句、证据信息、判决语句及判决结果之间的关联关系;对贝叶斯模型进行训练,得到该预定类型诉讼对应的预判模型。本发明能够提高诉讼预判准确率,并有效地指导相关方作出相应的操作。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种电子装置、诉讼数据处理的方法及存储介质。
背景技术
目前,对于法律案件的诉讼结果,一般都是需要等待诉讼判决书出来才能得知,业内也有采用人工对诉讼结果进行分析预判的,例如在车险领域中,采用人工的方式分析相关的诉讼请求、证据等,得到人工预判的结果,但是人工预判的准确率不高,且无法有效地指导相关方作出相应的操作,例如在车险领域中无法有效地指导当事人准备相应的证据,或者指导保险公司针对车险理赔案件采取相应的理赔措施。
发明内容
本发明的目的在于提供一种电子装置、诉讼数据处理的方法及存储介质,旨在提高诉讼预判准确率,并有效地指导相关方作出相应的操作。
为实现上述目的,本发明提供一种电子装置,所述电子装置包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
争议焦点获取步骤,获取预定类型诉讼的裁判文书,通过预设的方式分析得到每一裁判文书中的争议焦点句,并获取争议焦点句中对应的争议焦点;
证据分析步骤,基于预先建立的证据清单中的争议焦点与证据名称的对应关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行分析,获得该裁判文书中与所获取的争议焦点匹配的有效证据信息;
判决语句解析步骤,基于在每一裁判文书中获取到的焦点语句对对应的裁判文书进行解析,以获得该裁判文书中的判决语句;
关联步骤,基于该裁判文书的判决语句获取对应的判决结果,建立该裁判文书的争议焦点句、证据信息、判决语句及判决结果之间的关联关系;
模型训练步骤,基于各裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果对贝叶斯模型进行训练,得到该预定类型诉讼对应的预判模型。
优选地,所述争议焦点获取步骤,具体包括:
获取模式库中预先建立的争议焦点句的第一模式串,基于第一模式串对每一裁判文书中的语句进行匹配得到争议焦点句,并获取争议焦点句中对应的争议焦点;或者
获取标准的争议焦点句,计算标准的争议焦点句与每一裁判文书中的语句的句向量相似度,将句向量相似度大于预设相似度阈值的语句作为争议焦点句,并获取争议焦点句中对应的争议焦点;或者
预先标注争议焦点句和非争议焦点句,基于预先标注争议焦点句和非争议焦点句训练得到分类模型,以训练得到的分类模型识别各裁判文书中的语句,得到争议焦点句,并获取争议焦点句中对应的争议焦点。
优选地,所述证据分析步骤步骤,具体包括:
基于预先建立的证据清单中的争议焦点与证据名称的关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行匹配,分析是否匹配到与所获取的争议焦点对应的证据信息;
若是,则获取模式库中预先建立的证据信息存在性的第二模式串,基于第二模式串对该裁判文书进行匹配,以分析抗辩双方是否提交有该证据信息;
若是,则获取模式库中预先建立的证据信息有效性的第三模式串,基于第三模式串对该裁判文书进行匹配,以分析该证据信息是否有效;
若是,则以该证据信息作为该裁判文书的有效证据信息。
优选地,所述判决语句解析步骤,具体包括:
获取模式库中预先建立的争议焦点的第四模式串,基于该第四模式串对每一裁判文书中的语句进行匹配,得到涉及争议焦点的语句,将涉及争议焦点的语句中的争议焦点句剔除,以得到该裁判文书的候选判决句;
计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度,按照相似度降序的顺序对对应的候选判决句进行排序;
基于候选判决句的排序、候选判决句匹配到的争议焦点的数量、候选判决句在该裁判文书中的位置选取得到该裁判文书中的判决语句;
其中,所述计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度的步骤包括:
将候选判决句与争议焦点句分别进行分词,对分词标注对应的词性,并对不同词性的分词赋予对应的权重wi,分词后的候选判决句为(x1,x2,…xi…xn),分词后的争议焦点句为(y1,y2,…yi…yn),根据各词性的权重,候选判决句与争议焦点句分别表示为:
x=(w1x1,w2x2,…wixi…w3xn);
y=(w1y1,w2y2,…wiyi…w3yn);
计算候选判决句与争议焦点句加权的余弦相似度为:
为实现上述目的,本发明还提供一种诉讼数据处理的方法,所述诉讼数据处理的方法包括:
S1,获取预定类型诉讼的裁判文书,通过预设的方式分析得到每一裁判文书中的争议焦点句,并获取争议焦点句中对应的争议焦点;
S2,基于预先建立的证据清单中的争议焦点与证据名称的对应关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行分析,获得该裁判文书中与所获取的争议焦点匹配的有效证据信息;
S3,基于在每一裁判文书中获取到的焦点语句对对应的裁判文书进行解析,以获得该裁判文书中的判决语句;
S4,基于该裁判文书的判决语句获取对应的判决结果,建立该裁判文书的争议焦点句、证据信息、判决语句及判决结果之间的关联关系;
S5,基于各裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果对贝叶斯模型进行训练,得到该预定类型诉讼对应的预判模型。
优选地,所述步骤S1包括:
获取模式库中预先建立的争议焦点句的第一模式串,基于第一模式串对每一裁判文书中的语句进行匹配得到争议焦点句,并获取争议焦点句中对应的争议焦点;或者
获取标准的争议焦点句,计算标准的争议焦点句与每一裁判文书中的语句的句向量相似度,将句向量相似度大于预设相似度阈值的语句作为争议焦点句,并获取争议焦点句中对应的争议焦点;或者
预先标注争议焦点句和非争议焦点句,基于预先标注争议焦点句和非争议焦点句训练得到分类模型,以训练得到的分类模型识别各裁判文书中的语句,得到争议焦点句,并获取争议焦点句中对应的争议焦点。
优选地,所述步骤S2包括:
基于预先建立的证据清单中的争议焦点与证据名称的关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行匹配,分析是否匹配到与所获取的争议焦点对应的证据信息;
若是,则获取模式库中预先建立的证据信息存在性的第二模式串,基于第二模式串对该裁判文书进行匹配,以分析抗辩双方是否提交有该证据信息;
若是,则获取模式库中预先建立的证据信息有效性的第三模式串,基于第三模式串对该裁判文书进行匹配,以分析该证据信息是否有效;
若是,则以该证据信息作为该裁判文书的有效证据信息。
优选地,所述步骤S3包括:
获取模式库中预先建立的争议焦点的第四模式串,基于该第四模式串对每一裁判文书中的语句进行匹配,得到涉及争议焦点的语句,将涉及争议焦点的语句中的争议焦点句剔除,以得到该裁判文书的候选判决句;
计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度,按照相似度降序的顺序对对应的候选判决句进行排序;
基于候选判决句的排序、候选判决句匹配到的争议焦点的数量、候选判决句在该裁判文书中的位置选取得到该裁判文书中的判决语句;
其中,所述计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度的步骤包括:
将候选判决句与争议焦点句分别进行分词,对分词标注对应的词性,并对不同词性的分词赋予对应的权重wi,分词后的候选判决句为(x1,x2,…xi…xn),分词后的争议焦点句为(y1,y2,…yi…yn),根据各词性的权重,候选判决句与争议焦点句分别表示为:
x=(w1x1,w2x2,…wixi…w3xn);
y=(w1y1,w2y2,…wiyi…w3yn);
计算候选判决句与争议焦点句加权的余弦相似度为:
优选地,所述步骤S4包括:
所述判决结果包括支持与不支持,将判决语句与模式库中预先建立判决模式串进行匹配,获取对应的判决结果,建立该裁判文书的证据信息、焦点语句、判决语句及判决结果之间的关联关系并保存;
所述步骤S5包括:
以预定类型诉讼的裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果为一条数据,将所有裁判文书对应的数据分为第一比例的训练集及第二比例验证集,利用训练集中的各条数据对贝叶斯模型进行训练,利用验证集中的各条数据对训练后的贝叶斯模型进行准确率的验证,若训练后的贝叶斯模型的准确率大于预设阈值,则训练结束,以训练后的贝叶斯模型作为该预定类型诉讼对应的预判模型,若训练后的贝叶斯模型的准确率不大于预设阈值,则增加用于训练贝叶斯模型的数据的数量,直至训练后的贝叶斯模型的准确率大于预设阈值。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的诉讼数据处理的方法的步骤。
本发明的有益效果是:本发明通过自然语言分析及挖掘的技术获取预定类型诉讼的裁判文书的争议焦点句、证据信息、判决语句及判决结果,建立争议焦点句、证据信息、判决语句及判决结果之间的关联关系,通过深度学习的技术对具有关联的争议焦点句、证据信息、判决语句及判决结果进行学习,得到该预定类型诉讼对应的预判模型,通过该预判模型可以对相关类型诉讼作出预判,预判准确率高,并有效地指导相关方作出相应的操作。
附图说明
图1为本发明电子装置一实施例的硬件架构的示意图;
图2为本发明诉讼数据处理的方法一实施例的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,是本发明电子装置一实施例的结构示意图。电子装置1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子装置1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,电子装置1可包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,存储器11存储有可在处理器12上运行的处理系统。需要指出的是,图1仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子装置1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子装置1的内部存储单元,例如该电子装置1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子装置1的操作系统和各类应用软件,例如本发明一实施例中的处理系统的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子装置1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行处理系统等。
所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述电子装置1与其他电子设备之间建立通信连接。
所述处理系统存储在存储器11中,包括至少一个存储在存储器11中的计算机可读指令,该至少一个计算机可读指令可被处理器器12执行,以实现本申请各实施例的方法;以及,该至少一个计算机可读指令依据其各部分所实现的功能不同,可被划为不同的逻辑模块。
在一实施例中,上述处理系统被所述处理器12执行时实现如下步骤:
争议焦点获取步骤,获取预定类型诉讼的裁判文书,通过预设的方式分析得到每一裁判文书中的争议焦点句,并获取争议焦点句中对应的争议焦点;
本实施例中,对裁判文书进行分类,例如可以分为车险裁判文书、婚姻裁判文书、合同裁判文书、房产裁判文书等。对每一类型的裁判文书进行学习可以得到对应的预判模型。
在一实施例中,通过预设的方式分析得到每一裁判文书中的争议焦点句包括:获取模式库中预先建立的争议焦点句的第一模式串,基于第一模式串对每一裁判文书中的语句进行匹配得到争议焦点句。
其中,争议焦点句在裁判文书中大多会以特定的格式存在,例如车险裁判文书中会出现“本案的争议焦点如下:1、残赔金应适用城镇标准还是农村标准;2、被抚养人生活费认定问题”,本实施例通过经验,总结出争议焦点句的第一模式串或常用句式,构建成用于匹配争议焦点句的模式库,完成争议焦点句识别环节的操作。第一模式串例如为“争议焦点如下:1、#焦点句#,2、#焦点句#”,将第一模式串与裁判文书中的语句进行匹配,即可匹配得到争议焦点句。
在另一实施例中,通过预设的方式分析得到每一裁判文书中的争议焦点句包括:获取标准的争议焦点句,计算标准的争议焦点句与每一裁判文书中的语句的句向量相似度,将句向量相似度大于预设相似度阈值的语句作为争议焦点句。
其中,语句的关键词类似或语句上下文、结构相似的句子,其表示成的句向量也会较为接近,即句向量相似度接近1。根据这个原理,可以预先获取标准的争议焦点句,车险裁判文书中标准的争议焦点句例如为“1、伤残等级是否成立,2、赔偿年限是否成立”,计算标准的争议焦点句与每一裁判文书中的语句的句向量相似度,并预定句向量相似度的阈值(例如,阈值为0.985),句向量相似度大于该阈值的语句为争议焦点句。
在又一实施例中,通过预设的方式分析得到每一裁判文书中的争议焦点句包括:预先标注争议焦点句和非争议焦点句,基于预先标注争议焦点句和非争议焦点句训练得到分类模型,以训练得到的分类模型识别各裁判文书中的语句,得到争议焦点句。
其中,分类模型有多种,例如分类模型可以是随机森林模型,以车险领域为例,预先标注车险裁判文书中的争议焦点句和非争议焦点句,并获取一定数量的争议焦点句和非争议焦点句,例如各1000条,将标注后的争议焦点句和非争议焦点句输入至该分类模型中进行训练,然后检测训练后的分类模型的准确率,若准确率大于预定的阈值(例如0.985),则利用该训练后的分类模型识别各裁判文书中的语句,得到争议焦点句。
在通过上述的实施例得到争议焦点句后,提取争议焦点句中对应的争议焦点,在一实施例中,可以采用了模式匹配的方式获取争议焦点句中对应的争议焦点。具体地,分为两类,第一类是无完整焦点句的争议焦点匹配,第二类是有完整焦点句的争议焦点匹配。第一类无完整焦点句的争议焦点匹配主要是针对争议焦点在文书中表述为争议赔付项(例如车险裁判书中的医疗费、残疾赔偿金、误工费等),而不是争议焦点项。此种情况下,会将争议赔付项下的所有可能争议焦点都作为案件争议焦点。对于赔付项的匹配,就是用所有赔付项对应的模式串进行模式匹配,能匹配上的,就将赔付项下的所有争议焦点作为文书的争议焦点,赔付项对应的模式串例如为“#费#”、“#赔偿金#”等。第二类争议焦点则是由完整焦点句的争议焦点,会采用所有争议焦点的模式串进行模式匹配,例如争议焦点的模式串为“伤残等级是否成立”、“赔偿年限是否成立”,能匹配上的,就是裁判文书中存在的争议焦点。
证据分析步骤,基于预先建立的证据清单中的争议焦点与证据名称的对应关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行分析,获得该裁判文书中与所获取的争议焦点匹配的有效证据信息;
本实施例中,通过经验,建立起预定类型诉讼对应可能涉及到的证据清单,在该证据清单中包括争议焦点及对应的证据名称,在一实施例中,车险人伤赔付项目的证据清单如下表1所示:
表1
基于上述获得的争议焦点,对裁判文书进行分析,获得裁判文书中涉及到的与争议焦点匹配的有效证据,该分析过程包括证据三性要求的具体过程,及证据匹配、证据存在性分析(是否有提交对应证据)、证据有效性分析。
具体地,基于预先建立的证据清单中的争议焦点与证据名称的关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行匹配,分析是否匹配到与所获取的争议焦点对应的证据信息:对于所获取的争议焦点,在证据清单获取其对应的证据名称,形成该证据名称的模式串,例如该证据名称的模式串为:#费明细清单#、#鉴定报告#,利用该证据名称的模式串在裁判文书进行匹配,例如在裁判文书中匹配的结果为“医药费明细清单”、“非医保鉴定报告”。
其中,在形成该证据名称的模式串的过程中,可以基于经验人工进行总结得到,还可以通过下述的自动化方式得到:先使用相似度计算的方式,提取出存在性分析、有效性分析等判定的相似度较大的相似句子,然后通过一个证据实体识别程序以及判决词表,将相似句子中关键的证据及判决词提取出来,并以此来自动生成可能的模式串,最后通过打分+人工校验的方式对模式串进行筛选,以减少人工总结模式串的工作量。其他实施例中的模式串也可以采用与该自动化方式原理类似的方法得到,此处不做过多赘述。
若在裁判文书中匹配到与所获取的争议焦点对应的证据信息,则获取模式库中预先建立的证据信息存在性的第二模式串,基于第二模式串对该裁判文书进行匹配,以分析抗辩双方是否提交有该证据信息,其中:
在在裁判文书中匹配到与所获取的争议焦点对应的证据信息的基础上,分析抗辩双方是否有提交对应的证据。这一过程也可以通过模式识别的方式完成的,通过专家经验人工总结或通过程序分析得到大部分的证据是否提交的第二模式串,例如第二模式串为“#原告#未提供#证据#”,例如该第二模式串在裁判文书中匹配的结果例如是“#原告#在本案审理中未提供劳动合同(#证据#)证明其诉请”。
若裁判文书中证实抗辩双方有提交对应的证据,则获取模式库中预先建立的证据信息有效性的第三模式串,基于第三模式串对该裁判文书进行匹配,以分析该证据信息是否有效,其中:
在证据为抗辩双方提交了的基础上,分析证据是否有效。这一过程也可以通过模式识别的方式完成的,通过专家经验人工总结或通过程序分析得到大部分的证据是否有效的第三模式串,通过组合模式串的方式进行证据有效性分析。例如,第三模式串为“#证据#矛盾”,匹配的结果例如是“经审理查明,#原告#提供的劳动合同(#证据#)与其实际工作情况相矛盾,不予认可”,则该证据无效。
判决语句解析步骤,基于在每一裁判文书中获取到的焦点语句对对应的裁判文书进行解析,以获得该裁判文书中的判决语句;
具体地,首先获取候选判决句:获取模式库中预先建立的争议焦点的第四模式串,基于该第四模式串对每一裁判文书中的语句进行匹配,得到涉及争议焦点的语句,将涉及争议焦点的语句中的争议焦点句剔除,以得到该裁判文书的候选判决句;
然后,计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度,按照相似度降序的顺序对对应的候选判决句进行排序;
其中,通过将候选判决句与争议焦点句进行分词,将分词后的词语标注对应的名词、动词等词性,对不同词性的分词赋予不同的权重。此外,还加入了法律专用术语及特殊词词典,对于法律专用术语及特殊词词典中的词赋予更高的权重。wi即为每个分词的权重,如动词权重为0.5,名词权重为1,法律专用术语及特殊词词典中的词权重为2,分词后的候选判决句为(x1,x2,…xi…xn),分词后的争议焦点句为(y1,y2,…yi…yn),根据各词性的权重,候选判决句与争议焦点句分别表示为:
x=(w1x1,w2x2,…wixi…w3xn);
y=(w1y1,w2y2,…wiyi…w3yn);
加权的余弦相似度的计算公式如下:
将相似度最大的候选判决句排列在前,将相似度最小的候选判决句排列在后,基于候选判决句的排序、候选判决句匹配到的争议焦点的数量、候选判决句在该裁判文书中的位置选取得到该裁判文书中的判决语句,其中,候选判决句排列在前、匹配到的争议焦点的数量越多且候选判决句在该裁判文书中位于中间部分或者后面部分,则最有可能成为该裁判文书中的判决语句。
关联步骤,基于该裁判文书的判决语句获取对应的判决结果,建立该裁判文书的争议焦点句、证据信息、判决语句及判决结果之间的关联关系;
其中,判决结果包括支持及不支持两种,具体地,将判决语句与模式库中预先建立的判决模式串进行匹配,获取对应的判决结果,建立该裁判文书的证据信息、焦点语句、判决语句及判决结果之间的关联关系并保存。
模型训练步骤,基于各裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果对贝叶斯模型进行训练,得到该预定类型诉讼对应的预判模型。
本实施例中,以具有关联关系的争议焦点句、证据信息、判决语句及判决结果为一条数据,将所有裁判文书对应的数据分为第一比例(例如75%)的训练集及第二比例(例如20%)验证集,利用训练集中的各条数据对贝叶斯模型进行训练,利用验证集中的各条数据对训练后的贝叶斯模型进行准确率的验证,若训练后的贝叶斯模型的准确率大于预设阈值(例如0.985),则训练结束,以训练后的贝叶斯模型该预定类型诉讼对应的预判模型,若训练后的贝叶斯模型的准确率不大于预设阈值,则增加用于训练贝叶斯模型的数据的数量,直至训练后的贝叶斯模型的准确率大于预设阈值。
以下以该技术方案应用于车险领域为例进行描述:通过对某个地区/法院的历史车险裁判文书进行学习得到车险预判模型:
获取历史车险诉讼的裁判文书,通过预设的方式分析得到每一车险诉讼裁判文书中的争议焦点句,并获取争议焦点句中对应的争议焦点;基于预先建立的车险证据清单中的争议焦点与证据名称的对应关系、在每一车险裁判文书中获取的争议焦点,对对应的车险裁判文书进行分析,获得该车险裁判文书中与所获取的争议焦点匹配的有效证据信息;基于在每一车险裁判文书中获取到的焦点语句对对应的车险裁判文书进行解析,以获得该车险裁判文书中的判决语句;基于该车险裁判文书的判决语句获取对应的判决结果,建立该车险裁判文书的争议焦点句、证据信息、判决语句及判决结果之间的关联关系;基于各车险裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果对贝叶斯模型进行训练,得到车险预判模型;
在发生车险事故后,很多用户并不能确定证据保存、车险事故预判结果、理赔等的相关事宜,无法及时作出相应的操作,这时可以通过车险预判模型,用户在该车险预判模型输入争议焦点句、证据信息、判决语句及判决结果中的至少一项信息,即可以得到对应的其他信息,例如获得诉讼请求、支持金额、判决所支持的证据及诉讼预判结果,以指导当事人准备相应的证据,或指导保险公司针对车险理赔案件采取相应的理赔措施。
与现有技术相比,本发明通过自然语言分析及挖掘的技术获取预定类型诉讼的裁判文书的争议焦点句、证据信息、判决语句及判决结果,建立争议焦点句、证据信息、判决语句及判决结果之间的关联关系,通过深度学习的技术对具有关联的争议焦点句、证据信息、判决语句及判决结果进行学习,得到该预定类型诉讼对应的预判模型,通过该预判模型可以对相关类型诉讼作出预判,预判准确率高,并有效地指导相关方作出相应的操作。
如图2所示,图2为本发明诉讼数据处理的方法一实施例的流程示意图,该方法包括以下步骤:
步骤S1,获取预定类型诉讼的裁判文书,通过预设的方式分析得到每一裁判文书中的争议焦点句,并获取争议焦点句中对应的争议焦点;
本实施例中,对裁判文书进行分类,例如可以分为车险裁判文书、婚姻裁判文书、合同裁判文书、房产裁判文书等。对每一类型的裁判文书进行学习可以得到对应的预判模型。
在一实施例中,通过预设的方式分析得到每一裁判文书中的争议焦点句包括:获取模式库中预先建立的争议焦点句的第一模式串,基于第一模式串对每一裁判文书中的语句进行匹配得到争议焦点句。
其中,争议焦点句在裁判文书中大多会以特定的格式存在,例如车险裁判文书中会出现“本案的争议焦点如下:1、残赔金应适用城镇标准还是农村标准;2、被抚养人生活费认定问题”,本实施例通过经验,总结出争议焦点句的第一模式串或常用句式,构建成用于匹配争议焦点句的模式库,完成争议焦点句识别环节的操作。第一模式串例如为“争议焦点如下:1、#焦点句#,2、#焦点句#”,将第一模式串与裁判文书中的语句进行匹配,即可匹配得到争议焦点句。
在另一实施例中,通过预设的方式分析得到每一裁判文书中的争议焦点句包括:获取标准的争议焦点句,计算标准的争议焦点句与每一裁判文书中的语句的句向量相似度,将句向量相似度大于预设相似度阈值的语句作为争议焦点句。
其中,语句的关键词类似或语句上下文、结构相似的句子,其表示成的句向量也会较为接近,即句向量相似度接近1。根据这个原理,可以预先获取标准的争议焦点句,车险裁判文书中标准的争议焦点句例如为“1、伤残等级是否成立,2、赔偿年限是否成立”,计算标准的争议焦点句与每一裁判文书中的语句的句向量相似度,并预定句向量相似度的阈值(例如,阈值为0.985),句向量相似度大于该阈值的语句为争议焦点句。
在又一实施例中,通过预设的方式分析得到每一裁判文书中的争议焦点句包括:预先标注争议焦点句和非争议焦点句,基于预先标注争议焦点句和非争议焦点句训练得到分类模型,以训练得到的分类模型识别各裁判文书中的语句,得到争议焦点句。
其中,分类模型有多种,例如分类模型可以是随机森林模型,以车险领域为例,预先标注车险裁判文书中的争议焦点句和非争议焦点句,并获取一定数量的争议焦点句和非争议焦点句,例如各1000条,将标注后的争议焦点句和非争议焦点句输入至该分类模型中进行训练,然后检测训练后的分类模型的准确率,若准确率大于预定的阈值(例如0.985),则利用该训练后的分类模型识别各裁判文书中的语句,得到争议焦点句。
在通过上述的实施例得到争议焦点句后,提取争议焦点句中对应的争议焦点,在一实施例中,可以采用了模式匹配的方式获取争议焦点句中对应的争议焦点。具体地,分为两类,第一类是无完整焦点句的争议焦点匹配,第二类是有完整焦点句的争议焦点匹配。第一类无完整焦点句的争议焦点匹配主要是针对争议焦点在文书中表述为争议赔付项(例如车险裁判书中的医疗费、残疾赔偿金、误工费等),而不是争议焦点项。此种情况下,会将争议赔付项下的所有可能争议焦点都作为案件争议焦点。对于赔付项的匹配,就是用所有赔付项对应的模式串进行模式匹配,能匹配上的,就将赔付项下的所有争议焦点作为文书的争议焦点,赔付项对应的模式串例如为“#费#”、“#赔偿金#”等。第二类争议焦点则是由完整焦点句的争议焦点,会采用所有争议焦点的模式串进行模式匹配,例如争议焦点的模式串为“伤残等级是否成立”、“赔偿年限是否成立”,能匹配上的,就是裁判文书中存在的争议焦点。
步骤S2,基于预先建立的证据清单中的争议焦点与证据名称的对应关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行分析,获得该裁判文书中与所获取的争议焦点匹配的有效证据信息;
本实施例中,通过经验,建立起预定类型诉讼对应可能涉及到的证据清单,在该证据清单中包括争议焦点及对应的证据名称,在一实施例中,车险人伤赔付项目的如上述表1所示,此处不再赘述。
基于上述获得的争议焦点,对裁判文书进行分析,获得裁判文书中涉及到的与争议焦点匹配的有效证据,该分析过程包括证据三性要求的具体过程,及证据匹配、证据存在性分析(是否有提交对应证据)、证据有效性分析。
具体地,基于预先建立的证据清单中的争议焦点与证据名称的关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行匹配,分析是否匹配到与所获取的争议焦点对应的证据信息:对于所获取的争议焦点,在证据清单获取其对应的证据名称,形成该证据名称的模式串,例如该证据名称的模式串为:#费明细清单#、#鉴定报告#,利用该证据名称的模式串在裁判文书进行匹配,例如在裁判文书中匹配的结果为“医药费明细清单”、“非医保鉴定报告”。
其中,在形成该证据名称的模式串的过程中,可以基于经验人工进行总结得到,还可以通过下述的自动化方式得到:先使用相似度计算的方式,提取出存在性分析、有效性分析等判定的相似度较大的相似句子,然后通过一个证据实体识别程序以及判决词表,将相似句子中关键的证据及判决词提取出来,并以此来自动生成可能的模式串,最后通过打分+人工校验的方式对模式串进行筛选,以减少人工总结模式串的工作量。其他实施例中的模式串也可以采用与该自动化方式原理类似的方法得到,此处不做过多赘述。
若在裁判文书中匹配到与所获取的争议焦点对应的证据信息,则获取模式库中预先建立的证据信息存在性的第二模式串,基于第二模式串对该裁判文书进行匹配,以分析抗辩双方是否提交有该证据信息,其中:
在在裁判文书中匹配到与所获取的争议焦点对应的证据信息的基础上,分析抗辩双方是否有提交对应的证据。这一过程也可以通过模式识别的方式完成的,通过专家经验人工总结或通过程序分析得到大部分的证据是否提交的第二模式串,例如第二模式串为“#原告#未提供#证据#”,例如该第二模式串在裁判文书中匹配的结果例如是“#原告#在本案审理中未提供劳动合同(#证据#)证明其诉请”。
若裁判文书中证实抗辩双方有提交对应的证据,则获取模式库中预先建立的证据信息有效性的第三模式串,基于第三模式串对该裁判文书进行匹配,以分析该证据信息是否有效,其中:
在证据为抗辩双方提交了的基础上,分析证据是否有效。这一过程也可以通过模式识别的方式完成的,通过专家经验人工总结或通过程序分析得到大部分的证据是否有效的第三模式串,通过组合模式串的方式进行证据有效性分析。例如,第三模式串为“#证据#矛盾”,匹配的结果例如是“经审理查明,#原告#提供的劳动合同(#证据#)与其实际工作情况相矛盾,不予认可”,则该证据无效。
步骤S3,基于在每一裁判文书中获取到的焦点语句对对应的裁判文书进行解析,以获得该裁判文书中的判决语句;
具体地,首先获取候选判决句:获取模式库中预先建立的争议焦点的第四模式串,基于该第四模式串对每一裁判文书中的语句进行匹配,得到涉及争议焦点的语句,将涉及争议焦点的语句中的争议焦点句剔除,以得到该裁判文书的候选判决句;
然后,计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度,按照相似度降序的顺序对对应的候选判决句进行排序;
其中,通过将候选判决句与争议焦点句进行分词,将分词后的词语标注对应的名词、动词等词性,对不同词性的分词赋予不同的权重。此外,还加入了法律专用术语及特殊词词典,对于法律专用术语及特殊词词典中的词赋予更高的权重。wi即为每个分词的权重,如动词权重为0.5,名词权重为1,法律专用术语及特殊词词典中的词权重为2,分词后的候选判决句为(x1,x2,…xi…xn),分词后的争议焦点句为(y1,y2,…yi…yn),根据各词性的权重,候选判决句与争议焦点句分别表示为:
x=(w1x1,w2x2,…wixi…w3xn);
y=(w1y1,w2y2,…wiyi…w3yn);
加权的余弦相似度的计算公式如下:
将相似度最大的候选判决句排列在前,将相似度最小的候选判决句排列在后,基于候选判决句的排序、候选判决句匹配到的争议焦点的数量、候选判决句在该裁判文书中的位置选取得到该裁判文书中的判决语句,其中,候选判决句排列在前、匹配到的争议焦点的数量越多且候选判决句在该裁判文书中位于中间部分或者后面部分,则最有可能成为该裁判文书中的判决语句。
步骤S4,基于该裁判文书的判决语句获取对应的判决结果,建立该裁判文书的争议焦点句、证据信息、判决语句及判决结果之间的关联关系;
其中,判决结果包括支持及不支持两种,具体地,将判决语句与模式库中预先建立的判决模式串进行匹配,获取对应的判决结果,建立该裁判文书的证据信息、焦点语句、判决语句及判决结果之间的关联关系并保存。
步骤S5,基于各裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果对贝叶斯模型进行训练,得到该预定类型诉讼对应的预判模型。
本实施例中,以具有关联关系的争议焦点句、证据信息、判决语句及判决结果为一条数据,将所有裁判文书对应的数据分为第一比例(例如75%)的训练集及第二比例(例如20%)验证集,利用训练集中的各条数据对贝叶斯模型进行训练,利用验证集中的各条数据对训练后的贝叶斯模型进行准确率的验证,若训练后的贝叶斯模型的准确率大于预设阈值(例如0.985),则训练结束,以训练后的贝叶斯模型该预定类型诉讼对应的预判模型,若训练后的贝叶斯模型的准确率不大于预设阈值,则增加用于训练贝叶斯模型的数据的数量,直至训练后的贝叶斯模型的准确率大于预设阈值。
以下以该技术方案应用于车险领域为例进行描述:通过对某个地区/法院的历史车险裁判文书进行学习得到车险预判模型:获取历史车险诉讼的裁判文书,通过预设的方式分析得到每一车险诉讼裁判文书中的争议焦点句,并获取争议焦点句中对应的争议焦点;基于预先建立的车险证据清单中的争议焦点与证据名称的对应关系、在每一车险裁判文书中获取的争议焦点,对对应的车险裁判文书进行分析,获得该车险裁判文书中与所获取的争议焦点匹配的有效证据信息;基于在每一车险裁判文书中获取到的焦点语句对对应的车险裁判文书进行解析,以获得该车险裁判文书中的判决语句;基于该车险裁判文书的判决语句获取对应的判决结果,建立该车险裁判文书的争议焦点句、证据信息、判决语句及判决结果之间的关联关系;基于各车险裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果对贝叶斯模型进行训练,得到车险预判模型;
在发生车险事故后,很多用户并不能确定证据保存、车险事故预判结果、理赔等的相关事宜,无法及时作出相应的操作,这时可以通过车险预判模型,用户在该车险预判模型输入争议焦点句、证据信息、判决语句及判决结果中的至少一项信息,即可以得到对应的其他信息,例如获得诉讼请求、支持金额、判决所支持的证据及诉讼预判结果,以指导当事人准备相应的证据,或指导保险公司针对车险理赔案件采取相应的理赔措施。
与现有技术相比,本发明通过自然语言分析及挖掘的技术获取预定类型诉讼的裁判文书的争议焦点句、证据信息、判决语句及判决结果,建立争议焦点句、证据信息、判决语句及判决结果之间的关联关系,通过深度学习的技术对具有关联的争议焦点句、证据信息、判决语句及判决结果进行学习,得到该预定类型诉讼对应的预判模型,通过该预判模型可以对相关类型诉讼作出预判,预判准确率高,并有效地指导相关方作出相应的操作。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的方法的步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种电子装置,其特征在于,所述电子装置包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
争议焦点获取步骤,获取预定类型诉讼的裁判文书,通过预设的方式分析得到每一裁判文书中的争议焦点句,并获取争议焦点句中对应的争议焦点;
证据分析步骤,基于预先建立的证据清单中的争议焦点与证据名称的对应关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行分析,获得该裁判文书中与所获取的争议焦点匹配的有效证据信息;
判决语句解析步骤,基于在每一裁判文书中获取到的焦点语句对对应的裁判文书进行解析,以获得该裁判文书中的判决语句;
关联步骤,基于该裁判文书的判决语句获取对应的判决结果,建立该裁判文书的争议焦点句、证据信息、判决语句及判决结果之间的关联关系;
模型训练步骤,基于各裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果对贝叶斯模型进行训练,得到该预定类型诉讼对应的预判模型。
2.根据权利要求1所述的电子装置,其特征在于,所述争议焦点获取步骤,具体包括:
获取模式库中预先建立的争议焦点句的第一模式串,基于第一模式串对每一裁判文书中的语句进行匹配得到争议焦点句,并获取争议焦点句中对应的争议焦点;或者
获取标准的争议焦点句,计算标准的争议焦点句与每一裁判文书中的语句的句向量相似度,将句向量相似度大于预设相似度阈值的语句作为争议焦点句,并获取争议焦点句中对应的争议焦点;或者
预先标注争议焦点句和非争议焦点句,基于预先标注争议焦点句和非争议焦点句训练得到分类模型,以训练得到的分类模型识别各裁判文书中的语句,得到争议焦点句,并获取争议焦点句中对应的争议焦点。
3.根据权利要求1或2所述的电子装置,其特征在于,所述证据分析步骤步骤,具体包括:
基于预先建立的证据清单中的争议焦点与证据名称的关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行匹配,分析是否匹配到与所获取的争议焦点对应的证据信息;
若是,则获取模式库中预先建立的证据信息存在性的第二模式串,基于第二模式串对该裁判文书进行匹配,以分析抗辩双方是否提交有该证据信息;
若是,则获取模式库中预先建立的证据信息有效性的第三模式串,基于第三模式串对该裁判文书进行匹配,以分析该证据信息是否有效;
若是,则以该证据信息作为该裁判文书的有效证据信息。
4.根据权利要求1或2所述的电子装置,其特征在于,所述判决语句解析步骤,具体包括:
获取模式库中预先建立的争议焦点的第四模式串,基于该第四模式串对每一裁判文书中的语句进行匹配,得到涉及争议焦点的语句,将涉及争议焦点的语句中的争议焦点句剔除,以得到该裁判文书的候选判决句;
计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度,按照相似度降序的顺序对对应的候选判决句进行排序;
基于候选判决句的排序、候选判决句匹配到的争议焦点的数量、候选判决句在该裁判文书中的位置选取得到该裁判文书中的判决语句;
其中,所述计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度的步骤包括:
将候选判决句与争议焦点句分别进行分词,对分词标注对应的词性,并对不同词性的分词赋予对应的权重wi,分词后的候选判决句为(x1,x2,…xi…xn),分词后的争议焦点句为(y1,y2,…yi…yn),根据各词性的权重,候选判决句与争议焦点句分别表示为:
x=(w1x1,w2x2,…wixi…w3xn);
y=(w1y1,w2y2,…wiyi…w3yn);
计算候选判决句与争议焦点句加权的余弦相似度为:
5.一种诉讼数据处理的方法,其特征在于,所述诉讼数据处理的方法包括:
S1,获取预定类型诉讼的裁判文书,通过预设的方式分析得到每一裁判文书中的争议焦点句,并获取争议焦点句中对应的争议焦点;
S2,基于预先建立的证据清单中的争议焦点与证据名称的对应关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行分析,获得该裁判文书中与所获取的争议焦点匹配的有效证据信息;
S3,基于在每一裁判文书中获取到的焦点语句对对应的裁判文书进行解析,以获得该裁判文书中的判决语句;
S4,基于该裁判文书的判决语句获取对应的判决结果,建立该裁判文书的争议焦点句、证据信息、判决语句及判决结果之间的关联关系;
S5,基于各裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果对贝叶斯模型进行训练,得到该预定类型诉讼对应的预判模型。
6.根据权利要求5所述的诉讼数据处理的方法,其特征在于,所述步骤S1包括:
获取模式库中预先建立的争议焦点句的第一模式串,基于第一模式串对每一裁判文书中的语句进行匹配得到争议焦点句,并获取争议焦点句中对应的争议焦点;或者
获取标准的争议焦点句,计算标准的争议焦点句与每一裁判文书中的语句的句向量相似度,将句向量相似度大于预设相似度阈值的语句作为争议焦点句,并获取争议焦点句中对应的争议焦点;或者
预先标注争议焦点句和非争议焦点句,基于预先标注争议焦点句和非争议焦点句训练得到分类模型,以训练得到的分类模型识别各裁判文书中的语句,得到争议焦点句,并获取争议焦点句中对应的争议焦点。
7.根据权利要求5或6所述的诉讼数据处理的方法,其特征在于,所述步骤S2包括:
基于预先建立的证据清单中的争议焦点与证据名称的关系、在每一裁判文书中获取的争议焦点,对对应的裁判文书进行匹配,分析是否匹配到与所获取的争议焦点对应的证据信息;
若是,则获取模式库中预先建立的证据信息存在性的第二模式串,基于第二模式串对该裁判文书进行匹配,以分析抗辩双方是否提交有该证据信息;
若是,则获取模式库中预先建立的证据信息有效性的第三模式串,基于第三模式串对该裁判文书进行匹配,以分析该证据信息是否有效;
若是,则以该证据信息作为该裁判文书的有效证据信息。
8.根据权利要求5或6所述的诉讼数据处理的方法,其特征在于,所述步骤S3包括:
获取模式库中预先建立的争议焦点的第四模式串,基于该第四模式串对每一裁判文书中的语句进行匹配,得到涉及争议焦点的语句,将涉及争议焦点的语句中的争议焦点句剔除,以得到该裁判文书的候选判决句;
计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度,按照相似度降序的顺序对对应的候选判决句进行排序;
基于候选判决句的排序、候选判决句匹配到的争议焦点的数量、候选判决句在该裁判文书中的位置选取得到该裁判文书中的判决语句;
其中,所述计算该裁判文书中候选判决句与争议焦点句的加权的余弦相似度的步骤包括:
将候选判决句与争议焦点句分别进行分词,对分词标注对应的词性,并对不同词性的分词赋予对应的权重wi,分词后的候选判决句为(x1,x2,…xi…xn),分词后的争议焦点句为(y1,y2,…yi…yn),根据各词性的权重,候选判决句与争议焦点句分别表示为:
x=(w1x1,w2x2,…wixi…w3xn);
y=(w1y1,w2y2,…wiyi…w3yn);
计算候选判决句与争议焦点句加权的余弦相似度为:
9.根据权利要求8所述的诉讼数据处理的方法,其特征在于,所述步骤S4包括:
所述判决结果包括支持与不支持,将判决语句与模式库中预先建立判决模式串进行匹配,获取对应的判决结果,建立该裁判文书的证据信息、焦点语句、判决语句及判决结果之间的关联关系并保存;
所述步骤S5包括:
以预定类型诉讼的裁判文书对应的具有关联关系的争议焦点句、证据信息、判决语句及判决结果为一条数据,将所有裁判文书对应的数据分为第一比例的训练集及第二比例验证集,利用训练集中的各条数据对贝叶斯模型进行训练,利用验证集中的各条数据对训练后的贝叶斯模型进行准确率的验证,若训练后的贝叶斯模型的准确率大于预设阈值,则训练结束,以训练后的贝叶斯模型作为该预定类型诉讼对应的预判模型,若训练后的贝叶斯模型的准确率不大于预设阈值,则增加用于训练贝叶斯模型的数据的数量,直至训练后的贝叶斯模型的准确率大于预设阈值。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现如权利要求5至9中任一项所述的诉讼数据处理的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811043749.9A CN109359175B (zh) | 2018-09-07 | 2018-09-07 | 电子装置、诉讼数据处理的方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811043749.9A CN109359175B (zh) | 2018-09-07 | 2018-09-07 | 电子装置、诉讼数据处理的方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109359175A true CN109359175A (zh) | 2019-02-19 |
CN109359175B CN109359175B (zh) | 2023-04-07 |
Family
ID=65350595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811043749.9A Active CN109359175B (zh) | 2018-09-07 | 2018-09-07 | 电子装置、诉讼数据处理的方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109359175B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109992664A (zh) * | 2019-03-12 | 2019-07-09 | 平安科技(深圳)有限公司 | 争议焦点的标注分类方法、装置、计算机设备和存储介质 |
CN110377631A (zh) * | 2019-06-17 | 2019-10-25 | 平安科技(深圳)有限公司 | 案件信息处理方法、装置、计算机设备和存储介质 |
CN110377632A (zh) * | 2019-06-17 | 2019-10-25 | 平安科技(深圳)有限公司 | 诉讼结果预测方法、装置、计算机设备和存储介质 |
CN110457357A (zh) * | 2019-07-05 | 2019-11-15 | 中国平安财产保险股份有限公司 | 基于神经网络的律师推荐方法及相关设备 |
CN110675023A (zh) * | 2019-08-22 | 2020-01-10 | 中国司法大数据研究院有限公司 | 一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置 |
CN110765266A (zh) * | 2019-09-20 | 2020-02-07 | 成都星云律例科技有限责任公司 | 一种裁判文书相似争议焦点合并方法及系统 |
CN110889502A (zh) * | 2019-10-15 | 2020-03-17 | 东南大学 | 一种基于深度学习的争议焦点生成方法 |
CN111143550A (zh) * | 2019-11-27 | 2020-05-12 | 浙江大学 | 一种基于层次注意力神经网络模型的争议焦点自动识别方法 |
CN111161105A (zh) * | 2019-12-27 | 2020-05-15 | 中科鼎富(北京)科技发展有限公司 | 一种处理法院观点的方法、装置、存储介质和电子设备 |
CN111814477A (zh) * | 2020-07-06 | 2020-10-23 | 重庆邮电大学 | 一种基于争议焦点实体的争议焦点发现方法、装置及终端 |
CN111950253A (zh) * | 2020-08-28 | 2020-11-17 | 鼎富智能科技有限公司 | 用于裁判文书的证据信息提取方法及装置 |
CN112163707A (zh) * | 2020-09-30 | 2021-01-01 | 北京理工大学 | 一种基于贝叶斯网络的刑期预测方法 |
WO2021051866A1 (zh) * | 2019-09-18 | 2021-03-25 | 平安科技(深圳)有限公司 | 判案结果确定方法、装置、设备及计算机可读存储介质 |
WO2021057202A1 (zh) * | 2019-09-25 | 2021-04-01 | 北京国双科技有限公司 | 一种判决结果处理方法及装置 |
WO2021073410A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 法律证据的排序和推荐方法、装置、设备及存储介质 |
CN112800746A (zh) * | 2021-01-28 | 2021-05-14 | 北京华宇元典信息服务有限公司 | 基于文本匹配的争议焦点推荐方法、装置和电子设备 |
CN114040045A (zh) * | 2021-10-23 | 2022-02-11 | 林章建 | 数字化快速判决装置及其手机载体 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050071284A1 (en) * | 2003-09-26 | 2005-03-31 | Courson Gardner G. | Method of early case assessment in law suits |
CN106296495A (zh) * | 2016-08-09 | 2017-01-04 | 点击律(上海)网络科技有限公司 | 一种诉讼结果的预测方法及系统 |
CN107122451A (zh) * | 2017-04-26 | 2017-09-01 | 北京科技大学 | 一种法律文书案由分类器的自动构建方法 |
CN107330820A (zh) * | 2017-08-28 | 2017-11-07 | 北京智诚律法科技有限公司 | 一种诉讼结果的预测系统及方法 |
CN107918921A (zh) * | 2017-11-21 | 2018-04-17 | 南京擎盾信息科技有限公司 | 刑事案件判决结果度量方法及系统 |
CN108241621A (zh) * | 2016-12-23 | 2018-07-03 | 北京国双科技有限公司 | 法律知识的检索方法及装置 |
CN108304386A (zh) * | 2018-03-05 | 2018-07-20 | 上海思贤信息技术股份有限公司 | 一种基于逻辑规则推断法律文书判决结果的方法及装置 |
-
2018
- 2018-09-07 CN CN201811043749.9A patent/CN109359175B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050071284A1 (en) * | 2003-09-26 | 2005-03-31 | Courson Gardner G. | Method of early case assessment in law suits |
CN106296495A (zh) * | 2016-08-09 | 2017-01-04 | 点击律(上海)网络科技有限公司 | 一种诉讼结果的预测方法及系统 |
CN108241621A (zh) * | 2016-12-23 | 2018-07-03 | 北京国双科技有限公司 | 法律知识的检索方法及装置 |
CN107122451A (zh) * | 2017-04-26 | 2017-09-01 | 北京科技大学 | 一种法律文书案由分类器的自动构建方法 |
CN107330820A (zh) * | 2017-08-28 | 2017-11-07 | 北京智诚律法科技有限公司 | 一种诉讼结果的预测系统及方法 |
CN107918921A (zh) * | 2017-11-21 | 2018-04-17 | 南京擎盾信息科技有限公司 | 刑事案件判决结果度量方法及系统 |
CN108304386A (zh) * | 2018-03-05 | 2018-07-20 | 上海思贤信息技术股份有限公司 | 一种基于逻辑规则推断法律文书判决结果的方法及装置 |
Non-Patent Citations (1)
Title |
---|
吕文学;杨权利;: "基于CBR-RBR的工程争端诉讼结果预测" * |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109992664B (zh) * | 2019-03-12 | 2023-04-18 | 平安科技(深圳)有限公司 | 争议焦点的标注分类方法、装置、计算机设备和存储介质 |
CN109992664A (zh) * | 2019-03-12 | 2019-07-09 | 平安科技(深圳)有限公司 | 争议焦点的标注分类方法、装置、计算机设备和存储介质 |
CN110377632B (zh) * | 2019-06-17 | 2023-06-20 | 平安科技(深圳)有限公司 | 诉讼结果预测方法、装置、计算机设备和存储介质 |
CN110377631A (zh) * | 2019-06-17 | 2019-10-25 | 平安科技(深圳)有限公司 | 案件信息处理方法、装置、计算机设备和存储介质 |
CN110377632A (zh) * | 2019-06-17 | 2019-10-25 | 平安科技(深圳)有限公司 | 诉讼结果预测方法、装置、计算机设备和存储介质 |
CN110377631B (zh) * | 2019-06-17 | 2024-01-09 | 平安科技(深圳)有限公司 | 案件信息处理方法、装置、计算机设备和存储介质 |
CN110457357A (zh) * | 2019-07-05 | 2019-11-15 | 中国平安财产保险股份有限公司 | 基于神经网络的律师推荐方法及相关设备 |
CN110457357B (zh) * | 2019-07-05 | 2023-02-14 | 中国平安财产保险股份有限公司 | 基于神经网络的律师推荐方法及相关设备 |
CN110675023A (zh) * | 2019-08-22 | 2020-01-10 | 中国司法大数据研究院有限公司 | 一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置 |
CN110675023B (zh) * | 2019-08-22 | 2022-03-25 | 中国司法大数据研究院有限公司 | 一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置 |
WO2021051866A1 (zh) * | 2019-09-18 | 2021-03-25 | 平安科技(深圳)有限公司 | 判案结果确定方法、装置、设备及计算机可读存储介质 |
CN110765266A (zh) * | 2019-09-20 | 2020-02-07 | 成都星云律例科技有限责任公司 | 一种裁判文书相似争议焦点合并方法及系统 |
CN110765266B (zh) * | 2019-09-20 | 2022-07-22 | 成都星云律例科技有限责任公司 | 一种裁判文书相似争议焦点合并方法及系统 |
WO2021057202A1 (zh) * | 2019-09-25 | 2021-04-01 | 北京国双科技有限公司 | 一种判决结果处理方法及装置 |
CN110889502A (zh) * | 2019-10-15 | 2020-03-17 | 东南大学 | 一种基于深度学习的争议焦点生成方法 |
CN110889502B (zh) * | 2019-10-15 | 2024-02-06 | 东南大学 | 一种基于深度学习的争议焦点生成方法 |
WO2021073410A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 法律证据的排序和推荐方法、装置、设备及存储介质 |
CN111143550B (zh) * | 2019-11-27 | 2022-05-03 | 浙江大学 | 一种基于层次注意力神经网络模型的争议焦点自动识别方法 |
CN111143550A (zh) * | 2019-11-27 | 2020-05-12 | 浙江大学 | 一种基于层次注意力神经网络模型的争议焦点自动识别方法 |
CN111161105A (zh) * | 2019-12-27 | 2020-05-15 | 中科鼎富(北京)科技发展有限公司 | 一种处理法院观点的方法、装置、存储介质和电子设备 |
CN111814477B (zh) * | 2020-07-06 | 2022-06-21 | 重庆邮电大学 | 一种基于争议焦点实体的争议焦点发现方法、装置及终端 |
CN111814477A (zh) * | 2020-07-06 | 2020-10-23 | 重庆邮电大学 | 一种基于争议焦点实体的争议焦点发现方法、装置及终端 |
CN111950253A (zh) * | 2020-08-28 | 2020-11-17 | 鼎富智能科技有限公司 | 用于裁判文书的证据信息提取方法及装置 |
CN111950253B (zh) * | 2020-08-28 | 2023-12-08 | 鼎富智能科技有限公司 | 用于裁判文书的证据信息提取方法及装置 |
CN112163707A (zh) * | 2020-09-30 | 2021-01-01 | 北京理工大学 | 一种基于贝叶斯网络的刑期预测方法 |
CN112800746A (zh) * | 2021-01-28 | 2021-05-14 | 北京华宇元典信息服务有限公司 | 基于文本匹配的争议焦点推荐方法、装置和电子设备 |
CN114040045A (zh) * | 2021-10-23 | 2022-02-11 | 林章建 | 数字化快速判决装置及其手机载体 |
Also Published As
Publication number | Publication date |
---|---|
CN109359175B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359175A (zh) | 电子装置、诉讼数据处理的方法及存储介质 | |
CN110163478B (zh) | 一种合同条款的风险审查方法及装置 | |
CN108520343B (zh) | 风险模型训练方法、风险识别方法、装置、设备及介质 | |
CN103336766B (zh) | 短文本垃圾识别以及建模方法和装置 | |
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
CN110287479A (zh) | 命名实体识别方法、电子装置及存储介质 | |
US20180373751A1 (en) | Method and apparatus for recognizing a low-quality news resource, computer device and readable medium | |
CN107102993B (zh) | 一种用户诉求分析方法和装置 | |
CN110263248A (zh) | 一种信息推送方法、装置、存储介质和服务器 | |
CN109492222A (zh) | 基于概念树的意图识别方法、装置及计算机设备 | |
CN110362689A (zh) | 一种风险评估方法、装置、存储介质和服务器 | |
CN109062972A (zh) | 网页分类方法、装置及计算机可读存储介质 | |
CN110008336B (zh) | 一种基于深度学习的舆情预警方法及系统 | |
CN109508373A (zh) | 企业舆情指数的计算方法、设备及计算机可读存储介质 | |
CN107908615A (zh) | 一种获取搜索词对应商品类目的方法和装置 | |
CN110609908A (zh) | 案件串并方法及装置 | |
CN110362601A (zh) | 元数据标准的映射方法、装置、设备及存储介质 | |
CN110083832A (zh) | 文章转载关系的识别方法、装置、设备及可读存储介质 | |
CN107870945A (zh) | 内容分级方法和装置 | |
CN110263854A (zh) | 直播标签确定方法、装置及存储介质 | |
CN107122492A (zh) | 基于图片内容的歌词生成方法和装置 | |
CN114547315A (zh) | 一种案件分类预测方法、装置、计算机设备及存储介质 | |
CN107368489A (zh) | 一种资讯数据处理方法及装置 | |
CN107704869B (zh) | 一种语料数据抽样方法及模型训练方法 | |
CN110688540B (zh) | 一种作弊账户筛选方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |