CN117725903A - 裁判文书生成方法、装置、系统和存储介质 - Google Patents
裁判文书生成方法、装置、系统和存储介质 Download PDFInfo
- Publication number
- CN117725903A CN117725903A CN202311617205.XA CN202311617205A CN117725903A CN 117725903 A CN117725903 A CN 117725903A CN 202311617205 A CN202311617205 A CN 202311617205A CN 117725903 A CN117725903 A CN 117725903A
- Authority
- CN
- China
- Prior art keywords
- case
- semantic understanding
- information
- element information
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 239000000463 material Substances 0.000 claims abstract description 102
- 230000008859 change Effects 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 239000013590 bulk material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本发明提供一种裁判文书生成方法、装置、系统和存储介质,该方法包括:获取待审判案件的卷宗材料;获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;对各所述要素信息进行语义理解,得到各第一语义理解结果;基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。本发明可以提高裁判文书的生成效率,进而提升了整个案件的审判效率。
Description
技术领域
本发明涉及文本处理技术领域,尤其涉及一种裁判文书生成方法、装置、系统和存储介质。
背景技术
随着信息化水平的不断提高,各类司法文书作为案件的输出结果,各司法机构每天都会输出大量的裁判文书。其中,在裁判文书中,包含了大量的案件案情信息、案件审理信息以及法院判决信息。
目前,通常是司法人员通过阅读案件的卷宗材料,通过分析和总结的方式,从卷宗材料中手动提取有用的信息,从而基于这些信息撰写裁判文书。
然而,上述通过手动撰写裁判文书的方式,使得裁判文书的撰写效率较低。
发明内容
本发明提供一种裁判文书生成方法、装置、系统和存储介质,用以解决现有技术中裁判文书的生成效率较低的缺陷,实现提高裁判文书的生成效率的目的。
本发明提供一种裁判文书生成方法,包括:
获取待审判案件的卷宗材料;
获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;
基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;
对各所述要素信息进行语义理解,得到各第一语义理解结果;
基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。
根据本发明提供的一种裁判文书生成方法,所述基于各所述第一语义理解结果,生成所述待审判案件的裁判文书,包括:
获取所述待审判案件的案件类型对应的裁判文书模板,所述裁判文书模板包括至少一个通用语句和各所述通用语句对应的至少一个词槽;
针对各通用语句,对所述通用语句进行语义理解,得到第二语义理解结果;
确定与所述第二语义理解结果匹配的第一语义理解结果对应的第一要素信息;
将所述第一要素信息填充在所述通用语句对应的至少一个词槽中,生成所述待审判案件的裁判文书。
根据本发明提供的一种裁判文书生成方法,所述基于各所述第一语义理解结果,生成所述待审判案件的裁判文书之后,所述方法还包括:
从案例库中获取与所述待审判案件的案由相同、且案件类型相似的至少一个历史审判案件;
确定所有所述历史审判案件对应的历史裁判文书中的共同审判语句;
在所述裁判文书中不包括所述共同审判语句的情况下,将所述共同审判语句添加至所述裁判文书中。
根据本发明提供的一种裁判文书生成方法,所述方法还包括:
获取所述案件类型对应的法律知识、至少一个历史审判案件的历史卷宗材料和历史裁判文书;
将所述法律知识、各所述历史卷宗材料和各所述历史裁判文书输入要素提取模型中,得到所述要素提取模型输出的各所述历史卷宗材料中的要素字段,所述要素提取模型为基于所述法律知识、卷宗材料样本和所述卷宗材料样本对应的裁判文书样本对初始要素提取模型训练得到的;
基于各所述历史卷宗材料中的要素字段,构建所述要素表。
根据本发明提供的一种裁判文书生成方法,所述基于各所述历史卷宗材料中的要素字段,构建所述要素表,包括:
将所有所述历史卷宗材料中的要素字段进行去重处理,得到去重后的各要素字段;
将所述去重后的各要素字段基于语义进行归类,得到归类后的要素字段集合;
针对各所述要素字段集合,获取与所述要素字段集合中要素字段语义相同的扩充要素字段;
将所述扩充要素字段添加至所述要素字段集合中,得到扩充后的要素字段集合;
基于各所述扩充后的要素字段集合,构建所述要素表。
根据本发明提供的一种裁判文书生成方法,所述对各所述要素信息进行语义理解,得到各第一语义理解结果之前,所述方法还包括:
输出各所述要素信息;
在接收到用户输入的针对第二要素信息的第一更改指令的情况下,响应于所述第一更改指令,显示更改界面;
接收所述用户通过所述更改界面输入的第一要素更改信息;
采用所述第一要素更改信息更新所述第二要素信息;
对各所述要素信息进行语义理解,得到各第一语义理解结果,包括:
对未更新的要素信息和更新后的第二要素信息进行语义理解,得到各第一语义理解结果。
本发明还提供一种裁判文书生成装置,包括:
获取模块,用于获取待审判案件的卷宗材料;
所述获取模块,还用于获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;
确定模块,用于基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;
处理模块,用于对各所述要素信息进行语义理解,得到各第一语义理解结果;
生成模块,用于基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述裁判文书生成方法。
本发明还提供一种裁判文书生成系统,包括:审判终端、与所述审判终端通信连接的原告终端和被告终端;
所述审判终端,用于获取待审判案件的卷宗材料,并获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;
所述审判终端,还用于基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;
所述审判终端,还用于将各所述要素信息发送至所述原告终端和所述被告终端;
所述原告终端,用于输出各所述要素信息,并在接收到针对第三要素信息的第二更改指令的情况下,基于获取到的第二要素更改信息更新所述第三要素信息,并将更新后的第三要素信息发送至所述审判终端;
所述被告终端,用于输出各所述要素信息,并在接收到针对第四要素信息的第三更改指令的情况下,基于获取到的第三要素更改信息更新所述第四要素信息,并将更新后的第四要素信息发送至所述审判终端;
所述审判终端,还用于基于未更新的要素信息和更新后的要素信息进行语义理解,得到各第一语义理解结果,并基于各所述第一语义理解结果,生成所述待审判案件的裁判文书,所述更新后的要素信息包括所述更新后的第三要素信息和所述更新后的第四要素信息。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述裁判文书生成方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述裁判文书生成方法。
本发明提供的裁判文书生成方法、装置、系统和存储介质,在获取到待审判案件的卷宗材料后,可以获取待审判案件的案件类型对应的要素表,从而基于要素表中的多个要素字段,从卷宗材料中确定各个目标要素字段各自对应的要素信息,通过对要素信息进行语义理解后,得到各第一语义理解结果,并基于各第一语义理解结果,生成待审判案件的裁判文书。由于可以预先设置各个案件类型对应的用于表征主要信息的要素字段,基于该要素字段,从卷宗材料中提取出的要素信息均为对生成裁判文书比较重要的内容,因此,可以对要素信息进行语义理解后,基于语义理解结果自动生成裁判文书,因而可以提高裁判文书的生成效率,可以加快整个待审判案件的审判速度,进而提升了整个案件的审判效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的裁判文书生成方法的流程示意图;
图2是本发明实施例提供的裁判文书生成装置的结构示意图;
图3示例了一种电子设备的实体结构示意图;
图4为本发明实施例提供的裁判文书生成系统的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
近年来,司法机构受理的案件数量越来越多。目前,通常都是司法人员阅读案件的相关卷宗材料,通过分析和总结,从卷宗材料中提取有用的信息,从而再通过手动方式撰写出裁判文书。然而,与案件相关的卷宗材料通常会很多,如果靠人工分析和总结卷宗材料后,再通过手动方式撰写裁判文书,会使得裁判文书的撰写效率较低。
本发明实施例中考虑到上述问题,提出一种裁判文书生成方法,在获取到待审判案件的卷宗材料后,可以获取待审判案件的案件类型对应的要素表,从而基于要素表中的多个要素字段,从卷宗材料中确定各个目标要素字段各自对应的要素信息,通过对要素信息进行语义理解后,得到各第一语义理解结果,并基于各第一语义理解结果,生成待审判案件的裁判文书。由于可以预先设置各个案件类型对应的用于表征主要信息的要素字段,基于该要素字段,从卷宗材料中提取出的要素信息均为对生成裁判文书比较重要的内容,因此,可以对要素信息进行语义理解后,基于语义理解结果自动生成裁判文书,因而可以提高裁判文书的生成效率。
本发明实施例提供的裁判文书生成方法,可以应用于法律领域各类文书的生成场景中。
图1是本发明实施例提供的裁判文书生成方法的流程示意图,本方法的执行主体可以是终端设备、计算机、服务器、服务器集群或专门设计的裁判文书生成设备等电子设备,也可以是设置在该电子设备中的裁判文书生成装置,该裁判文书生成装置可以通过软件、硬件或两者的结合来实现。如图1所示,该裁判文书生成方法包括步骤101至步骤105。
步骤101:获取待审判案件的卷宗材料。
在本步骤中,待审判案件为需要进行审判的案件。卷宗材料为与待审判案件相关的材料,如起诉状、答辩状、证明材料和调解内容等等。
步骤102:获取待审判案件的案件类型对应的要素表,要素表中包括多个要素字段。
目前,司法机构都是基于要素式审判,也即司法机构在审判案件时,会紧紧围绕案件的要素予以展开,非要素的部分从简从略。因此,要素对于案件的审判以及裁判文书的生成是极其重要的。在本步骤中,要素字段也可以理解为要素,其是构成案件必不可缺的因素或者组成系统的基本单元。
另外,案件类型可以包括金融类案件、离婚类案件或遗产继承类案件等等。通常,不同的案件类型,在进行案件审判时,关注的重点会不同,因此,针对每个类型的案件,均会预先设置该类型对应的要素表,在要素表中包括多个要素字段。其中,在要素表中包括的要素字段可以理解为针对该类型的案件重点关注的内容,或者对审判案件比较有用的内容。例如,要素字段可以包括案情要素字段、当事人要素字段、事实要素字段、诉讼请求要素字段、事实及理由要素字段等。对于每一类型的案件,事实要素字段、诉讼请求要素字段和事实及理由要素字段会有所不同,例如,金融类案件中可能包括的要素字段会包括还款时间、利息、逾期或违约金等等,离婚类案件中可能包括的要素字段包括子女、财产或抚养等等。
步骤103:基于多个要素字段,从卷宗材料中确定至少一个目标要素字段各自对应的要素信息。
在本步骤中,要素信息为卷宗材料中包括的与目标要素字段对应的信息。至少一个目标要素字段为多个要素字段中的至少一个字段,其为卷宗材料中包括的字段。例如,若待审判案件的案件类型包括金融类案件,其对应的要素表中包括的要素字段包括当事人、还款时间、利息、逾期或违约金等等。通过分析卷宗材料,确定卷宗材料中包括有:当事人:张XX,还款时间:2023-11-1,利息:3%,因此,可以确定出目标要素字段包括当事人、还款时间和利息,要素信息包括:张XX、2023-11-1和3%。
步骤104:对各要素信息进行语义理解,得到各第一语义理解结果。
在本步骤中,由于不同的当事人,提交的卷宗材料不一样,因此,同样的内容可能在不同的卷宗材料中表述也会不一样。例如,有的卷宗材料中可能表述为“贷款”,有的卷宗材料中可能表述为“借钱”等等。因此,需要对获取到的要素信息进行语义理解,以理解该要素信息在卷宗材料中所表达的含义。
具体地,可以将要素信息输入语义理解模型中,得到语义理解模型输出的第一语义理解结果,其中,该语义理解模型可以是大语言模型,也可以是其他神经网络模型。示例性的,可以将要素信息样本输入初始语义理解模型中,得到初始语义理解模型输出的预测语义理解结果,将该预测语义理解结果和要素信息样本对应的标签信息进行比对,得到损失信息后,基于该损失信息可以调整初始语义理解模型的模型参数,通过不断重复上述过程,直至得到的模型收敛或者重复次数达到预设次数,从而将最终得到的模型确定为语义理解模型。
步骤105:基于各第一语义理解结果,生成待审判案件的裁判文书。
在本步骤中,裁判文书可以理解为对待审判案件进行审判或者调解的参考性文件。在确定出各第一语义理解结果之后,便可以获知要素信息表达的含义,从而可以基于与案件类型对应的裁判文书模板,生成待审判案件的裁判文书。由于裁判文书是基于要素信息生成的,其涵盖了对待审判案件比较重要的信息,因此,生成的裁判文书的准确度较高。
本发明实施例提供的裁判文书生成方法,在获取到待审判案件的卷宗材料后,可以获取待审判案件的案件类型对应的要素表,从而基于要素表中的多个要素字段,从卷宗材料中确定各个目标要素字段各自对应的要素信息,通过对要素信息进行语义理解后,得到各第一语义理解结果,并基于各第一语义理解结果,生成待审判案件的裁判文书。由于可以预先设置各个案件类型对应的用于表征主要信息的要素字段,基于该要素字段,从卷宗材料中提取出的要素信息均为对生成裁判文书比较重要的内容,因此,可以对要素信息进行语义理解后,基于语义理解结果自动生成裁判文书,因而可以提高裁判文书的生成效率,可以加快整个待审判案件的审判速度,进而提升了整个案件的审判效率。
示例性的,在上述实施例的基础上,在基于各第一语义理解结果,生成待审判案件的裁判文书时,可以获取待审判案件的案件类型对应的裁判文书模板,裁判文书模板包括至少一个通用语句和各通用语句对应的至少一个词槽;针对各通用语句,对通用语句进行语义理解,得到第二语义理解结果;确定与第二语义理解结果匹配的第一语义理解结果对应的第一要素信息;将第一要素信息填充在通用语句对应的至少一个词槽中,生成待审判案件的裁判文书。
具体地,可以通过大量的历史案件和法律知识库,通过数据挖掘和大数据分析等技术,对历史案件以及历史案件的历史裁判文书等进行分析和处理,确定各个案件类型对应的裁判文书模板,由于不同案件类型的待审判案件,生成的裁判文书会不同,因此,会对应不同的裁判文书模板。
其中,该裁判文书模板中包括至少一个通用语句和各通用语句对应的至少一个词槽。通用语句可以理解为可以适用于该案件类型的所有案件的语句,词槽为需要填写的内容。其中,对于不同的案件,在词槽处填写的内容可能不同。例如,若裁判文书模板中包括“利息是()”,其中,“利息是”为通用语句,“()”表征需要填写内容的词槽。
在确定出裁判文书模板之后,对于裁判文书模板中的通用语句,可以对该通用语句进行语义理解,从而确定出该通用语句的第二语义理解结果。将各第一语义理解结果和该通用语句的第二语义理解结果进行匹配,并从多个第一语义理解结果中确定与第二语义理解结果匹配的第一语义理解结果,并获取匹配的第一语义理解结果对应的第一要素信息,从而将第一要素信息填充在该通用语句对应的至少一个词槽中,以生成待审判案件的裁判文书。
举例来说,若通用语句为“利息是()”,则该第二语义理解结果为利息的相关内容。通过将与从卷宗材料中提取出的各要素进行语义理解后得到的第一语义理解结果进行匹配后,发现第一要素信息“利息:3%”对应的第一语义理解结果与该第二语义理解结果相匹配,从而将“3%”填充至通用语句“利息是()”的词槽中,得到“利息是3%”的内容。
可以理解的是,裁判文书模板中包括有多个通用语句,对于每个通用语句,都采用上述方式进行匹配之后,会将每个通用语句的词槽均填充完整,从而可以生成最终的裁判文书。
需要进行说明的是,有时候会存在部分通用语句的第二语义理解结果无法匹配到对应的第一语义理解结果,此时,可以将该通用语句的词槽空着,以便后续司法人员进行核对,也可以直接将该通用语句删除。
在本实施例中,通过对裁判文书模板中的各通用语句进行语义理解,得到第二语义理解结果后,确定与第二语义理解结果匹配的第一语义理解结果对应的第一要素信息,从而将第一要素信息填充在通用语句对应的至少一个词槽中,生成待审判案件的裁判文书。一方面,可以基于待审判案件的案件类型对应的裁判文书模板进行裁判文书的生成,可以提高裁判文书的生成效率。另一方面,可以基于通用语句的第二语义结果,确定与通用语句语义匹配的第一要素信息,从而将第一要素信息填充在语义匹配的通用语句的词槽中,从而可以使得生成的裁判文书更准确。
另外,同类型的历史审判案件的裁判文书,通常会对待审判案件的裁判文书起到非常重要的参考作用,因此,可以筛选一些案由相同、且案件类型相同的至少一个历史审判案件,从而基于这些历史审判案件的历史裁判文书中的审判语句,来对生成的待审判案件的裁判文书进行补充或者修改。
示例性的,在基于各第一语义理解结果,生成待审判案件的裁判文书后,还可以从案例库中获取与待审判案件的案由相同、且案件类型相同的至少一个历史审判案件;确定所有历史审判案件对应的历史裁判文书中的共同审判语句;在裁判文书中不包括共同审判语句的情况下,将共同审判语句添加至裁判文书中。
具体地,可以将过往相同案由、相似或者相同案件类型、相同审判结果的历史审判案件存储在案例库中,其中,该案例库中还包括有各历史审判案件的历史裁判文书。通过对这些历史裁判文书进行分析,可以提取出均出现在这些历史裁判文书中的共同审判语句,如“由原告承担诉讼费用”。若生成的待审判案件的裁判文书中不包括共同审判语句的情况下,如不包括“由原告承担诉讼费用”时,可以将该共同审判语句添加至裁判文书中。应理解,若裁判文书中包括共同审判语句时,可以不对该裁判文书做修改。
在本实施例中,可以从案例库中获取与待审判案件的案由相同、且案件类型相似的至少一个历史审判案件,并确定所有历史审判案件对应的历史裁判文书中的共同审判语句,当在裁判文书中不包括共同审判语句的情况下,可以将共同审判语句添加至裁判文书中。由于可以将历史审判案件的历史裁判文书中的部分审判语句作为参考,来对生成的裁判文书进行补充,因此,可以防止同案不同判的现象,提高了裁判文书的准确度,而且可以提高裁判文书的完善度。
示例性的,在上述各实施例的基础上,可以通过如下方式构建要素表:获取案件类型对应的法律知识、至少一个历史审判案件的历史卷宗材料和历史裁判文书;将法律知识、各历史卷宗材料和各历史裁判文书输入要素提取模型中,得到要素提取模型输出的各历史卷宗材料中的要素字段,要素提取模型为基于法律知识、卷宗材料样本和卷宗材料样本对应的裁判文书样本对初始要素提取模型训练得到的;基于各历史卷宗材料中的要素字段,构建要素表。
具体地,案件类型对应的法律知识,可以包括法律条款和法规知识等。可以从法律知识库中获取与案件类型对应的法律知识,从历史审判案件信息库中获取至少一个历史审判案件的历史卷宗材料和历史裁判文书,其中,历史审判案件信息库中包括历史时间段内所有历史审判案件的历史卷宗材料和历史裁判文书。
将获取到的法律知识、各历史卷宗材料和各历史裁判文书输入要素提取模型中,从而可以得到要素提取模型输出的各历史卷宗材料中的要素字段,该要素字段可以理解为在历史卷宗材料中比较重要或者对审判结果有用的信息。
其中,可以预先获取法律知识、卷宗材料样本和卷宗材料样本对应的裁判文书样本,并通过人工标注的方式或者通过对卷宗材料样本和裁判文书样本进行案件规律和关联性的挖掘,从而确定出卷宗材料样本中比较重要的信息以及对裁判文书样本有用的内容,并进行提炼,从而基于提炼的信息进行在卷宗材料样本中标注出真实要素字段,作为卷宗材料样本和卷宗材料样本对应的裁判文书样本对应的标注信息。将法律知识、卷宗材料样本和卷宗材料样本对应的裁判文书样本输入初始要素提取模型后,得到预测要素字段,将预测要素字段和真实要素字段进行比对,确定出损失信息后,可以基于损失信息对初始要素提取模型的模型参数进行调整,通过重复执行上述过程,直至模型收敛或者重复次数达到预设次数,将最终得到的模型确定为要素提取模型。
进一步地,可以将确定出的历史卷宗材料中的要素字段进行存储,从而构建出要素表。
在本实施例中,可以基于法律知识、至少一个历史审判案件的历史卷宗材料和历史裁判文书,通过预先训练的要素提取模型确定历史卷宗材料中的要素字段,并基于要素字段构建要素表,由于将历史卷宗材料和各历史裁判文书作为基础材料确定要素字段,可以提高要素字段的准确性,另外,可以借助要素提取模型提取要素字段,可以提高要素字段确定的效率。另外,通过从历史卷宗材料提取要素字段,并构建要素表,从而基于要素表中的要素字段提取要素信息,使得司法人员可以更快的理清审判思路和程序逻辑,加快整个案件的审判速度。另外,要素表对司法人员是一种指引和约束,可以节省庭前阅卷的时间,有利于审判权的规范行使,同时司法人员通常需要按照要素表进行审理,对司法人员的自由裁量进行了限制,同时要素表也是对当事人的诉讼指引和服务,有利于当事人更好地主张权利。
示例性的,在上述实施例的基础上,在基于各历史卷宗材料中的要素字段,构建要素表时,可以将所有历史卷宗材料中的要素字段进行去重处理,得到去重后的各要素字段;将去重后的各要素字段基于语义进行归类,得到归类后的要素字段集合;针对各要素字段集合,获取与要素字段集合中要素字段语义相同的扩充要素字段;将扩充要素字段添加至要素字段集合中,得到扩充后的要素字段集合;基于各扩充后的要素字段集合,构建要素表。
具体地,由于各个历史卷宗材料中的要素字段之间可能会有重复,因此,在从每个历史卷宗材料中提取要素字段后,需要先进行去重处理,从而得到去重后的各要素字段,这样,可以减少冗余的要素字段,可以节省系统的存储空间。进一步地,可以对去重后的各要素字段进行语义识别,确定出各要素字段的语义,从而将去重后的各要素字段基于语义进行归类,得到归类后的要素字段集合。应理解,各归类后的要素字段集合中包括相同或相似语义的要素字段。如将具有借款语义的要素字段归为一类,将具有存款语义的要素字段归为一类等等。
由于相同语义的要素字段,可能会有多种表达方式,为了涵盖更多的要素字段,针对每个要素字段集合,可以获取与要素字段集合中要素字段语义相同的扩充要素字段,如要素字段集合中要素字段为“借款”,可以确定出与其具有相同语义的扩充要素字段“借钱”等。从而将获取的扩充要素字段也添加至要素字段集合中,得到扩充后的要素字段集合,并基于各扩充后的要素字段集合,构建要素表。其中,通过这种方式构建的要素表中,要素字段集合可以是基于语义进行分类存储的,也即将相同语义的要素字段存储在一起。这样,后续在基于要素表确定至少一个目标要素字段时,可以直接基于语义从对应的要素字段中查找即可,从而可以提高目标要素字段确定的效率。
在本实施例中,将去重后的各要素字段基于语义进行归类,得到归类后的要素字段集合后,针对各要素字段集合,获取与要素字段集合中要素字段语义相同的扩充要素字段,这样,扩充后的要素字段集合中将包括较为丰富和全面的要素字段,提高了要素字段覆盖的全面性。另外,在将扩充要素字段添加至要素字段集合中,得到扩充后的要素字段集合后,基于各扩充后的要素字段集合构建要素表,由于要素表中包括的要素字段覆盖较为全面,因此,后续在基于要素表确定目标要素字段时,可以防止遗漏,提高了目标要素字段的准确性。
在上述各实施例的基础上,为了提高生成裁判文书的灵活性和准确性,司法人员或者其他相关授权人员也可以对电子设备提取的要素信息进行更改。示例性的,在对各要素信息进行语义理解,得到各第一语义理解结果之前,可以先输出各要素信息;在接收到用户输入的针对第二要素信息的第一更改指令的情况下,响应于第一更改指令,显示更改界面;接收用户通过更改界面输入的第一要素更改信息,并采用第一要素更改信息更新第二要素信息。
具体地,电子设备在从卷宗材料中确定出要素信息后,会通过电子设备的显示界面输出该要素信息。其中,电子设备可以为司法人员对应的电子设备,也可以为原告对应的电子设备,还可以为被告对应的电子设备。
在实际应用中,可能会存在某些要素信息有误差或者其并不是用户所重点关注的内容,因此,用户需要对这些要素信息进行修改。此时,用户可以输入第一更改指令,以指示对第二要素信息进行更改。电子设备在接收到第一更改指令后,会显示更改界面。用户通过该更改界面输入第一要素更改信息,从而可以采用第一要素更改信息更新第二要素信息,也即将第二要素信息更改为第一要素更改信息。
进一步地,在对第二要素信息进行更改后,对各要素信息进行语义理解时,可以是对未更新的要素信息和更新后的第二要素信息进行语义理解,得到各第一语义理解结果。
具体地,由于要素信息中部分信息进行了更新,部分信息没有进行更新,因此,在进行语义理解时,可以对未更新的要素信息和更新后的第二要素信息进行语义理解,以此得到各第一语义理解结果。其中,更新后的第二要素信息即为第一要素更改信息。
在本实施例中,可以对第二要素信息进行更改,从而可以使得要素信息的确定方式更加灵活,在后续基于要素信息生成裁判文书时,准确度也更高。
下面对本发明提供的裁判文书生成装置进行描述,下文描述的裁判文书生成装置与上文描述的裁判文书生成方法可相互对应参照。
图2是本发明实施例提供的裁判文书生成装置的结构示意图,参照图2所示,裁判文书生成装置200包括:
获取模块201,用于获取待审判案件的卷宗材料;
所述获取模块201,还用于获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;
确定模块202,用于基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;
处理模块203,用于对各所述要素信息进行语义理解,得到各第一语义理解结果;
生成模块204,用于基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。
在一种示例实施例中,生成模块204,具体用于:
获取所述待审判案件的案件类型对应的裁判文书模板,所述裁判文书模板包括至少一个通用语句和各所述通用语句对应的至少一个词槽;
针对各通用语句,对所述通用语句进行语义理解,得到第二语义理解结果;
确定与所述第二语义理解结果匹配的第一语义理解结果对应的第一要素信息;
将所述第一要素信息填充在所述通用语句对应的至少一个词槽中,生成所述待审判案件的裁判文书。
在一种示例实施例中,获取模块201,还用于从案例库中获取与所述待审判案件的案由相同、且案件类型相似的至少一个历史审判案件;
确定模块202,用于确定所有所述历史审判案件对应的历史裁判文书中的共同审判语句;
处理模块203,用于在所述裁判文书中不包括所述共同审判语句的情况下,将所述共同审判语句添加至所述裁判文书中。
在一种示例实施例中,该裁判文书生成装置还包括提取模块和构建模块;
获取模块201,还用于获取所述案件类型对应的法律知识、至少一个历史审判案件的历史卷宗材料和历史裁判文书;
提取模块,用于将所述法律知识、各所述历史卷宗材料和各所述历史裁判文书输入要素提取模型中,得到所述要素提取模型输出的各所述历史卷宗材料中的要素字段,所述要素提取模型为基于所述法律知识、卷宗材料样本和所述卷宗材料样本对应的裁判文书样本对初始要素提取模型训练得到的;
构建模块,用于基于各所述历史卷宗材料中的要素字段,构建所述要素表。
在一种示例实施例中,构建模块,具体用于:
将所有所述历史卷宗材料中的要素字段进行去重处理,得到去重后的各要素字段;
将所述去重后的各要素字段基于语义进行归类,得到归类后的要素字段集合;
针对各所述要素字段集合,获取与所述要素字段集合中要素字段语义相同的扩充要素字段;
将所述扩充要素字段添加至所述要素字段集合中,得到扩充后的要素字段集合;
基于各所述扩充后的要素字段集合,构建所述要素表。
在一种示例实施例中,所述装置还包括输出模块,其中:
输出模块,用于输出各所述要素信息;
显示模块,用于在接收到用户输入的针对第二要素信息的第一更改指令的情况下,响应于所述第一更改指令,显示更改界面;
接收模块,用于接收所述用户通过所述更改界面输入的第一要素更改信息;
更改模块,用于采用所述第一要素更改信息更新所述第二要素信息;
处理模块,具体用于:
对未更新的要素信息和更新后的第二要素信息进行语义理解,得到各第一语义理解结果。
本实施例的装置,可以用于执行裁判文书生成方法侧实施例中任一实施例的方法,其具体实现过程与技术效果与裁判文书生成方法侧实施例中类似,具体可以参见裁判文书生成方法侧实施例中的详细介绍,此处不再赘述。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行裁判文书生成方法,该方法包括:获取待审判案件的卷宗材料;获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;对各所述要素信息进行语义理解,得到各第一语义理解结果;基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
图4为本发明实施例提供的裁判文书生成系统的示意图,如图4所示,该系统包括审判终端401、与审判终端401通信连接的原告终端402和被告终端403。
其中,审判终端401,用于获取待审判案件的卷宗材料,并获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段。
审判终端401,还用于基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息。
所述审判终端401,还用于将各所述要素信息发送至所述原告终端402和所述被告终端403。
所述原告终端402,用于输出各所述要素信息,并在接收到针对第三要素信息的第二更改指令的情况下,基于获取到的第二要素更改信息更新所述第三要素信息,并将更新后的第三要素信息发送至所述审判终端401;
所述被告终端403,用于输出各所述要素信息,并在接收到针对第四要素信息的第三更改指令的情况下,基于获取到的第三要素更改信息更新所述第四要素信息,并将更新后的第四要素信息发送至所述审判终端401;
所述审判终端401,还用于基于未更新的要素信息和更新后的要素信息进行语义理解,得到各第一语义理解结果,并基于各所述第一语义理解结果,生成所述待审判案件的裁判文书,所述更新后的要素信息包括所述更新后的第三要素信息和所述更新后的第四要素信息。
在本实施例中,审判终端在初步审查后会将审查后的要素信息下发给原告终端和被告终端,原告终端和被告终端也可以对要素信息进行更改,从而使得要素信息的最终确定更加人性化,且更灵活。在审判终端、原告终端和被告终端均确定要素信息后,基于最终确定出的要素信息生成裁判文书,提高了裁判文书的准确性。另外,审判终端还可以对最终生成的裁判文书进行任意的修改,提高了裁判文书修改的灵活性。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的裁判文书生成方法,该方法包括:获取待审判案件的卷宗材料;获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;对各所述要素信息进行语义理解,得到各第一语义理解结果;基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的裁判文书生成方法,该方法包括:获取待审判案件的卷宗材料;获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;对各所述要素信息进行语义理解,得到各第一语义理解结果;基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种裁判文书生成方法,其特征在于,包括:
获取待审判案件的卷宗材料;
获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;
基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;
对各所述要素信息进行语义理解,得到各第一语义理解结果;
基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。
2.根据权利要求1所述的裁判文书生成方法,其特征在于,所述基于各所述第一语义理解结果,生成所述待审判案件的裁判文书,包括:
获取所述待审判案件的案件类型对应的裁判文书模板,所述裁判文书模板包括至少一个通用语句和各所述通用语句对应的至少一个词槽;
针对各通用语句,对所述通用语句进行语义理解,得到第二语义理解结果;
确定与所述第二语义理解结果匹配的第一语义理解结果对应的第一要素信息;
将所述第一要素信息填充在所述通用语句对应的至少一个词槽中,生成所述待审判案件的裁判文书。
3.根据权利要求1所述的裁判文书生成方法,其特征在于,所述基于各所述第一语义理解结果,生成所述待审判案件的裁判文书之后,所述方法还包括:
从案例库中获取与所述待审判案件的案由相同、且案件类型相似的至少一个历史审判案件;
确定所有所述历史审判案件对应的历史裁判文书中的共同审判语句;
在所述裁判文书中不包括所述共同审判语句的情况下,将所述共同审判语句添加至所述裁判文书中。
4.根据权利要求1-3任一项所述的裁判文书生成方法,其特征在于,所述方法还包括:
获取所述案件类型对应的法律知识、至少一个历史审判案件的历史卷宗材料和历史裁判文书;
将所述法律知识、各所述历史卷宗材料和各所述历史裁判文书输入要素提取模型中,得到所述要素提取模型输出的各所述历史卷宗材料中的要素字段,所述要素提取模型为基于所述法律知识、卷宗材料样本和所述卷宗材料样本对应的裁判文书样本对初始要素提取模型训练得到的;
基于各所述历史卷宗材料中的要素字段,构建所述要素表。
5.根据权利要求4所述的裁判文书生成方法,其特征在于,所述基于各所述历史卷宗材料中的要素字段,构建所述要素表,包括:
将所有所述历史卷宗材料中的要素字段进行去重处理,得到去重后的各要素字段;
将所述去重后的各要素字段基于语义进行归类,得到归类后的要素字段集合;
针对各所述要素字段集合,获取与所述要素字段集合中要素字段语义相同的扩充要素字段;
将所述扩充要素字段添加至所述要素字段集合中,得到扩充后的要素字段集合;
基于各所述扩充后的要素字段集合,构建所述要素表。
6.根据权利要求1-3任一项所述的裁判文书生成方法,其特征在于,所述对各所述要素信息进行语义理解,得到各第一语义理解结果之前,所述方法还包括:
输出各所述要素信息;
在接收到用户输入的针对第二要素信息的第一更改指令的情况下,响应于所述第一更改指令,显示更改界面;
接收所述用户通过所述更改界面输入的第一要素更改信息;
采用所述第一要素更改信息更新所述第二要素信息;
对各所述要素信息进行语义理解,得到各第一语义理解结果,包括:
对未更新的要素信息和更新后的第二要素信息进行语义理解,得到各第一语义理解结果。
7.一种裁判文书生成装置,其特征在于,包括:
获取模块,用于获取待审判案件的卷宗材料;
所述获取模块,还用于获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;
确定模块,用于基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;
处理模块,用于对各所述要素信息进行语义理解,得到各第一语义理解结果;
生成模块,用于基于各所述第一语义理解结果,生成所述待审判案件的裁判文书。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述裁判文书生成方法。
9.一种裁判文书生成系统,其特征在于,包括:审判终端、与所述审判终端通信连接的原告终端和被告终端;
所述审判终端,用于获取待审判案件的卷宗材料,并获取所述待审判案件的案件类型对应的要素表,所述要素表中包括多个要素字段;
所述审判终端,还用于基于多个所述要素字段,从所述卷宗材料中确定至少一个目标要素字段各自对应的要素信息;
所述审判终端,还用于将各所述要素信息发送至所述原告终端和所述被告终端;
所述原告终端,用于输出各所述要素信息,并在接收到针对第三要素信息的第二更改指令的情况下,基于获取到的第二要素更改信息更新所述第三要素信息,并将更新后的第三要素信息发送至所述审判终端;
所述被告终端,用于输出各所述要素信息,并在接收到针对第四要素信息的第三更改指令的情况下,基于获取到的第三要素更改信息更新所述第四要素信息,并将更新后的第四要素信息发送至所述审判终端;
所述审判终端,还用于基于未更新的要素信息和更新后的要素信息进行语义理解,得到各第一语义理解结果,并基于各所述第一语义理解结果,生成所述待审判案件的裁判文书,所述更新后的要素信息包括所述更新后的第三要素信息和所述更新后的第四要素信息。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述裁判文书生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311617205.XA CN117725903A (zh) | 2023-11-29 | 2023-11-29 | 裁判文书生成方法、装置、系统和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311617205.XA CN117725903A (zh) | 2023-11-29 | 2023-11-29 | 裁判文书生成方法、装置、系统和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117725903A true CN117725903A (zh) | 2024-03-19 |
Family
ID=90204308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311617205.XA Pending CN117725903A (zh) | 2023-11-29 | 2023-11-29 | 裁判文书生成方法、装置、系统和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117725903A (zh) |
-
2023
- 2023-11-29 CN CN202311617205.XA patent/CN117725903A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112016313B (zh) | 口语化要素识别方法及装置、警情分析系统 | |
CN110362798B (zh) | 裁决信息检索分析方法、装置、计算机设备和存储介质 | |
Braz et al. | Document classification using a Bi-LSTM to unclog Brazil's supreme court | |
CN112613321A (zh) | 一种抽取文本中实体属性信息的方法及系统 | |
CN110968664A (zh) | 一种文书检索方法、装置、设备及介质 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN115238688A (zh) | 电子信息数据关联关系分析方法、装置、设备和存储介质 | |
CN110852071A (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
CN116882494B (zh) | 面向专业文本的无监督知识图构建方法和装置 | |
CN116402166B (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN113033912A (zh) | 问题解决人推荐方法及装置 | |
CN112613293A (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN111950265A (zh) | 一种领域词库构建方法和装置 | |
CN114842982B (zh) | 一种面向医疗信息系统的知识表达方法、装置及系统 | |
CN116385189A (zh) | 财务报账单据列账科目匹配度校验方法及系统 | |
CN113434630B (zh) | 客服服务评估方法、装置、终端设备及介质 | |
CN114067343A (zh) | 一种数据集的构建方法、模型训练方法和对应装置 | |
CN117725903A (zh) | 裁判文书生成方法、装置、系统和存储介质 | |
CN113722421B (zh) | 一种合同审计方法和系统,及计算机可读存储介质 | |
CN113836297A (zh) | 文本情感分析模型的训练方法及装置 | |
CN112732908A (zh) | 试题新颖度评估方法、装置、电子设备和存储介质 | |
CN111611379A (zh) | 一种文本信息分类方法、装置、设备及可读存储介质 | |
CN110717029A (zh) | 一种信息处理方法和系统 | |
CN116662523B (zh) | 一种基于gpt模型的生化知识问答方法、系统及存储介质 | |
CN117573956B (zh) | 元数据管理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |