CN117033584B - 类案文本确定方法、装置及电子设备 - Google Patents
类案文本确定方法、装置及电子设备 Download PDFInfo
- Publication number
- CN117033584B CN117033584B CN202310955314.6A CN202310955314A CN117033584B CN 117033584 B CN117033584 B CN 117033584B CN 202310955314 A CN202310955314 A CN 202310955314A CN 117033584 B CN117033584 B CN 117033584B
- Authority
- CN
- China
- Prior art keywords
- case
- text
- determining
- target
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 239000000470 constituent Substances 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000240602 cacao Species 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Animal Behavior & Ethology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Technology Law (AREA)
- Evolutionary Biology (AREA)
- Human Computer Interaction (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种类案文本确定方法、装置及电子设备,涉及人工智能技术领域,其中方法包括:基于案件文本确定案件文本对应的至少一个案情要素;基于案件文本确定各案情要素对应的标签信息,并将标签信息添加在对应的案情要素中,得到标签化的案情要素;标签信息用于表征案件文本与案情要素的匹配结果;将各标签化的案情要素与预先构建的类案知识图谱进行匹配,得到案件文本对应的第一类案事实;类案知识图谱对应的案由与案件文本的案由相同;确定第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;基于相似度从案例库中确定案件文本的类案文本。本发明提高了确定类案文本的准确性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种类案文本确定方法、装置及电子设备。
背景技术
“类案类判”是当前审判的重点关注对象。因此,在对待决案件进行审判时,通常需要参考之前类案的审判结论。
相关技术中,在查找与待决案件关联的类案时,通常是提取待决案件中的所有关键词,将案例库中包括至少一个该关键词的案例均确定为待决案件关联的类案。
但上述相关技术中,会存在同一个关键词在不同类案事实中的重要程度不同,从而导致基于关键词确定的类案的准确性较低。
发明内容
针对现有技术存在的问题,本发明实施例提供一种类案文本确定方法、装置及电子设备。
本发明提供一种类案文本确定方法,包括:
基于案件文本确定所述案件文本对应的至少一个案情要素;
基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果;
将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同;
确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;
基于所述相似度从所述案例库中确定所述案件文本的类案文本。
根据本发明提供的一种类案文本确定方法,所述类案知识图谱包括至少一个推理规则;
所述将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实,包括:
针对各所述推理规则,将各所述标签化的案情要素与所述推理规则进行匹配,得到所述推理规则对应的所述第一类案事实;
将各所述推理规则对应的所述第一类案事实均确定为所述案件文本对应的第一类案事实。
根据本发明提供的一种类案文本确定方法,所述方法还包括:
确定所述案由对应的诉讼请求;
确定所述诉讼请求对应的权利请求基础规范;
对所述权利请求基础规范进行拆解,得到至少一个构成要件;
确定各所述构成要件对应的案情要素;
基于各所述案情要素确定至少一个推理规则;
基于各所述推理规则构建所述类案知识图谱。
根据本发明提供的一种类案文本确定方法,所述基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素,包括:
对所述案件文本进行语义理解,得到与各所述案情要素相关的第一文本;
针对各所述第一文本,将所述第一文本的语义信息与对应的案情要素进行匹配,得到所述匹配结果;
将所述匹配结果作为标签信息添加在对应的案情要素中,得到标签化的案情要素。
根据本发明提供的一种类案文本确定方法,所述方法还包括:
在所述类案文本的数量大于1的情况下,获取类案裁判时间位于第一预设时间范围内的各第一目标类案文本;
获取各排序维度的优先级;各所述排序维度包括相似度维度、类案层级维度和类案裁判时间维度;
基于最高优先级的排序维度对所有所述第一目标类案文本进行排序,得到第一目标排序结果;
输出所述第一目标排序结果。
根据本发明提供的一种类案文本确定方法,所述方法还包括:
在所述类案文本的数量大于1的情况下,获取类案裁判时间位于第二预设时间范围内的各第二目标类案文本;
针对各所述第二目标类案文本,获取所述第二目标类案文本的目标类案层级、所述第二目标类案文本的目标类案裁判时间、以及所述第二目标类案文本与所述案件文本的目标相似度;
基于所述目标类案层级、所述类案层级维度对应的第一权重、所述目标类案裁判时间、所述类案裁判时间维度对应的第二权重、所述目标相似度和所述相似度维度对应的第三权重,确定所述第二目标类案文本对应的分值;
基于各所述分值对各所述第二目标类案文本进行排序,得到第二排序结果;
输出所述第二排序结果。
根据本发明提供的一种类案文本确定方法,所述基于案件文本确定所述案件文本对应的至少一个案情要素,包括:
获取非结构化的初始案件文本;
将所述非结构化的初始案件文本输入至文本结构转化模型中,对所述非结构化的初始案件文本进行分段,得到各个段落文本,并添加各所述段落文本对应的段落标签,得到所述文本结构转化模型输出的结构化的案件文本;
基于所述结构化的案件文本中的各段落标签和对应的段落文本确定所述案件文本对应的至少一个所述案情要素。
本发明还提供一种类案文本确定装置,包括:
第一确定单元,用于基于案件文本确定所述案件文本对应的至少一个案情要素;
添加单元,用于基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果;
匹配单元,用于将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同;
第二确定单元,用于确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;
第三确定单元,用于基于所述相似度从所述案例库中确定所述案件文本的类案文本。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述类案文本确定方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述类案文本确定方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述类案文本确定方法。
本发明提供的类案文本确定方法、装置及电子设备,确定案件文本对应的至少一个案情要素,基于案件文本确定各案情要素对应的标签信息,并将标签信息添加在对应的案情要素中,得到标签化的案情要素,将各标签化的案情要素与预先构建的类案知识图谱进行匹配,得到案件文本对应的第一类案事实,确定案件文本的第一类案事实与案例库中各案例文本的第二类案事实的相似度,基于相似度从案例库中确定案件文本的类案文本。可知,本发明是先基于案件文本将各案情要素进行标签化,得到标签化的案情要素,再将标签化的案情要素与预先构建的类案知识图谱进行匹配,得到案件文本对应的类案事实,基于案件文本的类案事实与案例库中各案例文本的类案事实之间的相似度确定类案文本,由于类案事实能够真正反映案件文本的内容,从而提高了确定类案文本的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的类案文本确定方法的流程示意图之一;
图2是本发明实施例提供的类案事实匹配的思维模型图;
图3是本发明实施例提供的类案文本确定方法的流程示意图之二;
图4是本发明实施例提供的类案文本确定方法的流程示意图之三;
图5是本发明实施例提供的类案文本确定方法的流程示意图之四;
图6是本发明实施例提供的类案文本确定装置的结构示意图;
图7是本发明提供的电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图5描述本发明的类案文本确定方法。本方法的执行主体可以是计算机、服务器或者服务器集群等电子设备,或者是专门设计的智能设备,也可以是设置在该电子设备或智能设备中的类案文本确定装置,该类案文本确定装置可以通过软件、硬件或两者的结合来实现。
图1是本发明实施例提供的类案文本确定方法的流程示意图之一,如图1所示,该类案文本确定方法包括以下步骤:
步骤101、基于案件文本确定所述案件文本对应的至少一个案情要素。
示例地,案件文本即为待判决裁判文书,每个案由对应的案情要素集合不同,针对相同案由的案件文本,由于相同案由的每个案件文本的实际内容不同,则相同案由的案件文本也会对应不同的案情要素。本发明基于案件文本对应的案由对案件文本进行全面深度数据挖掘和语义理解,通过正则表达式在该案由对应的案情要素集合中确定出案件文本对应的至少一个案情要素。
步骤102、基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果。
示例地,确定各案情要素对应的标签信息是人工智能算法能够有效运行的关键,可以通过有监督的机器学习模型,对案件文本的内容进行分析,确定与案情要素相关的内容,基于对与案情要素相关的内容的语义理解,确定与案情要素相关的内容与案情要素的匹配结果,将匹配结果确定为对应案情要素的标签信息,并将标签信息添加在对应的案情要素中,得到标签化的案情要素,实现了对各案情要素的标签化处理;例如,案件文本的诉讼请求为请求离婚,案情要素为“是否有子女”,在案件文本中确定与“是否有子女”相关的内容为“婚后有一个女儿”,则可以将“婚后有一个女儿”的语义与案情要素“是否有子女”进行匹配,得到的匹配结果为“婚后生育子女”,将“婚后生育子女”确定为对应的标签信息,则标签化的案情要素为“是否有子女”=“婚后生育子女”。
需要说明的是,机器学习模型可以通过案件文本样本、案件文本样本对应的多个案情要素样本、各案情要素样本对应的标签样本训练得到,使得训练得到的机器学习模型能够基于输入的案件文本和案情要素对各案情要素添加标签信息。
步骤103、将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同。
其中,每个案由可以对应一个类案知识图谱。
示例地,在得到各标签化的案情要素后,将各标签化的案情要素代入预先构建的类案知识图谱中,将各标签化的案情要素与类案知识图谱中的推理规则进行匹配,确定满足推理规则的第一类案事实,将满足推理规则的第一类案事实确定为案件文本存在的类案事实;由于推理规则可以为至少一个,则案件文本存在的类案事实也为至少一个。
步骤104、确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度。
示例地,可以采用与上述步骤101至步骤103类似的方法确定案例库中的各案例文本对应的第二类案事实,然后确定案件文本对应的第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;具体可基于杰德卡系数Jaccard进行相似度计算,即将案件文本对应的各第一类案事实作为集合M的元素,将案例文本对应的第二类案事实作为集合N的元素,基于以下公式(1)计算集合M和集合N之间的相似度,相似度越高,说明对应的案例文本与案件文本的相似度越高。
其中,J(M,N)表示集合M和集合N之间的相似度,|M∪N|表示集合M和集合N的交集的数量,即集合M和集合N中相同类案事实的数量;|M∪N|表示集合M和集合N的并集的数量,即集合M和集合N中所有类案事实的数量,|M|表示集合M中所有类案事实的数量,|N|表示集合N中所有类案事实的数量。
图2是本发明实施例提供的类案事实匹配的思维模型图,如图2所示,案件文本的第一类案事实的数量与案例库中案例文本的第二类案事实的数量的交集即为共有类案事实数量。
步骤105、基于所述相似度从所述案例库中确定所述案件文本的类案文本。
示例地,案件文本对应的第一类案事实与案例库中各案例文本对应的第二类案事实之间的相似度,就相当于案件文本与案例库中各案例文本之间的相似度,将各相似度与预设阈值进行比较,将大于预设阈值的各目标相似度对应的案例文本确定为该案件文本的类案文本。
本发明提供的类案文本确定方法,确定案件文本对应的至少一个案情要素,基于案件文本确定各案情要素对应的标签信息,并将标签信息添加在对应的案情要素中,得到标签化的案情要素,将各标签化的案情要素与预先构建的类案知识图谱进行匹配,得到案件文本对应的第一类案事实,确定案件文本的第一类案事实与案例库中各案例文本的第二类案事实的相似度,基于相似度从案例库中确定案件文本的类案文本。可知,本发明是先基于案件文本将各案情要素进行标签化,得到标签化的案情要素,再将标签化的案情要素与预先构建的类案知识图谱进行匹配,得到案件文本对应的类案事实,基于案件文本的类案事实与案例库中各案例文本的类案事实之间的相似度确定类案文本,由于类案事实能够真正反映案件文本的内容,从而提高了确定类案文本的准确性,便于用户参考类案文本的判决结论对案件文本进行判决,以实现类案类判的要求,做到判决平等。
在一实施例中,所述类案知识图谱包括至少一个推理规则;上述步骤103将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实,具体可通过以下方式实现:
针对各所述推理规则,将各所述标签化的案情要素与所述推理规则进行匹配,得到所述推理规则对应的所述第一类案事实;将各所述推理规则对应的所述第一类案事实均确定为所述案件文本对应的第一类案事实。
示例地,与案件文本案由相同的类案知识图谱包括至少一个推理规则,针对每个推理规则,将案件文本对应的所有标签化的案情要素均与该推理规则进行匹配,在确定有与推理规则匹配的标签化的案情要素时,该推理规则就会触发,基于与推理规则匹配的标签化的案情要素推理出对应的第一类案事实;继续将案件文本对应的所有标签化的案情要素与剩余的推理规则进行匹配,直至没有剩余的推理规则为止,最终将推理出的各第一类案事实均确定为案件文本对应的第一类案事实;例如,标签化的案情要素1包括“是否有子女”=“婚后生育子女”,标签化的案情要素2包括“子女是否已成年”=“子女已成年”,推理规则1为(是否有子女)==“婚后生育子女”和(子女是否已成年)==“子女已成年”,将标签化的案情要素1和标签化的案情要素2与推理规则1进行匹配,推理出该推理规则1对应的第一类案事实为婚后有子女且子女已成年。再例如,标签化的案情要素1包括“是否有子女”=“婚后生育子女”,标签化的案情要素3包括“子女是否已满两周岁”=“子女不满两周岁”,推理规则2为(是否有子女)==“婚后生育子女”和(子女是否已满两周岁)==“子女不满两周岁”,将标签化的案情要素1和标签化的案情要素3与推理规则2进行匹配,推理出该推理规则2对应的第一类案事实为婚后有子女且子女不满两周岁。
需要说明的是,与推理规则匹配的标签化的案情要素可以为一个,也可以为多个,本发明对此不做限定。
在本实施例中,基于类案知识图谱包括的推理规则和案件文本的各标签化的案情要素,推理出案件文本对应的各第一类案事实,提高了类案事实的推理效率。
在一实施例中,图3是本发明实施例提供的类案文本确定方法的流程示意图之二,如图3所示,该类案文本确定方法还包括以下步骤:
步骤301、确定所述案由对应的诉讼请求。
示例地,在实际应用中,不存在完全相同的案件文本,但存在同一裁判规则可以适用多个案件文本,每个案件文本均有对应的案由,每个案由对应的诉讼请求可以为一个,也可以为多个;例如,案件文本为关于离婚诉讼的案件文本,诉讼请求可以包括请求离婚和请求子女抚养权。
步骤302、确定所述诉讼请求对应的权利请求基础规范。
示例地,针对每个诉讼请求都会制定对应的权利请求基础规范,在确定案件文本对应案由的诉讼请求时,查找该诉讼请求对应的权利请求基础规范。
步骤303、对所述权利请求基础规范进行拆解,得到至少一个构成要件。
示例地,在查找到该诉讼请求对应的权利请求基础规范时,将权利请求基础规范进行拆解,得到权利请求基础规范的各个构成要件。例如,对请求子女抚养权的诉讼请求的权利请求基础规范进行拆解,得到的构成要件包括:1)不满两周岁的子女,以由母亲直接抚养为原则;2)子女已满八周岁的,离婚后子女生活意愿;3)子女随其生活时间较长,改变生活环境对子女健康成长明显不利等。
步骤304、确定各所述构成要件对应的案情要素。
示例地,构成要件“不满两周岁的子女,以由母亲直接抚养为原则”对应的案情要素可以为“子女是否已满两周岁”,构成要件“子女已满八周岁的,离婚后子女生活意愿”对应的案情要素可以为“离婚后子女生活意愿”;构成要件“子女随其生活时间较长,改变生活环境对子女健康成长明显不利等”对应的案情要素可以为“子女先随谁生活”;上述步骤201至步骤204实现了对该案由适用的法律知识的梳理,得到基于法律知识的知识图谱。
步骤305、基于各所述案情要素确定至少一个推理规则。
示例地,在基于法律知识的知识图谱的基础上,对各案情要素的内容进行分析,进而确定出适用该案由的所有推理规则。
步骤306、基于各所述推理规则构建所述类案知识图谱。
示例地,在确定出适用该案由的所有推理规则时,将所有推理规则组合在一起,得到该案由对应的类案知识图谱,使得案由对应的类案知识图谱具备机器逻辑推理能力。
在本实施例中,基于法律知识和推理两部分的结合,形成案由对应的多个推理规则,将多个推理规则进行组合,完成该案由对应的类案知识图谱的创建,便于后续基于该类案知识图谱推理出相同案由的案例文本对应的类案事实。
在一实施例中,上述步骤102基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素,具体可通过以下方式实现:
对所述案件文本进行语义理解,得到与各所述案情要素相关的第一文本;针对各所述第一文本,将所述第一文本的语义信息与对应的案情要素进行匹配,得到所述匹配结果;将所述匹配结果作为标签信息添加在对应的案情要素中,得到标签化的案情要素。
示例地,可以将案件文本输入语义理解模块中,通过语义理解模块对案件文本进行语义理解,输出与语义理解结果,基于语义理解结果确定案件文本中与各案情要素相关的第一文本;例如,案情要素为“是否有子女”,基于对案件文本的语义理解结果确定案件文本中包括与“是否有子女”相关的内容为“婚后有一个女儿”,则第一文本为“婚后有一个女儿”。
针对各第一文本,将第一文本的语义信息与对应的案情要素进行匹配,得到匹配结果,将匹配结果作为标签信息添加在对应的案情要素中,得到标签化的案情要素。例如,第一文本为“婚后有一个女儿”,案情要素为“是否有子女”,通过对“婚后有一个女儿”进行语义理解可知婚后有子女,将婚后有子女与案情要素为“是否有子女”进行匹配,得到匹配结果为有子女,则将匹配结果有子女确定为案情要素为“是否有子女”对应的标签信息,得到标签化的案情要素为“是否有子女”=“有子女”,或者,标签化的案情要素为“是否有子女”=“婚后生育子女”。
在本实施例中,基于对案件文本的语义理解得到各案情要素相关的第一文本,将第一文本的语义信息与对应的案情要素进行匹配,将匹配结果作为标签信息添加在对应的案情要素中,实现了对各案情要素的标签化处理,且基于第一文本的语义信息与案情要素进行匹配,能够提高匹配结果的准确性。
在一实施例中,图4是本发明实施例提供的类案文本确定方法的流程示意图之三,如图4所示,在步骤105之后,该类案文本确定方法还包括以下步骤:
步骤106、在所述类案文本的数量大于1的情况下,获取类案裁判时间位于第一预设时间范围内的各第一目标类案文本。
其中,第一预设时间范围可以基于需求进行设定,例如,第一预设时间范围可以为1年内或者3年内。
示例地,在确定案件文本的类案文本的数量大于1时,由于类案文本是从案例库中确定的,案例库中的每个案例文本均为已经裁判结束后的案例文本,所以,每个类案文本均有对应的类案裁判时间,将类案裁判时间位于第一预设时间范围内的类案文本确定为第一目标类案文本;例如,确定案件文本的类案文本有5个,第一预设时间范围为半年内,第一个类案文本的类案裁判时间为五年前的时间,第二个类案文本的类案裁判时间为三年前的时间,第三个类案文本的类案裁判时间为一年前的时间,第四个类案文本的类案裁判时间为两个月内的时间,第五个类案文本的类案裁判时间为一个月内的时间,则可以确定第四个类案文本和第五个类案文本均为第一目标类案文本。
步骤107、获取各排序维度的优先级;各所述排序维度包括相似度维度、类案层级维度和类案裁判时间维度。
其中,类案层级维度是指裁判单位的级别维度;在时间范围上,因类案文本的数量可能比较庞大,基于具体情况可以选择近几年的类案文本进行推送,因此需要设定类案裁判时间维度。
示例地,对于确定的类案文本,尤其在确定的类案文本的数量较多的情况下,为避免类案文本推送的混乱,需要明确推送规则,以确保类案文本推送的有序呈现,该推送规则可以为对排序维度设定优先级,具体地,排序维度可以包括相似度维度、类案层级维度和类案裁判时间维度,可以基于需求对这三个排序维度设定优先级,例如,设定相似度维度的优先级高于类案层级维度的优先级,类案层级维度的优先级高于类案裁判时间维度的优先级。
步骤108、基于最高优先级的排序维度对所有所述第一目标类案文本进行排序,得到第一目标排序结果。
示例地,假设最高优先级的排序维度为相似度维度,则将各个第一目标类案文本与案件文本的相似度从高到低进行排序,得到第一目标排序结果。
步骤109、输出所述第一目标排序结果。
示例地,在得到第一目标排序结果时,可以将第一目标排序结果推送至用户的终端设备进行显示,也可以将第一目标排序结果直接进行显示或者语音播报等。
需要说明的是,还可以将各类案文本基于三个排序维度分别进行排序,本发明对此不做限定。
在本实施例中,在类案文本的数量大于1时,先选择在第一预设时间范围内的各第一目标类案文本,再将各第一目标类案文本基于最高优先级的排序维度进行排序,实现了对类案文本的筛选,并使得显示的类案文本更加符合用户需求。
在一实施例中,图5是本发明实施例提供的类案文本确定方法的流程示意图之四,如图5所示,在步骤105之后,该类案文本确定方法还包括以下步骤:
步骤110、在所述类案文本的数量大于1的情况下,获取类案裁判时间位于第二预设时间范围内的各第二目标类案文本。
其中,第二预设时间范围可以基于需求进行设定,例如,第二预设时间范围可以为1年内,第二预设时间范围可以与第一预设时间范围相同,也可以与第一预设时间范围不同。
示例地,在确定案件文本的类案文本的数量大于1时,由于类案文本是从案例库中确定的,案例库中的每个案例文本均为已经裁判结束后的案例文本,所以,每个类案文本均有对应的类案裁判时间,将类案裁判时间位于第二预设时间范围内的类案文本确定为第二目标类案文本。
步骤111、针对各所述第二目标类案文本,获取所述第二目标类案文本的目标类案层级、所述第二目标类案文本的目标类案裁判时间、以及所述第二目标类案文本与所述案件文本的目标相似度。
示例地,案例库中的每个案例文本均为已经裁判结束后的案例文本,所以,每个类案文本均有对应的类案层级和类案裁判时间,所以针对各第二目标类案文本,可以获取到第二目标类案文本对应的目标类案层级、目标类案裁判时间、以及第二目标类案文本与案件文本的目标相似度。
步骤112、基于所述目标类案层级、所述类案层级维度对应的第一权重、所述目标类案裁判时间、所述类案裁判时间维度对应的第二权重、所述目标相似度和所述相似度维度对应的第三权重,确定所述第二目标类案文本对应的分值。
示例地,考虑到每个排序维度的重要程度不同,所以可以基于排序维度的重要程度设定对应的权重,例如,设定类案层级维度对应的第一权重为0.3,类案裁判时间维度对应的第二权重为0.1,相似度维度对应的第三权重为0.6,从而可以基于第二目标类案文本的目标类案层级、类案层级维度对应的第一权重、第二目标类案文本的目标类案裁判时间、类案裁判时间维度对应的第二权重、第二目标类案文本与类案文本的目标相似度、以及相似度维度对应的第三权重,确定第二目标类案文本对应的分值;具体分值的计算如下:预先设定类案层级与第一量化值的对应关系,类案裁判时间与第二量化值的对应关系,以及相似度与第三量化值的对应关系;可以基于类案层级与第一量化值的对应关系,确定目标类案层级对应的量化值,基于类案裁判时间与第二量化值的对应关系,可以确定目标类案裁判时间对应的量化值,基于相似度与第三量化值的对应关系,可以确定目标相似度对应的量化值,最后将目标类案层级对应的量化值与第一权重相乘得到第一结果,将目标类案裁判时间对应的量化值与第二权重相乘得到第二结果,将目标相似度对应的量化值与第三权重相乘得到第三结果,将第一结果、第二结果和第三结果相加得到第二目标类案文本对应的分值。
需要说明的是,类案层级与第一量化值的对应关系,类案裁判时间与第二量化值的对应关系,以及相似度与第三量化值的对应关系,可基于需求进行设定,本发明对此不做限定。
步骤113、基于各所述分值对各所述第二目标类案文本进行排序,得到第二排序结果。
示例地,在确定各第二目标类案文本对应的分值时,按照分值从大到小对各第二目标类案文本进行排序,得到第二排序结果。
步骤114、输出所述第二排序结果。
示例地,在得到第二目标排序结果时,可以将第二目标排序结果推送至用户的终端设备进行显示,也可以将第二目标排序结果直接进行显示或者语音播报等。
在本实施例中,在类案文本的数量大于1时,先选择在第二预设时间范围内的各第二目标类案文本,再获取第二目标类案文本对应的目标类案层级、目标类案裁判时间和目标相似度,基于目标类案层级、目标类案裁判时间、目标相似度以及各排序维度对应的权重确定的分值,对各第二目标类案文本进行排序,从而提高了排序结果的准确性。
在一实施例中,上述步骤101基于案件文本确定所述案件文本对应的至少一个案情要素,具体可通过以下方式实现:
获取非结构化的初始案件文本;将所述非结构化的初始案件文本输入至文本结构转化模型中,对所述非结构化的初始案件文本进行分段,得到各个段落文本,并添加各所述段落文本对应的段落标签,得到所述文本结构转化模型输出的结构化的案件文本;基于所述结构化的案件文本中的各段落标签和对应的段落文本确定所述案件文本对应的至少一个所述案情要素。
其中,段落标签可以基于类案文本的具体内容进行确定,例如,段落标签可以为本院查明、本院认为等。
示例地,在获取到非结构化的初始案件文本时,需要对非结构化的初始案件文本进行数据预处理,具体数据预处理可以为:将非结构化的初始案件文本输入至文本结构转化模型中,基于裁判文书既定规则对非结构化的初始案件文本进行识别,基于识别结果对非结构化的初始案件进行分段,得到各个段落文本,并添加各段落文本对应的段落标签,得到文本结构转化模型输出的结构化的案件文本,并将结构化的案件文本存储至裁判文书数据库中,基于对结构化的案件文本中的各段落标签和对应的段落文本的语义理解,确定案件文本对应的各案情要素。
需要说明的是,文本结构转化模型可以基于如下方式训练得到:构建用于自然语言处理的神经网络模型,并获取非结构化的案件样本,将非结构化的案件样本输入至神经网络模型中,得到神经网络模型输出的结构化的预测案件文本,结构化的预测案件文本中包括各个段落文本样本和各段落文本样本对应的段落标签样本,基于各个段落文本样本和各段落文本样本对应的段落标签样本、以及对非结构化的案件样本标记的真实段落文本和真实段落文本对应的真实段落标签,构建损失函数,基于损失函数对神经网络模型进行优化,直至收敛,得到文本结构转化模型。
需要说明的是,在将结构化的案件文本存储至裁判文书数据库时,是由流控制和结构化查询语言(Structured Query Language,SQL)语句书写的过程,这个过程经编译和优化后存储在裁判文书数据库中。
在本实施例中,基于文本结构转化模型将非结构化的初始案件文本转化为结构化的案件文本,便于后续对案件文本进行语义理解,进一步提高类案文本确定的准确性。
本发明通过自然语言理解技术深度挖掘案例文本,让电子设备理解案例文本,基于案例文本对各案情要素进行标签化处理;同时结合专家系统梳理的法律推理逻辑,有助于提高案例文本的类案文本确定的准确度,支持个性化类案文本推送,以帮助获得与用户偏好更贴近的个性化的类案文本的推送服务。
下面对本发明提供的类案文本确定装置进行描述,下文描述的类案文本确定装置与上文描述的类案文本确定方法可相互对应参照。
图6是本发明实施例提供的类案文本确定装置的结构示意图,如图6所示,该类案文本确定装置600包括第一确定单元601、添加单元602、匹配单元603、第二确定单元604和第三确定单元605;其中:
第一确定单元601,用于基于案件文本确定所述案件文本对应的至少一个案情要素;
添加单元602,用于基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果;
匹配单元603,用于将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同;
第二确定单元604,用于确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;
第三确定单元605,用于基于所述相似度从所述案例库中确定所述案件文本的类案文本。
本发明提供的类案文本确定装置,确定案件文本对应的至少一个案情要素,基于案件文本确定各案情要素对应的标签信息,并将标签信息添加在对应的案情要素中,得到标签化的案情要素,将各标签化的案情要素与预先构建的类案知识图谱进行匹配,得到案件文本对应的第一类案事实,确定案件文本的第一类案事实与案例库中各案例文本的第二类案事实的相似度,基于相似度从案例库中确定案件文本的类案文本。可知,本发明是先基于案件文本将各案情要素进行标签化,得到标签化的案情要素,再将标签化的案情要素与预先构建的类案知识图谱进行匹配,得到案件文本对应的类案事实,基于案件文本的类案事实与案例库中各案例文本的类案事实之间的相似度确定类案文本,由于类案事实能够真正反映案件文本的内容,从而提高了确定类案文本的准确性。
基于上述任一实施例,所述类案知识图谱包括至少一个推理规则;
所述匹配单元603具体用于:
针对各所述推理规则,将各所述标签化的案情要素与所述推理规则进行匹配,得到所述推理规则对应的所述第一类案事实;
将各所述推理规则对应的所述第一类案事实均确定为所述案件文本对应的第一类案事实。
基于上述任一实施例,所述类案文本确定装置600还包括:
第四确定单元,用于确定所述案由对应的诉讼请求;
第五确定单元,用于确定所述诉讼请求对应的权利请求基础规范;
拆解单元,用于对所述权利请求基础规范进行拆解,得到至少一个构成要件;
第六确定单元,用于确定各所述构成要件对应的案情要素;
第七确定单元,用于基于各所述案情要素确定至少一个推理规则;
构建单元,用于基于各所述推理规则构建所述类案知识图谱。
基于上述任一实施例,所述添加单元602具体用于:
对所述案件文本进行语义理解,得到与各所述案情要素相关的第一文本;
针对各所述第一文本,将所述第一文本的语义信息与对应的案情要素进行匹配,得到所述匹配结果;
将所述匹配结果作为标签信息添加在对应的案情要素中,得到标签化的案情要素。
基于上述任一实施例,所述类案文本确定装置600还包括:
第一获取单元,用于在所述类案文本的数量大于1的情况下,获取类案裁判时间位于第一预设时间范围内的各第一目标类案文本;
第二获取单元,用于获取各排序维度的优先级;各所述排序维度包括相似度维度、类案层级维度和类案裁判时间维度;
第一排序单元,用于基于最高优先级的排序维度对所有所述第一目标类案文本进行排序,得到第一目标排序结果;
第一输出单元,用于输出所述第一目标排序结果。
基于上述任一实施例,所述类案文本确定装置600还包括:
第三获取单元,用于在所述类案文本的数量大于1的情况下,获取类案裁判时间位于第二预设时间范围内的各第二目标类案文本;
第四获取单元,用于针对各所述第二目标类案文本,获取所述第二目标类案文本的目标类案层级、所述第二目标类案文本的目标类案裁判时间、以及所述第二目标类案文本与所述案件文本的目标相似度;
第八确定单元,用于基于所述目标类案层级、所述类案层级维度对应的第一权重、所述目标类案裁判时间、所述类案裁判时间维度对应的第二权重、所述目标相似度和所述相似度维度对应的第三权重,确定所述第二目标类案文本对应的分值;
第二排序单元,用于基于各所述分值对各所述第二目标类案文本进行排序,得到第二排序结果;
第二输出单元,用于输出所述第二排序结果。
基于上述任一实施例,所述第一确定单元601具体用于:
获取非结构化的初始案件文本;
将所述非结构化的初始案件文本输入至文本结构转化模型中,对所述非结构化的初始案件文本进行分段,得到各个段落文本,并添加各所述段落文本对应的段落标签,得到所述文本结构转化模型输出的结构化的案件文本;
基于所述结构化的案件文本中的各段落标签和对应的段落文本确定所述案件文本对应的至少一个所述案情要素。
图7是本发明实施例提供的电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行类案文本确定方法,该方法包括:基于案件文本确定所述案件文本对应的至少一个案情要素;
基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果;
将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同;
确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;
基于所述相似度从所述案例库中确定所述案件文本的类案文本。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的类案文本确定方法,该方法包括:基于案件文本确定所述案件文本对应的至少一个案情要素;
基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果;
将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同;
确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;
基于所述相似度从所述案例库中确定所述案件文本的类案文本。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的类案文本确定方法,该方法包括:基于案件文本确定所述案件文本对应的至少一个案情要素;
基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果;
将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同;
确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;
基于所述相似度从所述案例库中确定所述案件文本的类案文本。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种类案文本确定方法,其特征在于,包括:
基于案件文本确定所述案件文本对应的至少一个案情要素;
基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果;
将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同;
确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;
基于所述相似度从所述案例库中确定所述案件文本的类案文本;
其中,所述类案知识图谱包括至少一个推理规则;
所述将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实,包括:
针对各所述推理规则,将各所述标签化的案情要素与所述推理规则进行匹配,得到所述推理规则对应的所述第一类案事实;
将各所述推理规则对应的所述第一类案事实均确定为所述案件文本对应的第一类案事实;
所述方法还包括:
确定所述案由对应的诉讼请求;
确定所述诉讼请求对应的权利请求基础规范;
对所述权利请求基础规范进行拆解,得到至少一个构成要件;
确定各所述构成要件对应的案情要素;
基于各所述案情要素确定至少一个推理规则;
基于各所述推理规则构建所述类案知识图谱。
2.根据权利要求1所述的类案文本确定方法,其特征在于,所述基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素,包括:
对所述案件文本进行语义理解,得到与各所述案情要素相关的第一文本;
针对各所述第一文本,将所述第一文本的语义信息与对应的案情要素进行匹配,得到所述匹配结果;
将所述匹配结果作为标签信息添加在对应的案情要素中,得到标签化的案情要素。
3.根据权利要求1所述的类案文本确定方法,其特征在于,所述方法还包括:
在所述类案文本的数量大于1的情况下,获取类案裁判时间位于第一预设时间范围内的各第一目标类案文本;
获取各排序维度的优先级;各所述排序维度包括相似度维度、类案层级维度和类案裁判时间维度;
基于最高优先级的排序维度对所有所述第一目标类案文本进行排序,得到第一目标排序结果;
输出所述第一目标排序结果。
4.根据权利要求3所述的类案文本确定方法,其特征在于,所述方法还包括:
在所述类案文本的数量大于1的情况下,获取类案裁判时间位于第二预设时间范围内的各第二目标类案文本;
针对各所述第二目标类案文本,获取所述第二目标类案文本的目标类案层级、所述第二目标类案文本的目标类案裁判时间、以及所述第二目标类案文本与所述案件文本的目标相似度;
基于所述目标类案层级、所述类案层级维度对应的第一权重、所述目标类案裁判时间、所述类案裁判时间维度对应的第二权重、所述目标相似度和所述相似度维度对应的第三权重,确定所述第二目标类案文本对应的分值;
基于各所述分值对各所述第二目标类案文本进行排序,得到第二排序结果;
输出所述第二排序结果。
5.根据权利要求1所述的类案文本确定方法,其特征在于,所述基于案件文本确定所述案件文本对应的至少一个案情要素,包括:
获取非结构化的初始案件文本;
将所述非结构化的初始案件文本输入至文本结构转化模型中,对所述非结构化的初始案件文本进行分段,得到各个段落文本,并添加各所述段落文本对应的段落标签,得到所述文本结构转化模型输出的结构化的案件文本;
基于所述结构化的案件文本中的各段落标签和对应的段落文本确定所述案件文本对应的至少一个所述案情要素。
6.一种类案文本确定装置,其特征在于,包括:
第一确定单元,用于基于案件文本确定所述案件文本对应的至少一个案情要素;
添加单元,用于基于所述案件文本确定各所述案情要素对应的标签信息,并将所述标签信息添加在对应的案情要素中,得到标签化的案情要素;所述标签信息用于表征所述案件文本与所述案情要素的匹配结果;
匹配单元,用于将各所述标签化的案情要素与预先构建的类案知识图谱进行匹配,得到所述案件文本对应的第一类案事实;所述类案知识图谱对应的案由与所述案件文本的案由相同;所述类案知识图谱包括至少一个推理规则;
第二确定单元,用于确定所述第一类案事实与案例库中各案例文本对应的第二类案事实的相似度;
第三确定单元,用于基于所述相似度从所述案例库中确定所述案件文本的类案文本;
所述匹配单元具体用于:
针对各所述推理规则,将各所述标签化的案情要素与所述推理规则进行匹配,得到所述推理规则对应的所述第一类案事实;
将各所述推理规则对应的所述第一类案事实均确定为所述案件文本对应的第一类案事实;
所述装置还包括:
第四确定单元,用于确定所述案由对应的诉讼请求;
第五确定单元,用于确定所述诉讼请求对应的权利请求基础规范;
拆解单元,用于对所述权利请求基础规范进行拆解,得到至少一个构成要件;
第六确定单元,用于确定各所述构成要件对应的案情要素;
第七确定单元,用于基于各所述案情要素确定至少一个推理规则;
构建单元,用于基于各所述推理规则构建所述类案知识图谱。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述类案文本确定方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述类案文本确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310955314.6A CN117033584B (zh) | 2023-07-31 | 2023-07-31 | 类案文本确定方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310955314.6A CN117033584B (zh) | 2023-07-31 | 2023-07-31 | 类案文本确定方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117033584A CN117033584A (zh) | 2023-11-10 |
CN117033584B true CN117033584B (zh) | 2024-04-02 |
Family
ID=88621891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310955314.6A Active CN117033584B (zh) | 2023-07-31 | 2023-07-31 | 类案文本确定方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117033584B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647631A (zh) * | 2018-06-25 | 2020-01-03 | 阿里巴巴集团控股有限公司 | 案例推荐的方法及装置、存储介质、处理器 |
CN111241241A (zh) * | 2020-01-08 | 2020-06-05 | 平安科技(深圳)有限公司 | 基于知识图谱的案件检索方法、装置、设备及存储介质 |
CN113486158A (zh) * | 2021-09-08 | 2021-10-08 | 中国司法大数据研究院有限公司 | 基于案情比对的类案检索方法、装置、设备及存储介质 |
CA3169288A1 (en) * | 2021-08-30 | 2023-02-28 | Accenture Global Solutions Limited | Knowledge graph based reasoning recommendation system and method |
CN115760495A (zh) * | 2022-10-13 | 2023-03-07 | 北京华夏电通科技股份有限公司 | 一种实现法律案例自动标签化的方法及装置 |
-
2023
- 2023-07-31 CN CN202310955314.6A patent/CN117033584B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647631A (zh) * | 2018-06-25 | 2020-01-03 | 阿里巴巴集团控股有限公司 | 案例推荐的方法及装置、存储介质、处理器 |
CN111241241A (zh) * | 2020-01-08 | 2020-06-05 | 平安科技(深圳)有限公司 | 基于知识图谱的案件检索方法、装置、设备及存储介质 |
CA3169288A1 (en) * | 2021-08-30 | 2023-02-28 | Accenture Global Solutions Limited | Knowledge graph based reasoning recommendation system and method |
CN113486158A (zh) * | 2021-09-08 | 2021-10-08 | 中国司法大数据研究院有限公司 | 基于案情比对的类案检索方法、装置、设备及存储介质 |
CN115760495A (zh) * | 2022-10-13 | 2023-03-07 | 北京华夏电通科技股份有限公司 | 一种实现法律案例自动标签化的方法及装置 |
Non-Patent Citations (1)
Title |
---|
结合案件要素序列的类案匹配方法研究与应用;孙倩;中国优秀硕士学位论文全文数据库 (社会科学Ⅰ辑);20220515(第5期);G120-229 * |
Also Published As
Publication number | Publication date |
---|---|
CN117033584A (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN110502621B (zh) | 问答方法、问答装置、计算机设备及存储介质 | |
US11520812B2 (en) | Method, apparatus, device and medium for determining text relevance | |
US11182433B1 (en) | Neural network-based semantic information retrieval | |
US11100124B2 (en) | Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches | |
US10565533B2 (en) | Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches | |
US20180225363A1 (en) | System and Methods for Automating Trademark and Service Mark Searches | |
CN111105209B (zh) | 适用于人岗匹配推荐系统的职位简历匹配方法及装置 | |
CN112800170A (zh) | 问题的匹配方法及装置、问题的回复方法及装置 | |
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
US20130262371A1 (en) | Method and apparatus for computer assisted innovation | |
CN110297893B (zh) | 自然语言问答方法、装置、计算机装置及存储介质 | |
CN109906450A (zh) | 用于通过相似性关联对电子信息排名的方法和装置 | |
CN113868406B (zh) | 搜索方法、系统、计算机可读存储介质 | |
CN113342958B (zh) | 问答匹配方法、文本匹配模型的训练方法和相关设备 | |
US20220358379A1 (en) | System, apparatus and method of managing knowledge generated from technical data | |
Huang et al. | Research on content-based MOOC recommender model | |
CN116910599A (zh) | 数据聚类方法、系统、电子设备及存储介质 | |
US20210382924A1 (en) | Method and system to perform text-based search among plurality of documents | |
Wei et al. | Online education recommendation model based on user behavior data analysis | |
He et al. | Sentiment classification technology based on Markov logic networks | |
CN113688633A (zh) | 一种提纲确定方法及装置 | |
CN117033584B (zh) | 类案文本确定方法、装置及电子设备 | |
US20240256597A1 (en) | Machine learning selection of images | |
CN117435685A (zh) | 文档检索方法、装置、计算机设备、存储介质和产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |