CN111291161A - 法律案件知识图谱查询方法、装置、设备及存储介质 - Google Patents

法律案件知识图谱查询方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111291161A
CN111291161A CN202010103656.1A CN202010103656A CN111291161A CN 111291161 A CN111291161 A CN 111291161A CN 202010103656 A CN202010103656 A CN 202010103656A CN 111291161 A CN111291161 A CN 111291161A
Authority
CN
China
Prior art keywords
relationship
entity
relation
legal
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010103656.1A
Other languages
English (en)
Inventor
刘嘉伟
于修铭
汪伟
陈晨
李可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010103656.1A priority Critical patent/CN111291161A/zh
Publication of CN111291161A publication Critical patent/CN111291161A/zh
Priority to PCT/CN2020/111301 priority patent/WO2021164226A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种法律案件知识图谱查询方法,包括:接收客户端发起的法律案件信息的查询请求;提取所述查询请求中的查询关键词;根据所述查询关键词,在预置的法律案件知识图谱库中检索目标关键词实体对象,并将与所述目标目标关键词实体对象匹配的法律案件信息输出至所述客户端;其中,所述法律案件知识图谱通过结合法理法规数据以及判案手册数据对裁判文书数据进行实体对象及实体对象关系抽取后构建得到。本申请还公开了一种法律案件知识图谱查询装置、设备及计算机可读存储介质。本申请能够清晰梳理出案件中的各种关系,降低了案件审理的复杂度,提升了案件审判的工作质量和效率。

Description

法律案件知识图谱查询方法、装置、设备及存储介质
技术领域
本申请涉及大数据技术领域,尤其涉及一种法律案件知识图谱查询方法、装置、设备及存储介质。
背景技术
随着社会与经济的快速发展,各类民事刑事纠纷案件也越来越多,各类案件处理涉及大量的法律知识,因而对于法律知识的智能化应用需求也越来越强烈。
然而法律知识体系非常复杂,是多种逻辑的结合,传统的法律智能化方法并不实用。例如,传统法律信息数据库通过都是存储未经加工处理的原始案件信息,比如直接存储整篇裁判文书,然后直接基于关键字对整篇裁判文书进行查询,查询到的信息比较零散,且内容上并不具有很好的逻辑关系,因而查询效率和准确性都不能满足用户实际需求;基于传统自然语言处理技术的方法,由于法律领域是十分垂直的领域,准确性面领着极大的挑战,同时,自然语言处理技术无法对自身产生的结果进行解释,因而也让其在严肃的法律领域无法让人信服。也即传统针对法律信息数据库的智能化处理的效果较差、法律逻辑关系不够清晰,因而不能较好地提升案件查询效率。
发明内容
本申请的主要目的在于提供一种法律案件知识图谱查询方法、装置、设备及存储介质,旨在解决如何构建出法律逻辑关系清晰的法律信息数据库以提升案件查询效率的技术问题。
为实现上述目的,本申请提供一种法律案件知识图谱查询方法,所述法律案件知识图谱查询方法包括以下步骤:
接收客户端发起的法律案件信息的查询请求;
提取所述查询请求中的查询关键词;
根据所述查询关键词,在预置的法律案件知识图谱库中检索目标关键词实体对象,并将与所述目标目标关键词实体对象匹配的法律案件信息输出至所述客户端;
其中,所述法律案件知识图谱通过结合法理法规数据以及判案手册数据对裁判文书数据进行实体对象及实体对象关系抽取后构建得到的。
可选地,在所述接收客户端发起的法律案件信息的查询请求的步骤之前,还包括:
获取法律案件的裁判文书数据;
基于预置实体关系标注模型,对所述裁判文书数据进行结构化抽取,得到所述裁判文书数据中的预置目标关键词实体对象及目标关键词实体对象的实体关系,其中,所述目标关键词实体对象包括:原告与被告、原告证据与被告证据、原告诉请与被告辩称、争议焦点、法院判定结果、法条依据以及法院判定原因;
根据关键词实体对象,生成大事实要素并将所述大事实要素确定为大事实要素实体对象;
基于预置规则,将各大事实要素分别拆分为多个小事实要素,并将所述小事实要素确定为小事实要素实体对象,其中,所述规则根据法理法规数据以及判案手册数据预先设定;
从指定的目标关键词实体对象中获取各小事实要素实体对象的实体关系;
根据获得的各实体对象及各实体关系,构建所述法律案件知识图谱。
可选地,所述根据关键词实体对象,生成大事实要素并将所述大事实要素确定为大事实要素实体对象包括:
对所述争议焦点进行聚类,得到多个争议焦点类别,并确定各争议焦点类别各自对应的预置案件争议焦点,其中,所述案件争议焦点指未被确认的事实;
根据所述原告证据与被告证据、所述原告诉请与被告辩称、所述法院判定结果、法条依据以及法院判定原因,对所述案件争议焦点对应的未被确认的事实进行确认,并将进行确认时所使用的信息作为大事实要素以及将所述大事实要素确定为大事实要素实体对象。
可选地,所述从指定的目标关键词实体对象中获取各小事实要素实体对象的实体关系包括:
对所述法院判定原因进行实体关系抽取,得到多个实体关系三元组,其中,所述实体关系三元组中包含有小事实要素分别与所述原告证据、所述被告证据之间的实体关系;
对所述各实体关系三元组中的关系进行聚类,得到关系层级结构矩阵;
根据所述关系层级结构矩阵,采用预置实体关系对齐算法,确定各小事实要素分别与所述原告证据、所述被告证据之间的实体关系。
可选地,所述对所述法院判定原因进行实体关系抽取,得到多个实体关系三元组包括:
对所述法院判定原因进行分句与切词,得到每个语句对应的单词序列;
使用预置的组合词性标注器对各单词序列进行词性标注,得到各单词序列的词性标注结果;
根据所述词性标注结果与预置依存标注表,标识各单词序列中各单词之间的依存关系;
基于各单词序列中各单词之间的依存关系,构建对应的句法分析树;
遍历所述句法分析树,并基于预置的中文语法规则,识别所述句法分析树中的核心词以及所述核心词对应的主语和宾语;
以所述核心词为实体关系、以所述核心词对应的主语和宾语为命名实体对象,构建实体关系三元组,其中,所述实体关系三元组用于描述法院判定原因中命名实体对象以及命名实体对象之间的实体关系。
可选地,所述对所述各实体关系三元组中的关系进行聚类,得到关系层级结构矩阵包括:
通过预置向量转换模型对各实体关系三元组中数据进行关系向量转换,得到关系向量;
通过预置聚类算法分别对所有关系向量、每个关系的所有关系向量进行聚类,对应得到关系聚类向量以及每个关系的关系子向量;
基于关系向量以及对应的关系聚类向量、关系子向量,构建关系层级结构矩阵;
其中,所述关系层级结构矩阵由顶层关系聚类层、中间层关系层以及底层关系子类层构成,其中,所述关系聚类层由所有关系聚类向量构成,所述关系层由所有关系向量构成,所述关系子类层由每个关系的所有关系子向量构成。
可选地,所述根据所述关系层级结构矩阵,采用预置实体关系对齐算法,确定各小事实要素分别与所述原告证据、所述被告证据之间的实体关系包括:
根据所述关系层级结构矩阵中的关系向量、关系聚类向量以及每个关系的关系子向量,计算所有实体关系三元组中任意两个关系之间的关系相似度;
以所有实体关系三元组中任意一个关系为相似性比对的基准关系,并依次判断其他关系与该基准关系之间的关系相似度是否超过预置阈值;
若是,则确定当前比对的关系与该基准关系相似并进行类别合并,否则将当前比对的关系作为新类别的关系;
从剩余未比对的关系中任意选择一个关系作为新的基准关系继续进行关系相似性比对,直至所有关系两两之间比对完成时结束。
进一步地,为实现上述目的,本发明还提供了一种法律案件知识图谱查询装置,所述法律案件知识图谱查询装置包括:
接收模块,用于接收客户端发起的法律案件信息的查询请求;
提取模块,用于提取所述查询请求中的查询关键词;
检索模块,用于根据所述查询关键词,在预置的法律案件知识图谱库中检索目标关键词实体对象,并将与所述目标目标关键词实体对象匹配的法律案件信息输出至所述客户端;
其中,所述法律案件知识图谱通过结合法理法规数据以及判案手册数据对裁判文书数据进行实体对象及实体对象关系抽取后构建得到。
可选地,所述法律案件知识图谱查询装置还包括:
图谱构建模块,用于构建所述法律案件知识图谱,具体包括:
数据获取单元,用于获取裁判文书数据,并从所述裁判文书数据中提取预置目标关键词实体对象及目标关键词实体对象的实体关系;
对象生成单元,用于根据关键词实体对象,生成大事实要素并将所述大事实要素确定为大事实要素实体对象;
对象拆分单元,用于基于预置规则,将各大事实要素分别拆分为多个小事实要素,并将所述小事实要素确定为小事实要素实体对象;
关系获取单元,用于从指定的目标关键词实体对象中获取各小事实要素实体对象的实体关系;
图谱构建单元,用于根据获得的各实体对象及各实体关系,构建所述法律案件知识图谱。
所述数据获取单元具体还用于:
基于预置实体关系标注模型,对所述裁判文书数据进行结构化抽取,得到所述裁判文书数据中的预置目标关键词实体对象及目标关键词实体对象的实体关系;
其中,所述目标关键词实体对象包括:原告与被告、原告证据与被告证据、原告诉请与被告辩称、争议焦点、法院判定结果、法条依据以及法院判定原因。
可选地,所述对象生成单元具体用于:
对所述争议焦点进行聚类,得到多个争议焦点类别,并确定各争议焦点类别各自对应的预置案件争议焦点,其中,所述案件争议焦点指未被确认的事实;
根据所述原告证据与被告证据、所述原告诉请与被告辩称、所述法院判定结果、法条依据以及法院判定原因,对所述案件争议焦点对应的未被确认的事实进行确认,并将进行确认时所使用的信息作为大事实要素以及将所述大事实要素确定为大事实要素实体对象。
可选地,所述关系获取单元包括:
关系抽取子单元,用于对所述法院判定原因进行实体关系抽取,得到多个实体关系三元组,其中,所述实体关系三元组中包含有小事实要素分别与所述原告证据、所述被告证据之间的实体关系;
关系聚类子单元,用于对所述各实体关系三元组中的关系进行聚类,得到关系层级结构矩阵;
关系对齐子单元,用于根据所述关系层级结构矩阵,采用预置实体关系对齐算法,确定各小事实要素分别与所述原告证据、所述被告证据之间的实体关系。
可选地,所述关系抽取子单元具体用于:
对所述法院判定原因进行分句与切词,得到每个语句对应的单词序列;
使用预置的组合词性标注器对各单词序列进行词性标注,得到各单词序列的词性标注结果;
根据所述词性标注结果与预置依存标注表,标识各单词序列中各单词之间的依存关系;
基于各单词序列中各单词之间的依存关系,构建对应的句法分析树;
遍历所述句法分析树,并基于预置的中文语法规则,识别所述句法分析树中的核心词以及所述核心词对应的主语和宾语;
以所述核心词为实体关系、以所述核心词对应的主语和宾语为命名实体对象,构建实体关系三元组,其中,所述实体关系三元组用于描述法院判定原因中命名实体对象以及命名实体对象之间的实体关系。
可选地,所述关系聚类子单元具体用于:
通过预置向量转换模型对各实体关系三元组中数据进行关系向量转换,得到关系向量;
通过预置聚类算法分别对所有关系向量、每个关系的所有关系向量进行聚类,对应得到关系聚类向量以及每个关系的关系子向量;
基于关系向量以及对应的关系聚类向量、关系子向量,构建关系层级结构矩阵;
其中,所述关系层级结构矩阵由顶层关系聚类层、中间层关系层以及底层关系子类层构成,其中,所述关系聚类层由所有关系聚类向量构成,所述关系层由所有关系向量构成,所述关系子类层由每个关系的所有关系子向量构成。
可选地,所述关系对齐子单元具体用于:
根据所述关系层级结构矩阵中的关系向量、关系聚类向量以及每个关系的关系子向量,计算所有实体关系三元组中任意两个关系之间的关系相似度;
以所有实体关系三元组中任意一个关系为相似性比对的基准关系,并依次判断其他关系与该基准关系之间的关系相似度是否超过预置阈值;
若是,则确定当前比对的关系与该基准关系相似并进行类别合并,否则将当前比对的关系作为新类别的关系;
从剩余未比对的关系中任意选择一个关系作为新的基准关系继续进行关系相似性比对,直至所有关系两两之间比对完成时结束。
进一步地,为实现上述目的,本发明还提供一种法律案件知识图谱查询设备,所述法律案件知识图谱查询设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述任一项所述的法律案件知识图谱查询方法的步骤。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的法律案件知识图谱查询方法的步骤。
本申请以预先构建的法律案件的知识图谱为案件审理数据库,通过知识图谱以梳理出待审理案件的各种法律逻辑关系。当查询法律案件信息时,只需输入要查询的关键字,通过检索本申请构建的法律案件的知识图谱,即可输出相应的法律案件信息。本申请的法律案件知识图谱是为解决法律相关案件而构建的,知识图谱中的法律案件信息完全根据裁判文书、法理法规及判案手册进行构建,因此知识图谱的真实性上无容置疑。本申请通过对实体对象与实体关系的进一步处理,从而获得更能反映案情的大事实要素、小事实要素以及小事实要素的实体关系,由此构建的法律案件知识图谱能够更加清晰地梳理出案件中的人物关系、证据与事实关系等复杂案情,从而降低了案件审理的复杂度,提升了案件审判的工作质量和效率。
附图说明
图1为本申请实施例方案涉及的法律案件知识图谱查询设备运行环境的结构示意图;
图2为本申请法律案件知识图谱查询方法第一实施例的流程示意图;
图3为本申请法律案件知识图谱查询方法第二实施例的流程示意图;
图4为图3中步骤S240一实施例的细化流程示意图;
图5为图4中步骤S2401一实施例的流程示意图;
图6为图4中步骤S2402一实施例的流程示意图;
图7为图4中步骤S2403一实施例的流程示意图;
图8为本申请法律案件知识图谱查询装置一实施例的功能模块示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请提供一种法律案件知识图谱查询设备。
参照图1,图1为本申请实施例方案涉及的法律案件知识图谱查询设备运行环境的结构示意图。
如图1所示,该法律案件知识图谱查询设备包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的法律案件知识图谱查询设备的硬件结构并不构成对法律案件知识图谱查询设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。其中,操作系统是管理和控制法律案件知识图谱查询设备和软件资源的程序,支持其它软件和/或程序的运行。
在图1所示的法律案件知识图谱查询设备的硬件结构中,网络接口1004主要用于接入网络;用户接口1003主要用于侦测确认指令和编辑指令等。而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行以下法律案件知识图谱查询方法的各实施例的操作。
基于上述法律案件知识图谱查询设备硬件结构,提出本申请法律案件知识图谱查询方法的各个实施例。
参照图2,图2为本申请法律案件知识图谱查询方法第一实施例的流程示意图。本实施例中,所述法律案件知识图谱查询方法包括以下步骤:
步骤S110,接收客户端发起的法律案件信息的查询请求;
步骤S120,提取所述查询请求中的查询关键词;
步骤S130,根据所述查询关键词,在预置的法律案件知识图谱库中检索目标关键词实体对象,并将与所述目标目标关键词实体对象匹配的法律案件信息输出至所述客户端;
其中,所述法律案件知识图谱通过结合法理法规数据以及判案手册数据对裁判文书数据进行实体对象及实体对象关系抽取后构建得到。
本实施例中,当进行法律案件信息查询时,用户可以通过客户端发起法律案件信息的查询请求,后台接收查询请求后,提取查询请求中的查询关键词,然后再使用提取的查询关键词,检索预先构建的法律案件知识图谱,通过关键词匹配的方式,确定需要查询的法律案件信息并输出。
本实施例以预先构建的法律案件的知识图谱为案件审理数据库,通过知识图谱以梳理出待审理案件的各种法律逻辑关系。当查询法律案件信息时,只需输入要查询的关键字,通过检索本申请构建的法律案件的知识图谱,即可输出相应的法律案件信息。本实施例中的法律案件知识图谱是为解决法律相关案件而构建的,知识图谱中的法律案件信息完全基于裁判文书、法理法规及判案手册构建,因此知识图谱的真实性上无容置疑。同时,本实施例提出的法律案件知识图谱能够清晰梳理出案件中的人物关系、证据与事实关系等复杂案情,进而可降低了案件审理的复杂度,提升案件审判的工作质量和效率。
参照图3,图3为本申请法律案件知识图谱查询方法第二实施例的流程示意图。本实施例中,在上述步骤S110之前,包括以下步骤:
步骤S210,获取裁判文书数据;
步骤S220,基于预置实体关系标注模型,对所述裁判文书数据进行结构化抽取,得到所述裁判文书数据中的预置目标关键词实体对象及目标关键词实体对象的实体关系;
其中,所述目标关键词实体对象包括:原告与被告、原告证据与被告证据、原告诉请与被告辩称、争议焦点、法院判定结果、法条依据以及法院判定原因;
本实施例优选通过网络爬虫方式采集指定网站的裁判文书数据。裁判文书用于记载人民法院审理案件的过程和结果,既包含了案件情况,也包含了判案过程和结果。
本实施例中,对于爬取方式不限。优选通过Docker容器作为媒介,来进行多机器部署指定的爬虫程序,实现多机器爬取指定的内容。需要进一步说明的是,不同裁判文书数据分别独立存储,比如按案件名称独立存储。
实体关系是知识图谱的基础数据结构,具体为<head,relation,tail>三元组形式,其中head和tail为实体,relation为实体间的关系。由于裁判文书数据都是以文本方式储存,因而需要从文本数据中提取出结构化数据。
例如,裁判文书中“原告:贾某明,农民”,“原告于2009年3月21日借给被告应某勇10万元款项,由被告杨某光担保”,则从上述内容中提取出的结构化数据包括<贾某明,职业,农民>,<贾某明,类型,原告>,<贾载明,借贷关系,应某勇>,<应某勇,担保关系,杨某光>等。
本实施例中,为实现裁判文书数据的自动化抽取,因此需要训练出相应的数学模型。比如,预先使用序列标注的方法对大量的裁判文书进行标注而获得训练用的结构化语料,标注的内容有:原告、被告、原告和被告提供的证据、原告的诉请、被告的辩称、案件的争议焦点、法院的判定结果、依据的法理法规、法院判定的原因等,然后利用人工标注的结构化数据作为训练集训练生成实体关系标注模型。
本实施例中,通过预置的实体关系标注模型可自动从采集到的裁判文书数据中抽取出三元组形式的结构化数据,实体对象具体包括:原告、被告、原告证据、被告证据、原告诉请、被告辩称、争议焦点、法院判定结果、法条依据、法院判定原因。其中,原告分别与原告证据、原告诉请存在相应的实体关系,被告分别与被告证据、被告辩称存在相应的实体关系,争议焦点分别与原告诉请、被告辩称存在相应的实体关系。
步骤S230,根据关键词实体对象,生成大事实要素并将所述大事实要素确定为大事实要素实体对象;
本实施例中,大事实要素是指法律对相应争议焦点进行判断确认时的重要信息。本实施例优选通过以下方式生成大事实要素:
(1)对所述争议焦点进行聚类,得到多个争议焦点类别,并确定各争议焦点类别各自对应的预置案件争议焦点,其中,所述案件争议焦点指未被确认的事实;
(2)根据所述原告证据与被告证据、所述原告诉请与被告辩称、所述法院判定结果、法条依据以及法院判定原因,对所述案件争议焦点对应的未被确认的事实进行确认,并将进行确认时所使用的信息作为大事实要素以及将所述大事实要素确定为大事实要素实体对象。
通常案件的争议焦点会有很多,基于案件类型的不同,案件对应的争议焦点亦不相同。因此,本实施例中先对各争议焦点进行聚类,从而得到多个争议焦点所属的类别。聚类是将数据分类到不同的类或者簇的过程,同一个簇中的对象具有很大的相似性,而不同簇间的对象则具有很大的差异性。本实施例对于聚类实现方式不限,比如使用分层聚类算法进行聚类。
通过聚类而将争议焦点划分为多个类别后,还需进一步确定各类别对应的案件争议焦点,也即相当于对争议焦点进行类别命名。通常,不同案件的案件争议焦点不同。比如民间借贷案件,其对应的案件争议焦点主要有:借贷关系是否成立、借贷形式是否合理、合同是否生效、合同是否有效、合同是否正常履行、担保关系是否成立、借款是否为夫妻共同债务七大类别。因此,需要将同一案件的所有争议焦点聚类为七个类别,并在完成聚类并得到七个争议焦点类别后,将各争议焦点类别分别与各案件争议焦点进行一一对应。本实施例优选通过人机交互的方式确定各争议焦点类别所对应的案件争议焦点。
本实施例中,案件争议焦点是指未被肯定或者未被否定的事实,因此,需要进一步对各案件争议焦点进行判断,具体基于从裁判文书中抽取的原告证据、被告证据、原告诉请、被告辩称、法院判定结果、法条依据、法院判定原因以及预置判断规则进行判断,进而生成新的实体对象,也即大事实要素。
例如,以民间借贷对应的案件争议焦点为例,通过判断所形成的大事实要素形式如下所示:
(1)【借贷关系是否成立—借贷主体及法律关系】,本案件争议焦点对应的大事实要素为“借贷主体及法律关系”的内容,用于作为判断确认“借贷关系是否成立”的重要信息。
(2)【借贷形式是否合理—借贷形式及主要条款】,本案件争议焦点对应的大事实要素为“借贷形式及主要条款”的内容,用于作为判断确认“借贷形式是否合理”的重要信息。
(3)【合同是否生效—合同生效】,本案件争议焦点对应的大事实要素为“合同生效”,也即对“合同是否生效”进行了肯定确认。
(4)【合同是否有效—合同有效性】,本案件争议焦点对应的大事实要素为“合同有效性”的内容,用于作为判断确认“合同是否有效”的重要信息。
(5)【合同是否正常履行—合同的履行】,本案件争议焦点对应的大事实要素为“合同的履行”的内容,用于作为判断确认“合同是否正常履行”的重要信息。
(6)【担保关系是否成立—借贷的担保关系】,本案件争议焦点对应的大事实要素为“借贷的担保关系”的内容,用于作为判断确认“担保关系是否成立”的重要信息。
(7)【借款是否为夫妻共同债务—借款是夫妻共同债务】,本案件争议焦点对应的大事实要素为“借款是夫妻共同债务”,也即对“借款是否为夫妻共同债务”进行了肯定确认。
本实施例对于案件争议焦点的判断确认方式不限,例如通过人机交互方式进行判断,也可以是针对不同的案件争议焦点而预先设置不同的判断规则,比如,“借贷关系是否成立”可通过正则模式识别出对应的“借贷主体及法律关系”,“借款是否为夫妻共同债务”则可通过判断证据中是否有关夫妻二人借款的信息,若有,则确定是夫妻共同债务。
步骤S240,基于预置规则,将各大事实要素分别拆分为多个小事实要素,并将所述小事实要素确定为小事实要素实体对象,其中,所述规则根据法理法规数据以及判案手册数据预先设定;
本实施例中,通常大事实要素是对某类事实的宏观概述,包含有更多的细节事实,也即小事实要素,比如,“合同生效”涉及生效的时间、生效条件等;“借贷的担保关系”涉及担保人基本信息、担保人与借贷人关系等。而在判案过程中,为真实、准确、全面对案件进行审理,通常法院会根据法理法规及判案手册设置一些原则性的判案规则,并且该判案规则具体针对与案件相关的多种细节事实。例如,大事实要素“借款是夫妻共同债务”的确定,需要“夫妻关系”、“合同上有夫妻双方签名”、“借款合同的有效性”等细节事实的综合证明,也即大事实要素“借款是夫妻共同债务”可以进一步拆分为“夫妻关系”、“合同上有夫妻双方签名”、“借款合同的有效性”等多个小事实要素。
本实施例中,基于法理法规及法院判案手册中的判案原则,设置相应的用于拆分大事实要素的判案规则,将各案件争议焦点各自对应的大事实要素分别拆分为多个小事实要素。其中,用于判案的规则具体根据法理法规数据以及判案手册数据预先设定。法理法规数据指各种法条、法理、法规,而判案手册指法院制定的用于辅助判案的知识文件。
步骤S250,从指定的目标关键词实体对象中获取各小事实要素实体对象的实体关系;
通常,在法律案件中,法院判定原因会陈述大量的案件事实与相应证据,也即法院判定原因中存在小事实要素分别与原告证据、被告证据之间的实体关系,因此,本实施例优选以法院判定原因作为指定的目标关键词实体对象,以从中获取各小事实要素实体对象的实体关系。
步骤S260,根据获得的各实体对象及各实体关系,构建所述法律案件知识图谱。
本实施例中,具体基于获得的实体对象+不同实体对象之间的关系,构建基于图数据库的法律结构图,也即法律案件知识图谱,其中,图数据库优选使用Neo4j图数据库。
本实施例以预先构建的法律案件的知识图谱为案件审理数据库,通过知识图谱以梳理出待审理案件的各种法律逻辑关系。当查询法律案件信息时,只需输入要查询的关键字,通过检索本申请构建的法律案件的知识图谱,即可输出相应的法律案件信息。本实施例的法律案件知识图谱是为解决法律相关案件而构建的,比如民间借贷案由,构建的信息完全来自裁判文书、法理法规及判案手册,因此知识图谱的真实性上无容置疑。本申请通过对实体对象与实体关系的进一步处理,从而获得更能反映案情的大事实要素、小事实要素以及小事实要素的实体关系,由此构建的法律案件知识图谱能够更加清晰地梳理出案件中的人物关系、证据与事实关系等复杂案情,从而降低了案件审理的复杂度,提升了案件审判的工作质量和效率。
参照图4,图4为图3中步骤S250一实施例的细化流程示意图。本实施例中,上述步骤S250进一步包括:
步骤S2501,对所述法院判定原因进行实体关系抽取,得到多个实体关系三元组,其中,所述实体关系三元组中包含有小事实要素分别与所述原告证据、所述被告证据之间的实体关系;
本实施例中,法院判定原因包含有判决证据、判决事实以及判定关系,因此通过实体关系抽取,可得到<判决证据,判定关系,判决事实>三元组。
步骤S2502,对所述各实体关系三元组中的关系进行聚类,得到关系层级结构矩阵;
本实施例中,进一步对三元组中各实体之间关系进行聚类,进而得到关系层级矩阵,其中,关系层级结构矩阵包括:
A、关系聚类层rc,是关系层级结构中的最顶层。
B、关系层r',是关系层级结构中的中间层,由所有的关系构成;
C、关系子类层rs,是关系层级结构中的最底层。
步骤S2503,根据所述关系层级结构矩阵,采用预置实体关系对齐算法,确定各小事实要素分别与所述原告证据、所述被告证据之间的实体关系。
本实施例中,实体关系对齐算法包括:对关系进行向量化,计算新加入的关系与其他已有关系之间距离,距离越近则代表相似度越高,设定阈值,与相似度超过该阈值的关系进行合并,如果没有任何一个关系相似,则划分为新的一个关系。
根据得到的关系层级矩阵,对于一个三元组(h,r,t)中的关系,可以得到它从语义空间到向量空间的映射embedding为:
r=rc+r′+rs
基于上述embedding过程,对新加入的关系与其他的关系计算向量距离,优选计算两向量关系之间的余弦距离,并将该距离作为相似度,进而确定各小事实要素分别对应与原告证据、被告证据之间的实体关系,该实体关系具体指肯定关系或否定关系。
参照图5,图5为图4中步骤S2501一实施例的流程示意图。本实施例中,上述步骤S2501进一步包括:
步骤S101,对所述法院判定原因进行分句与切词,得到每个语句对应的单词序列;
本实施例中,为更好地识别出命名实体对象以及实体关系,因此需要预先对法院判定原因数据进行分句,具体以逗号、句号为标识进行语句划分,进而将整篇文档内容划分为多个语句。同时还进一步通过切词操作将各单个语句切分为一个单词序列,该单词序列中包含有多个顺序排列的单词。例如使用jieba分词方式将一条语句划分为多个顺序排列的单词。
步骤S102,使用预置的组合词性标注器对各单词序列进行词性标注,得到各单词序列的词性标注结果;
词性标注器是一种词性标记工具,可用于处理一个词序列,以为每个词附加一个词性标记。例如,使用基于隐马尔可夫模型的词性标注器对词序列进行标记,或者使用基于神经网络算法的词性标注器对词序列进行标记。
本实施例中采用的组合词性标注器包含有多个词性标注器,比如正则表达式标注器、bigram标注器、unigram标注器等。例如,先尝试使用正则表达式标注器对词序列进行标记,如果正则表达式标注器无法找到一个标记,则尝试使用bigram标注器对词序列进行标记,以此类推,从而得到各单词序列的词性标注结果。
步骤S103,根据所述词性标注结果与预置依存标注表,标识各单词序列中各单词之间的依存关系;
本实施例中,对每个分句对应的单词序列进行词性标注后,得到每个单词对应的词性,然后再根据预置的依存标注表,进一步标识各单词序列中各单词之间的依存关系。其中,单词之间的依存关系主要体现在各单词之间的语法关系上。例如,张三/喜欢/跑步,词性标注为名称+情态动词+名称,则对应的语法关系为:主谓宾关系;张三/就职于/学校,词性标注为名称+介词+名称,则对应的语法关系为:介宾关系。
句子中的语法关系还有前置宾语、定中关系、间宾关系、介宾关系、并列关系、动宾关系、主谓关系、核心关系等依存关系,因此,只要基于词性标注和依存标注表,就可以标识出句子中各单词之间的依存关系。
例如句子“酒店总经理张三”对应标注的单词词性为“名词+名词+名词”结构,根据依存标注表可查对应的组合为定中关系,前一个名词作为定于修饰后一个名词,因此“酒店总经理张三”的核心名词因为“张三”,而“酒店”和“总经理”是修饰“张三”的,因此这三个词依存关系被标注为ATT(也即定中关系)。
步骤S104,基于各单词序列中各单词之间的依存关系,构建对应的句法分析树;
本实施例中,一个句子中各各单词之间的依存关系可以通过构建句法分析树的形式来进行表达。构建句法分析树通常包含有以下四个集合:
(1)有限的非终端语法标识的集合,即句法分析树上非叶子结点的集合。
(2)起始标识,即句法分析树的开始节点对应的位置;
(3)有限的终端标识集合,即语句中所有单词的集合,位于句法分析树的叶子结点,其中,句法分析树的叶子节点允许为空;
(4)构建句法树的有限个规则的集合,该规则表述了句法树的构建过程。
通过以上方式即可构建一个单词序列(也即一条语句)对应的句法分析树,其中,子叶子节点与父叶子节点之间存在依存关系。
步骤S105,遍历所述句法分析树,并基于预置的中文语法规则,识别所述句法分析树中的核心词以及所述核心词对应的主语和宾语;
本实施例中,在构建好整个语句对应的句法分析树后,从根节点开始进行遍历,并在遍历过程中,基于预置的中文语法规则,识别该句法分析树中的核心词以及核心词对应的主语和宾语。
在基于依存关系的实体关系抽取模型中,关系词并非是预先设置的类别,而是存在于当前的句子中。例如“张三在广州创办了一家酒店”,基于中文语法规则可知,该句子预定义的关系可能是“张三:创始人”,而“创始人”一词在句子中不存在,但是句中存在一个与其相似的词“创办”。因此在句法分析中,能够提取出核心词“创办”,该词前面有一个名词“广州”,而“广州”前面有一个介词“在”,因此“在广州”是一个介宾短语,依存关系被标记为POB(介宾关系),所以“广州”不是“创办”的主语,而是“张三”。“创办”一词后面是助词“了”可以省略,再往后则是名称“酒店”,因此“创办酒店”为动宾关系VOB。因此可分析得到该句的语义为“张三创办酒店”,核心词“创办”即为实体关系,“而张三”和“酒店”则是两个命名实体对象。
步骤S106,以所述核心词为实体关系、以所述核心词对应的主语和宾语为命名实体对象,构建实体关系三元组,其中,所述实体关系三元组用于描述法院判定原因中命名实体对象以及命名实体对象之间的实体关系。
本实施例中,在识别出句子中的命名实体对象及其之间的实体关系之后,再提取的核心词为实体关系、以该核心词对应的主语和宾语为命名实体对象,构建实体关系三元组,以用于描述法院判定原因中各命名实体对象以及各命名实体对象之间的实体关系。
需要说明的是,法院判定原因具体包含有判定事实和判定证据,以及还包含有事实与证据之间的关系,比如肯定关系或否定关系。本实施例中,通过上述实施例构建的实体关系三元组中包含有小事实要素与各种证据之间的关系。
参照图6,图6为图4中步骤S2502一实施例的流程示意图。本实施例中,上述步骤S2502进一步包括:
步骤S201,通过预置向量转换模型对各实体关系三元组中数据进行关系向量转换,得到关系向量;
知识图谱的数据基本结构主要为实体关系三元组,在一个三元组(h,r,t)中,h为主体、t为客体、r为关系,例如三元组(纽约,属于,美国),纽约为主体,美国为客体,属于为关系。三元组是一种直观的数据结构,主体和客体统称为实体,关系有不可逆的属性,在一个三元组中,主体和客体不能互换。
通过预置的向量转换模型对三元组数据进行转换,得到关系向量。预置的向量转换模型可以将字符型的三元组数据转换成向量型的三元组数据,也即将字符型的关系数据转换成关系向量
Figure BDA0002387737580000171
将字符型的主体数据转换成主体向量
Figure BDA0002387737580000172
将字符型的客体数据转换成客体向量
Figure BDA0002387737580000173
需要说明的是,预置的向量转换模型为转换嵌入(translating embedding,TransE)模型,该模型可以将三元组数据转换成向量形式,具体实现方式如下:
(1)将三元组中的主体和客体映射为低维度向量
Figure BDA0002387737580000174
Figure BDA0002387737580000175
(2)通过预置的损失函数调整
Figure BDA0002387737580000176
Figure BDA0002387737580000177
直至
Figure BDA0002387737580000178
最小,其中
Figure BDA0002387737580000179
(3)当
Figure BDA00023877375800001710
最小时,将
Figure BDA00023877375800001711
设置为向量型的三元组,
Figure BDA00023877375800001712
为关系向量。
步骤S202,通过预置聚类算法分别对所有关系向量、每个关系的所有关系向量进行聚类,对应得到关系聚类向量以及每个关系的关系子向量;
在知识图谱中,不同关系的含义可能会相同,例如,“所属国家”和“国籍”具有相同的含义,因此需要将表示相同含义的不同关系分为一类,并设置同一类关系的关系聚类向量。在同类的关系中,每个关系的关系向量与该类的关系聚类向量之间的欧式距离最小。
步骤S203,基于关系向量以及对应的关系聚类向量、关系子向量,构建关系层级结构矩阵;
本实施例中,关系层级结构矩阵由顶层关系聚类层、中间层关系层以及底层关系子类层构成,其中,所述关系聚类层由所有关系聚类向量构成,所述关系层由所有关系向量构成,所述关系子类层由每个关系的所有关系子向量构成。
对于三元组(h,r,t),TransE模型假设t-h≈r,则对每一个三元组可定义
Figure BDA0002387737580000185
其中t和h都来自TransE模型中的Embedding层。对每个关系,收集其对应的所有的
Figure BDA0002387737580000186
然后采用K-means算法进行对所有的
Figure BDA0002387737580000187
进行聚类,并将其划分为该关系的子类,所有关系的子类构成了关系层级结构中的最底层,也即关系子类层rs
参照图7,图7为图4中步骤S2503一实施例的流程示意图。本实施例中,上述步骤S2503进一步包括:
步骤S301,根据所述关系层级结构矩阵中的关系向量、关系聚类向量以及每个关系的关系子向量,计算所有实体关系三元组中任意两个关系之间的关系相似度;
结合关系向量、关系聚类向量和关系子向量来计算关系相似度,能够利用关系的层级结构信息,更准确的确定各个三元组中关系的意义是否相同,有利于对关系进行分类,提高了识别关系的准确性。
本实施例优选采用向量距离计算关系相似度,具体实现方式如下:
首先,通过预置公式得到每个三元组中关系的embedding为:
Figure BDA0002387737580000181
其中,
Figure BDA0002387737580000182
表示关系的embedding,
Figure BDA0002387737580000183
表示关系聚类向量,
Figure BDA0002387737580000184
表示初始的关系向量,
Figure BDA0002387737580000191
表示关系子向量。
然后,通过以下余弦距离计算关系相似度,其中,
Figure BDA0002387737580000192
Figure BDA0002387737580000193
表示任意两个关系向量。
Figure BDA0002387737580000194
步骤S302,以所有实体关系三元组中任意一个关系为相似性比对的基准关系,并依次判断其他关系与该基准关系之间的关系相似度是否超过预置阈值;
步骤S303,若是,则确定当前比对的关系与该基准关系相似并进行类别合并,否则将当前比对的关系作为新类别的关系;
步骤S304,从剩余未比对的关系中任意选择一个关系作为新的基准关系继续进行关系相似性比对,直至所有关系两两之间比对完成时结束。
通过聚类的方法构建了关系的上下层级结构,并充分利用了层级结构中的信息对关系进行向量化,通过计算新加入的关系与其他已有关系之间距离来衡量关系之间的相似度。距离越近则代表相似度越高,同时设定相似度阈值,若某新加入的关系的相似度超过该阈值则进行合并,如果新加入的关系不与任何一个关系相似,则将其划分为一个新的关系。
具体地,小事实要素分别与原告证据、被告证据之间的实体关系为肯定关系或否定关系。利用关系对齐技术,可将证据和小事实要素的关系抽取出来,此处的关系有肯定(或否定)以及肯定原因(或否定原因)。比如抽取出来的三元组为:【借款合同–[肯定有借款{原因:有签名}]->借款合同是否有借款人签名或追加】,这里的【借款合同】是证据,【借款合同是否有借款人签名或追加】是小事实要素,【肯定有借款{原因:有签名}】是证据和小事实要素的关系,也即可以得出小事实要素与原告证据自己的实体关系为肯定关系。
本申请还提供一种法律案件知识图查询装置。
参照图8,图8为本申请法律案件知识图谱查询装置一实施例的功能模块示意图。本实施例中,法律案件知识图谱查询装置包括:
接收模块10,用于接收客户端发起的法律案件信息的查询请求;
提取模块20,用于提取所述查询请求中的查询关键词;
检索模块30,用于根据所述查询关键词,在预置的法律案件知识图谱库中检索目标关键词实体对象,并将与所述目标目标关键词实体对象匹配的法律案件信息输出至所述客户端;
其中,所述法律案件知识图谱通过结合法理法规数据以及判案手册数据对裁判文书数据进行实体对象及实体对象关系抽取后构建得到。
基于与上述本申请法律案件知识图谱查询方法相同的实施例说明内容,因此本实施例对法律案件知识图谱查询装置的实施例内容不做过多赘述。
本申请还提供一种计算机可读存储介质。
本实施例中,计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项实施例中所述的法律案件知识图谱查询方法的步骤。其中,计算机程序被处理器执行时所实现的方法可参照本申请法律案件知识图谱查询方法的各个实施例,因此不再过多赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本申请各个实施例所述的方法。

Claims (10)

1.一种法律案件知识图谱查询方法,其特征在于,所述法律案件知识图谱查询方法包括以下步骤:
接收客户端发起的法律案件信息的查询请求;
提取所述查询请求中的查询关键词;
根据所述查询关键词,在预置的法律案件知识图谱库中检索目标关键词实体对象,并将与所述目标目标关键词实体对象匹配的法律案件信息输出至所述客户端;
其中,所述法律案件知识图谱通过结合法理法规数据以及判案手册数据对裁判文书数据进行实体对象及实体对象关系抽取后构建得到。
2.如权利要求1所述的法律案件知识图谱查询方法,其特征在于,在所述接收客户端发起的法律案件信息的查询请求的步骤之前,还包括:
获取法律案件的裁判文书数据;
基于预置实体关系标注模型,对所述裁判文书数据进行结构化抽取,得到所述裁判文书数据中的预置目标关键词实体对象及目标关键词实体对象的实体关系,其中,所述目标关键词实体对象包括:原告与被告、原告证据与被告证据、原告诉请与被告辩称、争议焦点、法院判定结果、法条依据以及法院判定原因;
根据关键词实体对象,生成大事实要素并将所述大事实要素确定为大事实要素实体对象;
基于预置规则,将各大事实要素分别拆分为多个小事实要素,并将所述小事实要素确定为小事实要素实体对象,其中,所述规则根据法理法规数据以及判案手册数据预先设定;
从指定的目标关键词实体对象中获取各小事实要素实体对象的实体关系;
根据获得的各实体对象及各实体关系,构建所述法律案件知识图谱。
3.如权利要求2所述的法律案件知识图谱查询方法,其特征在于,所述根据关键词实体对象,生成大事实要素并将所述大事实要素确定为大事实要素实体对象包括:
对所述争议焦点进行聚类,得到多个争议焦点类别,并确定各争议焦点类别各自对应的预置案件争议焦点,其中,所述案件争议焦点指未被确认的事实;
根据所述原告证据与被告证据、所述原告诉请与被告辩称、所述法院判定结果、法条依据以及法院判定原因,对所述案件争议焦点对应的未被确认的事实进行确认,并将进行确认时所使用的信息作为大事实要素以及将所述大事实要素确定为大事实要素实体对象。
4.如权利要求2所述的法律案件知识图谱查询方法,其特征在于,所述从指定的目标关键词实体对象中获取各小事实要素实体对象的实体关系包括:
对所述法院判定原因进行实体关系抽取,得到多个实体关系三元组,其中,所述实体关系三元组中包含有小事实要素分别与所述原告证据、所述被告证据之间的实体关系;
对所述各实体关系三元组中的关系进行聚类,得到关系层级结构矩阵;
根据所述关系层级结构矩阵,采用预置实体关系对齐算法,确定各小事实要素分别与所述原告证据、所述被告证据之间的实体关系。
5.如权利要求4所述的法律案件知识图谱查询方法,其特征在于,所述对所述法院判定原因进行实体关系抽取,得到多个实体关系三元组包括:
对所述法院判定原因进行分句与切词,得到每个语句对应的单词序列;
使用预置的组合词性标注器对各单词序列进行词性标注,得到各单词序列的词性标注结果;
根据所述词性标注结果与预置依存标注表,标识各单词序列中各单词之间的依存关系;
基于各单词序列中各单词之间的依存关系,构建对应的句法分析树;
遍历所述句法分析树,并基于预置的中文语法规则,识别所述句法分析树中的核心词以及所述核心词对应的主语和宾语;
以所述核心词为实体关系、以所述核心词对应的主语和宾语为命名实体对象,构建实体关系三元组,其中,所述实体关系三元组用于描述法院判定原因中命名实体对象以及命名实体对象之间的实体关系。
6.如权利要求4所述的法律案件知识图谱查询方法,其特征在于,所述对所述各实体关系三元组中的关系进行聚类,得到关系层级结构矩阵包括:
通过预置向量转换模型对各实体关系三元组中数据进行关系向量转换,得到关系向量;
通过预置聚类算法分别对所有关系向量、每个关系的所有关系向量进行聚类,对应得到关系聚类向量以及每个关系的关系子向量;
基于关系向量以及对应的关系聚类向量、关系子向量,构建关系层级结构矩阵;
其中,所述关系层级结构矩阵由顶层关系聚类层、中间层关系层以及底层关系子类层构成,其中,所述关系聚类层由所有关系聚类向量构成,所述关系层由所有关系向量构成,所述关系子类层由每个关系的所有关系子向量构成。
7.如权利要求6所述的法律案件知识图谱查询方法,其特征在于,所述根据所述关系层级结构矩阵,采用预置实体关系对齐算法,确定各小事实要素分别与所述原告证据、所述被告证据之间的实体关系包括:
根据所述关系层级结构矩阵中的关系向量、关系聚类向量以及每个关系的关系子向量,计算所有实体关系三元组中任意两个关系之间的关系相似度;
以所有实体关系三元组中任意一个关系为相似性比对的基准关系,并依次判断其他关系与该基准关系之间的关系相似度是否超过预置阈值;
若是,则确定当前比对的关系与该基准关系相似并进行类别合并,否则将当前比对的关系作为新类别的关系;
从剩余未比对的关系中任意选择一个关系作为新的基准关系继续进行关系相似性比对,直至所有关系两两之间比对完成时结束。
8.一种法律案件知识图谱查询装置,其特征在于,所述法律案件知识图谱查询装置包括:
接收模块,用于接收客户端发起的法律案件信息的查询请求;
提取模块,用于提取所述查询请求中的查询关键词;
检索模块,用于根据所述查询关键词,在预置的法律案件知识图谱库中检索目标关键词实体对象,并将与所述目标目标关键词实体对象匹配的法律案件信息输出至所述客户端;
其中,所述法律案件知识图谱通过结合法理法规数据以及判案手册数据对裁判文书数据进行实体对象及实体对象关系抽取后构建得到。
9.一种法律案件知识图谱查询设备,其特征在于,所述法律案件知识图谱查询设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的法律案件知识图谱查询方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的法律案件知识图谱查询方法的步骤。
CN202010103656.1A 2020-02-20 2020-02-20 法律案件知识图谱查询方法、装置、设备及存储介质 Pending CN111291161A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010103656.1A CN111291161A (zh) 2020-02-20 2020-02-20 法律案件知识图谱查询方法、装置、设备及存储介质
PCT/CN2020/111301 WO2021164226A1 (zh) 2020-02-20 2020-08-26 法律案件知识图谱查询方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010103656.1A CN111291161A (zh) 2020-02-20 2020-02-20 法律案件知识图谱查询方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111291161A true CN111291161A (zh) 2020-06-16

Family

ID=71024635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010103656.1A Pending CN111291161A (zh) 2020-02-20 2020-02-20 法律案件知识图谱查询方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN111291161A (zh)
WO (1) WO2021164226A1 (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753517A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于rpa及ai的文档对比方法、装置、设备及介质
CN111753025A (zh) * 2020-06-24 2020-10-09 南方科技大学 案件信息的自动获取方法、装置、设备和存储介质
CN111798344A (zh) * 2020-07-01 2020-10-20 北京金堤科技有限公司 主体名称确定方法和装置、电子设备和存储介质
CN111797246A (zh) * 2020-09-08 2020-10-20 共道网络科技有限公司 庭审方法、装置、电子设备及机器可读存储介质
CN111859969A (zh) * 2020-07-20 2020-10-30 航天科工智慧产业发展有限公司 数据分析方法及装置、电子设备、存储介质
CN111932413A (zh) * 2020-09-14 2020-11-13 平安国际智慧城市科技股份有限公司 案件要素提取方法、装置、设备及介质
CN112487146A (zh) * 2020-12-02 2021-03-12 重庆邮电大学 一种法律案件争议焦点获取方法、装置以及计算机设备
CN112632226A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 基于法律知识图谱的语义搜索方法、装置和电子设备
CN112632225A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN112883196A (zh) * 2021-02-01 2021-06-01 上海交通大学 基于知识图谱的案件分配方法、系统、介质及电子设备
CN113239130A (zh) * 2021-06-18 2021-08-10 广东博维创远科技有限公司 一种基于刑事司法文书的知识图谱的构建方法、装置和电子设备、存储介质
WO2021164226A1 (zh) * 2020-02-20 2021-08-26 平安科技(深圳)有限公司 法律案件知识图谱查询方法、装置、设备及存储介质
CN113486187A (zh) * 2021-03-24 2021-10-08 平安科技(深圳)有限公司 佛学知识图谱构建方法、装置、设备及存储介质
CN113868391A (zh) * 2021-09-27 2021-12-31 平安国际智慧城市科技股份有限公司 基于知识图谱的法律文书生成方法、装置、设备及介质
CN114092119A (zh) * 2021-11-29 2022-02-25 北京金堤科技有限公司 供应关系获取方法、装置、存储介质及电子设备
CN114187143A (zh) * 2021-12-21 2022-03-15 厦门大学 基于人工智能的建筑施工合同风险审查方法及系统
CN114239561A (zh) * 2021-12-10 2022-03-25 北京天眼查科技有限公司 供应关系获取方法、装置、存储介质及电子设备
CN114637822A (zh) * 2022-03-15 2022-06-17 平安国际智慧城市科技股份有限公司 法律信息查询方法、装置、设备及存储介质
CN115048521A (zh) * 2022-06-23 2022-09-13 重庆邮电大学 一种基于半监督的图神经网络的案件争议焦点识别方法及装置
CN115269879A (zh) * 2022-09-05 2022-11-01 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN115730078A (zh) * 2022-11-04 2023-03-03 南京擎盾信息科技有限公司 用于类案检索的事件知识图谱构建方法、装置及电子设备
TWI800971B (zh) * 2021-11-03 2023-05-01 財團法人資訊工業策進會 失能等級自動判斷裝置及失能等級自動判斷方法
CN116304019A (zh) * 2023-01-09 2023-06-23 中国司法大数据研究院有限公司 一种争议焦点体系构建与识别方法
CN117725235A (zh) * 2023-12-25 2024-03-19 武汉百智诚远科技有限公司 一种基于人工智能算法的法律知识增强检索系统及方法
CN117743590A (zh) * 2023-11-30 2024-03-22 北京汉勃科技有限公司 一种基于大语言模型的法律辅助方法及系统

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742494B (zh) * 2021-09-06 2024-03-15 湘潭大学 一种基于标签图转化的领域文本相似度计算方法及系统
CN113779358B (zh) * 2021-09-14 2024-05-24 支付宝(杭州)信息技术有限公司 一种事件检测方法和系统
CN113626608B (zh) * 2021-10-12 2022-02-15 深圳前海环融联易信息科技服务有限公司 增强语义的关系抽取方法、装置、计算机设备及存储介质
CN113821647B (zh) * 2021-11-22 2022-02-22 山东捷瑞数字科技股份有限公司 一种工程机械行业知识图谱构建方法及系统
CN114237829B (zh) * 2021-12-27 2022-08-26 南方电网物资有限公司 一种电力设备的数据采集与处理方法
CN114428806A (zh) * 2022-01-20 2022-05-03 北京北大英华科技有限公司 案件隐性知识挖掘方法、装置及电子设备
CN115048510B (zh) * 2022-02-17 2024-07-23 东南大学 基于层级式法律知识与双图联合表示学习的罪名预测方法
CN114238418B (zh) * 2022-02-24 2022-05-10 佛山市禅城区人民法院 信用卡要素表生成方法、系统和可读存储介质
CN114547345B (zh) * 2022-04-18 2022-07-19 支付宝(杭州)信息技术有限公司 结合图谱模式的输入提示方法及装置
CN114780083B (zh) 2022-06-17 2022-10-18 之江实验室 一种知识图谱系统的可视化构建方法及装置
CN115238688B (zh) * 2022-08-15 2023-08-01 广州市刑事科学技术研究所 电子信息数据关联关系分析方法、装置、设备和存储介质
CN115759038B (zh) * 2022-11-24 2024-07-09 盐城天眼察微科技有限公司 法律诉讼案由识别方法及装置
CN115809256B (zh) * 2023-02-22 2023-06-06 中关村科学城城市大脑股份有限公司 治安管理综合信息系统和可视化展示方法
CN115982388B (zh) * 2023-03-06 2024-04-19 共道网络科技有限公司 案件质控图谱建立、案件文书质检方法、设备及存储介质
CN115952290B (zh) * 2023-03-09 2023-06-02 太极计算机股份有限公司 基于主动学习和半监督学习的案情特征标注方法、装置和设备
CN116484010B (zh) * 2023-03-15 2024-01-16 北京擎盾信息科技有限公司 知识图谱构建方法、装置、存储介质及电子装置
CN116629258B (zh) * 2023-07-24 2023-10-13 北明成功软件(山东)有限公司 基于复杂信息项数据的司法文书的结构化分析方法及系统
CN116756324B (zh) * 2023-08-14 2023-10-27 北京分音塔科技有限公司 基于庭审音频的关联度挖掘方法、装置、设备及存储介质
CN117057425B (zh) * 2023-10-11 2023-12-22 人民法院信息技术服务中心 一种规律型知识分析方法及装置
CN117149821B (zh) * 2023-10-19 2024-01-30 北京人大金仓信息技术股份有限公司 一种查询优化方法、存储介质与计算机设备
CN117540799B (zh) * 2023-10-20 2024-04-09 上海歆广数据科技有限公司 一种个案图谱创建生成方法及系统
CN117609440B (zh) * 2023-10-27 2024-07-23 中国司法大数据研究院有限公司 一种面向裁判文书的文档级智能问答实现方法
CN117473074B (zh) * 2023-11-01 2024-06-14 中国通信建设集团有限公司数智科创分公司 一种基于人工智能的司法案例智能信息匹配系统及方法
CN117763156B (zh) * 2023-11-24 2024-05-07 上海歆广数据科技有限公司 一种动态全息个案管理系统
CN117609519B (zh) * 2024-01-22 2024-04-19 云南大学 一种电力碳排放计算公式中的实体关系抽取方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9703859B2 (en) * 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
CN106991092B (zh) * 2016-01-20 2021-11-05 阿里巴巴集团控股有限公司 基于大数据挖掘相似裁判文书的方法和设备
CN108614860A (zh) * 2018-03-27 2018-10-02 成都律云科技有限公司 一种律师信息处理方法和系统
CN108681977B (zh) * 2018-03-27 2022-05-31 成都律云科技有限公司 一种律师信息处理方法和系统
CN111291161A (zh) * 2020-02-20 2020-06-16 平安科技(深圳)有限公司 法律案件知识图谱查询方法、装置、设备及存储介质

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021164226A1 (zh) * 2020-02-20 2021-08-26 平安科技(深圳)有限公司 法律案件知识图谱查询方法、装置、设备及存储介质
CN111753025A (zh) * 2020-06-24 2020-10-09 南方科技大学 案件信息的自动获取方法、装置、设备和存储介质
CN111753517A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于rpa及ai的文档对比方法、装置、设备及介质
CN111798344B (zh) * 2020-07-01 2023-09-22 北京金堤科技有限公司 主体名称确定方法和装置、电子设备和存储介质
CN111798344A (zh) * 2020-07-01 2020-10-20 北京金堤科技有限公司 主体名称确定方法和装置、电子设备和存储介质
CN111859969A (zh) * 2020-07-20 2020-10-30 航天科工智慧产业发展有限公司 数据分析方法及装置、电子设备、存储介质
CN111859969B (zh) * 2020-07-20 2024-05-03 航天科工智慧产业发展有限公司 数据分析方法及装置、电子设备、存储介质
CN111797246A (zh) * 2020-09-08 2020-10-20 共道网络科技有限公司 庭审方法、装置、电子设备及机器可读存储介质
CN111932413A (zh) * 2020-09-14 2020-11-13 平安国际智慧城市科技股份有限公司 案件要素提取方法、装置、设备及介质
CN112487146A (zh) * 2020-12-02 2021-03-12 重庆邮电大学 一种法律案件争议焦点获取方法、装置以及计算机设备
CN112632225A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN112632225B (zh) * 2020-12-29 2022-08-30 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN112632226A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 基于法律知识图谱的语义搜索方法、装置和电子设备
CN112883196A (zh) * 2021-02-01 2021-06-01 上海交通大学 基于知识图谱的案件分配方法、系统、介质及电子设备
CN112883196B (zh) * 2021-02-01 2022-08-16 上海交通大学 基于知识图谱的案件分配方法、系统、介质及电子设备
CN113486187A (zh) * 2021-03-24 2021-10-08 平安科技(深圳)有限公司 佛学知识图谱构建方法、装置、设备及存储介质
CN113239130A (zh) * 2021-06-18 2021-08-10 广东博维创远科技有限公司 一种基于刑事司法文书的知识图谱的构建方法、装置和电子设备、存储介质
CN113868391B (zh) * 2021-09-27 2024-05-07 平安国际智慧城市科技股份有限公司 基于知识图谱的法律文书生成方法、装置、设备及介质
CN113868391A (zh) * 2021-09-27 2021-12-31 平安国际智慧城市科技股份有限公司 基于知识图谱的法律文书生成方法、装置、设备及介质
TWI800971B (zh) * 2021-11-03 2023-05-01 財團法人資訊工業策進會 失能等級自動判斷裝置及失能等級自動判斷方法
CN114092119A (zh) * 2021-11-29 2022-02-25 北京金堤科技有限公司 供应关系获取方法、装置、存储介质及电子设备
CN114239561A (zh) * 2021-12-10 2022-03-25 北京天眼查科技有限公司 供应关系获取方法、装置、存储介质及电子设备
CN114187143A (zh) * 2021-12-21 2022-03-15 厦门大学 基于人工智能的建筑施工合同风险审查方法及系统
CN114637822A (zh) * 2022-03-15 2022-06-17 平安国际智慧城市科技股份有限公司 法律信息查询方法、装置、设备及存储介质
CN115048521A (zh) * 2022-06-23 2022-09-13 重庆邮电大学 一种基于半监督的图神经网络的案件争议焦点识别方法及装置
CN115269879A (zh) * 2022-09-05 2022-11-01 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN115269879B (zh) * 2022-09-05 2023-05-05 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN115730078A (zh) * 2022-11-04 2023-03-03 南京擎盾信息科技有限公司 用于类案检索的事件知识图谱构建方法、装置及电子设备
CN116304019A (zh) * 2023-01-09 2023-06-23 中国司法大数据研究院有限公司 一种争议焦点体系构建与识别方法
CN116304019B (zh) * 2023-01-09 2023-09-12 中国司法大数据研究院有限公司 一种争议焦点体系构建与识别方法
CN117743590A (zh) * 2023-11-30 2024-03-22 北京汉勃科技有限公司 一种基于大语言模型的法律辅助方法及系统
CN117725235A (zh) * 2023-12-25 2024-03-19 武汉百智诚远科技有限公司 一种基于人工智能算法的法律知识增强检索系统及方法
CN117725235B (zh) * 2023-12-25 2024-04-30 武汉百智诚远科技有限公司 一种基于人工智能算法的法律知识增强检索系统及方法

Also Published As

Publication number Publication date
WO2021164226A1 (zh) 2021-08-26

Similar Documents

Publication Publication Date Title
CN111291161A (zh) 法律案件知识图谱查询方法、装置、设备及存储介质
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
US20180032930A1 (en) System and method to Generate Queries for a Business Database
US10289717B2 (en) Semantic search apparatus and method using mobile terminal
US9280535B2 (en) Natural language querying with cascaded conditional random fields
US20170308607A1 (en) Method and System for a Semantic Search Engine
WO2014033799A1 (ja) 単語意味関係抽出装置
US20150120738A1 (en) System and method for document classification based on semantic analysis of the document
CN110097278B (zh) 一种科技资源智能共享融合训练系统和应用系统
CN108922633A (zh) 一种疾病名称标准化规范方法及规范系统
CN117290489B (zh) 一种行业问答知识库快速构建方法与系统
CN102622453A (zh) 基于本体的食品安全事件语义检索系统
CN102609512A (zh) 异构信息知识挖掘与可视化分析系统及方法
CN107562919B (zh) 一种基于信息检索的多索引集成软件构件检索方法及系统
CN105760462B (zh) 基于关联数据查询的人机交互方法及装置
WO2020258303A1 (zh) 语义模型实例化方法、系统和装置
CN116501875B (zh) 一种基于自然语言和知识图谱的文档处理方法和系统
Han et al. Text Summarization Using FrameNet‐Based Semantic Graph Model
CN113641833B (zh) 服务需求匹配方法及装置
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
JP2016192202A (ja) 照合処理システム、方法、及びプログラム
CN112486919A (zh) 文档管理方法、系统及存储介质
CN114997288A (zh) 一种设计资源关联方法
Prudhomme et al. Automatic Integration of Spatial Data into the Semantic Web.
CN114491079A (zh) 知识图谱构建和查询方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40030820

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination