CN107908671A - 基于法律数据的知识图谱构建方法及系统 - Google Patents

基于法律数据的知识图谱构建方法及系统 Download PDF

Info

Publication number
CN107908671A
CN107908671A CN201711006520.3A CN201711006520A CN107908671A CN 107908671 A CN107908671 A CN 107908671A CN 201711006520 A CN201711006520 A CN 201711006520A CN 107908671 A CN107908671 A CN 107908671A
Authority
CN
China
Prior art keywords
law
mrow
legal
knowledge
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711006520.3A
Other languages
English (en)
Other versions
CN107908671B (zh
Inventor
杜向阳
梁雁圆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Shield Mdt Infotech Ltd
Original Assignee
Nanjing Shield Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Shield Mdt Infotech Ltd filed Critical Nanjing Shield Mdt Infotech Ltd
Priority to CN201711006520.3A priority Critical patent/CN107908671B/zh
Publication of CN107908671A publication Critical patent/CN107908671A/zh
Application granted granted Critical
Publication of CN107908671B publication Critical patent/CN107908671B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents

Abstract

本发明提供了基于法律数据的知识图谱构建方法及系统,方法包括:构建法律词典步骤,提取法律短语步骤,预处理法律文本步骤,初步构建法律知识步骤,识别法律实体步骤,识别法律关系步骤,构造法律知识链步骤;系统包括法律基础词典构建模块、法律基础知识库构建模块、法律实体自动识别模块、法律关系自动识别模块、法律知识链自动生成模块。本发明实现了针对法律数据构建知识图谱,能够在多个法律案由,如离婚纠纷、合同纠纷和机动车交通事故责任纠纷等案由数据构建知识图谱,为法律行业的上层应用提供了走向智能化的数据。

Description

基于法律数据的知识图谱构建方法及系统
技术领域
本发明属于数据处理技术领域,涉及一种法律数据的知识图谱构建方法及能够实现该方法的系统。
背景技术
人工智能正在我们人类的生活中发挥越来越重要的价值——它们正在接管我们的工作、帮助我们更高效更安全地生产、甚至改变我们生存与存在的方式。2010年以来,人工智能技术陆续在谷歌、Facebook、百度等顶尖互联网公司获得广泛应用;2016年,谷歌的战略重心从“移动先行”全面转向“人工智能先行”;根据埃森哲预测,到2035年时,人工智能可将12个发达经济体的年经济增长率提升一倍;2016年下半年,美国白宫科技政策办公室连续发布人工智能战略规划和研究报告,呼吁美国政府关注人工智能相关的科研、教育、产业发展及可能引发的就业和经济问题。2017年3月,人工智能首次写入我国的政府工作报告。人工智能技术将走出实验室,与相关产业进行更紧密衔接。而法律行业是人工智能应用的最热门领域之一。
人工智能和法律的结合是法律行业发展的必然方向,重点是根据相关技术方法建立基于法律知识和案例的推理模型或知识系统等应用。法律人工智能的核心难点在于如何让计算机表示和理解法律知识,知识图谱是解决这个难题的技术,它是机器大脑中的知识库。同时,法律知识图谱是人类和机器的桥梁,描述了法律客观世界的概念、实体、事件及其之间的关系,是法律知识人机交互的基础。
谷歌于2012年5月推出谷歌知识图谱,并利用其在搜索引擎中增强搜索结果,标志着大规模知识图谱在互联网语义搜索中的成功应用。在研究领域,知识图谱也取得了显著的成果,主要是根据FreeBase或ConceptNet5等已有的数据,推动了研究的发展。然而在法律行业,尚未出现基于法律知识图谱较成功的应用,原因在于真实的法律知识图谱构建的难度。主要存在的问题包括:
1)数据孤岛问题,法律行业在互联网的背景下也呈现出了大数据的特点,相关的法律数据包括法律法规、司法解释、裁判文书等。而各个数据往往都各自存储,各自定义,数据之间无法联动,彼此无法兼容。
2)知识缺失问题,法律行业的数据仍然是以非结构化的文本为主,缺乏具有知识结构且计算机能够理解的知识数据。
3)认知鸿沟问题,法律知识图谱不等同于传统的知识图谱,普通的知识图谱的构建方法对法律数据不完全适应,法律实体和法律关系都需要法律专家的介入,对实体和关系做法律上的专业定义。
4)构建体系问题,法律知识图谱没有一个统一规范的构建流程和体系,缺乏自动化的辅助工具。
因此目前尚无技术能够实现法律知识图谱的构建。
发明内容
为解决上述问题,本发明在深入研究法律知识图谱相关理论和技术的基础上,提出了一种融合法律专家知识和人工智能技术的法律知识图谱构建方法及系统,以解决现有技术中构建法律知识图谱方法中,所具有的词汇歧义、关联查询、数据集成、知识推理等问题,填补了针对法律数据自动化构建知识图谱的空白。为了达到上述目的,本发明提供如下技术方案:
基于法律数据的知识图谱构建方法,包括如下步骤:
步骤1,构建法律词典
首先下载以及人工标注法律种子词库,同时训练法律文本语料得到法律词向量;然后计算与词向量相似的候选法律词,计算相似度公式为:其中W1,W2为法律词汇的词向量;最后筛选有效的候选法律词;
步骤2,提取法律短语
通过互信息和信息熵分别提取组合词语,综合这两种方式计算的分数,使用加权平均的方式做排序筛序出短语候选组;
其中,
互信息计算公式为:X和Y为法律词,P(X,Y)为X和Y的联合概率,P(X)、P(Y)分别为X和Y的概率;
信息熵具体计算公式如下:
步骤3,预处理法律文本
将步骤1、步骤2中构建的法律词典、法律短语作为分词工具的扩展词,对原始法律文本数据进行分词、词性标注、句法分析,完成法律语料文本的预处理;
步骤4,初步构建法律知识
定义法律知识图谱中法律实体、法律关系、三元组、概念层次图及其他相关概念,标注相关的法律数据语料;
步骤5,识别法律实体
对已标注的法律文本数据,进行实体特征的抽取,并将抽取的特征通过模型计算,实现法律实体自动识别,模型计算过程如下:
句子沿着标签的路径,计算出概率转移矩阵和网络的分数表示为:
齐总,为模型的输入层,即输入的句子表示;[h(θ)]i,t为句子的第i个标签的第t个词;[P]i,j为转移概率矩阵表示对于一对连续的时间步长从第i个状态转换到第j个状态的转变矩阵;神经网络可训练的参数记为θ;模型所有参数可表示为
步骤6、识别法律关系
对法律专家标注的法律文本数据,使用法律关系规则模板,从文本中学习法律文本的关系表达式,采用机器学习方法发现法律关系;
步骤7、构造法律知识链
基于原始法律文本,采用步骤5和步骤6识别到的法律实体和法律关系,使用基于法律实体词和法律关系的法律事理图谱推理引擎来识别法律知识链。
进一步的,所述步骤6包括如下具体过程:
6.1、抽取法律文本的依存句法特征,制定关系抽取模板;
6.2、对法律语料进行预处理,进行语义特征、关系类别特征的抽取;
6.3、将抽取得到的特征值代入到关系抽取模型进行关系抽取;
6.4、将6.3抽取得到的关系做为候选关系组,并将候选关系组做类型过滤。
本发明还提供了基于法律数据的知识图谱构建系统,包括:法律基础词典构建模块、法律基础知识库构建模块、法律实体自动识别模块、法律关系自动识别模块、法律知识链自动生成模块;
所述法律基础词典构建模块用于构建和扩充法律基础词典;所述法律基础知识库构建模块用于构建法律专家知识库,制定法律专家知识模板;所述法律实体自动识别模块用于自动识别法律文本的法律实体,并向法律知识链自动生成模块推送法律实体;法律关系自动识别模块用于自动识别法律文本的法律关系,并向法律知识链自动生成模块推送推送法律关系;法律知识链自动生成模块用于通过法律实体自动识别模块和法律关系自动识别模块推送的实体和关系,生成候选知识链。
进一步的,还包括法律知识图谱应用服务模块,其用于提供系统中的应用接口。
与现有技术相比,本发明具有如下优点和有益效果:
本发明提供的方法及系统实现了针对法律数据构建知识图谱,通过本发明能够在多个法律案由,如离婚纠纷、合同纠纷和机动车交通事故责任纠纷等案由数据构建知识图谱,为法律行业的上层应用提供了走向智能化的数据。本发明将法律专家知识和深度学习相结合,实现了对海量法律数据的自动化识别、抽取和集成,节省了大量的人力物力。同时使得构建出来的法律知识图谱更符合人对法律的理解。
附图说明
图1为知识图谱的构建体系示意图。
图2为法律词典构建流程示意图。
图3为法律实体识别模型展开结构示意图。
图4为法律关系识别模型流程示意图。
图5为基于法律数据的知识图谱构建系统结构示意图。
具体实施方式
以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
本发明提出了法律知识图谱构建的体系,通过法律专家知识定义法律实体、法律关系和法律知识链,解决法律知识图谱在计算机中定义问题,解决认知的问题;通过多项自然语言处理技术构建了自动化的工具,提取法律文本中图谱内容。
本发明中法律知识图谱主要由法律实体库,法律关系库和法律知识库构成,如要构建知识图谱需要实现法律实体预识别、法律关系预识别、法律知识库构造。
法律实体预识别:在法律文本集中,通过机器学习算法结合自定义的专家法律知识,提出备选法律实体。提取法律实体的特征,建立评估函数,对备选的法律实体打分,然后输出法律实体,存入实体库。
法律关系预识别:将法律文本经过预处理,生成多条知识文本,识别出该文本中所包含的实体,然后对其作词性标注、句法分析等处理,提取出实体对应的关系,存入实体库。
法律知识库构造:输入知识文本,匹配出实体和关系,组织构造成知识链,然后存入知识库。
更为具体的说,本发明提供的法律数据的知识图谱构建方法,包括如下步骤:
步骤1,法律词典的构建。
本步骤构建流程如图2所示,首先下载以及人工标注法律种子词库,同时训练法律文本语料得到法律词向量;然后计算与词向量相似的候选法律词;最后筛选候选法律词是否有效。计算相似度公式为:其中W1,W2为法律词汇的词向量。
步骤2,法律短语的提取。
计算方式有两种:
1、利用互信息提取组合词语,互信息计算公式为:X和Y为法律词,P(X,Y)为X和Y的联合概率,P(X)、P(Y)为X和Y的概率;,其中互信息值越高,表明X和Y的相关性越高,则表示X和Y组成短语的可能性就越大。例如:借贷双方=借贷+双方。
2、利用信息熵来提取组合词语,左右熵的具体计算公式如下:
其中,EL(W)、ER(W)分别是当前词的左熵和右熵,P(aW|W)为当前词左边出现词的条件概率,P(Wb|W)为当前词右边出现词的条件概率。左右熵值越大,表明词语组合成短语的可能性就越大。
本发明综合排序上述两种计算方法,综合这两种方式计算的分数,使用加权平均的方式做排序筛序出短语候选组。
步骤3,法律文本的预处理。将步骤1、步骤2中构建的法律词典、法律短语作为分词工具的扩展词,对原始法律文本数据进行分词、词性标注、句法分析等,完成法律语料文本的预处理工作。
步骤4,法律知识的初步构建。该步骤也是法律知识图谱构建的基础工作,主要法律专家标注或众包标注的形式来完成,具体包括以下子步骤:
4.1、法律知识图谱相关概念的定义,由法律专家对法律实体、法律关系、三元组、概念层次图等相关概念作法律上的专业定义。
4.2、在步骤3的基础上标注一定量的法律数据,主要由法律专家标注或者使用众包技术来标注特定需求的法律数据语料。
步骤5,法律实体识别。
对步骤4已标注的法律文本数据,进行实体特征的抽取(如:语法特征、实体上下文特征、实体词向量特征等),并将抽取的特征用于法律实体识别模型的输入,从而实现法律实体自动识别。法律实体识别模型结构包括输入层、隐藏层、输出层,模型的展开结构如图3所示,通过该隐藏层能够根据历史信息的标签来预测当前的标签。其LE为法律实体(legalentity,LE),BIEO分别为实体词的开始,中间、结尾和非实体词构成部分,模型计算过程如下:
句子沿着标签的路径,计算出概率转移矩阵和网络的分数表示为:
上述模型中为模型的输入层,即输入的句子表示;[h(θ)]i,t为句子的第i个标签的第t个词;[P]i,j为转移概率矩阵表示对于一对连续的时间步长从第i个状态转换到第j个状态的转变矩阵;神经网络可训练的参数记为θ;模型所有参数可表示为
步骤6、法律关系识别。对法律专家标注的法律文本数据,使用步骤4.1中定义的法律关系规则模板,从文本中学习法律文本的关系表达式,结合机器学习方法来实现法律关系自动发现。其识别过程如图4所示,包括如下过程:
6.1、抽取法律文本的依存句法特征,制定关系抽取模板。如:并列关系COO结构模板(实体1,并列关系词(和、与等),实体2)、主谓关系SBV结构模板(实体1,能动关系词(导致、申请等),实体2)等。
6.2、对法律语料进行预处理,进行语义特征、关系类别特征的抽取。
6.3、将抽取得到的特征值代入到关系抽取模型(如:BootStrapping方法)进行关系抽取。
6.4、将6.3抽取得到的关系做为候选关系组,并将候选关系组做类型过滤。
步骤7、法律知识链构造。原始法律文本经过步骤5和步骤6识别到的法律实体和法律关系,使用基于法律实体词和法律关系的法律事理图谱推理引擎来识别法律知识链,完成法律知识链的构造。例如:a、感情破裂并且调解无效准予离婚;b、管理人知道驾驶人不能驾驶机动车认定有过错承担赔偿责任;c、贷款人未按约提供借款承担赔偿损失。
本发明还公开了一种基于法律知识的知识图谱构建系统,如图5所示,该系统包括:法律基础词典构建模块、法律基础知识库构建模块、法律实体自动识别模块、法律关系自动识别模块、法律知识链自动生成模块和法律知识图谱应用服务模块。
其中:法律基础词典构建模块,用于构建和扩充法律基础词典,实现上述步骤1-3功能;法律基础知识库构建模块,用于构建法律专家知识库,制定法律专家知识模板,实现上述步骤4功能;法律实体自动识别模块用于自动识别法律文本的法律实体,实现上述步骤5功能,并向法律知识链自动生成模块推送法律实体;法律关系自动识别模块用于自动识别法律文本的法律关系,实现上述步骤6功能,并向法律知识链自动生成模块推送推送法律关系;法律知识链自动生成模块,用于通过法律实体自动识别模块和法律关系自动识别模块推送的实体和关系,生成候选知识链,实现上述步骤7功能;法律知识图谱应用服务模块用于提供知识图谱上的应用接口,例如法律实体识别接口、法律关系识别接口、法律路径逻辑推理接口,该接口模块在某些应用场景下可以省略,并非必需。
基于上述方法和系统,本发明能够针对法律数据构建知识图谱,并能够在法律问答、法律知识智能检索、案例智能检索等应用中起到重要支撑作用。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (4)

1.基于法律数据的知识图谱构建方法,其特征在于,包括如下步骤:
步骤1,构建法律词典
首先下载以及人工标注法律种子词库,同时训练法律文本语料得到法律词向量;然后计算与词向量相似的候选法律词,计算相似度公式为:其中W1,W2为法律词汇的词向量;最后筛选有效的候选法律词;
步骤2,提取法律短语
通过互信息和信息熵分别提取组合词语,综合这两种方式计算的分数,使用加权平均的方式做排序筛序出短语候选组;
其中,
互信息计算公式为:X和Y为两个法律词,P(X,Y)为X和Y的联合概率,P(X)、P(Y)为X和Y的概率;
信息熵具体计算公式如下:
<mrow> <msub> <mi>E</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mo>&amp;ForAll;</mo> <mi>a</mi> <mo>&amp;Element;</mo> <mi>A</mi> </mrow> </munder> <mi>P</mi> <mrow> <mo>(</mo> <mi>a</mi> <mi>W</mi> <mo>|</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>&amp;CenterDot;</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>a</mi> <mi>W</mi> <mo>|</mo> <mi>W</mi> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>E</mi> <mi>R</mi> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mo>&amp;ForAll;</mo> <mi>b</mi> <mo>&amp;Element;</mo> <mi>B</mi> </mrow> </munder> <mi>P</mi> <mrow> <mo>(</mo> <mi>W</mi> <mi>b</mi> <mo>|</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>&amp;CenterDot;</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>W</mi> <mi>b</mi> <mo>|</mo> <mi>W</mi> <mo>)</mo> </mrow> </mrow>
步骤3,预处理法律文本
将步骤1、步骤2中构建的法律词典、法律短语作为分词工具的扩展词,对原始法律文本数据进行分词、词性标注、句法分析,完成法律语料文本的预处理;
步骤4,初步构建法律知识
定义法律知识图谱中法律实体、法律关系、三元组、概念层次图及其他相关概念,标注相关的法律数据语料;
步骤5,识别法律实体
对已标注的法律文本数据,进行实体特征的抽取,并将抽取的特征通过模型计算,实现法律实体自动识别,模型计算过程如下:
句子沿着标签的路径,计算出概率转移矩阵和网络的分数表示为:
<mrow> <mi>s</mi> <mrow> <mo>(</mo> <msubsup> <mrow> <mo>&amp;lsqb;</mo> <mi>X</mi> <mo>&amp;rsqb;</mo> </mrow> <mn>1</mn> <mi>T</mi> </msubsup> <mo>,</mo> <msubsup> <mrow> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow> <mn>1</mn> <mi>T</mi> </msubsup> <mo>,</mo> <mover> <mi>&amp;theta;</mi> <mo>~</mo> </mover> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>T</mi> </munderover> <mrow> <mo>(</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>h</mi> <mrow> <mo>(</mo> <mi>&amp;theta;</mi> <mo>)</mo> </mrow> </msub> <mo>&amp;rsqb;</mo> </mrow> <mrow> <msub> <mrow> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow> <mi>t</mi> </msub> <mo>,</mo> <mi>t</mi> </mrow> </msub> <mo>+</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <mi>P</mi> <mo>&amp;rsqb;</mo> </mrow> <mrow> <msub> <mrow> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow> <mi>t</mi> </msub> </mrow> </msub> <mo>)</mo> </mrow> </mrow>
其中,为模型的输入层,即输入的句子表示;[h(θ)]i,t为句子的第i个标签的第t个词;[P]i,j为转移概率矩阵表示对于一对连续的时间步长从第i个状态转换到第j个状态的转变矩阵;神经网络可训练的参数记为θ;模型所有参数可表示为
步骤6、识别法律关系
对法律专家标注的法律文本数据,使用法律关系规则模板,从文本中学习法律文本的关系表达式,采用机器学习与模板规则结合的方法提取法律关系;
步骤7、构造法律知识链
基于原始法律文本,采用步骤5和步骤6识别到的法律实体和法律关系,使用基于法律实体词和法律关系的法律事理图谱推理引擎来识别法律知识链。
2.根据权利要求1所述的基于法律数据的知识图谱构建方法,其特征在于,所述步骤6包括如下具体过程:
6.1、抽取法律文本的依存句法特征,制定关系抽取模板;
6.2、对法律语料进行预处理,进行语义特征、关系类别特征的抽取;
6.3、将抽取得到的特征值代入到关系抽取模型进行关系抽取;
6.4、将6.3抽取得到的关系做为候选关系组,并将候选关系组做类型过滤。
3.基于法律数据的知识图谱构建系统,其特征在于,包括:法律基础词典构建模块、法律基础知识库构建模块、法律实体自动识别模块、法律关系自动识别模块、法律知识链自动生成模块;
所述法律基础词典构建模块用于构建和扩充法律基础词典;所述法律基础知识库构建模块用于构建法律专家知识库,制定法律专家知识模板;所述法律实体自动识别模块用于自动识别法律文本的法律实体,并向法律知识链自动生成模块推送法律实体;法律关系自动识别模块用于自动识别法律文本的法律关系,并向法律知识链自动生成模块推送推送法律关系;法律知识链自动生成模块用于通过法律实体自动识别模块和法律关系自动识别模块推送的实体和关系,生成候选知识链。
4.根据权利要求3所述的基于法律数据的知识图谱构建系统,其特征在于,还包括法律知识图谱应用服务模块,其用于提供系统中的应用接口。
CN201711006520.3A 2017-10-25 2017-10-25 基于法律数据的知识图谱构建方法及系统 Active CN107908671B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711006520.3A CN107908671B (zh) 2017-10-25 2017-10-25 基于法律数据的知识图谱构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711006520.3A CN107908671B (zh) 2017-10-25 2017-10-25 基于法律数据的知识图谱构建方法及系统

Publications (2)

Publication Number Publication Date
CN107908671A true CN107908671A (zh) 2018-04-13
CN107908671B CN107908671B (zh) 2022-02-01

Family

ID=61841802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711006520.3A Active CN107908671B (zh) 2017-10-25 2017-10-25 基于法律数据的知识图谱构建方法及系统

Country Status (1)

Country Link
CN (1) CN107908671B (zh)

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921739A (zh) * 2018-08-06 2018-11-30 四川工商学院 一种基于大数据的立法智能分析平台
CN109101495A (zh) * 2018-08-27 2018-12-28 上海宝尊电子商务有限公司 一种基于图像识别和知识图谱的时尚领域文本生成方法
CN109165281A (zh) * 2018-07-20 2019-01-08 吴怡 一种基于语义网的多机器人终端共享式法律咨询系统
CN109284396A (zh) * 2018-09-27 2019-01-29 北京大学深圳研究生院 医学知识图谱构建方法、装置、服务器及存储介质
CN109597895A (zh) * 2018-11-09 2019-04-09 中电科大数据研究院有限公司 一种基于知识图谱的公文搜索方法
CN109656385A (zh) * 2018-12-28 2019-04-19 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109670050A (zh) * 2018-12-12 2019-04-23 科大讯飞股份有限公司 一种实体关系预测方法及装置
CN109977237A (zh) * 2019-05-27 2019-07-05 南京擎盾信息科技有限公司 一种面向法律领域的动态法律事件图谱构建方法
CN110008327A (zh) * 2019-04-01 2019-07-12 河北省讯飞人工智能研究院 法律回答生成方法及装置
CN110046262A (zh) * 2019-06-10 2019-07-23 南京擎盾信息科技有限公司 一种基于法律专家知识库的上下文推理方法
CN110059193A (zh) * 2019-06-21 2019-07-26 南京擎盾信息科技有限公司 基于法律语义件与文书大数据统计分析的法律咨询系统
CN110069763A (zh) * 2019-03-16 2019-07-30 平安科技(深圳)有限公司 合同文本定制方法、装置、设备及可读存储介质
CN110188346A (zh) * 2019-04-29 2019-08-30 浙江工业大学 一种基于信息抽取的网络安全法案件智能研判方法
CN110263177A (zh) * 2019-05-23 2019-09-20 广州市香港科大霍英东研究院 用于事件预测的知识图构建方法与事件预测方法
CN110414007A (zh) * 2019-08-02 2019-11-05 南京擎盾信息科技有限公司 一种基于法理图规则引擎的法律概念识别方法
CN110472061A (zh) * 2019-07-08 2019-11-19 郑州大学 一种基于短文本相似度计算的知识图谱融合方法
CN110609902A (zh) * 2018-05-28 2019-12-24 华为技术有限公司 一种基于融合知识图谱的文本处理方法及装置
CN110765257A (zh) * 2019-12-30 2020-02-07 杭州识度科技有限公司 一种知识图谱驱动型的法律智能咨询系统
CN110795926A (zh) * 2020-01-03 2020-02-14 四川大学 一种基于法律知识图谱的裁判文书相似性判断方法及系统
CN110837563A (zh) * 2018-08-17 2020-02-25 阿里巴巴集团控股有限公司 案件的裁判方法、装置和系统
CN110895568A (zh) * 2018-09-13 2020-03-20 阿里巴巴集团控股有限公司 处理庭审记录的方法和系统
CN111026880A (zh) * 2019-12-08 2020-04-17 大连理工大学 基于联合学习的司法知识图谱构建方法
CN111061882A (zh) * 2019-08-19 2020-04-24 广州利科科技有限公司 一种知识图谱构建方法
CN111324740A (zh) * 2018-12-13 2020-06-23 阿里巴巴集团控股有限公司 纠纷事件的识别方法、识别装置和识别系统
CN111368095A (zh) * 2020-02-28 2020-07-03 河海大学 基于水利知识-事理耦合网络的决策支持系统架构与方法
CN111368094A (zh) * 2020-02-27 2020-07-03 沈阳东软熙康医疗系统有限公司 实体知识图谱建立、属性信息获取、门诊分诊方法及装置
CN111507095A (zh) * 2019-01-29 2020-08-07 阿里巴巴集团控股有限公司 裁判文书的生成方法、装置、存储介质和处理器
CN111597350A (zh) * 2020-04-30 2020-08-28 西安理工大学 基于深度学习的轨道交通事件知识图谱构建方法
CN111625653A (zh) * 2019-02-26 2020-09-04 广州慧睿思通信息科技有限公司 法律数据处理方法、装置、计算机设备和存储介质
CN111898361A (zh) * 2020-07-14 2020-11-06 南京擎盾信息科技有限公司 法律文本解析方法、装置、设备和存储介质
CN111897959A (zh) * 2020-07-17 2020-11-06 南京擎盾信息科技有限公司 动态法律事件内的推理方法、装置、设备和存储介质
CN111930959A (zh) * 2020-07-14 2020-11-13 上海明略人工智能(集团)有限公司 用于图谱知识生成文本的方法与装置
CN111950278A (zh) * 2019-05-14 2020-11-17 株式会社理光 一种序列标注方法、装置及计算机可读存储介质
CN112199960A (zh) * 2020-11-12 2021-01-08 北京三维天地科技股份有限公司 一种标准知识元粒度解析系统
WO2021036181A1 (zh) * 2019-08-26 2021-03-04 北京国双科技有限公司 一种数据抽取方法、装置、存储介质及设备
WO2021063077A1 (zh) * 2019-09-30 2021-04-08 北京国双科技有限公司 一种基于笔录的图谱的构建方法及装置、存储介质、设备
CN112632223A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 案事件知识图谱构建方法及相关设备
CN112632225A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN113032359A (zh) * 2021-01-29 2021-06-25 厦门市法度信息科技有限公司 一种智能办案辅助系统及方法
CN114547257A (zh) * 2022-04-25 2022-05-27 湖南工商大学 类案匹配方法、装置、计算机设备及存储介质
CN114707004A (zh) * 2022-05-24 2022-07-05 国网浙江省电力有限公司信息通信分公司 基于图像模型和语言模型的事理关系抽取处理方法及系统
CN115203439B (zh) * 2022-09-15 2022-11-29 天津市道本科技有限公司 用于合规监管的知识图谱的构建方法、相关方法和系统
CN115495507A (zh) * 2022-11-17 2022-12-20 江苏鸿程大数据技术与应用研究院有限公司 一种工程材料信息价格匹配方法、系统及存储介质
CN117251685A (zh) * 2023-11-20 2023-12-19 中电科大数据研究院有限公司 一种基于知识图谱的标准化政务数据构建方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050197992A1 (en) * 2004-03-03 2005-09-08 The Boeing Company System, method, and computer program product for combination of cognitive causal models with reasoning and text processing for knowledge driven decision support
CN102624782A (zh) * 2011-10-31 2012-08-01 李宗诚 互联网ich / ict 信息融合基础
CN104598535A (zh) * 2014-12-29 2015-05-06 中国科学院计算机网络信息中心 一种基于最大熵的事件抽取方法
CN106156365A (zh) * 2016-08-03 2016-11-23 北京智能管家科技有限公司 一种知识图谱的生成方法及装置
CN106815293A (zh) * 2016-12-08 2017-06-09 中国电子科技集团公司第三十二研究所 一种面向情报分析的构建知识图谱的系统及方法
CN107122444A (zh) * 2017-04-24 2017-09-01 北京科技大学 一种法律知识图谱自动构建方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050197992A1 (en) * 2004-03-03 2005-09-08 The Boeing Company System, method, and computer program product for combination of cognitive causal models with reasoning and text processing for knowledge driven decision support
CN102624782A (zh) * 2011-10-31 2012-08-01 李宗诚 互联网ich / ict 信息融合基础
CN104598535A (zh) * 2014-12-29 2015-05-06 中国科学院计算机网络信息中心 一种基于最大熵的事件抽取方法
CN106156365A (zh) * 2016-08-03 2016-11-23 北京智能管家科技有限公司 一种知识图谱的生成方法及装置
CN106815293A (zh) * 2016-12-08 2017-06-09 中国电子科技集团公司第三十二研究所 一种面向情报分析的构建知识图谱的系统及方法
CN107122444A (zh) * 2017-04-24 2017-09-01 北京科技大学 一种法律知识图谱自动构建方法

Cited By (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609902A (zh) * 2018-05-28 2019-12-24 华为技术有限公司 一种基于融合知识图谱的文本处理方法及装置
CN110609902B (zh) * 2018-05-28 2021-10-22 华为技术有限公司 一种基于融合知识图谱的文本处理方法及装置
CN109165281A (zh) * 2018-07-20 2019-01-08 吴怡 一种基于语义网的多机器人终端共享式法律咨询系统
CN108921739A (zh) * 2018-08-06 2018-11-30 四川工商学院 一种基于大数据的立法智能分析平台
CN110837563A (zh) * 2018-08-17 2020-02-25 阿里巴巴集团控股有限公司 案件的裁判方法、装置和系统
CN110837563B (zh) * 2018-08-17 2023-05-30 阿里巴巴集团控股有限公司 案件的裁判方法、装置和系统
CN109101495A (zh) * 2018-08-27 2018-12-28 上海宝尊电子商务有限公司 一种基于图像识别和知识图谱的时尚领域文本生成方法
CN110895568A (zh) * 2018-09-13 2020-03-20 阿里巴巴集团控股有限公司 处理庭审记录的方法和系统
CN110895568B (zh) * 2018-09-13 2023-07-21 阿里巴巴集团控股有限公司 处理庭审记录的方法和系统
CN109284396A (zh) * 2018-09-27 2019-01-29 北京大学深圳研究生院 医学知识图谱构建方法、装置、服务器及存储介质
CN109597895A (zh) * 2018-11-09 2019-04-09 中电科大数据研究院有限公司 一种基于知识图谱的公文搜索方法
CN109597895B (zh) * 2018-11-09 2021-10-22 中电科大数据研究院有限公司 一种基于知识图谱的公文搜索方法
CN109670050A (zh) * 2018-12-12 2019-04-23 科大讯飞股份有限公司 一种实体关系预测方法及装置
CN111324740B (zh) * 2018-12-13 2023-05-02 阿里巴巴集团控股有限公司 纠纷事件的识别方法、识别装置和识别系统
CN111324740A (zh) * 2018-12-13 2020-06-23 阿里巴巴集团控股有限公司 纠纷事件的识别方法、识别装置和识别系统
CN109656385B (zh) * 2018-12-28 2022-12-09 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109656385A (zh) * 2018-12-28 2019-04-19 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN111507095B (zh) * 2019-01-29 2023-05-02 阿里云计算有限公司 裁判文书的生成方法、装置、存储介质和处理器
CN111507095A (zh) * 2019-01-29 2020-08-07 阿里巴巴集团控股有限公司 裁判文书的生成方法、装置、存储介质和处理器
CN111625653A (zh) * 2019-02-26 2020-09-04 广州慧睿思通信息科技有限公司 法律数据处理方法、装置、计算机设备和存储介质
CN110069763A (zh) * 2019-03-16 2019-07-30 平安科技(深圳)有限公司 合同文本定制方法、装置、设备及可读存储介质
CN110008327B (zh) * 2019-04-01 2022-01-14 河北省讯飞人工智能研究院 法律回答生成方法及装置
CN110008327A (zh) * 2019-04-01 2019-07-12 河北省讯飞人工智能研究院 法律回答生成方法及装置
CN110188346B (zh) * 2019-04-29 2023-09-29 浙江工业大学 一种基于信息抽取的网络安全法案件智能研判方法
CN110188346A (zh) * 2019-04-29 2019-08-30 浙江工业大学 一种基于信息抽取的网络安全法案件智能研判方法
CN111950278A (zh) * 2019-05-14 2020-11-17 株式会社理光 一种序列标注方法、装置及计算机可读存储介质
CN110263177A (zh) * 2019-05-23 2019-09-20 广州市香港科大霍英东研究院 用于事件预测的知识图构建方法与事件预测方法
CN109977237A (zh) * 2019-05-27 2019-07-05 南京擎盾信息科技有限公司 一种面向法律领域的动态法律事件图谱构建方法
CN110046262A (zh) * 2019-06-10 2019-07-23 南京擎盾信息科技有限公司 一种基于法律专家知识库的上下文推理方法
CN110046262B (zh) * 2019-06-10 2021-03-12 南京擎盾信息科技有限公司 一种基于法律专家知识库的上下文推理方法
CN110059193A (zh) * 2019-06-21 2019-07-26 南京擎盾信息科技有限公司 基于法律语义件与文书大数据统计分析的法律咨询系统
CN110472061A (zh) * 2019-07-08 2019-11-19 郑州大学 一种基于短文本相似度计算的知识图谱融合方法
CN110414007A (zh) * 2019-08-02 2019-11-05 南京擎盾信息科技有限公司 一种基于法理图规则引擎的法律概念识别方法
CN111061882A (zh) * 2019-08-19 2020-04-24 广州利科科技有限公司 一种知识图谱构建方法
WO2021036181A1 (zh) * 2019-08-26 2021-03-04 北京国双科技有限公司 一种数据抽取方法、装置、存储介质及设备
WO2021063077A1 (zh) * 2019-09-30 2021-04-08 北京国双科技有限公司 一种基于笔录的图谱的构建方法及装置、存储介质、设备
CN111026880A (zh) * 2019-12-08 2020-04-17 大连理工大学 基于联合学习的司法知识图谱构建方法
CN110765257B (zh) * 2019-12-30 2020-03-31 杭州识度科技有限公司 一种知识图谱驱动型的法律智能咨询系统
CN110765257A (zh) * 2019-12-30 2020-02-07 杭州识度科技有限公司 一种知识图谱驱动型的法律智能咨询系统
CN110795926A (zh) * 2020-01-03 2020-02-14 四川大学 一种基于法律知识图谱的裁判文书相似性判断方法及系统
CN110795926B (zh) * 2020-01-03 2020-04-07 四川大学 一种基于法律知识图谱的裁判文书相似性判断方法及系统
CN111368094A (zh) * 2020-02-27 2020-07-03 沈阳东软熙康医疗系统有限公司 实体知识图谱建立、属性信息获取、门诊分诊方法及装置
CN111368094B (zh) * 2020-02-27 2024-03-26 沈阳东软熙康医疗系统有限公司 实体知识图谱建立、属性信息获取、门诊分诊方法及装置
CN111368095B (zh) * 2020-02-28 2022-08-26 河海大学 基于水利知识-事理耦合网络的决策支持系统架构与方法
CN111368095A (zh) * 2020-02-28 2020-07-03 河海大学 基于水利知识-事理耦合网络的决策支持系统架构与方法
CN111597350A (zh) * 2020-04-30 2020-08-28 西安理工大学 基于深度学习的轨道交通事件知识图谱构建方法
CN111930959A (zh) * 2020-07-14 2020-11-13 上海明略人工智能(集团)有限公司 用于图谱知识生成文本的方法与装置
CN111898361A (zh) * 2020-07-14 2020-11-06 南京擎盾信息科技有限公司 法律文本解析方法、装置、设备和存储介质
CN111930959B (zh) * 2020-07-14 2024-02-09 上海明略人工智能(集团)有限公司 用于图谱知识生成文本的方法与装置
CN111897959A (zh) * 2020-07-17 2020-11-06 南京擎盾信息科技有限公司 动态法律事件内的推理方法、装置、设备和存储介质
CN112199960B (zh) * 2020-11-12 2021-05-25 北京三维天地科技股份有限公司 一种标准知识元粒度解析系统
CN112199960A (zh) * 2020-11-12 2021-01-08 北京三维天地科技股份有限公司 一种标准知识元粒度解析系统
CN112632223B (zh) * 2020-12-29 2023-01-20 天津汇智星源信息技术有限公司 案事件知识图谱构建方法及相关设备
CN112632225A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN112632223A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 案事件知识图谱构建方法及相关设备
CN112632225B (zh) * 2020-12-29 2022-08-30 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN113032359A (zh) * 2021-01-29 2021-06-25 厦门市法度信息科技有限公司 一种智能办案辅助系统及方法
CN114547257B (zh) * 2022-04-25 2022-07-19 湖南工商大学 类案匹配方法、装置、计算机设备及存储介质
CN114547257A (zh) * 2022-04-25 2022-05-27 湖南工商大学 类案匹配方法、装置、计算机设备及存储介质
CN114707004B (zh) * 2022-05-24 2022-08-16 国网浙江省电力有限公司信息通信分公司 基于图像模型和语言模型的事理关系抽取处理方法及系统
CN114707004A (zh) * 2022-05-24 2022-07-05 国网浙江省电力有限公司信息通信分公司 基于图像模型和语言模型的事理关系抽取处理方法及系统
CN115203439B (zh) * 2022-09-15 2022-11-29 天津市道本科技有限公司 用于合规监管的知识图谱的构建方法、相关方法和系统
CN115495507B (zh) * 2022-11-17 2023-03-24 江苏鸿程大数据技术与应用研究院有限公司 一种工程材料信息价格匹配方法、系统及存储介质
CN115495507A (zh) * 2022-11-17 2022-12-20 江苏鸿程大数据技术与应用研究院有限公司 一种工程材料信息价格匹配方法、系统及存储介质
CN117251685B (zh) * 2023-11-20 2024-01-26 中电科大数据研究院有限公司 一种基于知识图谱的标准化政务数据构建方法和装置
CN117251685A (zh) * 2023-11-20 2023-12-19 中电科大数据研究院有限公司 一种基于知识图谱的标准化政务数据构建方法和装置

Also Published As

Publication number Publication date
CN107908671B (zh) 2022-02-01

Similar Documents

Publication Publication Date Title
CN107908671A (zh) 基于法律数据的知识图谱构建方法及系统
CN110633409B (zh) 一种融合规则与深度学习的汽车新闻事件抽取方法
CN106156003B (zh) 一种问答系统中的问句理解方法
CN107832400A (zh) 一种基于位置的lstm和cnn联合模型进行关系分类的方法
CN108197294A (zh) 一种基于深度学习的文本自动生成方法
CN111008293A (zh) 基于结构化语义表示的视觉问答方法
CN110298037A (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN102262634B (zh) 一种自动问答方法及系统
CN108829722A (zh) 一种远程监督的Dual-Attention关系分类方法及系统
CN107239446A (zh) 一种基于神经网络与注意力机制的情报关系提取方法
CN105631479A (zh) 基于非平衡学习的深度卷积网络图像标注方法及装置
Shi Knowledge graph question and answer system for mechanical intelligent manufacturing based on deep learning
CN109558492A (zh) 一种适于事件归因的上市公司知识图谱构建方法及装置
CN109710769A (zh) 一种基于胶囊网络的水军评论检测系统及方法
CN112417877A (zh) 一种基于改进bert的文本蕴含关系识别方法
CN108596470A (zh) 一种基于TensorFlow框架的电力设备缺陷文本处理方法
CN109597876A (zh) 一种基于强化学习的多轮对话答复选择模型及其方法
CN110489567A (zh) 一种基于跨网络特征映射的节点信息获取方法及其装置
CN107992941A (zh) 一种合同条款分类方法
CN110750635A (zh) 一种基于联合深度学习模型的法条推荐方法
CN107451230A (zh) 一种问答方法以及问答系统
CN107662617A (zh) 基于深度学习的车载交互控制算法
CN108846138A (zh) 一种融合答案信息的问题分类模型构建方法、装置和介质
CN109492230A (zh) 一种基于感兴趣文本域卷积神经网络提取保险合同关键信息的方法
CN107688576A (zh) 一种cnn‑svm模型的构建及倾向性分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant