WO2021073254A1

WO2021073254A1 - 基于知识图谱的实体链接方法、装置、设备和存储介质

Info

Publication number: WO2021073254A1
Application number: PCT/CN2020/111240
Authority: WO
Inventors: 陈晨; 雷骏峰; 刘嘉伟; 于修铭; 李可; 汪伟
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-10-18
Filing date: 2020-08-26
Publication date: 2021-04-22
Also published as: CN110929038A; CN110929038B

Abstract

一种基于知识图谱的实体链接方法、装置、设备和存储介质。该方法包括：对法律文本进行分词，得到分词结果，查找是否存在与分词结果相同的实体指代，若存在，则将实体指代放入实体指代集合中，将实体放入候选实体集合中；分别计算关联分数和相关分数，将关联分数与对应的各相关分数进行相加，得到目标函数；在实体指代集合中，以目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。通过计算实体指代的关联分数和候选实体间的相关分数，确定最终的实体指代，并将实体指代进行链接，避免法律文本中存在着同义词、一词多义现象。

Description

基于知识图谱的实体链接方法、装置、设备和存储介质

本申请要求于2019年10月18日提交中国专利局、申请号为201910992304.3、发明名称为“基于知识图谱的实体链接方法、装置、设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及大数据技术领域，尤其涉及一种基于知识图谱的实体链接方法、装置、设备和存储介质。

背景技术

知识图谱将互联网的信息表达成更接近人类认知世界的形式，提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力，同时也在智能问答、大数据分析与决策中显示出强大威力，已经成为互联网基于知识的智能服务的基础设施。知识图谱与大数据和深度学习一起，成为推动人工智能发展的核心驱动力之一。在知识图谱里，每个节点表示现实世界中存在的“实体”，每条边为实体与实体之间的“关系”，知识图谱是关系的最有效的表示方式。

构建法律知识图谱对整合法律知识、挖掘法律热点、对法律事件预测、构建法律领域专家系统等将起到重要作用。由于法律的知识体系非常复杂，是多种逻辑的结合。发明人发现，法律文书中存在这大量的实体，如原告、被告、争议焦点、事实要素、法律发条等，这些实体对于案件信息抽取、法律信息检索等环节非常重要，但中文语言中普遍存在着同义词、一词多义现象，因此如何利用合适的自然语言处理技术将法律文书中的实体找出，并链接到法律知识图谱中正确的实体上变得尤为重要。

发明内容

有鉴于此，有必要针对复杂的法律文书中的实体如何正确的链接到法律知识图谱中的问题，提供一种基于知识图谱的实体链接方法、装置、设备和存储介质。

一种基于知识图谱的实体链接方法，包括：

获取法律文本，对所述法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与所述分词结果相同的实体指代，若存在，则将与所述分词结果相同的实体指代放入实体指代集合中，将与所述分词结果相同的实体指代对应的实体放入候选实体集合中，所述实体指代是指实体的代称，一个所述实体指代对应有多个实体；

计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将所述关联分数与对应的各相关分数进行相加，得到多个目标函数；

在所述实体指代集合中，以所述目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。

一种基于知识图谱的实体链接装置，包括：

分词及查找模块，用于获取法律文本，对所述法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与所述分词结果相同的实体指代，若存在，则将与所述分词结果相同的实体指代放入实体指代集合中，将与所述分词结果相同的实体指代对应的实体放入候选实体集合中，所述实体指代是指实体的代称，一个所述实体指代对应有多个实体；

计算模块，用于计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将所述关联分数与对应的各相关分数进行相加，得到多个目标函数；

确定及链接模块，用于在所述实体指代集合中，以所述目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如下所述的基于知识图谱的实体链接方法的步骤：

一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如下所述的基于知识图谱的实体链接方法的步骤：

上述基于知识图谱的实体链接方法、装置、设备和存储介质，包括获取法律文本，对所述法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与所述分词结果相同的实体指代，若存在，则将与所述分词结果相同的实体指代放入实体指代集合中，将与所述分词结果相同的实体指代对应的实体放入候选实体集合中；计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将所述关联分数与对应的各相关分数进行相加，得到多个目标函数；在所述实体指代集合中，以所述目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。本申请通过计算实体指代的关联分数和候选实体间的相关分数，确定最终的实体指代，并将实体指代进行链接，避免法律文本中存在着同义词、一词多义现象。在将实体指代链接至法律知识图谱后，实体链接能够帮助机器真正理解自由文本中法务实体的语义信息，帮助机器有效进行后续类案检索、证据指引和智能问答等任务。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。

图1为本申请一个实施例中的基于知识图谱的实体链接方法的流程图；

图2为本申请一个实施例中步骤S1的流程图；

图3为本申请一个实施例中基于知识图谱的实体链接装置的结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

图1为本申请一个实施例中的基于知识图谱的实体链接方法的流程图，如图1所示，一种基于知识图谱的实体链接方法，包括以下步骤：

步骤S1，分词及查找：获取法律文本，对法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与分词结果相同的实体指代，若存在，则将与分词结果相同的实体指代放入实体指代集合中，将与分词结果相同的实体指代对应的实体放入候选实体集合中，实体指代是指实体的代称，一个实体指代对应有多个实体。

由于日常书面文本当中可能会采用简称或者代称来表示一些特定名词，例如，用“苹果”或“苹果公司”等词来指代“苹果公司”这一特定名词，这些如“苹果”或“苹果公司”等简称或代称即为实体指代，一些特定名词即为实体，根据词语之间的对应关系，实体指代与实体之间得到一张预设的映射表。

本步骤中的法律文本是用户输入的一句话或一段文字，根据输入的法律文本来进行实体指代识别。本步骤在进行实体指代识别时，首先对法律文本进行分词，将一句话或一段文字切分成多个词语，将词语与映射表进行比较，得到实体指代及实体指代对应的实体，并读查找后得到的实体指代及对应的实体进行分类放入实体指代集合和候选实体集合中。

其中，实体指代代集合记作：M＝{m ₁，m ₂，…，m _N}，m指在映射表中存在分词结果的实体指代。候选实体集合记作：E _i＝{e _i1，e _i2，…，e _ik}(i＝1，2，…，N)，e指在映射表中实体指代对应的实体。

在一个实施例中，步骤S1中，获取法律文本，对法律文本进行分词，得到分词结果，包括：

对获取的法律文本进行分词，得到的多个词语为分词结果，在进行分词时最小分词滑窗为预设的最小分词阈值，最大分词滑窗为法律文本长度。

例如，输入的法律文本内容为“苹果公司卖的是苹果嘛”，预设的最小分词阈值为2，最大分词滑窗为10，则可以得到：划窗大小为2时的分词结果为“苹果”、“果公”、“公司”、“司卖”、“卖的”、“的是”、“是苹”、“苹果”、“果嘛”，划窗大小为3时得到的分词结果为“苹果公”、“果公司”、“公司卖”、“司卖的”、“卖的是”、“的是苹”、“是苹果”、“苹果嘛”，直至划窗大小为10时得到的分词结果为“苹果公司卖的是苹果嘛”。“苹果”、“果公”、“公司”、“司卖”、“卖的”、“的是”、“是苹”、“苹果”、“果嘛”、“苹果公”、“果公司”、 “公司卖”、“司卖的”、“卖的是”、“的是苹”、“是苹果”、“苹果嘛”…“苹果公司卖的是苹果嘛”均为本通过本实施方式得到的分词结果。

将上述分词结果中的每个词语在映射表中进行查询，是否存在相同的实体指代，当映射表中存在“苹果”和“苹果公司”两个实体指代，则实体指代集合为“苹果”和“苹果公司”，在映射表中查找实体指代对应的实体，能够得到“苹果”对应的实体有“苹果(蔷薇科苹果属果实)”、“苹果(苹果产品公司)”、“苹果(韩国2008年康理贯执导电影)”等，这些实体的集合即为候选实体集合。对于实体指代“苹果公司”同样有对应的候选实体集合。此时，M＝[“苹果”,“苹果公司”]，E1＝[“苹果(蔷薇科苹果属果实)”,“苹果(苹果产品公司)”,“苹果(韩国2008年康理贯执导电影)”,…]

本实施例的最小分词阈值取值范围为大于等于2，小于等于法律文本长度。通过上述方式对获取的法律文本进行分词，可以将所有可能的词语都得到划分，避免词语的遗漏。

在一个实施例中，步骤S1中，映射表为预设的法律知识图谱中实体指代与实体之间的映射关系表，如图2所示，包括：

步骤S101，爬取数据：通过预设的爬虫脚本获取预设网站中的法律裁判文书。

本步骤通过爬虫技术对网络中公开的各个网站内关于法律方面的法律裁判文书进行爬取。具体爬取方式如下：

预设网址列表，网址列表中包含多个法律裁判文书内容的网址；调用浏览器内核依次对网址列表中的网址发出网页访问请求，并等待接收网页访问请求的网站发出的反馈信息，反馈信息包括接收访问的反馈信息和拒绝接收访问的反馈信息；当接收到接收访问的反馈信息时，调用预设在数据库中的网络爬虫算法，采集法律裁判文书内容，然后继续调用浏览器内核访问网址列表中的其他网址，直到遍历网址列表中的所有网址；当接收到拒绝接收访问的反馈信息后，继续调用浏览器内核访问网址列表中的其他网址，直到遍历网址列表中的所有网址；汇总网络爬虫算法采集到的法律裁判文书。

步骤S102，解构数据：对每篇法律裁判文书的内容进行解构，得到节点内容，节点内容包括但不限于原告、被告、争议焦点和证据。

由于法律裁判文书的格式基本固定，因此本步骤在解构时，可以采用正则表达式、json表达式或grok表达式等解析方式对法律裁判文书内容进行解构。

其中，实体指代指在解构法律裁判文书内容时同一实体可能有多种表达方式，即一个实体含有多个可能的中文含义，在确定节点内容时，将其中一个节点内容定义为实体，将其他相同含义的其他实体定义为实体指代，将实体指代和实体填入映射表中，得到实体指代与实体之间的映射表。例如得到的节点内容有“苹果”、“苹果公司”等，则用“苹果”或“苹果公司”来指代“苹果公司”这一特定名词，则前者即为实体指代，后者即为实体。

步骤S103，构建图谱：将节点内容构建实体和属性之间的关系，得到法律知识图谱。

实体如原告、被告、争议焦点等，关系如提出、请求成立等。

步骤S104，建立映射关系：将法律知识图谱中的各实体与预设的映射关系表中的实体指代建立映射关系，得到更新后的映射关系表。

在建立法律知识图谱之前，可以预先设置一张实体指代与实体之间的初始映射表，当法律知识图谱构建完成后，将法律知识图谱中的所有实体，都与初始映射表中的实体指代建立映射关系，得到更新后的映射关系表。例如，法律知识图谱中的实体包含“苹果公司”，初始映射表中包含有“苹果”或“苹果公司”等实体指代，则将这些实体指代与法律知识图谱中的实体“苹果公司”建立映射关系，以便于后续根据更新后的映射关系表确定候选实体集合。

本实施例通过网络爬虫技术得到用于构建法律知识图谱的数据，通过解构数据，构建图谱的过程，最终得到法律知识图谱，此法律知识图谱作为实体指代识别的基础，确定出最终的实体指代。

步骤S2，计算目标函数：计算实体指代集合中各实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将关联分数分别与对应的各相关分数进行相加，得到多个目标函数。

通过步骤1)得到的实体指代和候选实体较多，其中大部分候选实体并不是最终确定的实体，因此本步骤通过对关联分数的计算，来实现候选实体的消歧任务。在候选实体集合中，任一实体指代对应可能有多个候选实体，在多个候选实体中，对任一两个候选实体之间计算相关分数，遍历实体指代对应的所有的候选实体，得到实体指代对应的多个相关分数，对此实体指代得到的关联分数，分别与所有的相关分数进行相加，得到多个目标函数。本步骤通过在目标函数中增加相关分数的计算，利用候选实体之间的相似性进行全局消歧。

在一个实施例中，步骤S2中，关联分数由上下文无关分数与上下文相关分数相乘得到。

1)上下文无关分数优选采用Levenshtein字符串编辑距离公式，即计算实体指代与候选实体文本编辑距离分数作为上下文无关分数。上下文无关分数sim(m，e)采用如下计算公式得到：

其中，m为实体指代，e为实体指代对应的候选实体集合中的其中一个候选实体，|m|和|e|分别表示m和e的字符串长度，ed(m，e)为Levenshtein距离公式，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数，w _s是预设的系数。

上述Levenshtein距离公式，例如对于字符串kitten和sitting，第一步，kitten-->sitten将k替换成s；第二步，sitten-->sittin将e替换成i；第三步，sittin-->sitting添加g；每经过一次编辑，也就是变化(插入，删除，替换)花费的代价都是1，因此ed(kitten,sitting)＝3，上述举例为英文，对于中文采用相同的计算方式。

2)上下文相关分数是将实体指代的上下文与候选实体的属性进行向量化，通过计算两个向量的距离来确定。

其中，候选实体的属性是预设的法律知识图谱中的候选实体的相关属性信息。在向量化时，可以采用NLP自然语言处理系统中现有的模型，如word2vec词向量化模型，word2vec是一个NLP工具，它可以将所有的词向量化，这样词与词之间就可以定量的去度量他们之间的关系，挖掘词之间的联系。本步骤利用word2vec的方法，采用直接调用的方式对实体指代的上下文与候选实体的属性分别进行向量化。

在通过计算两个向量的距离时，优选通过计算两个向量的余弦距离得到上下文相关分数，余弦距离的计算公式为：

其中，

表示利用word2vec的方法得到的两个向量，

表示向量模长。

本实施例通过上述Levenshtein距离公式及余弦距离公式等方式，来快速有效的实现候选实体的消歧任务。

在一个实施例中，步骤S2中，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，包括：

两个候选实体之间的相关分数sim(e ₁，e ₂)的计算公式为：

其中，e ₁、e ₂表示两个候选实体，E ₁表示与e ₁直接连接的实体集合，E ₂表示与e ₂直接连接的实体集合，|E ₁|表示E ₁中实体的数量，|E ₂|表示E ₂中实体的数量，E ₁∩E ₂表示两个集合的交集，|E|表示法律知识图谱中全部实体的数量。

目标函数

的计算公式为：

其中，φ(m _i，e _i)为关联分数，coh(e _i，e _j)为两个候选实体之间的相关分数。

本实施例通过上述计算公式，得到两个候选实体的相关分数，考虑到法律文本中可能存在多个实体指代，因此在目标函数中通过增加此相关分数的介入，利用候选实体之间的相似性，进行全局消歧。

步骤S3，确定及链接：在实体指代集合中，以目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。

在步骤2)计算出所有的目标函数后，最终的目标为目标函数最大化，最终得到

为实体指代M＝{m ₁，m ₂，…，m _N}集合对应的实体结果，实体结果为实体指代M集合与实体集合

例如，步骤1)中输入的法律文本内容为“苹果公司卖的是苹果嘛”，最终在本步骤中得到了实体指代“苹果公司”和“苹果”，实体指代“苹果公司”对应的实体为“苹果公司”，“苹果”对应的实体为“苹果(蔷薇科苹果属果实)”。

在得到最终的实体指代后，还将每个实体指代链接到法律知识图谱中对应的实体中，为后续法律案件检索、证据指引智能问答提供检索依据。

例如，将实体指代“苹果公司”链接到法律知识图谱中实体为“苹果公司”上，将实体指代“苹果”链接到法律知识图谱中实体为“苹果(蔷薇科苹果属果实)”上。

本实施例基于知识图谱的实体链接方法，采用分词计算对法律文本进行分词，可将所有可能的词语都得到划分，避免划分词语的遗漏问题。在得到的分词结果量较大的情况下，将分词结果与预设的映射表进行比较查询，去除无关词语，快速高效的筛选出关键词语并加入实体指代集合和对应的候选实体集合，为后续确定正确的实体指代给出数据支持。本申请还通过关联分数的计算，实现多个候选实体的消歧任务。考虑到输入的法律文本中可能存在多个实体指代，因此在目标函数中增加相关分数的计算，利用候选实体之间的相似性进一步实现全局消歧，最终得到确定的实体指代，并将实体指代进行链接，避免法律文本中存在着同义词、一词多义现象。

在一个实施例中，提出了一种基于知识图谱的实体链接装置，如图3所示，包括：

分词及查找模块，用于获取法律文本，对法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与分词结果相同的实体指代，若存在，则将与分词结果相同的实体指代放入实体指代集合中，将与分词结果相同的实体指代对应的实体放入候选实体集合中，实体指代是指实体的代称，一个实体指代对应有多个实体；

计算模块，用于对实体指代集合中每个实体指代计算实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将关联分数分别与对应的各相关分数进行相加，得到多个目标函数；

确定及链接模块，用于在实体指代集合中，以目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。

在一个实施例中，提出了一种计算机设备，包括存储器和处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行计算机可读指令时实现上述各实施例的基于知识图谱的实体链接方法中的步骤。

在一个实施例中，提出了一种存储有计算机可读指令的存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述各实施例的基于知识图谱的实体链接方法中的步骤。其中，存储介质可以为非易失性存储介质，也可以为易失性存储介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁盘或光盘等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请一些示例性实施例，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种基于知识图谱的实体链接方法，其中，包括：

获取法律文本，对所述法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与所述分词结果相同的实体指代，若存在，则将与所述分词结果相同的实体指代放入实体指代集合中，将与所述分词结果相同的实体指代对应的实体放入候选实体集合中，所述实体指代是指实体的代称，一个所述实体指代对应有多个实体；

计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将所述关联分数分别与对应的各相关分数进行相加，得到多个目标函数；

在所述实体指代集合中，以所述目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。
根据权利要求1所述的基于知识图谱的实体链接方法，其中，所述获取法律文本，对所述法律文本进行分词，得到分词结果，包括：

对获取的所述法律文本进行分词，得到的多个词语为分词结果，在进行分词时最小分词滑窗为预设的最小分词阈值，最大分词滑窗为所述法律文本长度。
根据权利要求1所述的基于知识图谱的实体链接方法，其中，所述映射表为预设的法律知识图谱中实体指代与实体之间的映射关系表，包括：

通过预设的爬虫脚本获取预设网站中的法律裁判文书；

对每篇所述法律裁判文书的内容进行解构，得到节点内容，所述节点内容包括但不限于原告、被告、争议焦点和证据；

将所述节点内容构建实体和属性之间的关系，得到法律知识图谱；

将所述法律知识图谱中的各实体与预设的映射关系表中的所述实体指代建立映射关系，得到更新后的映射关系表。
根据权利要求1所述的基于知识图谱的实体链接方法，其中，所述计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，包括：

所述关联分数由上下文无关分数与上下文相关分数相乘得到；

所述上下文无关分数sim(m，e)采用如下计算公式得到：

其中，m为实体指代，e为实体指代对应的候选实体集合中的其中一个候选实体，|m|和|e|分别表示m和e的字符串长度，ed(m，e)为距离公式，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数，w _s是预设的系数；

将所述实体指代的上下文与候选实体的属性进行向量化，通过计算两个向量的距离确定所述上下文相关分数。
根据权利要求4所述的基于知识图谱的实体链接方法，其中，所述通过计算两个向量的距离确定所述上下文相关分数，包括：

通过计算两个向量的余弦距离得到所述上下文相关分数，所述余弦距离的计算公式为：

其中，
表示两个向量，
表示向量模长。
根据权利要求1、4或5所述的基于知识图谱的实体链接方法，其中，所述计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，包括：

两个所述候选实体之间的相关分数sim(e ₁，e ₂)的计算公式为：

其中，e ₁、e ₂表示两个所述候选实体，E ₁表示与e ₁直接连接的实体集合，E ₂表示与e ₂直接连接的实体集合，|E ₁|表示E ₁中实体的数量，|E ₂|表示E ₂中实体的数量，E ₁∩E ₂表示两个集合的交集，|E|表示法律知识图谱中全部实体的数量。
根据权利要求6所述的基于知识图谱的实体链接方法，其中，所述将所述关联分数与对应的各相关分数进行相加，得到多个目标函数，包括：

所述目标函数
的计算公式为：

其中，φ(m _i，e _i)为所述关联分数，coh(e _i，e _j)为两个所述候选实体之间的相关分数。
一种基于知识图谱的实体链接装置，其中，包括：

分词及查找模块，用于获取法律文本，对所述法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与所述分词结果相同的实体指代，若存在，则将与所述分词结果相同的实体指代放入实体指代集合中，将与所述分词结果相同的实体指代对应的实体放入候选实体集合中，所述实体指代是指实体的代称，一个所述实体指代对应有多个实体；

计算模块，用于计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将所述关联分数分别与对应的各相关分数进行相加，得到多个目标函数；

确定及链接模块，用于在所述实体指代集合中，以所述目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。
一种计算机设备，其中，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如下所述的基于知识图谱的实体链接方法的步骤：

获取法律文本，对所述法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与所述分词结果相同的实体指代，若存在，则将与所述分词结果相同的实体指代放入实体指代集合中，将与所述分词结果相同的实体指代对应的实体放入候选实体集合中，所述实体指代是指实体的代称，一个所述实体指代对应有多个实体；

计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将所述关联分数分别与对应的各相关分数进行相加，得到多个目标函数；

在所述实体指代集合中，以所述目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。
根据权利要求9所述的基于知识图谱的实体链接设备，其中，所述获取法律文本，对所述法律文本进行分词，得到分词结果，包括以下步骤：

对获取的所述法律文本进行分词，得到的多个词语为分词结果，在进行分词时最小分词滑窗为预设的最小分词阈值，最大分词滑窗为所述法律文本长度。
根据权利要求9所述的基于知识图谱的实体链接设备，其中，所述映射表为预设的法律知识图谱中实体指代与实体之间的映射关系表，包括以下步骤：

通过预设的爬虫脚本获取预设网站中的法律裁判文书；

对每篇所述法律裁判文书的内容进行解构，得到节点内容，所述节点内容包括但不限于原告、被告、争议焦点和证据；

将所述节点内容构建实体和属性之间的关系，得到法律知识图谱；

将所述法律知识图谱中的各实体与预设的映射关系表中的所述实体指代建立映射关系，得到更新后的映射关系表。
根据权利要求9所述的基于知识图谱的实体链接设备，其中，所述计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，包括以下步骤：

所述关联分数由上下文无关分数与上下文相关分数相乘得到；

所述上下文无关分数sim(m，e)采用如下计算公式得到：

其中，m为实体指代，e为实体指代对应的候选实体集合中的其中一个候选实体，|m|和|e|分别表示m和e的字符串长度，ed(m，e)为距离公式，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数，w _s是预设的系数；

将所述实体指代的上下文与候选实体的属性进行向量化，通过计算两个向量的距离确定所述上下文相关分数。
根据权利要求12所述的基于知识图谱的实体链接设备，其中，所述通过计算两个向量的距离确定所述上下文相关分数，包括以下步骤：

通过计算两个向量的余弦距离得到所述上下文相关分数，所述余弦距离的计算公式为：

其中，
表示两个向量，
表示向量模长。
根据权利要求9、12或13所述的基于知识图谱的实体链接设备，其中，所述计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，包括以下步骤：

两个所述候选实体之间的相关分数sim(e ₁，e ₂)的计算公式为：

其中，e ₁、e ₂表示两个所述候选实体，E ₁表示与e ₁直接连接的实体集合，E ₂表示与e ₂直接连接的实体集合，|E ₁|表示E ₁中实体的数量，|E ₂|表示E ₂中实体的数量，E ₁∩E ₂表示两个集合的交集，|E|表示法律知识图谱中全部实体的数量。
根据权利要求14所述的基于知识图谱的实体链接设备，其中，所述将所述关联分数与对应的各相关分数进行相加，得到多个目标函数，包括以下步骤：

所述目标函数
的计算公式为：

其中，φ(m _i，e _i)为所述关联分数，coh(e _i，e _j)为两个所述候选实体之间的相关分数。
一种存储有计算机可读指令的存储介质，其中，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如下所述的基于知识图谱的实体链接方法的步骤：

获取法律文本，对所述法律文本进行分词，得到分词结果，在预设的映射表中查找是否存在与所述分词结果相同的实体指代，若存在，则将与所述分词结果相同的实体指代放入实体指代集合中，将与所述分词结果相同的实体指代对应的实体放入候选实体集合中，所述实体指代是指实体的代称，一个所述实体指代对应有多个实体；

计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数，计算各实体指代对应的所有候选实体中任意两个候选实体的相关分数，将所述关联分数分别与对应的各相关分数进行相加，得到多个目标函数；

在所述实体指代集合中，以所述目标函数值最大的实体指代确定为最终的实体指代，将最终的实体指代链接到法律知识图谱中对应的实体中。
根据权利要求16所述的存储介质，其中，所述基于知识图谱的实体链接的计算机可读指令被处理器执行所述获取法律文本，对所述法律文本进行分词，得到分词结果的步骤时，包括以下步骤：

对获取的所述法律文本进行分词，得到的多个词语为分词结果，在进行分词时最小分词滑窗为预设的最小分词阈值，最大分词滑窗为所述法律文本长度。
根据权利要求16所述的存储介质，其中，所述基于知识图谱的实体链接的计算机可读指令被处理器执行所述映射表为预设的法律知识图谱中实体指代与实体之间的映射关系表的步骤时，包括以下步骤：

通过预设的爬虫脚本获取预设网站中的法律裁判文书；

对每篇所述法律裁判文书的内容进行解构，得到节点内容，所述节点内容包括但不限于原告、被告、争议焦点和证据；

将所述节点内容构建实体和属性之间的关系，得到法律知识图谱；

将所述法律知识图谱中的各实体与预设的映射关系表中的所述实体指代建立映射关系，得到更新后的映射关系表。
根据权利要求16所述的存储介质，其中，所述基于知识图谱的实体链接的计算机可读指令被处理器执行所述计算所述实体指代集合中各实体指代与对应的候选实体之间的关联分数的步骤时，包括以下步骤：

所述关联分数由上下文无关分数与上下文相关分数相乘得到；

所述上下文无关分数sim(m，e)采用如下计算公式得到：

其中，m为实体指代，e为实体指代对应的候选实体集合中的其中一个候选实体，|m|和|e|分别表示m和e的字符串长度，ed(m，e)为距离公式，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数，w _s是预设的系数；

将所述实体指代的上下文与候选实体的属性进行向量化，通过计算两个向量的距离确定所述上下文相关分数。
根据权利要求19所述的存储介质，其中，所述基于知识图谱的实体链接的计算机可读指令被处理器执行所述通过计算两个向量的距离确定所述上下文相关分数的步骤时，包括以下步骤：

通过计算两个向量的余弦距离得到所述上下文相关分数，所述余弦距离的计算公式为：

其中，
表示两个向量，
表示向量模长。