CN112632224B

CN112632224B - 基于案例知识图谱的案件推荐方法、装置和电子设备

Info

Publication number: CN112632224B
Application number: CN202011592618.3A
Authority: CN
Inventors: 朵思惟; 余梓飞; 张程华; 薛晨云
Original assignee: Tianjin Huizhi Xingyuan Information Technology Co ltd
Current assignee: Tianjin Huizhi Xingyuan Information Technology Co ltd
Priority date: 2020-12-29
Filing date: 2020-12-29
Publication date: 2023-01-24
Anticipated expiration: 2040-12-29
Also published as: CN112632224A

Abstract

本说明书一个或多个实施例提供一种基于案例知识图谱的案例推荐方法、装置和电子设备。所述案例推荐方法包括：对用户输入的案件进行特征提取；将提取出的案件特征在所述案例知识图谱中进行语义图搜索，推送相关联案例；对所述相关联案例进行排序，最终进行数据返回。本发明基于案例知识图谱的案例推荐方法采用知识图谱、自然语言处理和深度学习等领域的技术，对用户的提问进行实体提取、关系提取、时间提取、语义分析，并在知识图谱中通过多维匹配算法，最终精确分析当前处理案件，最终推送出相关指导案例。

Description

基于案例知识图谱的案件推荐方法、装置和电子设备

技术领域

本说明书一个或多个实施例涉及知识图谱技术领域，尤其涉及一种基于案例知识图谱的案件推荐方法、装置和电子设备。

背景技术

对于法官和律师来说，类案推荐是日常工作中的核心内容。然而，类案推荐是一项复杂、繁琐的工作，要从数以千万计的裁判文书中找到真正想要了解的内容，需要花费大量的时间成本。传统的案例智能推荐只能是通过简单的案件类型及关键词过滤，经筛查后依旧有大量的文书，需要占用大量人工时间审阅。

基于此，需要一种能够自动对案例文书及包含的法律条文进行分类整理并且根据用户输入可以快速推荐相关案例的智能推荐系统。

发明内容

有鉴于此，本说明书一个或多个实施例的目的在于提出一种基于案例知识图谱的案件推荐方法、装置和电子设备，以解决难以精准推荐案例的问题。

基于上述目的，本说明书一个或多个实施例提供了一种基于案例知识图谱的案件推荐方法，包括：

响应于接收到用户输入的法律案件和/或问题的描述，从所述描述中提取多维度特征，所述多维度特征包括实体、关系、事件和主题；

根据所述多维度特征，在预先基于案例相关文件构建的案例知识图谱中进行语义图搜索，搜索出与所述多维度特征相关联的案例候选推荐数据；

输出所述案例候选推荐数据中的至少一个作为与所述描述相关的案例推荐数据。

进一步的，从所述描述中提取多维度特征，包括：

对所述描述进行预处理，以去除所述描述中的停用词；

对经过所述预处理的所述描述通过深度语义表示模型进行向量表示，计算得出相关实体，完成实体识别；

对经过所述实体识别的所述描述采用基于堆叠膨胀门卷积神经网络 DGCNN进行关系抽取；

对经过所述实体识别的所述描述进行事件抽取，所述事件抽取包括触发词提取和角色提取；

对经过所述实体识别的所述描述采用基于预训练的分类模型进行主题抽取；

对经过所述实体识别、所述关系抽取、所述事件抽取和所述主题抽取得到的相应特征进行融合。

进一步的，对经过所述实体识别的所述描述采用DGCNN进行关系抽取，包括：

通过字词混合向量得到所述描述的字向量序列，所述字向量序列加上位置向量，得到所述描述的混合编码；

将所述混合编码输入到12层DGCNN中进行编码，得到编码后的序列 H；

将所述序列H输入DGCNN自注意力层后得到序列H的向量表示；

将所述序列H的向量表示传入卷积神经网络CNN的全连接层Dense中，用sigmoid激活函数预测所述描述的主体的首尾位置；

随机采样一个所述主体，将所述序列H对应所述主体的子序列传入到一个双向长短期记忆LSTM神经网络中，得到所述主体的编码向量，所述主体的编码向量加上相对位置向量，得到一个与所述描述等长的向量序列；

将H传入DGCNN的另一层自注意力层后，将输出结果与所述描述等长的向量序列进行拼接；

将拼接后的结果传入CNN的全连接层Dense中，通过sigmoid激活函数来预测对应的客体的首、尾位置，同时把关系抽取出来。

进一步的，对经过所述实体识别的所述描述进行事件抽取，包括：

通过预训练的来自变换器的双向编码器表示BERT模型得到所述描述的词向量表示，基于案件类别对所述描述的每个词进行分类，当某个词超过其中一个案件类别设定的阈值时，则将该词归为所述案件类别，并作为触发词提取出来；

根据提取出的所述触发词，提取相关所有可能的角色。

进一步的，在预先基于案例相关文件构建的案例知识图谱中进行语义图搜索，搜索出与所述多维度特征相关联的案例候选推荐数据，包括：

优先采用子图搜索方式进行搜索，无返回结果时采用所述多维度特征自由组合的方式进行匹配搜索，直至匹配搜索成功。

进一步的，输出所述案例候选推荐数据中的至少一个作为与所述描述相关的案例推荐数据，包括：

对所述特征提取方式提取出的所述特征进行加权平均，得出所述案例候选推荐数据的相关度评分，从所述案例候选推荐数据中选取相关度评分较高的案例候选推荐数据作为案例候选数据集；

根据预定规则，过滤掉所述案例候选数据集中的异常案例。

基于同一发明构思，本说明书一个或多个实施例提供了一种基于案例知识图谱的案件推荐装置，包括：

特征提取模块，被配置为响应于接收到用户输入的法律案件和/或问题的描述，对所述描述进行特征提取；

语义图搜索模块，被配置为根据所述特征提取得到的特征，在预先基于案例相关文件构建的案例知识图谱中进行语义图搜索，搜索出与所述特征相关联的案例候选推荐数据；

输出模块，被配置为输出所述案例候选推荐数据中的至少一个作为与所述描述相关的案例推荐数据。

基于同一发明构思，本说明书一个或多个实施例提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现如上任意一项所述的方法。

基于同一发明构思，本说明书一个或多个实施例提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令在被计算机执行时，使所述计算机实现如上任意一项所述的方法。

从上面所述可以看出，本说明书一个或多个实施例提供的一种基于案例知识图谱的案件推荐方法、装置和电子设备，采用知识图谱、自然语言处理和深度学习等领域的技术，对用户的提问进行实体提取、关系提取、时间提取、语义分析，并在知识图谱中通过多维匹配算法，精确分析当前处理案件，推送出相关指导案例。为法官、律师提供依据，保障法律适用的稳定性和可预期性，达到统一司法裁判尺度。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书一个或多个实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一个或多个实施例的案例推荐方法的流程示意图；

图2为本说明书一个或多个实施例的特征提取操作的流程示意图；

图3为本说明书一个或多个实施例的案例推荐装置模块的结构示意图；

图4为本说明书一个或多个实施例的电子设备硬件结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本公开进一步详细说明。

需要说明的是，除非另外定义，本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。

如背景技术部分所述，当前案例推荐系统大多采用传统的数据库存储，推荐方法多采用关键词推荐的方式，不能准确理解用户真实法律诉求，难以精准推荐案例。

有鉴于此，本说明书一个或多个实施例提供了一种基于案例知识图谱的案例推荐方法、装置和电子设备。对用户输入的案件进行特征提取，以用户处理的当前案件内容作为输入，通过混合特征提取方案，进行案件地点、案由类型、涉案物品、涉案金额等关键实体、事件、关系的提取，作为图谱搜索的特征。进一步的，基于当前案件抽取出的特征在知识图谱中进行语义推荐、推理和多维度分析，输出案例候选推荐数据。根据多维搜索出的数据对案例候选推荐数据进行相关度排序，输出至少一个案例推荐数据。

可见，本说明书一个或多个实施例的一种基于案例知识图谱的案件推荐方法采用知识图谱、自然语言处理和深度学习等领域的技术，对用户的提问进行实体提取、关系提取、时间提取、语义分析，并在知识图谱中通过多维匹配算法，最终精确分析当前处理案件，推送出相关指导案例。

以下，通过具体的实施例来详细说明本说明书一个或多个实施例的技术方案。

参考图1，本说明书一个实施例的基于知识图谱的案例推荐方法，包括以下步骤：

步骤S101、响应于接收到用户输入的法律案件和/或问题的描述，对所述描述进行特征提取。

参考图2，所述特征提取方式具体包括以下步骤：

步骤S201、案件信息预处理，对于法律案件文本中的数据，只有一部分是需要的，而对于数据中大量的停用词需要对其预处理进行删去。

步骤S202、实体识别，案件实体识别和扩展，利用迁移学习模型，基于大量无监督文本进行深度语义训练，然后利用现有案例文书进行微调模型，构建出基于法律文书相关的深度语义表示模型。利用深度语义表示模型的语义信息对案件主题进行向量表示计算，计算出相关的实体，对主题进行扩展，提升知识图谱的泛化性。

具体的，实体识别任务可以被看作一类特殊的单句标注任务，是对句子中每一个字进行标注。我们将已经定义好的实体标签理解为类别，这样就相当于对每个字基于实体标签进行分类，这里的标签不仅包括实体类别，还包括字在实体中的位置。例如，“南京市”会被标记为[B-LOC,I-LOC,I-LOC]，其中‘B’和‘I’分别用来表示该字为其所属实体的“起始”或“非起始” 点，‘LOC’表示“位置”这类实体。我们将非实体标注为“O”。经过实体识别后，句子被标注为如下形式：

“习某某总书记今天在某某某广场发表讲话。”

[B-PER,I-PER,I-PER,O,O,O,O,O,O,B-LOC,I-LOC,I-LOC,I-LOC,I- LOC,O,O,O,O]

根据标签的标注，我们可以将两个实体“习某某”和“某某某广场”提取出来。

步骤S203、关系抽取，关系抽取采用基于堆叠膨胀门卷积神经网络 (DGCNN)进行抽取，具体流程如下：

(1)针对用户输入的所述描述，通过字词混合向量(Embedding)得到对应的字向量序列，然后加上位置向量(Position Embedding)，得到一个混合向量的编码，根据混合编码可以对所述描述抽取局部和整体的语义信息；

(2)将得到的混合编码输入到12层DGCNN中进行编码，得到编码后的序列H，通过12层的神经网络，充分优化学习参数，DGCNN使用CNN代替传统的长短期记忆(LSTM)神经网络，并且提取了更丰富的共现特征；

(3)将序列H传入一层自注意力层(Self Attention)后，得到所述序列H 的向量表示；

(4)将所述序列H的向量表示传入卷积神经网络(Convolutional NeuralNetwork,CNN)中的全连接层Dense中，通过sigmoid激活函数预测所述描述主体的首、尾位置；

(5)训练时随机采样一个标注的主体(通过sigmoid激活函数预测时逐一遍历所有的主体)，然后将序列H对应此主体的子序列传入到一个双向LSTM 神经网络中，得到主体的编码向量，然后加上相对位置向量Position Embedding，得到一个与所述描述等长的向量序列；

(6)将序列H传入另一层自注意力层(Self Attention)后，将输出结果与第5步输出的向量序列进行拼接；

(7)将拼接后的结果传入CNN中的全连接层Dense中，对于每一种关系，都通过sigmoid激活函数预测对应的客体的首、尾位置，同时把关系抽取出来。

基于上述步骤(1)至(7)完成对所述描述的关系抽取。

步骤S204、事件抽取，所述事件抽取包括触发词提取和角色提取，具体包括以下步骤：

(1)触发词提取，通过预训练的来自变换器的双向编码器表示(BERT) 模型得到所述描述的词向量表示，然后对每个词基于案件类别进行分类。如： “一名青年男子持枪扫射过往的行人而后自杀。”这句话，我们对“持枪扫射” 进行分类，其中案件类别包括“冲突，袭击”，“抢劫”，“盗窃”等等，那么它将被分类为“冲突，袭击”，“持枪扫射”作为触发词被提取出来。而“男子”这个词，由于其在每一个类别的得分都低于我们设定的阈值，不被归为任何一个案件类型，因此不会被作为触发词提取出来。

(2)角色提取，和触发词提取相比，角色提取更为复杂，一方面是由于候选角色大多由长名词短语构成，另一方面还存在角色重叠等问题。角色提取是根据提取出的触发词，提取相关所有可能的角色。为了克服上述两个难点，我们将原有的基于角色类别的分类问题改为了贴标签问题，也就是将每一个角色类别作为一个标签贴到所有可能的元素上，这样可以解决角色重叠问题。例如，“一名青年男子持枪扫射过往的行人而后自杀。”中的“男子”同时扮演了“袭击者”和“受害者”的角色，如果用分类的方式，“男子”只能被归为“袭击者”或者“受害者”中的一类，但如果用贴标签的方式，则两个标签“袭击者”和“受害者”都可以被贴在“男子”这个元素上。此外，我们对每一个角色类别标签，会识别其对应句子中元素的“开始”和“结束” 位置，这样可以很好的解决名词短语的问题，例如上句中的“青”和“男” 都会被贴上[“袭击者”,开始]的标签，“子”会被贴上[“袭击者”,结束]的标签，因此组合起来，“袭击者”会被贴到“青年男子”和“男子”这两个元素上。对于给定角色r，句子中第i个字是对应元素的“起始”和“结束”位置的概率计算公式如下：

其中，上角标‘r’表示角色类别里面的一个给定角色，脚标‘s’和‘e’分别代表“起始”和“结束”。其中B(i)是对第i个字进行预训练后的向量表示。

是大小为(2×n)权重矩阵，2代表二分类中的两类“是开始位置”或 “不是开始位置”，n代表向量B(i)的长度。最后得到的

是一个(2×1)的向量，例如:(0.9，0.1)^T代表“是开始位置”的概率为0.9，而“不是开始位置”的概率为0.1，因此我们第i个字标记为“开始位置”，并记

对于每个给定的角色r，我们可以基于

和

的值得到两个列表

和

如果

那么第i个字就被标记为“开始”。类似地，如果

那么第i个字就被标记为“结束”。最后，我们采用交叉熵损失函数做角色提取部分模型的微调。

基于上述步骤(1)和(2)完成对所述描述的事件抽取。

步骤S205、主题抽取，主题提取采用基于预训练的BERT分类模型进行构造，从文本整体语义上进行语义理解，输出整句的语义主题。这里的预训练BERT模型被当作句子的编码器来使用，对整句话进行编码，生成句子的向量表示，作为输入向量输入分类器，用softmax进行分类。

步骤S206、特征融合，利用上述实体、关系、事件、主题等多粒度多维度的信息进行特征融合，作为语义图搜索的输入进行案例知识图谱搜索。

基于步骤S201至S206完成对用户输入的所述描述的特征提取。

步骤S102、根据所述特征提取得到的特征，在预先基于案例相关文件构建的案例知识图谱中进行语义图搜索，搜索出与所述特征相关联的案例候选推荐数据。

步骤S103、输出所述法律案例候选推荐数据中的至少一个作为与所述描述相关的法律案例推荐数据，具体包括：

对所述特征提取方式提取出的所述特征进行加权平均，得出所述案例候选推荐数据的相关度评分，从所述案例候选推荐数据中选取相关度评分较高的案例候选推荐数据作为案例候选数据集。根据预定规则，过滤掉所述案例候选数据集中的异常案例。

当用户输入案例文书时，通过上述步骤S101至S103，为用户输出案例推荐数据。

可见，在本实施例中，针对用户处理案件过程中的案例推荐的全流程做出了优化方案，包括但不限于系统中的特征提取、图谱推荐等，解决了传统技术下案例推荐不够精准的缺陷。基于知识图谱的法律智能推荐系统采用知识图谱、自然语言处理和深度学习等领域的技术，对用户的提问进行实体提取、关系提取、时间提取、语义分析，并在知识图谱中通过多维匹配算法，最终精确分析当前处理案件，推送出相关指导案例。

需要说明的是，本说明书一个或多个实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。

需要说明的是，上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

基于同一发明构思，与上述任意实施例方法相对应的，本说明书一个或多个实施例还提供了一种基于知识图谱的案例推荐装置。

参考图3，所述一种基于知识图谱的案例推荐装置，包括：

特征提取模块301，被配置为响应于接收到用户输入的法律案件和/或问题的描述，对所述描述进行特征提取；

语义图搜索模块302，被配置为根据所述特征提取得到的特征，在预先基于案例相关文件构建的案例知识图谱中进行语义图搜索，搜索出与所述特征相关联的案例候选推荐数据；

输出模块303，被配置为输出所述案例候选推荐数据中的至少一个作为与所述描述相关的案例推荐数据。

作为一个可选的实施例，所述特征提取模块具体被配置为：

对所述描述进行预处理，以去除所述描述中的停用词；

对经过所述实体识别的所述描述采用DGCNN进行关系抽取；

对经过所述关系抽取、所述事件抽取和所述主题抽取得到的特征进行特征融合。

作为一个可选的实施例，所述关系抽取包括：

将所述序列H输入DGCNN自注意力层后得到序列H的向量表示；

将所述序列H的向量表示传入CNN的全连接层Dense中，用sigmoid 激活函数预测所述描述的主体的首尾位置；

随机采样一个所述主体，将所述序列H对应所述主体的子序列传入到一个双向LSTM神经网络中，得到所述主体的编码向量，所述主体的编码向量加上相对位置向量，得到一个与所述描述等长的向量序列；

作为一个可选的实施例，所述语义图搜索模块具体被配置为优先采用子图搜索方式进行搜索，无返回结果时采用所述特征自由组合的方式进行匹配搜索，直至匹配搜索成功。

作为一个可选的实施例，所述输出模块具体被配置为对所述特征提取方式提取出的所述特征进行加权平均，得出所述案例候选推荐数据的相关度评分，从所述案例候选推荐数据中选取相关度评分较高的案例候选推荐数据作为案例候选数据集；根据预定规则，过滤掉所述案例候选数据集中的异常案例。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

上述实施例的装置用于实现前述任一实施例中相应的基于知识图谱的案例推荐方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

基于同一发明构思，与上述任意实施例方法相对应的，本说明书一个或多个实施例还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上任意一实施例所述的基于案例知识图谱的案例推荐方法。

图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030 和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit， ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory，只读存储器)、RAM (Random AccessMemory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器 1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入 /输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

上述实施例的电子设备用于实现前述任一实施例中相应的基于案例知识图谱的案例推荐方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

基于同一发明构思，与上述任意实施例方法相对应的，本说明书一个或多个实施例还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使所述计算机执行如上任一实施例所述的基于案例知识图谱的案例推荐方法。

本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的基于知识图谱的案例推荐方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本公开的范围(包括权利要求)被限于这些例子；在本公开的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化，为了简明它们没有在细节中提供。

另外，为简化说明和讨论，并且为了不会使本说明书一个或多个实施例难以理解，在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外，可以以框图的形式示出装置，以便避免使本说明书一个或多个实施例难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本公开的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此，这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本公开的具体实施例对本公开进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态RAM(DRAM))可以使用所讨论的实施例。

本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本说明书一个或多个实施例的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种基于案例知识图谱的案例推荐方法，其特征在于，包括：

响应于接收到用户输入的法律案件和/或问题的描述，从所述描述中提取多维度特征，所述多维度特征包括实体、关系、事件和主题，

对所述描述进行预处理，以去除所述描述中的停用词；

对经过所述实体识别的所述描述采用基于堆叠膨胀门卷积神经网络DGCNN进行关系抽取；

对经过所述实体识别、所述关系抽取、所述事件抽取和所述主题抽取得到的相应特征进行融合；

2.根据权利要求1所述的案例推荐方法，其特征在于，对经过所述实体识别的所述描述采用DGCNN进行关系抽取，包括：

将所述混合编码输入到12层DGCNN中进行编码，得到编码后的序列H；

将所述序列H输入DGCNN自注意力层后得到序列H的向量表示；

3.根据权利要求1所述的案例推荐方法，其特征在于，对经过所述实体识别的所述描述进行事件抽取，包括：

根据提取出的所述触发词，提取相关所有可能的角色。

4.根据权利要求1至3中任一项所述的案例推荐方法，其特征在于，在预先基于案例相关文件构建的案例知识图谱中进行语义图搜索，搜索出与所述多维度特征相关联的案例候选推荐数据，包括：

5.根据权利要求1至3中任一项所述的案例推荐方法，其特征在于，输出所述案例候选推荐数据中的至少一个作为与所述描述相关的案例推荐数据，包括：

根据预定规则，过滤掉所述案例候选数据集中的异常案例。

6.一种基于案例知识图谱的案例推荐装置，其特征在于，包括：

特征提取模块，被配置为响应于接收到用户输入的法律案件和/或问题的描述，

从所述描述中提取多维度特征，所述多维度特征包括实体、关系、事件和主题，

对所述描述进行预处理，以去除所述描述中的停用词；

7.一种电子设备，包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现根据权利要求1至5中任意一项所述的方法。

8.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令在被计算机执行时，使所述计算机实现根据权利要求1至5中任意一项所述的方法。