CN110377730A

CN110377730A - 案由分类方法、装置、计算机设备和存储介质

Info

Publication number: CN110377730A
Application number: CN201910517242.0A
Authority: CN
Inventors: 汪成
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-06-14
Filing date: 2019-06-14
Publication date: 2019-10-25
Anticipated expiration: 2039-06-14
Also published as: WO2020248391A1; CN110377730B

Abstract

本申请涉及分类模型技术领域，提供了一种案由分类方法、装置、计算机设备和存储介质，包括首先获取案情文本，并构建案情文本对应的词嵌入；将构建得到的词嵌入输入至预设的分类模型中；分类模型为融合CNN模型以及DBM模型训练得到，分别通过CNN模型以及DBM模型提取所述词嵌入的特征向量；然后，对各个输出类别的特征向量进行融合，输出各个所述输出类别的目标特征向量；对所述目标特征向量进行sigmod计算得到对应的输出结果；最后，依次判断对应各个输出类别的输出结果是否大于阈值，若大于，则判定知识产权案件的案由为对应的输出类别。本申请实现对知识产权案件的案由进行分类。

Description

案由分类方法、装置、计算机设备和存储介质

技术领域

本申请涉及分类模型的技术领域，特别涉及一种案由分类方法、装置、计算机设备和存储介质。

背景技术

目前，人们对知识产权越来越重视，随之而来的是越来越多的知识产权案件发生。然而民法中知识产权案件的案由类型多达几十种，用户在面临知识产权案件发生时，非民法专业的人士很难对这些案件的案由类型进行区分，业内也没有专门针对知识产权案件进行案由分类的产品。

发明内容

本申请的主要目的为提供一种案由分类方法、装置、计算机设备和存储介质，实现对知识产权案件的案由进行分类。

为实现上述目的，本申请提供了一种案由分类方法，包括以下步骤：

获取案情文本，并构建所述案情文本对应的词嵌入；其中，所述案情文本为知识产权案件的案情文本；

将构建得到的词嵌入输入至预设的分类模型中；所述分类模型为融合CNN模型以及DBM模型训练得到，其中，所述CNN模型的全连接层与所述DBM模型的特征输出层共同连接的一个输出层作为所述分类模型的最终输出层；

分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量；其中，通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量，以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量；

通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合，输出各个所述输出类别的目标特征向量；并对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果；

依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别。

进一步地，所述通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合的融合计算过程为：

V＝f(yc+yd)，其中，V为目标特征向量，yc为局部特征向量，yd为全局特征向量；

所述对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果的计算过程为：

其中，所述f(V)的结果为0-1之间。

进一步地，所述获取案情文本，并构建所述案情文本对应的词嵌入的步骤之前，包括：

对训练集中的案情文本分别构建词嵌入，得到训练词嵌入；其中，所述训练集中的案情文本为知识产权案件的案情文本，且具有正确案由结果；

将所述训练词嵌入分别输入至原始CNN模型以及原始DBM模型中进行迭代训练，以使得所述原始CNN模型以及原始DBM模型的输出结果为所述训练集中案情文本对应的正确案由结果时，分别得到所述原始CNN模型以及原始DBM模型对应的训练参数；

根据所述原始CNN模型以及原始DBM模型对应的训练参数，得到训练完成的CNN模型以及DBM模型；

分别将所述训练词嵌入输入至所述训练完成的CNN模型以及DBM模型中，并通过所述训练完成的CNN模型的全连接层提取出所述训练词嵌入对应在各个输出类别的训练局部特征向量，以及通过所述DBM模型的特征输出层提取出所述训练词嵌入对应在各个输出类别的训练全局特征向量；

将对应所述各个输出类别的训练局部特征向量以及训练全局特征向量输入至最终输出层进行训练，当使得所述最终输出层的输出结果对应为所述正确案由结果时，得到所述最终输出层的训练参数；

根据所述原始CNN模型、原始DBM模型对应的训练参数以及所述最终输出层的训练参数，得到训练完成的所述分类模型。

进一步地，所述获取案情文本，并构建所述案情文本对应的词嵌入的步骤，包括：

获取所述案情文本，并对所述案情文本中的每一个语句进行分词，对分词后的词语进行语义识别以识别所述词语是否与案件的案情内容相关；

选择出包括有与案件的案情内容相关的词语的每一个语句，作为目标语句；

将所述目标语句按照在所述案情文本中的顺序进行组合，并输入至词向量模型中，以构建对应的词嵌入作为所述案情文本对应的词嵌入。

进一步地，所述依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别的步骤之后，包括：

对所述案情文本进行关键词识别，识别出所述知识产权案件的第一关键词；其中，所述第一关键词包括案发地点、案件涉及的企业名称中的至少一种；

根据所述知识产权案件的案由以及所述第一关键词，从数据库中查询出具有相同案由以及所述第一关键词的第一诉讼案件文本；并将所述第一诉讼案件文本推送至用户的用户终端。

进一步地，依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别的步骤之后，包括：

获取用户通过用户终端输入的所述知识产权案件的正确案由；所述正确案由为用户咨询专业人士之后得出的正确结果，并通过所述用户终端输入；

判断所述正确案由与所述知识产权案件的案由对应的输出类别是否相同；若不同，则将所述案情文本和所述正确案由组合为训练对，以迭代训练所述分类模型。

本申请还提供了一种案由分类装置，包括：

第一获取单元，用于获取案情文本，并构建所述案情文本对应的词嵌入；其中，所述案情文本为知识产权案件的案情文本；

输入单元，用于将构建得到的词嵌入输入至预设的分类模型中；所述分类模型为融合CNN模型以及DBM模型训练得到，其中，所述CNN模型的全连接层与所述DBM模型的特征输出层共同连接的一个输出层作为所述分类模型的最终输出层；

提取单元，用于分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量；其中，通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量，以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量；

融合单元，用于通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合，输出各个所述输出类别的目标特征向量；并对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果；

分类单元，用于依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别。

进一步地，所述融合单元通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合的融合计算过程为：

所述融合单元对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果的计算过程为：

其中，所述f(V)的结果为0-1之间。

本申请还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请提供的案由分类方法、装置、计算机设备和存储介质，包括首先获取案情文本，并构建所述案情文本对应的词嵌入；将构建得到的词嵌入输入至预设的分类模型中；所述分类模型为融合CNN模型以及DBM模型训练得到，分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量；其中，通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量，以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量；然后，对各个输出类别的所述局部特征向量以及全局特征向量进行融合，输出各个所述输出类别的目标特征向量；并对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果；最后，依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别；实现对知识产权案件的案由进行分类，最终获取到该知识产权案件的案由分类结果。

附图说明

图1是本申请一实施例中案由分类方法步骤示意图；

图2是本申请一实施例中案由分类装置结构框图；

图3是本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请一实施例中提供了一种案由分类方法，包括以下步骤：

步骤S1，获取案情文本，并构建所述案情文本对应的词嵌入；其中，所述案情文本为知识产权案件的案情文本；

步骤S2，将构建得到的词嵌入输入至预设的分类模型中；所述分类模型为融合CNN模型以及DBM模型训练得到，其中，所述CNN模型的全连接层与所述DBM模型的特征输出层共同连接的一个输出层作为所述分类模型的最终输出层；

步骤S3，分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量；其中，通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量，以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量；

步骤S4，通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合，输出各个所述输出类别的目标特征向量；并对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果；

步骤S5，依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别。

在本实施例中，上述案由分类方法应用于对知识产权案件案情文本的案由进行分类识别，以自动获取到所述知识产权案件的案由。

如上述步骤S1所述的，上述案情文本为关于知识产权案件的电子文本，为了使上述案情文本能够被本实施例中的分类模型所识别，需要对上述案情文本进行词嵌入的构建；构建词嵌入是使用密集向量来表示单词和文档的一类方法，是将词汇中的单词(也可能是短语)被映射到相对于词汇量的大小而言低维空间的实数向量矩阵中。上述安全文本中的每一个语句中都具有多个词，本实施例中构建每一个语句的词嵌入即是得到每一个语句的词向量，其实际上是将每一个语句中包括的词构成一个向量矩阵(或称句子矩阵)，该向量矩阵则为该语句的词嵌入。

如上述步骤S2所述的，本实施例中预先训练得到有一个分类模型(CNN-DBM模型)，该分类模型是基于CNN(卷积神经网络)模型以及DBM(data-based mechanistic)模型训练得到的一种新模型，该分类模型将CNN模型以及DBM模型进行了融合，使其在对案情文本进行分类时的效果更好，对专业词语、文本的识别能力更加出色。具体地，该分类模型中融合了CNN模型以及DBM模型，且所述CNN模型的全连接层与所述DBM模型的特征输出层共同连接一个目标输出层作为所述分类模型的最终输出层，即本实施例中的分类模型中不仅仅是包括有上述CNN模型以及DBM模型，而且是不再由上述CNN模型以及DBM模型单独输出分类结果，而是由CNN模型与DBM模型分别进行特征提取，将提取出的特征进行融合之后再由上述分类模型的最终输出层进行分类结果的输出。本实施例中在训练得到上述分类模型时，需要分别对上述CNN模型与DBM模型进行训练，然后再由CNN模型与DBM模型分别提取特征输入至最终输出层中进行融合训练以得到上述分类模型。

如上述步骤S3所述的，分别通过上述分类模型中的CNN模型与DBM模型提取所述词嵌入的特征向量，其中上述CNN模型是通过其全连接层的最后一层(即输出层的前一层)提取出对应的特征向量，由于上述CNN模型在提取特征向量时是通过卷积核的滑动来提取特征，因此其提取的特征向量为局部特征向量。上述DBM模型是无向图连接的神经网络，其通过相连两层的节点共同采样计算，使得文本表示更加准确，因此上述DBM模型提取的是全局特征向量，且上述DBM模型是通过其输出层提取出上述全局特征向量。上述CNN模型中，其卷积层尺寸设置为2,3,4,5,7，每个卷积层尺寸设置256个卷积核，卷积后进行最大池化；设置有两个全连接层，神经元个数分别为1024和256，全连接层的最后一层输出对应70个输出类别(案由为70种，因此设置有70个输出类别)的局部特征向量。上述DBM模型同样对应有70个输出类别；上述CNN模型与DBM模型均在各个输出类别中提取出相应的特征向量，然后进行各个输出类别的所述局部特征向量以及全局特征向量的融合。

如上述步骤S4所述的，通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合，输出对应各个输出类别的目标特征向量。上述CNN模型与DBM模型提取出上述词嵌入在各个输出类别的特征向量均不同，融合之后得到的目标特征向量具有上述特征向量的不同特点。本实施例中，将所述目标特征向量输入至最终输出层中进行计算，与单一特征向量输入时的计算原理一致，只是输入的向量(这里为融合得到的目标特征向量)不同。上述两个个特征向量融合后的目标特征向量是一个新的向量，输入至最终输出层中计算，最后进行分类，分类结果中融合了不同特征向量的特点，得到的分类结果相比于单独输入上述特征向量时的识别分类更准确。因此使得对案情文本进行分类时的效果更好，对专业词语、文本的识别能力更加出色。

在本实施例中，通过sigmod函数对上述目标特征向量进行计算，便可以得到对应的输出结果，其中，上述Sigmoid函数为神经网络的阈值函数，其可将变量映射到0，1之间。

如上述步骤S5所述的，上述输出结果是上述对应各个输出类别的目标特征向量在各个输出类别对应的输出结果，若判断该输出结果大于预设的阈值(如0.5)，则表明该输出结果为正确的分类结果，该输出类别即为上述知识产权案件对应的案由；其中，上述每一个输出类别均对应有一个案由。而上述对应各个输出类别的目标特征向量在各个输出类别对应的输出结果中最多只有一个结果会大于上述阈值，而该大于阈值的输出结果所对应的输出类别即是上述知识产权案件案情文本对应的案由；若上述输出结果中没有一个结果大于上述阈值，则表明该案情文本没有对应的案由分类结果，其可能并不是一个知识产权案件；此时，也可以返回一个相应无法分类的结果以进行提示。在本实施例中，由于经过上述CNN模型以及DBM模型分别进行特征的提取，再融合进行sigmod计算，使得上述分类模型对案情文本进行分类时的效果更好，对专业词语、文本的识别能力更加出色。

在一实施例中，上述通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合的融合计算过程为：

其中，所述f(V)的结果为0-1之间。

在使用上述分类模型进行知识产权案情文本进行案由分类之前，需要对上述分类模型进行预先训练。因此，在一实施例中，上述获取案情文本，并构建所述案情文本对应的词嵌入的步骤S1之前，包括：

步骤S11，对训练集中的案情文本分别构建词嵌入，得到训练词嵌入；其中，所述训练集中的案情文本为知识产权案件的案情文本，且具有正确案由结果；在本实施例中，上述训练集中预先构建有大量的训练文本，上述训练文本中包括有多个训练对，其中每个训练对由知识产权的案情文本及其对应的正确案由结果组成。本实施例中的训练词嵌入的构建过程与上述实施例中一致，在此不再进行赘述。

步骤S12，将所述训练词嵌入分别输入至原始CNN模型以及原始DBM模型中进行迭代训练，以使得所述原始CNN模型以及原始DBM模型的输出结果为所述训练集中案情文本对应的正确案由结果时，分别得到所述原始CNN模型以及原始DBM模型对应的训练参数；

步骤S13，根据所述原始CNN模型以及原始DBM模型对应的训练参数，得到训练完成的CNN模型以及DBM模型；本实施例中的，将得到的大量所述训练词嵌入分别依次输入至原始CNN模型以及原始DBM模型中进行迭代训练，以得到对应的训练参数；而将该训练参数代入至上述原始CNN模型以及原始DBM模型中，则得到训练完成的CNN模型以及DBM模型；应当注意的是，本实施例中原始CNN模型以及原始DBM模型都是包括有分类输出层的完整模型。

步骤S14，分别将所述训练词嵌入输入至所述训练完成的CNN模型以及DBM模型中，并通过所述训练完成的CNN模型的全连接层提取出所述训练词嵌入对应在各个输出类别的训练局部特征向量，以及通过所述DBM模型的特征输出层提取出所述训练词嵌入对应在各个输出类别的训练全局特征向量；在本实施例中，得到上述训练完成的CNN模型以及DBM模型，再分别提取特征向量；本实施例中，提取特征向量的过程与上述实施例中一致，在此不再进行赘述。

步骤S15，将对应所述各个输出类别的训练局部特征向量以及训练全局特征向量输入至最终输出层进行训练，当使得所述最终输出层的输出结果对应为所述正确案由结果时，得到所述最终输出层的训练参数；

步骤S16，根据所述原始CNN模型、原始DBM模型对应的训练参数以及所述最终输出层的训练参数，得到训练完成的所述分类模型。

在本实施例中，构建上述分类模型时，去掉上述CNN模型的输出层，将其全连接层与DBM模型的特征输出层相连后，再共同连接至最终输出层，该最终输出层进行输出结果的计算及分类。

在一实施例中，上述获取案情文本，并构建所述案情文本对应的词嵌入的步骤S1，包括：

S1a，获取所述案情文本，并对所述案情文本中的每一个语句进行分词，对分词后的词语进行语义识别以识别所述词语是否与案件的案情内容相关；

S1b，选择出包括有与案件的案情内容相关的词语的每一个语句，作为目标语句；

S1c，将所述目标语句按照在所述案情文本中的顺序进行组合，并输入至词向量模型中，以构建对应的词嵌入作为所述案情文本对应的词嵌入。

在本实施例中，为了降低构建词嵌入时的计算量，将上述案情文本中与案情内容无关的内容预先筛除，例如上述案情文本中的语气助词、形容词或者前述语句等。具体地，可以对其进行语义分析，判断其语义是否与案情内容相关。

在另一实施例中，上述步骤S1中，获取案情文本包括：

采集用户的语音信息，所述语音信息为所述用户对案情文本的语音描述信息；

对所述语音信息进行语音识别，并转换为所述案情文本。

在本实施例中，为了方便用户进行案情文本的输入，采用语音输入的方式，用户在用户终端上进行语音输入上述知识产权案件的案情，用户终端接收到上述语音信息之后，对其进行语音识别，转换为文本信息，即上述知识产权案件的案情文本。

在一实施例中，上述依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别的步骤S5之后，包括：

步骤S51，对所述案情文本进行关键词识别，识别出所述知识产权案件的第一关键词；其中，所述第一关键词包括案发地点、案件涉及的企业名称中的至少一种；

步骤S52，根据所述知识产权案件的案由以及所述第一关键词，从数据库中查询出具有相同案由以及所述第一关键词的第一诉讼案件文本；并将所述第一诉讼案件文本推送至用户的用户终端。在本实施例中，主要用于为用户推荐相似案件，上述数据库中存储有大量的诉讼案件文本，本实施例中，根据知识产权案件的案由以及所述第一关键词，从数据库中查询出具有相同案由以及所述第一关键词的第一诉讼案件文本。用户获取到上述第一诉讼案件文本之后，便于了解相应的诉讼过程、诉讼结果等。

在另一实施例中，上述依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别的步骤S5之后，包括：

步骤S501，获取用户通过用户终端输入的所述知识产权案件的正确案由；所述正确案由为用户咨询专业人士之后得出的正确结果，并通过所述用户终端输入；上述正确案由为法务人员针对上述知识产权案件的案情分析之后得出的结果，用户获取到上述正确案由之后，将其输入至用户终端中。

步骤S502，判断所述正确案由与所述知识产权案件的案由对应的输出类别是否相同；若不同，则将所述案情文本和所述正确案由组合为训练对，以迭代训练所述分类模型。若相同，则可以进一步验证本实施例中所使用的分类模型对知识产权案件案情文本的案由分类准确，对案情文本进行分类时的效果好。

综上所述，为本申请实施例中提供的案由分类方法，首先获取案情文本，并构建所述案情文本对应的词嵌入；将构建得到的词嵌入输入至预设的分类模型中；所述分类模型为融合CNN模型以及DBM模型训练得到，分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量；其中，通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量，以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量；然后，对各个输出类别的所述局部特征向量以及全局特征向量进行融合，输出各个所述输出类别的目标特征向量；并对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果；最后，依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别；实现对知识产权案件的案由进行分类，最终获取到该知识产权案件的案由分类结果。

参照图2，本申请一实施例中还提供了一种案由分类装置，包括：

第一获取单元10，用于获取案情文本，并构建所述案情文本对应的词嵌入；其中，所述案情文本为知识产权案件的案情文本；

输入单元20，用于将构建得到的词嵌入输入至预设的分类模型中；所述分类模型为融合CNN模型以及DBM模型训练得到，其中，所述CNN模型的全连接层与所述DBM模型的特征输出层共同连接的一个输出层作为所述分类模型的最终输出层；

提取单元30，用于分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量；其中，通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量，以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量；

融合单元40，用于通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合，输出各个所述输出类别的目标特征向量；并对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果；

分类单元50，用于依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别。

在一实施例中，所述融合单元40通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合的融合计算过程为：

所述融合单元40对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果的计算过程为：

其中，所述f(V)的结果为0-1之间。

在一实施例中，上述案由分类装置，还包括：

构建单元，用于对训练集中的案情文本分别构建词嵌入，得到训练词嵌入；其中，所述训练集中的案情文本为知识产权案件的案情文本，且具有正确案由结果；

训练输入单元，用于将所述训练词嵌入分别输入至原始CNN模型以及原始DBM模型中进行迭代训练，以使得所述原始CNN模型以及原始DBM模型的输出结果为所述训练集中案情文本对应的正确案由结果时，分别得到所述原始CNN模型以及原始DBM模型对应的训练参数；

模型训练单元，用于根据所述原始CNN模型以及原始DBM模型对应的训练参数，得到训练完成的CNN模型以及DBM模型；

训练提取单元，用于分别将所述训练词嵌入输入至所述训练完成的CNN模型以及DBM模型中，并通过所述训练完成的CNN模型的全连接层提取出所述训练词嵌入对应在各个输出类别的训练局部特征向量，以及通过所述DBM模型的特征输出层提取出所述训练词嵌入对应在各个输出类别的训练全局特征向量；

训练融合单元，用于将对应所述各个输出类别的训练局部特征向量以及训练全局特征向量输入至最终输出层进行训练，当使得所述最终输出层的输出结果对应为所述正确案由结果时，得到所述最终输出层的训练参数；

分类模型训练单元，用于根据所述原始CNN模型、原始DBM模型对应的训练参数以及所述最终输出层的训练参数，得到训练完成的所述分类模型。

在一实施例中，上述第一获取单元，包括：

获取子单元，用于获取所述案情文本，并对所述案情文本中的每一个语句进行分词，对分词后的词语进行语义识别以识别所述词语是否与案件的案情内容相关；

选择子单元，用于选择出包括有与案件的案情内容相关的词语的每一个语句，作为目标语句；

组合子单元，用于将所述目标语句按照在所述案情文本中的顺序进行组合，并输入至词向量模型中，以构建对应的词嵌入作为所述案情文本对应的词嵌入。

在一实施例中，上述案由分类装置，还包括：

识别单元，用于对所述案情文本进行关键词识别，识别出所述知识产权案件的第一关键词；其中，所述第一关键词包括案发地点、案件涉及的企业名称中的至少一种；

推送单元，用于根据所述知识产权案件的案由以及所述第一关键词，从数据库中查询出具有相同案由以及所述第一关键词的第一诉讼案件文本；并将所述第一诉讼案件文本推送至用户的用户终端。

在一实施例中，上述案由分类装置，还包括：

第二获取单元，用于获取用户通过用户终端输入的所述知识产权案件的正确案由；所述正确案由为用户咨询专业人士之后得出的正确结果，并通过所述用户终端输入；

判断单元，用于判断所述正确案由与所述知识产权案件的案由对应的输出类别是否相同；若不同，则将所述案情文本和所述正确案由组合为训练对，以迭代训练所述分类模型。

本实施例中的案由分类装置中各个单元、子单元的具体实现方式，参照上述方法实施例中的具体阐释，在此不再进行赘述。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储案情文本、训练集等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述任意一项所述的案由分类方法。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任意一项所述的案由分类方法。

综上所述，为本申请实施例中提供的案由分类方法、装置、计算机设备和存储介质，包括首先获取案情文本，并构建所述案情文本对应的词嵌入；将构建得到的词嵌入输入至预设的分类模型中；所述分类模型为融合CNN模型以及DBM模型训练得到，分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量；其中，通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量，以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量；然后，对各个输出类别的所述局部特征向量以及全局特征向量进行融合，输出各个所述输出类别的目标特征向量；并对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果；最后，依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别；实现对知识产权案件的案由进行分类，最终获取到该知识产权案件的案由分类结果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储与一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM通过多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种案由分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的案由分类方法，其特征在于，所述通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合的融合计算过程为：

其中，所述f(V)的结果为0-1之间。

3.根据权利要求1所述的案由分类方法，其特征在于，所述获取案情文本，并构建所述案情文本对应的词嵌入的步骤之前，包括：

4.根据权利要求1所述的案由分类方法，其特征在于，所述获取案情文本，并构建所述案情文本对应的词嵌入的步骤，包括：

5.根据权利要求1所述的案由分类方法，其特征在于，所述依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别的步骤之后，包括：

6.根据权利要求1所述的案由分类方法，其特征在于，依次判断对应各个所述输出类别的所述输出结果是否大于阈值，若大于，则判定所述知识产权案件的案由为对应的输出类别的步骤之后，包括：

7.一种案由分类装置，其特征在于，包括：

8.根据权利要求7所述的案由分类装置，其特征在于，所述融合单元通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合的融合计算过程为：

其中，所述f(V)的结果为0-1之间。

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。