WO2021072892A1

WO2021072892A1 - 基于神经网络混合模型的法律条文检索方法及相关设备

Info

Publication number: WO2021072892A1
Application number: PCT/CN2019/119314
Authority: WO
Inventors: 于修铭; 雷骏峰; 刘嘉伟; 陈晨; 李可; 汪伟
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-10-18
Filing date: 2019-11-19
Publication date: 2021-04-22
Also published as: CN110928987B; CN110928987A

Abstract

一种基于神经网络混合模型的法律条文检索方法及相关设备，涉及人工智能领域，所述方法包括：获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量（s101）；对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量（s102）；将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量（s103）；对所述混合堆栈向量进行归一化处理，获得文本检索结果（s104）。该方法通过对输入文本进行多路输入，并对多路输入向量化，进行堆栈嵌入循环运算，对运算后的结果拼接后再次进行堆栈嵌入循环运算，获得法律条文的检索结果，可以有效提高法律条文检索的准确度。

Description

基于神经网络混合模型的法律条文检索方法及相关设备

本申请要求于2019年10月18日提交中国专利局、申请号为201910991657.1、发明名称为“基于神经网络混合模型的法律条文检索方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中

技术领域

本申请涉及人工智能领域，特别涉及一种基于神经网络混合模型的法律条文检索方法及相关设备。

背景技术

知识图谱技术日益成为人工智能的基础，它是机器理解自然语言和构建知识网络的重要方法。近年来，知识图谱在司法领域的运用悄然兴起,法律条文的快速检索系统能够依赖法律知识图谱，根据用户输入的文本内容快速地在线检索法律条文，提高法院审判工作质量和效率，该系统主要包括两种类型的快速检索功能，一是根据法律条文对其相关法律条文的检索，二是根据案件要素信息对相关法律条文的检索。

法律条文检索系统通常被法律从业人员用于根据案件中的信息对相关法律条文进行检索，提高案件处理的效率，无需手动翻阅查找相关法律条文；而目前的法律条文检索通常都是通过自然语言处理技术，采用的方法较多为文本相似度、关键词匹配等方法，其中最典型的是transformer算法，该算法基于transformer模型，通过该模型，可以获取案件中的相关法律条文信息，但是该模型在训练过程中，只能够学习到文本的上文或者下文内容，因此预测准确度不高，且耗时较长。

发明内容

本申请的目的在于针对现有技术的不足，提供一种基于神经网络混合模型的法律条文检索方法及相关设备，通过对输入文本进行多路输入，并对多路输入向量化，进行堆栈嵌入循环运算，对运算后的结果拼接后再次进行堆栈嵌入循环运算，获得法律条文的检索结果，可以有效提高法律条文检索的准确度。

为达到上述目的，本申请的技术方案提供一种基于神经网络混合模型的法律条文检索方法及相关设备。

本申请公开了一种基于神经网络混合模型的法律条文检索方法，包括以下步骤：

获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量；

对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量；

将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量；

对所述混合堆栈向量进行归一化处理，获得文本检索结果。

本申请还公开了一种基于神经网络混合模型的法律条文检索装置，所述装置包括：

获取模块：设置为获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量；

第一堆栈模块：设置为对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量；

第二堆栈模块：设置为将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量；

输出模块：设置为对所述混合堆栈向量进行归一化处理，获得文本检索结果。

本申请还公开了一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被一个或多个所述处理器执行时，使得一个或多个所述处理器执行以下步骤：

对所述混合堆栈向量进行归一化处理，获得文本检索结果。

本申请还公开了一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，也可以是易失性计算机可读存储介质，所述存储介质可被处理器读写，所述存储介质存储有计算机指令，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

对所述混合堆栈向量进行归一化处理，获得文本检索结果。

本申请的有益效果是：本申请通过对输入文本进行多路输入，并对多路输入向量化，进行堆栈嵌入循环运算，对运算后的结果拼接后再次进行堆栈嵌入循环运算，获得法律条文的检索结果，可以有效提高法律条文检索的准确度。

附图说明

图1为本申请第一个实施例的一种基于神经网络混合模型的法律条文检索方法的流程示意图；

图2为本申请第二个实施例的一种基于神经网络混合模型的法律条文检索方法的流程示意图；

图3为本申请第三个实施例的一种基于神经网络混合模型的法律条文检索方法的流程示意图；

图4为本申请第四个实施例的一种基于神经网络混合模型的法律条文检索方法的流程示意图；

图5为本申请第五个实施例的一种基于神经网络混合模型的法律条文检索方法的流程示意图；

图6为本申请第六个实施例的一种基于神经网络混合模型的法律条文检索方法的流程示意图；

图7为本申请第七个实施例的一种基于神经网络混合模型的法律条文检索方法的流程示意图；

图8为本申请实施例的一种基于神经网络混合模型的法律条文检索装置结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请第一个实施例的一种基于神经网络混合模型的法律条文检索方法流程如图1所示，本实施例包括以下步骤：

步骤s101，获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量；

具体的，所述输入文本为任意长度的法律条文内容，可以是完整的一句话，例如：“想问借贷关系中需要参考哪些法律条文？”，当用户在系统中输入上述句子后，系统可获取所述输入文本。

具体的，通过用户输入的文本信息，可通过实体链接技术提取所述输入文本中的要素信息，所述要素信息可包括：争议焦点、小事实要素、证据，例如：“想问借贷关系中需要参考哪些法律条文？”文本中，争议焦点是“借贷关系是否成立”，小事实要素是“是否签订借条/欠条/收据/借款合同”，证据是“借款合同”。

具体的，当获取到输入文本后，通过分别对所述输入文本及文本中的要素信息进行向量化，可以获得第一文本向量及第二文本向量。

步骤s102，对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量；

具体的，所述堆栈嵌入包括对所述第一文本向量及所述第二文本向量进行嵌入操作，并将多个嵌入操作串联起来执行，完成堆栈嵌入操作；当执行嵌入操作时，首先获取所述第一文本向量及所述第二文本向量中的位置信息，所述位置信息根据计算公式

获得，其中p代表词向量中词的位置、i表示词向量中每一个词对应向量中元素的位置，d表示向量维度；然后将所述位置信息与所述第一文本向量及所述第二文本向量分别进行相加，获得第一位置向量及第二位置向量。

具体的，当获得所述第一位置向量及所述第二位置向量之后，将所述第一位置向量及所述第二位置向量输入神经网络模型，进行归一化处理，所述归一化可根据公式

进行，其中，μ为均值，σ为方差，a为位置向量，H为神经网络中神经元个数，由此获得第一归一化隐向量及第二归一化隐向量；然后将所述第一归一化隐向量及第二归一化隐向量输入卷积神经网络，进行特征提取，所述特征提取可通过卷积神经网络的卷积核进行提取，所述特征提取包括向量特征的提取，在向量特征进行提取后，将特征提取后的向量分别与所述第一位置向量和所述第二位置向量相加，获得第一特征隐向量及第二特征隐向量。

具体的，当获取到所述第一特征隐向量及所述第二特征隐向量后，可从所述第一特征隐向量及所述第二特征隐向量中获取位置信息，并将所述位置信息与所述第一特征隐向量及所述第二特征隐向量分别相加，获得新的第一位置向量及第二位置向量，然后将新的第一位置向量及第二位置向量输入神经网络进行归一化处理获得新的第一归一化隐向量及第二归一化隐向量，最后将新的第一归一化隐向量及第二归一化隐向量再次输入卷积神经网络进行特征提取，获得新的第一特征隐向量及第二特征隐向量，并重复本步骤N次，其中，所述重复的次数N可以预先设定，例如N＝6，当N＝6时可得到较好的结果，当完成N次本步骤之后，获得第一特征向量及第二特征向量。

具体的，当获取到所述第一特征向量及所述第二特征向量后，可将所述第一特征向量及所述第二特征向量再次输入神经网络模型进行归一化处理，获得第一归一化向量及第二归一化向量，然后将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行计算，并将计算后的向量分别与所述第一特征向量及第二特征向量相加，获得第一编码块向量及第二编码块向量；获得了编码块向量即意味着完成了嵌入操作。

具体的，当获取到所述第一编码块向量及所述第二编码块向量后，再将所述第一编码块向量及所述第二编码块向量与编码块向量对应的位置信息相加，获得新的第一位置信息及第二位置信息，然后将新的第一位置信息及第二位置信息输入神经网络模型进行归一化处理，获得新的第一归一化隐向量和第二归一化隐向量，并将新的第一归一化隐向量和第二归一化隐向量再次输入卷积神经网络模型进行特征提取，获得新的第一特征向量及第二特征向量，接着将新的第一特征向量及第二特征向量输入神经网络模型进行归一化处理，获得新的第一归一化向量及第二归一化向量，最后将新的第一归一化向量及第二归一化向量输入自注意力神经网络模型中进行计算，并将计算获得的结果分别与新的第一特征向量及第二特征向量相加，获得新的第一编码块向量及第二编码块向量，并重复本步骤N次，其中，所述重复的次数N可以预先设定，例如N＝6，当N＝6时可得到较好的结果，当完成N次本步骤之后，获得第一循环向量及第二循环向量，获得了循环向量即意味着完成了堆栈嵌入操作。

步骤s103，将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量；

具体的，当获取到所述第一循环向量与所述第二循环向量之后，可对所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，所述拼接为向量与向量之间的拼接，例如，如果所述第一循环向量是20*128维的向量，所述第二循环向量是30*128维的向量，则拼接后的向量，即混合向量为50*128维的向量。

具体的，当获取到所述混合向量后，可对所述混合向量进行堆栈嵌入，所述堆栈嵌入的操作可按照步骤s102的方式进行，即将所述混合向量与其对应的位置信息相加，获得新的位置向量，然后对新的位置向量进行归一化获得新的归一化隐向量，接着对新的归一化隐向量进行特征提取，获得新的特征向量，并对新的特征向量再次进行归一化获得新的归一化向量，最后对新的归一化向量输入自注意力神经网络模型进行计算，并将计算结果与新的特征向量相加获得新的编码块向量，将新的编码块向量循环进行前述步骤后获得循环向量，所述最终的循环向量即为合堆栈向量。

步骤s104，对所述混合堆栈向量进行归一化处理，获得文本检索结果。

具体的，当获取到所述混合堆栈向量之后，可对所述混合堆栈向量进行线性处理，所述线性处理包括将所述混合堆栈向量输入卷积神经网络的全连接层进行线性处理，获得待分类向量，所述全连接层可看成是矩阵乘法，例如：输入向量是一个128*128的向量，[1,2,...,128*128]，而全连接层的矩阵为一个(128*128)*4的矩阵,那么得到的结果即为长度为(1,4)的向量，对所述混合堆栈向量的线性处理的目的是为了降维，例如，上述例子中通过线性处理后向量从128维降到了4维，所述降维后的4维向量即为待分类向量。其中，经过全连接层后的向量维度即是检索的法律条文的总数目，例如，如果检索的法律条文的总数为2000，则输出的向量即为(1，2000)的向量。因此所述全连接层的构建需根据法律条文的数目进行预先设定。

具体的，当获取到待分类向量之后，可对所述待分类向量进行归一化处理，所述归一化处理可以通过softmax函数进行，当对所述待分类向量进行归一化处理之后，就会根据所述待分类向量的维度输出每个维度对应的概率，其中，每个维度对应一个法律条文。

具体的，还可预设法律条文的概率阈值，当获取到每个法律条文的概率后，可将所述概率分别与预设的概率阈值进行比较，如果概率大于所述概率阈值，则将所述概率对应的法律条文进行输出，否则不输出。

本实施例中，通过对输入文本进行多路输入，并对多路输入向量化，进行堆栈嵌入循环运算，对运算后的结果拼接后再次进行堆栈嵌入循环运算，获得法律条文的检索结果，可以有效提高法律条文检索的准确度。

图2为本申请第二个实施例的一种基于神经网络混合模型的法律条文检索方法流程示意图，如图所示，所述步骤s101，获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量，包括：

步骤s201，获取输入文本，将所述输入文本设置为第一文本；

具体的，当获取到输入文本之后，可将所述输入文本复制分成两份，并将所述输入文本设置为第一文本。

步骤s202，对所述第一文本进行实体链接，获得所述第一文本中的要素，将所述要素拼接成上下文，将所述上下文设置为第二文本；

具体的，可通过实体链接技术提取所述输入文本中的要素信息，所述要素信息包括：争议焦点、小事实要素、证据，例如：“想问借贷关系中需要参考哪些法律条文？”文本中，争议焦点是“借贷关系是否成立”，小事实要素是“是否签订借条/欠条/收据/借款合同”，证据是“借款合同”；然后将所有的要素信息拼接成上下文，并可将所述上下文设置为第二文本。

步骤s203，分别对所述第一文本和所述第二文本进行向量化，获得第一文本向量及第二文本向量。

具体的，当获取到第一文本及第二文本后，可分别对所述第一文本及第二文本进行向量化，获得第一文本向量及第二文本向量。

本实施例中，通过对输入文本分成两路，并对两路文本进行不同的处理，以及进行向量化，可以更多的获取文本中的上下文信息，提高文本的检索效果。

图3为本申请第三个实施例的一种基于神经网络混合模型的法律条文检索方法流程示意图，如图所示，所述步骤s203，分别对所述第一文本和所述第二文本进行向量化，获得第一文本向量及第二文本向量，包括：

步骤s301，对所述第一文本和所述第二文本进行字分割，获得第一文本和第二文本中的每个字；

具体的，所述字分割可以通过分词工具进行，当对所述第一文本和所述第二文本进行字分割后，可获得第一文本和第二文本中的每个字。

步骤s302，预设向量的维度，根据所述向量的维度分别对所述第一文本的每个字和所述第二文本的每个字进行向量化，获得第一文本向量和第二文本向量。

具体的，所述向量化可通过word2Vec方法进行，所述向量的维度可以设定为128维，例如，如果向量化的函数为X＝V(char)，其中，char表示每个字，则V(“想”)＝[v1，v2，...，v128]，而V(“想”)是一个128维的向量。所述文本向量的维度用于确定所述输入文本中字的向量数目，所述文本向量的维度可以预先设定，例如，设定为128，则本次输入文本的字向量数目为128，当所述输入文本的字向量数目超过128时，超过128的字向量直接删除，如果本次输入文本的字向量不足128，则不足的字向量用0补足。例如：用户输入文本：“想问借贷关系中需要参考哪些法律条文？”，则对文本中的字进行向量化后，可获得X1＝V(‘想’)，X2＝V(‘问’)，X3＝V(‘借’)，X4＝V(‘贷’)……，X17＝V(‘文’)，X18＝V(‘？’)，X19＝[0,0,0,……,0]……,X128＝[0,0,0,……,0]；当对所述第一文本及所述第二文本中的每个字进行向量化后，可获得第一文本向量和第二文本向量。

本实施例中，通过对文本进行向量化，可以更好的获取文本中的上下文信息，更精确的实现文本检索。

图4为本申请第四个实施例的一种基于神经网络混合模型的法律条文检索方法流程示意图，如图所示，所述步骤s102，对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量，包括：

步骤s401，将所述第一文本向量与所述第一文本向量的位置信息相加，获得第一位置向量，将所述第二文本向量与所述第二文本向量的位置信息相加，获得第二位置向量；

具体的，首先获取所述第一文本向量及所述第二文本向量中的位置信息，所述位置信息根据计算公式

步骤s402，分别将所述第一位置向量与所述第二位置向量输入神经网络模型进行归一化处理，获得第一归一化隐向量及第二归一化隐向量；

进行，其中，μ为均值，σ为方差，a为位置向量，H为神经网络中神经元个数，由此获得第一归一化隐向量及第二归一化隐向量。

步骤s403，对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量；

具体的，当获得所述第一归一化隐向量及所述第二归一化隐向量后，可将所述第一归一化隐向量及第二归一化隐向量输入卷积神经网络，进行特征提取，所述特征提取可通过卷积神经网络的卷积核进行提取，所述特征提取包括向量特征的提取，在向量特征进行提取后，获得第一特征向量及第二特征向量。

步骤s404，将所述第一特征向量及所述第二特征向量输入神经网络模型进行归一化处理，获得第一归一化向量及第二归一化向量，将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块向量，对所述第一编码块向量及所述第二编码块向量进行循环处理，获得第一循环向量及第二循环向量。

具体的，当获得所述第一特征向量及所述第二特征向量后，可将所述第一特征向量及所述第二特征向量输入神经网络模型进行归一化处理，获得第一归一化向量及第二归一化向量，并将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块向量，然后对所述第一编码块向量及所述第二编码块向量进行循环处理，获得第一循环向量及第二循环向量。

本实施例中，通过对文本向量进行堆栈嵌入操作，可以提高文本信息的采集和识别，提高文本检索的准确度。

图5为本申请第五个实施例的一种基于神经网络混合模型的法律条文检索方法流程示意图，如图所示，所述步骤s403，对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量，包括：

步骤s501，将所述第一归一化隐向量及所述第二归一化隐向量输入神经网络模型进行特征提取，将所述特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，获得第一特征隐向量及第二特征隐向量；

具体的，当获得所述第一归一化隐向量及所述第二归一化隐向量后，可将所述第一归一化隐向量及第二归一化隐向量输入卷积神经网络，进行特征提取，所述特征提取可通过卷积神经网络的卷积核进行提取，所述特征提取包括向量特征的提取，在向量特征进行提取后，将特征提取后的向量分别与所述第一位置向量和所述第二位置向量相加，获得第一特征隐向量及第二特征隐向量。

步骤s502，预设第一循环次数，将所述第一特征隐向量及所述第二特征隐向量输入神经网络模型进行归一化，将归一化后获得的向量输入神经网络模型进行特征提取，将特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，并根据预设的第一循环次数重复执行本步骤，获得第一特征向量及第二特征向量。

具体的，当获取到所述第一特征隐向量及所述第二特征隐向量后，可从所述第一特征隐向量及所述第二特征隐向量中获取位置信息，并将所述位置信息与所述第一特征隐向量及所述第二特征隐向量分别相加，获得新的第一位置向量及第二位置向量，然后将新的第一位置向量及第二位置向量输入神经网络进行归一化处理获得新的第一归一化隐向量及第二归一化隐向量，最后将新的第一归一化隐向量及第二归一化隐向量再次输入卷积神经网络进行特征提取，获得新的第一特征隐向量及第二特征隐向量，并重复本步骤N次，其中，所述重复的次数N可以预先设定，例如N＝6，当N＝6时可得到较好的结果，在重复进行本步骤时，本次的输出作为下次的输入；当完成N次本步骤之后，获得第一特征向量及第二特征向量。

本实施例中，通过对文本向量进行特征提取，可以更精确的提取文本中的特征信息，提高文本检索的精确度。

图6为本申请第六个实施例的一种基于神经网络混合模型的法律条文检索方法流程示意图，如图所示，所述步骤s502，将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块向量，对所述第一编码块向量及所述第二编码块向量进行循环处理，获得第一循环向量及第二循环向量，包括：

步骤s601，将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，将模型处理后获得的向量分别与所述第一特征向量及所述第二特征向量进行相加，获得第一编码块向量及第二编码块向量；

具体的，当获得所述第一归一化向量及所述第二归一化向量后，可将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行计算，并将计算后的向量分别与所述第一特征向量及第二特征向量相加，获得第一编码块向量及第二编码块向量。

步骤s602，预设第二循环次数，将所述第一编码块向量及所述第二编码块向量分别与位置信息相加获得位置向量，将所述位置向量输入神经网络模型进行归一化处理，获得归一化隐向量，将所述归一化隐向量进行特征提取，获得特征向量，将所述特征向量进行归一化处理，获得归一化向量，将所述归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块编码块向量，并根据预设的第二循环次数重复执行本步骤，获得第一循环向量及第二循环向量。

具体的，当获取到所述第一编码块向量及所述第二编码块向量后，再将所述第一编码块向量及所述第二编码块向量与编码块向量对应的位置信息相加，获得新的第一位置信息及第二位置信息，然后将新的第一位置信息及第二位置信息输入神经网络模型进行归一化处理，获得新的第一归一化隐向量和第二归一化隐向量，并将新的第一归一化隐向量和第二归一化隐向量再次输入卷积神经网络模型进行特征提取，获得新的第一特征向量及第二特征向量，接着将新的第一特征向量及第二特征向量输入神经网络模型进行归一化处理，获得新的第一归一化向量及第二归一化向量，最后将新的第一归一化向量及第二归一化向量输入自注意力神经网络模型中进行计算，并将计算获得的结果分别与新的第一特征向量及第二特征向量相加，获得新的第一编码块向量及第二编码块向量，并重复本步骤N次，其中，所述重复的次数N可以预先设定，例如N＝6，当N＝6时可得到较好的结果，在重复进行本步骤时，本次的输出作为下次的输入；当完成N次本步骤之后，获得第一循环向量及第二循环向量。

本实施例中，通过对文本向量进行堆栈嵌入处理，可以提高文本检索的精确度。

图7为本申请第七个实施例的一种基于神经网络混合模型的法律条文检索方法流程示意图，如图所示，所述步骤s104，对所述混合堆栈向量进行归一化处理，获得文本检索结果，包括：

步骤s701，预设法律条文概率阈值；

具体的，所述概率阈值用于将概率较低的法律条文进行排除，可预先在系统中进行设置。

步骤s702，将所述混合堆栈向量输入卷积神经网络的全连接层进行线性处理，获得待分类向量，并对所述待分类向量进行归一化处理，获得每一条法律条文对应的概率；

具体的，当获取到所述混合堆栈向量之后，可对所述混合堆栈向量进行线性处理，所述线性处理包括将所述混合堆栈向量输入卷积神经网络的全连接层进行线性处理，获得待分类向量，所述全连接层可看成是矩阵乘法，例如：输入向量是一个128*128的向量，[1,2,...,128*128]，而全连接层的矩阵为一个(128*128)*4的矩阵,那么得到的结果即为长度为(1,4)的向量，对所述混合堆栈向量的线性处理的目的是为了降维，例如，上述例子中通过线性处理后向量从 128维降到了4维，所述降维后的4维向量即为待分类向量。其中，经过全连接层后的向量维度即是检索的法律条文的总数目，例如，如果检索的法律条文的总数为2000，则输出的向量即为(1，2000)的向量。因此所述全连接层的构建需根据法律条文的数目进行预先设定。

步骤s703，将所述每一条法律条文对应的概率与所述预设的法律条文概率阈值进行比较，将所有大于所述法律条文概率阈值的法律条文进行输出。

具体的，当获取到每个法律条文的概率后，可将每一条法律条文对应的概率分别与预设的概率阈值进行比较，如果概率大于所述概率阈值，则将所述概率对应的法律条文进行输出，否则不输出。

本实施例中，通过设置概率阈值，并将大于所述概率阈值的法律条文进行输出，可以快速获得文本检索结果。

本申请实施例的一种基于神经网络混合模型的法律条文检索装置结构如图8所示，包括：

获取模块801、第一堆栈模块802、第二堆栈模块803及输出模块804；其中，获取模块801与第一堆栈模块802相连，第一堆栈模块802与第二堆栈模块803相连，第二堆栈模块803与输出模块804相连；获取模块801设置为获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量；第一堆栈模块802设置为对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量；第二堆栈模块803设置为将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量；输出模块804设置为对所述混合堆栈向量进行归一化处理，获得文本检索结果。

本申请实施例还公开了一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被一个或多个所述处理器执行时，使得一个或多个所述处理器执行上述各实施例中所述检索方法中的步骤。

本申请实施例还公开了一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，也可以是易失性计算机可读存储介质，所述存储介质可被处理器读写，所述存储器存储有计算机可读指令，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述各实施例中所述检索方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种基于神经网络混合模型的法律条文检索方法，包括以下步骤：

获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量；

对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量；

将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量；

对所述混合堆栈向量进行归一化处理，获得文本检索结果。
如权利要求1所述的基于神经网络混合模型的法律条文检索方法，其中，所述获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量，包括：

获取输入文本，将所述输入文本设置为第一文本；

对所述第一文本进行实体链接，获得所述第一文本中的要素，将所述要素拼接成上下文，将所述上下文设置为第二文本；

分别对所述第一文本和所述第二文本进行向量化，获得第一文本向量及第二文本向量。
如权利要求2所述的基于神经网络混合模型的法律条文检索方法，其中，所述分别对所述第一文本和所述第二文本进行向量化，获得第一文本向量及第二文本向量，包括：

对所述第一文本和所述第二文本进行字分割，获得第一文本和第二文本中的每个字；

预设向量的维度，根据所述向量的维度分别对所述第一文本的每个字和所述第二文本的每个字进行向量化，获得第一文本向量和第二文本向量。
如权利要求3所述的基于神经网络混合模型的法律条文检索方法，其中，所述对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量，包括：

将所述第一文本向量与所述第一文本向量的位置信息相加，获得第一位置向量，将所述第二文本向量与所述第二文本向量的位置信息相加，获得第二位置向量；

分别将所述第一位置向量与所述第二位置向量输入神经网络模型进行归一化处理，获得第一归一化隐向量及第二归一化隐向量；

对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量；

将所述第一特征向量及所述第二特征向量输入神经网络模型进行归一化处理，获得第一归一化向量及第二归一化向量，将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块向量，对所述第一编码块向量及所述第二编码块向量进行循环处理，获得第一循环向量及第二循环向量。
如权利要求4所述的基于神经网络混合模型的法律条文检索方法，其中，所述对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量，包括：

将所述第一归一化隐向量及所述第二归一化隐向量输入神经网络模型进行特征提取，将所述特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，获得第一特征隐向量及第二特征隐向量；

预设第一循环次数，将所述第一特征隐向量及所述第二特征隐向量输入神经网络模型进行归一化，将归一化后获得的向量输入神经网络模型进行特征提取，将特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，并根据预设的第一循环次数重复执行本步骤，获得第一特征向量及第二特征向量。
如权利要求5所述的基于神经网络混合模型的法律条文检索方法，其中，所述将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块向量，对所述第一编码块向量及所述第二编码块向量进行循环处理，获得第一循环向量及第二循环向量，包括：

将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，将模型处理后获得的向量分别与所述第一特征向量及所述第二特征向量进行相加，获得第一编码块向量及第二编码块向量；

预设第二循环次数，将所述第一编码块向量及所述第二编码块向量分别与位置信息相加获得位置向量，将所述位置向量输入神经网络模型进行归一化处理，获得归一化隐向量，将所述归一化隐向量进行特征提取，获得特征向量，将所述特征向量进行归一化处理，获得归一化向量，将所述归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块编码块向量，并根据预设的第二循环次数重复执行本步骤，获得第一循环向量及第二循环向量。
如权利要求6所述的基于神经网络混合模型的法律条文检索方法，其中，所述对所述混合堆栈向量进行归一化处理，获得文本检索结果，包括：

预设法律条文概率阈值；

将所述混合堆栈向量输入卷积神经网络的全连接层进行线性处理，获得待分类向量，并对所述待分类向量进行归一化处理，获得每一条法律条文对应的概率；

将所述每一条法律条文对应的概率与所述预设的法律条文概率阈值进行比较，将所有大于所述法律条文概率阈值的法律条文进行输出。
一种基于神经网络混合模型的法律条文检索装置，所述装置包括：

获取模块：设置为获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量；

第一堆栈模块：设置为对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量；

第二堆栈模块：设置为将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量；

输出模块：设置为对所述混合堆栈向量进行归一化处理，获得文本检索结果。
根据权利要求8所述的基于神经网络混合模型的法律条文检索装置，其中，所述获取模块，包括：

设置单元：设置为获取输入文本，将所述输入文本设置为第一文本；

拼接单元：设置为对所述第一文本进行实体链接，获得所述第一文本中的要素，将所述要素拼接成上下文，将所述上下文设置为第二文本；

第一向量化单元：设置为分别对所述第一文本和所述第二文本进行向量化，获得第一文本向量及第二文本向量。
根据权利要求9所述的基于神经网络混合模型的法律条文检索装置，其中，所述获取模块，包括：

分割单元：设置为对所述第一文本和所述第二文本进行字分割，获得第一文本和第二文本中的每个字；

第二向量化单元：设置为预设向量的维度，根据所述向量的维度分别对所述第一文本的每个字和所述第二文本的每个字进行向量化，获得第一文本向量和第二文本向量。
根据权利要求10所述的基于神经网络混合模型的法律条文检索装置，其中，所述第一堆栈模块，包括：

位置向量获取单元：设置为将所述第一文本向量与所述第一文本向量的位置信息相加，获得第一位置向量，将所述第二文本向量与所述第二文本向量的位置信息相加，获得第二位置向量；

归一化单元：设置为分别将所述第一位置向量与所述第二位置向量输入神经网络模型进行归一化处理，获得第一归一化隐向量及第二归一化隐向量；

第一特征提取单元：设置为对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量；

第一循环处理单元：设置为将所述第一特征向量及所述第二特征向量输入神经网络模型进行归一化处理，获得第一归一化向量及第二归一化向量，将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块向量，对所述第一编码块向量及所述第二编码块向量进行循环处理，获得第一循环向量及第二循环向量。
根据权利要求11所述的基于神经网络混合模型的法律条文检索装置，其中，所述第一堆栈模块，包括：

第二特征提取单元：设置为将所述第一归一化隐向量及所述第二归一化隐向量输入神经网络模型进行特征提取，将所述特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，获得第一特征隐向量及第二特征隐向量；

第二循环处理单元：设置为预设第一循环次数，将所述第一特征隐向量及所述第二特征隐向量输入神经网络模型进行归一化，将归一化后获得的向量输入神经网络模型进行特征提取，将特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，并根据预设的第一循环次数重复执行本步骤，获得第一特征向量及第二特征向量。
根据权利要求12所述的基于神经网络混合模型的法律条文检索装置，其中，所述第一堆栈模块，包括：

模型处理单元：设置为将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，将模型处理后获得的向量分别与所述第一特征向量及所述第二特征向量进行相加，获得第一编码块向量及第二编码块向量；

第三循环处理单元：设置为预设第二循环次数，将所述第一编码块向量及所述第二编码块向量分别与位置信息相加获得位置向量，将所述位置向量输入神经网络模型进行归一化处理，获得归一化隐向量，将所述归一化隐向量进行特征提取，获得特征向量，将所述特征向量进行归一化处理，获得归一化向量，将所述归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块编码块向量，并根据预设的第二循环次数重复执行本步骤，获得第一循环向量及第二循环向量。
根据权利要求13所述的基于神经网络混合模型的法律条文检索装置，其中，所述输出模块，包括：

预置单元：设置为预设法律条文概率阈值；

概率计算单元：设置为将所述混合堆栈向量输入卷积神经网络的全连接层进行线性处理，获得待分类向量，并对所述待分类向量进行归一化处理，获得每一条法律条文对应的概率；

输出单元：设置为将所述每一条法律条文对应的概率与所述预设的法律条文概率阈值进行比较，将所有大于所述法律条文概率阈值的法律条文进行输出。
一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被一个或多个所述处理器执行时，使得一个或多个所述处理器执行以下步骤：

获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量；

对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量；

将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量；

对所述混合堆栈向量进行归一化处理，获得文本检索结果。
根据权利要求15所述的计算机设备，其中，所述对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量时，使得所述处理器执行以下步骤：

将所述第一文本向量与所述第一文本向量的位置信息相加，获得第一位置向量，将所述第二文本向量与所述第二文本向量的位置信息相加，获得第二位置向量；

分别将所述第一位置向量与所述第二位置向量输入神经网络模型进行归一化处理，获得第一归一化隐向量及第二归一化隐向量；

对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量；

将所述第一特征向量及所述第二特征向量输入神经网络模型进行归一化处理，获得第一归一化向量及第二归一化向量，将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块向量，对所述第一编码块向量及所述第二编码块向量进行循环处理，获得第一循环向量及第二循环向量。
根据权利要求16所述的计算机设备，其中，所述对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量时，使得所述处理器执行以下步骤：

将所述第一归一化隐向量及所述第二归一化隐向量输入神经网络模型进行特征提取，将所述特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，获得第一特征隐向量及第二特征隐向量；

预设第一循环次数，将所述第一特征隐向量及所述第二特征隐向量输入神经网络模型进行归一化，将归一化后获得的向量输入神经网络模型进行特征提取，将特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，并根据预设的第一循环次数重复执行本步骤，获得第一特征向量及第二特征向量。
一种计算机可读存储介质，所述存储介质可被处理器读写，所述存储介质存储有计算机指令，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

获取输入文本，对所述输入文本进行向量化，获得第一文本向量及第二文本向量；

对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量；

将所述第一循环向量与所述第二循环向量进行拼接，获得混合向量，并对所述混合向量进行堆栈嵌入，获得混合堆栈向量；

对所述混合堆栈向量进行归一化处理，获得文本检索结果。
根据权利要求18所述的存储介质，其中，所述对所述第一文本向量及所述第二文本向量进行堆栈嵌入，获得第一循环向量及第二循环向量时，使得一个或多个所述处理器执行以下步骤：

将所述第一文本向量与所述第一文本向量的位置信息相加，获得第一位置向量，将所述第二文本向量与所述第二文本向量的位置信息相加，获得第二位置向量；

分别将所述第一位置向量与所述第二位置向量输入神经网络模型进行归一化处理，获得第一归一化隐向量及第二归一化隐向量；

对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量；

将所述第一特征向量及所述第二特征向量输入神经网络模型进行归一化处理，获得第一归一化向量及第二归一化向量，将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理，获得第一编码块向量及第二编码块向量，对所述第一编码块向量及所述第二编码块向量进行循环处理，获得第一循环向量及第二循环向量。
根据权利要求19所述的存储介质，其中，所述对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取，获得第一特征向量及第二特征向量时，使得一个或多个所述处理器执行以下步骤：

将所述第一归一化隐向量及所述第二归一化隐向量输入神经网络模型进行特征提取，将所述特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，获得第一特征隐向量及第二特征隐向量；

预设第一循环次数，将所述第一特征隐向量及所述第二特征隐向量输入神经网络模型进行归一化，将归一化后获得的向量输入神经网络模型进行特征提取，将特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加，并根据预设的第一循环次数重复执行本步骤，获得第一特征向量及第二特征向量。