WO2021174774A1

WO2021174774A1 - 神经网络关系抽取方法、计算机设备及可读存储介质

Info

Publication number: WO2021174774A1
Application number: PCT/CN2020/111513
Authority: WO
Inventors: 回艳菲; 王健宗; 程宁
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-07-30
Filing date: 2020-08-26
Publication date: 2021-09-10
Also published as: CN111898364A; CN111898364B

Abstract

一种神经网络关系抽取方法、计算机设备及计算机可读存储介质，所述方法包括：构建双通道神经网络模型（S101）；获取待处理的句子（S102）；对所述句子进行依存句法分析，得到所述句子的两个子句（S103）；将两个子句输入到第一通道中，通过CNN模型进行特征抽取，得到第一抽取信息（S104）；将所述句子输入到第二通道中，通过LSTM模型进行特征抽取，得到第二抽取信息（S105）；通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述语句最终的抽取特征，将所述最终的抽取特征输入到softmax层以完成对所述目标实体之间的关系类别进行分类（S106）。所述神经网络关系抽取方法，能够高质量地进行关系抽取。

Description

神经网络关系抽取方法、计算机设备及可读存储介质

本申请申明2020年07月30日递交的申请号为202010752459.2、名称为“神经网络关系抽取方法、计算机设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及人工智能技术领域，特别涉及一种神经网络关系抽取方法、计算机设备及可读存储介质。

背景技术

关系抽取在自然语言处理领域是一项非常重要的研究，作为一项重要的子任务，关系抽取旨在文本中抽取出两个实体间预先定义好的语义关系，抽取的关系和实体之间可以组织成三元组的形式存入图数据库，基于相关的知识图谱技术应用到医疗知识图谱中。如何构造一个高质量的医疗知识图谱，又离不开高质量的关系抽取。所以对于医疗知识图谱，关系抽取的地位尤为重要。

发明人发现，传统的关系抽取任务，一般通过单一的卷积神经网络(Convolutional Neural Network,CNN)或者循环神经网络(Recurrent Neural Network,RNN)等模型对句子进行向量化表示，但是单一模型的关系抽取质量并不高。

发明内容

本申请实施方式的目的在于提供一种神经网络关系抽取方法，能够高质量地进行关系抽取。

为解决上述技术问题，本申请的实施方式提供了一种神经网络关系抽取方法，所述方法包括：构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道；获取待处理的句子；对所述句子进行依存句法分析，生成依存句法分析树，从所述依存句法分析树中找出目标实体间的两条最短依存路径，所述两条最短路径表示所述句子的两个子句；将所述两个子句输入到所述第一通道中，通过卷积神经网络模型进行特征抽取，得到第一抽取信息；将所述句子输入到所述第二通道中，通过长短期记忆网络模型进行特征抽取，得到第二抽取信息；通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到softmax层以完成对所述目标实体之间的关系类别进行分类。

本申请的实施方式还提供了一种神经网络关系抽取系统，包括：建立模块，用于构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道；获取模块，用于获取待处理的句子；最短路径生成模块，用于对所述句子进行依存句法分析，得到所述句子的两个子句；第一抽取模块，用于在所述第一通道中，将所述两个子句输入到所述第一通道中，通过卷积神经网络模型进行特征抽取，得到第一抽取信息；第二抽取模块，用于在所述第二通道中，将所述句子输入到所述第二通道中，通过长短期记忆网络模型进行特征抽取，得到第二抽取信息；分类模块，用于通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到所述双通道神经网络模型的softmax层以完成对所述目标实体之间的关系类别进行分类。

本申请的实施方式还提供了一种计算机设备，所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述计算机可读指令被处理器执行时实现以下步骤：

构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道；

获取待处理的句子；

对所述句子进行依存句法分析，得到所述句子的两个子句；

将所述两个子句输入到所述第一通道中，通过卷积神经网络模型进行特征抽取，得到第一抽取信息；

将所述句子输入到所述第二通道中，通过长短期记忆网络模型进行特征抽取，得到第二抽取信息；

通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到所述双通道神经网络模型的softmax层以完成对所述目标实体之间的关系类别进行分类。

本申请的实施方式还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机可读指令，所述计算机可读指令可被至少一个处理器所执行，以使所述至少一个处理器执行如下步骤：

获取待处理的句子；

对所述句子进行依存句法分析，得到所述句子的两个子句；

本申请实施方式中提出的双通道神经网络关系抽取模型，该模型融合了最短依存路径的关键信息，又使用原语句保持依存路径捕捉不到的信息，通过CNN来抽取局部信息，并用池化层将最有用的信息进行汇聚，抽取了优秀的局部信息，保留了对关系进行分类的关键信息。使用LSTM对整个句子进行信息抽取，对于长距离的句子可以抽取出优秀的表示。对两种模型抽取出的信息，通过注意力机制进行加权汇总，得到当前句子的最终表示，且当前句子包含了对关系分类贡献最大的信息，最后经过softmax层进行分类，达到了对预定关系进行抽取的效果。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定。

图1是根据本申请第一实施方式的神经网络关系抽取方法的流程示意图；

图2是本申请第一实施方式中双通道神经网络模型的示意图；

图3是本申请第一实施方式中卷积神经网络模型进行特征抽取的示意图；

图4是根据本申请第二实施方式的神经网络关系抽取系统的程序模块图；

图5是根据本申请第三实施方式的计算机设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本申请各实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本申请所要求保护的技术方案。

本申请可应用于智慧政务/智慧城管/智慧社区/智慧安防/智慧物流/智慧医疗/智慧教育/智慧环保/智慧交通场景中，从而推动智慧城市的建设。

本申请的第一实施方式涉及一种神经网络关系抽取方法，本实施方式的核心在于，提出一种双通道神经网络关系抽取模型，采用卷积神经网络(Convolutional Neural Networks,CNN)模型来抽取最短依存路径的关键信息，使用长短期记忆网络(Long Short-Term Memory,LSTM)模型对整个句子进行信息抽取，对于长距离的句子可以抽取出优秀的表示，并用池化层将最有用的信息进行汇聚，抽取了优秀的局部信息，保留了对关系进行分类的关键信息。对两种模型抽取出的特征，通过注意力机制(也叫attention机制)进行加权汇总，得到当前句子的最终向量表示，最后经过softmax层进行分类，达到了对预定关系进行抽取的效果。下面对本实施方式的神经网络关系抽取方法的实现细节进行具体的说明，以下内容仅为方便理解提供的实现细节，并非实施本方案的必须。

本实施方式中的神经网络关系抽取方法的流程示意图如图1所示，该方法应用于计算机设备。

在本实施方式中，根据不同的需求，图1所示的流程图中的步骤的执行顺序可以改变，某些步骤可以省略。

步骤S101：构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道。

关系抽取旨在文本中抽取出两个实体间预先定义好的语义关系，抽取的关系和实体之间可以组织成三元组的形式存入图数据库，基于相关的知识图谱技术应用到医疗知识图谱中。构造一个高质量的医疗知识图谱，离不开高质量的关系抽取。所以对于医疗知识图谱，关系抽取的地位尤为重要。

现有技术中，卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)作为深度神经网络(Deep Neural Networks,DNN)的两种主要架构类型，在传统的关系抽取任务中，一般通过单一的CNN或者RNN等模型对句子进行向量化表示，但单一的模型可能会抓不到重点，尤其是在医疗领域中，句子的长短不一，没有哪种单一的模型是适配的，并且句子中并不是所有词语都对实体关系有贡献，因为有的句子过于冗长，所以单一模型的关系抽取质量并不高。因此，本实施例中，为了使关系抽取的质量更高，本申请中通过建立双通道神经网络模型来进行关系抽取。

本实施例中，在构建双通道神经网络模型后，还需对构建的所述双通道神经网络模型进行训练。具体地，对构建的所述双通道神经网络模型进行训练，包括：获取训练集，将所述训练集输入到所述双通道神经网络模型以输出所述训练集的预测关系类别，依据所述双通道神经网络模型输出的预测关系类别与所述训练集的实际关系类别，计算损失函数交叉熵，通过优化算法对所述损失函数交叉熵进行最小化，以训练所述双通道神经网络模型。

本实施例中，训练集是一组已知实际关系类别的训练数据的集合。

本实施例中，损失函数为：

其中，r _i代表实体之间的关系为第i种类别的概率值，s是单个句子，S为句子集合，t是实体关系的类别数。当实体关系为第i种类别时，则r _i为1，否则为0。

举个例子，假设实体之间一共有10种关系，实体1与实体2之间的实体关系为3，那么r ₃＝1。

本实施例中，通过最小化损失函数交叉熵以训练所述双通道神经网络模型，实际上是最小化预测关系类别与实际关系类别之间的损失函数交叉熵。

步骤S102：获取待处理的句子。

本实施例中，待处理的句子是指需要进行关系抽取的句子。

步骤S103：对所述句子进行依存句法分析，得到所述句子的两个子句。

具体地，通过句法分析器对所述句子进行依存句法分析，生成依存句法分析树；从所述依存句法分析树中找出目标实体间的两条最短依存路径，所述两条最短路径表示所述句子的两个子句。

目前在开源中文句法分析器中比较具有代表性有Stanfordparser和Berkeley parser。Stanford parser基于因子模型，Berkeley parser基于非词汇化分析模型。本实施例中，通过句法分析器(Stanfordparser)对所述句子进行依存句法分析。当然，在其他实施例中，也可以采用其他的句法分析器进行依存句法分析，本实施例中，对此并不作限定。

本实施例中，对待处理的句子进行依存句法分析，得到目标实体间的两条最短依存路径。由于，最短依存路径屏除了不重要的修饰语块，包含了表达关系模式的主干部分，因此，两条最短路径实际上为所述句子的两个子句。而且，通过获取句子的最短依存路径能够捕捉对关系分类贡献最大的信息，抽取句子中优秀的局部信息。

步骤S104：将所述两个子句输入到所述第一通道中，通过CNN模型进行特征抽取，得到第一抽取信息。

本实施例中，图2为本申请优先的实施例中双通道模型的示意图。如图2所示，在所述第一通道(左边的通道)中将两个子句(两条最短依存路径)分别输入到CNN模型进行特征抽取，得到第一抽取信息。具体地，在所述第一通道中将两个子句分别输入到CNN模型进行特征抽取，得到第一抽取信息，包括：

图3是本申请第一实施方式中卷积神经网络模型进行特征抽取的示意图，如图3所示，将两个子句进行向量表示，将所述两个子句的向量表示通过卷积层，池化层和非线性层进行处理，具体地，在卷积层进行卷积操作，在池化层使用最大池化(maxpooling)处理，其中，对某一行向量取最大池化操作后的值为该行中最大的值。进一步地，如图2所示，将处理后的两个子句的向量表示通过一层隐层进行融合，得到第一抽取信息s ₁。

本实施例中，将待处理的句子通过Stanfordparser句法分析器进行依存句法分析后得到两条最短依存路径(也是待处理的句子的两个子句)，然后，对两个子句的向量表示，其中，对两个子句的向量表示，具体为：定义两条最短依存路径上的词语i的向量

其中，

为词向量(word embedding)，其中，利用预训练的词向量，直接通过开源的词向量文件便能查找对应单词的词向量。

为位置向量(position embedding)。Position embedding是指最短依存路径上的当前词距离子句的两个实体词的相对距离，

其中

是当前词和第j个实体的相对距离。通过对子句的向量表示，则子句x转化为

给定一个子句x，假设子句有n个词，则通过公式一对子句x进行向量表示，公式一为：

其中，n表示每个子句包含的词的个数，

表示句子x中第i个词的向量，Z _n表示子句的向量表示。然后，将词向量和位置向量作为卷积神经网络的输入，通过卷积层、池化层和非线性层进行处理得到处理后句子的向量表示。具体地，根据公式二将所述两个子句的向量表示通过卷积层、池化层和非线性层进行处理，公式二为：[r _x ⁱ] _j＝max[f(W ¹z _n+b ¹)] _j，其中，[r _x ⁱ] _j表示向量r _x ⁱ的第j个向量，r _x ⁱ指对某一行向量取最大池化操作后的值，W ¹是卷积层的权重矩阵，f是非线性变换tanh函数，Z _n表示子句的向量表示，b ¹为偏值，为一个常量。本实施例中，卷积层在每个窗口大小为 k的两虚窗口，使用矩阵化向量对Z _n进行卷积操作。

进一步地，如图2所示，当两个子句完成了卷积层、池化层和非线性层的处理后，将两个子句的向量表示通过一层隐层(Hidden Layer)进行融合，得到第一抽取信息，也是两个子句在CNN模型的最后的句子表示s ₁。换言之，句子表示s ₁为能够表示待处理的句子的最终的特征向量，待处理的句子中的信息被包含在这个特征向量中。

步骤S105：将所述句子输入到所述第二通道中，通过LSTM模型进行特征抽取，得到第二抽取信息。

具体地，对所述句子进行分词操作以获取L个分词，对所述L个分词分别进行词向量映射，以获取L*d维词向量矩阵，所述L个分词映射为一个d维词向量；将所述L个分词的d维词向量依顺序输入到所述长短期记忆网络模型中进行特征抽取，得到所述第二抽取信息。

本实施例中，如图2右边部分所示，将待处理的完整句子的向量表示输入到LSTM模型进行特征抽取，得到第二抽取信息，也就是待处理的句子在LSTM模型的最后的句子表示s ₂。其中，当待处理的完整句子的向量表示输入到LSTM模型进行特征抽取的示意图同理于图3中的示意图，即将待处理的句子进行向量表示，将待处理的句子的向量表示通过卷积层，池化层和非线性层进行处理后得到待处理的句子输入到LSTM模型后得到待处理的句子的向量表示，其中，将待处理的句子的向量表示通过卷积层，池化层和非线性层进行处理具体的演算方法与步骤S104中均相同，此处不再赘述。

本实施例中，待处理的完整句子的向量表示为待处理的完整句子的词嵌入表示。

步骤S106：通过attention机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到所述双通道神经网络模型的softmax层以完成对所述目标实体之间的关系类别进行分类。

现有技术中，CNN模型对短句处理有巨大优势，而LSTM模型比较容易学习到长距离信息，对于抽取长距离句子特征有着优越的表现。本实施例中，在第一通道中，将待处理的句子的两个子句输入到CNN模型进行特征抽取，得到两个子句在CNN模型的最后的句子表示s ₁，以及在第二通道中，将所述句子输入到LSTM模型进行特征抽取，得到待处理的句子在LSTM模型的最后的句子表示s ₂后，为了可以同时处理长句和短句，以及考虑到最短依存路径有时会遗漏信息，本实施例中采用attention机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，即所述语句的最终的向量表示s。具体地，通过公式三及公式四将所述第一抽取信息与所述第二抽取信息进行加权汇总，

公式三为：

其中α _i为每个句子最终向量表示的权重，s _i为句子进行特征抽取后的向量表示，例如上述的s ₁，s ₂；

公式四为：

其中t _i是一个基于查询的方法，它由句子s _i和预测关系r进行匹配；

公式五为：

t _i＝s _iAr，其中，s _i为句子进行特征抽取后的向量表示，例如，第一抽取信息s ₁或者第二抽取信息s ₂，A是一个加权的对角矩阵，r是和关系r相关的查询向量，是关系r的向量表示。

进一步地，本实施例中，通过softmax层定义条件概率，其中，条件概率的计算公式为：

其中，n _r代表预定义的关系数量。

本实施例中，通过softma层进行分类后，还通过公式六得到输出的所有关系类别的概率值，其中，公式六为：

o＝Ms+d，其中，o为所有关系类别的概率值，M是关系矩阵表示，d是一个偏差向量。

本实施例中，o输出的所有关系类别的概率值，本质上为一个一维的列向量，列向量中的每个数字代表一个关系类别的概率值，表示目标实体为某种关系类别的可能性大小。

本实施例中，使用attention机制对CNN模型输出的表示与LSTM模型输出的表示进行融合，抽取了对于当前句子优秀的表示，使得最终训练出的关系抽取模型可以适合长短句。

本申请实施方式中提出的双通道神经网络模型，该模型融合了最短依存路径的关键信息，又使用原语句保持依存路径捕捉不到的信息，采用CNN来抽取局部信息，并用池化层将最有用的信息进行汇聚，抽取了优秀的局部信息，保留了对关系进行分类的关键信息。使用LSTM对整个句子进行信息抽取，对于长距离的句子可以抽取出优秀的表示。对两种模型抽取出的信息，通过attention机制进行加权汇总，得到当前句子的最终表示，且当前句子包含了对关系分类贡献最大的信息，最后经过双通道神经网络模型的softmax层进行分类，达到了对预定关系进行抽取的效果。

上面各种方法的步骤划分，只是为了描述清楚，并不对步骤执行的先后顺序进行限定，而且实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包括相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

在示例性的实施例中，可以将网络关系的相关数据上传至区块链中。基于网络关系的相关数据得到对应的摘要信息，具体来说，摘要信息由网络关系的相关数据进行散列处理得到，比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息，以便查证网络关系的相关数据是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请第二实施方式涉及一种神经网络关系抽取系统的框图，该计算机设备的神经网络关系抽取系统可以被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本申请实施例。本申请实施例所称的程序模块是指能够完成特定功能的一系列计算机可读指令段，以下描述将具体介绍本实施例中各程序模块的功能。

如图4所示，该神经网络关系抽取系统400可以包括建立模块410、获取模块420、最短路径生成模块430、第一模块440、第二模块450、分类模块460和训练模块470，其中：

建立模块410，用于构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道。

获取模块420，用于获取待处理的句子。

最短路径生成模块430，用于对所述句子进行依存句法分析，得到所述句子的两个子句。

具体地，通过句法分析器对所述句子进行依存句法分析，生成依存句法分析树，从所述依存句法分析树中找出目标实体间的两条最短依存路径，所述两条最短路径表示所述句子的两个子句。

第一抽取模块440，用于将所述两个子句输入到所述第一通道中，通过卷积神经网络(Convolutional Neural Networks,CNN)模型进行特征抽取，得到第一抽取信息。

第二抽取模块450，用于将所述句子输入到所述第二通道中，通过长短期记忆网络(Long Short-Term Memory,LSTM)模型进行特征抽取，得到第二抽取信息。

分类模块460，用于通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到所述双通道神经网络模型的softmax层以完成对所述目标实体之间的关系类别进行分类。

进一步地，所述神经网络关系抽取系统400还包括：

训练模块470，用于对构建的所述双通道神经网络模型进行训练。

所述训练模块470还用于：获取训练集；将所述训练集输入到所述双通道神经网络模型以输出所述训练集的预测关系类别；依据所述双通道神经网络模型输出的预测关系类别与所述训练集的实际关系类别，计算损失函数交叉熵；通过优化算法对所述损失函数进行最小化，以训练所述双通道神经网络模型。

所述第一抽取模块440还用于：将所述两个子句的词语进行向量表示；将所述两个子句的向量表示通过卷积层、池化层和非线性层进行处理；将处理后的两个子句的向量表示通过隐层进行融合，得到第一抽取信息。

本申请第三实施方式涉及一种计算机设备，参阅图5所示，是本申请神经网络关系抽取的计算机设备的硬件架构示意图。

本实施方式中，计算机设备500是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。例如，可以是智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图5所示，计算机设备500至少包括但不限于：可通过系统总线相互通信链接存储器510、处理器520、网络接口530。其中：

存储器510至少包括一种类型的可读存储介质，可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器510可以是计算机设备500的内部存储模块，例如该计算机设备400的硬盘或内存。在另一些实施例中，存储器510也可以是计算机设备500的外部存储设备，例如该计算机设备500上配备的插接式硬盘，智能存储卡(Smart Media Card，简称为SMC)，安全数字(Secure Digital，简称为SD)卡，闪存卡(Flash Card)等。当然，存储器510还可以既包括计算机设备500的内部存储模块也包括其外部存储设备。本实施例中，存储器510通常用于存储安装于计算机设备500的操作系统和各类应用软件，例如区块链安全交易方法的程序代码等。此外，存储器510还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器420在一些实施例中可以是中央处理器(Central Processing Unit，简称为CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器520通常用于控制计算机设备500的总体操作，例如执行与计算机设备500进行数据交互或者通信相关的控制和处理等。本实施例中，处理器520用于运行存储器510中存储的程序代码或者处理数据。

网络接口530可包括无线网络接口或有线网络接口，该网络接口530通常用于在计算机设备500与其他计算机设备之间建立通信链接。例如，网络接口530用于通过网络将计算机设备500与外部终端相连，在计算机设备500与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，简称为GSM)、宽带码分多址(Wideband Code Division Multiple Access，简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

需要指出的是，图5仅示出了具有部件510-530的计算机设备，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。

在本实施例中，存储于存储器510中的区块链安全交易方法还可以被分割为一个或者多个程序模块，并由一个或多个处理器(本实施例为处理器520)所执行，以完成本申请。

存储器510存储有可被至少一个处理器520执行的指令，指令被至少一个处理器520执行，以使至少一个处理器520能够执行上述神经网络关系抽取方法的步骤。

本申请的实施方式还提供了一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性。所述计算机可读存储介质内存储有计算机可读指令，所述计算机可读指令可被至少一个处理器所执行，以使所述至少一个处理器执行如下步骤：

获取待处理的句子；

对所述句子进行依存句法分析，得到所述句子的两个子句；

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解，上述各实施方式是实现本申请的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本申请的精神和范围。

Claims

一种神经网络关系抽取方法，其中，包括：

构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道；

获取待处理的句子；

对所述句子进行依存句法分析，得到所述句子的两个子句；

将所述两个子句输入到所述第一通道中，通过卷积神经网络模型进行特征抽取，得到第一抽取信息；

将所述句子输入到所述第二通道中，通过长短期记忆网络模型进行特征抽取，得到第二抽取信息；

通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到所述双通道神经网络模型的softmax层以完成对所述目标实体之间的关系类别进行分类。
根据权利要求1所述的神经网络关系抽取方法，其中，还包括：

对构建的所述双通道神经网络模型进行训练。
根据权利要求2所述的神经网络关系抽取方法，其中，所述对构建的所述双通道神经网络模型进行训练，包括：

获取训练集；

将所述训练集输入到所述双通道神经网络模型以输出所述训练集的预测关系类别；

依据所述双通道神经网络模型输出的预测关系类别与所述训练集的实际关系类别，计算损失函数交叉熵；

通过优化算法对所述损失函数进行最小化，以训练所述双通道神经网络模型。
根据权利要求1所述的神经网络关系抽取方法，其中，所述将所述两个子句输入到所述第一通道中，通过卷积神经网络模型进行特征抽取，得到第一抽取信息，包括：

将所述两个子句的词语进行向量表示；

将所述两个子句的向量表示通过卷积层、池化层和非线性层进行处理；

将处理后的两个子句的向量表示通过隐层进行融合，得到第一抽取信息。
根据权利要求1所述的神经网络关系抽取方法，其中，所述将所述句子输入到所述第二通道中，通过长短期记忆网络模型进行特征抽取，得到第二抽取信息，包括：

对所述句子进行分词操作以获取L个分词；

对所述L个分词分别进行词向量映射，以获取L*d维词向量矩阵，所述L个分词映射为一个d维词向量；

将所述L个分词的d维词向量依顺序输入到所述长短期记忆网络模型中进行特征抽取，得到所述第二抽取信息。
根据权利要求1所述的神经网络关系抽取方法，其中，所述对所述句子进行依存句法分析，得到所述句子的两个子句，包括：

通过句法分析器对所述句子进行依存句法分析，生成依存句法分析树；

从所述依存句法分析树中找出目标实体间的两条最短依存路径，所述两条最短路径表示所述句子的两个子句。
一种神经网络关系抽取系统，其中，包括：

建立模块，用于构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道；

获取模块，用于获取待处理的句子；

最短路径生成模块，用于对所述句子进行依存句法分析，得到所述句子的两个子句；

第一抽取模块，用于在所述第一通道中，将所述两个子句输入到所述第一通道中，通过卷积神经网络模型进行特征抽取，得到第一抽取信息；

第二抽取模块，用于在所述第二通道中，将所述句子输入到所述第二通道中，通过长短期记忆网络模型进行特征抽取，得到第二抽取信息；

分类模块，用于通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到所述双通道神经网络模型的softmax层以完成对所述目标实体之间的关系类别进行分类。
根据权利要求7所述的神经网络关系抽取系统，其中，所述第一抽取模块还用于：

将所述两个子句的词语进行向量表示；

将所述两个子句的向量表示通过卷积层、池化层和非线性层进行处理；

将处理后的两个子句的向量表示通过隐层进行融合，得到第一抽取信息。
一种计算机设备，其中，所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述计算机可读指令被处理器执行时实现以下步骤：

构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道；

获取待处理的句子；

对所述句子进行依存句法分析，得到所述句子的两个子句；

将所述两个子句输入到所述第一通道中，通过卷积神经网络模型进行特征抽取，得到第一抽取信息；

将所述句子输入到所述第二通道中，通过长短期记忆网络模型进行特征抽取，得到第二抽取信息；

通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到所述双通道神经网络模型的softmax层以完成对所述目标实体之间的关系类别进行分类。
根据权利要求9所述的计算机设备，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

对构建的所述双通道神经网络模型进行训练。
根据权利要求10所述的计算机设备，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

获取训练集；

将所述训练集输入到所述双通道神经网络模型以输出所述训练集的预测关系类别；

依据所述双通道神经网络模型输出的预测关系类别与所述训练集的实际关系类别，计算损失函数交叉熵；

通过优化算法对所述损失函数进行最小化，以训练所述双通道神经网络模型。
根据权利要求9所述的计算机设备，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

将所述两个子句的词语进行向量表示；

将所述两个子句的向量表示通过卷积层、池化层和非线性层进行处理；

将处理后的两个子句的向量表示通过隐层进行融合，得到第一抽取信息。
根据权利要求9所述的计算机设备，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

对所述句子进行分词操作以获取L个分词；

对所述L个分词分别进行词向量映射，以获取L*d维词向量矩阵，所述L个分词映射为一个d维词向量；

将所述L个分词的d维词向量依顺序输入到所述长短期记忆网络模型中进行特征抽取，得到所述第二抽取信息。
根据权利要求9所述的计算机设备，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

通过句法分析器对所述句子进行依存句法分析，生成依存句法分析树；

从所述依存句法分析树中找出目标实体间的两条最短依存路径，所述两条最短路径表示所述句子的两个子句。
一种计算机可读存储介质，其中，所述计算机可读存储介质内存储有计算机可读指令，所述计算机可读指令可被至少一个处理器所执行，以使所述至少一个处理器执行如下步骤：

构建双通道神经网络模型，所述双通道神经网络模型包括第一通道及第二通道；

获取待处理的句子；

对所述句子进行依存句法分析，得到所述句子的两个子句；

将所述两个子句输入到所述第一通道中，通过卷积神经网络模型进行特征抽取，得到第一抽取信息；

将所述句子输入到所述第二通道中，通过长短期记忆网络模型进行特征抽取，得到第二抽取信息；

通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述句子最终的抽取特征，将所述最终的抽取特征输入到所述双通道神经网络模型的softmax层以完成对所述目标实体之间的关系类别进行分类。
根据权利要求15所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

对构建的所述双通道神经网络模型进行训练。
根据权利要求16所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

获取训练集；

将所述训练集输入到所述双通道神经网络模型以输出所述训练集的预测关系类别；

依据所述双通道神经网络模型输出的预测关系类别与所述训练集的实际关系类别，计算损失函数交叉熵；

通过优化算法对所述损失函数进行最小化，以训练所述双通道神经网络模型。
根据权利要求15所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

将所述两个子句的词语进行向量表示；

将所述两个子句的向量表示通过卷积层、池化层和非线性层进行处理；

将处理后的两个子句的向量表示通过隐层进行融合，得到第一抽取信息。
根据权利要求15所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

对所述句子进行分词操作以获取L个分词；

对所述L个分词分别进行词向量映射，以获取L*d维词向量矩阵，所述L个分词映射为一个d维词向量；

将所述L个分词的d维词向量依顺序输入到所述长短期记忆网络模型中进行特征抽取，得到所述第二抽取信息。
根据权利要求15所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时还实现以下步骤：

通过句法分析器对所述句子进行依存句法分析，生成依存句法分析树；

从所述依存句法分析树中找出目标实体间的两条最短依存路径，所述两条最短路径表示所述句子的两个子句。