CN109670050A

CN109670050A - 一种实体关系预测方法及装置

Info

Publication number: CN109670050A
Application number: CN201811518633.6A
Authority: CN
Inventors: 李锐
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2018-12-12
Filing date: 2018-12-12
Publication date: 2019-04-23
Anticipated expiration: 2038-12-12
Also published as: CN109670050B

Abstract

本申请公开了一种实体关系预测方法及装置，该方法包括：在获取到包含同一实体对的不同目标文本后，首先确定出每一目标文本分别对该实体对的实体关系的体现程度，其中，该实体对包括两个不同的实体词，然后根据每一目标文本分别对该实体对的实体关系的体现程度，预测该实体对的实体关系。可见，本申请实施例在对实体对的实体关系进行预测时，考虑了包含该实体对的不同目标文本对该实体对的实体关系的体现程度，从而能够更准确地预测出该实体对的实体关系。

Description

一种实体关系预测方法及装置

技术领域

本申请涉及自然语言处理技术领域，尤其涉及一种实体关系预测方法及装置。

背景技术

在当前的自然语言处理领域中，关系抽取(relation extraction)任务通常被广泛应用于数据简化和构建知识图谱中。关系抽取通常指两个不同实体(又称实体对)之间的关系抽取，其中，实体泛指一切能够独立存在的东西，比如作品、人物、地点、机构等。

对于用户输入的一段自然语言，该段自然语言是一种非结构化文本，需要在该非结构化文本中正确识别出两个不同实体，并在此基础上预测出该非结构化文本中的两个不同实体之间的关系类别，用于形成结构化的数据，以便进行后续的存储和使用。但是，现有的实体关系预测方法，其预测结果的准确性还有待提高。

发明内容

本申请实施例的主要目的在于提供一种实体关系预测方法及装置，能够提高实体关系的预测结果的准确性。

本申请实施例提供了一种实体关系预测方法，包括：

获取包含同一实体对的不同目标文本，所述实体对包括两个不同的实体词；

确定每一目标文本分别对所述实体对的实体关系的体现程度；

根据每一目标文本分别对所述实体对的实体关系的体现程度，预测所述实体对的实体关系。

可选的，所述确定每一目标文本分别对所述实体对的实体关系的体现程度，包括：

对于每一目标文本，根据所述目标文本的文本内容，生成所述目标文本的文本表达结果，所述文本表达结果中携带了所述实体对的实体关系的相关信息；

根据各个目标文本的文本表达结果，分别确定每一目标文本对所述实体对的实体关系的体现程度。

可选的，所述根据所述目标文本的文本内容，生成所述目标文本的文本表达结果，包括：

通过分析所述目标文本中各个词语之间的依赖关系，生成所述目标文本的文本表达结果。

可选的，所述通过分析所述目标文本中各个词语之间的依赖关系，生成所述目标文本的文本表达结果，包括：

将所述目标文本的每一词语分别作为目标词语；

提取每一目标词语的词语特征；

对于每一目标词语，根据所述目标词语的词语特征生成所述目标词语的第一语义表达结果，并根据所述目标词语以及所述目标词语的相邻词语各自的第一语义表达结果，生成所述目标词语的第二语义表达结果；

根据各个目标词语的第二语义表达结果，生成所述目标文本的文本表达结果。

可选的，所述目标词语的词语特征包括所述目标词语的语义信息、以及所述目标词语的位置信息和/或所述目标词语的句法信息。

可选的，按照下述方式确定所述目标词语的相邻词语：

若所述目标词语是所述实体对中的一个实体词，则所述目标词语的相邻词语不包括所述实体对的另一实体词；

若所述目标词语不是所述实体对中的一个实体词、且所述实体对的两个实体词位于所述目标词语的同侧，则所述目标词语的相邻词语包括与所述目标词语最近的实体词；

若所述目标词语不是所述实体对中的一个实体词、且所述实体对的两个实体词位于所述目标词语的两侧，则所述目标词语的相邻词语包括所述实体对的两个实体词。

可选的，所述根据每一目标文本分别对所述实体对的实体关系的体现程度，预测所述实体对的实体关系，包括：

根据每一目标文本分别对应的文本表达结果和权重值，预测所述实体对的实际实体关系，所述权重值表征了所述目标文本对所述实体对的实体关系的体现程度。

可选的，所述根据每一目标文本分别对应的文本表达结果和权重值，预测所述实体对的实际实体关系，包括：

根据每一目标文本分别对应的文本表达结果和权重值，生成一个实体关系表达结果；

根据所述实体关系表达结果，预测所述实体对的实体关系。

利用预先构建的实体关系预测模型，确定每一目标文本分别对所述实体对的实体关系的体现程度；

相应地，所述根据每一目标文本分别对所述实体对的实体关系的体现程度，预测所述实体对的实体关系，包括：

利用所述实体关系预测模型，根据每一目标文本分别对所述实体对的实体关系的体现程度，预测所述实体对的实体关系。

可选的，所述实体关系预测模型的训练语料包括多个样本文本，所述样本文本中的实体对的实体关系被预先标注且通过查询预先构建的实体关系数据库进行标注。

本申请实施例还提供了一种实体关系预测装置，包括：

目标文本获取单元，用于获取包含同一实体对的不同目标文本，所述实体对包括两个不同的实体词；

体现程度确定单元，用于确定每一目标文本分别对所述实体对的实体关系的体现程度；

实体关系预测单元，用于根据每一目标文本分别对所述实体对的实体关系的体现程度，预测所述实体对的实体关系。

可选的，所述体现程度确定单元包括：

表达结果生成子单元，用于对于每一目标文本，根据所述目标文本的文本内容，生成所述目标文本的文本表达结果，所述文本表达结果中携带了所述实体对的实体关系的相关信息；

体现程度确定子单元，用于根据各个目标文本的文本表达结果，分别确定每一目标文本对所述实体对的实体关系的体现程度。

可选的，所述表达结果生成子单元具体用于：

可选的，所述表达结果生成子单元包括：

目标词语获得子单元，用于将所述目标文本的每一词语分别作为目标词语；

词语特征提取子单元，用于提取每一目标词语的词语特征；

语义结果生成子单元，用于对于每一目标词语，根据所述目标词语的词语特征生成所述目标词语的第一语义表达结果，并根据所述目标词语以及所述目标词语的相邻词语各自的第一语义表达结果，生成所述目标词语的第二语义表达结果；

文本结果生成子单元，用于根据各个目标词语的第二语义表达结果，生成所述目标文本的文本表达结果。

可选的，若所述目标词语是所述实体对中的一个实体词，则所述目标词语的相邻词语不包括所述实体对的另一实体词；

可选的，所述实体关系预测单元具体用于：

可选的，所述实体关系预测单元包括：

实体关系结果生成子单元，用于根据每一目标文本分别对应的文本表达结果和权重值，生成一个实体关系表达结果；

实体关系预测子单元，用于根据所述实体关系表达结果，预测所述实体对的实体关系。

可选的，所述体现程度确定单元具体用于：

相应地，所述实体关系预测单元具体用于：

本申请实施例还提供了一种实体关系预测设备，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述实体关系预测方法中的任意一种实现方式。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述实体关系预测方法中的任意一种实现方式。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述实体关系预测方法中的任意一种实现方式。

本申请实施例提供的一种实体关系预测方法及装置，在获取到包含同一实体对的不同目标文本后，首先确定出每一目标文本分别对该实体对的实体关系的体现程度，其中，该实体对包括两个不同的实体词，然后根据每一目标文本分别对该实体对的实体关系的体现程度，预测该实体对的实体关系。可见，本申请实施例在对实体对的实体关系进行预测时，考虑了包含该实体对的不同目标文本对该实体对的实体关系的体现程度，从而能够更准确地预测出该实体对的实体关系。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种实体关系预测方法的流程示意图；

图2为本申请实施例提供的实体关系预测模型的结构示意图；

图3为本申请实施例提供的确定每一目标文本分别对实体对的实体关系的体现程度的流程示意图；

图4为本申请实施例提供的通过分析目标文本中各个词语之间的依赖关系生成目标文本的文本表达结果的流程示意图；

图5为本申请实施例提供的根据每一目标文本分别对应的文本表达结果和权重值预测实体对的实际实体关系的流程示意图；

图6为本申请实施例提供的一种实体关系预测装置的组成示意图。

具体实施方式

在一些实体关系预测方法中，通常采用有监督的学习方法，将实体对的实体关系预测当作一个确定性的分类问题，根据已有的训练数据设计各种复杂的特征，然后使用训练好的分类器进行实体关系预测。但是，这种预测方式并没有考虑到包含同一实体对的不同文本对该实体对的实体关系的影响程度，导致实体关系的预测结果的准确性不高。

为解决上述缺陷，本申请实施例提供了一种实体关系预测方法，可以先获取包含同一实体对的不同文本，然后确定出每一文本分别对该实体对的实体关系的体现程度，比如，有的文本内容可以直接体现该实体对的实体关系，有的文本内容可以间接体现该实体对的实体关系，还有的文本无法体现该实体对的实体关系，即，不同文本内容对同一实体对的实体关系的体现程度可能各不相同，因此，可以对这些包含同一实体对的不同文本进行结合考虑，以根据不同文本分别对该实体对的实体关系的体现程度，预测该实体对的实体关系，相比于现有技术，能够更准确地预测出该实体对的实体关系。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

第一实施例

参见图1，为本实施例提供的一种实体关系预测方法的流程示意图，该方法包括以下步骤：

S101：获取包含同一实体对的不同目标文本，其中，该实体对包括两个不同的实体词。

在本实施例中，将采用本实施例实现实体关系预测的任一文本定义为目标文本。并且，不同目标文本中包含了同一实体对，可以通过本实施例对该实体对的实体关系进行预测，该实体对包括了两个不同的实体词，其中，实体词可以是人物、地点、机构等能够独立存在的东西。基于此，对该实体对的实体关系进行预测指的就是对这两个不同的实体词所代表的实体之间的关系进行预测。

需要说明的是，本实施例不限制目标文本的语种类型，比如，目标文本可以是中文文本、或英文文本等；本实施例也不限制目标文本的长度，比如，目标文本可以是句子文本、也可以是篇章文本；本实施例也不限制目标文本的类型，比如，目标文本可以是一条新闻简报或一条商品评论，也可以是演讲稿、杂志文章、文学作品等中的部分文本。

S102：确定每一目标文本分别对其包含的实体对的实体关系的体现程度。

在本实施例中，通过步骤S101获取到包含同一实体对的不同目标文本后，为了能够更准确地对该实体对的实体关系进行预测，需要确定出每一目标文本分别对该实体对的实体关系的体现程度，而每一目标文本对应的体现程度不同，对预测出其包含的实体对的实体关系的影响程度也不同，即，一个目标文本对应的体现程度越高(该目标文本越能体现出实体对的实体关系)，表明该目标文本对预测出其包含的实体对的实体关系的影响程度越高。

举例说明：假设某一实体对包含的两个实体词为“小明”和“小玲”，包含该实体对的三个目标文本分别为文本A“小明和妻子小玲周末去逛街了”、文本B“小明和小玲带着女儿去游乐园了”、以及文本C“小明和小玲去逛街了”。可以理解的是，假设“小明”和“小玲”的真正实体关系是夫妻关系，但这三个目标文本对“小明”和“小玲”的夫妻关系的体现程度是不同的。其中，文本A“小明和妻子小玲周末去逛街了”能够直接体现出二者为夫妻关系；文本B“小明和小玲带着女儿去游乐园了”并未完全体现出二者为夫妻关系，这是因为该目标文本中没有明确指出二者相对于彼此的关系，仅可以从“女儿”推测出二者可能为夫妻关系，即能够间接体现出二者为夫妻关系；而文本C“小明和小玲去逛街了”则根本无法体现出二者之间为夫妻关系。

S103：根据每一目标文本分别对该实体对的实体关系的体现程度，预测该实体对的实体关系。

在本实施例中，通过步骤S102确定出每一目标文本分别对该实体对的实体关系的体现程度后，可以根据每一目标文本分别对该实体对的实体关系的体现程度，确定出每一目标文本在预测该实体对的实体关系时所占的权重大小，比如，体现程度较大，则对应的目标文本在预测该实体对的实体关系时所占的权重也较大，反之，则对应的目标文本在预测该实体对的实体关系时所占的权重较小。进而，可以根据每一目标文本在预测该实体对的实体关系时所占的权重以及每一目标文本的语义信息，准确预测出该实体对的实体关系。

在本实施例的一种实现方式中，上述步骤S102具体可以包括：利用预先构建的实体关系预测模型，确定每一目标文本分别对该实体对的实体关系的体现程度。则，相应的，上述步骤S103具体可以包括：利用实体关系预测模型，根据每一目标文本分别对该实体对的实体关系的体现程度，预测该实体对的实体关系。

在本实现方式中，可以利用预先构建的实体关系预测模型，首先确定出每一目标文本对该实体对的实体关系的体现程度，再基于各个目标文本对应的体现程度，预测出该实体对的实体关系，该流程包括以下步骤A-C：

步骤A：将每一目标文本依次或并行输入至预先构建的实体关系预测模型。

在本实现方式中，图2为本实施例预先构建的实体关系预测模型的结构示意图。如图2所示，该实体关系预测模型的结构为分层结构，具体可以分为输入层、双向长短期记忆(Bi-directional Long Short-Term Memory，简称BiLSTM)层、Mask自注意力层、句间注意力层和输出层。

为了对每个目标文本所包含的实体对的实体关系进行准确预测，首先可以分别对每一目标文本进行分词处理，得到各个目标文本所包含的各个分词，并生成每一分词对应的向量表达结果。然后将每一目标文本包含的每一分词对应的向量表达结果输入至如图2所示的实体关系预测模型。

步骤B：利用实体关系预测模型，确定出每一目标文本分别对其包含的实体对的实体关系的体现程度。

在本实施例中，通过步骤A将每一目标文本中的每一分词的向量表达结果输入至实体关系预测模型后，如图2所示，可以使实体关系预测模型利用BiLSTM层、Mask自注意力层以及句间注意力层，确定每一目标文本对其包含的实体对的实体关系的体现程度，可以用不同的权重值来表征不同目标文本对应的体现程度。

步骤C：利用实体关系预测模型，根据每一目标文本分别对其包含的实体对的实体关系的体现程度，预测该实体对的实体关系。

在本实施例中，通过步骤B确定每一目标文本对其包含的实体对的实体关系的体现程度后，即，通过不同的权重值来表征不同目标文本对应的体现程度后，可以根据各个权重值计算出表征该实体对的实体关系的关系表达结果，如图2所示，进而可以使实体关系预测模型利用输出层，基于该关系表达结果，计算出该实体对属于每一预设实体关系时的概率值，并将其中最大概率值对应的关系类型作为预测出的该实体对的实体关系。

需要说明的是，通过上述步骤A-C来利用实体关系预测模型，预测实体对的实体关系的具体实现过程请参见第二实施例。

接下来，本实施例将对图2所示的实体关系预测模型的构建过程进行介绍。

需要说明的是，通过现有的采用有监督的学习方法进行模型训练时，通常需要大量的人工标注的训练语料，即预先标注出语料中不同实体对的实体关系，而对语料进行人工标注，往往非常耗时耗力。

为了解决上述缺陷，在本实施例中，需要预先收集大量的用于构建实体关系预测模型的训练语料，其中，该训练语料中包括多个样本文本，每一样本文本中包括一个实体对，且每一样本文本中的实体对的实体关系被预先标注且通过查询预先构建的实体关系数据库进行标注。需要说明的是，每一样本文本的语种类型与目标文本的语种类型相同，比如均是中文文本。

具体来讲，在收集样本文本时，以样本文本为一个句子为例，可以在比如维基百科或百度百科等搜索平台上进行搜索，从搜索结果中抽取出包含实体的各个句子，每个句子必须包含至少两个不同的实体，即每一句子中至少包括一个实体对，一种比较优选的实现方式是，每一句子中仅包括一个实体对。并且，在这些句子中，同一实体对会在至少两个句子中共现，例如，有三个句子，分别为“小明在球场打篮球时，结识了小玲”、“小明与小玲注册结婚”、“小明的妻子小玲怀上第二胎”，其中，“小明”和“小玲”这两个不同实体形成的实体对在这三个句子中共现。

并且，对于训练语料中的每一样本文本，可以通过远程监督的方式标注每一样本文本中的实体对的实体关系，即，可以通过查询预先构建的实体关系数据库，对每一样本文本包含的实体对的实体关系进行标注。具体地，在该预先构建的实体关系数据库中，预先存储了具有确定性关系的大量实体对的实体关系，比如两个名人之间的关系是夫妻关系，基于此，对于训练语料中的每一样本文本，可以查询该实体关系数据库，若该实体关系数据库中存储了该样本文本中的实体对的实体关系，则可以将该样本文本中的实体对的实体关系标注为实体关系数据库中存储的实体关系，而不必进行人工标注，当然，如果实体关系数据库中不包含该样本文本中的实体对的实体关系，则可以对其进行人工标注。

然后，利用训练语料中的各个样本文本进行模型训练，包括以下步骤(1)-(3)：

(1)、构建实体关系预测模型。

可以预先构建一个初始的实体关系预测模型，并初始化模型参数，比如图2所示的实体关系预测模型。

(2)、生成实体关系预测模型的输入特征。

从训练语料中提取包含同一实体对的多个样本文本，形成一组文本，并对该组文本中的每一样本文本进行分词处理，得到每个样本文本所包含的各个分词，并提取出每一分词的向量表达结果，作为实体关系预测模型的输入特征，用于一轮的模型训练。按照上述方式，可以提取多组文本并生成对应的输入特征，从而可以进行多轮的模型训练。

(3)、对实体关系预测模型进行训练。

在本实施例中，可以预设多种实体关系，比如“夫妻、父女、父子、母女、母子、无关类”等实体关系类型，并设置每种实体关系类型的目标输出值y，目标输出值y中各个维度的值分别代表了各种实体关系类型对应的概率值，这样，假设包括“夫妻、父女、父子、母女、母子、无关类”这6种实体关系类型，那么，夫妻关系对应的目标输出值为y₁＝[1,0,0,0,0,0]，父女关系对应的目标输出值为y₂＝[0,1,0,0,0,0]，父子关系对应的目标输出值为y₃＝[0,0,1,0,0,0]，母女关系对应的目标输出值为y₄＝[0,0,0,1,0,0]，母子关系对应的目标输出值为y₅＝[0,0,0,0,1,0]，无关类对应的目标输出值为y₆＝[0,0,0,0,0,1]。

在进行模型训练时，依次从训练数据中提取一组文本，每组文本中包括具有同一实体对的不同样本文本，利用各组文本进行多轮模型训练，直到满足训练结束条件为止，此时，即训练得到实体关系预测模型。

具体地，在进行本轮训练时，使用包含同一实体对的一组样本文本，可以将每一样本文本中的每一分词对应的向量表达结果输入至实体关系预测模型，并对每一样本文本对应的输入内容分别进行处理，具体处理过程请参见第二实施例，即只需要将第二实施例中的目标文本替换为样本文本即可。这样，通过当前的实体关系预测模型，便可以预测得到表征该实体对的实体关系的预测输出值y'，该y'可以是表征该实体对的实体关系的一组向量，向量中每一维度的值可以为区间[0,1]中的一个数值，且每一维度的值分别代表了该实体对属于各个预设实体关系类型(比如上述6种关系)时的概率值。例如，假设存在“夫妻、父女、父子、母女、母子、无关类”这6种预设的实体关系类型，并假设模型的预测输出值为y'＝[0.9,0.1,0,0,0.08,0.03]，可见，第一维度的值0.9最高，因此，该维度对应的实体关系类型即为该实体对的实体关系，即“夫妻”关系。

接着，将预测结果y'与对应的目标输出值y进行比较，比如将y'＝[0.9,0.1,0,0,0.08,0.03]与y₁＝[1,0,0,0,0,0]进行比较，根据二者的差异对模型参数进行更新。在训练过程中，使用的训练目标函数可以为交叉熵损失函数，交叉熵损失函数的计算公式如下：

其中，y_n表示第n个实体关系类型对应的目标输出值，即本轮使用的样本文本中的实体对的实际实体关系类型对应的目标输出值，比如y₁＝[1,0,0,0,0,0]；表示模型的预测输出值，比如y'＝[0.9,0.1,0,0,0.08,0.03]。

根据每轮训练结束后交叉熵损失函数值的变化，对实体关系预测模型的模型参数进行更新。

综上，本实施例提供的实体关系预测方法，在获取到包含同一实体对的不同目标文本后，首先确定出每一目标文本分别对该实体对的实体关系的体现程度，其中，该实体对包括两个不同的实体词，然后根据每一目标文本分别对该实体对的实体关系的体现程度，预测该实体对的实体关系。可见，本申请实施例在对实体对的实体关系进行预测时，考虑了包含该实体对的不同目标文本对该实体对的实体关系的体现程度，从而能够更准确地预测出该实体对的实体关系。

第二实施例

本实施例将对第一实施例中利用预先构建的实体关系预测模型，预测实体对的实体关系的具体实施方式进行介绍。

首先，本实施例将通过下述步骤S301-S302，对第一实施例中的S102“确定每一目标文本分别对该实体对的实体关系的体现程度”的具体实施方式进行介绍，具体可以利用第一实施例中预先构建的实体关系预测模型，来确定出每一目标文本分别对该实体对的实体关系的体现程度。

参见图3，其示出了本实施例提供的确定每一目标文本分别对实体对的实体关系的体现程度的流程示意图，该流程包括以下步骤：

S301：对于每一目标文本，根据目标文本的文本内容，生成目标文本的文本表达结果。

在本实施例中，在获取到包含同一实体对的不同目标文本后，首先可以利用现有或未来出现的实体识别方法，提取出该实体对中的两个实体，比如，可以通过命名实体识别(Name Entity Recognition，简称NER)的方法，将每一目标文本所包含的实体对中的两个实体识别出来，同时，还可以对每一目标文本进行数据处理，再将处理后的数据输入至如图2所示的预先构建的实体关系预测模型，以生成每一目标文本对应的文本表达结果。其中，每一目标文本对应的文本表达结果中均携带了该实体对的实体关系的相关信息。

举例说明：如图2所示，以一个目标文本比如“2016年小明的妻子小玲怀上第二胎”为例，其包含的实体对中的两个实体为“小明”和“小玲”，在对该句子进行数据处理后，可以将处理后的数据输入至如图2所示的实体关系预测模型，使得该模型可在句间注意力层输出该句子的文本表达结果，定义为S1，且S1中携带了实体对“小明”和“小玲”的实体关系的相关信息。类似的，可以将其他包含该实体对的目标文本输入至如图2所示的实体关系预测模型，使得该模型可在句间注意力层输出其它目标文本的文本表达结果S2、S3、S4等。

在本实施例的一种实现方式中，步骤S301具体可以包括：通过分析目标文本中各个词语之间的依赖关系，生成该目标文本的文本表达结果。

在本实现方式中，将每一目标文本进行数据处理并将处理后的数据输入至如图2所示的预先构建的实体关系预测模型后，通过该模型可以分析出每一目标文本中各个词语之间的依赖关系，并通过模型中的Mask自注意力层进行输出，再对Mask自注意力层的所有输出值进行进一步处理后，可以得到每一目标文本对应的文本表达结果。具体实现过程可参见图4所示的步骤S3011-S3014，其示出了本实施例提供的通过分析目标文本中各个词语之间的依赖关系生成目标文本的文本表达结果的流程示意图。接下来，以目标文本“2016年小明的妻子小玲怀上第二胎”为例，对本实现过程进行说明。该流程包括以下步骤：

S3011：将目标文本的每一词语分别作为目标词语。

可以将目标文本进行分词处理，得到各个词语，这里，将每一词语定义为目标词语。假设该目标文本为“2016年小明的妻子小玲怀上第二胎”，该目标文本的各个分词词语为“2016”、“年”、“小明”、“的”、“妻子”、“小玲”、“怀上”、“第二胎”。

S3012：提取每一目标词语的词语特征。

通过步骤S3011获得该目标文本包含的所有目标词语后，可以提取每一目标词语对应的词语特征。一种可选的实现方式是，对于每一目标词语而言，目标词语的词语特征可以包括该目标词语的语义信息、以及该目标词语的位置信息和/或该目标词语的句法信息。

在本实现方式中，目标词语的词语特征可以是该目标词语的向量表达结果，即，可以用目标词语的词向量表征其对应的语义信息，用目标词语的位置向量表征其对应的位置信息，用目标词语的句法向量表征其对应的句法信息。并且，需要说明的是，为了准确生成目标文本的文本表达结果，对于每一目标词语而言，其对应的词语特征中必须包含表征其语义信息的词向量，在此基础上，可以将目标词语的位置向量和/或句法向量作为辅助特征，用于后续的实体关系预测。

其中，目标词语的词向量可以通过向量生成方法来生成，比如，可以通过word2vec方法生成词向量。

目标词语的位置向量可以通过计算该目标词语相对于其所属目标文本包含的两个实体词之间的偏移位置得到。以图2中的句子“2016年小明的妻子小玲怀上第二胎”为例，其中的目标词语“2016”位于实体一“小明”左边第二个词、实体二“小玲”左边第五个词，因此，“2016”的位置向量即为[-2,-5]，其它分词的位置向量可以采用类似方式得到。

目标词语的句法向量可以通过依存句法分析技术对该目标词语所属的目标文本进行句法分析，并根据依存句法分析结果中的依存关系进行提取，比如可以利用哈工大语音技术平台(Language Technology Platform，简称LTP)进行提取，具体的提取过程为：通过调用LTP平台的依存句法分析接口函数，导入该平台已有的模型和参数，输入进行分词处理后的目标文本，即可获得每个目标词语的依存特征。其中，依存句法分析中的依存关系可以为常见的15种关系，比如，可以是主谓、动宾、间宾、并列、定中、动补等关系。然后，再根据目标文本中各个目标词语之间的依存关系，生成每一目标词语对应的句法向量，该句法向量可以为一个多维(比如15维)的向量，其中，每一维度对应一种依存关系，对于目标文本存在的各个依存关系，将其对应的维度值置为1，否则置为0。

S3013：对于每一目标词语，根据目标词语的词语特征生成该目标词语的第一语义表达结果，并根据该目标词语以及该目标词语的相邻词语各自的第一语义表达结果，生成该目标词语的第二语义表达。

通过步骤S3012提取每一目标词语的词语特征(词向量以及句法向量、位置向量中的至少一种向量)后，可将其作为输入数据，输入至如图2所示的实体关系预测模型，以每一目标词语(即“2016”、“年”、“小明”、“的”、“妻子”、“小玲”、“怀上”、“第二胎”)的词语特征为词向量、句法向量和位置向量为例，将其输入至实体关系预测模型的输入层后，如图2所示，可通过该模型中的BiLSTM层对这些输入向量进行编码处理，以生成每一目标词语的第一语义表达结果，然后，BiLSTM层将其输出的各个第一语义表达结果输入至Mask自注意力层。

具体来讲，可以通过BiLSTM层生成每一目标词语对应的前向隐层表征(如图2中BiLSTM层向右的前向箭头)、以及后向隐层表征(如图2中BiLSTM层向左的后向箭头)，将二者拼接成一个特征向量，作为相应目标词语在BiLSTM层的输出向量，即，作为相应目标词语的第一语义表达结果并输入至Mask自注意力层。

进一步的，如图2所示，对于目标文本中的每一目标词语，可以通过实体关系预测模型中的Mask自注意力层，对该目标词语以及该目标词语的相邻词语各自的第一语义表达结果进行数据处理，以生成该目标词语的第二语义表达结果，然后，Mask自注意力层将其输出的各个第二语义表达结果输入至句间自注意力层。

具体来讲，由于Mask注意力层能够学习到目标文本中各个词语之间潜在的依赖关系，同时，又由于目标文本中不同词语对于关系分类的作用不同，并且不同词语之间的相互依赖关系与其位置存在较大的关联。因此，通过Mask自注意力层获取到每一目标词语的第一语义表达结果后，再对整个目标文本进行编码，并将编码后的向量作为每个目标词语在该层的输出向量，即，作为每一目标词语的第二语义表达结果输入至句间自注意力层。其中，在计算每个目标词语的第二语义表达结果时，并不是用到目标文本中所有词语的第一语义表达结果，而是仅用到目标词语及其相邻词语各自的第一语义表达结果进行计算，以生成该目标词语的对应的第二语义表达结果。根据每个目标词语在目标文本中所处位置的不同，在计算每一目标词语对应的第二语义表达结果时，可以分成以下三种不同的情形：

在第一种情形中，若目标词语是实体对中的一个实体词，则该目标词语的相邻词语不包括实体对的另一实体词。

在本实现方式中，若目标词语是实体对中的一个实体词，如图2所示的“小明”或“小玲”，则该目标词语的相邻词语不包括实体对的另一实体词，比如，假设该目标词语是“小明”，则其相邻词语不包括“小玲”。

以目标词语为实体词“小明”为例，在计算其对应的第二语义表达结果时，如图2所示，其相邻词语不包括另一实体词“小玲”，但可以包括目标文本的第一个词语与另一实体词“小玲”之间的词语，由此，目标词语“小明”对应的相邻词语可以为“2016”、“年”、“的”、“妻子”，再将实体词“小明”的第一语义表达结果与这些相邻词的各自的第一语义表达结果相结合，即可计算出目标词语“小明”对应的第二语义表达结果，具体的计算公式如下：

其中，i表示实体词“小明”所在位置；表示实体词“小明”对应的第二语义表达结果(即实体词“小明”在Mask自注意力层中的输出向量)；j＝0表示第一个相邻词语“2016”所在位置；e2表示另一实体词“小玲”所在位置；h_j表示第j个词语对应的第一语义表达结果(即第j个词语在BiLSTM层中的输出向量)；α_j表示第j个词语在计算实体词“小明”对应的第二语义表达结果时所占的权重值。

α_j的具体计算公式如下：

其中，f为变换函数，一般可采用多层感知器(Multilayer Perceptron，简称MLP)；m为实体词“小明”与其相邻词语的总个数；h_i表示第i个词语对应的第一语义表达结果(即第i个词语在BiLSTM层中的输出向量)；h_j是表示实体词“小明”对应的第二语义表达结果。

以目标词语为实体词“小玲”为例，在计算其对应的第二语义表达结果时，如图2所示，其相邻词语不包括另一实体词“小明”，但可以包括目标文本的另一实体词“小明”与最后一个词语之间的词语，由此，目标词语“小玲”对应的相邻词语可以为“的”、“妻子”、“怀上”、“第二胎”，再将实体词“小玲”的第一语义表达结果与这些相邻词语的各自的第一语义表达结果相结合，即可计算出目标词语“小玲”对应的第二语义表达结果，具体的计算公式如下：

其中，i表示实体词“小玲”所在位置；表示实体词“小玲”对应的第二语义表达结果(即实体词“小玲”在Mask自注意力层中的输出向量)；e1表示另一实体词“小明”所在位置；T表示目标文本中最后一个词语所在的位置；h_j表示第j个词语对应的第一语义表达结果(即第j个词语在BiLSTM层中的输出向量)；α_j表示第j个词语在计算实体词“小玲”对应的第二语义表达结果时所占的权重值，α_j的取值可通过上述公式(3)的类似方法计算得到，将实体词“小明”替换为实体词“小玲”即可。

在第二种情形中，若目标词语不是实体对中的一个实体词、且实体对的两个实体词位于该目标词语的同侧，则该目标词语的相邻词语包括与目标词语最近的实体词。

在本实现方式中，若目标词语不是实体对中的一个实体词、且实体对的两个实体词位于该目标词语的同侧。比如，假设实体对的两个实体词均位于该目标词语的右侧，则该目标词语的相邻词语包括与该目标词语最近的实体词，即包含两个实体词中位于左侧的实体词，例如，如图2所示，实体对的两个实体词“小明”和“小玲”均位于目标词语“2016”的右侧，则该目标词语“2016”的相邻词语包括两个实体词中位于左侧的实体词“小明”；或者，假设实体对的两个实体词均位于该目标词语的左侧，则该目标词语的相邻词语包括与目标词语最近的实体词，即包含两个实体词中位于右侧的实体词，例如，实体对的两个实体词“小明”和“小玲”均位于目标词语“第二胎”的左侧，则该目标词语“第二胎”的相邻词语包括两个实体词中位于右侧的实体词“小玲”。

以目标词语“2016”为例，两个实体词“小明”和“小玲”均位于目标词语“2016”的右侧，在计算其对应的第二语义表达结果时，如图2所示，其相邻词语可以包括与其最近的实体词“小明”，以及第一个词语与实体词“小明”之间的词语，由此，目标词语“2016”的相邻词语可以包括“年”和“小明”，再将目标词语“2016”自身的第一语义表达结果与这些相邻词语各自的第一语义表达结果相结合，即可计算出目标词语“2016”对应的第二语义表达结果，具体的计算公式如下：

其中，i表示目标词语“2016”所在位置；表示目标词语“2016”对应的第二语义表达结果(即目标词语“2016”在Mask自注意力层中的输出向量)；j＝0表示目标词语“2016”自身(第一个词语)所在位置；e1表示与目标词语“2016”最近的实体词“小明”所在位置；h_j表示第j个词语对应的第一语义表达结果(即第j个词语在BiLSTM层中的输出向量)；α_j表示第j个词语在计算目标词语“2016”对应的第二语义表达结果时所占的权重值，α_j的取值可通过上述公式(3)的类似方法计算得到，将实体词“小明”替换为目标词语“2016”即可。

再以目标词语“第二胎”为例，两个实体词“小明”和“小玲”均位于目标词语“第二胎”的左侧，在计算其对应的第二语义表达结果时，如图2所示，其相邻词语可以包括与其最近的实体词“小玲”，以及该实体词“小玲”与最后一个词语之间的词语，由此，目标词语“第二胎”对应的相邻词语可以为“小玲”和“怀上”，再将目标词语“第二胎”自身的第一语义表达结果与这些相邻词语各自的第一语义表达结果相结合，即可计算出目标词语“第二胎”对应的第二语义表达结果，具体的计算公式如下：

其中，i表示目标词语“第二胎”所在位置；表示目标词语“第二胎”对应的第二语义表达结果(即目标词语“第二胎”在Mask自注意力层中的输出向量)；e2表示与目标词语“第二胎”最近的实体词“小玲”所在位置；Y表示目标文本中最后一个词语所在位置；h_j表示第j个词语对应的第一语义表达结果(即第j个词语在BiLSTM层中的输出向量)；α_j表示第j个词语在计算目标词语“第二胎”对应的第二语义表达结果时所占的权重值，α_j的取值可通过上述公式(3)的类似方法计算得到，将实体词“小明”替换为目标词语“第二胎”即可。

在第三种情形中，若目标词语不是实体对中的一个实体词、且实体对的两个实体词位于该目标词语的两侧，则该目标词语的相邻词语包括实体对的两个实体词。

在本实现方式中，若目标词语不是实体对中的一个实体词、且实体对的两个实体词分部位于该目标词语的两侧。如实体对的两个实体词分部位于该目标词语的左侧和右侧，则该目标词语的相邻词语可以包括这两个实体词。例如，如图2所示，实体对的两个实体词“小明”和“小玲”分别位于目标词语“的”的左侧和右侧，则该目标词语“的”的相邻词语可以包括这两个实体词“小明”和“小玲”。

如图2所示，以目标词语“的”为例，实体对的两个实体词“小明”和“小玲”分别位于目标词语“的”的左侧和右侧，在计算其对应的第二语义表达结果时，其相邻词语可以包括“小明”和“小玲”，以及二者之间的词语，由此，目标词语“的”对应的相邻词语即为“小明”、“妻子”和“小玲”，再将目标词语“的”自身的第一语义表达结果与这些相邻词语各自的第一语义表达结果相结合，即可计算出目标词语“的”对应的第二语义表达结果，具体的计算公式如下：

其中，i表示目标词语“的”所在位置；表示目标词语“的”对应的第二语义表达结果(即目标词语“的”在Mask自注意力层中的输出向量)；e1表示位于目标词语“的”左侧的实体词“小明”所在位置；e2表示位于目标词语“的”右侧的实体词“小玲”所在位置；h_j表示第j个词语对应的第一语义表达结果(即第j个词语在BiLSTM层中的输出向量)；α_j表示第j个词语在计算目标词语“的”对应的第二语义表达结果时所占的权重值，α_j的取值可通过上述公式(3)的类似方法计算得到，将实体词“小明”替换为目标词语“的”即可。

S3014：根据各个目标词语的第二语义表达结果，生成目标文本的文本表达结果。

如图2所示，利用实体关系预测模型，可以将通过步骤S3013生成的每一目标词语的第二语义表达结果(即每个目标词语在Mask自注意力层的输出向量)，输入至句间自注意力层，通过该句间自注意力层对这些输入向量进行处理后，可生成目标文本的文本表达结果。

具体地，可以在实体关系预测模型的句间自注意力层中，通过句间注意力机制，将每一目标词语的第二语义表达结果(即生成的每个目标词语在Mask自注意力层的输出向量)进行拼接，以生成该目标文本对应的文本表达结果S1，其中，该文本表达结果中携带了目标文本所包含的实体对的实体关系的相关信息。同理，可以得到包含该实体对的其他目标文本对应的文本表达结果S2、S3、S4等，如图2所示，具体实现过程可参见上述S1生成过程的介绍。

S302：根据各个目标文本的文本表达结果，分别确定每一目标文本对实体对的实体关系的体现程度。

在本实施例中，通过步骤S301生成每一目标文本的文本表达结果后，比如生成四个目标文本分别对应的文本表达结果S1、S2、S3、S4后，进一步可以基于各个文本表达结果，通过句间自注意力层来计算每一目标文本对应的权重值，该权重值表征对应目标文本对该实体对的实体关系的体现程度，权重值的计算公式如下：

其中，s_i表示第i个目标文本的文本表达结果；b_i表示第i个目标文本对应的权重值；exp为指数函数；N表示包含该实体对的不同目标文本的个数。

接着，本实施例将利用上述实体关系预测模型，对第一实施例中的S103“根据每一目标文本分别对该实体对的实体关系的体现程度，预测该实体对的实体关系”的具体实施方式进行介绍。

在本实施例的一种实现方式中，步骤S103具体可以包括：根据每一目标文本分别对应的文本表达结果和权重值，预测目标文本所包含的实体对的实体关系，其中，权重值表征了对应目标文本对实体对的实体关系的体现程度。

在本实现方式中，在利用实体关系预测模型，通过上述步骤S301-S302确定出每一目标文本分别对应的文本表达结果(比如S1、S2、S3、S4等)，以及每一目标文本分别对应的权重值b_i(可通过上述公式(8)计算得到)后，可通过句间自注意力层对每一目标文本分别对应的文本表达结果和权重值做进一步处理，再根据处理后的结果预测出该实体对的实际实体关系。具体的处理过程可以包括下述步骤S501-S502：

S501：根据每一目标文本分别对应的文本表达结果和权重值，生成一个实体关系表达结果。

在本实施例中，可以根据每一目标文本分别对应的文本表达结果和权重值，通过下述公式(9)计算出各个目标文本的综合表达结果：

其中，s_i表示第i个目标文本的文本表达结果；b_i表示第i个目标文本对应的权重值；N表示包含同一实体对的不同目标文本的个数；P为各个目标文本的综合表达结果。

这里，可以将该综合表达结果P称为实体关系表达结果，并将其输入至实体关系预测模型的输出层，如图2所示，用以预测该实体对的实体关系。

S502：根据该实体关系表达结果，预测实体对的实体关系。

在本实施例中，通过步骤S501生成一个实体关系表达结果P，并将其输入至实体关系预测模型的输出层后，可以通过该输出层，基于该实体关系表达结果P，输出该实体对属于每一预设实体关系类型时的概率，而其中最大概率值对应的实体关系类型即为预测出的该实体对的实体关系。其中，输出层可以是一个Softmax多标签分类器。

综上，本实施例利用预先构建的体关系预测模型，先确定出每一目标文本分别对所包含实体对的实体关系的体现程度，再基于各个目标文本对应的体现程度，预测出每一目标文本中所包含的实体对的实体关系，从而可以提高实体关系的预测结果的准确性。

第三实施例

本实施例将对一种实体关系预测装置进行介绍，相关内容请参见上述方法实施例。

参见图6，为本实施例提供的一种实体关系预测装置的组成示意图，该装置600包括：

目标文本获取单元601，用于获取包含同一实体对的不同目标文本，所述实体对包括两个不同的实体词；

体现程度确定单元602，用于确定每一目标文本分别对所述实体对的实体关系的体现程度；

实体关系预测单元603，用于根据每一目标文本分别对所述实体对的实体关系的体现程度，预测所述实体对的实体关系。

在本实施例的一种实现方式中，所述体现程度确定单元602包括：

在本实施例的一种实现方式中，所述表达结果生成子单元具体用于：

在本实施例的一种实现方式中，所述表达结果生成子单元包括：

词语特征提取子单元，用于提取每一目标词语的词语特征；

在本实施例的一种实现方式中，所述目标词语的词语特征包括所述目标词语的语义信息、以及所述目标词语的位置信息和/或所述目标词语的句法信息。

在本实施例的一种实现方式中，若所述目标词语是所述实体对中的一个实体词，则所述目标词语的相邻词语不包括所述实体对的另一实体词；

在本实施例的一种实现方式中，所述实体关系预测单元603具体用于：

在本实施例的一种实现方式中，所述实体关系预测单元603包括：

在本实施例的一种实现方式中，所述体现程度确定单元602具体用于：

相应地，所述实体关系预测单元603具体用于：

在本实施例的一种实现方式中，所述实体关系预测模型的训练语料包括多个样本文本，所述样本文本中的实体对的实体关系被预先标注且通过查询预先构建的实体关系数据库进行标注。

进一步地，本申请实施例还提供了一种实体关系预测设备，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述实体关系预测方法的任一种实现方法。

进一步地，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述实体关系预测方法的任一种实现方法。

进一步地，本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述实体关系预测方法的任一种实现方法。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如媒体网关等网络通信设备，等等)执行本申请各个实施例或者实施例的某些部分所述的方法。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种实体关系预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述确定每一目标文本分别对所述实体对的实体关系的体现程度，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述目标文本的文本内容，生成所述目标文本的文本表达结果，包括：

4.根据权利要求3所述的方法，其特征在于，所述通过分析所述目标文本中各个词语之间的依赖关系，生成所述目标文本的文本表达结果，包括：

将所述目标文本的每一词语分别作为目标词语；

提取每一目标词语的词语特征；

5.根据权利要求4所述的方法，其特征在于，所述目标词语的词语特征包括所述目标词语的语义信息、以及所述目标词语的位置信息和/或所述目标词语的句法信息。

6.根据权利要求4所述的方法，其特征在于，

7.根据权利要求2所述的方法，其特征在于，所述根据每一目标文本分别对所述实体对的实体关系的体现程度，预测所述实体对的实体关系，包括：

8.根据权利要求7所述的方法，其特征在于，所述根据每一目标文本分别对应的文本表达结果和权重值，预测所述实体对的实际实体关系，包括：

根据所述实体关系表达结果，预测所述实体对的实体关系。

9.根据权利要求1至8任一项所述的方法，其特征在于，所述确定每一目标文本分别对所述实体对的实体关系的体现程度，包括：

10.根据权利要求9所述的方法，其特征在于，所述实体关系预测模型的训练语料包括多个样本文本，所述样本文本中的实体对的实体关系被预先标注且通过查询预先构建的实体关系数据库进行标注。

11.一种实体关系预测装置，其特征在于，包括：

12.根据权利要求11所述的装置，其特征在于，所述体现程度确定单元包括：

13.根据权利要求12所述的装置，其特征在于，所述表达结果生成子单元具体用于：

14.根据权利要求13所述的装置，其特征在于，所述表达结果生成子单元包括：

词语特征提取子单元，用于提取每一目标词语的词语特征；

15.根据权利要求14所述的装置，其特征在于，所述目标词语的词语特征包括所述目标词语的语义信息、以及所述目标词语的位置信息和/或所述目标词语的句法信息。

16.根据权利要求14所述的装置，其特征在于，

17.根据权利要求12至16任一项所述的装置，其特征在于，所述实体关系预测单元具体用于：

18.一种实体关系预测设备，其特征在于，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行权利要求1-10任一项所述的方法。

19.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行权利要求1-10任一项所述的方法。

20.一种计算机程序产品，其特征在于，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行权利要求1-10任一项所述的方法。