CN113779211A

CN113779211A - 一种基于自然语言实体关系的智能问答推理方法和系统

Info

Publication number: CN113779211A
Application number: CN202110902862.3A
Authority: CN
Inventors: 李瑞轩; 辜希武; 吴小建; 李玉华
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2021-08-06
Filing date: 2021-08-06
Publication date: 2021-12-10
Anticipated expiration: 2041-08-06
Also published as: CN113779211B

Abstract

本发明公开一种基于自然语言实体关系的智能问答推理方法和系统，属于自然语言处理领域。包括：将语料库中每条语句进行分词、实体词提取；以自然语句作为实体关联的边，形成实体关系，对语料库中实体连接关系进行汇总，形成基于自然语言实体关系的语义网络数据库；设计基于BERT预训练语言模型和图神经网络的智能推理深度学习模型；以用户提交问题相关的实体连接图输入网络进行推理，通过多层感知机进行结果筛选给出最终答案。本发明通过任意给定的自然语言文本语料库自动构建实体关系数据库，避免通过人工介入手段进行实体提取和标注，并通过分析用户的复杂问句来自动发现和推理出答案，以帮助用户更快和更精准获得所需结果。

Description

一种基于自然语言实体关系的智能问答推理方法和系统

技术领域

本发明属于自然语言处理领域，更具体地，涉及一种基于自然语言实体关系的智能问答推理方法和系统。

背景技术

随着信息化产业的蓬勃飞速发展，人们对于各个领域的信息搜索和分析的需求也是与日俱增。面对互联网每日以惊人速度增长的信息和内容，如何从这些爆炸的信息中快速检索出人们想要的东西也变得愈发重要和迫切。这里面涉及到查询时的易用度和精准度的权衡：一方面，虽然可以设计和使用结构化的查询语言来精准描述自己的目标并快速获取到想要的结果，但是掌握并灵活地应用这些专业查询语言会使得学习成本陡然上升，因此并不适用于一般的用户和从业者；另一方面，使用常用的搜索引擎，人们可以用自然语言描述自己的问题并获取结果，这种检索方式简单且符合人类逻辑，但搜索引擎返回的结果往往是纷繁复杂、眼花缭乱的，包含很多冗余和错误的页面，要求查询者自己去遴选甄别出所需要的特定信息，这无疑增加了使用者的负担；更进一步的，由于用户检索时使用的是自然语言，这里面通常包含着复杂的语义内涵以及隐去了的常识性背景知识，而主流的搜索引擎一般都是基于关键词来完成内容检索任务，这进一步降低了搜索结果的准确率和召回率。

因此，一个理想的检索系统应该能同时具备简单易用和精准结果两个特性，而这正是智能问答系统所具备和要解决的。智能问答系统能够接受用户以自然语言输入的提问和描述，经过分析和推理后给出一个准确而简明的答案，而非冗杂的网页以供用户甄选，所以智能问答系统是比搜索引擎更为高效和易用的，也越来越受到多方的关注。此外在构建问答系统时需要额外的信息数据库提供问答决策支持。近年来一些产品化的问答系统也应运而生，例如Apple公司的Siri助手、Google公司的Google Now应用。智能问答利用自然语言处理(NLP)技术，能够充分理解用户提交的查询语句，深入挖掘其中信息之间的语义联系，然后更为精确地返还给用户理想的结果。

在这其中，语料库的构建和决策推理信息的生成也面临着一些问题和挑战：通常的语料信息库是搜集自各种网页文本，然后进行数据清洗和结构化处理，例如处理为典型的RDF三元组结构。高度结构化的语料库在结点检索时较方便，也有利于自动推理，但是其缺点是难以大规模生成和保持数据时效性的更新，且面对复杂语义的自然语言时不能够很好的采样出一个连接密集的网络化结构数据，特别是面对实际需求时更是捉襟见肘，面对这些巨量的数据也变得越来越不现实。由此推广至其他有类似需求的行业也是一样的，故而相关行业从业者也迫切希望能够借助人工智能技术来构建领域高效智能的信息处理系统以便能够把握行业动态、增加自己的竞争能力。

发明内容

针对现有技术的缺陷和改进需求，本发明提供了一种基于自然语言实体关系的智能问答推理方法和系统，其目的在于将海量的文本数据直接作为数据源，从其中自动生成问题相关的、基于自然语言实体连接关系的决策数据，并交由智能问答系统进行推理和给出准确结果。

为实现上述目的，按照本发明的第一方面，提供了一种基于自然语言实体关系的智能问答推理方法，所述方法包括：

一、实体关系语料库构建阶段：

对语料库中每一条语句进行分词操作；从分词后的语句中提取实体词；

以提取到的实体词为基础，若两个实体出现在同一自然语句中，则该条自然语句作为连接这两个实体的边，构成实体关系；对语料库中实体连接关系进行汇总，形成实体关系语料库；

二、训练阶段：

构建智能推理深度学习模型，所述智能推理深度学习模型包括：BERT模型，用于对实体连接关系数据进行词向量编码，并对图结构本身进行信息的编码融合，这些数据转换为向量结构后发送至图神经网络；图神经网络，用于对向量结构进行学习，根据语言信息本身进行理解完成推理，并给出最终的答案；

使用Mask遮盖机制将文本随机遮蔽掉部分内容，通过文章上下文来预测被遮盖的词是什么，依次初步训练BERT模型相应的参数；从语料库中随机选取几万条连续的句子对和不连续的句子对组成两个集合，让BERT去识别预测那些句子对是连续的而那些不是，得到预训练好的BERT模型；采用训练样本集训练图神经网络，训练样本包括问题、答案以及若干反例；

三、应用阶段：

对输入的问题语句进行分词和实体词提取，得到问题实体词；从实体关系语料库中获得问题相关的实体连接关系图；以问题相关的实体连接关系图作为推理决策数据，输入智能推理深度学习模型进行推理，将评分最高的结点作为最终答案结点的输出。

优选地，所述从分词后的语句中提取实体词，包括：

S16：给定已经分好词的句子s＝{w₁,w₂,w₃,...,w_n}，按照n-gram算法收集可能出现的实体词(w₁),(w₂),...,(w_n)、(w₁w₂),(w₂w₃),...,(w_n-1w_n)、……、(w₁w₂w₃...w_n)；

S17：计算实体的识别概率为Pr(w)＝Anchor(w)/Freq(w)，若Pr(w)低于选取实体识别概率阈值γ_ed，则筛除，其中，w表示n-gram词，Freq(w)表示w在整个语料库中出现的频数；Anchor(w)表示w在整个语料库中以锚点形式出现的频数；

S18：计算句子中其他词汇w₂对实体

的支持程度

其中，Pr(e'|w₂)是先验概率，Entity(w)表示词汇w所有可能指向的实体集合，

表示两个实体

的关联度，N_p(w₂)表示所有包含实体w₂的页面的集合的元素个数；

S19：对于

计算w_k与其可能的实体词

的匹配契合程度分数为

其中，w_k表示句子s提取到的锚点集合中的词汇，Entity(w_k)表示w_k对应的所有可能的实体集合；

S110：词汇最终对应的实体为

其中，Entity(s)表示句子s最终对应的实体集合，γ₁表示约束实体的先验概率的阈值，γ₂表示筛选掉较低分数的阈值。

有益效果：本发明设计了中文语句的实体提取方法。通过实体提取算法可以从中文语句中提炼出有效的实体，为后续任务打下基础，并使得在推理时深层次挖掘实体之间的联系变得可行。

优选地，两个实体

的关联度

为

其中，N_p＝|∪_wPages(w)|表示语料库中所有页面的总数。

优选地，对得到的实体进一步筛选，具体如下：

(1)分别计算实体识别概率Pr(e)以及所度量的实体与句子间的关联度R(e,s)：

(2)取二者的算术平均数作为最终筛选的指标

(3)若

表示阈值，则筛去，得到实体集合

优选地，所述形成实体关系包括：

S21：对任意a_p∈A以及对任意e_q∈E，A＝{a₁,a₂,...,a_k}表示经检索后与这些实体有关联的可能的答案实体集合，E＝{e₁,e₂,...,e_n}表示提取到的实体词集合，从语料库中包含二者联系的所有句子

作为两个实体连接的关系，则得到集合

其中，|S_p,q|＝N_p,q，N_p,q表示句子

的个数；

S22：当

但

时，依然认为

是有效的实体关系，对e_q也是同理，其中，

表示设e_p对应的文档；

S23：将语料库包含的所有实体E及其连接的边V，以及边上的自然语言语句S共同存入语义网络数据库中，构成图结构G＝(E,V,S)。

有益效果：本发明设计了基于自然语言实体连接关系的生成方法，避免了前期对文本的结构化处理，使得数据来源变得更加广泛，以及不依赖于前期人工标注数据，使得后续的问答系统能够应对复杂查询问题成为了可能。

优选地，所述问题相关的实体连接关系图的获得方式包括：

S34：分析问题Q可能包含的实体得到集合E_Q＝{e₁,e₂,...,e_n}；

S35：

在语义网络数据库G中寻找与之有边连接的其他实体E_i；

S36：查询后得到与问题Q相关的其他实体集合

二者的并集构成问题相关的实体连接关系图结点E_Q←E_Q∪E_other，此外，与它们直接的连接边V_Q以及边上关联的自然语言语句S_Q共同构成一个问题Q相关的子图

即实体连接关系图。

优选地，所述输入智能推理深度学习模型进行推理，将评分最高的结点作为最终答案结点的输出：

S410：输入的实体关系图分成问题描述Q、结点词E、连接边上的自然语言句子S以及对诸结点的附加描述信息T；

S411：将输入的数据中的Q、S和T使用BERT的分词器BERT-Tokenizer进行分词，并通过BERT进行词嵌入向量编码{v₁,v₂,...,v_n}＝BERT{w₁,w₂,...,w_n}；

S412：使用门控递归循环神经网络GRU单元依次对词嵌入向量进行基于注意力机制的编码操作，依次得到向量{h₁,h₂,...,h_n}＝GRU{v₁,v₂,...,v_n}；

S413：每一个输出结果h_i，定义其注意力权重α_i为α_i＝expWh_i/∑_jexpWh_j，其中，权重矩阵W通过GNN学习得到；

S414：使用注意力机制，对所有的输出进行加权，得到最终的输出h_o＝∑_iα_ih_i；

S415：对于S输出采用其向量的平均值；

S416：在参数迭代学习过程中，对问题、语句和附加信息结点的向量表示变量各自使用图卷积神经网络进行学习；

S417：在图神经网络进过多层迭代输出后，候选节点的输出表示融合本轮和上一轮的所有的问题结点、附加信息、语句文本的信息；

S418：经过图神经网络的若干轮操作后，得到答案候选实体结点E_C的输出{h_c：c∈C}，使用Sigmoid函数将它们映射为一个实数作为答案的概率，取最大的结果作为正确答案A：

其中，score(h_c)是通过接入一个多层感知机来获得。

优选地，S41中的信息具体包括：

问题文本Q：它是一段中文自然语言的描述；

问题实体Q_i：这些是通过实体提取算法从问题文本Q中提取出来的；

反例结点F_i：反例是与诸问题结点Q_i有关联的结点，有证据表明它们似乎也可以作为答案，但实际上并不是问题的真正答案；反例结点有助于在图神经网络训练时提供足够的信息以帮助网络模型做出正确的判断；

答案结点A：即问题描述Q的真正答案，从而E_other＝{A}∪F_i，以及E_Q＝Q_i∪E_other；

自然语言句子关联E_i：是对结点是否是问题答案的一种佐证信息，可以在推理时提供信息支持；

附加信息T_i：每个实体结点和候选结点都可以附带一个附加信息，用于进一步描述结点，并提供更丰富的语义信息。

优选地，步骤S47中参数迭代时的计算过程为：

对于顶点n，设其附加信息为t，则设顶点的向量表示是

将

分别输入到图卷积神经网络中进行传播计算，即第r轮迭代有

其中，句子向量是多个论据向量的平均值，而问题结点n_q的向量表示融合了本轮产生的问题向量以及与上一轮的自身输出做了叠加，并通过图卷积神经网络做了计算；第r轮迭代完成后，得到

将

作点乘，并通过Sigmoid函数归一化后得到一个数值p_n，其计算方法为：

以

为权重，计算候选结点的第r轮迭代形式记作

量化结果

就是候选实体n_c的表示。

为实现上述目的，按照本发明的第二方面，提供了一种基于自然语言实体关系的智能问答推理系统，计算机可读存储介质和处理器；

所述计算机可读存储介质用于存储可执行指令；

所述处理器用于读取所述计算机可读存储介质中存储的可执行指令，执行第一方面所述的基于自然语言实体关系的智能问答推理方法。

总体而言，通过本发明所构思的以上技术方案，能够取得以下有益效果：

本发明使用BERT预训练语言模型和图神经网络技术，设计基于自然语言实体连接关系的智能问答推理算法。一个良好的推理算法可以充分理解用户问题的内容并给出准确的答案。推理算法的基本思想就是给每一个可能是答案的结点进行评分然后输出最高分的作为结果。

附图说明

图1是本发明提供的一种基于自然语言实体关系的智能问答推理方法的流程示意图；

图2是本发明实施例中基于自然语言实体关系的语义网络数据库的生成流程示意图；

图3是本发明实施例中学习参数迭代的流程示意图；

图4是本发明实施例中智能问答推理模型的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明提供了一种基于自然语言实体关系的智能问答推理方法，如图1所示，整个流程包括：语料库实体提取、语料库实体关系数据库生成、用户问题的分析与实体关系图生成、智能问答推理结果，具体包括：

S1：将原始语料库中每一条语句都进行分词操作，然后利用实体提取算法进行实体词的提取；

S2：以自然语句作为实体关联的边，形成实体关系，对语料库中实体连接关系进行收集和汇总，形成基于自然语言实体关系的语义网络数据库；

S3：根据用户提交的问题描述，进行问题实体词提取，并从语义网络数据库中获得实体连接关系图结构；

S4：设计基于BERT预训练语言模型和图神经网络的智能推理深度学习模型；；以问题相关的实体连接图输入网络进行推理，并通过多层感知机进行结果的筛选给出最终的答案。

进一步地，所述步骤S1中的实体提取算法步骤包括：

S11：给定输入已经分好词的句子s＝{w₁,w₂,w₃,...,w_n}，按照n-gram算法来收集可能出现的实体词(w₁),(w₂),...,(w_n)、(w₁w₂),(w₂w₃),...,(w_n-1w_n)、……、(w₁w₂w₃...w_n)。

S12：设词汇w，令Freq(w)表示w在整个语料库中出现的频数；Anchor(w)表示w在整个语料库中以实体链接形式出现的频数，定义实体的识别概率为Pr(w)＝Anchor(w)/Freq(w)，选取实体识别概率阈值γ_ed，如果Pr(w)低于γ_ed则筛选掉。

S13：设词汇w₁的所有可能实体集合是Entity(w₁)，定义句子中其他词汇w₂对实体

的支持程度为

其中，Pr(e'|w₂)是先验概率，

表示两个实体

的关联度。

S14：设词汇w_k，它对应的所有可能的实体集合记为Entity(w_k)，对于

定义w_k与其可能的实体词

的匹配契合程度分数为

它是句子中其他词汇对其支持程度的和。

S15：词汇最终对应的实体为

句子s最终对应的实体集合记作Entity(s)。

如图2所示，实体关系数据库的生成具体包括：

S21：设通过对语料库中语句s进行实体提后得到实体集合E＝{e₁,e₂,...,e_n}。

S22：对任意e_p∈E以及对任意e_q∈E，从语料库中包含二者联系的任何句子

作为两个实体连接的关系。

S23：设这样的句子共有N_p,q个，则

其中，|S_p,q|＝N_p,q。

S24：此外，假设e_p对应的文档是

且当

但

时，我们依然认为

是有效的实体关系，因为此时假设

隐式地包含了e_p，对e_q也是同理。

S25：将语料库包含的所有实体E及其连接的边V，以及边上的自然语言语句S共同存入语义网络数据库中，形成一个图结构G＝(E,V,S)。

此外用户的问题生成实体连接关系图的步骤包括：

S31：分析问题Q可能包含的实体得到集合E_Q＝{e₁,e₂,...,e_n}。

S32：

在语义网络数据库G中寻找与之有边连接的其他实体E_i。

S33：查询后得到与问题Q相关的其他实体集合

即实体连接关系图；

智能问答推理的过程如图4所示，主要包括：

S41：输入的实体关系图可以分成问题描述Q、结点词E、连接边上的自然语言句子S以及对诸结点的附加描述信息T。

S42：将输入的数据中的Q、S和T使用BERT的分词器BERT-Tokenizer进行分词，并通过BERT进行词嵌入向量编码{v₁,v₂,...,v_n}＝BERT{w₁,w₂,...,w_n}，如图3所示。

S43：使用门控递归循环神经网络GRU单元依次对词嵌入向量进行基于注意力机制的编码操作，依次得到向量{h₁,h₂,...,h_n}＝GRU{v₁,v₂,...,v_n}。

S44：每一个输出结果h_i，定义其注意力权重α_i为α_i＝expWh_i/∑_jexpWh_j，其中权重矩阵W是可以通过GNN学习得到。

S45：使用注意力机制，我们对所有的输出进行加权，得到最终的输出h_o＝∑_iα_ih_i，如图3所示。

S46：特别地，由于两个结点直接连接的自然语言句子不止一条，因此对于S输出采用其向量的平均值。

S47：推理模型的主体是一个图神经网络，由三部分组成：输入表示、参数学习以及结点信息融合学习；在参数迭代学习过程中，对问题、语句和附加信息结点的向量表示变量各自使用图卷积神经网络进行学习。

S48：在图神经网络进过多层迭代输出后，候选节点的输出表示融合了本轮和上一轮的所有的问题结点、附加信息、语句文本的信息，将它们放在一起充分的予以考虑，量化结果

就是候选实体n_c的表示。

S49：经过图神经网络的若干轮操作后，我们得到答案候选实体结点E_C的输出{h_c：c∈C}，使用Sigmoid函数将它们映射为一个实数作为答案的概率，取最大的结果作为正确答案A：

其中score(h_c)是通过接入一个多层感知机来获得。

进一步地，所述步骤S41中：输入数据具体包括：问题文本Q：它是一段中文自然语言的描述；问题实体Q_i：这些是通过实体提取算法从问题文本Q中提取出来的；反例结点F_i：反例是与诸问题结点Q_i有关联的结点，有证据表明它们似乎也可以作为答案，但实际上并不是问题的真正答案，它们有助于在图神经网络训练时提供足够的信息以帮助网络模型做出正确的判断；答案结点A：即问题描述Q的真正答案；自然语言句子关联E_i：是对结点是否是问题答案的一种佐证信息，可以在推理时提供信息支持；附加信息T_i：每个实体结点和候选结点都可以附带一个附加信息，用于进一步描述结点，并提供更丰富的语义信息。

所述步骤S47中参数迭代时的计算过程是，由GRU模块生成的初始表示向量

分别是问题文本、附加信息和自然语言句子，然而考虑到附加信息是对实体结点的说明，实体结点反应在图上就是顶点，因此对于顶点n，设其附加信息为t，则设顶点的向量表示是

在这里将问题向量与附加信息相加，这样结点向量就融合了问题的语义信息。注意到这些顶点包括问题实体结点以及答案候选结点(此时包括正确答案和作为反例的错误答案)，必要时使用n_q,n_c加以区分。

将

分别输入到图卷积神经网络中进行传播计算，即第r轮迭代有

其中句子向量是多个论据向量的平均值，而问题结点n_q的向量表示融合了本轮产生的问题向量以及与上一轮的自身输出做了叠加，并通过图卷积神经网络做了计算。

第r轮迭代完成后，得到了

为了衡量结点n_c是否是正确答案，我们将

其直观意义在于点乘后结果同时包含了问题和支持候选结点n_c的句子信息，综合这些信息并量化它，于是就可以作为候选结点n_c是正确答案的置信度或者是权重，显然权重越大表明这个结点越有可能是正确答案。然后，以

为权重，就可以计算候选结点的第r轮迭代形式记作

它融合了本轮和上一轮的所有的问题结点、附加信息、语句文本的信息，将它们放在一起充分的予以考虑，量化结果

就是候选实体n_c的表示。

本发明提供了一种基于自然语言实体关系的智能问答推理系统，包括：

语料库预处理模块：语料库文本处理的过程，包括：繁简转换、格式转换、标签记号的去除、锚点扩增以及中文分词共五个步骤，最终得到可用的分词后语料库；

实体提取模块：利用实体提取算法进行实体词的提取，以自然语句作为实体关联的边，形成实体关系，对语料库中实体连接关系进行收集和汇总，形成基于自然语言实体关系的语义网络数据库；

实体连接关系图生成模块：根据用户提交的问题描述，进行问题实体词提取，并从语义网络数据库中获得实体连接关系图结构；

智能问答推理模块：根据用户的问题，将相关的实体连接图输入图神经网络进行推理发现，并通过多层感知机进行结果的筛选给出最终的答案。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于自然语言实体关系的智能问答推理方法，其特征在于，所述方法包括：

一、实体关系语料库构建阶段：

二、训练阶段：

三、应用阶段：

2.如权利要求1所述的方法，其特征在于，所述从分词后的语句中提取实体词，包括：

S11：给定已经分好词的句子s＝{w₁,w₂,w₃,...,w_n}，按照n-gram算法收集可能出现的实体词(w₁),(w₂),...,(w_n)、(w₁w₂),(w₂w₃),...,(w_n-1w_n)、……、(w₁w₂w₃...w_n)；

S12：计算实体的识别概率为Pr(w)＝Anchor(w)/Freq(w)，若Pr(w)低于选取实体识别概率阈值γ_ed，则筛除，其中，w表示n-gram词，Freq(w)表示w在整个语料库中出现的频数；Anchor(w)表示w在整个语料库中以锚点形式出现的频数；

S13：计算句子中其他词汇w₂对实体

的支持程度

表示两个实体

的关联度，N_p(w₂)表示所有包含实体w₂的页面的集合中元素个数；

S14：对于

计算w_k与其可能的实体词

的匹配契合程度分数为

S15：词汇最终对应的实体为

3.如权利要求2所述的方法，其特征在于，两个实体

的关联度

为

其中，N_p＝|∪_wPages(w)|表示语料库中所有页面的总数。

4.如权利要求2或3所述的方法，其特征在在于，对得到的实体进一步筛选，具体如下：

(2)取二者的算术平均数作为最终筛选的指标

(3)若

γ_s表示阈值，则筛去，得到实体集合

5.如权利要求1所述的方法，其特征在于，所述形成实体关系包括：

作为两个实体连接的关系，则得到集合

其中，|S_p,q|＝N_p,q，N_p,q表示句子

的个数；

S22：当

但

时，依然认为

是有效的实体关系，对e_q也是同理，其中，

表示设e_p对应的文档；

6.如权利要求1所述的方法，其特征在于，所述问题相关的实体连接关系图的获得方式包括：

S31：分析问题Q可能包含的实体得到集合E_Q＝{e₁,e₂,...,e_n}；

S32：

在语义网络数据库G中寻找与之有边连接的其他实体E_i；

S33：查询后得到与问题Q相关的其他实体集合

即实体连接关系图。

7.如权利要求1所述的方法，其特征在于，所述输入智能推理深度学习模型进行推理，将评分最高的结点作为最终答案结点的输出：

S41：输入的实体关系图分成问题描述Q、结点词E、连接边上的自然语言句子S以及对诸结点的附加描述信息T；

S42：将输入的数据中的Q、S和T使用BERT的分词器BERT-Tokenizer进行分词，并通过BERT进行词嵌入向量编码{v₁,v₂,...,v_n}＝BERT{w₁,w₂,...,w_n}；

S43：使用门控递归循环神经网络GRU单元依次对词嵌入向量进行基于注意力机制的编码操作，依次得到向量{h₁,h₂,...,h_n}＝GRU{v₁,v₂,...,v_n}；

S44：每一个输出结果h_i，定义其注意力权重为α_i＝expWh_i/∑_jexpWh_j，其中，权重矩阵W通过GNN学习得到；

S45：使用注意力机制，对所有的输出进行加权，得到最终的输出h_o＝∑_iα_ih_i；

S46：对于S输出采用其向量的平均值；

S47：在参数迭代学习过程中，对问题、语句和附加信息结点的向量表示变量各自使用图卷积神经网络进行学习；

S48：在图神经网络进过多层迭代输出后，候选节点的输出表示融合本轮和上一轮的所有的问题结点、附加信息、语句文本的信息；

S49：经过图神经网络的若干轮操作后，得到答案候选实体结点E_C的输出{h_c：c∈C}，使用Sigmoid函数将它们映射为一个实数作为答案的概率，取最大的结果作为正确答案A：

其中，score(h_c)是通过接入一个多层感知机来获得。

8.如权利要求7所述的方法，其特征在于，S41中的信息具体包括：

问题文本Q：它是一段中文自然语言的描述；

9.如权利要求7所述的方法，其特征在于，步骤S47中参数迭代时的计算过程为：

对于顶点n，设其附加信息为t，则设顶点的向量表示是

将

分别输入到图卷积神经网络中进行传播计算，即第r轮迭代有

将

以

为权重，计算候选结点的第r轮迭代形式记作

量化结果

就是候选实体n_c的表示。

10.一种基于自然语言实体关系的智能问答推理系统，其特征在于，计算机可读存储介质和处理器；

所述计算机可读存储介质用于存储可执行指令；

所述处理器用于读取所述计算机可读存储介质中存储的可执行指令，执行权利要求1至9任一项所述的基于自然语言实体关系的智能问答推理方法。