CN112287120A

CN112287120A - 一种基于强化学习的双系统知识图谱的知识推理方法

Info

Publication number: CN112287120A
Application number: CN202011219474.7A
Authority: CN
Inventors: 舒明雷; 刘浩; 王英龙; 周书旺; 刘照阳; 高天雷; 单珂
Original assignee: Shandong Computer Science Center National Super Computing Center in Jinan; Shandong Institute of Artificial Intelligence
Current assignee: Shandong Computer Science Center National Super Computing Center in Jinan; Shandong Institute of Artificial Intelligence
Priority date: 2020-11-04
Filing date: 2020-11-04
Publication date: 2021-01-29

Abstract

一种基于强化学习的双系统知识图谱的知识推理方法，通过融合高精度的分布式表示推理的单步推理算法和强化学习策略路径，搭建用于推理的推理系统和用于评价的评价系统。训练完备的评价系统帮助推理系统训练，使得推理系统可以学习评价系统中的网络信息。基于训练完备的评价系统对推理系统的推理路径评价，完成路径推理。

Description

一种基于强化学习的双系统知识图谱的知识推理方法

技术领域

本发明涉及，具体涉及一种基于强化学习的双系统知识图谱的知识推理方法。

背景技术

人工智能走入产业后，可以分为感知智能、认知智能和行为智能，后两者更与生产力相对应，NLP和知识图谱是发展认知智能的基础。一方面，在面对数据多样、复杂，孤岛化，且单一数据价值不高的应用场景时，使用知识图谱推理技术将带来最佳的应用价值。另一方面，认知智能在是探寻人类学习、理解、产生决策的生物能力，而知识图谱推理是实现认知推理的关键技术。同时，对于自动搭建的知识图谱和手动搭建的图谱，往往都面临不完整、知识缺失、实例正确性判断等问题，难以应用到垂直搜索、问答系统等领域。解决方案之一是通过对知识图谱实施有效的知识多步推理，进行知识图谱补全、链接预测、实例正确性判断。这其中包括基于一阶谓词逻辑规则的推理算法、本体推理算法、基于随机路径游走的推理算法和基于分布式表示的推理算法。

发明内容

本发明为了克服以上技术的不足，提供了一种基于Bert预训练，融合强化学习思想和分布式表示推理的多步路径推理方法。

本发明克服其技术问题所采用的技术方案是：

一种基于强化学习的双系统知识图谱的知识推理方法，包括如下步骤：

a)将知识图谱的三元组数据输入基于Bert的预训练模型，处理得到三元组的嵌入向量表示vector_v～(e,r)；

b)将嵌入向量表示vector_v～(e,r)分别输入ComplEx模型和基于神经网络的ConvE模型后分别训练测试，两个训练测试互不干扰，得到训练完备的评价系统；

c)选择多层感知机模型或多层Transformer的Encoder，完成路径的推理，根据评价系统建立推理系统，得到训练完备的推理系统；

d)根据训练完备的评价系统和推理系统完成路径推理。

进一步的，步骤a)中通过公式

计算得到三元组的嵌入向量表示vector_v～(e,r)，式中e₁为头实体，e₂为尾实体，e₁∈ξ，e₂∈ξ，ξ为所有的实体集合，r∈R，R为所有的关系集合，

为所有以Bert为基础的预训练模型。

进一步的，步骤b)中将嵌入向量表示vector_v～(e,r)输入ComplEx模型训练测试的步骤为：

b-1.1)设模型的评分函数为s，s＝σ(φ(r_v,e_v1,e_v2；Θ))＝σ(<Re(r_v),Im(e_v1),Im(e_v2)>+<Im(r_v),Re(e_v1),Re(e_v2)>-<Im(r_v),Im(e_v1),Re(e_v2)>)，评分函数s表示关系r_v与共轭向量e_v1、共轭向量e_v2的乘积求和并保留结果的实部，e₁通过映射得到e_v1，e₂通过映射得到e_v2，式中Re()表示取实部计算，Im()表示取实部计算表示取虚部计算，σ为对矩阵最后维度的求和计算，Θ为当前模型参数，<>为复数之间的乘积；

b-1.2)将嵌入向量表示vector_v～(e,r)输入到ComplEx模型中的进行训练测试，得到最优的模型ComplEx和模型精度CompleEx_mrr。

进一步的，步骤b)中将嵌入向量表示vector_v～(e,r)输入基于神经网络的ConvE模型训练测试的步骤为：

b-2.1)设打分函数为p，

式中σ为非线性激活函数，

式中W₁为卷积操作权重，Proj为将前馈输出映射到嵌入维度，f_dropout为dropout操作，f_FNN为前馈神经网络的函数；

b-2.2)将嵌入向量表示vector_v～(e,r)输入到基于神经网络的ConvE模型中的进行训练测试，得到最优的模型ConvE和模型精度ConvE_mrr。

进一步的，步骤c)包括如下步骤：

c-1)设推理路径为(e_start,r₁,e₂,r₂,e_end)，r₁,e₂,r₂为推理系统的训练路径，其中r₁和r₂关系集合中的关系，e_start与e_end为向量表示，设路径长度为3；

c-2)将e_start与e_end进行向量堆叠，得到[e_start,e_end]；

c-3)将[e_start,e_end]输入到评价系统的ComplEx模型中得到ComplEx输出V_complex，将[e_start,e_end]输入到评价系统的基于神经网络的ConvE模型中得到ConvE输出V_conve，通过公式V_assess＝V_complex*ComplEx_mrr+V_conve*Conve_mrr计算评价系统的模型输出V_assess；

c-4)根据e_start获取其所有相邻关系的向量表示，记为

计算

和V_assess的欧几里得距离，通过公式

选择最小距离值所对应的关系的向量表示V_r,true；

c-5)将[e_start,e_end]输入到推理系统中得到模型输出向量V_pred；

c-6)根据V_r,true和V_pred的差值作为推理系统的损失，更新推理系统网络模型，将V_r,true对应的关系作为路径下一跳即r₁；

c-7)将e_start和r₁进行向量堆叠，得到[e_start:r₁]；

c-8)迭代步骤c-3)至步骤c-6)，直至完成整个路径的推理；

c-9)在训练集上训练，得到训练后的推理系统。

进一步的，步骤d)包括如下步骤：

d-1)设模型推理路径为(e_start,r^o ₁,e^o ₂,r^o ₂,e_end)，r^o ₁,e^o ₂,r^o ₂为推理系统的推理路径；

d-2)将e_start与e_end进行向量堆叠，得到[e_start,e_end]；

d-3)将[e_start,e_end]输入到推理系统中得到模型输出向量V_pred；

d-4)根据e_start获取其所有相邻关系的向量表示，记为

计算

和V_pred的欧几里得距离，在计算得到的欧几里得距离中保留最小距离前三位对应的关系向量，分别记为

d-5)分别计算V_assess与

的欧几里得距离并分别记为dist_v1,dist_v2,dist_v3，取dist_v1,dist_v2,dist_v3中距离最小的变量对应的向量的关系作为推理路径的下一跳即r^o ₁；

d-6)迭代步骤d-2)至步骤d-5)，完成整个路径的推理。

本发明的有益效果是：通过基于强化学习的双系统知识图谱的知识推理方法建模融合高精度的单步推理算法和强化学习的策略路径的方法，搭建用于推理的推理系统和用于评价的评价系统。训练完备的评价系统帮助推理系统训练，使得推理系统可以学习评价系统中的网络信息。基于训练完备的评价系统对推理系统的推理路径评价，完成路径推理。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面结合附图1对本发明做进一步说明。

a)将知识图谱的三元组数据输入基于Bert的预训练模型，处理得到三元组的嵌入向量表示vector_v～(e,r)。

b)将嵌入向量表示vector_v～(e,r)分别输入ComplEx模型和基于神经网络的ConvE模型后分别训练测试，两个训练测试互不干扰，得到训练完备的评价系统。c)选择多层感知机模型或多层Transformer的Encoder，完成路径的推理，根据评价系统建立推理系统，得到训练完备的推理系统。如果数据规模小，则以多层感知机模型搭建推理系统，如果数据规模大，则以多层Transformer的Encoder搭建推理系统。

d)根据训练完备的评价系统和推理系统完成路径推理。

传统的知识推理方法中基于规则的推理算法，虽然实现了很高的推理精度，但是推理模式却不适用大规模复杂关系的知识图谱，基于随机路径游走的推理算法随着问题规模的扩大计算复杂度和计算资源消耗将呈现指数式增长，难以应用到大规模知识图谱中，基于分布式表示的推理算法是研究单步推理的推理算法。本发明的基于强化学习的双系统知识图谱的知识推理方法建模融合高精度的单步推理算法和强化学习的策略路径的方法，搭建用于推理的推理系统和用于评价的评价系统。训练完备的评价系统帮助推理系统训练，使得推理系统可以学习评价系统中的网络信息。基于训练完备的评价系统对推理系统的推理路径评价，完成路径推理。该方法综合运用了强化学习策略和分布式表示推理搭建知识图谱推理的双系统，运用到知识图谱的多步推理的场景中，进一步推动了知识图谱推理领域的相关研究。

步骤a)中通过公式

为所有以Bert为基础的预训练模型。

步骤b)中将嵌入向量表示vector_v～(e,r)输入ComplEx模型训练测试的步骤为：b-1.1)设模型的评分函数为s，s＝σ(φ(r_v,e_v1,e_v2；Θ))＝σ(<Re(r_v),Im(e_v1),Im(e_v2)>+<Im(r_v),Re(e_v1),Re(e_v2)＞-<Im(r_v),Im(e_v1),Re(e_v2)>)，评分函数s表示关系r_v与共轭向量e_v1、共轭向量e_v2的乘积求和并保留结果的实部，e₁通过映射得到e_v1，e₂通过映射得到e_v2，式中Re()表示取实部计算，Im()表示取实部计算表示取虚部计算，σ为对矩阵最后维度的求和计算，Θ为当前模型参数，<>为复数之间的乘积；

步骤b)中将嵌入向量表示vector_v～(e,r)输入基于神经网络的ConvE模型训练测试的步骤为：

b-2.1)设打分函数为p，

式中σ为非线性激活函数，

步骤c)包括如下步骤：

c-2)将e_start与e_end进行向量堆叠，得到[e_start,e_end]；

c-4)根据e_start获取其所有相邻关系的向量表示，记为

计算

和V_assess的欧几里得距离，通过公式

选择最小距离值所对应的关系的向量表示V_r,true；

c-5)将[e_start,e_end]输入到推理系统中得到模型输出向量V_pred；

c-7)将e_start和r₁进行向量堆叠，得到[e_start:r₁]；

c-8)迭代步骤c-3)至步骤c-6)，直至完成整个路径的推理；

c-9)在训练集上训练，得到训练后的推理系统。

步骤d)包括如下步骤：

d-2)将e_start与e_end进行向量堆叠，得到[e_start,e_end]；

d-3)将[e_start,e_end]输入到推理系统中得到模型输出向量V_pred；

d-4)根据e_start获取其所有相邻关系的向量表示，记为

计算

d-5)分别计算V_assess与

d-6)迭代步骤d-2)至步骤d-5)，完成整个路径的推理。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。