CN113111188B

CN113111188B - 一种文本生成方法及系统

Info

Publication number: CN113111188B
Application number: CN202110400913.2A
Authority: CN
Inventors: 黄民烈; 柯沛; 朱小燕
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2021-04-14
Filing date: 2021-04-14
Publication date: 2022-08-09
Anticipated expiration: 2041-04-14
Also published as: CN113111188A

Abstract

本发明提供一种文本生成方法及系统，包括：获取待输入的知识图谱；将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。本发明通过基于知识图谱和文本联合表示学习的文本生成框架，能够在编码端引入知识图谱结构信息的同时，构建输入图谱和输出文本的显式对齐关系，达到现有模型最优性能。

Description

一种文本生成方法及系统

技术领域

本发明涉及自然语言技术领域，尤其涉及一种文本生成方法及系统。

背景技术

知识图谱是信息时代人类用于存储知识的重要载体之一，其描述了世界上的实体和实体之间的关系。知识图谱中含有大量的结构化数据，常以三元组形式存储，例如(北京，是……的首都，中国)这个三元组对应的文本是“北京是中国的首都”。

在实际应用中，通常需要将知识图谱转化为自然语言文本，故知识图谱到文本生成便成为了自然语言处理领域的经典任务之一。随着近年大规模预训练语言模型的发展，GPT、BART、T5等预训练语言生成模型在知识图谱到文本生成任务上取得了很好的效果，其自动指标比非预训练的传统语言生成模型有显著提升。尽管如此，预训练语言模型在应用至知识图谱到文本生成任务时仍面临两个主要挑战：1)对知识图谱的结构信息编码不足；2)没有显式建模图和文本的对齐关系。

发明内容

本发明提供一种文本生成方法及系统，用以解决现有技术中存在的缺陷。

第一方面，本发明提供一种文本生成方法，包括：

获取待输入的知识图谱；

将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。

在一个实施例中，所述文本生成框架，通过以下步骤获得：

确定结构感知的语义聚合模型；

基于所述语义聚合模块确定根据图和文本联合表示学习的预训练任务，得到所述文本生成框架。

在一个实施例中，所述确定结构感知的语义聚合模型，具体包括：

确定由头实体、尾实体和关系构成的三元组，基于所述三元组构建线性化的知识图谱；

将所述线性化的知识图谱输入至Transformer结构的编码器中，确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量；

基于所述实体和关系表示向量获得更新后的实体表示向量，确定模型的隐向量维数和若干个可训练参数，根据所述更新后的实体向量表示、所述隐向量维数和所述若干个可训练参数获得实体和关系的语义表示向量；

将所述线性化的知识图谱中由实体占据的位置由原表示向量和所述更新后的实体表示向量相加所得到，其余位置维持所述原表示向量不变。

在一个实施例中，所述将所述线性化的知识图谱输入至Transformer结构的编码器中，确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量，具体包括：

确定所述编码器中任一层自注意力机制输出的每个位置上的隐状态向量；

基于所述隐状态向量由均值池化层获取所述实体表示向量和所述关系表示向量。

在一个实施例中，所述基于所述语义聚合模块确定根据图和文本联合表示学习的预训练任务，得到所述文本生成框架，具体包括：

确定图信息增强的文本重构任务，获得基于知识图谱和扰动后的文本序列生成的完整文本序列；

确定文本信息增强的图重构任务，获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱；

确定所述完整文本序列和所述完整知识图谱的对齐任务，获得所述文本生成框架。

在一个实施例中，所述确定图信息增强的文本重构任务，获得基于知识图谱和扰动后的文本序列生成的完整文本序列，具体包括：

基于输入的知识图谱、输出的文本序列和扰动后的文本序列，构建文本重构任务损失函数；

根据所述文本重构任务损失函数生成所述完整文本序列。

在一个实施例中，所述确定文本信息增强的图重构任务，获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱，具体包括：

基于输入的知识图谱、输出的文本序列、扰动后的知识图谱和指示所述扰动后的知识图谱中被扰动位置的指示函数，构建图重构任务损失函数；

根据所述图重构任务损失函数生成所述完整知识图谱。

在一个实施例中，所述确定所述完整文本序列和所述完整知识图谱的对齐任务，获得所述文本生成框架，具体包括：

将线性化的知识图谱和文本分别输入至模型的编码器和解码器中，获得图表示向量和文本表示向量；

将图表示向量通过均值池化层对最后一层Transformer结构的编码器输出的结果进行处理，得到图编码实体表示和图编码关系表示，将所述图编码实体表示和所述图编码关系表示合并为实体和关系表示向量序列，作为图表示；

将文本表示向量通过Transformer结构的解码器获得文本表示；

由所述图表示和所述文本表示之间的最优传输距离作为所述对齐任务的损失函数，所述损失函数包括相似度函数，所述相似度函数确定为表示向量的余弦相似度；

对所述最优传输距离进行最优解求解，生成所述文本生成框架。

第二方面，本发明还提供一种文本生成系统，包括：

获取模块，用于获取待输入的知识图谱；

处理模块，用于将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。

第三方面，本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述文本生成方法的步骤。

第四方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述文本生成方法的步骤。

本发明提供的文本生成方法及系统，通过基于知识图谱和文本联合表示学习的文本生成框架，能够在编码端引入知识图谱结构信息的同时，构建输入图谱和输出文本的显式对齐关系，达到现有模型最优性能。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的文本生成方法的流程示意图；

图2是本发明提供的结构感知的语义聚合模型的计算方法示意图；

图3是本发明提供的图和文本联合表示学习的训练方法示意图；

图4是本发明提供的文本生成系统的结构示意图；

图5是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明提供的文本生成方法的流程示意图，如图1所示，包括：

S1，获取待输入的知识图谱；

S2，将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。

具体地，针对现有技术中存在的不足，本发明提出的基于知识图谱和文本联合表示学习的文本生成框架，通过改进预训练模型的编码器，使其能够建模输入图谱中的结构信息，同时构造预训练任务以显式增强知识图谱和文本在表示空间的对齐关系，该方法还可扩展至其他图到文本生成任务中。

本发明通过基于知识图谱和文本联合表示学习的文本生成框架，能够在编码端引入知识图谱结构信息的同时，构建输入图谱和输出文本的显式对齐关系，达到现有模型最优性能。

基于上述实施例，所述文本生成框架，通过以下步骤获得：

确定结构感知的语义聚合模型；

具体地，本发明所提出的文本生成框架，是基于知识图谱和文本联合表示学习的文本生成框架，主要包括两个步骤：

设计结构感知的语义聚合模型和设计图和文本联合表示学习的预训练任务。

本发明所提出的文本生成框架具有很强的普适性，可直接扩展至其他图到文本的生成任务。

基于上述任一实施例，所述确定结构感知的语义聚合模型，具体包括：

其中，所述将所述线性化的知识图谱输入至Transformer结构的编码器中，确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量，具体包括：

具体地，对于设计结构感知的语义聚合模型，是通过以下步骤实现的，如图2所示：

一、知识图谱的线性化

知识图谱

由多个三元组(h,r,t)构成，其中h为头实体，t为尾实体，r为两者的关系。h,t∈V，V为实体的集合，r∈E，E为关系的集合。三元组可通过模板的方式线性化为文本序列，例如(Beijing,is capital of,China)可以线性化为<H>Beijing<R>is capital of<T>China，其中<H>,<R>,<T>分别表示头实体、关系和尾实体的分隔符。将知识图谱中的所有三元组都按上述模板线性化，即可完成知识图谱的线性化。

二、确定编码器中实体和关系的表示方法

将线性化后的知识图谱

输入至Transformer结构的编码器中，假设第l层自注意力机制输出的每个位置上的隐状态向量为

则本发明中实体和关系的表示可以通过均值池化层获取：

其中e_i表示第i个实体，r_ij表示第i个实体和第j个实体的关系，

和

表示相应的实体和关系在线性化后的知识图谱中占据的位置，

和

分别表示实体e_i和关系r_ij的向量表示。

三、设计结构感知的语义聚合模型

本发明所提出的结构感知的语义聚合模型如下：

其中W^VS,W^VR,W^QS,W^KS,W^KR为模型的可训练参数，d_k为模型的隐向量维数，

为更新后的实体表示向量。该模块融合了实体和关系的语义表示向量，通过结构感知的自注意力机制编码输入图谱的结构信息，以更新实体表示。

四、确定编码器中实体表示的更新方法

本发明中提出的实体表示的更新方法如下：

对于线性化后的知识图谱序列中由实体占据的位置，其表示由原表示向量

和实体表示向量

相加得到，其余位置则维持原表示向量不变。

基于上述任一实施例，所述基于所述语义聚合模块确定根据图和文本联合表示学习的预训练任务，得到所述文本生成框架，具体包括：

其中，所述确定图信息增强的文本重构任务，获得基于知识图谱和扰动后的文本序列生成的完整文本序列，具体包括：

根据所述文本重构任务损失函数生成所述完整文本序列。

其中，所述确定文本信息增强的图重构任务，获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱，具体包括：

根据所述图重构任务损失函数生成所述完整知识图谱。

其中，所述确定所述完整文本序列和所述完整知识图谱的对齐任务，获得所述文本生成框架，具体包括：

将文本表示向量通过Transformer结构的解码器获得文本表示；

具体地，对于设计图和文本联合表示学习的预训练任务，通过以下步骤实现，如图3所示：

一、设计图信息增强的文本重构任务

定义图信息增强的文本重构任务的损失函数：

其中

为输入的知识图谱，X为输出的文本序列，

为扰动后的文本序列，该任务要求模型根据知识图谱和扰动后的文本序列来生成完整的文本序列。

二、设计文本信息增强的图重构任务

定义文本信息增强的图重构任务的损失函数：

其中

为输入的知识图谱，X为输出的文本序列，

为扰动后的知识图谱，M_i为指示

中被扰动位置的指示函数。该任务要求模型根据扰动后的知识图谱和完整的文本序列重构出完整的知识图谱。

三、设计图和文本表示对齐任务

图和文本表示对齐任务首先将线性化的知识图谱和文本分别输入至模型的编码器和解码器中，以得到图的表示向量和文本的表示向量。其中图的表示向量可通过均值池化层对最后一层Transformer编码器输出的结果进行处理得到：

上述

和

分别为图编码后得到的实体表示和关系表示，可合并为实体和关系表示向量的序列

以作为图的总体表示用于后续计算。文本序列通过解码器也可以直接获得表示向量

该任务的损失函数定义为图表示和文本表示的最优传输距离：

其中相似度函数d定义为表示向量的余弦相似度，即

本发明提出的新的基于知识图谱和文本联合表示学习的文本生成框架，能够在编码端引入知识图谱结构信息的同时，构建输入图谱和输出文本的显式对齐关系。在知识图谱到文本生成任务的常用数据集WebNLG(v2.0)、WebQuestions、PathQuestions上，该文本生成框架的BLEU值比最强的基线模型提升1.58、0.45、2.65，能达到现有模型中的最优性能。

下面对本发明提供的文本生成系统进行描述，下文描述的文本生成系统与上文描述的文本生成方法可相互对应参照。

图4是本发明提供的文本生成系统的结构示意图，如图4所示，包括：获取模块41和处理模块42；其中：

获取模块41用于获取待输入的知识图谱；处理模块42用于将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。

图5示例了一种电子设备的实体结构示意图，如图5所示，该电子设备可以包括：处理器(processor)510、通信接口(CommunicationsInterface)520、存储器(memory)530和通信总线540，其中，处理器510，通信接口520，存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令，以执行文本生成方法，该方法包括：获取待输入的知识图谱；将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。

此外，上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的文本生成方法，该方法包括：获取待输入的知识图谱；将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的文本生成方法，该方法包括：获取待输入的知识图谱；将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种文本生成方法，其特征在于，包括：

获取待输入的知识图谱；

将所述待输入的知识图谱输入至文本生成框架，构建所述知识图谱与输出文本的对齐关系模型；其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的；

所述文本生成框架，通过以下步骤获得：

确定结构感知的语义聚合模型；

基于所述语义聚合模型确定根据图和文本联合表示学习的预训练任务，得到所述文本生成框架；

所述确定结构感知的语义聚合模型，具体包括：

其中，通过模板方式线性化所述三元组为文本序列，实现对所述知识图谱的线性化，得到所述线性化的知识图谱；

将所述线性化的知识图谱输入至Transformer结构的编码器中，确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量；基于所述实体和关系表示向量获得更新后的实体表示向量，确定模型的隐向量维数和若干个可训练参数，根据所述更新后的实体向量表示、所述隐向量维数和所述若干个可训练参数获得实体和关系的语义表示向量；

将所述线性化的知识图谱中由实体占据的位置由原表示向量和所述更新后的实体表示向量相加所得到，其余位置维持所述原表示向量不变，具体包括：