CN113111188B - 一种文本生成方法及系统 - Google Patents

一种文本生成方法及系统 Download PDF

Info

Publication number
CN113111188B
CN113111188B CN202110400913.2A CN202110400913A CN113111188B CN 113111188 B CN113111188 B CN 113111188B CN 202110400913 A CN202110400913 A CN 202110400913A CN 113111188 B CN113111188 B CN 113111188B
Authority
CN
China
Prior art keywords
text
graph
representation
entity
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110400913.2A
Other languages
English (en)
Other versions
CN113111188A (zh
Inventor
黄民烈
柯沛
朱小燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110400913.2A priority Critical patent/CN113111188B/zh
Publication of CN113111188A publication Critical patent/CN113111188A/zh
Application granted granted Critical
Publication of CN113111188B publication Critical patent/CN113111188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种文本生成方法及系统,包括:获取待输入的知识图谱;将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。本发明通过基于知识图谱和文本联合表示学习的文本生成框架,能够在编码端引入知识图谱结构信息的同时,构建输入图谱和输出文本的显式对齐关系,达到现有模型最优性能。

Description

一种文本生成方法及系统
技术领域
本发明涉及自然语言技术领域,尤其涉及一种文本生成方法及系统。
背景技术
知识图谱是信息时代人类用于存储知识的重要载体之一,其描述了世界上的实体和实体之间的关系。知识图谱中含有大量的结构化数据,常以三元组形式存储,例如(北京,是……的首都,中国)这个三元组对应的文本是“北京是中国的首都”。
在实际应用中,通常需要将知识图谱转化为自然语言文本,故知识图谱到文本生成便成为了自然语言处理领域的经典任务之一。随着近年大规模预训练语言模型的发展,GPT、BART、T5等预训练语言生成模型在知识图谱到文本生成任务上取得了很好的效果,其自动指标比非预训练的传统语言生成模型有显著提升。尽管如此,预训练语言模型在应用至知识图谱到文本生成任务时仍面临两个主要挑战:1)对知识图谱的结构信息编码不足;2)没有显式建模图和文本的对齐关系。
发明内容
本发明提供一种文本生成方法及系统,用以解决现有技术中存在的缺陷。
第一方面,本发明提供一种文本生成方法,包括:
获取待输入的知识图谱;
将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。
在一个实施例中,所述文本生成框架,通过以下步骤获得:
确定结构感知的语义聚合模型;
基于所述语义聚合模块确定根据图和文本联合表示学习的预训练任务,得到所述文本生成框架。
在一个实施例中,所述确定结构感知的语义聚合模型,具体包括:
确定由头实体、尾实体和关系构成的三元组,基于所述三元组构建线性化的知识图谱;
将所述线性化的知识图谱输入至Transformer结构的编码器中,确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量;
基于所述实体和关系表示向量获得更新后的实体表示向量,确定模型的隐向量维数和若干个可训练参数,根据所述更新后的实体向量表示、所述隐向量维数和所述若干个可训练参数获得实体和关系的语义表示向量;
将所述线性化的知识图谱中由实体占据的位置由原表示向量和所述更新后的实体表示向量相加所得到,其余位置维持所述原表示向量不变。
在一个实施例中,所述将所述线性化的知识图谱输入至Transformer结构的编码器中,确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量,具体包括:
确定所述编码器中任一层自注意力机制输出的每个位置上的隐状态向量;
基于所述隐状态向量由均值池化层获取所述实体表示向量和所述关系表示向量。
在一个实施例中,所述基于所述语义聚合模块确定根据图和文本联合表示学习的预训练任务,得到所述文本生成框架,具体包括:
确定图信息增强的文本重构任务,获得基于知识图谱和扰动后的文本序列生成的完整文本序列;
确定文本信息增强的图重构任务,获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱;
确定所述完整文本序列和所述完整知识图谱的对齐任务,获得所述文本生成框架。
在一个实施例中,所述确定图信息增强的文本重构任务,获得基于知识图谱和扰动后的文本序列生成的完整文本序列,具体包括:
基于输入的知识图谱、输出的文本序列和扰动后的文本序列,构建文本重构任务损失函数;
根据所述文本重构任务损失函数生成所述完整文本序列。
在一个实施例中,所述确定文本信息增强的图重构任务,获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱,具体包括:
基于输入的知识图谱、输出的文本序列、扰动后的知识图谱和指示所述扰动后的知识图谱中被扰动位置的指示函数,构建图重构任务损失函数;
根据所述图重构任务损失函数生成所述完整知识图谱。
在一个实施例中,所述确定所述完整文本序列和所述完整知识图谱的对齐任务,获得所述文本生成框架,具体包括:
将线性化的知识图谱和文本分别输入至模型的编码器和解码器中,获得图表示向量和文本表示向量;
将图表示向量通过均值池化层对最后一层Transformer结构的编码器输出的结果进行处理,得到图编码实体表示和图编码关系表示,将所述图编码实体表示和所述图编码关系表示合并为实体和关系表示向量序列,作为图表示;
将文本表示向量通过Transformer结构的解码器获得文本表示;
由所述图表示和所述文本表示之间的最优传输距离作为所述对齐任务的损失函数,所述损失函数包括相似度函数,所述相似度函数确定为表示向量的余弦相似度;
对所述最优传输距离进行最优解求解,生成所述文本生成框架。
第二方面,本发明还提供一种文本生成系统,包括:
获取模块,用于获取待输入的知识图谱;
处理模块,用于将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文本生成方法的步骤。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述文本生成方法的步骤。
本发明提供的文本生成方法及系统,通过基于知识图谱和文本联合表示学习的文本生成框架,能够在编码端引入知识图谱结构信息的同时,构建输入图谱和输出文本的显式对齐关系,达到现有模型最优性能。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的文本生成方法的流程示意图;
图2是本发明提供的结构感知的语义聚合模型的计算方法示意图;
图3是本发明提供的图和文本联合表示学习的训练方法示意图;
图4是本发明提供的文本生成系统的结构示意图;
图5是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明提供的文本生成方法的流程示意图,如图1所示,包括:
S1,获取待输入的知识图谱;
S2,将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。
具体地,针对现有技术中存在的不足,本发明提出的基于知识图谱和文本联合表示学习的文本生成框架,通过改进预训练模型的编码器,使其能够建模输入图谱中的结构信息,同时构造预训练任务以显式增强知识图谱和文本在表示空间的对齐关系,该方法还可扩展至其他图到文本生成任务中。
本发明通过基于知识图谱和文本联合表示学习的文本生成框架,能够在编码端引入知识图谱结构信息的同时,构建输入图谱和输出文本的显式对齐关系,达到现有模型最优性能。
基于上述实施例,所述文本生成框架,通过以下步骤获得:
确定结构感知的语义聚合模型;
基于所述语义聚合模块确定根据图和文本联合表示学习的预训练任务,得到所述文本生成框架。
具体地,本发明所提出的文本生成框架,是基于知识图谱和文本联合表示学习的文本生成框架,主要包括两个步骤:
设计结构感知的语义聚合模型和设计图和文本联合表示学习的预训练任务。
本发明所提出的文本生成框架具有很强的普适性,可直接扩展至其他图到文本的生成任务。
基于上述任一实施例,所述确定结构感知的语义聚合模型,具体包括:
确定由头实体、尾实体和关系构成的三元组,基于所述三元组构建线性化的知识图谱;
将所述线性化的知识图谱输入至Transformer结构的编码器中,确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量;
基于所述实体和关系表示向量获得更新后的实体表示向量,确定模型的隐向量维数和若干个可训练参数,根据所述更新后的实体向量表示、所述隐向量维数和所述若干个可训练参数获得实体和关系的语义表示向量;
将所述线性化的知识图谱中由实体占据的位置由原表示向量和所述更新后的实体表示向量相加所得到,其余位置维持所述原表示向量不变。
其中,所述将所述线性化的知识图谱输入至Transformer结构的编码器中,确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量,具体包括:
确定所述编码器中任一层自注意力机制输出的每个位置上的隐状态向量;
基于所述隐状态向量由均值池化层获取所述实体表示向量和所述关系表示向量。
具体地,对于设计结构感知的语义聚合模型,是通过以下步骤实现的,如图2所示:
一、知识图谱的线性化
知识图谱
Figure BDA0003020244890000071
由多个三元组(h,r,t)构成,其中h为头实体,t为尾实体,r为两者的关系。h,t∈V,V为实体的集合,r∈E,E为关系的集合。三元组可通过模板的方式线性化为文本序列,例如(Beijing,is capital of,China)可以线性化为<H>Beijing<R>is capital of<T>China,其中<H>,<R>,<T>分别表示头实体、关系和尾实体的分隔符。将知识图谱中的所有三元组都按上述模板线性化,即可完成知识图谱的线性化。
二、确定编码器中实体和关系的表示方法
将线性化后的知识图谱
Figure BDA0003020244890000072
输入至Transformer结构的编码器中,假设第l层自注意力机制输出的每个位置上的隐状态向量为
Figure BDA0003020244890000079
则本发明中实体和关系的表示可以通过均值池化层获取:
Figure BDA0003020244890000073
Figure BDA0003020244890000074
其中ei表示第i个实体,rij表示第i个实体和第j个实体的关系,
Figure BDA0003020244890000075
Figure BDA0003020244890000076
表示相应的实体和关系在线性化后的知识图谱中占据的位置,
Figure BDA0003020244890000077
Figure BDA0003020244890000078
分别表示实体ei和关系rij的向量表示。
三、设计结构感知的语义聚合模型
本发明所提出的结构感知的语义聚合模型如下:
Figure BDA0003020244890000081
Figure BDA0003020244890000082
Figure BDA0003020244890000083
其中WVS,WVR,WQS,WKS,WKR为模型的可训练参数,dk为模型的隐向量维数,
Figure BDA0003020244890000084
为更新后的实体表示向量。该模块融合了实体和关系的语义表示向量,通过结构感知的自注意力机制编码输入图谱的结构信息,以更新实体表示。
四、确定编码器中实体表示的更新方法
本发明中提出的实体表示的更新方法如下:
Figure BDA0003020244890000085
对于线性化后的知识图谱序列中由实体占据的位置,其表示由原表示向量
Figure BDA0003020244890000086
和实体表示向量
Figure BDA0003020244890000087
相加得到,其余位置则维持原表示向量不变。
基于上述任一实施例,所述基于所述语义聚合模块确定根据图和文本联合表示学习的预训练任务,得到所述文本生成框架,具体包括:
确定图信息增强的文本重构任务,获得基于知识图谱和扰动后的文本序列生成的完整文本序列;
确定文本信息增强的图重构任务,获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱;
确定所述完整文本序列和所述完整知识图谱的对齐任务,获得所述文本生成框架。
其中,所述确定图信息增强的文本重构任务,获得基于知识图谱和扰动后的文本序列生成的完整文本序列,具体包括:
基于输入的知识图谱、输出的文本序列和扰动后的文本序列,构建文本重构任务损失函数;
根据所述文本重构任务损失函数生成所述完整文本序列。
其中,所述确定文本信息增强的图重构任务,获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱,具体包括:
基于输入的知识图谱、输出的文本序列、扰动后的知识图谱和指示所述扰动后的知识图谱中被扰动位置的指示函数,构建图重构任务损失函数;
根据所述图重构任务损失函数生成所述完整知识图谱。
其中,所述确定所述完整文本序列和所述完整知识图谱的对齐任务,获得所述文本生成框架,具体包括:
将线性化的知识图谱和文本分别输入至模型的编码器和解码器中,获得图表示向量和文本表示向量;
将图表示向量通过均值池化层对最后一层Transformer结构的编码器输出的结果进行处理,得到图编码实体表示和图编码关系表示,将所述图编码实体表示和所述图编码关系表示合并为实体和关系表示向量序列,作为图表示;
将文本表示向量通过Transformer结构的解码器获得文本表示;
由所述图表示和所述文本表示之间的最优传输距离作为所述对齐任务的损失函数,所述损失函数包括相似度函数,所述相似度函数确定为表示向量的余弦相似度;
对所述最优传输距离进行最优解求解,生成所述文本生成框架。
具体地,对于设计图和文本联合表示学习的预训练任务,通过以下步骤实现,如图3所示:
一、设计图信息增强的文本重构任务
定义图信息增强的文本重构任务的损失函数:
Figure BDA0003020244890000101
其中
Figure BDA0003020244890000102
为输入的知识图谱,X为输出的文本序列,
Figure BDA0003020244890000103
为扰动后的文本序列,该任务要求模型根据知识图谱和扰动后的文本序列来生成完整的文本序列。
二、设计文本信息增强的图重构任务
定义文本信息增强的图重构任务的损失函数:
Figure BDA0003020244890000104
其中
Figure BDA0003020244890000105
为输入的知识图谱,X为输出的文本序列,
Figure BDA0003020244890000106
为扰动后的知识图谱,Mi为指示
Figure BDA0003020244890000107
中被扰动位置的指示函数。该任务要求模型根据扰动后的知识图谱和完整的文本序列重构出完整的知识图谱。
三、设计图和文本表示对齐任务
图和文本表示对齐任务首先将线性化的知识图谱和文本分别输入至模型的编码器和解码器中,以得到图的表示向量和文本的表示向量。其中图的表示向量可通过均值池化层对最后一层Transformer编码器输出的结果进行处理得到:
Figure BDA0003020244890000108
Figure BDA0003020244890000109
上述
Figure BDA00030202448900001010
Figure BDA00030202448900001011
分别为图编码后得到的实体表示和关系表示,可合并为实体和关系表示向量的序列
Figure BDA00030202448900001012
以作为图的总体表示用于后续计算。文本序列通过解码器也可以直接获得表示向量
Figure BDA00030202448900001013
该任务的损失函数定义为图表示和文本表示的最优传输距离:
Figure BDA0003020244890000111
Figure BDA0003020244890000112
其中相似度函数d定义为表示向量的余弦相似度,即
Figure BDA0003020244890000113
本发明提出的新的基于知识图谱和文本联合表示学习的文本生成框架,能够在编码端引入知识图谱结构信息的同时,构建输入图谱和输出文本的显式对齐关系。在知识图谱到文本生成任务的常用数据集WebNLG(v2.0)、WebQuestions、PathQuestions上,该文本生成框架的BLEU值比最强的基线模型提升1.58、0.45、2.65,能达到现有模型中的最优性能。
下面对本发明提供的文本生成系统进行描述,下文描述的文本生成系统与上文描述的文本生成方法可相互对应参照。
图4是本发明提供的文本生成系统的结构示意图,如图4所示,包括:获取模块41和处理模块42;其中:
获取模块41用于获取待输入的知识图谱;处理模块42用于将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。
本发明通过基于知识图谱和文本联合表示学习的文本生成框架,能够在编码端引入知识图谱结构信息的同时,构建输入图谱和输出文本的显式对齐关系,达到现有模型最优性能。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(CommunicationsInterface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行文本生成方法,该方法包括:获取待输入的知识图谱;将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的文本生成方法,该方法包括:获取待输入的知识图谱;将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的文本生成方法,该方法包括:获取待输入的知识图谱;将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种文本生成方法,其特征在于,包括:
获取待输入的知识图谱;
将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的;
所述文本生成框架,通过以下步骤获得:
确定结构感知的语义聚合模型;
基于所述语义聚合模型确定根据图和文本联合表示学习的预训练任务,得到所述文本生成框架;
所述确定结构感知的语义聚合模型,具体包括:
确定由头实体、尾实体和关系构成的三元组,基于所述三元组构建线性化的知识图谱;
其中,通过模板方式线性化所述三元组为文本序列,实现对所述知识图谱的线性化,得到所述线性化的知识图谱;
将所述线性化的知识图谱输入至Transformer结构的编码器中,确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量;基于所述实体和关系表示向量获得更新后的实体表示向量,确定模型的隐向量维数和若干个可训练参数,根据所述更新后的实体向量表示、所述隐向量维数和所述若干个可训练参数获得实体和关系的语义表示向量;
将所述线性化的知识图谱中由实体占据的位置由原表示向量和所述更新后的实体表示向量相加所得到,其余位置维持所述原表示向量不变,具体包括:
Figure FDA0003702561660000011
其中,
Figure FDA0003702561660000012
表示原表示向量,
Figure FDA0003702561660000013
表示实体表示向量,
Figure FDA0003702561660000014
表示更新后的实体表示向量;
所述将所述线性化的知识图谱输入至Transformer结构的编码器中,确定所述编码器中实体和关系表示方法以及实体表示向量和关系表示向量,具体包括:
确定所述编码器中任一层自注意力机制输出的每个位置上的隐状态向量;
基于所述隐状态向量由均值池化层获取所述实体表示向量和所述关系表示向量;
将所述线性化的知识图谱
Figure FDA00037025616600000211
输入至所述Transformer结构的编码器中,设第l层自注意力机制输出的每个位置上的隐状态向量为
Figure FDA00037025616600000210
则所述实体表示向量和所述关系表示向量为:
Figure FDA0003702561660000021
Figure FDA0003702561660000022
其中ei表示第i个实体,rij表示第i个实体和第j个实体的关系,
Figure FDA0003702561660000023
Figure FDA0003702561660000024
分别表示实体和关系在所述线性化后的知识图谱中占据的位置,
Figure FDA0003702561660000025
Figure FDA0003702561660000026
分别表示实体ei和关系rij的向量表示,p表示所述线性化后的知识图谱中所有位置的循环变量,m表示所述线性化后的知识图谱中含有的词的总数;
相应地,所述语义聚合模型包括:
Figure FDA0003702561660000027
Figure FDA0003702561660000028
Figure FDA0003702561660000029
其中W表示模型中可训练的参数矩阵,Q,K,V分别表示注意力机制中的查询、键和值,S,R分别表示实体和关系,WQS,WKS,WVS分别注意力机制中实体表示向量作为查询、键和值时对应的参数矩阵,dk为模型的隐向量维数,
Figure FDA0003702561660000031
为更新后的实体表示向量,
Figure FDA0003702561660000032
是注意力分数,
Figure FDA0003702561660000033
是归一化后的注意力权重。
2.根据权利要求1所述的文本生成方法,其特征在于,所述基于所述语义聚合模型确定根据图和文本联合表示学习的预训练任务,得到所述文本生成框架,具体包括:
确定图信息增强的文本重构任务,获得基于知识图谱和扰动后的文本序列生成的完整文本序列;
确定文本信息增强的图重构任务,获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱;
确定所述完整文本序列和所述完整知识图谱的对齐任务,获得所述文本生成框架。
3.根据权利要求1所述的文本生成方法,其特征在于,所述确定图信息增强的文本重构任务,获得基于知识图谱和扰动后的文本序列生成的完整文本序列,具体包括:
基于输入的知识图谱、输出的文本序列和扰动后的文本序列,构建文本重构任务损失函数;
根据所述文本重构任务损失函数生成所述完整文本序列。
4.根据权利要求3所述的文本生成方法,其特征在于,所述确定文本信息增强的图重构任务,获得基于扰动后的知识图谱和所述完整文本序列重构生成的完整知识图谱,具体包括:
基于输入的知识图谱、输出的文本序列、扰动后的知识图谱和指示所述扰动后的知识图谱中被扰动位置的指示函数,构建图重构任务损失函数;
根据所述图重构任务损失函数生成所述完整知识图谱。
5.根据权利要求2所述的文本生成方法,其特征在于,所述确定所述完整文本序列和所述完整知识图谱的对齐任务,获得所述文本生成框架,具体包括:
将线性化的知识图谱和文本分别输入至模型的编码器和解码器中,获得图表示向量和文本表示向量;
将图表示向量通过均值池化层对最后一层Transformer结构的编码器输出的结果进行处理,得到图编码实体表示和图编码关系表示,将所述图编码实体表示和所述图编码关系表示合并为实体和关系表示向量序列,作为图表示;
将文本表示向量通过Transformer结构的解码器获得文本表示;
由所述图表示和所述文本表示之间的最优传输距离作为所述对齐任务的损失函数,所述损失函数包括相似度函数,所述相似度函数确定为表示向量的余弦相似度;
对所述最优传输距离进行最优解求解,生成所述文本生成框架。
6.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述文本生成方法的步骤。
7.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述文本生成方法的步骤。
CN202110400913.2A 2021-04-14 2021-04-14 一种文本生成方法及系统 Active CN113111188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110400913.2A CN113111188B (zh) 2021-04-14 2021-04-14 一种文本生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110400913.2A CN113111188B (zh) 2021-04-14 2021-04-14 一种文本生成方法及系统

Publications (2)

Publication Number Publication Date
CN113111188A CN113111188A (zh) 2021-07-13
CN113111188B true CN113111188B (zh) 2022-08-09

Family

ID=76716937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110400913.2A Active CN113111188B (zh) 2021-04-14 2021-04-14 一种文本生成方法及系统

Country Status (1)

Country Link
CN (1) CN113111188B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627146B (zh) * 2021-08-11 2024-05-28 厦门大学 基于知识约束的两步式辟谣文本生成方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489755A (zh) * 2019-08-21 2019-11-22 广州视源电子科技股份有限公司 文本生成方法和装置
CN111476038A (zh) * 2020-05-06 2020-07-31 中国人民解放军国防科技大学 长文本生成方法、装置、计算机设备和存储介质
CN111651557A (zh) * 2020-05-09 2020-09-11 清华大学深圳国际研究生院 一种自动化文本生成方法、装置及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11151334B2 (en) * 2018-09-26 2021-10-19 Huawei Technologies Co., Ltd. Systems and methods for multilingual text generation field

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489755A (zh) * 2019-08-21 2019-11-22 广州视源电子科技股份有限公司 文本生成方法和装置
CN111476038A (zh) * 2020-05-06 2020-07-31 中国人民解放军国防科技大学 长文本生成方法、装置、计算机设备和存储介质
CN111651557A (zh) * 2020-05-09 2020-09-11 清华大学深圳国际研究生院 一种自动化文本生成方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN113111188A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
CN110765277B (zh) 一种基于知识图谱的移动端的在线设备故障诊断方法
CN112183747A (zh) 神经网络训练的方法、神经网络的压缩方法以及相关设备
CN110188926B (zh) 一种订单信息预测系统和方法
JP2022006173A (ja) 知識事前訓練モデルの訓練方法、装置及び電子機器
CN115827819A (zh) 一种智能问答处理方法、装置、电子设备及存储介质
CN115525773B (zh) 知识图谱补全模型的训练方法和装置
US11615247B1 (en) Labeling method and apparatus for named entity recognition of legal instrument
CN114185931A (zh) 一种基于神经网络模型的中文语言处理方法及装置
CN110852066B (zh) 一种基于对抗训练机制的多语言实体关系抽取方法及系统
CN111309930A (zh) 一种基于表示学习的医学知识图谱实体对齐方法
CN113111188B (zh) 一种文本生成方法及系统
CN114528312A (zh) 一种结构化查询语言语句的生成方法和装置
CN114064926A (zh) 多模态电力知识图谱构建方法、装置、设备及存储介质
CN114491174A (zh) 一种基于分层特征聚合的图像-文本匹配方法及系统
CN112463989A (zh) 一种基于知识图谱的信息获取方法及系统
CN112182167A (zh) 一种文本匹配方法、装置、终端设备和存储介质
CN114492661A (zh) 文本数据分类方法和装置、计算机设备、存储介质
CN117634459A (zh) 目标内容生成及模型训练方法、装置、系统、设备及介质
CN117520520A (zh) 一种基于知识图谱的知识查询方法和装置
CN117332771A (zh) 内容点的获取方法、装置、计算机可读介质及电子设备
CN110287396B (zh) 文本匹配方法及装置
CN116701744A (zh) 组件检索方法、组件检索装置、电子设备及存储介质
Wu et al. A summary of the latest research on knowledge graph technology
CN114398903B (zh) 意图识别方法、装置、电子设备及存储介质
CN114333069B (zh) 对象的姿态处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant