CN116227428A

CN116227428A - 一种基于迁移模式感知的文本风格迁移方法

Info

Publication number: CN116227428A
Application number: CN202310510077.2A
Authority: CN
Inventors: 张勇东; 毛震东; 赵慧婷; 韩靖轩; 张立成
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2023-05-08
Filing date: 2023-05-08
Publication date: 2023-06-06
Anticipated expiration: 2043-05-08
Also published as: CN116227428B

Abstract

本发明涉及自然语言生成领域。本发明提供了一种基于迁移模式感知的文本风格迁移方法，对输入的文本，输出对应的迁移模式分类，基于迁移模式分类和句子表示集合，定义类内对比学习损失，基于风格和句子表示集合定义类间对比学习损，并基于类内对比学习损失、类间对比学习损失、文本风格迁移模型的损失一起计算总体损失来训练文本风格迁移模型。使用训练后的文本风格迁移模型对目标文本进行文本风格迁移。本发明增加了句子表示的准确性和区分度，进而提高文本风格迁移任务的性能。本发明将迁移模式分类提取模型与文本风格迁移模型结合使用，提高了文本风格迁移模型的性能。

Description

一种基于迁移模式感知的文本风格迁移方法

技术领域

本发明涉及领域人工智能领域，具体涉及一种基于迁移模式感知的文本风格迁移方法。

背景技术

文本风格迁移是自然语言生成领域中一个重要的任务，它旨在改变风格属性的同时保留句子中的内容语义，这些风格属性包括但不限于情感、礼貌和格式。它不仅可以转换文本风格来做数据增广，还有利于各种下游任务如无监督的摘要、翻译甚至语音识别。

由于缺乏成对的句子，所以目前的研究工作大都关注于自监督的方法，并且可以大致分为两种途径。第一种途径将句子分离出独立于其风格属性的表示，并使用目标风格属性对此表示进行修改。第二种途径通过使用额外的风格嵌入直接修改输入句子的表示。

然而，现有的两种途径只考虑风格之间的差异性来完成风格迁移，没有注意到风格内部迁移模式的差异性对风格迁移的影响。事实上，文本风格迁移任务中有很多迁移模式。图2展示了情感迁移任务中消极情感到积极情感的三个例子，分别对应三种不同迁移模式。第一种迁移模式是提取关键的形容词并取其反义词。第二种迁移模式是加否定助词将正向情感改变为负向情感，而最后一种是将负极性短语改变为正极性短语。这种潜在的迁移模式自然存在于各种文本中，暗示着解决文本迁移任务的不同方法。

发明内容

为解决上述问题，本发明提供一种基于迁移模式感知的文本风格迁移方法。

该方法用迁移模式分类提取模型和文本风格迁移模型，将输入的句子的风格替换成目标风格，完成文本风格迁移任务，具体包括：

步骤一，准备由N个句子和各句子对应的风格标签组成的训练数据集；

步骤二，对训练数据集中每个句子

进行编码得到句子编码向量/>

，d为句子编码向量的维度，j为1到N的整数；

步骤三，自适应聚类：构建基于聚类算法的迁移模式分类提取模型，将句子编码向量

输入至迁移模式分类提取模型，输出句子编码向量/>

对应的迁移模式分类；

步骤四，对比学习：将所述训练数据集输入到文本风格迁移模型，得到句子表示集合，基于所述迁移模式分类和所述句子表示集合，定义类内对比学习损失

，基于风格标签和所述句子表示集合定义类间对比学习损失/>

；

则对比学习总体损失

：

；

H为风格标签的数量，

为第h个风格标签的类内对比学习损失；

步骤五，文本风格迁移模型的损失为

，计算文本风格迁移任务的总体损失/>

，其中，/>

为一个平衡/>

与/>

的参数；

保持文本风格迁移模型的结构不变，基于所述总体损失

训练文本风格迁移模型；

步骤六，使用训练过的文本风格迁移模型处理文本风格迁移任务。

进一步的，步骤三中，构建基于聚类算法的迁移模式分类提取模型的过程，包括：

步骤三A，定义

为每个风格标签对应的迁移模式类别的数量，随机初始化一个向量作为聚类中心表示/>

，1≤/>

≤/>

，根据句子编码向量集合/>

与聚类中心表示集合/>

，获得句子编码向量和聚类中心表示之间的距离矩阵/>

：

；

其中

为距离矩阵/>

中的元素，代表第/>

个聚类中心表示/>

与第/>

个句子编码向量/>

之间的归一化距离，/>

是可学习的模型参数，/>

是欧几里得距离；

步骤三B，根据所述距离矩阵

对所述句子进行分类：

；

其中

代表句子编码向量/>

不属于每一类的程度，/>

为argmin函数，argmin函数根据最小距离将句子编码向量/>

划分到相应的类，/>

代表句子编码向量/>

被划分到的类索引；

步骤三C，定义聚类损失函数

为：

；

其中

代表第/>

类聚类中心，计算/>

最小时的模型参数/>

；

步骤三D，根据聚类损失函数

训练迁移模式分类提取模型；

步骤三E，获得完成训练的迁移模式分类提取模型。

进一步的，步骤三D中，根据聚类损失函数

训练迁移模式分类提取模型，具体包括：

重新计算聚类中心表示

：

；

根据重新计算的聚类中心表示

训练迁移模式分类提取模型。

进一步的，步骤四中，将所述训练数据集输入到文本风格迁移模型，得到句子表示集合，基于所述迁移模式分类和所述句子表示集合，定义类内对比学习损失

，具体包括：

步骤四A，所述训练数据集中的句子组成句子集合B={}，使用文本风格迁移模型对所述训练数据集得到句子表示集合Z={}；

步骤四B，对第

个句子/>

，收集和/>

有相同迁移模式分类的正向句子集合/>

，收集和/>

有不同迁移模式分类的负向句子集合/>

，/>

，/>

为取余运算，定义类内对比学习损失/>

如下：

；

是温度系数，/>

代表由文本风格迁移模型获得的第/>

个句子/>

的句子表示，/>

表示/>

对应的正向句子集合/>

中第/>

个句子的句子表示，/>

表示/>

对应的负向句子集合

中第/>

个句子的句子表示；

步骤四C，对第

个句子/>

，收集和/>

有相同风格的正向句子集合/>

，收集和/>

有不同风格的负向句子集合/>

，/>

，定义类间对比学习损失/>

如下：

。

优选的，步骤四A中，使用文本风格迁移模型对所述训练数据集得到句子表示集合

，具体包括：

将训练数据中的句子组成句子序列

，使用RACoLN文本风格迁移模型的编码模块将所述句子序列/>

映射为一个和风格无关的内容表示/>

；

将所述内容表示

与目标风格/>

作为RACoLN文本风格迁移模型的样式编辑器的输入，得到内容相关的风格表示/>

将

作为所述句子表示集合/>

。

，具体包括：

使用Style Transformer文本风格迁移模型将句子的初始风格

映射为一个风格表示向量/>

使用Style Transformer文本风格迁移模型的编码模块将每个句子

与所述风格表示向量/>

编码为一个连续的表示/>

；

将

作为所述句子表示集合/>

。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

本发明提供了一个迁移模式分类提取模型来自动挖掘潜在的迁移模式信息并获得迁移模式标签，然后利用句子的迁移模式标签对同一种风格内的句子进行对比学习，同时利用句子的风格标签对不同风格间的句子进行对比学习，这样增加了句子表示的准确性和区分度，进而提高文本风格迁移任务的性能。将本发明的提供的迁移模式分类提取模型与文本风格迁移模型结合使用，可以提高文本风格迁移模型的性能。

附图说明

图1为本发明实施例提供的基于聚类算法的迁移模式分类提取模型的训练流程图；

图2为现有技术中的迁移模式举例。

具体实施方式

以下结合附图和具体实施例，对本发明进行详细说明，在详细说明本发明各实施例的技术方案前，对所涉及的名词和术语进行解释说明，在本说明书中，名称相同或标号相同的部件代表相似或相同的结构，且仅限于示意的目的。

本发明提出的迁移模式分类提取模型训练方法如图1所示。迁移模式分类提取模型自动挖掘每种风格中的潜在迁移模式。基于挖掘到的迁移模式信息，对比学习模块采用风格内对比学习损失和风格间对比学习损失来学习更精确的句子表示。最终这两个损失被应用于文本风格迁移模型，以进一步提高其性能。

（1）迁移模式分类提取模型

此模型的目标是挖掘潜在的迁移模式信息，将同一风格中的句子按照不同迁移模式进行聚类。本发明用两层全连接神经网络搭建迁移模式分类提取模型，并设计了一种聚类算法来对同一风格的句子进行聚类。根据句子编码向量到聚类中心（质心）的距离来对句子进行分类，然后通过所有句子编码向量的加权和来计算每个质心，最终设计了一种聚类损失来优化聚类网络以将句子划分为不同的类。聚类结果就可以看作迁移模式的监督信息来帮助获得更为精确的句子编码向量。

详细来讲，将

个句子输入BERT预训练语言模型，定义/>

为每个风格中的迁移模式类别的数量，对每个句子/>

进行编码得到一个/>

维的表示向量，所述表示向量即为句子编码向量/>

，随机初始化一个向量作为聚类中心表示/>

，1≤/>

≤/>

，迁移模式分类提取模型将句子编码向量集合/>

与聚类中心表示集合/>

作为输入，计算句子编码向量和聚类中心表示之间的距离矩阵/>

：

；

其中

是距离矩阵/>

中的元素，代表第/>

个聚类中心表示/>

与第/>

个句子编码向量/>

之间的归一化距离，代表了句子编码向量/>

不属于第/>

类的程度，/>

是可学习的模型参数，/>

是欧几里得距离；

而后，根据距离矩阵

来对句子编码向量进行分类：

；

其中

代表句子编码向量/>

不属于每一类的程度，/>

函数根据最小距离将句子编码向量/>

划分到相应的类，/>

代表句子编码向量/>

被划分到的类索引。

为了训练迁移模式分类提取模型来获得最优的聚类范式，本发明提出了一种聚类损失来最小化句子编码向量和其相应的聚类中心表示之间的距离。聚类损失的目标是找到一个最优化的模型参数

从而计算出最优化的聚类中心表示/>

，以至于在句子编码向量经过此迁移模式分类提取模型后，其与相应的聚类中心表示的距离更小，与其他聚类中心表示的距离更大。聚类损失/>

如下所示：

；

其中

代表第/>

类聚类中心。

之后，根据距离矩阵

来得到所有句子编码向量的权重，并根据句子编码向量的加权和来更新聚类中心表示/>

，更新的公式如下所示：

；

当迁移模式分类提取模型充分训练后，通过计算各个

就得到了每个句子的迁移模式分类作为迁移模式的监督信息。

（2）对比学习模块

本发明采用有监督对比学习来正则化隐空间，使得相同迁移模式或者相同风格的句子对在隐空间中的表示更近，使得不同迁移模式和风格的句子对在隐空间中的表示更远，最终让句子表示更有准确性与区分度。基于迁移模式标签对于同一风格的数据本发明设计了类内对比学习损失，基于风格标签对于不同风格的数据本发明设计了类间对比学习损失。这两个损失最终都会应用到文本风格迁移模型上。

A.类内对比学习损失

对于句子集合

中的一个句子/>

，/>

是/>

的正向句子集合，/>

里的句子都和/>

有相同的迁移模式。对应地，/>

，/>

表示取余运算，表示/>

的负向句子集合，/>

里的句子都和/>

有不同的迁移模式。使用文本风格迁移模型对句子集合/>

得到句子表示集合/>

，类内对比学习损失如下：

；

其中，

是温度系数，/>

表示类内对比学习损失，/>

代表/>

的句子表示，/>

表示

的正向句子集合/>

中第/>

个句子的句子表示，/>

表示/>

的负向句子集合/>

中第/>

个句子的句子表示。

通过最小化

，同种迁移模式句子表示之间的距离会更近，不同迁移模式句子表示之间的距离会更远。

B.类间对比学习损失

类似的，对于句子集合

中的一个句子/>

，/>

是/>

的正向句子集合，这里面的句子都和/>

有着相同的风格。对应地，/>

，表示/>

的负向句子集合，/>

里的句子都和/>

有不同的风格。类间对比学习损失如下：/>

；

其中，

是温度系数，/>

表示类间对比学习损失，/>

代表/>

的句子表示，/>

表示

的正向句子集合/>

中第/>

个句子的句子表示，/>

表示/>

的负向句子集合/>

中第/>

个句子的句子表示。

通过最小化

，同种风格句子表示之间的距离会更近，不同风格句子表示之间的距离会更远。

每一个风格内部都会存在一个类内对比学习损失

，在这些风格之间还会存在一个类间对比学习损失/>

。因此，对于/>

种风格标签的数据集，总体的对比学习损失

一般形式为：

；

其中，

为第h个风格标签的类内对比学习损失举例来讲；如图1所示的情感风格迁移任务，这里面有积极和消极两种风格，因此这个情感风格迁移任务中/>

。

（3）文本风格迁移模型的应用举例

本发明的训练包括了两个阶段，在第一阶段，用聚类损失

训练一个独立的迁移模式分类提取模型来得到迁移模式标签。在第二阶段，基于已有的迁移模式标签与风格标签，本发明通过对比学习模块计算出/>

。定义文本风格迁移模型的损失为/>

，保持文本风格迁移模型的结构不变，用/>

与/>

联合训练得到最终的文本风格迁移模型，训练的总损失/>

如下所示：

；

其中

为一个平衡/>

与/>

的参数。

下方为两个实施例，分别利用了两个不同的主流文本风格迁移模型来解释本发明的方法。

实施例1：

RACoLN文本风格迁移模型使用背景技术中提到的第一种主流方法，即将句子分离出独立于其风格属性的表示，并使用目标风格属性对此表示进行修改。它的基础结构包括一个编码器，一个解码器还有一个风格调整器（stylizer）。编码器将输入的句子序列

映射为一个和风格无关的内容表示/>

，stylizer将这个内容表示/>

与目标风格/>

作为输入，产生一个内容相关的风格表示/>

，解码器将/>

与/>

作为输入，产生一个新的序列/>

。将/>

作为RACoLN文本风格迁移模型得到的句子表示，计算总体学习损失/>

，再根据总体学习损失/>

计算/>

，再由/>

来优化RACoLN文本风格迁移模型。

详细来讲RACoLN文本风格迁移模型包括四个损失。

对RACoLN模型输入句子序列

与此句子序列的初始风格/>

，自重构损失旨在训练RACoLN模型将输入的句子序列转换为此句子序列的初始风格：

；

其中，

代表自重构损失，/>

是输入序列/>

的内容表示，/>

是风格/>

的表示，D代表句子序列x和初始风格s的集合，/>

表示对D中的/>

求[]内表达式的期望，/>

是由解码器定义的序列上的条件分布。

假设本发明首先将句子序列

转换到目标风格/>

得到/>

，而后又把/>

转换为原来的风格/>

。循环重构损失希望模型重建原来的输入/>

：

；

其中，

代表循环重构损失，/>

是转换后的句子序列/>

的内容表示。

句子序列

与转换后的句子序列/>

的内容表示预期是相似的，所以有了如下的内容损失/>

：

；

最终为了实现风格控制，想让转换后的句子序列

有着风格/>

，所以有了如下风格转移损失/>

：

；

其中，

是一个训练好的风格分类器，/>

是基于此分类器的条件分布，/>

由软采样获得。

综上，此文本风格迁移模型的基础损失

为：

；

其中

、/>

、/>

、/>

分别为平衡各个损失之间的参数。

实施例2：

Style Transformer文本风格迁移模型使用背景技术中提到的第二种主流方法，通过使用额外的风格嵌入直接修改输入句子的表示，它采用Transformer作为自己的基本模块，加入了一个额外的风格嵌入来将句子的初始风格

映射为一个风格表示向量/>

。Transformer的编码器将一个句子/>

与风格表示向量/>

编码为一个连续的表示/>

。解码器将/>

作为输入，并计算出与/>

和/>

Claims

1.一种基于迁移模式感知的文本风格迁移方法，用迁移模式分类提取模型和文本风格迁移模型，将输入的句子的风格替换成目标风格，完成文本风格迁移任务，其特征在于，包括以下步骤：

步骤二，对训练数据集中每个句子

进行编码得到句子编码向量/>

，d为句子编码向量的维度，j为1到N的整数；

输入至迁移模式分类提取模型，输出句子编码向量/>

对应的迁移模式分类；

；

则对比学习总体损失

：

；

H为风格标签的数量，

为第h个风格标签的类内对比学习损失；

步骤五，文本风格迁移模型的损失为

，计算文本风格迁移任务的总体损失

，其中，/>

为一个平衡/>

与/>

的参数；

保持文本风格迁移模型的结构不变，基于所述总体损失

训练文本风格迁移模型；

2.根据权利要求1所述基于迁移模式感知的文本风格迁移方法，其特征在于，步骤三中，构建基于聚类算法的迁移模式分类提取模型的过程，包括：

步骤三A，定义

，1≤/>

≤/>

，根据句子编码向量集合/>

与聚类中心表示集合

，获得句子编码向量和聚类中心表示之间的距离矩阵/>

：

；

其中

为距离矩阵/>

中的元素，代表第/>

个聚类中心表示/>

与第/>

个句子编码向量/>

之间的归一化距离，/>

是可学习的模型参数，/>

是欧几里得距离；

步骤三B，根据所述距离矩阵

对所述句子进行分类：

；

其中

代表句子编码向量/>

不属于每一类的程度，/>

为argmin函数，argmin函数根据最小距离将句子编码向量/>

划分到相应的类，/>

代表句子编码向量/>

被划分到的类索引；/>

步骤三C，定义聚类损失函数

为：

；

其中

代表第/>

类聚类中心，计算/>

最小时的模型参数/>

；

步骤三D，根据聚类损失函数

训练迁移模式分类提取模型；

步骤三E，获得完成训练的迁移模式分类提取模型。

3.根据权利要求2所述基于迁移模式感知的文本风格迁移方法，其特征在于，步骤三D中，根据聚类损失函数

训练迁移模式分类提取模型，具体包括：

重新计算聚类中心表示

：

；

根据重新计算的聚类中心表示

训练迁移模式分类提取模型。

4.根据权利要求1所述基于迁移模式感知的文本风格迁移方法，其特征在于，步骤四中，将所述训练数据集输入到文本风格迁移模型，得到句子表示集合，基于所述迁移模式分类和所述句子表示集合，定义类内对比学习损失

，具体包括：

步骤四A，所述训练数据集中的句子组成句子集合

，使用文本风格迁移模型对所述训练数据集得到句子表示集合/>

；

步骤四B，对第

个句子/>

，收集和/>

有相同迁移模式分类的正向句子集合/>

，收集和

有不同迁移模式分类的负向句子集合/>

，/>

，/>

为取余运算，定义类内对比学习损失/>

如下：

；

是温度系数，/>

代表由文本风格迁移模型获得的第/>

个句子/>

的句子表示，/>

表示/>

对应的正向句子集合/>

中第/>

个句子的句子表示，/>

表示/>

对应的负向句子集合/>

中第/>

个句子的句子表示；

步骤四C，对第

个句子/>

，收集和/>

有相同风格的正向句子集合/>

，收集和/>

有不同风格的负向句子集合/>

，/>

，定义类间对比学习损失/>

如下：

。

5.根据权利要求4所述基于迁移模式感知的文本风格迁移方法，其特征在于，步骤四A中，使用文本风格迁移模型对所述训练数据集得到句子表示集合

，具体包括：

将训练数据中的句子组成句子序列

，使用RACoLN文本风格迁移模型的编码模块将所述句子序列/>

映射为一个和风格无关的内容表示/>

；/>

将所述内容表示

与目标风格/>

将

作为所述句子表示集合/>

。

6.根据权利要求4所述的基于迁移模式感知的文本风格迁移方法，其特征在于，步骤四A中，使用文本风格迁移模型对所述训练数据集得到句子表示集合

，具体包括：

使用Style Transformer文本风格迁移模型将句子的初始风格

映射为一个风格表示向量/>

使用Style Transformer文本风格迁移模型的编码模块将每个句子

与所述风格表示向量/>

编码为一个连续的表示/>

；

将

作为所述句子表示集合/>

。/>