CN110097085B

CN110097085B - 歌词文本生成方法、训练方法、装置、服务器及存储介质

Info

Publication number: CN110097085B
Application number: CN201910265763.1A
Authority: CN
Inventors: 曹绍升; 丁毅
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2019-04-03
Filing date: 2019-04-03
Publication date: 2023-04-14
Anticipated expiration: 2039-04-03
Also published as: CN110097085A

Abstract

本发明公开一种歌词文本生成方法、训练方法、装置、服务器及存储介质，所述方法包括：根据待生成歌词文本的歌词属性，收集与所述歌词属性对应的歌词文本，所述歌词属性包括歌词的风格和/或歌词的主题，所述歌词文本中包含有多个目标词语；通过预设的词向量生成模型，生成所述目标词语的目标词向量；将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型；根据所述目标生成对抗网络模型，生成所述歌词属性的目标歌词文本。上述方法有效的实现了歌词文本的自动生成，提高了歌词的创作效率。

Description

歌词文本生成方法、训练方法、装置、服务器及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种歌词文本生成方法、训练方法、装置、服务器及存储介质。

背景技术

现有技术中，绝大多数的音乐歌词都是人为创作的，歌词的创作需要创作者有一定的文学功底以及人生阅历，同时创作者的创作灵感也会在很大程度上影响歌词的创作。对于没有歌词创作经验、或者没有写作灵感的创作者来说，创作歌词的效率很低。

发明内容

本说明书实施例提供及一种歌词文本生成方法、训练方法、装置、服务器及存储介质。

第一方面，本说明书实施例提供一种歌词文本生成方法，包括：

根据待生成歌词文本的歌词属性，收集与所述歌词属性对应的歌词文本，所述歌词属性包括歌词的风格和/或歌词的主题，所述歌词文本中包含有多个目标词语；

通过预设的词向量生成模型，生成所述目标词语的目标词向量；

将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型；

根据所述目标生成对抗网络模型，生成所述歌词属性的目标歌词文本。第二方面，本说明书实施例提供一种歌词文本生成模型的训练方法，包括：

收集与目标歌词属性对应的歌词文本，所述目标歌词属性包括歌词的风格和/或歌词的主题，所述歌词文本中包含有多个目标词语；

将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型，其中，所述目标生成对抗网络模型用于生成所述目标歌词属性的歌词文本。

第三方面，本说明书实施例提供一种歌词文本生成装置，包括：

收集模块，用于根据待生成歌词文本的歌词属性，收集与所述歌词属性对应的歌词文本，所述歌词属性包括歌词的风格和/或歌词的主题，所述歌词文本中包含有多个目标词语；

词向量生成模块，用于通过预设的词向量生成模型，生成所述目标词语的目标词向量；

模型获取模块，用于将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型；

歌词生成模块，用于根据所述目标生成对抗网络模型，生成所述歌词属性的目标歌词文本。

第四方面，本说明书实施例提供一种歌词文本生成模型的训练装置，包括：

收集模块，用于收集与目标歌词属性对应的歌词文本，所述目标歌词属性包括歌词的风格和/或歌词的主题，所述歌词文本中包含有多个目标词语；

模型获取模块，用于将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型，其中，所述目标生成对抗网络模型用于生成所述目标歌词属性的歌词文本。

第五方面，本说明书实施例提供一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行上述第一方面所述方法的步骤。

第六方面，本说明书实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项所述方法的步骤。

本说明书实施例有益效果如下：

本说明书实施例中，根据待生成歌词文本的歌词属性，收集与所述歌词属性对应的歌词文本，然后根据预设的词向量生成模型，对所述歌词文本中的目标歌词进行词向量训练，获得目标词语对应的目标词向量，进一步的，根据目标词向量、以及所述目标词语，对初始的生成对抗网络模型进行训练，获得训练好的目标生成对抗网络模型，并根据所述目标生成对抗网络模型，生成所述歌词属性的目标歌词，有效的实现了歌词文本的自动生成，提高了歌词创造的效率。另外，上述方案中，对于一种歌词属性，只收集该歌词属性下的歌词文本进行训练，能够保证生成的歌词具有鲜明的该歌词属性的特点，有效的提高了歌词生成的质量。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本说明书实施例第一方面提供的一种歌词文本生成方法的流程图；

图2为本说明书实施例第二方面提供的一种歌词文本生成模型的训练方法的流程图；

图3为本说明书实施例第三方面提供的一种歌词文本生成装置的示意图；

图4为本说明书实施例第五方面提供的服务器的示意图。

具体实施方式

为了更好的理解上述技术方案，下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明，应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明，而不是对本说明书技术方案的限定，在不冲突的情况下，本说明书实施例以及实施例中的技术特征可以相互组合。

第一方面，本说明书实施例提供一种歌词文本生成方法，如图1所示，为本说明书实施例提供的一种歌词文本生成方法的流程图，该方法包括以下步骤：

步骤S11：根据待生成歌词文本的歌词属性，收集与所述歌词属性对应的歌词文本，所述歌词属性包括歌词的风格和/或歌词的主题，所述歌词文本中包含有多个目标词语；

步骤S12：通过预设的词向量生成模型，生成所述目标词语的目标词向量；

步骤S13：将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型；

步骤S14：根据所述目标生成对抗网络模型，生成所述歌词属性的目标歌词文本。

本说明书实施例提供的歌词文本生成方法可以应用于在线音乐平台的服务器中，向在线音乐平台的用户提供歌词文本生成的服务，也可以应用于用户的终端设备，如手机、平板电脑等，这里不做限定。

以应用于音乐平台的服务器中为例，音乐平台的音乐库中的歌曲对应的歌词文本涵盖有各种风格和/或主题，例如，有的歌词风格为怀旧、有的歌词风格为中国风、有的歌词主题为爱情、有的歌词主题为青春，另外，不同类型的音乐，其歌词的结构组织也有区别，例如，说唱歌曲的歌词对韵脚有特别的要求。本说明书实施例中，针对每种歌词属性，均可以通过上述步骤来生成歌词文本。即，收集每种歌词属性对应的歌词文本，将歌词文本中包含的目标词语转换为词向量，然后根据目标词语的词向量对初始的生成对抗网络模型进行训练，并通过训练好的目标生成对抗网络模型，生成该种歌词属性的目标歌词。

为了便于说明，下面以将本说明书实施例中的歌词文本生成方法应用在音乐平台服务器中为例，来对歌词文本生成方法中的各个步骤进行描述。首先，执行步骤S11：根据待生成歌词文本的歌词属性，收集与所述歌词属性对应的歌词文本。

本说明书实施例中，待生成歌词文本的歌词属性可以是用户自定义的，歌词属性包括歌词的风格和/或歌词的主题，还可以包括歌词的格式等其他属性。举例来讲，用户可以将待生成歌词文本的歌词属性设定为校园风格，主题设定为爱情。歌词属性可以在用户终端上进行设定，例如，用户可以在用户终端上输入待生成歌词的歌词属性，或者在预设的歌词属性库中选择出待生成歌词文本的歌词属性。用户终端与音乐平台服务器通信连接，在设定好歌词属性后，用户终端将设定好的歌词属性信息发送给音乐平台服务器。

音乐平台服务器在接收到待生成歌词文本的歌词属性后，根据歌词属性进行歌词文本的收集。收集歌词文本可以通过以下方式实现：确定与所述歌词属性对应的歌曲标签；在预设歌曲库中确定出与所述歌曲标签对应的目标歌曲，并获取所述目标歌曲对应的歌词文本作为与所述歌词属性对应的歌词文本。

应理解的是，歌曲的标签可以是人工添加的，比如音乐平台的用户根据自己收听歌曲时的感受来添加该歌曲的标签，或者音乐平台的管理人员通过歌曲信息(包括歌词、旋律等信息)进行添加。歌曲的标签还可以是自动生成的，例如根据歌词内容来自动生成标签。歌曲的标签与歌词属性具有一定的相关性，例如，一首歌的标签包括欢快、儿歌，那么对应的，这首歌的歌词风格为欢快，主题为儿歌。根据歌词属性确定歌曲标签，可以通过多种方式实现，例如，通过预设算法对歌词属性进行处理得到对应的歌曲标签；或者，通过查找预设的歌词属性与歌曲标签的对应关系来得到，其中，预设的歌词属性与歌曲标签的对应关系可以是相关人员根据经验人为设置的。

在得到了与歌词属性对应的歌曲标签之后，在预设歌曲库中筛选出该歌曲标签下的目标歌曲。预设歌曲库可以是音乐平台的歌曲库，也可以是网络歌曲库，还可以是其他的歌曲库，这里不做限定。以音乐平台的歌曲库为例，歌曲库中的歌曲大部分都标记有标签，因此可以根据标签对歌曲库中的歌曲进行分类。在获得了与歌词属性对应的歌曲标签之后，将该歌曲标签与歌曲库中存在的标签进行比对，当歌曲库中存在与该歌曲标签相同的标签时，将该标签下的歌曲提取出来，并获取这些歌曲的歌词文本。或者，还可以在歌曲库存在的标签中确定出与该歌曲标签含义相近的标签，例如，在与歌词属性对应的歌曲标签为欢乐时，可以将歌曲库中的快乐、高兴、愉快等含义相近的标签下的歌曲收集起来，将这些歌曲的歌词文本作为与歌词属性对应的歌词文本。

另外，根据筛选出的歌曲确定歌词文本可以通过多种方式实现，例如，在歌曲中内嵌有歌词时，可以直接在歌曲中提取歌词文本；还可以根据与歌曲关联好的歌词信息来获取歌词文本；还可以根据歌曲信息(例如歌名、演唱者等信息)在音乐平台的歌词库或互联网上查找对应的歌词文本。

当然，除了通过预设歌曲库进行歌词文本的收集，还可以通过其他方式获取歌词文本，例如，通过在互联网上搜索相同或相近歌词属性的歌词文本等，这里不做限定。

本说明书实施例中，针对某种歌词属性，只收集该歌词属性下的歌词文本，而不是使用歌曲库中的全部歌曲，这样，能够保证生成的歌词具有鲜明的该歌词属性的特点。如果使用全部歌曲，则会导致生成的歌词太过于大众化，歌词属性不明显。

在收集到歌词文本之后，需要进一步的确定与歌词文本中包含的目标词语对应的词向量，以利用词向量来进行歌词文本生成。本说明书实施例中，目的是生成中文为主的目标歌词，因此，收集的歌词文本大部分也是中文。但对于一些歌词文本来说，其中经常会包含有一些外文(如英文、法文等)，为了使得词向量能够更好的表达歌词中各词之间语义上的关联，可以先将歌词文本中的外文翻译成中文，即，在收集了歌词文本之后，对歌词文本进行预处理，具体包括以下步骤：检测所述歌词文本中是否包含有非中文词语；在所述歌词文本中包含有所述非中文词语时，将所述非中文词语翻译成中文词语；对应的，所述通过预设的词向量生成模型，生成所述目标词语的目标词向量，包括：对翻译后的所述歌词文本进行分词处理，将分词结果作为所述目标词语；根据所述预设的词向量生成模型，对所述目标词语进行词向量训练，获得所述目标词语的目标词向量。

接下来，执行步骤12：通过预设的词向量生成模型，生成所述目标词语的目标词向量。

本说明书实施例中，目标词语可以是收集的歌词文本中包含的全部词语，也可以是收集的歌词文本中包含的部分词语，这里不做限定。应理解的是，收集的歌词文本可以包含多首歌曲对应的多个歌词文本，对于每个歌词来说，在歌词文本中确定目标词语可以通过多种方式实现。例如，对每个歌词文本按照预设规律进行词语采样，将每个歌词文本的词语采样结果作为目标词语。或者，将每个歌词文本中出现频率高于阈值的词语提取出来，作为目标词语。还可以通过对歌词文本进行分词处理来获得目标歌词。

以对歌词文本进行分词为例，将歌词文本中的每句歌词都进行分词。举例来讲，对于歌词“一闪一闪亮晶晶”，其分词结果可以为“一闪”、“一闪”、“亮晶晶”，可以将这三个词语作为该句歌词对应的目标词语。由于歌词文本由很多句歌词构成，通过对每句歌词进行分词处理，最终可以得到目标歌词的序列。其中，分词处理可以通过多种方式实现，例如，采用基于字符串匹配的分词方法、采用机器学习的方法等等，这里不做限定。

应说明的是，由于一首歌的歌词可能会存在许多重复的地方，例如，副歌部分可能存在两次、甚至更多次数的重复，为了减少计算量，在获取了歌词文本之后，本说明书实施例中的方法还包括：对所述歌词文本中包含的重复句子进行去重处理；所述通过预设的词向量生成模型，生成所述目标词语的目标词向量，包括：对去重处理后的歌词文本进行分词处理，将分词结果作为所述目标词语；根据所述预设的词向量生成模型，对所述目标词语进行词向量训练，获得所述目标词语的目标词向量。即，先将歌词文本进行句子级别的去重，即去除重复出现的句子，然后在句子去重之后，再进行歌词句子的分词处理，得到目标歌词。

在得到目标歌词之后，根据预设的词向量生成模型进行词向量的训练。本说明书实施例中，可以通过以下步骤来训练词向量：将所述目标词语进行笔画拆分，获得笔画拆分结果；根据预设的笔画与编码之间的对应关系，确定与所述笔画拆分结果对应的编码序列；根据所述编码序列，构建所述目标词语的笔画元素集合，其中，所述笔画元素集合中的每个笔画元素由所述编码序列中的多个编码元素组成；通过所述预设的词向量生成模型，对所述笔画元素集合中的每个笔画元素的初始笔画向量以及所述目标词语的初始词向量进行训练，获得所述目标词语的所述目标词向量。

在具体实施过程中，对于每一个目标词语来说，将其按照笔画进行拆分。以“大人”为例，“大”可以按照笔画拆分为“横”、“撇”、“捺”，人可以拆分为“撇”、“捺”，那么“大人”的笔画拆分结果由五个笔画构成，即“横”、“撇”、“捺”、“撇”、“捺”。进一步的，将每个笔画映射到数字编码，在一个实施例中，笔画与编码的对应关系可以是预先设置好的，例如，笔画与编码的对应关系可以为：笔画“横”“提”对应编码1，笔画“竖”、“竖钩”对应编码2，笔画“撇”对应编码3，笔画“捺”、“点”对应编码4，笔画“横折钩”、“竖弯钩”对应编码5。那么，上面的“大人”的笔画拆分结果可以转化为编码序列：13434。当然，笔画与编码的对应关系可以根据实际需要进行设置，这里不做限定。

进一步的，在获得了编码之后，构建该词语的笔画元素集合。应说明的是，笔画元素集合中包含的每个笔画元素由编码序列中的多个编码元素组成。例如，每个笔画元素包含有n个编码元素，n的取值可以是动态可调的，根据实际需要来进行选择。笔画元素集合可以通过n-gram来进行构建，在一个实施例中，n设置为3-5之间的正整数。仍沿用上面“大人”的编码序列13434来进行说明，当n为3时，3-gram对应的笔画元素为：134、343、434，当n为4时，4-gram对应的笔画元素为1343、3434，当n为5时，5-gram对应的笔画元素为13434，那么对于词语“大人”来说，笔画元素集合就包括有134、343、434、1343、3434、13434这6个元素。应理解的是，对于每个目标词语，都进行笔画拆分，则每个目标词语都对应有一个笔画元素集合。

本说明书实施例中，为了对词向量和笔画向量进行训练，针对每个目标词语，以及每个词语的笔画元素集合中的每个笔画元素，都进行向量初始化。仍以词语“大人”为例，会设置一个与“大人”对应的初始词向量，同时，对于“大人”对应的笔画元素集合来说，对于每个笔画元素，均设置一个初始笔画向量，那么“大人”对应的初始笔画向量总共有6个。词向量以及笔画向量的初始化可以采用随机初始化，也可以采用其他的初始化，在一个实施例中，各个初始笔画向量以及初始词向量的维度均相同。

接下来，通过预设的词向量生成模型来训练词向量以及笔画向量。预设的词向量生成模型可以根据实际需要进行选择，例如Skip-Gram模型，CBOW(continuous bag ofword)模型等。下面，为了便于说明，以Skip-Gram模型为例来对词向量以及笔画向量的训练过程来进行描述。

需要说明的是，Skip-Gram模型是用中心词语来预测上下文词语，在向量训练的过程中，通过梯度下降的方法来不断的调整中心词语的笔画向量，以及上下文词语的词向量。在所有的目标词语遍历完毕之后，得到所有目标词语的最终笔画向量以及最终的词向量。

以歌词为“试着忍住眼泪”为例，经过分词处理，得到目标词语“试着”、“忍住”、“眼泪”。本说明书实施例中，将中心词语的笔画向量作为预设的词向量生成模型的输入，将上下文词语的词向量作为模型的输出。以“忍住”为中心词语为例，上下文词语为“试着”和“眼泪”，则将“忍住”对应的初始笔画向量作为输入，并根据上下文词语的初始词向量以及损失函数，计算每个笔画向量和上下文词语的相似度，进而根据损失函数计算梯度，并对上下文词语的初始词向量以及中心词语的初始笔画向量进行迭代更新。当迭代次数满足预设的迭代次数，或者模型输出的准确率满足预设条件时，完成训练。

应理解的是，在训练过程中，会将每个目标词语依次作为中心词语，来预测该词语的上下文词语，通过这种方式，能够遍历所有目标词语，得到最终训练好的各个目标词语的笔画向量以及词向量。通过上述训练过程，能够使得中心词语与上下文词语的关联度较高，而且词义相同或相近的词语对应的上下文词语往往也是相同或相近的，而中心词语与非上下文词语的关联度较低。本说明书实施例中，目标词语的词向量既可以用上述训练好的笔画向量来表示，也可以用上述训练好的词向量来表示，这里不做限定。

在获得了目标词语的目标词向量之后，执行步骤S13：将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型；

应理解的是，生成对抗网络(Generative Adversarial Networks，GAN)模型包含两个网络：生成器(Generator)和判别器(Discriminator)，其中，生成器负责伪造一些数据，并要求这些数据尽可能的真实，而判别器负责判别给定的数据是否为伪造的。整个过程就是在博弈，生成器尽可能伪造出真实的数据，而判别器尽可能提高自身的判别性能。本说明书实施例中，生成器用来伪造歌词，判别器用来判别生成器生成的歌词是真实歌词的概率，例如，如果判别器的判别结果接近1，则表明歌词是真实的歌词，如果判别器的判别结果接近0，则表明歌词不是真实的歌词。

生成器和判别器可以根据实际需要选择对应的网络模型，例如，生成器可以选用循环神经网络、长短时记忆网络等，判别器可以选用卷积神经网络、循环神经网络等，这里不做限定。在选定各自的网络之后，首先初始化网络参数，包括初始化生成器的网络参数以及初始化判别器的网络参数，然后对生成器和判别器进行对抗训练，直到生成对抗网络达到收敛条件。

本说明书实施例中，生成对抗网络的训练包括循环迭代步骤：将所述当前生成器根据所述目标词语、以及所述目标词向量生成的伪造歌词作为假样本，将由所述目标词语构成的文本作为真样本，对所述当前判别器进行参数调整，获得参数调整后的判别器；将所述当前生成器生成的所述伪造歌词输入到所述参数调整后的判别器中进行判别，获得判别结果，并根据所述判别结果对所述当前生成器的参数进行调整，获得参数调整后的生成器。进一步的，将所述参数调整后的生成器作为所述当前生成器，将所述参数调整后的判别器作为所述当前判别器，重复执行所述循环迭代步骤直到迭代次数满足预设条件。

具体来讲，在训练的过程中，可以对生成器和判别器进行交替迭代训练，即生成器的训练和判别器的训练交替进行。应说明的是，将目标词语作为生成对抗网络模型的输入时，目标词语可以按照一定顺序进行排列，例如，将目标词语按照歌词文本中各词的先后顺序进行排列，每首歌曲的歌词文本所包含的目标词语可以构成一组目标词语序列，多首歌曲的歌词文本就组成了多组目标词语序列。对应的，根据每个目标词语对应的目标词向量，可以确定与每组目标词语序列对应的目标词向量序列，目标词向量序列中的各个词向量的排序与目标词语序列中的各个词语是一一对应的，在生成对抗网络模型的实际训练过程中，是通过多组目标词向量序列进行模型训练的。

在对生成对抗网络模型进行训练时，起始状态下的判别器为初始判别器，起始状态下的生成器未初始生成器。应理解的是，生成器和判别器的训练过程可以分开进行。

在对判别器进行训练时，将由目标词语构成的文本作为真样本，沿用上面的例子，将一组目标词语序列作为一个真样本，将初始生成器生成的伪造歌词作为假样本。应理解的是，初始生成器会根据与目标词语序列对应的目标词向量序列，生成伪造的词向量序列，并根据目标词语与目标词向量之间的对应关系，将伪造的词向量序列转换为伪造歌词。为了区别真样本和假样本，可以将真样本的标签设为1，将假样本的标签设为0，训练判别器的目的为在输入为真样本时，判别器的输出尽可能为1，在输入为假样本时，判别器的输出尽可能为0。因此，判别器的训练可以看作是有监督的二分类，根据上述带有标签的真样本和假样本进行对初始判别器进行训练，并对初始判别器的参数进行调整，得到第一次参数调整后的判别器。

在对生成器进行训练时，目的是令生成器生成的歌词尽可能接近真实的歌词，为了确定生成的歌词是否接近真实的歌词，可以将生成的伪造歌词输入到判别器中，根据判别器的判别结果来确定生成的伪造歌词的真实度。因此，在训练生成器时，可以将生成器和判别器串联起来进行训练，并且在训练这个串联的网络时，固定判别器的网络参数不变，只是将判别器的判别结果回传到生成器，以更新生成器的网络参数。

因此，可以根据上述方法将初始生成器和第一次参数调整后的判别器串联起来，将初始生成器生成的伪造歌词输入到第一次参数调整后的判别器中进行判别，并根据判别结果对初始生成器生成进行参数调整，得到第一次参数调整后的生成器。

进一步的，可以根据第一次参数调整后的生成器再次生成伪造歌词，并将伪造歌词作为假样本，和真样本一起对第一次参数调整后的判别器进行训练，得到第二次参数调整后的判别器。同时，根据第二次参数调整后的判别器的判别结果，对第一次参数调整后的生成器进行调整。重复上述步骤直到迭代次数满足预设条件时，认为生成对抗网络模型训练完毕，此时的判别器和生成器构成了目标生成对抗网络模型。其中，预设条件可以根据实际需要进行设定，例如，预设条件为迭代次数大于一阈值。

在训练好生成对抗网络模型之后，就可以利用训练好的目标生成对抗网络进行歌词文本生成，即执行步骤S14。在本说明书实施例中，步骤S14可以通过以下方式实现：根据所述目标生成对抗网络模型，生成初始歌词文本；根据预设词语和替换词语的对应关系，确定与所述初始歌词文本中的关键词语对应的目标替换词语，并将所述关键词语替换为所述目标替换词语，生成所述目标歌词文本，其中，在所述预设词语和替换词语的对应关系中，所述预设词语对应的替换词语为所述预设词语的近义词。

具体来讲，通过训练好的生成对抗网络生成的初始歌词文本，歌词文本受限于生成对抗网络的训练数据，当训练数据数量较小的情况下，生成歌词文本的词语选择性较小，导致生成的歌词文本较为单一，使用的词语不丰富。因此，在生成初始歌词文本之后，本说明书实施例中的方案还可以根据预设词语和替换词语的对应关系，对初始歌词文本中的关键词语进行替换。应理解的是，关键词语可以是初始歌词文本中出现频率较高的词语，也可以是在初始歌词文本中随机抽取的词语，还可以是其他方式确定的词语，这里不做限定。例如，生成的初始歌词文本中存在关键词语“超赞”，可以在预设的词语和替换词语的对应关系中查找与“超赞”语义相同或相近的词语，如果查找到“超赞”与“skr”语义相近，则可以将“超赞”用“skr”进行替换。

词语和替换词语的对应关系可以根据多种方式获得，在本说明书实施例中，可以通过以下方式获得：获取预设词语样本集；对所述预设词语样本集中的每个词语进行词向量训练，获得与所述每个词语对应的词向量；针对所述预设词语样本集中的每个词语，分别计算该词语的词向量和其余所有词语的词向量之间的相似度，将相似度大于一阈值的词语作为该词语的替换词语。

在该实施例中，获取预设词语样本集可以包含更多的词语量，不仅仅将词语限定在歌词文本中，还可以在互联网上获取数量庞大的词语。由于在更大的语料中，会出现更多的词语，这样就包容了词语的多样性。

在确定了预设词语样本集之后，可以对预设词语样本集中的词语进行词向量训练，具体的词向量训练可以参考上述目标词语的词向量过程，这里就不再赘述了，当然，还可以采用其他的词向量训练方法来生成词向量，这里不做限定。在获得了每个词语的词向量之后，为了确定词语之间的语义相关性，对任意两个词语的词向量之间的相似度进行计算。本说明书实施例中，针对预设词语样本集中的任一词语，计算该词语的词向量与其余所有词语的词向量之间的相似度，词向量之间的相似度可以采用计算欧式距离、余弦相似度等方式实现。进一步的，将相似度大于一阈值的词语作为该词语的替换词语，即这些词语之间可以进行相互替换。例如，以阈值为相似度为95％为例，在预设词语样本集中选定词语A，确定词语A对应的词向量a，并计算词向量a与预设词语样本集合中其他词语的词向量之间的相似度，确定词向量之间的相似度大于95％的词语，例如有3个词语的词向量与词向量a之间的相似度大于95％，则将这3个与作为词语A的替换词语，并将词语A与这3个词语之间的对应关系作为一条预设词语和替换词语。当然，阈值可以根据实际需要进行设置，这里不做限定。

另外，在构建词语替换映射时，还可以考虑两个词语之间的词性，例如，当两个词语均为形容词，且这两个词语之间的词向量之间的相似度大于阈值时，将这两个词语作为一条词语替换映射关系。

第二方面，本说明书实施例提供一种歌词文本生成模型的训练方法，如图2所示，该方法包括以下步骤：

步骤S21：收集与目标歌词属性对应的歌词文本，所述目标歌词属性包括歌词的风格和/或歌词的主题，所述歌词文本中包含有多个目标词语；

步骤S22：通过预设的词向量生成模型，生成所述目标词语的目标词向量；

步骤S23：将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型，其中，所述目标生成对抗网络模型用于生成所述目标歌词属性的歌词文本。

本说明书实施例中，针对每一种歌词属性，均可以通过上述方法生成一个对应的生成对抗网络模型，在使用过程中，可以根据需要生成的歌词文本的歌词属性，来选择对应的生成对抗网络模型。

关于上述方法，其中各个步骤的具体实现已经在本发明实施例提供的歌词文本生成方法的实施例中进行了详细描述，此处将不做详细阐述说明。

第三方面，本说明书实施例提供一种歌词文本生成装置，请参考图3，包括：

收集模块21，用于根据待生成歌词文本的歌词属性，收集与所述歌词属性对应的歌词文本，所述歌词属性包括歌词的风格和/或歌词的主题，所述歌词文本中包含有多个目标词语；

词向量生成模块22，用于通过预设的词向量生成模型，生成所述目标词语的目标词向量；

模型获取模块23，用于将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型；

歌词生成模块24，用于根据所述目标生成对抗网络模型，生成所述歌词属性的目标歌词文本。

在一种可选实现方式中，收集模块21，用于：

确定与所述歌词属性对应的歌曲标签；

在预设歌曲库中确定出与所述歌曲标签对应的目标歌曲，并获取所述目标歌曲对应的歌词文本作为与所述歌词属性对应的歌词文本。

在一种可选实现方式中，所述装置还包括：

检测模块，用于检测所述歌词文本中是否包含有非中文词语；

翻译模块，用于在所述歌词文本中包含有所述非中文词语时，将所述非中文词语翻译成中文词语；

词向量生成模块22，用于：

对翻译后的所述歌词文本进行分词处理，将分词结果作为所述目标词语；

根据预设的词向量生成模型，对所述目标词语进行词向量训练，获得所述目标词语的目标词向量。

在一种可选实现方式中，所述装置还包括：

去重模块，用于对所述歌词文本中包含的重复句子进行去重处理；

词向量生成模块22，用于：

对去重处理后的歌词文本进行分词处理，将分词结果作为所述目标词语；

根据所述预设的词向量生成模型，对所述目标词语进行词向量训练，获得所述目标词语的目标词向量。

在一种可选实现方式中，词向量生成模块22，用于：

将所述目标词语进行笔画拆分，获得笔画拆分结果；

根据预设的笔画与编码之间的对应关系，确定与所述笔画拆分结果对应的编码序列；

根据所述编码序列，构建所述目标词语的笔画元素集合，其中，所述笔画元素集合中的每个笔画元素由所述编码序列中的多个编码元素组成；

通过所述预设的词向量生成模型，对所述笔画元素集合中的每个笔画元素的初始笔画向量以及所述目标词语的初始词向量进行训练，获得所述目标词语的所述目标词向量。

在一种可选实现方式中，所述初始的生成对抗网络模型包括初始生成器以及初始判别器，将所述初始生成器作为当前生成器，将所述初始判别器作为当前判别器，模型获取模块23，用于：

执行循环迭代步骤：将所述当前生成器根据所述目标词语、以及所述目标词向量生成的伪造歌词作为假样本，将由所述目标词语构成的文本作为真样本，对所述当前判别器进行参数调整，获得参数调整后的判别器；将所述当前生成器生成的所述伪造歌词输入到所述参数调整后的判别器中进行判别，获得判别结果，并根据所述判别结果对所述当前生成器的参数进行调整，获得参数调整后的生成器；

将所述参数调整后的生成器作为所述当前生成器，将所述参数调整后的判别器作为所述当前判别器，重复执行所述循环迭代步骤直到迭代次数满足预设条件。

在一种可选实现方式中，歌词生成模块24，用于：

根据所述目标生成对抗网络模型，生成初始歌词文本；

根据预设词语和替换词语的对应关系，确定与所述初始歌词文本中的关键词语对应的目标替换词语，并将所述关键词语替换为所述目标替换词语，生成所述目标歌词文本，其中，在所述预设词语和替换词语的对应关系中，所述预设词语对应的替换词语为所述预设词语的近义词。

在一种可选实现方式中，所述预设词语和替换词语的对应关系根据以下方式获得：

获取预设词语样本集；

对所述预设词语样本集中的每个词语进行词向量训练，获得与所述每个词语对应的词向量；

针对所述预设词语样本集中的每个词语，分别计算该词语的词向量和其余所有词语的词向量之间的相似度，将相似度大于一阈值的词语作为该词语的替换词语。

关于上述装置，其中各个模块的具体功能已经在本发明实施例提供的歌词文本生成方法的实施例中进行了详细描述，此处将不做详细阐述说明。

第四方面，本说明书实施例提供一种歌词文本生成模型的训练装置，所述装置包括：

第五方面，基于与前述实施例中歌词文本生成方法以及歌词文本生成模型的训练方法同样的发明构思，本发明还提供一种服务器，如图4所示，包括存储器604、处理器602及存储在存储器604上并可在处理器602上运行的计算机程序，所述处理器602执行所述程序时实现前文所述的歌词文本生成方法以及歌词文本生成模型的训练方法的任一方法的步骤。

其中，在图4中，总线架构(用总线600来代表)，总线600可以包括任意数量的互联的总线和桥，总线600将包括由处理器602代表的一个或多个处理器和存储器604代表的存储器的各种电路链接在一起。总线600还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口606在总线600和接收器601和发送器603之间提供接口。接收器601和发送器603可以是同一个元件，即收发机，提供用于在传输介质上与各种其他装置通信的单元。处理器602负责管理总线600和通常的处理，而存储器604可以被用于存储处理器602在执行操作时所使用的数据。

第六方面，基于与前述实施例中基于歌词文本生成方法以及歌词文本生成模型的训练方法的发明构思，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前文所述基于歌词文本生成方法以及歌词文本生成模型的训练方法的任一方法的步骤。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品，该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种歌词文本生成方法，所述方法包括：

根据所述目标生成对抗网络模型，生成所述歌词属性的目标歌词文本。

2.根据权利要求1所述的方法，所述根据待生成歌词的歌词属性，收集与所述歌词属性对应的歌词文本，包括：

确定与所述歌词属性对应的歌曲标签；

3.根据权利要求1所述的方法，在所述根据待生成歌词的歌词属性，收集与所述歌词属性对应的歌词文本之后，所述方法还包括：

检测所述歌词文本中是否包含有非中文词语；

在所述歌词文本中包含有所述非中文词语时，将所述非中文词语翻译成中文词语；

所述通过预设的词向量生成模型，生成所述目标词语的目标词向量，包括：

4.根据权利要求1所述的方法，在所述根据待生成歌词的歌词属性，收集与所述歌词属性对应的歌词文本之后，所述方法还包括：

对所述歌词文本中包含的重复句子进行去重处理；

5.根据权利要求1所述的方法，所述通过预设的词向量生成模型，生成所述目标词语的目标词向量，包括：

将所述目标词语进行笔画拆分，获得笔画拆分结果；

6.根据权利要求1所述的方法，所述初始的生成对抗网络模型包括初始生成器以及初始判别器，将所述初始生成器作为当前生成器，将所述初始判别器作为当前判别器，所述将所述目标词向量、以及所述目标词语作为训练数据，对初始的生成对抗网络模型进行训练，获得目标生成对抗网络模型，包括：

7.根据权利要求1所述的方法，所述根据所述目标生成对抗网络模型，生成所述歌词属性的目标歌词文本，包括：

根据所述目标生成对抗网络模型，生成初始歌词文本；

8.根据权利要求7所述的方法，所述预设词语和替换词语的对应关系根据以下方式获得：

获取预设词语样本集；

9.一种歌词文本生成模型的训练方法，所述方法包括：

10.一种歌词文本生成装置，所述装置包括：

11.根据权利要求10所述的装置，所述收集模块，用于：

确定与所述歌词属性对应的歌曲标签；

12.根据权利要求10所述的装置，所述装置还包括：

所述词向量生成模块，用于：

13.根据权利要求10所述的装置，所述装置还包括：

所述词向量生成模块，用于：

14.根据权利要求10所述的装置，所述词向量生成模块，用于：

将所述目标词语进行笔画拆分，获得笔画拆分结果；

15.根据权利要求10所述的装置，所述初始的生成对抗网络模型包括初始生成器以及初始判别器，将所述初始生成器作为当前生成器，将所述初始判别器作为当前判别器，所述模型获取模块，用于：

16.根据权利要求10所述的装置，所述歌词生成模块，用于：

根据所述目标生成对抗网络模型，生成初始歌词文本；

17.根据权利要求16所述的装置，所述预设词语和替换词语的对应关系根据以下方式获得：

获取预设词语样本集；

18.一种歌词文本生成模型的训练装置，所述装置包括：

19.一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1-9任一项所述方法的步骤。

20.一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1-9任一项所述方法的步骤。