CN111476003A

CN111476003A - 歌词改写方法及装置

Info

Publication number: CN111476003A
Application number: CN202010171885.7A
Authority: CN
Inventors: 曹绍升; 杨轶斐
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-03-12
Filing date: 2020-03-12
Publication date: 2020-07-31
Anticipated expiration: 2040-03-12
Also published as: CN111476003B

Abstract

本说明书实施例公开了一种歌词改写方法及装置，对待改写的目标歌词文本中每句歌词，从该句歌词的句末词语开始，向前逐个选取词语进行改写，直至完成对该句歌词中句首词语的改写，得到改写后歌词文本。

Description

歌词改写方法及装置

技术领域

本说明书实施例涉及歌词处理技术，尤其涉及一种歌词改写方法及装置。

背景技术

歌词的创作需要创作者有一定的文学功底以及人生阅历，同时创作者的创作灵感也会在很大程度上影响歌词的创作。随着AI技术的不断发展，AI已经不断被应用到我们生活、工作的方方面面，比如，AI作词作曲功能就能够帮助音乐人(或爱好者)创造出更好的歌词或曲调。

发明内容

本说明书实施例提供一种歌词改写方法及装置，实现快速准确对实现对歌词等押韵文本进行自动改写。

第一方面，本说明书实施例提供一种歌词改写方法，包括：获取待改写的目标歌词文本，并针对所述目标歌词文本中每句歌词，从该句歌词的句末词语开始，向前逐个选取词语进行改写，直至完成对该句歌词中句首词语的改写，得到改写后歌词文本，其中，对该句歌词中除句末词语之外的每个词语进行改写，包括：确定出该句歌词中第i个词语的第一改写候选集，所述第一改写候选集包含一个以上候选词以及每个候选词的第一改写概率，i依次取N-1至1，N为该句歌词的词语数量；针对所述第一改写候选集中每个候选词，通过已训练的歌词语言模型确定所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；根据所述第一改写候选集中每个候选词的第一改写概率，以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第一改写候选集中确定出第一目标候选词，并将所述第i个词语改写为所述第一目标候选词。

第二方面，本说明书实施例提供一种歌词改写方法，包括：获取待改写的目标歌词文本，并针对所述目标歌词文本中每句歌词，从该句歌词的句首词语开始，向后逐个选取词语进行改写，直至完成对该句歌词中句末词语的改写，得到改写后歌词文本，其中，对该句歌词中除句末词语之外的每个词语进行改写，包括：确定出该句歌词中句首词语的第三改写候选集，所述第三改写候选集中包含一个以上候选词以及每个候选词的第一改写概率；根据所述第三改写候选集中每个候选词的第一改写概率，从所述第三改写候选集中确定出第三目标候选词，并将所述句首词语改写为所述第三目标候选词；确定出该句歌词中第i个词语的第四改写候选集，所述第四改写候选集中包含一个以上候选词以及每个候选词的第一改写概率，i依次取2至N-1，N为该句歌词的词语数量；针对所述第四改写候选集中每个候选词，通过已训练的歌词语言模型确定所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；根据所述第四改写候选集中每个候选词的第一改写概率和以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第四改写候选集中确定出第四目标候选词，将所述第i个词语改写为所述第四目标候选词。

第三方面，本说明书实施例提供一种歌词改写装置，包括：第一歌词获取单元，用于获取待改写的目标歌词文本；第一歌词改写单元，用于针对所述目标歌词文本中每句歌词，从该句歌词的句末词语开始，向前逐个选取词语进行改写，直至完成对该句歌词中句首词语的改写，得到改写后歌词文本，其中，所述第一歌词改写单元包括：第一改写子单元，用于针对所述目标歌词文本中每句歌词，对该句歌词中除句末词语之外的每个词语进行改写，包括：确定出该句歌词中第i个词语的第一改写候选集，所述第一改写候选集包含一个以上候选词以及每个候选词的第一改写概率，i依次取N-1至1，N为该句歌词的词语数量；针对所述第一改写候选集中每个候选词，通过已训练的歌词语言模型确定所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；根据所述第一改写候选集中每个候选词的第一改写概率以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第一改写候选集中确定出第一目标候选词，并将所述第i个词语改写为所述第一目标候选词。

第四方面，本说明书实施例提供一种歌词改写装置，包括：第二歌词获取单元，用于获取待改写的目标歌词文本；第二歌词改写单元，用于针对所述目标歌词文本中每句歌词，从该句歌词的句首词语开始，向后逐个选取词语进行改写，直至完成对该句歌词中句末词语的改写，得到改写后歌词文本，其中，所述第二歌词改写单元包括第三改写子单元，用于对该句歌词中除句末词语之外的每个词语进行改写，包括：确定出该句歌词中句首词语的第三改写候选集，所述第三改写候选集中包含一个以上候选词以及每个候选词的第一改写概率；根据所述第三改写候选集中每个候选词的第一改写概率，从所述第三改写候选集中确定出第三目标候选词，并将所述句首词语改写为所述第三目标候选词；确定出该句歌词中第i个词语的第四改写候选集，所述第四改写候选集中包含一个以上候选词以及每个候选词的第一改写概率，i依次取2至N-1，N为该句歌词的词语数量；针对所述第四改写候选集中每个候选词，通过已训练的歌词语言模型确定所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；根据所述第四改写候选集中每个候选词的第一改写概率，以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第四改写候选集中确定出第四目标候选词，将所述第i个词语改写为所述第四目标候选词。

第五方面，本说明书实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现第一方面或第二方面所述方法的步骤。

第六方面，本说明书实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面或第二方面所述方法的步骤。

本说明书实施例提供的一个或者多个技术方案，至少实现了如下技术效果或者优点：

对待改写的每句歌词进行逐个词语改写过程中，针对当前待改写词语的第一改写候选集中每个候选词，通过已训练的歌词语言模型确定该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；根据第一改写候选集中每个候选词的第一改写概率以及该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从第一改写候选集中确定出用于对当前待词语进行改写的第一目标候选词，由此实现了通过歌词语言模型打分对候选词的第一改写概率进行加权，不仅使得确定出的第一目标候选词是用于改写当前待改写词语的高频候选词，同时避免了改写后歌词中各词语是无语义关联的孤立词语，而是能够构成语义明确、通顺连贯的一句句歌词，进而提高了歌词改写质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本说明书实施例提供的歌词改写方法的流程图；

图2为本说明书实施例提供的歌词改写前后对照示例图；

图3为本说明书实施例提供的歌词改写装置的结构示意图；

图4为本说明书实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本说明书实施例中，术语“多个”表示“两个以上”，即包括两个或大于两个的情况；术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。

第一方面，本说明书实施例提供一种歌词改写方法，可以应用于任意一种在线音乐平台。参考图1所示，本说明书实施例提供的歌词改写方法，包括如下步骤：

S100、获取待改写的目标歌词文本。

在本说明书实施例中，待改写的目标歌词文本可以是用户输入的一句以上歌词或者导入的歌词文件，比如：可以在各类数码播放器中同步显示的LRC歌词文件，将用户输入的一句以上歌词或者导入的歌词文件，确定为待改写的目标歌词文本。

S102、针对目标歌词文本中每句歌词进行逐个词语改写，得到与目标歌词文本对应的改写后歌词文本。

在得到改写后歌词文本之后，向用户展示改写后歌词文本，或者每完成一句歌词的改写，就向用户展示该句歌词的改写后歌词。

在S102中，针对目标歌词文本中每句歌词，删除该句歌词中的非中文字符后，再进行中文分词，实现将该句歌词由汉字序列切分成由一个个词语构成的词语序列，对切分得到的词语序列进行逐个词语改写，根据改写顺序的不同，步骤S102可以有两种实施方式：

第一种实施方式：针对目标歌词文本中每句歌词，从该句歌词的句末词语开始，向前逐个选取词语进行改写，直至完成对该句歌词中句首词语的改写，得到与目标歌词文本对应的改写后歌词文本。

第二种实施方式是：针对目标歌词文本中每句歌词，从该句歌词的句首词语开始，向后逐个选取词语进行改写，直至完成对该句歌词中句末词语的改写，得到与目标歌词文本对应的改写后歌词文本。

下面，分别对第一种实施方式和第二种实施方式进行更为详细的描述，以充分理解这两种实施方式：

在第一种实施方式下，具体改写流程是：选取目标歌词文本中每句歌词，针对当前选取的该句歌词，先执行步骤1：对该句歌词中句末词语进行改写，再执行步骤2：依次对该句歌词的第i个词语进行改写，i依次取N-1至1，N为该句歌词的词语数量，得到针对该句歌词的一句改写后歌词。

具体来讲，步骤1对该句歌词中句末词语进行改写的具体实施流程包括如下步骤S1021～S1024：

步骤S1021：确定出该句歌词中句末词语的第二改写候选集，第二改写候选集包含一个以上候选词以及每个候选词的第一改写概率。

具体的，可以根据该句歌词中句末词语从一个以上改写候选集中查找到第二改写候选集。其中，每个改写候选集的形式可以是：改写目标词，用于改写目标词的一个以上候选词以及每个候选词的第一改写概率，第一改写概率越高的候选词，与改写目标词越匹配。候选词的第一改写概率表征了改写目标词与该候选词构成的改写词对在歌词文本集中出现的频率，而歌词文本集是生成一个以上改写候选集的源数据。因此，从一个以上改写候选集中确定出的第二改写候选集中，第一改写概率越高的候选词与该句歌词中句末词语(当前的改写目标词)越匹配。

举例来讲，某一改写候选集为：“爱恋|||秋天，30％；季节，35％；心弦，25％；一天，10％”，其中，符号“|||”之前的“爱恋”为改写目标词，符号“|||”之后的“秋天”、“季节”、“心弦”、“一天”均为用于改写“爱恋”的候选词，每个候选词后的数值表示该候选词的第一改写概率。如果该句歌词的句末词语是“爱恋”，则根据“爱恋”，可以从一个以上改写候选集中，查找到改写候选集：“爱恋|||秋天，30％；季节，35％；心弦，25％；一天，10％”。

当然，另一实施方式下，可以是根据查上一句改写后歌词中句末词语，从一个以上改写候选集中查找到用于对当前句歌词中句末词语进行改写的第二改写候选集，实现对于歌词的改写考虑了相邻两句歌词的关联。

执行步骤S1022：确定第二改写候选集中满足押韵条件的候选词。

具体的，根据汉字拼音转化关系，对第二改写候选集中每个候选词进行押韵判断，确定出第二改写候选集中每个满足押韵条件的候选词。在一可选的实施方式下，对每个候选词进行押韵判断具体是指：通过汉字拼音转化关系识别候选词的最后一个字与句末词语的最后一个字是否押韵(是否韵母相同)，押韵则满足押韵条件，不押韵，则表征不满足押韵条件，以实现对候选词的押韵判断。

在本说明书实施例中，汉字拼音转化关系可以是通过人工从纸质字典录入，也可以从网页中批量获取。

执行步骤S1023：根据预设的韵脚加权值，对第二改写候选集中每个满足押韵条件的候选词的第一改写概率进行韵脚加权计算，而第二改写候选集中不满足押韵条件的候选词的第一改写概率直接作为第二改写概率(第一改写概率值不变)，得到第二改写候选集中每个候选词的第二改写概率。

执行步骤S1024：根据第二改写候选集中每个候选词的第二改写概率，从第二改写候选集中确定出第二目标候选词，并将句末词语改写为第二目标候选词。

其中，韵脚加权值的具体数值大小可以根据实际需求预设设置，因此，在本说明书实施例中不进行具体限定。但是，预设的韵脚加权值越大，确定出的第二目标候选词就越倾向于与句末词语押韵。

具体的，从第二改写候选集中确定出第二改写概率最高的一个候选词，作为第二目标候选词，或者，针对第二改写候选集中每个候选词的第二改写概率进行归一化处理，以该候选词的归一化改写概率作为该候选词被选择为第二目标候选词的概率，从第二改写候选集中选择一个候选词作为第二目标候选词。

需要说明的是，只有每句歌词的句末词语需要考虑韵脚加权，每句歌词中其他位置的词语则不需要考虑韵脚。通过韵脚加权来调整候选词的第一改写概率，从而提高了改写后歌词文本中每句歌词的句末词语押韵可能性，从而，提高了改写后歌词质量。

具体来讲，步骤2中对该句歌词的第i个词语进行改写的具体实施流程包括如下步骤S1025～S1027：

S1025：确定出该句歌词中第i个词语的第一改写候选集，其中，第一改写候选集包含一个以上候选词以及每个候选词的第一改写概率，i依次取N-1至1，N为该句歌词的词语数量。

具体的，以第i个词语在一个以上改写候选集中进行查找，查找到以第i个词语为改写目标词的一个改写候选集，作为第一改写候选集，第一改写候选集中第一改写概率越高的候选词，与第i个词语越匹配。在具体实施过程中，确定出第一改写候选集的实施方式与前文确定出第二改写候选集的实施方式相同或相似，为了说明书的简洁，在此不再赘述。

S1026：针对第一改写候选集中每个候选词，通过已训练的歌词语言模型确定该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分。

在本说明书实施例中，候选词与该句歌词中改写后词语组成的词语序列，是：该候选词与该句歌词中第i+1至N个词语中每个词语的改写后词语组成的包含N-(i-1)个词语的词语序列。

具体来讲，候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，具体是该候选词与该句歌词中第i+1个词语至第N个词语中每个词语的改写后词语组成的词语序列的组合概率，该组合概率表征了词语序列的语言通顺程度以及语义明确程度。歌词语言模型打分越高，则表示该候选词与该句歌词改写后词语构成的词语序列更通顺、语义更明确。

在本说明书实施例中，已训练的歌词语言模型具体是预先通过如下步骤训练得到：从在线音乐平台获取歌词内容，或者从多种网络渠道获取一种类型以上的押韵文字内容，比如：诗词内容、歌词内容，散文内容等等押韵文字内容；删除获取的歌词内容或者押韵文字内容中的非中文字符删除后进行中文分词，得到歌词语言训练样本，基于歌词语言训练样本对初始的LM(Language Model,语言模型)进行训练，得到已训练的歌词语言模型。具体的，初始的语言模型可以是统计语言模型、N-gram语言模型、或者神经网络语言模型。

S1027：根据第一改写候选集中每个候选词的第一改写概率和所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从第一改写候选集中确定出第一目标候选词，并将第i个词语改写为第一目标候选词。

具体的，步骤S1027具体包括：针对第一改写候选集中每个候选词，根据该候选词的第一改写概率，以及该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，得到该候选词的第二改写概率；根据第一改写候选集中每个候选词的第二改写概率，从第一改写候选集中确定出第一目标候选词。

其中，第一改写候选集中每个候选词的第二改写概率可以通过如下两种方式得到：

方式一、针对第一改写候选集中每个候选词，将该候选词的第一改写概率，乘以该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，将乘积结果作为该候选词的第二改写概率。

方式二：针对第一改写候选集中每个候选词，将该候选词的第一改写概率，以及该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分进行加权和计算，将加权和结果作为该候选词的第二改写概率。

其中，根据第一改写候选集中每个候选词的第二改写概率，从第一改写候选集中确定第一目标候选词，可以有如下两种实施方式：

方式一：针对所述第一改写候选集中每个候选词，对所述候选词的第二改写概率进行归一化处理，并以所述候选词的归一化改写概率作为所述候选词被选择为第一目标候选词的概率，从所述第一改写候选集中选择一个候选词作为所述第一目标候选词。

归一化改写概率越高的候选词，被选择作为第一目标候选词的可能性越大，但是并不是绝对会被作为第一目标候选词，从而平衡了改写后歌词的多样性和合理性，使得歌词改写质量越高。

举例来讲，第一改写候选词中两个候选词：“他们仨”的第二改写概率为0.06，“一个人”的第二改写概率为0.36。进行归一化处理后，“他们仨”的第二改写概率为0.06/(0.06+0.36)＝6/42，“一个人”的第二改写概率为0.36/(0.06+0.36)＝36/42。会以6/42的概率选择“他们仨”作为第一目标候选词，以36/42的概率选择“一个人”作为第一目标候选词。

方式二：从第一改写候选集中确定出第二改写概率最高的一个候选词作为第一目标候选词。

通过上述各种确定第一目标候选词的方式均实现了结合第一改写概率和歌词语言模型打分来优选出用于改写第i个词语的第一目标候选词，从而保证了第i个词语的改写后词语与相邻词语的关联性，进而保证了改写后歌词句子的语言通顺、语义合理。

下面参考图2所示，以目标歌词文本中的一句歌词是“我们俩的爱恋”为例进行歌词改写的过程进行举例描述，改写过程包括如下步骤：

步骤1、对“我们俩的爱恋”进行中文分词得到歌词词语序列:我们俩||的||爱恋

步骤2、获取该歌词词语序列中的句末词语(倒数第一个词语)“爱恋”，并对句末词语“爱恋”进行改写：

以预设设定韵脚的加权值为20％为例，若句末词语是“爱恋”，则获取针对“爱恋”的改写候选集为“爱恋|||秋天，30％；季节，35％；心弦，25％；一天，10％”，根据识别出的韵脚“an”，判断出“秋天”、“心弦”、“一天”这三个候选词与“爱恋”押韵，“季节”这个候选词与“爱恋”不押韵。因此，根据预设的韵脚加权值，计算出每个候选词的第二改写概率为：“爱恋|||秋天，0.36；季节，0.35；心弦，0.30；一天，0.12”，因此，选择第二改写概率最高的候选词“秋天”。将“爱恋”改写为“秋天”。

步骤3、获取倒数第二个词语“的”，并对倒数第二个词语“的”进行改写：

获取用于改写该倒数第二个词语“的”的改写候选集为“的|||地，30％；得，30％；的，30％；你，10％”，该句歌词中句末词语的改写后词语是“秋天”，改写候选集中每个候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分为如下：(地|秋天)＝0.5，(得|秋天)＝0.1，(你|秋天)＝0.05，(的|秋天)＝0.6，其中，(的|秋天)＝0.6表示候选词“的”与“秋天”构成的词语序列“的秋天”的歌词语言模型打分是0.6，其他候选词与“秋天”组成的词语序列的歌词语言模型打分的含义类似。可以看出，词语序列“的秋天”的歌词语言模型打分最高，表征词语序列“的秋天”是“的秋天”、“地秋天”、“你秋天”、“得秋天”这四个词语序列中最通顺、语义最明确的词语序列。计算候选词“地”的第二改写概率为30％*0.5＝0.15，“得”的第二改写概率为30％*0.1＝0.03。候选词“你”的第二改写概率为30％*0.05＝0.015。候选词“的”的第二改写概率为30％*0.6＝0.18。其中，候选词“的”的第二改写概率最高，因此，确定出用于替换倒数第二个词语“的”的目标候选词是“的”，将倒数第二个词语“的”改写为“的”。

步骤4、获取倒数第三个词语“我们俩”，并对倒数第三个词语“我们俩”进行改写：

获取用于改写该倒数第三个词语“我们俩”的改写候选集为：“我们俩|||他们仨，60％；一个人，40％”，改写候选集中每个候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分为如下：(他们三|的秋天)＝0.1，(一个人|的秋天)＝0.9。可以看出，词语序列“一个人的秋天”的歌词语言模型打分最高，表征词语序列“一个人的秋天”是“他们仨的秋天”、“一个人的秋天”这两个词语序列中最通顺、语义最明确的词语序列。计算候选词“他们仨”的第二改写概率为60％*0.1＝0.06，“一个人”的第二改写概率为40％*0.9＝0.36。其中，候选词“一个人”的第二改写概率最高，因此，确定出用于替换倒数第三个词语“我们俩”的目标候选词是“一个人”。因此，将倒数第三个词语“我们俩”改写为“一个人”。

经过上述步骤1-4，将“我们俩的爱恋”这句歌词改写为新的一句歌词“一个人的秋天”。

在第二种实施方式下，对目标歌词文本进行改写的实施过程是：选取目标歌词文本中每句歌词，针对当前选取的该句歌词，先通过步骤1’对该句歌词中句首词语进行改写；再通过步骤2’依次对该句歌词中第i个词语进行改写，i依次取2至N-1，N为该句歌词的词语数量；最后，通过步骤3’对该句歌词中句末词语进行改写。

具体来讲，通过步骤1’对该句歌词中句首词语进行改写的实施流程，包括：确定出该句歌词中句首词语的第三改写候选集，其中，第三改写候选集中包含一个以上候选词以及每个候选词的第一改写概率；根据第三改写候选集中每个候选词的第一改写概率，从第三改写候选集中确定出第三目标候选词，并将句首词语改写为第三目标候选词。

由于在该实施方式下，句首词语是该句歌词中第一个被改写的词语，因此仅仅根据每个候选词的第一改写概率确定出用于改写句首词语的第三目标候选词，而不考虑歌词语言模型的打分。

具体来讲，通过步骤2’依次对该句歌词中除句末词语和句首词语之外的第i个词语进行改写的实施流程，具体包括如下步骤21’-23’：

步骤21’：确定出该句歌词中第i个词语的第四改写候选集，其中，第四改写候选集中包含一个以上候选词以及每个候选词的第一改写概率，i依次取2至N-1，N为该句歌词的词语数量；

步骤22’:针对第四改写候选集中每个候选词，通过已训练的歌词语言模型确定该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；

步骤23’:根据第四改写候选集中每个候选词的第一改写概率，以及候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从第四改写候选集中确定出第四目标候选词，将第i个词语改写为第四目标候选词。

具体来讲，通过步骤3’对目标歌词文本中每句歌词的句末词语进行改写的实施流程，具体包括如下步骤31’～步骤33’：

步骤31’：确定出该句歌词中句末词语的第五改写候选集，第五改写候选集包含一个以上候选词以及每个候选词的第一改写概率；

步骤32’：根据预设的韵脚加权值，对第五改写候选集中每个满足押韵条件的候选词的第一改写概率进行韵脚加权计算，得到第五改写候选集中每个候选词的第二改写概率；

步骤33’：针对第五改写候选集中每个候选词，通过已训练的歌词语言模型，确定出该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；

步骤34’：根据第五改写候选集中每个候选词的第二改写概率，该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从第五改写候选集中确定出第五目标候选词；将句末词语改写为第五目标候选词。

具体的，前文的第三改写候选集、第四改写候选集以及第五改写候选集，均从一个以上改写候选集中确定出，具体实施方式均与确定出第一改写候选集的实施方式相同或者相似，为了说明书的简洁，在此不再赘述。

在一可选的实施方式下，为了减小计算量，从一个以上改写候选集中，确定出针对第i个词语的原始改写候选集，原始改写候选集中包含一个以上候选词以及每个候选词的第一改写概率；根据第一改写概率的从高至低，从原始改写候选集中选择预设数量个候选词，作为第一改写候选集。确定第二改写候选集、第三改写候选集、第四改写候选集以及第五改写候选集的方式也可以通过相似方式确定出，为了说明书的简洁，在此不再赘述。

具体来讲，因为有些改写候选集中候选词可能会特别多，计算该改写候选集中每个候选词的第二改写概率会很耗时，在计算第二改写概率之前，先按照候选词的第一改写概率对原始候选集进行排序，保留TOP K(K是一个预先设定的超参数，正整数)，仅对保留的TOPK个候选词计算第二改写概率，这样就可以大幅度减少计算量。

在本说明书实施例中，一个以上改写候选集可以是通过如下步骤得到：获取歌词文本集，并对歌词文本集中每个歌词文本进行句对提取处理，得到歌词句对集，其中，歌词句对集中包含一个以上歌词句对，每个歌词句对包含相邻两句歌词；通过对歌词句对集中每个歌词句对进行词对提取处理，生成K组候选词，每组候选词中包含一个以上候选词，K为正整数；确定K组候选词中每个候选词的第一改写概率；根据K组候选词，以及K组候选词中每个候选词的第一改写概率，生成K组候选词对应的K个原始改写候选集，其中，每个原始改写候选集包含对应同一改写目标词的一个以上候选词以及原始改写候选集中每个候选词的第一改写概率。

在第二种实施方式下更多的实施细节可以参考第一中实施方式下的描述，为了说明书的简洁，在此不再赘述。

基于同一发明构思，本说明书实施例提供一种歌词改写装置，参考图3所示，包括：

第一歌词获取单元201，用于获取待改写的目标歌词文本；

第一歌词改写单元202，用于针对目标歌词文本中每句歌词，从该句歌词的句末词语开始，向前逐个选取词语进行改写，直至完成对该句歌词中句首词语的改写，得到改写后歌词文本，其中，第一歌词改写单元202包括：第一改写子单元2021，用于对该句歌词中除句末词语之外的每个词语进行改写，包括：

确定出该句歌词中第i个词语的第一改写候选集，第一改写候选集包含一个以上候选词以及每个候选词的第一改写概率，i依次取N-1至1，N为该句歌词的词语数量；

针对第一改写候选集中每个候选词，通过已训练的歌词语言模型确定候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；

根据第一改写候选集中每个候选词的第一改写概率，以及候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从第一改写候选集中确定出第一目标候选词，并将第i个词语改写为第一目标候选词。

在一可选的实施方式下，第一歌词改写单元202，还包括：第二改写子单元2022，用于对目标歌词文本中每句歌词的句末词语进行改写，包括：

确定出该句歌词中句末词语的第二改写候选集，第二改写候选集包含一个以上候选词以及每个候选词的第一改写概率；

确定第二改写候选集中满足押韵条件的候选词；

根据预设的韵脚加权值，对第二改写候选集中每个满足押韵条件的候选词的第一改写概率进行韵脚加权计算，得到第二改写候选集中每个候选词的第二改写概率；

根据第二改写候选集中每个候选词的第二改写概率，从第二改写候选集中确定出第二目标候选词，并将句末词语改写为第二目标候选词。

在一可选的实施方式下，第二改写子单元2022，具体用于：

根据汉字拼音转化关系，对第二改写候选集中每个候选词进行押韵判断，确定出第二改写候选集中满足押韵条件的候选词。

在一可选的实施方式下，第一改写子单元2021，具体用于：

针对第一改写候选集中每个候选词，将该候选词的第一改写概率，以及该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分进行加权和计算，将加权和结果作为该候选词的第二改写概率，或者

针对第一改写候选集中每个候选词，将该候选词的第一改写概率乘以该候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，将乘积结果作为该候选词的第二改写概率；

根据第一改写候选集中每个候选词的第二改写概率，从第一改写候选集中确定出第一目标候选词。

在一可选的实施方式下，第一改写子单元2021，具体用于：

从所述第一改写候选集中确定出第二改写概率最高的一个候选词作为所述第一目标候选词，或者

针对所述第一改写候选集中每个候选词，对所述候选词的第二改写概率进行归一化处理，并以所述候选词的归一化改写概率作为所述候选词被选择为第一目标候选词的概率，从所述第一改写候选集中选择一个候选词作为所述第一目标候选词。

在一可选的实施方式下，第一改写子单元2021，具体用于：

从一个以上改写候选集中，确定出针对第i个词语的原始改写候选集，原始改写候选集中包含一个以上候选词以及每个候选词的第一改写概率；

根据第一改写概率的从高至低，从原始改写候选集中选择预设数量个候选词，作为第一改写候选集。

在一可选的实施方式，装置还包括改写候选集生成单元，用于：

获取歌词文本集，并对歌词文本集中每个歌词文本进行句对提取处理，得到歌词句对集，其中，歌词句对集中包含一个以上歌词句对，每个歌词句对包含相邻两句歌词；

通过对歌词句对集中每个歌词句对进行词对提取处理，生成K组候选词，每组候选词中包含一个以上候选词，K为正整数；

确定K组候选词中每个候选词的第一改写概率；

根据K组候选词，以及K组候选词中每个候选词的第一改写概率，生成K组候选词对应的K个原始改写候选集，其中，每个原始改写候选集包含对应同一改写目标词的多个候选词以及原始改写候选集中每个候选词的第一改写概率。

基于同一发明构思，本说明书实施例提供一种歌词改写装置，包括：

第二歌词获取单元，用于获取待改写的目标歌词文本；

第二歌词改写单元，用于针对目标歌词文本中每句歌词，从该句歌词的句首词语开始，向后逐个选取词语进行改写，直至完成对该句歌词中句末词语的改写，得到改写后歌词文本，其中，第二歌词改写单元包括第三改写子单元，用于对该句歌词中除句末词语之外的每个词语进行改写，包括：

确定出该句歌词中句首词语的第三改写候选集，第三改写候选集中包含一个以上候选词以及每个候选词的第一改写概率；

根据第三改写候选集中每个候选词的第一改写概率，从第三改写候选集中确定出第三目标候选词，并将句首词语改写为第三目标候选词；

确定出该句歌词中第i个词语的第四改写候选集，第四改写候选集中包含一个以上候选词以及每个候选词的第一改写概率，i依次取2至N-1，N为该句歌词的词语数量；

针对第四改写候选集中每个候选词，通过已训练的歌词语言模型确定候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；

根据第四改写候选集中每个候选词的第一改写概率，以及候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从第四改写候选集中确定出第四目标候选词，将第i个词语改写为第四目标候选词。

在一可选的实施方式下，第二歌词改写单元包括第四改写子单元，用于针对目标歌词文本中每句歌词的句末词语进行改写，包括：

确定出该句歌词中句末词语的第五改写候选集，第五改写候选集包含一个以上候选词以及每个候选词的第一改写概率；

根据预设的韵脚加权值，对第五改写候选集中每个满足押韵条件的候选词的第一改写概率进行韵脚加权计算，得到第五改写候选集中每个候选词的第二改写概率；

针对第五改写候选集中每个候选词，通过已训练的歌词语言模型，确定候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；

根据第五改写候选集中每个候选词的第二改写概率，以及候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从第五改写候选集中确定出第五目标候选词；

将句末词语改写为第五目标候选词。

上述各装置，其中各个模块的具体功能已经在本说明书实施例提供的对应歌词改写方法实施例中进行了详细描述，此处将不做详细阐述说明。

基于与前述歌词改写方法同样的发明构思，本说明书实施例还提供一种电子设备，如图4所示，包括存储器304、处理器302及存储在存储器304上并可在处理器302上运行的计算机程序，处理器302执行程序实现前述歌词改写方法中任一实施方式下的步骤。

其中，在图4中，总线架构(用总线300来代表)，总线300可以包括任意数量的互联的总线和桥，总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件，即收发机，提供用于在传输介质上与各种其他装置通信的单元。处理器302负责管理总线300和通常的处理，而存储器304可以被用于存储处理器302在执行操作时所使用的数据。

基于与前述实施例中歌词改写方法的同一发明构思，本说明书实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前文歌词改写方法中任一实施方式下的步骤。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品，该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本说明书的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。

显然，本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样，倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内，则本说明书也意图包含这些改动和变型在内。

Claims

1.一种歌词改写方法，包括：

获取待改写的目标歌词文本，并针对所述目标歌词文本中每句歌词，从该句歌词的句末词语开始，向前逐个选取词语进行改写，直至完成对该句歌词中句首词语的改写，得到改写后歌词文本，其中，对该句歌词中除句末词语之外的每个词语进行改写，包括：

确定出该句歌词中第i个词语的第一改写候选集，所述第一改写候选集包含一个以上候选词以及每个候选词的第一改写概率，i依次取N-1至1，N为该句歌词的词语数量；

针对所述第一改写候选集中每个候选词，通过已训练的歌词语言模型确定所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；

根据所述第一改写候选集中每个候选词的第一改写概率，以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第一改写候选集中确定出第一目标候选词，并将所述第i个词语改写为所述第一目标候选词。

2.如权利要求1所述的方法，对所述目标歌词文本中每句歌词的句末词语进行改写，包括：

确定出该句歌词中句末词语的第二改写候选集，所述第二改写候选集包含一个以上候选词以及每个候选词的第一改写概率；

确定所述第二改写候选集中满足押韵条件的候选词；

根据预设的韵脚加权值，对所述第二改写候选集中每个满足押韵条件的候选词的第一改写概率进行韵脚加权计算，得到所述第二改写候选集中每个候选词的第二改写概率；

根据所述第二改写候选集中每个候选词的第二改写概率，从所述第二改写候选集中确定出第二目标候选词，并将所述句末词语改写为所述第二目标候选词。

3.如权利要求2所述的方法，所述确定所述第二改写候选集中满足押韵条件的候选词，包括：

根据汉字拼音转化关系，对所述第二改写候选集中每个候选词进行押韵判断，确定出所述第二改写候选集中满足押韵条件的候选词。

4.如权利要求1所述的方法，所述根据所述第一改写候选集中每个候选词的第一改写概率，以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第一改写候选集中确定出第一目标候选词，包括：

针对所述第一改写候选集中每个候选词，将所述候选词的第一改写概率，以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分进行加权和计算，将加权和结果作为所述候选词的第二改写概率，或者

针对所述第一改写候选集中每个候选词，将所述候选词的第一改写概率乘以所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，将乘积结果作为所述候选词的第二改写概率；

根据所述第一改写候选集中每个候选词的第二改写概率，从所述第一改写候选集中确定出所述第一目标候选词。

5.如权利要求4所述的方法，所述根据所述第一改写候选集中每个候选词的第二改写概率，从所述第一改写候选集中确定出所述第一目标候选词，包括：

6.如权利要求1所述的方法，所述确定出该句歌词中第i个词语的第一改写候选集，包括：

从一个以上改写候选集中，确定出针对所述第i个词语的原始改写候选集，所述原始改写候选集中包含一个以上候选词以及每个候选词的第一改写概率；

根据第一改写概率的从高至低，从所述原始改写候选集中选择预设数量个候选词，作为所述第一改写候选集。

7.如权利要求1-6中任一所述的方法，所述一个以上改写候选集通过如下步骤获得：

获取歌词文本集，并对所述歌词文本集中每个歌词文本进行句对提取处理，得到歌词句对集，其中，所述歌词句对集中包含一个以上歌词句对，每个所述歌词句对包含相邻两句歌词；

通过对所述歌词句对集中每个歌词句对进行词对提取处理，生成K组候选词，每组候选词中包含一个以上候选词，K为正整数；

确定所述K组候选词中每个候选词的第一改写概率；

根据所述K组候选词，以及所述K组候选词中每个候选词的第一改写概率，生成所述K组候选词对应的K个原始改写候选集，其中，每个所述原始改写候选集包含对应同一改写目标词的一个以上候选词以及所述原始改写候选集中每个候选词的第一改写概率。

8.一种歌词改写方法，包括：

获取待改写的目标歌词文本，并针对所述目标歌词文本中每句歌词，从该句歌词的句首词语开始，向后逐个选取词语进行改写，直至完成对该句歌词中句末词语的改写，得到改写后歌词文本，其中，对该句歌词中除句末词语之外的每个词语进行改写，包括：

确定出该句歌词中句首词语的第三改写候选集，所述第三改写候选集中包含一个以上候选词以及每个候选词的第一改写概率；

根据所述第三改写候选集中每个候选词的第一改写概率，从所述第三改写候选集中确定出第三目标候选词，并将所述句首词语改写为所述第三目标候选词；

确定出该句歌词中第i个词语的第四改写候选集，所述第四改写候选集中包含一个以上候选词以及每个候选词的第一改写概率，i依次取2至N-1，N为该句歌词的词语数量；

针对所述第四改写候选集中每个候选词，通过已训练的歌词语言模型确定所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；

根据所述第四改写候选集中每个候选词的第一改写概率，以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第四改写候选集中确定出第四目标候选词，将所述第i个词语改写为所述第四目标候选词。

9.如权利要求8所述的方法，针对所述目标歌词文本中每句歌词的句末词语进行改写，包括：

确定出该句歌词中句末词语的第五改写候选集，所述第五改写候选集包含一个以上候选词以及每个候选词的第一改写概率；

根据预设的韵脚加权值，对所述第五改写候选集中每个满足押韵条件的候选词的第一改写概率进行韵脚加权计算，得到所述第五改写候选集中每个候选词的第二改写概率；

针对所述第五改写候选集中每个候选词，通过所述已训练的歌词语言模型，确定所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分；

根据所述第五改写候选集中每个候选词的第一改写概率以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第五改写候选集中确定出第五目标候选词；

将所述句末词语改写为所述第五目标候选词。

10.一种歌词改写装置，包括：

第一歌词获取单元，用于获取待改写的目标歌词文本；

第一歌词改写单元，用于针对所述目标歌词文本中每句歌词，从该句歌词的句末词语开始，向前逐个选取词语进行改写，直至完成对该句歌词中句首词语的改写，得到改写后歌词文本，其中，所述第一歌词改写单元包括：第一改写子单元，用于对该句歌词中除句末词语之外的每个词语进行改写，包括：

11.如权利要求10所述的装置，所述第一歌词改写单元，还包括：第二改写子单元，用于对所述目标歌词文本中每句歌词的句末词语进行改写，包括：

确定所述第二改写候选集中满足押韵条件的候选词；

12.如权利要求11所述的装置，所述第二改写子单元，具体用于：

13.如权利要求10所述的装置，所述第一改写子单元，具体用于：

14.如权利要求13所述的装置，所述第一改写子单元，具体用于：

15.如权利要求10所述的装置，所述第一改写子单元，具体用于：

16.如权利要求10-15中任一所述的装置，还包括改写候选集生成单元，用于：

确定所述K组候选词中每个候选词的第一改写概率；

根据所述K组候选词，以及所述K组候选词中每个候选词的第一改写概率，生成所述K组候选词对应的K个原始改写候选集，其中，每个所述原始改写候选集包含对应同一改写目标词的多个候选词以及所述原始改写候选集中每个候选词的第一改写概率。

17.一种歌词改写装置，包括：

第二歌词获取单元，用于获取待改写的目标歌词文本；

第二歌词改写单元，用于针对所述目标歌词文本中每句歌词，从该句歌词的句首词语开始，向后逐个选取词语进行改写，直至完成对该句歌词中句末词语的改写，得到改写后歌词文本，其中，所述第二歌词改写单元包括第三改写子单元，用于对该句歌词中除句末词语之外的每个词语进行改写，包括：

确定出该句歌词中第i个词语的第四改写候选集，所述第四改写候选集中包含一个以上候选词以及每个候选词的改写概率，i依次取2至N-1，N为该句歌词的词语数量；

18.如权利要求16所述的装置，所述第二歌词改写单元包括第四改写子单元，用于针对所述目标歌词文本中每句歌词的句末词语进行改写，包括：

根据所述第五改写候选集中每个候选词的第二改写概率，以及所述候选词与该句歌词中改写后词语组成的词语序列的歌词语言模型打分，从所述第五改写候选集中确定出第五目标候选词；

将所述句末词语改写为所述第五目标候选词。

19.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1-9中任一所述方法的步骤。

20.一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1-9中任一所述方法的步骤。