CN111241829B - 一种基于神经网络的智能歌词修改方法及辅助系统 - Google Patents

一种基于神经网络的智能歌词修改方法及辅助系统 Download PDF

Info

Publication number
CN111241829B
CN111241829B CN202010036493.XA CN202010036493A CN111241829B CN 111241829 B CN111241829 B CN 111241829B CN 202010036493 A CN202010036493 A CN 202010036493A CN 111241829 B CN111241829 B CN 111241829B
Authority
CN
China
Prior art keywords
lyric
lyrics
prediction model
character
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010036493.XA
Other languages
English (en)
Other versions
CN111241829A (zh
Inventor
尹学渊
祁松茂
江天宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Potential Artificial Intelligence Technology Co ltd
Original Assignee
Chengdu Potential Artificial Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Potential Artificial Intelligence Technology Co ltd filed Critical Chengdu Potential Artificial Intelligence Technology Co ltd
Priority to CN202010036493.XA priority Critical patent/CN111241829B/zh
Publication of CN111241829A publication Critical patent/CN111241829A/zh
Application granted granted Critical
Publication of CN111241829B publication Critical patent/CN111241829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于神经网络的智能歌词修改方法及辅助系统,该系统应用该方法,方法包括歌词预测模型训练,采用处理好的歌词训练数据输入基本训练模型进行训练,得到歌词预测模型;获取待修改歌词及歌词修改限定信息;应用字符映射表将待修改歌词转换为预测模型的输入数据,待修改歌词中的欲替换词采用能区分的标识字符标识;将输入数据输入歌词预测模型进行预测,获取第一个标识字符对应的替换字的概率分布向量;根据歌词修改限定信息限定的歌词修改模式执行修改操作;输出替换候选歌词。能够将完整的或者半成品的歌词中指定的需要替换的词进行优选替换,对指定的韵脚和需要押韵的句子生成一系列候选押韵词,对整段歌词指定段进行仿写。

Description

一种基于神经网络的智能歌词修改方法及辅助系统
技术领域
本发明属于歌词创作方法技术领域,具体地说,涉及一种基于神经网络的智能歌词修改方法及辅助系统。
背景技术
音乐在人们的生活中发挥着不可替代的作用,不同的音乐能够带给人不同的体验,舒缓的音乐有助于睡眠,快节奏的音乐能够让人兴奋等等。音乐的组成包括乐曲和歌词。在进行音乐创作过程中往往采用的是根据乐曲填词或者根据歌词谱曲。随着网络的发展,经典乐曲重新填词重新演绎赋予乐曲新的含义在网络上也蓬勃发展。但是无论是创作全新的乐曲歌词还是旧曲作词,旧词谱曲都需要创作人员具有一定的音乐基础,以达到创作的音乐能带给人较好的体验。
申请号为201710939775.9的发明专利一种押韵歌词的生成方法和装置提供了一种押韵歌词的生成方法,包括:对终端中已输入的多张图像分别进行场景识别,生成分别匹配于所述多张图像对应的场景的描述文字;从所述每张图像对应的场景匹配出的描述文字中获取所述描述文字中最后一个词所对应的汉语拼音和韵脚;根据所述描述文字中最后一个词所对应的汉语拼音和韵脚生成对应于所述多张图像的押韵歌词,其中,每张图像对应的押韵歌词与该图像对应场景匹配出的描述文字的最后一个词具有相同的韵脚。
该方案中生成押韵歌词的方式为仅根据描述文字中最后一个词所对应的汉语拼音和韵脚生成对应于所述多张图像的押韵歌词,没有结合前后文和上下文进行处理,也没有提供押韵词的候选词;仅对押韵歌词进行生成,对其他不是一个词的连续字符的生成效果较差。
发明内容
针对现有技术中上述的不足,本发明提供一种基于神经网络的智能歌词修改方法及辅助系统,该方法能够将完整的或者半成品的歌词中指定的需要替换的词进行优选替换,对指定的韵脚和需要押韵的句子生成一系列候选押韵词,对整段歌词指定段进行仿写,降低音乐创作对创作人的音乐基础需求,降低创作人重复结构写作的难度,该系统应用该方法,用户操作简单,创作速度快。
为了达到上述目的,本发明采用的解决方案是:一种基于神经网络的智能歌词修改方法,包括如下步骤:
S1:歌词预测模型训练,采用处理好的歌词训练数据输入基本训练模型进行训练,得到歌词预测模型;
S2:获取待修改歌词及歌词修改限定信息;
S3:应用字符映射表将待修改歌词转换为预测模型的输入数据,待修改歌词中的欲替换词采用能区分的标识字符标识;
S4:将输入数据输入歌词预测模型进行预测,获取第一个标识字符对应的替换字的概率分布向量;
S5:根据歌词修改限定信息限定的歌词修改模式执行修改操作;歌词修改模式包括替换词推荐模式、押韵词推荐模式和段落仿写模式;
所述的替换词推荐模式包括:S511:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S512:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4-S511,得到第二个标识字符的n2个数字编码;S513:重复步骤S512,直至预测模型输入数据中不存在标识字符,得到n1*n2*...*nm个候选词,m为标识字符的数量,n1、n2、...nm为每个标识字符提取的数字编码的数量;所述的押韵词推荐模式包括:S521:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S522:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S521,得到第二个标识字符的替换词的数字编码;S523:重复步骤S522,直至预测模型输入数据中不存在标识字符,得到多个替换词,然后筛选出符合押韵规则的押韵替换词;
所述的段落仿写模式包括整段仿写模式和分词整段仿写模式;
整段仿写模式包括:S5311:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n个字符的数字编码;S5312:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S5311,得到第二个标识字符的数字编码,取概率最大的字符的数字编码;S5313:重复步骤S5312,直至预测模型输入数据中不存在标识字符,得到n个候选段落;
分词整段仿写模式还包括分词步骤:将段落中的句进行分词,应用字符映射表将分词后的段落转换为预测模型的输入数据,待修改歌词中的分词后的第一个欲替换词采用能区分的标识字符标识;S5321:将输入数据输入歌词预测模型进行预测,获取第一个标识字符对应的替换字的概率分布向量;S5321:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S5322:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S5321,得到第二个标识字符的n2个数字编码;S5323:重复步骤S5322,直至预测模型输入数据中不存在标识字符,n1*n2*...*nm个候选词;S5324:从候选词中选择n个替换词,依次使用替换词替换段落中的第一个欲替换词,将替换后的段落转换为预测模型的输入数据,待修改歌词中的分词后的第二个欲替换词采用能区分的标识字符标识;S5325:重复S4和S5321-S5324,直至段落中不存在未替换的分词,得到多个候选段落;
S6:输出替换候选歌词。
所述的歌词修改限定信息包括欲替换词在待修改歌词中的位置、押韵韵脚、歌词段落的范围以及具体的歌词修改模式。
所述的基本训练模型为能够根据上下文预测某位置的字符的模型。
所述的替换词推荐模式还包括概率过滤步骤:根据第一个标识字符对应位置的概率分布向量进行概率过滤,概率过滤的方式包括两种可选方案,第一种可选方案为:基于概率值的绝对大小选取一个阈值,筛选保留概率值绝对值大于阈值的对应字符结果;第二种可选方案为:基于每个字符的概率与前几个字符的概率均值的比值作为阈值,筛选保留比值大于阈值的对应字符结果。
所述的段落仿写模式还包括无具体意义词的候选跳过步骤:在获取歌词修改限定信息时限定无具体意义词不修改。
应用所述的基于神经网络的智能歌词修改方法的辅助系统,包括预测模型训练模块、待预测歌词数据预处理模块、待修改歌词录入模块、限定信息设置模块、替换候选歌词推荐模块和歌词预测模块;
所述的待预测歌词数据预处理模块应用字符映射表将待修改歌词转换为预测模型的输入数据,待修改歌词中的欲替换词采用能区分的标识字符标识;
所述的预测模型训练模块采用处理好的歌词训练数据输入基本训练模型进行训练,得到歌词预测模型;
所述的待修改歌词录入模块用于用户录入待修改的歌词;
所述的限定信息设置模块用于用户设置歌词修改限定信息;
所述的替换候选歌词推荐模块用于展示歌词预测模块预测得到的候选歌词;
所述的歌词预测模块采用歌词预测模型根据限定信息和歌词信息预测候选歌词。
本发明的有益效果是:
(1)该方法能够将完整的或者半成品的歌词中指定的需要替换的词进行优选替换,对指定的韵脚和需要押韵的句子生成一系列候选押韵词,对整段歌词指定段进行仿写,降低音乐创作对创作人的音乐基础需求,降低创作人重复结构写作的难度,有效提高歌词创作的质量,该系统应用该方法,用户操作简单,创作速度快。
附图说明
图1为本发明智能歌词修改方法流程图;
图2为本发明智能歌词修改辅助系统框图;
图3为数据预处理流程图。
具体实施方式
以下结合附图对本发明作进一步描述:
如图1所示,一种基于神经网络的智能歌词修改方法,包括如下步骤:
S1:歌词预测模型训练,采用处理好的歌词训练数据输入基本训练模型进行训练,得到歌词预测模型,基本训练模型采用能够根据上下文预测某位置的字符的模型;
S2:获取待修改歌词及歌词修改限定信息,歌词修改限定信息包括欲替换词在待修改歌词中的位置、押韵韵脚、歌词段落的范围以及具体的歌词修改模式;
S3:应用字符映射表将待修改歌词转换为预测模型的输入数据,待修改歌词中的欲替换词采用能区分的标识字符标识;
S4:将输入数据输入歌词预测模型进行预测,获取第一个标识字符对应的替换字的概率分布向量;
S5:根据歌词修改限定信息限定的歌词修改模式执行修改操作;歌词修改模式包括替换词推荐模式、押韵词推荐模式和段落仿写模式;
所述的替换词推荐模式包括:S511:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S512:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4-S511,得到第二个标识字符的n2个数字编码;S513:重复步骤S512,直至预测模型输入数据中不存在标识字符,得到n1*n2*...*nm个候选词,m为标识字符的数量,n1、n2、...nm为每个标识字符提取的数字编码的数量;所述的押韵词推荐模式包括:S521:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S522:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S521,得到第二个标识字符的替换词的数字编码;S523:重复步骤S522,直至预测模型输入数据中不存在标识字符,得到多个替换词,然后筛选出符合押韵规则的押韵替换词;
所述的段落仿写模式包括整段仿写模式和分词整段仿写模式;
整段仿写模式包括:S5311:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n个字符的数字编码;S5312:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S5311,得到第二个标识字符的数字编码,取概率最大的字符的数字编码;S5313:重复步骤S5312,直至预测模型输入数据中不存在标识字符,得到n个候选段落;
分词整段仿写模式还包括分词步骤:将段落中的句进行分词,应用字符映射表将分词后的段落转换为预测模型的输入数据,待修改歌词中的分词后的第一个欲替换词采用能区分的标识字符标识;S5321:将输入数据输入歌词预测模型进行预测,获取第一个标识字符对应的替换字的概率分布向量;S5321:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S5322:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S5321,得到第二个标识字符的n2个数字编码;S5323:重复步骤S5322,直至预测模型输入数据中不存在标识字符,n1*n2*...*nm个候选词;S5324:从候选词中选择n个替换词,依次使用替换词替换段落中的第一个欲替换词,将替换后的段落转换为预测模型的输入数据,待修改歌词中的分词后的第二个欲替换词采用能区分的标识字符标识;S5325:重复S4和S5321-S5324,直至段落中不存在未替换的分词,得到多个候选段落;
S6:输出替换候选歌词。
所述的替换词推荐模式还包括概率过滤步骤:根据第一个标识字符对应位置的概率分布向量进行概率过滤,概率过滤的方式包括两种可选方案,第一种可选方案为:基于概率值的绝对大小选取一个阈值,筛选保留概率值绝对值大于阈值的对应字符结果;第二种可选方案为:基于每个字符的概率与前几个字符的概率均值的比值作为阈值,筛选保留比值大于阈值的对应字符结果。
如图2所示,应用所述的基于神经网络的智能歌词修改方法的辅助系统,包括预测模型训练模块、待预测歌词数据预处理模块、待修改歌词录入模块、限定信息设置模块、替换候选歌词推荐模块和歌词预测模块;
所述的待预测歌词数据预处理模块应用字符映射表将待修改歌词转换为预测模型的输入数据,待修改歌词中的欲替换词采用能区分的标识字符标识;
所述的预测模型训练模块采用处理好的歌词训练数据输入基本训练模型进行训练,得到歌词预测模型;
所述的待修改歌词录入模块用于用户录入待修改的歌词;
所述的限定信息设置模块用于用户设置歌词修改限定信息;
所述的替换候选歌词推荐模块用于展示歌词预测模块预测得到的候选歌词;
所述的歌词预测模块采用歌词预测模型根据限定信息和歌词信息预测候选歌词。
在本发明的一个实施例中,基本训练模型采用bert模型,欲替换词采用掩码字符标识,bert模型能根据上下文预测某位置字符的或者仅利用上文预测后续字符,即可以实现保持原来语句结构的前提下推荐一些替代候选词,模型中的注意力机制可以使推荐词与歌词主题密切相关,在保证段落和句子结构不变的条件下生成结构相仿的段落推荐。
歌词预测模型训练时,首先进行歌词训练数据预处理,数据预处理过程如图3所示:
a.歌词文本(无需分类)数据去除敏感词、重复句、重复字构成的句子及非中文字符和非歌词内容语句,保留必要的标点符号;
b.将过滤后的歌词文本转换为能在解析时同时区分不同的句和不同歌词的格式。例如:每行一句,不同歌词用空行隔开。
c.将文本数据分为训练集文本和验证集文本。
d.据使用的字符集,构建一个字符映射表(字符映射到整数编号)。为减少字符集映射表的大小,可以对英文单词的字符的表示做一定的信息压缩,例如采用字节对编码(BPE)对数据进行压缩。
e.将训练数文本和验证文本编码为数字格式,并根据batchsize的大小将其转换为TFRecord等便于在硬盘进行序列化读取的格式分别保存下来(训练集和验证集各对应一个文件)。
(a)训练数据包含了输入数据,和正确输出数据,输入数据为编码后的一段文本序列,用一种掩码字符(也需转为数字表示)随机替换一部分输入序列的字符,并记录被替换字符的位置信息和被替换的字符表示,用来作为输出信息指导模型训练。
(b)多任务训练可以有效提升模型的泛化性能及加速训练速度。若采用多任务训练的方式,可以在输入序列中加入特定的任务标识符,对应的输出信息也可以根据具体任务添加和改动。如:判断是否为上下文的任务。
训练过程直接使用bert模型公开的训练超参数,对于多任务训练,每个任务的loss一般可以直接相加作为总loss。训练数据处理完成后,读入用中文维基百科,新闻等预料训练的预训练的bert中文模型,然后在歌词数据上执行训练过程,通过正确预测训练数文本中的输入数据对应的输出结果,不断调整网络的连接权重,直到(总)loss不再明显下降,则为收敛。导出模型作为歌词预测模型,供预测使用。
将训练集输入bert模型进行训练后会输出一个和字符映射表相同长度的概率分布向量,代表了字符映射表中的每个字符是当前上下文对应的下一个字符的概率。取概率按从大到小顺序的前n个字符作为候选字符。
循环的利用每次预测单个字的输出进行组合,得到词、句、段的候选。
Bert的输入为三个向量。字向量,文本向量,位置向量(不需要用户输入,自动计算得出)。向量长度为128(亦可为256等较大的值)
字向量:原始的数组每个元素为一个汉字,除此之外还有三个其他的符号,位于向量首位的[CLS],位于向量中部和末尾的[SEP](中部的符号位置可以是随机的,也可以是固定的,但一般置于一句话之后,即该符号不能置于一个句子的中部)。除此之外,掩码字符[MASK]用来替换限定信息指定的位置的字符([CLS],[SEP],[MASK]字符可被替换为任意的能区分的标识)。再将该字符表示的数组参照对应字符映射表转换为数字索引表示的向量,即为字向量。
文本向量:该向量用来区分不同的段,主要作用于文本分类任务。对于本任务而言,随机的或固定的将歌词分为A,B两段后,对于A段的每个字符位置(包括控制符,即第一个[SEP]符号本身及之前的字符位置)用数字0表示,B段用1来表示(即第一个[SEP]符号之后的所有字符位置)。
位置向量:依据相对编码的正余弦公式计算得到,为公开的标准操作。
训练获得歌词预测模型后需要获取待修改的歌词及歌词修改限定信息,待修改的歌词可以是一整段,也可以是一句。歌词修改限定信息包括欲替换词在待修改歌词中的位置、押韵韵脚、歌词段落的范围以及具体的歌词修改模式,欲替换词的位置可以是任何位置,也可以是不属于一个词的连续字符。押韵处理的句子可以是单押、双押甚至是多押,押韵替换词一般限定为句末对应的几个字。具体的歌词修改模式包括替换词推荐模式、押韵词推荐模式和段落仿写模式。
在本发明的一个实施例中,用户选择的歌词修改模式为替换词推荐模式。在替换词推荐模式下,系统获取待修改的歌词后,应用字符映射表将其转换为预测模型的输入数据,欲替换词采用掩码字符标识;然后将输入数据输入歌词预测模型进行预测,获取第一个掩码字符对应的替换字的概率分布向量;将第一个掩码字符对应位置的概率从大到小排列,得到位置索引向量(该向量每个元素表示了在字符引射表中的一个字符),即通过数字表示的对应于第一个掩码字符的单个字符的推荐列表,提取出概率从大到小排列的前n1个字符的数字编码,依次用于替换预测模型输入数据中第一个掩码字符,得到新的输入数据,再将新的输入数据输入歌词预测模型进行预测,获取第二个掩码字符对应的替换字的概率分布向量,选择其中的n2个,得到n2个第二个掩码字符的数字编码,此时获取的候选推荐为n1*n2个,第三个掩码字符的候选数字编码获取方式预第二个掩码字符的方式相同,其余掩码字符获取方式依次类推,直至预测模型输入数据中不存在掩码字符,得到n1*n2*...*nm个候选词,m为掩码字符的数量,n1、n2、...nm为每个掩码字符提取的数字编码的数量,n1、n2、...nm可以自己设定。在实际使用中,n1设定为多个,n2一般选择1-3个,n3、...nm一般仅选择1个,以避免产生非常多不合适的替换词。
可选的,获取对应于第一个掩码字符的单个字符的推荐列表后,可以根据第一个标识字符对应位置的概率分布向量进行概率过滤。
第一种概率过滤方式为:基于概率值的绝对大小选取一个阈值,筛选保留概率值绝对值大于阈值的对应字符结果。
第二种概率过滤方式为:基于每个字符的概率与前几个字符的概率均值的比值作为阈值,筛选保留比值大于阈值的对应字符结果。具体前几个字符根据测试的效果经验获取。
在本发明的另一个实施例中,用户选择的歌词修改模式为押韵词推荐模式。在押韵词推荐模式下,待修改的歌词中的欲修改词的位置限定为句末的两个或多个字,由押韵方式决定。系统获取待修改的歌词后,应用字符映射表将其转换为预测模型的输入数据,欲替换词采用掩码字符标识;然后将输入数据输入歌词预测模型进行预测,获取第一个掩码字符对应的替换字的概率分布向量;将第一个掩码字符对应位置的概率从大到小排列,得到位置索引向量(该向量每个元素表示了在字符引射表中的一个字符),即通过数字表示的对应于第一个掩码字符的单个字符的推荐列表,提取出概率从大到小排列的前n1个字符的数字编码,依次用于替换预测模型输入数据中第一个掩码字符,得到新的输入数据,再将新的输入数据输入歌词预测模型进行预测,获取第二个掩码字符对应的替换字的概率分布向量,选择其中的n2个,得到n2个第二个掩码字符的数字编码,此时获取的候选推荐为n1*n2个,第三个掩码字符的候选数字编码获取方式预第二个掩码字符的方式相同,其余掩码字符获取方式依次类推,直至预测模型输入数据中不存在标识字符,得到n1*n2*...*nm个候选词,m为掩码字符的数量,n1、n2、...nm为每个掩码字符提取的数字编码的数量,n1、n2、...nm可以自己设定。采用押韵规则过滤出满足押韵要求的词,作为押韵替换词输出。押韵规则采用十三辙规则。具体的,对于单押,只将韵母相同视为押韵,即对比候选词与指定韵脚的韵母是否相同来进行筛选,将筛选后的结果返回。对于双押,则按三个优先级来依次过滤,且三个优先级输出的候选项没有交集,这三个优先级依次是:同韵母+同声调,仅同韵母或仅同声调,单押。多押情形与双押大体一致,只是对于第三优先级则依次降级来输出(如四押的第三级包括三押,双押,单押)。
可选的,在押韵词推荐模式下,获取待修改歌词后,为了确定末尾词,可以先分词后再进行候选词推荐,若是末尾词的字数少于押韵字的要求,可以向前以词尾的那位扩展,形成一个大词再进行替换词推荐计算。
在本发明的另一个实施例中,用户选择的歌词修改模式为段落仿写模式。在段落仿写模式下,获取待修改的歌词后需要先将段中的句分词,再应用字符映射表将分词后的段落转换为预测模型的输入数据,待修改歌词中的欲替换词采用能区分的标识字符标识。分词可以采用结巴或者foolnltk等工具。
然后将输入数据输入歌词预测模型进行预测,获取第一个标识字符对应的替换字的概率分布向量;将第一个标识字符对应位置的概率从大到小排列,得到位置索引向量(该向量每个元素表示了在字符引射表中的一个字符),即通过数字表示的对应于第一个掩码字符的单个字符的推荐列表,提取出概率从大到小排列的前n1个字符的数字编码,依次用于替换预测模型输入数据中第一个掩码字符,得到新的输入数据,再将新的输入数据输入歌词预测模型进行预测,获取第二个掩码字符对应的替换字的概率分布向量,选择其中的n2个,得到n2个第二个掩码字符的数字编码,此时获取的候选推荐为n1*n2个,第三个掩码字符的候选数字编码获取方式与第二个掩码字符的方式相同,其余掩码字符获取方式依次类推,直至预测模型输入数据中不存在掩码字符,得到n1*n2*...*nm个候选词组成的段落。在实际使用中,n1设定为多个,n2、n3、...nm一般仅选择1个,以避免产生非常多的改写段落。这种方式产生的候选段落多样性好,但是结构与待替换歌词的结构相似性较差。
段落仿写模式还包括另一种可替换的仿写方式。首先将段落中的句进行分词,应用字符映射表将分词后的段落转换为预测模型的输入数据,待修改歌词中的分词后的第一个欲替换词采用掩码标识,其余欲替换词不使用掩码标识;将输入数据输入歌词预测模型进行预测,获取第一个掩码字符对应的替换字的概率分布向量;根据第一个掩码字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;再将得到的数字编码替换预测模型输入数据中第一个掩码字符;得到新的输入数据,再将新的输入数据输入歌词预测模型进行预测,获取第二个掩码字符对应的替换字的概率分布向量,选择其中的n2个字符的数字编码,第三个掩码字符的候选数字编码获取方式与第二个掩码字符的方式相同,其余掩码字符获取方式依次类推,直至预测模型输入数据中不存在掩码字符;得到第一个欲替换词的多个候选词,从中选择n个替换词,依次使用替换词替换段落中的第一个欲替换词,将替换后的段落转换为预测模型的输入数据,待修改歌词中的分词后的第二个欲替换词采用掩码字符标识,重复第一个欲替换词产生候选词的过程,得到不同的第一个替换词各自对应的第二个欲替换词的多个候选词,对不同的第一个替换词,各选择一个第二个欲替换词的候选词,得到n个第一个替换词与第二个替换词的组合;第三个欲替换词的获取方式与第二个欲替换词方式相同,依次类推,直至段落中不存在欲替换词,生成n个改写段落。这种方式生成的改写段落句子结构与改写歌词的句子结构相似性更好,但是替换段落的多样性相对较差。
可选的,段落仿写模式还包括无具体意义词的候选跳过步骤:在获取歌词修改限定信息时限定无具体意义词不修改,直接保留该词到原句,无具体意义的词包括连词,介词等。
可选的,为了实现一些特殊需求,可以对候选词的词性进行过滤(举例来说,每个位置可以限定候选词与原词词性相同,如都是名词,都是动词等。
在本申请方法的其他实施例中可以采用上下文模型作为基本训练模型,例如bi-lstm等。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (8)

1.一种基于神经网络的智能歌词修改方法,其特征在于:包括如下步骤:
S1:歌词预测模型训练,采用处理好的歌词训练数据输入基本训练模型进行训练,得到歌词预测模型;
S2:获取待修改歌词及歌词修改限定信息;
S3:应用字符映射表将待修改歌词转换为预测模型的输入数据,待修改歌词中的欲替换词采用能区分的标识字符标识;
S4:将输入数据输入歌词预测模型进行预测,获取第一个标识字符对应的替换字的概率分布向量;
S5:根据歌词修改限定信息限定的歌词修改模式执行修改操作;
S6:输出替换候选歌词;
所述的歌词修改模式包括替换词推荐模式、押韵词推荐模式和段落仿写模式;
所述的替换词推荐模式包括:S511:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S512:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4-S511,得到第二个标识字符的n2个数字编码;S513:重复步骤S512,直至预测模型输入数据中不存在标识字符,得到n1*n2*...*nm个候选词,m为标识字符的数量,n1、n2、...nm为每个标识字符提取的数字编码的数量;
所述的押韵词推荐模式包括:S521:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S522:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S521,得到第二个标识字符的替换词的数字编码;S523:重复步骤S522,直至预测模型输入数据中不存在标识字符,得到多个替换词,然后筛选出符合押韵规则的押韵替换词;
所述的段落仿写模式包括整段仿写模式和分词整段仿写模式;
整段仿写模式包括:S5311:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n个字符的数字编码;S5312:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S5311,得到第二个标识字符的数字编码,取概率最大的字符的数字编码;S5313:重复步骤S5312,直至预测模型输入数据中不存在标识字符,得到n个候选段落;
分词整段仿写模式还包括分词步骤:将段落中的句进行分词,应用字符映射表将分词后的段落转换为预测模型的输入数据,待修改歌词中的分词后的第一个欲替换词采用能区分的标识字符标识;S5321:将输入数据输入歌词预测模型进行预测,获取第一个标识字符对应的替换字的概率分布向量;S5321:根据第一个标识字符对应位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码;S5322:再将得到的数字编码替换预测模型输入数据中第一个标识字符;重复步骤S4和S5321,得到第二个标识字符的n2个数字编码;S5323:重复步骤S5322,直至预测模型输入数据中不存在标识字符,n1*n2*...*nm个候选词;S5324:从候选词中选择n个替换词,依次使用替换词替换段落中的第一个欲替换词,将替换后的段落转换为预测模型的输入数据,待修改歌词中的分词后的第二个欲替换词采用能区分的标识字符标识;S5325:重复S4和S5321-S5324,直至段落中不存在未替换的分词,得到多个候选段落。
2.根据权利要求1所述的基于神经网络的智能歌词修改方法,其特征在于:所述的歌词修改限定信息包括欲替换词在待修改歌词中的位置、押韵韵脚、歌词段落的范围以及具体的歌词修改模式。
3.根据权利要求1所述的基于神经网络的智能歌词修改方法,其特征在于:所述的基本训练模型为能够根据上下文预测某位置的字符的模型。
4.根据权利要求1所述的基于神经网络的智能歌词修改方法,其特征在于:所述的替换词推荐模式还包括概率过滤步骤:根据第一个标识字符对应位置的概率分布向量进行概率过滤。
5.根据权利要求4所述的基于神经网络的智能歌词修改方法,其特征在于:所述的概率过滤基于概率值的绝对大小选取一个阈值,筛选保留概率值绝对值大于阈值的对应字符结果。
6.根据权利要求4所述的基于神经网络的智能歌词修改方法,其特征在于:所述的概率过滤基于每个字符的概率与前几个字符的概率均值的比值作为阈值,筛选保留比值大于阈值的对应字符结果。
7.根据权利要求1所述的基于神经网络的智能歌词修改方法,其特征在于:所述的段落仿写模式还包括无具体意义词的候选跳过步骤:在获取歌词修改限定信息时限定无具体意义词不修改。
8.应用权利要求1-7中任意一项所述的基于神经网络的智能歌词修改方法的辅助系统,其特征在于:包括预测模型训练模块、待预测歌词数据预处理模块、待修改歌词录入模块、限定信息设置模块、替换候选歌词推荐模块和歌词预测模块;
所述的待预测歌词数据预处理模块应用字符映射表将待修改歌词转换为预测模型的输入数据,待修改歌词中的欲替换词采用能区分的标识字符标识;
所述的预测模型训练模块采用处理好的歌词训练数据输入基本训练模型进行训练,得到歌词预测模型;
所述的待修改歌词录入模块用于用户录入待修改的歌词;
所述的限定信息设置模块用于用户设置歌词修改限定信息;
所述的替换候选歌词推荐模块用于展示歌词预测模块预测得到的候选歌词;
所述的歌词预测模块采用歌词预测模型根据限定信息和歌词信息预测候选歌词。
CN202010036493.XA 2020-01-14 2020-01-14 一种基于神经网络的智能歌词修改方法及辅助系统 Active CN111241829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010036493.XA CN111241829B (zh) 2020-01-14 2020-01-14 一种基于神经网络的智能歌词修改方法及辅助系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010036493.XA CN111241829B (zh) 2020-01-14 2020-01-14 一种基于神经网络的智能歌词修改方法及辅助系统

Publications (2)

Publication Number Publication Date
CN111241829A CN111241829A (zh) 2020-06-05
CN111241829B true CN111241829B (zh) 2023-05-05

Family

ID=70874546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010036493.XA Active CN111241829B (zh) 2020-01-14 2020-01-14 一种基于神经网络的智能歌词修改方法及辅助系统

Country Status (1)

Country Link
CN (1) CN111241829B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548103B (zh) * 2020-11-25 2024-03-29 马上消费金融股份有限公司 一种命名实体识别模型的训练方法和命名实体的识别方法
CN112883729B (zh) * 2021-03-11 2023-08-11 网易(杭州)网络有限公司 文本创作的词汇推荐方法、装置及服务器
CN112988018B (zh) * 2021-04-13 2023-02-07 杭州网易云音乐科技有限公司 多媒体文件输出方法、装置、设备及计算机可读存储介质
CN113946269A (zh) * 2021-10-18 2022-01-18 网易(杭州)网络有限公司 一种歌词的替换方法、装置、电子设备及可读存储介质
CN116011430B (zh) * 2023-03-22 2024-04-02 暗链科技(深圳)有限公司 韵脚去重方法、非易失性可读存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109471951A (zh) * 2018-09-19 2019-03-15 平安科技(深圳)有限公司 基于神经网络的歌词生成方法、装置、设备和存储介质
CN109716326A (zh) * 2017-06-21 2019-05-03 微软技术许可有限责任公司 在自动聊天中提供个性化歌曲
TWM578439U (zh) * 2018-12-22 2019-05-21 淇譽電子科技股份有限公司 自動詞曲創作系統
CN109815493A (zh) * 2019-01-09 2019-05-28 厦门大学 一种智能嘻哈音乐歌词生成的建模方法
CN110019919A (zh) * 2017-09-30 2019-07-16 腾讯科技(深圳)有限公司 一种押韵歌词的生成方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109716326A (zh) * 2017-06-21 2019-05-03 微软技术许可有限责任公司 在自动聊天中提供个性化歌曲
CN110019919A (zh) * 2017-09-30 2019-07-16 腾讯科技(深圳)有限公司 一种押韵歌词的生成方法和装置
CN109471951A (zh) * 2018-09-19 2019-03-15 平安科技(深圳)有限公司 基于神经网络的歌词生成方法、装置、设备和存储介质
TWM578439U (zh) * 2018-12-22 2019-05-21 淇譽電子科技股份有限公司 自動詞曲創作系統
CN109815493A (zh) * 2019-01-09 2019-05-28 厦门大学 一种智能嘻哈音乐歌词生成的建模方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Masato Konno ; Kohei Suzuki ; Maki Sakamoto.Sentence Generation System Using Affective Image. 2018 Joint 10th International Conference on Soft Computing and Intelligent Systems (SCIS) and 19th International Symposium on Advanced Intelligent Systems (ISIS).2019,全文. *
韩凝.基于深度神经网络的音乐自动标注技术研究.中国优秀硕士学位论文全文数据库 信息科技辑.2018,全文. *

Also Published As

Publication number Publication date
CN111241829A (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
CN111241829B (zh) 一种基于神经网络的智能歌词修改方法及辅助系统
CN111694924B (zh) 一种事件抽取方法和系统
CN110119765B (zh) 一种基于Seq2seq框架的关键词提取方法
CN110795556B (zh) 一种基于细粒度插入式解码的摘要生成方法
JP5128629B2 (ja) 品詞タグ付けシステム、品詞タグ付けモデルのトレーニング装置および方法
CN111259665B (zh) 一种基于神经网络的交互式歌词生成方法及系统
CN110597961B (zh) 一种文本类目标注方法、装置、电子设备及存储介质
CN114444479A (zh) 一种端到端中文语音文本纠错方法、装置和存储介质
CN110807324A (zh) 一种基于IDCNN-crf与知识图谱的影视实体识别方法
CN112307208A (zh) 长文本的分类方法、终端及计算机存储介质
CN100429648C (zh) 一种文本自动分块的方法、分块器和文本到语言合成系统
CN109993216B (zh) 一种基于k最近邻knn的文本分类方法及其设备
CN112818698B (zh) 一种基于双通道模型的细粒度的用户评论情感分析方法
CN114139497A (zh) 一种基于bertsum模型的文本摘要提取方法
CN113065349A (zh) 基于条件随机场的命名实体识别方法
CN114970503A (zh) 一种基于预训练的字音字形知识增强的中文拼写纠正方法
CN113221569A (zh) 一种毁伤试验文本信息抽取方法
CN115687567A (zh) 一种不需要标注数据的短文本搜索相似长文本方法
CN115098673A (zh) 基于变体注意力及层次结构的业务文书信息抽取方法
CN111241820A (zh) 不良用语识别方法、装置、电子装置及存储介质
CN113961706A (zh) 一种基于神经网络自注意力机制的精确文本表示方法
CN111368531B (zh) 翻译文本处理方法、装置、计算机设备和存储介质
KR100542757B1 (ko) 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치
CN115795026A (zh) 基于对比学习的中文文本摘要生成方法
CN115203206A (zh) 数据内容搜索方法、装置、计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230417

Address after: Room 1210, 12 / F, unit 1, building 1, No. 722, middle section of Yizhou Avenue, high tech Zone, Chengdu, Sichuan 610000

Applicant after: Chengdu potential Artificial Intelligence Technology Co.,Ltd.

Address before: 610041 Building No. 722, Building No. 1, Unit 12, Layer 121, Middle Section of Yizhou Avenue, Chengdu High-tech Zone, Sichuan Province

Applicant before: CHENGDU HIFIVE TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant