CN114492416B - 一种歌词生成方法、装置、设备、存储介质 - Google Patents
一种歌词生成方法、装置、设备、存储介质 Download PDFInfo
- Publication number
- CN114492416B CN114492416B CN202210109520.0A CN202210109520A CN114492416B CN 114492416 B CN114492416 B CN 114492416B CN 202210109520 A CN202210109520 A CN 202210109520A CN 114492416 B CN114492416 B CN 114492416B
- Authority
- CN
- China
- Prior art keywords
- rhyme
- lyric
- character
- input sequence
- lyrics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000003825 pressing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000015654 memory Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 230000006854 communication Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本申请的实施例揭示了一种歌词生成方法、装置、设备、存储介质,该方法包括:获取歌词文本以及歌词文本对应的押韵类型,押韵类型用于描述歌词句末押韵词的字数;将歌词文本转换为输入序列,输入序列中携带有用于描述歌词句末押韵词的字数的特殊字符;根据输入序列生成符合押韵类型的押韵歌词文本。本申请实施例提供的方法,能够高效地创作满足对象押韵要求的歌词以及押韵词的字数,可拓展到多押歌词的生成,且有效保证歌词生成的歌词质量。
Description
技术领域
本申请涉及文字处理技术,具体而言,涉及一种歌词生成方法、歌词生成装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
音乐的出现丰富了人们的生活,不同的音乐能够带给人不同的体验,舒缓的音乐有助于睡眠,快节奏的音乐能够让人兴奋等等。歌词是音乐的重要组成部分,现阶段,绝大多数的音乐歌词是创作者自行创作的,而在歌词的创作过程中,押韵的设计是至关重要的环节,相关技术中通常是由创作者以自身的文学功底和人生阅历编写押韵的文字,这种押韵的设计方式需要耗费很多的时间,且因对创作者的文学功底和人生阅历的要求,使得编写出了的押韵的文字达不到押韵要求,质量参差不齐。
发明内容
为解决上述技术问题,本申请的实施例提供了一种歌词生成方法、歌词生成装置、电子设备、计算机可读存储介质及计算机程序产品,能够高效地创作满足对象押韵要求的歌词以及押韵词的字数,可拓展到多押歌词的生成,且有效保证歌词生成的歌词质量。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种歌词生成方法,包括:获取歌词文本以及所述歌词文本对应的押韵类型,所述押韵类型用于描述歌词句末押韵词的字数;将所述歌词文本转换为输入序列,所述输入序列中携带有用于描述所述歌词句末押韵词的字数的特殊字符;根据所述输入序列生成符合所述押韵类型的押韵歌词文本。
根据本申请实施例的一个方面,提供了一种歌词生成装置,包括:获取模块,用于获取歌词文本以及所述歌词文本对应的押韵类型,所述押韵类型用于描述歌词句末押韵词的字数;转换模块,将所述歌词文本转换为输入序列,所述输入序列中携带有用于描述所述歌词句末押韵词的字数的特殊字符;生成模块,根据所述输入序列生成符合所述押韵类型的押韵歌词文本。
在本申请的一实施例中,所述生成模块包括句末歌词生成单元和其余歌词生成单元,句末歌词生成单元用于预测与所述句末字符押韵的押韵输出字符,并将所述押韵输出字符作为所述押韵歌词文本的句末歌词;其余歌词生成单元,用于根据所述押韵输出字符和所述输入序列预测其余歌词,并根据所述其余歌词和所述句末歌词生成所述押韵歌词文本。
在本申请的一实施例中,所述输入序列的前端包括多个句末字符;句末歌词生成单元进一步用于将所述输入序列输入预训练的歌词生成模型,获得所述歌词生成模型输出的与所述输入序列的前端中第一个句末字符的韵脚相同、且符合词语组合规则的押韵输出字符,其中,所述词语组合规则与所述特殊字符对应;将所述输入序列和得到的押韵输出字符输入到所述歌词生成模型,获得所述歌词生成模型输出的与所述输入序列的前端中第二个句末字符的韵脚相同、且符合所述词语组合规则的押韵输出字符;重复执行将所述输入序列和得到的押韵输出字符输入到所述歌词生成模型的步骤,直至将得到的押韵输出字符按照所述词语组合规则组成的词语的字数等于所述歌词句末押韵词的字数。
在本申请的一实施例中,句末歌词生成单元进一步用于将所述输入序列输入所述歌词生成模型,以预测所述输入序列的各个下一字符的概率;根据押韵表从各个下一字符中筛选出押韵字符得到押韵字符集,所述押韵字符与所述输入序列的前端中第一个句末字符的韵脚相同;从所述押韵字符集中选择概率最大且所述符合词语组合规则的字符作为所述押韵输出字符。
在本申请的一实施例中,其余歌词生成单元进一步用于将所述输入序列和所述押韵输出字符输入到预训练的歌词生成模型中,以预测得到各个下一字符的概率,并输出概率最大的字符作为其余输出字符;重复执行将所述输入序列和其余输出字符输入到所述歌词生成模型的步骤,直至预测得到分隔符;将输出的其余输出字符组合得到所述其余歌词。
在本申请的一实施例中,转换模块包括划分单元和插入单元,划分单元用于以字为单位对所述歌词文本进行划分,得到第一字符序列;插入单元将用于描述所述歌词句末押韵词的字数的特殊字符插入到所述第一字符序列中首字符的前一字符位,得到所述输入序列。
在本申请的一实施例中,转换模块还包括顺序调整单元,在将用于描述所述歌词句末押韵词的字数的特殊字符插入到所述第一字符序列中首字符的前一字符位,得到所述输入序列之前,顺序调整单元用于对所述第一字符序列中的各个字符的顺序进行调整,以将所述歌词文本中的句末押韵词对应的句末字符调整至所述第一字符序列的前端。
根据本申请实施例的一个方面,提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个被所述一个或多个处理器执行时,使得所述电子设备实现如上所述的歌词生成方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的歌词生成方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品所述计算机指令被处理器执行时实现如上所述的歌词生成方法。
在本申请的实施例所提供的技术方案中,通过获取歌词文本以及歌词文本对应的押韵类型,其中,押韵类型用于描述歌词句末押韵词的字数,以此可获知歌词创作的押韵要求;将歌词文本转化为携带有特殊字符的输入序列,通过该特殊字符来描述歌词句末押韵词的字数,以将押韵要求融入到输入序列中,使得输入序列满足歌词创作的押韵要求,进而可以根据输入序列生成符合押韵类型的押韵歌词文本,从而能够高效地创作满足对象押韵要求的歌词以及押韵词的字数,可拓展到多押歌词的生成,且有效保证歌词生成的歌词质量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。在附图中:
图1是本申请涉及的一种实施环境的示意图;
图2是本申请的一示例性实施例示出的一种歌词生成方法的流程图;
图3是图2所示实施例中的步骤S120在一示例性实施例中的流程图;
图4是图2所示实施例中的步骤S130在一示例性实施例中的流程图;
图5是图4所示实施例中的步骤S131在一示例性实施例中的流程图;
图6是图5所示实施例中的步骤S510在一示例性实施例中的流程图;
图7是图4所示实施例中的步骤S132在一示例性实施例中的流程图;
图8是本申请的另一示例性实施例示出的一种歌词生成模型的训练方法的流程图;
图9是本申请的一示例性实施例示出的一种歌词生成模型的网络结构图;
图10是本申请的一示例性实施例示出的歌词预处理的示意图;
图11是本申请的另一示例性实施例示出的基于歌词生成模型的歌词生成方法的流程图;
图12是本申请的一示例性实施例示出的一种歌词生成装置的示意图;
图13示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
还需要说明的是:在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
随着人工智能(Artificial Intelligence, AI)技术研究和进步,AI技术在多个领域展开研究和应用,AI是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,AI是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。AI也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
其中,机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是AI的核心,是使计算机具有智能的根本途径,其应用遍及AI的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
AI结合云服务,也可以实现AI云服务,一般也被称作是AIaaS(AI as a Service,中文为“AI即服务”)。这是目前主流的一种AI平台的服务方式,具体来说AIaaS平台会把几类常见的AI服务进行拆分,并在云端提供独立或者打包的服务。这种服务模式类似于开了一个AI主题商城:所有的开发者都可以通过API接口的方式来接入使用平台提供的一种或者是多种AI服务,部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运维自已专属的云AI服务。本申请可以基于AIaaS实现歌词生成的应用场景。
请参阅图1,图1是本申请涉及的一种实施歌词生成方法的实施环境的示意图。该实施环境包括客户端10、服务器20,客户端10和服务器20之间通过有线或者无线网络进行通信。
客户端10,用于接收使用对象输入的歌词文本和押韵类型,押韵类型用于描述歌词句末押韵词的字数,并将歌词文本和押韵类型发送给服务器20。
服务器20,用于接收歌词文本和押韵类型,将歌词文本转换为输入序列,输入序列中携带有用于描述歌词句末押韵词的字数的特殊字符,进而根据输入序列生成符合押韵类型的押韵歌词文本,并将押韵歌词文本返回给客户端10,进而通过客户端10展示给使用对象。
在另一示例中,也可以是客户端10接收使用对象输入的歌词文本和押韵类型后,客户端10将歌词文本转化为输入序列,进而根据输入序列生成符合押韵类型的押韵歌词文本。
其中,客户端10可以是智能手机、平板、笔记本电脑、计算机等任意能够接收输入的电子设备,服务器20可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和智能平台等基础云计算服务的云服务器,本处不对此进行限制。
如图2所示,图2是根据一示例性实施例示出的一种歌词生成方法的流程图。该方法可以应用于图1所示的实施环境,并由图1所示实施例环境中的客户端或服务器20具体执行。该歌词生成方法可以包括步骤S110至步骤S130,详细介绍如下:
S110、获取歌词文本以及歌词文本对应的押韵类型,押韵类型用于描述歌词句末押韵词的字数。
在本申请一实施例中,获取来自使用对象输入的歌词文本以及歌词文本对应的押韵类型,其中,歌词文本可以为一句歌词,也可以为多句歌词;歌词文本对应的押韵类型,描述的是歌词句末押韵词的字数,进而通过押韵类型确定使用对象的押韵要求是单押还是多押,其中单押指的是歌词中句子结尾和下一句的结尾的字的韵母相同,也就是说,最后一个字押韵;多押指的是歌词句末有多个字押韵,包括句末有两个字押韵的双押,句末有三个字押韵的三押等;可选的,歌词句末押韵词的字数大于或等于2,进而后续生成的押韵歌词文本为多押歌词。
在一示例中,获取歌词文本以及歌词文本对应的押韵类型可以接收来自客户端发送的歌词文本和押韵类型,也可以是服务器展示输入界面,通过该输入界面接收使用对象输入的歌词文本和押韵类型,在此不进行限定,当获取到单句的歌词文本和押韵类型为“A,2”,其中“A”为单句歌词,“2”为押韵类型,表示使用对象的押韵要求为双押。
S120、将歌词文本转换为输入序列,输入序列中携带有用于描述歌词句末押韵词的字数的特殊字符。
在本申请一实施例中,将歌词文本转换为输入序列,并在歌词文本转换过程中,插入特殊字符,以得到携带有特殊字符的输入序列,该特殊字符用于描述歌词句末押韵词的字数,例如歌词句末押韵词的字数为2,特殊字符为[W2],通过[W2]来表示歌词句末押韵词的字数为2;当然该特殊字符的表现形式可以根据实际需进行灵活调整,在此并不进行限定。
可以理解的是,将歌词文本为单句歌词时,通过转换将单句歌词排成一行;当歌词文本为多句歌词时,通过转换将多句歌词排成一行,进而得到输入序列。
S130、根据输入序列生成符合押韵类型的押韵歌词文本。
在本申请一实施例中,输入序列包含了获取的歌词文本,还携带了歌词句末押韵词的字数,进而生成的押韵歌词文本符合押韵类型,例如歌词文本和押韵类型为“A,2”,则生成的押韵歌词文本为“B”,且“A”和“B”的最后两个字押韵。其中,当歌词文本“A”为单句歌词时,则“B”可以为“A”的下一句歌词;当歌词文本“A”为多句歌词时,如包括“A1和A2”,则“B”包括对“A1和A2”的歌词句末的词调整后的歌词“B1和B2”,也就是说,B1与A1对应, B2与A2对应,区别在于句末词不同,进而使得押韵歌词文本满足押韵类型。
本实施例提供的歌词生成方法,可以根据使用对象上传的歌词文本和指定的歌词句末押韵词的字数,以确定使用对象的押韵要求,通过将歌词文本转化为输入序列,且将押韵词的字数融入到输入序列中,使得输入序列满足使用对象的押韵要求,进而根据输入序列生成的押韵歌词文本满足押韵类型,能够高效地创作满足对象押韵要求的歌词,且可扩展到多押歌词的生成,可以替代或辅助创作者进行歌词创作。
如图3所示 ,图3是图2所示实施例中的在步骤S120在一示例性实施例中的流程图,将歌词文本转换为输入序列包括:
S121、以字为单位对歌词文本进行划分,得到第一字符序列。
需要说明的是,歌词文本是由一个字一个字构成的,以一个字为单位对歌词文本进行划分,使得各个字相互分离且独立,将各个字作为字符,得到第一字符序列。例如歌词文本为“abcde”,则第一字符序列为{“a”“b”“c”“d”“e”}。
值得注意的是,在以字为单位对歌词文本进行划分之前,还可以在歌词文本的首位字之前插入开头符[CLS],通过该开头符来表征开头符之后的为歌词文本的字。
可选的,当歌词文本为多句歌词时,除了在歌词文本的首位字之前插入开头符,在多句歌词换行插入分隔符[SEP],如歌词文本为两句歌词“abcde fgijk”,则在“a”之前插入开头符,得到“[CLS]abcde fgijk”,然后歌词换行插入分隔符,得到“[CLS]abcde[SEP]fgijk[SEP]”,接着以字为单位进行划分,得到第一字符序列为{“[CLS]”“a”“b”“c”“d”“e”“[SEP]”“f”“g”“i”“j”“k”“[SEP]”},其中“a”、“b”、“c”等字符为第一字符序列中的字符,[CLS]” 和“[SEP]”为插入符。
S122、将用于描述歌词句末押韵词的字数的特殊字符插入到第一字符序列中首字符的前一字符位,得到输入序列。
在本申请一实施例中,根据歌词句末押韵词的字数,确定特殊字符,歌词句末押韵词的字数为一、二、三和四,则对应特殊字符为[W1]、[W2]、[W3]和[W4],例如句末押韵词为“力量”,则特殊字符为[W2];句末押韵词为“乐哈哈”,则特殊字符为[W3];然后将该特殊字符插入到第一字符序列中首字符的前一字符位,得到输入序列,假设特殊字符为[W2],则输入序列为{ “[CLS]”“[W2]”“a”“b”“c”“d”“e” }。
可选的,当歌词文本为多句歌词时,则在每句歌词的首字符的前一字符位插入特殊字符,承接上例,则输入序列为{“[CLS]”“[W2]”“a”“b”“c”“d”“e” “[SEP]”“[W2]”“f”“g”“i”“j”“k”“[SEP]”}。
在本实施例中,通过以字为单位对歌词文本进行划分,使得歌词文本中的各个字互相分离独立,且将描述歌词句末押韵词的字数的特殊字符插入到第一字符序列中首字符的前一字符位,便于后续歌词生成模型能基于特殊字符生成满足押韵类型的词,高效且准确生成歌词。
值得注意的是,在本申请一实施例中,为了更高效得生成押韵歌词文本中的押韵词,在步骤S122之前,歌词生成方法还包括:
对第一字符序列中的各个字符的顺序进行调整,以将歌词文本中的句末押韵词对应的句末字符调整至第一字符序列的前端。
即对第一字符序列中的各个字符的顺序进行调整,使得将歌词文本中的句末押韵词提到序列中的前端,其中,仅对字符的顺序调整,当第一字符序列中包含了插入符时,则保持插入符的位置不变。
可选的,可以是对第一字符序列中的各个字符进行顺序倒置,例如第一字符序列为{“[CLS]”“a”“b”“c”“d”“e”},顺序倒置后得到的序列为{“[CLS]”“e”“d”“c”“b”“a”},歌词文本中的句末押韵词对应的句末字符为“d”和“e”,将其调整至第一字符序列的前端。
可选的,对第一字符序列中的各个字符的顺序调整,可以是将歌词文本中的句末押韵词对应的句末字符调整至第一字符序列的前端,对于歌词文本中的其它字符可以进行随机调整或不进行调整,例如顺序调整后的序列为{“[CLS]”“e”“d”“a”“c”“b” },或{“[CLS]”“d”“e”“a”“b”“c” };当随机调整时,则需要记录该随机调整的调整方式,以便于后续生成对应的通顺押韵歌词文本。
需要说明的是,当歌词文本包括多句歌词时,则对分别每句歌词对应的字符的顺序调整,每句歌词中的字符互相的顺序不调整,例如{“[CLS]”“a”“b”“c”“d”“e” “[SEP]”“f”“g”“i”“j”“k”“[SEP]”},则顺序调整后的序列为{“[CLS]”“e”“d”“c”“b”“a”“[SEP]”“k”“j”“i”“g”“f”“[SEP]”}。当然,每句歌词中的字符各自对应的顺序调整方式可以相同,也可以不同。
本实施例中,通过对第一字符序列中的各个字符的顺序进行调整,使得将歌词文本中的句末押韵词提到序列中的前端,便于后续歌词生成模型能提早生成押韵歌词文本的句末押韵词,以高效生成满足押韵要求的歌词。
如图4所示,图4为图2所示实施例中的在步骤S130在一示例性实施例中的流程图,输入序列的前端为歌词文本中的句末押韵词对应的句末字符;根据输入序列生成符合押韵类型的押韵歌词文本包括:
S131、预测与句末字符押韵的押韵输出字符,并将押韵输出字符作为押韵歌词文本的句末歌词。
在本申请实施例中,由于输入序列的前端为歌词文本中的句末押韵词的句末字符,按照输入序列从前到后的顺序,首先预测与句末字符押韵的押韵输出字符,可以理解的是,句末字符有几个,则押韵输出字符则有几个,使得押韵歌词的句末歌词符合押韵类型,例如输入序列为{“[CLS]”“e”“d”“c”“b”“a”},则句末字符为“e”和“d”,则先预测与“e”押韵的押韵输出字符“x”,然后预测与“d”押韵的押韵输出字符“y”,因歌词文本的句末字符的顺序有调整,将该押韵输出字符“x”和“y”的顺序调整后,作为押韵歌词文本的句末歌词“yx”。
S132、根据押韵输出字符和输入序列预测其余歌词,并根据其余歌词和句末歌词生成押韵歌词文本。
当得到押韵输出字符后,将押韵输出字符加入输入序列中得到新的输入序列,根据新的输入序列预测其余歌词,该其余歌词为除了句末歌词外的歌词,当得到押韵歌词文本的句末歌词和其余歌词,根据其余歌词和句末歌词的顺序生成押韵歌词文本。
在本实施例中,在将歌词文本的句末押韵词对应的句末字符调至输入序列的前端后,首先生成与句末字符押韵的押韵输出字符,然后基于押韵输出字符和输入序列预测其余歌词,能创作押韵自然,且意思表达清楚的押韵歌词文本。
如图5所示,图5为图4所示实施例中的在步骤S131在一示例性实施例中的流程图,输入序列的前端包括多个句末字符;预测与句末字符押韵的押韵输出字符包括:
S510、将输入序列输入预训练的歌词生成模型,获得歌词生成模型输出的与输入序列的前端中第一个句末字符的韵脚相同、且符合词语组合规则的押韵输出字符,其中,词语组合规则与特殊字符对应。
在本申请的一实施例中,预先训练得到了歌词生成模型,该歌词生成模块可以根据已有的输入序列,生成最有可能的输出字符。其中,该歌词生成模型可以是自回归文本生成模型,也可以是深度自注意力网络的解码器(transformer-decoder)、LSTM(Long Short-Term Memory,长短期记忆)模型,其中自回归文本生成模块包括GPT-2(Gererate Pre-Training-2 Model)。
将输入序列输入到预训练的歌词生成模型,该歌词生成模型会一个字一个字输出,首先输出与输入序列的前端中第一个句末字符的韵脚相同的第一个押韵输出字符,且第一个押韵输出字符符合词语组合规则。需要说明的是,词语组合规则与特殊字符对应,词语组合规则指的是该押韵输出字符可以与其他字符能组合成一个多字词语;当特殊字符为[W2],则表示该押韵输出字符能与其他字符能组合成一个二字词语,例如输入序列的前端中第一个句末字符为“量”,假设歌词生成模型输出的第一个押韵输出字符为“浪”,“量”和“浪”的韵脚相同,且“浪”能组合成二字词语,如能组成“流浪”、“波浪”等二字词语。
S520、将输入序列和得到的押韵输出字符输入到歌词生成模型,获得歌词生成模型输出的与输入序列的前端中第二个句末字符的韵脚相同、且符合词语组合规则的押韵输出字符。
在本申请的一实施例中,将第一个押韵输出字加入该输入序列,可以加入到输入序列中的末位符的之后,得到新的输入序列,将该新的输入序列输入到歌词生成模型中,歌词生成模块会输出与输入序列的前端中第二个句末字符的韵脚相同的第二个押韵输出字符,该第二个押韵输出字符符合词语组合规则,且该第二个押韵输出字符能与第一个押韵输出字符组合成一个多字词语,若特殊字符为[W2],则第一个押韵输出字符和第二个押韵输出字符能组合一个二字词;若特殊字符为[W3],则第一个押韵输出字符、第二个押韵输出字符和其他字符能组合一个三字词。
例如输入序列的前端中第二句末字符为“力”,假设歌词生成模型输出的第二个押韵输出字符为“流”,“力”和“流”的韵脚相同,且“流”能组合成二字词语,能和“浪”组合成二字词“流浪”。
S530、重复执行将输入序列和得到的押韵输出字符输入到歌词生成模型的步骤,直至将得到的押韵输出字符按照词语组合规则组成的词语的字数等于歌词句末押韵词的字数。
在本申请的一实施例中,重复执行步骤S520,即继续将第二个押韵输出字符加入新的输入序列,得到更新后的新的输入序列,将更新后的新的输入序列输入到歌词生成模型,生成与输入序列的前端中第三个句末字符押韵韵脚相同、且符合词语组合规则的第三个押韵输出字符;重复该步骤,直到将第一个押韵字符、第二个押韵字符等按照词语组合规则组合的词语的字数等于歌词句末押韵词的字数;例如第一个押韵字符“浪”、第二个押韵字符“流”组合成“流浪”,该“流浪”的字数与歌词句末押韵词的字数2相同,则不再将输入序列和得到的押韵输出字符输入到歌词生成模型。
在本实施例中,将输入序列输入到歌词生成模型,歌词生成模型会一个字一个字输出与句末字符押韵,且能和其他字符组合词语的押韵输出符,使得押韵输出符能满足多押的要求,且押韵自然。
如图6所示,图6为图5所示实施例中的在步骤S510在一示例性实施例中的流程图,获得歌词生成模型输出的与输入序列的前端中第一个句末字符的韵脚相同且符合词语组合规则的押韵输出字符,包括:
S511、将输入序列输入歌词生成模型,以预测输入序列的各个下一字符的概率。
如前所述,歌词生成模型根据已有的输入序列,生成最有可能的输出字符,其中,歌词生成模块可以根据输入序列的表述的内容,预测出输入序列的多个下一个字符的概率。
S512、根据押韵表从各个下一字符中筛选出押韵字符得到押韵字符集,押韵字符与输入序列的前端中第一个句末字符的韵脚相同。
在本申请一实施例中,押韵表包括多类韵脚,从各个下一字符中筛选出与输入序列的前端中第一句末字符的韵脚相同的押韵字符,即将与第一句末字符不押韵的字符筛选掉, 得到押韵字符集。如下表1所示,表1为本申请实施例提供的一种示例性的押韵表,押韵表中的实例可以根据实际情况进行灵活调整。
表1
S513、从押韵字符集中选择概率最大且符合词语组合规则的字符作为押韵输出字符。
由于歌词生成模型预测出各个下一字符的概率,则押韵字符集中每个字符均对应有一个概率,选择概率最大且符合词语组合规则的字符作为与第一句末字符对应的第一个押韵输出字符。
获得与输入序列的前端中第二个句末字符的韵脚相同且符合词语组合规则的第二个押韵输出字符的过程,如步骤S511~S513所示,在此不再一一赘述。
在本实施例中,通过歌词生成模型预测下一字符的概率,选择押韵、概率最大且能组合词语的字符作为押韵输出字符,保证了押韵输出字符的可靠性和准确性。
如图7所示,图7为图4所示实施例中的在步骤S132在一示例性实施例中的流程图,根据押韵输出字符和输入序列预测其余歌词包括:
S710、将输入序列和押韵输出字符输入到预训练的歌词生成模型中,以预测得到各个下一字符的概率,并输出概率最大的字符作为其余输出字符。
当押韵输出字符预测完成后,将所有押韵输出字符加入到输入序列中,然后输入到预训练的歌词生成模型中,歌词生成模型会预测输入序列的各个下一字符的概率,由于与歌词文本的句末词押韵的押韵输出字符已经得到了,而歌词的其他部分可以不用满足押韵要求,因此可从各个下一字符中输出概率最大的字符作为第一个其余输出字符。
S720、重复执行将输入序列和其余输出字符输入到歌词生成模型的步骤,直至预测得到分隔符。
重复执行S710,将其余输出字符继续添加到输入序列中,然后输入到歌词生成模型,以使得歌词生成模型继续预测下一字符,从而得到剩余的其余输出字符,直到歌词生成模型预测的下一字符为分隔符;当歌词生成模型预测得到分隔符,表示歌词生成模型已经完成输出字符的预测。
S730、将输出的其余输出字符组合得到其余歌词。
可以理解的是,当输入序列为顺序调整后的序列,则根据顺序调整方式将输出的其余输出字符组合得到其余歌词;当输入序列为未顺序调整的序列,则根据字符输出顺序将输出的其余输出字符组合得到该其余歌词。
在本实施例中,在押韵输出字符预测完成后,通过将所有押韵输出字符加入到输入序列中,然后输入到预训练的歌词生成模型中,以生成能衔接上押韵输出符的各个其余输出字符,通过其余输出字符创作得到意思表达清楚其余歌词 。
为了便于理解,本申请的一实施例以具体的应用场景对歌词生成方法进行说明,在此,需要先对歌词生成模型进行训练,如图8所示,图8为对歌词生成模型的训练方法的流程图,该方法包括:
S810、选择自回归生成模型作为歌词生成模型。
选择GPT-2模型作为歌词生成模型,如图9所示,GPT-2模型包括字序列模块,字嵌入模块,位置嵌入模块,N个子模块,层归一化模块和分类模块,其中N为正整数,子模块包括掩多头注意力模块和前向模块,且在掩多头注意力模块于前向模块后面分别连接一个层归一化模块。
S820、对样本歌词进行预处理,以将样本歌词转换成字的序列,并插入用于描述歌词句末押韵词的特殊字符。
其中预处理包括:1)在歌词的开头插入开头符[CLS],换行插入分隔符[SEP],其余歌词以字为单位分隔,最后得到一个以字为单位的序列;2)特殊字保持不动,将每句歌词的字的顺序倒置;3)每句歌词前增加一个表示词字数的特殊字,如果歌词最后一个词字数分别是一、二、三、四,则对应特殊字为[W1]、[W2]、[W3]、[W4]。
例如如图10所示,图10为本申请实施例中歌词预处理的示意图。假设样本歌词为两句歌词“快乐悲伤化作力量 是你让我学会坚强”,将两句歌词排为一行,在第一句歌词的开头插入开头符[CLS],两句歌词的换行处插入分隔符[SEP],在第二句歌词的换行处插入分隔符,然后保持[CLS]和[SEP]的位置不变,将每句歌词的字顺序进行倒置,由于两句歌词中“力量”和“坚强”都是二字词,则在每句歌词的首个字符前增加一个表示词字数的特征字符[W2]。
S830、将预处理的样本歌词输出到歌词生成模型中,并按照自回归生成的方式训练模型。
如图10所示,将字序列{ [CLS],[W2],量,力,作,…,是 }输入到歌词生成模型中,以续写双押歌词,歌词生成模型预测下一个字符的概率,从押韵表中选择韵脚与“量”字相同,且概率最大的字m,将m加入输入序列;将包含m 的输入序列输入到歌词生成模型,继续预测下一个字符的概率,从押韵表中选择韵脚与“力”字相同,概率最大且能m组合二字词的字n,将n加入输入序列中。
由于样本歌词的句末为二字词,则样本歌词的下一句歌词的句末字nm已经预测得到的,此时可以不用在预测押韵的词。将包含n和m的输入序列输入到歌词生成模型中,预测下一个字符的概率,从中选择概率最大的字X;
i.若 X 不是 [SEP],则把 X 加入模型的输入序列里,继续预测下一个字符;
ii.否则,模型已经完整预测下一句歌词。
由于模型在训练过程中,模型会基于[W2]生成二字词,后面生成的押韵词都是逆序的二字词,因此模型生成的下一句歌词的句末词为与样本歌词押韵是二字词,满足押韵要求。
通过上述步骤S810~S830对GPT-2进行训练后,得到训练完成的歌词生成模型,该歌词生成模型可以根据输入的歌词和指定的多押字数,生成押韵歌词,如图11所示,图11为本申请实施例提供的一种基于歌词生成模型的歌词生成方法,包括:
S1110、通过接口接收使用对象上传的歌词和用于描述句末多押字数的押韵类型。
通过web接口使用对象上传一句歌词,并指定多押字数。
S1120、将歌词转换为输入序列,输入序列中携带有用于描述歌词句末押韵词的字数的特殊字符。
歌词转换过程如步骤S820所示,在此不再一一赘述。
S1130、将输入序列输入到预训练的歌词生成模型,以生成满足句末多押的歌词。
将输入序列输入到该歌词生成模型,该歌词生成模型会一个字一个字输出,首先获得根据输入序列对应的表述内容,输出的与输入序列的前端中第一个句末字符的韵脚相同、且符合词语组合规则的第一押韵输出字符,其中,词语组合规则与特殊字符对应。
将输入序列和得到的押韵输出字符输入到歌词生成模型,即将第一个押韵输出字加入该输入序列,然后输入到歌词生成模型,获得输出的与输入序列的前端中第二个句末字符的韵脚相同、且符合词语组合规则的第二押韵输出字符。
重复执行将输入序列和得到的押韵输出字符输入到歌词生成模型的步骤,直至将得到的押韵输出字符的字数满足多押字数,且押韵输出字符能组合成一个多押的词语。
在将最后一个押韵输出字符加入输入序列后,然后输入到歌词生成模型,以预测得到下一字符的概率,并输出概率最大的字符作为其余输出字符,若其余输出字符不是分隔符,则将其余输出字符加入到输入序列中,继续预测下一个字;若其余输出字符为分隔符,则表示歌词生成模型已经完整生成下句歌词。
将歌词生成模型输出的所有字符按照逆序的顺序调整,以生成句末多押的歌词。
S1140、将生成的歌词展示给使用对象。
例如输入:(快乐悲伤化作力量,2),则歌词生成模型输出:眼泪只是因为想痛哭一场,其中力量(i iang)和一场(i ang)就是一组双押,生成的歌词“眼泪只是因为想痛哭一场”与输入的歌词押韵,满足双押的要求,且歌词内容与输入的歌词衔接顺畅,意思表达清楚,满足歌词续写的要求,将该生成的歌词展示给使用对象。
可以理解的是,本申请实施例提供的歌词生成方法可以通过多种形式应用于歌词创作中,例如应用于在线教育平台、k歌应用、短视频创作平台、在线视频媒体平台、以及提供云服务、云数据、云运营等整体一站式服务的服务平台等产品中。
本发明提出一种歌词生成方法,该方法可以对输入的歌词和多押要求,生成相应的满足多押的歌词创作,在实际业务场景中可以替代或辅助创作者进行歌词创作。
介绍本申请的装置实施例,可以用于执行本申请上述实施例中的歌词生成方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的歌词生成方法的实施例。
图12示出了根据本申请的一个实施例的歌词生成装置的框图,歌词生成装置,包括获取模块1210、转换模块1220和生成模块1230;
获取模块1210,用于获取歌词文本以及歌词文本对应的押韵类型,押韵类型用于描述歌词句末押韵词的字数;
转换模块1220,将歌词文本转换为输入序列,输入序列中携带有用于描述歌词句末押韵词的字数的特殊字符;
生成模块1230,根据输入序列生成符合押韵类型的押韵歌词文本。
在本申请的一个实施例中,基于前述方案,生成模块1230包括句末歌词生成单元和其余歌词生成单元,句末歌词生成单元用于预测与句末字符押韵的押韵输出字符,并将押韵输出字符作为押韵歌词文本的句末歌词;其余歌词生成单元,用于根据押韵输出字符和输入序列预测其余歌词,并根据其余歌词和句末歌词生成押韵歌词文本。
在本申请的一个实施例中,输入序列的前端包括多个句末字符;句末歌词生成单元进一步用于将输入序列输入预训练的歌词生成模型,获得歌词生成模型输出的与输入序列的前端中第一个句末字符的韵脚相同、且符合词语组合规则的押韵输出字符,其中,词语组合规则与特殊字符对应;将输入序列和得到的押韵输出字符输入到歌词生成模型,获得歌词生成模型输出的与输入序列的前端中第二个句末字符的韵脚相同、且符合词语组合规则的押韵输出字符;重复执行将输入序列和得到的押韵输出字符输入到歌词生成模型的步骤,直至将得到的押韵输出字符按照词语组合规则组成的词语的字数等于歌词句末押韵词的字数。
在本申请的一个实施例中,基于前述方案,句末歌词生成单元进一步用于将输入序列输入歌词生成模型,以预测输入序列的各个下一字符的概率;根据押韵表从各个下一字符中筛选出押韵字符得到押韵字符集,押韵字符与输入序列的前端中第一个句末字符的韵脚相同;从押韵字符集中选择概率最大且符合词语组合规则的字符作为押韵输出字符。
在本申请的一个实施例中,基于前述方案,其余歌词生成单元进一步用于将输入序列和押韵输出字符输入到预训练的歌词生成模型中,以预测得到各个下一字符的概率,并输出概率最大的字符作为其余输出字符;重复执行将输入序列和其余输出字符输入到歌词生成模型的步骤,直至预测得到分隔符;将输出的其余输出字符组合得到其余歌词。
在本申请的一个实施例中,基于前述方案,转换模块1220包括划分单元和插入单元,划分单元用于以字为单位对歌词文本进行划分,得到第一字符序列;插入单元将用于描述歌词句末押韵词的字数的特殊字符插入到第一字符序列中首字符的前一字符位,得到输入序列。
在本申请的一个实施例中,基于前述方案,转换模块1220还包括顺序调整单元,在将用于描述歌词句末押韵词的字数的特殊字符插入到第一字符序列中首字符的前一字符位,得到输入序列之前,顺序调整单元用于对第一字符序列中的各个字符的顺序进行调整,以将歌词文本中的句末押韵词对应的句末字符调整至第一字符序列的前端。
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
本实施例提供的歌词生成装置,可以根据使用对象上传的歌词文本和指定的歌词句末押韵词的字数,以确定使用对象的押韵要求,通过将歌词文本转化为输入序列,且将押韵词的字数融入到输入序列中,使得输入序列满足使用对象的押韵要求,进而根据输入序列生成的押韵歌词文本满足押韵类型,能够高效地创作满足对象押韵要求的歌词,且可扩展到多押歌词的生成,可以替代或辅助创作者进行歌词创作。
本申请的实施例还提供了一种电子设备,包括一个或多个处理器,以及存储装置,其中,存储装置,用于存储一个或多个程序,当一个或多个被一个或多个处理器执行时,使得所述电子设备实现如上所述的歌词生成方法。
图13示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图13示出的电子设备的计算机系统1300仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图13所示,计算机系统1300包括中央处理单元(Central Processing Unit,CPU)1301,其可以根据存储在只读存储器(Read-Only Memory,ROM)1302中的程序或者从储存部分1308加载到随机访问存储器(Random Access Memory,RAM)1303中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1303中,还存储有系统操作所需的各种程序和数据。CPU 1301、ROM 1302以及RAM 1303通过总线1304彼此相连。输入/输出(Input /Output,I/O)接口1305也连接至总线1304。
以下部件连接至I/O接口1305:包括键盘、鼠标等的输入部分1306;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1307;包括硬盘等的储存部分1308;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至I/O接口1305。可拆卸介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1310上,以便于从其上读出的计算机程序根据需要被安装入储存部分1308。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1309从网络上被下载和安装,和/或从可拆卸介质1311被安装。在该计算机程序被中央处理单元(CPU)1301执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前所述的方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供如前所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术人员根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。
Claims (8)
1.一种歌词生成方法,其特征在于,包括:
获取歌词文本以及所述歌词文本对应的押韵类型,所述押韵类型用于描述歌词句末押韵词的字数,歌词句末押韵词的字数大于或等于2;
将所述歌词文本转换为输入序列,所述输入序列中携带有用于描述所述歌词句末押韵词的字数的特殊字符,所述输入序列的前端包括所述歌词文本中的句末押韵词对应多个的句末字符;
将所述输入序列输入预训练的歌词生成模型,获得所述歌词生成模型输出的与所述输入序列的前端中第一个句末字符的韵脚相同、且符合词语组合规则的押韵输出字符,其中,所述词语组合规则与所述特殊字符对应;
将得到的押韵输出字符加入到所述输入序列中的末位符之后得到新的输入序列,将所述新的输入序列输入到所述歌词生成模型,获得所述歌词生成模型输出的与所述输入序列的前端中第二个句末字符的韵脚相同、且符合所述词语组合规则的,能与前一个押韵输出字符组成多字词语的押韵输出字符;
重复执行将所述新的输入序列和得到的押韵输出字符输入到所述歌词生成模型的步骤,直至将得到的押韵输出字符按照所述词语组合规则组成的词语的字数等于所述歌词句末押韵词的字数;
将得到的押韵输出字符作为押韵歌词文本的句末歌词;根据所述押韵输出字符和所述新的输入序列预测其余歌词,并根据所述其余歌词和所述句末歌词生成符合所述押韵类型的押韵歌词文本。
2.根据权利要求1所述的方法,其特征在于,所述将所述输入序列输入预训练的歌词生成模型,获得所述歌词生成模型输出的与所述输入序列的前端中第一个句末字符的韵脚相同且符合词语组合规则的押韵输出字符,包括:
将所述输入序列输入所述歌词生成模型,以预测所述输入序列的各个下一字符的概率;
根据押韵表从各个下一字符中筛选出押韵字符得到押韵字符集,所述押韵字符与所述输入序列的前端中第一个句末字符的韵脚相同;
从所述押韵字符集中选择概率最大且所述符合词语组合规则的字符作为所述押韵输出字符。
3.根据权利要求1所述的方法,其特征在于,所述根据所述押韵输出字符和所述输入序列预测其余歌词,包括:
将所述输入序列和所述押韵输出字符输入到预训练的歌词生成模型中,以预测得到各个下一字符的概率,并输出概率最大的字符作为其余输出字符;
重复执行将所述输入序列和其余输出字符输入到所述歌词生成模型的步骤,直至预测得到分隔符;
将输出的其余输出字符组合得到所述其余歌词。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述歌词文本转换为输入序列包括:
以字为单位对所述歌词文本进行划分,得到第一字符序列;
将用于描述所述歌词句末押韵词的字数的特殊字符插入到所述第一字符序列中首字符的前一字符位,得到所述输入序列。
5.根据权利要求4所述的方法,其特征在于,在将用于描述所述歌词句末押韵词的字数的特殊字符插入到所述第一字符序列中首字符的前一字符位,得到所述输入序列之前,所述方法包括:
对所述第一字符序列中的各个字符的顺序进行调整,以将所述歌词文本中的句末押韵词对应的句末字符调整至所述第一字符序列的前端。
6.一种歌词生成装置,其特征在于,包括:
获取模块,用于获取歌词文本以及所述歌词文本对应的押韵类型,所述押韵类型用于描述歌词句末押韵词的字数,歌词句末押韵词的字数大于或等于2;
转换模块,将所述歌词文本转换为输入序列,所述输入序列中携带有用于描述所述歌词句末押韵词的字数的特殊字符,所述输入序列的前端包括所述歌词文本中的句末押韵词对应多个的句末字符;
生成模块,将所述输入序列输入预训练的歌词生成模型,获得所述歌词生成模型输出的与所述输入序列的前端中第一个句末字符的韵脚相同、且符合词语组合规则的押韵输出字符,其中,所述词语组合规则与所述特殊字符对应;将得到的押韵输出字符加入到所述输入序列中的末位符之后得到新的输入序列,将所述新的输入序列输入到所述歌词生成模型,获得所述歌词生成模型输出的与所述输入序列的前端中第二个句末字符的韵脚相同、且符合所述词语组合规则的,能与前一个押韵输出字符组成多字词语的押韵输出字符;重复执行将所述新的输入序列和得到的押韵输出字符输入到所述歌词生成模型的步骤,直至将得到的押韵输出字符按照所述词语组合规则组成的词语的字数等于所述歌词句末押韵词的字数;将得到的押韵输出字符作为押韵歌词文本的句末歌词;根据所述押韵输出字符和所述新的输入序列预测其余歌词,并根据所述其余歌词和所述句末歌词生成符合所述押韵类型的押韵歌词文本。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求1-5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1-5中的任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210109520.0A CN114492416B (zh) | 2022-01-28 | 2022-01-28 | 一种歌词生成方法、装置、设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210109520.0A CN114492416B (zh) | 2022-01-28 | 2022-01-28 | 一种歌词生成方法、装置、设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114492416A CN114492416A (zh) | 2022-05-13 |
CN114492416B true CN114492416B (zh) | 2024-05-17 |
Family
ID=81477842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210109520.0A Active CN114492416B (zh) | 2022-01-28 | 2022-01-28 | 一种歌词生成方法、装置、设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114492416B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591472A (zh) * | 2021-01-21 | 2021-11-02 | 腾讯科技(深圳)有限公司 | 歌词生成方法、歌词生成模型训练方法、装置及电子设备 |
CN113850080A (zh) * | 2021-09-29 | 2021-12-28 | 北京百度网讯科技有限公司 | 一种押韵词推荐方法、装置、设备及存储介质 |
CN113920968A (zh) * | 2021-10-09 | 2022-01-11 | 北京灵动音科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
-
2022
- 2022-01-28 CN CN202210109520.0A patent/CN114492416B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591472A (zh) * | 2021-01-21 | 2021-11-02 | 腾讯科技(深圳)有限公司 | 歌词生成方法、歌词生成模型训练方法、装置及电子设备 |
CN113850080A (zh) * | 2021-09-29 | 2021-12-28 | 北京百度网讯科技有限公司 | 一种押韵词推荐方法、装置、设备及存储介质 |
CN113920968A (zh) * | 2021-10-09 | 2022-01-11 | 北京灵动音科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114492416A (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10592607B2 (en) | Iterative alternating neural attention for machine reading | |
CN112104919B (zh) | 基于神经网络的内容标题生成方法、装置、设备、和计算机可读存储介质 | |
CN116702737B (zh) | 文案生成方法、装置、设备、存储介质及产品 | |
CN112767910B (zh) | 音频信息合成方法、装置、计算机可读介质及电子设备 | |
CN109219812A (zh) | 口语对话系统中的自然语言生成 | |
CN111897934B (zh) | 问答对生成方法及装置 | |
CN110750987B (zh) | 文本处理方法、装置及存储介质 | |
CN117149989A (zh) | 大语言模型训练方法、文本处理方法及装置 | |
Yang et al. | Deep learning and its applications to natural language processing | |
CN111104512A (zh) | 游戏评论的处理方法及相关设备 | |
CN111723295B (zh) | 一种内容分发方法、装置和存储介质 | |
CN111666756A (zh) | 一种基于主题融合的序列模型文本摘要生成方法 | |
JP2018084627A (ja) | 言語モデル学習装置およびそのプログラム | |
CN112035699A (zh) | 音乐合成方法、装置、设备和计算机可读介质 | |
CN115640398A (zh) | 评论生成模型训练方法、评论生成方法、设备及存储介质 | |
Chen et al. | [Retracted] The Use of Wireless Network Combined with Artificial Intelligence Technology in the Reform of Music Online Teaching System | |
Knowles | Machine-in-the-loop writing: Optimizing the rhetorical load | |
CN114330483A (zh) | 数据处理方法及模型训练方法、装置、设备、存储介质 | |
CN114492416B (zh) | 一种歌词生成方法、装置、设备、存储介质 | |
Mishra et al. | AI based approach to trailer generation for online educational courses | |
Roque | Language technology enables a poetics of interactive generation | |
CN115858736A (zh) | 一种基于情感提示微调的情感文本生成方法 | |
Sannino et al. | Lessonable: leveraging deep fakes in MOOC content creation | |
CN112749553B (zh) | 视频文件的文本信息处理方法、装置和服务器 | |
CN114330296A (zh) | 新词发现方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |