CN115017258A - 一种歌曲信息生成方法以及装置 - Google Patents

一种歌曲信息生成方法以及装置 Download PDF

Info

Publication number
CN115017258A
CN115017258A CN202210427069.7A CN202210427069A CN115017258A CN 115017258 A CN115017258 A CN 115017258A CN 202210427069 A CN202210427069 A CN 202210427069A CN 115017258 A CN115017258 A CN 115017258A
Authority
CN
China
Prior art keywords
word lattice
data
song
target
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210427069.7A
Other languages
English (en)
Inventor
常永炷
张荣升
吕唐杰
胡志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202210427069.7A priority Critical patent/CN115017258A/zh
Publication of CN115017258A publication Critical patent/CN115017258A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种歌曲信息生成方法以及装置,该方法包括:获取输入的歌曲检索信息,歌曲检索信息包括初始词格数据或初始歌词数据;响应于歌曲检索信息为初始词格数据,从预设的数据库中获得目标词格数据,并获取目标词格数据对应的目标歌曲信息;或者,响应于歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成初始歌词对应的初始词格数据,并从预设的数据库中获得与初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取目标词格数据对应的目标歌曲信息;输出目标歌曲信息。通过使用该方法,可降低歌词创作过程的难度及门槛,提升歌词创作过程的准确性及可靠性。

Description

一种歌曲信息生成方法以及装置
技术领域
本申请涉及计算机技术领域,具体涉及歌曲信息生成方法。本申请同时涉及歌曲信息生成装置、电子设备以及计算机可读取存储介质。
背景技术
歌曲包含了音乐性和文学性,其中音乐性主要体现在歌曲的旋律曲调上,而其文学内涵主要体现在歌词上。在歌词创作过程中,歌词创作者往往先确定一首歌的旋律或者词格,然后基于确定的词格进行填词。词格在歌词中的表现主要是长度来决定的,例如对于歌词“时间再不能浪费,手中有多少机会”的词格可以看作是“时间/再不能/浪费,手中/有多少/机会”,即表示成“232,232”。其在歌词中一般情况下是基于长度来区分。。由于词格的确定过程为从无到有的过程,因此,进行词格的确定是歌词创作人较难的环节。
现有的歌词创作过程依赖于歌词创作人专有的领域知识,歌词创作过程的难度较高,因此在歌曲创作过程中,如何降低歌词创作人在创作歌词时的难度,是需要解决的问题。
发明内容
本申请实施例提供一种歌曲信息生成方法、装置、电子设备及计算机可读存储介质,以解决现有的歌词创作过程难度高的问题。
本申请实施例提供一种歌曲信息生成方法,包括:
获取输入的歌曲检索信息,所述歌曲检索信息包括初始词格数据或初始歌词数据;
响应于所述歌曲检索信息为初始词格数据,从预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;或者,
响应于所述歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成所述初始歌词数据对应的初始词格数据,并从所述预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,获取所述目标词格数据对应的目标歌曲信息;
输出所述目标歌曲信息;
其中,所述数据库中关联存储有词格数据以及该词格数据对应的歌曲信息。
可选的,所述方法还包括:
获取历史歌曲的历史歌词数据;
对所述历史歌词数据进行数据清洗,并基于所述词格生成模型,生成所述历史歌词数据的词格数据;
将所述词格数据和所述历史歌曲的歌曲信息之间的关联信息存储于所述数据库中。
可选的,所述词格生成模型通过如下方式训练获得:
获得目标预训练模型;
获取歌词数据样本以及所述歌词数据样本对应的词格数据样本;
基于所述歌词数据样本、所述词格数据样本以及所述目标预训练模型进行模型训练,获得用于基于输入的歌词数据生成该歌词数据对应的词格数据的词格生成模型。
可选的,所述获得目标预训练模型,包括:
获取文本语料;
基于所述文本语料进行语言模型预训练,获得初始预训练模型;
利用歌词文本语料对所述初始预训练模型进行训练,获得所述目标预训练模型。
可选的,所述基于所述文本语料进行语言模型预训练,包括:
采用预训练任务以及所述文本语料进行语言模型预训练。
可选的,所述预训练任务包含以下至少一种:
预训练任务MLM;
预训练任务NSP。
可选的,所述方法还包括:采用如下方式中的一种计算所述初始词格数据与所述数据库中所存储的词格数据之间的相似度:
词向量的语义相似度;
余弦相似度;
欧式距离;
曼哈顿距离;
汉民距离。
可选的,所述目标歌曲信息包括如下中的至少一种:
目标歌曲的歌词数据;
目标歌曲的作者;
目标歌曲的谱曲;
目标歌曲的名称。
本申请实施例还提供一种歌曲信息生成装置,所述装置包括:
歌曲检索信息获取单元,用于获取输入的歌曲检索信息,所述歌曲检索信息包括初始词格数据或初始歌词数据;
目标歌曲信息获得单元,用于响应于所述歌曲检索信息为初始词格数据,从预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;或者,响应于所述歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成所述初始歌词数据对应的初始词格数据,并从所述预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;
目标歌曲信息输出单元,用于输出所述目标歌曲信息;
其中,所述数据库中关联存储有词格数据以及该词格数据对应的歌曲信息。
本申请实施例还提供一种电子设备,包括处理器和存储器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现上述方法。
本申请实施例还提供一种计算机可读存储介质,其上存储有一条或多条计算机指令,该指令被处理器执行以实现上述方法。
与现有技术相比,本申请实施例具有以下优点:
本申请实施例提供的歌曲信息生成方法,获取输入的歌曲检索信息,歌曲检索信息包括初始词格数据或初始歌词数据;响应于歌曲检索信息为初始词格数据,从预设的数据库中获得与初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取目标词格数据对应的目标歌曲信息;或者,响应于歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成初始歌词数据对应的初始词格数据,并从预设的数据库中获得与初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取目标词格数据对应的目标歌曲信息;输出目标歌曲信息;其中,数据库中关联存储有词格数据以及该词格数据对应的歌曲信息。该方法可基于初始词格数据或初始歌词数据,通过数据库检索方式获得目标词格数据以及对应的目标歌曲信息,将其作为歌词创作过程的参考信息。通过使用该方法,可降低歌词创作的难度及门槛,提升歌词创作过程的便利性及准确性。
附图说明
图1是本申请一实施例提供的歌曲信息生成方法的流程图;
图2是本申请一实施例提供的歌曲信息生成装置的单元框图;
图3是本申请一实施例提供的电子设备的逻辑结构示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
需要说明的是,本申请实施例各部分及附图中的术语“第一”、“第二”及“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。该类数据在适当情况下可以互换,以便本文所描述的本申请实施例能够以除了在本文图示或描述的内容之外的顺序实施。术语“包括”和“具有”以及他们的任何变形,旨在覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
歌曲是一种综合性的艺术体裁,包含了音乐性和文学性,其中音乐性主要体现在歌曲的旋律曲调上,而其文学内涵主要的体现在歌词上,在一首歌曲中,歌词往往表达了歌曲的宗旨和灵魂,阐述了一首歌所要表达的感情和主旨,所以歌词的好坏在很大程度上决定了一首歌的好坏。然而,词格则是一首歌的旋律,一首朗朗上口,容易传唱的歌曲必然有着一套独特的旋律。在歌词创作过程中,歌词创作者往往先确定一首歌的旋律或者词格,然后基于确定的词格进行填词。词格在歌词中的表现主要是长度来决定的,讲究的是平仄,主要包括一字句(平声的,如“归!猎猎西风卷绣旗”(张孝祥《归字谣》,仄声的,如:“错!错!错!”(陆游《钗头凤》),二字句(依平仄共有四类格式:平平(“琅然,清圜,谁弹”。(苏轼《醉翁操》))、仄仄(如:“日暮,望高城不见,只见乱山无数”(姜夔《长亭怨慢》))、平仄(如“知否?应是绿肥红瘦”。(李清照《如梦令》)、仄平(“待眠,未眠,事万千,也问天,也恨天。”(赵汝茪)))以及三字句或者四字句等等。在歌词中,一般情况下基于长度进行区分,例如对于歌词“时间再不能浪费,手中有多少机会”的词格可以看作是“时间/再不能/浪费,手中/有多少/机会”,即表示成“232,232”。现有的歌词创作过程依赖于歌词创作人专有的领域知识,歌词创作过程的难度较高,例如,由于词格的确定过程为从无到有的过程,因此,进行词格的确定是歌词创作人较难的环节,对专有领域知识的依赖较高,导致歌词创作的门槛及难度较高。
在歌曲创作过程中,为了降低歌词创作人在创作歌词时的难度及门槛,本申请提供了一种歌曲信息提供方法、与该方法相对应的歌曲信息检索装置,可实施该方法的电子设备以及计算机可读存储介质。以下提供实施例对上述方法、装置、电子设备以及计算机可读存储介质进行详细说明。
本申请第一实施例提供一种歌曲信息提供方法。图1为本申请一实施例提供的歌曲信息提供方法的流程图,以下结合图1对本实施例提供的歌曲信息提供方法进行详细描述。以下描述所涉及的实施例是用来解释说明方法原理,不是实际使用的限定。
如图1所示,本申请实施例提供的歌曲信息提供方法包括如下步骤:
S101,获取输入的歌曲检索信息。
本步骤用于获取用户输入的歌曲检索信息,在本实施例中,该歌曲检索信息可以为初始词格数据,也可以为初始歌词数据。例如,歌词创作人在创作歌词时,其可以在创作歌词之前、先确定出“232,232”等初始词格数据,即,先确定待创作歌曲的词格,然后基于已有的词格进行填词;也可以在确定词格之前,先创作出
S102,响应于歌曲检索信息为初始词格数据,从预设的数据库中获得与初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取目标词格数据对应的目标歌曲信息;或者,响应于歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成初始歌词数据对应的初始词格数据,并从预设的数据库中获得与初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取目标词格数据对应的目标歌曲信息。
在本实施例中,该目标歌曲信息包括如下内容中的一种或多种:目标歌曲的歌词数据、目标歌曲的作者、目标歌曲的谱曲、目标歌曲的名称。
其中,上述数据库中关联存储有词格数据以及该词格数据对应的歌曲信息,在本实施例中,还需通过如下方式对词格数据及词格数据对应的歌曲信息进行关联存储:
获取历史歌曲的历史歌词数据;
对所述历史歌词数据进行数据清洗,并基于词格生成模型,生成所述历史歌词数据的词格数据;
将所述词格数据和所述历史歌曲的歌曲信息进行关联存储,即,将所述词格数据和所述历史歌曲的歌曲信息之间的关联信息存储于所述数据库中,以便后续检索。例如,通过唯一索引将歌词以及上述生成的词格进行存储,在本申请实施例中采用了图存储结构对词格数据和歌曲信息进行一一映射。
需要说明的是,本步骤还需采用如下方式中的一种计算所述初始词格数据与所述数据库中所存储的词格数据之间的相似度:词向量的语义相似度、余弦相似度、欧式距离、曼哈顿距离、汉民距离等相似度计算方式。
在本实施例中,上述词格生成模型通过如下方式训练获得:
首先,获得目标预训练模型。具体为:获取文本语料,例如,收集获得随机的文本语料;基于所述文本语料进行语言模型预训练,获得初始预训练模型,例如,采用预训练任务以及所述随机的文本语料进行语言模型预训练,预训练任务可以包含现有的自然语言处理技术中的预训练任务MLM(Mask Language Model)和预训练任务NSP(Next SentencePrediction)中的至少一种;利用歌词文本语料对所述初始预训练模型进行训练,获得所述目标预训练模型。
其次,获取歌词数据样本以及所述歌词数据样本对应的词格数据样本;
最后,基于所述歌词数据样本、所述词格数据样本以及所述目标预训练模型进行模型训练,获得用于基于输入的歌词数据生成该歌词数据对应的词格数据的词格生成模型。
具体的,可采用BERT(Bidirectional Encoder Representation Transformers)预训练网络在社交媒体以及已知的所有电商媒体评论数据、百科等语料进行模型的预训练,增强预训练模型的学习能力,在训练预训练模型时采用自然语言处理中的预训练任务MLM(Mask Language Model)和NSP(Next Sentence Prediction),在此基础上,利用歌词的数据进行进一步的训练,得到歌词的预训练模型。然后,利用训练好的预训练模型在已有的词格标注语料中训练词格生成模型,具体为:将已标注的歌词词格数据集进行收集,并且进行清洗,例如,过滤掉非中文的符号、网页链接以及标签信息等,在进行数据过滤之后将数据处理为预训练网络可以解析的格式,利用已经标注的数据以及其标签,以及训练完成的预训练模型进行微调训练,获取词格生成模型。该词格生成模型的输入数据的格式为原始歌词数据,输出为“/”分割的歌词数据,例如输入“时间再不能浪费”,输出为“时间/再不能/浪费”,然后通过规则的方式将其映射为“232”的词格,训练的方式采用的序列到序列的训练方式。
S103,输出目标歌曲信息。
在上述步骤之后,本步骤用于向用户输出上述目标歌曲信息,以供用户将该目标歌曲信息作为创作歌词时的参考依据及灵感来源。
在本实施例中,在输出目标歌曲信息的同时,还可同步输出上述初始词格数据以及目标词格数据。
现有的词格生成过程中,大多采用人工方式进行确定,例如歌词创作人基于专有的领域知识进行决策,从而确定当前歌词的词格,或者基于规则的方式对文本进行分词,在大多数歌曲作词中,通常采用的是词粒度,由于歌词与词比较相似,因此采用对歌词分词进行伪词格的划分,并且将其作为真正的词格。然而,上述方式存在以下不足:歌词创作人基于专有的领域知识进行决策时,只有真正的歌词创作人才有专业的知识确定一首歌的词格,其提高了歌词创作门槛;对于基于规则的方式,词格的划分与分词技术并不是完全的吻合,现有的分词方式无法完全准确无误的将歌词分隔开来,并且伪词格难以代替真正的词格。通过使用本实施例提供的歌曲信息提供方法,针对任意输入的初始歌词数据,可基于预先训练的词格生成模型、生成该初始歌词对应的初始词格数据,并从预设的数据库中获得与初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并向用户输出初始词格数据或目标词格数据,可降低词格创作的门槛,提升词格创作过程的便利性及准确性。
本申请实施例所提供的方法可应用于词格检索系统,该词格检索系统的输入可以是词格,例如“332 233”,也可以是歌词,如“我希望许过的愿望一路生花”。当输入词格时,直接在数据库中检索相似词格的歌词,输出为歌词;当输入为歌词时,通过词格生成模型生成该歌词对应的词格,然后基于词格之间的相似度进行检索,输出可作为创作歌词时的参考依据及灵感来源的歌词以及其它歌曲信息。该过程利用大规模预训练模型训练的词格生成模型,仅需要少量的标注数据集,即可训练一个词格生成模型,并且将其应用到词格检索系统中,通过该系统可以在现有的歌曲中检索相似的词格,从而极大的简化创作者谱曲的难度,实现更简单的歌词创作,以此降低歌词创作的门槛。通过该词格检索系统,用户可以随意输入词格,通过词格去检索现有歌曲曲库中与输入部分具有相似词格的歌曲,从而为歌词制作人提供更好的谱曲灵感,从而决定是否去修改词格以及如何去制作该词格下的歌词,减少谱曲难度,缩短了创作歌词的时间,极大的简化了歌词创作人在创作歌词时的难度。
本申请通过利用现有的大量歌词数据训练一个预训练模型,再利用部分带标签的训练数据,训练获得词格生成模型,该词格生成模型可以针对任意的歌曲去生成该歌词的词格,因此,用户不仅可以利用词格检索词格,也可以用随意的歌词基于词格的方式检索相似的歌词,给新创作的歌词的旋律编写提供参考。
上述第一实施例提供了一种歌曲信息生成方法,与之相对应的,本申请第二实施例还提供一种歌曲信息生成装置,该装置可以以软件或硬件的方式应用于歌曲检索平台的服务器中,以执行歌曲信息的检索工作。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关的技术特征的细节部分请参见上述提供的方法实施例的对应说明即可,下述对装置实施例的描述仅仅是示意性的。
请参考图2理解该实施例,图2为本实施例提供的歌曲信息生成装置的单元框图,如图2所示,本实施例提供的歌曲信息生成装置包括:
歌曲检索信息获取单元201,用于获取输入的歌曲检索信息,所述歌曲检索信息包括初始词格数据或初始歌词数据;
目标歌曲信息获得单元202,用于响应于所述歌曲检索信息为初始词格数据,从预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;或者,响应于所述歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成所述初始歌词数据对应的初始词格数据,并从所述预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;
目标歌曲信息输出单元203,用于输出所述目标歌曲信息;
其中,所述数据库中关联存储有词格数据以及该词格数据对应的歌曲信息。
可选的,所述装置还包括:
历史歌词数据获取单元,用于获取历史歌曲的历史歌词数据;
词格数据生成单元,用于对所述历史歌词数据进行数据清洗,并基于所述词格生成模型,生成所述历史歌词数据的词格数据;
关联信息存储单元,用于将所述词格数据和所述历史歌曲的歌曲信息之间的关联信息存储于所述数据库中。
可选的,所述词格生成模型通过如下方式训练获得:
获得目标预训练模型;
获取歌词数据样本以及所述歌词数据样本对应的词格数据样本;
基于所述歌词数据样本、所述词格数据样本以及所述目标预训练模型进行模型训练,获得用于基于输入的歌词数据生成该歌词数据对应的词格数据的词格生成模型。
可选的,所述获得目标预训练模型,包括:
获取文本语料;
基于所述文本语料进行语言模型预训练,获得初始预训练模型;
利用歌词文本语料对所述初始预训练模型进行训练,获得所述目标预训练模型。
可选的,所述基于所述文本语料进行语言模型预训练,包括:
采用预训练任务以及所述文本语料进行语言模型预训练。
可选的,所述预训练任务包含以下至少一种:
预训练任务MLM;
预训练任务NSP。
可选的,所述方法还包括:采用如下方式中的一种计算所述初始词格数据与所述数据库中所存储的词格数据之间的相似度:
词向量的语义相似度;
余弦相似度;
欧式距离;
曼哈顿距离;
汉民距离。
可选的,所述目标歌曲信息包括如下中的至少一种:
目标歌曲的歌词数据;
目标歌曲的作者;
目标歌曲的谱曲;
目标歌曲的名称。
在上述实施例中,提供了一种歌曲信息生成方法以及一种歌曲信息生成装置,此外,本申请第三实施例还提供一种电子设备,由于电子设备实施例基本相似于方法实施例,所以描述得比较简单,相关的技术特征的细节部分请参见上述提供的方法实施例的对应说明即可,下述对电子设备实施例的描述仅仅是示意性的。该电子设备实施例如下:
请参考图3理解本实施例,图3为本实施例提供的电子设备的逻辑结构示意图。如图3所示,本实施例提供的电子设备包括:处理器301和存储器302;
该存储器302用于存储执行上述歌曲信息提供方法的计算机指令,该计算机指令在被处理器301读取执行时,执行如下操作:
获取输入的歌曲检索信息,所述歌曲检索信息包括初始词格数据或初始歌词数据;
响应于所述歌曲检索信息为初始词格数据,从预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;或者,
响应于所述歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成所述初始歌词数据对应的初始词格数据,并从所述预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,获取所述目标词格数据对应的目标歌曲信息;
输出所述目标歌曲信息;
其中,所述数据库中关联存储有词格数据以及该词格数据对应的歌曲信息。
可选的,还包括:
获取历史歌曲的历史歌词数据;
对所述历史歌词数据进行数据清洗,并基于所述词格生成模型,生成所述历史歌词数据的词格数据;
将所述词格数据和所述历史歌曲的歌曲信息之间的关联信息存储于所述数据库中。
可选的,所述词格生成模型通过如下方式训练获得:
获得目标预训练模型;
获取歌词数据样本以及所述歌词数据样本对应的词格数据样本;
基于所述歌词数据样本、所述词格数据样本以及所述目标预训练模型进行模型训练,获得用于基于输入的歌词数据生成该歌词数据对应的词格数据的词格生成模型。
可选的,所述获得目标预训练模型,包括:
获取文本语料;
基于所述文本语料进行语言模型预训练,获得初始预训练模型;
利用歌词文本语料对所述初始预训练模型进行训练,获得所述目标预训练模型。
可选的,所述基于所述文本语料进行语言模型预训练,包括:
采用预训练任务以及所述文本语料进行语言模型预训练。
可选的,所述预训练任务包含以下至少一种:
预训练任务MLM;
预训练任务NSP。
可选的,还包括:采用如下方式中的一种计算所述初始词格数据与所述数据库中所存储的词格数据之间的相似度:
词向量的语义相似度;
余弦相似度;
欧式距离;
曼哈顿距离;
汉民距离。
可选的,所述目标歌曲信息包括如下中的至少一种:
目标歌曲的歌词数据;
目标歌曲的作者;
目标歌曲的谱曲;
目标歌曲的名称。
在上述的实施例中,提供了一种歌曲信息生成方法、一种歌曲信息生成装置以及一种电子设备,此外,本申请第四实施例还提供了一种用于实现上述歌曲信息生成方法的计算机可读存储介质。本申请提供的计算机可读存储介质实施例描述得比较简单,相关部分请参见上述方法实施例的对应说明即可,下述描述的实施例仅仅是示意性的。
本实施例提供的计算机可读存储介质上存储有计算机指令,该指令被处理器执行时实现以下步骤:
获取输入的歌曲检索信息,所述歌曲检索信息包括初始词格数据或初始歌词数据;
响应于所述歌曲检索信息为初始词格数据,从预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;或者,
响应于所述歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成所述初始歌词数据对应的初始词格数据,并从所述预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,获取所述目标词格数据对应的目标歌曲信息;
输出所述目标歌曲信息;
其中,所述数据库中关联存储有词格数据以及该词格数据对应的歌曲信息。
可选的,还包括:
获取历史歌曲的历史歌词数据;
对所述历史歌词数据进行数据清洗,并基于所述词格生成模型,生成所述历史歌词数据的词格数据;
将所述词格数据和所述历史歌曲的歌曲信息之间的关联信息存储于所述数据库中。
可选的,所述词格生成模型通过如下方式训练获得:
获得目标预训练模型;
获取歌词数据样本以及所述歌词数据样本对应的词格数据样本;
基于所述歌词数据样本、所述词格数据样本以及所述目标预训练模型进行模型训练,获得用于基于输入的歌词数据生成该歌词数据对应的词格数据的词格生成模型。
可选的,所述获得目标预训练模型,包括:
获取文本语料;
基于所述文本语料进行语言模型预训练,获得初始预训练模型;
利用歌词文本语料对所述初始预训练模型进行训练,获得所述目标预训练模型。
可选的,所述基于所述文本语料进行语言模型预训练,包括:
采用预训练任务以及所述文本语料进行语言模型预训练。
可选的,所述预训练任务包含以下至少一种:
预训练任务MLM;
预训练任务NSP。
可选的,所述方法还包括:采用如下方式中的一种计算所述初始词格数据与所述数据库中所存储的词格数据之间的相似度:
词向量的语义相似度;
余弦相似度;
欧式距离;
曼哈顿距离;
汉民距离。
可选的,所述目标歌曲信息包括如下中的至少一种:
目标歌曲的歌词数据;
目标歌曲的作者;
目标歌曲的谱曲;
目标歌曲的名称。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

Claims (11)

1.一种歌曲信息生成方法,其特征在于,包括:
获取输入的歌曲检索信息,所述歌曲检索信息包括初始词格数据或初始歌词数据;
响应于所述歌曲检索信息为初始词格数据,从预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;或者,
响应于所述歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成所述初始歌词数据对应的初始词格数据,并从所述预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,获取所述目标词格数据对应的目标歌曲信息;
输出所述目标歌曲信息;
其中,所述数据库中关联存储有词格数据以及该词格数据对应的歌曲信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取历史歌曲的历史歌词数据;
对所述历史歌词数据进行数据清洗,并基于所述词格生成模型,生成所述历史歌词数据的词格数据;
将所述词格数据和所述历史歌曲的歌曲信息之间的关联信息存储于所述数据库中。
3.根据权利要求1或2所述的方法,其特征在于,所述词格生成模型通过如下方式训练获得:
获得目标预训练模型;
获取歌词数据样本以及所述歌词数据样本对应的词格数据样本;
基于所述歌词数据样本、所述词格数据样本以及所述目标预训练模型进行模型训练,获得用于基于输入的歌词数据生成该歌词数据对应的词格数据的词格生成模型。
4.根据权利要求3所述的方法,其特征在于,所述获得目标预训练模型,包括:
获取文本语料;
基于所述文本语料进行语言模型预训练,获得初始预训练模型;
利用歌词文本语料对所述初始预训练模型进行训练,获得所述目标预训练模型。
5.根据权利要求4所述的方法,其特征在于,所述基于所述文本语料进行语言模型预训练,包括:
采用预训练任务以及所述文本语料进行语言模型预训练。
6.根据权利要求5所述的方法,其特征在于,所述预训练任务包含以下至少一种:
预训练任务MLM;
预训练任务NSP。
7.根据权利要求1所述的方法,其特征在于,还包括:采用如下方式中的一种计算所述初始词格数据与所述数据库中所存储的词格数据之间的相似度:
词向量的语义相似度;
余弦相似度;
欧式距离;
曼哈顿距离;
汉民距离。
8.根据权利要求1所述的方法,其特征在于,所述目标歌曲信息包括如下中的至少一种:
目标歌曲的歌词数据;
目标歌曲的作者;
目标歌曲的谱曲;
目标歌曲的名称。
9.一种歌曲信息生成装置,其特征在于,所述装置包括:
歌曲检索信息获取单元,用于获取输入的歌曲检索信息,所述歌曲检索信息包括初始词格数据或初始歌词数据;
目标歌曲信息获得单元,用于响应于所述歌曲检索信息为初始词格数据,从预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;或者,响应于所述歌曲检索信息为初始歌词数据,基于预先训练的词格生成模型,生成所述初始歌词数据对应的初始词格数据,并从所述预设的数据库中获得与所述初始词格数据之间的相似度达到预定相似度阈值的目标词格数据,并获取所述目标词格数据对应的目标歌曲信息;
目标歌曲信息输出单元,用于输出所述目标歌曲信息;
其中,所述数据库中关联存储有词格数据以及该词格数据对应的歌曲信息。
10.一种电子设备,其特征在于,包括处理器和存储器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如权利要求1-8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有一条或多条计算机指令,其特征在于,该指令被处理器执行以实现如权利要求1-8中任一项所述的方法。
CN202210427069.7A 2022-04-22 2022-04-22 一种歌曲信息生成方法以及装置 Pending CN115017258A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210427069.7A CN115017258A (zh) 2022-04-22 2022-04-22 一种歌曲信息生成方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210427069.7A CN115017258A (zh) 2022-04-22 2022-04-22 一种歌曲信息生成方法以及装置

Publications (1)

Publication Number Publication Date
CN115017258A true CN115017258A (zh) 2022-09-06

Family

ID=83067393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210427069.7A Pending CN115017258A (zh) 2022-04-22 2022-04-22 一种歌曲信息生成方法以及装置

Country Status (1)

Country Link
CN (1) CN115017258A (zh)

Similar Documents

Publication Publication Date Title
Vasiliev Natural language processing with Python and spaCy: A practical introduction
US20210158795A1 (en) Generating audio for a plain text document
US10978053B1 (en) System for determining user intent from text
US11604929B2 (en) Guided text generation for task-oriented dialogue
JP2004005530A (ja) 音声対話インターフェースを利用した情報提供装置及びその方法
JP7205839B2 (ja) データ生成モデル学習装置、潜在変数生成モデル学習装置、翻訳データ生成装置、データ生成モデル学習方法、潜在変数生成モデル学習方法、翻訳データ生成方法、プログラム
US20100125459A1 (en) Stochastic phoneme and accent generation using accent class
CN110599998A (zh) 一种语音数据生成方法及装置
US11322133B2 (en) Expressive text-to-speech utilizing contextual word-level style tokens
CN113157727A (zh) 提供召回结果的方法、设备和存储介质
CN116484808A (zh) 一种公文用可控文本生成方法及装置
JP2023071771A (ja) データ生成モデル学習装置、データ生成装置、データ生成モデル学習方法、データ生成方法、プログラム
CN117591663A (zh) 一种基于知识图谱的大模型prompt生成方法
Zhu et al. A Survey of AI Music Generation Tools and Models
JP7283718B2 (ja) 音響信号検索装置、音響信号検索方法、データ検索装置、データ検索方法、プログラム
CN112883713A (zh) 基于卷积神经网络的评价对象抽取方法及装置
CN116681049A (zh) 一种文本生成方法及设备
JP2023071785A (ja) 音響信号検索装置、音響信号検索方法、データ検索装置、データ検索方法、プログラム
CN115017258A (zh) 一种歌曲信息生成方法以及装置
Cruz-Alcazar et al. Two grammatical inference applications in music processing
Agarwal et al. Next Word Prediction Using Hindi Language
CN113515949A (zh) 使用一般和目标领域知识的弱监督语义实体识别
Vogel et al. Investigating Paraphrasing-Based Data Augmentation for Task-Oriented Dialogue Systems
JP6441203B2 (ja) 音声認識結果圧縮装置、音声認識結果圧縮方法、プログラム
JP6309852B2 (ja) 強調位置予測装置、強調位置予測方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination