CN109635841B - 歌词评价方法、装置及存储介质、计算机设备 - Google Patents
歌词评价方法、装置及存储介质、计算机设备 Download PDFInfo
- Publication number
- CN109635841B CN109635841B CN201811348254.7A CN201811348254A CN109635841B CN 109635841 B CN109635841 B CN 109635841B CN 201811348254 A CN201811348254 A CN 201811348254A CN 109635841 B CN109635841 B CN 109635841B
- Authority
- CN
- China
- Prior art keywords
- lyrics
- target lyrics
- score
- target
- lyric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 76
- 238000004364 calculation method Methods 0.000 claims abstract description 34
- 230000033764 rhythmic process Effects 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 19
- 230000015654 memory Effects 0.000 claims description 35
- 239000013598 vector Substances 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000003062 neural network model Methods 0.000 claims description 4
- 230000008451 emotion Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种歌词评价方法、装置及存储介质、计算机设备,所述方法包括:将目标歌词的类别与系统中该目标歌词的主题分类进行匹配计算,得到目标歌词的分类评分;根据目标歌词的歌词演唱的速度与其对应音频文件的节奏进行相似度计算,根据计算结果得到目标歌词的旋律评分;获取目标歌词对应的歌词拼音,根据目标歌词的格式以及歌词拼音得到目标歌词每句歌词的句末词的拼音,根据句末词的拼音获得目标歌词的押韵评分;根据目标歌词的格式获取目标歌词的歌词语句间的逻辑关系,得到歌词语句间的逻辑评分;根据目标歌词的分类评分、旋律评分、押韵评分以及逻辑评分,计算目标歌词的评价得分。上述方法可以根据多方面实现歌词的自动化评价。
Description
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及一种歌词评价方法、装置及存储介质、计算机设备。
背景技术
歌词作为一种表述方式特殊的文本,通过赋予不同的节奏和音律结合歌词内容表达出不同的情感和心境。对于歌词的处理,往往是根据歌词内容制作匹配的节奏,以形成歌曲。也即是说,先制作歌词,再根据歌词制作对应曲风的音律。最终形成的歌曲,歌词本身表达是否到位,歌词与曲调是否匹配等歌词评价在音乐中尤为重要。
当前的文本评价产品主要集中在作文、翻译等文本内容的评价,评价的方式也主要从文本内容的语法表达及语义表达的连贯性等方面进行评估。然而,歌词作为一种表述方式特殊的文本,除了语义、语法方面的要求之外,也必须考虑到节奏、韵律、情感等方面的要求。传统采用人工对歌词进行多方面的评估以及结合评估结果进行改进创作等,花费大量的人力,并且效率相对较低。
发明内容
本发明提出一种歌词评价方法、装置及存储介质、计算机设备,以根据多方面实现歌词的自动化评价,从而节约歌词创作流程中的人工评价成本。
本发明提供以下方案:
一种歌词评价方法,包括:根据目标歌词的文本确定所述目标歌词的类别,将所述目标歌词的类别与系统中该目标歌词的主题分类进行匹配计算,得到所述目标歌词的分类评分;根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分;获取所述目标歌词对应的歌词拼音,识别所述目标歌词的格式,根据所述目标歌词的格式以及所述歌词拼音得到所述目标歌词每句歌词的句末词的拼音,根据所述句末词的拼音获得所述目标歌词的押韵评分;根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分;根据所述目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分。
在一实施例中,所述根据目标歌词的文本确定所述目标歌词的类别,包括:将所述目标歌词的文本通过one-hot独热码的方式获得所述文本的数字编码;将所述数字编码通过word embedding词嵌入模型矩阵,得到对应的词向量;将所述词向量输入到神经网络模型,获取所述目标歌词的类别。
在一实施例中,所述word embedding词嵌入模型通过以下方式进行训练:获取歌词数据库中的多篇歌词作为训练样本;根据所述训练样本利用CBOW连续词袋模型对所述word embedding词嵌入模型进行训练。
在一实施例中,所述根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分,包括:根据所述时间轴信息计算所述目标歌词各个段落的所述歌词演唱速度;通过声波波形处理算法获取所述音频文件中各个时间段落的音乐节拍;获取所述各个段落的所述歌词演唱速度与其对应的所述各个时间段落的音乐节拍的差值,将该差值作为相似度值;根据所述相似度值得到所述目标歌词的旋律评分。
在一实施例中,所述根据所述句末词的拼音获得所述目标歌词的押韵评分,包括:根据所述目标歌词的格式确定所述目标歌词需要押韵的句子;获取需要押韵的句子的句末词的拼音,并根据该句末词的拼音确定出需要押韵的句子的押韵情况;根据所述押韵情况获得对应的所述押韵评分。
在一实施例中,所述根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分,包括:根据所述目标歌词的格式获取所述目标歌词的歌词语句;通过word embedding词嵌入模型获取所述歌词语句的词向量;计算所述歌词语句的词向量之间的余弦相似度;根据所述余弦相似度确定所述歌词语句间的逻辑评分。
在一实施例中,所述根据所述目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分,包括:将所述分类评分乘以其相应的权重、所述旋律评分乘以其相应的权重、所述押韵评分乘以其相应的权重以及所述逻辑评分乘以其相应的权重后进行累加,并将累加值作为所述目标歌词的评价得分。
一种歌词评价装置,包括:第一获取模块,用于根据目标歌词的文本确定所述目标歌词的类别,将所述目标歌词的类别与系统中该目标歌词的主题分类进行匹配计算,得到所述目标歌词的分类评分;第二获取模块,用于根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分;第三获取模块,用于获取所述目标歌词对应的歌词拼音,识别所述目标歌词的格式,根据所述目标歌词的格式以及所述歌词拼音得到所述目标歌词每句歌词句末词的拼音,根据所述句末词的拼音获得所述目标歌词的押韵评分;第四获取模块,用于根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分;计算模块,用于根据所述目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分。
一种存储介质,其上存储有计算机程序;所述计算机程序适于由处理器加载并执行上述任一实施例所述的歌词评价方法。
一种计算机设备,其包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据上述任一实施例所述的歌词评价方法。
上述实施例提供的歌词评价方法,系统首先根据目标歌词的文本确定其类型,并将该类型与系统中该目标歌词的归类进行匹配计算,得到其分类评分。再者,根据其时间轴信息确定其歌词演唱速度与音频文件中节奏的相似度,得到其旋律评分。另外,根据其格式以及歌词拼音确定每句歌词的句末词拼音,以得到其押韵评分。此外,还根据其格式获取歌词语句间的逻辑关系,得到其逻辑评分。最终根据所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分。因此,对目标歌词的评价,除了在语义、语法方面的考量之外,也结合对应歌曲的节奏、韵律、情感等方面评价,可实现针对歌词从多个方面进行自动评价,包括语法、语义、节奏、韵律等,从而节约了歌词创作流程中的人工评价成本。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明提供的歌词评价方法的应用场景的一实施例中的结构示意图;
图2为本发明提供的一种歌词评价方法的一实施例中的方法流程图;
图3为本发明提供的步骤S100的一实施例中的方法流程图;
图4为本发明提供的步骤S200的一实施例中的方法流程图;
图5为本发明提供的步骤S300的一实施例中的方法流程图;
图6为本发明提供的步骤S400的一实施例中的方法流程图;
图7为本发明提供的一种歌词评价装置的一实施例中的结构框图;
图8为本发明提供的一种计算机设备的一实施例中的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式,这里使用的“第一”、“第二”仅用于区别同一技术特征,并不对该技术特征的顺序和数量等加以限定。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本发明提供的一种歌词评价方法,适用于各种将歌词进行多方面分析评估以得到歌词评价的平台、终端或者服务器。系统通过该歌词评价方法对用户输入的歌词进行相应的分析,以得到该歌词的评价。以下先对该歌词评价方法的应用环境进行先导性说明:
如图1所示,服务器100与用户终端位于同一个网络200环境中,后服务器100与用户终端通过网络200进行数据信息的交互。用户终端可包括手机303以及pad等移动终端,也可以包括笔记本电脑以及台式电脑等。网络200可包括无线网络和/或有线网络。服务器100通过网络200获取用户输入的歌词,根据本发明所述的歌词评价方法对该歌词进行多方面的分析,以得到该歌词的最终评价。服务器100的数量与用户终端中的用户的数量均不作限定,图1所示只作为示例说明。用户终端中安装有接收歌词输入的客户端。用户可以通过客户端与对应的服务器100进行信息交互。客户端与服务器100相对应,共同遵循同一套数据协议,使得服务器100跟客户端能够互相解析出对方的数据,向用户下发歌词的评价结果。
本发明提供一种歌词评价方法。在一实施例中,如图2所示,该歌词评价方法,包括以下步骤:
S100,根据目标歌词的文本确定所述目标歌词的类别,将所述目标歌词的类别与系统中该目标歌词的主题分类进行匹配计算,得到所述目标歌词的分类评分。
在本实施例中,系统首先根据目标歌词的文本确定出目标歌词的类别。具体可以是,通过对歌词文本内容的识别,确定出与该歌词文本内容匹配的类别。同时,系统之前针对该目标歌词标注有相应的主题类别。该主题类别可以是人工标注,也可以是采用其他自动化方式由系统自动标注。进一步地,将根据目标歌词的文本确定的目标歌词的类别与系统中针对该目标歌词标注的主题类别进行匹配计算,根据计算结果确定目标歌词的分类评分。具体可以是,系统将该匹配计算结果值与分类评分值通过相关公式进行关联,每个结果值对应一个分类评分值。通过上述匹配计算,可得到对应的一个分类评分值。或者,若匹配计算的结果值达到某一预设分值,在系统根据该预设分值匹配出一个分类评分值。如,匹配结果值大于80分且小于90分,则分类评分为90分。匹配结果值大于90分且小于95分,则分类评分为95分。
在一实施例中,如图3所示,步骤S100,包括:
S110,将所述目标歌词的文本通过one-hot独热码的方式获得所述文本的数字编码。
S120,将所述数字编码通过word embedding词嵌入模型矩阵,得到对应的词向量。
S130,将所述词向量输入到神经网络模型,获取所述目标歌词的类别。
其中,所述word embedding词嵌入模型通过以下方式进行训练:
获取歌词数据库中的多篇歌词作为训练样本;根据所述训练样本利用CBOW连续词袋模型对所述word embedding词嵌入模型进行训练。
在本实施例中,采用word embedding(词嵌入)和卷积神经网络(CNN)相结合的方法来实现目标歌词的主题分类和风格分类,从而实现评价歌词与主题是否契合、与风格是否吻合。首先将目标歌词的文本通过one-hot独热编码的形式生成对应的数字编码,然后通过训练好的word embedding模型矩阵进行映射,以输出低维度、连续的词向量。进而,将获得的词向量输入至卷积神经网络(CNN)模型当中,经过卷积层、池化层以及最后的分类层,计算出每个类对应的概率。根据概率的大小,可以获取分类结果。其中,word embedding采用CBOW(连续词袋)模型训练词向量,该模型由Word2Vec(一群用来产生词向量的相关模型)工具实现,可以直接使用。
S200,根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分。
在本实施例中,系统获取目标歌词对应的时间轴信息,根据时间轴信息可计算出目标歌词在各个段落的歌词演唱速度。同时,针对目标歌词对应的音频文件,如midi文件,可通过声波波形处理算法,计算出目标歌词各个时间段的音乐节拍。根据上述两步计算出的歌词演唱速度和音乐节拍信息之间的差值,同时根据其差值进行相似度计算,可以获取歌词与音乐两者之间匹配度的评价,也即是获得目标歌词的旋律评分。
在一实施例中,如图4所示,步骤S200,包括:
S210,根据所述时间轴信息计算所述目标歌词各个段落的所述歌词演唱速度。
S220,通过声波波形处理算法获取所述音频文件中各个时间段落的音乐节拍。
S230,获取所述各个段落的所述歌词演唱速度与其对应的所述各个时间段落的音乐节拍的差值,将该差值作为相似度值。
S240,根据所述相似度值得到所述目标歌词的旋律评分。
在本实施例中,通过目标歌词文件中的时间轴信息计算出歌词演唱的速度,可以是计算平均速度,然后与音频文件(例如midi)提取的节奏进行相似度计算匹配,从而实现歌词与乐曲的在节奏和旋律的匹配方面的评价。具体可以是,根据目标歌词的文本对应的时间轴信息,计算出对应音乐在各个段落的歌词演唱速度。针对对应音乐的音频文件,通过声波波形处理算法,计算出各个时间段的音乐节拍,进而根据上述两步计算出歌词演唱速度和音乐节拍信息之间的差值,根据差值可获取歌词与音乐两者之间匹配度的评价,也即是可获得所述目标歌词的旋律评分。例如,系统设置多个分值范围,每个分值范围对应一个旋律得分。系统将该差值与所述多个分值范围进行对比,当该差值落入某个分值范围时,将该分值范围对应的旋律得分作为所述旋律评分。
S300,获取所述目标歌词对应的歌词拼音,识别所述目标歌词的格式,根据所述目标歌词的格式以及所述歌词拼音得到所述目标歌词每句歌词的句末词的拼音,根据所述句末词的拼音获得所述目标歌词的押韵评分。
在本实施例中,系统进一步对目标歌词的押韵情况进行判断。具体可通过将目标歌词的文字转化为拼音,以便找到每句歌词末尾的词是否具有相同的韵脚。系统通过对目标歌词的格式进行识别,可读取出需要押韵的语句,并获取该语句的句尾词的拼音,进而判断是否押韵。最终根据目标歌词的押韵情况确定目标歌词的押韵评分。
在一实施例中,如图5所示,步骤S300,包括:
S310,根据所述目标歌词的格式确定所述目标歌词需要押韵的句子。
S320,获取需要押韵的句子的句末词的拼音,并根据该句末词的拼音确定出需要押韵的句子的押韵情况。
S330,根据所述押韵情况获得对应的所述押韵评分。
在本实施例中,系统对目标歌词的押韵情况进行判断。具体地,通过将目标歌词的文字转化为对应的拼音,并根据目标歌词的格式获取到目标歌词需要押韵的句子,进一步获取押韵句子的句末词的拼音,从而确定整个目标歌词的押韵情况,根据押韵情况确定对应的押韵评分。可以是,目标歌词的格式获取目标歌词的所有需要押韵的句子,并确定其需要押韵的句子的数量。获取所有需要押韵的句子中押韵的句子的数量,将所述押韵的句子的数量除以所述需要押韵的句子的数量,得到押韵比。根据押韵比得到所述押韵评分。例如,系统设置每个押韵比对应一个押韵分值,将获得的押韵比与系统的押韵分值进行匹配,将匹配得到的押韵分值作为所述押韵评分。
S400,根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分。
在本实施例中,系统对目标歌词中的歌词语句间的逻辑关联性进行判断。具体地,根据目标歌词的格式获取到该目标歌词的语句以及段落。进一步地,获取目标歌词语句间的逻辑关系。可以是,直接根据相关的逻辑算法计算相邻两句语句间的逻辑关系,也可以是先确定目标歌词的段落关系,再进一步根据段落关系确定段落间语句的逻辑关系。最终根据目标歌词语句间的逻辑关系确定该目标歌词的逻辑评分。可以是,目标歌词的每个歌词语句间的逻辑关系对应一个分值,最终将所有分值进行累加,获取累加结果值的均值作为所述逻辑评分。也可以是,目标歌词的每个歌词语句间的逻辑关系对应一个分值,将每个分值乘以其权重值,获取所有分值乘以其权重值之后的累加值,将该累加值作为所述逻辑评分。
在一实施例中,如图6所示,步骤S400,包括:
S410,根据所述目标歌词的格式获取所述目标歌词的歌词语句。
S420,通过word embedding词嵌入模型获取所述歌词语句的词向量。
S430,计算所述歌词语句的词向量之间的余弦相似度。
S440,根据所述余弦相似度确定所述歌词语句间的逻辑评分。
在本实施例中,系统对目标歌词的语句间的逻辑关联性进行判断。首先利用大规模语料训练word embedding模型,由此得到每条语句的词向量组合。将目标歌词的每个语句输入到word embedding模型中,得到每条语句的词向量,再计算两个词向量组合之间的余弦相似度。根据相似度确定所述逻辑评分。其中,相似度计算公式为:
A、B表示两个词向量,cosθ表示向量A和向量B之间的余弦相似度。
S500,根据所述目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分。
在本实施例中,系统根据目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分。因此,对目标歌词的评价,除了在语义、语法方面的考量之外,也结合对应歌曲的节奏、韵律、情感等方面评价,可实现针对歌词从多个方面进行自动评价,包括语法、语义、节奏、韵律等,从而节约了歌词创作流程中的人工评价成本。
在一实施例中,步骤S500,包括:将所述分类评分乘以其相应的权重、所述旋律评分乘以其相应的权重、所述押韵评分乘以其相应的权重以及所述逻辑评分乘以其相应的权重后进行累加,并将累加值作为所述目标歌词的评价得分。
本实施例中,在目标歌词的评价方案中,目标歌词的分类评分、旋律评分、押韵评分以及逻辑评分在总体评分过程应根据每个的重要程度对应相应的权值比重,此处将所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分分别乘以相应的权重值之后进行累加,将累加结果值作为最终的目标歌词的评价得分。
本发明还提供一种歌词评价装置。在一实施例中,如图7所示,该歌词评价装置包括第一获取模块10、第二获取模块20、第三获取模块30、第四获取模块40以及计算模块50。
第一获取模块10用于根据目标歌词的文本确定所述目标歌词的类别,将所述目标歌词的类别与系统中该目标歌词的主题分类进行匹配计算,得到所述目标歌词的分类评分。在本实施例中,系统首先根据目标歌词的文本确定出目标歌词的类别。具体可以是,通过对歌词文本内容的识别,确定出与该歌词文本内容匹配的类别。同时,系统之前针对该目标歌词标注有相应的主题类别。该主题类别可以是人工标注,也可以是采用其他自动化方式由系统自动标注。进一步地,将根据目标歌词的文本确定的目标歌词的类别与系统中针对该目标歌词标注的主题类别进行匹配计算,根据计算结果确定目标歌词的分类评分。具体可以是,系统将该匹配计算结果值与分类评分值通过相关公式进行关联,每个结果值对应一个分类评分值。通过上述匹配计算,可得到对应的一个分类评分值。或者,若匹配计算的结果值达到某一预设分值,在系统根据该预设分值匹配出一个分类评分值。如,匹配结果值大于80分且小于90分,则分类评分为90分。匹配结果值大于90分且小于95分,则分类评分为95分。
第二获取模块20用于根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分。在本实施例中,系统获取目标歌词对应的时间轴信息,根据时间轴信息可计算出目标歌词在各个段落的歌词演唱速度。同时,针对目标歌词对应的音频文件,如midi文件,可通过声波波形处理算法,计算出目标歌词各个时间段的音乐节拍。根据上述两步计算出的歌词演唱速度和音乐节拍信息之间的差值,同时根据其差值进行相似度计算,可以获取歌词与音乐两者之间匹配度的评价,也即是获得目标歌词的旋律评分。
第三获取模块30用于获取所述目标歌词对应的歌词拼音,识别所述目标歌词的格式,根据所述目标歌词的格式以及所述歌词拼音得到所述目标歌词每句歌词句末词的拼音,根据所述句末词的拼音获得所述目标歌词的押韵评分。在本实施例中,系统进一步对目标歌词的押韵情况进行判断。具体可通过将目标歌词的文字转化为拼音,以便找到每句歌词末尾的词是否具有相同的韵脚。系统通过对目标歌词的格式进行识别,可读取出需要押韵的语句,并获取该语句的句尾词的拼音,进而判断是否押韵。最终根据目标歌词的押韵情况确定目标歌词的押韵评分。
第四获取模块40用于根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分。在本实施例中,系统对目标歌词中的歌词语句间的逻辑关联性进行判断。具体地,根据目标歌词的格式获取到该目标歌词的语句以及段落。进一步地,获取目标歌词语句间的逻辑关系。可以是,直接根据相关的逻辑算法计算相邻两句语句间的逻辑关系,也可以是先确定目标歌词的段落关系,再进一步根据段落关系确定段落间语句的逻辑关系。最终根据目标歌词语句间的逻辑关系确定该目标歌词的逻辑评分。可以是,目标歌词的每个歌词语句间的逻辑关系对应一个分值,最终将所有分值进行累加,获取累加结果值的均值作为所述逻辑评分。也可以是,目标歌词的每个歌词语句间的逻辑关系对应一个分值,将每个分值乘以其权重值,获取所有分值乘以其权重值之后的累加值,将该累加值作为所述逻辑评分。
计算模块50用于根据所述目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分。在本实施例中,系统根据目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分。因此,对目标歌词的评价,除了在语义、语法方面的考量之外,也结合对应歌曲的节奏、韵律、情感等方面评价,可实现针对歌词从多个方面进行自动评价,包括语法、语义、节奏、韵律等,从而节约了歌词创作流程中的人工评价成本。
在其他实施例中,本发明提供的歌词评价装置中的各个模块还用于执行本发明所述的歌词评价方法中,对应各个步骤执行的操作,在此不再做详细的说明。
本发明还提供一种存储介质。该存储介质上存储有计算机程序;所述计算机程序被处理器执行时,实现上述任一实施例所述的歌词评价方法。该存储介质可以是存储器。例如,内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储介质包括但不限于这些类型的存储器。本发明所公开的存储器只作为例子而非作为限定。
本发明还提供一种计算机设备。一种计算机设备包括:一个或多个处理器;存储器;一个或多个应用程序。其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述任一实施例所述的歌词评价方法。
图8为本发明一实施例中的计算机设备的结构示意图。本实施例所述计算机设备可以是服务器、个人计算机以及网络设备。如图8所示,设备包括处理器803、存储器805、输入单元807以及显示单元809等器件。本领域技术人员可以理解,图8示出的设备结构器件并不构成对所有设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储器805可用于存储应用程序801以及各功能模块,处理器803运行存储在存储器805的应用程序801,从而执行设备的各种功能应用以及数据处理。存储器可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储器包括但不限于这些类型的存储器。本发明所公开的存储器只作为例子而非作为限定。
输入单元807用于接收信号的输入,以及接收用户输入的关键字。输入单元807可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元809可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元809可采用液晶显示器、有机发光二极管等形式。处理器803是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器803内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。
在一实施方式中,设备包括一个或多个处理器803,以及一个或多个存储器805,一个或多个应用程序801。其中所述一个或多个应用程序801被存储在存储器805中并被配置为由所述一个或多个处理器803执行,所述一个或多个应用程序801配置用于执行以上实施例所述的歌词评价方法。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括存储器、磁盘或光盘等。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
应该理解的是,在本发明各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种歌词评价方法,其特征在于,包括:
根据目标歌词的文本确定所述目标歌词的类别,将所述目标歌词的类别与系统中该目标歌词的主题分类进行匹配计算,得到所述目标歌词的分类评分;
根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分;
获取所述目标歌词对应的歌词拼音,识别所述目标歌词的格式,根据所述目标歌词的格式以及所述歌词拼音得到所述目标歌词每句歌词的句末词的拼音,根据所述句末词的拼音获得所述目标歌词的押韵评分;
根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分;
根据所述目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分;
所述根据目标歌词的文本确定所述目标歌词的类别,包括:
将所述目标歌词的文本通过one-hot独热码的方式获得所述文本的数字编码;
将所述数字编码通过word embedding词嵌入模型矩阵,得到对应的词向量;
将所述词向量输入到神经网络模型,获取所述目标歌词的类别;
所述根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分,包括:
根据所述时间轴信息计算所述目标歌词各个段落的所述歌词演唱的速度;
通过声波波形处理算法获取所述音频文件中各个时间段落的音乐节拍;
获取所述各个段落的所述歌词演唱速度与其对应的所述各个时间段落的音乐节拍的差值,将该差值作为相似度值;
根据所述相似度值得到所述目标歌词的旋律评分;
所述根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分,包括:
根据所述目标歌词的格式获取所述目标歌词的歌词语句;
通过word embedding词嵌入模型获取所述歌词语句的词向量;
计算所述歌词语句的词向量之间的余弦相似度;
根据所述余弦相似度确定所述歌词语句间的逻辑评分。
2.根据权利要求1所述的方法,其特征在于,所述word embedding词嵌入模型通过以下方式进行训练:
获取歌词数据库中的多篇歌词作为训练样本;
根据所述训练样本利用CBOW连续词袋模型对所述word embedding词嵌入模型进行训练。
3.根据权利要求1所述的方法,其特征在于,所述根据所述句末词的拼音获得所述目标歌词的押韵评分,包括:
根据所述目标歌词的格式确定所述目标歌词需要押韵的句子;
获取需要押韵的句子的句末词的拼音,并根据该句末词的拼音确定出需要押韵的句子的押韵情况;
根据所述押韵情况获得对应的所述押韵评分。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分,包括:
将所述分类评分乘以其相应的权重、所述旋律评分乘以其相应的权重、所述押韵评分乘以其相应的权重以及所述逻辑评分乘以其相应的权重后进行累加,并将累加值作为所述目标歌词的评价得分。
5.一种歌词评价装置,其特征在于,包括:
第一获取模块,用于根据目标歌词的文本确定所述目标歌词的类别,将所述目标歌词的类别与系统中该目标歌词的主题分类进行匹配计算,得到所述目标歌词的分类评分;
第二获取模块,用于根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分;
第三获取模块,用于获取所述目标歌词对应的歌词拼音,识别所述目标歌词的格式,根据所述目标歌词的格式以及所述歌词拼音得到所述目标歌词每句歌词句末词的拼音,根据所述句末词的拼音获得所述目标歌词的押韵评分;
第四获取模块,用于根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分;
计算模块,用于根据所述目标歌词的所述分类评分、所述旋律评分、所述押韵评分以及所述逻辑评分,计算所述目标歌词的评价得分;
所述根据目标歌词的文本确定所述目标歌词的类别,包括:
将所述目标歌词的文本通过one-hot独热码的方式获得所述文本的数字编码;
将所述数字编码通过word embedding词嵌入模型矩阵,得到对应的词向量;
将所述词向量输入到神经网络模型,获取所述目标歌词的类别;
所述根据所述目标歌词对应的时间轴信息计算所述目标歌词中歌词演唱的速度,将所述歌词演唱的速度与所述目标歌词对应的音频文件的节奏进行相似度计算,根据计算结果得到所述目标歌词的旋律评分,包括:
根据所述时间轴信息计算所述目标歌词各个段落的所述歌词演唱的速度;
通过声波波形处理算法获取所述音频文件中各个时间段落的音乐节拍;
获取所述各个段落的所述歌词演唱速度与其对应的所述各个时间段落的音乐节拍的差值,将该差值作为相似度值;
根据所述相似度值得到所述目标歌词的旋律评分;
所述根据所述目标歌词的格式获取所述目标歌词的歌词语句间的逻辑关系,得到所述歌词语句间的逻辑评分,包括:
根据所述目标歌词的格式获取所述目标歌词的歌词语句;
通过word embedding词嵌入模型获取所述歌词语句的词向量;
计算所述歌词语句的词向量之间的余弦相似度;
根据所述余弦相似度确定所述歌词语句间的逻辑评分。
6.一种存储介质,其特征在于,其上存储有计算机程序;所述计算机程序适于由处理器加载并执行上述权利要求1至4中任一项所述的歌词评价方法。
7.一种计算机设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据权利要求1至4任一项所述的歌词评价方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811348254.7A CN109635841B (zh) | 2018-11-13 | 2018-11-13 | 歌词评价方法、装置及存储介质、计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811348254.7A CN109635841B (zh) | 2018-11-13 | 2018-11-13 | 歌词评价方法、装置及存储介质、计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109635841A CN109635841A (zh) | 2019-04-16 |
CN109635841B true CN109635841B (zh) | 2023-11-03 |
Family
ID=66067854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811348254.7A Active CN109635841B (zh) | 2018-11-13 | 2018-11-13 | 歌词评价方法、装置及存储介质、计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109635841B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188356B (zh) * | 2019-05-30 | 2023-05-19 | 腾讯音乐娱乐科技(深圳)有限公司 | 信息处理方法及装置 |
CN113744721B (zh) * | 2021-09-07 | 2024-05-14 | 腾讯音乐娱乐科技(深圳)有限公司 | 模型训练方法、音频处理方法、设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971674A (zh) * | 2014-05-22 | 2014-08-06 | 天格科技(杭州)有限公司 | 一种评分准确、用户体验好的演唱实时评分方法 |
WO2015125321A1 (ja) * | 2014-02-21 | 2015-08-27 | 独立行政法人産業技術総合研究所 | 多角的歌声分析システム及び多角的歌声分析方法 |
CN106547789A (zh) * | 2015-09-22 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 一种歌词生成方法及装置 |
CN108520740A (zh) * | 2018-04-13 | 2018-09-11 | 国家计算机网络与信息安全管理中心 | 基于多种特征的音频内容一致性分析方法和分析系统 |
-
2018
- 2018-11-13 CN CN201811348254.7A patent/CN109635841B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015125321A1 (ja) * | 2014-02-21 | 2015-08-27 | 独立行政法人産業技術総合研究所 | 多角的歌声分析システム及び多角的歌声分析方法 |
CN103971674A (zh) * | 2014-05-22 | 2014-08-06 | 天格科技(杭州)有限公司 | 一种评分准确、用户体验好的演唱实时评分方法 |
CN106547789A (zh) * | 2015-09-22 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 一种歌词生成方法及装置 |
CN108520740A (zh) * | 2018-04-13 | 2018-09-11 | 国家计算机网络与信息安全管理中心 | 基于多种特征的音频内容一致性分析方法和分析系统 |
Non-Patent Citations (1)
Title |
---|
歌词与内容相结合的流行音乐结构分析;梁塽 等;山东大学学报(工学版);第40卷(第5期);第77-81页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109635841A (zh) | 2019-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304375B (zh) | 一种信息识别方法及其设备、存储介质、终端 | |
Lo et al. | Cost-sensitive multi-label learning for audio tag annotation and retrieval | |
Jamdar et al. | Emotion analysis of songs based on lyrical and audio features | |
CN111858859A (zh) | 自动问答处理方法、装置、计算机设备及存储介质 | |
CN111143604B (zh) | 一种音频的相似度匹配方法、装置及存储介质 | |
EP1840764A1 (en) | Hybrid audio-visual categorization system and method | |
CN110188356B (zh) | 信息处理方法及装置 | |
CN111563158B (zh) | 文本排序方法、排序装置、服务器和计算机可读存储介质 | |
CN109299272B (zh) | 一种用于神经网络输入的大信息量文本表示方法 | |
CN111382260A (zh) | 一种检索文本纠错方法、装置和存储介质 | |
CN108766451B (zh) | 一种音频文件处理方法、装置和存储介质 | |
CN109635841B (zh) | 歌词评价方法、装置及存储介质、计算机设备 | |
Ünal et al. | A hierarchical approach to makam classification of Turkish makam music, using symbolic data | |
Hyung et al. | Utilizing context-relevant keywords extracted from a large collection of user-generated documents for music discovery | |
CN113010730A (zh) | 音乐文件生成方法、装置、设备及存储介质 | |
CN114328823A (zh) | 数据库自然语言查询方法及装置、电子设备、存储介质 | |
Sumi et al. | Automatic Chord Recognition Based on Probabilistic Integration of Chord Transition and Bass Pitch Estimation. | |
CN111460215B (zh) | 音频数据处理方法、装置、计算机设备以及存储介质 | |
Van Den Bosch | Scalable classification-based word prediction and confusible correction | |
Arronte Alvarez et al. | Distributed vector representations of folksong motifs | |
Coviello et al. | Automatic Music Tagging With Time Series Models. | |
Chen et al. | On the use of anti-word models for audio music annotation and retrieval | |
Fuentes | Multi-scale computational rhythm analysis: a framework for sections, downbeats, beats, and microtiming | |
CN113822081A (zh) | 翻译效果评估方法、装置、电子设备和存储介质 | |
Kher | Music Composer Recognition from MIDI Representation using Deep Learning and N-gram Based Methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |