CN102880648A

CN102880648A - 一种对歌曲进行分析的方法及装置

Info

Publication number: CN102880648A
Application number: CN2012103068952A
Authority: CN
Inventors: 朱中的
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Yinzhibang Culture Technology Co ltd
Priority date: 2012-08-24
Filing date: 2012-08-24
Publication date: 2013-01-16

Abstract

本发明提供了一种对歌曲进行分析的方法及装置，其中对歌曲进行分析的方法包括：A.利用歌曲对应的歌词中的时间轴标签，确定所述歌词中的相似分句；B.利用所述歌词中的相似分句确定所述歌曲中具有相似性的同类音乐段落。通过上述方式，能够降低获取同类音乐段落的难度，提高各种依赖于同类音乐段落的相关应用的处理效率。

Description

一种对歌曲进行分析的方法及装置

【技术领域】

本发明涉及数据处理技术，特别涉及一种对歌曲进行分析的方法及装置。

【背景技术】

对歌曲进行分析，以确定歌曲中旋律相似的同类音乐段落，对很多与音乐相关的应用都有积极的意义。

例如很多音乐网站为了让用户更好地下载所需歌曲，为可供下载的歌曲提供了试听功能，但是由于很多用户只熟悉歌曲中的某些片段，如果将一首歌曲从头开始供用户试听，不仅会浪费用户的时间，也会浪费网站的资源。歌曲中同类音乐段落具有重复性，通常是用户最容易记住的音乐片段，因此将歌曲中的同类音乐段落提取出来供用户试听，可以有效提高音乐网站的服务效率。

此外，如果一首歌曲中的音乐段落可划分为多个集合，每个集合由同类音乐段落构成，则歌曲中的高潮片段通常是其中一个集合中的同类音乐段落。可以理解，从歌曲中提取高潮片段作为手机铃声，可以有效改善手机铃声的质量。

此外，确定歌曲的同类音乐段落，还有利于对音乐进行分类，在音乐检索和音乐推荐中都具有积极的意义。

目前，对歌曲进行分析，通常是从歌曲的音频角度考虑的，例如比较歌曲各个音乐段落的音频相似度，以对各音乐段落进行归类。但是对歌曲进行音频分析的难度较大，计算的复杂性高。

【发明内容】

本发明所要解决的技术问题是提供一种对歌曲进行分析的方法及装置，以降低获取同类音乐段落的难度。

本发明为解决技术问题而采用的技术方案是提供一种对歌曲进行分析的方法，包括：A.利用歌曲对应的歌词中的时间轴标签，确定所述歌词中的相似分句；B.利用所述歌词中的相似分句确定所述歌曲中具有相似性的同类音乐段落。

根据本发明之一优选实施例，所述方法进一步包括：从所述同类音乐段落中提取所述歌曲的高潮片段。

根据本发明之一优选实施例，所述方法进一步包括：在所述同类音乐段落对应的歌词间建立比对关系，并根据所述比对关系生成所述歌曲对应的歌词的流程图。

根据本发明之一优选实施例，所述步骤A包括：根据所述歌词中的时间轴标签提取所述歌词中的各个文本分句；依据预设策略确定各个文本分句间的相似度，并将相似度大于设定的第一阈值的文本分句作为所述歌词中的相似分句。

根据本发明之一优选实施例，所述预设策略至少包括以下策略中的一种：策略一：根据各个文本分句中词语的共现程度确定各个文本分句间的相似度，所述共现程度由词语的共现数量及共现位置确定；策略二：根据各个文本分句中对应位置的词语的词性匹配度确定各个文本分句间的相似度；策略三：根据各个文本分句的文本编辑距离、文本最长公共子串、或文本汉明距离确定各个文本分句间的相似度。

根据本发明之一优选实施例，所述步骤B包括：根据所述歌词中的时间轴标签提取所述歌词中的各个文本段落；将对应位置的相似分句所占比例大于设定的第二阈值的文本段落所对应的音乐段落作为所述歌曲的同类音乐段落。

根据本发明之一优选实施例，所述步骤B进一步包括：利用所述同类音乐段落的音频指纹特征对所述同类音乐段落的相似有效性进行验证，以过滤所述同类音乐段落中相似有效性低的音乐段落。

本发明还提供了一种对歌曲进行分析的装置，包括：分句确定单元，用于利用歌曲对应的歌词中的时间轴标签，确定所述歌词中的相似分句；段落确定单元，用于根据所述歌词中的相似分句确定所述歌曲的同类音乐段落。

根据本发明之一优选实施例，所述装置进一步包括：高潮确定单元，用于从所述同类音乐段落中提取所述歌曲的高潮片段。

根据本发明之一优选实施例，所述装置进一步包括：歌词流程图生成单元，用于在所述同类音乐段落对应的歌词间建立比对关系，并根据所述比对关系生成所述歌曲对应的歌词的流程图。

根据本发明之一优选实施例，所述分句确定单元包括：分句提取单元，用于根据所述歌词中的时间轴标签提取所述歌词中的各个文本分句；分句比对单元，用于依据预设策略确定各个文本分句间的相似度，并将相似度大于设定的第一阈值的文本分句作为所述歌词中的相似分句。

根据本发明之一优选实施例，所述段落确定单元包括：段落提取单元，用于根据所述歌词中的时间轴标签提取所述歌词中的各个文本段落；归类单元，用于将对应位置的相似分句所占比例大于设定的第二阈值的文本段落所对应的音乐段落作为所述歌曲的同类音乐段落。

根据本发明之一优选实施例，所述段落确定单元进一步包括：验证单元，用于利用所述同类音乐段落的音频指纹特征对所述同类音乐段落的相似有效性进行验证，以过滤所述同类音乐段落中相似有效性低的音乐段落。

由以上技术方案可以看出，本发明通过利用歌曲对应的歌词，能够实现一种通过文本分析来确定歌曲中的同类音乐段落的歌曲分析方法，该方法能够有效降低获取同类音乐段落的难度，从而提高各种依赖于同类音乐段落的相关应用的处理效率。

【附图说明】

图1为本发明中对歌曲进行分析的方法的流程示意图；

图2为本发明中对具有时间轴标签的歌词的示意图；

图3为本发明中部分歌词流程图的示意图；

图4为本发明中对歌曲进行分析的装置的实施例一的结构示意框图；

图5为本发明中分句确定单元的实施例的结构示意框图；

图6为本发明中段落确定单元的实施例一的结构示意框图；

图7为本发明中段落确定单元的实施例二的结构示意框图；

图8为本发明中对歌曲进行分析的装置的实施例二的结构示意框图；

图9为本发明中对歌曲进行分析的装置的实施例三的结构示意框图。

【具体实施方式】

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

请参考图1，图1为本发明中对歌曲进行分析的方法的流程示意图。如图1所示，该方法包括：

步骤S101：利用歌曲对应的歌词中的时间轴标签，确定歌词中的相似分句。

步骤S102：利用歌词中的相似分句确定歌曲中具有相似性的同类音乐段落。

下面对上述步骤进行详细说明。

本发明中提到的歌词，为具有时间轴标签的歌词。请参考图2，图2为本发明中具有时间轴标签的歌词的示意图。时间轴标签，表示的是歌词中的当前文本行在歌曲中演唱的开始时刻。目前，互联网上存在大量的音乐资源，这些音乐资源除了包含歌曲的音频文件以外，还有对应音频文件的具有时间轴标签的歌词文本。本发明可预先通过在互联网上进行数据挖掘或通过人工标注时间轴标签的方式，获取到歌曲对应的具有时间轴标签的歌词文本，由于数据挖掘属于现有技术，在此不再赘述其实现过程。

作为步骤S101的一种实施方式，步骤S101包括：

步骤S1011：根据歌词中的时间轴标签提取歌词中的各个文本分句。

步骤S1012：依据预设策略确定各个文本分句间的相似度，并将相似度大于设定的第一阈值的文本分句作为歌词中的相似分句。其中第一阈值的大小用于对文本分句之间相似程度进行控制。

歌词中的每个时间轴标签对应的就是歌词中的一个文本分句，因此步骤S1011通过读取歌词中的时间轴标签，即可得到歌词中的各个文本分句。在得到各个文本分句之后，步骤S1012中可将得到的文本分句两两相互比较，从而将相似度大于设定的第一阈值的文本分句聚为一类相似分句。其中，步骤S1012中，确定各个文本分句间的相似度的预设策略至少包括以下策略中的一种：

策略一：根据各个文本分句中的词语的共现程度确定各个文本分句间的相似度。其中词语的共现程度由词语的共现数量及共现位置确定。

例如：“因为爱情，不会轻易悲伤”与“因为爱情，怎么会有沧桑”这两个分句，其共现的词语有“因为”、“爱情”，且“因为”在两个分句中的共现位置均为第一位，“爱情”在两个分句中的共现位置均为第二位。

具体地，根据策略一，两个文本分句之间的相似度可用下列公式衡量：

Sim = Σ_{i = 1}^{n} w_{i} / N

其中Sim表示两个文本分句之间的相似度，n表示两个文本分句中共现的词语数量，w_i表示两个文本分句中第i个共现词语的共现位置的权重，N表示两个文本分句包含的词语总数。共现词语的共现位置的权重可预先根据共现位置的对应关系进行设置。例如某个共现词语在两个分句中都出现在第一位，则该词语的w_i的值可设置为1，如果某个共现词语出现在一个分句的第一位，而在另一个分句中出现在第二位，则该词语的w_i的值可设置为0.9，应该理解，这里取值1或0.9只是示意，并不构成对策略一的限制。

策略二：根据各个文本分句中对应位置的词语的词性匹配度确定各个文本分句间的相似度。

例如“有时会突然忘了我还在爱着你”与“虽然会经常忘了我依然爱着你”这两个分句，每个对应位置上的词语的词性都是一样的，如对应位置均为第一位的“有时”和“虽然”都是副词，对应位置均为第三位的“突然”和“经常”也都是副词，其余词语的关系类似。因此，根据策略二，“有时会突然忘了我还在爱着你”与“虽然会经常忘了我依然爱着你”这两个分句的相似度就会较高。

策略三：根据各个文本分句的文本编辑距离、文本最长公共字串、或文本汉明距离确定各个文本分句间的相似度。

文本编辑距离、文本最长公共字串或文本汉明距离，均是现有技术在确定文本之间相似度的常用手段，在此不再赘述。

应该理解，本发明在步骤S1012中确定各个文本分句间的相似度时，可以综合采用上述三种策略中的任意一种，或多种的组合，优选地，可以将这三种策略综合使用，例如每种策略得到一个相似度值，并根据为每种策略预先分配的权重值，将这三种策略得到的相似度值加权求和后作为分句间的相似度值。

作为步骤S102的实施例一，步骤S102包括：

步骤S1021：根据歌词中的时间轴标签提取歌词中的各个文本段落。

步骤S1022：将对应位置的相似分句所占比例大于设定的第二阈值的文本段落所对应的音乐段落作为歌曲的同类音乐段落。其中第二阈值的大小用以对文本段落之间的相似程度进行控制。

从图2示意的歌词中可以看出，在时间轴标签中存在不对应任何文本分句的标签，通过这些标签，步骤S1021可以将歌词分为不同的文本段落，如图2中示意的段落1至段落8。

步骤S1022中，将各个文本段落进行比对，如果两个文本段落在对应位置的相似分句在这两个文本段落各自包含的分句中所占比例大于设定的第二阈值，则说明这两个文本段落的相似度较高。由于文本段落在歌词中有时间轴标签，因此通过这些时间轴标签，文本段落就与歌曲中的音乐段落对应起来，本发明将步骤S1022中确定的相似度高的文本段落所对应的音乐段落作为具有相似性的同类音乐段落。

以下面的文本段落1和文本段落2为例对上述过程进行具体说明。

文本段落1：

因为爱情，不会轻易悲伤分句1

所以一切都是幸福的模样分句2

因为爱情，简单地生长分句3

依然随时可以为你疯狂分句4

文本段落2：

因为爱情，怎么会有沧桑分句5

所以我们还是年轻的模样分句6

因为爱情，在那个地方分句7

依然还有人在那里游荡人来人往分句8

假设通过步骤S101可以确定，分句1与分句5是相似分句，分句2与分句6是相似分句，分句3与分句7是相似分句，由于分句1和分句5在段落中的对应位置是相同的（对应各自段落中的第一句），分句2与分句6在段落中的对应位置是相同的（对应各自段落中的第二句），分句3与分句7在段落中的对应位置是相同的（对应各自段落中的第三句），所以文本段落1和文本段落2在对应位置的相似分句的数量为3，对应位置的相似分句在文本段落中所占比例为3/4，假设第二阈值为0.5，则文本段落1和文本段落2就是相似的文本段落，其分别在歌曲中对应的音乐段落，就属于同类音乐段落。

作为步骤S102的实施例二，在步骤S1022中确定出歌曲中的同类音乐段落之后，步骤S102中进一步还可包括：

步骤S1023：利用同类音乐段落的音频指纹特征对同类音乐段落的相似有效性进行验证，以过滤其中相似有效性低的音乐段落。具体地，步骤S1023包括提取同类音乐段落中的各个音乐段落的音频指纹特征，基于提取的音频指纹特征对各个音乐段落进行比对，以及过滤对比结果中相似有效性低的音乐段落。

对音乐提取音频指纹特征，于本领域有多种已知方法，作为其中的一种方法，可参考中国发明专利申请号为201110218558.3的专利文件，该专利文件中公开了一种提取音频指纹特征的方式。步骤S1023中对同类音乐段落中的每个音乐段落，分别提取音频指纹特征进行比对，如果这些同类音乐段落中的每个音乐段落的音频指纹特征都比较相似，则说明这些同类音乐段落从音频内容的角度来看，的确是具有相似性的，从而可以对步骤S1022中得到的同类音乐段落的相似有效性进行很好地验证，如果同类音乐段落中存在某个音乐段落的音频指纹特征相异于大多数同类音乐段落，则可以把该音乐段落剔除出同类音乐段落。例如步骤S1022得到同类音乐段落为W、X、Y、Z，其中X、Y、Z的音频指纹特征相似，而W的音频指纹特征与X、Y、Z的音频指纹特征相异，则可将W从同类音乐段落中过滤掉。

通过步骤S102的实施例二，本发明可以以文本分析的方式迅速有效地定位歌曲中的同类音乐片段，并利用音频分析的方法对同类音乐段落的相似有效性进行验证，在提高歌曲分析的效率的同时，增强最终输出的同类音乐段落的可靠性。

作为同类音乐段落的一种应用方式，本发明进一步还可包括：

步骤S103：从同类音乐段落中提取出歌曲的高潮片段。

例如歌曲1的音乐段落有A、B、C、D、E、F，其中同类音乐段落为：

类别1：音乐段落A、B、C

类别2：音乐段落D、E

类别3：音乐段落F

则步骤S103的一种实施方式为将包含音乐段落数最多的类别中的音乐段落作为歌曲的高潮片段，如上面例子中，音乐段落A、B、C中的任意一个或多个就可以作为歌曲的高潮片段。此外，在确定歌曲的高潮片段时，还可以将音乐段落的长度作为一个选取因素，假设类别1和类别2包含的音乐段落数量相同，但是类别1中的音乐段落长度大于类别2中的音乐段落长度，则可以将类别1中的音乐段落作为歌曲的高潮片段。

通过上述方式，本发明能够快速有效地确定歌曲中的高潮片段，为从歌曲中提取手机铃声提供了一种简单有效的实施途径。

此外，本发明在步骤S102得到同类音乐段落后，还可以进一步包括：

步骤S104：在同类音乐段落对应的歌词间建立比对关系，并根据该比对关系生成歌曲对应歌词的流程图。

请参考图3，图3为本发明中部分歌词流程图的示意图。假设通过步骤S101和步骤S102后，图2所示的歌词中的文本段落3、4、6、7所对应的音乐段落为同类音乐段落。则在步骤S104中，先在歌词中的文本段落3、4、6、7间建立比对关系，具体地包括建立段落间每个分句的比对关系。在依据该比对关系生成流程图时，还包括将相同分句进行合并，进一步还可根据分词结果，将分句中相同的分词进行合并，得到如图3所示的歌词流程图。

在歌曲播放时，根据播放进度动态播放本发明中的歌词流程图，能够强化用户对歌词的记忆，提升用户体验。

请参考图4，图4为本发明中对歌曲进行分析的装置的实施例一的结构示意框图。

如图4所示，该实施例包括：分句确定单元201及段落确定单元202。其中分句确定单元201，用于利用歌曲对应的歌词中的时间轴标签，确定歌词中的相似分句。段落确定单元202，用于根据歌词中的相似分句确定歌曲的同类音乐段落。

请参考图5，图5为本发明中分句确定单元的实施例的结构示意框图。如图5所示，分句确定单元201包括：分句提取单元2011和分句比对单元2012。其中分句提取单元2011，用于根据歌词中的时间轴标签提取歌词中的各个文本分句。分句比对单元2012，用于依据预设策略确定各个文本分句间的相似度，并将相似度大于设定的第一阈值的文本分句作为歌词中的相似分句。

其中，分句比对单元2012在确定各个文本分句间的相似度时，可采用的预设策略至少包括以下策略之一：

策略一：根据各个文本分句中词语的共现程度确定各个文本分句间的相似度，其中词语的共现程度由词语的共现数量及共现位置确定。

策略三：根据各个文本分句的文本编辑距离、文本最长公共子串、或文本汉明距离确定各个文本分句间的相似度。

请参考图6，图6为本发明中段落确定单元的实施例一的结构示意框图。如图6所示，段落确定单元202包括：段落提取单元2021及归类单元2022。其中段落提取单元2021，用于根据歌词中的时间轴标签确定歌词中的各个文本段落。归类单元2022，用于将对应位置的相似分句所占比例大于设定的第二阈值的文本段落所对应的音乐段落作为歌曲的同类音乐段落。

请参考图7，图7为本发明中段落确定单元的实施例二的结构示意框图。与图6所示的实施例一相比，在本实施例中，段落确定单元202进一步还包括：验证单元2023。其中验证单元2023，用于利用同类音乐段落的音乐指纹特征对同类音乐段落的相似有效性进行验证，以过滤同类音乐段落中相似有效性低的音乐段落。具体地，验证单元2023包括：特征提取单元2023_1、特征比对单元2023_2及过滤单元2023_3。其中特征提取单元2023_1，用于提取同类音乐段落中各个音乐段落的音频指纹特征。特征比对单元2023_2，用于基于提取的音频指纹特征对各个音乐段落进行比对。过滤单元2023_3，用于过滤比对结果中相似有效性低的音乐段落。

请参考图8，图8为本发明中对歌曲进行分析的装置的实施例二的结构示意框图。与图4所示的实施例一相比，本实施例中该装置进一步包括：高潮确定单元203，用于从段落确定单元202输出的同类音乐段落中提取歌曲的高潮片段。具体地，高潮确定单元203将包含音乐段落数最多的类别中的音乐段落作为歌曲的高潮片段。

请参考图9，图9为本发明中对歌曲进行分析的装置的实施例三的结构示意框图。与图4所示的实施例一相比，本实施例中该装置进一步包括：歌词流程图生成单元204，用于在同类音乐段落对应的歌词间建立比对关系，并根据该比对关系生成歌曲对应的歌词的流程图。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种对歌曲进行分析的方法，包括：

A.利用歌曲对应的歌词中的时间轴标签，确定所述歌词中的相似分句；

B.利用所述歌词中的相似分句确定所述歌曲中具有相似性的同类音乐段落。

2.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：

从所述同类音乐段落中提取所述歌曲的高潮片段。

3.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：

在所述同类音乐段落对应的歌词间建立比对关系，并根据所述比对关系生成所述歌曲对应的歌词的流程图。

4.根据权利要求1所述的方法，其特征在于，所述步骤A包括：

根据所述歌词中的时间轴标签提取所述歌词中的各个文本分句；

依据预设策略确定各个文本分句间的相似度，并将相似度大于设定的第一阈值的文本分句作为所述歌词中的相似分句。

5.根据权利要求4所述的方法，其特征在于，所述预设策略至少包括以下策略中的一种：

策略一：根据各个文本分句中词语的共现程度确定各个文本分句间的相似度，所述共现程度由词语的共现数量及共现位置确定；

策略二：根据各个文本分句中对应位置的词语的词性匹配度确定各个文本分句间的相似度；

6.根据权利要求1所述的方法，其特征在于，所述步骤B包括：

根据所述歌词中的时间轴标签提取所述歌词中的各个文本段落；

将对应位置的相似分句所占比例大于设定的第二阈值的文本段落所对应的音乐段落作为所述歌曲的同类音乐段落。

7.根据权利要求6所述的方法，其特征在于，所述步骤B进一步包括：

利用所述同类音乐段落的音频指纹特征对所述同类音乐段落的相似有效性进行验证，以过滤所述同类音乐段落中相似有效性低的音乐段落。

8.一种对歌曲进行分析的装置，包括：

分句确定单元，用于利用歌曲对应的歌词中的时间轴标签，确定所述歌词中的相似分句；

段落确定单元，用于根据所述歌词中的相似分句确定所述歌曲的同类音乐段落。

9.根据权利要求8所述的装置，其特征在于，所述装置进一步包括：

高潮确定单元，用于从所述同类音乐段落中提取所述歌曲的高潮片段。

10.根据权利要求8所述的装置，其特征在于，所述装置进一步包括：

歌词流程图生成单元，用于在所述同类音乐段落对应的歌词间建立比对关系，并根据所述比对关系生成所述歌曲对应的歌词的流程图。

11.根据权利要求8所述的装置，其特征在于，所述分句确定单元包括：

分句提取单元，用于根据所述歌词中的时间轴标签提取所述歌词中的各个文本分句；

分句比对单元，用于依据预设策略确定各个文本分句间的相似度，并将相似度大于设定的第一阈值的文本分句作为所述歌词中的相似分句。

12.根据权利要求11所述的装置，其特征在于，所述预设策略至少包括以下策略中的一种：

13.根据权利要求8所述的装置，其特征在于，所述段落确定单元包括：

段落提取单元，用于根据所述歌词中的时间轴标签提取所述歌词中的各个文本段落；

归类单元，用于将对应位置的相似分句所占比例大于设定的第二阈值的文本段落所对应的音乐段落作为所述歌曲的同类音乐段落。

14.根据权利要求13所述的装置，其特征在于，所述段落确定单元进一步包括：

验证单元，用于利用所述同类音乐段落的音频指纹特征对所述同类音乐段落的相似有效性进行验证，以过滤所述同类音乐段落中相似有效性低的音乐段落。