CN109686376A

CN109686376A - 一种歌曲演唱评价方法及系统

Info

Publication number: CN109686376A
Application number: CN201910015887.4A
Authority: CN
Inventors: 马哲; 高超
Original assignee: BEIJING THUNDERSTONE TECHNOLOGY Ltd
Current assignee: BEIJING THUNDERSTONE TECHNOLOGY Ltd
Priority date: 2019-01-08
Filing date: 2019-01-08
Publication date: 2019-04-26
Anticipated expiration: 2039-01-08
Also published as: CN109686376B

Abstract

本发明公开一种歌曲演唱评价方法及系统，其中，该方法包括：S1.比较原唱歌曲的第一音频指纹和伴奏音乐的第二音频指纹，将所述第一音频指纹和所述第二音频指纹有区别的时间范围标记为第一差异区域；S2.将所述第一差异区域的起点标记为第一时间点；S3.比较演唱歌曲的第三音频指纹和所述伴奏音乐的第二音频指纹，将所述第三音频指纹和所述第二音频指纹有区别的时间范围标记为第二差异区域；S4.将所述第二差异区域的起点标记为第二时间点；S5.比较所述第一时间点与所述第二时间点，若所述第一时间点不等于所述第二时间点，则减少演唱者演唱得分。通过上述方法，可以判断出演唱者是否有抢拍或者漏拍的情况，对演唱者的评分会更加的客观准确。

Description

一种歌曲演唱评价方法及系统

技术领域

本发明涉及音频数据处理领域，尤其涉及一种歌曲演唱评价方法及系统。

背景技术

演唱打分是一种实时对用户的个人演唱进行即时反馈的技术，可以对演唱者的演唱准确度进行评估，利用演唱打分系统提供演唱打分功能，可以给用户带来很好的体验，具有很高的娱乐性。

由于声音具有相当的不稳定性，难以直接用单一声学模型进行精确评估，较为常见的K歌打分方法如下：1.从时域波形出发，对演唱者的音频信号和机器自带的原唱信号进行采样，然后比较各个采样点的大小，如果比较一致则得分高，否则得分低；2.从能量的角度出发，对演唱者的音频信号和伴奏音乐分别用A/D进行数字化，然后对两种数字信号的规格化能量进行比较和差异测量，最后根据两者差异情况给分；3.从频域分析的角度出发，首先将机器自带原唱信号与伴奏乐声进行小波变换，再将演唱者的音频信号与伴奏音乐进行小波变换。比较两次得到的频谱信号的分布情况，越是一致则得分越高。

节拍的掌握是歌曲演唱中非常重要的一个技巧，抢拍或漏拍的现象对歌曲演唱效果具有较大的影响，现有技术中，对歌曲演唱水平的评价是需要对原唱歌曲和演唱歌曲的整体进行比对评价，不能清楚的评价演唱者是否存在抢拍或漏拍的情况。对于有歌词文件的歌曲，可以通过歌词文件中标注的时间点来确定演唱者需要演唱的片段，从而确定演唱者是否存在抢拍或漏拍的现象；而对于没有歌词文件的歌曲，需要先确定演唱者需要演唱的片段，才能确定演唱者是否存在抢拍或漏拍的现象，现有技术是无法对演唱者演唱无歌词文件的歌曲时是否存在抢拍或漏拍的情况进行评价。

发明内容

针对现有技术中存在的缺陷，本发明的目的在于提供一种歌曲演唱评价方法及系统，可以清楚准确的评价演唱者演唱歌曲时，是否存在抢拍或漏拍的现象。

为达到以上目的，一方面，本发明实施例提供了一种歌曲演唱评价方法，包括如下步骤：

S1.比较原唱歌曲的第一音频指纹和伴奏音乐的第二音频指纹，将所述第一音频指纹和所述第二音频指纹有区别的时间范围标记为第一差异区域；

S2.将所述第一差异区域的起点标记为第一时间点；

S3.比较演唱歌曲的第三音频指纹和所述伴奏音乐的第二音频指纹，将所述第三音频指纹和所述第二音频指纹有区别的时间范围标记为第二差异区域；

S4.将所述第二差异区域的起点标记为第二时间点；

S5.比较所述第一时间点与所述第二时间点，若所述第一时间点不等于所述第二时间点，则减少演唱者演唱得分。

更进一步的，所述步骤S1中，包括：

S11.按照设定的时间间隔对所述原唱歌曲进行分割，得到多个第一音频片段，并提取每个所述第一音频片段的音频指纹，组成所述原唱歌曲的所述第一音频指纹；

S12.按照设定的时间间隔对所述伴奏音乐进行分割，得到多个第二音频片段，并提取每个所述第二音频片段的音频指纹，组成所述伴奏音乐的所述第二音频指纹；

S13.比较所述原唱歌曲的所述第一音频指纹和所述伴奏音乐的所述第二音频指纹，将所述第一音频指纹和所述第二音频指纹有区别的时间范围标记为第一差异区域。

更进一步的，所述步骤S3中，包括：

S31.按照设定的时间间隔对所述演唱歌曲进行分割，得到多个第三音频片段，并提取每个所述第三音频片段的音频指纹，组成所述演唱歌曲的所述第三音频指纹；

S33.比较所述演唱歌曲的所述第三音频指纹和所述伴奏音乐的所述第二音频指纹，将所述第三音频指纹和所述第二音频指纹有区别的时间范围标记为第二差异区域。

更进一步的，所述步骤S31之前，包括：

S301.用收音设备对演唱者进行收音；

S302.将所述收音设备收取到的声音与所述伴奏音乐进行合成，得到所述演唱歌曲。

更进一步的，在所述步骤S5之后，包括：

S6.比较所述第一差异区域的和所述第二差异区域相同时间点的第一音频指纹和第三音频指纹，并根据所述第一音频指纹和所述第二音频指纹的相似度进行打分。

另一方面，本发明实施例提供了一种歌曲演唱评价系统，包括：

第一音频指纹比较模块，用于比较原唱歌曲的第一音频指纹和伴奏音乐的第二音频指纹，将所述第一音频指纹和所述第二音频指纹有区别的时间范围标记为第一差异区域；

第一记录模块，用于记录所述第一差异区域的起始的时间点，并将其标记为第一时间点；

第二音频指纹比较模块，用于比较演唱歌曲的第三音频指纹和所述伴奏音乐的第二音频指纹，将所述第三音频指纹和所述第二音频指纹有区别的时间范围标记为第二差异区域；

第二记录模块，用于记录所述第二差异区域的起始的时间点，并将其标记为第二时间点；

时间点比较模块，用以比较所述第一时间点和所述第二时间点的大小，若所述第一时间点不等于所述第二时间点，则减少演唱者演唱得分。

更进一步的，所述第一音频指纹比较模块还包括：

第一音频指纹提取子模块，用于按照设定的时间间隔对所述原唱歌曲进行分割，得到多个第一音频片段，并提取每个所述第一音频片段的音频指纹，组成所述演唱歌曲的所述第一音频指纹；

第二音频指纹提取子模块，用于按照设定的时间间隔对所述伴奏音乐进行分割，得到多个第二音频片段，并提取每个所述第二音频片段的音频指纹，组成所述伴奏音乐的所述第二音频指纹；

第一比较子模块，用于比较所述原唱歌曲的所述第一音频指纹和所述伴奏音乐的所述第二音频指纹，将所述第一音频指纹和所述第二音频指纹有区别的时间范围标记为第一差异区域。

更进一步的，所述第二音频指纹比较模块还包括：

第三音频指纹提取子模块，用于按照设定的时间间隔对所述演唱歌曲进行分割，得到多个第三音频片段，并提取每个所述第三音频片段的音频指纹，组成所述演唱歌曲的所述第三音频指纹；

第二比较子模块，用于比较所述演唱歌曲的所述第三音频指纹和所述伴奏音乐的所述第二音频指纹，将所述第三音频指纹和所述第二音频指纹有区别的时间范围标记为第二差异区域。

更进一步的，其特征在于，还包括：

收音模块，利用收音设备，对演唱者进行收音；

合成模块，用于将从所述收音模块得到的声音与伴奏音乐进行合成，得到所述演唱歌曲。

更进一步的，其特征在于，还包括：

打分模块，用于根据所述时间点比较模块得到的结果进行打分，以及比较所述第一差异区域的和所述第二差异区域相同时间点的第一音频指纹和第三音频指纹，并根据相似度进行打分。

本技术方案中，通过比较无歌词文件的原唱歌曲与伴奏音乐的音频指纹的差异区域，可以得到原唱歌曲中具有歌词的部分；通过比较演唱者演唱歌曲与伴奏音乐的音频指纹的差异区域，可以得到演唱歌曲中演唱者开始演唱的部分；比较两部分的起始时间点就可以清楚的判断出演唱者是否有抢拍或者漏拍的情况，对演唱者的评分会更加的客观准确。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一种歌曲演唱评价方法的流程图；

图2是本发明实施例步骤S1的流程图；

图3是本发明实施例步骤S3的流程图；

图4是本发明实施例步骤S31前的步骤的流程图；

图5是本发明实施例步骤S5与S6的流程图；

图6是本发明实施例一种歌曲演唱评价系统的结构框图；

图7是本发明实施例第一音频指纹比较模块的结构框图；

图8是本发明实施例第二音频指纹比较模块的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：

如图1所示，为本发明实施例一种歌曲演唱评价方法的流程图，包括如下步骤：

音频指纹技术是指通过特定的算法将一段音频中独一无二的数字特征以标识符的形式提取出来，用于识别海量的声音样本或跟踪定位样本在数据库中的位置。音频指纹技术通过提取声音中的数据特征将需要被识别的内容与建立的音频指纹数据库进行比对完成的，识别过程不受音频本身的储存格式，编码方式，码率和压缩技术影响。一首歌曲是由歌词和曲谱(即伴奏)组成的，由于歌词的存在，原唱歌曲的音频指纹会与伴奏音乐的音频指纹存在差异。在有歌词文件的歌曲中，可以通过歌词文件中标注的时间点来确定演唱者需要演唱的片段，而对于没有歌词文件的歌曲，需要确定演唱者需要演唱的片段。

本实施例将原唱歌曲的第一音频指纹和伴奏音乐的第二音频指纹进行比对，出现差异之处表示此处有歌词，需要演唱者进行演唱。所以，本实施例从所述第一音频指纹和所述第二音频指纹开始出现差别的时间点开始记录，从开始记录的时间点到结束记录的时间点之间称为第一差异区域。在一首有歌词的歌曲中，存在至少一个第一差异区域。

S2.将所述第一差异区域的起点标记为第一时间点；

在一首有歌词的歌曲中，存在至少一个第一差异区域，每一个第一差异区域均对应一个第一时间点。

本实施例将演唱歌曲的第三音频指纹和伴奏音乐的第二音频指纹进行比对，出现差异之处表示此处有演唱者进行演唱。所以，本实施例从所述第三音频指纹和所述第二音频指纹开始出现差别的时间点开始记录，从开始记录的时间点到结束记录的时间点之间称为第二差异区域。在一首演唱者进行了演唱的歌曲中，存在至少一个第二差异区域。

S4.将所述第二差异区域的起点标记为第二时间点；

在一首演唱者进行了演唱的歌曲中，存在至少一个第二差异区域，每一个第二差异区域均对应一个第二时间点。

由于可能存在多个第一时间点和第二时间点，所以存在多种比对方式，在其中一种实施方式中，每个所述第一时间点均与每个所述第二时间点进行比较，若该第一时间点有对应的第二时间点，则表示演唱者在该部分的演唱时，并无抢拍或漏拍的现象，当演唱者存在抢拍或漏拍的现象时，减少演唱者演唱得分。在另一种实施方式中，当第一时间点的个数与第二时间点的个数相同时，可以将第一时间点和第二时间点一一进行比对，当第一时间点等于第二时间点时，表示演唱者在该部分的演唱时，并无抢拍或漏拍的现象，当演唱者存在抢拍或漏拍的现象时，减少演唱者演唱得分。

在本实施例中，步骤S1还包括如图2所示的下述步骤：

在本实施例中，将所述原唱歌曲按照设定的时间间隔进行分割，得到多个第一音频片段，将每个第一音频片段通过傅里叶变换把时域信号变换成频域信号，并对其取模，可以得到每个第一音频片段模长的数组，即为每个第一音频片段的特征值，将每个第一音频片段模长的数组分割成多个区间，选取各区间中模长最大的元素的下标组成多元组，将每个第一音频片段的多元组作为元素组成多元组数组，即为所述原唱歌曲的所述第一音频指纹。

在本实施例中，将每个第一音频片段模长的数组分割为四个区间，即下标值为(0，40]、(40，80]、(80，120]、(120，180]四个区间，选取各区间中模长最大的元素的下标组成四元组，将每个第一音频片段的四元组作为元素组成四元组数组，即为所述原唱歌曲的所述第一音频指纹。

在本实施例中，将所述伴奏音乐按照设定的时间间隔进行分割，得到多个第二音频片段，将每个第二音频片段通过傅里叶变换把时域信号变换成频域信号，并对其取模，可以得到每个第二音频片段模长的数组，即为每个第二音频片段的特征值，将每个第二音频片段模长的数组分割成多个区间，选取各区间中模长最大的元素的下标组成多元组，将每个第二音频片段的多元组作为元素组成多元组数组，即为所述伴奏音乐的所述第二音频指纹。

在本实施例中，将每个第二音频片段模长的数组分割为四个区间，即下标值为(0，40]、(40，80]、(80，120]、(120，180]四个区间，选取各区间中模长最大的元素的下标组成四元组，将每个第二音频片段的四元组作为元素组成四元组数组，即为所述伴奏音乐的所述第二音频指纹。

在本实施例中，步骤S3还包括如图3所示的下述步骤：

在本实施例中，将所述演唱歌曲按照设定的时间间隔进行分割，得到多个第三音频片段，将每个第三音频片段通过傅里叶变换把时域信号变换成频域信号，并对其取模，可以得到每个第三音频片段模长的数组，即为每个第三音频片段的特征值，将每个第三音频片段模长的数组分割成多个区间，选取各区间中模长最大的元素的下标组成多元组，将每个第三音频片段的多元组作为元素组成多元组数组，即为所述演唱歌曲的所述第三音频指纹。

在本实施例中，将每个第三音频片段模长的数组分割为四个区间，即下标值为(0，40]、(40，80]、(80，120]、(120，180]四个区间，选取各区间中模长最大的元素的下标组成四元组，将每个第三音频片段的四元组作为元素组成四元组数组，即为所述演唱歌曲的所述第三音频指纹。

S32.比较所述演唱歌曲的所述第三音频指纹和所述伴奏音乐的所述第二音频指纹，将所述第三音频指纹和所述第二音频指纹有区别的时间范围标记为第二差异区域。

在本实施例中，步骤S31还包括如图4所示的下述步骤：

S301.用收音设备对演唱者进行收音；

所述收音设备可以指麦克风、话筒、录音器等设备，也可以指包含上述麦克风、话筒、录音器等设备的其他电子设备，如手机、录音笔、具有话筒的耳机等。

在本实施例中，步骤S5之后还包括如图5所示下述步骤：

对演唱者演唱进行评价的分数至少包括演唱者抢拍漏拍分数和演唱者演唱相似度分数。对演唱者演唱相似度进行判断，可以采用优先级队列的算法进行分析。

在本实施例中，通过比较无歌词文件的原唱歌曲与伴奏音乐的音频指纹的差异，可以得到原唱歌曲中具有歌词的部分。通过比较演唱者演唱歌曲与伴奏音乐的音频指纹的差异，可以得到演唱歌曲中演唱者开始演唱的部分。比较两个差异区域的起始时间点就可以清楚的判断出演唱者是否有抢拍或者漏拍的情况，对演唱者的评分会更加的客观准确。

实施例2：

如图6所示，本发明实施例一种歌曲演唱评价系统的结构框图，包括：

第一音频指纹比较模块711，用于比较原唱歌曲的第一音频指纹和伴奏音乐的第二音频指纹，将所述第一音频指纹和所述第二音频指纹有区别的时间范围标记为第一差异区域；

本实施例中第一音频指纹比较模块711，用于比较原唱歌曲的第一音频指纹和伴奏音乐的第二音频指纹，从所述第一音频指纹和所述第二音频指纹开始出现差别的时间点开始记录，从开始记录的时间点到结束记录的时间点之间称为第一差异区域。在一首有歌词的歌曲中，存在至少一个第一差异区域。

第一记录模块712，用于记录所述第一差异区域的起始的时间点，并将其标记为第一时间点；

在一首有歌词的歌曲中，存在至少一个第一差异区域，所以每一个第一差异区域均对应一个第一时间点。

第二音频指纹比较模块721，用于比较演唱歌曲的第三音频指纹和所述伴奏音乐的第二音频指纹，将所述第三音频指纹和所述第二音频指纹有区别的时间范围标记为第二差异区域；

在本实施例中，第二音频指纹比较模块721，用于比较演唱歌曲的第三音频指纹和伴奏音乐的第二音频指纹，从所述第三音频指纹和所述第二音频指纹开始出现差别的时间点开始记录，从开始记录的时间点到结束记录的时间点之间称为第二差异区域。在一首演唱者进行了演唱的歌曲中，存在至少一个第二差异区域。

第二记录模块722，用于记录所述第二差异区域的起始的时间点，并将其标记为第二时间点；

在一首演唱者进行了演唱的歌曲中，存在至少一个第二差异区域，所以每一个第二差异区域均对应一个第二时间点。

时间点比较模块73，用以比较所述第一时间点和所述第二时间点的大小，若所述第一时间点不等于所述第二时间点，则减少演唱者演唱得分。

由于可能存在多个第一时间点和第二时间点，所以存在多种比对方式，在其中一种实施方式中，每个所述第一时间点均与每个所述第二时间点进行比较，若该第一时间点有对应的第二时间点，则表示演唱者在该部分的演唱时，并无抢拍或漏拍的现象。在另一种实施方式中，当第一时间点的个数与第二时间点的个数相同时，可以将第一时间点和第二时间点一一进行比对，当第一时间点等于第二时间点时，表示演唱者在该部分的演唱时，并无抢拍或漏拍的现象。当演唱者存在抢拍或漏拍的现象时，减少演唱者演唱得分。

在本实施例中，还包括：

收音模块74，利用收音设备，对演唱者进行收音；

所述收音模块74可以指麦克风、话筒、录音器等收音设备，也可以指包含上述麦克风、话筒、录音器等设备的其他电子设备，如手机、录音笔、具有话筒的耳机等。

合成模块75，用于将从所述收音模块74得到的声音与伴奏音乐进行合成，得到演唱歌曲。

打分模块76，用于根据所述时间点比较模块得到的结果进行打分，以及比较所述第一差异区域的和所述第二差异区域相同时间点的第一音频指纹和第三音频指纹，并根据相似度进行打分。

在本实施例中，第一音频指纹比较模块711包括如图7所示的下述模块：

第一音频指纹提取子模块7111，用于按照设定的时间间隔对所述原唱歌曲进行分割，得到多个第一音频片段，并提取每个所述第一音频片段的音频指纹，组成所述演唱歌曲的所述第一音频指纹；

第二音频指纹提取子模块7112，用于按照设定的时间间隔对所述伴奏音乐进行分割，得到多个第二音频片段，并提取每个所述第二音频片段的音频指纹，组成所述伴奏音乐的所述第二音频指纹；

第一比较子模块7113，用于比较所述原唱歌曲的所述第一音频指纹和所述伴奏音乐的所述第二音频指纹，将所述第一音频指纹和所述第二音频指纹有区别的时间范围标记为第一差异区域。

在本实施例中，第二音频指纹比较模块721包括如图8所示的下述模块：

第三音频指纹提取子模块7211，用于按照设定的时间间隔对所述演唱歌曲进行分割，得到多个第三音频片段，并提取每个所述第三音频片段的音频指纹，组成所述演唱歌曲的所述第三音频指纹；

第二比较子模块7212，用于比较所述演唱歌曲的所述第三音频指纹和所述伴奏音乐的所述第二音频指纹，将所述第三音频指纹和所述第二音频指纹有区别的时间范围标记为第二差异区域。

在本实施例中，通过所述第一音频指纹比较模块711，比较无歌词文件的原唱歌曲与伴奏音乐的音频指纹的差异，可以得到原唱歌曲中具有歌词的部分。通过所述第二音频指纹比较模块721，比较演唱者演唱歌曲与伴奏音乐的音频指纹的差异，可以得到演唱歌曲中演唱者开始演唱的部分。利用时间点比较模块73，比较两个差异区域的起始时间点就可以清楚的判断出演唱者是否有抢拍或者漏拍的情况，对演唱者的评分会更加的客观准确。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种歌曲演唱评价方法，其特征在于，包括如下步骤：

S2.将所述第一差异区域的起点标记为第一时间点；

S4.将所述第二差异区域的起点标记为第二时间点；

2.如权利要求1所述的一种歌曲演唱评价方法，其特征在于，所述步骤S1中，包括：

3.如权利要求1所述的一种歌曲演唱评价方法，其特征在于，所述步骤S3中，包括：

4.如权利要求3所述的一种歌曲演唱评价方法，其特征在于，所述步骤S31之前，包括：

S301.用收音设备对演唱者进行收音；

5.如权利要求1所述的一种歌曲演唱评价方法，其特征在于，在所述步骤S5之后，包括：

6.一种歌曲演唱评价系统，其特征在于，包括：

7.如权利要求6所述的一种歌曲演唱评价系统，其特征在于，所述第一音频指纹比较模块还包括：

8.如权利要求6所述的一种歌曲演唱评价系统，其特征在于，所述第二音频指纹比较模块还包括：

9.如权利要求8所述的一种歌曲演唱评价系统，其特征在于，还包括：

收音模块，利用收音设备，对演唱者进行收音；

10.如权利要求6所述的一种歌曲演唱评价系统，其特征在于，还包括：