CN106095943B

CN106095943B - 演唱歌曲熟识广度检测方法和装置

Info

Publication number: CN106095943B
Application number: CN201610416943.1A
Authority: CN
Inventors: 赵伟峰
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-06-14
Filing date: 2016-06-14
Publication date: 2018-09-21
Anticipated expiration: 2036-06-14
Also published as: CN106095943A

Abstract

本发明涉及一种演唱歌曲熟识广度检测方法和装置。所述方法包括：获取演唱等级，选取与所述演唱等级对应的歌曲；获取用户根据所述选取的歌曲录制的音频数据；提取所述录制的音频数据中的旋律特征，得到用户的旋律特征；将所述用户的旋律特征与所述选取的歌曲的原始旋律特征进行比对，得到相似度值；判断所述相似度值是否大于预设的阈值，若是，则提示检测结束，将所述演唱等级作为演唱歌曲熟识广度等级，并输出所述演唱歌曲熟识广度等级，若否，则表示所述用户通过所述演唱等级，并获取所述演唱等级的相邻下一演唱等级，继续循环执行。实现了检测出用户的演唱歌曲熟识广度。

Description

演唱歌曲熟识广度检测方法和装置

技术领域

本发明涉及计算机应用领域，特别是涉及一种演唱歌曲熟识广度检测方法和装置。

背景技术

随着计算机技术和网络技术的发展，越来越多的用户通过网络从事各种社交活动，丰富自己的生活，同时也享受网络带来的便捷。例如，以往用户通常在提供音乐设备的场所演唱自己熟悉的歌曲，目前用户可直接录制歌曲并上传到网络，然而用户通常只会演唱自己所熟悉的歌曲，无法了解自己对歌曲的熟识广度。

发明内容

基于此，有必要针对用户无法了解对歌曲的熟识广度的问题，提供一种演唱歌曲熟识广度检测方法，能检测出演唱歌曲熟识广度。

此外，还有必要提供一种演唱歌曲熟识广度检测装置，能检测出演唱歌曲熟识广度。

一种演唱歌曲熟识广度检测方法，包括：

步骤A，获取演唱等级，选取与所述演唱等级对应的歌曲；

步骤B，获取用户根据所述选取的歌曲演唱并录制的音频数据；

步骤C，提取所述录制的音频数据中的旋律特征，得到用户的旋律特征；

步骤D，将所述用户的旋律特征与所述选取的歌曲的原始旋律特征进行比对，得到检测值；

步骤E，判断所述检测值是否大于预设的阈值，若是，则提示检测结束，将所述演唱等级作为演唱歌曲熟识广度等级，并输出所述演唱歌曲熟识广度等级，若否，则表示所述用户通过所述演唱等级，并获取所述演唱等级的相邻下一演唱等级，继续循环执行步骤A至E。

一种演唱歌曲熟识广度检测装置，包括：

选取模块，用于获取演唱等级，选取与所述演唱等级对应的歌曲；

音频数据获取模块，用于获取用户根据所述选取的歌曲演唱并录制的音频数据；

提取模块，用于提取所述录制的音频数据中的旋律特征，得到用户的旋律特征；

比对模块，用于将所述用户的旋律特征与所述选取的歌曲的原始旋律特征进行比对，得到检测值；

判断模块，用于判断所述检测值是否大于预设的阈值；

输出模块，用于在判断出所述检测值大于预设的阈值，提示检测结束，将所述演唱等级作为演唱歌曲熟识广度等级，并输出所述演唱歌曲熟识广度等级；

进入模块，用于在判断出所述相似度值小于或等于预设的阈值，表示所述用户通过所述演唱等级，并获取所述演唱等级的相邻下一演唱等级，继续由所述选取模块、音频数据获取模块、提取模块、比对模块、判断模块、输出模块和进入模块循环执行。

上述演唱歌曲熟识广度检测方法和装置，获取演唱等级，选取与演唱等级对应的歌曲，录制用户根据所选歌曲进行演唱的音频数据，提取录制的音频数据中的旋律特征，得到用户旋律特征，将用户旋律特征与原始旋律特征比对得到检测值，检测值大于预设的阈值，则将该演唱等级作为演唱歌曲熟识广度等级，并输出，作为该用户的演唱歌曲熟识广度等级，若小于或等于预设的阈值，则继续获取下一演唱等级，再选取对应的歌曲进行检测，直到检测出该用户的演唱歌曲熟识广度等级，实现了检测出用户的演唱歌曲熟识广度。

附图说明

图1A为一个实施例中终端的内部结构示意图；

图1B为一个实施例中服务器的内部结构示意图；

图2为一个实施例中演唱歌曲熟识广度检测方法的流程图；

图3为一个实施例中提取该录制的音频数据中的旋律特征，得到用户的旋律特征的具体流程图；

图4为一个实施例中将该用户的旋律特征与该选取的歌曲的原始旋律特征进行比对，得到检测值的具体流程图；

图5A为一个实施例中演唱歌曲熟识广度检测装置的结构框图；

图5B为另一个实施例中演唱歌曲熟识广度检测装置的结构框图；

图6为另一个实施例中演唱歌曲熟识广度检测装置的结构框图；

图7为一个实施例中提取模块的内部结构框图；

图8为一个实施例中比对模块的内部结构框图；

图9为另一个实施例中演唱歌曲熟识广度检测装置的结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1A为一个实施例中终端(或电子设备等)的内部结构示意图。如图1A所示，该终端包括通过系统总线连接的处理器、非易失性存储介质、内存储器、网络接口、声音采集装置、扬声器、显示屏和输入装置。其中，终端的非易失性存储介质存储有操作系统，还包括一种演唱歌曲熟识广度检测装置，该演唱歌曲熟识广度检测装置用于实现一种演唱歌曲熟识广度检测方法。该处理器用于提供计算和控制能力，支撑整个终端的运行。终端中的内存储器为非易失性存储介质中的演唱歌曲熟识广度检测装置的运行提供环境，该内存储器中可储存有计算机可读指令，该计算机可读指令被所述处理器执行时，可使得所述处理器执行一种演唱歌曲熟识广度检测方法。网络接口用于与服务器进行网络通信等。终端的显示屏可以是液晶显示屏或者电子墨水显示屏等，输入装置可以是显示屏上覆盖的触摸层，也可以是终端外壳上设置的按键、轨迹球或触控板，也可以是外接的键盘、触控板或鼠标等。该终端可以是手机、平板电脑或者个人数字助理或穿戴式设备等。本领域技术人员可以理解，图1A中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的终端的限定，具体的终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

图1B为一个实施例中服务器(或云端等)的内部结构示意图。如图1B所示，该服务器包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中，该服务器的非易失性存储介质存储有操作系统、数据库和演唱歌曲熟识广度检测装置，数据库中存储有歌曲、演唱等级、歌曲与演唱等级的对应关系等，该演唱歌曲熟识广度检测装置用于实现适用于服务器的一种演唱歌曲熟识广度检测方法。该服务器的处理器用于提供计算和控制能力，支撑整个服务器的运行。该服务器的内存储器为非易失性存储介质中的演唱歌曲熟识广度检测装置的运行提供环境，该内存储器中可储存有计算机可读指令，该计算机可读指令被所述处理器执行时，可使得所述处理器执行一种演唱歌曲熟识广度检测方法。该服务器的网络接口用于据以与外部的终端通过网络连接通信等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本领域技术人员可以理解，图1B中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的服务器的限定，具体的服务器可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

图2为一个实施例中演唱歌曲熟识广度检测方法的流程图。如图2所示，一种演唱歌曲熟识广度检测方法，包括：

步骤202，获取演唱等级，选取与该演唱等级对应的歌曲。

本实施例中，演唱等级是指将演唱歌曲分成多个演唱等级后，用户待检测的演唱等级。

获取用户标识所对应的用户已通过的演唱等级k，判断已通过的演唱等级k是否为最大演唱等级，若是，则认为用户已经通过全部的演唱等级，结束本次检测，并提示已经通过全部的演唱等级，若否，将已通过的演唱等级k增加1作为要检测的演唱等级，随机从要检测的演唱等级k+1对应的歌曲中选取一首或多首歌曲。

可由终端获取演唱等级，选取与演唱等级对应的歌曲；也可由终端获取演唱等级，并上传到服务器，由服务器根据上传的演唱等级，选取与该演唱等级对应的歌曲，并返回选取的歌曲到终端。

在一个实施例中，在该获取演唱等级，选取与该演唱等级对应的歌曲的步骤之前，还包括：获取音乐库中的歌曲的流传度；按照该歌曲的流传度从高到低进行排序；将排序后的歌曲划分为第一数量个演唱等级，每个演唱等级包括第二数量首歌曲，且流传度高的歌曲所属的演唱等级低。

本实施例中，音乐库是指用于存储歌曲的数据库。流传度是指歌曲被流传的程度。第一数量和第二数量可根据需要设定。第一数量采用n表示，第二数量采用t表示。n和t均为自然数。演唱等级越低的歌曲流传度越高。演唱等级越低对应的演唱难度越小。演唱等级可采用1至n表示。演唱等级1级表示演唱等级最小，演唱等级n级表示演唱等级最大，也可采用其他方式表示。

在一个实施例中，上述演唱歌曲熟识广度检测方法还包括：获取音乐库中的歌曲的流传度之前，获取音乐库中各歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量；根据各歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量通过加权得到各歌曲对应的流传度。

歌曲被演唱数量是指歌曲被演唱的总次数。歌曲已上线时间是指歌曲位于指定网络平台上的时长。歌曲收听数量是指歌曲被收听的总次数。

根据歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量通过加权得到各歌曲对应的流传度f的计算公式如公式(1)。

f(x,y,z)＝a₀x+a₁y+a₂z+a₃ (1)

其中，x表示歌曲被演唱数量，y表示歌曲已上线时间，z表示歌曲收听数量，a₀、a₁、a₂、a₃均为系数。歌曲被演唱数量越大、歌曲被收听数量越大、歌曲已上线时间越短的歌曲的流传度越高。

步骤204，获取用户根据该选取的歌曲录制的音频数据。

在一个实施例中，可获取用户根据选取的歌曲进行清唱并录制的音频数据。清唱时不会播放所选取的歌曲，由用户直接演唱。

在一个实施例中，在获取用户根据选取的歌曲录制的音频数据之前，播放所述选取的歌曲的伴奏。获取用户根据选取的歌曲并按照播放的伴奏录制的音频数据。

在一个实施例中，在获取用户根据选取的歌曲录制的音频数据之前，根据选取的歌曲播放用于伴唱的提示音。

伴唱的提示音是用于辅助用户寻找歌词和曲调的。在终端上根据选取的歌曲播放用于伴唱的提示音，该用于伴唱的提示音是所选歌曲的一部分内容，例如前奏部分。在播放提示音时，在终端上展示选取的歌曲信息。该歌曲信息可包括歌曲名、歌手名、专辑名等。

在一个实施例中，根据选取的歌曲播放用于伴唱的提示音包括：根据该选取的歌曲播放不超过第一预设时长的用于伴唱的提示音。

获取用户根据该选取的歌曲录制的音频数据的步骤包括：获取用户根据该用于伴唱的提示音录制的超过第二预设时长的音频数据。

第一预设时长和第二预设时长可根据需要设定。如第一预设时长可为15秒，第二预设时长可为20秒。歌曲被选取出来后，在终端上播放歌曲的一部分内容，如前奏等。播放的提示音不超过第一预设时长是为了减少给用户过多的提示，避免造成检测的不准确。获取用户根据提示音进行演唱该选取的歌曲的任意一段，并对用户演唱的数据进行录制，录制的音频数据要超过第二预设时长。录制的音频数据超过第二预设时长的目的是为了更多的录制用户演唱歌曲的音频数据，避免录制的音频数据过短，后续检测不准确。

步骤206，提取该录制的音频数据中的旋律特征，得到用户的旋律特征。

本实施例中，旋律特征可包括三元组序列。三元组序列中的每个三元组包括三元组的起始时间、三元组的音符值和三元组的持续时间。

步骤208，将该用户的旋律特征与该选取的歌曲的原始旋律特征进行比对，得到检测值。

本实施例中，获取选取的歌曲的原始旋律特征，将用户的旋律特征与选取的歌曲的原始旋律特征进行比对，即将用户的三元组序列与选取的歌曲的原始三元组序列进行计算得到检测值。该检测值可为误差值。检测值可用来评测用户是否通过演唱等级。

步骤210，判断该检测值是否大于预设的阈值，若是，执行步骤212，若否，获取该演唱等级相邻的下一演唱等级，执行步骤202。

本实施例中，预设的阈值可根据需要设定。

步骤212，提示检测结束，将该演唱等级作为演唱歌曲熟识广度等级，并输出该演唱歌曲熟识广度等级。

步骤206至步骤212可在终端或服务器上执行。

判断检测值是否大于预设的阈值，若是，则提示检测结束，将本次的演唱等级作为演唱歌曲熟识广度等级，输出该演唱歌曲熟识广度等级，若否，则表示该用户通过该演唱等级，并将本次的演唱等级增加1，获取本次的演唱等级的相邻下一演唱等级，继续执行步骤202至步骤210，选取与相邻下一演唱等级对应的歌曲，获取用户根据选取的歌曲录制的音频数据，提取该录制的音频数据中的旋律特征，得到用户的旋律特征，将该用户的旋律特征与选取的歌曲的原始旋律特征进行比对，得到检测值，判断检测值是否大于预设的阈值，若是，提示检测结束，将该演唱等级作为演唱歌曲熟识广度等级，并输出该演唱歌曲熟识广度等级，若否，将本次演唱等级增加1，如此循环，直到提示检测结束，或者预设的所有的演唱等级全部通过。

上述演唱歌曲熟识广度检测方法，获取演唱等级，选取与演唱等级对应的歌曲，录制用户根据选取的歌曲演唱的音频数据，提取录制的音频数据中的旋律特征，得到用户旋律特征，将用户旋律特征与原始旋律特征比对得到检测值，检测值大于预设的阈值，则将该演唱等级作为演唱歌曲熟识广度等级，并输出，作为该用户的演唱歌曲熟识广度等级，若小于或等于预设的阈值，则继续获取下一演唱等级，再选取对应的歌曲进行检测，直到检测出该用户的演唱歌曲熟识广度等级，实现了检测出用户的演唱歌曲熟识广度。

在一个实施例中，选取与演唱等级对应的歌曲可为一首或多首。若选取的歌曲为多首，则录制用户演唱的多首歌曲，分别得到各自的旋律特征。将各自的旋律与对应的原始旋律进行比对，得到各自的检测值。各自的检测值均与预设的阈值比较，若各自的检测值均不大于预设的阈值，则表示用户通过该演唱等级。也就是说，选取了多首歌曲时，该多首歌曲全部通过，则表示用户通过该演唱等级。

图3为一个实施例中提取该录制的音频数据中的旋律特征，得到用户的旋律特征的具体流程图。如图3所示，该用户的旋律特征包括三元组序列。该提取该录制的音频数据中的旋律特征，得到用户的旋律特征的步骤包括：

步骤302，提取该录制的音频数据中的基频数据。

本实施例中，在提取录制的音频数据中的基频数据之前，可对音频数据进行规整处理为指定采样率采样精度的格式的基频数据。该指定采样率采样精度可根据需要设定，如采样率为16KB(千字节)，采样精度为16bit(位)。

由于人在发声时声带振动产生的频率经过声道过滤后会产生大量泛音，需要从音频数据中提取直接表现声带振动频率的基音。基音是指振动频率最低的音。基频数据是指基音数据，可包括基频点、基频值、帧移和帧长等。帧移和帧长根据需要选定。如帧移为10ms(毫秒)，帧长为30ms。帧移是指前后两帧的重叠量。帧长是指每帧的长度。

步骤304，获取该基频数据中的奇异基频点，并将该奇异基频点的基频值置零。

本实施例中，某个基频点相邻的前一基频点的基频值为零，相邻的后一基频点的基频值为零，该基频点的基频值不为零，则该基频点为奇异基频点。将该奇异基频点的基频值置为零。

步骤306，对该基频数据进行中值滤波处理。

本实施例中，判断基频段长度是否小于第一预设帧长，若是，则直接进行窗长为基频段长度的中值滤波，若否，则每帧做第一预设点数的中值滤波。

具体地，基频段长度是指基频数据中连续相邻基频值不为零的基频点连起来的长度。第一预设帧长可根据需要设定，如为30帧、35帧等。

中值滤波是指将每一基频点的基频值设置为该基频点某领域窗口内的所有基频点基频值的中值。

步骤308，对基频值为零的基频点进行填充处理。

本实施例中，将基频段后长度小于第二预设帧长的零基频段的基频值置为基频段最后一帧基频值。零基频段是由连续相邻基频值为零的基频点连起来形成的。第二预设帧长可根据需要设定，如为15帧。

步骤310，对经过中值滤波处理及填充处理后的基频值进行音符化，得到音符值。

本实施例中，对全部的基频值进行音符化，其计算公式为(2)。

其中，x为基频值。

步骤312，将时间上连续且音符值相同的点连在一起，得到该录制的音频数据的三元组序列，该三元组序列中的各三元组包括三元组的起始时间、三元组的音符值和三元组的持续时间。

本实施例中，合并音符值，将时间上连续且音符值相同的点连在一起，得到录制的音频数据的三元组序列O_i，其中，O为三元组(s,m,l)，s为三元组的起始时间(单位可为50毫秒)，m为该三元组的音符值，l为该三元组的持续时间(单位可为50毫秒)。其中，三元组的起始时间单位和三元组的持续时间单位可根据需要选定，不限于此50毫秒。

通过提取基频数据中的三元组序列，作为用户的旋律特征，便于与原始旋律特征比对，计算方便，且提取出基频数据，去除了泛音，提高比对的准确性，同时对基频数据进行奇异基频点检测及置零，中值滤波及零基频点填充，去除噪声，提高三元组序列的准确性，便于后续计算。

步骤302至步骤312可在终端上或服务器上执行。

在一个实施例中，在该获取该基频数据中的奇异基频点，并将该奇异基频点的基频值置零的步骤之后，上述演唱歌曲熟识广度检测方法还包括：获取该基频数据中基频值非零的段落时间和；判断该段落时间和是否大于或等于第三预设时长，若是，则执行该对该基频数据进行中值滤波处理的步骤，若否，则提示检测结束，将该演唱等级作为演唱歌曲熟识广度等级，并输出该演唱歌曲熟识广度等级。

本实施例中，第三预设时长可根据需要设定，如10秒，15秒等。连续相邻的基频值非零的基频点连起来形成一个段落，采用时间表示该段落长度。将各个基频值非零的段落时间加起来求和得到基频值非零的段落时间和。小于第三预设时长，直接提示检测结束，减少后面的数据处理过程，节省计算资源及计算时间。

图4为一个实施例中将该用户的旋律特征与该选取的歌曲的原始旋律特征进行比对，得到检测值的具体流程图。如图4所示，将该用户的旋律特征与该选取的歌曲的原始旋律特征进行比对，得到检测值的步骤包括：

步骤402，获取该选取的歌曲的第一原始三元组序列及该歌曲的分句信息。

本实施例中，可从音乐库中获取选取的歌曲的第一原始三元组序列及歌曲的分句信息。第一原始三元组序列可由歌曲的midi文件转换得到。直接读取midi文件即可形成。如表1所示。

表1

s(起始时间)	l(持续时间)	m(音符值)
			42432	328	71
42761	328	74
			43090	328	76
43419	328	76
			43748	328	74
44076	328	71
			44405	657	71
45063	328	69

表1中的起始时间和持续时间的单位为50毫秒，通过对起始时间和持续时间进行规整单位处理得到对应的整数值(采用四舍五入处理)，如持续时间328/50约等于7。657/50约等于13。在其他方式中也可以采用取整处理。

歌曲的分句信息可包括各分句的起始时间和结束时间、分句数量等。

步骤404，根据该分句信息获取该歌曲的分句数量及各分句对应的第二原始三元组序列。

本实施例中，根据三元组序列中各三元组的起始时间和结束时间与分句的起始时间和结束时间进行比较，三元组的起始时间和结束时间落在哪个分句中，则该三元组属于该分句。如此每个分句得到一个三元组序列，即为第二原始三元组序列。

步骤406，以各个分句为起点，得到分句数量个第三原始三元组序列，且各个第三原始三元组序列中原始三元组的个数与该录制的音频数据的三元组序列中三元组的个数相同。

本实施例中，因用户录制的音频数据可为从任意分句开始演唱得到的，故以各个分句为起点，选取与录制的音频数据的三元组序列中三元组的个数相同的原始三元组组成第三原始三元组序列。因有分句数量个分句，则得到分句数量个第三原始三元组序列。

步骤408，计算各个第三原始三元组序列与该录制的音频数据的三元组序列之间的距离，选取最小的距离作为最优距离。

在一个实施例中，步骤408包括：计算第三原始三元组序列中原始三元组与对应的该录制的音频数据的三元组序列中三元组的音符值差的绝对值，再加上两者持续时间差的绝对值，得到两者之间的距离；计算第三原始三元组序列与该录制的音频数据的三元组序列一一对应的三元组间的距离之和，得到第三原始三元组序列与该录制的音频数据的三元组序列之间的距离。

具体地，例如录制的音频数据的三元组序列中包括三个三元组(s11，m11，l11)、(s12，m12，l12)和(s13，m13，l13)，第三原始三元组序列包括三个原始三元组(s21，m21，l21)、(s22，m22，l22)和(s23，m23，l23)，则(s11，m11，l11)与(s21，m21，l21)对应，(s12，m12，l12)与(s22，m22，l22)对应，(s13，m13，l13)与(s23，m23，l23)对应。(s11，m11，l11)与(s21，m21，l21)的距离为L1＝|m11-m21|+|l11-l21|,(s12，m12，l12)与(s22，m22，l22)之间的距离为L2＝|m12-m22|+|l12-l22|，(s13，m13，l13)与(s23，m23，l23)之间的距离为L3＝|m13-m23|+|l13-l23|，则第三原始三元组序列与该录制的音频数据的三元组序列之间的距离为L＝L1+L2+L3。

步骤410，将该最优距离除以该基频数据中基频值非零的段落时间和，得到误差率，将该误差率作为检测值。

步骤402至步骤410可在终端或服务器上执行。

上述通过原始三元组序列与录制的音频数据的三元组序列进行比对，得到最优距离，再将最优距离除以基频值非零的段落时间和，可得到平均距离，将该平均距离作为误差率，更加准确反映误差率。

进一步的，该判断该检测值是否大于预设的阈值的步骤包括：判断该误差率是否大于预设的阈值。

预设的阈值根据需要设定。

在一个实施例中，上述演唱歌曲熟识广度检测方法还包括：获取分享指令；根据该分享指令将用户标识及对应的演唱歌曲熟识广度等级分享至社交平台。

本实施例中，终端获取用户触发操作产生的分享指令，根据该分享指令将用户标识及对应的演唱歌曲熟识广度等级分享到社交平台。

用户标识是用于唯一表示用户身份的字符串等。社交平台可包括即时通信应用、微博、朋友圈等中一种或多种。

图5A为一个实施例中演唱歌曲熟识广度检测装置的结构框图。如图5A所示，一种演唱歌曲熟识广度检测装置，包括选取模块502、音频数据获取模块504、提取模块506、比对模块508、判断模块510、输出模块512和进入模块514。其中：

选取模块502用于获取演唱等级，选取与该演唱等级对应的歌曲。

音频数据获取模块504用于获取用户根据该选取的歌曲录制的音频数据。

提取模块506用于提取该录制的音频数据中的旋律特征，得到用户的旋律特征。

比对模块508用于将该用户的旋律特征与该选取的歌曲的原始旋律特征进行比对，得到检测值。

判断模块510用于判断该检测值是否大于预设的阈值。

输出模块512用于在判断出该检测值大于预设的阈值，提示检测结束，将该演唱等级作为演唱歌曲熟识广度等级，并输出该演唱歌曲熟识广度等级。

进入模块514用于在判断出该检测值小于或等于预设的阈值，表示该用户通过该演唱等级，并获取该演唱等级的相邻下一演唱等级，继续由该选取模块502、音频数据获取模块504、提取模块506、比对模块508、判断模块510、输出模块512和进入模块514循环执行。

上述演唱歌曲熟识广度检测装置，获取演唱等级，选取与演唱等级对应的歌曲，录制用户根据选取的歌曲演唱的音频数据，提取录制的音频数据中的旋律特征，得到用户旋律特征，将用户旋律特征与原始旋律特征比对得到检测值，检测值大于预设的阈值，则将该演唱等级作为演唱歌曲熟识广度等级，并输出，作为该用户的演唱歌曲熟识广度等级，若小于或等于预设的阈值，则继续获取下一演唱等级，再选取对应的歌曲进行检测，直到检测出该用户的演唱歌曲熟识广度等级，实现了检测出用户的演唱歌曲熟识广度。

图5B为另一个实施例中演唱歌曲熟识广度检测装置的结构框图。如图5B所示，一种演唱歌曲熟识广度检测装置，包括选取模块502、音频数据获取模块504、提取模块506、比对模块508、判断模块510、输出模块512和进入模块514，还包括播放模块503。

音频数据获取模块504还用于获取用户根据选取的歌曲进行清唱并录制的音频数据。

在一个实施例中，播放模块503用于播放该选取的歌曲的伴奏。音频数据获取模块504还用于获取用户根据选取的歌曲并按照播放的伴奏录制的音频数据。

在一个实施例中，播放模块503还用于在获取用户根据选取的歌曲录制的音频数据之前，根据选取的歌曲播放用于伴唱的提示音。

播放模块503还用于根据该选取的歌曲播放不超过第一预设时长的用于伴唱的提示音。

音频数据获取模块504还用于获取用户根据该提示音演唱并录制的超过第二预设时长的音频数据。

图6为另一个实施例中演唱歌曲熟识广度检测装置的结构框图。如图6所示，一种演唱歌曲熟识广度检测装置，除了包括选取模块502、音频数据获取模块504、提取模块506、比对模块508、判断模块510、输出模块512和进入模块514，还包括参数获取模块516、流传度计算模块518、流传度获取模块520、排序模块522、等级划分模块524。其中：

参数获取模块516用于获取音乐库中各歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量。

流传度计算模块518用于根据各歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量通过加权得到各歌曲对应的流传度。

流传度获取模块520用于在该获取演唱等级，选取与该演唱等级对应的歌曲之前，获取音乐库中的歌曲的流传度。

排序模块522用于按照该歌曲的流传度从高到低进行排序。

等级划分模块524用于将排序后的歌曲划分为第一数量个演唱等级，每个演唱等级包括第二数量首歌曲，且流传度高的歌曲所属的演唱等级低。

如图7所示，在一个实施例中，该用户的旋律特征包括三元组序列；

该提取模块506包括提取单元5061、置零单元5062、滤波单元5063、填充单元5064、转化单元5065、合并单元5066、时间长度获取单元5067和判断单元5068中所有可能的组合。其中：

提取单元5061用于提取该录制的音频数据中的基频数据。

置零单元5062用于获取该基频数据中的奇异基频点，并将该奇异基频点的基频值置零。

滤波单元5063用于对该基频数据进行中值滤波处理。

填充单元5064用于对基频值为零的基频点进行填充处理。

转化单元5065用于对经过中值滤波处理及填充处理后的基频值进行音符化，得到音符值。

合并单元5066用于将时间上连续且音符值相同的点连在一起，得到该录制的音频数据的三元组序列，该三元组序列中的各三元组包括三元组的起始时间、三元组的音符值和三元组的持续时间。

时间长度获取单元5067用于在该获取该基频数据中的奇异基频点，并将该奇异基频点的基频值置零之后，获取该基频数据中基频值非零的段落时间和。

判断单元5068用于判断该段落时间和是否大于或等于第三预设时长，若是，则该滤波单元5063用于对该基频数据进行中值滤波处理，若否，则该输出模块512提示检测结束，将该演唱等级作为演唱歌曲熟识广度等级，并输出该演唱歌曲熟识广度等级。

如图8所示，该比对模块508包括第一获取单元5081、第二获取单元5082、第三获取单元5083、距离计算单元5084和相似度计算单元5085，其中：

第一获取单元5081用于获取该选取的歌曲的第一原始三元组序列及该歌曲的分句数量。

第二获取单元5082用于获取该歌曲的各分句对应的第二原始三元组序列。

第三获取单元5083用于以各个分句为起点，得到分句数量个第三原始三元组序列，且各个第三原始三元组序列中原始三元组的个数与该录制的音频数据的三元组序列中三元组的个数相同。

距离计算单元5084用于计算各个第三原始三元组序列与该录制的音频数据的三元组序列之间的距离，选取最小的距离作为最优距离。

检测值计算单元5085用于将该最优距离除以该基频数据中基频值非零的段落时间和，得到误差率，将该误差率作为检测值。

该判断模块510还用于判断该误差率是否大于预设的阈值。

该距离计算单元5084还用于计算第三原始三元组序列中原始三元组与对应的该录制的音频数据的三元组序列中三元组的音符值差的绝对值，再加上两者持续时间差的绝对值，得到两者之间的距离；以及

计算第三原始三元组序列与该录制的音频数据的三元组序列一一对应的三元组间的距离之和，得到第三原始三元组序列与该录制的音频数据的三元组序列之间的距离。

图9为另一个实施例中演唱歌曲熟识广度检测装置的结构框图。如图9所示，一种演唱歌曲熟识广度检测装置，除了包括选取模块502、音频数据获取模块504、提取模块506、比对模块508、判断模块510、输出模块512和进入模块514，还包括指令获取模块526和分享模块528。其中：

指令获取模块526用于获取分享指令。

分享模块528用于根据该分享指令将用户标识及对应的演唱歌曲熟识广度等级分享至社交平台。

在其他实施例中，一种演唱歌曲熟识广度检测装置，可包括选取模块502、播放模块503、音频数据获取模块504、提取模块506、比对模块508、判断模块510、输出模块512、进入模块514、参数获取模块516、流传度计算模块518、流传度获取模块520、排序模块522、等级划分模块524、指令获取模块526和分享模块528中任意可能的组合。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory，ROM)等。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种演唱歌曲熟识广度检测方法，包括：

步骤A，获取演唱等级，选取与所述演唱等级对应的歌曲；

步骤B，获取用户根据所述选取的歌曲录制的音频数据；

2.根据权利要求1所述的方法，其特征在于，在所述获取演唱等级，选取与所述演唱等级对应的歌曲的步骤之前，所述方法还包括：

获取音乐库中的歌曲的流传度；

按照所述歌曲的流传度从高到低进行排序；

将排序后的歌曲划分为第一数量个演唱等级，每个演唱等级包括第二数量首歌曲，且流传度高的歌曲所属的演唱等级低。

3.根据权利要求2所述的方法，其特征在于，在所述获取音乐库中的歌曲的流传度的步骤之前，所述方法还包括：

获取音乐库中各歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量；

根据各歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量通过加权得到各歌曲对应的流传度。

4.根据权利要求1所述的方法，其特征在于，在所述获取用户根据所述选取的歌曲录制的音频数据的步骤之前，所述方法还包括：

根据所述选取的歌曲播放不超过第一预设时长的用于伴唱的提示音；

所述获取用户根据所述选取的歌曲录制的音频数据的步骤包括：

获取用户根据所述用于伴唱的提示音录制的超过第二预设时长的音频数据。

5.根据权利要求1所述的方法，其特征在于，所述用户的旋律特征包括三元组序列；

所述提取所述录制的音频数据中的旋律特征，得到用户的旋律特征的步骤包括：

提取所述录制的音频数据中的基频数据；

获取所述基频数据中的奇异基频点，并将所述奇异基频点的基频值置零；

对所述基频数据进行中值滤波处理；

对基频值为零的基频点进行填充处理；

对经过中值滤波处理及填充处理后的基频值进行音符化，得到音符值；

将时间上连续且音符值相同的点连在一起，得到所述录制的音频数据的三元组序列，所述三元组序列中的各三元组包括三元组的起始时间、三元组的音符值和三元组的持续时间。

6.根据权利要求5所述的方法，其特征在于，在所述获取所述基频数据中的奇异基频点，并将所述奇异基频点的基频值置零的步骤之后，所述方法还包括：

获取所述基频数据中基频值非零的段落时间和，连续相邻的基频值非零的基频点连起来形成一个段落，采用时间表示该段落长度，将各个基频值非零的段落时间加起来求和得到基频值非零的段落时间和；

判断所述段落时间和是否大于或等于第三预设时长，若是，则执行所述对所述基频数据进行中值滤波处理的步骤，若否，则提示检测结束，将所述演唱等级作为演唱歌曲熟识广度等级，并输出所述演唱歌曲熟识广度等级。

7.根据权利要求5所述的方法，其特征在于，所述将所述用户的旋律特征与所述选取的歌曲的原始旋律特征进行比对，得到检测值的步骤包括：

获取所述选取的歌曲的第一原始三元组序列及所述歌曲的分句信息；

根据所述分句信息获取所述歌曲的分句数量及各分句对应的第二原始三元组序列；

以各个分句为起点，得到分句数量个第三原始三元组序列，且各个第三原始三元组序列中原始三元组的个数与所述录制的音频数据的三元组序列中三元组的个数相同；

计算各个第三原始三元组序列与所述录制的音频数据的三元组序列之间的距离，选取最小的距离作为最优距离；

将所述最优距离除以所述基频数据中基频值非零的段落时间和，得到误差率，将所述误差率作为检测值，连续相邻的基频值非零的基频点连起来形成一个段落，采用时间表示该段落长度，将各个基频值非零的段落时间加起来求和得到基频值非零的段落时间和；

所述判断所述检测值是否大于预设的阈值的步骤包括：

判断所述误差率是否大于预设的阈值。

8.根据权利要求7所述的方法，其特征在于，所述计算各个第三原始三元组序列与所述录制的音频数据的三元组序列之间的距离的步骤包括：

计算第三原始三元组序列中原始三元组与对应的所述录制的音频数据的三元组序列中三元组的音符值差的绝对值，再加上两者持续时间差的绝对值，得到两者之间的距离；

计算第三原始三元组序列与所述录制的音频数据的三元组序列一一对应的三元组间的距离之和，得到第三原始三元组序列与所述录制的音频数据的三元组序列之间的距离。

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取分享指令；

根据所述分享指令将用户标识及对应的演唱歌曲熟识广度等级分享至社交平台。

10.一种演唱歌曲熟识广度检测装置，其特征在于，包括：

音频数据获取模块，用于获取用户根据所述选取的歌曲录制的音频数据；

判断模块，用于判断所述检测值是否大于预设的阈值；

进入模块，用于在判断出所述检测值小于或等于预设的阈值，表示所述用户通过所述演唱等级，并获取所述演唱等级的相邻下一演唱等级，继续由所述选取模块、音频数据获取模块、提取模块、比对模块、判断模块、输出模块和进入模块循环执行。

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

流传度获取模块，用于在所述获取演唱等级，选取与所述演唱等级对应的歌曲之前，获取音乐库中的歌曲的流传度；

排序模块，用于按照所述歌曲的流传度从高到低进行排序；

等级划分模块，用于将排序后的歌曲划分为第一数量个演唱等级，每个演唱等级包括第二数量首歌曲，且流传度高的歌曲所属的演唱等级低。

12.根据权利要求11所述的装置，其特征在于，所述装置还包括：

参数获取模块，用于获取音乐库中各歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量；

流传度计算模块，用于根据各歌曲对应的歌曲被演唱数量、歌曲已上线时间和歌曲收听数量通过加权得到各歌曲对应的流传度。

13.根据权利要求10所述的装置，其特征在于，所述装置还包括：

播放模块，用于在所述获取用户根据所述选取的歌曲录制的音频数据之前，根据所述选取的歌曲播放不超过第一预设时长的用于伴唱的提示音；

所述音频数据获取模块还用于获取用户根据所述用于伴唱的提示音录制的超过第二预设时长的音频数据。

14.根据权利要求10所述的装置，其特征在于，所述用户的旋律特征包括三元组序列；

所述提取模块包括：

提取单元，用于提取所述录制的音频数据中的基频数据；

置零单元，用于获取所述基频数据中的奇异基频点，并将所述奇异基频点的基频值置零；

滤波单元，用于对所述基频数据进行中值滤波处理；

填充单元，用于对基频值为零的基频点进行填充处理；

转化单元，用于对经过中值滤波处理及填充处理后的基频值进行音符化，得到音符值；

合并单元，用于将时间上连续且音符值相同的点连在一起，得到所述录制的音频数据的三元组序列，所述三元组序列中的各三元组包括三元组的起始时间、三元组的音符值和三元组的持续时间。

15.根据权利要求14所述的装置，其特征在于，所述提取模块还包括：

时间长度获取单元，用于在所述获取所述基频数据中的奇异基频点，并将所述奇异基频点的基频值置零之后，获取所述基频数据中基频值非零的段落时间和，连续相邻的基频值非零的基频点连起来形成一个段落，采用时间表示该段落长度，将各个基频值非零的段落时间加起来求和得到基频值非零的段落时间和；

判断单元，用于判断所述段落时间和是否大于或等于第三预设时长，若是，则所述滤波单元用于对所述基频数据进行中值滤波处理，若否，则所述输出模块提示检测结束，将所述演唱等级作为演唱歌曲熟识广度等级，并输出所述演唱歌曲熟识广度等级。

16.根据权利要求14所述的装置，其特征在于，所述比对模块包括：

第一获取单元，用于获取所述选取的歌曲的第一原始三元组序列及所述歌曲的分句信息；

第二获取单元，用于根据所述分句信息获取所述歌曲的分句数量及各分句对应的第二原始三元组序列；

第三获取单元，用于以各个分句为起点，得到分句数量个第三原始三元组序列，且各个第三原始三元组序列中原始三元组的个数与所述录制的音频数据的三元组序列中三元组的个数相同；

距离计算单元，用于计算各个第三原始三元组序列与所述录制的音频数据的三元组序列之间的距离，选取最小的距离作为最优距离；

相似度值计算单元，用于将所述最优距离除以所述基频数据中基频值非零的段落时间和，得到误差率，将所述误差率作为检测值，连续相邻的基频值非零的基频点连起来形成一个段落，采用时间表示该段落长度，将各个基频值非零的段落时间加起来求和得到基频值非零的段落时间和；

所述判断模块还用于判断所述误差率是否大于预设的阈值。

17.根据权利要求16所述的装置，其特征在于，所述距离计算单元还用于计算第三原始三元组序列中原始三元组与对应的所述录制的音频数据的三元组序列中三元组的音符值差的绝对值，再加上两者持续时间差的绝对值，得到两者之间的距离；以及

18.根据权利要求10所述的装置，其特征在于，所述装置还包括：

指令获取模块，用于获取分享指令；

分享模块，用于根据所述分享指令将用户标识及对应的演唱歌曲熟识广度等级分享至社交平台。