CN107507628B

CN107507628B - 唱歌评分方法、装置及终端

Info

Publication number: CN107507628B
Application number: CN201710770576.XA
Authority: CN
Inventors: 梁衍鹏
Original assignee: Guangzhou Kugou Computer Technology Co Ltd
Current assignee: Guangzhou Kugou Computer Technology Co Ltd
Priority date: 2017-08-31
Filing date: 2017-08-31
Publication date: 2021-01-15
Anticipated expiration: 2037-08-31
Also published as: CN107507628A

Abstract

本发明公开了一种唱歌评分方法、装置及终端，属于语音信号处理技术领域。所述方法包括：实时获取用户在演唱歌曲时产生的人声数据流；将人声数据流转换成音高数据流；分别基于n个偏移时长对音高数据流进行偏移，得到n个偏移数据流，n个偏移时长各不相同；根据n个偏移数据流分别计算每句歌词最高的演唱得分；根据歌曲中所有歌词的演唱得分计算歌曲的演唱得分。本发明可通过多次对不同的偏移数据流进行评分来提高每句歌词的演唱得分，最终提高歌曲的演唱评分，而不是仅仅根据一个音高数据流计算每句歌词的演唱得分，解决了歌词的演唱得分不准确时，导致歌曲的演唱得分不高的问题，达到了提高歌曲的演唱得分的效果。

Description

唱歌评分方法、装置及终端

技术领域

本发明涉及语音信号处理技术领域，特别涉及一种唱歌评分方法、装置及终端。

背景技术

用户在唱歌时，通常是终端播放歌曲的伴奏，用户随着伴奏唱歌，终端中的声卡对此时的外界声音进行录制，得到直播音频流。终端还可以对该直播音频流进行评分，用户可以根据演唱得分确定自己的唱歌水平。

相关技术中，终端获取用户演唱歌曲时产生的人声数据流；将该人声数据流转换为音高数据流；根据音高数据流分别计算每句歌词的演唱得分；根据歌曲中所有歌词的演唱得分计算该歌曲的演唱得分。

仅仅根据音高数据流计算每句歌词的演唱得分，这种评分方式较为严格，导致歌曲的演唱得分不高。

发明内容

为了解决以音高片段的初始时刻开始的标准音高文件对该音高片段进行评分，导致用户的演唱得分不高的问题，本发明实施例提供了一种唱歌评分方法、装置及终端。所述技术方案如下：

第一方面，提供了一种唱歌评分方法，所述方法包括：

实时获取用户在演唱歌曲时产生的人声数据流；

将所述人声数据流转换成音高数据流；

分别基于n个偏移时长对所述音高数据流进行偏移，得到n个偏移数据流，所述n个偏移时长各不相同，n≥2；

根据所述n个偏移数据流分别计算每句歌词最高的演唱得分；

根据所述歌曲中所有歌词的演唱得分计算所述歌曲的演唱得分。

第二方面，提供了一种唱歌评分装置，所述装置包括：

获取模块，用于实时获取用户在演唱歌曲时产生的人声数据流；

转换模块，用于将所述获取模块得到的所述人声数据流转换成音高数据流；

偏移模块，用于分别基于n个偏移时长对所述音高数据流进行偏移，得到n个偏移数据流，所述n个偏移时长各不相同，n≥2；

第一计算模块，用于根据所述偏移模块得到的所述n个偏移数据流分别计算每句歌词最高的演唱得分；

第二计算模块，用于根据所述歌曲中所有歌词的演唱得分计算所述歌曲的演唱得分。

第三方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的唱歌评分方法。

第四方面，提供了一种唱歌评分设备，所述唱歌评分设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行如第一方面所述的唱歌评分方法。

本发明实施例提供的技术方案的有益效果是：

由于n个偏移时长各不相同，所以，基于n个偏移时长偏移后可以得到n个不同的偏移数据流，这样，终端可以根据这n个不同的偏移数据流分别计算每句歌词最高的演唱得分，从而通过多次对不同的偏移数据流进行评分来提高每句歌词的演唱得分，最终提高歌曲的演唱评分，而不是仅仅根据一个音高数据流计算每句歌词的演唱得分，解决了歌词的演唱得分不准确时，导致歌曲的演唱得分不高的问题，达到了提高歌曲的演唱得分的效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例提供的唱歌评分方法的方法流程图；

图2是本发明另一实施例提供的唱歌评分方法的方法流程图；

图3是本发明一个实施例提供的唱歌评分的流程示意图；

图4是本发明一个实施例提供的唱歌评分装置的结构框图；

图5是本发明再一实施例提供的唱歌评分装置的结构框图；

图6是本发明一个实施例提供的终端的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

请参考图1，其示出了本发明一个实施例提供的唱歌评分方法的方法流程图，该唱歌评分方法可以应用于终端中，该终端可以是智能电视、智能手机或者平板电脑等等。该唱歌评分方法，包括：

步骤101，实时获取用户在演唱歌曲时产生的人声数据流。

步骤102，将人声数据流转换成音高数据流。

步骤103，分别基于n个偏移时长对音高数据流进行偏移，得到n个偏移数据流。

其中，n个偏移时长各不相同，且n≥2。

步骤104，根据n个偏移数据流分别计算每句歌词最高的演唱得分。

步骤105，根据歌曲中所有歌词的演唱得分计算歌曲的演唱得分。

综上所述，本发明实施例提供的唱歌评分方法，由于n个偏移时长各不相同，所以，基于n个偏移时长偏移后可以得到n个不同的偏移数据流，这样，终端可以根据这n个不同的偏移数据流分别计算每句歌词最高的演唱得分，从而通过多次对不同的偏移数据流进行评分来提高每句歌词的演唱得分，最终提高歌曲的演唱评分，而不是仅仅根据一个音高数据流计算每句歌词的演唱得分，解决了歌词的演唱得分不准确时，导致歌曲的演唱得分不高的问题，达到了提高歌曲的演唱得分的效果。

请参考图2，其示出了本发明另一实施例提供的唱歌评分方法的方法流程图，该唱歌评分方法可以应用于终端中，该终端可以是智能电视、智能手机或者平板电脑等等。该唱歌评分方法，包括：

步骤201，实时对用户演唱歌曲时的外界声音进行录音，得到直播音频流。

用户在唱歌时，终端中播放歌曲的伴奏，用户随着伴奏进行歌唱，此时，终端中的声卡实时对外界声音进行录音，本实施例将录音得到的数据流称为直播音频流。此时的直播音频流中至少包括人声数据流和伴奏，人声数据流即为用户发出的声音形成的数据流。

步骤202，根据歌曲的伴奏从直播音频流中提取人声数据流。

在获取到伴奏的前提下，从直播音频流中提取出人声数据流的技术已经非常成熟，本实施例不作赘述。

步骤203，将人声数据流转换成音高数据流。

音高指声音的高度，由发声体的振动频率决定。本实施例中，终端通过音高来对用户的演唱水平进行评分。

其中，将人声数据流转换成音高数据流的技术已经非常成熟，本实施例不作赘述。

需要说明的是，终端在声卡开始录音时开始计时，所以，人声数据流对应于一条时间轴，相应的，根据人声数据流转换得到的音高数据流也对应于该时间轴。即，音高数据流可以表示每个时刻声音的音高。

步骤204，分别基于n个偏移时长对音高数据流进行偏移，得到n个偏移数据流。

其中，n个偏移时长各不相同，且n≥2。其中，偏移包括向前偏移和向后偏移，当向前偏移时，偏移时长为负值；当向后偏移时，偏移时长为正值。当偏移时长为0时，偏移数据流即为步骤203得到的音高数据流。

在设置偏移时长时，终端可以设置偏移步长，以n个偏移步长来表示n个偏移时长。其中，偏移步长可以设置在50-60ms之间，也可以设置为其它数值，本实施例不作限定。在一种实现方式中，若n个5，且偏移步长为60ms，则偏移时长分别为-120ms、-60ms、0、60ms、120ms。

可选的，终端还可以设置偏移时长的最大值，此时，向前或向后偏移的时长的绝对值小于等于该偏移时长。

在实现时，终端可以基于时间轴对音高数据流的初始时刻进行偏移，从而实现对音频数据流的偏移。比如，在偏移之前，音高数据流基于时间轴的初始时刻是50ms，偏移时长为60ms，则在偏移之后，该音高数据流基于时间轴的初始时刻为110ms。

需要说明的是，，直播音频流的初次采样时刻的数值大于n个偏移时长的最大值，即，终端可以将直播音频流的初次采样时刻的数值设置为大于n个偏移时长的最大值，这样，在将该直播音频流对应的音高数据流向前偏移时，不会造成偏移后的初始时刻在时间轴的负轴上，导致偏移异常的问题，从而保证了偏移的正常执行。

步骤205，从n个偏移数据流中提取每句歌词对应的n个音高片段。

音高片段是对人声数据片段进行转换后得到的，人声数据片段是一句歌词的人声数据。

本实施例中，从n个偏移数据流中提取每句歌词对应的n个音高片段，可以包括如下两个子步骤：

步骤205a，获取歌曲的歌词文件。

歌词文件包括一首歌曲的所有歌词，且歌词以句为单位进行断句。

步骤205b，对于每个偏移数据流，当偏移数据流当前的数据与歌词文件中一句歌词的结尾对应时，从偏移数据流中提取歌词对应的音高片段。

在实现时，每当一个偏移数据流当前的数据与歌词文件中一句歌词的结尾对应时，终端实时地从偏移数据流中提取出与一句歌词对应的音高片段。比如，在偏移数据流当前的数据与第一句歌词对应时，提取第一句歌词对应的音高片段；在偏移数据流当前的数据与第二句歌词对应时，提取第二句歌词对应的音高片段，依次类推，直至提取到最后一句歌词对应的音高片段，然后执行步骤206。

步骤206，分别对每句歌词对应的n个音高片段进行评分，并将分值最高的演唱得分作为歌词最高的演唱得分。

本实施例中，分别对每句歌词对应的n个音高片段进行评分，可以包括如下两个子步骤：

步骤206a，获取歌曲的标准音高文件。

标准音高文件是作曲时设置的，可以表示每个时刻的标准音高。

步骤206b，对于每句歌词，通过标准音高文件对歌词对应的n个音高片段进行评分，得到n个演唱得分。

由于每个偏移数据流都可以提取出歌词对应的一个音高片段，因此，终端最终可以从n个偏移数据流中提取出该歌词对应的n个音高片段，终端再对这n个音高片段进行评分，得到n个演唱得分。

在实现时，终端在标准音高文件中获取该句歌词对应的标准音高片段，利用该标准音高片段分别对n个音高片段进行评分，得到n个演唱得分。这样，在由于制作误差或用户没有按时演唱或声卡存在时延，导致音高片段与标准音高片段在同一时刻的音高不对应时，可以通过n个偏移时长对音高片段中音高的时刻进行调整。当调整后的音高片段与标准音高片段在同一时刻的音高对应时，该音高片段的演唱得分最高，这时的演唱得分才能体现用户真正的演唱水平，所以将该演唱得分作为该歌词的演唱得分，从而通过放宽评分标准来提高演唱得分。

需要说明的是，相关技术中，相邻音高的时间间隔为50-60ms，所以，本实施例中将偏移步长设置在50-60ms之间，这样在以偏移步长为单位调整音高片段时，实际上是以音高为单位调整音高片段，使得以音高为评分依据的评分算法得到的评分结果更准确。

在执行完步骤205和206，得到一句歌词的演唱评分后，终端再次执行步骤205和206，以得到下一句歌词的演唱评分，依此类推，直至得到所有歌词的演唱评分后，执行步骤207。

步骤207，根据歌曲中所有歌词的演唱得分计算歌曲的演唱得分。

终端将所有歌词的演唱得分进行加权平均，将计算得到的结果作为歌曲的演唱得分。

请参考图3所示的唱歌评分的流程示意图，其中终端中设置有n个打分实例，每个打分实例获取到一个歌词文件、一个标准音高文件和一路偏移数据流，根据歌词文件从该路偏移数据流提取一句歌词对应的音高片段，根据标准音高文件对该音高片段进行评分，输出该歌词的演唱得分，终端接收每个打分实例输出的该歌词的演唱得分，对得到的n个演唱得分进行保存，并选取分值最高的演唱得分作为该歌词最高的演唱得分，终端再对所有歌词的演唱得分进行加权平均，得到歌曲最终的演唱得分。

对于每句歌词，从n个偏移数据流中提取该歌词对应的n个音高片段，此时这n个音高片段的初始时刻各不相同，再在标准音高文件中获取该句歌词对应的标准音高片段，利用该标准音高片段分别对n个音高片段进行评分，得到n个演唱评分，终端再将分值最高的演唱得分作为该歌词最高的演唱得分，解决了由于歌词文件、标准音高文件、音乐伴奏的时间存在制作误差，用户虽然音高很准，却没有按时演唱歌词，声卡在录音过程中存在时延时，得到的演唱得分不准确的问题，达到了进一步提高歌曲的演唱得分的效果。

直播音频流的初次采样时刻的数值大于n个偏移时长的最大值，这样，在将该直播音频流对应的音高数据流向前偏移时，不会造成偏移后的初始时刻在时间轴的负轴上，导致偏移异常的问题，从而保证了偏移的正常执行。

请参考图4，其示出了本发明一个实施例提供的唱歌评分装置的结构框图，该唱歌评分装置可以应用于终端中，该终端可以是智能电视、智能手机或者平板电脑等等。该唱歌评分装置，包括：

获取模块410，用于实时获取用户在演唱歌曲时产生的人声数据流；

转换模块420，用于将获取模块410得到的人声数据流转换成音高数据流；

偏移模块430，用于分别基于n个偏移时长对音高数据流进行偏移，得到n个偏移数据流，n个偏移时长各不相同，n≥2；

第一计算模块440，用于根据偏移模块430得到的n个偏移数据流分别计算每句歌词最高的演唱得分；

第二计算模块450，用于根据歌曲中所有歌词的演唱得分计算歌曲的演唱得分。

综上所述，本发明实施例提供的唱歌评分装置，由于n个偏移时长各不相同，所以，基于n个偏移时长偏移后可以得到n个不同的偏移数据流，这样，终端可以根据这n个不同的偏移数据流分别计算每句歌词最高的演唱得分，从而通过多次对不同的偏移数据流进行评分来提高每句歌词的演唱得分，最终提高歌曲的演唱评分，而不是仅仅根据一个音高数据流计算每句歌词的演唱得分，解决了歌词的演唱得分不准确时，导致歌曲的演唱得分不高的问题，达到了提高歌曲的演唱得分的效果。

请参考图5，其示出了本发明再一实施例提供的唱歌评分装置的结构框图，该唱歌评分装置可以应用于终端中，该终端可以是智能电视、智能手机或者平板电脑等等。该唱歌评分装置，包括：

获取模块510，用于实时获取用户在演唱歌曲时产生的人声数据流；

转换模块520，用于将获取模块510得到的人声数据流转换成音高数据流；

偏移模块530，用于分别基于n个偏移时长对音高数据流进行偏移，得到n个偏移数据流，n个偏移时长各不相同，n≥2；

第一计算模块540，用于根据偏移模块530得到的n个偏移数据流分别计算每句歌词最高的演唱得分；

第二计算模块550，用于根据歌曲中所有歌词的演唱得分计算歌曲的演唱得分。

可选的，第一计算模块540，包括：

第一提取单元541，用于从n个偏移数据流中提取每句歌词对应的n个音高片段；

计算单元542，用于分别对第一提取单元541得到的每句歌词对应的n个音高片段进行评分，并将分值最高的演唱得分作为歌词最高的演唱得分。

可选的，第一提取单元541，具体用于：

获取歌曲的歌词文件；

对于每个偏移数据流，当偏移数据流当前的数据与歌词文件中一句歌词的结尾对应时，从偏移数据流中提取歌词对应的音高片段。

可选的，计算单元542，具体用于：

获取歌曲的标准音高文件；

对于每句歌词，通过标准音高文件对歌词对应的n个音高片段进行评分，得到n个演唱得分。

可选的，获取模块510，包括：

录音单元511，用于实时对用户演唱歌曲时的外界声音进行录音，得到直播音频流，直播音频流的初次采样时刻的数值大于n个偏移时长的最大值；

第二提取单元512，用于根据歌曲的伴奏从录音单元511得到的直播音频流中提取人声数据流。

请参考图6，其示出了本发明一个实施例提供的终端600的结构框图，该终端可以包括射频(RF，Radio Frequency)电路601、包括有一个或一个以上计算机可读存储介质的存储器602、输入单元603、显示单元604、传感器605、音频电路606、无线保真(WiFi，Wireless Fidelity)模块607、包括有一个或者一个以上处理核心的处理器609、以及电源609等部件。本领域技术人员可以理解，图6中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

RF电路601可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器609处理；另外，将涉及上行的数据发送给基站。通常，RF电路601包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM，Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA，Low Noise Amplifier)、双工器等。此外，RF电路601还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(GSM，Global System of Mobile communication)、通用分组无线服务(GPRS，GeneralPacket Radio Service)、码分多址(CDMA，Code Division Multiple Access)、宽带码分多址(WCDMA，Wideband Code Division Multiple Access)、长期演进(LTE，Long TermEvolution)、电子邮件、短消息服务(SMS，Short Messaging Service)等。

存储器602可用于存储软件程序以及模块，处理器609通过运行存储在存储器602的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端设备的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器602可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器602还可以包括存储器控制器，以提供处理器608和输入单元603对存储器602的访问。

输入单元603可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，在一个具体的实施例中，输入单元603可包括触敏表面以及其他输入设备。触敏表面，也称为触摸显示屏或者触控板，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触敏表面可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器609，并能接收处理器608发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面，输入单元603还可以包括其他输入设备。具体地，其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元604可用于显示由用户输入的信息或提供给用户的信息以及终端设备的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元604可包括显示面板，可选的，可以采用液晶显示器(LCD，Liquid CrystalDisplay)、有机发光二极管(OLED，Organic Light-Emitting Diode)等形式来配置显示面板。进一步的，触敏表面可覆盖显示面板，当触敏表面检测到在其上或附近的触摸操作后，传送给处理器608以确定触摸事件的类型，随后处理器608根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图6中，触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能，但是在某些实施例中，可以将触敏表面与显示面板集成而实现输入和输出功能。

终端还可包括至少一种传感器605，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板的亮度，接近传感器可在终端移动到耳边时，关闭显示面板和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路606、扬声器，传声器可提供用户与终端之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号，传输到扬声器，由扬声器转换为声音信号输出；另一方面，传声器将收集的声音信号转换为电信号，由音频电路606接收后转换为音频数据，再将音频数据输出处理器609处理后，经RF电路601以发送给比如另一终端，或者将音频数据输出至存储器602以便进一步处理。音频电路606还可能包括耳塞插孔，以提供外设耳机与终端的通信。

WiFi属于短距离无线传输技术，终端通过WiFi模块607可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图6示出了WiFi模块607，但是可以理解的是，其并不属于终端的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器608是终端的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器602内的软件程序和/或模块，以及调用存储在存储器602内的数据，执行终端的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器608可包括一个或多个处理核心；优选的，处理器608可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器608中。

终端还包括给各个部件供电的电源609(比如电池)，优选的，电源可以通过电源管理系统与处理器608逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源609还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出，终端还可以包括摄像头、蓝牙模块等，在此不再赘述。具体在本实施例中，终端中的处理器608会运行存储在存储器602中的一个或一个以上的程序指令，从而实现上述各个方法实施例中所提供的唱歌评分方法。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，RandomAccess Memory)、磁盘或光盘等。

本发明一个实施例提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的唱歌评分方法。

本发明一个实施例提供了一种终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行如上所述的唱歌评分方法。

需要说明的是：上述实施例提供的唱歌评分装置在进行唱歌评分时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将唱歌评分装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的唱歌评分装置与唱歌评分方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种唱歌评分方法，其特征在于，所述方法包括：

实时获取用户在演唱歌曲时产生的人声数据流；

将所述人声数据流转换成音高数据流，所述音高数据流用于指示时间轴上的每个时刻的声音的音高；

分别根据n个偏移时长中的每个偏移时长基于时间轴对所述音高数据流的初始时刻进行偏移，得到n个偏移数据流，每个偏移时长对应一个偏移数据流，所述n个偏移时长各不相同，n≥2；

根据所述n个偏移数据流分别计算每句歌词最高的演唱得分；

2.根据权利要求1所述的方法，其特征在于，所述根据所述n个偏移数据流分别计算每句歌词最高的演唱得分，包括：

从所述n个偏移数据流中提取每句歌词对应的n个音高片段；

分别对每句歌词对应的n个音高片段进行评分，并将分值最高的演唱得分作为所述歌词最高的演唱得分。

3.根据权利要求2所述的方法，其特征在于，所述从所述n个偏移数据流中提取每句歌词对应的n个音高片段，包括：

获取所述歌曲的歌词文件；

对于每个偏移数据流，当所述偏移数据流当前的数据与所述歌词文件中一句歌词的结尾对应时，从所述偏移数据流中提取所述歌词对应的音高片段。

4.根据权利要求2所述的方法，其特征在于，所述分别对每句歌词对应的n个音高片段进行评分，包括：

获取所述歌曲的标准音高文件；

对于每句歌词，通过所述标准音高文件对所述歌词对应的n个音高片段进行评分，得到n个演唱得分。

5.根据权利要求1至4任一所述的方法，其特征在于，所述实时获取用户在演唱歌曲时产生的人声数据流，包括：

实时对所述用户演唱所述歌曲时的外界声音进行录音，得到直播音频流，所述直播音频流的初次采样时刻的数值大于所述n个偏移时长的最大值；

根据所述歌曲的伴奏从所述直播音频流中提取所述人声数据流。

6.一种唱歌评分装置，其特征在于，所述装置包括：

转换模块，用于将所述获取模块得到的所述人声数据流转换成音高数据流，所述音高数据流用于指示时间轴上的每个时刻的声音的音高；

偏移模块，用于分别根据n个偏移时长中的每个偏移时长基于时间轴对所述音高数据流的初始时刻进行偏移，得到n个偏移数据流，每个偏移时长对应一个偏移数据流，所述n个偏移时长各不相同，n≥2；

7.根据权利要求6所述的装置，其特征在于，所述第一计算模块，包括：

第一提取单元，用于从所述n个偏移数据流中提取每句歌词对应的n个音高片段；

计算单元，用于分别对所述第一提取单元得到的每句歌词对应的n个音高片段进行评分，并将分值最高的演唱得分作为所述歌词最高的演唱得分。

8.根据权利要求7所述的装置，其特征在于，所述第一提取单元，具体用于：

获取所述歌曲的歌词文件；

9.根据权利要求7所述的装置，其特征在于，所述计算单元，具体用于：

获取所述歌曲的标准音高文件；

10.根据权利要求6至9任一所述的装置，其特征在于，所述获取模块，包括：

录音单元，用于实时对所述用户演唱所述歌曲时的外界声音进行录音，得到直播音频流，所述直播音频流的初次采样时刻的数值大于所述n个偏移时长的最大值；

第二提取单元，用于根据所述歌曲的伴奏从所述录音单元得到的所述直播音频流中提取所述人声数据流。

11.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至5任一所述的唱歌评分方法。

12.一种终端，其特征在于，所述终端包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行权利要求1至5任一所述的唱歌评分方法。