CN111429949A

CN111429949A - 音高线生成方法、装置、设备及存储介质

Info

Publication number: CN111429949A
Application number: CN202010301415.8A
Authority: CN
Inventors: 汤伯超
Original assignee: Guangzhou Fanxing Huyu IT Co Ltd
Current assignee: Guangzhou Fanxing Huyu IT Co Ltd
Priority date: 2020-04-16
Filing date: 2020-04-16
Publication date: 2020-07-17
Anticipated expiration: 2040-04-16
Also published as: CN111429949B

Abstract

本申请公开了一种音高线生成方法、装置、设备及存储介质，属于计算机和互联网技术领域，所述方法包括：获取目标歌曲的n个歌曲音高信息；根据n个歌曲音高信息，确定目标歌曲的第一标准音高信息；根据第一标准音高信息，生成目标歌曲的第一音高线模型。本申请实施例提供了一种自动生成音高线的方法，提升了生成音高线的效率，节约了人力成本。并且，本申请实施例中，歌曲音高信息是用户演唱目标歌曲时生成的音高信息，从而根据多个歌曲音高信息确定的标准音高信息，融合了不同用户的演唱特点，以及同一用户在不同时刻的演唱特点，提升了根据该标准音高信息生成的音高线模型的通用性。

Description

音高线生成方法、装置、设备及存储介质

技术领域

本申请实施例涉及计算机和互联网技术领域，特别涉及一种音高线生成方法、装置、设备及存储介质。

背景技术

随着移动互联网的快速发展，各种唱歌类客户端逐渐兴起。用户通过安装在终端上的唱歌类客户端来唱歌，可以达到娱乐的效果。

在用户唱歌的过程中，客户端能够为用户提供演唱评分服务，以使得用户明确自己的唱歌水平，便于后续改进和提高。对用户的演唱评分需要绘制用户唱歌时的音高线，然后将该音高线与标准音高线进行比较，并根据它们之间的偏差来评分。相关技术对标准音高线的绘制采用人工标注的方法，也即，后台技术人员对客户端可供用户选择演唱的歌曲人工绘制标准音高线。

然而，由于唱歌类客户端可以提供海量歌曲供用户演唱，采用人工绘制标准音高线的方式效率低下，且浪费人力成本。

发明内容

本申请实施例提供了一种音高线生成方法、装置、设备及存储介质，可用于自动生成音高线，提升生成音高线的效率，节约人力成本。所述技术方案如下：

一方面，本申请实施例提供了一种音高线生成方法，所述方法包括：

获取目标歌曲的n个歌曲音高信息，所述歌曲音高信息是指用户根据所述目标歌曲的原始音频信息演唱所述目标歌曲时生成的音高信息，所述n为正整数；

根据所述n个歌曲音高信息，确定所述目标歌曲的第一标准音高信息；

根据所述第一标准音高信息，生成所述目标歌曲的第一音高线模型。

另一方面，本申请实施例提供了一种音高线生成方法，所述方法包括：

获取录制请求，所述录制请求用于请求在客户端中录制目标歌曲；

生成所述目标歌曲的歌曲音高信息；

向服务器发送所述歌曲音高信息；

接收来自于所述服务器的标准音高线模型，所述标准音高线模型是由所述服务器根据所述目标歌曲的至少一个歌曲音高信息生成的。

再一方面，本申请实施例提供了一种音高线生成装置，所述装置包括：

信息获取模块，用于获取目标歌曲的n个歌曲音高信息，所述歌曲音高信息是指用户根据所述目标歌曲的原始音频信息演唱所述目标歌曲时生成的音高信息，所述n为正整数；

信息确定模块，用于根据所述n个歌曲音高信息，确定所述目标歌曲的第一标准音高信息；

模型生成模块，用于根据所述第一标准音高信息，生成所述目标歌曲的第一音高线模型。

又一方面，本申请实施例提供了一种音高线生成装置，所述装置包括：

请求获取模块，用于获取录制请求，所述录制请求用于请求在客户端中录制目标歌曲；

信息生成模块，用于生成所述目标歌曲的歌曲音高信息；

信息发送模块，用于向服务器发送所述歌曲音高信息；

模型接收模块，用于接收来自于所述服务器的标准音高线模型，所述标准音高线模型是由所述服务器根据所述目标歌曲的至少一个歌曲音高信息生成的。

还一方面，本申请实施例提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机程序，所述计算机程序由所述处理器加载并执行以实现上述音高线生成方法。

还一方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述音高线生成方法。

还一方面，本申请实施例提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得计算机执行上述音高线生成方法。

本申请实施例提供的技术方案可以包括如下有益效果：

通过根据目标歌曲的多个歌曲音高信息，确定标准音高信息，并根据该标准音高信息，生成目标歌曲的音高线模型，从而提供了一种自动生成音高线的方法，提升了生成音高线的效率，节约了人力成本。并且，本申请实施例中，歌曲音高信息是用户演唱目标歌曲时生成的音高信息，从而根据多个歌曲音高信息确定的标准音高信息，融合了不同用户的演唱特点，以及同一用户在不同时刻的演唱特点，提升了根据该标准音高信息生成的音高线模型的通用性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的音高线生成系统的示意图；

图2是本申请一实施例提供的音高线生成方法的流程图；

图3是本申请另一实施例提供的音高线生成方法的流程图；

图4是本申请又一实施例提供的音高线生成方法的流程图；

图5是本申请一实施例提供的音高线生成装置的框图；

图6是本申请另一实施例提供的音高线生成装置的框图；

图7是本申请再一实施例提供的音高线生成装置的框图；

图8是本申请又一实施例提供的音高线生成装置的框图；

图9是本申请一实施例提供的终端的结构框图；

图10是本申请一实施例提供的服务器的结构框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

请参考图1，其示出了本申请一实施例提供的音高线生成系统的示意图。该音高线生成系统包括：终端10和服务器20。

终端10可以是诸如手机、平板电脑、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备、PC(Personal Computer，个人计算机)等电子设备。本申请实施例中，终端10可以包括处理器、存储器等部件。可选地，处理器，可以为CPU(Central Processing Unit，中央处理单元)等，可以用于获取目标歌曲的音频信息，并提取该音频信息中的音高信息等处理；存储器，可以为RAM(Random Access Memory，随机存取存储器)，Flash(闪存)等，可以用于存储数据、处理过程所需的数据、处理过程中生成的数据等，如存储目标歌曲的音高信息。本申请实施例对终端10的数量不作限定，可选地，该数量为至少一个。

本申请实施例中，终端10中安装有目标应用程序的客户端30，本申请实施例对目标应用程序的类型不作限定，可选地，该目标应用程序可以是歌曲播放类应用程序、K歌类应用程序、即时通讯类应用程序和视频播放类应用程序等。该客户端30可用于执行终端10执行的各个步骤，为了便于描述，在下述方法示例中，仅以客户端30执行终端10执行的各个步骤进行举例说明。

服务器20用于终端10中安装的客户端30提供后台服务。服务器20可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心。本申请实施例中，服务器20也可以包括处理器和存储器等部件。可选地，处理器，可以为CPU、GPU(Graphics Processing Unit，图形处理器)和FPGA(Field Programmable Gate Array，现场可编程逻辑门阵列)等，可以用于对目标歌曲的音高信息进行处理，得到目标歌曲的音高线模型；存储器，可以为系统存储器和大容量存储设备等，可以用于存储数据、处理过程所需的数据、处理过程中生成的数据等，如存储各个歌曲对应的音高信息，以及存储生成的各个歌曲对应的音高线模型。

本申请实施例中，服务器20可以通过网络40从终端10处获取音高信息，并对该音高信息进行存储。在一个示例中，针对目标歌曲，服务器20可以从存储的音高信息中获取目标歌曲对应的音高信息，并对目标歌曲的音高信息进行处理，得到目标歌曲的音高线模型。可选地，网络40可以是有线网络，也可以是无线网络。

请参考图2，其示出了本申请一实施例提供的音高线生成方法的流程图。该方法可以应用于上述服务器中，该方法可以包括如下几个步骤(210～230)：

步骤210，获取目标歌曲的n个歌曲音高信息。

歌曲音高信息是指用户演唱目标歌曲时生成的音高信息。本申请实施例对用户演唱目标歌曲的方式不作限定，可选地，用户清唱所述目标歌曲；或者，用户根据客户端播放的目标歌曲的原始音频信息演唱目标歌曲，其中，原始音频信息是指该目标歌曲的演唱者演唱目标歌曲生成的音频信息，本申请实施例对目标歌曲的原始音频信息对应的演唱者不作限定，可选地，该演唱者是目标歌曲的原创者，或者，该演唱者是目标歌曲的翻唱者。在用户演唱目标歌曲时，客户端可以进行音频信息记录，并根据息生成歌曲音高信息，有关客户端生成歌曲音高信息的过程详见下述方法实施例，此处不多赘述。

客户端在生成歌曲音高信息后，可以将该歌曲音高信息发送给服务器，由服务器对该歌曲音高信息进行存储。在一个示例中，上述方法还包括：接收来自于客户端的目标歌曲的歌曲音高信息；确定歌曲音高信息中包含的字音高信息的数量；若数量等于目标歌曲的歌词字数，则存储歌曲音高信息。

服务器在接收到目标歌曲的歌曲音高信息后，可以解析该歌曲音高信息，从而确定该歌曲音高信息中包含的字音高信息的数量。本申请实施例中，目标歌曲的歌词中每一个字可以对应一个字音高信息，若服务器解析出的字音高信息的数量等于目标歌曲的歌词字数，即表示该歌曲音高信息的内容是完整的，则服务器存储该歌曲音高信息，以便在后续生成目标歌曲的音高线模型的过程中使用；若服务器解析出的字音高信息的数量不等于目标歌曲的歌词字数，即表示该歌曲音高信息的内容是残缺的，不可用于生成目标歌曲的音高线模型，则服务器不存储该歌曲音高信息。

本申请实施例对服务器存储歌曲音高信息的位置不作限定，可选地，服务器可以将歌曲音高信息存储于信息数据库中，该信息数据库可以位于该服务器中，也可以位于其它计算机设备中。本申请实施例对服务器存储歌曲音高信息的方式也不作限定，可选地，服务器分类存储歌曲音高信息，示例性地，服务器按照歌曲音高信息对应的歌曲来分类存储歌曲音高信息，也即，服务器将属于同一首歌曲的歌曲音高信息存储在一个类别下。

在生成目标歌曲的音高线模型时，服务器可以从其存储的歌曲音高信息中获取目标歌曲的n个歌曲音高信息，n为正整数。可选地，每个歌曲音高信息对应有信息标识，如编号、hash(哈希)值等，该信息标识指示该歌曲音高信息对应的歌曲。本申请实施例对歌曲音高信息和信息标识之间的对应关系不作限定，可选地，多个歌曲音高信息对应一个信息标识，此时，一首歌曲可以对应一个信息标识，从而一首歌曲下的所有歌曲音高信息共用一个信息标识；或者，一个歌曲音高信息对应一个信息标识，从而一首歌曲下的所有歌曲音高信息对应一定范围的信息标识。服务器在获取目标歌曲的歌曲音高信息时，可以从其存储的歌曲音高信息中获取与目标歌曲对应的信息标识下的歌曲音高信息。

步骤220，根据n个歌曲音高信息，确定目标歌曲的第一标准音高信息。

第一标准音高信息是指目标歌曲的n个歌曲音高信息对应的优化歌曲音高信息，服务器获取到目标歌曲的n个歌曲音高信息后，可以对该n个歌曲音高信息进行处理，以确定目标歌曲的第一标准音高信息。本申请实施例对第一标准音高信息的确定方式不作限定，可选地，服务器对n个歌曲音高信息中的音高值进行平均计算处理或加权计算处理，以得到第一标准音高信息。本申请实施例对第一标准音高信息的内容不作限定，可选地，标准音高信息包括目标歌曲中每个字的标准音高值。

在一个示例中，上述第一标准音高信息包括目标歌曲中的至少一个字的标准音高值，则上述步骤220包括：对于目标歌曲中的第i个字，根据n个歌曲音高信息，确定第i个字的n个字音高信息，i为正整数；从n个字音高信息中选取满足第一条件的字音高信息；根据满足第一条件的字音高信息，计算第i个字的标准音高值。

本申请实施例中，一个歌曲音高信息中包含多个字音高信息，该字音高信息的数量等于目标歌曲的歌词字数，则针对目标歌曲中的第i个字，从每个歌曲音高信息中均可以提取出与该第i个字对应的字音高信息，从而服务器根据n个歌曲音高信息，可以确定该第i个字的n个字音高信息。为了确保标准音高信息的准确性，服务器可以对n个字音高信息进一步筛选，从n个字音高信息中选取满足第一条件的字音高信息，然后根据满足第一条件的字音高信息，计算第i个字的标准音高值。本申请实施例服务器计算标准音高值的方式不作限定，可选地，服务器可以对满足第一条件的字音高信息中的音高值进行平均计算处理或加权计算处理，以计算第i个字的标准音高值。

本申请实施例对上述第一条件的设置时机不作限定，可选地，上述第一条件可以预先设置，也可以由服务器根据目标歌曲动态设置，如根据目标歌曲的歌曲类型动态设置第一条件。本申请实施例对上述第一条件的设置内容也不作限定，可选地，上述第一条件可以结合服务器对第一标准音高信息的准确性需求来具体设置，如针对准确性需求较高的标准音高信息，服务器可以设置较为严苛的第一条件。

在一个示例中，上述从n个字音高信息中选取满足第一条件的字音高信息包括：计算n个字音高信息中的音高值的平均值；对于n个字音高信息中的第k个字音高信息，在第k个字音高信息中的音高值与平均值之间的差值小于第一阈值的情况下，选取第k个字音高信息；其中，第一条件包括差值小于第一阈值。

服务器在提取出n个字音高信息后，可以将该n个字音高信息中偏差较大的字音高信息剔除，选取偏差较小的字音高信息。也即，对于n个字音高信息，服务器先根据n个字音高信息中的音高值计算音高值的平均值，然后再对n个字音高信息中的每个字音高信息的音高值，计算该音高值与平均值之间的差值，若该音高值与平均值之间的差值小于第一阈值，则服务器选取该字音高信息，从而，上述第一条件包括差值小于第一阈值。

本申请实施例对第一阈值的设置时机和设置内容均不作限定，可选地，服务器可以结合标准音高信息的准确性需求来具体设置第一阈值，如针对准确性需求较高的标准音高信息，服务器可以设置较低的第一阈值，从而使得选取出的字音高信息之间的偏差尽可能小，提升标准音高信息的准确性。例如，服务器设置第一阈值为20赫兹，假设服务器计算出的n个字音高信息中音高值的平均值为50赫兹，那么当某个字音高信息中的音高值与50赫兹之间的差值小于20赫兹时，即可选取该字音高信息。

步骤230，根据第一标准音高信息，生成目标歌曲的第一音高线模型。

确定第一标准音高信息后，服务器可以进一步根据该第一标准音高信息，生成目标歌曲的第一音高线模型。本申请实施例对第一音高线模型的生成方式不作限定，可选地，第一标准音高信息包括目标歌曲中的至少一个字的标准音高值，则服务器按照歌词顺序，串联每个字的标准音高值，即可得到目标歌曲的第一音高线模型，其中，歌词顺序用于指示每个字在目标歌曲的歌词中的位置。

在一个示例中，上述步骤230之后，还包括：获取目标歌曲的新增的m个歌曲音高信息，m为正整数；根据n个歌曲音高信息和m个歌曲音高信息，确定目标歌曲的第二标准音高信息；根据第二标准音高信息，生成目标歌曲的第二音高线模型。

由于不断有用户演唱目标歌曲，客户端不断发送歌曲音高信息给服务器，从而服务器不断增加存储的歌曲音高信息的数量。根据不同数量的歌曲音高信息生成的音高线模型也可能是不一样的，通常来说，歌曲音高信息的数量越多，生成的音高线模型越准确，也即生成的音高线模型越逼近目标歌曲的标准音高线。本申请实施例中，为了得到更加准确的音高线模型，服务器在根据n个歌曲音高信息生成第一音高线模型后，继续获取新增的m个歌曲音高信息，然后根据该n+m个歌曲音高信息，确定目标歌曲第二标准音高信息，再根据第二标准音高信息，生成目标歌曲第二音高线模型。本申请实施例对服务器获取新增的m个歌曲音高信息的方式不作限定，可选地，服务器可以每隔预设时间获取歌曲音高信息，由于目标歌曲的歌曲音高信息的数量不断在增加，从而服务器在预设时间之后获取到的歌曲音高信息包括新增的歌曲音高信息。

可选地，上述生成目标歌曲的第二音高线模型之后，还包括：对于目标歌曲中的第s个字，确定第s个字对应的第一音高值和第二音高值，第一音高值是指第s个字在第一音高线模型中的音高值，第二音高值是指第s个字在第二音高线模型中的音高值，s为正整数；计算第一音高值和第二音高值的音高差；根据目标歌曲中的t个字的音高差，计算第一音高线模型和第二音高线模型之间的音高差平均值，t为正整数；在音高差平均值小于第二阈值的情况下，确定第二音高线模型为目标歌曲的标准音高线模型。

歌曲音高信息的数量越多，音高线模型的误差越小，为了避免服务器不断生成音高线模型，降低服务器的处理开销，本申请实施例在音高线模型的误差满足一定条件的情况下，将该音高线模型确定为标准音高线模型，并不再生成新的音高线模型。本申请实施例确定音高线模型的误差的方式为确定音高线模型之间的音高差平均值，也即，服务器计算第二音高线模型与第二音高线模型之间的音高差平均值，在音高差平均值小于第二阈值的情况下，确定音高线模型的误差满足要求，从而服务器将第二音高线模型确定为目标歌曲的标准音高线模型。

综上所述，本申请实施例提供的技术方案，通过根据目标歌曲的多个歌曲音高信息，确定标准音高信息，并根据该标准音高信息，生成目标歌曲的音高线模型，从而提供了一种自动生成音高线的方法，提升了生成音高线的效率，节约了人力成本。并且，本申请实施例中，歌曲音高信息是用户演唱目标歌曲时生成的音高信息，从而根据多个歌曲音高信息确定的标准音高信息，融合了不同用户的演唱特点，以及同一用户在不同时刻的演唱特点，提升了根据该标准音高信息生成的音高线模型的通用性。

另外，本申请实施例提供的技术方案，在生成音高线模型之后，继续获取新增的歌曲音高信息，并根据新增的歌曲音高信息和之前的歌曲音高信息，确定更新后的标准音高信息，然后根据更新后的标准音高信息，生成目标歌曲的更新后的音高线模型，从而实现了一种自动更新音高线模型的方法。由于使用的歌曲音高信息的数量越多，生成的音高线模型越准确，本申请实施例不断根据新增的歌曲音高信息和之前的歌曲音高信息生成音高线模型，实现了不断提升音高线模型的准确性。并且，本申请实施例在更新后的音高线模型与前一次的音高线模型之间的误差小于某一阈值的情况下，确定更新后的音高线模型与标准音高线之间的误差进入容忍度范围，并确定更新后的音高线模型为标准音高线模型，从而避免服务器不断更新音高线模型，提供了一种确定服务器停止更新音高线模型的方式，降低了服务器的处理开销。

请参考图3，其示出了本申请一实施例提供的音高线生成方法的流程图。该方法可以应用于上述客户端中，该方法可以包括如下几个步骤(310～340)：

步骤310，获取录制请求。

录制请求用于请求在客户端中录制目标歌曲。本申请实施例中，客户端对应有用户界面，该用户界面中包括一些操作控件，如按钮、滑块、图标等，以供用户进行操作。本申请实施例对录制请求的获取方式不作限定，可选地，客户端的用户界面中显示有录制控件，用户点击该录制控件可以触发客户端获取录制请求。当然，用户除了通过触控操作来触发客户端获取录制请求之外，还可以通过滑动、语音、手势等方式来触发客户端获取录制请求。本申请实施例对录制请求包含的内容不作限定，可选地，录制请求包括目标歌曲的歌曲标识。

步骤320，生成目标歌曲的歌曲音高信息。

客户端在获取到录制请求后，即可根据该录制请求提供录制服务，也即，在用户演唱目标歌曲的过程中，客户端录制用户演唱时的音频信息，并根据该音频信息生成目标歌曲的歌曲音高信息。

在一个示例中，上述步骤320包括：获取目标歌曲的歌词的第m个字的音频信息，该音频信息包括原始音频信息和直播音频信息，m为正整数；根据原始音频信息和直播音频信息，确定第m个字的歌曲音频信息；从第m个字的歌曲音频信息中提取第m个字的字音高信息；根据目标歌曲的歌词中各个字的字音高信息，生成目标歌曲的歌曲音高信息。

原始音频信息是指客户端播放目标歌曲的音频信息，直播音频信息是指客户端记录的用户演唱目标歌曲的音频信息，歌曲音频信息是指用户演唱目标歌曲的音频信息。对于目标歌曲的歌词的第m个字，客户端可以根据该第m个字的原始音频信息和直播音频信息，确定该第m个字的歌曲音频信息。可选地，客户端可以将原始音频信息与直播音频信息之间的差值作为歌曲音频信息，也即，歌曲音频信息可以使用直播音频信息减去原始音频信息得到。应理解，音频信息可以转换为频谱数据，该频谱数据中包括幅值，本申请实施例中直播音频信息减去原始音频信息的实现方法可以是：直播音频信息对应的频谱数据中的各个幅值，减去原始音频信息对应的频谱数据的各个幅值，从而可以得到歌曲音频信息对应的频谱数据的各个幅值，根据歌曲音频信息对应的频谱数据的各个幅值可以进一步转换为歌曲因信息。

客户端在确定了第m个字的歌曲音频信息后，可以从该第m个字的歌曲音频信息中提取第m个字的字音高信息。本申请实施例对字音高信息的内容不作限定，可选地，字音高信息包括以下至少一项：起始时间、音高值和时间间隔，其中，起始时间是指用户演唱该第m个字的时刻，音高值是指用户演唱该第m个字的音高值，时间间隔是指用户演唱该第m个字和演唱第m+1个字之间的时间间隔。客户端可以在用户演唱目标歌曲的过程中，实时确定目标歌曲中各个字的字音高信息，并对其进行存储。在确定了目标歌曲中所有字的字音高信息后，客户端可以根据歌词顺序，串联各个字的字音高信息，以生成目标歌曲的歌曲音高信息，其中，歌词顺序是指各个字在目标歌曲中的位置。

步骤330，向服务器发送歌曲音高信息。

客户端在生成歌曲音高信息后，可以将该歌曲音高信息发送给服务器，由服务器存储该歌曲音高信息。有关服务器存储歌曲音高信息的过程详见上述方法实施例，此处不再赘述。

步骤340，接收来自于服务器的标准音高线模型。

标准音高线模型是由服务器根据目标歌曲的至少一个歌曲音高信息生成的。有关服务器生成标准音高线模型的过程详见上述方法实施例，此处不再赘述。服务器在生成标准音高线模型后，可以将该标准音高线模型发送给客户端。

在一个示例中，上述步骤340之后，还包括：获取目标歌曲的录制音高信息；根据录制音高信息和标准音高线模型，生成目标歌曲的演唱评分；在客户端的用户界面中显示演唱评分。

客户端在接收到标准音高线模型后，即可根据该标准音高线模型进行演唱评分。在客户端获取录制请求后，获取录制音高信息，该录制音高信息是指用户演唱目标歌曲过程中录制的音高信息，然后根据录制音高信息和标准音高线模型，生成目标歌曲的演唱评分，该演唱评分用于指示用户演唱目标歌曲的水平。可选地，客户端可以计算录制音高信息与标准音高线模型之间的偏差，然后根据该偏差计算目标歌曲的演唱评分，可选地，该偏差越小，演唱评分越高。在计算出演唱评分后，客户端可以在用户界面中显示演唱评分，以使得用户明确自己的演唱水平，进行后续的改进等。

综上所述，本申请实施例提供的技术方案，通过在获取对应于目标歌曲的录制请求后，提供录制服务并生成目标歌曲的歌曲音高信息，然后向服务器发送歌曲音高信息，经过服务器对目标歌曲的歌曲音高信息的处理后，接收来自于服务器的标准音高线模型，从而提供了一种自动生成音高线的方法，提升了生成音高线的效率，节约了人力成本。并且，本申请实施例中，歌曲音高信息是用户演唱目标歌曲时生成的音高信息，从而标准音高线模型融合了不同用户的演唱特点，以及同一用户在不同时刻的演唱特点，提升了根据标准音高线模型的通用性。

另外，本申请实施例提供的技术方案，客户端在接收到标准音高线模型后，可以根据该标准音高线模型和录制音高信息，确定演唱评分，并在客户端的用户界面中显示演唱评分，以使得用户明确自身的演唱水平，提供了一种标准音高线模型的使用方法，提升了标准音高线模型的实用性。

下面从客户端和服务器交互的角度对本申请的技术方案进行说明。请参考图4，其示出了本申请一实施例提供的音高线生成方法的流程图，该方法可以包括如下几个步骤：

步骤410，客户端生成歌曲音高信息。客户端在获取到录制请求后，即可根据该录制请求提供录制服务，也即，在用户演唱目标歌曲的过程中，客户端录制用户演唱时的音频信息，并根据该音频信息生成目标歌曲的歌曲音高信息。可选地，客户端可以根据提取目标歌曲中各个字的字音高信息，然后根据各个字的字音高信息生成目标歌曲的歌曲音高信息。

步骤420，客户端向服务器发送歌曲音高信息。客户端在生成歌曲音高信息后，可以将该歌曲音高信息发送给服务器，由服务器存储该歌曲音高信息。可选地，服务器在接收到来自于客户端的目标歌曲的歌曲音高信息之后，确定歌曲音高信息中包含的字音高信息的数量，若该数量等于目标歌曲的歌词字数，则存储歌曲音高信息。

步骤430，服务器获取目标歌曲的n个歌曲音高信息。在生成目标歌曲的音高线模型时，服务器可以从其存储的歌曲音高信息中获取目标歌曲的n个歌曲音高信息，n为正整数。可选地，每个歌曲音高信息对应有信息标识，服务器在获取目标歌曲的歌曲音高信息时，可以从其存储的歌曲音高信息中获取与目标歌曲对应的信息标识下的歌曲音高信息。

步骤440，服务器根据n个歌曲音高信息，确定目标歌曲的第一标准音高信息。服务器获取到目标歌曲的n个歌曲音高信息后，可以对该n个歌曲音高信息进行处理，以确定目标歌曲的第一标准音高信息。可选地，第一标准音高信息包括目标歌曲中的至少一个字的标准音高值，则服务器确定目标歌曲的第一标准音高信息包括：对于目标歌曲中的第i个字，根据n个歌曲音高信息，确定第i个字的n个字音高信息，i为正整数；从n个字音高信息中选取满足第一条件的字音高信息；根据满足第一条件的字音高信息，计算第i个字的标准音高值。

步骤450，服务器根据第一标准音高信息，生成目标歌曲的第一音高线模型。确定第一标准音高信息后，服务器可以进一步根据该第一标准音高信息，生成目标歌曲的第一音高线模型。可选地第一，标准音高信息包括目标歌曲中的至少一个字的标准音高值，则服务器按照歌词顺序，串联每个字的标准音高值，即可得到目标歌曲的第一音高线模型，其中，歌词顺序用于指示每个字在目标歌曲的歌词中的位置。

步骤460，服务器获取目标歌曲的新增的m个歌曲音高信息。本申请实施例对服务器获取新增的m个歌曲音高信息的方式不作限定，可选地，服务器可以每隔预设时间获取歌曲音高信息，由于目标歌曲的歌曲音高信息的数量不断在增加，从而服务器在预设时间之后获取到的歌曲音高信息包括新增的歌曲音高信息。

步骤470，服务器根据n个歌曲音高信息和m个歌曲音高信息，生成目标歌曲的第二音高线模型。服务器根据该n+m个歌曲音高信息，可以确定目标歌曲第二标准音高信息，再根据第二标准音高信息，生成目标歌曲第二音高线模型。

步骤480，服务器在第二音高线模型与第一音高线模型之间的音高差平均值小于第二阈值的情况下，确定第二音高线模型为目标歌曲的标准音高线模型。本申请实施例在音高线模型的误差满足一定条件的情况下，将该音高线模型确定为标准音高线模型，并不再生成新的音高线模型。本申请实施例确定音高线模型的误差的方式为确定音高线模型之间的偏差，也即，服务器计算第二音高线模型与第一音高线模型之间的音高差平均值，在音高差平均值小于第二阈值的情况下，确定音高线模型的误差满足要求，从而服务器将第二音高线模型确定为目标歌曲的标准音高线模型。

步骤490，服务器向客户端发送标准音高线模型。服务器在生成标准音高线模型后，可以将该标准音高线模型发送给客户端，以便于客户端进行后续的演唱评分等处理。可选地，服务器可以将该标准音高线模型发送给提供该标准音高线模型生成过程中所需的歌曲音高信息的客户端，也可以将该标准音高线模型发送给其它客户端，还可以将该标准音高线模型发送给所有的客户端，本申请实施例对此不作限定。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参考图5，其示出了本申请一个实施例提供的音高线生成装置的框图。该装置500具有实现上述方法实施例的功能，该功能可以由硬件实现，也可以由硬件执行相应的软件实现。该装置500可以是上文介绍的计算机设备，如服务器。该装置500可以包括：信息获取模块510、信息确定模块520和模型生成模块530。

信息获取模块510，用于获取目标歌曲的n个歌曲音高信息，所述歌曲音高信息是指用户根据所述目标歌曲的原始音频信息演唱所述目标歌曲时生成的音高信息，所述n为正整数。

信息确定模块520，用于根据所述n个歌曲音高信息，确定所述目标歌曲的第一标准音高信息。

模型生成模块530，用于根据所述第一标准音高信息，生成所述目标歌曲的第一音高线模型。

在一个示例中，所述第一标准音高信息包括所述目标歌曲中的至少一个字的标准音高值；如图6所示，所述信息确定模块520包括：信息确定子模块522，用于对于所述目标歌曲中的第i个字，根据所述n个歌曲音高信息，确定所述第i个字的n个字音高信息，所述i为正整数；信息选取子模块524，用于从所述n个字音高信息中选取满足第一条件的字音高信息；信息计算子模块526，用于根据所述满足第一条件的字音高信息，计算所述第i个字的标准音高值。

在一个示例中，所述字音高信息包括音高值，如图6所示，所述信息选取子模块524，用于：计算所述n个字音高信息中的音高值的平均值；对于所述n个字音高信息中的第k个字音高信息，在所述第k个字音高信息中的音高值与所述平均值之间的差值小于第一阈值的情况下，选取所述第k个字音高信息；其中，所述第一条件包括所述差值小于所述第一阈值。

在一个示例中，所述信息获取模块510，还用于获取所述目标歌曲的新增的m个歌曲音高信息，所述m为正整数；所述信息确定模块520，还用于根据所述n个歌曲音高信息和所述m个歌曲音高信息，确定所述目标歌曲的第二标准音高信息；所述模型生成模块530，还用于根据所述第二标准音高信息，生成所述目标歌曲的第二音高线模型。

在一个示例中，如图6所示，所述装置500还包括：音高值确定模块540，用于对于所述目标歌曲中的第s个字，确定所述第s个字对应的第一音高值和第二音高值，所述第一音高值是指所述第s个字在所述第一音高线模型中的音高值，所述第二音高值是指所述第s个字在所述第二音高线模型中的音高值，所述s为正整数；音高差计算模块550，用于计算所述第一音高值和所述第二音高值的音高差；平均值计算模块560，用于根据所述目标歌曲中的t个字的音高差，计算所述第一音高线模型和所述第二音高线模型之间的音高差平均值，所述t为正整数；标准确定模块570，用于在所述音高差平均值小于第二阈值的情况下，确定所述更新后的音高线模型为所述目标歌曲的标准音高线模型。

在一个示例中，如图6所示，所述装置500还包括：信息接收模块501，用于接收来自于客户端的所述目标歌曲的歌曲音高信息；数量确定模块503，用于确定所述歌曲音高信息中包含的字音高信息的数量；信息存储模块505，用于若所述数量等于所述目标歌曲的歌词字数，则存储所述歌曲音高信息。

请参考图7，其示出了本申请一个实施例提供的音高线生成装置的框图。该装置700具有实现上述方法实施例的功能，该功能可以由硬件实现，也可以由硬件执行相应的软件实现。该装置700可以是上文介绍的计算机设备，如客户端。该装置700可以包括：。

请求获取模块710，用于获取录制请求，所述录制请求用于请求在客户端中录制目标歌曲。

信息生成模块720，用于生成所述目标歌曲的歌曲音高信息。

信息发送模块730，用于向服务器发送所述歌曲音高信息。

模型接收模块740，用于接收来自于所述服务器的标准音高线模型，所述标准音高线模型是由所述服务器根据所述目标歌曲的至少一个歌曲音高信息生成的。

在一个示例中，所述信息生成模块720，用于：获取所述目标歌曲的歌词的第m个字的音频信息，所述音频信息包括原始音频信息和直播音频信息，所述原始音频信息是指所述客户端播放所述目标歌曲的音频信息，所述直播音频信息是指所述客户端记录的用户演唱所述目标歌曲的音频信息，所述m为正整数；根据所述原始音频信息和所述直播音频信息，确定所述第m个字的歌曲音频信息，所述歌曲音频信息是指所述用户演唱所述目标歌曲的音频信息；从所述第m个字的歌曲音频信息中提取所述第m个字的字音高信息；根据所述目标歌曲的歌词中各个字的字音高信息，生成所述目标歌曲的歌曲音高信息。

在一个示例中，如图8所示，所述装置700还包括：信息获取模块750，用于获取所述目标歌曲的录制音高信息，所述录制音高信息是指所述客户端在用户演唱所述目标歌曲时录制的音高信息；评分生成模块760，用于根据所述录制音高信息和所述标准音高线模型，生成所述目标歌曲的演唱评分，所述演唱评分用于指示所述用户演唱所述目标歌曲的水平；评分显示模块770，用于在所述客户端的用户界面中显示所述演唱评分。

需要说明的是，本申请实施例提供的装置，在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

请参考图9，其示出了本申请一个实施例提供的终端900的结构框图。该终端900可以是诸如手机、平板电脑、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备等电子设备。该终端900中安装有客户端，可用于实施上述客户端侧的音高线生成方法。具体来讲：

通常，终端900包括有：处理器901和存储器902。

处理器901可以包括一个或多个处理核心，比如9核心处理器、8核心处理器等。处理器901可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(FieldProgrammable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器901可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器901还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器902可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令，至少一段程序、代码集或指令集，所述至少一条指令、至少一段程序、代码集或指令集，且经配置以由一个或者一个以上处理器执行，以实现上述客户端侧的音高线生成方法。

在一些实施例中，终端900还可选包括有：外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地，外围设备包括：射频电路904、触摸显示屏905、摄像头906、音频电路907、定位组件908和电源909中的至少一种。

本领域技术人员可以理解，图9中示出的结构并不构成对终端900的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

请参考图10，其示出了本申请实施例提供的服务器的结构框图。该服务器可以用于实施上述服务器侧的音高线生成方法。具体来讲：

该服务器1000包括处理单元(如CPU、GPU和FPGA等)1001、包括RAM(Random-AccessMemory，随机存储器)1002和ROM(Read-Only Memory，只读存储器)1003的系统存储器1004，以及连接系统存储器1004和中央处理单元1001的系统总线1005。该服务器1000还包括帮助服务器内的各个器件之间传输信息的I/O系统(Input Output System，基本输入/输出系统)1006，和用于存储操作系统1013、应用程序1014和其他程序模块1015的大容量存储设备1007。

该I/O系统1006包括有用于显示信息的显示器1008和用于用户输入信息的诸如鼠标、键盘之类的输入设备1009。其中，该显示器1008和输入设备1009都通过连接到系统总线1005的输入输出控制器1010连接到中央处理单元1001。该I/O系统1006还可以包括输入输出控制器1010以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1010还提供输出到显示屏、打印机或其他类型的输出设备。

该大容量存储设备1007通过连接到系统总线1005的大容量存储控制器(未示出)连接到中央处理单元1001。该大容量存储设备1007及其相关联的计算机可读介质为服务器1000提供非易失性存储。也就是说，该大容量存储设备1007可以包括诸如硬盘或者CD-ROM(Compact Disc Read-Only Memory，只读光盘)驱动器之类的计算机可读介质(未示出)。

不失一般性，该计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM(Erasable Programmable Read-Only Memory，可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory，电可擦写可编程只读存储器)、闪存或其他固态存储其技术，CD-ROM、DVD(Digital Video Disc，高密度数字视频光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知该计算机存储介质不局限于上述几种。上述的系统存储器1004和大容量存储设备1007可以统称为存储器。

根据本申请实施例，该服务器1000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1000可以通过连接在该系统总线1005上的网络接口单元1011连接到网络1012，或者说，也可以使用网络接口单元1011来连接到其他类型的网络或远程计算机系统(未示出)。

该存储器还包括计算机程序，该计算机程序存储于存储器中，且经配置以由一个或者一个以上处理器执行，以实现上述服务器侧的音高线生成方法。

在示例性实施例中，还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述客户端侧的音高线生成方法。

在示例性实施例中，还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述服务器侧的音高线生成方法。

在示例性实施例中，还提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得计算机执行上述客户端侧的音高线生成方法。

在示例性实施例中，还提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得计算机执行上述服务器侧的音高线生成方法。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种音高线生成方法，其特征在于，所述方法包括：

获取目标歌曲的n个歌曲音高信息，所述歌曲音高信息是指用户演唱所述目标歌曲时生成的音高信息，所述n为正整数；

2.根据权利要求1所述的方法，其特征在于，所述第一标准音高信息包括所述目标歌曲中的至少一个字的标准音高值；

所述根据所述n个歌曲音高信息，确定所述目标歌曲的第一标准音高信息，包括：

对于所述目标歌曲中的第i个字，根据所述n个歌曲音高信息，确定所述第i个字的n个字音高信息，所述i为正整数；

从所述n个字音高信息中选取满足第一条件的字音高信息；

根据所述满足第一条件的字音高信息，计算所述第i个字的标准音高值。

3.根据权利要求2所述的方法，其特征在于，所述字音高信息包括音高值，所述从所述n个字音高信息中选取满足第一条件的字音高信息，包括：

计算所述n个字音高信息中的音高值的平均值；

对于所述n个字音高信息中的第k个字音高信息，在所述第k个字音高信息中的音高值与所述平均值之间的差值小于第一阈值的情况下，选取所述第k个字音高信息；

其中，所述第一条件包括所述差值小于所述第一阈值。

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一标准音高信息，生成所述目标歌曲的第一音高线模型之后，还包括：

获取所述目标歌曲的新增的m个歌曲音高信息，所述m为正整数；

根据所述n个歌曲音高信息和所述m个歌曲音高信息，确定所述目标歌曲的第二标准音高信息；

根据所述第二标准音高信息，生成所述目标歌曲的第二音高线模型。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第二标准音高信息，生成所述目标歌曲的第二音高线模型之后，还包括：

对于所述目标歌曲中的第s个字，确定所述第s个字对应的第一音高值和第二音高值，所述第一音高值是指所述第s个字在所述第一音高线模型中的音高值，所述第二音高值是指所述第s个字在所述第二音高线模型中的音高值，所述s为正整数；

计算所述第一音高值和所述第二音高值的音高差；

根据所述目标歌曲中的t个字的音高差，计算所述第一音高线模型和所述第二音高线模型之间的音高差平均值，所述t为正整数；

在所述音高差平均值小于第二阈值的情况下，确定所述第二音高线模型为所述目标歌曲的标准音高线模型。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述方法还包括：

接收来自于客户端的所述目标歌曲的歌曲音高信息；

确定所述歌曲音高信息中包含的字音高信息的数量；

若所述数量等于所述目标歌曲的歌词字数，则存储所述歌曲音高信息。

7.一种音高线生成方法，其特征在于，所述方法包括：

生成所述目标歌曲的歌曲音高信息；

向服务器发送所述歌曲音高信息；

8.根据权利要求7所述的方法，其特征在于，所述生成所述目标歌曲的歌曲音高信息，包括：

获取所述目标歌曲的歌词的第m个字的音频信息，所述音频信息包括原始音频信息和直播音频信息，所述原始音频信息是指所述客户端播放所述目标歌曲的音频信息，所述直播音频信息是指所述客户端记录的用户演唱所述目标歌曲的音频信息，所述m为正整数；

根据所述原始音频信息和所述直播音频信息，确定所述第m个字的歌曲音频信息，所述歌曲音频信息是指所述用户演唱所述目标歌曲的音频信息；

从所述第m个字的歌曲音频信息中提取所述第m个字的字音高信息；

根据所述目标歌曲的歌词中各个字的字音高信息，生成所述目标歌曲的歌曲音高信息。

9.根据权利要求7所述的方法，其特征在于，所述接收来自于所述服务器的标准音高线模型之后，还包括：

获取所述目标歌曲的录制音高信息，所述录制音高信息是指所述客户端在用户演唱所述目标歌曲时录制的音高信息；

根据所述录制音高信息和所述标准音高线模型，生成所述目标歌曲的演唱评分，所述演唱评分用于指示所述用户演唱所述目标歌曲的水平；

在所述客户端的用户界面中显示所述演唱评分。

10.一种音高线生成装置，其特征在于，所述装置包括：

11.一种音高线生成装置，其特征在于，所述装置包括：

信息生成模块，用于生成所述目标歌曲的歌曲音高信息；

信息发送模块，用于向服务器发送所述歌曲音高信息；

12.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机程序，所述计算机程序由所述处理器加载并执行以实现如权利要求1至6任一项所述的音高线生成方法，或者实现如权利要求7至9任一项所述的音高线生成方法。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的音高线生成方法，或者实现如权利要求7至9任一项所述的音高线生成方法。