WO2018045988A1

WO2018045988A1 - 歌曲的数字乐谱文件的生成方法、装置和存储介质

Info

Publication number: WO2018045988A1
Application number: PCT/CN2017/101008
Authority: WO
Inventors: 赵伟锋
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2016-09-09
Filing date: 2017-09-08
Publication date: 2018-03-15
Also published as: CN106448630B; US10923089B2; US20180350336A1; CN106448630A

Abstract

一种歌曲的数字乐谱文件的生成方法、装置和存储介质。其中，该方法包括：从歌曲对应的清唱音频文件中获取满足第一条件的候选清唱音频文件（S202），其中，清唱音频文件包括用户对歌曲进行演唱的清唱数据；根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段（S204）；提取每个有效音频片段的音符信息（S206），其中，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；以及根据每个有效音频片段的音符信息生成数字乐谱文件（S208），其中，数字乐谱文件包括三元组中的部分或全部。解决了相关技术中数字乐谱文件的制作效率低的技术问题。

Description

歌曲的数字乐谱文件的生成方法、装置和存储介质

本申请要求于2016年09月09日提交中国专利局、优先权号为2016108161119、发明名称为“歌曲的数字乐谱文件的生成方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机领域，具体而言，涉及一种歌曲的数字乐谱文件的生成方法、装置和存储介质。

背景技术

目前，数字乐谱文件的制作主要采用人工制作的方式，比如，音乐数字设备接口文件(Musical Instrument Digital Instrument，简称为MIDI)文件均采用人工制作的方式，数字乐谱文件在制作的过程中由于人工的参与，一方面造成数字乐谱文件的制作成本较大，另一方面制作完的数字乐谱文件也没有有效的方法对其质量进行检测，从而造成数字乐谱文件的制作效率比较低。

针对上述的相关技术中数字乐谱文件的制作效率低的技术问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种歌曲的数字乐谱文件的生成方法、装置和存储介质，以至少解决相关技术中数字乐谱文件的制作效率低的技术问题。

根据本申请实施例的一个方面，提供了一种歌曲的数字乐谱文件的生成方法。该歌曲的数字乐谱文件的生成方法包括：从歌曲对应的清唱音频文件中获取满足第一条件的清唱音频文件，其中，清唱音频文件包括用户对歌曲进行演唱的清唱数据；根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段；提取每个有效音频片段的音符信息，其中，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；以及根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部。

根据本申请实施例的另一方面，还提供了一种歌曲的数字乐谱文件的生成装置。该歌曲的数字乐谱文件的生成装置包括：获取单元，被设置为从歌曲对应的清唱音频文件中获取满足第一条件的候选清唱音频文件，其中，清唱音频文件包括用户对歌曲进行演唱的清唱数据；划分单元，被设置为根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段；提取单元，被设置为提取每个有效音频片段的音符信息，其中，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；以及生成单元，被设置为根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部。

根据本申请实施例的另一方面，还提供了一种终端，其中，终端被设置为执行程序代码，程序代码用于执行本申请实施例的歌曲的数字乐谱文件的生成方法中的步骤。

根据本申请实施例的另一方面，还提供了一种存储介质，其中，存储介质被设置为存储程序代码，程序代码用于执行本申请实施例的歌曲的数字乐谱文件的生成方法中的步骤。

在本申请实施例中，从歌曲对应的清唱音频文件中获取满足第一条件的候选清唱音频文件，其中，清唱音频文件包括用户对歌曲进行演唱的清唱数据；根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段；提取每个有效音频片段的音符信息，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部，通过用户候选清唱音频文件对应的歌曲进行演唱的清唱数据生成数字乐谱文件，达到了自动生成数字乐谱文件的目的，从而实现了提高清唱音频文件的制作效率的技术效果，进而解决了相关技术中数字乐谱文件的制作效率低的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种歌曲的数字乐谱文件的生成方法的硬件环境的示意图；

图2是根据本申请实施例的一种歌曲的数字乐谱文件的生成方法的流程图；

图3是根据本申请实施例的一种根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段的方法的流程图；

图4是根据本申请实施例的一种提取每个有效音频片段的音符信息的方法的流程图；

图5是根据本申请实施例的一种对每个有效音频片段执行处理的方法的流程图；

图6是根据本申请实施例的另一种歌曲的数字乐谱文件的生成方法的流程图；

图7是根据本申请实施例的另一种歌曲的数字乐谱文件的生成方法的流程图；

图8是根据本申请实施例的一种合并音符值的方法的流程图；

图9是根据本申请实施例的一种生成多个有效音频片段对应的三元组的方法的流程图；

图10是根据本申请实施例的一种根据每个有效音频片段的音符信息生成数字乐谱文件的方法的流程图；

图11是根据本申请实施例的一种获取候选清唱音频文件的方法的流程图；

图12是根据本申请实施例的另一种歌曲的数字乐谱文件的生成方法的流程图；

图13是根据本申请实施例的一种根据每个有效音频片段的音符信息生成数字乐谱文件的视化格式的示意图；

图14是根据本申请实施例的一种歌曲的数字乐谱文件的生成装置的示意图；

图15是根据本申请实施例的另一种歌曲的数字乐谱文件的生成装置的示意图；

图16是根据本申请实施例的另一种歌曲的数字乐谱文件的生成装置的示意图；

图17是根据本申请实施例的另一种歌曲的数字乐谱文件的生成装置的示意图；以及

图18是根据本申请实施例的一种终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例，提供了一种歌曲的数字乐谱文件的生成方法实施例。

可选地，在本实施例中，上述歌曲的数字乐谱文件的生成方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。图1是根据本申请实施例的一种歌曲的数字乐谱文件的生成方法的硬件环境的示意图。如图1所示，服务器102通过网络与终端104进行连接，上述网络包括但不限于：广域网、城域网或局域网，终端104并不限定于PC、手机、平板电脑等。本申请实施例的歌曲的数字乐谱文件的生成方法可以由服务器102来执行，也可以由终端104来执行，还可以是由服务器102和终端104共同执行。其中，终端104执行本申请实施例的歌曲的数字乐谱文件的生成方法也可以是由安装在其上的客户端来执行。

图2是根据本申请实施例的一种歌曲的数字乐谱文件的生成方法的流程图。如图2所示，该方法可以包括以下步骤：

步骤S202，从歌曲对应的清唱音频文件中获取满足第一条件的候选清唱音频文件。

清唱音频文件包括用户对歌曲进行演唱的清唱数据。候选清唱音频文件为满足第一条件的清唱音频文件，其中，第一条件为用于在歌曲对应的清唱音频文件中筛选出候选清唱音频文件的筛选条件，也即，确定清唱音频文件是否达到候选标准，比如，大量的其他用户对上传的清唱音频文件进行打分，多个清唱音频文件中的每个清唱音频文件都得到相应的分数，将第一条件设为分数高于预定分数阈值的条件，比如，在0～10分之间对清唱音频文件进行打分，将第一条件设为分数高于8分的条件，进而将分数高于预定分数阈值的清唱音频文件确定为候选清唱音频文件。可选地，大量的其他用户还可以对上传的清唱音频文件进行评价，比如，“满意”、“不满意”、“差评”、“一般”、“优秀”、“赞”等，将第一条件设为评价结果达到预定评价阈值的条件，比如，将第一条件设为评价结果达到10个“满意”、20个优秀、30个赞的条件，则将评价结果达到预定阈值的清唱音频文件确定为候选清唱音频文件。

可选地，上述第一条件除了包括上述筛选条件之外，还进一步包括人工筛选的条件，也即，上述筛选条件为第一条件中的初步筛选条件。比如，在确定上传的清唱音频文件达到上述初步筛选条件之后，由特定的制作人员对达到初步筛选条件的清唱音频文件进行试听，确定达到初步筛选条件的清唱音频文件的演唱音准是否准确，也即，确定对达到初步筛选条件的清唱音频文件进行演唱的用户的演唱音准是否达到可用标准。如果确定达到初步筛选条件的清唱音频文件的演唱音准准确，则确定上传的清唱音频文件为候选清唱音频文件。

在该实施例中，上述清唱音频文件包括用户对歌曲进行演唱的清唱数据，该清唱数据包括用户在演唱歌曲时所采集到的用户的声音数据，该声音数据包括用于指示用户的声音的音调的数据，用于指示用户的声音的音色的数据，用于指示用户的声音的响度的数据，用于指示用户的声音的乐音的数据等。该清唱音频文件还可以包括用户演唱某手歌曲的音准数据，该音准数据用于指示用户演唱某手歌曲的音高，以使特定的制作人员判断用户演唱歌曲是否准确。

可选地，判断歌曲是否存在对应的清唱音频文件，如果判断出歌曲中不存在对应的清唱音频文件，则发送用于请求上传清唱音频文件的上传请求。在发送上传请求之前，对接收上传请求的对象进行筛选。可以获取数据库中存储的用户所演唱的歌曲的历史演唱数据。根据历史演唱数据确定用于表示用户演唱水平的等级数据，将等级数据达到预定等级阈值的用户确定为目标用户，优选将该目标用户对歌曲进行演唱所生成的清唱音频文件确定为候选清唱音频文件，则收录该目标用户的清唱音频文件的终端也即接收上传请求的对象。

在对接收上传请求的对象进行筛选时，还可以从数据库中获取对用户所演唱的歌曲进行评价的评价数据和对歌曲进行打分的打分数据，比如，评价数据包括用于指示“满意”、“不满意”、“差评”、“一般”、“优秀”、“赞”等数据，打分数据可以用于指示0～10分之间的打分数据。根据评价数据和打分数据确定用于表示用户演唱水平的等级数据，进而将等级数据达到预设等级阈值的用户确定为目标用户，获取该目标用户对歌曲进行演唱所生成的清唱音频文件。

可选地，待生成数字乐谱文件的歌曲为新歌，暂时没有用户对其进行演唱，则有奖邀请高水平的用户对新歌进行演唱以获取上述新歌对应的清唱音频文件。

步骤S204，根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段。

在本申请上述步骤S204提供的技术方案中，一首歌曲对应一个歌词文件，歌词文件包括每句歌词对应的时间信息。歌词文件中的每一句对应一个音频片段。可选地，将具有歌词且没有多余噪音的音频片段确定为候选清唱音频文件的有效音频片段。在获取候选清唱音频文件之后，从候选清唱音频文件中划分出多个有效音频片段，可选地，获取候选清唱音频文件对应的歌词文件中的每一句的时长信息，按照每一句歌词文件的时长信息对候选清唱音频文件进行划分，得到划分结果，并检测划分结果是否有多余的噪音，进而将没有歌词的部分去除掉，并且确保有效音频片段没有多余的噪音。

步骤S206，提取每个有效音频片段的音符信息。

在该实施例中，音符信息包括一个或多个三元组，从有效音频片段中可以提取出三元组。可以将每个有效音频片段执行处理，比如，对每个有效音频片段执行滤波处理，得到基频段，对基频段中的基频值进行音符化处理，得到基频值的音符值，然后将音符值进行合并，可以将音符值中的相同音符值的点连在一起，并生成每个有效音频片段对应的三元组，每个有效音频片段对应的三元组包括三元组的起始时间，三元组的音符值，三元组的持续时间。每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值。其中，音符的起始时间也即为三元组的起始时间，该起始时间的单位可以为毫秒，音符的持续时间也即为三元组的持续时间，该持续时间的单位可以为毫秒，音符的音符值也即为三元组的音符值。在从候选清唱音频文件中划分出多个有效音频片段之后，提取出每个有效音频片段的音符信息。

步骤S208，根据每个有效音频片段的音符信息生成数字乐谱文件。

数字乐谱文件包括三元组中的部分或全部。在提取每个有效音频片段的音符信息之后，根据音符的起始时间，音符的持续时间，音符的音符值生成数字乐谱文件。可选地，将音符信息中的多个三元组组成三元组序列，对三元组序列进行规整，得到数字乐谱文件。可选地，在对三元组序列进行规整时，可以将所有n个有效音频片段x₁对应的三元组W_i连到一起，比如，直接将每一句对应的三元组起始时间s加上该句在整个歌曲中的起始时间而连到一起，得到整首歌曲对应的三元组序列W_a＝O_ii∈[1，t]，其中，O用于表示三元组，i用于表示第i个，t用于表示此三元组序列的三元组总个数。当三元组满足以下(1)至(3)条件之一时(i>1and i<t)，则对O_i进行处理(其中m_i为第i个三元组的音符值，m_i-1为第i-1个三元组的音符值，m_i+1为第i+1个三元组的音符值)：

(1)|m_i-m_i-1|≥6；

(2)|m_i-m_i+1|≥6；

(3)|m_i-1-m_i+1|≤3。

在对三元组进行处理时，在s_i＝s_i-1+l_i-1成立的情况下，合并第i-1与第i个二元组，也即，通过l'_i-1＝l_i-1+l_i计算第i-1个三元组的持续时间l'_i-1，并删除第i个三元组，其中，s_i为第i个三元组的起始时间，s_i-1为第i-1个三元组的起始时间，l_i-1为第i-1个三元组的持续时间，l_i为第i个三元组的持续时间；在s_i＝s_i-1+l_i-1不成立，s_i+1＝s_i+l_i成立的情况下，通过l'_i+1＝l_i+1+l_i计算第i+1个三元组的持续时间l'_i+1，通过s'_i+1＝s_i计算第i+1个三元组的起始时间s'_i+1，并删除第i个三元组的持续时间，其中，s_i+1为第i+1个三元组的起始时间，l_i+1为第i+1个三元组的持续时间；在s_i＝s_i-1+l_i-1不成立时，s_i+1＝s_i+l_i也不成立的情况下，直接删除第i个三元组，从而将三元组序列进行规整，将规整后的三元组序列生成数字乐谱文件。

在得到数字乐谱文件之后，按照预设格式输出数字乐谱文件。可选地，对数字乐谱文件进行质量检测，比如，保留质量检测合格的数字乐谱文件，删除质量检测不合格的数字乐谱文件，从而降低了人工对数字乐谱文件的制作成本，提高了数字乐谱文件的制作效率。

可选地，该数字乐谱文件为MIDI文件，从而通过上述步骤有效地降低了制作MIDI文件的人工成本，并且提高了MIDI文件的制作质量，提高了MIDI文件的制作效率。

可选地，该实施例从歌曲对应的清唱音频文件中获取的候选清唱音频文件可以为一个，也可以为多个。当候选音频文件为多个候选音频文件时，根据歌曲的时间信息对每个候选清唱音频文件进行划分，得到每个候选清唱音频文件的多个有效音频片段，根据每个候选清唱音频文件对应的多个有效音频片段的音符信息生成每个候选清唱音频文件对应的数字乐谱文件，每个候选清唱音频文件对应的数字乐谱文件可以为MIDI文件。可选地，每个候选清唱音频文件对应的数字乐谱文件可以由用户自主选择，将选择到的候选清唱音频文件对应的数字乐谱文件确定为该歌曲最终的数字乐谱文件，也可以对每个候选清唱音频文件对应的数字乐谱文件进行质量检测，得到质量检测结果，将质量检测结果最高的数字乐谱文件确定为该歌曲最终的数字乐谱文件。

通过上述步骤S202至步骤S208，通过从歌曲对应的清唱音频文件中获取满足第一条件的清唱音频文件；根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段；提取每个有效音频片段的音符信息，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；以及根据每个有效音频片段的音符信息生成数字乐谱文件，数字乐谱文件包括三元组中的部分或全部，通过用户候选清唱音频文件对应的歌曲进行演唱的清唱数据生成数字乐谱文件，达到了自动生成数字乐谱文件的目的，避免了通过人工制作数字乐谱文件的高成本，从而实现了提高数字乐谱文件的制作效率的技术效果，进而解决了相关技术中数字乐谱文件的制作效率低的技术问题。

作为一种可选的实施方式，步骤S204，根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段，通过根据歌词文件中每句歌词对应的时间信息将将候选清唱音频文件中划分出多个有效音频片段进行实现。

图3是根据本申请实施例的一种根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段的方法的流程图。如图3所示，该方法包括以下步骤：

步骤S301，获取歌曲对应的歌词文件。

在该实施例中，一首歌曲对应一个歌词文件，获取歌曲对应的歌词文件，该歌词文件包括每句歌词对应的时间信息。

候选清唱音频文件自带歌词文件，根据候选清唱音频文件自带的歌词文件获取候选清唱音频文件中每个音频片段的播放时长，歌词文件中包括用于指示播放时长的指示信息，也即，通过指示信息可以确定歌词文件中的每个音频片段在播放过程中的播放时长。

步骤S302，根据歌词文件中每句歌词对应的时间信息将候选清唱音频文件划分出多个有效音频片段。

具体的，每句歌词对应时间信息即为候选清唱音频文件中每个音频片段的播放时长。在获取歌曲对应的歌词文件之后，由歌词文件中每句歌词对应的时间信息确定候选清唱音频文件中的多个音频片段，每个音频片段与歌词文件中的每句歌词相对应。举例而言，歌词文件中第一句歌词对应的时间信息为1～8秒，第二句歌词对应的时间信息为1～10秒，第三句歌词对应的时间信息为1～6秒，则由1～8秒划分出候选清唱音频文件中的第一音频片段，该第一音频片段与第一句歌词相对应，由1～10秒划分出候选音频文件中的第二音频片段，该第二音频片段与第二句歌词相对应，由1～6秒划分出候选音频文件中的第三音频片段，该第三音频片段与第三句歌词相对应。

可选地，获取候选清唱音频文件中的原始音频数据，根据每句歌词对应的时间信息对原始音频数据进行划分，得到多个音频片段，将每个音频片段中没有歌词的部分去掉，并且去除掉具有多余噪音的部分，从而从多个有效音频片段中提取多个有效音频片段，进而实现了根据歌词文件中每句歌词对应的时间信息将候选清唱音频文件划分出多个有效音频片段的目的。

该实施例通过获取歌曲对应的歌词文件，根据歌词文件中每句歌词对应的时间信息将候选清唱音频文件划分出多个有效音频片段，从而实现了根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段的目的，进而达到了提高数字乐谱文件的制作效率的技术效果。

作为一种可选的实施方式，步骤S206，提取每个有效音频片段的音符信息包括：在多个有效音频片段中基频值为非零的音频片段的播放时长之和超过预设时间的情况下，对每个有效音频片段执行处理，得到基频段，通过对基频段中的基频值执行音符化处理得到的音符值进行合并，以实现对有效音频片段的音符信息的提取。

图4是根据本申请实施例的一种提取每个有效音频片段的音符信息的方法的流程图。如图4所示，该方法包括以下步骤：

步骤S401，提取每个有效音频片段的基频信息。

基频信息包括音频片段的基频值。在从候选清唱音频文件中划分出多个有效音频片段之后，提取每个有效音频片段的基频信息，该基频信息可以为帧移为10毫秒，帧长为30毫秒的基频，该基频信息包括音频片段的基频值。由于人们在发声时带振动产生的频率经过声道过滤后会产生大量的泛音，为了便于后续对候选清唱音频文件的处理，需要从音频信息中提取直接表现声带振动频率的基音，该基音也决定了整个音符的音高，也即，基频值。

步骤S402，获取多个有效音频片段中基频值为非零的音频片段的播放时长之和。

在提取每个有效音频片段的基频信息之后，获取每个有效音频片段的基频值，再从多个有效音频片段中提取有效音频值为非零的音频片段，比如，多个有效音频片段包括音频片段1、音频片段2、音频片段3和音频片段4，其中，音频片段1和音频片段2为音频值为非零的音频片段，音频片段3和音频片段4为音频值为零的音频片段，则从音频片段1、音频片段2、音频片段3和音频片段4中提取音频片段1和音频片段2。在从多个音频片段中提取出音频值为非零的音频片段之后，获取基频值为非零的音频片段的播放时长，对基频值为非零的音频片段的播放时长进行求和计算，得到基频值为非零的音频片段的播放时长之和，比如，在从上述音频片段1、音频片段2、音频片段3和音频片段4中提取出音频片段1和音频片段2之后，分别获取音频片段1和音频片段2的播放时长，比如，音频片段1的播放时长为2秒，音频片段2的播放时长为3秒，则对音频片段1的播放时长2秒和音频片段2的播放时长3秒进行求和计算，得到基频值为非零的音频片段的播放时长5秒。

可选地，在从多个有效音频片段中获取上述基频值为非零的音频片段时，可以获取多个有效音频片段中相邻有效音频片段的基频值，在相邻有效音频片段的基频值的差值满足一定条件时，比如，相邻有效音频片段的基频值的差值小于预定差值，则将相邻的有效音频片段的基频值置零，也即，根据有效音频片段中前后基频点的基频值的差异来检测奇异基频点，并将奇异基频点置零，使得该相邻的有效音频片段为基频值为零的音频片段。

步骤S403，判断播放时长之和是否超过预设时间。

在获取多个有效音频片段中基频值为非零的有效音频片段在播放时的播放时长之和之后，判断播放时长之和是否超过预设时间，其中，预设时间可以为10秒，判断基频值为非零的有效音频片段的播放时长之和是否超过10秒。

在判断播放时长之和是否超过预设时间之后，如果判断出播放时长未超过预设时间，也即，基频值为非零的音频片段的播放时长之和比较短，则确定有效音频片段未过关，不能用于得到基频段；或者，重新提取每个有效音频片段的基频信息，获取多个有效音频片段中基频值为非零的音频片段的播放时长之和，再次判断播放时长之和是否超过预设时间，如果播放时长仍未超过预设时间，则直接确定有效音频片段未过关，不能用于得到基频段；或者，不对有效音频片段进行处理。

步骤S404，对每个有效音频片段执行处理，得到基频段。

在判断播放时长之和是否超过预设时间之后，如果判断出播放时长之和超过预设时间，对每个有效音频片段执行处理，得到基频段，也即，分别对多个有效音频片段执行处理，得到基频段。可选地，对每个有效音频片段执行滤波处理，得到基频段。在播放时长之和超过预设时间的情况下，对每个有效音频片段执行处理，这样得到的基频段由于播放时长之和较长，可以将基频段中的基频值进行音符化处理，得到基频值的音符值，可以很好地划分包括有起始时间、音符值和持续时间的三元组，从而可以准确得到有效音频片段的音符信息，达到提取每个有效音频片段的音符信息的目的，进而根据每个有效音频片段的音符信息生成数字乐谱文件，达到提高清唱音频文件的制作效率的效果。

步骤S405，获取基频段中的基频值。

在对有效音频片段执行处理，得到基频段之后，获取基频段中的基频值。可选地，将基频段中小于预设帧数的零基频段值设置为基频段最后一帧基频值，比如，将基频段后面小于15帧的零基频段的基频值都置为基频段最后一帧基频值。

步骤S406，对基频值执行音符化处理，得到基频值的音符值。

在获取基频段中的基频值之后，对基频值进行符号化处理，比如，通过公式

计算基频值的音符值f(x)，其中，x为基频段的基频值。可选地，对基频段中的全部基频值进行音符化，得到音符值。

步骤S407，合并音符值，得到有效音频片段的音符信息。

在对基频值执行音符化处理，得到基频值的音符值之后，合并音符值，将音符值相同的点连在一起，这样就得到一个三元组序列W＝O_ii，i∈[1，k]，其中O为三元组(s，m，l)，其中s为该三元组的起始时间(单位为毫秒)、m为该三元组的音符值、l为该三元组的持续时间(单位为毫秒)，k为三元组序列包括的三元组个数，从而得到有效音频片段的音符信息。

该实施例通过提取每个有效音频片段的基频信息，其中，基频信息包括音频片段的基频值；获取多个有效音频片段中基频值为非零的音频片段的播放时长之和；如果播放时长之和超过预设时间，对每个有效音频片段执行处理，得到基频段；获取基频段中的基频值；对基频值执行音符化处理，得到基频值的音符值；以及合并音符值，得到有效音频片段的音符信息，实现了提取每个有效音频片段的音符信息的目的，进而达到了提高清唱音频文件的制作效率的效果。

作为一种可选的实施方式，步骤S404，对每个有效音频片段执行处理包括：根据音频片段对应的长度对音频片段执行滤波处理，得到滤波片段，获取滤波片段的基频值。

图5是根据本申请实施例的一种对每个有效音频片段执行处理的方法的流程图。如图5所示，该方法包括以下步骤：

步骤S501，获取每个有效音频片段对应的长度。

该实施例中的音频片段对应的长度，也即，基频段长度，单位为帧。如果判断出播放时长之和超过预设时间，获取每个有效音频片段对应的长度。

步骤S502，对长度小于第一预设值的有效音频片段执行第一滤波处理，得到第一滤波片段。

在获取每个有效音频片段对应的长度之后，判断每个有效音频片段对应的长度是否小于第一预设值，对长度小于第一预设值的有效音频片段执行第一滤波处理，得到第一滤波片段，比如，第一预设值为35帧，对基频段长度小于35帧的有效音频片段直接进行窗长为基频段长度的中值滤波，得到第一滤波片段。

步骤S503，对长度大于等于第一预设值的有效音频片段执行第二滤波处理，得到第二滤波片段。

在获取每个有效音频片段对应的长度之后，判断每个有效音频片段对应的长度是否小于第一预设值，对长度大于等于第一预设值的音频片段执行第二滤波处理，得到第二滤波片段，比如，第一预设值为35帧，对基频段长度大于等于35帧的音频片段，每帧做10点的中值滤波，得到第二滤波片段。

在该实施例中，中值滤波用于对有效音频片段中的噪声信号进行滤除，并且在滤除噪声信号的同时，能够保护有效音频片段的信号边缘，使之不被模糊。在对有效音频片段进行中值滤波时，设定窗长，将窗长中的音频片段的数据设为中值滤波的信号样本值，将信号样本值按照从小到大的顺序进行排列，这样排序后的数据的中值，便为中值滤波的输出值。

举例而言，在对基频段长度大于等于35帧的音频片段，每帧做10点的中值滤波时，设定窗长为10个点，也即，对长度大于等于第一预设值的有效音频片段的每帧音频片段中的10个数据进行中值滤波，将窗长中的10个数据设为中值滤波的信号样本值，将信号样本值按照从小到大的顺序进行排列，这样排序后的数据的中值，便为中值滤波的输出值，从而得到第二滤波片段。

可选地，获取基频段中的基频值包括：获取第一滤波片段的基频值和第二滤波片段的基频值。

该实施例通过获取每个有效音频片段对应的长度；对长度小于第一预设值的有效音频片段执行第一滤波处理，得到第一滤波片段；对长度大于等于第一预设值的音频片段执行第二滤波处理，得到第二滤波片段，达到了对每个有效音频片段执行处理的目的，进而达到了提高数字乐谱文件的制作效率的目的。

作为一种可选的实施方式，在获取每个有效音频片段对应的长度之后，在长度小于第二预设值的有效音频片段中存在零音频片段，将零音频片段的基频值设置为预设基频值。

图6是根据本申请实施例的另一种歌曲的数字乐谱文件的生成方法的流程图。如图6所示，该方法还包括以下步骤：

步骤S601，判断长度小于第二预设值的有效音频片段中是否存在零音频片段。

在获取每个有效音频片段对应的长度之后，判断长度小于第二预设值的有效音频片段中是否存在零音频片段，其中，零音频片段为基频值为零的音频片段。

零音频片段为基频值为零的音频片段，第二预设值可以为15帧，判断长度小于15帧的音频片段中是否存在零音频片段。

步骤S602，将零音频片段的基频值设置为预设基频值。

在判断长度小于第二预设值的有效音频片段中存在零音频片段之后，如果判断出长度小于第二预设值的有效音频片段中存在零音频片段，将零音频片段的基频值设置为预设基频值，可选地，预设基频值为基频段最后一帧基频值，可以将基频段后面小于15帧的零基频片段的基频值都置为基频段最后一帧基频值。

可选地，获取基频段中的基频值包括：获取第一滤波片段的基频值、第二滤波片段的基频值和预设基频值。

该实施例通过在获取每个有效音频片段对应的长度之后，判断长度小于第二预设值的有效音频片段中是否存在零音频片段，其中，零音频片段为基频值为零的音频片段；如果判断出长度小于第二预设值的有效音频片段中存在零音频片段，将零音频片段的基频值设置为预设基频值；获取第一滤波片段的基频值、第二滤波片段的基频值和预设基频值，达到了对每个有效音频片段执行处理的目的，进而达到了提高清唱音频文件的制作效率的目的。

作为一种可选的实施方式，在获取多个有效音频片段中基频值为非零的音频片段的时长之和之前，通过在相邻音频片段的基频值的差值满足第二条件的情况下，将相邻音频片段的基频值置零。

图7是根据本申请实施例的另一种歌曲的数字乐谱文件的生成方法的流程图。如图7所示，该方法还包括以下步骤：

步骤S701，获取多个有效音频片段中相邻音频片段的基频值。

在获取多个有效音频片段中基频值为非零的音频片段的时长之和之前，获取多个有效音频片段中相邻音频片段的基频值。

步骤S702，计算相邻音频片段的基频值的差值。

在获取多个有效音频片段中相邻音频片段的基频值之后，对相邻音频片段的基频值进行计算，得到相邻音频片段的基频值的差值。

步骤S703，判断差值是否满足第二条件。

在计算相邻音频片段的基频值的差值之后，判段差值是否满足第二条件，该第二条件可以是差值小于预定差值的条件，为用于检测奇异基频点的条件，根据前后基频点的基频值的差值检测奇异基频点。

步骤S704，将相邻音频片段的基频值置零。

如果判断出差值满足第二条件，则根据前后基频点的基频值的差值确定出奇异基频点，将相邻音频片段的基频值置零。

该实施例通过在获取多个有效音频片段中基频值为非零的音频片段的时长之和之前，获取多个有效音频片段中相邻音频片段的基频值；计算相邻音频片段的基频值的差值；判断差值是否满足条件；如果判断出差值满足第二条件，将相邻音频片段的基频值置零，实现了对音频片段进行置零处理的操作，进而提高了清唱音频文件的制作效率。

作为一种可选的实施方式，步骤S407，合并音符值，得到有效音频片段的音符信息包括：根据音符值中的相同音符值生成多个有效音频片段对应的三元组，将多个有效音频片段对应的三元组组合成用于表示音符信息的第一三元组序列。

图8是根据本申请实施例的一种合并音符值的方法的流程图。如图8所示，该方法包括以下步骤：

步骤S801，将音符值中的相同音符值进行合并，并生成多个有效音频片段对应的三元组。

获取音符值中的相同音符值，将相同音符值的点连在一起，并生成多个有效音频片段对应的三元组，多个有效音频片段对应的三元组包括三元组的起始时间，三元组的音符值，三元组的持续时间。

步骤S802，将多个有效音频片段对应的三元组组合成用于表示音符信息的第一三元组序列。

在将音符值中的相同音符值进行合并，并生成多个有效音频片段对应的三元组之后，将多个有效音频片段对应的三元组组合成用于表示音符信息的第一三元组序列。

该实施例通过将音符值中的相同音符值进行合并，并生成多个有效音频片段对应的三元组；以及将多个有效音频片段对应的三元组组合成用于表示音符信息的第一三元组序列，实现了合并音符值，得到有效音频片段的音符信息的目的。

作为一种可选的实施方式，步骤S801，生成多个有效音频片段对应的三元组包括：根据相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间生成多个有效音频片段对应的三元组。

图9是根据本申请实施例的一种生成多个有效音频片段对应的三元组的方法的流程图。如图9所示，该方法包括以下步骤：

步骤S901，获取相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间。

该实施例在生成多个有效音频片段对应的三元组时，获取相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间。

步骤S902，根据相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间生成多个有效音频片段对应的三元组。

在获取相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间之后，根据相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间生成多个有效音频片段对应的三元组。

该实施例通过获取相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间；根据相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间生成多个有效音频片段对应的三元组，达到了生成多个有效音频片段对应的三元组的目的，进而提高了清唱音频文件的制作效率。

作为一种可选的实施方式，第一三元组序列包括第一三元组和第二三元组，步骤S208，根据每个有效音频片段的音符信息生成数字乐谱文件包括在不同条件下得到第二三元组序列，将第二三元组序列中的三元组按照预设格式输出，得到数字乐谱文件。

图10是根据本申请实施例的一种根据每个有效音频片段的音符信息生成数字乐谱文件的方法的流程图。如图10所示，该方法包括以下步骤：

步骤S1001，合并第一三元组和第二三元组，得到第三三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列。

获取第一三元组的起始时间，第二三元组的起始时间和第二三元组的持续时间，当第一三元组的起始时间等于第二三元组的起始时间与第二三元组的持续时间之和时，合并第一三元组和第二三元组，得到第三三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列。

步骤S1002，合并第四三元组和第一三元组，得到第五三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列。

获取第四三元组的起始时间，当第一三元组的起始时间不等于第二三元组的起始时间与第二三元组的持续时间之和时，当第四三元组的起始时间等于第一三元组的起始时间与第一三元组的持续时间之和时，合并第四三元组和第一三元组，得到第五三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列。

步骤S1003，从第一三元组序列中删除第一三元组，得到第二三元组序列。

当第一三元组的起始时间不等于第二三元组的起始时间与第二三元组的持续时间之和时，且当第四三元组的起始时间不等于第一三元组的起始时间与第一三元组的持续时间之和时，从第一三元组序列中删除第一三元组，得到第二三元组序列。

步骤S1004，将第二三元组序列中的三元组按照预设格式输出，得到数字乐谱文件。

在通过步骤S1001、步骤S1002、步骤S1003不同条件下得到的第二三元组之后，将第二三元组序列中的三元组按照预设格式输出，得到数字乐谱文件。

作为一种可选的实施方式，当s_i＝s_i-1+l_i-1成立时，通过l'_i-1＝l_i-1+l_i计算第三三元组的持续时间l'_i-1，其中，s_i为第一三元组的起始时间，s_i-1为第二三元组的起始时间，l_i-1为第二三元组的持续时间，l_i为第一三元组的持续时间；当s_i＝s_i-1+l_i-1不成立，s_i+1＝s_i+l_i成立时，通过l'_i+1＝l_i+1+l_i计算第五三元组的持续时间l'_i+1，通过s'_i+1＝s_i计算第五三元组的起始时间s'_i+1，其中，s_i+1为第四三元组的起始时间，l_i+1为第四三元组的持续时间。

作为一种可选的实施方式，步骤S202，从歌曲对应的清唱音频文件中获取候选清唱音频文件包括：获取对多个原始清唱音频文件的回复信息，在回复信息所表示的质量等级达到预定等级的情况下，将原始清唱音频文件确定为候选清唱音频文件。

图11是根据本申请实施例的一种获取候选清唱音频文件的方法的流程图。如图11所示，该获取候选清唱音频文件的方法包括以下步骤：

步骤S1101，获取上传的多个原始清唱音频文件。

原始清唱音频文件可以为用户演唱歌曲上传的清唱音频文件，获取上传的多个原始清唱音频文件。

步骤S1102，获取对多个原始清唱音频文件的回复信息。

在获取上传的多个原始清唱音频文件之后，获取对多个原始清唱音频文件的回复信息，该回复信息用于表示原始清唱音频文件的质量等级，可以为用户演唱歌曲在上传之后，其他用户对其作品进行打分和/或评价，通过打分和/或评价从而确定质量等级。

步骤S1103，判断回复信息所表示的质量等级是否达到预定等级。

在获取对多个原始清唱音频文件的回复信息之后，判断回复信息所表示的质量等级是否达到预定等级。

步骤S1104，将原始清唱音频文件确定为候选清唱音频文件。

如果判断出回复信息所表示的质量等级达到预定等级，则将原始清唱音频文件确定为候选清唱音频文件。可选地，如果判断出回复信息所表示的质量等级未达到预定等级，则不将原始清唱音频文件确定为候选清唱音频文件。

可选地，当用户评价达到某一阈值后，比如，当得到大于等于32个“赞”时，则认为此用户演唱歌曲达到候选标准，将原始清唱音频文件确定为候选清唱音频文件。

该实施例通过获取上传的多个原始清唱音频文件；获取对多个原始清唱音频文件的回复信息，回复信息用于表示原始清唱音频文件的质量等级；判断回复信息所表示的质量等级是否达到预定等级；以及如果判断出回复信息所表示的质量等级达到预定等级，则将原始清唱音频文件确定为候选清唱音频文件，达到了获取候选清唱音频文件的目的。

作为一种可选的实施方式，确定原始清唱音频文件为候选清唱音频文件包括：在判断出评价指标符合预设评价指标的情况下，获取原始清唱音频文件的音准数据；判断音准数据是否符合预设音准；以及如果判断出音准数据符合预设音准，确定原始清唱音频文件为候选清唱音频文件，实现了度候选清唱音频文件的获取。

可选地，在获取候选清唱音频文件之后，将候选清唱音频文件的格式调整为预设格式，比如，将候选清唱音频文件的格式调整为16k16bit pcm格式，以得到调整清唱音频文件，根据歌曲的时间信息从调整清唱音频文件中划分出多个有效音频片段；提取每个有效音频片段的音符信息；以及根据每个有效音频片段的音符信息生成数字乐谱文件，达到了自动生成数字乐谱文件的目的。

该实施例通过获取候选清唱音频文件，候选清唱音频文件包括用户候选清唱音频文件对应的歌曲进行演唱的清唱数据；从候选清唱音频文件中划分出多个有效音频片段；提取每个有效音频片段的音符信息，其中，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部，通过用户候选清唱音频文件对应的歌曲进行演唱的清唱数据生成数字乐谱文件，达到了自动生成数字乐谱文件的目的，从而实现了提高清唱音频文件的制作效率的技术效果，进而解决了相关技术中数字乐谱文件的制作效率低的技术问题。

下面结合优选的实施例对本申请的技术方案进行说明。

图12是根据本申请实施例的另一种歌曲的数字乐谱文件的生成方法的流程图。如图12所示，该包括以下步骤：

步骤S1201，基于用户评价选取候选用户演唱歌曲。

在上传用户演唱的歌曲的清唱音频文件之后，会有大量其他用户对上传的清唱音频文件进行打分和/或评价，当打分和/或评价达到某一阈值y后，则认为此用户演唱的歌曲达到候选标准，再由制作人员进行试听，确定用户演唱音准是否达到可用的标准，如果达到可用的标准则执行步骤S1202。

可选地，如果要生成清唱音频文件的歌曲为新歌，暂时没有人演唱，则有奖邀请资深高水平的用户演唱，即可生成清唱音频文件。

步骤S1202，根据歌词文件提取有效数据段。

歌曲自带的歌词文件包含了每一句歌曲的时长信息，通过此时长信息将原始音频数据按照每一句的时间进行切割，将没有歌词的部分去除掉，确保无效部分没有多余的噪音，这样就得到一系列的音频片段{x₁，x₂...x_n}，其中n为歌词文件中的句子的个数。

步骤S1203，音符提取。

将用户上传的清唱音频文件调整为16k16bit pcm格式。提取该音频的基频信息(帧移10ms，帧长30ms)，由于人在发声时声带振动产生的频率经过声道过滤后会产生大量泛音，为了便于后续操作，需要从音频中提取直接表现声带振动频率的基音，基音也决定了整个音符的音高。根据与前后基频点基频值的差异检测奇异基频点，并置零。判断基频值非零的段落时间之和是否超过10秒，如果低于10秒则直接判定为未过关。在基频值非零的段落时间之和超过10秒的情况下，当有效音频片段的长度小于35帧时，直接进行窗长为基频段长度的中值滤波，得到基频段；当有效音频片段的长度大于等于35帧时，每帧做10点中值滤波，得到基频段。对基频段后面小于15帧的零基频段的基频值都置为基频段最后一帧基频值，从而实现了零基频点填充。

合并得到的音符值，将得到的音符值相同的点连在一起，这样就得到一个三元组序列W＝O_ii，i∈[1，k]，其中O为三元组(s，m，l)，其中s为该三元组的起始时间(单位为毫秒)、m为该三元组的音符值、l为该三元组的持续时间(单位为毫秒)，k为三元组此句话对应的三元组个数，从而得到有效音频片段的音符信息。

步骤S1204，后端规整。

将所有n个单句音频片段x₁对应的三元组W_i连到一起，直接将每一句对应的三元组起始时间s加上该句在整个歌曲中的起始时间即可，得到整首歌对应的三元组序列W_a＝O_ii∈[1，t]，其中，i用于表示第i个，t为此三元组序列的三元组个数。去奇异音符，当三元组满足以下(1)至(3)条件之一时(i>1and i<t)，则对三元组O_i进行特殊处理(其中m_i为第i个三元组的音符值，m_i-1为第i-1个三元组的音符值，m_i+1为第i+1个三元组的音符值)：

(1)|m_i-m_i-1|≥6；

(2)|m_i-m_i+1|≥6；

(3)|m_i-1-m_i+1|≤3。

对三元组进行处理：

当s_i＝s_i-1+l_i-1成立时，则合并第i-1与第i个二元组，也即，通过l'_i-1＝l_i-1+l_i计算第i-1个三元组的持续时间l'_i-1，并删除第i个三元组，其中，s_i为第i个三元组的起始时间，s_i-1为第i-1个三元组的起始时间，l_i-1为第i-1个三元组的持续时间，l_i为第i个三元组的持续时间。

当s_i＝s_i-1+l_i-1不成立，s_i+1＝s_i+l_i成立时，通过l'_i+1＝l_i+1+l_i计算第i+1个三元组的持续时间l'_i+1，通过s'_i+1＝s_i计算第i+1个三元组的起始时间s'_i+1，并删除第i个三元组的持续时间，其中，s_i+1为第i+1个三元组的起始时间，l_i+1为第i+1个三元组的持续时间。

当s_i＝s_i-1+l_i-1不成立时，s_i+1＝s_i+l_i也不成立时，直接删除第i个三元组。

本申请实施例通过候选清唱音频文件生成数字乐谱文件，其中，候选清唱音频文件包括用户对候选清唱音频文件对应的歌曲进行演唱的清唱数据，从而使用户的声音自动生成数字乐谱文件，而不需要人工制作，降低了数字乐谱文件制作的成本，提高了数字乐谱文件制作的效率。

本申请实施例的应用环境可以但不限于参照上述实施例中的应用环境，本实施例中对此不再赘述。本申请实施例提供了用于实施上述信息获取、传输方法的一种可选的具体应用。

图13是根据本申请实施例的一种根据每个有效音频片段的音符信息生成数字乐谱文件的视化格式的示意图。如图13所示，数字乐谱文件的视化格式为将三元组序列按照每一行(例如，36000 150 55)表示一个三元组，第一列(例如，36000 36150 36200 36330 36960)为音符的起始时间(单位ms)，第二列(例如，150 50 130 630 30)为音符持续时间(单位ms)，第三列(例如，55 56 57 56 55)为音符的音符值。

在全民k歌应用中，每一首可供演唱的歌曲都会有一个对应的MIDI文件，此文件描述了原唱歌手演绎此歌曲的音高走势。此文件则为可以使用的MIDI文件，其作用有很多，比如，给用户提供可视化音高参考曲线、对于用户不足之处进行修音、对用户演唱进行评价等，之前MIDI文件均采用人工制作的方式，这样一方面人工成本较大，另一方面制作完的MIDI文件也没有有效的办法进行质量检测，而通过本申请实施例的获取候选清唱音频文件；从候选清唱音频文件中划分出多个有效音频片段；提取每个有效音频片段的音符信息，其中，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；以及根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部，通过用户候选清唱音频文件对应的歌曲进行演唱的清唱数据生成数字乐谱文件，达到了自动生成数字乐谱文件的目的，从而实现了提高清唱音频文件的制作效率的技术效果，进而解决了相关技术中数字乐谱文件的制作效率低的技术问题。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

根据本申请实施例，还提供了一种用于实施上述歌曲的数字乐谱文件的生成方法的歌曲的数字乐谱文件的生成装置。图14是根据本申请实施例的一种歌曲的数字乐谱文件的生成装置的示意图。如图14所示，该装置可以包括：获取单元10、划分单元20、提取单元30和生成单元40。

获取单元10，被设置为从歌曲对应的清唱音频文件中获取满足第一条件的清唱音频文件，其中，清唱音频文件包括用户对歌曲进行演唱的清唱数据。

划分单元20，被设置为根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段。

提取单元30，被设置为提取每个有效音频片段的音符信息，其中，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值。

生成单元40，被设置为根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部。

此处需要说明的是，上述获取单元10、划分单元20、提取单元30和生成单元40可以作为装置的一部分运行在终端中，可以通过终端中的处理器来执行上述模块实现的功能，终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。

图15是根据本申请实施例的另一种歌曲的数字乐谱文件的生成装置的示意图。如图15所示，该装置可以包括：获取单元10、划分单元20、提取单元30和生成单元40。其中，划分单元20包括：第一获取模块21、划分模块22。

需要说明的是，该实施例的获取单元10、划分单元20、提取单元30和生成单元40与图14所示实施例的歌曲的数字乐谱文件的生成装置中的作用相同，此处不再赘述。

第一获取模块21，被设置为获取歌曲对应的歌词文件，歌词文件包括每句歌词对应的时间信息。

划分模块22，被设置为根据歌词文件中每句歌词对应的时间信息将候选清唱音频文件划分为多个有效音频片段。

此处需要说明的是，上述第一获取模块21和划分模块22可以作为装置的一部分运行在终端中，可以通过终端中的处理器来执行上述模块实现的功能，终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。

图16是根据本申请实施例的另一种歌曲的数字乐谱文件的生成装置的示意图。如图16所示，该装置可以包括：获取单元10、划分单元20、提取单元30和生成单元40，提取单元30包括：提取模块31、第二获取模块32、判断模块33、第一处理模块34、第三获取模块35、第二处理模块36和合并模块37。

需要说明的是，获取单元10、划分单元20、提取单元30和生成单元40与图14所示实施例的歌曲的数字乐谱文件的生成装置中的作用相同，此处不再赘述。

提取模块31，被设置为提取每个有效音频片段的基频信息，其中，基频信息包括音频片段的基频值。

第二获取模块32，被设置为获取多个有效音频片段中基频值为非零的音频片段的播放时长之和。

判断模块33，被设置为判断播放时长之和是否超过预设时间。

第一处理模块34，被设置为在判断出播放时长之和超过预设时间时，对每个有效音频片段执行处理，得到基频段。

可选地，在判断播放时长之和是否超过预设时间之后，如果判断出播放时长未超过预设时间，也即，基频值为非零的音频片段的播放时长之和比较短，则确定有效音频片段未过关，不能用于得到基频段；或者，重新提取每个有效音频片段的基频信息，获取多个有效音频片段中基频值为非零的音频片段的播放时长之和，再次判断播放时长之和是否超过预设时间，如果播放时长仍未超过预设时间，则直接确定有效音频片段未过关，不能用于得到基频段；或者，不对有效音频片段进行处理。

第三获取模块35，被设置为获取基频段中的基频值。

第二处理模块36，被设置为对基频值执行音符化处理，得到基频值的音符值。

合并模块37，被设置为合并音符值，得到有效音频片段的音符信息。

此处需要说明的是，上述提取模块31、第二获取模块32、判断模块33、第一处理模块34、第三获取模块35、第二处理模块36和合并模块37可以作为装置的一部分运行在终端中，可以通过终端中的处理器来执行上述模块实现的功能，终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。

可选地，该歌曲的数字乐谱文件的生成装置还包括：计算单元、第一判断单元和置零单元。其中，获取单元10被设置为在获取多个有效音频片段中基频值为非零的音频片段的时长之和之前，获取多个有效音频片段中相邻音频片段的基频值；计算单元被设置为计算相邻音频片段的基频值的差值；第一判断单元被设置为判断差值是否满足条件；置零单元被设置为在判断出差值满足第二条件时，将相邻音频片段的基频值置零。

此处需要说明的是，上述计算单元、第一判断单元和置零单元可以作为装置的一部分运行在终端中，可以通过终端中的处理器来执行上述单元实现的功能，终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。

可选地，合并模块37包括生成模块和组合模块。其中，生成模块，被设置为将音符值中的相同音符值进行合并，并生成多个有效音频片段对应的三元组；组合模块被设置为将多个有效音频片段对应的三元组组合成被设置为表示音符信息的第一三元组序列。

此处需要说明的是，上述生成模块和组合模块可以作为装置的一部分运行在终端中，可以通过终端中的处理器来执行上述模块实现的功能，终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。

可选地，生成模块被设置为获取相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间，以及根据相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间生成多个有效音频片段对应的三元组。

可选地，第一三元组序列包括第一三元组和第二三元组，生成单元40被设置为当第一三元组的起始时间等于第二三元组的起始时间与第二三元组的持续时间之和时，合并第一三元组和第二三元组，得到第三三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列；当第一三元组的起始时间不等于第二三元组的起始时间与第二三元组的持续时间之和时，当第四三元组的起始时间等于第一三元组的起始时间与第一三元组的持续时间之和时，合并第四三元组和第一三元组，得到第五三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列；当第一三元组的起始时间不等于第二三元组的起始时间与第二三元组的持续时间之和时，且当第四三元组的起始时间不等于第一三元组的起始时间与第一三元组的持续时间之和时，从第一三元组序列中删除第一三元组，得到第二三元组序列；以及将第二三元组序列中的三元组按照预设格式输出，得到数字乐谱文件。

可选地，当s_i＝s_i-1+l_i-1成立时，通过l'_i-1＝l_i-1+l_i计算第三三元组的持续时间l'_i-1，其中，s_i为第一三元组的起始时间，s_i-1为第二三元组的起始时间，l_i-1为第二三元组的持续时间，l_i为第一三元组的持续时间；当s_i＝s_i-1+l_i-1不成立，s_i+1＝s_i+l_i成立时，通过l'_i+1＝l_i+1+l_i计算第五三元组的持续时间l'_i+1，通过s'_i+1＝s_i计算第五三元组的起始时间s'_i+1，其中，s_i+1为第四三元组的起始时间，l_i+1为第四三元组的持续时间。

图17是根据本申请实施例的另一种歌曲的数字乐谱文件的生成装置的示意图。如图17所示，该装置可以包括：获取单元10、划分单元20、提取单元30和生成单元40。其中，提取单元30包括：提取模块31、第二获取模块32、判断模块33、第一处理模块34、第三获取模块35、第二处理模块36和合并模块37，其中，第一处理模块34包括：获取子模块341、第一处理子模块342和第二处理子模块343。

需要说明的是，该实施例的获取单元10、划分单元20、提取单元30和生成单元40，提取模块31、第二获取模块32、判断模块33、第一处理模块34、第三获取模块35、第二处理模块36和合并模块37与图16所示实施例的歌曲的数字乐谱文件的生成装置中的作用相同，此处不再赘述。

获取子模块341，被设置为获取每个有效音频片段对应的长度。

第一处理子模块342，被设置为对长度小于第一预设值的有效音频片段执行第一滤波处理，得到第一滤波片段。

第二处理子模块343，被设置为对长度大于等于第一预设值的音频片段执行第二滤波处理，得到第二滤波片段。

第三获取模块35被设置为获取第一滤波片段的基频值和第二滤波片段的基频值。

此处需要说明的是，上述获取子模块341、第一处理子模块342和第二处理子模块343可以作为装置的一部分运行在终端中，可以通过终端中的处理器来执行上述模块实现的功能，终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。

可选地，该歌曲的数字乐谱文件的生成装置还包括：第二判断单元和设置单元。其中，第二判断单元，被设置为在获取每个有效音频片段对应的长度之后，判断长度小于第二预设值的有效音频片段中是否存在零音频片段，其中，零音频片段为基频值为零的音频片段；设置单元，被设置为在判断出长度小于第二预设值的有效音频片段中存在零音频片段，将零音频片段的基频值设置为预设基频值；第三获取模块35被设置为获取第一滤波片段的基频值、第二滤波片段的基频值和预设基频值。

此处需要说明的是，上述第二判断单元和设置单元可以作为装置的一部分运行在终端中，可以通过终端中的处理器来执行上述模块实现的功能，终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。

可选地，获取单元10包括第四获取模块、第五获取模块和确定模块。其中，第四获取模块，被设置为获取上传的多个原始清唱音频文件；第五获取模块被设置为获取对多个原始清唱音频文件的回复信息，其中，回复信息被设置为表示原始清唱音频文件的质量等级；确定模块，被设置为判断回复信息所表示的质量等级是否达到预定等级，在判断出回复信息所表示的质量等级达到预定等级时，则将原始清唱音频文件确定为候选清唱音频文件。

此处需要说明的是，上述第四获取模块、第五获取模块和确定模块可以作为装置的一部分运行在终端中，可以通过终端中的处理器来执行上述模块实现的功能，终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。

需要说明的是，该实施例中的获取单元10可以被设置为执行本申请实施例1中的步骤S202，该实施例中的划分单元20可以被设置为执行本申请实施例1中的步骤S204，该实施例中的提取单元30可以被设置为执行本申请实施例1中的步骤S206，该实施例中的生成单元40可以被设置为执行本申请实施例1中的步骤S208。

在该实施例中，通过获取单元10从歌曲对应的清唱音频文件中获取满足第一条件的清唱音频文件，通过划分单元20根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段，通过提取单元30提取每个有效音频片段的音符信息，其中，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值，通过生成单元40根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部，通过用户候选清唱音频文件对应的歌曲进行演唱的清唱数据生成数字乐谱文件，达到了自动生成数字乐谱文件的目的，从而实现了提高清唱音频文件的制作效率的技术效果，进而解决了相关技术中数字乐谱文件的制作效率低的技术问题。

此处需要说明的是，上述单元和模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在如图1所示的硬件环境中，可以通过软件实现，也可以通过硬件实现，其中，硬件环境包括网络环境。

本申请实施例所提供的各个功能模块可以在移动终端、计算机终端或者类似的运算装置中运行，也可以作为存储介质的一部分进行存储。

由此，本申请的实施例可以提供一种终端，该终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

根据本申请实施例，还提供了一种用于实施上述歌曲的数字乐谱文件的生成方法的终端，其中，终端就可以为计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

图18是根据本申请实施例的一种终端的结构框图。如图18所示，该终端可以包括：一个或多个(图中仅示出一个)处理器181、存储器183、以及传输装置185，如图18所示，该终端还可以包括输入输出设备187。

其中，存储器183可用于存储软件程序以及模块，如本申请实施例中的歌曲的数字乐谱文件的生成方法和装置对应的程序指令/模块，处理器181通过运行存储在存储器183内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的歌曲的数字乐谱文件的生成方法。存储器183可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器183可进一步包括相对于处理器181远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置185用于经由一个网络接收或者发送数据，还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置185包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置185为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

其中，具体地，存储器183用于存储应用程序。

处理器181可以通过传输装置185调用存储器183存储的应用程序，以执行上述方法实施例中的各个可选或优选实施例的方法步骤的程序代码，包括：

从歌曲对应的清唱音频文件中获取满足第一条件的清唱音频文件，其中，清唱音频文件包括用户对歌曲进行演唱的清唱数据；

根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段；

提取每个有效音频片段的音符信息，其中，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；

根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部。

处理器181还用于执行下述步骤：获取歌曲对应的歌词文件，歌词文件包括每句歌词对应的时间信息；根据歌词文件中每句歌词对应的时间信息将候选清唱音频文件划分出多个有效音频片段。

处理器181还用于执行下述步骤：提取每个有效音频片段的基频信息，其中，基频信息包括音频片段的基频值；获取多个有效音频片段中基频值为非零的音频片段的播放时长之和；如果播放时长之和超过预设时间，对每个有效音频片段执行处理，得到基频段；获取基频段中的基频值；对基频值执行音符化处理，得到基频值的音符值；以及合并音符值，得到有效音频片段的音符信息。

处理器181还用于执行下述步骤：获取每个有效音频片段对应的长度；对长度小于第一预设值的有效音频片段执行第一滤波处理，得到第一滤波片段；对长度大于等于第一预设值的音频片段执行第二滤波处理，得到第二滤波片段；获取第一滤波片段的基频值和第二滤波片段的基频值。

处理器181还用于执行下述步骤：在获取每个有效音频片段对应的长度之后，如果长度小于第二预设值的有效音频片段中存在零音频片段，将零音频片段的基频值设置为预设基频值，其中，零音频片段为基频值为零的音频片段；获取第一滤波片段的基频值、第二滤波片段的基频值和预设基频值。

处理器181还用于执行下述步骤：在获取多个有效音频片段中基频值为非零的音频片段的时长之和之前，获取多个有效音频片段中相邻音频片段的基频值；计算相邻音频片段的基频值的差值；如果差值满足第二条件，将相邻音频片段的基频值置零。

处理器181还用于执行下述步骤：将音符值中的相同音符值进行合并，并生成多个有效音频片段对应的三元组；以及将多个有效音频片段对应的三元组组合成用于表示音符信息的第一三元组序列。

处理器181还用于执行下述步骤：获取相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间；以及根据相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间生成多个有效音频片段对应的三元组。

处理器181还用于执行下述步骤：第一三元组序列包括第一三元组和第二三元组，当第一三元组的起始时间等于第二三元组的起始时间与第二三元组的持续时间之和时，合并第一三元组和第二三元组，得到第三三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列；当第一三元组的起始时间不等于第二三元组的起始时间与第二三元组的持续时间之和时，当第四三元组的起始时间等于第一三元组的起始时间与第一三元组的持续时间之和时，合并第四三元组和第一三元组，得到第五三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列；当第一三元组的起始时间不等于第二三元组的起始时间与第二三元组的持续时间之和时，且当第四三元组的起始时间不等于第一三元组的起始时间与第一三元组的持续时间之和时，从第一三元组序列中删除第一三元组，得到第二三元组序列；以及将第二三元组序列中的三元组按照预设格式输出，得到数字乐谱文件。

处理器181还用于执行下述步骤：当s_i＝s_i-1+l_i-1成立时，通过l'_i-1＝l_i-1+l_i计算第三三元组的持续时间l'_i-1，其中，s_i为第一三元组的起始时间，s_i-1为第二三元组的起始时间，l_i-1为第二三元组的持续时间，l_i为第一三元组的持续时间；当s_i＝s_i-1+l_i-1不成立，s_i+1＝s_i+l_i成立时，通过l'_i+1＝l_i+1+l_i计算第五三元组的持续时间l'_i+1，通过s'_i+1＝s_i计算第五三元组的起始时间s'_i+1，其中，s_i+1为第四三元组的起始时间，l_i+1为第四三元组的持续时间。

处理器181还用于执行下述步骤：获取上传的多个原始清唱音频文件；获取对多个原始清唱音频文件的回复信息，其中，回复信息用于表示原始清唱音频文件的质量等级；如果回复信息所表示的质量等级达到预定等级，则将原始清唱音频文件确定为候选清唱音频文件。

在本申请实施例中，获取候选清唱音频文件；从候选清唱音频文件中划分出多个有效音频片段；提取每个有效音频片段的音符信息，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部，通过用户候选清唱音频文件对应的歌曲进行演唱的清唱数据生成数字乐谱文件，达到了自动生成数字乐谱文件的目的，从而实现了提高清唱音频文件的制作效率的技术效果，进而解决了相关技术中数字乐谱文件的制作效率低的技术问题。

可选地，本实施例中的具体示例可以参考上述实施例中所描述的示例，本实施例在此不再赘述。

本领域普通技术人员可以理解，图18所示的结构仅为示意，终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。图18其并不对上述电子装置的结构造成限定。例如，终端还可包括比图18中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图18所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以存储程序代码，所述程序代码用于执行上述方法实施例所提供的歌曲的数字乐谱文件的生成方法中的步骤。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：

从歌曲对应的清唱音频文件中获取满足第一条件的候选清唱音频文件，其中，清唱音频文件包括用户对歌曲进行演唱的清唱数据；

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：获取歌曲对应的歌词文件，歌词文件包括每句歌词对应的时间信息；根据歌词文件中每句歌词对应的时间信息将候选清唱音频文件划分出多个有效音频片段。

存储介质还被设置为存储用于执行以下步骤的程序代码：提取每个有效音频片段的基频信息，其中，基频信息包括音频片段的基频值；获取多个有效音频片段中基频值为非零的音频片段的播放时长之和；如果播放时长之和超过预设时间，对每个有效音频片段执行处理，得到基频段；获取基频段中的基频值；对基频值执行音符化处理，得到基频值的音符值；以及合并音符值，得到有效音频片段的音符信息。

存储介质还被设置为存储用于执行以下步骤的程序代码：获取每个有效音频片段对应的长度；对长度小于第一预设值的有效音频片段执行第一滤波处理，得到第一滤波片段；对长度大于等于第一预设值的音频片段执行第二滤波处理，得到第二滤波片段；获取第一滤波片段的基频值和第二滤波片段的基频值。

存储介质还被设置为存储用于执行以下步骤的程序代码：在获取每个有效音频片段对应的长度之后，如果长度小于第二预设值的有效音频片段中存在零音频片段，将零音频片段的基频值设置为预设基频值，其中，零音频片段为基频值为零的音频片段；获取第一滤波片段的基频值、第二滤波片段的基频值和预设基频值。

存储介质还被设置为存储用于执行以下步骤的程序代码：在获取多个有效音频片段中基频值为非零的音频片段的时长之和之前，获取多个有效音频片段中相邻音频片段的基频值；计算相邻音频片段的基频值的差值；如果差值满足第二条件，将相邻音频片段的基频值置零。

存储介质还被设置为存储用于执行以下步骤的程序代码：将音符值中的相同音符值进行合并，并生成多个有效音频片段对应的三元组；以及将多个有效音频片段对应的三元组组合成用于表示音符信息的第一三元组序列。

存储介质还被设置为存储用于执行以下步骤的程序代码：获取相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间；以及根据相同音符值、多个有效音频片段对应的三元组的起始时间、多个有效音频片段对应的三元组的持续时间生成多个有效音频片段对应的三元组。

存储介质还被设置为存储用于执行以下步骤的程序代码：第一三元组序列包括第一三元组和第二三元组，当第一三元组的起始时间等于第二三元组的起始时间与第二三元组的持续时间之和时，合并第一三元组和第二三元组，得到第三三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列；当第一三元组的起始时间不等于第二三元组的起始时间与第二三元组的持续时间之和时，当第四三元组的起始时间等于第一三元组的起始时间与第一三元组的持续时间之和时，合并第四三元组和第一三元组，得到第五三元组，并从第一三元组序列中删除第一三元组，得到第二三元组序列；当第一三元组的起始时间不等于第二三元组的起始时间与第二三元组的持续时间之和时，且当第四三元组的起始时间不等于第一三元组的起始时间与第一三元组的持续时间之和时，从第一三元组序列中删除第一三元组，得到第二三元组序列；以及将第二三元组序列中的三元组按照预设格式输出，得到数字乐谱文件。

存储介质还被设置为存储用于执行以下步骤的程序代码：当s_i＝s_i-1+l_i-1成立时，通过l'_i-1＝l_i-1+l_i计算第三三元组的持续时间l'_i-1，其中，s_i为第一三元组的起始时间，s_i-1为第二三元组的起始时间，l_i-1为第二三元组的持续时间，l_i为第一三元组的持续时间；当s_i＝s_i-1+l_i-1不成立，s_i+1＝s_i+l_i成立时，通过l'_i+1＝l_i+1+l_i计算第五三元组的持续时间l'_i+1，通过s'_i+1＝s_i计算第五三元组的起始时间s'_i+1，其中，s_i+1为第四三元组的起始时间，l_i+1为第四三元组的持续时间。

存储介质还被设置为存储用于执行以下步骤的程序代码：获取上传的多个原始清唱音频文件；获取对多个原始清唱音频文件的回复信息，其中，回复信息用于表示原始清唱音频文件的质量等级；如果回复信息所表示的质量等级达到预定等级，则将原始清唱音频文件确定为候选清唱音频文件。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

如上参照附图以示例的方式描述了根据本申请的歌曲的数字乐谱文件的生成方法、装置和存储介质。但是，本领域技术人员应当理解，对于上述本申请所提出的歌曲的数字乐谱文件的生成方法、装置和存储介质，还可以在不脱离本申请内容的基础上做出各种改进。因此，本申请的保护范围应当由所附的权利要求书的内容确定。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

工业实用性

在本申请实施例中，从歌曲对应的清唱音频文件中获取满足第一条件的候选清唱音频文件，其中，候选清唱音频文件包括用户对候选清唱音频文件对应的歌曲进行演唱的清唱数据；根据歌曲的时间信息从候选清唱音频文件中划分出多个有效音频片段；提取每个有效音频片段的音符信息，音符信息包括一个或多个三元组，每个三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；根据每个有效音频片段的音符信息生成数字乐谱文件，其中，数字乐谱文件包括三元组中的部分或全部，通过用户候选清唱音频文件对应的歌曲进行演唱的清唱数据生成数字乐谱文件，达到了自动生成数字乐谱文件的目的，从而实现了提高清唱音频文件的制作效率的技术效果，进而解决了相关技术中数字乐谱文件的制作效率低的技术问题。

Claims

一种歌曲的数字乐谱文件的生成方法，包括：

从歌曲对应的清唱音频文件中获取满足第一条件的候选清唱音频文件，其中，所述清唱音频文件包括用户对所述歌曲进行演唱的清唱数据；

根据所述歌曲的时间信息从所述候选清唱音频文件中划分出多个有效音频片段；

提取每个所述有效音频片段的音符信息，其中，所述音符信息包括一个或多个三元组，每个所述三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；以及

根据每个所述有效音频片段的音符信息生成数字乐谱文件，其中，所述数字乐谱文件包括所述三元组中的部分或全部。
根据权利要求1所述的方法，其中，根据所述歌曲的时间信息从所述候选清唱音频文件中划分出多个有效音频片段包括：

获取所述歌曲对应的歌词文件，所述歌词文件包括每句歌词对应的时间信息；以及

根据所述歌词文件中每句歌词对应的时间信息将所述候选清唱音频文件划分出多个有效音频片段。
根据权利要求1所述的方法，其中，所述提取每个所述有效音频片段的音符信息包括：

提取每个所述有效音频片段的基频信息，其中，所述基频信息包括音频片段的基频值；

获取所述多个有效音频片段中所述基频值为非零的音频片段的播放时长之和；

如果所述播放时长之和超过预设时间，对每个所述有效音频片段执行处理，得到基频段；

获取所述基频段中的基频值；

对所述基频值执行音符化处理，得到所述基频值的音符值；以及

合并所述音符值，得到所述多个有效音频片段的音符信息。
根据权利要求3所述的方法，其中，

对每个所述有效音频片段执行处理包括：获取每个所述有效音频片段对应的长度；对所述长度小于第一预设值的有效音频片段执行第一滤波处理，得到第一滤波片段；对所述长度大于等于所述第一预设值的有效音频片段执行第二滤波处理，得到第二滤波片段；

获取所述基频段中的基频值包括：获取所述第一滤波片段的基频值和所述第二滤波片段的基频值。
根据权利要求4所述的方法，其中，

在获取每个所述有效音频片段对应的长度之后，所述方法还包括：如果所述长度小于第二预设值的有效音频片段中存在零音频片段，将所述零音频片段的基频值设置为预设基频值，其中，所述零音频片段为所述基频值为零的音频片段；

获取所述基频段中的基频值包括：获取所述第一滤波片段的基频值、所述第二滤波片段的基频值和所述预设基频值。
根据权利要求3所述的方法，其中，在获取所述多个有效音频片段中所述基频值为非零的音频片段的时长之和之前，所述方法还包括：

获取所述多个有效音频片段中相邻音频片段的基频值；

计算所述相邻音频片段的基频值的差值；

如果所述差值满足第二条件，将所述相邻音频片段的基频值置零。
根据权利要求3所述的方法，其中，合并所述音符值，得到所述有效音频片段的音符信息包括：

将所述音符值中的相同音符值进行合并，并生成所述多个有效音频片段对应的三元组；以及

将所述多个有效音频片段对应的三元组组合成用于表示所述音符信息的第一三元组序列。
根据权利要求7所述的方法，其中，生成所述多个有效音频片段对应的三元组包括：

获取所述相同音符值、所述多个有效音频片段对应的三元组的起始时间、所述多个有效音频片段对应的三元组的持续时间；以及

根据所述相同音符值、所述多个有效音频片段对应的三元组的起始时间、所述多个有效音频片段对应的三元组的持续时间生成所述多个有效音频片段对应的三元组。
根据权利要求7所述的方法，其中，所述第一三元组序列包括第一三元组和第二三元组，根据所述多个有效音频片段的音符信息生成所述数字乐谱文件包括：

当所述第一三元组的起始时间等于所述第二三元组的起始时间与所述第二三元组的持续时间之和时，合并所述第一三元组和所述第二三元组，得到第三三元组，并从所述第一三元组序列中删除所述第一三元组，得到第二三元组序列；

当所述第一三元组的起始时间不等于所述第二三元组的起始时间与所述第二三元组的持续时间之和时，当第四三元组的起始时间等于所述第一三元组的起始时间与所述第一三元组的持续时间之和时，合并所述第四三元组和所述第一三元组，得到第五三元组，并从所述第一三元组序列中删除所述第一三元组，得到所述第二三元组序列；

当所述第一三元组的起始时间不等于所述第二三元组的起始时间与所述第二三元组的持续时间之和时，且当所述第四三元组的起始时间不等于所述第一三元组的起始时间与所述第一三元组的持续时间之和时，从所述第一三元组序列中删除所述第一三元组，得到所述第二三元组序列；以及

将所述第二三元组序列中的三元组按照预设格式输出，得到所述数字乐谱文件。
根据权利要求9所述的方法，其中，

当s_i＝s_i-1+l_i-1成立时，通过l'_i-1＝l_i-1+l_i计算所述第三三元组的持续时间l'_i-1，其中，s_i为所述第一三元组的起始时间，s_i-1为所述第二三元组的起始时间，l_i-1为所述第二三元组的持续时间，l_i为所述第一三元组的持续时间；

当s_i＝s_i-1+l_i-1不成立，s_i+1＝s_i+l_i成立时，通过l'_i+1＝l_i+1+l_i计算所述第五三元组的持续时间l'_i+1，通过s'_i+1＝s_i计算所述第五三元组的起始时间s'_i+1，其中，s_i+1为所述第四三元组的起始时间，l_i+1为所述第四三元组的持续时间。
根据权利要求1所述的方法，其中，获取所述候选清唱音频文件包括：

获取上传的多个原始清唱音频文件；

获取对所述多个原始清唱音频文件的回复信息，其中，所述回复信息用于表示所述原始清唱音频文件的质量等级；

如果所述回复信息所表示的质量等级达到预定等级，则将所述原始清唱音频文件确定为所述候选清唱音频文件。
一种歌曲的数字乐谱文件的生成装置，包括：

获取单元，被设置为从歌曲对应的清唱音频文件中获取满足第一条件的候选清唱音频文件，其中，所述清唱音频文件包括用户对所述歌曲进行演唱的清唱数据；

划分单元，被设置为根据所述歌曲的时间信息从所述候选清唱音频文件中划分出多个有效音频片段；

提取单元，被设置为提取每个所述有效音频片段的音符信息，其中，所述音符信息包括一个或多个三元组，每个所述三元组包括具有映射关系的音符的起始时间，音符的持续时间，音符的音符值；以及

生成单元，被设置为根据每个所述有效音频片段的音符信息生成数字乐谱文件，其中，所述数字乐谱文件包括所述三元组中的部分或全部。
根据权利要求12所述的装置，其中，所述划分单元包括：

第一获取模块，被设置为获取所述歌曲对应的歌词文件，所述歌词文件包括每句歌词对应的时间信息；以及

划分模块，被设置为根据所述歌词文件中每句歌词对应的时间信息将所述候选清唱音频文件划分为多个有效音频片段。
根据权利要求12所述的装置，其中，所述提取单元包括：

提取模块，被设置为提取每个所述有效音频片段的基频信息，其中，所述基频信息包括音频片段的基频值；

第二获取模块，被设置为获取所述多个有效音频片段中所述基频值为非零的音频片段的播放时长之和；

第一处理模块，被设置为在所述播放时长之和超过预设时间时，对每个所述有效音频片段执行处理，得到基频段；

第三获取模块，被设置为获取所述基频段中的基频值；

第二处理模块，被设置为对所述基频值执行音符化处理，得到所述基频值的音符值；以及

合并模块，被设置为合并所述音符值，得到所述多个有效音频片段的音符信息。
根据权利要求14所述的装置，

所述第一处理模块包括：获取子模块，被设置为获取每个所述有效音频片段对应的长度；第一处理子模块，被设置为对所述长度小于第一预设值的音频片段执行第一滤波处理，得到第一滤波片段；第二处理子模块，被设置为对所述长度大于等于所述第一预设值的音频片段执行第二滤波处理，得到第二滤波片段；

所述第三获取模块被设置为获取所述第一滤波片段的基频值和所述第二滤波片段的基频值。
一种终端，其中，所述终端被设置为执行程序代码，所述程序代码用于执行所述权利要求1至11中任意一项所述的歌曲的数字乐谱文件的生成方法中的步骤。
一种存储介质，其中，所述存储介质被设置为存储程序代码，所述程序代码用于执行所述权利要求1至11中任意一项所述的歌曲的数字乐谱文件的生成方法中的步骤。