CN109584902B - 一种音乐节奏确定方法、装置、设备及存储介质 - Google Patents
一种音乐节奏确定方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109584902B CN109584902B CN201811456707.8A CN201811456707A CN109584902B CN 109584902 B CN109584902 B CN 109584902B CN 201811456707 A CN201811456707 A CN 201811456707A CN 109584902 B CN109584902 B CN 109584902B
- Authority
- CN
- China
- Prior art keywords
- signal
- beat
- peak value
- time domain
- music
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000033764 rhythmic process Effects 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims abstract description 27
- 238000001914 filtration Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000001020 rhythmical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
本发明公开了一种音乐节奏确定方法、装置、设备及存储介质。该方法包括:获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型;根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应;对帧信号的时域能量进行自相关计算,得到自相关信号;将自相关信号中峰值对应的位置作为音乐信号的节奏。本发明实施例提高了确定音乐信号节奏的准确性。
Description
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种音乐节奏确定方法、装置、设备及存储介质。
背景技术
节奏是音乐的灵魂,如果没有了节奏,音乐就会杂乱无章,也就不能称为音乐,可见节奏是音乐的关键性因素。
传统技术中,确定音乐信号的节奏有如下两种方式:其一、人工获取。即由具有音乐专业知识的人通过对音乐信号进行识别,来给出音乐信号的节奏;其二、基于两个节拍点之间的时间间隔来确定音乐信号的节奏,其中,两个节拍点可能为两个强节拍,也可能为一个强节拍和一个弱节拍,还可能为两个弱节拍。
发明人在实现本发明的过程中,发现现有技术至少存在如下问题:针对方式一,对音乐信号的节奏的识别准确率较高,但是较繁琐和费时,且无法实现自动实时获得音乐信号的节奏,相应的,也就无法应用于短视频和视频直播等领域,应用范围有限。针对方式二,所确定的节拍点本身不准确。此外,即使确定的两个节拍点准确,两个节拍点之间可能存在着旋律类或人声类的音乐信号,而由于无法正确识别上述类型音乐信号的节拍点,因此,会将该部分音乐信号也作为两个节拍点的时间间隔的一部分,从而使得确定出的音乐信号的节奏与音乐信号的节奏真值产生较大误差。
发明内容
本发明实施例提供一种音乐节奏确定方法、装置、设备及存储介质,以提高确定音乐信号节奏的准确性。
第一方面,本发明实施例提供了一种音乐节奏确定方法,该方法包括:
获取音乐信号,所述音乐信号包括至少两帧帧信号以及与所述帧信号对应的节拍类型;
根据所述帧信号的原始时域能量和加权系数确定所述帧信号的时域能量,所述加权系数与所述节拍类型对应;
对所述帧信号的时域能量进行自相关计算,得到自相关信号;
将所述自相关信号中峰值对应的位置作为所述音乐信号的节奏。
进一步的,所述节拍类型包括节拍和非节拍;所述加权系数包括第一加权系数和第二加权系数,所述第一加权系数大于所述第二加权系数;所述第一加权系数与所述节拍对应,所述第二加权系数与所述非节拍对应;
所述根据所述帧信号的原始时域能量和加权系数确定所述帧信号的时域能量,所述加权系数与所述节拍类型对应,包括:
所述帧信号的节拍类型为节拍,则根据所述帧信号的原始时域能量和所述第一加权系数确定所述帧信号的时域能量;
所述帧信号的节拍类型为非节拍,则根据所述帧信号的原始时域能量和所述第二加权系数确定所述帧信号的时域能量。
进一步的,所述将所述自相关信号中峰值对应的位置作为所述音乐信号的节奏,包括:
对所述自相关信号中峰值按降序方式进行排序,并选取前至少两个峰值作为目标峰值;
将所述目标峰值对应的位置作为所述音乐信号的节奏。
进一步的,所述将所述目标峰值对应的位置作为所述音乐信号的节奏,包括:
将所述目标峰值中最大峰值作为第一峰值,并计算所述第一峰值与比例系数的乘积,将乘积结果作为门限峰值;
将所述目标峰值中峰值大于等于所述门限峰值的其它峰值作为第二峰值,并将所述第二峰值以及所述第一峰值作为第一更新目标峰值;
将所述第一更新目标峰值对应的位置作为所述音乐信号的节奏。
进一步的,所述将所述第一更新目标峰值对应的位置作为所述音乐信号的节奏,包括:
分别计算所述第一峰值对应的位置与所述第二峰值中各个峰值对应的位置的比值;
将比值结果中非偶数对应的峰值以及所述第一峰值作为第二更新目标峰值;
将所述第二更新目标峰值对应的位置作为所述音乐信号的节奏。
进一步的,所述目标峰值为前两个峰值。
进一步的,所述对所述帧信号的时域能量进行自相关计算,得到自相关信号,包括:
对所述帧信号的时域能量进行滤波处理,得到处理后的帧信号的时域能量;
对所述处理后的帧信号的时域能量进行自相关计算,得到所述自相关信号。
第二方面,本发明实施例还提供了一种音乐节奏确定装置,该装置包括:
音乐信号获取模块,用于获取音乐信号,所述音乐信号包括至少两帧帧信号以及与所述帧信号对应的节拍类型;
帧信号时域能量确定模块,用于根据所述帧信号的原始时域能量和加权系数确定所述帧信号的时域能量,所述加权系数与所述节拍类型对应;
自相关信号生成模块,用于对所述帧信号的时域能量进行自相关计算,得到自相关信号;
音乐节奏确定模块,用于将所述自相关信号中峰值对应的位置作为所述音乐信号的节奏。
进一步的,所述节拍类型包括节拍和非节拍;所述加权系数包括第一加权系数和第二加权系数,所述第一加权系数大于所述第二加权系数;所述第一加权系数与所述节拍对应,所述第二加权系数与所述非节拍对应;
所述帧信号时域能量确定模块,包括:
第一帧信号时域能量确定子模块,用于所述帧信号的节拍类型为节拍,则根据所述帧信号的原始时域能量和所述第一加权系数确定所述帧信号的时域能量;
第二帧信号时域能量确定子模块,用于所述帧信号的节拍类型为非节拍,则根据所述帧信号的原始时域能量和所述第二加权系数确定所述帧信号的时域能量。
进一步的,所述音乐节奏确定模块,包括:
目标峰值确定子模块,用于对所述自相关信号中峰值按降序方式进行排序,并选取前至少两个峰值作为目标峰值;
音乐节奏确定子模块,用于将所述目标峰值对应的位置作为所述音乐信号的节奏。
进一步的,所述音乐节奏确定子模块,包括:
门限峰值确定单元,用于将所述目标峰值中最大峰值作为第一峰值,并计算所述第一峰值与比例系数的乘积,将乘积结果作为门限峰值;
第一更新目标峰值确定单元,用于将所述目标峰值中峰值大于等于所述门限峰值的其它峰值作为第二峰值,并将所述第二峰值以及所述第一峰值作为第一更新目标峰值;
音乐节奏确定单元,用于将所述第一更新目标峰值对应的位置作为所述音乐信号的节奏。
进一步的,所述音乐节奏确定单元,具体用于:
分别计算所述第一峰值对应的位置与所述第二峰值中各个峰值对应的位置的比值;
将比值结果中非偶数对应的峰值以及所述第一峰值作为第二更新目标峰值;
将所述第二更新目标峰值对应的位置作为所述音乐信号的节奏。
进一步的,所述目标峰值为前两个峰值。
进一步的,所述自相关信号生成模块,包括:
时域能量处理子模块,用于对所述帧信号的时域能量进行滤波处理,得到处理后的帧信号的时域能量;
自相关信号生成子模块,用于对所述处理后的帧信号的时域能量进行自相关计算,得到所述自相关信号。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例第一方面所述的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例第一方面所述的方法。
本发明实施例通过获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型,根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应,对帧信号的时域能量进行自相关计算,得到自相关信号,因为自相关信号中峰值对应的位置与音乐信号的周期相关,即与两个节拍之间的时间间隔相关,因此将自相关信号中峰值对应的位置作为音乐信号的节奏,可以提高确定音乐信号节奏的准确性。进一步的,由于本发明实施例所提供的技术方案是对音乐信号的自相关信号进行分析来确定音乐信号的节奏,而不是根据两个节拍点之间的时间间隔来确定音乐信号的节奏,因此,即使对帧信号的节拍类型确定错误,也可准确确定音乐信号的节奏。
附图说明
图1是本发明实施例中的一种音乐节奏确定方法的流程图;
图2是本发明实施例中的另一种音乐节奏确定方法的流程图;
图3是本发明实施例中的一种音乐节奏确定装置的结构示意图;
图4是本发明实施例中的一种设备的结构示意图。
具体实施方式
下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例
为了更好地理解本发明实施例所提供的技术方案,下面首先对涉及到的几个基本概念进行说明,具体的:
其一、拍子。在音乐中,时间被分成均等的基本单位,每个单位称为一个“拍子”或称为“一拍”。拍子的时值是以音符的时值来表示的,一拍的时值可以是四分音符(即以四分音符为一拍),也可以是二分音符(即以二分音符为一拍),还可以是八分音符(即以八分音符为一拍)。拍子的时值是一个相对的时间概念,示例性的,如当规定乐曲的速度为每分钟60拍时,每拍占用的时间是一秒,半拍占用的时间是二分之一秒,依此类推。拍子的基本时值确定之后,各种时值的音符就与拍子联系在一起,示例性的,如当以四分音符为一拍时,则全音符相当于四拍,二音符相当于两拍,八音符相当于半拍,十六音符相当于四分之一拍。
其二、拍号。拍号是一个分数,分母表示拍子的基本时值,也即是以几分音符作为一拍,分子表示每小节中有几拍。示例性的,如2/4表示以四分音符为一拍,每小节有两拍;3/4表示以四分音符为一拍,每小节有三拍。拍号的分母部分只有2、4和8三种,也即只能用二分音符、四分音符和八分音符作为拍子的基本时值。
其三、小节。音乐总是跌宕起伏,强弱交替出现,这种交替出现不能是杂乱无章的,必须按照旋律的结构,组织成最小的、有规律的组织,在这个基础上进行才可以,这个最基本的基础即是小节。规律如下:强节拍和弱节拍交替进行,每当一个强节拍出现,不论后面是否存在弱节拍以及存在几个弱节拍,在第二个强节拍出现之前,便构成了一个小节,当第二个强节拍出现之后,又形成第二个小节,这样循环往复,可以理解到,除在弱节拍上标记了强音记号外,每小节只存在一个强节拍。示例性的,2/4表示每小节有两拍,第一拍是强节拍,第二拍是弱节拍,即强-弱;3/4表示每小节有三拍,第一拍是强节拍,第二拍和第三拍是弱节拍,即强-弱-弱。
其四、单拍子。单拍子是指每小节只包含一个强节拍,及固定数目的弱节拍,且从乐曲开始到结束,这种强弱规律都不发生变化。示例的,如二拍子和三拍子,二拍子如2/2(强-弱),2/4(强-弱);三拍子如3/4(强-弱-弱),3/8(强-弱-弱)等。
其五、复拍子。如果一小节包含两个以上同种类的单拍子,即出现两个以上的重音,则称为复拍子,这些重音在力度上是不同的,将第一个重音位置称为强节拍,第二重音位置称为次强节拍。示例性的,如4/4(强-弱-次强-弱);6/8(强-弱-弱-次强-弱-弱)。需要说明的是,除了四拍子(如4/4)外,复拍子的重音位置都是以三拍子为基础的,即每隔两个弱节拍出现一个强节拍。
其六、节拍。节拍是指强节拍和弱节拍的组合规律,具体指在乐谱中每一小节的音符总长度,每小节的长度是固定的。或者,节拍是有强有弱的相同的时间段内,按照一定的顺序反复出现,形成的有规律的强弱变化。在节拍中相同的时间片段即为前文所述的“拍子”。将处于强关系的拍子称为强节拍,将处于弱关系的拍子称为弱节拍。
其七、节奏。节奏是音乐在时间上的组织,是音乐中交替出现的有规律的强弱和长短现象,是轻重缓急的变化和重复。或者,节奏是指在节拍的基础上,由各种不同时值的音符组合在一起形成的多样化的形态,它和音的长短、强弱有着密切的关系。节奏可以包括三部分,第一部分为等级韵律结构,是乐谱中存在的时序关系;第二部分为速度变奏,它指示出音乐事件出现的可能时变速率;第三部分为无节奏部分,它指的是一些非节奏的信息,即没有周期性特征出现的部分。换个角度来看,节奏包括节拍和速度两部分,前者是指音乐规律性的强弱交替的律动,后者是指这种律动的速率程度。
为了解决前文所述的问题,可考虑转换思路,从音乐信号的特征入手,提供一种可以准确确定音乐信号的节奏的方法。需要说明的是,本发明实施例用两个节拍点之间的时间间隔来表征音乐信号的节奏,其中,两个节拍点可能为两个强节拍,也可能为一个强节拍和一个弱节拍,还可能为两个弱节拍。由此可见,本发明可实现上述目标的关键在于:如何准确确定两个节拍点之间的时间间隔。下面将结合具体实施例对上述内容进行进一步说明。
图1为本发明实施例提供的一种音乐节奏确定方法的流程图,本实施例可适用于实现准确确定音乐信号的节奏的情况,该方法可以由音乐节奏确定装置来执行,该装置可以采用软件和/或硬件的方式实现,该装置可以配置于设备中,例如典型的是计算机或移动终端等。如图1所示,该方法具体包括如下步骤:
步骤110、获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型。
在本发明的实施例中,获取到音乐信号,并对该音乐信号进行分帧处理和节拍点检测,得到该音乐信号的两帧或两帧以上的帧信号以及与帧信号对应的节拍类型。音乐信号可以是用户上传的音乐信号,也可以是终端或服务器的数据库中的音乐信号。节拍类型可以包括节拍和非节拍,这里所述的节拍可以包括强节拍和/或弱节拍。
获取到音乐信号,对音乐信号进行分帧处理,得到至少两帧帧信号,与帧信号对应的节拍类型,可作如下理解:获取到音乐信号,对音乐信号进行预处理,得到处理后的音乐信号;对处理后的音乐信号进行分帧处理,得到至少两帧帧信号;获取帧信号的功率谱;对功率谱进行子带分解,分为至少两个子带;根据每个子带对应的节拍类乐器,对每个子带的信号进行时频域联合滤波;根据时频域联合滤波的结果确定帧信号的节拍类型。具体的:
预处理可以包括对音乐信号进行解码、双通道转单通道、采样率转换以及去除直流分量等必要的预处理操作,其中,预处理过程属于常规操作,在此不作具体赘述。
对处理后的音乐信号进行分帧处理时,可以将N点作为一帧,分帧后对每一帧信号加窗处理,然后对每个帧信号进行STFT(Short Time Fourier Transform,短时傅里叶变换)得每个帧信号的功率谱,将每帧帧信号对应的功率谱进行子带分解,分解为至少两个子带,每个子带对应用于检测一种类型的节拍点,更为具体的,对帧信号的功率谱进行分析,结合音乐中常用的节拍类乐器的频响特点,对功率谱进行子带分解。
将每帧帧信号对应的功率谱进行子带分解后,进一步根据每个子带对应的节拍类乐器,采用节拍类乐器相应的参数对每个子带的信号进行时频域联合滤波。其中,节拍类乐器相应的参数可以由以下方式确定:根据每个子带中,用于检测的节拍类乐器节拍点与其它不同于该节拍点的干扰信号,在时间上的特性及在谐波分布上的特性设置该子带的参数。
根据时频域联合滤波的结果,获取每个子带的信号中每个频率的节拍置信度,根据每个频率的节拍置信度计算每个子带中所有频率对应的功率值的加权求和值,根据该加权求和值得到帧信号的节拍类型,其中,节拍置信度是一个0~1之间的数值,将节拍置信度与帧信号的功率谱相乘,属于节拍的帧信号的功率谱会保留下来,不属于节拍(即非节拍)的帧信号的功率谱会被抑制。计算得到每个子带中所有频率对应的功率值的加权求和值后,可以将加权求和值大于门限功率值的帧信号的节拍类型确定为节拍,将加权求和值小于等于门限值功率值的帧信号的节拍类型确定为非节拍。
由于节拍分为强节拍和弱节拍,因此,需要进一步区分强节拍与弱节拍。具体的:可以设定强节拍门限功率值,进而将帧信号的功率值大于强节拍门限功率值的帧信号确定为强节拍,将帧信号的功率值大于门限值功率值且小于等于强节拍门限功率值的帧信号确定为弱节拍。其中,强节拍门限功率值可以通过如下方式确定:获取所有节拍的帧信号的功率值的均值以及方差;计算均值与三倍方差的和值,将该和值作为强节拍点门限功率值。
步骤120、根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应。
在本发明的实施例中,音乐信号包括至少两帧帧信号,帧信号对应的节拍类型可能为节拍,也可能为非节拍,而音乐信号的节奏需要根据节拍类型为节拍的帧信号来确定,因此,为了凸显节拍类型为节拍的帧信号,抑制节拍类型为非节拍的帧信号,可以考虑采用帧信号的原始时域能量与加权系数相乘的方式,其中,加权系数与节拍类型对应,具体的:
加权系数可以为0-1之间的数值,加权系数可以包括第一加权系数和第二加权系数,其中,第一加权系数大于第二加权系数,第一加权系数与节拍对应,第二加权系数与非节拍对应。更为具体的:帧信号的节拍类型为节拍,则可以将该帧信号的原始时域能量与第一加权系数相乘,得到该帧信号的时域能量;帧信号的节拍类型为非节拍,则可以该帧信号的原始时域能量与第二加权系数相乘,得到该帧信号的时域能量。各帧帧信号的时域能量组成了音乐信号的时域能量。经过上述处理后,相对来说,音乐信号中节拍类型为节拍的帧信号的时域能量得到了增强,而音乐信号中节拍类型为非节拍的帧信号的时域能量得到了抑制。
示例性的,如音乐信号包括N帧帧信号,其中,M帧帧信号的节拍类型为节拍,(N-M)帧帧信号的节拍类型为非节拍,第一加权系数为0.9,第二加权系数为0.1,对于节拍类型为节拍的M帧帧信号,将每帧帧信号的原始时域能量与第一加权系数相乘,得到每帧帧信号的时域能量;对于节拍类型为非节拍的(N-M)帧帧信号,将每帧帧信号的原始时域能量与第二加权系数相乘,得到每帧帧信号的时域能量。
步骤130、对帧信号的时域能量进行自相关计算,得到自相关信号。
步骤140、将自相关信号中峰值对应的位置作为音乐信号的节奏。
在本发明的实施例中,由于音乐信号的节奏具有周期性,因此,可以对音乐信号进行自相关分析,可以确定音乐信号的节奏。具体的:可以理解到,针对音乐信号来说,当时间延时为周期以及周期的整数倍时,该时间延时对应的是两个强节拍之间的时间间隔,更为具体的:如果该时间延时为周期时,则该时间延时对应的是两个相邻强节拍之间的时间间隔;如果该时间延时为周期的整数倍时,则该时间延时对应的是两个不相邻的强节拍之间的时间间隔。此外,还可以理解到,如果该音乐信号是包含弱节拍的音乐信号,如二拍子和三拍子等,则该时间延时对应的也是两个弱节拍之间的时间间隔,更为具体的:如果该时间间隔为周期时,则该时间延时对应的是两个相邻弱节拍之间的时间间隔;如果该时间延时为周期的整数倍时,则该时间延时对应的也是两个不相邻弱节拍之间的时间间隔。
由于音乐信号中各节拍之间的时间间隔是相等的,因此,不同小节中两个强节拍之间的时间间隔,或者,不同小节中两个弱节拍之间的时间间隔(即音乐信号是包含弱节拍的音乐信号),均是同一小节中强节拍与弱节拍之间的时间间隔或者弱节拍与弱节拍之间的时间间隔(即音乐信号是包含弱节拍的音乐信号)的整数倍。基于上述,如果时间延时为同一小节中强节拍与弱节拍之间的时间间隔或者弱节拍与弱节拍之间的时间间隔,则该时间延时将是周期的整数倍分之一,具体为几分之一是由拍子的类型所决定的,如音乐信号为二拍子,则该时间延迟将是周期的二分之一,再如音乐信号为三拍子,则该时间延迟将是周期的三分之一。
当时间延时为周期以及周期的整数倍时,自相关信号中将出现最大峰值;当时间延时为周期的整数倍分之一或者整数倍分之一的整数倍(除整数倍分之一的整数倍等于一的情况)时,自相关信号中将出现峰值,但不是最大峰值。基于上述可以理解到,自相关信号中峰值对应的位置与音乐信号的周期相关,即与两个节拍之间的时间间隔相关,而又由于两个节拍之间的时间间隔可表征音乐信号的节奏,因此,自相关信号中峰值对应的位置与音乐信号的节奏相关。由此可知,可对音乐信号进行自相关处理,得到自相关信号,将自相关信号中峰值对应的位置作为音乐信号的节奏。
具体的:由于音乐信号包括至少两帧帧信号,因此,音乐信号的时域能量是由各帧帧信号的时域能量组成的。这里所述的对帧信号的时域能量进行自相关计算也即对音乐信号的时域时域能量进行自相关计算,得到自相关信号,并可将自相关信号中峰值对应的位置作为音乐信号的节奏。
示例性的,如音乐信号包括N帧帧信号以及每帧帧信号对应的节拍类型,音乐信号为二拍子的音乐信号,即强节拍-弱节拍,音乐信号的周期为T,同一小节中两个相邻节拍之间的时间间隔为τ,相邻两小节中两个强节拍(或者两个弱节拍)之间的时间间隔为2τ,可以理解到T=2τ。自相关信号中峰值对应的位置nτ和2nτ为音乐信号对应的节奏,其中,n≥1。
需要说明的是,本发明实施例所提供的技术方案在计算音乐信号的自相关信号之前,对音乐信号的时域能量进行了加权处理,加权处理的结果使得音乐信号中节拍类型为节拍的帧信号的时域能量得到了增强,而音乐信号中节拍类型为非节拍的帧信号的时域能量得到了抑制,进而提高了自相关信号的可靠性。
还需要说明的是,由于本发明实施例所提供的技术方案是对音乐信号的自相关信号进行分析来确定音乐信号的节奏,而不是根据两个节拍点之间的时间间隔来确定音乐信号的节奏,因此,即使对帧信号的节拍类型确定错误,也可准确确定音乐信号的节奏。其中,对帧信号的节拍类型确定错误主要有如下几种情况:将原本是强节拍的节拍点确定为弱节拍或非节拍;将原本是弱节拍的节拍点确定为强节拍或非节拍;将原本是节拍的节拍点确定为非节拍以及将原本是非节拍的节拍点确定为节拍。
本实施例的技术方案,通过获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型,根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应,对帧信号的时域能量进行自相关计算,得到自相关信号,因为自相关信号中峰值对应的位置与音乐信号的周期相关,即与两个节拍之间的时间间隔相关,因此将自相关信号中峰值对应的位置作为音乐信号的节奏,可以提高确定音乐信号节奏的准确性。进一步的,由于本发明实施例所提供的技术方案是对音乐信号的自相关信号进行分析来确定音乐信号的节奏,而不是根据两个节拍点之间的时间间隔来确定音乐信号的节奏,因此,即使对帧信号的节拍类型确定错误,也可准确确定音乐信号的节奏。
可选的,在上述技术方案的基础上,节拍类型包括节拍和非节拍。加权系数包括第一加权系数和第二加权系数,第一加权系数大于第二加权系数;第一加权系数与节拍对应,第二加权系数与非节拍对应。根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应,具体可以包括:帧信号的节拍类型为节拍,则根据帧信号的原始时域能量和第一加权系数确定帧信号的时域能量。帧信号的节拍类型为非节拍,则根据帧信号的原始时域能量和第二加权系数确定帧信号的时域能量。
在本发明的实施例中,帧信号对应的节拍类型可能为节拍,也可能为非节拍,而音乐信号的节奏需要根据节拍类型为节拍的帧信号来确定,因此,为了凸显节拍类型为节拍的帧信号,抑制节拍类型为非节拍的帧信号,可以考虑采用帧信号的原始时域能量与加权系数相乘的方式,其中,加权系数与节拍类型对应,具体的:加权系数可以包括第一加权系数和第二加权系数,其中,第一加权系数大于第二加权系数,第一加权系数与节拍对应,第二加权系数与非节拍对应。更为具体的:如果帧信号的节拍类型为节拍,则可以将该帧信号的原始时域能量与第一加权系数相乘,得到该帧信号的时域能量;如果帧信号的节拍类型为非节拍,则可以该帧信号的原始时域能量与第二加权系数相乘,得到该帧信号的时域能量。各帧帧信号的时域能量组成了音乐信号的时域能量。经过上述处理后,相对来说,音乐信号中节拍类型为节拍的帧信号的时域能量得到了增强,而音乐信号中节拍类型为非节拍的帧信号的时域能量得到了抑制。
可选的,在上述技术方案的基础上,将自相关信号中峰值对应的位置作为音乐信号的节奏,具体可以包括:对自相关信号中峰值按降序方式进行排序,并选取前至少两个峰值作为目标峰值。将目标峰值对应的位置作为音乐信号的节奏。
在本发明的实施例中,需要说明的是,确定音乐信号的节奏包括:其一、确定相邻两个小节中两个强节拍之间的时间间隔;其二、确定同一小节中相邻两个节拍之间的时间间隔。其中,第一方面确定由于音乐信号的节奏具有周期性,因此,对音乐信号进行自相关计算得到的自相关信号中峰值对应的位置也具有周期性,同时,不同数值大小的峰值对应的位置之间还具有倍数关系,相应的,根据不同数值大小的峰值对应的位置所确定的音乐信号的节奏之间也具有倍数关系。需要说明的是,如果音乐信号为一拍子,则每个周期中自相关信号将只存在一个峰值;如果音乐信号不为一拍子,如二拍子或三拍子,则每个周期中自相关信号将存在至少两个峰值。
由于目的在于确定音乐信号的节奏,因此,可以选择自相关信号中峰值较大的至少两个峰值作为目标峰值,将目标峰值对应的位置作为音乐信号的节奏即可,其它峰值对应的位置与目标峰值对应的位置成倍数关系。
基于上述,为了确定自相关信号中的目标峰值,可以对自相关信号中峰值按降序方式进行排序,根据排序结果确定目标峰值,即选择排序结果中前至少两个峰值作为目标峰值。在确定目标峰值后,将目标峰值对应的位置作为音乐信号的节奏。
需要说明的是,这里所述的对自相关信号中峰值按降序方式进行排序指的是对每个周期的自相关信号,对其峰值按降序方式进行排序。此外,通常只选择第一个周期即可。
可选的,在上述技术方案的基础上,将目标峰值对应的位置作为音乐信号的节奏,具体可以包括:将目标峰值中最大峰值作为第一峰值,并计算第一峰值与比例系数的乘积,将乘积结果作为门限峰值。将目标峰值中峰值大于等于门限峰值的其它峰值作为第二峰值,并将第二峰值以及第一峰值作为第一更新目标峰值。将第一更新目标峰值对应的位置作为音乐信号的节奏。
在本发明的实施例中,如果自相关信号中某峰值的数值较小,则可以说明该峰值存在较大的干扰,该峰值并不可靠。由于自相关信号中峰值对应的位置即为音乐信号的节奏,因此,为了实现准确确定音乐信号的节奏,需要准确确定自相关信号中的峰值,即需要对峰值是否可靠进行确定。换个角度理解,可用于确定音乐信号的节奏的自相关信号中的峰值需要显著,这里所述的峰值显著指的是峰值的数值满足预设条件,预设条件可以为峰值大于等于门限峰值。其中,门限峰值可通过如下方式确定,具体的:将目标峰值中最大峰值作为第一峰值,并计算第一峰值与比例系数的乘积,将乘积结果作为门限峰值。可以理解到,上述是建立在确定目标峰值中最大峰值(即第一峰值)显著的基础上的,即认为第一峰值可靠。
在确定门限峰值后,将目标峰值中峰值大于等于门限峰值的峰值作为第二峰值,并将第一峰值和第二峰值作为第一更新目标峰值,将第一更新目标峰值对应的位置作为音乐信号的节奏。可以理解到,经过上述处理,第一更新目标峰值中的各个峰值均为显著峰值,即第一更新目标峰值中的各个峰值可靠。
可选的,在上述技术方案的基础上,将第一更新目标峰值对应的位置作为音乐信号的节奏,具体可以包括:分别计算第一峰值对应的位置与第二峰值中各个峰值对应的位置的比值。将比值结果中非偶数对应的峰值以及第一峰值作为第二更新目标峰值。将第二更新目标峰值对应的位置作为音乐信号的节奏。
在本发明的实施例中,由于音乐信号的节奏具有周期性,因此,只要确定相邻两个小节中两个强节拍之间的时间间隔,以及,确定一个小节中相邻两个节拍之间的时间间隔即可。具体的:如果相邻两个小节中两个强节拍之间的时间间隔是一个小节中相邻两个节拍之间的时间间隔的偶数倍,则可以确定该音乐信号为二拍子,此时,将相邻两个小节中两个强节拍之间的时间间隔作为音乐信号的节奏即可。如果相邻两个小节中两个强节拍之间的时间间隔是一个小节中相邻两个节拍之间的时间间隔的奇数倍,则可以确定该音乐信号为三拍子,此时,将相邻两个小节中两个强节拍之间的时间间隔,以及,一个小节中相邻两个节拍之间的时间间隔作为音乐信号的节奏即可。上述反映到自相关信号中为:
分别计算第一峰值对应的位置与第二峰值中各个峰值对应的位置的比值,将比值结果中非偶数对应的峰值以及第一峰值作为第二更新目标峰值,将第二更新目标峰值对应的位置作为音乐信号的节奏。
示例性的,如目标峰值为前两个峰值,即第一峰值和第二峰值,并确定第二峰值大于门限峰值,即第一峰值和第二峰值作为第一更新目标峰值,第一峰值对应的位置为2τ,第二峰值对应的位置为τ。计算第一峰值对应的位置与第二峰值的位置的比值为2,由于比值结果为偶数,因此,将第一峰值对应的位置作为音乐信号的节奏,并确定该音乐信号为二拍子,即每小节为强节拍-弱节拍。
可选的,在上述技术方案的基础上,目标峰值可以为前两个峰值。
在本发明的实施例中,对于通常涉及的二拍子和三拍子的音乐信号,选取前两个峰值作为目标峰值即可。当目标峰值为前两个峰值时,将目标峰值中最大峰值作为第一峰值,并计算第一峰值与比例系数的乘积,将乘积结果作为门限峰值,将目标峰值中大于等于门限峰值的其它峰值作为第二峰值,并计算第一峰值对应的位置与第二峰值对应的位置的比值,如果比值结果为偶数,则将第一峰值对应的位置作为音乐信号的节奏;如果比值结果为非偶数,则将第一峰值对应的位置和第二峰值对应的位置作为音乐信号的节奏。
可选的,在上述技术方案的基础上,对帧信号的时域能量进行自相关计算,得到自相关信号,具体可以包括:对帧信号的时域能量进行滤波处理,得到处理后的帧信号的时域能量。对处理后的帧信号的时域能量进行自相关计算,得到自相关信号。
在本发明的实施例中,为了降低噪声信号对帧信号的影响,可采用滤波算法对帧信号的时域能量进行滤波处理,这里滤波算法可以为中值滤波算法、算术平均滤波算法、加权平均滤波算法和滑动平均滤波算法等。其中,中值滤波是对某一参数连续采样N次,将N次采样的值按升序方式进行排序,再取中间值作为本次采样值。具体采用哪种滤波算法,可根据实际情况进行确定,在此不作具体限定。
在得到处理后的帧信号的时域能量后,对处理后的帧信号的时域能量进行自相关计算,得到自相关信号。后续通过对自相关信号的分析确定音乐信号的节奏。
图2为本发明实施例提供的另一种音乐节奏确定方法的流程图,本实施例可适用于实现准确确定音乐信号的节奏的情况,该方法可以由音乐节奏确定装置来执行,该装置可以采用软件和/或硬件的方式实现,该装置可以配置于设备中,例如典型的是计算机或移动终端等。如图2所示,该方法具体包括如下步骤:
步骤201、获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型,节拍类型包括节拍和非节拍。
步骤202、帧信号的节拍类型为节拍,则根据帧信号的原始时域能量和第一加权系数确定帧信号的时域能量。
步骤203、帧信号的节拍类型为非节拍,则根据帧信号的原始时域能量和第二加权系数确定帧信号的时域能量。
步骤204、对帧信号的时域能量进行滤波处理,得到处理后的帧信号的时域能量。
步骤205、对处理后的帧信号的时域能量进行自相关计算,得到自相关信号。
步骤206、对自相关信号中峰值按降序方式进行排序,并选取前至少两个峰值作为目标峰值。
步骤207、将目标峰值中最大峰值作为第一峰值,并计算第一峰值与比例系数的乘积,将乘积结果作为门限峰值。
步骤208、将目标峰值中峰值大于等于门限峰值的其它峰值作为第二峰值,并将第二峰值以及第一峰值作为第一更新目标峰值。
步骤209、分别计算第一峰值对应的位置与第二峰值中各个峰值对应的位置的比值。
步骤210、将比值结果中非偶数对应的峰值以及第一峰值作为第二更新目标峰值。
步骤211、将第二更新目标峰值对应的位置作为音乐信号的节奏。
在本发明的实施例中,需要说明的是,第一加权系数大于第二加权系数。目标峰值可以为前两个峰值。
本实施例的技术方案,通过获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型,根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应,对帧信号的时域能量进行自相关计算,得到自相关信号,因为自相关信号中峰值对应的位置与音乐信号的周期相关,即与两个节拍之间的时间间隔相关,因此将自相关信号中峰值对应的位置作为音乐信号的节奏,可以提高确定音乐信号节奏的准确性。进一步的,由于本发明实施例所提供的技术方案是对音乐信号的自相关信号进行分析来确定音乐信号的节奏,而不是根据两个节拍点之间的时间间隔来确定音乐信号的节奏,因此,即使对帧信号的节拍类型确定错误,也可准确确定音乐信号的节奏。
图3为本发明实施例提供的一种音乐节奏确定装置的结构示意图,本实施例可适用于实现准确确定音乐信号的节奏的情况,该装置可以采用软件和/或硬件的方式实现,该装置可以配置于设备中,例如典型的是计算机或移动终端等。如图3所示,该装置具体包括:
音乐信号获取模块310,用于获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型。
帧信号时域能量确定模块320,用于根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应。
自相关信号生成模块330,用于对帧信号的时域能量进行自相关计算,得到自相关信号。
音乐节奏确定模块340,用于将自相关信号中峰值对应的位置作为音乐信号的节奏。
本实施例的技术方案,通过获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型,根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应,对帧信号的时域能量进行自相关计算,得到自相关信号,因为自相关信号中峰值对应的位置与音乐信号的周期相关,即与两个节拍之间的时间间隔相关,因此将自相关信号中峰值对应的位置作为音乐信号的节奏,可以提高确定音乐信号节奏的准确性。进一步的,由于本发明实施例所提供的技术方案是对音乐信号的自相关信号进行分析来确定音乐信号的节奏,而不是根据两个节拍点之间的时间间隔来确定音乐信号的节奏,因此,即使对帧信号的节拍类型确定错误,也可准确确定音乐信号的节奏。
可选的,在上述技术方案的基础上,节拍类型包括节拍和非节拍;加权系数包括第一加权系数和第二加权系数,第一加权系数大于第二加权系数;第一加权系数与节拍对应,第二加权系数与非节拍对应;
帧信号时域能量确定模块320,具体可以包括:
第一帧信号时域能量确定子模块,用于帧信号的节拍类型为节拍,则根据帧信号的原始时域能量和第一加权系数确定帧信号的时域能量。
第二帧信号时域能量确定子模块,用于帧信号的节拍类型为非节拍,则根据帧信号的原始时域能量和第二加权系数确定帧信号的时域能量。
可选的,在上述技术方案的基础上,音乐节奏确定模块340,具体可以包括:
目标峰值确定子模块,用于对自相关信号中峰值按降序方式进行排序,并选取前至少两个峰值作为目标峰值。
音乐节奏确定子模块,用于将目标峰值对应的位置作为音乐信号的节奏。
可选的,在上述技术方案的基础上,音乐节奏确定子模块,具体可以包括:
门限峰值确定单元,用于将目标峰值中最大峰值作为第一峰值,并计算第一峰值与比例系数的乘积,将乘积结果作为门限峰值。
第一更新目标峰值确定单元,用于将目标峰值中其它峰值大于等于门限峰值的峰值作为第二峰值,并将第二峰值以及第一峰值作为第一更新目标峰值。
音乐节奏确定单元,用于将第一更新目标峰值对应的位置作为音乐信号的节奏。
可选的,在上述技术方案的基础上,音乐节奏确定单元,具体可以用于:
分别计算第一峰值对应的位置与第二峰值中各个峰值对应的位置的比值。
将比值结果中非偶数对应的峰值以及第一峰值作为第二更新目标峰值。
将第二更新目标峰值对应的位置作为音乐信号的节奏。
可选的,在上述技术方案的基础上,目标峰值为前两个峰值。
可选的,在上述技术方案的基础上,自相关信号生成模块330,具体可以包括:
时域能量处理子模块,用于对帧信号的时域能量进行滤波处理,得到处理后的帧信号的时域能量。
自相关信号生成子模块,用于对处理后的帧信号的时域能量进行自相关计算,得到自相关信号。
本发明实施例所提供的音乐节奏确定装置可执行本发明任意实施例所提供的音乐节奏确定方法,具备执行方法相应的功能模块和有益效果。
图4为本发明实施例提供的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备412的框图。图4显示的设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,设备412以通用计算设备的形式表现。设备412的组件可以包括但不限于:一个或者多个处理器416,系统存储器428,连接于不同系统组件(包括系统存储器428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Instruction Set Architecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型(Instruction Set Architecture,ISA)总线、视频电子标准协会(Video ElectronicsStandards Association,VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnect,PCI)总线。
设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被移动终端412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)730和/或高速缓存存储器432。设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如(Computer Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。
设备412也可以与一个或多个外部设备414(例如键盘、指向设备、显示器424等)通信,还可与一个或者多个使得用户能与该设备412交互的设备通信,和/或与使得该设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与设备412的其它模块通信。应当明白,尽管图4中未示出,可以结合设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在系统存储器428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种音乐节奏确定方法,包括:
获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型。
根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应。
对帧信号的时域能量进行自相关计算,得到自相关信号。
将自相关信号中峰值对应的位置作为音乐信号的节奏。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供应用于设备的音乐节奏确定方法的技术方案。该设备的硬件结构以及功能可参见实施例的内容解释。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的一种音乐节奏确定方法,该方法包括:
获取音乐信号,音乐信号包括至少两帧帧信号以及与帧信号对应的节拍类型。
根据帧信号的原始时域能量和加权系数确定帧信号的时域能量,加权系数与节拍类型对应。
对帧信号的时域能量进行自相关计算,得到自相关信号。
将自相关信号中峰值对应的位置作为音乐信号的节奏。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Computer Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、射频等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——局域网(Local AreaNetwork,LAN)或广域网(Wide Area Network,WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
当然,本发明实施例所提供的一种计算机可读存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的设备的音乐节奏确定方法中的相关操作。对存储介质的介绍可参见实施例中的内容解释。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (7)
1.一种音乐节奏确定方法,其特征在于,包括:
获取音乐信号,所述音乐信号包括至少两帧帧信号以及与所述帧信号对应的节拍类型;
根据所述帧信号的原始时域能量和加权系数确定所述帧信号的时域能量,所述加权系数与所述节拍类型对应;
对所述帧信号的时域能量进行自相关计算,得到自相关信号;
对所述自相关信号中峰值按降序方式进行排序,并选取前至少两个峰值作为目标峰值;
将所述目标峰值中最大峰值作为第一峰值,并计算所述第一峰值与比例系数的乘积,将乘积结果作为门限峰值;
将所述目标峰值中大于等于所述门限峰值的其它峰值作为第二峰值,并将所述第二峰值以及所述第一峰值作为第一更新目标峰值;
分别计算所述第一峰值对应的位置与所述第二峰值中各个峰值对应的位置的比值;
将比值结果中非偶数对应的峰值以及所述第一峰值作为第二更新目标峰值;
将所述第二更新目标峰值对应的位置作为所述音乐信号的节奏。
2.根据权利要求1所述的方法,其特征在于,所述节拍类型包括节拍和非节拍;所述加权系数包括第一加权系数和第二加权系数,所述第一加权系数大于所述第二加权系数;所述第一加权系数与所述节拍对应,所述第二加权系数与所述非节拍对应;
所述根据所述帧信号的原始时域能量和加权系数确定所述帧信号的时域能量,所述加权系数与所述节拍类型对应,包括:
所述帧信号的节拍类型为节拍,则根据所述帧信号的原始时域能量和所述第一加权系数确定所述帧信号的时域能量;
所述帧信号的节拍类型为非节拍,则根据所述帧信号的原始时域能量和所述第二加权系数确定所述帧信号的时域能量。
3.根据权利要求1所述的方法,其特征在于,所述目标峰值为前两个峰值。
4.根据权利要求1所述的方法,其特征在于,所述对所述帧信号的时域能量进行自相关计算,得到自相关信号,包括:
对所述帧信号的时域能量进行滤波处理,得到处理后的帧信号的时域能量;
对所述处理后的帧信号的时域能量进行自相关计算,得到所述自相关信号。
5.一种音乐节奏确定装置,其特征在于,包括:
音乐信号获取模块,用于获取音乐信号,所述音乐信号包括至少两帧帧信号以及与所述帧信号对应的节拍类型;
帧信号时域能量确定模块,用于根据所述帧信号的原始时域能量和加权系数确定所述帧信号的时域能量,所述加权系数与所述节拍类型对应;
自相关信号生成模块,用于对所述帧信号的时域能量进行自相关计算,得到自相关信号;
目标峰值确定子模块,用于对所述自相关信号中峰值按降序方式进行排序,并选取前至少两个峰值作为目标峰值;
门限峰值确定单元,用于将所述目标峰值中最大峰值作为第一峰值,并计算所述第一峰值与比例系数的乘积,将乘积结果作为门限峰值;
第一更新目标峰值确定单元,用于将所述目标峰值中大于等于所述门限峰值的其它峰值作为第二峰值,并将所述第二峰值以及所述第一峰值作为第一更新目标峰值;
音乐节奏确定单元,具体用于分别计算所述第一峰值对应的位置与所述第二峰值中各个峰值对应的位置的比值;将比值结果中非偶数对应的峰值以及所述第一峰值作为第二更新目标峰值;将所述第二更新目标峰值对应的位置作为所述音乐信号的节奏。
6.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4任一所述的方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811456707.8A CN109584902B (zh) | 2018-11-30 | 2018-11-30 | 一种音乐节奏确定方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811456707.8A CN109584902B (zh) | 2018-11-30 | 2018-11-30 | 一种音乐节奏确定方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109584902A CN109584902A (zh) | 2019-04-05 |
CN109584902B true CN109584902B (zh) | 2021-07-23 |
Family
ID=65926688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811456707.8A Active CN109584902B (zh) | 2018-11-30 | 2018-11-30 | 一种音乐节奏确定方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109584902B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112259088B (zh) * | 2020-10-28 | 2024-05-17 | 瑞声新能源发展(常州)有限公司科教城分公司 | 音频重音识别方法、装置、设备和介质 |
CN112866732B (zh) * | 2020-12-30 | 2023-04-25 | 广州方硅信息技术有限公司 | 音乐广播方法及其装置、设备与介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6316712B1 (en) * | 1999-01-25 | 2001-11-13 | Creative Technology Ltd. | Method and apparatus for tempo and downbeat detection and alteration of rhythm in a musical segment |
JP3789326B2 (ja) * | 2000-07-31 | 2006-06-21 | 松下電器産業株式会社 | テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体 |
CN101908342B (zh) * | 2010-07-23 | 2012-09-26 | 北京理工大学 | 利用频域滤波后处理进行音频暂态信号预回声抑制的方法 |
CN103854644B (zh) * | 2012-12-05 | 2016-09-28 | 中国传媒大学 | 单声道多音音乐信号的自动转录方法及装置 |
CN108320730B (zh) * | 2018-01-09 | 2020-09-29 | 广州市百果园信息技术有限公司 | 音乐分类方法及节拍点检测方法、存储设备及计算机设备 |
-
2018
- 2018-11-30 CN CN201811456707.8A patent/CN109584902B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109584902A (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kong et al. | Decoupling magnitude and phase estimation with deep resunet for music source separation | |
EP1309964B1 (en) | Fast frequency-domain pitch estimation | |
US7593847B2 (en) | Pitch detection method and apparatus | |
US20040167775A1 (en) | Computational effectiveness enhancement of frequency domain pitch estimators | |
JPS63500683A (ja) | 並列処理型ピッチ検出器 | |
Manfredi et al. | Perturbation measurements in highly irregular voice signals: Performances/validity of analysis software tools | |
US20080234959A1 (en) | Pitch Extraction with Inhibition of Harmonics and Sub-harmonics of the Fundamental Frequency | |
JP2004538525A (ja) | 周波数分析によるピッチ判断方法および装置 | |
CN107210029B (zh) | 用于处理一连串信号以进行复调音符辨识的方法和装置 | |
CN109584902B (zh) | 一种音乐节奏确定方法、装置、设备及存储介质 | |
Kumar et al. | Performance evaluation of a ACF-AMDF based pitch detection scheme in real-time | |
Benetos et al. | A temporally-constrained convolutive probabilistic model for pitch detection | |
CN116884438B (zh) | 基于声学特征的练琴音准检测方法及系统 | |
Yu et al. | Multi-layered cepstrum for instantaneous frequency estimation | |
Singh et al. | Efficient pitch detection algorithms for pitched musical instrument sounds: A comparative performance evaluation | |
JP2001222289A (ja) | 音響信号分析方法及び装置並びに音声信号処理方法及び装置 | |
JPH07234696A (ja) | 音声の複素ケプストラム分析装置 | |
Su et al. | Minimum-latency time-frequency analysis using asymmetric window functions | |
Zhang et al. | Measurement and analysis of musical vibrato parameters | |
JP2005249967A (ja) | 周波数解析方法および装置 | |
Kawahara et al. | Temporally fine F0 extractor applied for frequency modulation power spectral analysis of singing voices | |
Caetano et al. | Adaptive sinusoidal modeling of percussive musical instrument sounds | |
JP4625934B2 (ja) | 音分析装置およびプログラム | |
Christensen et al. | Variable order harmonic sinusoidal parameter estimation for speech and audio signals | |
Schutz et al. | Periodic signal modeling for the octave problem in music transcription |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220614 Address after: 31a, 15 / F, building 30, maple mall, bangrang Road, Brazil, Singapore Patentee after: Baiguoyuan Technology (Singapore) Co.,Ltd. Address before: 511442 23-39 / F, building B-1, Wanda Plaza North, Wanbo business district, 79 Wanbo 2nd Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province Patentee before: GUANGZHOU BAIGUOYUAN INFORMATION TECHNOLOGY Co.,Ltd. |