CN108281157A - 音乐中鼓点节拍的检测方法及计算机存储介质、终端 - Google Patents
音乐中鼓点节拍的检测方法及计算机存储介质、终端 Download PDFInfo
- Publication number
- CN108281157A CN108281157A CN201711464060.9A CN201711464060A CN108281157A CN 108281157 A CN108281157 A CN 108281157A CN 201711464060 A CN201711464060 A CN 201711464060A CN 108281157 A CN108281157 A CN 108281157A
- Authority
- CN
- China
- Prior art keywords
- signal
- music
- army
- beat point
- frame signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 21
- 238000001228 spectrum Methods 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 20
- 230000000737 periodic effect Effects 0.000 claims description 49
- 238000009826 distribution Methods 0.000 claims description 17
- 238000009432 framing Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 12
- 230000009466 transformation Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000033764 rhythmic process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003014 reinforcing effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/076—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
本发明涉及信号处理领域,具体涉及一种音乐中鼓点节拍的检测方法及计算机存储介质、终端,所述方法包括:获取待检测音乐的音乐信号中每一帧信号的频谱;从所述频谱中提取每一帧信号在预设低频段中的低频信号;若本帧信号与前一帧信号的低频信号相比,能量增长大于预设值,确定本帧信号的位置出现底鼓节拍点;从所述频谱中提取每一帧信号在预设中高频段中的中高频信号;若本帧信号与前一帧信号的中高频信号相比,能量变化大于预置值,并且本帧信号的中高频信号的能量平坦度大于预设门限,确定本帧信号的位置出现军鼓节拍点。本发明通过军鼓和底鼓的频谱特征从具有鼓点的音乐中,检测出军鼓和底鼓的节拍点,为后续的其它处理打下良好的基础。
Description
技术领域
本发明涉及信号处理领域,具体涉及一种音乐中鼓点节拍的检测方法及计算机存储介质、终端。
背景技术
节拍点是音乐中鼓或其它乐器敲击时形成的人耳能明显感知、与音乐中其它部分差异较大的位置,尤其是在包含架子鼓演奏的音乐中,一般架子鼓包括底鼓和军鼓,底鼓多用于加强乐句或加强节奏的表现,一般决定了一首音乐作品的节奏与表演速度;军鼓音色清晰、明快,通过各种敲击效果(如轻、重、缓、急的区别)可以表达出不同的音乐情绪。随着互联网技术以及音频、图像处理技术的不断发展,用户在录制视频时会加播音乐以提高视频的音视觉体验,然而现有技术中,音乐仅仅是简单的加入到视频中,没有与视频很好的融合,究其原因是音乐的节拍没能准确地被检测出来,现有的音乐节拍检测方法是利用音乐的时域包络变化获得节拍点,这种方法对于很多音乐,特别是舞曲来说,由于音乐信号时域包络抖动很小(如图4所示),这种情况下难以检测出音乐节拍,或者检测出的音乐节拍没有统一的规律,导致节拍点序列杂乱,无法有效地跟视频画面结合;还有一种方法是利用音乐信号(如图5所示的信号)在频域上或者相位上的突变,以突变的点作为音乐的节拍点,但该种方法对于人声或者音乐的突变也能检测到,会带来一定程度的误检,此外,也无法区分音乐中不同鼓的节拍点。
发明内容
为克服以上技术问题,特别是现有技术无法准确地检测出音乐中的不同鼓的节拍点的问题,特提出以下技术方案:
本发明的实施例根据一个方面,提供了一种音乐中鼓点节拍的检测方法,包括:
获取待检测音乐的音乐信号中每一帧信号的频谱;
从所述频谱中提取每一帧信号在预设低频段中的低频信号;若本帧信号与前一帧信号的低频信号相比,能量增长大于预设值,确定本帧信号的位置出现底鼓节拍点;
从所述频谱中提取每一帧信号在预设中高频段中的中高频信号;若本帧信号与前一帧信号的中高频信号相比,能量变化大于预置值,并且本帧信号的中高频信号的能量平坦度大于预设门限,确定本帧信号的位置出现军鼓节拍点。
进一步地,所述确定本帧信号的位置出现军鼓节拍点之后,还包括:
根据军鼓节拍点的周期性规律,对所述音乐信号的全部军鼓节拍点进行筛选,得到符合周期性规律的军鼓节拍点。
具体的,所述根据军鼓节拍点的周期性规律,对所述音乐信号的全部军鼓节拍点进行筛选,得到符合周期性规律的军鼓节拍点,包括:
根据所述音乐信号的全部军鼓节拍点,得到军鼓节拍点的周期性规律;
从音乐信号的全部军鼓节拍点中,剔除不符合周期性规律的军鼓节拍点,得到符合周期性规律的军鼓节拍点。
优选地,所述根据所述音乐信号的全部军鼓节拍点,得到军鼓节拍点的周期性规律,包括:
在时域上统计根据所述音乐信号的底鼓节拍点和军鼓节拍点的分布特点,把所述分布特点与预定音乐类型分布特定进行匹配,得到所述待检测音乐的音乐类型;
获取所述音乐类型对应的军鼓节拍点的预定周期性规律;
获取所述音乐信号的军鼓节拍点的周期性规律;
利用所述音乐类型对应的军鼓节拍点的预定周期性规律对所述音乐信号的军鼓节拍点的周期性规律进行校正,得到校正后的军鼓节拍点的周期性规律。
较佳地,所述从所述频谱中提取每一帧信号在预设低频段中的低频信号,包括:
使用预设截止频率的低通滤波器对所述频谱进行滤波,得到每一帧信号在小于所述预设截止频率的低频信号。
较佳地,所述从所述频谱中提取每一帧信号在预设中高频段中的中高频信号,包括:
使用预设中高频段的带通滤波器对所述频谱进行滤波,得到每一帧信号在预设中高频段中的中高频信号。
进一步地,所述获取待检测音乐的音乐信号中每一帧信号的频谱,包括:
以预设采样频率对待检测音乐的音乐信号进行采样;
对所述采样后的音乐信号进行分帧,对分帧后的每一帧信号进行加窗并做傅里叶变换,获取每一帧信号的频谱。
进一步地,所述从所述频谱中提取每一帧信号在预设中高频段中的中高频信号之后,还包括:
计算每一帧信号在预设中高频段中的各频点能量的方差,得到能量平坦度。
本发明的实施例根据另一个方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的音乐中鼓点节拍的检测方法。
本发明的实施例根据又一个方面,还提供了一种终端,所述终端包括一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的音乐中鼓点节拍的检测方法。
本发明与现有技术相比,具有以下有益效果:
本发明利用了军鼓和底鼓的频谱特征对音乐信号中的两种鼓点的节拍进行检测,在检测底鼓节拍点中比较了低频信号能量,在检测军鼓节拍点中比较了中高频信号能量和能量谱的平坦度,可以有效的从具有鼓点的音乐中,检测出军鼓和底鼓的节拍点,为后续的其它处理打下良好的基础。
此外,本发明不仅从军鼓的频谱特征对音乐信号中的军鼓节拍点进行检测,还基于音乐的节奏、军鼓在音乐中的表现特性(即军鼓节拍的周期性)对音乐信号中的军鼓节拍点进行检测,以此更准确地确定音乐中出现的军鼓节拍点。
再者,本发明不仅从音乐的频谱特征确定军鼓节拍点的周期规律,还通过在时域上统计根据所述音乐信号的底鼓节拍点和军鼓节拍点的分布特点匹配待检测音乐的音乐类型,再利用音乐类型的预定周期性规律对待检测音乐的军鼓节拍点的周期性规律进行校正,得到更为准确的军鼓节拍点的周期性规律,从而更准确地确定音乐中出现的军鼓节拍点。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明音乐中鼓点节拍的检测方法的一实施例流程示意图;
图2为一段音乐中军鼓和底鼓的频谱示意图;
图3为本发明终端的一实施例结构示意图;
图4为音乐信号的时域包络抖动示例图;
图5为频域上的音乐信号示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
在一种实施例中,本发明提供一种音乐中鼓点节拍的检测方法,如图1所示,该方法包括:
S100:获取待检测音乐的音乐信号中每一帧信号的频谱。
本实施例中检测到的音乐信号初始是声压随时间变化的函数,相当于在时域上的波形图,在获取到待检测音乐的音乐信号后,对时域上音乐信号处理得到音乐信号中每一帧的频谱。具体的,本实施例中,所述获取待检测音乐的音乐信号的动作执行于用户选定欲播放的音乐之后,所述欲播放的音乐可以是从视频应用中的预存音乐选定的音乐,也可以是从用户终端的预存音乐选定加载于视频应用中的音乐,还可以是视频应用通过麦克风获取的其它设备播放的现场音乐。
S200:从所述频谱中提取每一帧信号在预设低频段中的低频信号;若本帧信号与前一帧信号的低频信号相比,能量增长大于预设值,确定本帧信号的位置出现底鼓节拍点。
如图2是已知的一段音乐的音乐信号频谱图,图中椭圆框标记的是底鼓节拍点,通过多段已知的音乐分析对比可以知道当底鼓出现时,在频谱上会出现一个明显的低频延展到100Hz以下,并保持一段时间,信号频率越低,传递距离越远,具有的能量越大,基于此,本实施例将音乐信号分成许多帧并在获取了每一帧信号的频谱后,提取每一帧信号在预设低频段中的低频信号,并根据帕斯瓦尔定理计算每一帧信号的低频信号的能量,然后比较前后2帧信号的能量变化,若本帧信号与前一帧信号的低频信号相比,能量增长大于预设值时,则确定本帧信号的位置出现底鼓节拍点。
具体的,本实施例中使用预设截止频率的低通滤波器对所述频谱进行滤波,得到每一帧信号在小于所述预设截止频率的低频信号,再根据每一帧信号的低频信号的频谱特性确定底鼓节拍点的出现位置。
S300:从所述频谱中提取每一帧信号在预设中高频段中的中高频信号;若本帧信号与前一帧信号的中高频信号相比,能量变化大于预置值,并且本帧信号的中高频信号的能量平坦度大于预设门限,确定本帧信号的位置出现军鼓节拍点。
同样的,图2中方框标记的是军鼓节拍点,通过多段已知的音乐分析得到军鼓在中频部分能量非常强,而且有很好的周期性,基于此,本实施例提取每一帧信号在预设中高频段中的中高频信号,并计算每一帧信号的中高频信号的能量及能量平坦度,若本帧信号与前一帧信号的中高频信号相比,能量变化大于预置值,并且本帧信号的中高频信号的能量平坦度大于预设门限,则确定本帧信号的位置出现军鼓节拍点。
具体的,本实施例中使用预设中高频段的带通滤波器对所述频谱进行滤波,得到每一帧信号在预设中高频段中的中高频信号,再根据每一帧信号的中高频信号的频谱特性确定军鼓节拍点的出现位置。
当检测得到底鼓节拍点和军鼓节拍点后,利用底鼓节拍点和军鼓节拍点在音乐中出现的位置,在该位置处添加一些音视频特效或光影效果,以此增强音乐/视频的表现力。例如,用户在录制视频时,选定了一首音乐作为背景音乐,客户端通过上述方法检测出背景音乐中底鼓节拍点和军鼓节拍点出现的时间,当播放背景音乐到达底鼓节拍点时,在视频录制节目上渲染“底鼓敲击”的图形特效,当播放背景音乐到达军鼓节拍点时,在视频录制节目上渲染“军鼓敲击”的图形特效,以此增强视频的表现形式,提高视频的观看效果。
本发明利用了军鼓和底鼓的频谱特征对音乐信号中的两种鼓点的节拍进行检测,在检测底鼓节拍点中比较了低频信号能量,在检测军鼓节拍点中比较了中高频信号能量和能量谱的平坦度,可以有效的从具有鼓点的音乐中,检测到军鼓和底鼓的节拍点,为后续的其它处理打下良好的基础。
进一步的,本发明的一种实施例,所述确定本帧信号的位置出现军鼓节拍点之后,还包括:
根据军鼓节拍点的周期性规律,对所述音乐信号的全部军鼓节拍点进行筛选,得到符合周期性规律的军鼓节拍点。
在由音乐信号的频率特性确定军鼓节拍点后,再根据音乐本身的特点对军鼓节拍点进行筛选,由于音乐是人类创造的用来表达情感的一种方式,音乐的节奏有一定的听觉和表达的基本规律,尤其是节奏感较强的含有架子鼓演奏的音乐中,军鼓节拍点的出现呈现一定的周期性规律,本实施例根据军鼓节拍点的周期性规律,例如军鼓节拍点出现的周期为T,则任意两个相邻的军鼓节拍点之间的距离为n*T,n为正整数,然后对所述音乐信号的全部军鼓节拍点进行筛选,得到符合周期性规律的军鼓节拍点,以此更准确地确定军鼓节拍点。
进一步的,上述实施例中,所述根据军鼓节拍点的周期性规律,对所述音乐信号的全部军鼓节拍点进行筛选,得到符合周期性规律的军鼓节拍点,包括:
根据所述音乐信号的全部军鼓节拍点,得到军鼓节拍点的周期性规律;
从音乐信号的全部军鼓节拍点中,剔除不符合周期性规律的军鼓节拍点,得到符合周期性规律的军鼓节拍点。
由于不同音乐中军鼓节拍点的周期不相同,不能将一种军鼓节拍点的特定周期应用在所有音乐上,本实施例根据检测出来的所述音乐信号的全部军鼓节拍点,得到时域上的军鼓节拍点,然后统计所有军鼓节拍点出现的时间及相邻每两个军鼓节拍点的时间间隔,得到军鼓节拍点的周期性规律,然后从音乐信号的全部军鼓节拍点中,剔除不符合周期性规律的军鼓节拍点,得到符合周期性规律的军鼓节拍点。
本发明另一种实施例中,所述根据所述音乐信号的全部军鼓节拍点,得到军鼓节拍点的周期性规律,包括:
在时域上统计根据所述音乐信号的底鼓节拍点和军鼓节拍点的分布特点,把所述分布特点与预定音乐类型分布特定进行匹配,得到所述待检测音乐的音乐类型;
获取所述音乐类型对应的军鼓节拍点的预定周期性规律;
获取所述音乐信号的军鼓节拍点的周期性规律;
利用所述音乐类型对应的军鼓节拍点的预定周期性规律对所述音乐信号的军鼓节拍点的周期性规律进行校正,得到校正后军鼓节拍点的周期性规律。
在根据频率特性得到待检测音乐中的底鼓节拍点和军鼓节拍点之后,反过来便可确定底鼓节拍点和军鼓节拍点在时域上的分布,然后在时域上统计根据所述音乐信号的底鼓节拍点和军鼓节拍点的分布特点,不同音乐类型的底鼓节拍点和军鼓节拍点的分布特点不同,将所述分布特点与预定音乐类型分布特定进行匹配,得到所述待检测音乐的音乐类型,然后获取所述音乐类型对应的军鼓节拍点的预定周期性规律,流行歌曲和摇滚歌曲对应的军鼓节拍点的周期性规律不尽相同,然后利用所述音乐类型对应的军鼓节拍点的预定周期性规律结合时域上的音乐信号的军鼓节拍点的特点对所述音乐信号的军鼓节拍点的周期性规律进行校正,得到校正后的军鼓节拍点的周期性规律,以更准确地筛选出符合周期性规律的军鼓节拍点。
本发明的一种实施例中,所述获取待检测音乐的音乐信号中每一帧信号的频谱,包括:
以预设采样频率对待检测音乐的音乐信号进行采样;
对所述采样后的音乐信号进行分帧,对分帧后的每一帧信号进行加窗并做傅里叶变换,获取每一帧信号的频谱。
音乐频率范围约为20Hz-20KHz,人耳能听到的最高频率大约是22KHz,由奈奎斯特采样定理,采样频率至少要是最高频率的2倍才能保证信号不失真,考虑到一定的余量本实施例采用大于40KHz的采样频率对音乐信号进行采样。进一步的,在对音乐信号采样之前,还对待检测音乐的音乐信号提取单声道。在对音乐信号采样后以从频域的角度分析音乐信号,而此时需要对采样后的音乐信号进行傅里叶变换,傅里叶变换要求输入信号是平稳的,在比较短的时间内,音乐信号便可看成是平稳的,从音乐信号中截取出来的一小段信号就叫一帧,帧长为20~50毫秒,对所述采样后的音乐信号进行分帧以对每一帧信号做傅里叶变换;取出来的一帧信号在做傅里叶变换之前,要先进行加窗的操作,即与一个窗函数相乘,让一帧信号的幅度在两端渐变到0,以此提高变换结果(即频谱)的分辨率,通过对所述采样后的音乐信号进行分帧,对分帧后的每一帧信号进行加窗并做傅里叶变换,获取每一帧信号的频谱,以便后续根据频谱分析出音乐中的底鼓节拍点和军鼓节拍点。
本发明的一种实施例,所述从所述频谱中提取每一帧信号在预设中高频段中的中高频信号之后,还包括:
计算每一帧信号在预设中高频段中的各频点能量的方差,得到能量平坦度。
本实施例中,计算每一帧信号在预设中高频段中的各频点能量的方差作为该帧信号的能量平坦度,能量平坦度越小,表示频谱越平坦;能量平坦度越大,表示频谱变化越剧烈,当本帧信号与前一帧信号的中高频信号相比,能量变化大于预置值,并且本帧信号的中高频信号的能量平坦度大于预设门限,确定本帧信号的位置出现军鼓节拍点。
在另一种实施例中,本发明提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述实施例所述的音乐中鼓点节拍的检测方法。其中,所述计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSSMemory,随即存储器)、EPROM(EraSable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储设备包括由设备(例如,计算机、手机)以能够读的形式存储或传输信息的任何介质,可以是只读存储器,磁盘或光盘等。
本发明实施例提供的一种计算机可读存储介质,可实现获取待检测音乐的音乐信号中每一帧信号的频谱;从所述频谱中提取每一帧信号在预设低频段中的低频信号;若本帧信号与前一帧信号的低频信号相比,能量增长大于预设值,确定本帧信号的位置出现底鼓节拍点;从所述频谱中提取每一帧信号在预设中高频段中的中高频信号;若本帧信号与前一帧信号的中高频信号相比,能量变化大于预置值,并且本帧信号的中高频信号的能量平坦度大于预设门限,确定本帧信号的位置出现军鼓节拍点。利用了军鼓和底鼓的频谱特征对音乐信号中的两种鼓点的节拍进行检测,在检测底鼓节拍点中比较了低频信号能量,在检测军鼓节拍点中比较了中高频信号能量和能量谱的平坦度,可以有效的从具有鼓点的音乐中,检测出军鼓和底鼓的节拍点,为后续的其它处理打下良好的基础。此外,本发明提供的计算机可读存储介质还可实现不仅从军鼓的频谱特征对音乐信号中的军鼓节拍点进行检测,还基于音乐的节奏、军鼓在音乐中的表现特性(即军鼓节拍的周期性)对音乐信号中的军鼓节拍点进行检测,以此更准确地确定音乐中出现的军鼓节拍点。另外,本发明提供的计算机可读存储介质不仅从音乐的频谱特征确定军鼓节拍点的周期规律,还通过在时域上统计根据所述音乐信号的底鼓节拍点和军鼓节拍点的分布特点匹配待检测音乐的音乐类型,再利用音乐类型的预定周期性规律对待检测音乐的军鼓节拍点的周期性规律进行校正,得到更为准确的军鼓节拍点的周期性规律,从而更准确地确定音乐中出现的军鼓节拍点。
本发明实施例提供的计算机可读存储介质可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。
此外,在又一种实施例中,本发明还提供一种终端,如图3所示,所述终端可以包括一个或者一个以上的处理器301,还包括存储器302、WiFi(wireless fidelity,无线保真)电路303、RF(Radio Frequency,射频)电路304、音频电路305、传感器306、输出设备307、输入设备304、电源309,处理器301是终端的控制中心,利用各种接口和线路连接以上各部分。本领域技术人员可以理解,图3中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
WiFi电路303可为用户提供无线局域网或互联网访问;其可包括天线、WiFi模块等。RF电路304可收发信息,或在通话过程中信号的接收和发送;其可包括天线、至少一个放大器、调谐器、一个或多个振荡器、耦合器、双工器等。音频电路305可将接收到的音频数据转换成电信号,传输到扬声器,也可将传声器收集的声音信号转换为音频数据,发给处理器301处理;其可设置扬声器、传声器、耳机接口等。传感器306可用于感应外界信号,并发给处理器301处理;其可包括运动传感器、光传感器等。输出设备307可用于显示各种信号;其可为采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-EmittingDiode,有机发光二极管)等形式来配置显示面板。输入设备304可用于输入数字和字符等信息;其可为物理按键、触控面板等。电源309可为终端各部分供电,通过电源管理系统与处理器309逻辑连接;其可包括一个或一个以上的直流或交流电源、充电系统、电源状态指示器等组件。存储器302可用于存储软件程序以及模块;其可为计算机可读存储介质,具体的为硬盘、闪存等。处理器是终端的控制中心,通过运行或执行存储在存储器302内的软件程序和/或模块,以及调用存储在存储器302的数据,执行终端各种功能、处理终端数据。
作为一个实施例,终端包括:一个或多个处理器301,存储器302,一个或多个应用程序,其中所述一个或多个应用程序被存储在存储器302中并被配置为由所述一个或多个处理器301执行,所述一个或多个程序配置用于执行以上实施例所述的音乐中鼓点节拍的检测方法。
本发明实施例提供的一种终端,可实现利用了军鼓和底鼓的频谱特征对音乐信号中的两种鼓点的节拍进行检测,在检测底鼓节拍点中比较了低频信号能量,在检测军鼓节拍点中比较了中高频信号能量和能量谱的平坦度,可以有效的从具有鼓点的音乐中,检测出军鼓和底鼓的节拍点,为后续的其它处理打下良好的基础。此外,本发明提供的终端不仅从军鼓的频谱特征对音乐信号中的军鼓节拍点进行检测,还基于音乐的节奏、军鼓在音乐中的表现特性(即军鼓节拍的周期性)对音乐信号中的军鼓节拍点进行检测,以此更准确地确定音乐中出现的军鼓节拍点。另外,本发明提供的终端不仅从音乐的频谱特征确定军鼓节拍点的周期规律,还通过在时域上统计根据所述音乐信号的底鼓节拍点和军鼓节拍点的分布特点匹配待检测音乐的音乐类型,再利用音乐类型的预定周期性规律对待检测音乐的军鼓节拍点的周期性规律进行校正,得到更为准确的军鼓节拍点的周期性规律,从而更准确地确定音乐中出现的军鼓节拍点。
本发明实施例提供的终端可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种音乐中鼓点节拍的检测方法,其特征在于,包括:
获取待检测音乐的音乐信号中每一帧信号的频谱;
从所述频谱中提取每一帧信号在预设低频段中的低频信号;若本帧信号与前一帧信号的低频信号相比,能量增长大于预设值,确定本帧信号的位置出现底鼓节拍点;
从所述频谱中提取每一帧信号在预设中高频段中的中高频信号;若本帧信号与前一帧信号的中高频信号相比,能量变化大于预置值,并且本帧信号的中高频信号的能量平坦度大于预设门限,确定本帧信号的位置出现军鼓节拍点。
2.根据权利要求1所述的方法,其特征在于,所述确定本帧信号的位置出现军鼓节拍点之后,还包括:
根据军鼓节拍点的周期性规律,对所述音乐信号的全部军鼓节拍点进行筛选,得到符合周期性规律的军鼓节拍点。
3.根据权利要求2所述的方法,其特征在于,所述根据军鼓节拍点的周期性规律,对所述音乐信号的全部军鼓节拍点进行筛选,得到符合周期性规律的军鼓节拍点,包括:
根据所述音乐信号的全部军鼓节拍点,得到军鼓节拍点的周期性规律;
从音乐信号的全部军鼓节拍点中,剔除不符合周期性规律的军鼓节拍点,得到符合周期性规律的军鼓节拍点。
4.根据权利要求3所述的方法,其特征在于,所述根据所述音乐信号的全部军鼓节拍点,得到军鼓节拍点的周期性规律,包括:
在时域上统计根据所述音乐信号的底鼓节拍点和军鼓节拍点的分布特点,把所述分布特点与预定音乐类型分布特定进行匹配,得到所述待检测音乐的音乐类型;
获取所述音乐类型对应的军鼓节拍点的预定周期性规律;
获取所述音乐信号的军鼓节拍点的周期性规律;
利用所述音乐类型对应的军鼓节拍点的预定周期性规律对所述音乐信号的军鼓节拍点的周期性规律进行校正,得到校正后的军鼓节拍点的周期性规律。
5.根据权利要求1所述的方法,其特征在于,所述从所述频谱中提取每一帧信号在预设低频段中的低频信号,包括:
使用预设截止频率的低通滤波器对所述频谱进行滤波,得到每一帧信号在小于所述预设截止频率的低频信号。
6.根据权利要求1所述的方法,其特征在于,所述从所述频谱中提取每一帧信号在预设中高频段中的中高频信号,包括:
使用预设中高频段的带通滤波器对所述频谱进行滤波,得到每一帧信号在预设中高频段中的中高频信号。
7.根据权利要求1所述的方法,其特征在于,所述获取待检测音乐的音乐信号中每一帧信号的频谱,包括:
以预设采样频率对待检测音乐的音乐信号进行采样;
对所述采样后的音乐信号进行分帧,对分帧后的每一帧信号进行加窗并做傅里叶变换,获取每一帧信号的频谱。
8.根据权利要求1所述的方法,其特征在于,所述从所述频谱中提取每一帧信号在预设中高频段中的中高频信号之后,还包括:
计算每一帧信号在预设中高频段中的各频点能量的方差,得到能量平坦度。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现权利要求1至8任一项所述的音乐中鼓点节拍的检测方法。
10.一种终端,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据权利要求1~8任一项所述的音乐中鼓点节拍的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711464060.9A CN108281157B (zh) | 2017-12-28 | 2017-12-28 | 音乐中鼓点节拍的检测方法及计算机存储介质、终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711464060.9A CN108281157B (zh) | 2017-12-28 | 2017-12-28 | 音乐中鼓点节拍的检测方法及计算机存储介质、终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108281157A true CN108281157A (zh) | 2018-07-13 |
CN108281157B CN108281157B (zh) | 2021-11-12 |
Family
ID=62802527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711464060.9A Active CN108281157B (zh) | 2017-12-28 | 2017-12-28 | 音乐中鼓点节拍的检测方法及计算机存储介质、终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108281157B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110853677A (zh) * | 2019-11-20 | 2020-02-28 | 北京雷石天地电子技术有限公司 | 歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质 |
CN111081271A (zh) * | 2019-11-29 | 2020-04-28 | 福建星网视易信息系统有限公司 | 基于频域和时域的音乐节奏检测方法及存储介质 |
CN111128232A (zh) * | 2019-12-26 | 2020-05-08 | 广州酷狗计算机科技有限公司 | 音乐的小节信息确定方法、装置、存储介质及设备 |
CN111444384A (zh) * | 2020-03-31 | 2020-07-24 | 北京字节跳动网络技术有限公司 | 一种音频关键点确定方法、装置、设备及存储介质 |
CN112289344A (zh) * | 2020-10-30 | 2021-01-29 | 腾讯音乐娱乐科技(深圳)有限公司 | 鼓点波形确定方法、装置及计算机存储介质 |
CN112489676A (zh) * | 2020-12-15 | 2021-03-12 | 腾讯音乐娱乐科技(深圳)有限公司 | 模型训练方法、装置、设备及存储介质 |
CN112530454A (zh) * | 2020-11-30 | 2021-03-19 | 厦门亿联网络技术股份有限公司 | 一种窄带语音信号检测方法、装置、系统和可读存储介质 |
CN113520356A (zh) * | 2021-07-07 | 2021-10-22 | 浙江大学 | 基于柯氏音的心脏疾病早期诊断系统 |
CN113573442A (zh) * | 2021-07-16 | 2021-10-29 | 广东和音元视电子科技有限公司 | 音频控制场景的方法、设备和计算机可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1258879A2 (en) * | 2001-05-18 | 2002-11-20 | Pioneer Corporation | Beat density detecting apparatus and information playback apparatus |
JP2005274708A (ja) * | 2004-03-23 | 2005-10-06 | Sony Corp | 信号処理装置および信号処理方法、プログラム、並びに記録媒体 |
US20070169613A1 (en) * | 2006-01-26 | 2007-07-26 | Samsung Electronics Co., Ltd. | Similar music search method and apparatus using music content summary |
CN101216344A (zh) * | 2008-01-04 | 2008-07-09 | 凌通科技股份有限公司 | 一种音乐节拍检测装置及其方法 |
CN103578478A (zh) * | 2013-11-11 | 2014-02-12 | 安徽科大讯飞信息科技股份有限公司 | 实时获取音乐节拍信息的方法及系统 |
CN104299621A (zh) * | 2014-10-08 | 2015-01-21 | 百度在线网络技术(北京)有限公司 | 一种音频文件的节奏感强度获取方法及装置 |
CN104599663A (zh) * | 2014-12-31 | 2015-05-06 | 华为技术有限公司 | 歌曲伴奏音频数据处理方法和装置 |
US20150234833A1 (en) * | 2009-05-06 | 2015-08-20 | Gracenote, Inc. | Systems, methods, and apparatus for generating an audio-visual presentation using characteristics of audio, visual and symbolic media objects |
CN106875930A (zh) * | 2017-02-09 | 2017-06-20 | 深圳市韵阳科技有限公司 | 基于歌曲伴音和话筒人声实时检测的灯光控制方法及系统 |
CN107103917A (zh) * | 2017-03-17 | 2017-08-29 | 福建星网视易信息系统有限公司 | 音乐节奏检测方法及其系统 |
-
2017
- 2017-12-28 CN CN201711464060.9A patent/CN108281157B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1258879A2 (en) * | 2001-05-18 | 2002-11-20 | Pioneer Corporation | Beat density detecting apparatus and information playback apparatus |
JP2005274708A (ja) * | 2004-03-23 | 2005-10-06 | Sony Corp | 信号処理装置および信号処理方法、プログラム、並びに記録媒体 |
US20070169613A1 (en) * | 2006-01-26 | 2007-07-26 | Samsung Electronics Co., Ltd. | Similar music search method and apparatus using music content summary |
CN101216344A (zh) * | 2008-01-04 | 2008-07-09 | 凌通科技股份有限公司 | 一种音乐节拍检测装置及其方法 |
US20150234833A1 (en) * | 2009-05-06 | 2015-08-20 | Gracenote, Inc. | Systems, methods, and apparatus for generating an audio-visual presentation using characteristics of audio, visual and symbolic media objects |
CN103578478A (zh) * | 2013-11-11 | 2014-02-12 | 安徽科大讯飞信息科技股份有限公司 | 实时获取音乐节拍信息的方法及系统 |
CN104299621A (zh) * | 2014-10-08 | 2015-01-21 | 百度在线网络技术(北京)有限公司 | 一种音频文件的节奏感强度获取方法及装置 |
CN104599663A (zh) * | 2014-12-31 | 2015-05-06 | 华为技术有限公司 | 歌曲伴奏音频数据处理方法和装置 |
CN106875930A (zh) * | 2017-02-09 | 2017-06-20 | 深圳市韵阳科技有限公司 | 基于歌曲伴音和话筒人声实时检测的灯光控制方法及系统 |
CN107103917A (zh) * | 2017-03-17 | 2017-08-29 | 福建星网视易信息系统有限公司 | 音乐节奏检测方法及其系统 |
Non-Patent Citations (3)
Title |
---|
SOLLI, DR: "Fluctuations and correlations in modulation instability", 《NATURE PHOTONICS》 * |
王敬志: "基于桨力测量分析的皮艇专项竞技能力评价指标体系构建", 《体育科学》 * |
肖武雄: "《频谱音乐的基本原理》", 30 November 2014, 北京:文化艺术出版社 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110853677B (zh) * | 2019-11-20 | 2022-04-26 | 北京雷石天地电子技术有限公司 | 歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质 |
CN110853677A (zh) * | 2019-11-20 | 2020-02-28 | 北京雷石天地电子技术有限公司 | 歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质 |
CN111081271A (zh) * | 2019-11-29 | 2020-04-28 | 福建星网视易信息系统有限公司 | 基于频域和时域的音乐节奏检测方法及存储介质 |
CN111081271B (zh) * | 2019-11-29 | 2022-09-06 | 福建星网视易信息系统有限公司 | 基于频域和时域的音乐节奏检测方法及存储介质 |
CN111128232A (zh) * | 2019-12-26 | 2020-05-08 | 广州酷狗计算机科技有限公司 | 音乐的小节信息确定方法、装置、存储介质及设备 |
CN111128232B (zh) * | 2019-12-26 | 2022-11-15 | 广州酷狗计算机科技有限公司 | 音乐的小节信息确定方法、装置、存储介质及设备 |
CN111444384A (zh) * | 2020-03-31 | 2020-07-24 | 北京字节跳动网络技术有限公司 | 一种音频关键点确定方法、装置、设备及存储介质 |
CN111444384B (zh) * | 2020-03-31 | 2023-10-13 | 北京字节跳动网络技术有限公司 | 一种音频关键点确定方法、装置、设备及存储介质 |
CN112289344A (zh) * | 2020-10-30 | 2021-01-29 | 腾讯音乐娱乐科技(深圳)有限公司 | 鼓点波形确定方法、装置及计算机存储介质 |
CN112530454A (zh) * | 2020-11-30 | 2021-03-19 | 厦门亿联网络技术股份有限公司 | 一种窄带语音信号检测方法、装置、系统和可读存储介质 |
CN112489676A (zh) * | 2020-12-15 | 2021-03-12 | 腾讯音乐娱乐科技(深圳)有限公司 | 模型训练方法、装置、设备及存储介质 |
CN112489676B (zh) * | 2020-12-15 | 2024-06-14 | 腾讯音乐娱乐科技(深圳)有限公司 | 模型训练方法、装置、设备及存储介质 |
CN113520356A (zh) * | 2021-07-07 | 2021-10-22 | 浙江大学 | 基于柯氏音的心脏疾病早期诊断系统 |
CN113520356B (zh) * | 2021-07-07 | 2024-04-30 | 浙江大学 | 基于柯氏音的心脏疾病早期诊断系统 |
CN113573442A (zh) * | 2021-07-16 | 2021-10-29 | 广东和音元视电子科技有限公司 | 音频控制场景的方法、设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108281157B (zh) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108281157A (zh) | 音乐中鼓点节拍的检测方法及计算机存储介质、终端 | |
CN111326132B (zh) | 音频处理方法、装置、存储介质及电子设备 | |
CN103440862B (zh) | 一种语音与音乐合成的方法、装置以及设备 | |
US9697814B2 (en) | Method and device for changing interpretation style of music, and equipment | |
TWI433027B (zh) | 適應性使用者介面 | |
CN109256146B (zh) | 音频检测方法、装置及存储介质 | |
CN109448761B (zh) | 播放歌曲的方法和装置 | |
CN108109634B (zh) | 歌曲音高的生成方法、装置及设备 | |
US20210027800A1 (en) | Method for processing audio, electronic device and storage medium | |
CN108335688A (zh) | 音乐中主节拍点检测方法及计算机存储介质、终端 | |
CN108111909A (zh) | 视频图像处理方法及计算机存储介质、终端 | |
US10235898B1 (en) | Computer implemented method for providing feedback of harmonic content relating to music track | |
CN111128232B (zh) | 音乐的小节信息确定方法、装置、存储介质及设备 | |
CN109616090B (zh) | 多音轨序列生成方法、装置、设备及存储介质 | |
CN109243479B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
CN108053832B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
CN109756628A (zh) | 一种功能按键音效的播放方法、装置及电子设备 | |
CN113470613A (zh) | 合唱混音方法、装置、电子设备和存储介质 | |
WO2023061330A1 (zh) | 音频合成方法、装置、设备及计算机可读存储介质 | |
CN112435643A (zh) | 生成电音风格歌曲音频的方法、装置、设备及存储介质 | |
CN111933098A (zh) | 伴奏音乐的生成方法、装置及计算机可读存储介质 | |
CN104768106B (zh) | 一种终端音效的转换方法及装置 | |
CN103167161A (zh) | 一种基于麦克风输入实现手机吹奏乐器的系统及方法 | |
CN207966489U (zh) | 一种歌曲点播系统 | |
KR20120096880A (ko) | 사용자가 자신의 음성에 기초하여 디지털 악기를 연주할 수 있도록 하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220523 Address after: 31a, 15th floor, building 30, maple commercial city, bangrang Road, Brazil Patentee after: Baiguoyuan Technology (Singapore) Co.,Ltd. Address before: Building B-1, North District, Wanda Commercial Plaza, Wanbo business district, No. 79, Wanbo 2nd Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province Patentee before: GUANGZHOU BAIGUOYUAN INFORMATION TECHNOLOGY Co.,Ltd. |