CN101375327A - 节拍提取设备和节拍提取方法 - Google Patents
节拍提取设备和节拍提取方法 Download PDFInfo
- Publication number
- CN101375327A CN101375327A CNA2007800035136A CN200780003513A CN101375327A CN 101375327 A CN101375327 A CN 101375327A CN A2007800035136 A CNA2007800035136 A CN A2007800035136A CN 200780003513 A CN200780003513 A CN 200780003513A CN 101375327 A CN101375327 A CN 101375327A
- Authority
- CN
- China
- Prior art keywords
- beat
- registration process
- positional information
- extracts
- music
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 48
- 239000000284 extract Substances 0.000 claims abstract description 99
- 230000033764 rhythmic process Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 89
- 230000008569 process Effects 0.000 claims description 54
- 238000001228 spectrum Methods 0.000 claims description 28
- 230000008859 change Effects 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 abstract description 34
- 230000005236 sound signal Effects 0.000 abstract description 6
- 239000000203 mixture Substances 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000001360 synchronised effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005755 formation reaction Methods 0.000 description 3
- 238000012856 packing Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000005039 memory span Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10G—REPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
- G10G3/00—Recording music in notation form, e.g. recording the mechanical operation of a musical instrument
- G10G3/04—Recording music in notation form, e.g. recording the mechanical operation of a musical instrument using electrical means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/40—Rhythm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/076—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/011—Files or data streams containing coded musical information, e.g. for transmission
- G10H2240/046—File format, i.e. specific or non-standard musical file format used in or adapted for electrophonic musical instruments, e.g. in wavetables
- G10H2240/071—Wave, i.e. Waveform Audio File Format, coding, e.g. uncompressed PCM audio according to the RIFF bitstream format method
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/325—Synchronizing two or more audio tracks or files according to musical features or musical timings
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/215—Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
- G10H2250/235—Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
当收到记录在.wav文件中的数字音频信号时,节拍提取处理单元12从数字音频信号中提取节拍位置信息,并以记录在.mty文件中的元数据的形式输出该结果。另外,节拍对准处理单元13对准记录在.mty文件中的元数据的节拍信息,并以记录在.may文件中的元数据的形式输出结果。在再现乐曲的音乐信号的时候,高度准确地提取音乐的节奏的节拍。
Description
技术领域
本发明涉及一种提取音乐节奏的节拍的节拍提取设备和节拍提取方法。
背景技术
乐曲是基于时间尺度,比如小节和节拍构成的。因此,音乐家利用小节和节拍作为时间的基本尺度演奏乐曲。当采用乐曲的演奏的定时时,音乐家使用在某一小节的某一节拍产生特定声音的方法演奏该乐曲,而决不使用在开始演奏之后的某分某秒产生特定声音的时间戳记采用方法来演奏该乐曲。由于音乐是由小节和节拍定义的,因此音乐家能够灵活地处理音乐速度和节奏方面的波动。另外,每位音乐家能够在同样的乐谱的演奏中,用音乐速度和节奏表达他们的独创性。
音乐家进行的演奏最终以音乐内容的形式被传递给用户。更具体地说,每位音乐家的演奏以双声道立体声的形式被混音,并被形成为完整的包装。该完整的包装以采用PCM(脉码调制)格式的音乐CD(光盘)的形式被交付给用户。这种音乐CD的声源被称为所谓的采样声源。
在这种CD或类似物的包装阶段,和音乐家明白的定时,比如小节和节拍有关的信息遗失。
不过,仅仅通过收听通过对这种PCM格式的音频波形进行D/A(数模)转换而获得的模拟声音,人类就能够自然地重新识别和定时有关的信息。即,人类能够自然地重新获得音乐节奏的感觉。另一方面,机器不具有这样的能力,只具有并不直接与音乐本身直接相关的时间戳记的时间信息。
作为与由音乐家的演奏或者由歌唱家的嗓音提供的这种乐曲比较的一种对象是常规的卡拉OK系统。这种系统在卡拉OK显示屏幕上显示与音乐的节奏同步的歌词。
不过,这种卡拉OK系统并不识别音乐的节奏,而只是再现称为MIDI(乐器数字接口)的专用数据。
同步控制所必需的演奏信息和歌词信息以及描述发声的定时(事件时间)的时间码信息(时间戳记)以MIDI格式描述成MIDI数据。MIDI数据事先由内容创作者生成。卡拉OK重放设备只是按照MIDI数据的指令,在预定定时完成发声。即,该设备立刻生成(播放)乐曲。这只能在MIDI数据及其专用设备的有限环境中享受。
此外,尽管除了MIDI之外还存在各种格式,比如SMIL(同步多媒体集成语言),不过基本原理相同。
同时,市场中发行的音乐内容的主流是主要包括称为上述采样声源的原始音频波形的格式,比如由CD代表的PCM数据或作为其压缩音频的MP3(MPEG(运动图像专家组)音频层3),而不是MIDI和SMIL。
音乐重放设备通过对PCM等的这些采样音频波形进行D/A转换并输出它们,向用户提供音乐内容。另外,如在FM音频广播等中所看到的那样,存在其中音乐波形本身的模拟信号被广播的例子。此外,存在个人立刻演奏音乐,比如在音乐会和现场演奏中,并且音乐内容被提供给用户的例子。
如果机器能够自动从音乐的原始音乐波形中识别定时,比如音乐的小节和节拍,那么即使不存在准备好的信息,比如MIDI和SMIL的事件时间信息,也能够实现如同在卡拉OK和舞蹈中那样,使音乐和另一媒体能够节奏同步的同步功能。此外,就诸如CD之类的大量现有内容而论,扩大了新的娱乐活动的可能性。
迄今为止,做出了自动提取音乐速度或节拍的各种尝试。
例如,在日本未经审查的专利申请公开No.2002-116754中,公开一种计算充当时序信号的音乐波形信号的自相关性,根据计算结果分析音乐的节拍结构,并根据该分析结果进一步提取音乐的速度的方法。
另外,在日本专利No.3066528中,描述一种根据乐曲数据创建多个频带中的每个频带的声压数据,从所述多个频带中指定节奏感受最显著的一个频带,并根据指定的频率定时的声压数据的变化周期,估计节奏分量。
计算节奏、节拍和音乐速度的技术被大致分成如日本未经审查的专利申请公开No.2002-116754那样在时域中分析音乐信号的技术,和如日本专利No.3066528那样在频域中分析音乐信号的技术。
但是,在日本未经审查的专利申请公开No.2002-116754的在时域中分析音乐信号的方法中,由于节拍和时序波形不一定相符,因此基本不能获得高的提取准确性。另外,日本专利No.3066528的在频域中分析音乐信号的方法能够与日本未经审查的专利申请公开No.2002-116754相比较相对提高提取准确性。但是,频率分析产生的数据包含除特定音符的节拍之外的许多节拍,极其难以把特定音符的节拍从所有节拍中分离出来。另外,由于音乐速度(时间周期)本身波动极大,因此在跟踪这些波动的同时,只提取特定音符的节拍极其困难。
因此,利用常规技术不可能提取在整个乐曲内随时间波动的特定音符的节拍。
发明内容
鉴于这样的常规情况,提出了本发明。本发明的目的是提供一种关于其音乐速度(tempo)波动的乐曲,能够在整首乐曲内只高度准确提取特定音符的节拍的节拍提取设备和节拍提取方法。
为了实现上述目的,按照本发明的节拍提取设备的特征在于包括节拍提取处理装置,用于提取乐曲的节奏的节拍位置信息,和节拍对准处理装置,用于利用节拍提取处理装置提取和获取的节拍位置信息产生节拍周期信息,并根据节拍周期信息对准由节拍提取处理装置提取的节拍位置信息的节拍。
另外,为了实现上述目的,按照本发明的节拍提取方法的特征在于包括节拍提取处理步骤,用于提取乐曲的节奏的节拍位置信息,和节拍对准处理步骤,用于利用在节拍提取处理步骤提取和获取的节拍位置信息产生节拍周期信息,并根据节拍周期信息对准由节拍提取处理装置提取的节拍位置信息的节拍。
附图说明
图1是表示包括按照本发明的节拍提取设备的一个实施例的音乐重放设备的内部配置的功能方框图。
图2是表示节拍提取部分的内部配置的功能方框图。
图3(A)是表示数字音频信号的时序波形的例子的示图,而图3(B)是表示数字音频信号的频谱图的示图。
图4是表示节拍提取处理单元的内部配置的功能方框图。
图5(A)是表示数字音频信号的时序波形的例子的示图,图5(B)是表示数字音频信号的频谱图的示图,图5(C)是表示数字音频信号的提取的节拍信息的示图。
图6(A)是表示由节拍提取处理单元提取的节拍位置信息的节拍间隔的示图,而图6(B)是表示由节拍对准处理单元进行对准处理后的节拍位置信息的节拍间隔的示图。
图7是表示其中确定特定节拍是否合拍的窗口宽度的示图。
图8是表示节拍位置信息的节拍间隔的示图。
图9是表示根据节拍提取部分提取的节拍位置信息计算的节拍的总数的示图。
图10是表示节拍的总数和瞬时节拍周期的示图。
图11是表示现场录制的乐曲中的瞬时BPM对节拍数的关系图的示图。
图12是表示所谓的计算机同步的录制乐曲中的瞬时BPM对节拍数的关系图的示图。
图13是表示按照可靠性指数值,校正节拍位置信息的程序的例子的流程图。
图14是表示自动优化节拍提取条件的程序的例子的流程图。
具体实施方式
下面参考附图,说明应用本发明的具体实施例。
图1是表示包括按照本发明的节拍提取设备的实施例的音乐重放设备10的内部配置的方框图。例如,音乐重放设备10由个人计算机构成。
在音乐重放设备10中,CPU(中央处理器)101,ROM(只读存储器)102和RAM(随机存取存储器)103与系统总线100连接。ROM 102保存各种程序。CPU 101在充当工作区的RAM 103中执行基于这些程序的处理。
音频数据解码部分104,介质驱动器105,通信网络接口(附图中,所述接口被表示成I/F。下面同样如此)107,操作输入部分接口109,显示接口111,I/O端口113,I/O端口114,输入部分接口115,HDD(硬盘驱动器)121也与系统总线100连接。由每个功能块处理的一系列数据通过系统总线100被供给另一功能块。
介质驱动器105把记录在介质106,比如CD(光盘)或DVD(数字通用光盘)上的音乐内容的音乐数据输入到系统总线100。
诸如键盘和鼠标之类的操作输入部分110与操作输入部分接口109连接。
假定显示器112显示与提取的节拍同步的图像,和与提取的节拍同步起舞的人像或机器人。
音频再现部分117和节拍提取部分11与I/O端口113连接。另外,节拍提取部分11与I/O端口114连接。
包括A/D(模数)转换器116A,麦克风端子116B和麦克风116C的输入部分116与输入部分接口115连接。麦克风116C拾取的音频信号和音乐信号由A/D转换器116A转换成数字音频信号。数字音频信号随后被供给输入部分接口115。输入部分接口115把该数字音频信号输入到系统总线100。输入系统总线100的数字音频信号(对应于时序波形信号)以.wav文件等格式被记录在HDD 121中。通过输入部分接口115输入的数字音频信号并不直接被供给音频再现部分117。
当通过系统总线100从HDD 121或介质驱动器105收到音乐数据时,音频数据解码部分104解码该音频数据,以恢复数字音频信号。音频数据解码部分104通过系统总线100把恢复的数字音频信号传给I/O端口113。I/O端口113把通过系统总线100传送的数字音频信号供给节拍提取部分11和音频再现部分117。
诸如现在CD之类的介质106通过介质驱动器105被引入到系统总线100。收听者通过下载或类似手段获得的,并将被保存在HDD 121中的非压缩音频内容被直接输入到系统总线100。另一方面,压缩的音频内容通过音频数据解码部分104返回给系统总线100。从输入部分116通过输入部分接口115输入系统总线100的数字音频信号(数字音频信号不局限于音乐信号,例如包括话音信号和其它声频带信号)在被保存在HDD 121中之后,也被再次被返回给系统总线100。
在应用本发明的一个实施例中的音乐重放设备10中,输入系统总线100的数字音频信号(对应于时序波形信号)被传送给I/O端口113,随后被供给节拍提取部分11。
作为按照本发明的节拍处理设备的一个实施例的节拍提取部分11包括节拍提取处理单元12,用于提取乐曲的节奏的节拍位置信息,和节拍对准处理单元13,用于利用节拍提取处理单元12提取和获得的节拍位置信息,产生节拍周期信息,并根据节拍周期信息,对准节拍提取处理单元12提取的节拍位置信息的节拍。
如图2中所示,当收到以.wav文件的形式记录的数字音频信号时,节拍提取处理单元12从该数字音频信号提取粗略的节拍位置信息,并以用.mty文件记录的元数据的形式输出该结果。另外,节拍对准处理单元13利用用.mty文件记录的整个元数据,或者与预期具有同样音乐速度的乐曲部分对应的元数据,对准由节拍提取处理单元12提取的节拍位置信息,并以用.may文件记录的元数据的形式输出该结果。这便于逐步地获得高度准确的提取节拍位置信息。同时,节拍提取部分11将在后面详细说明。
音频再现部分117包括D/A转换器117A,输出放大器117B和扬声器117C。I/O端口113把通过系统总线100传送的数字音频信号供给包括在音频再现部分117中的D/A转换器117A。D/A转换器117A把从I/O端口113供给的数字音频信号转换成模拟音频信号,并通过输出放大器117B把模拟音频信号供给扬声器117C。扬声器117C再现通过输出放大器117B从D/A转换器117A供给的模拟音频信号。
由例如LCD(液晶显示器)等构成的显示器112与显示接口111连接。显示器112显示从音乐内容的音乐数据提取的节拍分量和音乐速度值。显示器112还显示与音乐同步的动画图像或歌词。
通信网络接口107与因特网108连接。音乐重放设备10通过因特网108访问保存音乐内容的属性信息的服务器,并利用音乐内容的标识信息作为检索关键字发送获取属性信息的获取请求。音乐重放设备把响应该获取请求从服务器发送的属性信息保存在例如包括在HDD 121中的硬盘中。
音乐重放设备10采用的音乐内容的属性信息包括构成乐曲的信息。构成乐曲的信息包括充当决定所谓的旋律的标准的信息,比如关于乐曲的小段(section)的信息,关于乐曲的和弦,和弦单位中的音乐速度,调子,音量和节拍的信息,关于乐谱的信息,关于和弦进行的信息,和关于歌词的信息。
这里,和弦单位是附属于乐曲的和弦的单位,比如乐曲的节拍或小节。另外,关于乐曲的小段的信息包括从乐曲的开始位置起的相对位置信息或者时间戳记。
包括在应用本发明的一个实施例中的音乐重放设备10中的节拍提取部分11根据数字音频信号的特征,提取音乐的节奏的节拍位置信息,这将在下面说明。
图3(A)表示数字音频信号的时序波形的一个例子。已知图3(A)中所示的时序波形零星地包括指示较大瞬时峰值的部分。指示较大峰值的所述部分对应于例如鼓的一部分节拍。
同时,实际收听具有图3(A)中所示的时序波形的数字音频信号的音乐显示基本间隔均匀地包括更多的节拍分量,不过这样的节拍分量被隐藏在具有图3(A)中所示的时序波形的数字音频信号的时序波形中。因此,仅仅根据图3(A)中所示的时序波形的较大峰值,不能提取音乐的节奏的实际节拍分量。
图3(B)表示具有图3(A)中所示的时序波形的数字音频信号的频谱。在图3(B)中所示的数字音频信号的频谱中,已知隐藏在图3(A)中所示的时序波形中的节拍分量可被看作功率谱瞬时显著变化的部分。实际收听该声音显示该频谱中功率谱瞬时显著变化的部分对应于节拍分量。节拍提取部分11把该频谱的功率谱瞬时显著变化的部分看作节奏的节拍分量。
通过提取这些节拍分量和测量节拍周期,能够知道音乐的节奏周期和BPM(每分钟的节拍)。
如图4中所示,节拍提取处理单元12包括功率谱计算器12A,变化率计算器12B,包络跟随器12C,比较器12D和二值化器12E。
功率谱计算器12A接收由图5(A)中所示的乐曲的时序波形构成的数字音频信号。
更具体地说,从音频数据解码部分104供给的数字音频信号被供给包括在节拍提取处理单元12中的功率谱计算器12A。
由于不能从时序波形高度准确地提取节拍分量,因此功率谱计算器12A利用例如对该时序波形的FFT(快速傅里叶变换)计算图5(B)中所示的频谱。
当输入节拍提取处理单元12的数字音频信号的采样频率为48kHz时,该FFT运算中的分辨率最好被设置成与为512样本或1024样本的样本数实时的5-30毫秒。在该FFT运算中设置的各种值并不局限于这些。另外,通常最好在应用窗函数(切趾函数),比如汉宁(hanning)函数或汉明(hamming)函数,并重叠窗口(“范围”)的时候,执行FFT运算。
功率谱计算器12A把计算的功率谱供给变化率计算器12B。
变化率计算器12B计算从功率谱计算器12A供给的功率谱中的变化率。更具体地说,变化率计算器12B对从功率谱计算器12A供给的功率谱进行微分运算,从而计算功率谱中的变化率。通过反复对瞬时变化的功率谱进行微分运算,变化率计算器12B输出指示图5(C)中所示的提取节拍波形的检测信号。这里,沿图5(C)中所示的提取节拍波形的正方向出现的峰值被看作节拍分量。
当从变化率计算器12B收到检测信号时,包络跟随器12C对该检测信号应用具有恰当时间常数的滞后特性,从而从该检测信号中除去震颤。包络跟随器把消除震颤的检测信号供给比较器12D。
比较器12D设置适当的阈值,从自包络跟随器12C供给的检测信号中除去低电平噪声,并把消除低电平噪声的检测信号供给二值化器12E。
二值化器12E执行二值化操作,以便只从自比较器12D供给的检测信号中提取电平等于或高于阈值的检测信号。二值化器以记录在.mty文件中的元数据的形式输出指示由P1,P2,P3构成的节拍分量的时间位置的节拍位置信息。
按照这种方式,节拍提取处理单元12从数字音频信号的时序波形中提取节拍位置信息,并以记录在.mty文件中的元数据的形式输出该节拍位置信息。同时,包括在该节拍提取处理单元12中的每个元件具有内部参数,并且通过改变每个内部参数修改每个元件的操作的效果。内容参数被自动优化,如后所述。不过,内部参数可由用户对操作输入部分110的手动操作手动设置。
由节拍提取处理单元12提取并作为元数据记录在.mty文件中的乐曲的节拍位置信息的节拍间隔通常是不均匀的,如图6(A)中所示。
节拍对准处理单元13对节拍提取处理单元12提取的节拍位置信息中乐曲的或者预期具有相同音乐速度的多个乐曲部分的节拍位置信息进行对准处理。
节拍对准处理单元13从节拍提取处理单元12提取并记录在.mty文件中的节拍位置信息的元数据中提取相隔均匀时间间隔定时的间隔均匀的节拍,比如由图6(A)的A1-A11所示的那些节拍,而不提取间隔不均匀的节拍,比如由B1-B4所示的那些节拍。在该实施例中,间隔均匀的节拍相隔1/4音符的间隔被定时。
节拍对准处理单元13根据节拍提取处理单元12提取并记录在.mty文件中的节拍位置信息的元数据计算高度准确的平均周期T,并提取时间间隔与平均周期T相等的节拍作为间隔均匀的节拍。
这里,提取的间隔均匀的节拍独自导致图6(A)中所示的空白周期。因此,如图6(B)中所示,节拍对准处理单元13重新在理应存在间隔均匀的节拍的位置添加插值(interpolation)节拍,比如C1-C3所示的那些插值节拍。这使得可以获得相隔均匀间隔定时的所有节拍的节拍位置信息。
节拍对准处理单元13把与间隔均匀的节拍基本同相的节拍定义成合拍(in beat),并提取它们。这里,所述合拍是与音乐节拍同步的节拍,还包括间隔均匀的节拍。另一方面,节拍对准处理单元13把与间隔均匀的节拍异相的节拍定义成失拍(out beat),并排除它们。失拍是不与实际的音乐节拍(1/4音符节拍)同步的节拍。因此,节拍对准处理单元13需要区分合拍和失拍。
更具体地说,作为确定某一节拍是合拍还是失拍的方法,节拍对准处理单元13定义如图7中所示的以间隔均匀的节拍为中心的预定窗口宽度W。节拍对准处理单元13确定包括在该窗口宽度W中的节拍是合拍,不包括在该窗口宽度W中的节拍是失拍。
另外,当窗口宽度W中不包括间隔均匀的节拍时,节拍对准处理单元13增加插值节拍,所述插值节拍是插入间隔均匀节拍的节拍。
更具体地说,如图8中所示,节拍对准处理单元13提取间隔均匀的节拍,比如由A11-A20所示的那些节拍,和合拍D11(它是与间隔均匀的节拍A11基本同相的节拍)作为合拍。节拍对准处理单元还提取插值节拍,比如由C11-C13所示的那些节拍。另外,节拍对准处理单元13不提取诸如由B11-B13所示的那些失拍作为1/4音符节拍。
由于音乐节拍实际上瞬时波动,因此从波动较大的音乐中提取的合拍的数目减小。从而,产生导致称为节拍滑移(beat slip)的提取错误的问题。
因此,对于波动较大的音乐,通过把窗口宽度W的值重新设置得更大,提取的合拍的数目增大,提取错误能够被降低。窗口宽度W通常是常数。不过,对于波动极大的乐曲,窗口宽度可作为参数被调节,比如增大该值。
节拍对准处理单元13分配包括在窗口宽度W中的合拍或者不包括在窗口宽度W中的失拍的节拍属性作为元数据。另外,如果在窗口宽度W内不存在任何提取的节拍,那么节拍对准处理单元13自动增加插值节拍,并分配该插值节拍的节拍属性作为元数据。通过该操作,包括节拍信息,比如上述节拍位置信息和上述节拍属性的节拍信息构成的元数据被记录在元数据文件(.may)中。同时,包括在该节拍对准处理单元13中的每个元件具有内部参数,比如基本窗口宽度W,通过改变每个内部参数修改操作的效果。
如上所述,通过在节拍提取处理单元12和节拍对准处理单元13中执行两步数据处理,节拍提取部分11能够从数字音频信号中自动提取高度准确的节拍信息。节拍提取部分不仅执行节拍是合拍还是失拍的确定,而且还执行增加适当节拍的插值处理,从而能够获得整首乐曲内1/4音符间隔的节拍信息。
下面说明计算与由音乐重放设备10中的按照本发明的节拍提取部分11提取的节拍位置信息一起获得的各种音乐特征的数量的方法。
如图9中所示,音乐重放设备10能够利用下面所示的等式(1),根据节拍提取部分11提取的第一节拍X1和最后节拍Xn的节拍位置信息,计算节拍的总数。
节拍的总数=合拍的总数+插值节拍的总数 (1)
另外,音乐重放设备10能够利用下面所示的等式(2)和等式(3),根据节拍提取部分11提取的节拍位置信息,计算音乐速度(平均BPM)。
平均节拍周期[样本]=(最后节拍位置-第一节拍位置)/(节拍的总数-1) (2)
平均BPM[bpm]=采样频率/平均节拍周期×60 (3)
这样,音乐重放设备10能够利用简单的四种基本算术运算,获得节拍的总数和平均BPM。这允许音乐重放设备10利用计算的结果,高速、低负载地计算乐曲的音乐速度。同时,确定乐曲的音乐速度的方法并不局限于这一种。
由于在该计算方法中,计算准确性取决于音频采样频率,因此通常能够获得8个有效数字的高度准确的值。另外,即使在节拍对准处理单元13的节拍提取处理中发生提取错误,获得的BPM也是高度准确的值,因为在该计算方法中,其错误率介于几百分之一和几千分之一之间。
另外,根据节拍提取部分11提取的节拍位置信息,音乐重放设备10能够计算指示乐曲的音乐速度的瞬时波动的瞬时BPM(到目前为止,这是不能实现的)。如图10中所示,音乐重放设备10把间隔均匀的节拍的时间间隔设置成瞬时节拍周期Ts,并利用下面给出的等式(4)计算瞬时BPM。
瞬时BPM[bpm]=采样频率/瞬时节拍周期Ts×60 (4)
音乐重放设备10关于每个单一的节拍标出瞬时BPM的图表,并通过显示接口11把所述图表显示在显示器112上。用户能够把瞬时BPM的分布理解为用户实际收听的音乐的速度波动的分布,并且能够把其用于例如节奏训练,在乐曲的录制期间造成的演奏错误的掌握,等等。
图11是表示现场录制的乐曲的瞬时BPM对节拍数的关系图的示图。图12是表示所谓的计算机合成的录制乐曲的瞬时BPM对节拍数的关系图的示图。从这两个图的比较可看出,计算机录制的乐曲具有比现场录制的乐曲小的波动时间宽度。这是因为计算机录制的乐曲具有比较起来,音乐速度变化较小的特性。通过利用该特性,能够自动确定某一乐曲是现场录制的还是计算机录制的,以前这是不可能的。
下面说明使节拍位置信息提取处理的准确性更高的方法。
由于指示节拍提取部分11提取的节拍位置信息的元数据通常是按照计算机的自动识别技术提取的数据,因此该节拍位置信息包括或多或少的提取错误。特别地,取决于乐曲,存在节拍明显不均匀波动的乐曲和极其缺乏节拍感觉的乐曲。
因此,节拍对准处理单元13向从节拍提取处理单元12供给的元数据分配指示该元数据的可靠性的可靠性指数值,并自动确定该元数据的可靠性。所述可靠性指数值被定义成如下面的等式(5)所示,与瞬时BPM的方差成反比的函数。
可靠性指数∝1/瞬时BPM的方差 (5)
这是因为存在当在节拍提取处理中造成提取错误时,瞬时BPM的方差(variance)通常增大的特性。即,可靠性指数值被定义成随着瞬时BPM的方差变小而增大。
下面利用图13和图14的流程图,说明根据可靠性指数值更准确地提取节拍位置信息的方法。
可以毫不夸张地说从包括节拍位置信息提取错误的各个乐曲以100%的准确性自动获得具体的节拍位置信息是不可能的。因此,用户能够通过手动操作,手动校正节拍位置信息提取错误。如果能够容易地发现提取错误,并且错误部分能够被校正,那么校正工作变得更有效。
图13是表示根据可靠性指数值,手动校正节拍位置信息的程序的例子的流程图。
在步骤S1,数字音频信号从I/O端口113被供给包括在节拍提取部分11中的节拍提取处理单元12。
在步骤S2,节拍提取处理单元12从自I/O端口113供给的数字音频信号中提取节拍位置信息,并把节拍位置信息作为记录在.mty文件中的元数据提供给节拍对准处理单元13。
在步骤S3,节拍对准处理单元13对构成从节拍提取处理单元12供给的节拍位置信息的节拍进行对准处理。
在步骤S4,节拍对准处理单元13确定分配给对准处理后的元数据的可靠性指数值是否等于或大于阈值N(%)。如果在步骤S4,可靠性指数值等于或大于N(%),那么处理进入步骤S6。如果可靠性指数值小于N(%),那么处理进入步骤S5。
在步骤S5,用户利用包括在音乐重放设备10中的创作工具(未示出),进行关于节拍对准处理的手动校正。
在步骤S6,节拍对准处理单元13把经过节拍对准处理后的节拍位置信息作为记录在.may文件中的元数据提供给I/O端口114。
另外,通过根据上述可靠性指数值,改变节拍位置信息的提取条件,能够更加高度准确地提取节拍位置信息。
图14是表示指定节拍提取条件的程序的例子的流程图。
多个指定提取条件的内部参数存在于节拍提取部分11中的节拍提取处理中,提取准确性随参数值而变化。因此,在节拍提取部分11中,节拍提取处理单元12和节拍对准处理单元12预先准备多组内部参数,对于每个参数组进行节拍提取处理,并计算上述可靠性指数值。
在步骤S11,数字音频信号从I/O端口113被供给包括在节拍提取部分11中的节拍提取处理单元12。
在步骤S12,节拍提取处理单元12从自I/O端口113供给的数字音频信号中提取节拍位置信息,并把节拍位置信息作为记录在.mty文件中的元数据供给节拍对准处理单元13。
在步骤S13,节拍对准处理单元13对从节拍提取处理单元12供给的元数据进行节拍对准处理。
在步骤S14,节拍对准处理单元13确定分配给对准处理后的元数据的可靠性指数值是否等于或大于阈值N(%)。如果在步骤S14,可靠性指数值等于或大于N(%),那么处理进入步骤S16。如果可靠性指数值小于N(%),那么处理进入步骤S15。
在步骤S15,节拍提取处理单元12和节拍对准处理单元13改变上述参数组的参数,处理返回步骤S12。在步骤S12和步骤S13之后,再次在步骤S14进行可靠性指数值的确定。
重复步骤S12-S15,直到在步骤S14,可靠性指数值等于或大于N(%)为止。
通过这样的步骤,能够指定最佳的参数组,并且能够显著提高自动节拍提取处理的提取准确性。
如上所述,按照包括按照本发明的节拍提取设备的音乐重放设备10,不具有时间戳记信息,比如节拍位置信息的音频波形(采样声源),比如PCM能够与其它媒体音乐同步。另外,由于时间戳记信息,比如节拍位置信息的数据大小介于几K字节和几十K字节之间,相当小,为音频波形的数据大小的几千分之一,因此能够降低存储器容量和减少处理步骤,从而使用户可以相当容易地处理它。
如上所述,按照包括按照本发明的节拍提取设备的音乐重放设备10,能够从其音乐速度变化的音乐中,或者从其节奏波动的音乐中准确提取整首乐曲内的节拍,此外通过使音乐与其它媒体同步创建新的娱乐。
同时,显然本发明并不仅仅局限于上述实施例,可在不脱离本发明的精神的范围内不同地修改。
例如,按照本发明的节拍提取设备不仅可应用于上面说明的个人计算机或便携式音乐重放设备,而且可应用于各种设备或电子设备。
按照本发明,乐曲的节奏的节拍位置信息被提取,利用该提取和获得的节拍位置信息生成节拍周期信息,根据该节拍周期信息对准提取的节拍位置信息的节拍,从而能够高度准确地从整个乐曲中提取特定音符的节拍位置信息。
Claims (18)
1.一种节拍提取设备,其特征在于包括:
节拍提取处理装置,用于提取乐曲的节奏的节拍位置信息;和
节拍对准处理装置,用于利用节拍提取处理装置提取和获取的节拍位置信息产生节拍周期信息,并根据节拍周期信息对准由节拍提取处理装置提取的节拍位置信息的节拍。
2.按照权利要求1所述的节拍提取设备,其特征在于:
节拍对准处理装置使用从整个乐曲、或者从预期具有相同音乐速度的一部分乐曲提取的节拍位置信息。
3.按照权利要求1所述的节拍提取设备,其特征在于:
节拍提取处理装置包括:
功率谱计算装置,用于根据音乐的音乐信号的时序波形计算音乐信号的功率谱;和
变化量计算装置,用于计算功率谱计算装置计算的功率谱中的变化量,并输出计算的变化量。
4.按照权利要求1所述的节拍提取设备,其特征在于节拍对准处理装置定义就时间而论以与节拍周期信息的节拍周期相符的节拍为中心的窗口宽度,并且只提取存在于该窗口宽度内的节拍。
5.按照权利要求4所述的节拍提取设备,其特征在于当在窗口宽度内不存在任何节拍时,节拍对准处理装置在窗口宽度内增加新的节拍,并提取该增加的节拍。
6.按照权利要求1所述的节拍提取设备,其特征在于节拍对准处理装置计算指示节拍对准的节拍位置信息的可靠性的指数值,并确定所述指数值是否等于或高于预定阈值。
7.按照权利要求6所述的节拍提取设备,其特征在于节拍提取处理装置和节拍对准处理装置分别具有指定节拍提取处理条件和节拍对准处理条件的内部参数,并且反复改变相应的内部参数,直到所述指数值等于或高于预定阈值为止。
8.按照权利要求6所述的节拍提取设备,其特征在于还包括:校正装置,用于手动校正由节拍对准处理装置对准的节拍位置信息,直到所述指数值等于或高于预定阈值为止。
9.按照权利要求6所述的节拍提取设备,其特征在于所述指数值是与节拍位置信息的节拍之间的瞬时BPM的方差成反比的函数。
10.一种节拍提取方法,其特征在于包括:
节拍提取处理步骤,用于提取乐曲的节奏的节拍位置信息;和
节拍对准处理步骤,用于利用在节拍提取处理步骤提取和获取的节拍位置信息产生节拍周期信息,并根据节拍周期信息对准在节拍提取处理步骤提取的节拍位置信息的节拍。
11.按照权利要求10所述的节拍提取方法,其特征在于:
在节拍对准处理步骤,使用从整个乐曲、或者从预期具有相同音乐速度的一部分乐曲提取的节拍位置信息。
12.按照权利要求10所述的节拍提取方法,其特征在于:
节拍提取处理步骤包括:
功率谱计算步骤,用于根据音乐的音乐信号的时序波形,计算音乐信号的功率谱;和
变化量计算步骤,用于计算在功率谱计算步骤计算的功率谱中的变化量,并输出计算的变化量。
13.按照权利要求10所述的节拍提取方法,其特征在于在节拍对准处理步骤,定义就时间而论以与节拍周期信息的节拍周期相符的节拍为中心的窗口宽度,并且只提取存在于该窗口宽度内的节拍。
14.按照权利要求13所述的节拍提取方法,其特征在于当在窗口宽度内不存在任何节拍时,在节拍对准处理步骤,在窗口宽度内增加新的节拍并提取该增加的节拍。
15.按照权利要求10所述的节拍提取方法,其特征在于在节拍对准处理步骤,计算指示节拍对准的节拍位置信息的可靠性的指数值,并确定所述指数值是否等于或高于预定阈值。
16.按照权利要求15所述的节拍提取方法,其特征在于在节拍提取处理步骤和节拍对准处理步骤,分别存在指定节拍提取处理条件和节拍对准处理条件的内部参数,并且相应的内部参数反复被改变,直到所述指数值等于或高于预定阈值为止。
17.按照权利要求16所述的节拍提取方法,其特征在于还包括:校正步骤,用于手动校正在节拍对准处理步骤对准的节拍位置信息,直到所述指数值等于或高于预定阈值为止。
18.按照权利要求15所述的节拍提取方法,其特征在于所述指数值是与节拍位置信息的节拍之间的瞬时BPM的方差成反比的函数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP016801/2006 | 2006-01-25 | ||
JP2006016801A JP4949687B2 (ja) | 2006-01-25 | 2006-01-25 | ビート抽出装置及びビート抽出方法 |
PCT/JP2007/051073 WO2007086417A1 (ja) | 2006-01-25 | 2007-01-24 | ビート抽出装置及びビート抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101375327A true CN101375327A (zh) | 2009-02-25 |
CN101375327B CN101375327B (zh) | 2012-12-05 |
Family
ID=38309206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800035136A Expired - Fee Related CN101375327B (zh) | 2006-01-25 | 2007-01-24 | 节拍提取设备和节拍提取方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8076566B2 (zh) |
EP (1) | EP1978508A1 (zh) |
JP (1) | JP4949687B2 (zh) |
KR (1) | KR101363534B1 (zh) |
CN (1) | CN101375327B (zh) |
WO (1) | WO2007086417A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102347022A (zh) * | 2010-08-02 | 2012-02-08 | 索尼公司 | 音乐速度检测装置、音乐速度检测方法和程序 |
CN102754147A (zh) * | 2009-10-30 | 2012-10-24 | 杜比国际公司 | 复杂度可缩放的感知节拍估计 |
CN107871489A (zh) * | 2016-09-28 | 2018-04-03 | 卡西欧计算机株式会社 | 和弦判定装置、和弦判定方法以及非暂时性的记录介质 |
CN109256146A (zh) * | 2018-10-30 | 2019-01-22 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频检测方法、装置及存储介质 |
CN111669497A (zh) * | 2020-06-12 | 2020-09-15 | 杭州趣维科技有限公司 | 一种移动端自拍时音量驱动贴纸效果的方法 |
CN113411663A (zh) * | 2021-04-30 | 2021-09-17 | 成都东方盛行电子有限责任公司 | 一种用于非编工程中的音乐节拍提取方法 |
CN113590872A (zh) * | 2021-07-28 | 2021-11-02 | 广州艾美网络科技有限公司 | 跳舞谱面生成的方法、装置以及设备 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4465626B2 (ja) * | 2005-11-08 | 2010-05-19 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US7956274B2 (en) * | 2007-03-28 | 2011-06-07 | Yamaha Corporation | Performance apparatus and storage medium therefor |
JP4311466B2 (ja) * | 2007-03-28 | 2009-08-12 | ヤマハ株式会社 | 演奏装置およびその制御方法を実現するプログラム |
JP4467601B2 (ja) * | 2007-05-08 | 2010-05-26 | ソニー株式会社 | ビート強調装置、音声出力装置、電子機器、およびビート出力方法 |
JP5266754B2 (ja) * | 2007-12-28 | 2013-08-21 | ヤマハ株式会社 | 磁気データ処理装置、磁気データ処理方法および磁気データ処理プログラム |
KR101230479B1 (ko) * | 2008-03-10 | 2013-02-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법 |
WO2009125489A1 (ja) * | 2008-04-11 | 2009-10-15 | パイオニア株式会社 | テンポ検出装置及びテンポ検出プログラム |
JP5150573B2 (ja) * | 2008-07-16 | 2013-02-20 | 本田技研工業株式会社 | ロボット |
JP2010054530A (ja) * | 2008-08-26 | 2010-03-11 | Sony Corp | 情報処理装置、発光制御方法およびコンピュータプログラム |
US7915512B2 (en) * | 2008-10-15 | 2011-03-29 | Agere Systems, Inc. | Method and apparatus for adjusting the cadence of music on a personal audio device |
JP2010114737A (ja) * | 2008-11-07 | 2010-05-20 | Kddi Corp | 携帯端末、拍位置修正方法および拍位置修正プログラム |
JP5282548B2 (ja) * | 2008-12-05 | 2013-09-04 | ソニー株式会社 | 情報処理装置、音素材の切り出し方法、及びプログラム |
JP5582915B2 (ja) * | 2009-08-14 | 2014-09-03 | 本田技研工業株式会社 | 楽譜位置推定装置、楽譜位置推定方法および楽譜位置推定ロボット |
JP4537490B2 (ja) * | 2009-09-07 | 2010-09-01 | 株式会社ソニー・コンピュータエンタテインメント | オーディオ再生装置およびオーディオ早送り再生方法 |
EP2328142A1 (en) * | 2009-11-27 | 2011-06-01 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method for detecting audio ticks in a noisy environment |
US9159338B2 (en) * | 2010-05-04 | 2015-10-13 | Shazam Entertainment Ltd. | Systems and methods of rendering a textual animation |
JP5594052B2 (ja) * | 2010-10-22 | 2014-09-24 | ソニー株式会社 | 情報処理装置、楽曲再構成方法及びプログラム |
US9324377B2 (en) | 2012-03-30 | 2016-04-26 | Google Inc. | Systems and methods for facilitating rendering visualizations related to audio data |
CN103971685B (zh) * | 2013-01-30 | 2015-06-10 | 腾讯科技(深圳)有限公司 | 语音命令识别方法和系统 |
US9411882B2 (en) | 2013-07-22 | 2016-08-09 | Dolby Laboratories Licensing Corporation | Interactive audio content generation, delivery, playback and sharing |
US9756281B2 (en) | 2016-02-05 | 2017-09-05 | Gopro, Inc. | Apparatus and method for audio based video synchronization |
US9697849B1 (en) | 2016-07-25 | 2017-07-04 | Gopro, Inc. | Systems and methods for audio based synchronization using energy vectors |
US9640159B1 (en) | 2016-08-25 | 2017-05-02 | Gopro, Inc. | Systems and methods for audio based synchronization using sound harmonics |
US9653095B1 (en) | 2016-08-30 | 2017-05-16 | Gopro, Inc. | Systems and methods for determining a repeatogram in a music composition using audio features |
US9916822B1 (en) | 2016-10-07 | 2018-03-13 | Gopro, Inc. | Systems and methods for audio remixing using repeated segments |
JP6705422B2 (ja) * | 2017-04-21 | 2020-06-03 | ヤマハ株式会社 | 演奏支援装置、及びプログラム |
CN108108457B (zh) | 2017-12-28 | 2020-11-03 | 广州市百果园信息技术有限公司 | 从音乐节拍点中提取大节拍信息的方法、存储介质和终端 |
JP7343268B2 (ja) * | 2018-04-24 | 2023-09-12 | 培雄 唐沢 | 任意信号挿入方法及び任意信号挿入システム |
US11749240B2 (en) * | 2018-05-24 | 2023-09-05 | Roland Corporation | Beat timing generation device and method thereof |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6199710A (ja) | 1984-10-19 | 1986-05-17 | 富士バルブ株式会社 | 2つの部材の固定方法 |
JPH0366528A (ja) | 1989-08-02 | 1991-03-22 | Fujitsu Ltd | ロボットハンド |
JP3433818B2 (ja) * | 1993-03-31 | 2003-08-04 | 日本ビクター株式会社 | 楽曲検索装置 |
JP3066528B1 (ja) | 1999-02-26 | 2000-07-17 | コナミ株式会社 | 楽曲再生システム、リズム解析方法及び記録媒体 |
JP4186298B2 (ja) | 1999-03-17 | 2008-11-26 | ソニー株式会社 | リズムの同期方法及び音響装置 |
KR100365989B1 (ko) * | 2000-02-02 | 2002-12-26 | 최광진 | 가상 음악 영상 시스템 및 그 시스템의 영상 표시 방법 |
US7035873B2 (en) * | 2001-08-20 | 2006-04-25 | Microsoft Corporation | System and methods for providing adaptive media property classification |
JP3789326B2 (ja) | 2000-07-31 | 2006-06-21 | 松下電器産業株式会社 | テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体 |
JP4027051B2 (ja) * | 2001-03-22 | 2007-12-26 | 松下電器産業株式会社 | 楽曲登録装置、楽曲登録方法、及びそのプログラムと記録媒体 |
US7373209B2 (en) * | 2001-03-22 | 2008-05-13 | Matsushita Electric Industrial Co., Ltd. | Sound features extracting apparatus, sound data registering apparatus, sound data retrieving apparatus, and methods and programs for implementing the same |
US6518492B2 (en) * | 2001-04-13 | 2003-02-11 | Magix Entertainment Products, Gmbh | System and method of BPM determination |
DE10123366C1 (de) | 2001-05-14 | 2002-08-08 | Fraunhofer Ges Forschung | Vorrichtung zum Analysieren eines Audiosignals hinsichtlich von Rhythmusinformationen |
CN1206603C (zh) * | 2001-08-30 | 2005-06-15 | 无敌科技股份有限公司 | 音乐音频产生方法与播放系统 |
JP4646099B2 (ja) * | 2001-09-28 | 2011-03-09 | パイオニア株式会社 | オーディオ情報再生装置及びオーディオ情報再生システム |
JP3674950B2 (ja) * | 2002-03-07 | 2005-07-27 | ヤマハ株式会社 | 音楽データのテンポ推定方法および装置 |
JP4243682B2 (ja) | 2002-10-24 | 2009-03-25 | 独立行政法人産業技術総合研究所 | 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム |
-
2006
- 2006-01-25 JP JP2006016801A patent/JP4949687B2/ja not_active Expired - Fee Related
-
2007
- 2007-01-24 WO PCT/JP2007/051073 patent/WO2007086417A1/ja active Application Filing
- 2007-01-24 EP EP07707320A patent/EP1978508A1/en not_active Withdrawn
- 2007-01-24 KR KR1020087016468A patent/KR101363534B1/ko not_active IP Right Cessation
- 2007-01-24 CN CN2007800035136A patent/CN101375327B/zh not_active Expired - Fee Related
- 2007-01-24 US US12/161,882 patent/US8076566B2/en not_active Expired - Fee Related
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102754147A (zh) * | 2009-10-30 | 2012-10-24 | 杜比国际公司 | 复杂度可缩放的感知节拍估计 |
CN102754147B (zh) * | 2009-10-30 | 2014-10-22 | 杜比国际公司 | 复杂度可缩放的感知节拍估计 |
CN104157280A (zh) * | 2009-10-30 | 2014-11-19 | 杜比国际公司 | 复杂度可缩放的感知节拍估计 |
US9466275B2 (en) | 2009-10-30 | 2016-10-11 | Dolby International Ab | Complexity scalable perceptual tempo estimation |
CN102347022A (zh) * | 2010-08-02 | 2012-02-08 | 索尼公司 | 音乐速度检测装置、音乐速度检测方法和程序 |
CN107871489B (zh) * | 2016-09-28 | 2021-11-02 | 卡西欧计算机株式会社 | 和弦判定装置、和弦判定方法以及非暂时性的记录介质 |
CN107871489A (zh) * | 2016-09-28 | 2018-04-03 | 卡西欧计算机株式会社 | 和弦判定装置、和弦判定方法以及非暂时性的记录介质 |
CN109256146A (zh) * | 2018-10-30 | 2019-01-22 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频检测方法、装置及存储介质 |
CN109256146B (zh) * | 2018-10-30 | 2021-07-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频检测方法、装置及存储介质 |
CN111669497A (zh) * | 2020-06-12 | 2020-09-15 | 杭州趣维科技有限公司 | 一种移动端自拍时音量驱动贴纸效果的方法 |
CN113411663A (zh) * | 2021-04-30 | 2021-09-17 | 成都东方盛行电子有限责任公司 | 一种用于非编工程中的音乐节拍提取方法 |
CN113411663B (zh) * | 2021-04-30 | 2023-02-21 | 成都东方盛行电子有限责任公司 | 一种用于非编工程中的音乐节拍提取方法 |
CN113590872A (zh) * | 2021-07-28 | 2021-11-02 | 广州艾美网络科技有限公司 | 跳舞谱面生成的方法、装置以及设备 |
CN113590872B (zh) * | 2021-07-28 | 2023-11-28 | 广州艾美网络科技有限公司 | 跳舞谱面生成的方法、装置以及设备 |
Also Published As
Publication number | Publication date |
---|---|
KR101363534B1 (ko) | 2014-02-14 |
WO2007086417A1 (ja) | 2007-08-02 |
JP2007199306A (ja) | 2007-08-09 |
US8076566B2 (en) | 2011-12-13 |
CN101375327B (zh) | 2012-12-05 |
JP4949687B2 (ja) | 2012-06-13 |
US20090056526A1 (en) | 2009-03-05 |
KR20080087112A (ko) | 2008-09-30 |
EP1978508A1 (en) | 2008-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101375327B (zh) | 节拍提取设备和节拍提取方法 | |
CN1941071B (zh) | 拍子提取及检测设备和方法、音乐同步显示设备和方法 | |
KR101292698B1 (ko) | 메타데이터 부여 방법 및 장치 | |
US8138409B2 (en) | Interactive music training and entertainment system | |
JP5759022B2 (ja) | セマンティック・オーディオ・トラック・ミキサー | |
EP3418917B1 (en) | Methods and systems for synchronizing media | |
US9159338B2 (en) | Systems and methods of rendering a textual animation | |
US7288710B2 (en) | Music searching apparatus and method | |
CN1463419A (zh) | 同步文本/可视信息与音频重放 | |
US20160196812A1 (en) | Music information retrieval | |
Rosenzweig et al. | Erkomaishvili Dataset: A Curated Corpus of Traditional Georgian Vocal Music for Computational Musicology. | |
JP2005530192A (ja) | 音楽記譜システム | |
US20160071429A1 (en) | Method of Presenting a Piece of Music to a User of an Electronic Device | |
Ahmedovich | FUNDAMENTALS OF THE USE OF INAVATORY PROGRAMS OF MUSIC CULTURE IN TEACHING AS A SUBJECT | |
GB2422755A (en) | Audio signal processing | |
Müller et al. | Interactive fundamental frequency estimation with applications to ethnomusicological research | |
Monti et al. | Monophonic transcription with autocorrelation | |
CN109410972B (zh) | 生成音效参数的方法、装置及存储介质 | |
Bozkurt | A system for tuning instruments using recorded music instead of theory-based frequency presets | |
JP2009063714A (ja) | オーディオ再生装置およびオーディオ早送り再生方法 | |
Dixon | Analysis of musical content in digital audio | |
Fuadi et al. | The Introduction Types of Vocal Sound in Choir in Realtime Using Hankel Transformation and Macdonald Function | |
Curtz | Feature extraction and non-binary bass line classification in a drumbeat generator application | |
JPH10307581A (ja) | 波形データ圧縮装置および方法 | |
Dixon | Audio Analysis Applications for Music |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121205 Termination date: 20160124 |
|
EXPY | Termination of patent right or utility model |