JP5008766B2 - テンポ検出装置及びテンポ検出プログラム - Google Patents
テンポ検出装置及びテンポ検出プログラム Download PDFInfo
- Publication number
- JP5008766B2 JP5008766B2 JP2010507096A JP2010507096A JP5008766B2 JP 5008766 B2 JP5008766 B2 JP 5008766B2 JP 2010507096 A JP2010507096 A JP 2010507096A JP 2010507096 A JP2010507096 A JP 2010507096A JP 5008766 B2 JP5008766 B2 JP 5008766B2
- Authority
- JP
- Japan
- Prior art keywords
- envelope
- frequency
- tempo
- score
- music data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims description 71
- 238000001228 spectrum Methods 0.000 claims description 38
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 14
- 238000013075 data extraction Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000033764 rhythmic process Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- GDOPTJXRTPNYNR-UHFFFAOYSA-N methyl-cyclopentane Natural products CC1CCCC1 GDOPTJXRTPNYNR-UHFFFAOYSA-N 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/40—Rhythm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/076—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/021—Indicator, i.e. non-screen output user interfacing, e.g. visual or tactile instrument status or guidance information using lights, LEDs or seven segments displays
- G10H2220/086—Beats per minute [BPM] indicator, i.e. displaying a tempo value, e.g. in words or as numerical value in beats per minute
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/121—Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
- G10H2240/131—Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/025—Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
- G10H2250/031—Spectrum envelope processing
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
【0001】
本発明は、楽曲のテンポを検出するテンポ検出装置及びテンポ検出プログラムに関する。
【背景技術】
【0002】
昨今では、大容量の記憶手段(例えば、ハードディスクなど)に大量の楽曲データを記憶させ、記憶された大量の楽曲データの中から所望の楽曲データを検索し、音楽を再生するという方法が普及している。このような楽曲データの検索においては、アーティスト名や曲名などの書誌データを検索条件として検索する他、楽曲が有する情感(例えば、「明るい曲」、「静かな曲」など)を検索条件にして検索することも可能となっている。これは、楽曲データから楽曲の特徴量を検出し、検出した特徴量と楽曲が有する情感を結びつけて楽曲データを検索するものである。
【0003】
楽曲が有する情感と結びつく特徴量の一つにテンポがある。テンポは楽曲の特徴を表す重要なパラメータであるため、従来から様々な検出方法が提案されている。
【0004】
例えば、特許文献1には、音楽信号の所定の周波数成分の振幅のピーク間隔を計測することによって、テンポを検出する技術が開示されている。
【0005】
また、例えば、特許文献2には、所定の間隔で音楽信号のレベル変化の相関を求め、最も相関関数が高くなる時間間隔を探索することによって、テンポを検出する技術が開示されている。
【0006】
また、上述した特許文献1や特許文献2に示すように、音楽信号を時間領域で分析してテンポを検出する方法のほか、音楽信号を周波数領域で分析してテンポを検出する方法も開示されている。
【0007】
例えば、特許文献3には、微小区間の音楽信号の波形を高速フーリエ変換して平均パワーを求め、その平均パワーの時系列データをさらに高速フーリエ変換してパワースペクトルを算出し、算出したパワースペクトルとパワースペクトルの近似直線の差分に基づいてテンポを検出する技術が開示されている。
[0008]
特許文献1:特開平8−201542号公報
特許文献2:特開平5−27751号公報
特許文献3:特開2006−194953号公報
発明の開示
課題が解決しようとする課題
[0009]
しかしながら、上述した特許文献1のように、音楽信号の所定の周波数成分の振幅のピーク間隔を計測することによって、テンポを検出する方法は、処理が非常に簡単であるが、ビートの弱い楽曲や不規則な信号が含まれている楽曲では、誤検出が多く、正確にテンポを検出することができないという問題がある。すなわち、この検出方法は、ダンスミュージックなどのビートの強い楽曲では有効であるが、ポップスなどのビートの弱い楽曲では正確なテンポ検出が難しいという問題がある。
[0010]
また、特許文献2のように、相関関数を用いてテンポを検出する方法は、正確にテンポを検出することは可能であるが、高精度にテンポを検出するには、非常に大きな演算量が必要であり、製品に実装することは難しいという問題がある。
[0011]
また、特許文献3のように、高速フーリエ変換を多用して音楽信号を周波数領域で分析し、テンポを検出する方法も、非常に大きな演算量が必要であり、製品に実装することは難しいという問題がある。
[0012]
また、いずれの方法も楽曲の拍子については考慮されておらず、例えば、4/4拍子か3/4拍子か6/8拍子かといった判断を行うことが困難である。
[0013]
本発明は、上記の事情を鑑みてなされたものであり、その課題の一例としては、楽曲の種類によらず、高精度にテンポを検出することができるとともに、高精度検出のための負荷が少なく実装に耐え得るテンポ検出装置及びテンポ検出プログラムを提供することにある。
課題を解決するための手段
[0014]
上記の課題を達成するため、請求項1に記載の発明は、楽曲データのエンベロープを検出するエンベロープ検出手段と、検出されたエンベロープに対して、離散フーリエ変換処理を行って、周波数スペクトルを検出する周波数成分検出手段と、検出した周波数スペクトルの特徴に基づいて、楽曲データのテンポを検出するテンポ検出手段と、を有し、前記エンベロープ検出手段は、少なくとも2つ以上の周波数帯域の成分を抽出する楽曲データ抽出手段と、前記楽曲データ抽出手段で抽出されたそれぞれの周波数帯域の成分の楽曲データのエンベロープをそれぞれ生成するエンベロープ生成手段と、前記エンベロープ生成手段で生成されたそれぞれのエンベロープを重みづけして加算する加算手段と、を有するテンポ検出装置である。
【0015】
また、請求項8に記載の発明は、楽曲データのテンポを検出するテンポ検出プログラムであって、楽曲データのエンベロープを検出するエンベロープ検出ステップと、検出されたエンベロープに対して、離散フーリエ変換処理を行って、周波数スペクトルを検出する周波数成分検出ステップと、検出した周波数スペクトルの特徴に基づいて、楽曲データのテンポを検出するテンポ検出ステップと、をコンピュータに実行させ、前記エンベロープ検出ステップは、少なくとも2つ以上の周波数帯域の成分を抽出する楽曲データ抽出ステップと、前記楽曲データ抽出ステップで抽出されたそれぞれの周波数帯域の成分の楽曲データのエンベロープをそれぞれ生成するエンベロープ生成ステップと、前記エンベロープ生成ステップで生成されたそれぞれのエンベロープを重みづけして加算する加算ステップと、を有する。
【図面の簡単な説明】
[0016]
[図1]本発明の実施の形態に係るテンポ検出装置の概略構成図である。
[図2]本発明の実施の形態に係るテンポ検出装置に入力された音楽信号の波形の一例を示す図である。
[図3]本発明の実施の形態に係るテンポ検出装置において抽出された高域成分の波形の一例を示す図である。
[図4]本発明の実施の形態に係るテンポ検出装置において抽出された低域成分の波形の一例を示す図である。
[図5]図3に示す信号に対して絶対値をとった後の波形を示す図である。
[図6]図4に示す信号に対して絶対値をとった後の波形を示す図である。
[図7]図5に示す信号と図6に示す信号を合成した信号の波形を示す図である。
[図8]図7に示す信号のエンベロープをとった後、DC成分を除去した信号の波形である。
[図9]図8に示す信号をFFT積算して得られた周波数スペクトルを示す図である。
[図10]図9の0〜6Hz部分を拡大した周波数スペクトルを示す図である。
[図11]本発明の実施の形態に係るテンポ検出装置のエンベロープ検出手段の変形例の構成を示す図である。
符号の説明
[0017]
1,4 エンベロープ検出手段
2 周波数成分検出手段
3 テンポ検出手段
11 フィルタ部
12,41 前処理部
13,42 エンベロープ生成部
21 DCカット部
22 FFT演算部
31 スコア算出部
32 テンポ決定部
43 後処理部
100 テンポ検出装置
【発明を実施するための最良の形態】
【0018】
以下、本発明の実施の形態を図面を用いて説明する。
【0019】
図1は、本発明の実施の形態に係るテンポ検出装置100の概略構成及びテンポ検出処理の流れを示す図である。テンポ検出装置100は、楽曲のリズムからテンポ(BPM;Beat Per Minute)を検出する装置であり、楽曲のエンベロープ(時間的な振幅の包絡線)を検出するエンベロープ検出手段1と、検出したエンベロープの周波数成分を検出する周波数成分検出手段2と、検出したエンベロープの周波数成分からピーク周波数を解析して、楽曲のテンポを検出するテンポ検出手段3と、を備えている。
【0020】
本実施の形態のテンポ検出装置100におけるテンポ検出方法は、楽曲のリズムには時間的な繰り返し構造があるので、楽曲のエンベロープをとることにより、この時間的な繰り返し構造を取得し、取得した時間的な繰り返し構造をフーリエ変換することにより、楽曲のエンベロープの周波数スペクトルを算出し、算出した周波数スペクトルのピーク周波数に基づいて楽曲のテンポを検出する方法である。すなわち、本実施の形態のテンポ検出装置100におけるテンポ検出方法は、楽曲データを周波数領域で解析してテンポを検出する方法である。
【0021】
エンベロープ検出手段1は、詳しくは、フィルタ部11と、前処理部12と、エンベロープ生成部13と、を具備する構成である。
【0022】
フィルタ部11は、入力される音楽信号の所定の周波数領域の成分を抽出する機能を有している。本実施の形態では、フィルタ部11は、2つのフィルタ、具体的には、入力される音楽信号の低域成分を抽出するLPF(Low Pass Filter)11aと、高域成分を抽出するHPF(High Pass Filter)11bにより構成されており、LPF11aのカットオフ周波数を200Hz、HPF11bのカットオフ周波数を2kHzとしている。勿論、カットオフ周波数の値は一例であり、この値に限定されない。また、楽曲のリズムは、低域と高域に多く含まれることが多いので、本実施の形態のフィルタ部11は、低域成分を抽出するLPF11aと高域成分を抽出するHPF11bを備える構成としてが、これ以外の構成でもよく、例えば、3つ以上の周波数領域の成分を抽出するようなフィルタ部11であってもよい。また、複数の周波数領域の成分を抽出するのではなく、1つの周波数領域の成分を抽出するようなフィルタ部11であってもよい。
【0023】
図2に、入力された音楽信号の波形、図3に、LPF11aにより抽出された低域成分の波形、図4に、HPF11bにより抽出された高域成分の波形の一例を示す。
【0024】
前処理部12は、フィルタ部11により抽出された低域成分及び高域成分の音楽信号の絶対値を計算し、絶対値を計算した低域成分及び高域成分の音楽信号をそれぞれ重み付けして、加算する機能を有している。ここで、低域成分の音楽信号と高域成分の音楽信号を加算して混合するのは、低音楽器と高音楽器で4分音符周期を刻む楽曲もあるため、このような楽曲のリズムにも対応させるためである。
【0025】
図5に、抽出された低域成分の音楽信号に対して絶対値を計算した後の波形、図6に、抽出された高域成分の音楽信号に対して絶対値を計算した後の波形を示す。
【0026】
本実施の形態では、絶対値を計算した低域成分の音楽信号と、絶対値を計算した高域成分の音楽信号の重みづけ比率を2:1にして音楽信号のレベルを加算している。なお、本実施の形態では、低域成分を重視したため、低域成分と高域成分の重みづけ比率を2:1としたが、重みづけ比率はこれに限定されない。
【0027】
図7に、絶対値を計算した低域成分の音楽信号と、絶対値を計算した高域成分の音楽信号を重みづけして加算した音楽信号の波形を示す。
【0028】
エンベロープ生成部13は、前処理部12により生成された音楽信号のエンベロープを生成する機能を有している。具体的には、エンベロープ生成部13は、LPF13aを用いて、絶対値を計算した低域成分の音楽信号と、絶対値を計算した高域成分の音楽信号を重みづけして加算した音楽信号のエンベロープを生成するようになっている。
【0029】
本実施の形態では、LPF13aのカットオフ周波数を10Hzとしているが、勿論、一例であって、カットオフ周波数はこの値に限定されない。また、LPF13aを用いてエンベロープを生成する方法以外のエンベロープ生成方法によりエンベロープを生成するようにしてもよい。例えば、前処理部12により生成された音楽信号の極大点を連ねてエンベロープを生成するようにしてもよい。
【0030】
なお、本実施の形態のエンベロープ検出手段1は、低域成分の信号と高域成分の信号を重みづけ加算してから、エンベロープを生成するように構成したが、これ以外の構成を採用してもよい。例えば、図11に示すようなエンベロープ検出手段4としてもよい。エンベロープ検出手段4は、フィルタ部11と、前処理部41と、エンベロープ生成部42と、後処理部43と、を具備する構成であって、絶対値を計算した低域成分の音楽信号と、絶対値を計算した高域成分の音楽信号に対して、それぞれエンベロープを生成した後、生成された各エンベロープを重みづけ加算するようになっている。このように、低域成分の音楽信号に対するエンベロープと、高域成分の音楽信号に対するエンベロープとを生成した後に、重みづけ加算して、1つのエンベロープを生成するようにしてもよい。
【0031】
周波数成分検出手段2は、詳しくは、DCカット部21と、FFT演算部22と、を具備する構成である。
【0032】
DCカット部21は、エンベロープ生成部13で生成されたエンベロープのDC成分を除去する機能を有している。具体的には、DCカット部21は、カットオフ周波数が低いHPF21aを用いて、低域の信号を除去している。DC成分を除去するのは、DC成分があると後述するFFT処理を施すことによって、低域の周波数が強調され、テンポを誤検出するおそれがあるからである。なお、本実施の形態では、HPF21aのカットオフ周波数を0.5Hzとしているが、一例であって、HPF21aのカットオフ周波数はこの値に限定されない。
【0033】
図8にエンベロープを生成した後にDCカットを行った音楽信号の波形を示す。
【0034】
FFT演算部22は、DC成分をカットされたエンベロープ波形を高速フーリエ変換(FFT;Fast Fourier Transform)処理を行って、周波数スペクトルを算出する機能を有している。具体的には、FFT演算部22は、サンプリング周波数を50Hz、FFTポイントを1024ポイントとして、FFT処理を行っている。すなわち、FFT処理を行うフレーム長を約20.5秒(≒1024/50)とし、1024ポイントたまるごとに(20.5秒ごとに)、FFTを行って絶対値を積算するようにしている。なお、本実施の形態では、FFTポイントを1024ポイントとしてFFT処理を積算するように構成したが、楽曲1曲分すべてをFFT処理するように構成してもよい。すなわち、本実施の形態においては、音楽信号のエンベロープ波形に対して低い帯域のサンプリング周波数でFFT処理を行うので、演算量を少なくすることができる。そのため、楽曲1曲すべてをFFT処理したとしても、FFT処理を多用することにならないので、装置に負荷をかけることがない。
【0035】
図9にFFT処理後のスペクトラムの一例を示す。
【0036】
また、本実施の形態の周波数成分検出手段2では、DC成分を除去した後、FFT処理を施すように構成したが、周波数成分検出手段2の構成はこれに限定されるものではなく、他の構成を採用してもよい。例えば、FFT処理後にDC成分を除去するようにしてもよく、FFT処理を行うときに所定の窓関数をかけて重みづけをし、低域周波数成分を除去するようにしてもよい。
【0037】
テンポ検出手段3は、詳しくは、スコア算出部31と、テンポ決定部32と、を具備する構成である。
【0038】
スコア算出部31は、FFT演算部22によって得られたスペクトラムを解析する機能を有している。より詳しくは、想定される楽曲のテンポが1〜3Hzと想定されることから、スコア算出部31は、当該周波数領域を周波数分解能に従ってサーチして、スコアを算出するようになっている。本実施の形態では、サーチポイント(サーチ周波数)の振幅スペクトルの値だけでなく、2倍の周波数及び1/2倍の周波数の振幅スペクトルの値も重みづけてしてスコアを算出するようになっている。具体的には、サーチポイント(×1周波数)の振幅スペクトルの値の重みを1、サーチポイントの2倍の周波数の振幅スペクトルの値の重みを0.5、サーチポイントの1/2倍の周波数の振幅スペクトルの値の重みを0.5として、3つの値を加算してスコアを算出している。これにより、本実施の形態におけるスコア算出は、FFT演算部22によって得られたスペクトラムのピークを考慮するとともに、他の4拍子系(2分音符、8分音符)も考慮したスコア算出となっている。
【0039】
図10に図9の0〜6Hz部分を拡大したスペクトラムを示す。なお、図10では横軸の単位はBPM(=Hz×60)である。例えば、図10に示すように、140BPM(ピークP1付近)をサーチポイントとしているときは、140BPMにおける振幅スペクトルの値に、280BPM(ピークP3付近)における振幅スペクトルの値及び70BPM(ピークP2付近)における振幅スペクトルの値を加味して、140BPMにおけるスコアを算出する。
【0040】
なお、本実施の形態では、サーチポイントの周波数の2倍及び1/2倍の周波数を加味して加算するスコア算出方法としたが、さらに、サーチポイントの周波数の4倍、8倍、…、1/4倍、1/8倍、…を加味して加算するスコア算出方法としてもよい。すなわち、4拍子系の音符を考慮したスコア算出方法としては、サーチポイントの振幅スペクトルの値のほか、サーチポイントの2N、1/2N(Nは自然数)倍の周波数の振幅スペクトルの値を考慮した算出方法としてもよい。さらには、4拍子系の音符に加えて、または代えて、3拍子系の音符を考慮したスコア算出方法としてもよい。すなわち、サーチポイントの3N、1/3N(Nは自然数)倍の周波数の振幅スペクトルの値を考慮した算出方法としてもよい。
【0041】
テンポ決定部32は、スコア算出部31により算出されたスコアのうち、スコアが最大となった周波数をテンポ周波数と決定し、決定したテンポ周波数を60倍することによってBPMを算出するようになっている。
【0042】
次に、図1を用いて、本実施の形態に係るテンポ検出装置100の動作について説明する。
【0043】
まず、テンポ検出装置100は、LPF11aにより、入力された音楽信号の低域成分を抽出するとともに(ステップS102)、HPF11bにより、入力された音楽信号の高域成分を抽出する(ステップS104)。
【0044】
次いで、テンポ検出装置100は、抽出された低域成分の音楽信号の絶対値を計算するとともに(ステップS106)、抽出された高域成分の音楽信号の絶対値を計算して(ステップS108)、絶対値計算された低域成分の音楽信号及び高域成分の音楽信号のそれぞれを重み付けして加算する(ステップS110)。
【0045】
次いで、テンポ検出装置100は、LPF13aを用いて、加算された音楽信号のエンベロープを生成する(ステップS112)。
【0046】
次いで、テンポ検出装置100は、HPF21aを用いて、生成されたエンベロープのDC成分を除去し(ステップS202)、DC成分を除去されたエンベロープに対してFFT積算を行う(ステップS204)。この結果、テンポ検出装置100は、音楽信号の周波数スペクトルを得ることができる。
【0047】
次いで、テンポ検出装置100は、得られた周波数スペクトルの所定の周波数領域の波形データから、4拍子系を考慮したスコアを算出し(ステップS302)、算出したスコアの中で最大のスコアとなった周波数をテンポと決定し、決定した周波数をBPMに換算する(ステップS304)。
【0048】
なお、図11に示したエンベロープ検出手段4を用いてエンベロープを生成する場合には、上述したステップS102〜S108の処理の後に、抽出された低域成分の音楽信号の絶対値、及び抽出された高域成分の音楽信号の絶対値それぞれに対して、エンベロープを生成し(ステップS122,S124)、生成したそれぞれのエンベロープを重み付け加算して(ステップS126)、エンベロープを生成する。
【0049】
以上述べたように、本実施の形態に係るテンポ検出装置100によれば、楽曲データのエンベロープを検出するエンベロープ検出手段1と、検出されたエンベロープに対して、高速フーリエ変換処理を行って、周波数スペクトルを検出する周波数成分検出手段2と、検出した周波数スペクトルの特徴に基づいて、テンポを検出するテンポ検出手段3と、を有するので、楽曲の種類によらず、高精度にテンポを検出することができる。
【0050】
すなわち、本実施の形態に係るテンポ検出装置100によれば、音楽信号の低域成分と高域成分をそれぞれ抽出し、抽出したそれぞれの周波数成分の音楽信号を重みづけ加算して、エンベロープを生成し、生成したエンベロープの周波数スペクトルを生成した後に、4拍子系を考慮したスコア算出方法を用いて、テンポを検出するので、ポップスのようなビートの弱い楽曲であっても正確にテンポを検出することができる。
【0051】
また、本実施の形態に係るテンポ検出装置100によれば、エンベロープの周波数スペクトルを生成するに際して、高速フーリエ変換処理の負荷が小さいので、実装適用が可能である。
【0052】
この結果、本実施の形態に係るテンポ検出装置100を、フィーリングによる再生機能を有するAVシステムに組み込めば、フィーリング(例えば、明るい、ノリがいい、静かななど)に適合した音楽を的確かつ迅速に選曲することができる。
【0053】
なお、上記実施の形態のテンポ検出装置100の動作は、テンポ検出装置100に格納された制御プログラムを実行することにより実現される。そして、この制御プログラムは、テンポ検出装置100に記憶される他、携行可能なフラッシュメモリ、CD−ROM、MO、DVD−ROMなどのAV機器やコンピュータが読み取り可能な記録媒体に記録することも、通信ネットワークを介して配信することも可能である。
【0054】
以上、本発明の実施の形態について説明してきたが、本発明は、上述した実施の形態に限られるものではなく、本発明の要旨を逸脱しない範囲において、本発明の実施の形態に対して種々の変形や変更を施すことができ、そのような変形や変更を伴うものもまた、本発明の技術的範囲に含まれるものである。
Claims (8)
- 楽曲データのエンベロープを検出するエンベロープ検出手段と、
検出されたエンベロープに対して、離散フーリエ変換処理を行って、周波数スペクトルを検出する周波数成分検出手段と、
検出した周波数スペクトルの特徴に基づいて、楽曲データのテンポを検出するテンポ検出手段と、
を有し、
前記エンベロープ検出手段は、
少なくとも2つ以上の周波数帯域の成分を抽出する楽曲データ抽出手段と、
前記楽曲データ抽出手段で抽出されたそれぞれの周波数帯域の成分の楽曲データのエンベロープをそれぞれ生成するエンベロープ生成手段と、
前記エンベロープ生成手段で生成されたそれぞれのエンベロープを重みづけして加算する加算手段と、
を有することを特徴とするテンポ検出装置。 - 前記エンベロープ生成手段は、
LPF(Low Pass Filter)を用いてエンベロープを生成することを特徴とする請求項1記載のテンポ検出装置。 - 前記楽曲データ抽出手段は、
抽出したそれぞれの周波数帯域の成分に対して、信号レベルの絶対値をとることを特徴とする請求項1又は2記載のテンポ検出装置。 - 前記周波数成分検出手段は、
検出されたエンベロープのDC成分を除去するDC成分除去手段と、
DC成分を除去されたエンベロープに対して離散フーリエ変換処理を行って、周波数スペクトルを生成するFFT手段と、
を有することを特徴とする請求項1乃至3のいずれか1項に記載のテンポ検出装置。 - 前記テンポ検出手段は、
予め定めた周波数領域を所定の間隔ごとにサーチしてそれぞれの周波数地点におけるスコアを予め定められた演算方法に基づいて算出するスコア算出手段と、
算出したそれぞれの周波数地点のスコアのうち最大値となった周波数地点の周波数をテンポとして決定するテンポ手段と、
を有することを特徴とする請求項1乃至4のいずれか1項に記載のテンポ検出装置。 - 前記スコア算出手段は、
当該周波数地点における振幅レベルである第1のスコアに、当該周波数の2 N (Nは正負の整数であって、設定されるNの個数は少なくとも1つ以上)倍の周波数地点における振幅レベルである第2のスコアを重みづけして加算したスコアを当該周波数地点におけるスコアとすることを特徴とする請求項5記載のテンポ検出装置。 - 前記スコア算出手段は、
当該周波数地点における振幅レベルである第1のスコアまたは当該周波数地点におけるスコアに、当該周波数の3 N (Nは正負の整数であって、設定されるNの個数は少なくとも1つ以上)倍の周波数地点における振幅レベルである第3のスコアを重みづけして加算したスコアを当該周波数地点におけるスコアとすることを特徴とする請求項5又は6記載のテンポ検出装置。 - 楽曲データのテンポを検出するテンポ検出プログラムであって、
楽曲データのエンベロープを検出するエンベロープ検出ステップと、
検出されたエンベロープに対して、離散フーリエ変換処理を行って、周波数スペクトルを検出する周波数成分検出ステップと、
検出した周波数スペクトルの特徴に基づいて、楽曲データのテンポを検出するテンポ検出ステップと、
をコンピュータに実行させ、
前記エンベロープ検出ステップは、
少なくとも2つ以上の周波数帯域の成分を抽出する楽曲データ抽出ステップと、
前記楽曲データ抽出ステップで抽出されたそれぞれの周波数帯域の成分の楽曲データのエンベロープをそれぞれ生成するエンベロープ生成ステップと、
前記エンベロープ生成ステップで生成されたそれぞれのエンベロープを重みづけして加算する加算ステップと、
を有することを特徴とするテンポ検出プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2008/057129 WO2009125489A1 (ja) | 2008-04-11 | 2008-04-11 | テンポ検出装置及びテンポ検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009125489A1 JPWO2009125489A1 (ja) | 2011-07-28 |
JP5008766B2 true JP5008766B2 (ja) | 2012-08-22 |
Family
ID=41161632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010507096A Expired - Fee Related JP5008766B2 (ja) | 2008-04-11 | 2008-04-11 | テンポ検出装置及びテンポ検出プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8344234B2 (ja) |
JP (1) | JP5008766B2 (ja) |
WO (1) | WO2009125489A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009125489A1 (ja) * | 2008-04-11 | 2009-10-15 | パイオニア株式会社 | テンポ検出装置及びテンポ検出プログラム |
TWI484473B (zh) * | 2009-10-30 | 2015-05-11 | Dolby Int Ab | 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統 |
JP5203404B2 (ja) * | 2010-02-13 | 2013-06-05 | 学校法人 龍谷大学 | テンポ値検出装置およびテンポ値検出方法 |
JP5569228B2 (ja) * | 2010-08-02 | 2014-08-13 | ソニー株式会社 | テンポ検出装置、テンポ検出方法およびプログラム |
US8927846B2 (en) * | 2013-03-15 | 2015-01-06 | Exomens | System and method for analysis and creation of music |
US10474672B2 (en) * | 2015-08-25 | 2019-11-12 | Schlafender Hase GmbH Software & Communications | Method for comparing text files with differently arranged text sections in documents |
JP6693189B2 (ja) | 2016-03-11 | 2020-05-13 | ヤマハ株式会社 | 音信号処理方法 |
CN107622774B (zh) * | 2017-08-09 | 2018-08-21 | 金陵科技学院 | 一种基于匹配追踪的音乐速度谱图生成方法 |
US10916229B2 (en) * | 2018-07-03 | 2021-02-09 | Soclip! | Beat decomposition to facilitate automatic video editing |
EP4445224A1 (en) * | 2021-12-12 | 2024-10-16 | Globerman, Ziv | Metronome device with real time feedback and method related thereto |
US20230288983A1 (en) * | 2022-03-08 | 2023-09-14 | Arris Enterprises Llc | Virtual reality device with ambient audio synchronization |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004528596A (ja) * | 2001-05-14 | 2004-09-16 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | リズム情報に関するオーディオ信号を解析するための装置及び方法 |
JP2005274708A (ja) * | 2004-03-23 | 2005-10-06 | Sony Corp | 信号処理装置および信号処理方法、プログラム、並びに記録媒体 |
WO2007138812A1 (ja) * | 2006-05-30 | 2007-12-06 | Murata Manufacturing Co., Ltd. | レーダ装置 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4089246A (en) * | 1976-08-09 | 1978-05-16 | Kooker Stephen L | Musical rhythm-tempo tutoring device |
US4300225A (en) * | 1979-08-09 | 1981-11-10 | Lambl George R | Disco beat meter |
US4361066A (en) * | 1981-06-15 | 1982-11-30 | Baldwin Piano & Organ Company | Tempo measurement, display, and control system for an electronic musical instrument |
US4542675A (en) * | 1983-02-04 | 1985-09-24 | Hall Jr Robert J | Automatic tempo set |
JP3245890B2 (ja) * | 1991-06-27 | 2002-01-15 | カシオ計算機株式会社 | 拍検出装置及びそれを用いた同期制御装置 |
JPH0527751A (ja) | 1991-07-19 | 1993-02-05 | Brother Ind Ltd | 自動採譜装置等に用いられるテンポ抽出装置 |
JP3373315B2 (ja) | 1995-01-20 | 2003-02-04 | パイオニア株式会社 | 拍数検出装置 |
US5614687A (en) * | 1995-02-20 | 1997-03-25 | Pioneer Electronic Corporation | Apparatus for detecting the number of beats |
US6316712B1 (en) * | 1999-01-25 | 2001-11-13 | Creative Technology Ltd. | Method and apparatus for tempo and downbeat detection and alteration of rhythm in a musical segment |
US6787689B1 (en) * | 1999-04-01 | 2004-09-07 | Industrial Technology Research Institute Computer & Communication Research Laboratories | Fast beat counter with stability enhancement |
US6657117B2 (en) * | 2000-07-14 | 2003-12-02 | Microsoft Corporation | System and methods for providing automatic classification of media entities according to tempo properties |
US6323412B1 (en) * | 2000-08-03 | 2001-11-27 | Mediadome, Inc. | Method and apparatus for real time tempo detection |
DE10164686B4 (de) * | 2001-01-13 | 2007-05-31 | Native Instruments Software Synthesis Gmbh | Automatische Erkennung und Anpassung von Tempo und Phase von Musikstücken und darauf aufbauender interaktiver Musik-Abspieler |
JP3982443B2 (ja) * | 2003-03-31 | 2007-09-26 | ソニー株式会社 | テンポ解析装置およびテンポ解析方法 |
EP1709624A1 (en) * | 2004-01-21 | 2006-10-11 | Koninklijke Philips Electronics N.V. | Method and system for determining a measure of tempo ambiguity for a music input signal |
US7026536B2 (en) * | 2004-03-25 | 2006-04-11 | Microsoft Corporation | Beat analysis of musical signals |
JP4347815B2 (ja) | 2005-01-11 | 2009-10-21 | シャープ株式会社 | テンポ抽出装置およびテンポ抽出方法 |
WO2007010637A1 (ja) * | 2005-07-19 | 2007-01-25 | Kabushiki Kaisha Kawai Gakki Seisakusho | テンポ検出装置、コード名検出装置及びプログラム |
JP4940588B2 (ja) * | 2005-07-27 | 2012-05-30 | ソニー株式会社 | ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法 |
US7518053B1 (en) * | 2005-09-01 | 2009-04-14 | Texas Instruments Incorporated | Beat matching for portable audio |
JP4949687B2 (ja) * | 2006-01-25 | 2012-06-13 | ソニー株式会社 | ビート抽出装置及びビート抽出方法 |
KR101215937B1 (ko) * | 2006-02-07 | 2012-12-27 | 엘지전자 주식회사 | IOI 카운트(inter onset intervalcount) 기반 템포 추정 방법 및 이를 위한 템포 추정장치 |
JP4672613B2 (ja) * | 2006-08-09 | 2011-04-20 | 株式会社河合楽器製作所 | テンポ検出装置及びテンポ検出用コンピュータプログラム |
US7645929B2 (en) * | 2006-09-11 | 2010-01-12 | Hewlett-Packard Development Company, L.P. | Computational music-tempo estimation |
JP4467601B2 (ja) * | 2007-05-08 | 2010-05-26 | ソニー株式会社 | ビート強調装置、音声出力装置、電子機器、およびビート出力方法 |
WO2009125489A1 (ja) * | 2008-04-11 | 2009-10-15 | パイオニア株式会社 | テンポ検出装置及びテンポ検出プログラム |
JP5337608B2 (ja) * | 2008-07-16 | 2013-11-06 | 本田技研工業株式会社 | ビートトラッキング装置、ビートトラッキング方法、記録媒体、ビートトラッキング用プログラム、及びロボット |
US8071869B2 (en) * | 2009-05-06 | 2011-12-06 | Gracenote, Inc. | Apparatus and method for determining a prominent tempo of an audio work |
US8878041B2 (en) * | 2009-05-27 | 2014-11-04 | Microsoft Corporation | Detecting beat information using a diverse set of correlations |
JP5569228B2 (ja) * | 2010-08-02 | 2014-08-13 | ソニー株式会社 | テンポ検出装置、テンポ検出方法およびプログラム |
-
2008
- 2008-04-11 WO PCT/JP2008/057129 patent/WO2009125489A1/ja active Application Filing
- 2008-04-11 US US12/937,436 patent/US8344234B2/en not_active Expired - Fee Related
- 2008-04-11 JP JP2010507096A patent/JP5008766B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004528596A (ja) * | 2001-05-14 | 2004-09-16 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | リズム情報に関するオーディオ信号を解析するための装置及び方法 |
JP2005274708A (ja) * | 2004-03-23 | 2005-10-06 | Sony Corp | 信号処理装置および信号処理方法、プログラム、並びに記録媒体 |
WO2007138812A1 (ja) * | 2006-05-30 | 2007-12-06 | Murata Manufacturing Co., Ltd. | レーダ装置 |
Also Published As
Publication number | Publication date |
---|---|
US20110067555A1 (en) | 2011-03-24 |
WO2009125489A1 (ja) | 2009-10-15 |
US8344234B2 (en) | 2013-01-01 |
JPWO2009125489A1 (ja) | 2011-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5008766B2 (ja) | テンポ検出装置及びテンポ検出プログラム | |
CN103854644B (zh) | 单声道多音音乐信号的自动转录方法及装置 | |
JP4465626B2 (ja) | 情報処理装置および方法、並びにプログラム | |
CN104143324B (zh) | 一种乐音音符识别方法 | |
Salamon et al. | Sinusoid extraction and salience function design for predominant melody estimation | |
CN104599663B (zh) | 歌曲伴奏音频数据处理方法和装置 | |
Collins | Using a Pitch Detector for Onset Detection. | |
JP3789326B2 (ja) | テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体 | |
CN102903357A (zh) | 一种提取歌曲副歌的方法、装置和系统 | |
JP6047985B2 (ja) | 伴奏進行生成装置及びプログラム | |
CN101399035A (zh) | 从音频文件提取节拍的方法和设备 | |
JP6252147B2 (ja) | 音響信号分析装置及び音響信号分析プログラム | |
JP2015079151A (ja) | 楽曲判別装置、楽曲判別装置の判別方法、プログラム | |
JP2010097084A (ja) | 携帯端末、拍位置推定方法および拍位置推定プログラム | |
Dittmar et al. | Novel mid-level audio features for music similarity | |
JP5447624B2 (ja) | カラオケ装置 | |
JP2011022489A (ja) | 音高認識方法、音高認識プログラム、記録媒体、及び音高認識システム | |
JP3832266B2 (ja) | 演奏データ作成方法および演奏データ作成装置 | |
JP2015125239A (ja) | 音声信号処理装置、音声信号処理装置の制御方法、プログラム | |
Tang et al. | Melody Extraction from Polyphonic Audio of Western Opera: A Method based on Detection of the Singer's Formant. | |
Coyle et al. | Onset detection using comb filters | |
JP2001067068A (ja) | 音楽パートの識別方法 | |
Shandilya et al. | Retrieving pitch of the singing voice in polyphonic audio | |
JP5034642B2 (ja) | カラオケ装置 | |
JP2015040970A (ja) | 小節間隔推定およびその推定のための特徴量抽出を行う装置、方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120515 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5008766 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150608 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |