JP3780858B2 - 波形データ分析方法、波形データ分析装置およびプログラム - Google Patents
波形データ分析方法、波形データ分析装置およびプログラム Download PDFInfo
- Publication number
- JP3780858B2 JP3780858B2 JP2001088420A JP2001088420A JP3780858B2 JP 3780858 B2 JP3780858 B2 JP 3780858B2 JP 2001088420 A JP2001088420 A JP 2001088420A JP 2001088420 A JP2001088420 A JP 2001088420A JP 3780858 B2 JP3780858 B2 JP 3780858B2
- Authority
- JP
- Japan
- Prior art keywords
- range
- waveform data
- envelope level
- envelope
- detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
【発明の属する技術分野】
本発明は、楽曲のテンポの推定に用いて好適な波形データ分析方法、波形データ分析装置およびプログラムに関する。
【0002】
【従来の技術】
(1)テンポ検出について
従来より、楽曲の波形データに対して様々な加工を施すため、その波形データから楽曲のテンポを推定することが要請されている。例えば、外部のMIDIクロックに同期させ波形データの再生タイミングを調節する、ダンスホール等において複数の楽曲を連続再生する時、前後の楽曲のテンポを合わせることによって違和感を無くす、等の用途が知られている。
【0003】
例えば、特開平8−201542号公報においては、波形データのピーク間の時間を検出し、これによってテンポを推定する技術が開示されている。また、特公平6−87199号公報においては、波形データから打楽器音等、立上がり、立下がりが急峻な信号を検出し、これによってテンポを決定する技術、および、入力される信号の時間間隔をある一定時間監視し、同じ時間間隔がある回数連続して存在した場合に、その時間間隔をその音楽のテンポとして推定する技術が開示されている。
【0004】
(2)無音区間の検出について
従来より、楽曲の波形データの中から無音区間を検索する技術が知られている(特開昭63−175895号公報、特開平1−86200号公報等)。これらの技術は、波形データの記憶容量を減らすため、無音区間における録音を停止する等の動作を行うものである。
【0005】
【発明が解決しようとする課題】
しかし、上述したテンポ検出技術によって正確なテンポを検出することは困難であった。また、上述した無音区間の検出技術をテンポ検出のために用いることは実現性に乏しい。
この発明は上述した事情に鑑みてなされたものであり、正確なテンポを検出できる波形データ分析方法、波形データ分析装置およびプログラムを提供することを第1の目的としている。また、このテンポ検出のために有音区間あるいは無音区間を正確に判定できる波形データ分析方法、波形データ分析装置およびプログラムを提供することを第2の目的としている。
【0006】
【課題を解決するための手段】
上記課題を解決するため本発明にあっては、下記構成を具備することを特徴とする。なお、括弧内は例示である。
請求項1記載の波形データ分析方法にあっては、波形データ上の第1の範囲(ウィンドウR)における第1のエンベロープレベル(平均エンベロープレベルRave)と、この第1の範囲の直後に隣接し該第1の範囲よりも短い第2の範囲(ウィンドウS)における第2のエンベロープレベル(平均エンベロープレベルSave)とを検出するエンベロープレベル検出過程と、前記波形データ上において、前記第1の範囲と前記第2の範囲とを所定時間ずつ順次後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルと前記第2のエンベロープレベルとを順次検出させる過程と、この順次検出された両エンベロープレベルについて、前記第1のエンベロープレベルの前記第2のエンベロープレベルに対する比(R ave/ S ave )が所定値(V min )より大きいか否かに基づいて、前記波形データが有音から無音に変化する位置を判定する過程とを有することを特徴とする。
また、請求項2記載の波形データ分析方法にあっては、波形データ上の第1の範囲(ウィンドウR)における第1のエンベロープレベル(平均エンベロープレベルRave)と、この第1の範囲の直後に隣接し該第1の範囲よりも短い第2の範囲(ウィンドウS)における第2のエンベロープレベル(平均エンベロープレベルSave)とを検出するエンベロープレベル検出過程と、前記第1のエンベロープレベルの前記第2のエンベロープレベルに対する比(R ave/ S ave )が所定値(V min )よりも大きいというレベル比条件が充足されるまで、前記第1および第2の範囲を隣接させたまま前記波形データの時間軸上で後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルと前記第2のエンベロープレベルとを順次検出させる第1移動過程と、前記レベル比条件が充足された後、前記第1の範囲を固定したまま、前記レベル比条件が充足されなくなるまで前記第2の範囲を後方に移動させつつ、前記エンベロープレベル検出過程に前記第2のエンベロープレベルを順次検出させる第2移動過程と、該第2の範囲が移動された範囲に基づいて、前記波形データの無音区間の開始位置および終了位置を判定する判定過程とを有することを特徴とする。
さらに、請求項3記載の構成にあっては、請求項2記載の波形データ分析方法において、さらに、前記波形データに対して前記第1移動過程、前記第2移動過程、および、前記判定過程を繰り返し実行させることにより、複数の無音区間のそれぞれの開始位置および終了位置を検出する検出過程と、前記検出された複数の無音区間のうちの各一対の無音区間の前記開始位置および前記終了位置に基づいて、所定のテンポ範囲(C min 〜C max )に対応する時間関係を有する無音区間の対を検出する対検出過程と、検出された無音区間の対について、それぞれ、前記所定のテンポ範囲に対応する拍周期の範囲を区切って成る複数の拍区間のうちの、その対における時間範囲に含まれる拍区間に投票を行う投票過程と、この投票過程による投票結果を平滑化し、平滑化された投票結果に基づいて拍周期を推定する推定過程とを有することを特徴とする。
また、請求項4記載の波形データ分析方法にあっては、波形データ上の第1の範囲(ウィンドウR)における第1のエンベロープレベル(平均エンベロープレベルR ave )と、この第1の範囲の直前に隣接し該第1の範囲よりも短い第2の範囲(ウィンドウS)における第2のエンベロープレベル(平均エンベロープレベルS ave )とを検出するエンベロープレベル検出過程と、前記波形データ上において、前記第1の範囲と前記第2の範囲とを所定時間ずつ順次後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルと前記第2のエンベロープレベルとを順次検出させる過程と、この順次検出された両エンベロープレベルについて、前記第1のエンベロープレベルの前記第2のエンベロープレベルに対する比(R ave/ S ave )が所定値(V min )より大きいか否かに基づいて、前記波形データが無音から有音に変化する位置を判定する過程とを有することを特徴とする。
また、請求項5記載の波形データ分析方法にあっては、波形データ上の第1の範囲(ウィンドウR)における第1のエンベロープレベル(平均エンベロープレベルR ave )と、この第1の範囲の直前に隣接し該第1の範囲よりも短い第2の範囲(ウィンドウS)における第2のエンベロープレベル(平均エンベロープレベルS ave )とを検出するエンベロープレベル検出過程と、前記第1のエンベロープレベルの前記第2のエンベロープレベルに対する比(R ave/ S ave )が所定値(V min )よりも大きいというレベル比条件が充足されるまで、前記第1および第2の範囲を隣接させたまま前記波形データの時間軸上で後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルと前記第2のエンベロープレベルとを順次検出させる第1移動過程と、前記レベル比条件が充足された後、前記第2の範囲を固定したまま、前記レベル比条件が充足されなくなるまで前記第1の範囲を後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルを順次検出させる第2移動過程と、該第1の範囲が移動された範囲に基づいて、前記波形データの有音区間の開始位置および終了位置を判定する判定過程とを有することを特徴とする。
さらに、請求項6記載の構成にあっては、請求項5記載の波形データ分析方法において、さらに、前記波形データに対して前記第1移動過程、前記第2移動過程、および、前記判定過程を繰り返し実行させることにより、複数の有音区間のそれぞれの開始位置および終了位置を検出する検出過程と、前記検出された複数の有音区間のうちの各一対の有音区間の前記開始位置および前記終了位置に基づいて、所定のテンポ範囲(C min 〜C max )に対応する時間関係を有する有音区間の対を検出する対検出過程と、検出された有音区間の対について、それぞれ、前記所定のテンポ範囲に対応する拍周期の範囲を区切って成る複数の拍区間のうちの、その対における時間範囲に含まれる拍区間に投票を行う投票過程と、この投票過程による投票結果を平滑化し、平滑化された投票結果に基づいて拍周期を推定する推定過程とを有することを特徴とする。
また、請求項7記載の波形データ分析装置にあっては、請求項1ないし6の何れかに記載の波形データ分析方法を実行することを特徴とする。
また、請求項8記載のプログラムにあっては、請求項1ないし6の何れかに記載の波形データ分析方法を処理装置に実行させることを特徴とする。
【0007】
【発明の実施の形態】
1.第1実施形態
1.1.第1実施形態の構成
次に、本発明の第1実施形態の波形解析システムのハードウエア構成を図1を参照し説明する。なお、本波形解析システムは、汎用パーソナルコンピュータ上で動作するアプリケーションプログラムおよびドライバ等によって構成されている。
図において2は通信インタフェースであり、インターネット等の外部ネットワークを介して波形データ等のやりとりを行う。4は入力装置であり、キーボード、マウス等から構成されている。6は演奏操作子であり、鍵盤および打楽器を模擬するパッド操作子等によって構成されている。
【0008】
8はディスプレイであり、ユーザに対して各種情報を表示する。10はCPUであり、後述するプログラムに基づいて、バス16を介して他の各部を制御する。12はROMであり、イニシャルプログラムローダ等が格納されている。14はRAMであり、CPU10によって読み書きされる。18はドライブ装置であり、CD−ROM、MO等の記憶媒体20の読み書きを行う。
【0009】
22は波形取込インタフェースであり、外部から入力されたアナログ波形をサンプリングし、デジタル波形データに変換した後、バス16を介して出力する。24はハードディスクであり、汎用パーソナルコンピュータのオペレーティングシステム、後述する波形編集のアプリケーションプログラム、波形データ等が格納される。26は波形出力インタフェースであり、バス16を介して供給された波形データをアナログ波形に変換し、サウンドシステム28を介して発音させる。
【0010】
1.2.第1実施形態の動作
次に、本実施形態の動作を説明する。
まず、パーソナルコンピュータの電源が投入されると、ROM12に格納されたイニシャルプログラムローダが実行され、オペレーティングシステムが立上る。このオペレーティングシステムにおいて所定の操作を行うと、本実施形態の波形解析アプリケーションプログラムが起動される。
【0011】
1.2.1.波形データの取得
波形解析アプリケーションプログラムにおいてユーザが所定の操作を行うと、波形取込インタフェース22を介して、解析対象の波形データがRAM14上に取得される。なお、波形データは、通信インタフェース2あるいは記憶媒体20を介して取得してもよい。この波形データは1フレーズ程度の長さが好適であり、さらに長い場合にはフレーズ単位に分割しておくとよい。
【0012】
1.2.2.波形データの解析
(1)無音区間の検出(SP2)
次に、波形データが取得された後、所定の操作が行われると、波形解析アプリケーションプログラムにおいて図2に示す解析プログラムが実行される。図において処理がステップSP2に進むと、該波形データの中から無音区間が検出される。その詳細を図3を参照し説明する。
【0013】
まず、図3(a)に示すように、比較的時間幅の長いウィンドウRと、これより短いウィンドウSとを想定する。なお、ウィンドウSの幅は、人間の聴覚において無音区間であると判定されうる最短の長さ程度に設定される。ウィンドウRは波形データの先頭に位置し、ウィンドウSはこの直後に隣接して配置される。ここで、ウィンドウR内の平均エンベロープレベルをRaveとし、ウィンドウSの平均エンベロープレベルをSaveとし、所定の相対音量閾値をVminとして、「Rave/Save >Vmin」の条件が満たされるか否かが判定される。
【0014】
上記条件が満たされなければ、ウィンドウR,Sの時間位置が所定時間だけ進められ、条件「Rave/Save >Vmin」が満たされるか否かが再び判定される。そして、この条件が満たされるまで、ウィンドウR,Sの時間位置が進められる。ここで、同図(b)の実線に示す位置において、上記条件「Rave/Save >Vmin」が満たされたこととする。この時点におけるウィンドウSのスタート位置ts1が無音区間T1のスタート位置になる。
【0015】
次に、ウィンドウSの時間位置のみが所定時間だけ進められ、再び上記条件「Rave/Save >Vmin」が満たされるか否かが判定される。そして、この条件が満たされなくなるまで、ウィンドウSの時間位置が逐次進められる。ここで、同図(b)の破線で示すウィンドウS’の時間位置において、上記条件が満たされなくなったこととする。
【0016】
この破線のウィンドウS’のエンド位置te1が無音区間T1のエンド位置になる。次に、このエンド位置te1の直後にウィンドウRが配置され、ウィンドウRの直後に隣接してウィンドウSが配置される。そして、上述したのと同様の動作が繰り返され、これによって、波形データ内の無音区間T1, T2, T3, T4, ……, Tnが逐次求められる。
【0017】
(2)無音区間の有効ペアの検出(SP4)
図2において、次に処理がステップSP4に進むと、各無音区間T1, T2, T3, T4, ……, Tnのペア(全体で2n個)のうち「有効ペア」を構成するものが抽出される。すなわち、2つの無音区間Tp, Tq(但しp<q)について、各々のスタート位置をtsp,tsq、各々のエンド位置をtep, teq、最大拍長をCmax、最小拍長をCminとしたとき、「Cmin ≦ teq−tsp」あるいは「Cmax ≧ tsq−tep」である場合に、これら無音区間Tp, Tqは有効ペアを構成する。
【0018】
その処理内容について具体例を挙げて説明しておく。楽曲のテンポが40〜160の範囲で設定されると仮定すると、一拍の長さは1500msec〜400msecになる。かかる場合、最小拍長Cminは400msec、最大拍長Cmaxは1500msecになる。次に、無音区間T6〜T10が図4に示すように配置されており、最小拍長Cminおよび最大拍長Cmaxが図示の通りの長さであったとすると、
無音区間T6, T7のペアおよび無音区間T6, T10のペアは有効ペアを構成せず、無音区間T6, T8のペアおよび無音区間T6, T9のペアは有効ペアを構成する。
【0019】
(3)拍区間に対する投票(SP6)
本実施形態においては、最小拍長Cmin〜最大拍長Cmaxの範囲を、所定間隔(例えば10msec間隔)で分割した値を拍区間とする。従って、上記例においては、(1500−400)/10=110個の拍区間が存在することになる。図2において処理がステップSP6に進むと、上記各有効ペアに基づいて、各拍区間に対する投票が行われる。
【0020】
すなわち、2つの無音区間Tp, Tqが有効ペアを構成するのであれば、その全体ないし中心値が「tsq−tep」〜「teq−tsp」の範囲にある拍区間のうち、「Cmin 以上かつCmax以下」の条件を満たす全ての拍区間に対して1票づつ投票が行われる。そして、これと同様の処理が全ての有効ペアに対して実行されると、横軸を拍区間とし、縦軸を得票数とするヒストグラムが得られる。
【0021】
(4)投票結果に基づく拍周期候補の検出(SP8)
次に、処理がステップSP8に進むと、上記ヒストグラムが平滑化される。例えば、各拍区間の投票数が、前後を含めた複数の拍区間の得票数の平均値に修正される。この結果、例えば図5の実線に示すような特性が得られる。次にこの特性における極大値、すなわち傾きが正から負に転換する箇所が検出される。図示のように、これら極大値を成す拍区間の中心値を拍周期候補C1,C2,……,Cmとする。
【0022】
(5)拍周期の決定(SP10)
次に、処理がステップSP10に進むと、各拍周期候補C1,C2,……,Cmに対して、各無音区間が周期性を有するか否かが判定され、これによって最終的な拍周期が決定される。ここで、無音区間の周期性を判定する方法として、拍周期候補C1を例として説明する。まず、図6(a)に示すように楽曲の波形データを拍周期候補C1毎の周期区間に区切り、同図(b)に示すように各区間を縦に配列したとする。そうすると、各周期内で「X」で示す期間については、3周期に渡って無音区間の一部が重複することになる。
【0023】
このように、拍周期候補C1で区切った各周期内において、少なくとも一部の位相が重複する複数の無音区間(図示の例ではT1, T3, T4)を「グループを構成する」という。そして、拍周期候補C2,……,Cmについても、同様にグループを構成する無音区間が検出される。そして、波形データの所定範囲内(例えば1フレーズ内)のうちグループを構成する無音区間の連続性が高い拍周期候補が、最終的な拍周期として推定されることになる。
【0024】
なお、言うまでもないが、テンポは「60秒/拍周期」により決定される。楽曲によっては、途中からテンポが変動するものもしばしば見受けられるが、本実施形態によれば所定範囲毎に最終的な拍周期を推定するため、楽曲内でテンポの遷移を追跡してゆくことが可能である。
【0025】
2.第2実施形態
次に、本発明の第2実施形態について説明する。第2実施形態のハードウエア構成は第1実施形態と同様であるが、波形解析アプリケーションプログラムにおいては、図2に代えて図7に示す解析プログラムが実行される。
【0026】
図において処理がステップSP22に進むと、波形データのエンベロープのピーク位置P1, P2, P3, P4, ……, Pnが検出される。次に、処理がステップSP24に進むと、これらピーク位置P1, P2, P3, P4, ……, Pnのペア(全体で2n個)のうち「有効ペア」を構成するものが抽出される。すなわち、2つのピーク位置間の時間が、上記第1実施形態において説明した最小拍長Cmin以上かつ最大拍長Cmax以下である場合に、これらピーク位置は有効ペアを構成する。
【0027】
次に、処理がステップSP26に進むと、各有効ペアについて、2つのピーク位置の間隔が属する拍区間に対する投票が行われる。ここで、一の拍区間の範囲は第1実施形態のものよりも広く、50msec〜100msec程度に設定すると好適である。また、本実施形態においては、一の有効ペアによって、一の拍区間のみに投票が行われる点が第1実施形態とは異なる。次に、処理がステップSP28に進むと、投票結果のヒストグラムに基づいて、最も得票数の多かった拍区間の中心値が最終的な拍周期として推定されることになる。
【0028】
3.変形例
本発明は上述した実施形態に限定されるものではなく、例えば以下のように種々の変形が可能である。
(1)上記各実施形態はパーソナルコンピュータ上で動作するソフトウエアによって波形解析システムを実現したが、同様の機能を各種の電子楽器、携帯電話器、アミューズメント機器、その他楽音を発生する装置に使用してもよい。また、上記実施形態に用いられるソフトウエアをCD−ROM、フロッピーディスク等の記録媒体に格納して頒布し、あるいは伝送路を通じて頒布することもできる。
【0029】
(2)第1実施形態においては、有音から無音に変化する位置によって無音区間を検出したが、無音から有音に変化する位置をまず検出し、次に有音から無音に変化するポイントまでの区間を有音区間として検出し、この有音区間を上記無音区間に代えて用いることによって拍周期を検出してもよい。
【0030】
例えば、波形データの時間軸上でウィンドウSをウィンドウRの前に(図3においては左側に)隣接配置して「Rave/Save >Vmin」が満たされるまで両ウィンドウを右方向に移動させる。そして、上記条件が満たされると、該条件が満たされなくなるまで、ウィンドウRのみを右方向に移動させ、ウィンドウRの最初の開始時刻と、ウィンドウRの最後の終了時刻との間を「有音区間」とするとよい。なお、この場合の閾値Vminは、第1実施形態の閾値Vminよりも大きな値にすると好適である。
【0031】
(3)第1実施形態のステップSP8においては、平滑化した得票数の極大値によって拍周期候補C1,C2,……,Cmを求めたが、それ以外の方法で拍周期候補を求めてもよい。その一例を説明しておく。まず、平滑化した投票結果の特性(図5)において、着目している拍区間の前後の広い範囲に渡って得票数を平均化すると、同図の破線に示すような局所的平均値が求まる。ここで、平滑化した投票結果と局所的平均値との差分を求めると、図8に示すような正規化得票数が得られる。
【0032】
次に、横軸と並行な直線であって図8の特性に対して2m回(図示の例ではm=3)交差する直線のうち最もレベルの高いものが検索される。この直線を、図中の破線で示す。正規化得票数がこの破線のレベルよりも高い区間はm個存在する。これら区間において、中心に位置する拍区間、または交差した区間の中で最も得票数の多かった拍区間の中心値を拍周期候補C1,C2,……,Cmとして選択してもよい。
【0033】
(4)また、第1実施形態のステップSP10においては、各拍周期候補C1,C2,……,Cmのうち無音区間の連続性が高い拍周期候補が、最終的な拍周期として推定された。しかし、これ以外の方法によって最終的な拍周期を推定してもよい。例えば、波形データを各拍周期候補で区切った時、各周期内の同一のタイミングに無音区間が位置する頻度が高い拍周期候補を最終的な拍周期にしてもよい。
【0034】
(5)また、第1実施形態のステップSP8,SP10に代わる他の方法として、実際のテンポが存在する拍区間における標準的なピーク形状を予め取得しておき、投票結果の特性(図5)の中から標準的なピーク形状を有する部分をパターン認識によって抽出し、これによって最終的な拍周期を推定してもよい。また、投票結果に対して所定幅の窓関数を畳み込み、その畳み込み結果の値のピーク位置を最終的な拍周期として推定してもよい。
【0035】
(6)また、上記第1実施形態のステップSP10においては、倍音関係にあるピーク同志を、テンポに対応させてグループ化し、これらグループ毎に各ピークのレベルの重み付け加算を行ない、この重み付け後の値の大きなグループのテンポを楽音波形のテンポとして推定してもよい。
【0036】
(7)さらに、第1実施形態と第2実施形態とを組み合わせることによってより精度の高いテンポを求めるようにしてもよい。すなわち、第1実施形態によれば、図5において説明したように、拍周期候補C1,C2,……,Cmが求まる。これら拍周期候補C1,C2,……,Cmのうち、第2実施形態で求めた拍周期の属する拍区間(50msec〜100msec幅)に属するものを優先して最終的な拍周期として推定してもよい。
【0037】
(8)上記各実施形態においては、録音された波形データをそのまま用いてテンポを推定したが、予め波形データにハイパスフィルタリング処理(例えば10kHz以上のみの成分を抽出する)を施し、その結果に基づいてテンポを推定してもよい。これは、種々の音色のうち主として打楽器音がテンポに同期してオン/オフされる傾向が強いことと、打楽器音は他の音色と比較して高周波成分を多く含むことに鑑みてである。
【0038】
【発明の効果】
以上説明したように第1および第2のエンベロープレベルの比に基づいて有音区間または無音区間を検出する構成によれば、有音区間または無音区間を正確に検出することができる。また、かかる有音区間または無音区間に基づいて拍周期を推定する構成によれば、テンポを正確に推定することができる。
【図面の簡単な説明】
【図1】 本発明の第1実施形態の波形解析システムのブロック図である。
【図2】 第1実施形態における波形データ解析プログラムのフローチャートである。
【図3】 同プログラムのステップSP2の動作説明図である。
【図4】 同プログラムのステップSP4の動作説明図である。
【図5】 同プログラムのステップSP8の動作説明図である。
【図6】 同プログラムのステップSP10の動作説明図である。
【図7】 本発明の第2実施形態における波形データ解析プログラムのフローチャートである。
【図8】 第1実施形態の変形例の動作説明図である。
【符号の説明】
2…通信インタフェース、4…入力装置、6…演奏操作子、8…ディスプレイ、10…CPU、12…ROM、14…RAM、16…バス、18…ドライブ装置、20…記憶媒体、22…波形取込インタフェース、24…ハードディスク、26…波形出力インタフェース、28…サウンドシステム。
Claims (8)
- 波形データ上の第1の範囲における第1のエンベロープレベルと、この第1の範囲の直後に隣接し該第1の範囲よりも短い第2の範囲における第2のエンベロープレベルとを検出するエンベロープレベル検出過程と、
前記波形データ上において、前記第1の範囲と前記第2の範囲とを所定時間ずつ順次後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルと前記第2のエンベロープレベルとを順次検出させる過程と、
この順次検出された両エンベロープレベルについて、前記第1のエンベロープレベルの前記第2のエンベロープレベルに対する比が所定値より大きいか否かに基づいて、前記波形データが有音から無音に変化する位置を判定する過程と
を有することを特徴とする波形データ分析方法。 - 波形データ上の第1の範囲における第1のエンベロープレベルと、この第1の範囲の直後に隣接し該第1の範囲よりも短い第2の範囲における第2のエンベロープレベルとを検出するエンベロープレベル検出過程と、
前記第1のエンベロープレベルの前記第2のエンベロープレベルに対する比が所定値よりも大きいというレベル比条件が充足されるまで、前記第1および第2の範囲を隣接させたまま前記波形データの時間軸上で後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルと前記第2のエンベロープレベルとを順次検出させる第1移動過程と、
前記レベル比条件が充足された後、前記第1の範囲を固定したまま、前記レベル比条件が充足されなくなるまで前記第2の範囲を後方に移動させつつ、前記エンベロープレベル検出過程に前記第2のエンベロープレベルを順次検出させる第2移動過程と、
該第2の範囲が移動された範囲に基づいて、前記波形データの無音区間の開始位置および終了位置を判定する判定過程と
を有することを特徴とする波形データ分析方法。 - さらに、前記波形データに対して前記第1移動過程、前記第2移動過程、および、前記判定過程を繰り返し実行させることにより、複数の無音区間のそれぞれの開始位置および終了位置を検出する検出過程と、
前記検出された複数の無音区間のうちの各一対の無音区間の前記開始位置および前記終了位置に基づいて、所定のテンポ範囲に対応する時間関係を有する無音区間の対を検出する対検出過程と、
検出された無音区間の対について、それぞれ、前記所定のテンポ範囲に対応する拍周期の範囲を区切って成る複数の拍区間のうちの、その対における時間範囲に含まれる拍区間に投票を行う投票過程と、
この投票過程による投票結果を平滑化し、平滑化された投票結果に基づいて拍周期を推定する推定過程と
を有することを特徴とする請求項2記載の波形データ分析方法。 - 波形データ上の第1の範囲における第1のエンベロープレベルと、この第1の範囲の直前に隣接し該第1の範囲よりも短い第2の範囲における第2のエンベロープレベルとを検出するエンベロープレベル検出過程と、
前記波形データ上において、前記第1の範囲と前記第2の範囲とを所定時間ずつ順次後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルと前記第2のエンベロープレベルとを順次検出させる過程と、
この順次検出された両エンベロープレベルについて、前記第1のエンベロープレベルの前記第2のエンベロープレベルに対する比が所定値より大きいか否かに基づいて、前記波形データが無音から有音に変化する位置を判定する過程と
を有することを特徴とする波形データ分析方法。 - 波形データ上の第1の範囲における第1のエンベロープレベルと、この第1の範囲の直前に隣接し該第1の範囲よりも短い第2の範囲における第2のエンベロープレベルとを検出するエンベロープレベル検出過程と、
前記第1のエンベロープレベルの前記第2のエンベロープレベルに対する比が所定値よりも大きいというレベル比条件が充足されるまで、前記第1および第2の範囲を隣接させたまま前記波形データの時間軸上で後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルと前記第2のエンベロープレベルとを順次検出させる第1移動過程と、
前記レベル比条件が充足された後、前記第2の範囲を固定したまま、前記レベル比条件が充足されなくなるまで前記第1の範囲を後方に移動させつつ、前記エンベロープレベル検出過程に前記第1のエンベロープレベルを順次検出させる第2移動過程と、
該第1の範囲が移動された範囲に基づいて、前記波形データの有音区間の開始位置および終了位置を判定する判定過程と
を有することを特徴とする波形データ分析方法。 - さらに、前記波形データに対して前記第1移動過程、前記第2移動過程、および、前記判定過程を繰り返し実行させることにより、複数の有音区間のそれぞれの開始位置および終了位置を検出する検出過程と、
前記検出された複数の有音区間のうちの各一対の有音区間の前記開始位置および前記終了位置に基づいて、所定のテンポ範囲に対応する時間関係を有する有音区間の対を検出する対検出過程と、
検出された有音区間の対について、それぞれ、前記所定のテンポ範囲に対応する拍周期の範囲を区切って成る複数の拍区間のうちの、その対における時間範囲に含まれる拍区間に投票を行う投票過程と、
この投票過程による投票結果を平滑化し、平滑化された投票結果に基づいて拍周期を推定する推定過程と
を有することを特徴とする請求項5記載の波形データ分析方法。 - 請求項1ないし6の何れかに記載の波形データ分析方法を実行することを特徴とする波形データ分析装置。
- 請求項1ないし6の何れかに記載の波形データ分析方法を処理装置に実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001088420A JP3780858B2 (ja) | 2001-03-26 | 2001-03-26 | 波形データ分析方法、波形データ分析装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001088420A JP3780858B2 (ja) | 2001-03-26 | 2001-03-26 | 波形データ分析方法、波形データ分析装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002287744A JP2002287744A (ja) | 2002-10-04 |
JP3780858B2 true JP3780858B2 (ja) | 2006-05-31 |
Family
ID=18943517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001088420A Expired - Fee Related JP3780858B2 (ja) | 2001-03-26 | 2001-03-26 | 波形データ分析方法、波形データ分析装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3780858B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101452696B (zh) * | 2007-12-07 | 2012-11-28 | 索尼株式会社 | 信号处理装置、信号处理方法和程序 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4650662B2 (ja) * | 2004-03-23 | 2011-03-16 | ソニー株式会社 | 信号処理装置および信号処理方法、プログラム、並びに記録媒体 |
WO2007004540A1 (ja) * | 2005-07-01 | 2007-01-11 | Pioneer Corporation | コンピュータプログラム、並びに情報再生装置及び方法 |
JP4735398B2 (ja) * | 2006-04-28 | 2011-07-27 | 日本ビクター株式会社 | 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム |
JP5066692B2 (ja) * | 2006-10-25 | 2012-11-07 | 株式会社コルグ | テンポ検出装置 |
-
2001
- 2001-03-26 JP JP2001088420A patent/JP3780858B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101452696B (zh) * | 2007-12-07 | 2012-11-28 | 索尼株式会社 | 信号处理装置、信号处理方法和程序 |
Also Published As
Publication number | Publication date |
---|---|
JP2002287744A (ja) | 2002-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7842874B2 (en) | Creating music by concatenative synthesis | |
US6140568A (en) | System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal | |
US8688251B2 (en) | System and method for automatically producing haptic events from a digital audio signal | |
CN101689225B (zh) | 生成音乐小样和识别相关的歌曲结构 | |
US20130131851A1 (en) | System and method for automatically producing haptic events from a digital audio signal | |
JP3789326B2 (ja) | テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体 | |
US9070370B2 (en) | Technique for suppressing particular audio component | |
CN101093661B (zh) | 一种音高跟踪和播放方法及其系统 | |
Eronen et al. | Music Tempo Estimation With $ k $-NN Regression | |
JP2004538525A (ja) | 周波数分析によるピッチ判断方法および装置 | |
US20160027421A1 (en) | Audio signal analysis | |
CN101093660B (zh) | 一种基于双峰值检测的音符切分方法及其装置 | |
TWI253058B (en) | Method for music analysis | |
JP3780858B2 (ja) | 波形データ分析方法、波形データ分析装置およびプログラム | |
Teixeira et al. | Ulises: a agent-based system for timbre classification | |
JP2010097084A (ja) | 携帯端末、拍位置推定方法および拍位置推定プログラム | |
US7012186B2 (en) | 2-phase pitch detection method and apparatus | |
JP3601373B2 (ja) | 波形編集方法 | |
Wright et al. | Analyzing Afro-Cuban Rhythms using Rotation-Aware Clave Template Matching with Dynamic Programming. | |
US20060150805A1 (en) | Method of automatically detecting vibrato in music | |
JP3534012B2 (ja) | 波形分析方法 | |
JP3915428B2 (ja) | 楽曲分析装置、及びプログラム | |
JPH0675562A (ja) | 自動採譜装置 | |
JP2001067068A (ja) | 音楽パートの識別方法 | |
JP4625935B2 (ja) | 音分析装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060227 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090317 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100317 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110317 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110317 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120317 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |