JP2012234202A - リズムの構造を抽出する方法、複数の音声信号のアイテム間の類似する関係を決定する方法、および、そのプログラム - Google Patents

リズムの構造を抽出する方法、複数の音声信号のアイテム間の類似する関係を決定する方法、および、そのプログラム Download PDF

Info

Publication number
JP2012234202A
JP2012234202A JP2012173010A JP2012173010A JP2012234202A JP 2012234202 A JP2012234202 A JP 2012234202A JP 2012173010 A JP2012173010 A JP 2012173010A JP 2012173010 A JP2012173010 A JP 2012173010A JP 2012234202 A JP2012234202 A JP 2012234202A
Authority
JP
Japan
Prior art keywords
rhythm
time series
rhythm structure
extraction method
structure extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012173010A
Other languages
English (en)
Inventor
Francois Pachet
パシェ、フランソワ
Olivier Delerue
ドゥレリュー、オリビエ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony France SA
Original Assignee
Sony France SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony France SA filed Critical Sony France SA
Publication of JP2012234202A publication Critical patent/JP2012234202A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/40Rhythm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/071Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for rhythm pattern analysis or rhythm style recognition

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】 音楽的構成等のリズム構造に関する情報を自動的且つ効率的に抽出する。
【解決手段】 データベースからリズム構造を抽出する処理において、解析により入力信号を処理して、入力信号に含まれているリズム情報を選択し、解析の実行中に音を合成する。データベースには、例えば打撃音を表すデータが格納されている。入力信号は、例えばスペクトル分析により処理される。
【選択図】図1

Description

本発明は、供給される信号、例えば音楽信号からリズム構造(rhythmic structure)を抽出するリズム構造抽出方法、このリズム構造を用いて信号の類似関係(similarity relation)を判定する類似関係判定方法、リズム構造抽出装置、類似関係判定装置及びコンピュータプログラム製品に関する。本発明は、特に、信号分析(signal analysis)における音の合成(synthesizing sound)に関する。本発明が提供するリズム構造の表現は、例えば楽曲等の所定のアイテム間の類似関係を表すように設計されている。類似するリズムを有する異なる音楽信号は、類似する表現を有する。本発明は、音楽カタログに対して類似性に基づく検索を実行する電子音楽配給(Electronic Music Distribution:EMD)の分野に応用される。音楽カタログには、例えば同様のリズムを有する楽曲を検索するための検索コードを用いてアクセスすることができる。
比較的短い音楽信号に関する音楽的な特徴の抽出について様々な研究がなされている。これら抽出される特徴とは、ピッチ(pitch)、基本周波数(fundamental frequency)、スペクトル特性(spectral characteristics)等である。また、例えばポピュラー音楽の楽曲の抜粋等の比較的長い音楽信号から拍(beat)又はテンポ(temp)を抽出する研究もなされている。
拍及びテンポの抽出に関する参照文献は、インターネットURL、http://stephanus2.socsci.kun.nl/mmm/papers/foot-tapping-bib.htmlphanus2.socsci.kun.nl/mmm/papers/foot-tapping-bib.htmlにも紹介されている。
さらに、1998年1月、ジェイ・アコースト・エスオーシー・エイエム(J. Acoust. Soc. Am)発行のシェイラー・エリック・ディー(Scheirer, Eric D.)著、「アコスティック音楽信号のテンポ及び拍の分析(Tempo and Beat Analysis of Acoustic Musical Signals)」103(1)、第588〜601頁にもテンポ抽出に関する研究が解説されている。
さらに、シェイラー・エリック・ディー(Scheirer, Eric D.)及びスラニー・マルコルム(Slaney Malcolm)を発明者とする国際特許出願公開番号WO9817543A2号、「多特性音声/音楽判定装置(Multifeature Speech/MusicDiscrimination System)」にも特性抽出の技術が開示されている。この技術は、インターネットURL、http://sound.media.mit.edu/ eds/papers.htmlにも解説されている。
上述の国際特許出願に開示されている装置では、音声/音楽判定回路(speech/music discriminator)は、オーディオ信号の複数の特徴データを分類回路(classifier)に入力する。オーディオ信号の個々のフレームから判定される特徴データの幾つか、及び他の入力データは、複数のフレームに亘る特徴の変化(variations)に基づいており、音声における有声(voiced)及び無声(unvoiced)成分の変化(changes)を、音楽におけるより一定の特徴から区別する。この文献では、特徴データに基づき検査点(test point)へのラベル付けを行う種類が異なる複数の分類回路が開示されている。好ましい分類回路の組は、K−dツリー空間分割技術(K-d tree spatial partitioning technique)を含む様々な種類の最隣接法(nearest-neighbor approach)に基づいている。
国際特許出願公開番号WO98/17543A2号
インターネットURL、http://stephanus2.socsci.kun.nl/mmm/papers/foot-tapping-bib.htmlphanus2.socsci.kun.nl/mmm/papers/foot-tapping-bib.html 1998年1月、ジェイ・アコースト・エスオーシー・エイエム(J. Acoust. Soc. Am)発行のシェイラー・エリック・ディー(Scheirer, Eric D.)著、「アコスティック音楽信号のテンポ及び拍の分析(Tempo and Beat Analysis of Acoustic Musical Signals)」103(1)、第588〜601頁
完全な自動的手法(automatic approaches)を用いて高レベルの音楽的特性を抽出する技術は未だ確立されていない。さらに、例えば音色等の他の音楽的次元から厳密に独立させて、楽曲のリズム構造を定義することは困難であった。
上述の技術は、MPEG7にも関連する。MPEG7は、将来のMPEG7標準規格に含まれる「オーディオディスクリプタ(audio descriptors)」に関するレポートの草案を作成中である。しかしながら、この草案は、本願の出願日以前には公開されていない。MPEG7では、「低レベルディスクリプタ(low level descriptor)」を中心とする研究がなされており、本発明では、例えばスペクトル中心(spectral centroid)の文脈において、この低レベルディスクリプタについても検討する。
MPEG7オーディオに関する記事は、インターネットURLhttp://www.iua.upf.es/ xserra/articles/cbmi99/cbmi99.htmlupf.es/ xserra/articles/cbmi99/cbmi99.htmlにおいても参照できる。
本発明は、上述の課題に鑑みてなされたものであり、音楽的構成等のリズム構造に関する情報を自動的に抽出することができる、信頼度が高く効率的なリズム構造抽出方法及び類似関係判定方法を提供することを目的とする。
上述の目的を達成するために、本発明に係るリズム構造抽出方法は、音を表すデータを含むデータベースからリズム構造を抽出するリズム構造抽出方法において、解析により入力信号を処理して、入力信号に含まれているリズム情報を選択するステップと、解析の実行中に音を合成するステップとを有する。
このデータベースは、打撃音を表すデータを含んでいてもよい。
入力信号を処理するステップは、入力信号をスペクトル分析により処理するステップを有していてもよい。
記音を合成するステップは、オンセットピークのタイムシリーズ及び入力信号から新たな打撃音を合成し、新たな打撃音を定義し、繰り返される反復処理を可能とするステップと、算出されるピークシリーズタイムシリーズサイクルが先行するサイクルと同じになるまで、反復処理を繰り返すステップと、入力信号をピーク抽出のために全ての打撃音と比較した後に、2つの異なるタイムシリーズを選択するステップとを有していてもよい。
また、本発明に係るリズム構造抽出方法は、それぞれが1つの打撃音の時間的な貢献(contribution)を表すタイムシリーズとしてリズム構造を定義するステップを有していてもよい。リズム構造を定義するステップは、好ましくは、上述の処理より先に行う。
さらに、本発明に係るリズム構造抽出方法は、複数のオンセットタイムシリーズを組み合わせてリズム構造を構築するステップと、複数のタイムシリーズ内に含まれるリズム情報を削減し、アイテムに対する削減されたリズム情報を抽出するステップと有していてもよい。
好ましくは、このリズム構造抽出方法において、リズム構造は、オーディオ信号における所定のアイテムの数値的表現によって形成され、データベース内の打撃音は、オーディオ信号内に存在する。
また、リズム構造を定義するステップは、それぞれがオーディオ信号における打撃音の1つに対応する時間的貢献を表すタイムシリーズの重なりとしてリズム構造を定義するステップを有していてもよい。
さらに、リズム構造を構築するステップは、複数のオンセットタイムシリーズを組み合わせて入力信号のリズム構造の数値的表現を構築するステップを有していてもよい。
また、リズム構造を削減するステップは、複数のタイムシリーズの相関を分析することにより複数のタイムシリーズに含まれているリズム情報を削減し、オーディオ信号のアイテムに対応する削減されたリズム情報を抽出するステップを有していてもよい。
また、本発明に係る類似関係判定方法は、一方が比較の参照として使用されるオーディオ信号におけるアイテムのリズム構造を比較することにより、アイテム間の類似関係を判定するものであり、上述のリズム構造抽出方法を実行して比較すべきオーディオ信号の各アイテムに対応するリズム構造を判定するステップと、削減されたリズム情報に基づいてオーディオ信号のアイテム間の距離測定を行うステップと、特定の基準を用いて、参照用のアイテムから特定の距離内にあるオーディオ信号のアイテムが同様のリズムを有するものと判定するステップとを有する。
この類似関係判定方法は、参照用のオーディオ信号との類似性に基づいてオーディオ信号のアイテムを選択するステップを有していてもよい。
さらに、リズム構造を定義するステップは、各タイムシリーズが与えられた打撃音の時間的ピークを表すものと定義するステップを有していてもよい。
入力信号を処理するステップは、入力信号に対するピーク抽出処理を実行するステップを有していてもよい。
ピーク抽出処理を実行するステップは、信号を高調波音と雑音として分析することによりピークを抽出するステップを有していてもよい。
また、入力信号を処理するステップは、ピークフィルタリング処理を実行するステップを有していてもよい。
好ましくは、ピークフィルタリング処理を実行するステップは、所定の閾値に達するまで、オーディオ信号における打撃音の発生を表すオンセットタイムシリーズを繰り返し抽出するステップを有する。
さらに、ピークフィルタリング処理を実行するステップは、オーディオ信号と打撃音の相関関数値を算出する相関分析技術により、データベースに格納されている各打撃音とオーディオ信号とを比較するステップを有していてもよい。
さらに、ピークフィルタリング処理を実行するステップは、所定の振幅閾値以下の相関関数値をフィルタリングして除去し、所定の時間閾値以下の発生時間を有するピークをフィルタリングして除去し、所定の質閾値以下の質を有するピークをフィルタリングして除去することにより、処理の結果得られたタイムシリーズのピークの質を評価して、ピーク位置ベクトル及びピーク値ベクトルを有するオンセットタイムシリーズを生成するステップを有していてもよい。
また、本発明に係るリズム構造抽出方法及び類似関係判定方法において、入力信号を処理するステップは、相関分析処理を実行するステップを有していてもよい。
この相関分析処理を実行するステップは、タイムシリーズの相関積を公式化するステップと、相関積からテンポ値を選択するステップと、テンポ値をスケーリングするステップとを有していてもよい。
さらに、相関積を公式化するステップは、信号における2つの主要な打撃音のオンセットタイムシリーズを表す2つのタイムシリーズを入力情報として特定するステップと、入力されたタイムシリーズに含まれているリズム情報を削減した情報を表す数値の組を出力情報として生成するステップと、2つのタイムシリーズの相関積を算出するステップとを有していてもよい。
テンポ値を選択するステップは、信号における顕著な期間を表すテンポ値を選択するステップを有していてもよい。
また、テンポ値を選択するステップは、相関積からテンポ値を抽出するステップを有し、顕著な期間は所定の範囲内から選択してもよい。
テンポ値をスケーリングするステップは、テンポ値及び振幅の値に基づいてタイムシリーズをスケーリングし、新たな正規化されたタイムシリーズの組を生成するステップと、相関積をトリミング及び削減し、所定の範囲内に含まれる正規化された各相関積に対応する値を残すステップとを有していてもよい。
また、テンポ値をスケーリングするステップは、タイムシリーズを相関積によりスケーリングするステップを有していてもよい。
好ましくは、距離の測定値を算出するステップは、オーディオ信号の各アイテムに対するリズムの内部表現に基づいてオーディオ信号2つのアイテムを算出し、相関積から算出されたデータを単純な数値に削減するステップを有する。
距離の測定値を算出するステップは、それぞれがフィルタにおけるタイムシリーズの貢献を表す係数の組として各タイムシリーズの構造の表現を算出するステップと、各フィルタによりタイムシリーズをフィルタリングし、リズムを表す所定の数値を生成するステップとを実行することによりリズムの内部表現を構築する。
また、距離の測定値を算出するステップは、リズムを表現する所定の数値により各信号を表現するステップと、2つの信号間について距離の測定値を算出するステップとを有していてもよい。
本発明において、オーディオ信号のアイテムは、例えば楽曲であり、オーディオ信号は例えば音楽オーディオ信号である。
さらに、データベースに含まれる打撃音は、例えば打楽器により発生された音に基づくオーディオ信号である。
さらに、2つの信号は、例えばバスドラムとスネアドラムの音をそれぞれ表している。
また、本発明に係るリズム構造抽出装置及び類似関係判定装置は、汎用コンピュータと周辺装置とを備え、上述のリズム構造抽出方法又は類似関係判定方法を実現するようプログラミングされている。
また、本発明に係るプログラム製品は、汎用コンピュータの内部メモリにロードされ、汎用コンピュータに上述のリズム構造抽出方法又は類似関係判定方法を実行させる。
以上のように、本発明に係るリズム構造抽出方法は、音を表すデータを含むデータベースからリズム構造を抽出するリズム構造抽出方法において、解析により入力信号を処理して、入力信号に含まれているリズム情報を選択するステップと、解析の実行中に音を合成するステップとを有する。これにより、音楽的構成等のリズム構造に関する情報を自動的且つ効率的に抽出することができる。
また、本発明に係る類似関係判定方法は、一方が比較の参照として使用されるオーディオ信号におけるアイテムのリズム構造を比較することにより、アイテム間の類似関係を判定するものであり、上述のリズム構造抽出方法を実行して比較すべきオーディオ信号の各アイテムに対応するリズム構造を判定するステップと、削減されたリズム情報に基づいてオーディオ信号のアイテム間の距離測定を行うステップと、特定の基準を用いて、参照用のアイテムから特定の距離内にあるオーディオ信号のアイテムが同様のリズムを有するものと判定するステップとを有する。音楽的構成等のリズム構造に関する情報を自動的且つ効率的に抽出し、信号の類似関係を判定することができる。
本発明に基づいて入力信号内の打撃音の発生を検出及び抽出して得られたスペクトルを示す図である。 本発明に基づく質の測定により得られたスペクトルを示す図である。 本発明に基づく処理の全体の流れを説明する図である。 本発明に基づくピークの抽出、評価、及び音合成の処理の流れを説明する図である。
以下、本発明に係るリズム構造抽出方法、類似関係判定方法、リズム構造抽出装置、類似関係判定装置及びコンピュータプログラム製品について、図面を参照して詳細に説明する。
信号を分析して音を合成(synthesize)することにより明白又は自明ではない音の出現を検出することができる。
図1(a)〜(c)の左側は、連続する音のスペクトルを示し、詳しくは、図1(a)に示すスペクトルは、包括的な音(general sound)を示し、図1(b)及び図1(c)のスペクトルは、それぞれ入力信号から合成された音を示している。図1(a)〜(c)の右側に示すスペクトルは、対応する入力信号の打撃音(percussive sound)から検出されたピークを示している。
図2に示すように、上述したピークの質の測定(quality measure of peak)によって、これらピークのローカルエネルギ(local energy)が他の打撃音に対応する他のピークのローカルエネルギより小さい場合であっても、与えられた打撃音の真の発生に実際に対応するピークのみを検出することができる。
本発明の具体例では、以下の2つの処理段階(以下、フェーズという。)を有する。
1)トレーニングフェーズ:このフェーズにおいては、本発明に基づくパラメータの一部が調整(tune)され、関連する楽曲のクラスタ(cluster)及び/又はカテゴリ(category)が生成される。
2)ワーキングフェーズ:このフェーズにおいては、入力された楽曲に類似するクラスタが生成される。
これらフェーズは、以下のような特徴を有している。
1)トレーニングフェーズ
入力:デジタルフォーマットの音楽信号のデータベース、例えば通常20秒以上の長さの波形ファイル(wav)
出力:このデータベースのクラスタ
2)ワーキングフェーズ
入力:デジタルフォーマットの音楽信号のデータベース、例えば通常20秒以上の長さの波形ファイル(wav)
出力:この楽曲とデータベース内の他の楽曲間の距離の測定値(distance measure)。この測定値により、入力された楽曲に類似するリズム構造を有する楽曲を含むクラスタの集合が生成される。
以下、与えられた楽曲に対し、トレーニングフェーズにおいてクラスタを自動的に構築し、ワーキングフェーズにおいて、標準的な分類法を用いて、同様のクラスタを発見する処理に適した楽曲のリズム構造の数値的表現を抽出する本発明のメインモジュールについて説明する。
楽曲のリズム構造抽出
リズム構造は、タイムシリーズ(time series)の重なり(superposition)として定義される。各タイムシリーズは、入力信号における所定の打楽器の打撃音による複数の一時的なピークを表している。ピークは、信号における打撃音の発生(significant contribution)を表している。与えられた入力信号に対して、打撃音のライブラリにおける異なる打楽器に関する、複数のタイムシリーズが抽出される。抽出される異なるタイムシリーズの数は、例えば、2つであってもよい。
これらタイムシリーズが抽出されると、データ削減処理(data reduction process)が行われ、各タイムシリーズの主要な特性が抽出され、タイムシリーズ間の関係が集合的に調べられる。
このデータ削減処理により、各タイムシリーズ及び各タイムシリーズの組合せの様々な自己相関(auto-correlation)及び相関パラメータに関する削減された情報を含む特徴空間(feature space)における多次元点(multi-dimensional point)が生成される。
この処理を包括的に図3に示す。本発明に基づく処理は、少なくとも以下の動作を実行する。
1)スペクトル分析技術を用いて入力信号を前処理し、入力信号における非リズム情報を抑圧する。
2)信号内の打撃音の発生を表す複数のオンセットタイムシリーズ(onset times series)を組み合わせて入力信号のリズム構造の表現を構築する。
3)信号からこれらタイムシリーズを抽出するために、打撃音のライブラリを使用する。
4)音合成モジュール(sound synthesis module)を用いて、打撃音のライブラリを反復的に構築する。
5)タイムシリーズの自己相関及び相互相関積(auto-correlation and cross-correlation products)を算出することにより、タイムシリーズ内に与えられた情報を削減する。
6)タイムシリーズの相関を分析して、単純なテンポ抽出を行う。
7)削減された情報を用いて、2つの楽曲間の距離の測定値を求める。
楽曲用の削減されたリズム情報の抽出は、幾つかのフェーズにより実現される。
まず、信号を前処理し、非リズム情報をフィルタリングする。これにより、信号は単純化され、リズム情報のみを有するようになる。続いて、以下のような処理を行う。
1)チャンネル抽出
・サウンドライブラリの全ての打撃音に対し、入力信号上のピーク抽出を行う。・処理の結果得られたタイムシリーズのピークの質を評価する。
・固定点が決定されるまで、処理を繰り返す。
・抽出が成功したタイムシリーズを合成する。
2)相関分析
・相関積を算出する。
・相関積からテンポを抽出する。
・相関積をスケーリングする。
・相関積に対するトリミング及び削減を行う。
3)2)の結果から距離測定値を算出する。
好適な実施の形態に使用される4つのモジュールの定義
1)非リズム情報をフィルタリングする前処理
この処理では、SMS法(SMS approach)と同様の技術を利用する。すなわち、信号を高調波音と雑音の和として分析する処理は、例えば、1997年ザビエル・セラ(Xavier Serra)著、シー・ローズ(C.Roads)、エス・ポープ(S.Pope)、エー・ピチアリ(A.Picialli)、ジー・ド・ポリ(G.De Poli)編「正弦波と雑音の和による楽音モデリング(Musical Sound Modelling With Sinusoids Plus Noise)」及びスウェッツアンドザイトリンジャパブリッシャ社(Swets & Zeitlinger Publishers)発行の「音楽信号処理(Musical Singal Processing)」等に記述されている技術と同様の技術を用いる。
2)チャンネル抽出
このモジュールは、信号における打撃音の発生を表すオンセットタイムシリーズを抽出する。この抽出処理の流れを図4に示す。この処理は、固定点に達するまで繰り返し実行される。
i)相関の技術を用いて、打撃音のサウンドライブラリ内の各音と信号とを比較する。この処理では、以下に示す式を用いて、tを[1,N]に属する要素とする信号S(t)及びtを[1,N]に属する要素とする楽器音I(t)に関する相関関数Cor(δ)を算出する。
Figure 2012234202
ii)処理の結果得られたタイムシリーズのピークの質の算出及び評価
このモジュールは、以下のような一連のフィルタにより信号をフィルタリングすることにより実現される。
a)例えば、TA=50/100×Max(Cor)として、振幅閾値TAを下回るCor関数の全ての値をフィルタリングして取り除く。
b)「近すぎる」ピーク、すなわち、他のピークとの間の発生時間の間隔が時間閾値TSより小さい全てのピークをフィルタリングして取り除く。TSは、信号において、通常10ミリ秒に設定される。
c)十分に高い質を示す測定値を有さない全てのピークを取り除く。質の測定値は、以下に示す式に基づき、相関信号Cor内のピークtにおけるローカルエネルギと、ピークtの近辺のローカルエネルギQ(Cor)との比として算出される。
Figure 2012234202
通常、picWidthは、500サンプルとし、これは、11025Hzのサンプリングレートで45ミリ秒の期間に相当する。ここで、質閾値TQを50/100Max(Q(cor,t))として、Q(p)>TQを満たすピークのみを残す。これにより得られるオンセットタイムシリーズは、1≦i≦nbPeaksとして、ピークの位置を表すpeakPosition(i)及びピークの値を表すpeakValue(i)といった2つのベクトルにより表現される。
d)ピークのタイムシリーズのこの時点における新たな打撃音が、元の信号と合成される。新たに合成される打撃音は、以下のように定義される。
Figure 2012234202
ここで、tは[1,N]に属する要素とする。
e)楽器Iを新たな楽器newInstに置き換えて、上述の処理を繰り返す。この処理は、算出されたピークタイムシリーズが先行するサイクルと同様に算出されるまで繰り返され、すなわち、固定点反復処理(fixed point iteration)を実行する。
ピーク抽出に対して、信号を全ての打撃音と比較した後、以下の判定基準に基づいて、2つのタイムシリーズを選択する。
・2つのタイムシリーズは異なっていなくてはならず、一方が他方を包含する関係にあってはならない。
・矛盾が生じた場合、すなわち、2つのタイムシリーズの候補が異なる音を有するものである場合、ピーク数が最大のタイムシリーズを選択する。
このような処理により、2つのタイムシリーズが得られ、これらのタイムシリーズは、整合される打楽器のスペクトル中心(spectral centroid)に基づいて区別(sort out)される。例えば、第1のタイムシリーズはバスドラムを表し、第2のタイムシリーズはスネアドラムを表すものとする。ここで、打撃音がバスドラム及びスネアドラムのような音ではない場合であっても、タイムシリーズを定められた順序で生成及び比較することのみを目的として、このような区別を行う。
3)相関分析
このモジュールには、前段のモジュールにより算出され、信号における2つの主要な打撃音のオンセットタイムシリーズを表す2つのタイムシリーズが入力される。また、このモジュールは、このデータを削減し、後の分類(classification)に適するデータを表す数値の組を出力する。この数値のシリーズをTS及びTSとして示す。
このモジュールは、次の処理を実行する。
i)相関積の算出
各タイムシリーズC1,1、C2,2、C1,2は、以下の式に示すように、TS1とTS2の相関積として算出される。
Figure 2012234202
ii)相関積からのテンポ抽出
テンポは、以下の式を用いて相関積から抽出される。
すなわち、t>0として、
MAX=MAX(C1,1(t)+C2,2(t))
なお、ここで、C1,1のエネルギを表すC1,1(0)の検討を避けるために、t>0から開始する。MAXの演算子(index)の値、すなわちIMAXは、可能な乗数(multicative factor)を有する信号における最も顕著な期間(prominent period)を表し、これをテンポと推定する。ここでは、60拍毎分(beat per minute:以下、bpmとする。)〜180bpmのテンポ、すなわち250ミリ秒〜750ミリ秒の期間についてのみ検討する。したがって、顕著な期間がこの範囲内にない場合、次のような乗算又は除算を行う。すなわち、IMAX<250ミリ秒の場合、IMAX=IMAX×2とし、IMAX>750msの場合、IMAX=IMAX/2とする。
iii)相関積のスケーリング
一旦、テンポが抽出されると、続いて、テンポ及び振幅の最大値に基づいて、タイムシリーズをスケーリングして正規化する。以下に示す式により、新たな3つの正規化されたタイムシリーズが算出される。
1,1=C1,1(t×IMAX)/MAX
2,2=C2,2(t×IMAX)/MAX
1,2=C1,2(t×IMAX)/MAX
iv)相関積のトリミング及び削減
ここでは、各正規化されたタイムシリーズについて、0〜1の範囲内の値のみを残す。
4)モジュール3)の結果からの距離測定値の算出
各楽曲のリズムの内部表現に基づいて、2つの楽曲間の距離を測定し、これにより、モジュール3)で算出されたデータは、単純な数値に削減される。
i)リズムの内部表現の構築
それぞれがタイムシリーズにおける櫛形フィルタ(comb filter)の効果(contribution)を表す係数の組として、各タイムシリーズCNi,jの構造(morphology)の表現を算出する。櫛形フィルタF,Fの組は、以下のように定義される。
Figure 2012234202
すなわち、各櫛形フィルタFは、前段のフィルタF(j>i)内の成分(fraction)が重なることを避けるために、素因子(prime fraction)のみを含むという条件で、範囲[0,1]を1/i、2/i、(i−1)/iに分割したものを表している。
関数gauss(t)は、クロスオーバー(crossover)を避けるのに十分な減衰係数(decaying coefficient)を有するガウス関数である。減衰係数は、例えば30に設定される。
タイムシリーズCNを各フィルタFによりフィルタリングすることにより、N個の数値が得られる。
本発明に基づく具体例では、N=8とし、これにより2拍、3拍から最大8拍までのリズムパターンを記述することができる。なお、要求に応じて、Nの値として他の値を使用してもよい。
したがって、3個のタイムシリーズCNijからは、リズムを表す3×8=24個の数値が生成される。
ii)距離に関連付けられた多次元空間内におけるリズムの表現
各音楽信号Sは、上述の方法により、24個の数値により表現される。音楽信号Sと音楽信号S間の距離の測定値は、この空間における自乗差分(squared differences)の重み付け加算値として表される。
Figure 2012234202
重みαの実際の値は、標準的なデータ解析技術を用いて決定される。
本発明によれば、複数の打撃音を含むデータベースを用いてリズムの構造を抽出する方法であって、a)入力信号を入力する段階と、b)前記入力信号に含まれているリズムの情報を選択するため分析手法により前記入力信号を処理する分析段階と、c)前記分析手法を遂行している間、音を合成する合成段階とを具備し、
前記分析段階における上記分析手法は、
繰り返して反復処理して、前記入力信号内のオンセット(頭節の出だし)ピークの時系列データから新しい打撃音を合成して、新しい打撃音を規定する段階、
計算されたピークのシリーズ(系列)サイクルが前のサイクルと同じになるまで、前記反復処理を遂行する段階、および、
前記ピークの抽出のため、前記入力信号を全ての前記打撃音と比較した後、2つの異なる時系列データを選択する段階
を具備する、リズムの構造を抽出する方法が提供される。
好ましくは、当該方法は、各々が打撃音の1つのための一時的な寄与を表している、時系列データとして前記リズムの構造を規定する段階を具備する。
好ましくは、当該方法は、a)複数のオンセット時系列データを組み合わせることにより前記入力信号のリズムの構造を構成する段階と、b)前記複数のオンセット時系列データに含まれる前記リズムの情報を減少させる段階であって、アイテムのための減少されたリズムの情報を抽出する、リズムの情報を減少させる段階とを具備する。
好ましくは、前記リズムの構造を規定する段階は、各々が音声信号内の前記打撃音の1つのため一時的な寄与を表している、複数の時系列データを重畳したものとして前記リズムの構造を規定する段階を具備する。
好ましくは、前記リズムの構造を構成する段階は、複数のオンセット時系列データを組み合わせることにより前記入力信号のリズムの構造の前記数字的な表記を構成する段階を具備する。
好ましくは、前記リズムの情報を減少させる段階は、前記複数の時系列データに含まれる前記リズム情報をその相関積を分析することにより減少させ、その結果、音声信号のアイテムのための減少されたリズムの情報を抽出する段階を具備する。
また本発明によれば、複数の音声信号のアイテム間の類似する関係を、リズムの構造と比較することにより決定する方法であって、前記複数のアイテムの1つが比較のため参照として使用されるものであり、当該方法は、上記いずれかに記載の段階を遂行することによって比較すべき各音声信号のアイテムのためのリズムの構造を決定する段階と、減少されたリズムの情報を基に前記複数の音声信号のアイテム間の距離の測定を遂行する段階とを具備し、それにより、特定の基準における参照アイテムの特定の距離内の音声信号のアイテムが同じリズムを持つと考慮される、
複数の音声信号のアイテム間の類似する関係をリズムの構造を比較することにより決定する方法が提供される。
好ましくは、当該方法は、前記参照音声信号に対するその類似度に基づいて音声信号のアイテムを選択する段階をさらに具備する。
好ましくは、前記リズムの構造を規定する段階は、与えられた打撃音の一時的なピークを表すものとして前記時系列データの各々を規定する段階を具備する。
好ましくは、前記入力信号を処理する段階は、相関分析を行う段階を具備し、前記相関分析を行う段階は、時系列データの相関積を数式化する段階と、前記相関積からテンポ(音の速さ)を選択する段階と、前記テンポをスケールする段階とを具備する。
好ましくは、前記数式化する段階は、下記の諸段階、すなわち、a)前記入力信号として、前記入力信号内の2つの主の打撃音のオンセット時系列データを表す2つ1の時系列データを特定する段階と、b)出力として、前記入力系列に含まれるリズムの情報の減少を表す数の組を提供する段階と、c)前記2つの時系列データの相関積を計算する段階とを具備する。
好ましくは、前記複数の音声信号のアイテム間の距離の測定を行う段階は、音声信号の各アイテムのためのリズムを表す本質的な特性(インターナル)に基づいて前記2つの音声信号のアイテムを計算し、それにより、前記相関積から計算したデータを簡単な数に減少させる、段階を具備する。
好ましくは、前記複数の音声信号のアイテム間の距離の測定を行う段階は、リズムを表す前記本質的な特性(インターナル)を構成する段階を具備し、当該インターナルを構成する段階は下記の処理を行う、a)フィルタの前記時系列データ内の寄与を表すそれぞれの係数の組としての前記時系列データの各々のためのモルフォロジー(形態)についつての表記を計算し、b)各フィルタを時系列データに適用して、それにより、前記リズムを表す所定の数を生成する。
また本発明によれば、コンピュータにおいて実施される、上記いずれかの方法を実施するプログラムが提供される。
本発明のリズムの構造を抽出する方法によれば、音楽的構成などのリズム構造に関する情報を自動的かつ効率的に抽出することができる。
本発明の複数の音声信号のアイテム間の類似する関係をリズムの構造を比較することにより決定する方法によれば、音楽的構成などのリズム構造に関する情報を自動的かつ効率的に抽出し、信号の類似関係を判定することができる。
本発明のプログラムは、上記リズムの構造を抽出する方法、または、複数の音声信号のアイテム間の類似する関係をリズムの構造を比較することにより決定する方法を、コンピュータにおいて実行可能である。

Claims (34)

  1. 音を表すデータを含むデータベースからリズム構造を抽出するリズム構造抽出方法において、
    解析により入力信号を処理して、該入力信号に含まれているリズム情報を選択するステップと、
    上記解析の実行中に上記音を合成するステップとを有するリズム構造抽出方法。
  2. 上記データベースは、打撃音を表すデータを含んでいることを特徴とする請求項1記載のリズム構造抽出方法。
  3. 上記入力信号を処理するステップは、該入力信号をスペクトル分析により処理するステップを有することを特徴とする請求項1又は2記載のリズム構造抽出方法。
  4. 上記音を合成するステップは、
    オンセットピークのタイムシリーズ及び上記入力信号から新たな打撃音を合成し、該新たな打撃音を定義し、繰り返される反復処理を可能とするステップと、
    算出されるピークシリーズタイムシリーズサイクルが先行するサイクルと同じになるまで、上記反復処理を繰り返すステップと、
    上記入力信号をピーク抽出のために全ての打撃音と比較した後に、2つの異なるタイムシリーズを選択するステップとを有することを特徴とする請求項1乃至3いずれか1項記載のリズム構造抽出方法。
  5. それぞれが1つの打撃音の時間的な貢献を表すタイムシリーズとして上記リズム構造を定義するステップを有する請求項1乃至4いずれか1項記載のリズム構造抽出方法。
  6. 複数のオンセットタイムシリーズを組み合わせて上記リズム構造を構築するステップと、
    上記複数のタイムシリーズ内に含まれるリズム情報を削減し、アイテムに対する削減されたリズム情報を抽出するステップと有する請求項1乃至5いずれか1項記載のリズム構造抽出方法。
  7. 上記リズム構造は、オーディオ信号における所定のアイテムの数値的表現によって形成され、上記データベース内の打撃音は、オーディオ信号内に存在することを特徴とする請求項6記載のリズム構造抽出方法。
  8. 上記リズム構造を定義するステップは、それぞれが上記オーディオ信号における打撃音の1つに対応する時間的貢献を表すタイムシリーズの重なりとして上記リズム構造を定義するステップを有することを特徴とする請求項5乃至7いずれか1項記載のリズム構造抽出方法。
  9. 上記リズム構造を構築するステップは、複数のオンセットタイムシリーズを組み合わせて上記入力信号のリズム構造の数値的表現を構築するステップを有することを特徴とする請求項6乃至8いずれか1項記載のリズム構造抽出方法。
  10. 上記リズム構造を削減するステップは、上記複数のタイムシリーズの相関を分析することにより該複数のタイムシリーズに含まれているリズム情報を削減し、オーディオ信号のアイテムに対応する削減されたリズム情報を抽出するステップを有することを特徴とする請求項6乃至9いずれか1項記載のリズム構造抽出方法。
  11. 一方が比較の参照として使用されるオーディオ信号におけるアイテムのリズム構造を比較することにより、アイテム間の類似関係を判定する類似関係判定方法において、
    請求項1乃至10いずれか1項記載のリズム構造抽出方法を実行して比較すべきオーディオ信号の各アイテムに対応するリズム構造を判定するステップと、
    削減されたリズム情報に基づいて上記オーディオ信号のアイテム間の距離測定を行うステップと、
    特定の基準を用いて、参照用のアイテムから特定の距離内にあるオーディオ信号のアイテムが同様のリズムを有するものと判定するステップとを有する類似関係判定方法。
  12. 上記参照用のオーディオ信号との類似性に基づいてオーディオ信号のアイテムを選択するステップを有する請求項11記載の類似関係判定方法。
  13. 上記リズム構造を定義するステップは、各タイムシリーズが与えられた打撃音の時間的ピークを表すものと定義するステップを有することを特徴とする請求項5乃至12いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  14. 上記入力信号を処理するステップは、該入力信号に対するピーク抽出処理を実行するステップを有することを特徴とする請求項1乃至13いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  15. 上記ピーク抽出処理を実行するステップは、信号を高調波音と雑音として分析することによりピークを抽出するステップを有することを特徴とする請求項14記載のリズム構造抽出方法又は類似関係判定方法。
  16. 上記入力信号を処理するステップは、ピークフィルタリング処理を実行するステップを有することを特徴とする請求項1乃至15いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  17. 上記ピークフィルタリング処理を実行するステップは、所定の閾値に達するまで、上記オーディオ信号における打撃音の発生を表すオンセットタイムシリーズを繰り返し抽出するステップを有することを特徴とする請求項16記載のリズム構造抽出方法又は類似関係判定方法。
  18. 上記ピークフィルタリング処理を実行するステップは、オーディオ信号と打撃音の相関関数値を算出する相関分析技術により、上記データベースに格納されている各打撃音と上記オーディオ信号とを比較するステップを有することを特徴とする請求項16又は17記載のリズム構造抽出方法又は類似関係判定方法。
  19. 上記ピークフィルタリング処理を実行するステップは、所定の振幅閾値以下の相関関数値をフィルタリングして除去し、所定の時間閾値以下の発生時間を有するピークをフィルタリングして除去し、所定の質閾値以下の質を有するピークをフィルタリングして除去することにより、処理の結果得られた上記タイムシリーズのピークの質を評価して、ピーク位置ベクトル及びピーク値ベクトルを有するオンセットタイムシリーズを生成するステップを有することを特徴とする請求項16乃至18いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  20. 上記入力信号を処理するステップは、相関分析処理を実行するステップを有することを特徴とする請求項1乃至19いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  21. 上記相関分析処理を実行するステップは、タイムシリーズの相関積を公式化するステップと、該相関積からテンポ値を選択するステップと、該テンポ値をスケーリングするステップとを有することを特徴とする請求項20記載のリズム構造抽出方法又は類似関係判定方法。
  22. 上記相関積を公式化するステップは、
    上記信号における2つの主要な打撃音のオンセットタイムシリーズを表す2つのタイムシリーズを入力情報として特定するステップと、
    上記入力されたタイムシリーズに含まれているリズム情報を削減した情報を表す数値の組を出力情報として生成するステップと、
    上記2つのタイムシリーズの相関積を算出するステップとを有する請求項21記載のリズム構造抽出方法又は類似関係判定方法。
  23. 上記テンポ値を選択するステップは、上記信号における顕著な期間を表すテンポ値を選択するステップを有することを特徴とする請求項21又は22記載のリズム構造抽出方法又は類似関係判定方法。
  24. 上記テンポ値を選択するステップは、上記相関積からテンポ値を抽出するステップを有し、上記顕著な期間は所定の範囲内から選択されることを特徴とする請求項23記載のリズム構造抽出方法又は類似関係判定方法。
  25. 上記テンポ値をスケーリングするステップは、
    上記テンポ値及び振幅の値に基づいて上記タイムシリーズをスケーリングし、新たな正規化されたタイムシリーズの組を生成するステップと、
    上記相関積をトリミング及び削減し、上記所定の範囲内に含まれる正規化された各相関積に対応する値を残すステップとを有する請求項21乃至24いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  26. 上記テンポ値をスケーリングするステップは、上記タイムシリーズを上記相関積によりスケーリングするステップを有することを特徴とする請求項25記載のリズム構造抽出方法又は類似関係判定方法。
  27. 上記距離の測定値を算出するステップは、上記オーディオ信号の各アイテムに対するリズムの内部表現に基づいて該オーディオ信号2つのアイテムを算出し、上記相関積から算出されたデータを単純な数値に削減するステップを有することを特徴とする請求項11乃至26いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  28. 上記距離の測定値を算出するステップは、それぞれがフィルタにおけるタイムシリーズの貢献を表す係数の組として上記各タイムシリーズの構造の表現を算出するステップと、各フィルタによりタイムシリーズをフィルタリングし、上記リズムを表す所定の数値を生成するステップとを実行することにより上記リズムの内部表現を構築することを特徴とする請求項27記載のリズム構造抽出方法又は類似関係判定方法。
  29. 上記距離の測定値を算出するステップは、上記リズムを表現する所定の数値により各信号を表現するステップと、2つの信号間について上記距離の測定値を算出するステップとを有することを特徴とする請求項27又は28記載のリズム構造抽出方法又は類似関係判定方法。
  30. 上記オーディオ信号のアイテムは、楽曲であり、上記オーディオ信号は、音楽オーディオ信号であることを特徴とする請求項1乃至29記載のリズム構造抽出方法又は類似関係判定方法。
  31. 上記データベースに含まれる打撃音は、打楽器により発生された音に基づくオーディオ信号であることを特徴とする請求項1乃至30いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  32. 上記2つの信号は、それぞれバスドラムとスネアドラムの音を表していることを特徴とする請求項22乃至31いずれか1項記載のリズム構造抽出方法又は類似関係判定方法。
  33. 汎用コンピュータと周辺装置とを備え、請求項1乃至32いずれか1項記載のリズム構造抽出方法又は類似関係判定方法を実現するようプログラミングされたリズム構造抽出装置又は類似関係判定装置。
  34. 汎用コンピュータの内部メモリにロードされ、該汎用コンピュータに請求項1乃至32いずれか1項記載のリズム構造抽出方法又は類似関係判定方法を実行させるコンピュータプログラム製品。
JP2012173010A 2000-04-06 2012-08-03 リズムの構造を抽出する方法、複数の音声信号のアイテム間の類似する関係を決定する方法、および、そのプログラム Pending JP2012234202A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP00400948.6 2000-04-06
EP00400948A EP1143409B1 (en) 2000-04-06 2000-04-06 Rhythm feature extractor

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001109158A Division JP2002006839A (ja) 2000-04-06 2001-04-06 リズム構造抽出方法及び類似関係判定方法

Publications (1)

Publication Number Publication Date
JP2012234202A true JP2012234202A (ja) 2012-11-29

Family

ID=8173635

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001109158A Pending JP2002006839A (ja) 2000-04-06 2001-04-06 リズム構造抽出方法及び類似関係判定方法
JP2012173010A Pending JP2012234202A (ja) 2000-04-06 2012-08-03 リズムの構造を抽出する方法、複数の音声信号のアイテム間の類似する関係を決定する方法、および、そのプログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001109158A Pending JP2002006839A (ja) 2000-04-06 2001-04-06 リズム構造抽出方法及び類似関係判定方法

Country Status (4)

Country Link
US (1) US6469240B2 (ja)
EP (1) EP1143409B1 (ja)
JP (2) JP2002006839A (ja)
DE (1) DE60041118D1 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6910035B2 (en) * 2000-07-06 2005-06-21 Microsoft Corporation System and methods for providing automatic classification of media entities according to consonance properties
US6657117B2 (en) * 2000-07-14 2003-12-02 Microsoft Corporation System and methods for providing automatic classification of media entities according to tempo properties
US7035873B2 (en) * 2001-08-20 2006-04-25 Microsoft Corporation System and methods for providing adaptive media property classification
KR100880480B1 (ko) * 2002-02-21 2009-01-28 엘지전자 주식회사 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템
US20030205124A1 (en) * 2002-05-01 2003-11-06 Foote Jonathan T. Method and system for retrieving and sequencing music by rhythmic similarity
US20050022654A1 (en) * 2003-07-29 2005-02-03 Petersen George R. Universal song performance method
WO2005071662A1 (en) * 2004-01-21 2005-08-04 Koninklijke Philips Electronics N.V. Method and system for determining a measure of tempo ambiguity for a music input signal
US7148415B2 (en) * 2004-03-19 2006-12-12 Apple Computer, Inc. Method and apparatus for evaluating and correcting rhythm in audio data
US7626110B2 (en) * 2004-06-02 2009-12-01 Stmicroelectronics Asia Pacific Pte. Ltd. Energy-based audio pattern recognition
US7563971B2 (en) * 2004-06-02 2009-07-21 Stmicroelectronics Asia Pacific Pte. Ltd. Energy-based audio pattern recognition with weighting of energy matches
CN101189610B (zh) * 2005-06-01 2011-12-14 皇家飞利浦电子股份有限公司 用于确定内容项特性的方法和电子设备
EP1941486B1 (en) * 2005-10-17 2015-12-23 Koninklijke Philips N.V. Method of deriving a set of features for an audio input signal
KR100655935B1 (ko) * 2006-01-17 2006-12-11 삼성전자주식회사 화상형성장치 및 화상형성장치 구동제어 방법
US8494842B2 (en) * 2007-11-02 2013-07-23 Soundhound, Inc. Vibrato detection modules in a system for automatic transcription of sung or hummed melodies
CN101471068B (zh) * 2007-12-26 2013-01-23 三星电子株式会社 通过哼唱音乐旋律搜索基于波形的音乐文件的方法和系统
CN101958646B (zh) * 2009-07-17 2013-08-28 鸿富锦精密工业(深圳)有限公司 电源补偿装置及方法
US9053695B2 (en) * 2010-03-04 2015-06-09 Avid Technology, Inc. Identifying musical elements with similar rhythms
JP5454317B2 (ja) 2010-04-07 2014-03-26 ヤマハ株式会社 音響解析装置
JP5560861B2 (ja) * 2010-04-07 2014-07-30 ヤマハ株式会社 楽曲解析装置
US8670577B2 (en) 2010-10-18 2014-03-11 Convey Technology, Inc. Electronically-simulated live music
JP5500058B2 (ja) * 2010-12-07 2014-05-21 株式会社Jvcケンウッド 曲順決定装置、曲順決定方法、および曲順決定プログラム
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
US9160837B2 (en) * 2011-06-29 2015-10-13 Gracenote, Inc. Interactive streaming content apparatus, systems and methods
JP5962218B2 (ja) * 2012-05-30 2016-08-03 株式会社Jvcケンウッド 曲順決定装置、曲順決定方法、および曲順決定プログラム
CN103839538B (zh) * 2012-11-22 2016-01-20 腾讯科技(深圳)有限公司 音乐节奏检测方法及检测装置
US9798974B2 (en) * 2013-09-19 2017-10-24 Microsoft Technology Licensing, Llc Recommending audio sample combinations
US9372925B2 (en) 2013-09-19 2016-06-21 Microsoft Technology Licensing, Llc Combining audio samples by automatically adjusting sample characteristics
JP6946442B2 (ja) * 2017-09-12 2021-10-06 AlphaTheta株式会社 楽曲解析装置および楽曲解析プログラム
CN111816147A (zh) * 2020-01-16 2020-10-23 武汉科技大学 一种基于信息提取的音乐节奏定制方法
CN112990261B (zh) * 2021-02-05 2023-06-09 清华大学深圳国际研究生院 一种基于敲击节奏的智能手表用户识别方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55116386U (ja) * 1979-02-09 1980-08-16
US4674384A (en) * 1984-03-15 1987-06-23 Casio Computer Co., Ltd. Electronic musical instrument with automatic accompaniment unit
JPH0687199B2 (ja) * 1986-09-11 1994-11-02 松下電器産業株式会社 テンポ表示装置
JP3245890B2 (ja) * 1991-06-27 2002-01-15 カシオ計算機株式会社 拍検出装置及びそれを用いた同期制御装置
US5451709A (en) * 1991-12-30 1995-09-19 Casio Computer Co., Ltd. Automatic composer for composing a melody in real time
US5369217A (en) * 1992-01-16 1994-11-29 Roland Corporation Rhythm creating system for creating a rhythm pattern from specifying input data
JPH05333857A (ja) * 1992-05-27 1993-12-17 Brother Ind Ltd 自動採譜装置
AU4341193A (en) * 1992-06-03 1993-12-30 Neil Philip McAngus Todd Analysis and synthesis of rhythm
JPH0659668A (ja) * 1992-08-07 1994-03-04 Brother Ind Ltd リズム楽器の自動採譜装置
JPH0675562A (ja) * 1992-08-28 1994-03-18 Brother Ind Ltd 自動採譜装置
JP3433818B2 (ja) * 1993-03-31 2003-08-04 日本ビクター株式会社 楽曲検索装置
JP2877673B2 (ja) * 1993-09-24 1999-03-31 富士通株式会社 時系列データ周期性検出装置
US6121532A (en) * 1998-01-28 2000-09-19 Kay; Stephen R. Method and apparatus for creating a melodic repeated effect
JPH11338868A (ja) * 1998-05-25 1999-12-10 Nippon Telegr & Teleph Corp <Ntt> 歌詞によるリズムパターンの検索方法及び装置及び歌詞によるリズムパターンの検索プログラムを格納した記憶媒体
US6316712B1 (en) * 1999-01-25 2001-11-13 Creative Technology Ltd. Method and apparatus for tempo and downbeat detection and alteration of rhythm in a musical segment
JP3528654B2 (ja) * 1999-02-08 2004-05-17 ヤマハ株式会社 メロディ生成装置及びリズム生成装置と記録媒体

Also Published As

Publication number Publication date
US20020005110A1 (en) 2002-01-17
EP1143409A1 (en) 2001-10-10
JP2002006839A (ja) 2002-01-11
DE60041118D1 (de) 2009-01-29
EP1143409B1 (en) 2008-12-17
US6469240B2 (en) 2002-10-22

Similar Documents

Publication Publication Date Title
JP2012234202A (ja) リズムの構造を抽出する方法、複数の音声信号のアイテム間の類似する関係を決定する方法、および、そのプログラム
Lee et al. Acoustic chord transcription and key extraction from audio using key-dependent HMMs trained on synthesized audio
US7273978B2 (en) Device and method for characterizing a tone signal
Paulus et al. Measuring the similarity of Rhythmic Patterns.
EP0955592B1 (en) A system and method for querying a music database
Klapuri Musical meter estimation and music transcription
JP2003330460A (ja) 少なくとも2つのオーディオ・ワークの比較方法、少なくとも2つのオーディオ・ワークの比較方法をコンピュータに実現させるためのプログラム、及び、オーディオ・ワークのビートスペクトルの決定方法
JP3789326B2 (ja) テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体
US9378719B2 (en) Technique for analyzing rhythm structure of music audio data
JP6743425B2 (ja) 音信号処理方法および音信号処理装置
Atli et al. Audio feature extraction for exploring Turkish makam music
Tian et al. Towards music structural segmentation across genres: Features, structural hypotheses, and annotation principles
Völkel et al. Automatic genre classification of latin american music using characteristic rhythmic patterns
Thomas et al. Detection of largest possible repeated patterns in indian audio songs using spectral features
Tzanetakis et al. Subband-based drum transcription for audio signals
Lee A system for automatic chord transcription from audio using genre-specific hidden Markov models
Marolt Automatic transcription of bell chiming recordings
JP4926044B2 (ja) 音信号の特徴を記述する装置および方法
Ravelli et al. Automatic rhythm modification of drum loops
Kitahara Mid-level representations of musical audio signals for music information retrieval
JP2002278544A (ja) 採譜方法および採譜装置
Tripodi Setting the rhythm scene: deep learning-based drum loop generation from arbitrary language cues
Lee et al. Music genre classification using a time-delay neural network
Rao et al. Improving polyphonic melody extraction by dynamic programming based dual f0 tracking
Bhaduri et al. Matra and tempo detection for indic Tala-s

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120831

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130625

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131203