JP3730144B2 - 類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体 - Google Patents

類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体 Download PDF

Info

Publication number
JP3730144B2
JP3730144B2 JP2001236948A JP2001236948A JP3730144B2 JP 3730144 B2 JP3730144 B2 JP 3730144B2 JP 2001236948 A JP2001236948 A JP 2001236948A JP 2001236948 A JP2001236948 A JP 2001236948A JP 3730144 B2 JP3730144 B2 JP 3730144B2
Authority
JP
Japan
Prior art keywords
binary feature
music
similarity
similar
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001236948A
Other languages
English (en)
Other versions
JP2003044082A (ja
Inventor
邦夫 柏野
秀尚 永野
洋 村瀬
トス ブライアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001236948A priority Critical patent/JP3730144B2/ja
Publication of JP2003044082A publication Critical patent/JP2003044082A/ja
Application granted granted Critical
Publication of JP3730144B2 publication Critical patent/JP3730144B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音楽の断片を検索鍵として与えることにより、数多くの楽曲が蓄積された音楽データベースの中から検索鍵の音楽に類似した楽曲、または検索鍵の音楽に類似した楽曲の該当部分を検索することのできる、類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体に関する。
【0002】
【従来の技術】
類似音楽検索方法として、従来、以下に示す技術が知られている。一つは、特許3065314号(文献1)に示されるように、信号同士の類似性に基づいて、音響信号の断片を、長時間の音響信号中から高速に検索するものである。他の一つは、Asif Ghias, Jonathan Logan, David Chamberlin, Brian C.Smith:”Query by Humming: Musical Information Retrieval in an Audio Database”, ACM Mulch Media, pp.231-236 (1995)(文献2)に示されるように、単旋律どうしの照合法として、単旋律を、その音高の遷移方向のみの情報に置き換えた単純な符号として表現し、効率的に照合を行う方法である。
【0003】
しかしながら、前者は、同一のCDに収録された音楽のように、オリジナルが同一の信号どうしの検索には適するが、同一の曲の別の演奏といったように、オリジナルが同一でない場合には、有効な検索をなし得ないという問題があった。また、後者は、検索鍵とする音楽と蓄積された音楽との双方が、単旋律、すなわち同時に1つの音だけが演奏されるような音楽である場合のみに適用可能であり、同時に複数の音が演奏される多重奏の場合には、有効な検索をなし得ないという問題があった。
【0004】
【発明が解決しようとする課題】
一方、主旋律の一部をハミング等で歌って検索鍵とする音楽検索方法が知られている。例えば、西原祐一、小杉尚子、紺谷精一、山室雅司:「時間正規化を用いたハミング検索システム」情報処理学会研究報告、99−MUS-30,pp.27-32(1999)(文献3)には、あらかじめ音楽データベースにおいて主旋律の単音情報を付与しておき、これと、検索鍵のハミングから抽出した単音情報とを照合する方法が開示されている。また、橋口博樹、西村拓一、赤坂貴史、岡隆一:「鼻歌の旋律と歌詞をクエリーとする楽曲信号のスポッティング検索」信学技報、PRMU2000−118,pp.79-86(2000)(文献4)には、ハミング等と、データベース中の音楽とを、スペクトルログラムで照合する方法が開示されている。
しかしながら、これらいずれの方法においても、検索鍵として与える音楽の断片が、ハミングのような単旋律でない場合には、有効な検索をなし得ないという問題があった。
【0005】
本発明は、上記のような従来の技術の欠点を解決するためになされたものであり、バイナリ特徴系列を用い、かつ、移調や時間伸縮を考慮して音楽の断片同士の照合を行なうことにより、従来容易に実現し得なかった多重奏同士を対象としても有効な検索を行い得る、類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記した課題を解決するために本発明は、あらかじめ音楽信号が蓄積された音楽データベースの中から、検索鍵として与えられる音楽信号に類似した音楽もしくは類似した箇所を探し出す類似音楽検索装置であって、前記音楽データベースに蓄積された音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した蓄積バイナリ特徴系列に変換する蓄積バイナリ特徴系列計算手段と、前記検索鍵となる音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した目的バイナリ特徴系列に変換する目的バイナリ特徴系列計算手段と、前記目的バイナリ特徴系列と前記蓄積バイナリ特徴系列とを比較して類似度を算出する類似度計算手段と、前記類似度に基づいて検出すべき箇所を特定し検索結果として出力する検索結果出力手段とを備えたことを特徴とする。
【0007】
本発明の類似音楽検索装置において、前記類似度計算手段は、前記目的バイナリ特徴系列と蓄積バイナリ特徴系列が移調されている場合、一方を順次移調させながら類似度を計算する移調吸収手段を備えることを特徴とする。
【0008】
本発明の類似音楽検索装置において、前記類似度計算手段は、前記目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合、当該伸縮を吸収しながら類似度を計算する時間伸縮吸収手段を備えることを特徴とする。
【0009】
上記構成により、類似度計算部は、蓄積された音楽データベースから、あるいは検索鍵となる音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した蓄積バイナリ特徴系列、ならびに目的バイナリ特徴系列を取り込み、比較照合することによって類似度を計算し、計算された類似度に基づき検出すべき箇所を特定して検索結果として出力することができる。
このように、バイナリ特徴系列を用い、また、移調や時間伸縮を考慮して音楽の断片同士の比較照合を行うことによって、従来容易に実現し得なかった、多重奏同士を対象としても有効な検索をなし得る類似音楽検索装置を提供することができる。
なお、本発明は、検索鍵とする音楽や、蓄積されている音楽が、MIDI(Musical Instrument Digital Interface)や音符の情報等のように符号として与えられる場合と、音響信号として与えられる場合の双方に適用できる。また、本発明は、検索鍵と蓄積されている音楽の双方において、同時に複数の音が演奏されている多重奏であっても適用し得るものである。
【0010】
上記した課題を解決するために本発明は、あらかじめ音楽信号が蓄積された音楽データベースの中から、検索鍵として与えられる音楽信号に類似した音楽もしくは類似した箇所を探し出す類似音楽検索装置に用いられる類似音楽検索方法であって、前記データベースに蓄積された音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した蓄積バイナリ特徴系列に変換し、前記検索鍵の音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した目的バイナリ特徴系列に変換し、前記目的バイナリ特徴系列と前記蓄積バイナリ特徴系列とを比較し類似度を算出し、前記類似度に基づいて検出すべき箇所を特定し検索結果として出力することを特徴とする。
【0011】
本発明の類似音楽検索方法において、前記類似度の算出において、目的バイナリ特徴系列と蓄積バイナリ特徴系列とが移調されている場合も類似していると判定されるため、それらの一方を順次移調させながら類似度を算出することを特徴とする。
【0012】
本発明の類似音楽検索方法において、前記類似度の算出において、前記目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合も類似していると判定されるため、該伸縮を吸収しながら類似度を計算することを特徴とする。
【0013】
上記した課題を解決するために本発明は、あらかじめ蓄積された音楽データベースの中から、検索鍵として与えられた音楽に類似した音楽もしくは類似した箇所を探し出す類似音楽検索装置に用いられる類似音楽検索プログラムであって、前記音楽データベースに蓄積された音楽から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、蓄積バイナリ特徴系列を導く蓄積バイナリ特徴系列計算ステップと、前記検索鍵の音楽から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、目的バイナリ特徴系列を導く目的バイナリ特徴系列計算ステップと、前記目的バイナリ特徴系列と前記蓄積バイナリ特徴系列とを比較し類似度を算出する類似度計算ステップと、前記類似度に基づいて検出すべき箇所を特定し検索結果として出力する検索結果出力ステップとをコンピュータに実行させることを特徴とする。
【0014】
本発明の類似音楽検索プログラムにおいて、前記第蓄積バイナリ特徴系列計算ステップは、前記音楽データベースに蓄積された音楽信号を読み込む音楽信号読み込みステップと、前記読み込まれた音楽信号の周波数解析を行い短時間パワー値の算出を行なう短時間スペクトル生成ステップと、それぞれの時刻における短時間スペクトルの各要素の中から、その時刻において存在する音楽の基本周波数かまたはその上音であると考えられる要素を抽出する要素抽出ステップと、前記抽出された要素を12音階に対応付けして音の高さを表す符号に変換し、音名として要因リストを生成する要因リスト生成ステップと、前記要因リストにおいて、ある音の上音のうち基本周波数の略整数倍の周波数を持つ音の音名を除去して基本周波数リストを生成する基本周波数リスト生成ステップと、前記基本周波数リストの各基本周波数をバイナリ特徴ベクトルに変換するバイナリ特徴ベクトル変換ステップとをコンピュータに実行させることを特徴とする。
【0015】
本発明の類似音楽検索プログラムにおいて、前記目的バイナリ特徴系列計算ステップは、前記検索鍵となる音楽信号の少なくとも断片を受信する目的音楽信号受信ステップと、前記音響信号の周波数解析を行い短時間パワー値の算出を行なう短時間スペクトル生成ステップと、それぞれの時刻における短時間スペクトルの各要素の中から、その時刻において存在する音楽の基本周波数かまたはその上音であると考えられる要素を抽出する短時間スペクトル時系列要素抽出ステップと、前記抽出された要素を12音階に対応付けして音の高さを表す符号に変換し、音名として要因リストを生成する要因リスト生成ステップと、前記要因リストにおいて、ある音の上音のうち基本周波数の略整数倍の周波数を持つ音の音名を除去して基本周波数リストを生成する基本周波数リスト生成ステップと、前記基本周波数リストの各基本周波数をバイナリ特徴ベクトルに変換するバイナリ特徴ベクトル変換ステップとをコンピュータに実行させることを特徴とする。
【0016】
本発明の類似音楽検索プログラムにおいて、前記バイナリ特徴ベクトル変換ステップは、以下の演算式(1)を計算することにより、前記基本周波数リストの各基本周波数をバイナリ特徴ベクトルに変換するステップをコンピュータに実行させることを特徴とする。
【数3】
Figure 0003730144
【0017】
本発明の類似音楽検索プログラムにおいて、前記類似度計算ステップは、前記目的バイナリ特徴ベクトル時系列と蓄積バイナリ特徴ベクトル時系列を取り込むステップと、前記目的バイナリ特徴ベクトルの時系列を前記蓄積バイナリ特徴ベクトルの時系列上で時間軸方向にずらしながら各部分に対し、以下の演算式(2)を計算することにより順次類似度を算出するステップをコンピュータに実行させることを特徴とする。
【数4】
Figure 0003730144
【0018】
本発明の類似音楽検索プログラムにおいて、前記類似度計算ステップは、前記目的バイナリ特徴系列と蓄積バイナリ特徴系列が移調されている場合、一方を順次移調させながら類似度を計算する移調吸ステップをコンピュータに実行させることを特徴とする。
【0019】
本発明の類似音楽検索プログラムにおいて、前記移調吸収ステップは、前記類似度計算時に前記蓄積バイナリ特徴系列から出力される目的バイナリ特徴ベクトルの各要素をシフトさせて最大12通りに展開してそれぞれの類似度を求め、前記求められた類似度のうちの最大値をその箇所における類似度とみなす類似度計算ステップをコンピュータに実行させることを特徴とする。
【0020】
本発明の類似音楽検索プログラムにおいて、前記類似度計算ステップは、前記目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合、当該伸縮を吸収しながら類似度を計算する時間伸縮吸収ステップをコンピュータに実行させることを特徴とする。
【0021】
本発明の類似音楽検索プログラムにおいて、前記時間伸縮吸収ステップは、前記目的バイナリ特徴ベクトルまたは蓄積バイナリ特徴ベクトルのいずれか一方の時系列について、時間軸方向に一定回数以上連続するバイナリベクトルに着目し、その変化が生じた時点でのバイナリベクトルを抽出して並べる連続バイナリベクトル抽出ステップと、前記連続バイナリベクトルが前記目的バイナリ特徴ベクトルまたは蓄積バイナリ特徴ベクトルのいずれか他方の時系列に、前記並べられた順に含まれるか否かを調べ、含まれる割合を算出するバイナリベクトル含有率計算ステップと、前記割合によって前記類似度計算手段により計算される類似度を補正する類似度補正ステップとをコンピュータに実行させることを特徴とする。
【0022】
本発明の類似音楽検索プログラムにおいて、前記検索結果出力ステップは、前記類似度計算ステップで計算された蓄積バイナリ特徴ベクトルの時系列の各部分における目的バイナリ特徴ベクトルの時系列との類似度値を受信する類似度値受信ステップと、前記類似度値に基づきあらかじめ規定された選択基準に従い検索結果として出力すべきか否かを判定し、検出すべき箇所を特定して検索結果として出力する検索結果出力判定ステップとをコンピュータに実行させることを特徴とする。
【0023】
上記した課題を解決するために本発明は、あらかじめ蓄積された音楽データベースの中から、検索鍵として与えられた音楽に類似した音楽もしくは類似した箇所を探し出す類似音楽検索装置に用いられる類似音楽検索プログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記音楽データベースに蓄積された音楽から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、蓄積バイナリ特徴系列を導く蓄積バイナリ特徴系列計算ステップと、前記検索鍵の音楽から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、目的バイナリ特徴系列を導く目的バイナリ特徴系列計算ステップと、前記目的バイナリ特徴系列と前記蓄積バイナリ特徴系列とを比較し類似度を算出する類似度計算ステップと、前記類似度に基づいて検出すべき箇所を特定し検索結果として出力する第検索結果出力ステップとをコンピュータに実行させる類似音楽検索プログラムを記録したことを特徴とする。
【0024】
本発明の記録媒体において、前記類似度計算ステップは、前記目的バイナリ特徴系列と蓄積バイナリ特徴系列が移調されている場合、一方を順次移調させながら類似度を計算する移調吸収ステップをコンピュータに実行させることを特徴とする。
【0025】
本発明の記録媒体において、前記類似度計算ステップは、前記目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合、当該伸縮を吸収しながら類似度を計算する時間伸縮吸収ステップをコンピュータに実行させることを特徴とする。
【0026】
【発明の実施の形態】
次に、本発明の一実施形態について図面を用いて説明する。
図1は、本発明の一実施形態である類似音楽検索装置の内部構成を機能展開して示したブロック図である。
以下に示す各ブロックは、具体的には、CPUならびにメモリを含む周辺LSIで構成され、CPUがメモリに記録されたプログラムを逐次読み出し実行することによりその機能を実現する。
【0027】
ここに示す類似音楽検索装置は、蓄積バイナリ特徴系列計算手段1と、目的バイナリ特徴系列計算手段2と、類似度計算手段3と、検索結果出力手段4と、情報蓄積手段7とで構成される。
類似音楽検索装置は、検索鍵信号、すなわち見本となる検索したい音楽の断片の音響信号(目的音楽信号)を入力とし、情報蓄積手段7に蓄積された音楽の音響信号(蓄積音楽信号)との類似度があらかじめ設定した値θ(これを探索閾値という)を上回る箇所、およびその付随情報(曲名等)を出力する。
【0028】
蓄積バイナリ特徴系列計算手段1は、情報蓄積手段7に蓄積された蓄積音楽信号71から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、蓄積バイナリ特徴系列を導き、蓄積バイナリ特徴72として情報蓄積手段7に格納する。
目的バイナリ特徴系列計算手段2は、検索鍵の音楽信号(目的音楽信号)から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、目的バイナリ特徴系列を導き、類似度計算手段3へ供給する。
【0029】
類似度計算手段3は、目的バイナリ特徴系列計算手段2によって生成される目的バイナリ特徴系列と、蓄積バイナリ特徴系列計算手段1により生成され、情報蓄積手段72から得られる蓄積バイナリ特徴系列とを比較照合して類似度を算出する機能を持つ。
検索結果出力手段4は、類似度計算手段3により計算される類似度に基づいて検出すベき箇所を特定して検索結果として出力する機能を持つ。
なお、情報蓄積手段7は、音楽の音響信号(蓄積音楽信号)71、蓄積バイナリ特徴系列72の他に、音響信号に付随する、曲名、アーティスト等の付随情報73を格納する。
【0030】
図4は、図1に示す本発明一実施形態の動作を説明するために引用したフローチャートである。
以下、図4のフローチャートを参照しながら図1に示す本発明実施形態の動作について詳細に説明する。
検索に先だち、情報蓄積手段7に、検索の対象となる音楽の音響信号(蓄積音楽信号)71と、曲名等各音楽の付随情報73を蓄積しておくものとする(ステップS41)。これは、公知のデータベース技術を用いて実現可能である。
蓄積バイナリ特徴系列計算手段1は、情報蓄積手段7を介して与えられる蓄積音楽信号71を読み込む(ステップS42)。ここでは、蓄積音楽信号71は音響信号とする。そして、読み込んだ蓄積音楽信号に対し蓄積バイナリ特徴ベクトル系列を算出すべく、まずは周波数解析を行う(ステップS43)。
【0031】
図5に蓄積バイナリ特徴計算手段1による蓄積バイナリ特徴ベクトル系列の算出のための手順がフローチャートで示されている。
先の周波数解析は、フーリエ変換に基づく短時間スペクトルによるものなど、各種考えられるが、ここでは帯域フィルタバンクを用いるものとする。すなわち、75HZから9600Hzまでの7オクターブの帯域に、対数周波数軸上に等間隔となるように、336個のバンドパスフィルタを配置し、それぞれのフィルタにおける出力波形の時間窓内の2乗平均値を計算して短時間パワー値を得、短時間スペクトルを生成する(ステップS431)。
このとき、時間窓としては44msの長さのものを用い、11msずつ時間軸上を移動させながらパワー値の算出を行なう。
【0032】
このようにして得た周波数毎のパワー値、すなわち短時間スペクトルの時系列に基づいて、バイナリ特徴の時系列を計算する。ここで、バイナリ特徴とは、”0”か”1”のいずれかの値を要素にもつ12次元ベクトルである。各次元は、音楽の音階(半音単位)に対応している。すなわち、その時刻において、各次元に対応する楽音が存在していれば”1”、存在していなければ”0”になる。
なお、楽音とは、基本周波数をもつ音のことであり、具体的には、以下のように計算する。
【0033】
まず、それぞれの時刻における短時間スペクトル(336次元ベクトル)の各要素において、ある周波数のパワーが予め定めた値以上であり、かつ、周波数軸方向のローカルピークとなっている要素を抽出する(ステップS432)。この要素は、その時刻において存在している楽音の基本周波数か、またはその上音であると考えられる。このような要素を全て取り出し、かつ、楽譜上の音の高さに対応づけて音名とし、要因リストに格納する(ステップS433)。なお、このように要因リストを生成するステップは、要素の全てを必ずしも楽譜上の音の高さに一度変換することに限定されるものではなく、例えば、連続的な周波数値で処理した後、楽譜上の高さに変換するようにしてもよい。
ここで音名は、音楽の分野で用いられる、A2、E3などといった音の高さを表す符号であり、たとえばA2=440Hzなどと規定することにより、周波数値の対応から容易に求めることができる。
【0034】
次に、要因リストにおいて、倍音(ある音の上音のうち、基本周波数のほぼ整数倍の周波数をもつもの)を除去して、基本周波数リストを得る(ステップS433)。この倍音除去の処理は、例えば、柏野邦夫、中臺一博、木下智義、田中英彦:「音楽情景分析の処理モデルOPTIMAにおける単音の認識」、電子情報通信学会論文誌D-II,J79-D-II,No.11,pp.1751-1761(1996)に開示されている「単音形成処理」によって行なうことが可能である。
このようにして得た基本周波数リストの各基本周波数を、バイナリ特徴ベクトルに変換する(ステップS435)。バイナリ特徴ベクトルヘの変換は、以下の演算式(3)を計算することによって求めることができる。
【数5】
Figure 0003730144
図10に上記したバイナリ特徴ベクトルへの変換処理の一例が示されており、基本周波数リストltに示されたそれぞれの音の高さに相当するベクトルの成分に1が立っている。例えば、「A」に相当するkijには、音符の基準周波数fs=55Hzとして、k11=55、k12=110、k13=220、k14=440等がある。そして、これらのいずれかが、基本周波数リストに含まれていたとき、対応するベクトルの成分「A」(すなわちb1)が1になる。
【0035】
説明を図4に戻し、上記のようにして得られるバイナリ特徴ベクトルの時系列を、情報蓄積手段7に蓄積する(ステップS44)。
次に、目的バイナリ特徴系列計算手段2では、はじめに、目的音楽信号、すなわち検索鍵となる音楽の断片の音響信号を受信する(ステップS45)。そして、目的バイナリ特徴ベクトルの時系列を算出する(ステップS46)。ここでの具体的な処理は、図5にフローチャートで示した蓄積バイナリ特徴計算手段1における処理と同一であるため、重複を回避する意味で説明を省略する。
【0036】
そして、類似度計算を行なう(ステップS47)。類似計算処理については図6にその詳細がフローチャートで示されている。
図6において、類似度計算手段3は、まず、目的バイナリ特徴系列計算手段2から、目的バイナリ特徴ベクトルの時系列を受信する(ステップS471)。次に、情報蓄積手段7を参照して、蓄積バイナリ特徴系列計算手段1によって生成された蓄積バイナリ特徴ベクトルの時系列72を取得する(ステップS472)。
【0037】
XがYの終端に届いたかを判断し(S473)届いていない場合には、類似度計算手段3は、目的バイナリ特徴ベクトルの時系列と、蓄積バイナリ特徴ベクトルの時系列の一部との類似度を計算する。
このとき、類似度P(z)は以下の演算式(2)を計算することによって行なわれ、演算式(3)を計算することにより最終的に合計類似度SBが計算される(ステップS474)。
類似度の計算は、目的バイナリ特徴ベクトルの時系列を、蓄積バイナリ特徴ベクトルの時系列上で時間軸方向にずらしながら、各部分に対して順次行う(ステップS475)。
【数6】
Figure 0003730144
類似度計算の一例を図11に示す。ここでは、音符個数Dが”5”、共通音符Uが”4”となることから上記演算式により類似度は80%となることがわかる。これを各zについて求め、式(3)により合計類似度を求める。
【0038】
説明を図4に戻し、類似度計算の結果は、検索結果出力手段4に供給され、ここで、検索結果出力処理が行なわれる(ステップS48)。検索結果出力処理についての詳細は図7にその詳細がフローチャートで示されている。
図7において、検索結果出力手段4は、類似度計算手段3で計算された、蓄積バイナリ特徴ベクトルの時系列の各部分における、目的バイナリ特徴ベクトルの時系列との類似度値を受け取り(ステップS482)、検索結果として出力すベきか否かを判定する。
この判定は、ある一定の閾値を事前に定めておくか、あるいは、全ての箇所の類似度値のうちの上位数箇所を選択する、などの方法が考えられ、用途に応じていずれを用いてもよいことは自明である。ここでは、前者に示す方法を採用するものとする。ステップS483で閾値と比較され、ここで類似度合値が閾値内にあるか否かが判定され、その判定された箇所に対し、情報蓄積手段7に予め蓄えておいた付随情報、すなわち曲名やアーティスト名等の情報を付加し、検索結果として出力する(ステップS484)。
【0039】
図2は、本発明における類似音楽検索装置の他の実施形態を示すブロック図であり、図1に示す実施形態との差異は、更に、移調吸収手段5を付加したことにある。
類似度計算手段3は、目的バイナリ特徴系列と蓄積バイナリ特徴系列とが移調されている場合も類似していると判定するため、移調吸収手段5は、それらの一方を順次移調させながら類似度を計算するために用いられる。
【0040】
移調吸収手段5による移調吸収処理の手順が図8にフローチャートで示されている。移調吸収手段5では、類似度の計算時に、蓄積バイナリ特徴系列計算手段1から出力された、目的バイナリ特徴ベクトルの各要素をシフトさせ、最大12通りに展開する(ステップS476)。このようにして得た12通りの類似度値のうちの最大値を、その箇所における類似度値とみなす(ステップS477、S478)。
図12にその様子が示されている。図12では、(a)から(f)に向かって入力曲(蓄積バイナリ特徴)が1ビットずつシフトされ、(f)の段階で蓄積バイナリ特徴が目的曲(目的バイナリ特徴)と一致する。その時点での類似度は、音符個数6、共通音符6となるため、類似度は100%となる。
【0041】
図3は、本発明における類似音楽検索装置の更に他の実施形態を示すブロック図であり、図2に示す実施形態との差異は、更に、時間伸縮吸収手段6を付加したことにある。
時間伸縮吸収手段6は、目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合も類似していると判定するため、この伸縮を吸収しながら類似度を計算する。
時間伸縮吸収手段6では、時間軸の伸縮への対応は、公知の方法であるDPマッチングによる方法を用いることが可能である。DPマッチングとは、音楽の時系列パターンを標準の時系列パターンと照合するために動的に時間正規化する方法の代表例あり、現在広く用いられている。
【0042】
その他にも、ランレングス符号による方法を用いることも可能であり、以下に示す演算式により時間伸縮吸収処理が行なわれる。
入力曲のFFS:C={ci},i=1,2,…,…,D
ここでランレングス符号化を行うと、
H={hk},k=1,2,…,…,M
但し、Mは符号変化の回数であり、Hは、L(ci)>αであるようなciのみから成立する(αは特定の音長の閾値)。
目的曲のFSS:R={ri},i=1,2,…,…,D
第二類似度基準Scは、Rに含まれるHの割合であるとして(順序も考慮)、Sc>θのとき類似していると判定する。なお、FSSとは、Feature Symbol Stringsのことをいう。これは各特徴ベクトルをシンボルとして、それを時系列順に並べたものである。
【0043】
図9にランレングスによる時間伸縮吸収処理手順がフローチャートで示されている。図9において、時間伸縮吸収手段6は、はじめに、目的バイナリ特徴ベクトルの時系列について、時間方向に一定回数以上連続するバイナリベクトルに着目し、その変化が生じた時点でのバイナリベクトルを取り出して並ベる(ステップS479)。
なお、図13に示す時間伸縮吸収手段6による処理の一例では、a、c、d、e、gが取り出されたバイナリベクトルであり、蓄積バイナリ特徴との対応を探索することにより時間伸縮処理が行なわれる。
【0044】
次に、これらが、蓄積バイナリ特徴ベクトルの時系列に、その順に含まれるか否かを調べ、含まれていた割合を算出する(ステップS480)。算出された値は、類似度計算手段3において既に説明した処理によって算出した類似度を補足する、第二類似度とみなされる。この場合、検索結果出力手段4では、これら二つの類似度値のそれぞれを総合して、検索結果とすベきか否かを判定する(ステップS481)。例えば、それぞれの類似度値に対する閾値を予め決めておき、いずれかがその閾値を越えた場合に、類似していると判断して検索結果とする。なお、前述の場合とは逆に、蓄積バイナリ特徴ベクトルの時系列について、時間方向に一定回数以上連続するバイナリベクトルを取り出し、これを目的バイナリ特徴ベクトルの時系列に含まれるかの割合を算出する処理としてもよい。
【0045】
図14、図15は、本発明における類似音楽検索装置の動作実験例を説明するために引用した図である。ここでは、動作実験のために、蓄積音楽信号として、演奏家による実際の142曲のアンサンブル演奏を収録して蓄積した。図14に<表1>として示されるように、計142曲は、20の異なる曲と、それらに変化を加えた曲から成っている。
【0046】
まず、20の異なる曲のうちの8曲について、5種類の変化(原曲、移調、楽器変換、テンポ変換、および変奏)を加え、さらに2回演奏を行って80曲とした。次に、20の異なる曲のうちの別の9曲(いずれも3パートのアンサンブル演奏で、ピアノを含む)について、ピアノが単旋律を演奏したものと、通常のように和音を演奏したものとの2種類の変化を設け、それぞれ3回演奏を行って、54曲とした。なお、3回の演奏のうち、2回は同一の演奏家、1回は別の演奏家が演奏した。
その次に、20の異なる曲のうちの別の2曲について、3回演奏を行って、6曲とした。なお、3回の演奏のうち、2回は同一の演奏家、1回は別の演奏家が演奏した。さらに、20の異なる曲のうちの残りの1曲について、2回の演奏(同一の演奏家)を行って、2曲とした。
【0047】
このような、計142曲の蓄積音楽信号の全ての曲から、各1箇所ずつ、20秒間の区間を切り出して、目的信号とし、その他の141曲を対象として照合する実験を行った。すなわち、検索は142回行った。
これらの検索のうち、移調を含む曲を対象とする検索では、図2に示す実施形態を使用し、テンポ変換を含む曲を対象とする検索では、図3に示す実施形態を使用し、それ以外の検索では、図1に示す実施形態を使用した。
【0048】
性能評価は、リコール率Rと、エラー率Eとで行った。Rは、正しい検索結果の数を、検出されるべき曲数で割ったものである。またEは、出力として得られた曲数のうち、誤った曲の割合である。本実験では、類似度の閾値を定めて、閾値を越える類似度を与える曲を全て出力するものとした。すなわち、検索を行っても、結果が0曲のこともあれば、複数曲が出力される場合もありうる。また、正誤は、箇所は問わず、曲名に対して判定した。
【0049】
図15に、実験結果を<表2>として示す。閾値の設定によって結果は変化するが、この結果は平均の誤り率がE=13%となるように設定したときの、変化の仕方別のR値である。
本実験により、最も代表的な音楽のバリエーションである、演奏の違い、ある楽器の単旋律/多重奏の違い、調の違い、楽器の違い、テンポの違いに対して概ね良好な検索結果(R値が69〜100%)が得られることが明らかになった。すなわち、主旋律の符号列を付与するなど人手による処理を介することなく、多重奏の音響信号を検索鍵として、良好な類似音楽検索を行なえることを確かめることができた。
【0050】
なお、上記した本発明実施形態においては、蓄積バイナリ特徴系列計算手段1と、目的バイナリ特徴系列計算手段2と、類似度計算手段3と、検索結果出力手段4と、移調吸収手段5と、時間伸縮吸収手段6のそれぞれで実行される手順をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより本発明における類似音楽検索装置における機能が実行されるものとする。ここでいうコンピュータシステムとは、OSや周辺機器等のハードウアを含むものである。
【0051】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のシステムやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0052】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0053】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0054】
【発明の効果】
以上説明したように本発明によれば、バイナリ特徴系列を用い、また、移調や時間伸縮を考慮して音楽の断片同士の比較照合を行なうことによって、従来容易に実現し得なかった、多重奏同士を対象としても有効な検索をなし得る類似音楽検索装置を提供することができる。
なお、本発明は、検索鍵とする音楽や、蓄積されている音楽が、MIDI(Musical Instrument Digital Interface)や音符の情報等のように符号として与えられる場合と、音響信号として与えられる場合の双方に適用できる。また、本発明は、検索鍵と蓄積されている音楽の双方において、同時に複数の音が演奏されている多重奏であっても適用し得るものである。
【図面の簡単な説明】
【図1】 本発明による類似音楽検索装置の一実施形態を示すブロック図である。
【図2】 本発明による類似音楽検索装置の他の実施形態を示すブロック図である。
【図3】 本発明による類似音楽検索装置の更に他の実施形態を示すブロック図である。
【図4】 本発明実施形態の動作を説明するために引用したフローチャートである。
【図5】 本発明実施形態の動作を説明するために引用したフローチャートである。
【図6】 本発明実施形態の動作を説明するために引用したフローチャートである。
【図7】 本発明実施形態の動作を説明するために引用したフローチャートである。
【図8】 本発明実施形態の動作を説明するために引用したフローチャートである。
【図9】 本発明実施形態の動作を説明するために引用したフローチャートである。
【図10】 バイナリ特徴ベクトルへの変換処理の一例を説明するために引用した動作概念図である。
【図11】 本発明の構成の一つである類似度計算手段による処理の一例を説明するために引用した動作概念図である。
【図12】 本発明の構成の一つである移調吸収手段による処理の一例を説明するために引用した動作概念図である。
【図13】 本発明の構成の一つである時間伸縮吸収手段による処理の一例を説明するために引用した動作概念図である。
【図14】 本発明における類似音楽検索装置の機能を実験するために使用した音楽の種類を説明するために引用した表(表1)である。
【図15】 本発明における類似音楽検索装置の実験結果を説明するために引用した表(表2)である。
【符号の説明】
1…蓄積バイナリ特徴系列計算手段、2…目的バイナリ特徴系列計算手段、3…類似度計算手段、4…検索結果出力手段、5…移調吸収手段、6…時間伸縮吸収手段、7…情報蓄積手段、71…蓄積音楽信号、72…蓄積バイナリ特徴、73…付随情報

Claims (19)

  1. あらかじめ音楽信号が蓄積された音楽データベースの中から、検索鍵として与えられる音楽信号に類似した音楽もしくは類似した箇所を探し出す類似音楽検索装置であって、
    前記音楽データベースに蓄積された音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した蓄積バイナリ特徴系列に変換する蓄積バイナリ特徴系列計算手段と、
    前記検索鍵となる音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した目的バイナリ特徴系列に変換する目的バイナリ特徴系列計算手段と、
    前記目的バイナリ特徴系列と前記蓄積バイナリ特徴系列とを比較して類似度を算出する類似度計算手段と、
    前記類似度に基づいて検出すべき箇所を特定し検索結果として出力する検索結果出力手段とを備えたことを特徴とする類似音楽検索装置。
  2. 前記類似度計算手段は、
    前記目的バイナリ特徴系列と蓄積バイナリ特徴系列が移調されている場合、一方を順次移調させながら類似度を計算する移調吸収手段を備えることを特徴とする請求項1に記載の類似音楽検索装置。
  3. 前記類似度計算手段は、
    前記目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合、当該伸縮を吸収しながら類似度を計算する時間伸縮吸収手段を備えることを特徴とする請求項1または2に記載の類似音楽検索装置。
  4. あらかじめ音楽信号が蓄積された音楽データベースの中から、検索鍵として与えられる音楽信号に類似した音楽もしくは類似した箇所を探し出す類似音楽検索装置に用いられる類似音楽検索方法であって、
    前記データベースに蓄積された音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した蓄積バイナリ特徴系列に変換し、
    前記検索鍵の音楽信号から、各時刻における楽音または楽音の周波数成分の有無を要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した目的バイナリ特徴系列に変換し、
    前記目的バイナリ特徴系列と前記蓄積バイナリ特徴系列とを比較し類似度を算出し、
    前記類似度に基づいて検出すべき箇所を特定し検索結果として出力することを特徴とする類似音楽検索方法。
  5. 前記類似度の算出において、目的バイナリ特徴系列と蓄積バイナリ特徴系列とが移調されている場合も類似していると判定されるため、それらの一方を順次移調させながら類似度を算出することを特徴とする、請求項4に記載の類似音楽検索方法。
  6. 前記類似度の算出において、前記目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合も類似していると判定されるため、該伸縮を吸収しながら類似度を計算することを特徴とする請求項4または請求項5に記載の類似音楽検索方法。
  7. あらかじめ蓄積された音楽データベースの中から、検索鍵として与えられた音楽に類似した音楽もしくは類似した箇所を探し出す類似音楽検索装置に用いられる類似音楽検索プログラムであって、
    前記音楽データベースに蓄積された音楽から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、蓄積バイナリ特徴系列を導く蓄積バイナリ特徴系列計算ステップと、
    前記検索鍵の音楽から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、目的バイナリ特徴系列を導く目的バイナリ特徴系列計算ステップと、
    前記目的バイナリ特徴系列と前記蓄積バイナリ特徴系列とを比較し類似度を算出する類似度計算ステップと、
    前記類似度に基づいて検出すべき箇所を特定し検索結果として出力する検索結果出力ステップとをコンピュータに実行させる類似音楽検索プログラム。
  8. 前記蓄積バイナリ特徴系列計算ステップは、
    前記音楽データベースに蓄積された音楽信号を読み込む音楽信号読み込みステップと、
    前記読み込まれた音楽信号の周波数解析を行い短時間パワー値の算出を行なう短時間スペクトル生成ステップと、
    それぞれの時刻における短時間スペクトルの各要素の中から、その時刻において存在する音楽の基本周波数かまたはその上音であると考えられる要素を抽出する要素抽出ステップと、
    前記抽出された要素を12音階に対応付けして音の高さを表す符号に変換し、音名として要因リストを生成する要因リスト生成ステップと、
    前記要因リストにおいて、ある音の上音のうち基本周波数の略整数倍の周波数を持つ音の音名を除去して基本周波数リストを生成する基本周波数リスト生成ステップと、
    前記基本周波数リストの各基本周波数をバイナリ特徴ベクトルに変換するバイナリ特徴ベクトル変換ステップとをコンピュータに実行させる請求項7に記載の類似音楽検索プログラム。
  9. 前記目的バイナリ特徴系列計算ステップは、
    前記検索鍵となる音楽信号の少なくとも断片を受信する目的音楽信号受信ステップと、
    前記音響信号の周波数解析を行い短時間パワー値の算出を行なう短時間スペクトル生成ステップと、
    それぞれの時刻における短時間スペクトルの各要素の中から、その時刻において存在する音楽の基本周波数かまたはその上音であると考えられる要素を抽出する短時間スペクトル時系列要素抽出ステップと、
    前記抽出された要素を12音階に対応付けして音の高さを表す符号に変換し、音名として要因リストを生成する要因リスト生成ステップと、
    前記要因リストにおいて、ある音の上音のうち基本周波数の略整数倍の周波数を持つ音の音名を除去して基本周波数リストを生成する基本周波数リスト生成ステップと、
    前記基本周波数リストの各基本周波数をバイナリ特徴ベクトルに変換するバイナリ特徴ベクトル変換ステップとをコンピュータに実行させる請求項7に記載の類似音楽検索装置。
  10. 前記バイナリ特徴ベクトル変換ステップは、
    以下の演算式(1)を計算することにより、前記基本周波数リストの各基本周波数をバイナリ特徴ベクトルに変換するステップをコンピュータに実行させる請求項8または9に記載の類似音楽検索プログラム。
    Figure 0003730144
  11. 前記類似度計算ステップは、
    前記目的バイナリ特徴ベクトル時系列と蓄積バイナリ特徴ベクトル時系列を取り込むステップと、
    前記目的バイナリ特徴ベクトルの時系列を前記蓄積バイナリ特徴ベクトルの時系列上で時間軸方向にずらしながら各部分に対し、以下の演算式(2)を計算することにより順次類似度を算出するステップをコンピュータに実行させる請求項7に記載の類似音楽検索プログラム。
    Figure 0003730144
  12. 前記類似度計算ステップは、
    前記目的バイナリ特徴系列と蓄積バイナリ特徴系列が移調されている場合、一方を順次移調させながら類似度を計算する移調吸収ステップをコンピュータに実行させる請求項7または11に記載の類似音楽検索プログラム。
  13. 前記移調吸収ステップは、
    前記類似度計算時に前記蓄積バイナリ特徴系列から出力される目的バイナリ特徴ベクトルの各要素をシフトさせて最大12通りに展開してそれぞれの類似度を求める第1の類似度計算ステップと、
    前記求められた類似度のうちの最大値をその箇所における類似度とみなす第2の類似度計算ステップとをコンピュータに実行させる請求項12に記載の類似音楽検索プログラム。
  14. 前記類似度計算ステップは、
    前記目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合、当該伸縮を吸収しながら類似度を計算する時間伸縮吸収ステップをコンピュータに実行させる請求項7または11に記載の類似音楽検索プログラム。
  15. 前記時間伸縮吸収ステップは、
    前記目的バイナリ特徴ベクトルまたは蓄積バイナリ特徴ベクトルのいずれか一方の時系列について、時間軸方向に一定回数以上連続するバイナリベクトルに着目し、その変化が生じた時点でのバイナリベクトルを抽出して並べる連続バイナリベクトル抽出ステップと、
    前記連続バイナリベクトルが前記目的バイナリ特徴ベクトルまたは蓄積バイナリ特徴ベクトルのいずれか他方の時系列に、前記並べられた順に含まれるか否かを調べ、含まれる割合を算出するバイナリベクトル含有率計算ステップと、
    前記割合によって前記類似度計算手段により計算される類似度を補正する類似度補正ステップとをコンピュータに実行させる請求項14に記載の類似音楽検索プログラム。
  16. 前記検索結果出力ステップは、
    前記類似度計算ステップで計算された蓄積バイナリ特徴ベクトルの時系列の各部分における目的バイナリ特徴ベクトルの時系列との類似度値を受信する類似度値受信ステップと、
    前記類似度値に基づきあらかじめ規定された選択基準に従い検索結果として出力すべきか否かを判定し、検出すべき箇所を特定して検索結果として出力する検索結果出力判定ステップとをコンピュータに実行させる請求項7に記載の類似音楽検索プログラム。
  17. あらかじめ蓄積された音楽データベースの中から、検索鍵として与えられた音楽に類似した音楽もしくは類似した箇所を探し出す類似音楽検索装置に用いられる類似音楽検索プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    前記音楽データベースに蓄積された音楽から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、蓄積バイナリ特徴系列を導く蓄積バイナリ特徴系列計算ステップと、
    前記検索鍵の音楽から、各時刻における楽音または楽音の周波数成分の有無を、要素として予め定めた2種類の値のいずれかをとるベクトルの系列で表した、目的バイナリ特徴系列を導く目的バイナリ特徴系列計算ステップと、
    前記目的バイナリ特徴系列と前記蓄積バイナリ特徴系列とを比較し類似度を算出する類似度計算ステップと、
    前記類似度に基づいて検出すべき箇所を特定し検索結果として出力する第検索結果出力ステップとをコンピュータに実行させる類似音楽検索プログラムを記録した記録媒体。
  18. 前記類似度計算ステップは、
    前記目的バイナリ特徴系列と蓄積バイナリ特徴系列が移調されている場合、一方を順次移調させながら類似度を計算する移調吸収ステップをコンピュータに実行させる請求項17に記載の類似音楽検索プログラムを記録した記録媒体。
  19. 前記類似度計算ステップは、
    前記目的バイナリ特徴系列と蓄積バイナリ特徴系列とが時間軸方向に局所的に伸縮している場合、当該伸縮を吸収しながら類似度を計算する時間伸縮吸収ステップをコンピュータに実行させる請求項17または18に記載の類似音楽検索プログラムを記録した記録媒体。
JP2001236948A 2001-08-03 2001-08-03 類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体 Expired - Fee Related JP3730144B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001236948A JP3730144B2 (ja) 2001-08-03 2001-08-03 類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001236948A JP3730144B2 (ja) 2001-08-03 2001-08-03 類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体

Publications (2)

Publication Number Publication Date
JP2003044082A JP2003044082A (ja) 2003-02-14
JP3730144B2 true JP3730144B2 (ja) 2005-12-21

Family

ID=19068120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001236948A Expired - Fee Related JP3730144B2 (ja) 2001-08-03 2001-08-03 類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体

Country Status (1)

Country Link
JP (1) JP3730144B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009282536A (ja) * 2003-05-30 2009-12-03 National Institute Of Advanced Industrial & Technology 既知音響信号除去方法及び装置
KR100822376B1 (ko) * 2006-02-23 2008-04-17 삼성전자주식회사 곡명을 이용한 음악 주제 분류 방법 및 시스템
JP5082257B2 (ja) * 2006-02-27 2012-11-28 大日本印刷株式会社 音響信号検索装置
JP2008107641A (ja) * 2006-10-26 2008-05-08 Yamaha Corp 音声データ検索装置
JP5093806B2 (ja) * 2008-02-11 2012-12-12 株式会社イクシコム 類似音楽検索システム
JP5078032B2 (ja) * 2008-09-29 2012-11-21 国立大学法人 名古屋工業大学 音源同定方法及び音源同定装置
JP5182892B2 (ja) * 2009-09-24 2013-04-17 日本電信電話株式会社 音声検索方法,音声検索装置および音声検索プログラム
KR101051803B1 (ko) * 2010-12-16 2011-07-25 전자부품연구원 허밍 또는 노래 기반 음원 검색 방법 및 시스템
JP2013117688A (ja) * 2011-12-05 2013-06-13 Sony Corp 音響処理装置、音響処理方法、プログラム、記録媒体、サーバ装置、音響再生装置および音響処理システム
JP6045511B2 (ja) * 2014-01-08 2016-12-14 Psソリューションズ株式会社 音響信号検出システム、音響信号検出方法、音響信号検出サーバー、音響信号検出装置、及び音響信号検出プログラム
KR102240455B1 (ko) * 2019-06-11 2021-04-14 네이버 주식회사 동적 노트 매칭을 위한 전자 장치 및 그의 동작 방법

Also Published As

Publication number Publication date
JP2003044082A (ja) 2003-02-14

Similar Documents

Publication Publication Date Title
JP3908221B2 (ja) 楽譜追跡方法およびその装置
Salamon et al. Melody extraction from polyphonic music signals: Approaches, applications, and challenges
Dannenberg et al. A comparative evaluation of search techniques for query‐by‐humming using the MUSART testbed
Turetsky et al. Ground-truth transcriptions of real music from force-aligned midi syntheses
Dixon On the computer recognition of solo piano music
JP6040809B2 (ja) コード選択装置、自動伴奏装置、自動伴奏方法および自動伴奏プログラム
US20230402026A1 (en) Audio processing method and apparatus, and device and medium
KR20080054393A (ko) 음악 분석
JP3730144B2 (ja) 類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体
JPH1115468A (ja) 楽曲検索方法、楽曲検索装置、楽曲検索システム、及び記録媒体
JP2012506061A (ja) デジタル音楽音響信号の分析方法
JP2000347659A (ja) 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体
KR100702059B1 (ko) 고객 특성이 피드백 반영되는 질의 풀 기반의 유비쿼터스음악 정보 검색 시스템 및 방법
JP3612272B2 (ja) 音楽情報検索装置、音楽情報検索方法および音楽情報検索用プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3934556B2 (ja) 信号識別子の抽出方法及びその装置、信号識別子からデータベースを作成する方法及びその装置、及び、検索時間領域信号を参照する方法及びその装置
Pardo Finding structure in audio for music information retrieval
JP2008257020A (ja) メロディーの類似度算出方法及び類似度算出装置
Duggan Machine annotation of traditional Irish dance music
Gogineni et al. Mridangam artist identification from taniavartanam audio
JPH06202621A (ja) 楽曲演奏情報を利用した楽曲検索装置
De Mulder et al. Factors affecting music retrieval in query-by-melody
JP6421811B2 (ja) コード選択方法およびコード選択装置
JP2004531758A5 (ja)
JP4695781B2 (ja) 音響信号の符号化方法
JP6658785B2 (ja) 自動伴奏方法および自動伴奏装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051005

R151 Written notification of patent or utility model registration

Ref document number: 3730144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091014

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101014

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101014

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111014

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111014

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121014

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121014

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131014

Year of fee payment: 8

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees