JP3764033B2 - 楽曲検索装置および方法 - Google Patents

楽曲検索装置および方法 Download PDF

Info

Publication number
JP3764033B2
JP3764033B2 JP2000208945A JP2000208945A JP3764033B2 JP 3764033 B2 JP3764033 B2 JP 3764033B2 JP 2000208945 A JP2000208945 A JP 2000208945A JP 2000208945 A JP2000208945 A JP 2000208945A JP 3764033 B2 JP3764033 B2 JP 3764033B2
Authority
JP
Japan
Prior art keywords
feature
music
music search
database
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000208945A
Other languages
English (en)
Other versions
JP2002024232A (ja
Inventor
拓一 西村
博樹 橋口
隆一 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2000208945A priority Critical patent/JP3764033B2/ja
Publication of JP2002024232A publication Critical patent/JP2002024232A/ja
Application granted granted Critical
Publication of JP3764033B2 publication Critical patent/JP3764033B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、クエリーの音声の特徴と類似した特徴を有する楽曲を、音楽データベースの中から検索する楽曲検索装置および方法に関する。
【0002】
【従来の技術】
連続DP(たとえば、岡隆一、“連続DPを用いた連続音声認識”,音響学会音声研資料,S78−20,pp,145−152(1978−06))は、ジェスチャ認識や音声認識に用いられてきた基本的なパターンマッチ処理法の一つである。音声の要求に基づいて楽曲を検索する技術として、特願平11−120198号に示される装置がある。この提案では、入力音声の示す音階と楽曲の音階との差分をマッチングすることにより楽曲を検索している。
【0003】
また、“ハミング歌唱を手掛りとするメロディイ検索”,蔭山,高島,信学論(D−II,vol.J77−D−II,no.8,pp.1543−1551,1994),“WWW上での歌声による曲検索システム”,園田,後藤,村岡,信学論(D−II,vol.J82−D−II,no.4,pp.721−731,1999)では、音高と音長に対して連続DPの適用による楽曲検索を行っている。
【0004】
連続DPを以下に説明しておく。
【0005】
クエリーであるTフレームの時系列データを、N次元特徴ベクトル(z(τ,1),…,z(τ,N))の系列として
【0006】
【数1】
Figure 0003764033
【0007】
と表し、同様にデータベースに登録された1つの楽曲の特徴ベクトル系列を
【0008】
【数2】
Figure 0003764033
【0009】
と表す。また、(z(τ,1),…,z(τ,N))と(u(t,1),…,u(t,N))のとの局所距離をd(t,τ)と表記する。局所距離の計算式の一例を以下に示す。
【0010】
【数3】
Figure 0003764033
【0011】
ここで、データベース、クエリーの時間軸をそれぞれt,τと区別している。さらに、点(t,τ)を終点としたクエリーとデータベース上の楽曲との間の特徴ベクトルに関する累積距離をS(t,τ)と表す。連続DPではS(t,τ)を以下のような漸化式で更新する。初期条件(t=0);
【0012】
【数4】
Figure 0003764033
【0013】
【外1】
Figure 0003764033
【0014】
【数5】
Figure 0003764033
【0015】
【数6】
Figure 0003764033
【0016】
【数7】
Figure 0003764033
【0017】
この漸化式では、図1に示す3個の局所パスのうちで累積距離が最小となる値が選択されている。このため、クエリー全体との累積距離S(t,T)は、データベースの時間方向の伸縮が1/2〜2倍であるとしたときの最小の累積距離となっている。連続DPの出力A(t)、すなわち、クエリーとデータベース上の1つの楽曲の特徴ベクトルの累積距離は、重みの和3Tで正規化して
【0018】
【数8】
Figure 0003764033
【0019】
と表される。このような計算をデータベース上の全ての楽曲の特徴ベクトルについて行い、最小の累積距離をまた、検索時にメモリに記憶しておくデータは、
【0020】
【外2】
Figure 0003764033
【0021】
についてS(t,τ),S(t,2,τ),S(t−2,τ),d(t,τ),d(t−1,τ)だけでよいので、楽曲検索装置はデータベースのフレーム数に依存せず、わずか5Tのメモリ量で検索が可能である。
【0022】
【発明が解決しようとする課題】
従来の楽曲検索方法では、楽曲データベース登録される楽曲の特徴およびクエリーとして使用される楽曲の一部の特徴は共に音階の相対変化、具体的には、たとえば、最初の音階から2音階上がり次に1音階下がるというような相対変化としていた。このため、従来では楽曲の波形から直接的に得られるの絶対音階を示す楽曲データからさらに処理を行い、相対音階を求める処理を別に用意しなければならならない。この付加的な処理は一般の楽曲について良好に行なわれる保証はない不具合があった。
【0023】
そこで、本発明の目的は、楽曲に関するユーザの操作および検索処理を簡素化することができる楽曲検索装置および方法を提供することにある。
【0024】
【課題を解決するための手段】
本願発明は、楽曲データベースの特徴は絶対音階の時間的変化とし、絶対音階の時間的変化とクエリーの時間的な相対変化とを比較して、楽曲の検索を行なう。このような着想に基づき、上記目的を達成するために、請求項1の発明は、予め楽曲データベースに登録された楽曲の第1の特徴と、クエリーとして使用される楽曲の一部の第2の特徴とを比較し、第2の特徴と最も類似する楽曲の範囲を検索する楽曲検索装置において、前記第1の特徴を時間軸方向に沿った楽曲の音階の絶対音階群のパワー系列で表し、前記第2の特徴を時間軸方向に沿った楽曲の相対音階で表し、
前記第2の特徴を入力する入力手段と、前記第1の特徴と前記入力手段から入力された前記第2の特徴とを連続DPの手法により比較して第2の特徴に類似する楽曲の範囲を検索する楽曲検索手段とを具え、
所定時間の間隔を有する2つの音階の差分値を時間軸上の異なる時刻について複数組取得し、当該取得した複数組の差分値を並べた系列で前記第2の特徴を表すことを特徴とする。
【0025】
請求項2の発明は、請求項1に記載の楽曲検索装置において、前記入力手段は音声を入力し、入力した音声を分析して前記第2の特徴を取得することを特徴とする。
【0026】
請求項3の発明は、請求項1に記載の楽曲検索装置において、前記データベースには複数の楽曲に関する第1の特徴が登録されており、前記複数の楽曲の第1の特徴と前記第2の特徴を比較することを特徴とする。
【0027】
請求項4の発明は、請求項1に記載の楽曲検索装置において、前記楽曲検索手段により範囲が検索された楽曲を第1の特徴に基づき再生出力する再生出力手段をさらに具えたことを特徴とする。
【0029】
請求項の発明は、予め楽曲データベースに登録された楽曲の第1の特徴と、クエリーとして使用される楽曲の一部の第2の特徴とを比較し、第2の特徴と最も類似する楽曲の範囲を検索する楽曲検索方法において、
前記第1の特徴を時間軸方向に沿った楽曲の音階の絶対音階群のパワー系列で表し、
前記第2の特徴を時間軸方向に沿った楽曲の相対音階で表し、
前記第2の特徴を楽曲検索装置に入力する入力し、
前記楽曲検索装置では、前記第1の特徴と前記入力手段から入力された前記第2の特徴とを連続DPの手法により比較して第2の特徴に類似する楽曲の範囲を検索し、
所定時間の間隔を有する2つの音階の差分値を時間軸上の異なる時刻について複数組取得し、当該取得した複数組の差分値を並べた系列で前記第2の特徴を表すことを特徴とする。
【0030】
請求項の発明は、請求項に記載の楽曲検索方法において、前記楽曲検索装置に音声を入力し、当該入力した音声を前記楽曲検索装置により音響分析して前記第2の特徴を取得することを特徴とする。
【0031】
請求項の発明は、請求項に記載の楽曲検索方法において、前記データベースには複数の楽曲に関する第1の特徴が登録されており、前記楽曲検索装置は前記複数の楽曲の第1の特徴と前記第2の特徴を比較することを特徴とする。
【0032】
請求項の発明は、請求項に記載の楽曲検索方法において、前記楽曲検索装置は範囲が検索された楽曲を第1の特徴に基づき再生出力することを特徴とする。
【0034】
【発明の実施形態】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
【0035】
最初に本発明を適用した楽曲検索法の原理について説明する。
【0036】
クエリーおよびデータベースに登録され、クエリーの比較(距離計算)の対象とされる楽曲の特徴パターンが、従来では主旋律の変化パターン、すなわち、スカラー量の時系列(相対的な音階の変化)で表すのに対し、本実施形態ではデータベースに登録される特徴パターンが、横軸が時間軸、縦軸が音階軸により定まるパワースペクトルの周波数(絶対音階)軸を有する時空間パターンを使用する点が新規特徴である。換言すれば、本実施形態では時空間パターン上にいくつも存在している絶対音階の変化パターンの中から、クエリー(検索の対象の楽曲の一部)の音階変化系列に一致する部分を見出すことに新規特徴がある。このような処理を実行するために本実施形態でも上述の連続DPの手法を使用する。ただし、従来では2次元的な累積距離の計算を行なうのに対し、本実施形態では3次元に拡張した累積距離の計算を行なう。この3次元の連続DPを最初に説明する。
【0037】
音階の総数をNとし、クエリーである音声区間長をT、フレームの音階差分データを{q(τ)|τ=1,…,T}とする。ここで、音階差分データは、入力音声の主たる音階が抽出された後、その時間差分によって定まるものである。時間差分とは、所定時間の間隔を有する2つの音階の差分値であり、該差分値を時間軸上の異なる時刻についての差分値を複数組取得し、当該取得した複数組の差分値を並べた系列で楽曲の音階の変化量を表す。
【0038】
したがって、
【0039】
【外3】
Figure 0003764033
【0040】
としてよい。一方、予め登録される複数組の楽曲の特徴ベクトルの集合(以下、単にデータベースと称することもある)についての分析特徴である、ベクトルの時系列パターンを
【0041】
【数9】
Figure 0003764033
【0042】
とする。ここで、データベース、クエリーの時間軸をそれぞれt,τと区別する。
【0043】
参照の区間時系列データを区間の始終端に依存しない対象の時系列データ中に、最も類似した区間を見出すために本実施形態では連続DPを使用する。ただし、b(t,x)はtフレーム、音階xのパワーを表す。参照データ(クエリーの特徴)をスカラー変化量の時系列パターンとして捉え、検索データ(楽曲の特徴)を時空間パターンとするように連続DPを拡張する。このような連続DPの手法を本願明細書では、Model driven path連続DP(mp−連続DP)と呼ぶことにする。
【0044】
mp−連続DPにおいて、累積すべき局所距離を定めるが、ここでは局所累積距離を、データベースの時刻t、および音階xに対してd(x,t)と表記する。局所距離の計算式の一例を以下に示す。
【0045】
局所距離d(x,t)には、時刻tでのxに対する最大パワーM(t)=max b(t,x)で正規化される量
【0046】
【数10】
Figure 0003764033
【0047】
などを使用することができる。
【0048】
さらに、点(x,τ,t)を終点としたクエリーとデータベースとの累積距離をS(x,τ,t)で表す。mp−連続DPではS(x,τ,t)を以下のような漸化式で更新する。
【0049】
【数11】
S(x,1,t) = 3d(x,t) (11)
【0050】
【数12】
Figure 0003764033
【0051】
境界条件は以下で与えられる。
【0052】
【数13】
Figure 0003764033
【0053】
この漸化式では、連続DP同様、クエリー全体との累積距離S(x,τ,t)は、データベースの時間方向の伸縮が1/2〜2倍であるとしたときの最小の累積距離となっている。
【0054】
mp−連続DPの出力A(t,x)は、重みの和3Tで正規化して
【0055】
【数14】
Figure 0003764033
【0056】
と定める。
【0057】
このとき、検出結果はデータベースの時刻t*と音階x*であり、以下の式で求められる。
【0058】
【数15】
Figure 0003764033
【0059】
ここで、argは、S(x,τ,t)の引数(t,x)を返す関数である。
【0060】
このような距離計算を1つの登録の楽曲について行なうと、距離計算結果の最小値を持つ部分が、1つの楽曲の中のクエリーと最も類似する部分となる。また、全ての楽曲について同様の距離計算を行ない、それぞれ得られる最小値の中の最もも小さい値を持つ楽曲部分が最終的な計算結果となる。
【0061】
このような楽曲検索方法を適用して楽曲検索を行なうための楽曲検索装置の機能構成を図1に示す。
【0062】
図1において、1000はクエリーとして使用する楽曲の一部分から特徴パターンを取得するクエリー取得部である。クエリー取得部では、マイクなどの音響装置から得られる音声信号に対して、FFTなどの通常のスペクトル分析を行い、基本周波数、それに対応する音階を得た後、クエリーとなる音階差分の系列を生成する。音階差分の系列は所定時間の間隔を有する2つの音階の差分値を異なる時刻について複数組取得したものである。
【0063】
1010は複数組の楽曲の各々の特徴パターンを記憶し、データベースの形態で記憶した楽曲データベース構築部である。データベース構築部では、コンパクトディスク(CD)などの楽曲から、スペクトル分析を行い、各音階に対するパワースペクトルを得た後、それらを時空間パターンとしてハードディスクなどの記録媒体に保存しておく。もちろん、楽曲の入力を繰り返すことでデータベースを拡大することができる。
【0064】
1020は楽曲データベース上の特徴パターンとクエリーの特徴パターンとの間との間の距離計算を行なってクエリーに最も類似する楽曲部分を検索するパターン検索処理部である。距離計算には上述のmp−連続DPが使用される。
【0065】
クエリー入力である音声(歌、ハミング)の特徴パターンは音階差分データとして表され、楽曲データベース構築部1010に登録された楽曲の特徴パターン、すなわち、時空間パターンで表される。
【0066】
1030はパターン検索処理部1020の検索結果から、クエリーに最も類似する部分を有する楽曲を楽曲データベース構築部1010から検出し、検出した楽曲の先頭部分から演奏を行なう楽曲演奏部である。
【0067】
パターン検索処理部1020は、音階差分の系列と時空間パターンを基に、上述のmp−連続DPの計算手順にしたがって、累積距離S(x,τ,t)、S(x,T,t)を計算し、時空間パターンの中から音階差分の系列と最も類似した部分の終端(t*,x*)を見つけ出す処理を行う。このとき、出力時刻t*からクエリーの長さTだけ時間を遡れば、入力音声に適合した楽曲部分の頭出しが可能となる。この頭だし処理(楽曲およびその先頭部分の検出)を検索楽曲演奏部1030で行い、演奏(出力する)する。
【0068】
このような機能構成を実際に実現するための楽曲検索装置の一例を図2を参照して次に説明する。図2は楽曲検索装置のシステム構成を示す。楽曲検索装置として市販のパーソナルコンピュータやワークステーションを使用できるので、説明は簡単に留める。
【0069】
図2において、CPU10はシステムメモリ50にローディングされた楽曲検索プログラム(後述)を実行して、本発明に係る楽曲検索処理を実行する。ハードディスク(HD)20は上記楽曲検索プログラムおよびパターン検索処理で使用するパターンデータベース、本実施形態では検索の対象となる複数組の楽曲の時空間パターンを蓄積(記憶)したデータベースを保存している。
【0070】
I/O80は、検索結果の始端時刻に一致するデータベース上の特徴パターンのアドレス位置を検出し、その位置を開始位置として1つの楽曲全体の特徴パターンをハードディスク20のデータベースから読み出してスピーカ30に出力する。スピーカ30は出力された特徴パターンを音響信号に変換して再生出力する。
【0071】
入力インターフェース(I/O)40はマイク70から、検索対象(クエリー)の音声を入力する。システムメモリ50はCPU10が実行する楽曲検索プログラム、CPU10に対する入出力データを一時記憶する。入力装置60はマウスなどのポインティングデバイス(以下、マスク)を有しCPU10に対する動作指示や情報入力を行う。
【0072】
図3および図4は上記楽曲検索プログラムの内容を示す。図3はメイン処理手順を示し、図4は図3内の局所距離および累積距離の計算処理の詳細を示す。図3,図4を参照して楽曲検索処理を説明する。
【0073】
入力装置60からの指示に応じてCPU10はHD20から図3の検索プログラムをシステムメモリ50はローディングし、実行を開始する。
【0074】
図3において、ユーザは、入力装置60からクエリー、この場合、マイク70から検索対象となるクエリーの音声の入力を指示する。この指示に応じて、CPU10はマイクから入出力インターフェース40を介して音声を入力し、図1のクエリー取得部1000としての処理を行って音声信号から取得した特徴パターンをシステムメモリ50に書き込む。
【0075】
また、CPU10は楽曲検索処理で使用するデータの初期設定を行う(ステップS10)。これにより(11)式で説明した初期条件、(13)式で説明した境界条件が設定される。次にCPU10はハードディスク20上の(楽曲)データベースを検索すべく、データベース内の最初のフレーム番号としてt=0を初期設定し、最適パスの始端位置(t0,x0)=(0,0)を設定する。
【0076】
次に、CPU10は、クエリーとして入力した複数枚(τ)の音階差分とデータベースの時空間パターンの局所距離および累積距離を(12)式に従って計算する(ステップS30)。局所距離計算および累積距離計算については後で図4により詳細に説明する。
【0077】
さらに、CPU10は計算された累積距離について、所定期間内の累積距離の極大値検出処理を行い、その極大値を持つ最適パスの始端位置および終端位置を検索結果、換言すれば、クエリーに類似する楽曲の範囲(1つの楽曲の中の類似する一部分)を検索結果としてシステムメモリ50に出力する(記憶する)(ステップS40)。
【0078】
この後、ステップS50で変数tがデータベースの最終フレーム番号に到達するまで、変数tの値をインクリメント(1づつ更新すること)して(ステップS60)、局所距離計算および累積距離計算等を繰り返すと、
これにより1つの楽曲の中のクエリーに最も類似する範囲が検出される。これをデータベース上の複数の楽曲(特徴パターンの形態)について上記処理を実行し、累積距離が最も小さいものが検索結果となる。最終的に、データベース上の楽曲の中で最も類似する個所が検出され、その個所を含む楽曲の始端部も検出される。このときのCPU11が図1のパターン検索処理部1020および楽曲演奏部1030の楽曲先端部検出部として機能する。
【0079】
図3のステップS30の局所距離計算および累積距離計算の詳細を図4に示す。図4において、データベース上のtの時空間パターンとクエリーの1番目の音階差分との間の局所距離を計算すべくクエリー側のフレーム番号τが0に初期設定(ステップS100)され、さらに1にインクリメントされる(S110)。
【0080】
次にt,τ,xに対して、局所距離d(x,t)およびS(x,τ,t)の計算が上述の数式により行われる。音階xは総音階数Nに達する(S170)まで、インクリメントされる(S120)が、到達後は、τのインクリメント(S110)とともに再度、音階番号1(x=1)に初期化(S115に続きS120)される。引続き、τのインクリメントがデータベースの末端Wに達するまで続けられるが、このx,τのインクリメントの最中は、常に、現時点での累積距離S(x,τ,t)と、それまでの累積距離の最大値SMAXの比較が行われることによって、順次SMAXも単調非減少に更新されていく。
【0081】
累積距離計算のすべての手順は、τ=T、x=Nになったとき、そのときのSMAXの値と音階xを返り値として出力し、終了する。図4の処理が終了すると、図3のステップS40に戻る。ここで、τの値がクエリーの最後尾の値Tに、xの値が総音階数Nに到達した時が、現在のtにおける最適パスの終端位置となっている。このtの値の累積距離に帯同されている最適パスの始端位置および累積距離の値からなるデータセット(3つのデータを1組とするデータ)がシステムメモリ50に一時記憶する。
【0082】
本実施形態では、累積計算S(x,τ,t)を計算する際、複数のデータセット全てをシステムメモリ50に記憶すると多量のメモリ領域が必要となるので、t番目(今回)のデータセットとt−1番目のデータ(前回)だけを記憶するメモリ領域だけを用意し、tの値が更新されるごとに今回得られたデータセットを前回の記憶領域に移す。このため、これまで記憶されていたデータセットは新たなデータセットにより上書き記憶により消去される。
【0083】
図3のステップS40の極大値検出処理では、上述の累積距離計算により、τの値がクエリーの最後尾の位置まで到達すると、最適パスの始端位置、終端位置および累積距離のデータセットが得られる。図3の繰り返し計算でtの値がインクリメントされ、これまでに得られた仮の極大値と、今回得られた累積距離の値の大小関係が判定され、今回得られた累積距離が仮の極大値よりも大きい場合には、仮の極大値が今回の累積値で更新される。
【0084】
【実施例】
具体的な計算事例を図5を参照して説明する。人が歌った音律から図aのクエリー取得処理後の、クエリー列を(q(1),q(2),q(3),q(4))=(2,1,−1,0)とする。例えばレ(+2)ミ(+1)ファ(−1)ミ(+0)ミの音律で人が歌った場合などがこれに当る。CDなどの楽曲から、図1のデータベース構築部1010を通じて得られた時系列パターンに対する局所距離を図5で5×10の行列として表現している。行列の行インデックスは音階(ここでは、x1,…,x5の5音階)を表し、列インデックスt1,…,t10はデータベース内の時刻あるいはフレーム番号を表している。さらに、各要素は局所距離に対応し、例えば、x3行t6列目の要素1は、d(x3,t6)=1を表している。
【0085】
累積距離計算(11)式、(12)式によれば、t=t1のとき、
【0086】
【数16】
S(x1 ,1 ,t1 )=S(x2 ,1 ,t1 )=…=S(x10 ,1 ,t1 )=3×0.5 (16)
である。(15)式の値を得るために上の累積距離の最大値をとる必要があるが、この場合全て同じ値(1.5)なので、音階の最初値x1をとる。楽曲検索では、時間tが重要なので、音階の最初値をとっても問題はない。また、mp−連続DPの出力(14)式の値は、以下で与えられる。
【0087】
【数17】
A(x1 ,1 ,t1 )=A(x2 ,1 ,t1 )=…=A(x10 ,1 ,t1 )=1.5/(3T)=0.125 (17)
1,…,t10においても累積距離計算(11)式、(12)式に基づいて計算し、mp−連続DPの出力を求めると、t7のとき、累積距離の最大値は、S(x3,4,t7)=12をとり、t7が所望の楽曲の末端となる。したがって、始端は4時点戻ったt3であり、図5の矢印で記されているときの階差は、クエリーと一致していることが分かる。したがって、これらの矢印で決まる道順が、所望の楽曲の始端から末端までとなっている。
【0088】
上述の実施形態の他に次の形態を実施できる。
1)上述の実施形態では、楽曲の特徴パターンをデータベースの形態で登録しているが、楽曲の音響信号を登録して、検索ごとに音響信号から楽曲の特徴パターンを抽出してもよい。
2)クエリーとして使用する楽曲の特徴パターンそのものを楽曲検索装置に入力してもよい。
3)上述の実施形態では音声を含む楽曲の演奏をマイクで入力で入力し、フーリエ解析し、その中の音声特徴を示すパワースペクトラム成分を取り出し、その成分を時間的にならべることで、楽曲データベースに登録する楽曲の絶対的音階(本発明の第1の特徴)を作成する。これにより演奏などの雑音成分が取り除かれるという効果をも奏する。雑音のない絶対音階を得られる場合には、絶対音階を他の形態で表してもよい。
【0089】
【発明の効果】
以上、説明したように、本発明では、人が歌った音声などの楽曲の絶対音階の時間変化を特徴としているので、従来のように別途楽曲の絶対音階のデータから相対音階の特徴を取り出してデータベースに登録する必要がない。このため、楽曲データベースへの登録が簡素化され、検索も絶対音階と相対音階の双方を取り扱わなくてもよいので、簡素化される。
【0090】
さらには、クエリーとして与える楽曲の一部分が1つ楽曲のどの範囲にあるかを検索したり、楽曲の一部分から楽曲を楽曲データベースの中から探したり多様な用途に本発明を適用することができる。
【図面の簡単な説明】
【図1】本発明実施形態の機能構成を示すブロック図である。
【図2】本発明実施形態のシステム構成を示すブロック図である。
【図3】本発明実施形態の検出処理手順を示すフローチャートである。
【図4】本発明実施形態の局所距離および累積距離の計算処理の詳細を示すフローチャートである。
【図5】本発明実施例を説明するための説明図である。
【符号の説明】
10 CPU
20 HD
30 スピーカ
40 I/O
50 システムメモリ
60 入力装置
70 マイク
80 I/O

Claims (8)

  1. 予め楽曲データベースに登録された楽曲の第1の特徴と、クエリーとして使用される楽曲の一部の第2の特徴とを比較し、第2の特徴と最も類似する楽曲の範囲を検索する楽曲検索装置において、
    前記第1の特徴を時間軸方向に沿った楽曲の音階の絶対音階群のパワー系列で表し、
    前記第2の特徴を時間軸方向に沿った楽曲の相対音階で表し、
    前記第2の特徴を入力する入力手段と、
    前記第1の特徴と前記入力手段から入力された前記第2の特徴とを連続DPの手法により比較して第2の特徴に類似する楽曲の範囲を検索する楽曲検索手段と
    を具え、
    所定時間の間隔を有する2つの音階の差分値を時間軸上の異なる時刻について複数組取得し、当該取得した複数組の差分値を並べた系列で前記第2の特徴を表すことを特徴とする楽曲検索装置。
  2. 請求項1に記載の楽曲検索装置において、前記入力手段は音声を入力し、入力した音声を音響分析して前記第2の特徴を取得することを特徴とする楽曲検索装置。
  3. 請求項1に記載の楽曲検索装置において、前記データベースには複数の楽曲に関する第1の特徴が登録されており、前記複数の楽曲の第1の特徴と前記第2の特徴を比較することを特徴とする楽曲検索装置。
  4. 請求項1に記載の楽曲検索装置において、前記楽曲検索手段により範囲が検索された楽曲を第1の特徴に基づき再生出力する再生出力手段をさらに具えたことを特徴とする楽曲検索装置。
  5. 予め楽曲データベースに登録された楽曲の第1の特徴と、クエリーとして使用される楽曲の一部の第2の特徴とを比較し、第2の特徴と最も類似する楽曲の範囲を検索する楽曲検索方法において、
    前記第1の特徴を時間軸方向に沿った楽曲の音階の絶対音階群のパワー系列で表し、
    前記第2の特徴を時間軸方向に沿った楽曲の相対音階で表し、
    前記第2の特徴を楽曲検索装置に入力する入力し、
    前記楽曲検索装置では、前記第1の特徴と前記入力手段から入力された前記第2の特徴とを連続DPの手法により比較して第2の特徴に類似する楽曲の範囲を検索し、
    所定時間の間隔を有する2つの音階の差分値を時間軸上の異なる時刻について複数組取得し、当該取得した複数組の差分値を並べた系列で前記第2の特徴を表すことを特徴とする楽曲検索方法。
  6. 請求項に記載の楽曲検索方法において、前記楽曲検索装置に音声を入力し、当該入力した音声を前記楽曲検索装置により音響分析して前記第2の特徴を取得することを特徴とする楽曲検索方法。
  7. 請求項に記載の楽曲検索方法において、前記データベースには複数の楽曲に関する第1の特徴が登録されており、前記楽曲検索装置は前記複数の楽曲の第1の特徴と前記第2の特徴を比較することを特徴とする楽曲検索方法。
  8. 請求項に記載の楽曲検索方法において、前記楽曲検索装置は範囲が検索された楽曲を第1の特徴に基づき再生出力することを特徴とする楽曲検索方法。
JP2000208945A 2000-07-10 2000-07-10 楽曲検索装置および方法 Expired - Fee Related JP3764033B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000208945A JP3764033B2 (ja) 2000-07-10 2000-07-10 楽曲検索装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000208945A JP3764033B2 (ja) 2000-07-10 2000-07-10 楽曲検索装置および方法

Publications (2)

Publication Number Publication Date
JP2002024232A JP2002024232A (ja) 2002-01-25
JP3764033B2 true JP3764033B2 (ja) 2006-04-05

Family

ID=18705437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000208945A Expired - Fee Related JP3764033B2 (ja) 2000-07-10 2000-07-10 楽曲検索装置および方法

Country Status (1)

Country Link
JP (1) JP3764033B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010097870A1 (ja) * 2009-02-27 2010-09-02 三菱電機株式会社 音楽検索装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4539647B2 (ja) * 2006-12-13 2010-09-08 ヤマハ株式会社 コンテンツ再生装置
KR100932220B1 (ko) 2008-01-31 2009-12-16 연세대학교 산학협력단 반복 패턴을 이용한 음악 검색 방법 및 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2969527B2 (ja) * 1990-03-27 1999-11-02 日通工株式会社 メロディ認識装置及びそれに使用されるメロディ情報抽出装置
JP3467415B2 (ja) * 1998-12-01 2003-11-17 日本電信電話株式会社 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010097870A1 (ja) * 2009-02-27 2010-09-02 三菱電機株式会社 音楽検索装置
JPWO2010097870A1 (ja) * 2009-02-27 2012-08-30 三菱電機株式会社 音楽検索装置
JP5127982B2 (ja) * 2009-02-27 2013-01-23 三菱電機株式会社 音楽検索装置

Also Published As

Publication number Publication date
JP2002024232A (ja) 2002-01-25

Similar Documents

Publication Publication Date Title
US8170702B2 (en) Method for classifying audio data
Wold et al. Content-based classification, search, and retrieval of audio
KR101292698B1 (ko) 메타데이터 부여 방법 및 장치
Hainsworth et al. Particle filtering applied to musical tempo tracking
US20050086052A1 (en) Humming transcription system and methodology
JP5333517B2 (ja) データ処理装置およびプログラム
CN106095925A (zh) 一种基于声乐特征的个性化歌曲推荐系统
Wold et al. Classification, search and retrieval of audio
Nishimura et al. Music Signal Spotting Retrieval by a Humming Query Using Start Frame Feature Dependent Continuous Dynamic Programming.
KR100978913B1 (ko) Svm기반 복 수의 매칭 알고리즘을 결합한 음원 검색 시스템 및 방법
Tzanetakis et al. A framework for audio analysis based on classification and temporal segmentation
JP4622199B2 (ja) 楽曲検索装置及び楽曲検索方法
JPWO2006137271A1 (ja) 楽曲検索装置、楽曲検索方法および楽曲検索プログラム
JP5395399B2 (ja) 携帯端末、拍位置推定方法および拍位置推定プログラム
JP3764033B2 (ja) 楽曲検索装置および方法
JP2012015809A (ja) 楽曲選択装置、楽曲選択方法および楽曲選択プログラム
JP2003316818A (ja) 情報検索方法及びその装置、コンピュータプログラム
CN101488128B (zh) 基于旋律印记的音乐搜索方法和系统
JP5085577B2 (ja) プレイリスト作成装置、楽曲再生装置、プレイリスト作成方法およびプレイリスト作成プログラム
JP4597714B2 (ja) 情報検索装置および方法ならびにコンピュータプログラム
Díaz-Báñez et al. An efficient DTW-based approach for melodic similarity in flamenco singing
Salamon Pitch analysis for active music discovery
Dupont et al. Audiocycle: Browsing musical loop libraries
JP2008257020A (ja) メロディーの類似度算出方法及び類似度算出装置
JP4631251B2 (ja) メディア検索装置およびメディア検索プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050909

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051108

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060118

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100127

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110127

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120127

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130127

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130127

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees