JP3844627B2 - 音楽検索システム - Google Patents

音楽検索システム Download PDF

Info

Publication number
JP3844627B2
JP3844627B2 JP32644799A JP32644799A JP3844627B2 JP 3844627 B2 JP3844627 B2 JP 3844627B2 JP 32644799 A JP32644799 A JP 32644799A JP 32644799 A JP32644799 A JP 32644799A JP 3844627 B2 JP3844627 B2 JP 3844627B2
Authority
JP
Japan
Prior art keywords
song
pitch
search key
change
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32644799A
Other languages
English (en)
Other versions
JP2000356996A (ja
Inventor
朋久 姫野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP32644799A priority Critical patent/JP3844627B2/ja
Publication of JP2000356996A publication Critical patent/JP2000356996A/ja
Application granted granted Critical
Publication of JP3844627B2 publication Critical patent/JP3844627B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、多数の曲データを収録した曲データベースから目的とする曲を検索する音楽検索システムに関し、特にマイク等から入力されたメロディーを検索キーとして目的とする曲を曖昧検索する音楽検索システムに関する。
【0002】
【従来の技術】
従来、カラオケでは、曲毎に固有の番号を付加しておき、曲名や歌手名から曲の番号を探すことができるようにした冊子を用いて所望の曲を選択できるようにしている。
しかし、曲名がわからない場合や冊子が手元にない場合は所望の曲を探すことができない。そこで、歌声、鼻歌、ハミング又は楽器音等(以下、単に「メロディ」という)をマイクから入力し、曲データベースに収録された多数の曲データから所望の曲を検索することが提案されている。
【0003】
例えば、特開平8−129393号公報には、マイクから入力されたメロディを旋律データ(音程の経時的変化を表わす数値データ)に変換し、曲データベースに収録された曲の旋律データと比較することにより曲を検索することが記載されている。また、特開平9−293083号公報には、マイクから入力されたメロディを音程データ及びリズムデータに変換し、曲データベースに収録された曲の音程データ及びリズムデータとを比較して、1小節毎に類似率を算出することが記載されている。更に、特開平8−160975号公報には、マイクから入力されたメロディの音程の相対的変化を求め、曲データベースに収録された曲の音程の相対的変化と比較して曲を検索することが記載されている。いずれの場合も、入力されたメロディの音程が収録曲の音程と完全に一致していなくても、検索が可能になっている。
【0004】
【発明が解決しようとする課題】
上述した従来の技術では、いずれもマイクから入力されたメロディを1音づつ分割して旋律データ又は音程データとリズムデータとを作成し、収録曲のデータと比較している。
しかしながら、人間の歌声(鼻歌及びハミングを含む)には半音程度のビブラートがあることが多い。このため、マイクから入力された人間の歌声を1音毎に分析すると極めて複雑になり、曲データベースに収録されている曲データとの比較照合が難しくなる。
【0005】
以上から本発明の目的は、マイク等から入力された人間の歌声(鼻歌やハミングを含む)を基に所望の曲をより確実に検索することができる音楽検索システムを提供することである。
【0006】
【課題を解決するための手段】
上記した課題は、音楽検索に使用する検索キーの作成方法において、曲の旋律データから音程の変化の頂点を抽出し、それらの頂点から誤差範囲Eを超えて音程が変化した頂点を代表点として抽出し、それらの代表点の音程の変化をその変化の大きさによって分類し、その結果に基づいて音程の変化を示す分木データを作成し、前記分木データを数値化して検索キーを作成することを特徴とする音楽検索キーの作成方法により解決する。
また、上記した課題は、複数の曲データを収録した曲データ収録手段と、前記曲データ収録手段に収録された曲の音程の変化に基づいて作成された収録曲検索キーを格納した収録曲検索キー格納手段と、入力された信号をデジタルの旋律データに変換する旋律認識手段と、前記旋律認識手段から出力される前記旋律データの音程の変化に基づいて入力曲検索キーを作成する検索キー作成手段と、前記入力曲検索キーと前記収録曲検索キー格納手段に格納された前記収録曲検索キーとを比較する検索手段とを有し、前記収録曲検索キーが、曲の旋律データから音程の変化の頂点を抽出し、それらの頂点から誤差範囲Eを超えて音程が変化した頂点を代表点として抽出し、それらの代表点の音程の変化をその変化の大きさによって分類し、その結果に基づいて音程の変化を示す分木データをフレーズ毎に作成し、それらの分木データを重ね合わせ、その結果を数値化して作成されたものであり、前記検索キー作成手段は、前記旋律データから音程の頂点を抽出し、それらの頂点から誤差範囲Eを超えて音程が変化した頂点を代表点として抽出し、それらの代表点の音程の変化をその変化の大きさによって分類し、その結果に基づいて音程の変化を示す分木データを作成し、前記分木データを数値化して前記入力曲検索キーを作成することを特徴とする音楽検索システムにより解決する。
【0007】
以下、本発明の作用について説明する。
本発明においては、検索キー作成手段が、旋律認識手段から出力される旋律データを基に音程(音高)の変化を簡略化して表わす入力曲検索キーを作成する。また、収録曲検索キーデータベースには、曲データベースに収録された曲の音程の変化を簡略化して表わす収録曲検索キーを格納している。そして、検索手段により、入力曲検索キーと収録曲検索キー格納手段に格納されている収録曲検索キーとを比較照合して、目的とする曲を検索する。
【0008】
このように、本発明においては、マイク等から入力されたメロディと収録曲の旋律とを1音毎に比較するのではなく、入力音の音程(音高)の変化を簡略化した入力曲検索キーと、収録曲の音程の変化を簡略化した収録曲検索キーとを比較照合して目的とする曲を検索するので、簡略化の際に細かな音程の変化が省略される。これにより、細かな音程の変化に起因する検索ヒット率の低下が回避される。例えば、音程の誤差範囲を決めて、その誤差範囲内の音程の変化を省略することにより、ビブラートの影響を取り除くことができる。
【0009】
また、本発明においては、絶対音階でなく相対的な音程の変化を検索キーとするので、例えばマイク等から入力されたメロディのキー(調)がずれていても、音程の変化の傾向が間違っていなければ所望の曲を検索することができる。
検索キーの作成方法としては、例えば旋律データの音程の変化を調べて音程の変化の頂点を抽出し、これらの頂点から音程の誤差範囲Eを超えて音程が変化した頂点を代表点として抽出して、これらの代表点に着目した音程の変化を表わす検索キーを作成する。このようにして作成された検索キーは、曲の音程の変化の傾向が表わされており、細かな音程の変化が省略されている。収録曲検索キー及び入力曲検索キーを同じアルゴリズムで作成して、入力曲検索キーと収録曲検索キーとを比較照合することにより、目的とする曲をより確実に検索することができる。
【0010】
ところで、一般的な楽曲では、音域の範囲が1オクターブから2オクターブ程度であることが多く、ある代表点から次の代表点への音程(音高)の変化が上向きであるときは、更に次の代表点への音程の変化が上向きとなる可能性は、下向きとなる可能性に比べて小さくなる。この場合は、音高の変化が上向きのときの分類を荒くし、下向きのときの分類に細かくすることにより、検索キーのもつ情報量を効率よく上げることができる。また、ある代表点から次の代表点への音程の変化が下向きであるときは、更に次の代表点への音程の変化が下向きとなる可能性は、上向きとなる可能性に比べて小さくなる。この場合は、音高の変化が下向きのときの分類を荒くし、上向きのときの分類を細かくすることにより、検索キーの持つ情報量を効率よく上げることができる。
【0011】
このように、ある代表点から次の代表点への音程の変化が上向きか下向きかに応じて更に次の代表点への音程の変化の評価アルゴリズムを変えることにより、検索キーのもつ情報量を効率よく上げることができて、より一層正確な楽曲の検索が可能となる。
【0012】
【発明の実施の形態】
以下、本発明の実施の形態について、添付の図面を参照して説明する。
(第1の実施の形態)
図1は本発明の第1の実施の形態の音楽検索システムの構成を示すブロック図である。なお、本実施の形態は本発明をカラオケに適用した例を示す。
【0013】
この音楽検索システムは、通信回線を介して接続されたサーバ20及び端末装置10により構成されており、サーバ20には多数の曲データを磁気記録装置等に収録してなる曲データベース21が構築されている。本実施の形態では、サーバ20にはMIDI(musical instrument digital interface)形式で曲データが収録されているものとする。
【0014】
端末装置10は、マイク11、旋律認識部12、検索エンジン13、表示部14、キー作成部15及び検索キーデータベース16により構成されている。マイク11に入力された歌声、鼻歌、ハミング又は楽器音は、アナログの電気信号に変換されて旋律認識部12に入力される。旋律認識部12は、入力されたアナログの電気信号をA/D(アナログ−デジタル)変換して数秒間分保持する。そして、保持したデジタル信号を例えば高速フーリエ変換(Fast Fourier Transform)してデジタルの旋律データに変換する。
【0015】
キー作成部15は、旋律認識部12から旋律データを入力して、後述するアルゴリズムにより検索キー(入力曲検索キー)を作成する。また、キー作成部15は曲データベース21からMIDIデータを入力し、入力曲検索キーの作成アルゴリズムと同様のアルゴリズムで収録曲の検索キー(収録曲検索キー)も作成する。
【0016】
キー作成部15で作成された収録曲検索キーは検索キーデータベース16に格納される。予め、検索キーデータベース16には、曲データベース21に収納されている全ての曲の検索キーを格納しておくことが好ましいが、サーバ20から端末装置10に新しい曲が呼び出されるたびにその曲の収録曲検索キーを作成するようにしてもよい。また、予めサーバ20又はその他の装置により作成された収録曲検索キーを検索キーデータベース16に転送して格納してもよい。
【0017】
また、入力曲検索キーは、キー作成部15から旋律認識部12を介して検索エンジン13に伝達される。検索エンジン13は、入力曲検索キーと検索キーデータベース16に記録されている収録曲検索キーとを比較照合して該当する曲を検索し、その検索結果を表示部14に表示する。
なお、端末装置10はマイクロコンピュータと該マイクロコンピュータの動作手順を決めるソフトウェアを記録した記録装置とを有しており、旋律認識部12はA/Dコンバータ等のハードウェアとソフトウェアとにより実現され、検索エンジン13及びキー作成部15はソフトウェアにより実現され、検索キーデータベース16は磁気記録装置とそれに記録された収録曲検索キーとにより実現される。
【0018】
以下、検索キーの作成アルゴリズムについて説明する。以下の例は、曲データベース21に収録された曲データから収録曲検索キーを作成する場合について説明する。なお、この例に使用した曲は「ちょうちょう」である。
まず、キー作成部15は、サーバ20から曲データ(MIDIデータ)を入力すると、音高(音程)の時間に対する変化を調べる。図2(a)はサーバ20から入力された曲データの旋律(簡略化前の旋律)を示す模式図であり、横軸が時間、縦軸が音高である。この例では、1オクターブを半音毎の12音に分割しており、半音を1単位としている。なお、マイク11からメロディを入力した際に旋律認識部12からキー作成部15に出力される旋律データも、これと同様のデータ形式である。
【0019】
キー作成部15では、図2(a)に示すような旋律データをフレーズに分割する。ここでは、図2(b)に示すように、4小節単位で付点四分音符以上の長さ(時間)があるところをフレーズの区切りとしている。なお、MIDIデータに含まれるデータにより1小節を判別して一定数の小節毎にフレーズを区切ってもよい。
【0020】
次に、図2(c)に示すように、各フレーズの旋律データを簡略化する。旋律データの簡略化は、以下の4つのステップによる。
▲1▼第1ステップ
旋律データの頂点(山及び谷)を抽出する。例えば、旋律データの頂点は図3中に(1)から(21)の数字で示した部分である。旋律認識部12は、旋律データから各頂点の位置(時間及び音高)を抽出して記憶する。
【0021】
▲2▼第2ステップ
音程の誤差範囲をEとし、各頂点のうちE/2の範囲を超えて変化する頂点を抽出して代表点とする。例えば、E=2(半音2つ分)とした場合に、図3において、(2)の頂点と(3)の頂点との音高差は1であるので、(3)の頂点は抽出されず、第1のフレーズで抽出される頂点は、(1)、(2)、(4)、(5)の4つであり、これらの頂点が第1のフレーズの代表点となる。これと同様に、第2のフレーズの代表点は、(6)、(7)、(9)、(10)、(11)の5つであり、第3のフレーズの代表点は、(12)、(13)、(15)の3つであり、第4のフレーズの代表点は、(16)、(17)、(19)、(20)、(21)の5つである。
【0022】
▲3▼第3ステップ
簡略化された旋律データから各フレーズ毎に4分木データを作成する。ここでは、音程移動のしきい値をWとし、各フレーズ毎に代表点と次の代表点との音高の差が+Wを超えて変化する場合、0〜+Wの範囲内である場合、0〜−Wの範囲内である場合、及び−Wを超えて変化する場合の4つに分類する。すなわち、各代表点毎に選択可能な枝が4つあり、次の代表点との音高差により4つの枝から1つの枝のみを選択する。そして、各代表点毎に4つの枝からいずれか1つの枝を選択して、フレーズ毎の4分木データを作成する。
【0023】
図4(a)は、E=2、W=5としたときの第1のフレーズの4分木データであり、破線及び実線で示す枝が各代表点毎に用意された4つの枝を示し、実線で示す枝が次の代表点との音高差により選択された枝を示す。第1のフレーズの代表点(1)と代表点(2)との間の音高の変化は0〜−Wの範囲内であるので、4つの枝のうちの上から3番目の枝が選択される。また、代表点(2)と代表点(4)との間の音高の変化も0〜−Wの範囲内であるので、上から3番目の枝が選択される。更に、代表点(4)と代表点(5)との間の音高の変化は+5を超えるので、上から1番目の枝が選択される。これらの枝をつなげて描画すると、図4(a)に示す4分木データとなる。
【0024】
第2〜第4のフレーズについても、同様に4分木データを作成する。図4(b)は第2のフレーズの4分木データであり、図4(c)は第3のフレーズの4分木データ、図4(d)は第4のフレーズの4分木データである。
▲4▼第4ステップ
第1〜第4のフレーズの各4分木データをマージする。すなわち、第1のフレーズの4分木データに、第2〜第4のフレーズの4分木データを重ね合わせる。この例では、第1のフレーズの分木データに第2〜第4のフレーズの分木データをマージすると、図5に示すように、第1の枝分かれ位置(ポインタ)及び第2の枝分かれ位置(ポインタ)ではそれぞれ2つの枝が選択されている。
【0025】
このようにして、作成した4分木データを数値化して検索キー(収録曲検索キー)とし、曲名又は曲の番号と関連付けて検索キーデータベース16に記憶する。分木データを数値化する場合、この例では、各枝分かれ位置に選択可能な4つの枝があり、枝分かれ位置が4つあるので、例えば検索キーのデータは順に0110 0110 1000 0010の16ビットとなる。このように、各フレーズの4分木データをマージすることにより、収録曲検索キーのビット数を削減できて、検索キーデータベース16の記憶容量を削減することができる。なお、実際には端末用データとして0(NULL)を用いるため、検索キーのビット数は16ビットよりも少し多くなる。
【0026】
誤差範囲E及びしきい値Wの値を変えて、上記の第2〜第4ステップを繰り返し、1つの曲に対し複数の検索キーを用意する。上記の例ではE=2、W=5としたが、Eの値又はWの値のいずれか一方又は両方を変化させた条件で1つの曲に対し10種類程度の検索キーを用意しておく。この場合、1つの検索キーのビット数は16ビットであるので、1曲に対し複数の検索キーを用意しても、データ量は極めて少ない。
【0027】
一方、マイクから入力したメロディ(歌声、鼻歌、ハミング又は楽器音等)は、旋律認識部12でサンプリングしてデジタルの旋律データに変換する。このデジタルの旋律データから、キー作成部15で、収録曲検索キーの作成アルゴリズムと同様のアルゴリズムにより入力曲検索キーを作成する。但し、マイクから入力されるメロディは1フレーズ程度であると考えられるので、フレーズ毎の分木データをマージする必要がなく、図5に示す分木データと異なり、1つの枝分かれ位置で2以上の枝が選択されることはない。
【0028】
検索エンジン13は、入力曲検索キーと収録曲検索キーとを比較し、検索キーが一致する収録曲を抽出する。但し、マイク11から入力されるメロディは1フレーズ未満の場合もあるので、フレーズの途中まで一致していれば(例えば、3番目の枝分かれ位置まで一致していれば)、検索条件に合致したものとみなす。また、検索エンジン13は、誤差範囲E及びしきい値Wの値が同じ検索キー同士を比較することが必要である。例えば、10種類の検索キーがあれば、各検索キーについて入力曲検索キーと収録曲検索キーとを比較照合し、10のうち8つの検索キーが一致すれば一致率を80%とする。
【0029】
このようにして、検索エンジン13は例えば一致率が70%以上の曲を検索候補とし、一致率(照合度合い)が高いものから降順にソートして表示部14に曲名と一致率とを表示する。ユーザは、必要に応じて、違うフレーズのメロディを入力することにより、更に検索候補を絞り込むこともできる。そして、表示部14に表示された1又は複数の検索候補からユーザが所望の曲を指定すると、端末装置10からサーバ20に曲データ転送要求が出力され、サーバー20から端末装置10に曲データが伝送されて、図示しない演奏装置により曲の演奏が開始される。
【0030】
本実施の形態においては、上述の如く、曲データベース21に収録された曲データ及びマイク11から入力されたメロディの両方を同じアルゴリズムで簡略化して収録曲検索キー及び入力曲検索キーを作成し、入力曲検索キーと収録曲検索キーとを比較照合して所望の曲を検索するので、例えばマイクからメロディを入力する際に音程が細かく変化しても、所望の曲を検索することができる。また、本実施の形態においては、誤差範囲E及びしきい値Wの値を変えて1つの曲につき複数の検索キーを作成するので、所望の曲をある程度絞り込むことができて、検索ヒット数が多くなることが回避される。また、検索キーのビット数が少ないので、検索を高速で行うことができる。更に、本実施の形態では、簡略化した音程の変化により曲を検索するので、類似した曲の検索も可能である。
【0031】
(第2の実施の形態)
以下、本発明の第2の実施の形態について説明する。
本実施の形態においては、第1の実施の形態で説明した第1〜第4ステップのうち、第3ステップのアルゴリズムが異なることにあり、第1の実施の形態と重複する部分の説明は省略する。
【0032】
通常の楽曲では、音域の範囲が1オクターブから2オクターブ程度の範囲に限られることが多い。このため、ある代表点(第1の代表点)から次の代表点(第2の代表点)への音程の変化が上向きであるとすると、第2の代表点から次の代表点(第3の代表点)への音高の変化が上向きであることは比較的少なく、音高の変化が下向きの可能性が大きい。これと同様に、ある代表点(第1の代表点)から次の代表点(第2の代表点)への音高の変化が下向きであるとすると、第2の代表点から次の代表点(第3の代表点)への音高の変化が下向きであることは比較的少なく、音高の変化が上向きの可能性が大きい。
【0033】
このため、第1の代表点から第2の代表点への音高の変化が上向きの場合は、第2の代表点から第3の代表点への音高の変化が下向きの場合を更に詳しく分類し、第1の代表点から第2の代表点への音高の変化が下向きの場合は、第2の代表点から第3の代表点への音高の変化が上向きの場合を更に詳しく分類することによって、検索キーのもつ情報量をより効率的に上げることができる。
【0034】
以下、より具体的に説明する。
本実施の形態においては、音程の誤差範囲Eと、3つのしきい値W、W1 ,W2 (但し、0<W1 <W2 )とにより、分木データを作成する。
まず、第1の実施の形態と同様にして代表点を抽出する。すなわち、旋律データの頂点を抽出した後、各頂点のうち音高がE/2を超えて変化する頂点を抽出して代表点とする。
【0035】
その後、フレーズの最初の代表点(第1の代表点)から次の代表点(第2の代表点)への音高の変化に基づく枝の選択は、第1の実施の形態と同様に行う。すなわち、第1の代表点から第2の代表点への音高の変化が+Wを超える場合は、上から1番目の枝を選択する。第1の代表点から第2の代表点への音高の変化が0〜+Wの範囲内であれば、上から2番目の枝を選択する。第1の代表点から第2の代表点への音高の変化が0〜−Wの範囲内であれば、上から3番目の枝を選択する。第1の代表点から第2の代表点への音高の変化が−Wを超える場合は、上から4番目の枝を選択する。
【0036】
第2の代表点から第3の代表点への音高の変化に基づく枝の選択は、第1の代表点から第2の代表点への音高の変化の方向に応じて、下記の2つの音程の変化の評価アルゴリズムのいずれか一方のアルゴリズムを用いて決定する。
▲1▼第1の評価アルゴリズム(第1の代表点から第2の代表点への音高の変化が上向きの場合)
第2の代表点から第3の代表点への音高の変化が上向きの場合は、上から1番目の枝を選択する。第2の代表点から第3の代表点への音高の変化が0〜−W1 の範囲内のときは、上から2番目の枝を選択する。第2の代表点から第3の代表点への音高の変化が−W1 〜−W2 の範囲内のときは、上から3番目の枝を選択する。第2の代表点から第3の代表点への音高の変化が−W2 より小さいときは、上から4番目の枝を選択する。
【0037】
▲2▼第2の評価アルゴリズム(第1の代表点から第2の代表点への音高の変化が下向きの場合)
第2の代表点から第3の代表点への音高の変化がW2 より大きいときは、上から1番目の枝を選択する。第2の代表点から第3の代表点への音高の変化がW1 〜W2 の範囲内のときは、上から2番目の枝を選択する。第2の代表点から第3の代表点への音高の変化が0〜W1 の範囲内のときは、上から3番目の枝を選択する。第2の代表点から第3の代表点への音高の変化が下向きのときは、上から4番目の枝を選択する。
【0038】
いずれも場合も、選択した枝に沿って次の枝分かれ位置まで移動する。そして、第3の代表点以降についても、上記と同様にして枝を選択し、1フレーズ毎に分木データを作成する。
図6(a)は、E=2、W=5、W1 =4.5、W2 =6.5としたときの第1のフレーズの4分木データである。図中、破線及び実線で示す枝が各代表点毎に用意された4つの枝を示し、実線で示す枝が次の代表点との音高差により選択された枝を示す。例えば、第1のフレーズの代表点(1)から代表点(2)への音高の変化が0〜−Wの範囲内であるので、上から3番目の枝が選択される。次の枝分かれ位置では、代表点(1)から代表点(2)への変化が下方向の変化であり、かつ代表点(2)から代表点(4)への音高の変化が下向きであるので、上から4番目の枝が選択される。次の枝分かれ位置では、代表点(2)から代表点(4)の変化が下方向の変化であり、且つ代表点(4)から代表点(5)への音高の変化がW2 を超えるので、上から1番目の枝が選択される。これらの枝をつなげて描画すると、図6(a)に示す4分木データとなる。
【0039】
第2〜第4のフレーズについても、同様に4分木データを作成する。図6(b)は第2のフレーズの4分木データであり、図6(c)は第3のフレーズの4分木データ、図6(d)は第4のフレーズの4分木データである。
その後、第1の実施の形態と同様に、これらの第1〜第4のフレーズの4分木データをマージし、数値化して収録曲検索キーとする。本実施の形態においても、誤差範囲E及びしきい値W、W1 、W2 の値を変えて、1つの曲に対し複数の収録曲検索キーを用意する。
【0040】
一方、マイクから入力したメロディについても、同様のアルゴリズムで入力曲検索キーを作成し、入力曲検索キーと収録曲検索キーとを比較して、所望の楽曲を検索する。
本実施の形態においては、前の代表点からの音高の変化が上向きならば第1の評価アルゴリズムを使用して、音高の上方向の移動による選択枝を少なくし、下方向の選択枝を多くする。逆に、前の代表点からの音高の変化が下向きならば第2の評価アルゴリズムを使用して、音高の下方向の移動による選択枝を少なくし、上方向の選択枝を多くする。これにより、検索キーのもつ情報量を効率よく上げることができて、より一層的確な楽曲検索が可能になる。
【0041】
本願発明者らが第1の実施の形態及び第2の実施の形態の音楽検索システムを実際に作製して検索の絞込み度合いの適否を調べたところ、第1の実施の形態の検索システムでは、楽曲によって検索キーで検索される楽曲の数に偏りがあり、ある音列では1000曲中で1曲しか検索ヒットしないが、他の音列では1000曲中で100曲ヒットしてしまうということがあり、マイクから入力されたフレーズで検索曲を数曲に絞り込むことが難しいことがあった。
【0042】
一方、第2の実施の形態の音楽検索システムでは検索のヒット率が最適化され、第1の実施の形態に比べて楽曲の絞込み度合いが最高で約10倍程度改善された。
なお、第1の実施の形態又は第2の実施の形態による楽曲の検索に加えて、例えば更に音程の移動による分木データを作成し、検索曲を絞り込むようにしてもよい。音程の移動による分木データとは、例えば図7に示すように、同じ音程は無視し、音程の変化を分木データで表したものである。
【0043】
また、上記の第1の実施の形態及び第2の実施の形態では、マイクから入力したメロディのみで所望の曲を検索する場合について説明したが、曲名、歌手名又は歌詞の一部からも曲を検索できるように、これらの情報を端末装置10又はサーバ20に文字データとして格納しておいてもよい。
更に、上記の第1の実施の形態及び第2の実施の形態では4分木データにより音程の変化を簡略化した場合について説明したが、本発明は4分木データによる簡略化に限定されるものではなく、2分木データ、6分木データ又は8分木データ等により簡略化してもよい。
【0044】
更にまた、上記の第1の実施の形態及び第2の実施の形態では本発明をカラオケの曲検索に適用した例について説明したが、これにより本発明がカラオケに限定されるものではない。
【0045】
【発明の効果】
以上説明したように、本発明によれば、収録曲検索キーデータベースに曲データベースに収録されている曲の音程の変化を簡略化して表わす収録曲検索キーを格納しておき、マイク等から入力したメロディを旋律認識部でデジタルの旋律データに変換して、検索キー作成手段で入力曲の音程の変化を簡略化して表わす入力曲検索キーを作成して、入力曲検索キーと収録曲検索キーとを比較照合することにより所望の曲を検索するので、音程の細かな変化が省略され、人間の歌声等による曲検索をより確実に行うことができる。また、入力曲検索キー及び収録曲検索キーのビット数が少ないので、検索が高速で行われる。
【0046】
また、ある代表点から次の代表点への音程の変化が上向きか下向きかに応じて更に次の代表点への音程の変化の評価アルゴリズムを変えることにより、検索キーのもつ情報量を効率よく上げることができて、より正確な検索が可能になる。
【図面の簡単な説明】
【図1】図1は、本発明の第1の実施の形態の音楽検索システムの構成を示すブロック図である。
【図2】図2は、旋律データの簡略化方法を示す模式図である。
【図3】図3は、旋律データの頂点の抽出及び代表点の抽出を示す模式図である。
【図4】図4は、各フレーズの4分木データである。
【図5】図5は、4つの4分木データをマージした後の4分木データである。
【図6】図6は、本発明の第2の実施の形態の音楽検索システムによる各フレーズの4分木データである。
【図7】図7は、音程の移動による分木データの作成方法を示す模式図である。
【符号の説明】
10 端末装置、
11 マイク、
12 旋律認識部、
13 検索エンジン、
14 表示部、
15 キー作成部、
16 検索キーデータベース、
20 サーバ、
21 曲データベース。

Claims (2)

  1. 音楽検索に使用する検索キーの作成方法において、
    曲の旋律データから音程の変化の頂点を抽出し、
    それらの頂点から誤差範囲Eを超えて音程が変化した頂点を代表点として抽出し、
    それらの代表点の音程の変化をその変化の大きさによって分類し、その結果に基づいて音程の変化を示す分木データを作成し、
    前記分木データを数値化して検索キーを作成することを特徴とする音楽検索キーの作成方法。
  2. 複数の曲データを収録した曲データ収録手段と、
    前記曲データ収録手段に収録された曲の音程の変化に基づいて作成された収録曲検索キーを格納した収録曲検索キー格納手段と、
    入力された信号をデジタルの旋律データに変換する旋律認識手段と、
    前記旋律認識手段から出力される前記旋律データの音程の変化に基づいて入力曲検索キーを作成する検索キー作成手段と、
    前記入力曲検索キーと前記収録曲検索キー格納手段に格納された前記収録曲検索キーとを比較する検索手段とを有し、
    前記収録曲検索キーが、曲の旋律データから音程の変化の頂点を抽出し、それらの頂点から誤差範囲Eを超えて音程が変化した頂点を代表点として抽出し、それらの代表点の音程の変化をその変化の大きさによって分類し、その結果に基づいて音程の変化を示す分木データをフレーズ毎に作成し、それらの分木データを重ね合わせ、その結果を数値化して作成されたものであり、
    前記検索キー作成手段は、前記旋律データから音程の頂点を抽出し、それらの頂点から誤差範囲Eを超えて音程が変化した頂点を代表点として抽出し、それらの代表点の音程の変化をその変化の大きさによって分類し、その結果に基づいて音程の変化を示す分木データを作成し、前記分木データを数値化して前記入力曲検索キーを作成することを特徴とする音楽検索システム。
JP32644799A 1999-04-12 1999-11-17 音楽検索システム Expired - Fee Related JP3844627B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32644799A JP3844627B2 (ja) 1999-04-12 1999-11-17 音楽検索システム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11-103998 1999-04-12
JP10399899 1999-04-12
JP32644799A JP3844627B2 (ja) 1999-04-12 1999-11-17 音楽検索システム

Publications (2)

Publication Number Publication Date
JP2000356996A JP2000356996A (ja) 2000-12-26
JP3844627B2 true JP3844627B2 (ja) 2006-11-15

Family

ID=26444557

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32644799A Expired - Fee Related JP3844627B2 (ja) 1999-04-12 1999-11-17 音楽検索システム

Country Status (1)

Country Link
JP (1) JP3844627B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010097870A1 (ja) 2009-02-27 2010-09-02 三菱電機株式会社 音楽検索装置
WO2017028113A1 (zh) * 2015-08-16 2017-02-23 胡丹丽 具有手写输入功能的音频播放器及其播放方法

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3612272B2 (ja) * 2000-10-13 2005-01-19 日本電信電話株式会社 音楽情報検索装置、音楽情報検索方法および音楽情報検索用プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002215632A (ja) * 2001-01-18 2002-08-02 Nec Corp 携帯端末を用いた音楽検索システム、音楽検索方法、および購入方法
KR20020065668A (ko) * 2001-02-07 2002-08-14 엘지전자주식회사 음악 서비스 제공 시스템 및 이 시스템의 운영 방법
JP2002258874A (ja) * 2001-03-01 2002-09-11 Alpine Electronics Inc 音楽試聴方法、システムおよび情報端末、音楽検索サーバ
DE60237860D1 (de) 2001-03-22 2010-11-18 Panasonic Corp Schallmerkmalermittlungsgerät, Schalldatenregistrierungsgerät, Schalldatenwiederauffindungsgerät und Verfahren und Programme zum Einsatz derselben
KR100512143B1 (ko) * 2002-02-08 2005-09-02 엘지전자 주식회사 멜로디 기반 음악 검색방법과 장치
KR100497356B1 (ko) * 2002-06-12 2005-06-23 삼성전자주식회사 주파수 분석을 이용한 노래선곡방법 및 장치
KR100468971B1 (ko) * 2002-06-25 2005-01-29 엘지전자 주식회사 멜로디 기반 검색이 가능한 음악 재생장치
KR20040000797A (ko) * 2002-06-25 2004-01-07 엘지전자 주식회사 음악 데이터의 특징 정보 표현방법
CN100454298C (zh) * 2003-12-08 2009-01-21 皇家飞利浦电子股份有限公司 旋律数据库搜索
KR100774708B1 (ko) 2006-07-18 2007-11-08 한국정보통신대학교 산학협력단 실시간 음악 인식을 통한 사용자 선호 멜로디 구간의벨소리 및/또는 컬러링 생성 시스템 및 방법
CN101226526A (zh) * 2007-01-17 2008-07-23 上海怡得网络有限公司 一种基于音乐片段信息查询的音乐搜索方法
JP4906565B2 (ja) * 2007-04-06 2012-03-28 アルパイン株式会社 メロディー推定方法及びメロディー推定装置
JP5678686B2 (ja) * 2011-01-25 2015-03-04 ヤマハ株式会社 端末装置、プログラムおよび楽曲検索方法
JP2013117688A (ja) 2011-12-05 2013-06-13 Sony Corp 音響処理装置、音響処理方法、プログラム、記録媒体、サーバ装置、音響再生装置および音響処理システム
KR101376478B1 (ko) 2012-05-09 2014-03-19 (주)마이오디 허밍 기반 음원 검색환경 구성방법과 이를 위한 음원 검색장치 및 음원 자동 재생을 위한 음원 검색시스템
JP6291913B2 (ja) * 2014-03-04 2018-03-14 ヤマハ株式会社 楽曲生成システム
CN104867492B (zh) * 2015-05-07 2019-09-03 科大讯飞股份有限公司 智能交互系统及方法
WO2017028115A1 (zh) * 2015-08-16 2017-02-23 胡丹丽 智能桌面音箱和智能桌面音箱的控制方法
CN106469557B (zh) * 2015-08-18 2020-02-18 阿里巴巴集团控股有限公司 伴奏音乐的提供方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010097870A1 (ja) 2009-02-27 2010-09-02 三菱電機株式会社 音楽検索装置
WO2017028113A1 (zh) * 2015-08-16 2017-02-23 胡丹丽 具有手写输入功能的音频播放器及其播放方法

Also Published As

Publication number Publication date
JP2000356996A (ja) 2000-12-26

Similar Documents

Publication Publication Date Title
JP3844627B2 (ja) 音楽検索システム
EP1397756B1 (en) Music database searching
US6528715B1 (en) Music search by interactive graphical specification with audio feedback
Jang et al. A general framework of progressive filtering and its application to query by singing/humming
US6307139B1 (en) Search index for a music file
JP2003519845A (ja) 音楽検索エンジン
US20040060424A1 (en) Method for converting a music signal into a note-based description and for referencing a music signal in a data bank
JP2010521021A (ja) 楽曲ベースの検索エンジン
Rolland et al. Musical content-based retrieval: an overview of the Melodiscov approach and system
Casey et al. The importance of sequences in musical similarity
JPH09293083A (ja) 楽曲検索装置および検索方法
JPH1115468A (ja) 楽曲検索方法、楽曲検索装置、楽曲検索システム、及び記録媒体
US7962530B1 (en) Method for locating information in a musical database using a fragment of a melody
KR100512143B1 (ko) 멜로디 기반 음악 검색방법과 장치
Lee et al. Korean traditional music genre classification using sample and MIDI phrases
Dannenberg et al. Panel: new directions in music information retrieval
JP2002055695A (ja) 音楽検索システム
JP3934556B2 (ja) 信号識別子の抽出方法及びその装置、信号識別子からデータベースを作成する方法及びその装置、及び、検索時間領域信号を参照する方法及びその装置
JP2003131674A (ja) 楽曲検索システム
Kosugi et al. SoundCompass: a practical query-by-humming system; normalization of scalable and shiftable time-series data and effective subsequence generation
JP2002123287A (ja) 音楽特徴量生成方法及び装置と音楽情報検索装置と音楽特徴量生成用プログラムの記録媒体
Salamon et al. A chroma-based salience function for melody and bass line estimation from music audio signals
JPH06202621A (ja) 楽曲演奏情報を利用した楽曲検索装置
JP2001167100A (ja) 音楽検索システムの検索結果出力方法
JP2004531758A5 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060815

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060816

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110825

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees