JP4622199B2 - 楽曲検索装置及び楽曲検索方法 - Google Patents

楽曲検索装置及び楽曲検索方法 Download PDF

Info

Publication number
JP4622199B2
JP4622199B2 JP2001289792A JP2001289792A JP4622199B2 JP 4622199 B2 JP4622199 B2 JP 4622199B2 JP 2001289792 A JP2001289792 A JP 2001289792A JP 2001289792 A JP2001289792 A JP 2001289792A JP 4622199 B2 JP4622199 B2 JP 4622199B2
Authority
JP
Japan
Prior art keywords
music
musical
song
coordinate value
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001289792A
Other languages
English (en)
Other versions
JP2003099462A (ja
JP2003099462A5 (ja
Inventor
和美 荒蔭
一郎 宍戸
徹 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2001289792A priority Critical patent/JP4622199B2/ja
Publication of JP2003099462A publication Critical patent/JP2003099462A/ja
Publication of JP2003099462A5 publication Critical patent/JP2003099462A5/ja
Application granted granted Critical
Publication of JP4622199B2 publication Critical patent/JP4622199B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、指定された参照曲に類似する印象を有する楽曲を複数の楽曲の中から検索、抽出する楽曲検索装置及び楽曲検索方法に係り、特に、CD(Compact Disk)等の一般的な楽音データの中から楽曲を検索することを可能にする技術に関する。
【0002】
【従来の技術】
従来より、例えばカラオケ装置等のように、入力された曲名や歌手名等の検索キーワードに基づいて条件に合った楽曲を検索する楽曲検索装置が知られているが、このような楽曲検索装置では、例えば「この曲に似た感じの曲」といった、指定した曲(「参照曲」という)に類似する印象の楽曲を検索することはできない。
【0003】
このような背景から、例えば特開平2−54300号公報には、メロディを利用して楽曲を検索する楽曲検索装置が開示されている。また、例えば特開平6−290574号公報には、楽曲の音楽的特徴から検索のためのインデックスを作成し、このインデックスを利用して楽曲を検索する楽曲検索装置が開示されている。
【0004】
一方、最近では、正準相関分析によって楽曲の印象を示す感性語及び音楽的特徴から検索空間を作成し、この検索空間上で類似曲を検索する楽曲検索装置が開示されている(例えば、辻ら,「曲の局所パターン特徴量を用いた類似曲検索・感性語による検索」,電子情報通信学会技術報告,SP−124)。この楽曲検索装置は、MIDI(Music Instruments Digital Interface)データ中の楽曲の旋律情報を利用し、旋律情報と感性語を正準相関分析にかけることにより類似曲検索を行っている。
【0005】
【発明が解決しようとする課題】
しかしながら、特開平2−54300号公報に開示されているようなメロディを利用した楽曲検索装置は、例えば「以前耳にした曲を検索したい」、「このメロディに似たメロディを持つ曲を検索したい」といった検索に対しては有効的であるが、ユーザが指定した参照曲と似た印象を持つ楽曲を検索することには対応できない。
【0006】
また、特開平6−290574号公報に開示されているような楽曲検索装置では、楽曲の印象を指定して耳にしたことのない楽曲を検索することは可能であるものの、音楽的特徴とインデックスとして用いられる楽曲の印象との間に相関関係が無いために、音楽的特徴と楽曲の印象との対応付けが難しい。
【0007】
さらに、音楽的特徴として旋律情報を使用し、旋律情報と感性情報とを結び付けるような楽曲検索装置は、楽曲の印象による検索を行う場合には有効的であるものの、CD等に記録されている楽曲のように、MIDIデータではない音楽データからは音楽的特徴としての旋律情報を抽出することはできないために、MIDIデータ以外の音楽データを検索の対象とすることができない。
【0008】
本発明は、このような問題に鑑みてなされたものであり、その目的とするところは、CD等の一般的な楽音データの中からユーザの指定する参照曲に類似する印象を有する楽曲を検索することが可能な楽曲検索装置及び楽曲検索方法を提供することにある。
【0009】
【課題を解決するための手段】
以上の課題を解決すべく、本発明に係る楽曲検索装置の特徴は、
曲の音響信号である楽音データを複数の楽曲分格納する楽音データ格納手段と、
前記楽音データ格納手段に格納された楽曲の楽音データに対して、その楽音データの先頭からの時間的位置が異なる複数の解析区間を設定し、前記解析区間毎に所定の特徴量を算出し、前記複数の解析区間の特徴量を異なるベクトル次元に対応させたベクトルをその楽曲の特徴ベクトルとして作成する音楽的特徴抽出手段と、
徴ベクトルと、所定の感性語に対する楽曲の適合度合いを示す感性ベクトルとを用いて算出された重み係数であり、特徴ベクトルを検索空間における座標値に変換するための前記重み係数を用いて前記楽音データ格納手段に格納されている楽曲の前記座標値を算出する座標値算出手段と、
前記楽音データ格納手段に格納されている前記楽曲の中から検索する楽曲の参照曲となる楽曲を選択する参照曲選択手段と、
前記座標値算出手段で算出された前記参照曲の座標値である基準座標値と、前記座標値算出手段で算出された前記参照曲以外の他の楽曲の各座標値とを各々比較し、前記他の楽曲の内から前記基準座標値と近い座標値を有する楽曲を選択する検索手段と、
を備えることである。
【0010】
また、本発明に係る楽曲検索方法の特徴は、
複数の楽曲を検索対象として楽曲の検索を行う楽曲検索装置で実行される楽曲検索方法であって、
楽曲の音響信号である楽音データを複数の楽曲分格納する楽音データ格納手段に格納された楽曲の楽音データに対して、その楽音データの先頭からの時間的位置が異なる複数の解析区間を設定し、前記解析区間毎に所定の特徴量を算出し、前記複数の解析区間の特徴量を異なるベクトル次元に対応させたベクトルをその楽曲の特徴ベクトルとして作成する音楽的特徴抽出ステップと、
徴ベクトルと、所定の感性語に対する楽曲の適合度合いを示す感性ベクトルとを用いて算出された重み係数であり、特徴ベクトルを検索空間における座標値に変換するための前記重み係数を用いて前記楽音データ格納手段に格納されている楽曲の前記座標値を算出する座標値算出ステップと、
前記楽音データ格納手段に格納されている前記楽曲の中から検索する楽曲の参照曲となる楽曲を選択する参照曲選択ステップと、
前記座標値算出ステップで算出された前記参照曲の座標値である基準座標値と、前記座標値算出ステップで算出された前記参照曲以外の他の楽曲の各座標値とを各々比較し、前記他の楽曲の内から前記基準座標値と近い座標値を有する楽曲を選択する検索ステップと、
を備えることである。
【0011】
すなわち、本発明に係る楽曲検索装置及び楽曲検索方法の特徴においては、楽曲の音楽的特徴を示す特徴ベクトルと、所定の感性語に対する楽曲の適合度合いを示す感性ベクトルとを用いて検索空間における各楽曲の座標値を算出し、この検索空間上における参照曲の位置に近い位置にある楽曲を類似する楽曲として抽出するので、CD等の一般的な楽音データの中からユーザの指定する参照曲に類似する印象を有する楽曲を検索することができる。
【0012】
また、本発明に係る楽曲検索装置及び楽曲検索方法において、楽音データをフレーム単位で時間周波数解析してフレーム毎のスペクトルデータを算出し、フレームのスペクトルデータと他のフレームのスペクトルデータとの、周波数成分毎の差分値を加算した第1の加算値をフレーム毎に算出する。次に、隣接する所定数のフレームにおいて第1の加算値が最大となるフレームをビート位置として判定する。そして、複数の解析区間毎のビート位置の個数と、そのビート位置における前記第1の加算値を前記複数の解析区間毎に加算した第2の加算値との少なくとも一方を用いて、特徴ベクトルを作成するようにした。この場合には、CD等の楽曲のようなMIDIデータではない楽音データからでも特徴ベクトルを容易に作成することができる。
【0013】
尚、検索空間は、感性ベクトルと特徴ベクトルとを正準相関分析することにより、もしくは感性ベクトルと特徴ベクトルとを重回帰分析することにより作成するようにしてもよい。
【0014】
【発明の実施の形態】
以下、図1〜図10を参照して、本発明を適用した実施の形態である楽曲検索装置の構成及び動作について詳しく説明する。
【0015】
[楽曲検索装置の構成]
図1は、本発明の実施の形態となる楽曲検索装置の全体構成を示すブロック図である。
【0016】
この実施の形態における楽曲検索装置は、図1に示すように、楽音データ格納手段101、書誌データ格納手段102、音楽的特徴抽出手段103、感性ベクトル格納手段104、検索空間作成手段105、参照曲選択入力手段106、検索手段107、検索結果出力手段108、及び楽曲データ追加手段109を備える。
【0017】
楽音データ格納手段101は楽音データを格納し、書誌データ格納手段102は楽音データのタイトルや作曲者等の書誌データ(書誌的項目)を格納する。尚、楽音データは、デジタル形式若しくはアナログ形式の音響信号であり、書誌データと合わせてテープ、ハードディスク等の読み出し可能な記憶媒体に格納される。
【0018】
音楽的特徴抽出手段103は、楽音データ格納手段101に格納されている楽音データのうち、事前に学習曲として選んだ楽曲データについて周波数解析することにより得られるスペクトルデータから音楽的特徴を抽出し、抽出した音楽的特徴を特徴ベクトルV として格納する。
【0019】
感性ベクトル格納手段104は、楽曲を聞いたユーザが楽曲に対して持った印象を感性語により評価した感性語データに基づいて感性ベクトルV を作成し、作成した感性ベクトルV を楽音データ毎に格納する。
【0020】
ここで、感性語とは、例えば「楽しい」,「暗い」等の楽曲の印象を表す言葉であり、感性語データとは、楽曲の評価者が楽曲に対して持った印象を感性語毎に数段階に分けて付与した値を示す。
【0021】
尚、この実施の形態においては、感性語として「美しい」,「暗い」,「落ち着く」の3つの言葉を用意し、各感性語について「1」〜「5」の5段階評価を行った。そして、例えば、評価者が楽曲を聞いた時に、「楽しい」,「暗い」,「落ち着く」についてそれぞれ、「4」,「1」,「3」の評価を行った場合には、感性ベクトルV は以下の式(1)により表現される。
【0022】
【数1】
Figure 0004622199
事前に学習曲として選んだ楽曲データについて、予めこのような評価を行って感性ベクトルを作成し、感性ベクトル格納手段104に格納しておく。
【0023】
検索空間作成手段105は、音楽的特徴抽出手段103内に格納された特徴ベクトルV と感性ベクトル格納手段104内に格納された感性ベクトルV とを正準相関分析もしくは重回帰分析にかけることにより検索空間を作成する。また、その後、新たに追加される楽曲については、正準相関分析もしくは重回帰分析によって求められた重み係数を用いて検索空間上に配置する。
【0024】
参照曲選択入力手段106は、ユーザの操作に従って、検索のための手掛かりとなる参照曲を楽音データ格納手段101に格納されている楽音データの中から選択する。
【0025】
検索手段107は、参照曲選択入力手段106により選択された楽曲における検索空間上の位置と他の楽曲における検索空間上の位置との間の距離を求め、選択された楽曲に近い位置にある楽曲を抽出する。
【0026】
検索結果出力手段108は、検索手段107が抽出した楽曲を検索結果として表示出力し、また、抽出された楽曲の楽音データを出力する。
【0027】
楽曲データ追加手段109は、検索の対象となる楽曲の楽音データや書誌データを新たに追加する。
【0028】
[楽曲検索装置の動作]
上記楽曲検索装置は、大きく分けて、音楽的特徴抽出処理、検索空間作成処理、及び検索処理により実行される。そこで、以下では、これらの各処理について順に詳しく説明する。
【0029】
〔音楽的特徴抽出処理〕
始めに、図2に示すブロック図と図3に示すフローチャートを参照して、音楽的特徴を抽出する処理の流れについて説明する。
【0030】
音楽的特徴抽出手段103は、図2に示すように、時間周波数変換手段201、遅延手段202、差分データ演算手段203、テンポ情報作成手段204、ビート情報作成手段205、特徴ベクトル作成手段206を備える。
【0031】
図3に示すフローチャートは、楽音データが時間周波数変換手段201に入力されることで開始となり、この音楽的特徴抽出処理はステップS1の処理に移行する。
【0032】
時間周波数変換手段201は、FFT(Fast Fourier Transform;高速フーリエ変換)等の手段を用いて一定区間毎の楽音データを周波数領域のスペクトルパワーに変換する(ステップS1)。周波数スペクトルパワーに変換された楽曲データは、差分データ演算手段203に入力されると共に、 遅延手段202にて遅延される。
【0033】
遅延手段202は、時間周波数変換手段201により周波数スペクトルパワーに変換された楽音データを、所定のフレーム数だけ遅延させる(ステップS2)。尚、ここでいう「フレーム」とは時間周波数変換を行う単位のことを意味する。
【0034】
差分データ演算手段203は、遅延手段202が遅延されたフレーム数分だけ間隔を空けた2つのフレームのスペクトルパワーの差分値を演算する(ステップS3)。ここで、遅延フレーム数が1フレームである場合、差分データ演算手段203は、隣り合う2つのフレーム間でスペクトルパワーの差分を演算し、フレームfのi番目の差分値d(i,f)は以下の式(2)により表現される。
【0035】
【数2】
Figure 0004622199
ここで、spec(i ,f)はフレームf のi番目のスペクトルパワーである。
【0036】
テンポ情報作成手段204は、差分データ演算手段203が出力する 差分データを用いてテンポ情報を作成する(ステップS4)。
【0037】
〈テンポ情報作成処理〉
ここで、上記ステップS4におけるテンポ情報作成手段204によるテンポ情報作成処理を、図4に示すフローチャートを参照して詳しく説明する。
【0038】
ステップS41において、テンポ情報作成手段204は、入力した差分データがテンポ情報を作成するために使用する帯域であるか否かを判別する。判別の結果、テンポ情報を作成するために使用する帯域である場合にはステップS42の処理へと移行し、テンポ情報を作成するために使用する帯域でない場合にはステップS44の処理へと移行する。
【0039】
ステップS42において、テンポ情報作成手段204は、差分値d(i,f)が閾値Th以上(ここで、閾値Th>0とする)であるか否かを判別する。判別の結果、閾値Th以上である場合にはステップS43の処理へと移行し、閾値Th以下である場合にはステップS44の処理へと移行する。
【0040】
ステップS43において、テンポ情報作成手段204は、スコアS(f)に差分値d(i,f)を加算し、ステップS44の処理へと移行する。
【0041】
ここで、閾値Thは正の値であるので、このステップS43の処理により、フレームf よりも時間的に後に位置するフレームf +nにおいて、特定の周波数帯域のスペクトルパワーが大きく増加している場合のみ、スコアS(f)に差分値が加算されることになる。
【0042】
ステップS44の処理において、テンポ情報作成手段204は、フレーム内の全ての差分値に対して上記の処理を完了したか否かを判別する。判別の結果、完了した場合にはステップS45の処理へと移行し、完了していない場合には再びステップS41の処理に戻り、上記ステップS41〜ステップS44の処理を繰り返す。
【0043】
ステップS45において、テンポ情報作成手段204は、特定区間内の全てのフレームについて上記の処理を完了したか否かを判別する。判別の結果、完了した場合にはステップS46の処理へと移行し、完了していない場合にはステップS41の処理に戻る。
【0044】
ここで、本明細書中における「特定区間」とは、予め決めた位置における一定時間長のフレームを意味する。具体的には、この実施の形態では、楽曲データを時間長において3等分した各データの先頭から30秒の区間とする。従って、一つの楽曲データについては、3つのテンポ情報と3つのビート情報が作成されることとなる。
【0045】
ステップS46において、テンポ情報作成手段204は、フレームf のスコアS(f)が隣接するNフレームのスコアの中で最大の値であるか否かを判別する。判別の結果、最大の値である場合にはステップS47に移行し、テンポ情報作成手段204は、そのフレームf がビート位置にあると判断し、ビートフラグB(f)の値を1に設定すると共にカウンタbeatの値を1増数し、ステップS49に移行する。
【0046】
一方、フレームf のスコアS(f)が隣接するNフレームのスコアの中で最大の値でない場合には、ステップS48において、テンポ情報作成手段204は、ビートフラグB(f)の値を0に設定し、ステップS49に移行する。
【0047】
ステップS49において、テンポ情報作成手段204は、特定区間内の全てのフレームについて上記の処理を完了したか否かを判別する。判別の結果、完了した場合には一連のテンポ情報作成処理は終了し、音楽的特徴抽出処理のステップS5の処理に移行する。一方、完了していない場合には、再びステップS46の処理に戻り、ステップS46〜ステップS49の各処理を繰り返す。
【0048】
再び、図3のフローチャートに戻り、検索空間作成処理のステップS5以後の処理について説明する。
【0049】
ビート情報作成手段205は、差分データ演算手段203が出力する 差分データを用いてビート情報を作成する(ステップS5)。
【0050】
〈ビート情報作成処理〉
ここで、上記ステップS5におけるビート情報作成手段205によるビート情報作成処理を、図5に示すフローチャートを参照して詳しく説明する。
【0051】
ステップS51において、ビート情報作成手段205は、ビートフラグB(f)が1であるか否かを判別することにより、そのフレームがビート位置にあるか否かを判別する。判別の結果、ビート位置にある場合にはステップS52の処理へと移行し、ビート位置にない場合にはステップS55の処理へと移行する。
【0052】
ステップS52において、ビート情報作成手段205は、差分値d(i,f)が閾値Th以上であるか否かを判別する。判別の結果、閾値Th以上である場合にはステップS53の処理へと移行し、閾値Th以下である場合にはステップS54の処理へと移行する。
【0053】
ステップS53において、ビート情報作成手段205は、レベルLにその差分値d(i,f)を加算する。
【0054】
ここで、前述のように閾値Thは正の値であるので、ステップS53の処理にて、ビート位置にあると判定されたフレームfにおいて、時間的に後ろに位置するフレームf+nでスペクトルパワーが増加している場合のみ、レベルLに差分値が加算されることになる。
【0055】
ステップS54において、ビート情報作成手段205は、フレーム内の全ての差分値に対して上記の処理を完了したか否かを判別する。判別の結果、完了した場合にはステップS55の処理へと移行し、完了していない場合にはこのビート情報作成処理は再度ステップS52の処理に戻り、フレーム内の全ての差分値に対して上記の処理を完了するまでステップS52〜ステップS54の処理を繰り返す。
【0056】
ステップS55において、ビート情報作成手段205は、特定区間内の全てのフレームについて上記の処理を完了したか否かを判別する。判別の結果、完了した場合にはステップS56の処理へと移行し、完了していない場合にはステップS51の処理に戻り、特定区間内の全てのフレームについて上記の処理を完了するまでステップS51〜ステップS55の各処理を繰り返す。
【0057】
ステップS56において、ビート情報作成手段205は、レベルLをカウンタbeatの値で割ることにより1ビート位置当たりの平均レベルを算出し、算出した値をビート情報levelに設定する。これにより、一連のビート情報作成処理は終了し、図3のステップS6の処理に移行する。
【0058】
再び図3のフローチャートに戻り、特徴ベクトル作成手段206は、作成されたテンポ情報とビート情報とを用いて特徴ベクトルV を作成する(ステップS6)。
【0059】
ここで、具体的には、テンポ情報作成手段204(ステップS4の処理)により作成された3つのテンポ情報を[beat0,beat1,beat2]とし、ビート情報作成手段205(ステップS5の処理)により作成された3つのビート情報を[level0,level1,level2]とすると、特徴ベクトルV は、以下の式(3)により表される。
【0060】
【数3】
Figure 0004622199
〔検索空間作成処理〕
検索空間作成手段105は、作成された特徴ベクトルV と感性ベクトル格納手段104内に格納されている感性ベクトルV とを「正準相関分析」にかけることにより、各楽曲の正準変量が示された図6に例示するような検索空間を作成する(ステップS7)。
【0061】
ここで、上記検索空間は、図7に示すように、各楽曲の検索空間上での座標値で表現することも可能である。
【0062】
本明細書中でいう「正準相関分析」とは、2組の変数群[x1 ,x2 ,....,xp ]及び[y1 ,y2 ,....,yq ]による合成変数[u=a1 x1 +a2 x2 +....+ap xp ]及び[v=b1 y1 +b2 y2 +....+bq yq ]の相関係数が最大となるように、重み係数[a1 ,a2 ,....,ap ]及び[b1 ,b2 ,....,bq ]を定める方式を意味する。
【0063】
ここで、検索のための楽曲を新規に追加する場合には、先ず楽曲データ追加手段109にてその楽曲の楽音データと書誌データを追加し、次に、前述の方法によりその楽曲の楽音データから特徴ベクトルを抽出する。そして、抽出した特徴ベクトルと、既に求められている上記重み係数を用いて、図6に例示するような検索空間上にその楽曲を配置すれば良い。
【0064】
〔検索処理〕
次に、図8に示すフローチャートを参照して、上記の処理により作成された検索空間を利用して楽曲検索を行う際の処理の流れについて説明する。
【0065】
この図8に示すフローチャートは、ユーザが参照曲選択入力手段106を介して手がかりとする参照曲を入力することで開始となり、ステップS11の処理に移行する。
【0066】
尚、参照曲選択入力手段106は様々な形態が想定されるが、例えば図9(a)に示すような入力ウィンドウ300として構成し、ユーザに楽曲名301を直接入力させるようにしても良いし、あるいは、例えば図9(b)に示すような入力ウィンドウ400として構成し、楽曲名や歌手名を50音別に指定する形態401として、ユーザに楽曲名を選択入力させるようにしても良い。
【0067】
検索手段107は、検索空間上にある楽曲の位置と、指定された参照曲の位置との間の距離dを算出することにより、検索空間上での参照曲の位置に近い位置にある楽曲を算出する(ステップS11)。
【0068】
ここで、楽曲A及び楽曲Bの検索空間上での座標をそれぞれ、[A(xa,ya),B(xb,yb)]とすると、2つの楽曲間の距離dは次式(4)により表現される。
【0069】
【数4】
Figure 0004622199
そして、検索結果出力手段108は、検索空間上での参照曲の位置に近い位置にある楽曲の書誌データ及び楽曲データを検索結果として出力する(ステップS12)。
【0070】
[その他の実施の形態]
次に、 検索空間作成手段105による検索空間作成処理(ステップS7)において、特徴ベクトルV と感性ベクトルV とを「重回帰分析」にかけることにより検索空間を作成する例を説明する。
【0071】
重回帰分析とは、目的変数[y1 ,y2 ,y3 ,....]と、それに影響すると考えられる2つ以上の説明変数[x1 ,x2 ,x3 ,....]との間の関係式(次式(5)及び(6))を求め、係数[a1 ,b1 ,c1 ,....,a2 ,b2 ,c2 ,....]を決定するものである。
【0072】
【数5】
Figure 0004622199
ここで、感性ベクトル格納手段104に格納された感性ベクトルの各要素を目的変数[y1 ,y2 ,y3 ,....]とし、特徴ベクトル作成手段206により作成される特徴ベクトルV を説明変数[x1 ,x2 ,x3 ,....]に当てはめ、それぞれの楽曲の間で相関が最大になるように、係数[a1 ,b1 ,c1 ,....,a2 ,b2 ,c2 ,....]を求める。これにより、各楽曲毎に目的変数[y1 ,y2 ,y3 ,....]の値が求まり、従って感性ベクトルと同じ次元数の感性空間上に各楽曲を配置することができる。
【0073】
検索を行う際には、検索手段107において検索空間上での楽曲間の距離dを演算し、近い位置にある楽曲を求める。楽曲A及び楽曲Bの検索空間上での座標をそれぞれ、[A(y1a ,y2a ,y3a ,....),B(y1b ,y2b ,y3b ,....)]とすると、2つの楽曲間の距離dは次式(7)により表現される。
【0074】
【数6】
Figure 0004622199
また、検索のための楽曲を新規に追加する場合には、抽出した特徴ベクトルと、既に求められている係数[a1 ,b1 ,c1 ,....,a2 ,b2 ,c2 ,....]を用いて、目的変数[y1 ,y2 ,y3 ,....]の値を求め、検索空間上にその楽曲を配置すれば良い。
【0075】
以上、本発明者らによってなされた発明を適用した実施の形態について説明したが、この実施の形態による本発明の開示の一部をなす論述及び図面により本発明は限定されることはない。この実施の形態に基づいて当業者等によりなされる他の実施の形態、実施例及び運用技術等は全て本発明の範疇に含まれることは勿論である。
【0076】
【発明の効果】
本発明によれば、楽曲の音楽的特徴を示す特徴ベクトルと、所定の感性語に対する楽曲の適合度合いを示す感性ベクトルとを用いて検索空間における各楽曲の座標値を算出し、この検索空間上における参照曲の位置に近い位置にある楽曲を類似する楽曲として抽出するので、CD等の一般的な楽音データの中からユーザの指定する参照曲に類似する印象を有する楽曲を検索することができる。また、一旦検索空間が作成された後に、新たに追加される楽曲については、特徴ベクトルのみを求め、作成済みの検索空間に配置するようにしてもよく、その場合は、少ない労力で楽曲の追加を行うことを可能とする。
【0077】
また、楽音データをフレーム単位で時間周波数解析してフレーム毎のスペクトルデータを算出し、フレームのスペクトルデータと他のフレームのスペクトルデータとの、周波数成分毎の差分値を加算した第1の加算値をフレーム毎に算出する。次に、隣接する所定数のフレームにおいて第1の加算値が最大となるフレームをビート位置として判定する。そして、複数の解析区間毎のビート位置の個数と、そのビート位置における前記第1の加算値を前記複数の解析区間毎に加算した第2の加算値との少なくとも一方を用いて、特徴ベクトルを作成するようにした。この場合には、CD等の楽曲のようなMIDIデータではない楽音データであっても楽曲の特徴ベクトルを容易に作成することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態である楽曲検索装置の全体構成を示すブロック図である。
【図2】図1に示す 楽曲検索装置における音楽的特徴抽出手段の構成を示すブロック図である。
【図3】図1に示す 楽曲検索装置における検索空間作成処理を示すフローチャート図である。
【図4】図3に示すテンポ情報作成処理を示すフローチャート図である。
【図5】図3に示すビート情報作成処理を示すフローチャート図である。
【図6】図1に示す 楽曲検索装置における検索空間を示す模式図である。
【図7】図1に示す 楽曲検索装置における検索空間を示す他の例である。
【図8】図1に示す 楽曲検索装置における検索処理を示すフローチャートである。
【図9】図1に示す 楽曲検索装置における参照曲選択入力手段の構成を示す模式図である。
【符号の説明】
101…楽音データ格納手段、
102…書誌データ格納手段、
103…音楽的特徴抽出手段、
104…感性ベクトル格納手段、
105…検索空間作成手段、
106…参照曲入力手段、
107…検索手段、
108…検索結果出力手段、
109…楽曲データ追加手段、
201…時間周波数変換手段、
202…遅延手段、
203…差分データ演算手段、
204…テンポ情報作成手段、
205…ビート情報作成手段、
206…特徴ベクトル作成手段

Claims (10)

  1. 曲の音響信号である楽音データを複数の楽曲分格納する楽音データ格納手段と、
    前記楽音データ格納手段に格納された楽曲の楽音データに対して、その楽音データの先頭からの時間的位置が異なる複数の解析区間を設定し、前記解析区間毎に所定の特徴量を算出し、前記複数の解析区間の特徴量を異なるベクトル次元に対応させたベクトルをその楽曲の特徴ベクトルとして作成する音楽的特徴抽出手段と、
    徴ベクトルと、所定の感性語に対する楽曲の適合度合いを示す感性ベクトルとを用いて算出された重み係数であり、特徴ベクトルを検索空間における座標値に変換するための前記重み係数を用いて前記楽音データ格納手段に格納されている楽曲の前記座標値を算出する座標値算出手段と、
    前記楽音データ格納手段に格納されている前記楽曲の中から検索する楽曲の参照曲となる楽曲を選択する参照曲選択手段と、
    前記座標値算出手段で算出された前記参照曲の座標値である基準座標値と、前記座標値算出手段で算出された前記参照曲以外の他の楽曲の各座標値とを各々比較し、前記他の楽曲の内から前記基準座標値と近い座標値を有する楽曲を選択する検索手段と、
    を備えることを特徴とする楽曲検索装置。
  2. 前記音楽的特徴抽出手段は、
    前記設定した複数の解析区間毎に、前記楽音データ格納手段に格納された前記楽音データをフレーム単位で時間周波数解析してフレーム毎のスペクトルデータを算出し、フレームのスペクトルデータと他のフレームのスペクトルデータとの、周波数成分毎の差分値を加算した第1の加算値をフレーム毎に算出して、隣接する所定数のフレームにおいて前記第1の加算値が最大となるフレームをビート位置として判定すると共に、前記複数の解析区間毎の前記ビート位置の個数と、前記ビート位置における前記第1の加算値を前記複数の解析区間毎に加算した第2の加算値との少なくとも一方を用いて、前記特徴ベクトルを作成する、
    ことを特徴とする請求項1記載の楽曲検索装置。
  3. 前記音楽的特徴抽出手段は、
    1つの楽曲を所定数の小区間に分割し、それぞれの小区間に対して所定時間の前記解析区間を設定する
    ことを特徴とする請求項1または請求項記載の楽曲検索装置。
  4. 前記座標値算出手段は、
    前記音楽的特徴抽出手段で作成された特徴ベクトルと、所定の感性語に対する前記楽曲の適合度合いを示す感性ベクトルとを正準相関分析して前記重み係数を算出する、
    ことを特徴とする請求項1〜請求項3のいずれか1項に記載の楽曲検索装置。
  5. 前記座標値算出手段は、
    前記音楽的特徴抽出手段で作成された特徴ベクトルと、所定の感性語に対する前記楽曲の適合度合いを示す感性ベクトルとを重回帰分析して前記重み係数を算出する、
    ことを特徴とする請求項1〜請求項3のいずれか1項に記載の楽曲検索装置
  6. 複数の楽曲を検索対象として楽曲の検索を行う楽曲検索装置で実行される楽曲検索方法であって、
    楽曲の音響信号である楽音データを複数の楽曲分格納する楽音データ格納手段に格納された楽曲の楽音データに対して、その楽音データの先頭からの時間的位置が異なる複数の解析区間を設定し、前記解析区間毎に所定の特徴量を算出し、前記複数の解析区間の特徴量を異なるベクトル次元に対応させたベクトルをその楽曲の特徴ベクトルとして作成する音楽的特徴抽出ステップと、
    特徴ベクトルと、所定の感性語に対する楽曲の適合度合いを示す感性ベクトルとを用いて算出された重み係数であり、特徴ベクトルを検索空間における座標値に変換するための前記重み係数を用いて、前記楽音データ格納手段に格納されている楽曲の前記座標値を算出する座標値算出ステップと、
    前記楽音データ格納手段に格納されている前記楽曲の中から検索する楽曲の参照曲となる楽曲を選択する参照曲選択ステップと、
    前記座標値算出ステップで算出された前記参照曲の座標値である基準座標値と、前記座標値算出ステップで算出された前記参照曲以外の他の楽曲の各座標値とを各々比較し、前記他の楽曲の内から前記基準座標値と近い座標値を有する楽曲を選択する検索ステップと、
    を備えることを特徴とする楽曲検索方法。
  7. 前記音楽的特徴抽出ステップは、
    前記設定した複数の解析区間毎に、前記楽音データ格納手段に格納された前記楽音データをフレーム単位で時間周波数解析してフレーム毎のスペクトルデータを算出し、フレームのスペクトルデータと他のフレームのスペクトルデータとの、周波数成分毎の差分値を加算した第1の加算値をフレーム毎に算出して、隣接する所定数のフレームにおいて前記第1の加算値が最大となるフレームをビート位置として判定すると共に、前記複数の解析区間毎の前記ビート位置の個数と、前記ビート位置における前記第1の加算値を前記複数の解析区間毎に加算した第2の加算値との少なくとも一方を用いて、前記特徴ベクトルを作成する、
    ことを特徴とする請求項6に記載の楽曲検索方法。
  8. 前記音楽的特徴抽出ステップは、
    1つの楽曲を所定数の小区間に分割し、それぞれの小区間に対して所定時間の前記解析区間を設定する、
    ことを特徴とする請求項6または請求項7に記載の楽曲検索方法。
  9. 前記座標値算出ステップは、
    前記音楽的特徴抽出ステップで作成された特徴ベクトルと、所定の感性語に対する前記楽曲の適合度合いを示す感性ベクトルとを正準相関分析して前記重み係数を算出する、
    ことを特徴とする請求項6〜請求項8のいずれか1項に記載の楽曲検索方法。
  10. 前記座標値算出ステップは、
    前記音楽的特徴抽出ステップで作成された特徴ベクトルと、所定の感性語に対する前記楽曲の適合度合いを示す感性ベクトルとを重回帰分析して前記重み係数を算出する、
    ことを特徴とする請求項6〜請求項8のいずれか1項に記載の楽曲検索方法。
JP2001289792A 2001-09-21 2001-09-21 楽曲検索装置及び楽曲検索方法 Expired - Lifetime JP4622199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001289792A JP4622199B2 (ja) 2001-09-21 2001-09-21 楽曲検索装置及び楽曲検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001289792A JP4622199B2 (ja) 2001-09-21 2001-09-21 楽曲検索装置及び楽曲検索方法

Publications (3)

Publication Number Publication Date
JP2003099462A JP2003099462A (ja) 2003-04-04
JP2003099462A5 JP2003099462A5 (ja) 2009-06-25
JP4622199B2 true JP4622199B2 (ja) 2011-02-02

Family

ID=19112233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001289792A Expired - Lifetime JP4622199B2 (ja) 2001-09-21 2001-09-21 楽曲検索装置及び楽曲検索方法

Country Status (1)

Country Link
JP (1) JP4622199B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304119A (ja) * 2004-03-03 2007-11-22 Pioneer Electronic Corp 楽曲同一性判別装置及び方法等
JP3871690B2 (ja) * 2004-09-30 2007-01-24 松下電器産業株式会社 音楽コンテンツ再生装置
JP2008145448A (ja) * 2005-03-31 2008-06-26 Pioneer Electronic Corp 情報類似性判別装置及び情報類似性判別方法等
JP4940588B2 (ja) * 2005-07-27 2012-05-30 ソニー株式会社 ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法
JP5082257B2 (ja) * 2006-02-27 2012-11-28 大日本印刷株式会社 音響信号検索装置
JP5259111B2 (ja) * 2007-03-27 2013-08-07 ヤマハ株式会社 音楽再生制御装置
JP2008251109A (ja) * 2007-03-30 2008-10-16 Clarion Co Ltd 楽曲再生制御装置および楽曲再生方法
JP4933330B2 (ja) * 2007-03-30 2012-05-16 クラリオン株式会社 楽曲再生制御装置および再生リスト作成方法
JP4916945B2 (ja) * 2007-04-19 2012-04-18 株式会社タイトー 楽曲情報付与サーバ、端末、及び楽曲情報付与システム
JP4982860B2 (ja) * 2007-07-31 2012-07-25 学校法人 中央大学 音響処理のための情報処理装置、音響処理方法、プログラム、および音響検索システム
JP4983506B2 (ja) * 2007-09-25 2012-07-25 ヤマハ株式会社 楽曲加工装置およびプログラム
JP5098896B2 (ja) * 2008-08-28 2012-12-12 ソニー株式会社 再生装置および再生方法
JP2010086273A (ja) 2008-09-30 2010-04-15 Kddi Corp 楽曲検索装置、楽曲検索方法、および楽曲検索プログラム
JP2016057571A (ja) * 2014-09-12 2016-04-21 ヤマハ株式会社 音響解析装置
JP2016057570A (ja) * 2014-09-12 2016-04-21 ヤマハ株式会社 音響解析装置
JP7135607B2 (ja) * 2018-09-03 2022-09-13 日本電信電話株式会社 情報処理装置、情報処理方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06290574A (ja) * 1993-03-31 1994-10-18 Victor Co Of Japan Ltd 楽曲検索装置
JPH10134549A (ja) * 1996-10-30 1998-05-22 Nippon Columbia Co Ltd 楽曲検索装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06290574A (ja) * 1993-03-31 1994-10-18 Victor Co Of Japan Ltd 楽曲検索装置
JPH10134549A (ja) * 1996-10-30 1998-05-22 Nippon Columbia Co Ltd 楽曲検索装置

Also Published As

Publication number Publication date
JP2003099462A (ja) 2003-04-04

Similar Documents

Publication Publication Date Title
JP4622199B2 (ja) 楽曲検索装置及び楽曲検索方法
JP4465626B2 (ja) 情報処理装置および方法、並びにプログラム
JP3433818B2 (ja) 楽曲検索装置
CN106095925B (zh) 一种基于声乐特征的个性化歌曲推荐方法
US7812241B2 (en) Methods and systems for identifying similar songs
Bosch et al. Evaluation and combination of pitch estimation methods for melody extraction in symphonic classical music
JP4344499B2 (ja) 音楽データベースの検索
US8492637B2 (en) Information processing apparatus, musical composition section extracting method, and program
JP5565374B2 (ja) オーディオ作品のセグメンテーションを変更するための装置
US7373209B2 (en) Sound features extracting apparatus, sound data registering apparatus, sound data retrieving apparatus, and methods and programs for implementing the same
JP5593608B2 (ja) 情報処理装置、メロディーライン抽出方法、ベースライン抽出方法、及びプログラム
US20050086052A1 (en) Humming transcription system and methodology
CN109979488B (zh) 基于重音分析的人声转乐谱系统
WO2001031513A2 (en) Music search by melody input
JP5127982B2 (ja) 音楽検索装置
JP2007520727A (ja) 楽曲のようなサウンドシーケンスを処理する方法
JPH10307580A (ja) 音楽検索方法および装置
JPH10319948A (ja) 音楽演奏に含まれる楽器音の音源種類判別方法
JP6296221B2 (ja) 音響信号のアライメント装置、アライメント方法及びコンピュータプログラム
JP4722738B2 (ja) 楽曲分析方法及び楽曲分析装置
CN110867174A (zh) 自动混音装置
Nagavi et al. An extensive analysis of query by singing/humming system through query proportion
JP4607660B2 (ja) 楽曲検索装置および楽曲検索方法
JP3934556B2 (ja) 信号識別子の抽出方法及びその装置、信号識別子からデータベースを作成する方法及びその装置、及び、検索時間領域信号を参照する方法及びその装置
JP7375302B2 (ja) 音響解析方法、音響解析装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101018

R151 Written notification of patent or utility model registration

Ref document number: 4622199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term