JP2007114798A - 楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体 - Google Patents

楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体 Download PDF

Info

Publication number
JP2007114798A
JP2007114798A JP2006307810A JP2006307810A JP2007114798A JP 2007114798 A JP2007114798 A JP 2007114798A JP 2006307810 A JP2006307810 A JP 2006307810A JP 2006307810 A JP2006307810 A JP 2006307810A JP 2007114798 A JP2007114798 A JP 2007114798A
Authority
JP
Japan
Prior art keywords
music
search
impression value
predicted
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006307810A
Other languages
English (en)
Other versions
JP4027405B2 (ja
Inventor
Junichi Tagawa
潤一 田川
Hiroaki Yamane
裕明 山根
Masayuki Misaki
正之 三▲さき▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2006307810A priority Critical patent/JP4027405B2/ja
Publication of JP2007114798A publication Critical patent/JP2007114798A/ja
Application granted granted Critical
Publication of JP4027405B2 publication Critical patent/JP4027405B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

【課題】楽曲に対する主観的な印象に基づいて利用者の希望する楽曲を検索可能にする方法及び装置を提供する。
【解決手段】検索を希望する楽曲に対する利用者の主観的な要件を入力して数値化して出力し、その出力から、検索対象の楽曲の印象を数量化した予測印象値を算出し、前記予測印象値をキーとして、複数の楽曲の音響信号及びその楽曲の印象を数量化した印象値を格納した前記楽曲データベースを検索することにより、利用者の楽曲に対する主観的なイメージに基づいて、希望する楽曲を検索することが可能となる。
【選択図】図1

Description

本発明は、楽曲に関する書誌情報や楽曲に対する主観的な印象に基づいて、利用者の希望する楽曲を検索して提示する楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体に関するものである。
ハードディスクや連装機能付きCDプレーヤ等、大量の音楽が格納されている楽曲データベースから特定の楽曲を検索する場合、一般的には楽曲の曲名や歌手名、作詞・作曲者名等をキーワードとして検索を行う場合が多い。
従来の一般的な楽曲検索装置を、図8を用いて説明する。図8において、81は選曲条件入力手段で、検索対象の曲名等、選曲の条件を入力する。82は楽曲データベースで、楽曲のオーディオ信号と共に、各楽曲の曲名や歌手名、作詞・作曲者名等の書誌情報が記録され、参照可能となっている。83は書誌情報検索手段で、選曲条件入力手段81で入力された曲名等の条件を検索キーとして楽曲データベースを参照し、検索キーと一致又は類似する書誌情報をもった楽曲を出力する。84は再生曲選択手段で、書誌情報検索手段83の検索結果から利用者が再生を希望する楽曲を選択する。そして85は楽曲再生手段で、再生曲選択手段84で選択された楽曲を聴取可能なように再生する。
従来の楽曲検索装置の動作を例を挙げて説明する。今、利用者が「クリスマス」に関する楽曲を検索し、聴取したいとする。この場合は、利用者が選曲条件入力手段81で曲名の項目に「クリスマス」と入力し、曲名に「クリスマス」という文字列が含まれる楽曲を検索するのが一般的である。書誌情報検索手段83では、楽曲データベース82を参照し、曲名「クリスマス」を検索キーとして書誌情報に「クリスマス」という文字列が含まれている楽曲を検索し、その結果を出力する。検索の結果、「クリスマスキャロル」、「クリスマスイブ」、「戦場のメリークリスマス」の3曲が出力されたとすると、再生曲選択手段84でこれら3曲のその他の書誌情報(歌手名、作詞・作曲者名等)を参考に利用者が再生する曲を選択し、希望の曲があれば楽曲再生手段85で再生し、聴取することができる。
しかしながら、上記のような楽曲の曲名、歌手名等の書誌情報は楽曲の客観的・外観的な観点からの情報であり、楽曲そのものが聴取者に対してもたらす主観的印象を推測するのは困難である。そのため、「躍動感がある楽曲を検索したい」などという主観的な印象に基づく楽曲の検索は、従来の楽曲検索装置では困難であるという課題があった。
一方、上記主観的な印象に基づく楽曲検索を実現するために、上記楽曲データベース82に予め楽曲の主観的な印象をインデックス化して登録しておき、このインデックス情報に基づいて所望の楽曲を検索する方法が考えられる。しかしこの場合、上記インデックス情報の登録作業は人(主に装置の作成者又は利用者)が各楽曲を聞いてその印象を判断する必要があり、登録する楽曲数が多い場合はその作業にかかる負担も大きくなるという課題があった。
そこで本発明の目的は、楽曲に対する主観的な印象に基づいて利用者の希望する楽曲を検索可能にする楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体を提供することにある。
この課題を解決するために本発明の楽曲検索装置は、楽曲データベースから楽曲を検索する楽曲検索装置であって、利用者の聴覚要件を数値化して出力する検索要件入力部と、前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部と、を有することを特徴とするものである。
この課題を解決するために本発明の楽曲検索装置は、楽曲データベースから楽曲を検索する楽曲検索装置であって、利用者の聴覚要件を数値化して出力する検索要件入力部と、前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記楽曲の特徴量に関する検索要件を前記検索要件入力部に入力することを特徴とするものである。
この課題を解決するために本発明の楽曲検索装置は、楽曲データベースから楽曲を検索する楽曲検索装置であって、利用者の聴覚要件を数値化して出力する検索要件入力部と、前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測象値算出部と、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記予測印象値算出部は、前記検索要件入力部の出力に応じて予め定めた数量に基づいて予測印象値を算出することを特徴とするものである。
この課題を解決するために本発明の楽曲検索装置は、楽曲データベースから楽曲を検索する楽曲検索装置であって、利用者の聴覚要件を数値化して出力する検索要件入力部と、前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記印象値検索部は、前記予測印象値と前記楽曲データベースに格納されている楽曲の印象値との間のユークリッド距離を算出し、前記ユークリッド距離が小さい楽曲から順に候補曲として出力することを特徴とするものである。
この課題を解決するために本発明の楽曲検索装置は、楽曲データベースから楽曲を検索する楽曲検索装置であって、利用者の聴覚要件を数値化して出力する検索要件入力部と、前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記印象値検索部は、前記予測印象値と前記楽曲データベースに格納されている楽曲の印象値との間のユークリッド距離を算出し、前記ユークリッド距離が所定の距離以下の楽曲に対して前記ユークリッド距離が小さい楽曲から順に候補曲として出力することを特徴とするものである。
この課題を解決するために本発明の楽曲検索装置は、楽曲データベースから楽曲を検索する楽曲検索装置であって、利用者の聴覚要件を数値化して出力する検索要件入力部と、前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記印象値検索部は、前記予測印象値と前記楽曲データベースに格納されている各楽曲の印象値との間のユークリッド距離を算出し、前記ユークリッド距離に基づいて類似度を算出し、前記類似度に基づいて候補曲を出力することを特徴とするものである。
この課題を解決するために本発明の楽曲検索装置は、楽曲データベースから楽曲を検索する楽曲検索装置であって、利用者の聴覚要件を数値化して出力する検索要件入力部と、前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記印象値検索部が出力した前記候補曲に関する情報を前記楽曲データベースより抽出して利用者に提示し、前記候補曲から特定の楽曲を選択する選曲部と、前記選曲部で選曲された楽曲の音響信号を前記データベースから抽出し、楽曲の一部又は全部を利用者が聴取可能なように再生する楽曲再生部と、を有することを特徴とするものである。
この課題を解決するために本発明の楽曲検索装置は、楽曲データベースから楽曲を検索する楽曲検索装置であって、利用者の聴覚要件を数値化して出力する検索要件入力部と、前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記印象値検索部が出力した前記候補曲に関する情報を前記楽曲データベースより抽出して利用者に提示し、前記候補曲から特定の楽曲を予め定めた選曲方法に従って楽曲を選択する選曲部と、前記選曲部で選曲された楽曲の音響信号を前記データベースから抽出し、楽曲の一部又は全部を利用者が聴取可能なように再生する楽曲再生部と、を具備することを特徴とするものである。
この課題を解決するために本発明の楽曲検索方法は、楽曲データベースから楽曲を検索する楽曲検索方法であって、利用者の聴覚要件を数値化して出力する検索要件入力ステップと、前記検索要件入力ステップの出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出ステップと、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索ステップと、を有することを特徴とするものである。
この課題を解決するために本発明のコンピュータプログラムは、コンピュータによって読み取られ実行されるコンピュータプログラムであって、コンピュータに、利用者の聴覚要件を数値化して出力する検索要件入力ステップと、前記検索要件入力ステップの出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出ステップと、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索ステップと、を実行させるためのものである。
この課題を解決するために本発明の記録媒体は、コンピュータに、利用者の聴覚要件を数値化して出力する検索要件入力ステップと、前記検索要件入力ステップの出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出ステップと、前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索ステップと、を実行させるためのプログラムを記録したコンピュータ読み取り可能なものである。
本願の発明は、検索を希望する楽曲に対する利用者の主観的な要件を入力して数値化して出力し、その出力から、検索対象の楽曲の印象を数量化した予測印象値を算出し、前記予測印象値をキーとして、複数の楽曲の音響信号及びその楽曲の印象を数量化した印象値を格納した前記楽曲データベースを検索することにより、利用者の楽曲に対する主観的なイメージに基づいて、希望する楽曲を検索することが可能となる。
請求項4記載の発明は、前記予測印象値と前記楽曲データベースに格納されている各楽曲の印象値との間のユークリッド距離を算出し、前記ユークリッド距離が小さい楽曲から順に出力することにより、検索対象のイメージに近い候補曲を類似度の大きい順に出力することができる。
請求項5記載の発明は、前記予測印象値と前記楽曲データベースに格納されている各楽曲の印象値との間のユークリッド距離を算出し、前記ユークリッド距離が予め定めた距離以下の楽曲について、前記ユークリッド距離の小さい楽曲から順から出力することにより、類似度が予め定めた範囲以内の候補曲を類似度の大きい順に出力することができる。
請求項6記載の発明は、ユークリッド距離に基づいて前記予測印象値と候補曲の印象値との類似度を算出し、その類似度を候補曲と共に出力することにより、利用者に対し、検索対象に対する候補曲の類似度の指標を提示することができる。
請求項7記載の発明は、前記印象値検索ステップが出力した前記候補曲に関する情報を前記楽曲データベースより抽出して利用者に対して提示し、利用者が候補曲から楽曲を選択可能にし、利用者が選曲した楽曲の音響信号を前記データベースから抽出し、楽曲の一部または全部を利用者が聴取可能なように再生することにより、利用者が検索結果を試聴して確認でき、検索結果の絞込みを行うことが可能となる。
請求項8記載の発明は、予め定めた選曲方法に従って候補曲から抽出する楽曲を選択することにより、複数の候補曲から出力する楽曲を絞り込むことができる。
また本願の請求項10,11記載の発明は、検索を希望する楽曲に対する利用者の主観的な要件を入力して数値化して出力し、その出力から、検索対象の楽曲の印象を数量化した予測印象値を算出し、前記予測印象値をキーとして、複数の楽曲の音響信号及びその楽曲の印象を数量化した印象値を格納した前記楽曲データベースを検索するように機能させるプログラムを記録媒体に記録することにより、記録媒体に記録されたコンピュータプログラムにより、利用者の楽曲に対する主観的なイメージに基づいて、希望する楽曲を検索することができる。
(実施の形態1)
以下、本発明の実施の形態1について、図面を参照しながら説明する。図1は本発明の実施の形態1における楽曲検索装置の全体構成を示すブロック図である。図1において、11は楽曲データベース、12は音響信号入力手段、13は特徴量抽出手段、14は印象値算出手段、15は書誌情報入力手段、16は検索要件入力手段、17は予測印象値算出手段、18は印象値検索手段、19は選曲手段、110は楽曲再生手段を表している。
以上のように構成された楽曲検索装置の動作について、図1を用いて説明する。本装置は大きく分けて、検索対象となる楽曲の音響信号及びその付随情報を楽曲データベース11に登録する楽曲登録部111、及び利用者の検索要件に応じて楽曲データベースから所望の楽曲を検索する楽曲検索部112及び楽曲データベース11より構成される。
まず楽曲登録部111について概説する。楽曲データベース11は、利用者が再生可能な複数の楽曲について、楽曲毎にその音響信号及び付随情報を記録し、参照可能としたものである。最初に、音響信号入力手段12は、登録対象として入力された音響信号(CD等のメディアに記録された音響信号や放送等で配信される音響信号等)を楽曲データベース11へ登録すると共に、付随情報生成のため後段の特徴量抽出手段13に出力する。入力される音響信号がアナログ信号の場合は、音響信号入力手段12によりディジタル化した後、後段に出力される。
次に、特徴量抽出手段13は、入力された音響信号から、その音響信号の物理的特徴を表すいくつかの特徴量を抽出し楽曲データベースに登録する。そして、印象値算出手段14は特徴量抽出手段13が抽出した楽曲の物理的特徴量を、楽曲の主観的な印象を数量化した印象値に変換し、楽曲データベースに登録する。一方、登録対象として入力された音響信号に関する書誌情報(曲名、歌手名等)は書誌情報入力手段15により別途楽曲データベースに登録される。
次に楽曲検索部112について概説する。最初に、利用者は検索要件入力手段16に、検索したい楽曲に対する要件を入力する。次に予測印象値算出手段17は入力された検索要件のうち主観的な印象に関する部分から、検索対象として予想される楽曲の印象値(楽曲の主観的な印象を表す数量)を算出する。そして印象値検索手段18は入力された検索要件と予測印象値算出手段17で算出された予想印象値を検索キーとして、楽曲データベース11に登録されている各楽曲の付随情報部分を参照し、検索キーに類似する付随情報をもっている複数の楽曲を候補曲として出力する。その後、選曲手段19は、利用者の選択操作や予め定めた選曲手順等により楽曲の選択を行い、楽曲再生手段110は最終的に選択された楽曲を検索結果として再生する。
では、以下各手段の詳細について、図面を参照しながら説明する。図2は本実施の形態における特徴量抽出抽出手段の概略を示すブロック図である。また(表1)は本発明の実施の形態における特徴量及びその概略を表したものである。
Figure 2007114798
図2の特徴量抽出手段は、入力された音響信号から、(表1)に記載された8つの物理的特徴量を抽出する。(表1)の各特徴量の抽出動作を図2を使って説明する。以下、処理フレーム時刻をt,帯域分割した周波数帯域番号をfとし、音響信号はディジタル化された後、一定時間長のフレーム単位で処理されるものとする。
(1)スペクトル変化度(SF)
まずステップ21において入力された音響信号を処理フレーム毎にフーリエ変換し、各帯域のパワーを求めることによりパワースペクトルS(t)を算出する。次にステップ22において(数1)よりフレーム間のパワースペクトル変化量ΔS(t)を算出する。
Figure 2007114798
そしてステップ23において全フレーム時刻にわたりΔS(t)を平均化し、スペクトル変化度SFLXを算出する(数2)。
Figure 2007114798
(2)平均発音数(AR)
まず、ステップ21で算出されたパワースペクトルS(t)の各帯域のパワーp(t,f)を利用して、各帯域の信号成分の立ち上がり度合いd(t,f)及びd(t,f)をフレーム時刻tにおいて周波数方向に加算した立ち上がり成分D(t)を算出する。d(t,f)及びD(t)は、各帯域fのパワーp(t,f)を利用して(数3)から(数7)により算出する。
Figure 2007114798
Figure 2007114798
Figure 2007114798
Figure 2007114798
Figure 2007114798
立ち上がり度合いd(t,f)及び立ち上がり成分D(t)の抽出方法については、例えば文献(後藤・村岡:“音楽音響信号に対するビートトラッキングシステム”,情報処理学会研究報告,Vol.94, No.71, pp.49-56, 1994)に詳細が記載されている。そしてステップ25において立ち上がり度合いd(t,f)の全フレームにわたる出現頻度を(数8)により算出し、平均発音数とする。
Figure 2007114798
(3)発音非周期性(NZ)
まずステップ26において(数9)によりD(t)の自己相関関数A(m)(mは遅延フレーム)を算出し、立ち上がり成分の周期性を求める。次にステップ27においてA(m)をフーリエ変換し、各帯域のパワーを求めることによりA(m)のパワースペクトルAspec(K)(Kは周波数)を算出する。そしてステップ28においてAspec(K)の直流成分値(即ちAspec(0))を、ステップ29においてAspec(K)のピーク値(Aspec(Kpeak)とする)をそれぞれ検出し、ステップ210においてAspec(0)とAspec(Kpeak)の比率を算出することにより、発音非周期性を算出する(数10)。
Figure 2007114798
Figure 2007114798
(4)拍周期(TT)
拍周期TTは、楽曲の拍の間隔、即ち当前記楽曲の4分音符の時間長であり、立ち上がり成分D(t)の自己相関関数A(m)を用いて検出する。まずステップ211でA(m)のピーク部分、即ち信号の立ち上がり成分の周期が最も強く表れている時間長pk(i)を算出する。次にステップ212によりpk(i)より拍周期候補T1,T2を算出し、ステップ213で楽曲の周期構造を算出し、ステップ214において立ち上がり頻度AR、及び前記周期性構造を参照することにより、T1,T2のうち真の拍周期と考えられる方を楽曲の拍周期として出力する。拍周期の算出方法については、例えば文献(田川・三崎:“音楽信号からのテンポ検出法に関する一検討”,日本音響学会講演論文集,pp.529-530,
2000)に詳細が記載されている。
(5)拍周期比率(BR)
拍周期と、優勢な発音周期との関係より、拍周期比率を求める。まずステップ215において、上記Aspec(Kpeak)に対応する時間周期Tkpeakを算出した後、(数11)により拍周期TTとTkpeakとの比率BRを算出する。
Figure 2007114798
(6)拍強度1(BI1)
拍周期の概ね半分の周期で出現する、立ち上がり成分のパワーを算出する。まずステップ216において拍周期の半分に相当する周波数f1をTTより算出する。そしてステップ217においてf1近傍で極大値をもつAspec(K)の値を参照し、その値をBI1とする。
(7)拍強度2(BI2)
拍周期の概ね1/4の周期で出現する、立ち上がり成分のパワーを算出する。まずステップ218において拍周期の半分に相当する周波数f2をTTより算出する。そしてステップ219においてf2近傍で極大値をもつAspec(K)の値を参照し、その値をBI2とする。
(8)拍強度比(IR)
ステップ220において、拍強度1BI1と拍強度2BI2の比率IRを(数12)により算出する。
Figure 2007114798
以上の各特徴量は、楽曲の音響的特徴を表した数量であり、楽曲が聴取者に与える主観的な印象と関連が高いと考えられる。例えば、拍周期は楽曲のテンポ、即ち速さを表現する数量であり、一般的に速い楽曲は「忙しく」、遅い曲は「ゆったり」感じられるなどは、我々が日常音楽を聞く上で体験することである。そこで、これらの特徴量を主観的な印象と関連付けるための数量として用いる。
図1の特徴量抽出手段13により求まった(表1)の特徴量は、印象値算出手段14において、(数13)により印象値、即ち楽曲の主観的な印象を表現する数量に変換される。
Figure 2007114798
(数13)において、Iiは印象因子iに対する印象値、Pjは特徴量jの値、Wijは特徴量jと印象因子iとの関係を表す重み係数、Npは特徴量の種類数である。本実施の形態では(表1)に示されているようにNp=7であり、Pjはそれぞれ各特徴量に対応する。また、印象値Iiは楽曲の主観的な印象を表す数量であり、特定の形容詞語で表現されるような印象の度合い(Ejとする)を集約した数量として用いる。例えば、楽曲の印象を「激しさ(E1)」、「のりのよさ(E2)」、「爽やかさ(E3)」、「素朴さ(E4)」、「ソフトさ(E5)」の5つの観点の度合いで表現すると、IiはEjから(数14)で求める。
Figure 2007114798
(数14)でYijはEjとIjとの関係を表す重み係数である。Yij及び印象因子数Niの導出は、サンプルとして選定した複数の楽曲に対するEjの値を予めSD(semantic differencial)法等による官能評価実験で求めておき、その結果に対し、主成分分析等の因子分析を施すことにより求めておく。また、Wijの導出は、上記官能評価及び因子分析によりYijを導出し各楽曲の印象値Iiを(数14)で求めた後、その対応する各楽曲について算出した特徴量Pjとの関係を線形重回帰分析等の手法により算出する。なお、上記特徴量Pjと印象値Iiの導出は、線形重回帰分析にかえてニューラルネットワーク等の非線形なシステムにより導出しても良い。
楽曲データベース11は、各楽曲の音響信号及びその付随情報より構成されるレコードの集合体である。本実施の形態における楽曲データベース11のレコード構成例を図3に示す。レコードは、レコードを一意に参照するための曲ID、書誌情報入力手段15により入力された曲名や歌手名などの楽曲に関する書誌情報、特徴量抽出手段13により抽出された特徴量、特徴量から印象値変換手段により抽出された印象値、及び音響信号入力手段12で入力された楽曲の音響信号より構成される。
検索要件入力手段16は、利用者が検索を希望する楽曲に対する要件を入力する。入力される検索要件の例を図4に示す。検索要件はアーティスト名などの文字列や「激しさ」の度合いなどを表す数値、及び「陽気に踊りたい」など予め定めた条件の有無および検索方法などを入力する。各検索要件は、キーボードや各種スイッチ、スライダーやボリューム等の手段により利用者により入力される。
予測印象値算出手段17は、検索要件入力手段16で入力された検索要件のうち、主観的な印象に関する要件(主観的要件)から、検索対象として予想される楽曲の印象値PIj(予測印象値)を算出する。予測印象値PIjは前記重み係数Yijを用いて数15より算出される。
Figure 2007114798
IEjは例えば「激しさ」の度合い等、主観的要件を構成する数値であり、IEjの種類は重み係数Yijの導出過程で用いられた楽曲に対する印象の度合いの種類と対応する。
また、「陽気に踊りたい」など複数の主観的要因が絡む要件については、予めその要件を表現するIEjの値をプリセットしておき、当前記要件が選択された場合はそのプリセット値から(数15)より予測印象値PIjを算出する。例えば、主観的な度合いを最大1.0、最小−1.0の間の数量で表現した場合、「陽気に踊りたい」という要件は、「のりのよさ及び爽快さの度合いが大きい」と類推できるので、激しさIE1=0.5、のりのよさIE2=1.0、爽やかさIE3=1.0、素朴さIE4=0.0、ソフトさIE5=0.0などという値でプリセットしておき、このIEjより対応する予測印象値PIjを算出することができる。
印象値検索手段18は、楽曲データベース11を参照し、書誌的要件と予測印象値PIjを検索キーとして、検索キーに類似するレコードを抽出する。書誌的要件に対しては、楽曲データベースに格納されている各レコードの書誌情報部分を参照し、入力された要件とのマッチングを計る(入力された文字列が含まれているかなど)ことにより、類似するレコードを抽出する。一方、予測印象値PIjに対しては、楽曲データベースに格納されている各レコードの印象値との類似性を数量化して検索する。印象値の類似性を模式的に説明した図を図5に示す。各レコードに記録されている各楽曲の印象値Iiは印象因子数Ni個の数値組で構成されるベクトルとして空間上で表現することができ、この空間を印象空間と呼ぶことにする。図5は印象値の印象因子数Ni=2の場合の例であり、各楽曲の印象値Iiは42のように2次元の印象空間上の点で表現される。同様に予測印象値PIjも印象空間上に布置することができ、ある主観的要件に対して例として43の位置に布置されたとする。すると、予測印象値PIjと楽曲の印象値Iiの類似性は印象空間上のユークリッド距離の大小として表現することができ、(数16)により距離Lを算出し数量化できる。
Figure 2007114798
距離Lを検索対象の全ての楽曲に対して算出すると、Lが小さい楽曲ほど予測印象値と類似している、即ち希望する楽曲の主観的な印象と類似するとみなすことができるので、距離Lが小さい楽曲から順次候補曲とする。検索結果として出力する候補曲は、予め定めた個数の候補曲を検索結果として出力する。なお、44のように予測印象値を中心とした類似性判別境界を設定し、境界内の楽曲を検索結果として出力しても良い。この場合は、類似性の判別範囲を予め定めておくことにより、類似度がある程度以上の楽曲は候補曲としないという限定を加えることができる。
また、書誌的要件による検索と主観的要件による検索はそれぞれ独立して行っても、組み合わせて行ってもよく、検索方法は利用者が検索要件入力手段で指定するものとする。
また、検索要件入力手段16で入力された曲名等の書誌情報からまず前記当する楽曲を検索し、さらにその楽曲の印象値を予測印象値として楽曲を検索することにより、書誌情報に基づいて、主観的に類似する楽曲を検索することができる。例えば、利用者が曲名に「夜空ノムコウ」と入力し、この曲名をキーにまず楽曲データベース11を検索する。そして前記当する楽曲が見つかった後、さらに「夜空ノムコウ」の印象値を予測印象値として楽曲データベース11を検索することにより、当前記楽曲の主観的印象に基づいて検索を行い、それに類似した印象をもつ楽曲を検索することが可能となる。この例では、「「夜空ノムコウ」に類似する印象をもつ楽曲」が検索結果として出力される。
また、検索要件入力手段16が、音響信号入力手段12、特徴量抽出手段13、及び印象値算出手段14を備えると、入力された音響信号から特徴量を算出し、その特徴量を予測印象値として楽曲データベースを参照することにより、入力された楽曲の音響信号に類似した印象をもつ楽曲を検索することができる。
印象値検索手段18によって抽出された候補曲は、選曲手段19によってさらに絞り込むことができる。選曲手段19では抽出された候補曲に関する付随情報(曲名、アーティスト名等)を楽曲データベースより抽出して利用者に提示し、再生する楽曲の選択を促す。選択に際しては楽曲再生手段110により楽曲の一部または全部を視聴しても良い。
また、主観的要件により検索がなされた場合は、印象値検索手段18で算出した距離Lに基づき、利用者が指定した主観的要件と抽出された各候補曲との類似度を算出し、その類似度を利用者に提示しても良い。なお、検索結果の選択は、「第一候補曲を選択結果とする」など予め定めた方法により利用者の指示を介さず自動的に行われても良い。利用者に対する情報の提示はモニターやLCDなどの表示手段により行われ、選択の入力はキーボードやスイッチなどの入力手段によりなされる。
選曲手段により選択された楽曲は、楽曲再生手段110により利用者が聴取可能な形で提示される。もちろん、楽曲を再生せず、曲名等の書誌情報を検索結果として利用者に提示しても良い。
次に図6は楽曲登録装置の全体構成を示すブロック図である。図6において、61は楽曲データベース、62は音響信号入力手段、63は特徴量抽出手段、64は印象値算出手段、65は書誌情報入力手段を表している。本装置は実施の形態1における、楽曲登録部111を独立して装置化したものである。従って、図6の各手段の動作は、実施の形態1記載の各手段と同様である。
楽曲登録装置は、検索データとして楽曲データベースに登録する楽曲及びその付随情報を入力された音響信号より抽出し、楽曲データベース61に格納する。本装置によりデータベース61に格納されるデータは、音響信号、特徴量、印象値、書誌情報等であり、本データを楽曲データベースに格納することにより、実施の形態1記載の楽曲検索装置に必要なデータベースを個別に作成することができる。
なお、楽曲データベース61はハードディスク等の記録媒体やCDROM等のリムーバブル媒体の形態をとり、本装置により楽曲データを登録後、楽曲検索装置に組み込み検索に利用することができる。
また、楽曲データベース61とその他の手段とはインターネット等のネットワークを介して接続されている場合があり、この場合は、本装置により登録データを作成後、ネットワークを介してデータベースに格納することにより、ネットワークに接続された1または複数の楽曲検索装置に対して、検索に必要なデータを供給することができる。
(実施の形態2)
本実施の形態は、上記実施の形態1をコンピュータプログラムとして実施した形態である。以下、本発明の実施の形態2について、図面を参照しながら説明する。図7は本発明の実施の形態2におけるプログラムの全体構成を示すブロック図である。図7において、71は楽曲登録プログラム、72は楽曲検索プログラム、73は楽曲データベースであり、その他の手段の名称及び機能は実施の形態1に記載の各手段と同様である。
楽曲登録プログラム71及び楽曲検索プログラム72は、パーソナルコンピュータやマイクロコンピュータ等の各種コンピュータ用のプログラムとして記述され、コンピュータの記録領域(メモリ、ハードディスク、フレキシブルディスク等)に格納されている。また楽曲データベース73は実施の形態1や実施の形態2に記載のように、ハードディスクやCDROM等のコンピュータの記録媒体に記録されているデータの集合体である。
楽曲登録プログラム71は、検索データとして楽曲データベースに登録する楽曲及びその付随情報をコンピュータに入力された音響信号より抽出し、楽曲データベース73に格納する。本プログラムにより楽曲データベース73に格納されるデータは、音響信号、特徴量、印象値、書誌情報等であり、本データを楽曲データベース73に格納することにより、楽曲検索プログラム72に必要なデータベースを作成することができる。
一方、楽曲検索プログラム72は、まず利用者の検索要件を入力し、その検索要件のうち主観的な印象に関する部分から、検索対象として予想される楽曲の印象値(予測印象値)を算出する。そして入力された検索要件と前記予測印象値を検索キーとして、楽曲データベース73に登録されている各楽曲の付随情報部分を参照し、検索キーに類似する付随情報をもっている複数の楽曲を候補曲として出力する。その後、利用者の選択操作を記号化した選択パラメータや予め定めた選曲手順等により楽曲の選択を行い、最終的に選択された楽曲を検索結果として出力する。
以上のプログラムにより、利用者が入力した検索要件に応じて、所望の楽曲を提供することが可能となる。なお、楽曲登録プログラム71及び楽曲検索プログラム72はCDROM91(図9)等のリムーバブルメディアやコンピュータネットワーク等を介してコンピュータの記録領域に格納されても良い。また、楽曲登録プログラム71と楽曲検索プログラム72はそれぞれ別のコンピュータ上で動作し、両コンピュータで共有された記録領域に格納された楽曲データベース73にアクセスしても良い。もちろん、楽曲データベース73をフレキシブルディスクやCDROM等のリムーバブルメディアに記録し、楽曲登録プログラム71でデータベース73を作成後、別のコンピュータで動作する楽曲検索プログラム72で利用しても良い。
本発明の実施の形態1の楽曲検索装置の概略構成を表すブロック図 本発明の実施の形態1の特徴量抽出の概略構成を表すブロック図 本発明の実施の形態1の楽曲データベースを構成するレコードの例を表す図 本発明の実施の形態1の入力要件の例を表す図 印象空間の模式的説明を表す図 本発明の実施の形態2の楽曲登録装置の概略構成を表すブロック図 本発明の実施の形態3の楽曲検索プログラムの概略構成を表すブロック図 従来の楽曲検索装置の概略構成を表すブロック図 本発明の実施の形態3のCDROMを示す図
符号の説明
11,61,73,82 楽曲データベース
12,62 音響信号入力手段
13,63 特徴量抽出手段
14,64 印象値算出手段
15,65 書誌情報入力手段
16 検索要件入力手段
17 予測印象値算出手段
18 印象値検索手段
19 選曲手段
31 楽曲レコード
32 書誌情報
33 特徴量
34 印象値
71 楽曲登録プログラム
72 楽曲検索プログラム
81 選曲条件入力手段
83 書誌情報検索手段
84 再生曲選択手段
85,110 楽曲再生手段
91 CDROM
111 楽曲登録部

Claims (11)

  1. 楽曲データベースから楽曲を検索する楽曲検索装置であって、
    利用者の聴覚要件を数値化して出力する検索要件入力部と、
    前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部と、を有することを特徴とする楽曲検索装置。
  2. 楽曲データベースから楽曲を検索する楽曲検索装置であって、
    利用者の聴覚要件を数値化して出力する検索要件入力部と、
    前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記楽曲の特徴量に関する検索要件を前記検索要件入力部に入力することを特徴とする楽曲検索装置。
  3. 楽曲データベースから楽曲を検索する楽曲検索装置であって、
    利用者の聴覚要件を数値化して出力する検索要件入力部と、
    前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、
    前記予測印象値算出部は、
    前記検索要件入力部の出力に応じて予め定めた数量に基づいて予測印象値を算出することを特徴とする楽曲検索装置。
  4. 楽曲データベースから楽曲を検索する楽曲検索装置であって、
    利用者の聴覚要件を数値化して出力する検索要件入力部と、
    前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、
    前記印象値検索部は、
    前記予測印象値と前記楽曲データベースに格納されている楽曲の印象値との間のユークリッド距離を算出し、前記ユークリッド距離が小さい楽曲から順に候補曲として出力することを特徴とする楽曲検索装置。
  5. 楽曲データベースから楽曲を検索する楽曲検索装置であって、
    利用者の聴覚要件を数値化して出力する検索要件入力部と、
    前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、
    前記印象値検索部は、
    前記予測印象値と前記楽曲データベースに格納されている楽曲の印象値との間のユークリッド距離を算出し、前記ユークリッド距離が所定の距離以下の楽曲に対して前記ユークリッド距離が小さい楽曲から順に候補曲として出力することを特徴とする楽曲検索装置。
  6. 楽曲データベースから楽曲を検索する楽曲検索装置であって、
    利用者の聴覚要件を数値化して出力する検索要件入力部と、
    前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、
    前記印象値検索部は、
    前記予測印象値と前記楽曲データベースに格納されている各楽曲の印象値との間のユークリッド距離を算出し、前記ユークリッド距離に基づいて類似度を算出し、前記類似度に基づいて候補曲を出力することを特徴とする楽曲検索装置。
  7. 楽曲データベースから楽曲を検索する楽曲検索装置であって、
    利用者の聴覚要件を数値化して出力する検索要件入力部と、
    前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記印象値検索部が出力した前記候補曲に関する情報を前記楽曲データベースより抽出して利用者に提示し、前記候補曲から特定の楽曲を選択する選曲部と、
    前記選曲部で選曲された楽曲の音響信号を前記データベースから抽出し、楽曲の一部又は全部を利用者が聴取可能なように再生する楽曲再生部と、を有することを特徴とする楽曲検索装置。
  8. 楽曲データベースから楽曲を検索する楽曲検索装置であって、
    利用者の聴覚要件を数値化して出力する検索要件入力部と、
    前記検索要件入力部の出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出部と、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索部とを有し、前記印象値検索部が出力した前記候補曲に関する情報を前記楽曲データベースより抽出して利用者に提示し、前記候補曲から特定の楽曲を予め定めた選曲方法に従って楽曲を選択する選曲部と、
    前記選曲部で選曲された楽曲の音響信号を前記データベースから抽出し、楽曲の一部又は全部を利用者が聴取可能なように再生する楽曲再生部と、を具備することを特徴とする楽曲検索装置。
  9. 楽曲データベースから楽曲を検索する楽曲検索方法であって、
    利用者の聴覚要件を数値化して出力する検索要件入力ステップと、
    前記検索要件入力ステップの出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出ステップと、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索ステップと、を有することを特徴とする楽曲検索方法。
  10. コンピュータによって読み取られ実行されるコンピュータプログラムであって、
    コンピュータに、
    利用者の聴覚要件を数値化して出力する検索要件入力ステップと、
    前記検索要件入力ステップの出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出ステップと、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索ステップと、を実行させるためのコンピュータプログラム。
  11. コンピュータに、
    利用者の聴覚要件を数値化して出力する検索要件入力ステップと、
    前記検索要件入力ステップの出力から聴感上の心理量を数量化した予測印象値を算出する予測印象値算出ステップと、
    前記予測印象値を検索キーとして前記楽曲データベースを検索する印象値検索ステップと、を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2006307810A 2006-11-14 2006-11-14 楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体 Expired - Fee Related JP4027405B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006307810A JP4027405B2 (ja) 2006-11-14 2006-11-14 楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006307810A JP4027405B2 (ja) 2006-11-14 2006-11-14 楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001082150A Division JP4027051B2 (ja) 2001-03-22 2001-03-22 楽曲登録装置、楽曲登録方法、及びそのプログラムと記録媒体

Publications (2)

Publication Number Publication Date
JP2007114798A true JP2007114798A (ja) 2007-05-10
JP4027405B2 JP4027405B2 (ja) 2007-12-26

Family

ID=38096952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006307810A Expired - Fee Related JP4027405B2 (ja) 2006-11-14 2006-11-14 楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体

Country Status (1)

Country Link
JP (1) JP4027405B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009258292A (ja) * 2008-04-15 2009-11-05 Yamaha Corp 音声データ処理装置およびプログラム
JP2009282681A (ja) * 2008-05-21 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 類似アイテム検索装置及び類似アイテム検索方法並びにそのプログラムと記録媒体
JP2010118885A (ja) * 2008-11-13 2010-05-27 Nippon Hoso Kyokai <Nhk> 音響信号再生装置
US8224846B2 (en) 2008-09-30 2012-07-17 Kddi Corporation Apparatus for music retrieval, method for music retrieval, and program for music retrieval
JP2014006692A (ja) * 2012-06-25 2014-01-16 Nippon Hoso Kyokai <Nhk> 聴覚印象量推定装置及びそのプログラム
JP2015060177A (ja) * 2013-09-20 2015-03-30 カシオ計算機株式会社 演奏データファイル検索方法、システム、プログラム、端末装置、およびサーバ装置
WO2016039463A1 (ja) * 2014-09-12 2016-03-17 ヤマハ株式会社 音響解析装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009258292A (ja) * 2008-04-15 2009-11-05 Yamaha Corp 音声データ処理装置およびプログラム
JP2009282681A (ja) * 2008-05-21 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 類似アイテム検索装置及び類似アイテム検索方法並びにそのプログラムと記録媒体
US8224846B2 (en) 2008-09-30 2012-07-17 Kddi Corporation Apparatus for music retrieval, method for music retrieval, and program for music retrieval
JP2010118885A (ja) * 2008-11-13 2010-05-27 Nippon Hoso Kyokai <Nhk> 音響信号再生装置
JP2014006692A (ja) * 2012-06-25 2014-01-16 Nippon Hoso Kyokai <Nhk> 聴覚印象量推定装置及びそのプログラム
JP2015060177A (ja) * 2013-09-20 2015-03-30 カシオ計算機株式会社 演奏データファイル検索方法、システム、プログラム、端末装置、およびサーバ装置
WO2016039463A1 (ja) * 2014-09-12 2016-03-17 ヤマハ株式会社 音響解析装置
JP2016057570A (ja) * 2014-09-12 2016-04-21 ヤマハ株式会社 音響解析装置

Also Published As

Publication number Publication date
JP4027405B2 (ja) 2007-12-26

Similar Documents

Publication Publication Date Title
JP4027051B2 (ja) 楽曲登録装置、楽曲登録方法、及びそのプログラムと記録媒体
EP1244093B1 (en) Sound features extracting apparatus, sound data registering apparatus, sound data retrieving apparatus and methods and programs for implementing the same
KR101143160B1 (ko) 기록된 음악의 브라우징 방법 및 음악 브라우징 시스템
JP4027405B2 (ja) 楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体
Kapur et al. Query-by-beat-boxing: Music retrieval for the DJ
JP2011043710A (ja) 音声処理装置、音声処理方法及びプログラム
JP2012234167A (ja) 楽音発生パターンを示すクエリーを用いて演奏データの検索を行う装置、方法および記憶媒体
KR20070059102A (ko) 콘텐츠 생성 장치 및 콘텐츠 생성 방법
JP4981630B2 (ja) 感性マッチング方法、装置及びコンピュータ・プログラム
JP2007280342A (ja) 楽曲特徴量演算装置及び楽曲検索システム
JP2010020133A (ja) 再生装置、表示方法および表示プログラム
JP4364838B2 (ja) 楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム
JP2012234168A (ja) 楽音発生パターンを示すクエリーを用いて演奏データの検索を行う装置、方法および記録媒体
JP2003177784A (ja) 音響変節点抽出装置及びその方法、音響再生装置及びその方法、音響再生システム、音響配信システム、情報提供装置、音響信号編集装置、音響変節点抽出方法プログラム記録媒体、音響再生方法プログラム記録媒体、音響信号編集方法プログラム記録媒体、音響変節点抽出方法プログラム、音響再生方法プログラム、音響信号編集方法プログラム
Niyazov et al. Content-based music recommendation system
Tolos et al. Mood-based navigation through large collections of musical data
JP2008041043A (ja) 情報処理装置
Collins et al. A new curated corpus of historical electronic music: Collation, data and research findings
KR20140129443A (ko) 적응형 음원 추천 시스템 및 방법
Boland et al. Finding my beat: personalised rhythmic filtering for mobile music interaction
JP2014178620A (ja) 音声処理装置
JP4447540B2 (ja) カラオケ唱歌録音作品の鑑賞システム
JP2014164112A (ja) 電気機器
Aspillaga et al. Mixme: A recommendation system for DJs
JP4413643B2 (ja) 楽曲検索再生装置

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20070129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071009

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4027405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131019

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees