JP2006195619A - 情報検索装置および情報検索方法 - Google Patents

情報検索装置および情報検索方法 Download PDF

Info

Publication number
JP2006195619A
JP2006195619A JP2005004825A JP2005004825A JP2006195619A JP 2006195619 A JP2006195619 A JP 2006195619A JP 2005004825 A JP2005004825 A JP 2005004825A JP 2005004825 A JP2005004825 A JP 2005004825A JP 2006195619 A JP2006195619 A JP 2006195619A
Authority
JP
Japan
Prior art keywords
music
information
search
unit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005004825A
Other languages
English (en)
Inventor
Narifumi Nochida
成文 後田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2005004825A priority Critical patent/JP2006195619A/ja
Publication of JP2006195619A publication Critical patent/JP2006195619A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 本発明は、記憶されている情報の全てを検索することなく、適切な情報を短時間で検索することができる情報検索装置および情報検索方法を提供することを課題とする。
【解決手段】 選択された代表曲に基づいて楽曲データベースを検索することで、楽曲マップにおいて代表曲が配置されているニューロンを代表ニューロンとしてその座標を特定し、検索テーブルを参照することで、検索された楽曲数が予め定められた検索数以上になるまで、代表ニューロンから外側に向けてニューロンに配置されている楽曲データを順次検索する。検索テーブルは、楽曲マップにおける各ニューロンの座標と、各ニューロンに配置されている楽曲データとからなる。
【選択図】 図10

Description

本発明は、任意空間上にマッピングされた複数の情報を検索する情報検索装置および情報検索方法に関し、特に複数の部分空間に分割された任意空間上のいずれかの部分空間に配置された情報を検索する情報検索装置および情報検索方法に関する。
近年、HDD等の大容量の記憶手段が開発され、大容量の記憶手段に大量の楽曲データを記憶させることができるようになっている。大容量の記憶手段に記憶されている大量の楽曲データの検索は、アーティスト名や曲名、その他のキーワード等の書誌データを用いて行うのが一般的であるが、書誌データで検索した場合には、楽曲が持っている情感を考慮することができず、印象の異なる楽曲が検索される可能性があり、聴取した際の印象が同じような楽曲を検索したい場合には、不向きである。
そこで、楽曲に対する主観的な印象に基づいて利用者の希望する楽曲を検索可能にするために、検索を希望する楽曲に対するユーザの主観的な要件を入力して数値化して出力し、その出力から、検索対象の楽曲の印象を数量化した予測印象値を算出し、算出した予測印象値をキーとして、複数の楽曲の音響信号およびその楽曲の印象を数量化した印象値を記憶した楽曲データベースを検索することにより、利用者の楽曲に対する主観的なイメージに基づいて、希望する楽曲を検索する装置が提案されている(例えば、特許文献1参照)。
しかしながら、従来技術では、予測印象値をキーとして、複数の楽曲の音響信号およびその楽曲の印象を数量化した印象値を記憶した楽曲データベースを検索するようにしているため、予測印象値と楽曲データベースに記憶されている全楽曲の印象値との距離をそれぞれ計算する必要があり、楽曲データベースに記憶されている楽曲数が大量になると、膨大な計算量になり、検索時間が長くなってしまうという問題点があった。
特開2002−278547号公報
本発明は斯かる問題点を鑑みてなされたものであり、その目的とするところは、記憶されている情報の全てを検索することなく、適切な情報を短時間で検索することができる情報検索装置および情報検索方法を提供する点にある。
本発明は上記課題を解決すべく、以下に掲げる構成とした。
本発明の情報検索装置は、任意空間上にマッピングされた複数の情報を検索する情報検索装置であって、前記任意空間は、前記情報が配置される複数の部分空間に分割されており、複数の前記部分空間のいずれかを中心空間として特定する中心空間特定手段と、予め定められた検索数以上になるまで前記中心空間から外側に向けて前記部分空間に配置された前記情報を検索する検索手段と、該検索手段によって検索された前記情報を出力する出力手段とを具備することを特徴とする。
さらに、本発明の情報検索装置は、前記任意空間は、学習が施された自己組織化マップであり、複数の前記部分空間は、それぞれ異なる特徴ベクトルが付与された複数のニューロンであり、前記情報は、前記情報が有する特徴量を入力ベクトルとし、当該入力ベクトルと最も距離が短い前記特徴ベクトルが付与されている前記ニューロンに配置されていることを特徴とする。
さらに、本発明の情報検索装置は、前記検索手段は、前記部分空間の座標と、前記部分空間に配置されている前記情報とからなる検索テーブルに基づいて前記情報を検索することを特徴とする。
また、本発明の情報検索方法は、任意空間上にマッピングされた複数の情報を検索する情報検索方法であって、複数の前記情報は、前記任意空間を構成する複数の部分空間のいずれかにそれぞれ配置されており、複数の前記部分空間のいずれかを中心空間として特定し、予め定められた検索数以上になるまで前記中心空間から外側に向けて前記部分空間に配置された前記情報を検索し、該検索した前記情報を出力することを特徴とする。
さらに、本発明の情報検索方法は、前記任意空間は、学習が施された自己組織化マップであり、複数の前記部分空間は、それぞれ異なる特徴ベクトルが付与された複数のニューロンであり、前記情報は、前記情報が有する特徴量を入力ベクトルとし、当該入力ベクトルと最も距離が短い前記特徴ベクトルが付与されている前記ニューロンに配置されていることを特徴とする。
さらに、本発明の情報検索方法は、前記部分空間の座標と、前記部分空間に配置されている前記情報とからなる検索テーブルに基づいて前記情報を検索することを特徴とする請求項4又は5記載の情報検索方法。
本発明の情報検索装置および情報検索方法は、任意空間を構成する複数の部分空間のいずれかに複数の情報をそれぞれ配置し、複数の部分空間のいずれかを中心空間として特定することで、予め定められた検索数以上になるまで中心空間から外側に向けて部分空間に配置された情報を検索するように構成することにより、記憶されている情報の全てを検索することなく、適切な情報を短時間で検索することができるという効果を奏する。
さらに、本発明の情報検索装置および情報検索方法は、任意空間を学習が施された自己組織化マップとすると共に、複数の部分空間をそれぞれ異なる特徴ベクトルが付与された複数のニューロンとし、情報が有する特徴量を入力ベクトルとして当該入力ベクトルと最も距離が短い特徴ベクトルが付与されているニューロンに情報を配置するように構成することにより、記憶されている情報の全てを検索することなく、類似した情報を短時間で検索することができるという効果を奏する。
さらに、本発明の情報検索装置および情報検索方法は、部分空間の座標と、部分空間に配置されている情報とからなる検索テーブルに基づいて情報を検索するように構成することにより、記憶されている情報の全てを検索することなく、適切な情報をさらに短時間で検索することができるという効果を奏する。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。
図1は、本発明に係る情報検索装置の実施の形態の構成を示すブロック図であり、図2は、図1に示す情報検索装置に用いられるニューラルネットワークを事前に学習させるニューラルネットワーク学習装置の構成を示すブロック図である。
本実施の形態は、図1を参照すると、情報検索装置10と、端末装置30とがUSB等のデータ伝送路で接続されており、端末装置30は、情報検索装置10から切り離して携帯することができる構成となっている。
情報検索装置10は、図1を参照すると、楽曲データ入力部11と、圧縮処理部12と、特徴データ抽出部13と、印象度データ変換部14と、楽曲データベース15と、楽曲マッピング部16と、楽曲マップ記憶部17と、楽曲検索部18と、PC操作部19と、PC表示部20と、送受信部21と、音声出力部22とからなる。
楽曲データ入力部11は、CD、DVD等の楽曲データが記憶されている記憶媒体を読み取る機能を有し、CD、DVD等の記憶媒体から楽曲データを入力し、圧縮処理部12および特徴データ抽出部13に出力する。CD、DVD等の記憶媒体以外にインターネット等のネットワークを経由した楽曲データ(配信データ)を入力するように構成しても良い。なお、圧縮された楽曲データが入力される場合には、圧縮された楽曲データを伸長して特徴データ抽出部13に出力する。
圧縮処理部12は、楽曲登録時には、楽曲データ入力部11から入力された楽曲データをMP3やATRAC(Adaptive Transform Acoustic Coding )等の圧縮形式で圧縮し、圧縮した楽曲データを、アーティスト名、曲名等の書誌データと共に楽曲データベース15に記憶させる。
特徴データ抽出部13は、楽曲データ入力部11から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出し、抽出した特徴データを印象度データ変換部14に出力する。
印象度データ変換部14は、予め学習が施された階層型ニューラルネットワークを用いて、特徴データ抽出部13から入力された特徴データを、人間の感性によって判断される印象度データに変換し、変換した印象度データを楽曲マッピング部16に出力すると共に、特徴データ抽出部13から入力された特徴データと変換した印象度データとを楽曲データに関連づけて楽曲データベース15に登録する。
楽曲データベース15は、HDD等の大容量の記憶手段であり、圧縮処理部12によって圧縮された楽曲データ、書誌データと、特徴データ抽出部13によって抽出された特徴データと、印象度データ変換部14によって変換された印象度データとが関連づけられて記憶される。
楽曲マッピング部16は、印象度データ変換部14から入力された印象度データに基づいて、任意空間である楽曲マップに楽曲データをマッピングし、楽曲データをマッピングした楽曲マップを楽曲マップ記憶部17に記憶させる。
楽曲マップ記憶部17は、HDD等の大容量の記憶手段であり、楽曲マッピング部16によって楽曲データがマッピングされた楽曲マップが記憶される。
楽曲検索部18は、PC操作部19から書誌データに基づいて楽曲データベース15を検索し、当該検索結果をPC表示部20に表示すると共に、PC操作部19によって選択された代表曲に基づいて楽曲マップ記憶部17を検索し、当該代表曲検索結果をPC表示部20に表示する。また、楽曲検索部18は、送受信部21を介してPC操作部19によって選択された楽曲データを端末装置30に出力する。
PC操作部19は、キーボードやマウス等の入力手段であり、楽曲データベース15および楽曲マップ記憶部17に記憶されている楽曲データを検索する検索条件の入力、端末装置30に出力する楽曲データを選択する入力が行われる。
PC表示部20は、例えば液晶ディスプレイ等の表示手段であり、楽曲マップ記憶部17に記憶されている楽曲データのマッピング状況の表示、楽曲データベース15および楽曲マップ記憶部17に記憶されている楽曲データを検索する検索条件の表示、検索された楽曲データ(検索結果)の表示等が行われる。
送受信部21は、端末装置30の送受信部31との間をUSB等のデータ伝送路で接続可能に構成されており、楽曲検索部18によって検索され、PC操作部19によって選択された楽曲データを端末装置30の送受信部31に出力すると共に、端末装置30からの修正指示を受信する。
音声出力部22は、楽曲データベース15に記憶されている楽曲データを伸長して再生するオーディオプレーヤである。
端末装置30は、HDD等の大容量の記憶手段を有するポータブルオーディオ、MDプレーヤ等の音声再生装置であり、図1を参照すると、送受信部31と、検索結果記憶部32と、端末操作部33、端末表示部34と、音声出力部35とからなる。
送受信部31は、情報検索装置10の送受信部21との間をUSB等のデータ伝送路で接続可能に構成されており、情報検索装置10の送受信部21から入力された楽曲データを検索結果記憶部32に記憶させる。
端末操作部33は、検索結果記憶部32に記憶されている楽曲データの選択・再生を指示する入力、ボリュームコントロールの入力等、楽曲データの再生に係る入力が行われる。
端末表示部34は、例えば液晶ディスプレイ等の表示手段であり、再生中の曲名や、各種操作ガイダンスが表示される。
音声出力部35は、検索結果記憶部32に圧縮されて記憶されている楽曲データを伸長して再生するオーディオプレーヤである。
ニューラルネットワーク学習装置40は、印象度データ変換部14で用いられる階層型ニューラルネットワークと、楽曲マッピング部16で用いられる楽曲マップとの学習を行う装置であり、図2を参照すると、楽曲データ入力部41と、音声出力部42と、特徴データ抽出部43と、印象度データ入力部44と、結合重み値学習部45と、楽曲マップ学習部46と、結合重み値出力部47と、特徴ベクトル出力部48とからなる。
楽曲データ入力部41は、CD、DVD等の楽曲データが記憶されている記憶媒体を読み取る機能を有し、CD、DVD等の記憶媒体から楽曲データを入力し、音声出力部42および特徴データ抽出部43に出力する。CD、DVD等の記憶媒体以外にインターネット等のネットワークを経由した楽曲データ(配信データ)を入力するように構成しても良い。なお、圧縮された楽曲データが入力される場合には、圧縮された楽曲データを伸長して音声出力部42および特徴データ抽出部43に出力する。
音声出力部42は、楽曲データ入力部41から入力された楽曲データを伸長して再生するオーディオプレーヤである。
特徴データ抽出部43は、楽曲データ入力部41から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出し、抽出した特徴データを結合重み値学習部45に出力する。
印象度データ入力部44は、音声出力部42からの音声出力に基づく、評価者による印象度データの入力を受け付け、受け付けた印象度データを、階層型ニューラルネットワークの学習に用いる教師信号として結合重み値学習部45に出力すると共に自己組織化マップへの入力ベクトルとして楽曲マップ学習部46に出力する。
結合重み値学習部45は、特徴データ抽出部43から入力された特徴データと、印象度データ入力部44から入力された印象度データとに基づいて階層型ニューラルネットワークに学習を施し、各ニューロンの結合重み値を更新し、結合重み値出力部47を介して更新した結合重み値を出力する。学習が施された階層型ニューラルネットワーク(更新された結合重み値)は、情報検索装置10の印象度データ変換部14に移植される。
楽曲マップ学習部46は、印象度データ入力部44から入力された印象度データを自己組織化マップへの入力ベクトルとして自己組織化マップに学習を施し、各ニューロンの特徴ベクトルを更新し、特徴ベクトル出力部48を介して更新した特徴ベクトルを出力する。学習が施された自己組織化マップ(更新された特徴ベクトル)は、楽曲マップとして情報検索装置10の楽曲マップ記憶部17に記憶される。
次に、本実施の形態の動作について図3乃至図9を参照して詳細に説明する。
図3は、図1に示す情報検索装置における楽曲登録動作を説明するためのフローチャートであり、図4は、図1に示す特徴データ抽出部における特徴データ抽出動作を説明するためのフローチャートであり、図5は、図2に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの学習アルゴリズムを説明するための説明図であり、図6は、図2に示すニューラルネットワーク学習装置における楽曲マップの学習アルゴリズムを説明するための説明図であり、図7は、図1に示す楽曲マップ記憶部に記憶される検索テーブル例を示す図であり、図8は、図2に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの学習動作を説明するためのフローチャートであり、図9は、図2に示すニューラルネットワーク学習装置における楽曲マップの学習動作を説明するためのフローチャートある。
まず、情報検索装置10における楽曲登録動作について図3を参照して詳細に説明する。
図3は、図1に示す情報検索装置における楽曲登録動作を説明するためのフローチャートであり、

楽曲データ入力部11にCD、DVD等の楽曲データが記憶されている記憶媒体をセットし、楽曲データ入力部11から楽曲データを入力する(ステップA1)。
圧縮処理部12は、楽曲データ入力部11から入力された楽曲データを圧縮し(ステップA2)、圧縮した楽曲データを、アーティスト名、曲名等の書誌データと共に楽曲データベース15に記憶させる(ステップA3)。
特徴データ抽出部13は、楽曲データ入力部11から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出する(ステップA4)。
特徴データ抽出部13における特徴データの抽出動作は、図4を参照すると、楽曲データの入力を受け付け(ステップB1)、楽曲データの予め定められたデータ解析開始点から一定のフレーム長に対しFFT(高速フーリエ変換)を行い(ステップB2)、パワースペクトルを算出する。なお、ステップB2の前に高速化を目的としてダウンサンプリングを行うようにしても良い。
次に、特徴データ抽出部13は、Low、Middle、Highの周波数帯域を予め設定しておき、Low、Middle、Highの3帯域のパワースペクトルを積分し、平均パワーを算出すると共に(ステップB3)、Low、Middle、Highの周波数帯域の内、最大のパワーを持つ帯域をPitchのデータ解析開始点値とし、Pitchを測定する(ステップB4)。
ステップB2〜ステップB4の処理動作は、予め定められたフレーム個数分行われ、特徴データ抽出部13は、ステップB2〜ステップB4の処理動作を行ったフレーム個数が予め定められた設定値に達したか否かを判断し(ステップB5)、ステップB2〜ステップB4の処理動作を行ったフレーム個数が予め定められた設定値に達していない場合には、データ解析開始点をシフトしながら(ステップB6)、ステップB2〜ステップB4の処理動作を繰り返す。
ステップB2〜ステップB4の処理動作を行ったフレーム個数が予め定められた設定値に達した場合には、特徴データ抽出部13は、ステップB2〜ステップB4の処理動作によって算出したLow、Middle、Highの平均パワーの時系列データに対しFFTを行うと共に、ステップB2〜ステップB4の処理動作によって測定したPitchの時系列データに対しFFTを行う(ステップB7)。
次に、特徴データ抽出部13は、Low、Middle、High、PitchにおけるFFT分析結果から、横軸を対数周波数、縦軸を対数パワースペクトルとしたグラフにおける回帰直線の傾きと、回帰直線のY切片とをゆらぎ情報として算出し(ステップB8)、Low、Middle、High、Pitchのそれぞれにおける回帰直線の傾きおよびY切片を8項目からなる特徴データとして印象度データ変換部14に出力する。
印象度データ変換部14は、図5に示すような入力層(第1層)、中間層(第n層)、出力層(第N層)からなる階層型ニューラルネットワークを用い、入力層(第1層)に特徴データ抽出部13で抽出された特徴データを入力することによって、出力層(第N層)から印象度データを出力、すなわち特徴データを印象度データに変換し(ステップA5)、出力層(第N層)から出力された印象度データを、楽曲マッピング部16に出力すると共に、特徴データ抽出部13から入力された特徴データと出力層(第N層)から出力された印象度データを楽曲データと共に楽曲データベース15に記憶させる。なお、中間層(第n層)の各ニューロンの結合重み値wは、評価者によって予め学習が施されている。また、本実施の形態の場合には、入力層(第1層)に入力される特徴データ、すなわち特徴データ抽出部13によって抽出される特徴データの項目は、前述のように8項目であり、印象度データの評価項目としては、人間の感性によって判断される「明るい、暗い」、「重い、軽い」、「かたい、やわらかい」、「安定、不安定」、「澄んだ、にごった」、「滑らか、歯切れの良い」、「激しい、穏やか」、「厚い、薄い」の8項目を設定し、各評価項目を7段階評価で表すように設定した。従って、入力層(第1層)のニューロン数Lと出力層(第N層)のニューロン数Lとは、それぞれ8個となっており、中間層(第n層:n=2,…,N−1)のニューロン数Lnは、適宜設定されている。
楽曲マッピング部16は、楽曲データ入力部11から入力された楽曲データを楽曲マップ記憶部17に記憶されている楽曲マップの該当箇所にマッピングする。楽曲マッピング部16におけるマッピング動作に用いられる任意空間である楽曲マップは、複数の部分空間に分割されており、楽曲データは、複数の部分空間のいずれかに配置される。楽曲マップとしては、例えばニューロンが2次元に規則的に配置(図6に示す例では、9*9の正方形)されている自己組織化マップ(SOM)を用いることができ、この場合には、ニューロンが複数の部分空間に対応する。
本実施の形態では、楽曲マップとしてニューロンが100*100の正方形に配列された2次元SOMを使用し、楽曲マップの各ニューロンには、(1,1)〜(100,100)の座標が付与され、座標によりニューロン間の距離が認識できるように構成されている。楽曲マップにマッピングされた楽曲データは、楽曲マップ記憶部17に記憶される検索テーブルによって管理されると共に、楽曲データが配置されたニューロンの座標が楽曲データと共に楽曲データベース15に記憶される。検索テーブルは、該当するニューロンを検索し、検索されたニューロンに配置されている楽曲データを特定するためのものであり、図7に示すように、楽曲マップにおける各ニューロンの座標と、各ニューロンに配置されている楽曲データとからなる。なお、本実施の形態では、楽曲マップとしてニューロンが正方形に配列された2次元SOMを用いたが、ニューロンの配列は、長方形であっても、蜂の巣であっても良く、さらに3次元SOMを用いるようにしても良い。
また、楽曲マッピング部16におけるマッピング動作に用いられる楽曲マップは、予め学習が施されており、各ニューロンには、予め学習されたn次元の特徴ベクトルm(t)∈Rが付与されており、楽曲マッピング部16は、印象度データ変換部14によって変換された印象度データを入力ベクトルxとし、入力ベクトルxに最も近いニューロン、すなわちユークリッド距離‖x−m‖を最小にするニューロンに、入力された楽曲データを配置し(ステップA6)、楽曲データがマッピングされた楽曲マップを楽曲マップ記憶部17に記憶させる。なお、Rは、印象度データの各評価項目の評価段階数を示し、nは、印象度データの項目数を示す。
次に、印象度データ変換部14における変換動作(ステップA5)に用いられる階層型ニューラルネットワークの学習動作について図8を参照して詳細に説明する。
評価者による階層型ニューラルネットワーク(結合重み値w)の学習は、例えば、図2に示すニューラルネットワーク学習装置40を用いて行われ、まず、階層型ニューラルネットワーク(結合重み値w)を事前学習させるための事前学習データ(楽曲データの特徴データ+印象度データ)の入力が行われる。
楽曲データ入力部41にCD、DVD等の楽曲データが記憶されている記憶媒体をセットし、楽曲データ入力部41から楽曲データを入力し(ステップC1)、特徴データ抽出部43は、楽曲データ入力部41から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出する(ステップC2)。
また、音声出力部42は、楽曲データ入力部41から入力された楽曲データを音声出力し(ステップC3)、評価者は、音声出力部42からの音声出力を聞くことによって、楽曲の印象度を感性によって評価し、評価結果を印象度データとして印象度データ入力部44から入力し(ステップC4)、結合重み値学習部45は、印象度データ入力部44から入力された印象度データを教師信号として受け付ける。なお、本実施の形態では、印象度の評価項目としては、人間の感性によって判断される「明るい、暗い」、「重い、軽い」、「かたい、やわらかい」、「安定、不安定」、「澄んだ、にごった」、「滑らか、歯切れの良い」、「激しい、穏やか」、「厚い、薄い」の8項目を設定し、各評価項目についての7段階評価を印象度データとして楽曲データ入力部41で受け付けるように構成した。
次に、特徴データと入力された印象度データとからなる学習データが予め定められたサンプル数Tに達したか否かを判断し(ステップC5)、学習データがサンプル数Tに達するまでステップC1〜C4の動作が繰り返される。
結合重み値学習部45における階層型ニューラルネットワークの学習、すなわち各ニューロンの結合重み値wの更新は、誤差逆伝播学習法を用いて行う。
まず、初期値として、中間層(第n層)の全てニューロンの結合重み値wを乱数によって−0.1〜0.1程度の範囲の小さな値に設定しておき、結合重み値学習部45は、特徴データ抽出部43によって抽出された特徴データを入力信号x(j=1,2,…,8) として入力層(第1層)に入力し、入力層(第1層)から出力層(第N層)に向けて、各ニューロンの出力を計算する。
次に、結合重み値学習部45は、印象度データ入力部44から入力された印象度データを教師信号y(j=1,2,…,8) とし、出力層(第N層)の出力outj と、教師信号yとの誤差から、学習則δj を次式によって計算する。
Figure 2006195619
次に、結合重み値学習部45は、学習則δj を使って、中間層(第n層)の誤差信号 δj n を次式によって計算する。
Figure 2006195619
なお、数式2において、wは、第 n 層 j 番目と第 n -1 層k番目のニューロンの間の結合重み値を表している。
次に、結合重み値学習部45は、中間層(第n層)の誤差信号 δj n を用いて各ニューロンの結合重み値wの変化量Δwを次式によって計算し、各ニューロンの結合重み値wを更新する(ステップC6)。なお、次式において、ηは、学習率を表し、評価者による学習では、η(0<η≦1)に設定されている。
Figure 2006195619
ステップC6では、サンプル数Tの事前学習データのそれぞれについて学習が行われ、次に、次式に示す2乗誤差Eが予め定められた事前学習用の基準値Eよりも小さいか否かが判断され(ステップC7)、2乗誤差Eが基準値Eよりも小さくなるまでステップC6の動作が繰り返される。なお、2乗誤差Eが基準値Eよりも小さくなると想定される学習反復回数Sを予め設定しておき、ステップC6の動作を学習反復回数S回繰り返すようにしても良い。
Figure 2006195619
ステップC7で2乗誤差Eが基準値Eよりも小さいと判断された場合には、結合重み値学習部45は、事前学習させた各ニューロンの結合重み値wを結合重み値出力部47によって出力し(ステップC8)、結合重み値出力部47から出力された各ニューロンの結合重み値wは、印象度データ変換部14に記憶される。
次に、楽曲マッピング部16におけるマッピング動作(ステップA6)に用いられる楽曲マップの学習動作について図9を参照して詳細に説明する。
楽曲データ入力部41にCD、DVD等の楽曲データが記憶されている記憶媒体をセットし、楽曲データ入力部41から楽曲データを入力し(ステップD1)、音声出力部42は、楽曲データ入力部41から入力された楽曲データを音声出力し(ステップD2)、評価者は、音声出力部42からの音声出力を聞くことによって、楽曲の印象度を感性によって評価し、評価結果を印象度データとして印象度データ入力部44から入力し(ステップD3)、楽曲マップ学習部46は、印象度データ入力部44から入力された印象度データを自己組織化マップへの入力ベクトルとして受け付ける。なお、本実施の形態では、印象度の評価項目としては、人間の感性によって判断される「明るい、暗い」、「重い、軽い」、「かたい、やわらかい」、「安定、不安定」、「澄んだ、にごった」、「滑らか、歯切れの良い」、「激しい、穏やか」、「厚い、薄い」の8項目を設定し、各評価項目についての7段階評価を印象度データとして楽曲データ入力部41で受け付けるように構成した。
楽曲マップ学習部46は、は、印象度データ入力部44から入力された印象度データを入力ベクトルx(t)∈Rとし、各ニューロンの特徴ベクトルm(t)∈Rを学習させる。なお、tは、学習回数を表し、学習回数を定める設定値Tを予め設定しておき、学習回数t=0,1,…,Tについて学習を行わせる。なお、Rは、各評価項目の評価段階を示し、nは、印象度データの項目数を示す。
まず、初期値として、全てのニューロンの特徴ベクトルm(0)をそれぞれ0〜1の範囲でランダムに設定しておき、楽曲マップ学習部46は、x(t)に最も近いニューロンc、すなわち‖x(t)−m(t)‖を最小にする勝者ニューロンcを求め、勝者ニューロンcの特徴ベクトルm(t)と、勝者ニューロンcの近傍にある近傍ニューロンiの集合Ncのそれぞれの特徴ベクトルm(t)(i∈Nc)とを、次式に従ってそれぞれ更新する(ステップD4)。なお、近傍ニューロンiを決定するための近傍半径は、予め設定されているものとする。
Figure 2006195619
なお、数式5において、hci(t)は、学習率を表し、次式によって求められる。
Figure 2006195619
なお、αinitは学習率の初期値であり、R(t)は、単調減少する一次関数もしくは指数関数が用いられる。
次に、楽曲マップ学習部46は、学習回数tが設定値Tに達したか否かを判断し(ステップD5)、学習回数tが設定値Tに達するまでステップD1〜ステップD4の処理動作を繰り返し、学習回数tが設定値Tに達すると、再び最初のサンプルから同じ処理動作を行う。この反復回数が予め定められたS回になった時点で、特徴ベクトル出力部48を介して学習させた特徴ベクトルm(T)∈Rを出力する(ステップD6)。出力された各ニューロンiの特徴ベクトルm(T)は、情報検索装置10の楽曲マップ記憶部17に楽曲マップとして記憶される。
次に、情報検索装置10における楽曲検索動作について図10乃至図15を参照して詳細に説明する。
図10は、図1に示す情報検索装置における楽曲検索動作を説明するためのフローチャートであり、図11は、図1に示すPC表示部に表示される検索条件入力画面例を示す図であり、図12は、図1に示すPC表示部に表示される条件検索結果表示画面例を示す図であり、図13は、図1に示すPC表示部に表示される代表曲検索結果表示画面例を示す図であり、図14は、図1に示すPC表示部に表示される楽曲リスト表示画面例を示す図であり、図15は、図1に示すPC表示部に表示される楽曲マップ表示画面例を示す図である。
楽曲検索部18は、PC表示部20に、検索条件を入力する検索条件入力画面51を表示し、PC操作部19からのユーザ入力を受け付ける。検索条件入力画面51は、図11に示すように、検索条件として書誌データを入力する書誌データ入力領域511と、検索の実行を指示する検索実行ボタン512と、全楽曲リスト表示ボタン513と、楽曲マップ表示ボタン514とからなり、ユーザは、検索条件として書誌データをPC操作部19から入力し(ステップE1)、検索実行ボタン512をクリックすることで、書誌データに基づく検索を楽曲検索部18に指示する。
楽曲検索部18は、PC操作部19から入力された書誌データに基づいて楽曲データベース15を検索し(ステップE2)、条件検索結果を表示する条件検索結果表示画面52をPC表示部20に表示させる(ステップE3)。条件検索結果表示画面52は、図12を参照すると、条件検索結果の中から代表曲を選択する代表曲選択領域521と、選択された代表曲に基づく検索を指示する代表曲検索実行ボタン522と、条件検索結果の出力を指示する出力ボタン523とからなる。
次に、ユーザは、代表曲選択領域521に表示されている検索結果の中から代表曲を選択し(ステップE4)、代表曲検索実行ボタン522をクリックすることで、代表曲に基づく検索を楽曲検索部18に指示する。なお、この時点で出力ボタン523がクリックされた場合には、楽曲検索部18は、送受信部21を介して代表曲検索結果表示画面53に表示されている条件検索結果の楽曲データを端末装置30に出力する。
楽曲検索部18は、選択された代表曲に基づいて楽曲データベース15を検索することで、楽曲マップにおいて代表曲が配置されているニューロン(以下、代表ニューロンと称す)の座標を特定する(ステップE5)。
次に、楽曲検索部18は、変数nに0を設定し(ステップE6)、楽曲マップ記憶部17に記憶されている図7に示す検索テーブルを参照することで、ステップE5で特定した代表ニューロンから距離nのニューロンに配置されている楽曲データを検索し(ステップE7)、検索された楽曲数が予め定められた検索数以上であるか否かを判断する(ステップE8)。
ステップE8で検索された楽曲数が予め定められた検索数未満である場合には、楽曲検索部18は、変数nをインクリメントし(ステップE9)、ステップE7に戻り、検索された楽曲数が予め定められた検索数以上になるまでステップE7およびステップE8を繰り返す。
ステップE8で検索された楽曲数が予め定められた検索数以上である場合には、楽曲検索部18は、検索された楽曲データを予め定められた検索数まで絞り込んだ後(ステップE10)、絞り込んだ楽曲データを代表曲検索結果として表示する代表曲検索結果表示画面53をPC表示部20に表示する(ステップE11)。代表曲検索結果表示画面53は、図13を参照すると、出力する楽曲データを選択する出力楽曲選択領域531と、選択された楽曲データの出力を指示する出力ボタン532とからなる。
ステップE10における検索された楽曲データの絞り込みは、代表ニューロンの特徴ベクトルもしくは代表曲の印象度データ変換部14によって変換された印象度データを入力ベクトルxとし、検索された楽曲データの印象度データを検索対象ベクトルXとすると、入力ベクトルxに近い検索対象ベクトルX、すなわちユークリッド距離‖X−x‖が小さいものを順に予め定められた検索数まで検索することで行われる。なお、ステップE10における検索された楽曲データの絞り込みは、代表ニューロンから最も離れたニューロン、すなわち代表ニューロンから検索に用いた変数nの最大値分離れたニューロンに配置されている楽曲データに対してのみ行うようにすると、距離計算を行う対象件数を少なくすることができるため、検索時間(計算時間)を短縮することができる。また、ステップE10における検索された楽曲データの絞り込みを行うことなく、検索された楽曲データを全て代表曲検索結果として図13に示す代表曲検索結果表示画面53に表示するようにしても良く、この場合には、距離計算を行うことなく検索を行うことができるため、検索時間(計算時間)をさらに短縮することができる。
次に、ユーザは、代表曲検索結果表示画面53に表示されている代表曲検索結果の中から端末装置30に出力する楽曲データを選択し(ステップE12)、出力ボタン532をクリックすることで、選択した楽曲データの出力を楽曲検索部18に指示し、楽曲検索部18は、送受信部21を介してユーザによって選択された楽曲データを端末装置30に出力する(ステップE13)。
検索条件入力画面51において、楽曲リスト表示ボタン513がクリックされると、楽曲検索部18は、記憶されている全楽曲データの楽曲リストを表示する楽曲リスト表示画面54をPC表示部20に表示させる。楽曲リスト表示画面54は、図14を参照すると、全楽曲データの楽曲リストの中から代表曲を選択する代表曲選択領域541と、選択された代表曲に基づく検索を指示する代表曲選択実行ボタン542とからなる。
ユーザが代表曲選択領域541に表示されている楽曲リストの中から代表曲を選択し(ステップE4)、代表曲検索実行ボタン542をクリックすることで、選択された代表曲に基づく検索が楽曲検索部18に指示され、以下、ステップE5〜ステップE13の楽曲検索動作が行われる。
また、検索条件入力画面51において、楽曲マップ表示ボタン514がクリックされると、楽曲検索部18は、楽曲マップのニューロンをポイントとして表示する楽曲マップ表示画面55をPC表示部20に表示させる。楽曲マップ表示画面55は、図15を参照すると、検索の中心とするニューロンを選択するニューロン選択領域551と、選択されたニューロンに基づく検索を指示するマップ検索実行ボタン552とからなる。
ユーザがニューロン選択領域551に表示されているニューロンの中から検索の中心とするニューロンを選択し、マップ検索実行ボタン552をクリックすることで、ステップE5で特定される代表ニューロンの替わりに、ニューロン選択領域551で選択されたニューロンに基づく検索が楽曲検索部18に指示され、以下、ステップE6〜ステップE13の楽曲検索動作が行われる。
なお、ニューロン選択領域551においては、楽曲データが配置されているニューロンのみが表示され、楽曲がマッピンクされているニューロンにカーソルを移動させると、カーソルが位置するニューロンに配置されている楽曲データの楽曲名のポップアップ表示553が行われるように構成されている。
以上説明したように、本実施の形態によれば、楽曲マップを構成する複数の部分空間のいずれかに複数の楽曲データをそれぞれ配置し、複数の部分空間のいずれかを中心空間として特定することで、予め定められた検索数以上になるまで中心空間から外側に向けて部分空間に配置された楽曲データを検索するように構成することにより、楽曲データベース15に記憶されている楽曲データの全てを検索することなく、適切な楽曲データを短時間で検索することができるという効果を奏する。
さらに、本実施の形態によれば、楽曲マップを学習が施された自己組織化マップとすると共に、複数の部分空間をそれぞれ異なる特徴ベクトルが付与された複数のニューロンとし、楽曲データが有する特徴量を入力ベクトルとして当該入力ベクトルと最も距離が短い特徴ベクトルが付与されているニューロンに楽曲データを配置するように構成することにより、楽曲データベース15に記憶されている楽曲データの全てを検索することなく、類似した楽曲データを短時間で検索することができるという効果を奏する。
さらに、本実施の形態によれば、部分空間の座標と、部分空間に配置されている楽曲データとからなる検索テーブルに基づいて楽曲データを検索するように構成することにより、楽曲データベース15に記憶されている楽曲データの全てを検索することなく、適切な楽曲データをさらに短時間で検索することができるという効果を奏する。
なお、本発明が上記各実施の形態に限定されず、本発明の技術思想の範囲内において、各実施の形態は適宜変更され得ることは明らかである。また、上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。なお、各図において、同一構成要素には同一符号を付している。
本発明に係る情報検索装置の実施の形態の構成を示すブロック図である。 図1に示す情報検索装置に用いられるニューラルネットワークを事前に学習させるニューラルネットワーク学習装置の構成を示すブロック図である。 図1に示す情報検索装置における楽曲登録動作を説明するためのフローチャートである。 図1に示す特徴データ抽出部における特徴データ抽出動作を説明するためのフローチャートである。 図2に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの学習アルゴリズムを説明するための説明図である。 図2に示すニューラルネットワーク学習装置における楽曲マップの学習アルゴリズムを説明するための説明図である。 図1に示す楽曲マップ記憶部に記憶される検索テーブル例を示す図である。 図2に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの学習動作を説明するためのフローチャートである。 図2に示すニューラルネットワーク学習装置における楽曲マップの学習動作を説明するためのフローチャートある。 図1に示す情報検索装置における楽曲検索動作を説明するためのフローチャートである。 図1に示すPC表示部に表示される検索条件入力画面例を示す図である。 図1に示すPC表示部に表示される条件検索結果表示画面例を示す図である。 図1に示すPC表示部に表示される代表曲検索結果表示画面例を示す図である。 図1に示すPC表示部に表示される楽曲リスト表示画面例を示す図である。 図1に示すPC表示部に表示される楽曲マップ表示画面例を示す図である。
符号の説明
10 情報検索装置
11 楽曲データ入力部
12 圧縮処理部
13 特徴データ抽出部
14 印象度データ変換部
15 楽曲データベース
16 楽曲マッピング部
17 楽曲マップ記憶部
18 楽曲検索部(中心空間特定手段、検索手段)
19 PC操作部
20 PC表示部
21 送受信部(出力手段)
22 音声出力部
30 端末装置
31 送受信部
32 検索結果記憶部
33 端末操作部
34 端末表示部
35 音声出力部
40 ニューラルネットワーク学習装置
41 楽曲データ入力部
42 音声出力部
43 特徴データ抽出部
44 印象度データ入力部
45 結合重み値学習部
46 楽曲マップ学習部
47 結合重み値出力部
48 特徴ベクトル出力部
51 検索条件入力画面
52 条件検索結果表示画面
53 代表曲検索結果表示画面
54 楽曲リスト表示画面
55 楽曲マップ表示画面
511 書誌データ入力領域
512 検索実行ボタン
513 全楽曲リスト表示ボタン
514 楽曲マップ表示ボタン
521 代表曲選択領域
522 代表曲検索実行ボタン
523 出力ボタン
531 出力楽曲選択領域
532 出力ボタン
541 代表曲選択領域
542 代表曲選択実行ボタン
551 ニューロン選択領域
552 マップ検索実行ボタン
553 ポップアップ表示

Claims (6)

  1. 任意空間上にマッピングされた複数の情報を検索する情報検索装置であって、
    前記任意空間は、前記情報が配置される複数の部分空間に分割されており、
    複数の前記部分空間のいずれかを中心空間として特定する中心空間特定手段と、
    予め定められた検索数以上になるまで前記中心空間から外側に向けて前記部分空間に配置された前記情報を検索する検索手段と、
    該検索手段によって検索された前記情報を出力する出力手段とを具備することを特徴とする情報検索装置。
  2. 前記任意空間は、学習が施された自己組織化マップであり、
    複数の前記部分空間は、それぞれ異なる特徴ベクトルが付与された複数のニューロンであり、
    前記情報は、前記情報が有する特徴量を入力ベクトルとし、当該入力ベクトルと最も距離が短い前記特徴ベクトルが付与されている前記ニューロンに配置されていることを特徴とする請求項1記載の情報検索装置。
  3. 前記検索手段は、前記部分空間の座標と、前記部分空間に配置されている前記情報とからなる検索テーブルに基づいて前記情報を検索することを特徴とする請求項1又は2記載の情報検索装置。
  4. 任意空間上にマッピングされた複数の情報を検索する情報検索方法であって、
    複数の前記情報は、前記任意空間を構成する複数の部分空間のいずれかにそれぞれ配置されており、
    複数の前記部分空間のいずれかを中心空間として特定し、
    予め定められた検索数以上になるまで前記中心空間から外側に向けて前記部分空間に配置された前記情報を検索し、
    該検索した前記情報を出力することを特徴とする情報検索方法。
  5. 前記任意空間は、学習が施された自己組織化マップであり、
    複数の前記部分空間は、それぞれ異なる特徴ベクトルが付与された複数のニューロンであり、
    前記情報は、前記情報が有する特徴量を入力ベクトルとし、当該入力ベクトルと最も距離が短い前記特徴ベクトルが付与されている前記ニューロンに配置されていることを特徴とする請求項4記載の情報検索方法。
  6. 前記部分空間の座標と、前記部分空間に配置されている前記情報とからなる検索テーブルに基づいて前記情報を検索することを特徴とする請求項4又は5記載の情報検索方法。
JP2005004825A 2005-01-12 2005-01-12 情報検索装置および情報検索方法 Pending JP2006195619A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005004825A JP2006195619A (ja) 2005-01-12 2005-01-12 情報検索装置および情報検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005004825A JP2006195619A (ja) 2005-01-12 2005-01-12 情報検索装置および情報検索方法

Publications (1)

Publication Number Publication Date
JP2006195619A true JP2006195619A (ja) 2006-07-27

Family

ID=36801675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005004825A Pending JP2006195619A (ja) 2005-01-12 2005-01-12 情報検索装置および情報検索方法

Country Status (1)

Country Link
JP (1) JP2006195619A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165759A (ja) * 2006-12-08 2008-07-17 Sony Corp 情報処理装置及び方法並びにプログラム
JP2013182051A (ja) * 2012-02-29 2013-09-12 Xing Inc 端末装置及び楽曲再生装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934909A (ja) * 1995-07-24 1997-02-07 Sharp Corp 情報検索装置
JP2000035796A (ja) * 1998-05-07 2000-02-02 Canon Inc 音楽情報処理装置及び方法
JP2005077865A (ja) * 2003-09-02 2005-03-24 Sony Corp 音楽検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934909A (ja) * 1995-07-24 1997-02-07 Sharp Corp 情報検索装置
JP2000035796A (ja) * 1998-05-07 2000-02-02 Canon Inc 音楽情報処理装置及び方法
JP2005077865A (ja) * 2003-09-02 2005-03-24 Sony Corp 音楽検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165759A (ja) * 2006-12-08 2008-07-17 Sony Corp 情報処理装置及び方法並びにプログラム
JP2013182051A (ja) * 2012-02-29 2013-09-12 Xing Inc 端末装置及び楽曲再生装置

Similar Documents

Publication Publication Date Title
US7805389B2 (en) Information processing apparatus and method, program and recording medium
JP4611819B2 (ja) 楽曲管理装置および情報表示方法
US7576278B2 (en) Song search system and song search method
JP2005301921A (ja) 楽曲検索システムおよび楽曲検索方法
JP4607660B2 (ja) 楽曲検索装置および楽曲検索方法
JP2006195619A (ja) 情報検索装置および情報検索方法
JP4246120B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4279274B2 (ja) 携帯端末装置および楽曲情報表示方法
JP2005309712A (ja) 楽曲検索システムおよび楽曲検索方法
JP4313343B2 (ja) 携帯端末装置および情報表示方法
JP2006317872A (ja) 携帯端末装置および楽曲表現方法
JP4313340B2 (ja) 携帯端末装置および選曲方法
JP4115923B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4246100B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4607659B2 (ja) 楽曲検索装置および楽曲検索方法
JP4165650B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4165645B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP2006323438A (ja) 楽曲検索システム
JP4246101B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4165649B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4339171B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP3901695B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP2006318384A (ja) 楽曲検索システムおよび楽曲検索方法
KR102623459B1 (ko) 사용자의 보컬 평가에 기반한 오디션 이벤트 서비스 제공 방법, 장치 및 시스템
JP2007011894A (ja) 携帯端末装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100615