JP4165650B2 - 楽曲検索システムおよび楽曲検索方法 - Google Patents

楽曲検索システムおよび楽曲検索方法 Download PDF

Info

Publication number
JP4165650B2
JP4165650B2 JP2004040645A JP2004040645A JP4165650B2 JP 4165650 B2 JP4165650 B2 JP 4165650B2 JP 2004040645 A JP2004040645 A JP 2004040645A JP 2004040645 A JP2004040645 A JP 2004040645A JP 4165650 B2 JP4165650 B2 JP 4165650B2
Authority
JP
Japan
Prior art keywords
music
data
search
unit
impression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004040645A
Other languages
English (en)
Other versions
JP2005234723A (ja
Inventor
成文 後田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004040645A priority Critical patent/JP4165650B2/ja
Publication of JP2005234723A publication Critical patent/JP2005234723A/ja
Application granted granted Critical
Publication of JP4165650B2 publication Critical patent/JP4165650B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、HDD等の大容量の記憶手段に大量に記憶されている楽曲データの中から所望の楽曲を検索する楽曲検索システムおよび楽曲検索方法に関し、特に人間の感性によって判断される印象度データに基づいて楽曲の検索が可能な楽曲検索システムおよび楽曲検索方法に関する。
近年、HDD等の大容量の記憶手段が開発され、大容量の記憶手段に大量の楽曲データを記憶させることができるようになっている。大容量の記憶手段に記憶されている大量の楽曲データの検索は、アーティスト名や曲名、その他のキーワード等の書誌データを用いて行うのが一般的であるが、書誌データで検索した場合には、楽曲が持っている情感を考慮することができず、印象の異なる楽曲が検索される可能性があり、聴取した際の印象が同じような楽曲を検索したい場合には、不向きである。
そこで、楽曲に対する主観的な印象に基づいて利用者の希望する楽曲を検索可能にするために、検索を希望する楽曲に対するユーザの主観的な要件を入力して数値化して出力し、その出力から、検索対象の楽曲の印象を数量化した予測印象値を算出し、算出した予測印象値をキーとして、複数の楽曲の音響信号およびその楽曲の印象を数量化した印象値を格納した楽曲データベースを検索することにより、利用者の楽曲に対する主観的なイメージに基づいて、希望する楽曲を検索する装置が提案されている(例えば、特許文献1参照)。
しかしながら、従来技術では、楽曲の物理的な特徴を変換した印象値を、ユーザの主観的な要件の入力が数値化された予測印象値に基づいて検索を行っているため、ユーザによって検索条件として入力される主観的な要件の入力項目が集約されてしまい、主観的な要件に基づく精度の高い楽曲データの検索を実現することができないと共に、楽曲の物理的な特徴を印象値に変換するルールが固定されているため、変換後の印象値が必ずしも個々のユーザの嗜好に即しないという問題点があった。
特開2002−278547号公報
本発明は斯かる問題点を鑑みてなされたものであり、その目的とするところは、ユーザの感性に基づいて学習させた階層型ニューラルネットワークによって、楽曲の有する物理的な複数の項目からなる特徴データと、人間の感性によって判断される項目からなる印象度データとを直接関連づけることにより、ユーザによって検索条件として入力される人間の感性によって判断される印象度データの項目が集約されることなく、ユーザの感性によって判断される印象度データに基づいて精度の高い楽曲データの検索を行うことができると共に、ユーザがシステムを利用する前に初期設定としてサンプル楽曲に対する印象度データを用いて階層型ニューラルネットワークの学習を行うことによって、個々のユーザにより嗜好に適合した楽曲データの検索を行うことができる楽曲検索システムおよび楽曲検索方法を提供する点にある。
本発明は上記課題を解決すべく、以下に掲げる構成とした。
本発明の楽曲検索システムは、楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、人間の感性によって判断される印象度データを入力する印象度データ入力手段と、該印象度データ入力手段から入力された前記印象度データを教師信号として用いて、前記楽曲データが有する物理的な特徴データを前記印象度データに変換する階層型ニューラルネットワークを学習させる階層型ニューラルネットワーク学習手段と、前記楽曲データを入力する楽曲データ入力手段と、該楽曲データ入力手段によって入力された前記楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで前記特徴データを抽出する特徴データ抽出手段と、前記階層型ニューラルネットワーク学習手段によって学習が施された前記階層型ニューラルネットワークを用いて、前記特徴データ抽出手段によって抽出された前記特徴データを前記印象度データに変換する印象度データ変換手段と、該印象度データ変換手段によって変換された前記印象度データを前記楽曲データ入力手段によって入力された前記楽曲データと共に前記楽曲データベースに記憶させる記憶制御手段と、キーワードに対応する楽曲を設定するキーワード設定手段と、楽曲がマッピングで表示される楽曲マッピング表示手段と、前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、前記印象度データ入力手段から検索条件として入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索手段と、該楽曲検索手段によって検索された前記楽曲データを出力する楽曲データ出力手段と、初期設定用楽曲データを記憶するサンプルデータ記憶手段と、該サンプルデータ記憶手段に記憶されている前記初期設定用楽曲データを音声出力する音声出力手段と、を具備し、前記サンプルデータ記憶手段には、前記初期設定用楽曲データに対応する前記特徴データが予め記憶されており、前記特徴データ抽出手段は、前記サンプルデータ記憶手段に記憶されている前記初期設定用楽曲データから前記特徴データを抽出し、前記階層型ニューラルネットワーク学習手段は、前記特徴データと前記音声出力手段から音声出力された前記初期設定用楽曲データに対応して前記印象度データ入力手段から入力された前記印象度データを用いて前記階層型ニューラルネットワークを学習させることを特徴とする。
さらに、本発明の楽曲検索システムは、前記特徴データ抽出手段は、前記特徴データとしてゆらぎ情報からなる複数の項目を抽出することを特徴とする。
さらに、本発明の楽曲検索システムは、前記楽曲検索手段は、前記印象度データ入力手段から入力された前記印象度データを入力ベクトルとすると共に、前記楽曲データベースに記憶されている前記印象度データを検索対象ベクトルとし、両者のユークリッド距離が小さい順に検索することを特徴とする。
さらに、本発明の楽曲検索方法は、コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、前記コンピュータは、人間の感性によって判断される印象度データを教師信号として受け付ける階層型ニューラルネットワーク学習部の階層型ニューラルネットワーク学習工程と、該入力した前記印象度データを教師信号として用いて、前記楽曲データが有する物理的な特徴データを前記印象度データに変換する階層型ニューラルネットワークを学習させる楽曲マップ学習部の楽曲マップ学習工程と、前記楽曲データ入力する楽曲データ入力部の楽曲データ入力工程と、該入力した前記楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と、前記楽曲マップ学習工程で学習させた前記階層型ニューラルネットワークを用いて、前記特徴データ抽出工程で抽出した前記特徴データを前記印象度データに変換する印象度データ変換部の印象度データ変換工程と、前記印象度データ変換工程で変換した前記印象度データを前記楽曲データと共に前記楽曲データベースに記憶させる前記コンピュータの記憶制御工程とキーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、検索条件として印象度データの入力を受け付けるPC操作部の印象度データ入力工程と、該受け付けた印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索部の楽曲検索工程と前記楽曲検索工程によって検索された楽曲データを出力する検索結果出力部の楽曲データ出力工程と、初期設定用楽曲データを記憶するサンプルデータ記憶部のサンプルデータ記憶工程と、前記サンプルデータ記憶工程で記憶されている前記初期設定用楽曲データを音声出力する音声出力工程と、を実行し、前記サンプルデータ記憶工程には、前記初期設定用楽曲データに対応する前記特徴データが予め記憶されており、前記特徴データ抽出工程は、前記サンプルデータ記憶工程に記憶されている前記初期設定用楽曲データから前記特徴データを抽出し、前記階層型ニューラルネットワーク学習手段は、前記特徴データと前記音声出力工程から音声出力された前記初期設定用楽曲データに対応して前記印象度データ入力手段から入力された前記印象度データを用いて前記階層型ニューラルネットワークを学習させることを特徴とする。
さらに、本発明の楽曲検索方法は、前記特徴データ抽出工程は前記特徴データとしてゆらぎ情報からなる複数の項目を抽出することを特徴とする。
さらに、本発明の楽曲検索プログラムは、上記楽曲検索方法をコンピュータで実行可能とすることを特徴とする。
本発明の楽曲検索システムおよび楽曲検索方法は、ユーザの感性に基づいて学習させた階層型ニューラルネットワークを用いて、楽曲の有する物理的な複数の項目からなる特徴データと、人間の感性によって判断される項目からなる印象度データとを直接関連づけ、楽曲データから抽出した特徴データを印象度データに変換し、変換した印象度データを楽曲データベースに記憶させるように構成すると共に、楽曲検索部によって楽曲データベースに記憶されている印象度データをユーザによって入力された印象度データに基づいて検索するように構成することにより、ユーザによって検索条件として入力される人間の感性によって判断される印象度データの項目が集約されることなく、ユーザの感性によって判断される印象度データに基づいて精度の高い楽曲データの検索を行うことができ、大容量の記憶手段に記憶されている大量の楽曲データの中から聴取した際の印象が同じような楽曲のみを検索することができると共に、個々のユーザの嗜好を反映させた楽曲の検索を行うことができるという効果を奏する。
さらに、本発明の楽曲検索システムおよび楽曲検索方法は、ユーザによって学習が施された自己組織化マップであり、楽曲データが有する印象度データに基づいて楽曲データがマッピングされている楽曲マップを楽曲マップ記憶部に記憶しておき、楽曲検索部によって楽曲マップ記憶部に記憶されている楽曲マップを用いて検索するように構成することにより、代表曲を選択するだけで、大容量の記憶手段に記憶されている大量の楽曲データの中から代表曲と同じような印象をユーザに与える楽曲を素早く検索することができるという効果を奏する。
さらに、本発明の楽曲検索システムおよび楽曲検索方法は、特徴データ抽出部においてゆらぎ情報からなる複数の項目を特徴データとして抽出するように構成することにより、楽曲データの物理的な特徴を正確に抽出することができ、特徴データから変換される印象度データの精度を向上させることができるという効果を奏する。
さらに、本発明の楽曲検索システムおよび楽曲検索方法は、印象度データ変換部によって特徴データから変換される印象度データと、PC操作部から入力される印象度データとを同一の複数項目とすることにより、多様な項目を設定することができ、ユーザが印象度データに基づく検索を容易に行うことができるという効果を奏する。
さらに、本発明の楽曲検索システムおよび楽曲検索方法は、楽曲検索部において、PC操作部から入力された印象度データを入力ベクトルとすると共に、楽曲データベースに記憶されている印象度データを検索対象ベクトルとし、両者のユークリッド距離が小さい順に検索するように構成することにより、印象度データの項目を多くしても正確に検索を行うことができ、検索精度を向上させることができるという効果を奏する。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。
図1は、本発明に係る楽曲検索システムの実施の形態の構成を示すブロック図であり、図2は、図1に示す端末装置の構成を示すブロック図である。
本実施の形態は、図1を参照すると、楽曲検索装置10と、端末装置30とがUSB等のデータ伝送路で接続されており、端末装置30は、楽曲検索装置10から切り離して携帯することができる構成となっている。
楽曲検索装置10は、図1を参照すると、楽曲データ入力部11と、圧縮処理部12と、特徴データ抽出部13と、印象度データ変換部14と、楽曲データベース15と、楽曲マッピング部16と、楽曲マップ記憶部17と、楽曲検索部18と、PC操作部19と、PC表示部20と、検索結果出力部21と、初期設定部22と、サンプルデータ記憶部23と、音声出力部24と、階層型ニューラルネットワーク学習部25と、楽曲マップ学習部26とからなる。
楽曲データ入力部11は、CD、DVD等の楽曲データが記憶されている記憶媒体を読み取る機能を有し、CD、DVD等の記憶媒体から楽曲データを入力し、圧縮処理部12および特徴データ抽出部13に出力する。CD、DVD等の記憶媒体以外にインターネット等のネットワークを経由した楽曲データ(配信データ)を入力するように構成しても良い。なお、圧縮された楽曲データが入力される場合には、圧縮された楽曲データを伸長して特徴データ抽出部13に出力する。
圧縮処理部12は、楽曲データ入力部11から入力された楽曲データをMP3やATRAC(Adaptive Transform Acoustic Coding )等の圧縮形式で圧縮し、圧縮した楽曲データを、アーティスト名、曲名等の書誌データと共に楽曲データベース15に記憶させる。
特徴データ抽出部13は、楽曲データ入力部11から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出し、抽出した特徴データを印象度データ変換部14に出力する。
印象度データ変換部14は、予め学習が施された階層型ニューラルネットワークを用いて、特徴データ抽出部13から入力された特徴データを、人間の感性によって判断される印象度データに変換し、変換した印象度データを楽曲マッピング部16に出力する。
楽曲データベース15は、HDD等の大容量の記憶手段であり、圧縮処理部12によって圧縮された楽曲データ、書誌データと、特徴データ抽出部13によって抽出された特徴データとが関連づけられて記憶される。
楽曲マッピング部16は、印象度データ変換部14から入力された印象度データに基づいて、予め学習が施された自己組織化マップである楽曲マップに楽曲データをマッピングし、楽曲データをマッピングした楽曲マップを楽曲マップ記憶部17に記憶させる。
楽曲マップ記憶部17は、HDD等の大容量の記憶手段であり、楽曲マッピング部16によって楽曲データがマッピングされた楽曲マップが記憶される。
楽曲検索部18は、PC操作部19から入力された印象度データおよび書誌データに基づいて楽曲データベース15を検索し、当該検索結果をPC表示部20に表示すると共に、PC操作部19によって選択された代表曲に基づいて楽曲マップ記憶部17を検索し、当該代表曲検索結果をPC表示部20に表示する。また、楽曲検索部18は、検索結果出力部21を介してPC操作部19によって選択された楽曲データを端末装置30に出力する。
PC操作部19は、キーボードやマウス等の入力手段であり、楽曲データベース15および楽曲マップ記憶部17に記憶されている楽曲データを検索する検索条件の入力、端末装置30に出力する楽曲データを選択する入力が行われる。また、PC操作部19は、音声出力部24からの音声出力に基づく、ユーザによる印象度データの入力を受け付け、受け付けた印象度データを、階層型ニューラルネットワークの学習に用いる教師信号として階層型ニューラルネットワーク学習部25に出力すると共に自己組織化マップへの入力ベクトルとして楽曲マップ学習部26に出力する。
PC表示部20は、例えば液晶ディスプレイ等の表示手段であり、初期設定画面の表示、楽曲マップ記憶部17に記憶されている楽曲データのマッピング状況の表示、楽曲データベース15および楽曲マップ記憶部17に記憶されている楽曲データを検索する検索条件の表示、検索された楽曲データ(検索結果)の表示が行われる。
検索結果出力部21は、端末装置30の検索結果入力部31との間をUSB等のデータ伝送路で接続可能に構成されており、楽曲検索部18によって検索され、PC操作部19によって選択された楽曲データを端末装置30の検索結果入力部31に出力する。
初期設定部22は、最初に電源が投入されると、初期設定画面をPC表示部20に表示させ、PC操作部19からの指示に基づいて、サンプルデータ記憶部23に記憶されている複数のサンプルデータを読み出し、読み出したサンプルデータの内の特徴データを階層型ニューラルネットワーク学習部25に出力すると共に、読み出したサンプルデータの内の楽曲データを音声出力部24に出力する。
サンプルデータ記憶部23は、メモリ等の記憶手段であり、楽曲データと、当該楽曲データから特徴データ抽出部13による特徴データの抽出方法と同様の方法で事前に抽出された特徴データとからなるサンプルデータが複数記憶されている。なお、楽曲データとしては、1曲全部を必要とするものではなく、特徴データの抽出に用いられた部分のみで良い。
音声出力部24は、初期設定部22から入力されたサンプルデータの内の楽曲データを伸長して再生するオーディオプレーヤである。
階層型ニューラルネットワーク学習部25は、初期設定部22から入力された特徴データと、PC操作部19から入力された印象度データとに基づいて階層型ニューラルネットワークに学習を施し、各ニューラルの結合重み値を更新し、更新した結合重み値を印象度データ変換部14に出力する。
楽曲マップ学習部26は、PC操作部19から入力された印象度データを自己組織化マップへの入力ベクトルとして自己組織化マップに学習を施し、各ニューラルの特徴ベクトルを更新し、更新した特徴ベクトルを楽曲マップ記憶部17に記憶させる。
端末装置30は、HDD等の大容量の記憶手段を有するポータブルオーディオ等の音声再生装置であり、図2を参照すると、検索結果入力部31と、検索結果記憶部32と、端末操作部33、端末表示部34と、音声出力部35とからなる。
検索結果入力部31は、楽曲検索装置10の検索結果出力部21をUSB等のデータ伝送路で接続可能に構成されており、楽曲検索装置10の検索結果出力部21から入力された楽曲データを検索結果記憶部32に記憶させる。
端末操作部33は、検索結果記憶部32に記憶されている楽曲データの選択・再生を指示する入力、ボリュームコントロールの入力等の楽曲データの再生に係る入力が行われる。
端末表示部34は、例えば液晶ディスプレイ等の表示手段であり、再生中の曲名や、各種操作ガイダンスが表示される。
音声出力部35は、検索結果記憶部32に圧縮されて記憶されている楽曲データを伸長して再生するオーティオプレーヤである。
次に、本実施の形態の動作について図3乃至図16を参照して詳細に説明する。
図3は、図1に示す階層型ニューラルネットワーク学習部において初期設定時に行われる階層型ニューラルネットワークの学習動作を説明するためのフローチャートであり、図4は、図1に示す階層型ニューラルネットワーク学習部における階層型ニューラルネットワークの学習アルゴリズムを説明するための説明図であり、図5は、図1に示すPC表示部に教示される初期設定画面例を示す図であり、図6は、図1に示す楽曲マップ学習部において初期設定時に行われる楽曲マップの学習動作を説明するためのフローチャートであり、図7は、図1に示す楽曲マップ学習部における楽曲マップの学習アルゴリズムを説明するための説明図であり、図8は、図1に示す楽曲検索装置における楽曲登録動作を説明するためのフローチャートであり、図9は、図1に示す特徴データ抽出部における特徴データ抽出動作を説明するためのフローチャートであり、図10は、図1に示す楽曲検索装置における楽曲検索動作を説明するためのフローチャートであり、図11は、図1に示すPC表示部に表示される表示画面例を示す図であり、図12は、図11に示す検索条件入力領域の表示例を示す図であり、図13および図14は、図11に示す検索結果表示領域の表示例を示す図であり、図15は、図11に示す表示画面に表示される全楽曲リスト表示領域例を示す図であり、図16は、図11に示す表示画面に表示されるキーワード検索領域例を示す図である。
本実施の形態の楽曲検索装置10では、使用に先立って初期設定として、印象度データ変換部14で用いられる階層型ニューラルネットワークの学習と、楽曲マッピング部16で用いられる楽曲マップの学習とが行われる。
まず、階層型ニューラルネットワーク学習部25において初期設定時に行われる階層型ニューラルネットワークの学習動作について図3乃至図5を参照して詳細に説明する。
印象度データ変換部14で用いられる階層型ニューラルネットワークは、図4に示すように、入力層(第1層)、中間層(第n層)および出力層(第N層)からなり、入力層(第1層)に特徴データを入力することによって、出力層(第N層)から印象度データを出力、すなわち特徴データを印象度データに変換し、出力層(第N層)から出力するものであり、中間層(第n層)の各ニューラルの結合重み値wを初期設定する。なお、特徴データは、特徴データ抽出部13によって楽曲データから抽出される8項目からなるデータであり、入力層(第1層)のニューロン数Lは、8個となっている(特徴データ抽出部13による特徴データの抽出方法については、後述する)。また、印象度データは、人間の感性によって判断される(明るい、暗い)、(重い、軽い)、(かたい、やわらかい)、(安定、不安定)、(澄んだ、にごった)、(滑らか、歯切れの良い)、(激しい、穏やか)、(厚い、薄い)の8項目がそれぞれ7段階評価で表されたデータであり、出力層(第N層)のニューロン数Lは、8個となっている。中間層(第n層:n=2,…,N−1)のニューロン数Lは、適宜設定されている。
最初に電源が投入されると、初期設定部22は、初期設定画面40をPC表示部20に表示させる。初期設定画面40は、図5に示すように、印象度データ、すなわち(明るい、暗い)、(重い、軽い)、(かたい、やわらかい)、(安定、不安定)、(澄んだ、にごった)、(滑らか、歯切れの良い)、(激しい、穏やか)、(厚い、薄い)の8項目についての7段階評価をそれぞれ入力する印象度データ入力領域41と、初期設定の開始を指示する初期設定開始ボタン42と、印象度データ入力領域41に入力した印象度データの入力を確定させる入力確定ボタン43とからなる。
ユーザによって初期設定開始ボタン42がクリックされると、初期設定部22は、サンプルデータ記憶部23に記憶されている複数のサンプルデータ(特徴データ+楽曲データ)の最初の1つを読み出し、読み出したサンプルデータの内の特徴データを階層型ニューラルネットワーク学習部25に出力すると共に(ステップA1)、読み出したサンプルデータの内の楽曲データを音声出力部24に出力し、音声出力部24は、初期設定部22から入力された楽曲データを音声出力する(ステップA2)。
ユーザは、音声出力部24からの音声出力を聞くことによって、楽曲の印象度を感性によって評価し、PC操作部19から印象度データ入力領域41に評価結果を入力し、入力確定ボタン43をクリックする。ユーザによって入力確定ボタン43がクリックされると、印象度データ入力領域41に入力された8項目の評価結果は、印象度データとして階層型ニューラルネットワーク学習部25から入力され(ステップA3)、階層型ニューラルネットワーク学習部25は、PC操作部19から入力された印象度データを教師信号として受け付ける。
階層型ニューラルネットワーク学習部25は、初期設定部22から入力された特徴データと、PC操作部19から入力された印象度データとに基づいて、誤差逆伝播学習法を用い、階層型ニューラルネットワークの学習、すなわち各ニューロンの結合重み値wの更新を行う。
まず、初期値として、中間層(第n層)の全てのニューロンの結合重み値wを乱数によって−0.1〜0.1程度の範囲の小さな値に設定しておき、階層型ニューラルネットワーク学習部25は、初期設定部22から入力された特徴データを入力信号x(j=1,2,…,8)として入力層(第1層)に入力し、入力層(第1層)から出力層(第N層)に向けて、各ニューロンの出力を計算する。
次に、階層型ニューラルネットワーク学習部25は、PC操作部19から入力された印象度データを教師信号y(j=1,2,…,8)とし、出力層(第N層)の出力outj と、教師信号yとの誤差から、学習則δj を次式によって計算する。
Figure 0004165650
次に、階層型ニューラルネットワーク学習部25は、学習則δj を使って、中間層(第n層)の誤差信号δj nを次式によって計算する。
Figure 0004165650
なお、数2において、wは、第n層j番目と第n−1層k番目のニューロンの間の結合重み値を表している。
次に、階層型ニューラルネットワーク学習部25は、中間層(第n層)の誤差信号 δj n を用いて各ニューロンの結合重み値wの変化量Δwを次式によって計算し、各ニューロンの結合重み値wを更新する(ステップA4)。
Figure 0004165650
なお、数3において、ηは、学習率を表し、 (0<η≦1)に設定されている。
学習回数として、サンプルデータ記憶部23に記憶されているサンプルデータのサンプル数Tおよび学習反復回数Sを予め設定しておき、学習回数t=1,…,Tについて学習を行い、階層型ニューラルネットワーク学習部25は、学習回数tがサンプル数Tに達したか否かを判断し(ステップA5)、学習回数tが設定値Tに達するまでステップA1〜ステップA4の処理動作を繰り返し、学習回数tが設定値Tに達すると、再び始めのサンプルデータから学習を行う。この一連の処理をS回繰り返した時点で、印象度データ変換部14に学習させた各ニューロンの結合重み値wを出力する(ステップA6)。
なお、学習回数を定めるサンプル数Tは、次式に示す2乗誤差Eが十分に小さくなる値に設定すると良い。
Figure 0004165650
なお、本実施の形態では、中間層(第n層)の各ニューラルの結合重み値wの初期値として、中間層(第n層)の全てのニューロンの結合重み値wを乱数によって−0.1〜0.1程度の範囲の小さな値に設定しておく構成としたが、各ニューラルの結合重み値wとしてある程度まで学習させたものを用いるようにすることもでき、この場合には、初期設定で行う学習動作の数(サンプル数T)を少なくすることができ、ユーザの手間を最小限に抑えることができる。
また、本実施の形態では、サンプルデータ記憶部23に楽曲データと特徴データとからなるサンプルデータを記憶させるように構成したが、サンプルデータ記憶部23に楽曲データのみを記憶しておき、初期設定部22によって読み出された楽曲データを特徴データ抽出部13に入力し、特徴データ抽出部13によって楽曲データから抽出された特徴データを階層型ニューラルネットワーク学習部25に入力するように構成しても良い。
次に、楽曲マップ学習部26において初期設定時に行われる楽曲マップの学習動作について図6および図7を参照して詳細に説明する。
楽曲マッピング部16で用いられる楽曲マップは、教師信号を必要としない学習ニューラルネットワーク、すなわち入力パターン群をその類似度に応じて分類する能力を自律的に獲得して行くニューラルネットワークであって、図7に示すように、n次元の特徴ベクトルm(t)∈Rを内包するニューロンが2次元に規則的に配置(図7に示す例では、9*9の正方形)されている自己組織化マップ(SOM)であり、各ニューロンの特徴ベクトルm(t)∈Rを初期設定する。なお、本実施の形態では、ニューロンが100*100の正方形に配列された2次元SOMを使用したが、ニューロンの配列は、正方形であっても、蜂の巣であっても良い。
楽曲マップの初期設定は、階層型ニューラルネットワークの初期設定に並行して行われる。ユーザによって初期設定開始ボタン42がクリックされると、初期設定部22は、サンプルデータ記憶部23に記憶されている複数のサンプルデータ(特徴データ+楽曲データ)の最初の1つを読み出し、読み出したサンプルデータの内の楽曲データを音声出力部24に出力し、音声出力部24は、初期設定部22から入力された楽曲データを音声出力する(ステップB1)。
ユーザは、音声出力部24からの音声出力を聞くことによって、楽曲の印象度を感性によって評価し、PC操作部19から印象度データ入力領域41に評価結果を入力し、入力確定ボタン43をクリックする。ユーザによって入力確定ボタン43がクリックされると、印象度データ入力領域41に入力された8項目の評価結果は、印象度データとしてPC操作部19から楽曲マップ学習部26に入力され(ステップB2)、楽曲マップ学習部26は、PC操作部19から入力された印象度データに基づいて、楽曲マップの学習、すなわち各ニューロンの特徴ベクトルm(t)∈Rの更新を行う。
楽曲マップ学習部26は、PC操作部19から入力された印象度データを入力ベクトルx(t)∈Rとし、各ニューロンの特徴ベクトルm(t)∈Rを学習させる。なお、tは、学習回数を表し、学習回数を定める設定値Tを予め設定しておき、学習回数t=1,…,Tについて学習を行わせる。なお、Rは、各印象度項目の評価段階を示し、nは、印象度データの項目数を示す。
まず、初期値として、全てのニューロンの特徴ベクトルm(0)をそれぞれ0〜1の範囲でランダムに設定しておき、楽曲マップ学習部26は、x(t)に最も近いニューロンc、すなわち‖x(t)−m(t)‖を最小にする勝者ニューロンcを求め、勝者ニューロンcの特徴ベクトルm(t)と、勝者ニューロンcの近傍にある近傍ニューロンiの集合Nのそれぞれの特徴ベクトルm(t)(i∈N)とを、次式に従ってそれぞれ更新する(ステップB3)。なお、近傍ニューロンiを決定するための近傍半径は、予め設定されているものとする。
Figure 0004165650
なお、数5において、hci(t)は、学習率を表し、次式によって求められる。
Figure 0004165650
なお、αinitは学習率の初期値であり、R(t)は、単調減少する一次関数もしくは指数関数が用いられる。
次に、楽曲マップ学習部26は、学習回数tがサンプル数Tに達したか否かを判断し(ステップB4)、学習回数tがサンプル数Tに達するまでステップB1〜ステップB4の処理動作を繰り返し、学習回数tがサンプル数Tに達すると、再び最初のサンプルから同じ処理動作を行う。この反復回数がS回になった時点で、学習させた特徴ベクトルm(T)∈Rを出力する(ステップB5)。出力された各ニューロンiの特徴ベクトルm(T)は、楽曲マップ記憶部17に楽曲マップとして記憶される。
なお、本実施の形態では、各ニューロンの特徴ベクトルm(t)∈Rの初期値として、全てのニューロンの特徴ベクトルm(0)をそれぞれ0〜1の範囲でランダムに設定しておく構成としたが、各ニューロンの特徴ベクトルm(t)∈Rとしてある程度まで学習させたものを用いるようにすることもでき、この場合には、初期設定で行う学習動作の数(サンプル数T)を少なくすることができ、ユーザの手間を最小限に抑えることができる。
次に、楽曲検索装置10における楽曲登録動作について図8および図9を参照して詳細に説明する。
楽曲データ入力部11にCD、DVD等の楽曲データが記憶されている記憶媒体をセットし、楽曲データ入力部11から楽曲データを入力する(ステップC1)。
圧縮処理部12は、楽曲データ入力部11から入力された楽曲データを圧縮し(ステップC2)、圧縮した楽曲データを、アーティスト名、曲名等の書誌データと共に楽曲データベース15に記憶させる(ステップC3)。
特徴データ抽出部13は、楽曲データ入力部11から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出する(ステップC4)。
特徴データ抽出部13における特徴データの抽出動作は、図9を参照すると、楽曲データの入力を受け付け(ステップD1)、楽曲データの予め定められたデータ解析開始点から一定のフレーム長に対しFFT(高速フーリエ変換)を行い(ステップD2)、パワースペクトルを算出する。なお、ステップD2の前に高速化を目的としてダウンサンプリングを行うようにしても良い。
次に、特徴データ抽出部13は、Low、Middle、Highの周波数帯域を予め設定しておき、Low、Middle、Highの3帯域のパワースペクトルを積分し、平均パワーを算出すると共に(ステップD3)、Low、Middle、Highの周波数帯域の内、最大のパワーを持つ帯域をPitchのデータ解析開始点値とし、Pitchを測定する(ステップD4)。
ステップD2〜ステップD4の処理動作は、予め定められたフレーム個数分行われ、特徴データ抽出部13は、ステップD2〜ステップD4の処理動作を行ったフレーム個数が予め定められた設定値に達したか否かを判断し(ステップD5)、ステップD2〜ステップD4の処理動作を行ったフレーム個数が予め定められた設定値に達していない場合には、データ解析開始点をシフトしながら(ステップD6)、ステップD2〜ステップD4の処理動作を繰り返す。
ステップD2〜ステップD4の処理動作を行ったフレーム個数が予め定められた設定値に達した場合には、特徴データ抽出部13は、ステップD2〜ステップD4の処理動作によって算出したLow、Middle、Highの平均パワーの時系列データに対しFFTを行うと共に、ステップD2〜ステップD4の処理動作によって測定したPitchの時系列データに対しFFTを行う(ステップD7)。
次に、特徴データ抽出部13は、Low、Middle、High、PitchにおけるFFT分析結果から、横軸を対数周波数、縦軸を対数パワースペクトルとしたグラフにおける回帰直線の傾きと、回帰直線のY切片とをゆらぎ情報として算出し(ステップD8)、Low、Middle、High、Pitchのそれぞれにおける回帰直線の傾きおよびY切片を8項目からなる特徴データとして印象度データ変換部14に出力する。
印象度データ変換部14は、図4に示すような入力層(第1層)、中間層(第n層)、出力層(第N層)からなる階層型ニューラルネットワークを用い、入力層(第1層)に特徴データ抽出部13で抽出された特徴データを入力することによって、出力層(第N層)から印象度データを出力、すなわち特徴データを印象度データに変換し(ステップC5)、出力層(第N層)から出力された印象度データを、楽曲マッピング部16に出力すると共に、楽曲データと共に楽曲データベース15に記憶させる。なお、中間層(第n層)の各ニューラルの結合重み値wは、階層型ニューラルネットワーク学習部25によって初期設定、すなわち学習が施されている。また、本実施の形態の場合には、入力層(第1層)に入力される特徴データ、すなわち特徴データ抽出部13によって抽出される特徴データの項目は、前述のように8項目であり、印象度データの項目としては、人間の感性によって判断される(明るい、暗い)、(重い、軽い)、(かたい、やわらかい)、(安定、不安定)、(澄んだ、にごった)、(滑らか、歯切れの良い)、(激しい、穏やか)、(厚い、薄い)の8項目を設定し、各項目を7段階評価で表すように設定した。従って、入力層(第1層)のニューロン数Lと出力層(第N層)のニューロン数Lとは、それぞれ8個となっており、中間層(第n層:n=2,…,N−1)のニューロン数Lは、適宜設定されている。
楽曲マッピング部16は、楽曲データ入力部11から入力された楽曲を楽曲マップ記憶部17に記憶されている楽曲マップの該当箇所にマッピングする。楽曲マッピング部16におけるマッピング動作に用いられる楽曲マップは、楽曲マップ学習部26によって初期設定、すなわち学習が施されており、各ニューロンには、予め学習されたn次元の特徴ベクトルm(t)∈Rが内包されており、楽曲マッピング部16は、印象度データ変換部14によって変換された印象度データを入力ベクトルxとし、入力ベクトルxに最も近いニューロン、すなわちユークリッド距離‖x−m‖を最小にするニューロンに、入力された楽曲をマッピングし(ステップC6)、マッピングした楽曲マップを楽曲マップ記憶部17に記憶させる。なお、Rは、印象度データの各項目の評価段階数を示し、nは、印象度データの項目数を示す。
次に、楽曲検索装置10における楽曲検索動作について図10乃至図16を参照して詳細に説明する。
楽曲検索部18は、PC表示部20に、図11に示すような検索画面50を表示し、PC操作部19からのユーザ入力を受け付ける。検索画面50は、楽曲マップ記憶部17に記憶されている楽曲データのマッピング状況が表示される楽曲マップ表示領域51と、検索条件を入力する検索条件入力領域52と、検索結果が表示される検索結果表示領域53とからなる。図11の楽曲マップ表示領域51に示されている点は、楽曲データがマッピングされている楽曲マップのニューロンを示している。
検索条件入力領域52は、図12に示すように、検索条件として印象度データを入力する印象度データ入力領域521と、検索条件として書誌データを入力する書誌データ入力領域522と、検索の実行を指示する検索実行ボタン523とからなり、ユーザは、検索条件として印象度データおよび書誌データをPC操作部19から入力し(ステップE1)、検索実行ボタン523をクリックすることで、印象度データおよび書誌データに基づく検索を楽曲検索部18に指示する。なお、PC操作部19からの印象度データの入力は、図12に示すように、印象度データの各項目を7段階評価で入力することによって行われる。
楽曲検索部18は、PC操作部19から入力された印象度データおよび書誌データに基づいて楽曲データベース15を検索し(ステップE2)、図13に示すような検索結果を検索結果表示領域53に表示する。
PC操作部19から入力された印象度データに基づく検索は、PC操作部19から入力された印象度データを入力ベクトルxとし、楽曲データベース15に楽曲データと共に記憶されている印象度データを検索対象ベクトルXとすると、入力ベクトルxに近い検索対象ベクトルX、すなわちユークリッド距離‖x−X‖が小さい順に検索して行く。検索する件数は、予め定めておいても、ユーザによって任意に設定するようにしても良い。また、印象度データと書誌データとが共に検索条件とされている場合には、書誌データに基づく検索を行った後、印象度データに基づく検索が行われる。
検索条件入力領域52を用いた検索以外に、楽曲マップ表示領域51を用いた検索を行える様にしても良い。この場合には、楽曲マップ表示領域51において検索対象領域を指定することで、検索対象領域内にマッピングされている楽曲データを検索結果として検索結果表示領域53に表示する。
次に、ユーザは、検索結果表示領域53に表示されている検索結果の中から代表曲を選択し(ステップE3)、代表曲検索実行ボタン531をクリックすることで、代表曲に基づく検索を楽曲検索部18に指示する。
楽曲検索部18は、選択された代表曲に基づいて楽曲マップ記憶部17に記憶されている楽曲マップを検索し(ステップE4)、代表曲がマッピングされているニューロンと、その近傍ニューロンとにマッピングされている楽曲データを代表曲検索結果として検索結果表示領域53に表示する。近傍ニューロンを決定するための近傍半径は、予め定めておいても、ユーザによって任意に設定するようにしても良い。
次に、ユーザは、検索結果表示領域53に表示されている代表曲検索結果の中から端末装置30に出力する楽曲データを、図14に示すように選択し(ステップE5)、出力ボタン532をクリックすることで、選択した楽曲データの出力を楽曲検索部18に指示し、楽曲検索部18は、検索結果出力部21を介してユーザによって選択された楽曲データを端末装置30に出力する(ステップE6)。
なお、検索条件入力領域52、楽曲マップ表示領域51を用いた代表曲の検索以外に、図15に示すような、記憶されている全楽曲のリストが表示される全楽曲リスト表示領域54を検索画面50に表示させ、全楽曲リストから代表曲を直接選択して、代表曲選択実行ボタン541をクリックすることで、選択された代表曲に基づく検索を楽曲検索部18に指示するように構成しても良い。
さらに、上述した検索以外に、「明るい曲」、「楽しい曲」、「癒される曲」というように言葉で表現されるキーワードに対応するニューロン(あるいは楽曲)を設定しておき、キーワードを選択することによって楽曲の検索を行えるように構成しても良い。すなわち、図16(a)に示すような、キーワード検索領域55を検索画面50に表示させ、キーワード選択領域551に表示されたキーワードのリストからいずれかを選択し、おまかせ検索ボタン553をクリックすることで、選択されたキーワードに対応するニューロンに基づく検索を楽曲検索部18に指示するように構成する。図16(a)に示す設定楽曲表示領域552には、選択されたキーワードに対応する楽曲が設定されている場合に、当該楽曲が設定楽曲として表示され、この場合には、おまかせ検索ボタン553をクリックすることで、選択されたキーワードに対応する設定楽曲を代表曲とする検索を楽曲検索部18に指示する。また、図16(a)に示す設定楽曲変更ボタン554は、キーワードに対応する楽曲を変更する際に使用されるもので、設定楽曲変更ボタン554をクリックすることで、全楽曲リストが表示されて、全楽曲リストの中から楽曲を選択することで、キーワードに対応する楽曲を変更できるように構成する。なお、キーワードに対応するニューロン(あるいは楽曲)の設定は、キーワードに印象度データを割り付けておき、当該印象度データを入力ベクトルxとし、入力ベクトルxに最も近いニューロン(あるいは楽曲)とを対応づけるようにしても良く、ユーザによって任意に設定できるように構成しても良い。
このように、キーワードに対応するニューロンが設定されている場合には、図16(b)に示すように、楽曲マップ表示領域51において楽曲がマッピンクされているニューロンをクリックすると、クリックされたニューロンに対応するキーワードがキーワード表示511としてポップアップ表示されるように構成すると、楽曲マップ表示領域51を利用した楽曲の検索を容易に行うことができる。
以上説明したように、本実施の形態によれば、ユーザの感性に基づいて学習させた階層型ニューラルネットワークを用いて、楽曲の有する物理的な複数の項目からなる特徴データと、人間の感性によって判断される項目からなる印象度データとを直接関連づけ、楽曲データから抽出した特徴データを印象度データに変換し、変換した印象度データを楽曲データベース15に記憶させるように構成すると共に、楽曲検索部18によって楽曲データベース15に記憶されている印象度データをユーザによって入力された印象度データに基づいて検索するように構成することにより、ユーザによって検索条件として入力される人間の感性によって判断される印象度データの項目が集約されることなく、ユーザの感性によって判断される印象度データに基づいて精度の高い楽曲データの検索を行うことができ、大容量の記憶手段に記憶されている大量の楽曲データの中から聴取した際の印象が同じような楽曲のみを検索することができると共に、個々のユーザの嗜好を反映させた楽曲の検索を行うことができるという効果を奏する。
さらに、本実施の形態によれば、ユーザによって学習が施された自己組織化マップであり、楽曲データが有する印象度データに基づいて楽曲データがマッピングされている楽曲マップを楽曲マップ記憶部17に記憶しておき、楽曲検索部18によって楽曲マップ記憶部17に記憶されている楽曲マップを用いて検索するように構成することにより、代表曲を選択するだけで、大容量の記憶手段に記憶されている大量の楽曲データの中から代表曲と同じような印象をユーザに与える楽曲を素早く検索することができるという効果を奏する。
さらに、本実施の形態によれば、特徴データ抽出部13においてゆらぎ情報からなる複数の項目を特徴データとして抽出するように構成することにより、楽曲データの物理的な特徴を正確に抽出することができ、特徴データから変換される印象度データの精度を向上させることができるという効果を奏する。
さらに、本実施の形態によれば、印象度データ変換部14によって特徴データから変換される印象度データと、PC操作部19から入力される印象度データとを同一の複数項目とすることにより、多様な項目を設定することができ、ユーザが印象度データに基づく検索を容易に行うことができるという効果を奏する。
さらに、本実施の形態によれば、楽曲検索部18において、PC操作部19から入力された印象度データを入力ベクトルとすると共に、楽曲データベース15に記憶されている印象度データを検索対象ベクトルとし、両者のユークリッド距離が小さい順に検索するように構成することにより、印象度データの項目を多くしても正確に検索を行うことができ、検索精度を向上させることができるという効果を奏する。
次に、本発明の他の実施の形態について図17を参照して詳細に説明する。
図17は、本発明に係る楽曲検索システムの他の実施の形態の構成を示すブロック図である。
他の実施の形態では、図17を参照すると、図1に示す楽曲データベース15、楽曲マップ記憶部17および楽曲検索部18とそれぞれ同等の機能を有する楽曲データベース36、楽曲マップ記憶部37および楽曲検索部38を端末装置30に備え、端末装置30で楽曲データベース36の検索と、楽曲マップ記憶部37に記憶されている楽曲マップの検索とを行えるように構成されている。他の実施の形態において、楽曲検索装置10は、楽曲データ入力部11から入力された楽曲データを楽曲データベース15に、印象度データ変換部14によって変換された印象度データを楽曲データベース15に、楽曲マッピング部16によってマッピングされた楽曲マップを楽曲マップ記憶部17にそれぞれ記憶させる楽曲登録装置として機能する。
楽曲検索装置10の楽曲データベース15および楽曲マップ記憶部17の記憶内容は、端末装置30に出力され、端末装置30のデータベース入力部39は、楽曲データベース15および楽曲マップ記憶部17の記憶内容を楽曲データベース36および楽曲マップ記憶部37に記憶させる。検索条件の入力は、端末表示部34の表示内容に基づいて、端末操作部33から行われる。
なお、本発明が上記各実施の形態に限定されず、本発明の技術思想の範囲内において、各実施の形態は適宜変更され得ることは明らかである。また、上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。なお、各図において、同一構成要素には同一符号を付している。
本発明に係る楽曲検索システムの実施の形態の構成を示すブロック図である。 図1に示す端末装置の構成を示すブロック図である。 図1に示す階層型ニューラルネットワーク学習部において初期設定時に行われる階層型ニューラルネットワークの学習動作を説明するためのフローチャートである。 図1に示す階層型ニューラルネットワーク学習部における階層型ニューラルネットワークの学習アルゴリズムを説明するための説明図である。 図1に示すPC表示部に教示される初期設定画面例を示す図である。 図1に示す楽曲マップ学習部において初期設定時に行われる楽曲マップの学習動作を説明するためのフローチャートある。 図1に示す楽曲マップ学習部における楽曲マップの学習アルゴリズムを説明するための説明図である。 図1に示す楽曲検索装置における楽曲登録動作を説明するためのフローチャートである。 図1に示す特徴データ抽出部における特徴データ抽出動作を説明するためのフローチャートである。 図1に示す楽曲検索装置における楽曲検索動作を説明するためのフローチャートである。 図1に示すPC表示部に表示される表示画面例を示す図である。 図11に示す検索条件入力領域の表示例を示す図である。 図11に示す検索結果表示領域の表示例を示す図である。 図11に示す検索結果表示領域の表示例を示す図である。 図11に示す表示画面に表示される全楽曲リスト表示領域例を示す図である。 図11に示す表示画面に表示されるキーワード検索領域例を示す図である。 本発明に係る楽曲検索システムの他の実施の形態の構成を示すブロック図である。
符号の説明
10 楽曲検索装置
11 楽曲データ入力部
12 圧縮処理部
13 特徴データ抽出部
14 印象度データ変換部
15 楽曲データベース
16 楽曲マッピング部
17 楽曲マップ記憶部
18 楽曲検索部
19 PC操作部
20 PC表示部
21 検索結果出力部
22 初期設定部
23 サンプルデータ記憶部
24 音声出力部
25 階層型ニューラルネットワーク学習部
26 楽曲マップ学習部
30 端末装置
31 検索結果入力部
32 検索結果記憶部
33 端末操作部
34 端末表示部
35 音声出力部
36 楽曲データベース
37 楽曲マップ記憶部
38 楽曲検索部
39 データベース入力部
40 初期設定画面
41 印象度データ入力領域
42 初期設定開始ボタン
43 入力確定ボタン
50 検索画面
51 楽曲マップ表示領域
52 検索条件入力領域
53 検索結果表示領域
54 全楽曲リスト表示領域
55 キーワード検索領域
511 キーワード表示
521 印象度データ入力領域
522 書誌データ入力領域
523 検索実行ボタン
531 代表曲検索実行ボタン
532 出力ボタン
541 代表曲選択実行ボタン
551 キーワード選択領域
552 設定楽曲表示領域
553 おまかせ検索ボタン
554 設定楽曲変更ボタン

Claims (6)

  1. 楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、
    人間の感性によって判断される印象度データを入力する印象度データ入力手段と、
    該印象度データ入力手段から入力された前記印象度データを教師信号として用いて、前記楽曲データが有する物理的な特徴データを前記印象度データに変換する階層型ニューラルネットワークを学習させる階層型ニューラルネットワーク学習手段と、
    前記楽曲データを入力する楽曲データ入力手段と、
    該楽曲データ入力手段によって入力された前記楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで前記特徴データを抽出する特徴データ抽出手段と、
    前記階層型ニューラルネットワーク学習手段によって学習が施された前記階層型ニューラルネットワークを用いて、前記特徴データ抽出手段によって抽出された前記特徴データを前記印象度データに変換する印象度データ変換手段と、
    該印象度データ変換手段によって変換された前記印象度データを前記楽曲データ入力手段によって入力された前記楽曲データと共に前記楽曲データベースに記憶させる記憶制御手段と、
    キーワードに対応する楽曲を設定するキーワード設定手段と、
    楽曲がマッピングで表示される楽曲マッピング表示手段と、
    前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、
    前記印象度データ入力手段から検索条件として入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索手段と、
    該楽曲検索手段によって検索された前記楽曲データを出力する楽曲データ出力手段と、
    初期設定用楽曲データを記憶するサンプルデータ記憶手段と、
    該サンプルデータ記憶手段に記憶されている前記初期設定用楽曲データを音声出力する音声出力手段と、を具備し、
    前記サンプルデータ記憶手段には、前記初期設定用楽曲データに対応する前記特徴データが予め記憶されており、
    前記特徴データ抽出手段は、前記サンプルデータ記憶手段に記憶されている前記初期設
    定用楽曲データから前記特徴データを抽出し、
    前記階層型ニューラルネットワーク学習手段は、前記特徴データと前記音声出力手段から音声出力された前記初期設定用楽曲データに対応して前記印象度データ入力手段から入力された前記印象度データを用いて前記階層型ニューラルネットワークを学習させることを特徴とする楽曲検索システム。
  2. 前記特徴データ抽出手段は、前記特徴データとしてゆらぎ情報からなる複数の項目を抽
    出することを特徴とする請求項1に記載の楽曲検索システム。
  3. 前記楽曲検索手段は、前記印象度データ入力手段から入力された前記印象度データを入力ベクトルとすると共に、前記楽曲データベースに記憶されている前記印象度データを検索対象ベクトルとし、両者のユークリッド距離が小さい順に検索することを特徴とする請求項1乃至2のいずれかに記載の楽曲検索システム。
  4. コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、
    前記コンピュータは、人間の感性によって判断される印象度データを教師信号として受け付ける階層型ニューラルネットワーク学習部の階層型ニューラルネットワーク学習工程と、
    該入力した前記印象度データを教師信号として用いて、前記楽曲データが有する物理的な特徴データを前記印象度データに変換する階層型ニューラルネットワークを学習させる楽曲マップ学習部の楽曲マップ学習工程と、
    前記楽曲データを入力する楽曲データ入力部の楽曲データ入力工程と、
    該入力した前記楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と、
    前記楽曲マップ学習工程で学習させた前記階層型ニューラルネットワークを用いて、前記特徴データ抽出工程で抽出した前記特徴データを前記印象度データに変換する印象度データ変換部の印象度データ変換工程と、
    前記印象度データ変換工程で変換した前記印象度データを前記楽曲データと共に前記楽曲データベースに記憶させる前記コンピュータの記憶制御工程と、
    キーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、
    楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、
    前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、
    検索条件として印象度データの入力を受け付けるPC操作部の印象度データ入力工程と、
    該受け付けた印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索部の楽曲検索工程と、
    前記楽曲検索工程によって検索された楽曲データを出力する検索結果出力部の楽曲データ出力工程と、
    初期設定用楽曲データを記憶するサンプルデータ記憶部のサンプルデータ記憶工程と、
    前記サンプルデータ記憶工程で記憶されている前記初期設定用楽曲データを音声出力する音声出力工程と、を実行し、
    前記サンプルデータ記憶工程には、前記初期設定用楽曲データに対応する前記特徴データが予め記憶されており、
    前記特徴データ抽出工程は、前記サンプルデータ記憶工程に記憶されている前記初期設
    定用楽曲データから前記特徴データを抽出し、
    前記階層型ニューラルネットワーク学習手段は、前記特徴データと前記音声出力工程から音声出力された前記初期設定用楽曲データに対応して前記印象度データ入力手段から入力された前記印象度データを用いて前記階層型ニューラルネットワークを学習させることを特徴とする楽曲検索方法。
  5. 前記特徴データ抽出工程は、前記特徴データとしてゆらぎ情報からなる複数の項目を抽出することを特徴とする請求項に記載の楽曲検索方法。
  6. 請求項のいずれかに記載の楽曲検索方法をコンピュータで実行可能な楽曲検索プログラム。
JP2004040645A 2004-02-17 2004-02-17 楽曲検索システムおよび楽曲検索方法 Expired - Fee Related JP4165650B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004040645A JP4165650B2 (ja) 2004-02-17 2004-02-17 楽曲検索システムおよび楽曲検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004040645A JP4165650B2 (ja) 2004-02-17 2004-02-17 楽曲検索システムおよび楽曲検索方法

Publications (2)

Publication Number Publication Date
JP2005234723A JP2005234723A (ja) 2005-09-02
JP4165650B2 true JP4165650B2 (ja) 2008-10-15

Family

ID=35017637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004040645A Expired - Fee Related JP4165650B2 (ja) 2004-02-17 2004-02-17 楽曲検索システムおよび楽曲検索方法

Country Status (1)

Country Link
JP (1) JP4165650B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4893940B2 (ja) * 2006-01-06 2012-03-07 ソニー株式会社 情報処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP2005234723A (ja) 2005-09-02

Similar Documents

Publication Publication Date Title
KR20080030922A (ko) 정보처리 장치 및 방법, 프로그램, 및 기록 매체
JP4611819B2 (ja) 楽曲管理装置および情報表示方法
US7576278B2 (en) Song search system and song search method
Ünal et al. A hierarchical approach to makam classification of Turkish makam music, using symbolic data
JP2005301921A (ja) 楽曲検索システムおよび楽曲検索方法
JP4246120B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4607660B2 (ja) 楽曲検索装置および楽曲検索方法
JP4165650B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4115923B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP2005346347A (ja) 情報検索装置、情報検索方法、情報検索プログラムおよび記録媒体
JP2005309712A (ja) 楽曲検索システムおよび楽曲検索方法
JP4246100B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4246101B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4165645B2 (ja) 楽曲検索システムおよび楽曲検索方法
Mirza et al. Residual LSTM neural network for time dependent consecutive pitch string recognition from spectrograms: a study on Turkish classical music makams
JP2006195619A (ja) 情報検索装置および情報検索方法
JP4165649B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4313343B2 (ja) 携帯端末装置および情報表示方法
JP4339171B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4313340B2 (ja) 携帯端末装置および選曲方法
JP4607659B2 (ja) 楽曲検索装置および楽曲検索方法
JP3901695B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4279274B2 (ja) 携帯端末装置および楽曲情報表示方法
JP2006317872A (ja) 携帯端末装置および楽曲表現方法
JP2006323438A (ja) 楽曲検索システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080321

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080715

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080722

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110808

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110808

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120808

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120808

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130808

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees