JP4246101B2 - 楽曲検索システムおよび楽曲検索方法 - Google Patents

楽曲検索システムおよび楽曲検索方法 Download PDF

Info

Publication number
JP4246101B2
JP4246101B2 JP2004117314A JP2004117314A JP4246101B2 JP 4246101 B2 JP4246101 B2 JP 4246101B2 JP 2004117314 A JP2004117314 A JP 2004117314A JP 2004117314 A JP2004117314 A JP 2004117314A JP 4246101 B2 JP4246101 B2 JP 4246101B2
Authority
JP
Japan
Prior art keywords
data
music
correction
input
impression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004117314A
Other languages
English (en)
Other versions
JP2005301705A (ja
Inventor
成文 後田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004117314A priority Critical patent/JP4246101B2/ja
Publication of JP2005301705A publication Critical patent/JP2005301705A/ja
Application granted granted Critical
Publication of JP4246101B2 publication Critical patent/JP4246101B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

本発明は、HDD等の大容量の記憶手段に大量に記憶されている楽曲データの中から所望の楽曲を検索する楽曲検索システムおよび楽曲検索方法に関し、特に人間の感性によって判断される印象度データに基づいて楽曲の検索が可能な楽曲検索システムおよび楽曲検索方法に関する。
近年、HDD等の大容量の記憶手段が開発され、大容量の記憶手段に大量の楽曲データを記憶させることができるようになっている。大容量の記憶手段に記憶されている大量の楽曲データの検索は、アーティスト名や曲名、その他のキーワード等の書誌データを用いて行うのが一般的であるが、書誌データで検索した場合には、楽曲が持っている情感を考慮することができず、印象の異なる楽曲が検索される可能性があり、聴取した際の印象が同じような楽曲を検索したい場合には、不向きである。
そこで、楽曲に対する主観的な印象に基づいて利用者の希望する楽曲を検索可能にするために、検索を希望する楽曲に対するユーザの主観的な要件を入力して数値化して出力し、その出力から、検索対象の楽曲の印象を数量化した予測印象値を算出し、算出した予測印象値をキーとして、複数の楽曲の音響信号およびその楽曲の印象を数量化した印象値を格納した楽曲データベースを検索することにより、利用者の楽曲に対する主観的なイメージに基づいて、希望する楽曲を検索する装置が提案されている(例えば、特許文献1参照)。
しかしながら、従来技術では、楽曲の物理的な特徴を変換した印象値を検索するに際し、ユーザの主観的な要件の入力が数値化された予測印象値を用いて行っているため、ユーザによって検索条件として入力される主観的な要件の入力項目が集約されてしまい、主観的な要件に基づく精度の高い楽曲データの検索を実現することができないと共に、楽曲の印象を数量化した印象値が固定されているため、ユーザの嗜好に即しない場合があるという問題点があった。
特開2002−278547号公報
本発明は斯かる問題点を鑑みてなされたものであり、その目的とするところは、階層型ニューラルネットワークによって、楽曲の有する物理的な複数の項目からなる特徴データと、人間の感性によって判断される項目からなる印象度データとを直接関連づけることにより、ユーザによって検索条件として入力される人間の感性によって判断される印象度データの項目が集約されることなく、人間の感性によって判断される印象度データに基づいて精度の高い楽曲データの検索を行うことができ、さらに、階層型ニューラルネットワークをユーザの嗜好に即したものに成長させることができる楽曲検索システムおよび楽曲検索方法を提供する点にある。
本発明は上記課題を解決すべく、以下に掲げる構成とした。
本発明の楽曲検索システムは、楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、楽曲データを入力する楽曲データ入力手段と、該楽曲データ入力手段によって入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出手段と、該特徴データ抽出手段によって抽出された前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換手段と、該印象度データ変換手段によって変換された前記印象度データを前記楽曲データ入力手段によって入力された楽曲データと共に前記楽曲データベースに記憶させる記憶制御手段と、前記印象度データを検索条件として入力する印象度データ入力手段と、キーワードに対応する楽曲を設定するキーワード設定手段と、楽曲がマッピングで表示される楽曲マッピング表示手段と、前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、該印象度データ入力手段から入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索手段と、該楽曲検索手段によって検索された楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データを修正した修正データを入力する修正データ入力手段と、該修正データ入力手段によって入力された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶手段と、該修正データ記憶手段に記憶された前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習手段と、を具備することを特徴とする。
また、本発明の楽曲検索システムは、楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、楽曲データを入力する楽曲データ入力手段と、該楽曲データ入力手段によって入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出手段と、該特徴データ抽出手段によって抽出された前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換手段と、該印象度データ変換手段によって変換された前記印象度データを前記楽曲データ入力手段によって入力された楽曲データと共に前記楽曲データベースに記憶させる記憶制御手段と、前記印象度データを検索条件として入力する印象度データ入力手段と、キーワードに対応する楽曲を設定するキーワード設定手段と、楽曲がマッピングで表示される楽曲マッピング表示手段と、前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、該印象度データ入力手段から入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索手段と、該楽曲検索手段によって検索された楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データの修正指示を入力する修正指示入力手段と、該修正指示入力手段によって入力された前記修正指示に基づいて前記印象度データを前記検索条件から遠ざかる方向に自動修正した修正データを作成する印象度データ修正手段と、該印象度データ修正手段によって作成された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶手段と、該修正データ記憶手段に記憶された前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習手段と、を具備することを特徴とする。
また、本発明の楽曲検索システムは、楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、楽曲データを入力する楽曲データ入力手段と、該楽曲データ入力手段によって入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出手段と、該特徴データ抽出手段によって抽出された前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換手段と、該印象度データ変換手段によって変換された前記印象度データに基づいて、前記楽曲データ入力手段によって入力された楽曲データを予め学習が施された自己組織化マップである楽曲マップにマッピングする楽曲マッピング手段と、該楽曲マッピング手段によってマッピングされた楽曲データが記憶される楽曲マップ記憶手段と、前記楽曲マップにマッピングされている楽曲データの中から代表曲を選択する代表曲選択手段と、キーワードに対応する楽曲を設定するキーワード設定手段と、楽曲がマッピングで表示される楽曲マッピング表示手段と、前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、該代表曲選択手段によって選択された前記代表曲と前記キーワードに基づいて楽曲マップを検索する楽曲検索手段と、該楽曲検索手段によって検索された楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データを修正した修正データを入力する修正データ入力手段と、該修正データ入力手段によって入力された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶手段と、該修正データ記憶手段に記憶された前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習手段と、を具備することを特徴とする。
また、本発明の楽曲検索システムは、楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、楽曲データを入力する楽曲データ入力手段と、該楽曲データ入力手段によって入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出手段と、該特徴データ抽出手段によって抽出された前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換手段と、該印象度データ変換手段によって変換された前記印象度データに基づいて、前記楽曲データ入力手段によって入力された楽曲データを予め学習が施された自己組織化マップである楽曲マップにマッピングする楽曲マッピング手段と、該楽曲マッピング手段によってマッピングされた楽曲データが記憶される楽曲マップ記憶手段と、前記楽曲マップにマッピングされている楽曲データの中から代表曲を選択する代表曲選択手段と、キーワードに対応する楽曲を設定するキーワード設定手段と、楽曲がマッピングで表示される楽曲マッピング表示手段と、前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、該代表曲選択手段によって選択された前記代表曲と前記キーワードに基づいて楽曲マップを検索する楽曲検索手段と、該楽曲検索手段によって検索された楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データの修正指示を入力する修正指示入力手段と、該修正指示入力手段によって入力された前記修正指示に基づいて前記印象度データを修正した修正データを作成する印象度データ修正手段と、該印象度データ修正手段によって作成された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶手段と、該修正データ記憶手段に記憶された前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習手段と、を具備することを特徴とする。
さらに、本発明の楽曲検索システムは、前記ニューラルネットワーク再学習手段は、前記修正データ記憶手段に新たに記憶された前記再学習データの数が所定数に到達した時に前記階層型ニューラルネットワークの再学習を開始させることを特徴とする。
さらに、本発明の楽曲検索システムは、前記ニューラルネットワーク再学習手段は、前回の再学習動作からの経過時間が所定時間に到達した時に前記階層型ニューラルネットワークの再学習を開始させることを特徴とする。
さらに、本発明の楽曲検索システムは、前記修正データ記憶手段に記憶されている前記再学習データの数を表示する修正情報表示手段と、前記階層型ニューラルネットワークの再学習指示を入力する再学習指示入力手段と、を具備し、前記ニューラルネットワーク再学習手段は、前記再学習指示入力手段から入力された前記再学習指示に基づいて前記階層型ニューラルネットワークの再学習を開始させることを特徴とする。
さらに、本発明の楽曲検索システムは、前記階層型ニューラルネットワークの再学習に使用された前記再学習データは、前記修正データ記憶手段に記憶しておき、次回の前記階層型ニューラルネットワークの再学習にも使用させることを特徴とする。
また、本発明の楽曲検索方法は、コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、前記コンピュータは、楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と、該入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と、該特徴データ抽出工程によって抽出した前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換部の印象度データ変換工程と、該印象度データ変換工程によって変換した前記印象度データを前記楽曲データ入力工程で受け付けた楽曲データと共に前記楽曲データベースに記憶する前記コンピュータの記憶制御工程と、検索条件として前記印象度データの入力を受け付ける印象度データ入力部の印象度データ入力工程とキーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、印象度データ入力工程から入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索部の楽曲検索工程と、該楽曲検索工程によって検索した楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データを修正した修正データの入力を受け付ける修正データ入力の修正データ入力工程と、該修正データ入力工程によって入力された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶部の修正データ記憶工程と、該修正データ記憶工程で記憶した前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習部のニューラルネットワーク再学習工程とを実行することを特徴とする。
また、本発明の楽曲検索方法は、コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、前記コンピュータは、楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と、該入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と、該特徴データ抽出工程によって抽出した前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換部の印象度データ変換工程と、該印象度データ変換工程によって変換した前記印象度データを前記楽曲データ入力工程で受け付けた楽曲データと共に前記楽曲データベースに記憶する前記コンピュータの記憶制御工程と、検索条件として前記印象度データの入力を受け付ける印象度データ入力部の印象度データ入力工程とキーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、印象度データ入力工程から入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索部の楽曲検索工程と、該楽曲検索工程によって検索した楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データの修正指示の入力を受け付ける修正データ入力の修正データ入力工程と、該修正データ入力工程によって入力された前記修正指示に基づいて前記印象度データを前記検索条件から遠ざかる方向に自動修正した修正データを作成する修正データ作成部の修正データ修正工程と、該修正データ修正工程で作成した前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶部の修正データ記憶工程と、該修正データ記憶工程で記憶した前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習部のニューラルネットワーク再学習工程とを実行することを特徴とする。
また、本発明の楽曲検索方法は、コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、前記コンピュータは、楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と、該入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と、該特徴データ抽出工程によって抽出した前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換部の印象度データ変換工程と該印象度データ変換工程によって変換された前記印象度データに基づいて、前記楽曲データ入力工程によって入力された楽曲データを予め学習が施された自己組織化マップである楽曲マップにマッピングする楽曲マッピング部の楽曲マッピング工程と、該楽曲マッピング工程によってマッピングされた楽曲データが記憶される楽曲マップ記憶部の楽曲マップ記憶工程と、前記楽曲マップにマッピングされている楽曲データの中から代表曲を選択する代表曲選択部の代表曲選択工程と、キーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、該代表曲選択工程によって選択された前記代表曲と前記キーワードに基づいて楽曲マップを検索する楽曲検索部の楽曲検索工程と、該楽曲検索工程によって検索した楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データを修正した修正データの入力を受け付ける修正データ入力の修正データ入力工程と、該修正データ入力工程によって入力された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶部の修正データ記憶工程と、該修正データ記憶工程で記憶した前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習部のニューラルネットワーク再学習工程とを実行することを特徴とする。
また、本発明の楽曲検索方法は、コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、前記コンピュータは、楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と、該入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と、該特徴データ抽出工程によって抽出した前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換部の印象度データ変換工程と該印象度データ変換工程によって変換された前記印象度データに基づいて、前記楽曲データ入力工程によって入力された楽曲データを予め学習が施された自己組織化マップである楽曲マップにマッピングする楽曲マッピング部の楽曲マッピング工程と、該楽曲マッピング工程によってマッピングされた楽曲データが記憶される楽曲マップ記憶部の楽曲マップ記憶工程と、前記楽曲マップにマッピングされている楽曲データの中から代表曲を選択する代表曲選択部の代表曲選択工程と、キーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、該代表曲選択工程によって選択された前記代表曲と前記キーワードに基づいて楽曲マップを検索する楽曲検索部の楽曲検索工程と、該楽曲検索工程によって検索した楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データの修正指示の入力を受け付ける修正データ入力の修正データ入力工程と、該修正データ入力工程によって入力された前記修正指示に基づいて前記印象度データを前記検索条件から遠ざかる方向に自動修正した修正データを作成する印象度データ修正部の印象度データ修正工程と、該修正データ修正工程で作成した前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶部の修正データ記憶工程と、該修正データ記憶工程で記憶した前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習部のニューラルネットワーク再学習工程とを実行することを特徴とする。
さらに、本発明の楽曲検索方法は、前記ニューラルネットワーク再学習工程は、前記修正データ記憶工程で新たに記憶した前記再学習データの数が所定数に到達した時に前記階層型ニューラルネットワークの再学習を開始することを特徴とする。
さらに、本発明の楽曲検索方法は、前記ニューラルネットワーク再学習工程は、前回の再学習動作からの経過時間が所定時間に到達した時に前記階層型ニューラルネットワークの再学習を開始することを特徴とする。
さらに、本発明の楽曲検索方法は、前記修正データ記憶工程で記憶している前記再学習データの数を表示する修正情報表示部の修正情報表示工程と、前記階層型ニューラルネットワークの再学習指示の入力を受け付ける再学習指示入力部の再学習指示入力工程と、前記ニューラルネットワーク再学習工程は、前記再学習指示入力工程から入力された前記再学習指示に基づいて前記階層型ニューラルネットワークの再学習を開始することを特徴とする。
さらに、本発明の楽曲検索方法は、前記階層型ニューラルネットワークの再学習に使用された前記再学習データは、前記修正データ記憶工程で記憶しておき、次回の前記階層型ニューラルネットワークの再学習にも使用することを特徴とする。
本発明の楽曲検索システムおよび楽曲検索方法は、階層型ニューラルネットワークによって、楽曲の有する物理的な複数の項目からなる特徴データと、人間の感性によって判断される項目からなる印象度データとを直接関連づけることにより、楽曲データから抽出した特徴データを印象度データに変換して記憶しておき、当該記憶している印象度データをユーザによって入力された印象度データに基づいて検索することができるため、ユーザによって検索条件として入力される人間の感性によって判断される項目が集約されることなく、人間の感性によって判断される印象度データに基づいて精度の高い楽曲データの検索を行うことができ、大容量の記憶手段に記憶されている大量の楽曲データの中から聴取した際の印象が同じような楽曲のみを検索することができ、さらに、ユーザによって修正された印象度データおよびユーザの指示によって自動修正した印象度データに基づいて階層型ニューラルネットワークを再学習させるように構成することにより、階層型ニューラルネットワークをユーザの嗜好に即したものに成長させることができるため、特徴データから印象度データへの変換精度を向上させることができ、使用期間が長くなるほどユーザの嗜好に即した検索を実現することができるという効果を奏する。
さらに、本発明の楽曲検索システムおよび楽曲検索方法は、予め学習が施された自己組織化マップであり、楽曲データが、当該楽曲データが有する印象度データに基づいてマッピングされている楽曲マップを用いて検索するように構成することにより、代表曲を選択するだけで、大容量の記憶手段に記憶されている大量の楽曲データの中から代表曲と印象が同じような楽曲を素早く検索することができ、さらに、ユーザによって修正された印象度データおよびユーザの指示によって自動修正した印象度データに基づいて階層型ニューラルネットワークを再学習させるように構成することにより、階層型ニューラルネットワークをユーザの嗜好に即したものに成長させることができるため、特徴データから印象度データへの変換精度を向上させることができ、使用期間が長くなるほどユーザの嗜好に即した検索を実現することができるという効果を奏する。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。
図1は、本発明に係る楽曲検索システムの実施の形態の構成を示すブロック図であり、図2は、図1に示す楽曲検索装置に用いられるニューラルネットワークを事前に学習させるニューラルネットワーク学習装置の構成を示すブロック図である。
本実施の形態は、図1を参照すると、楽曲検索装置10と、端末装置30とがUSB等のデータ伝送路で接続されており、端末装置30は、楽曲検索装置10から切り離して携帯することができる構成となっている。
楽曲検索装置10は、図1を参照すると、楽曲データ入力部11と、圧縮処理部12と、特徴データ抽出部13と、印象度データ変換部14と、楽曲データベース15と、楽曲マッピング部16と、楽曲マップ記憶部17と、楽曲検索部18と、PC操作部19と、PC表示部20と、送受信部21と、音声出力部22と、修正データ記憶部23と、ニューラルネットワーク学習部24とからなる。
楽曲データ入力部11は、CD、DVD等の楽曲データが記憶されている記憶媒体を読み取る機能を有し、CD、DVD等の記憶媒体から楽曲データを入力し、圧縮処理部12および特徴データ抽出部13に出力する。CD、DVD等の記憶媒体以外にインターネット等のネットワークを経由した楽曲データ(配信データ)を入力するように構成しても良い。なお、圧縮された楽曲データが入力される場合には、圧縮された楽曲データを伸長して特徴データ抽出部13に出力する。
圧縮処理部12は、楽曲の登録時には、楽曲データ入力部11から入力された楽曲データをMP3やATRAC(Adaptive Transform Acoustic Coding )等の圧縮形式で圧縮し、圧縮した楽曲データを、アーティスト名、曲名等の書誌データと共に楽曲データベース15に記憶させる。
特徴データ抽出部13は、楽曲データ入力部11から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出し、抽出した特徴データを印象度データ変換部14に出力する。
印象度データ変換部14は、予め学習が施された階層型ニューラルネットワークを用いて、特徴データ抽出部13から入力された特徴データを、人間の感性によって判断される印象度データに変換し、変換した印象度データを楽曲マッピング部16に出力すると共に、特徴データ抽出部13から入力された特徴データと変換した印象度データとを楽曲データに関連づけて楽曲データベース15に登録する。
楽曲データベース15は、HDD等の大容量の記憶手段であり、圧縮処理部12によって圧縮された楽曲データ、書誌データと、特徴データ抽出部13によって抽出された特徴データと、印象度データ変換部14によって変換された印象度データとが関連づけられて記憶される。
楽曲マッピング部16は、印象度データ変換部14から入力された印象度データに基づいて、予め学習が施された自己組織化マップである楽曲マップに楽曲データをマッピングし、楽曲データをマッピングした楽曲マップを楽曲マップ記憶部17に記憶させる。
楽曲マップ記憶部17は、HDD等の大容量の記憶手段であり、楽曲マッピング部16によって楽曲データがマッピングされた楽曲マップが記憶される。
楽曲検索部18は、PC操作部19から入力された印象度データおよび書誌データに基づいて楽曲データベース15を検索し、当該検索結果をPC表示部20に表示すると共に、PC操作部19によって選択された代表曲に基づいて楽曲マップ記憶部17を検索し、当該代表曲検索結果をPC表示部20に表示する。また、楽曲検索部18は、送受信部21を介してPC操作部19によって選択された楽曲データを端末装置30に出力する。
また、楽曲検索部18は、楽曲データおよび印象度データを楽曲データベース15から読み出し、読み出した楽曲データを音声出力部22に出力して音声出力させると共に、音声出力を試聴したユーザの指示に基づいて印象度データを修正し、楽曲データベース15に記憶されている印象度データを更新すると共に、楽曲データベース15から特徴データを読み出して、修正データと特徴データとを再学習データとして修正データ記憶部23に記憶させる。
PC操作部19は、キーボードやマウス等の入力手段であり、楽曲データベース15および楽曲マップ記憶部17に記憶されている楽曲データを検索する検索条件の入力、端末装置30に出力する楽曲データを選択する入力、印象度データの修正入力、印象度データの自動修正を指示する入力、階層型ニューラルネットワークの再学習を指示する入力、楽曲データの再登録を指示する入力が行われる。
PC表示部20は、例えば液晶ディスプレイ等の表示手段であり、楽曲マップ記憶部17に記憶されている楽曲データのマッピング状況の表示、楽曲データベース15および楽曲マップ記憶部17に記憶されている楽曲データを検索する検索条件の表示、検索された楽曲データ(検索結果)の表示等が行われる。
送受信部21は、端末装置30の送受信部31との間をUSB等のデータ伝送路で接続可能に構成されており、楽曲検索部18によって検索され、PC操作部19によって選択された楽曲データを端末装置30の送受信部31に出力すると共に、端末装置30からの修正指示を受信する。
音声出力部22は、楽曲データベース15に記憶されている楽曲データを伸長して再生するオーディオプレーヤである。
修正データ記憶部23は、修正された印象度データと特徴データとを再学習データとして記憶するHDD等の記憶手段である。
ニューラルネットワーク学習部24は、印象度データ変換部14で用いられる階層型ニューラルネットワークの再学習を行う手段であり、印象度データ変換部14から各ニューロンの結合重み値を読み出し、読み出した各ニューロンの結合重み値を初期値とし、修正データ記憶部23に記憶されている再学習データによって階層型ニューラルネットワークの再学習、すなわち各ニューロンの結合重み値を再学習させ、印象度データ変換部14の各ニューロンの結合重み値wを再学習させた各ニューロンの結合重み値に更新する。
端末装置30は、HDD等の大容量の記憶手段を有するポータブルオーディオ、MDプレーヤ等の音声再生装置であり、図1を参照すると、送受信部31と、検索結果記憶部32と、端末操作部33、端末表示部34と、音声出力部35とからなる。
送受信部31は、楽曲検索装置10の送受信部21をUSB等のデータ伝送路で接続可能に構成されており、楽曲検索装置10の送受信部21から入力された楽曲データを検索結果記憶部32に記憶させると共に、端末装置30が楽曲検索装置10に接続されると、検索結果記憶部32に記憶された修正指示を楽曲検索装置10に送信する。
端末操作部33は、検索結果記憶部32に記憶されている楽曲データの選択・再生を指示する入力、ボリュームコントロールの入力等、楽曲データの再生に係る入力、再生中の楽曲に対応する印象度データの修正を指示する修正指示入力が行われる。
端末表示部34は、例えば液晶ディスプレイ等の表示手段であり、再生中の曲名や、各種操作ガイダンスが表示される。
音声出力部35は、検索結果記憶部32に圧縮されて記憶されている楽曲データを伸長して再生するオーディオプレーヤである。
ニューラルネットワーク学習装置40は、印象度データ変換部14で用いられる階層型ニューラルネットワークと、楽曲マッピング部16で用いられる楽曲マップとの学習を行う装置であり、図2を参照すると、楽曲データ入力部41と、音声出力部42と、特徴データ抽出部43と、印象度データ入力部44と、結合重み値学習部45と、楽曲マップ学習部46と、結合重み値出力部47と、特徴ベクトル出力部48とからなる。
楽曲データ入力部41は、CD、DVD等の楽曲データが記憶されている記憶媒体を読み取る機能を有し、CD、DVD等の記憶媒体から楽曲データを入力し、音声出力部42および特徴データ抽出部43に出力する。CD、DVD等の記憶媒体以外にインターネット等のネットワークを経由した楽曲データ(配信データ)を入力するように構成しても良い。なお、圧縮された楽曲データが入力される場合には、圧縮された楽曲データを伸長して音声出力部42および特徴データ抽出部43に出力する。
音声出力部42は、楽曲データ入力部41から入力された楽曲データを伸長して再生するオーディオプレーヤである。
特徴データ抽出部43は、楽曲データ入力部41から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出し、抽出した特徴データを結合重み値学習部45に出力する。
印象度データ入力部44は、音声出力部42からの音声出力に基づく、評価者による印象度データの入力を受け付け、受け付けた印象度データを、階層型ニューラルネットワークの学習に用いる教師信号として結合重み値学習部45に出力すると共に自己組織化マップへの入力ベクトルとして楽曲マップ学習部46に出力する。
結合重み値学習部45は、特徴データ抽出部43から入力された特徴データと、印象度データ入力部44から入力された印象度データとに基づいて階層型ニューラルネットワークに学習を施し、各ニューロンの結合重み値を更新し、結合重み値出力部47を介して更新した結合重み値を出力する。学習が施された階層型ニューラルネットワーク(更新された結合重み値)は、楽曲検索装置10の印象度データ変換部14に移植される。
楽曲マップ学習部46は、印象度データ入力部44から入力された印象度データを自己組織化マップへの入力ベクトルとして自己組織化マップに学習を施し、各ニューロンの特徴ベクトルを更新し、特徴ベクトル出力部48を介して更新した特徴ベクトルを出力する。学習が施された自己組織化マップ(更新された特徴ベクトル)は、楽曲マップとして楽曲検索装置10の楽曲マップ記憶部17に記憶される。
次に、本実施の形態の動作について図3乃至図20を参照して詳細に説明する。
図3は、図1に示す楽曲検索装置における楽曲登録動作を説明するためのフローチャートであり、図4は、図1に示す特徴データ抽出部における特徴データ抽出動作を説明するためのフローチャートであり、図5は、図2に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの学習動作を説明するためのフローチャートであり、図6は、図2に示すニューラルネットワーク学習装置における楽曲マップの学習動作を説明するためのフローチャートあり、図7は、図1に示す楽曲検索装置における楽曲検索動作を説明するためのフローチャートであり、図8は、図2に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの学習アルゴリズムを説明するための説明図であり、図9は、図2に示すニューラルネットワーク学習装置における楽曲マップの学習アルゴリズムを説明するための説明図であり、図10は、図1に示すPC表示部の表示画面例を示す図であり、図11は、図10に示す検索条件入力領域の表示例を示す図であり、図12および図13は、図10に示す検索結果表示領域の表示例を示す図であり、図14は、図10に示す表示画面例に表示される全楽曲リスト表示領域例を示す図であり、図15は、図10に示す表示画面例に表示されるキーワード検索領域例を示す図であり、図16は、本発明に係る楽曲検索システムの実施の形態の階層型ニューラルネットワークの再学習動作を説明するためのフローチャートであり、図17は、図10に示す表示画面例に表示される修正画面例を示す図であり、図18は、図1に示す印象度データ変換部で用いられる階層型ニューラルネットワークの再学習動作を説明するためのフローチャートであり、図19は、図10に示す表示画面例に表示される再学習指示領域の表示例を示す図であり、図20は、図1に示す楽曲検索装置における楽曲データの再登録動作を説明するためのフローチャートである。
まず、楽曲検索装置10における楽曲登録動作について図3を参照して詳細に説明する。
楽曲データ入力部11にCD、DVD等の楽曲データが記憶されている記憶媒体をセットし、楽曲データ入力部11から楽曲データを入力する(ステップA1)。
圧縮処理部12は、楽曲データ入力部11から入力された楽曲データを圧縮し(ステップA2)、圧縮した楽曲データを、アーティスト名、曲名等の書誌データと共に楽曲データベース15に記憶させる(ステップA3)。
特徴データ抽出部13は、楽曲データ入力部11から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出する(ステップA4)。
特徴データ抽出部13における特徴データの抽出動作は、図4を参照すると、楽曲データの入力を受け付け(ステップB1)、楽曲データの予め定められたデータ解析開始点から一定のフレーム長に対しFFT(高速フーリエ変換)を行い(ステップB2)、パワースペクトルを算出する。なお、ステップB2の前に高速化を目的としてダウンサンプリングを行うようにしても良い。
次に、特徴データ抽出部13は、Low、Middle、Highの周波数帯域を予め設定しておき、Low、Middle、Highの3帯域のパワースペクトルを積分し、平均パワーを算出すると共に(ステップB3)、Low、Middle、Highの周波数帯域の内、最大のパワーを持つ帯域をPitchのデータ解析開始点値とし、Pitchを測定する(ステップB4)。
ステップB2〜ステップB4の処理動作は、予め定められたフレーム個数分行われ、特徴データ抽出部13は、ステップB2〜ステップB4の処理動作を行ったフレーム個数が予め定められた設定値に達したか否かを判断し(ステップB5)、ステップB2〜ステップB4の処理動作を行ったフレーム個数が予め定められた設定値に達していない場合には、データ解析開始点をシフトしながら(ステップB6)、ステップB2〜ステップB4の処理動作を繰り返す。
ステップB2〜ステップB4の処理動作を行ったフレーム個数が予め定められた設定値に達した場合には、特徴データ抽出部13は、ステップB2〜ステップB4の処理動作によって算出したLow、Middle、Highの平均パワーの時系列データに対しFFTを行うと共に、ステップB2〜ステップB4の処理動作によって測定したPitchの時系列データに対しFFTを行う(ステップB7)。
次に、特徴データ抽出部13は、Low、Middle、High、PitchにおけるFFT分析結果から、横軸を対数周波数、縦軸を対数パワースペクトルとしたグラフにおける回帰直線の傾きと、回帰直線のY切片とをゆらぎ情報として算出し(ステップB8)、Low、Middle、High、Pitchのそれぞれにおける回帰直線の傾きおよびY切片を8項目からなる特徴データとして印象度データ変換部14に出力する。
印象度データ変換部14は、図8に示すような入力層(第1層)、中間層(第n層)、出力層(第N層)からなる階層型ニューラルネットワークを用い、入力層(第1層)に特徴データ抽出部13で抽出された特徴データを入力することによって、出力層(第N層)から印象度データを出力、すなわち特徴データを印象度データに変換し(ステップA5)、出力層(第N層)から出力された印象度データを、楽曲マッピング部16に出力すると共に、特徴データ抽出部13から入力された特徴データと出力層(第N層)から出力された印象度データとを楽曲データと共に楽曲データベース15に記憶させる。なお、中間層(第n層)の各ニューロンの結合重み値wは、評価者によって予め学習が施されている。また、本実施の形態の場合には、入力層(第1層)に入力される特徴データ、すなわち特徴データ抽出部13によって抽出される特徴データの項目は、前述のように8項目であり、印象度データの項目としては、人間の感性によって判断される(明るい、暗い)、(重い、軽い)、(かたい、やわらかい)、(安定、不安定)、(澄んだ、にごった)、(滑らか、歯切れの良い)、(激しい、穏やか)、(厚い、薄い)の8項目を設定し、各項目を7段階評価で表すように設定した。従って、入力層(第1層)のニューロン数Lと出力層(第N層)のニューロン数Lとは、それぞれ8個となっており、中間層(第n層:n=2,…,N−1)のニューロン数Lnは、適宜設定されている。
楽曲マッピング部16は、楽曲データ入力部11から入力された楽曲を楽曲マップ記憶部17に記憶されている楽曲マップの該当箇所にマッピングする。楽曲マッピング部16におけるマッピング動作に用いられる楽曲マップは、例えばニューロンが2次元に規則的に配置(図9に示す例では、9*9の正方形)されている自己組織化マップ(SOM)であり、教師信号を必要としない学習ニューラルネットワークで、入力パターン群をその類似度に応じて分類する能力を自律的に獲得して行くニューラルネットワークである。なお、本実施の形態では、ニューロンが100*100の正方形に配列された2次元SOMを使用したが、ニューロンの配列は、正方形であっても、蜂の巣であっても良い。
また、楽曲マッピング部16におけるマッピング動作に用いられる楽曲マップは、予め学習が施されており、各ニューロンには、予め学習されたn次元の特徴ベクトルm(t)∈Rが内包されており、楽曲マッピング部16は、印象度データ変換部14によって変換された印象度データを入力ベクトルxとし、入力ベクトルxに最も近いニューロン、すなわちユークリッド距離‖x−m‖を最小にするニューロンに、入力された楽曲をマッピングし(ステップA6)、マッピングした楽曲マップを楽曲マップ記憶部17に記憶させる。なお、Rは、印象度データの各項目の評価段階数を示し、nは、印象度データの項目数を示す。
次に、印象度データ変換部14における変換動作(ステップA5)に用いられる階層型ニューラルネットワークの学習動作について図5および図8を参照して詳細に説明する。
評価者による階層型ニューラルネットワーク(結合重み値w)の学習は、例えば、図3に示すニューラルネットワーク学習装置40を用いて行われ、まず、階層型ニューラルネットワーク(結合重み値w)を事前学習させるための事前学習データ(楽曲データの特徴データ+印象度データ)の入力が行われる。
楽曲データ入力部41にCD、DVD等の楽曲データが記憶されている記憶媒体をセットし、楽曲データ入力部41から楽曲データを入力し(ステップC1)、特徴データ抽出部43は、楽曲データ入力部41から入力された楽曲データから、ゆらぎ情報からなる特徴データを抽出する(ステップC2)。
また、音声出力部42は、楽曲データ入力部41から入力された楽曲データを音声出力し(ステップC3)、評価者は、音声出力部42からの音声出力を聞くことによって、楽曲の印象度を感性によって評価し、評価結果を印象度データとして印象度データ入力部44から入力し(ステップC4)、結合重み値学習部45は、印象度データ入力部44から入力された印象度データを教師信号として受け付ける。なお、本実施の形態では、印象度の評価項目としては、人間の感性によって判断される(明るい、暗い)、(重い、軽い)、(かたい、やわらかい)、(安定、不安定)、(澄んだ、にごった)、(滑らか、歯切れの良い)、(激しい、穏やか)、(厚い、薄い)の8項目を設定し、各項目についての7段階評価を印象度データとして楽曲データ入力部41で受け付けるように構成した。
次に、特徴データと入力された印象度データとからなる学習データが予め定められたサンプル数Tに達したか否かを判断し(ステップC5)、学習データがサンプル数Tに達するまでステップC1〜C4の動作が繰り返される。
結合重み値学習部45における階層型ニューラルネットワークの学習、すなわち各ニューロンの結合重み値wの更新は、誤差逆伝播学習法を用いて行う。
まず、初期値として、中間層(第n層)の全てのニューロンの結合重み値wを乱数によって−0.1〜0.1程度の範囲の小さな値に設定しておき、結合重み値学習部45は、特徴データ抽出部43によって抽出された特徴データを入力信号x(j=1,2,…,8)として入力層(第1層)に入力し、入力層(第1層)から出力層(第N層)に向けて、各ニューロンの出力を計算する。
次に、結合重み値学習部45は、印象度データ入力部44から入力された印象度データを教師信号y(j=1,2,…,8) とし、出力層(第N層)の出力outj と、教師信号yとの誤差から、学習則δj を次式によって計算する。
Figure 0004246101
次に、結合重み値学習部45は、学習則δj を使って、中間層(第n層)の誤差信号 δj n を次式によって計算する。
Figure 0004246101
なお、数式2において、wは、第 n 層 j 番目と第 n -1 層k 番目のニューロンの間の結合重み値を表している。
次に、結合重み値学習部45は、中間層(第n層)の誤差信号δj n を用いて各ニューロンの結合重み値wの変化量Δwを次式によって計算し、各ニューロンの結合重み値wを更新する(ステップC6)。なお、次式において、ηは、学習率を表し、評価者による学習では、η(0<η≦1)に設定されている。
Figure 0004246101
ステップC6では、サンプル数Tの事前学習データのそれぞれについて学習が行われ、次に、次式に示す2乗誤差Eが予め定められた事前学習用の基準値Eよりも小さいか否かが判断され(ステップC7)、2乗誤差Eが基準値Eよりも小さくなるまでステップC6の動作が繰り返される。なお、2乗誤差Eが基準値Eよりも小さくなると想定される学習反復回数Sを予め設定しておき、ステップC6の動作を学習反復回数S回繰り返すようにしても良い。
Figure 0004246101
ステップC7で2乗誤差Eが基準値Eよりも小さいと判断された場合には、結合重み値学習部45は、事前学習させた各ニューロンの結合重み値wを結合重み値出力部47によって出力し(ステップC8)、結合重み値出力部47から出力された各ニューロンの結合重み値wは、印象度データ変換部14に記憶される。
次に、楽曲マッピング部16におけるマッピング動作(ステップA6)に用いられる楽曲マップの学習動作について図6および図9を参照して詳細に説明する。
楽曲データ入力部41にCD、DVD等の楽曲データが記憶されている記憶媒体をセットし、楽曲データ入力部41から楽曲データを入力し(ステップD1)、音声出力部42は、楽曲データ入力部41から入力された楽曲データを音声出力し(ステップD2)、評価者は、音声出力部42からの音声出力を聞くことによって、楽曲の印象度を感性によって評価し、評価結果を印象度データとして印象度データ入力部44から入力し(ステップD3)、楽曲マップ学習部46は、印象度データ入力部44から入力された印象度データを自己組織化マップへの入力ベクトルとして受け付ける。なお、本実施の形態では、印象度の評価項目としては、人間の感性によって判断される(明るい、暗い)、(重い、軽い)、(かたい、やわらかい)、(安定、不安定)、(澄んだ、にごった)、(滑らか、歯切れの良い)、(激しい、穏やか)、(厚い、薄い)の8項目を設定し、各項目についての7段階評価を印象度データとして楽曲データ入力部41で受け付けるように構成した。
楽曲マップ学習部46は、は、印象度データ入力部44から入力された印象度データを入力ベクトルx(t)∈Rとし、各ニューロンの特徴ベクトルm(t)∈Rを学習させる。なお、tは、学習回数を表し、学習回数を定める設定値Tを予め設定しておき、学習回数t=0,1,…,Tについて学習を行わせる。なお、Rは、各印象度項目の評価段階を示し、nは、印象度データの項目数を示す。
まず、初期値として、全てのニューロンの特徴ベクトルm(0)をそれぞれ0〜1の範囲でランダムに設定しておき、楽曲マップ学習部46は、x(t)に最も近いニューロンc、すなわち‖x(t)−m(t)‖を最小にする勝者ニューロンcを求め、勝者ニューロンcの特徴ベクトルm(t)と、勝者ニューロンcの近傍にある近傍ニューロンiの集合Nのそれぞれの特徴ベクトルm(t)(i∈N)とを、次式に従ってそれぞれ更新する(ステップD4)。なお、近傍ニューロンiを決定するための近傍半径は、予め設定されているものとする。
Figure 0004246101
なお、数式5において、hci(t)は、学習率を表し、次式によって求められる。
Figure 0004246101
なお、αinitは学習率の初期値であり、R(t)は、単調減少する一次関数もしくは指数関数が用いられる。
次に、楽曲マップ学習部46は、学習回数tが設定値Tに達したか否かを判断し(ステップD5)、学習回数tが設定値Tに達するまでステップD1〜ステップD4の処理動作を繰り返し、学習回数tが設定値Tに達すると、再び最初のサンプルから同じ処理動作を行う。この反復回数が予め定められたS回になった時点で、特徴ベクトル出力部48を介して学習させた特徴ベクトルm(T)∈Rを出力する(ステップD6)。出力された各ニューロンiの特徴ベクトルm(T)は、楽曲検索装置10の楽曲マップ記憶部17に楽曲マップとして記憶される。
次に、楽曲検索装置10における楽曲検索動作について図7を参照して詳細に説明する。
楽曲検索部18は、PC表示部20に、図10に示すような検索画面50を表示し、PC操作部19からのユーザ入力を受け付ける。検索画面50は、楽曲マップ記憶部17に記憶されている楽曲データのマッピング状況が表示される楽曲マップ表示領域51と、検索条件を入力する検索条件入力領域52と、検索結果が表示される検索結果表示領域53と、階層型ニューラルネットワークの再学習を指示する再学習指示領域70とからなる。図10の楽曲マップ表示領域51に示されている点は、楽曲データがマッピングされている楽曲マップのニューロンを示している。
検索条件入力領域52は、図11に示すように、検索条件として印象度データを入力する印象度データ入力領域521と、検索条件として書誌データを入力する書誌データ入力領域522と、検索の実行を指示する検索実行ボタン523とからなり、ユーザは、検索条件として印象度データや書誌データをPC操作部19から入力し(ステップE1)、検索実行ボタン523をクリックすることで、印象度データや書誌データに基づく検索を楽曲検索部18に指示する。なお、PC操作部19からの印象度データの入力は、図11に示すように、印象度データの各項目を7段階評価で入力することによって行われる。
楽曲検索部18は、PC操作部19から入力された印象度データおよび書誌データに基づいて楽曲データベース15を検索し(ステップE2)、図12に示すような検索結果を検索結果表示領域53に表示する。
PC操作部19から入力された印象度データに基づく検索は、PC操作部19から入力された印象度データを入力ベクトルxとし、楽曲データベース15に楽曲データと共に記憶されている印象度データを検索対象ベクトルXとすると、入力ベクトルxに近い検索対象ベクトルX、すなわちユークリッド距離‖X−x‖が小さい順に検索して行く。検索する件数は、予め定めておいても、ユーザによって任意に設定するようにしても良い。また、印象度データと書誌データとが共に検索条件とされている場合には、書誌データに基づく検索を行った後、印象度データに基づく検索が行われる。
検索条件入力領域52を用いた検索以外に、楽曲マップ表示領域51を用いた検索を行えるようにしても良い。この場合には、楽曲マップ表示領域51において検索対象領域を指定することで、検索対象領域内にマッピングされている楽曲データを検索結果として検索結果表示領域53に表示する。
次に、ユーザは、検索結果表示領域53に表示されている検索結果の中から代表曲を選択し(ステップE3)、代表曲検索実行ボタン531をクリックすることで、代表曲に基づく検索を楽曲検索部18に指示する。なお、この時点で出力ボタン532がクリックされた場合には、楽曲検索部18は、送受信部21を介して検索結果表示領域53に表示されている検索結果の楽曲データを端末装置30に出力する。
楽曲検索部18は、選択された代表曲に基づいて楽曲マップ記憶部17に記憶されている楽曲マップを検索し(ステップE4)、代表曲がマッピングされているニューロンと、その近傍ニューロンとにマッピングされている楽曲データを代表曲検索結果として検索結果表示領域53に表示する。近傍ニューロンを決定するための近傍半径は、予め定めておいても、ユーザによって任意に設定するようにしても良い。
次に、ユーザは、検索結果表示領域53に表示されている代表曲検索結果の中から端末装置30に出力する楽曲データを、図13に示すように選択し(ステップE5)、出力ボタン532をクリックすることで、選択した楽曲データの出力を楽曲検索部18に指示し、楽曲検索部18は、送受信部21を介してユーザによって選択された楽曲データを端末装置30に出力する(ステップE6)。
なお、検索条件入力領域52、楽曲マップ表示領域51を用いた代表曲の検索以外に、図14に示すような、記憶されている全楽曲のリストが表示される全楽曲リスト表示領域54を検索画面50に表示させ、全楽曲リストから代表曲を直接選択して、代表曲選択実行ボタン541をクリックすることで、選択された代表曲に基づく検索を楽曲検索部18に指示するように構成しても良い。
さらに、上述した検索以外に、「明るい曲」、「楽しい曲」、「癒される曲」というように言葉で表現されるキーワードに対応するニューロン(あるいは楽曲)を設定しておき、キーワードを選択することによって楽曲の検索を行えるように構成しても良い。すなわち、図15(a)に示すような、キーワード検索領域55を検索画面50に表示させ、キーワード選択領域551に表示されたキーワードのリストからいずれかを選択し、おまかせ検索ボタン553をクリックすることで、選択されたキーワードに対応するニューロンに基づく検索を楽曲検索部18に指示するように構成する。図15(a)に示す設定楽曲表示領域552には、選択されたキーワードに対応する楽曲が設定されている場合に、当該楽曲が設定楽曲として表示され、この場合には、おまかせ検索ボタン553をクリックすることで、選択されたキーワードに対応する設定楽曲を代表曲とする検索を楽曲検索部18に指示する。また、図15(a)に示す設定楽曲変更ボタン554は、キーワードに対応する楽曲を変更する際に使用されるもので、設定楽曲変更ボタン554をクリックすることで、全楽曲リストが表示されて、全楽曲リストの中から楽曲を選択することで、キーワードに対応する楽曲を変更できるように構成する。なお、キーワードに対応するニューロン(あるいは楽曲)の設定は、キーワードに印象度データを割り付けておき、当該印象度データを入力ベクトルxとし、入力ベクトルxに最も近いニューロン(あるいは楽曲)とを対応づけるようにしても良く、ユーザによって任意に設定できるように構成しても良い。
このように、キーワードに対応するニューロンが設定されている場合には、図15(b)に示すように、楽曲マップ表示領域51において楽曲がマッピンクされているニューロンをクリックすると、クリックされたニューロンに対応するキーワードがキーワード表示511としてポップアップ表示されるように構成すると、楽曲マップ表示領域51を利用した楽曲の検索を容易に行うことができる。
次に、楽曲検索装置における印象度データの修正動作について図16および図17を参照して詳細に説明する。
検索結果表示領域53には、図12および図13に示すように、検索された楽曲毎に試聴ボタン533が設けられており、PC操作部19によって試聴ボタン533をクリックすると(ステップF1)、楽曲検索部18は、対応する楽曲の楽曲データおよび印象度データを楽曲データベース15から読み出し、読み出した楽曲データを音声出力部22に出力すると共に、図17に示す修正指示領域60をPC表示部20に表示し、修正データ入力領域61に読み出した印象度データを表示する(ステップF2)。修正データ入力領域61に表示される印象度データは、図17に示すように、項目毎の段階がポイントの位置で表現される。
音声出力部22は、楽曲検索部18から入力された楽曲データを音声出力し(ステップF3)、ユーザは、印象度データや書誌データに基づいて検索された楽曲を試聴して代表曲を選択することができ、また、代表曲に基づいて検索された楽曲を試聴して端末装置30に出力する楽曲を確認することができる。また、試聴中にPC操作部19によって修正指示領域60の音声出力停止ボタン64をクリックすると、楽曲検索部18は、音声出力部22への楽曲データの出力を停止し、音声出力を停止させると共に、修正指示領域60の表示を消す。
ユーザが音声出力部22からの音声出力に違和感をおぼえた場合、すなわち修正データ入力領域61に表示されている印象度データが異なると感じた場合や、検索結果として不適であると感じた場合には、以下に示す2つの方法のいずれかによって印象度データを修正することができる。
印象度データを修正する第1の方法は、PC操作部19によって修正データ入力領域61に表示されている印象度データの修正入力、すなわち項目毎のポイントの位置の移動を行った後(ステップF4)、修正実行ボタン62をクリックする(ステップF5)。
修正実行ボタン62のクリックによって、修正された印象度データ(以下、修正された印象度データを修正データと称す)が楽曲検索部18に入力され、楽曲検索部18は、楽曲データベース15に記憶されている印象度データを入力された修正データに更新すると共に、楽曲データベース15から特徴データを読み出して、修正データと特徴データとを再学習データとして修正データ記憶部23に記憶させる(ステップF6)。
印象度データを修正する第2の方法は、PC操作部19によって自動修正ボタン63をクリックする。自動修正ボタン63がクリックされると(ステップF7)、修正指示が楽曲検索部18に入力され、楽曲検索部18は、修正が指示された楽曲の印象度データを検索条件から遠ざかる方向に自動修正し(ステップF8)、楽曲データベース15に記憶されている印象度データを自動修正した修正データに更新すると共に、楽曲データベース15から特徴データを読み出して、修正データと特徴データとを再学習データとして修正データ記憶部23に記憶させる(ステップF6)。
楽曲検索部18による自動修正は、検索が印象度データ入力領域521に入力された印象度データや代表曲の印象度データに基づいて行われた場合に実行され、検索条件である印象度データの内の最も特徴的な項目を特定し、当該項目の段階を所定数遠ざかる方向に移動させる。例えば、検索条件である印象度データが図11の印象度データ入力領域521に示すものである場合には、(明るい、暗い)の段階を示す項目で最も明るい評価となっているため、(明るい、暗い)の段階を示す項目が最も特徴的な項目として特定され、(明るい、暗い)の段階を暗い方向に移動させる。なお、検索が書誌データに基づくものである場合には、第2の方法を選択することができず、この場合には、自動修正ボタン63をクリックできないように制御するか、修正指示領域60から自動修正ボタン63を消去するようにすると良い。
楽曲マッピング部16は、楽曲マップ記憶部17に新たな修正データが記憶されると、修正データで楽曲を再マッピングし(ステップF9)、修正データに基づいて再マッピングした楽曲マップを楽曲マップ記憶部17に記憶させる。
次に、端末装置30における印象度データの修正動作について詳細に説明する。
ユーザが端末装置30で楽曲を聴取中に違和感をおぼえた場合、すなわち検索結果として不適であると感じた場合には、再生中の楽曲に対応する印象度データの修正を指示する修正指示入力を端末操作部33によって行う。修正指示入力は、例えば、端末操作部33に修正指示入力を行う専用のボタンを設け、当該ボタンを楽曲の再生中に押下することによって行われる。専用のボタンの代わりに、楽曲の再生中において、いずれかのボタンに修正指示入力の機能を割り当てるようにしても良い。
端末操作部33によって入力された修正指示は、検索結果記憶部32に記憶され、端末装置30が楽曲検索装置10に接続されると、送受信部31によって楽曲検索装置10に送信される。端末操作部33からの修正指示は、楽曲検索装置10の送受信部21によって受信され、受信された修正指示は、楽曲検索部18に出力される。
修正指示が入力された楽曲検索部18は、修正が指示された楽曲の印象度データを検索条件から遠ざかる方向に自動修正し、楽曲データベース15に記憶されている印象度データを自動修正した修正データに更新すると共に、楽曲データベース15から特徴データを読み出して、修正データと特徴データとを再学習データとして修正データ記憶部23に記憶させる。
次に、印象度データ変換部14で用いられる階層型ニューラルネットワークの再学習動作について図18を参照して詳細に説明する。
ニューラルネットワーク学習部24は、修正データ記憶部23に新たに記憶された再学習データの数をカウントしており(ステップG1)、修正データ記憶部23に新たに記憶された再学習データの数が所定数に到達したか否かを判断し(ステップG2)、修正データ記憶部23に新たに記憶された再学習データの数が所定数に到達すると、印象度データ変換部14から各ニューロンの結合重み値wを読み出し(ステップG3)、読み出した各ニューロンの結合重み値wを初期値とし、修正データ記憶部23に記憶されている再学習データによって階層型ニューラルネットワークの再学習、すなわち各ニューロンの結合重み値wを再学習させる(ステップG4)。なお、階層型ニューラルネットワークの再学習を開始する再学習データの数、すなわち所定数は、予め定めておいても良く、ユーザによって設定できるようにしても良い。また、前回階層型ニューラルネットワークの再学習を行った時からの経過時間を計測し、当該経過時間が所定時間に到達した時に階層型ニューラルネットワークの再学習を開始するようにしても良く、階層型ニューラルネットワークの再学習を開始する経過時間、すなわち所定時間は、予め定めておいても良く、ユーザによって設定できるようにしても良い。
ニューラルネットワーク学習部24における階層型ニューラルネットワークの再学習は、ニューラルネットワーク学習装置40で行われる学習方法と同様の方法で行われ、ニューラルネットワーク学習部24は、印象度データ変換部14の各ニューロンの結合重み値wを再学習させた各ニューロンの結合重み値wに更新する(ステップG5)。なお、再学習に使用した再学習データは、修正データ記憶部23から消去するようにしても良いが、修正データ記憶部23に記憶させておき、次回の再学習時に使用するようにすると、階層型ニューラルネットワークの再学習時に使用する再学習データの数が増えるため、再学習の精度が良くなる。但し、再学習に使用した再学習データを修正データ記憶部23に記憶させておく場合には、同一の楽曲に対する新たな修正データが記憶された際に、以前の修正データを消去して同一の楽曲に対して2つの修正データが存在しないようにする必要がある。
ニューラルネットワーク学習部24による階層型ニューラルネットワークの再学習動作は、楽曲登録動作や楽曲検索動作等の他の処理を妨げないように、時分割して行うことができる。すなわち、ニューラルネットワーク学習部24による階層型ニューラルネットワークの再学習中に他の処理が開始されると、再学習動作を中断し、他の処理が終了後に再学習動作を再開するように構成されている。また、ニューラルネットワーク学習部24による階層型ニューラルネットワークの再学習動作を楽曲検索装置10の立ち上げ時のアイドリング中や切断時に終了処理中に分割して行うようにしても良い。
なお、階層型ニューラルネットワークの再学習は、ユーザの指示によって行うことができる。検索画面50の再学習指示領域70は、図19に示すように、修正情報表示領域71と、再学習実行ボタン72と、再登録実行ボタン73とからなり、修正情報表示領域71には、修正データ記憶部23に記憶されている修正データの数と、前回階層型ニューラルネットワークの再学習を行った時からの経過時間と、前回楽曲データの再登録を行った時からの経過時間とが表示される。なお、修正情報表示領域71に表示されている修正データの数は、新たに記憶された修正データ(再学習に用いられていない修正データ)の数と、再学習に用いられたことがある修正データの数とが表示され、再学習に用いられたことがある修正データの数が括弧内に表示される。
ユーザは、修正情報表示領域71に表示されている情報を確認し、階層型ニューラルネットワークの再学習を行う必要があると判断した場合には、PC操作部19によって再学習実行ボタン72をクリックする。再学習実行ボタン72がクリックされると、ニューラルネットワーク学習部24に再学習指示が出力され、ニューラルネットワーク学習部24は、印象度データ変換部14から各ニューロンの結合重み値wを読み出し、読み出した各ニューロンの結合重み値wを初期値とし、修正データ記憶部23に記憶されている再学習データによって階層型ニューラルネットワークの再学習、すなわち各ニューロンの結合重み値wを再学習させ、印象度データ変換部14の各ニューロンの結合重み値wを再学習させた各ニューロンの結合重み値wに更新する。
次に、楽曲検索装置10における楽曲データの再登録動作について図20を参照して詳細に説明する。
修正情報表示領域71において、PC操作部19によって再登録実行ボタン73をクリックすることによって、楽曲データベース15に記憶されている全ての楽曲データの再登録動作が開始される。
PC操作部19によって再登録実行ボタン73をクリックされると(ステップH1)、ニューラルネットワーク学習部24に再登録指示が出力され、ニューラルネットワーク学習部24は、印象度データ変換部14から各ニューロンの結合重み値wを読み出し(ステップH2)、読み出した各ニューロンの結合重み値wを初期値とし、修正データ記憶部23に記憶されている再学習データによって階層型ニューラルネットワークの再学習、すなわち各ニューロンの結合重み値wを再学習させ(ステップH3)、印象度データ変換部14の各ニューロンの結合重み値wを再学習させた各ニューロンの結合重み値wに更新する(ステップH4)。
次に、ニューラルネットワーク学習部24は、楽曲マッピング部16に対して楽曲マップにマッピングされている全ての楽曲の消去を指示し、楽曲マッピング部16は、楽曲マップ記憶部17に記憶されている楽曲マップにマッピングされている全ての楽曲を消去する(ステップH5)。
次に、ニューラルネットワーク学習部24は、印象度データ変換部14に対して楽曲データベース15に記憶されている印象度データの更新を指示し、印象度データ変換部14は、楽曲データベース15に記憶されている楽曲データの特徴データを読み出し(ステップH6)、読み出した特徴データを再学習された階層型ニューラルネットワークを用いて印象度データに変換し(ステップH7)、楽曲データベース15に記憶されている楽曲データの印象度データを更新すると共に(ステップH8)、変換した印象度データを楽曲マッピング部16に出力する。楽曲マッピング部16は、印象度データ変換部14から入力される更新された印象度データに基づいて楽曲を再マッピングする(ステップH9)。
ニューラルネットワーク学習部24は、印象度データが更新されていない楽曲データが存在するか否かを判断し(ステップH10)、印象度データが更新されていない楽曲データが存在する場合には、ステップH6〜ステップH9の処理を繰り返し、印象度データが更新されていない楽曲データが存在しない場合、すなわち楽曲データベース15に記憶されている全ての楽曲データの印象度データを更新した場合には、楽曲データの再登録動作を終了する。
以上説明したように、本実施の形態によれば、印象度データ変換部14によって、楽曲の有する物理的な複数の項目からなる特徴データと人間の感性によって判断される項目からなる印象度データとを直接関連づけた階層型ニューラルネットワークを用いて、楽曲データから抽出した特徴データを印象度データに変換し、変換した印象度データを楽曲データベース15に記憶させるように構成すると共に、楽曲検索部18によって楽曲データベース15に記憶されている印象度データをユーザによって入力された印象度データに基づいて検索するように構成することにより、ユーザによって検索条件として入力される人間の感性によって判断される印象度データの項目が集約されることなく、人間の感性によって判断される印象度データに基づいて精度の高い楽曲データの検索を行うことができ、大容量の記憶手段に記憶されている大量の楽曲データの中から聴取した際の印象が同じような楽曲のみを検索することができ、さらに、ユーザによって修正された印象度データおよびユーザの指示によって自動修正した印象度データを再学習データとして修正データ記憶部23に記憶しておき、ニューラルネットワーク学習部24によって修正データ記憶部23に記憶されている再学習データに基づいて階層型ニューラルネットワークを再学習させるように構成することにより、階層型ニューラルネットワークをユーザの嗜好に即したものに成長させることができるため、特徴データから印象度データへの変換精度を向上させることができ、使用期間が長くなるほどユーザの嗜好に即した検索を実現することができるという効果を奏する。
さらに、本実施の形態によれば、予め学習が施された自己組織化マップであり、楽曲データが、当該楽曲データが有する印象度データに基づいてマッピングされている楽曲マップを楽曲マップ記憶部17に記憶しておき、楽曲検索部18によって楽曲マップ記憶部17に記憶されている楽曲マップを用いて検索するように構成することにより、代表曲を選択するだけで、大容量の記憶手段に記憶されている大量の楽曲データの中から代表曲と印象が同じような楽曲を素早く検索することができ、ユーザによって修正された印象度データおよびユーザの指示によって自動修正した印象度データを再学習データとして修正データ記憶部23に記憶しておき、ニューラルネットワーク学習部24によって修正データ記憶部23に記憶されている再学習データに基づいて階層型ニューラルネットワークを再学習させるように構成することにより、階層型ニューラルネットワークをユーザの嗜好に即したものに成長させることができるため、特徴データから印象度データへの変換精度を向上させることができ、使用期間が長くなるほどユーザの嗜好に即した検索を実現することができるという効果を奏する。
なお、本発明が上記各実施の形態に限定されず、本発明の技術思想の範囲内において、各実施の形態は適宜変更され得ることは明らかである。また、上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。なお、各図において、同一構成要素には同一符号を付している。
本発明に係る楽曲検索システムの実施の形態の構成を示すブロック図である。 図1に示す楽曲検索装置に用いられるニューラルネットワークを事前に学習させるニューラルネットワーク学習装置の構成を示すブロック図である。 図1に示す楽曲検索装置における楽曲登録動作を説明するためのフローチャートである。 図1に示す特徴データ抽出部における特徴データ抽出動作を説明するためのフローチャートである。 図2に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの学習動作を説明するためのフローチャートである。 図2に示すニューラルネットワーク学習装置における楽曲マップの学習動作を説明するためのフローチャートである。 図1に示す楽曲検索装置における楽曲検索動作を説明するためのフローチャートである。 図2に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの学習アルゴリズムを説明するための説明図である。 図2に示すニューラルネットワーク学習装置における楽曲マップの学習アルゴリズムを説明するための説明図である。 図1に示すPC表示部の表示画面例を示す図である。 図10に示す検索条件入力領域の表示例を示す図である。 図10に示す検索結果表示領域の表示例を示す図である。 図10に示す検索結果表示領域の表示例を示す図である。 図10に示す表示画面例に表示される全楽曲リスト表示領域例を示す図である。 図10に示す表示画面例に表示されるキーワード検索領域例を示す図である。 本発明に係る楽曲検索システムの実施の形態の階層型ニューラルネットワークの再学習動作を説明するためのフローチャートである。 図10に示す表示画面例に表示される修正画面例を示す図である。 図1に示す印象度データ変換部で用いられる階層型ニューラルネットワークの再学習動作を説明するためのフローチャートである。 図10に示す表示画面例に表示される再学習指示領域の表示例を示す図である。 図1に示す楽曲検索装置における楽曲データの再登録動作を説明するためのフローチャートである。
符号の説明
10 楽曲検索装置
11 楽曲データ入力部
12 圧縮処理部
13 特徴データ抽出部
14 印象度データ変換部
15 楽曲データベース
16 楽曲マッピング部
17 楽曲マップ記憶部
18 楽曲検索部
19 PC操作部
20 PC表示部
21 送受信部
22 音声出力部
23 修正データ記憶部
24 ニューラルネットワーク学習部
30 端末装置
31 送受信部
32 検索結果記憶部
33 端末操作部
34 端末表示部
35 音声出力部
40 ニューラルネットワーク学習装置
41 楽曲データ入力部
42 音声出力部
43 特徴データ抽出部
44 印象度データ入力部
45 結合重み値学習部
46 楽曲マップ学習部
47 結合重み値出力部
48 特徴ベクトル出力部
50 検索画面
51 楽曲マップ表示領域
52 検索条件入力領域
53 検索結果表示領域
54 全楽曲リスト表示領域
55 キーワード検索領域
60 修正指示領域
61 修正データ入力領域
62 修正実行ボタン
63 自動修正ボタン
64 音声出力停止ボタン
70 再学習指示領域
71 修正情報表示領域
72 再学習実行ボタン
73 再登録実行ボタン
511 キーワード表示
521 印象度データ入力領域
522 書誌データ入力領域
523 検索実行ボタン
531 代表曲検索実行ボタン
532 出力ボタン
533 試聴ボタン
541 代表曲選択実行ボタン
551 キーワード選択領域
552 設定楽曲表示領域
553 おまかせ検索ボタン
554 設定楽曲変更ボタン

Claims (17)

  1. 楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、
    楽曲データを入力する楽曲データ入力手段と、
    該楽曲データ入力手段によって入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出手段と、
    該特徴データ抽出手段によって抽出された前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換手段と、
    該印象度データ変換手段によって変換された前記印象度データを前記楽曲データ入力手段によって入力された楽曲データと共に前記楽曲データベースに記憶させる記憶制御手段と、
    前記印象度データを検索条件として入力する印象度データ入力手段と、
    キーワードに対応する楽曲を設定するキーワード設定手段と、
    楽曲がマッピングで表示される楽曲マッピング表示手段と、
    前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、
    該印象度データ入力手段から入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索手段と、
    該楽曲検索手段によって検索された楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データを修正した修正データを入力する修正データ入力手段と、
    該修正データ入力手段によって入力された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶手段と、
    該修正データ記憶手段に記憶された前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習手段と、を具備することを特徴とする楽曲検索システム。
  2. 楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、
    楽曲データを入力する楽曲データ入力手段と、
    該楽曲データ入力手段によって入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出手段と、
    該特徴データ抽出手段によって抽出された前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換手段と、
    該印象度データ変換手段によって変換された前記印象度データを前記楽曲データ入力手段によって入力された楽曲データと共に前記楽曲データベースに記憶させる記憶制御手段と、
    前記印象度データを検索条件として入力する印象度データ入力手段と、
    キーワードに対応する楽曲を設定するキーワード設定手段と、
    楽曲がマッピングで表示される楽曲マッピング表示手段と、
    前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、
    該印象度データ入力手段から入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索手段と、
    該楽曲検索手段によって検索された楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データの修正指示を入力する修正指示入力手段と、
    該修正指示入力手段によって入力された前記修正指示に基づいて前記印象度データを前記検索条件から遠ざかる方向に自動修正した修正データを作成する印象度データ修正手段と、
    該印象度データ修正手段によって作成された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶手段と、
    該修正データ記憶手段に記憶された前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習手段と、を具備することを特徴とする楽曲検索システム。
  3. 楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、
    楽曲データを入力する楽曲データ入力手段と、
    該楽曲データ入力手段によって入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出手段と、
    該特徴データ抽出手段によって抽出された前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換手段と、
    該印象度データ変換手段によって変換された前記印象度データに基づいて、前記楽曲データ入力手段によって入力された楽曲データを予め学習が施された自己組織化マップである楽曲マップにマッピングする楽曲マッピング手段と、
    該楽曲マッピング手段によってマッピングされた楽曲データが記憶される楽曲マップ記憶手段と、
    前記楽曲マップにマッピングされている楽曲データの中から代表曲を選択する代表曲選択手段と、
    キーワードに対応する楽曲を設定するキーワード設定手段と、
    楽曲がマッピングで表示される楽曲マッピング表示手段と、
    前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、
    該代表曲選択手段によって選択された前記代表曲と前記キーワードに基づいて楽曲マップを検索する楽曲検索手段と、
    該楽曲検索手段によって検索された楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データを修正した修正データを入力する修正データ入力手段と、
    該修正データ入力手段によって入力された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶手段と、
    該修正データ記憶手段に記憶された前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習手段と、を具備することを特徴とする楽曲検索システム。
  4. 楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索システムであって、
    楽曲データを入力する楽曲データ入力手段と、
    該楽曲データ入力手段によって入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出手段と、
    該特徴データ抽出手段によって抽出された前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換手段と、
    該印象度データ変換手段によって変換された前記印象度データに基づいて、前記楽曲データ入力手段によって入力された楽曲データを予め学習が施された自己組織化マップである楽曲マップにマッピングする楽曲マッピング手段と、
    該楽曲マッピング手段によってマッピングされた楽曲データが記憶される楽曲マップ記憶手段と、
    前記楽曲マップにマッピングされている楽曲データの中から代表曲を選択する代表曲選択手段と、
    キーワードに対応する楽曲を設定するキーワード設定手段と、
    楽曲がマッピングで表示される楽曲マッピング表示手段と、
    前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、
    該代表曲選択手段によって選択された前記代表曲と前記キーワードに基づいて楽曲マップを検索する楽曲検索手段と、
    該楽曲検索手段によって検索された楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データの修正指示を入力する修正指示入力手段と、
    該修正指示入力手段によって入力された前記修正指示に基づいて前記印象度データを修正した修正データを作成する印象度データ修正手段と、
    該印象度データ修正手段によって作成された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶手段と、
    該修正データ記憶手段に記憶された前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習手段と、を具備することを特徴とする楽曲検索システム。
  5. 前記ニューラルネットワーク再学習手段は、前記修正データ記憶手段に新たに記憶された前記再学習データの数が所定数に到達した時に前記階層型ニューラルネットワークの再学習を開始させることを特徴とする請求項1乃至4のいずれかに記載の楽曲検索システム。
  6. 前記ニューラルネットワーク再学習手段は、前回の再学習動作からの経過時間が所定時間に到達した時に前記階層型ニューラルネットワークの再学習を開始させることを特徴とする請求項1乃至5のいずれかに記載の楽曲検索システム。
  7. 前記修正データ記憶手段に記憶されている前記再学習データの数を表示する修正情報表示手段と、
    前記階層型ニューラルネットワークの再学習指示を入力する再学習指示入力手段と、を
    具備し、
    前記ニューラルネットワーク再学習手段は、前記再学習指示入力手段から入力された前記再学習指示に基づいて前記階層型ニューラルネットワークの再学習を開始させることを特徴とする請求項1乃至6のいずれかに記載の楽曲検索システム。
  8. 前記階層型ニューラルネットワークの再学習に使用された前記再学習データは、前記修正データ記憶手段に記憶しておき、次回の前記階層型ニューラルネットワークの再学習にも使用させることを特徴とする請求項1乃至7のいずれかに記載の楽曲検索システム。
  9. コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、
    前記コンピュータは、楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と
    該入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と
    特徴データ抽出工程によって抽出した前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換部の印象度データ変換工程と
    印象度データ変換工程によって変換した前記印象度データを前記楽曲データ入力工程で受け付けた楽曲データと共に前記楽曲データベースに記憶する前記コンピュータの記憶制御工程と
    検索条件として前記印象度データの入力を受け付ける印象度データ入力部の印象度データ入力工程と
    キーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、
    楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、
    前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、
    印象度データ入力工程から入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索部の楽曲検索工程と
    楽曲検索工程によって検索した楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データを修正した修正データの入力を受け付ける修正データ入力の修正データ入力工程と
    修正データ入力工程によって入力された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶部の修正データ記憶工程と
    修正データ記憶工程で記憶した前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習部のニューラルネットワーク再学習工程とを実行することを特徴とする楽曲検索方法。
  10. コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、
    前記コンピュータは、楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と
    該入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と
    特徴データ抽出工程によって抽出した前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換部の印象度データ変換工程と
    印象度データ変換工程によって変換した前記印象度データを前記楽曲データ入力工程で受け付けた楽曲データと共に前記楽曲データベースに記憶する前記コンピュータの記憶制御工程と
    検索条件として前記印象度データの入力を受け付ける印象度データ入力部の印象度データ入力工程と
    キーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、
    楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、
    前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、
    印象度データ入力工程から入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索部の楽曲検索工程と
    楽曲検索工程によって検索した楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データの修正指示の入力を受け付ける修正データ入力の修正データ入力工程と
    修正データ入力工程によって入力された前記修正指示に基づいて前記印象度データを前記検索条件から遠ざかる方向に自動修正した修正データを作成する修正データ作成部の修正データ修正工程と
    修正データ修正工程で作成した前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶部の修正データ記憶工程と
    修正データ記憶工程で記憶した前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習部のニューラルネットワーク再学習工程とを実行することを特徴とする楽曲検索方法。
  11. コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、
    前記コンピュータは、楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と
    該入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と
    特徴データ抽出工程によって抽出した前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換部の印象度データ変換工程と
    該印象度データ変換工程によって変換された前記印象度データに基づいて、前記楽曲データ入力工程によって入力された楽曲データを予め学習が施された自己組織化マップである楽曲マップにマッピングする楽曲マッピング部の楽曲マッピング工程と、
    該楽曲マッピング工程によってマッピングされた楽曲データが記憶される楽曲マップ記憶部の楽曲マップ記憶工程と、
    前記楽曲マップにマッピングされている楽曲データの中から代表曲を選択する代表曲選択部の代表曲選択工程と、
    キーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、
    楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、
    前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、
    該代表曲選択工程によって選択された前記代表曲と前記キーワードに基づいて楽曲マップを検索する楽曲検索部の楽曲検索工程と
    楽曲検索工程によって検索した楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データを修正した修正データの入力を受け付ける修正データ入力の修正データ入力工程と
    修正データ入力工程によって入力された前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶部の修正データ記憶工程と
    修正データ記憶工程で記憶した前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習部のニューラルネットワーク再学習工程とを実行することを特徴とする楽曲検索方法。
  12. コンピュータが実行する楽曲データベースに記憶された複数の楽曲データの中から所望の楽曲データを検索する楽曲検索方法であって、
    前記コンピュータは、楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と
    該入力された楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで物理的な特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と
    特徴データ抽出工程によって抽出した前記特徴データを予め学習が施された階層型ニューラルネットワークを用いて人間の感性によって判断される印象度データに変換する印象度データ変換部の印象度データ変換工程と
    該印象度データ変換工程によって変換された前記印象度データに基づいて、前記楽曲データ入力工程によって入力された楽曲データを予め学習が施された自己組織化マップである楽曲マップにマッピングする楽曲マッピング部の楽曲マッピング工程と、
    該楽曲マッピング工程によってマッピングされた楽曲データが記憶される楽曲マップ記憶部の楽曲マップ記憶工程と、
    前記楽曲マップにマッピングされている楽曲データの中から代表曲を選択する代表曲選択部の代表曲選択工程と、
    キーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、
    楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、
    前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、
    該代表曲選択工程によって選択された前記代表曲と前記キーワードに基づいて楽曲マップを検索する楽曲検索部の楽曲検索工程と
    楽曲検索工程によって検索した楽曲データの項目毎の段階がポイントの位置で表現された前記印象度データの修正指示の入力を受け付ける修正データ入力の修正データ入力工程と
    修正データ入力工程によって入力された前記修正指示に基づいて前記印象度データを前記検索条件から遠ざかる方向に自動修正した修正データを作成する印象度データ修正部の印象度データ修正工程と
    修正データ修正工程で作成した前記修正データと前記特徴データとを再学習データとして記憶する修正データ記憶部の修正データ記憶工程と
    修正データ記憶工程で記憶した前記再学習データに基づいて前記階層型ニューラルネットワークを再学習させるニューラルネットワーク再学習部のニューラルネットワーク再学習工程とを実行することを特徴とする楽曲検索方法。
  13. 前記ニューラルネットワーク再学習工程は、前記修正データ記憶工程で新たに記憶した前記再学習データの数が所定数に到達した時に前記階層型ニューラルネットワークの再学習を開始することを特徴とする請求項9乃至12のいずれかに記載の楽曲検索方法。
  14. 前記ニューラルネットワーク再学習工程は、前回の再学習動作からの経過時間が所定時間に到達した時に前記階層型ニューラルネットワークの再学習を開始することを特徴とする請求項9乃至13のいずれかに記載の楽曲検索方法。
  15. 前記修正データ記憶工程で記憶している前記再学習データの数を表示する修正情報表示部の修正情報表示工程と
    前記階層型ニューラルネットワークの再学習指示の入力を受け付ける再学習指示入力部の再学習指示入力工程と
    前記ニューラルネットワーク再学習工程は、前記再学習指示入力工程から入力された前記再学習指示に基づいて前記階層型ニューラルネットワークの再学習を開始することを特徴とする請求項9乃至14のいずれかに記載の楽曲検索方法。
  16. 前記階層型ニューラルネットワークの再学習に使用された前記再学習データは、前記修正データ記憶工程で記憶しておき、
    次回の前記階層型ニューラルネットワークの再学習にも使用することを特徴とする請求項9乃至15のいずれかに記載の楽曲検索方法。
  17. 請求項9乃至16のいずれかに記載の楽曲検索方法をコンピュータで実行可能な楽曲検索プログラム。
JP2004117314A 2004-04-12 2004-04-12 楽曲検索システムおよび楽曲検索方法 Expired - Fee Related JP4246101B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004117314A JP4246101B2 (ja) 2004-04-12 2004-04-12 楽曲検索システムおよび楽曲検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004117314A JP4246101B2 (ja) 2004-04-12 2004-04-12 楽曲検索システムおよび楽曲検索方法

Publications (2)

Publication Number Publication Date
JP2005301705A JP2005301705A (ja) 2005-10-27
JP4246101B2 true JP4246101B2 (ja) 2009-04-02

Family

ID=35333154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004117314A Expired - Fee Related JP4246101B2 (ja) 2004-04-12 2004-04-12 楽曲検索システムおよび楽曲検索方法

Country Status (1)

Country Link
JP (1) JP4246101B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021026505A (ja) * 2019-08-05 2021-02-22 ギリア株式会社 情報処理装置および情報処理用プログラム
WO2021075288A1 (ja) * 2019-10-15 2021-04-22 ソニー株式会社 情報処理装置、情報処理方法

Also Published As

Publication number Publication date
JP2005301705A (ja) 2005-10-27

Similar Documents

Publication Publication Date Title
JP4274221B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP4611819B2 (ja) 楽曲管理装置および情報表示方法
JP2005301921A (ja) 楽曲検索システムおよび楽曲検索方法
EP1530195A2 (en) Song search system and song search method
JP2005309712A (ja) 楽曲検索システムおよび楽曲検索方法
JP4246101B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4339171B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4246120B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4607660B2 (ja) 楽曲検索装置および楽曲検索方法
CN111026904A (zh) 一种基于内容画像的播单评分方法
JP4115923B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP3901695B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4246100B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4165650B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4165645B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP2006195619A (ja) 情報検索装置および情報検索方法
JP4279274B2 (ja) 携帯端末装置および楽曲情報表示方法
JP4165649B2 (ja) 楽曲検索システムおよび楽曲検索方法
JP4313340B2 (ja) 携帯端末装置および選曲方法
JP2006317872A (ja) 携帯端末装置および楽曲表現方法
JP4607659B2 (ja) 楽曲検索装置および楽曲検索方法
JP2006301890A (ja) 楽曲管理システムおよび楽曲管理方法
KR102623459B1 (ko) 사용자의 보컬 평가에 기반한 오디션 이벤트 서비스 제공 방법, 장치 및 시스템
KR102623449B1 (ko) 사용자 보컬 평가 결과 맞춤형 보컬 트레이닝 서비스 제공 방법, 장치 및 시스템
JP5469884B2 (ja) 画像音楽再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090107

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120116

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130116

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees