WO2021100493A1

WO2021100493A1 - 情報処理装置および情報処理方法、並びにプログラム

Info

Publication number: WO2021100493A1
Application number: PCT/JP2020/041497
Authority: WO
Inventors: 進太郎増井; 直樹澁谷; 東山　恵祐
Original assignee: ソニーグループ株式会社
Priority date: 2019-11-22
Filing date: 2020-11-06
Publication date: 2021-05-27
Also published as: US12013893B2; US20220391438A1

Abstract

本開示は、ユーザの要求に応じて検索された楽曲の、検索された理由や根拠となる特徴を提示することができるようにする情報処理装置および情報処理方法、並びにプログラムに関する。ユーザの検索要求に基づいて、楽曲を検索し、検索された楽曲の、検索要求に応じた特徴を、特徴の種別毎のバルーンの大きさで表現する情報を検索要求に対する応答として生成する。楽曲エージェント装置に適用することができる。

Description

情報処理装置および情報処理方法、並びにプログラム

　本開示は、情報処理装置および情報処理方法、並びにプログラムに関し、特に、ユーザの要求に応じて検索された楽曲の、検索された理由や根拠となる特徴を提示できるようにした情報処理装置および情報処理方法、並びにプログラムに関する。

　ストレージの大容量化やネットワークの普及により、スマートフォン等に代表される端末装置を用いた膨大の量の楽曲（コンテンツ）の再生が可能になった。

　ところが、情報過多になったためユーザは、既知の楽曲（コンテンツ）を再生させようとしても、見つけ出すことが難しい状況になっている。

　また、ユーザは、未知の楽曲については、検索さえもできないため、再生可能な楽曲が大量にあっても十分に生かしきることができない。

　そこで、ユーザの要求に応じて、コンテンツベース型フィルタリング処理や、協調フィルタリング型フィルタリング処理により、楽曲を検索し、推薦する技術が提案されている。

　さらに、楽曲の再生に先立ち、ユーザにより指定された、再生したい楽曲に対する感情心理状態に対応する楽曲を、予め楽曲の識別子と生体情報、または、生体情報の解析結果とが対応付けて登録されているデータベースから、生体情報の解析結果に基づいて楽曲を検索してユーザに提示（推薦）する技術が提案されている（特許文献１参照）。

特開２００４－２４６５３５号公報

　しかしながら、コンテンツベース型フィルタリング処理、協調フィルタリング型フィルタリング処理、および特許文献１に記載の技術を用いた処理では、いずれにおいても楽曲が検索された根拠や理由がユーザに提示されていない。

　このため、ユーザは、検索や推薦がなされた理由や根拠を、よく理解できない状態で、検索や推薦がなされた楽曲を再生することになるため、検索や推薦された楽曲に対して十分に納得した状態で楽曲を再生させることができないことがあった。

　本開示は、このような状況に鑑みてなされたものであり、特に、ユーザの要求に応じて検索された楽曲について、検索された理由や根拠を提示できるようにするものである。

　本開示の一側面の情報処理装置、およびプログラムは、ユーザの検索要求に基づいて、楽曲を検索する検索部と、前記検索部により検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果を、前記検索要求に対する応答として生成する応答生成部とを含む情報処理装置、およびプログラムである。

　本開示の一側面の情報処理方法は、ユーザの検索要求に基づいて、楽曲を検索し、検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果を、前記検索要求に対する応答として生成するステップを含む情報処理方法である。

　本開示の一側面においては、ユーザの検索要求に基づいて、楽曲が検索され、検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果が、前記検索要求に対する応答として生成される。

本開示の概要を説明する図である。本開示の情報処理装置のハードウェアの構成例を説明する図である。楽曲エージェント処理部の構成例を説明する図である。検索結果画像を説明する図である。プレイリスト選択画像を説明する図である。楽曲選択画像を説明する図である。キャラクタ生成処理を説明するフローチャートである。楽曲エージェント処理を説明するフローチャートである。応答生成処理を説明するフローチャートである。汎用のパーソナルコンピュータの構成例を説明する図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　以下、本技術を実施するための形態について説明する。説明は以下の順序で行う。
　１．本開示の概要
　２．好適な実施の形態
　３．ソフトウェアにより実行させる例

　＜＜１．本開示の概要＞＞
　本開示は、ユーザの要求に応じて検索された楽曲に対する理由や根拠となる特徴を提示できるようにするものである。

　まず、本開示の概要について説明する。

　これまで、楽曲の検索にあたっては、コンテンツベース型フィルタリング処理や、協調フィルタリング型フィルタリング処理により、楽曲が検索されている。

　ここで、コンテンツベース型フィルタリング処理とは、アーティスト、楽曲名、歌詞、レーベル、発売時期、ジャンル、テンポ、コード進行、利用楽器、映画主題歌曲等のユーザが好む情報に基づいて、楽曲をフィルタリング（推定）する処理である。

　より具体的には、コンテンツベース型フィルタリング処理では、例えば、「2000年代の楽曲が好き、EDMが好き」といったユーザが好む、ユーザの要求となる情報が得られるとき、この条件にマッチする（適合する）楽曲が検索される。

　また、協調フィルタリング型フィルタリング処理は、ユーザAの再生履歴と同じ楽曲を再生しているユーザBがよく再生している楽曲を検索する処理である。

　より具体的には、例えば、ユーザAが、楽曲aaa、楽曲bbbを再生しており、ユーザBが、楽曲aaa、楽曲bbb、および楽曲cccを再生している場合、協調フィルタリング型フィルタリング処理では、ユーザAが再生する楽曲が、ユーザBが再生する楽曲に包含されているため、ユーザA，Bは、嗜好が近いとみなされるので、ユーザAに対して、ユーザBが再生している楽曲cccが検索される。

　さらに、特許文献１の技術においては、楽曲の再生に先立ち、ユーザにより指定された、再生したい楽曲に対する感情心理状態に対応する楽曲を、予め楽曲の識別子と生体情報、または、生体情報の解析結果とが対応付けて登録されているデータベースから、生体情報の解析結果に基づいて楽曲が検索されてユーザに提示される。

　しかしながら、いずれにおいても検索された楽曲が、どのような理由で検索されたのかがユーザに提示されない。

　このため、例えば、ユーザが再生したいと意図していた楽曲が検索されなかった場合、検索の理由や根拠がよく理解できないので、ユーザが再生したいと意図した楽曲をさらに検索させるために、どのようなフィードバックとなる要求をすればよいのかを認識することができない。

　結果として、ユーザは、自らが再生したいと意図した楽曲を、さらに検索させるためのフィードバックを適切にすることができないので、効率よく自らが再生したいと意図した楽曲を検索させることができない。

　そこで、本開示においては、楽曲が検索された理由や根拠となる特徴を提示することにより、楽曲が検索された理由や根拠をユーザに認識し易くさせる。

　これにより、ユーザは再生したいと意図していた楽曲が検索されなかった場合でも、検索された楽曲の、検索の理由や根拠となる特徴に基づいて、自らが希望する楽曲が検索されるような要求をフィードバックすることが可能となる。

　結果として、ユーザが再生したいと意図した楽曲を効率よく検索させるようにすることが可能となる。

　より具体的には、本開示においては、例えば、ユーザの要求が「盛り上がる曲」である場合、検索される楽曲を、図１で示されるように提示する。

　図１においては、検索された楽曲が、ジャケットＪ１として提示されると共に、楽曲の特徴となる要素としてバルーンＦ１乃至Ｆ６が提示されている。

　ジャケットＪ１においては、上部に"Title A"と表記されて、検索された楽曲のタイトルが「Title A」であることが表され、下部に"Artist B"と表記されて、検索された楽曲のアーティストが「Artist B」であることが表されている。

　また、ジャケットＪ１の周囲には、円形のバルーンＦ１乃至Ｆ６が設けられており、それぞれが、検索された楽曲の特徴と、その大きさを表現している。

　すなわち、バルーンＦ１には、"BPM 120"と表記されて、検索された楽曲のBPM（Beats Per Minute）が120であることが表されている。

　また、バルーンＦ２には、"EDM"と表記されて、検索された楽曲のジャンルがEDM（Electronic Dance Music）に含まれることが表されている。

　さらに、バルーンＦ３には、"Tropical"と表記されて、検索された楽曲のジャンルがトロピカル（熱帯地域における雰囲気を持つ楽曲）に含まれることが表されている。

　また、バルーンＦ４には、"Dance"と表記されて、検索された楽曲のジャンルがダンスミュージックに含まれることが表されている。

　さらに、バルーンＦ５には、"CLUB MUSIC"と表記されて、検索された楽曲のジャンルがクラブミュージックに含まれることが表されている。

　バルーンＦ６には、"clap hands"と表記されて、検索された楽曲のジャンルが手拍子を入れて盛り上がる曲のジャンルに含まれることが表されている。

　このように１つの楽曲でも、複数のジャンルに属することがある。

　しかしながら、１つの楽曲が、複数のジャンルに属する場合でも、特定のジャンルの特徴が多く、他の特定のジャンルの特徴が少ないといったことがあり、複数のジャンルに属していても、それぞれジャンルが持つ特徴を均一に備えていないことが多い。

　そこで、本開示においては、複数のジャンルに属している場合でも、それぞれのジャンルの特徴の多少、または大小をバルーンの大きさで表現することにより、検索された楽曲どのような特徴を備えた楽曲であるのかを提示する。

　すなわち、図１の場合、バルーンＦ３が最も大きなバルーンであるので、検索された楽曲の最も大きな特徴（ジャンル）が、トロピカルな楽曲（熱帯地域における雰囲気を持つ楽曲）の特徴であることが表されている。

　また、バルーンＦ１，Ｆ２は、バルーンＦ３に次ぐ大きさであるので、検索された楽曲の２番目の特徴が、BPMが120で、かつ、ジャンルがEDMに含まれることであることが表されている。

　さらに、検索された楽曲は、４番目以降の特徴として、ダンスミュージック、クラブミュージック、および、手拍子を入れて盛り上がる要素を含むジャンルに含まれるという特徴を備えていることが表されている。

　図１で示されるように、検索された楽曲の持つ特徴と、その大きさとが提示されることで、ユーザは、検索された理由や根拠となる特徴を認識することが可能となる。

　これにより、検索された楽曲が、自らが意図した楽曲である場合、楽曲が検索された理由や根拠となる特徴をよく理解して、納得したうえで、検索された楽曲を再生させることが可能となる。

　また、検索された楽曲が、自らが意図した楽曲ではない場合、楽曲が検索された理由や根拠となる楽曲の持つ特徴と、その大きさに基づいて、自らが意図した楽曲が検索されるようなフィードバックを考えることが可能となる。

　すなわち、ユーザの意図した楽曲がトロピカルである特徴（熱帯地域における雰囲気を持つ楽曲の特徴）よりも、ダンスミュージックとしての特徴を持った楽曲を望む場合については、「もっとダンサブルに！」といった要求をフィードバックすることで、自らが意図した楽曲を検索され易くすることが可能となる。

　また、ユーザの意図した楽曲のBPMが120よりも速い楽曲を望む場合については、「もっとアップテンポに！」といった要求をフィードバックすることで、自らが意図した楽曲を検索され易くすることが可能となる。

　結果として、本開示においては、検索された楽曲の理由や根拠となる特徴を認識できる情報を提示することで、意図した楽曲が検索された場合には、ユーザに検索された楽曲を納得した状態で再生できるようにする。また、意図しない楽曲が検索された場合には、適切なフィードバックを掛けられるようにして、ユーザが意図した楽曲が、効率よく検索されるようにすることが可能となる。

　＜＜２．好適な実施の形態＞＞
　＜本開示の情報処理装置の構成例＞
　次に、図２のブロック図を参照して、本開示の情報処理装置のハードウェアの構成例について説明する。

　本開示の情報処理装置は、例えば、スマートフォンやタブレットなどである。

　図２の情報処理装置１１は、制御部３１、入力部３２、出力部３３、記憶部３４、通信部３５、ドライブ３６、およびリムーバブル記憶媒体３７より構成されており、相互にバス３８を介して接続されており、データやプログラムを送受信することができる。

　制御部３１は、プロセッサやメモリから構成されており、情報処理装置１１の動作の全体を制御する。

　また、制御部３１は、楽曲エージェント処理部５１を備えている。

　楽曲エージェント処理部５１は、入力部３２を介して入力される、ユーザの要求に応じて、記憶部３４や通信部３５を介して図示せぬネットワーク上のサーバ等に格納された楽曲コンテンツを検索し、検索結果となる楽曲を出力部３３より出力させる。

　尚、楽曲エージェント処理部５１の詳細な構成については、図３を参照して後述する。

　入力部３２は、ユーザが操作コマンドを入力するキーボードや音声により入力するマイクロフォンなどの入力デバイスより構成され、入力された各種の信号を制御部３１に供給する。

　出力部３３は、スピーカ等からなる音声出力部１２１（図３）、LCD（Liquid Crystal Display）や有機EL（Organic Electro-Luminescence）等からなる画像表示部１２２（図３）、LED（Light Emitting Diode）等からなる構成される発光部１２３（図３）、およびバイブレータよりなる振動部１２４（図３）より構成され、制御部３１により制御されて、各種の検索結果の表示や、検索された楽曲の再生を行う。

　記憶部３４は、HDD（Hard Disk Drive）、SSD（Solid State Drive）、または、半導体メモリなどからなり、制御部３１により制御され、コンテンツデータを含む各種のデータおよびプログラムを書き込む、または、読み出す。

　通信部３５は、制御部３１により制御され、有線（または無線（図示せず））により、LAN（Local Area Network）などに代表される通信ネットワークを介して、各種の装置との間で各種のデータやプログラムを送受信する。

　ドライブ３６は、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ(Mini Disc)を含む）、もしくは半導体メモリなどのリムーバブル記憶媒体３７に対してデータを読み書きする。

　＜楽曲エージェント処理部の構成例＞
　次に、図３の機能ブロック図を参照して、制御部３１により実現される楽曲エージェント処理部５１の機能について説明する。

　楽曲エージェント処理部５１は、音声認識処理部１５１、意味解析処理部１５２、雑談発話抽出部１５３、検索発話抽出部１５４、フィードバック発話抽出部１５５、音楽雑談DB（Database）１５６、楽曲検索エンジン１５７、楽曲DB（Database）１５８、応答生成部１５９、音声合成部１６０、および楽曲再生部１６１より構成される。

　音声認識処理部１５１は、入力部３２におけるマイクロフォン１０２により収音された音声に基づいて、音声認識処理を行い、ユーザの発話をテキスト情報に変換して意味解析処理部１５２に出力する。

　意味解析処理部１５２は、入力部３２のキーボード１０１が操作されることにより入力されるテキスト情報、および、音声認識処理部１５１より供給される発話に係る音声認識処理結果であるテキスト情報に基づいて、例えば、形態素解析などにより発話内容の意味を解析する。

　そして、意味解析処理部１５２は、発話内容の解析結果を雑談発話抽出部１５３、検索発話抽出部１５４、およびフィードバック発話抽出部１５５に出力する。

　尚、以降においては、ユーザにより操作されてキーボード１０１より入力されるテキスト情報は、ユーザが音声として発した発話の音声認識処理結果となるテキスト情報であるものとして説明する。

　したがって、以降においては、発話内容の解析結果に基づいたテキスト情報については、キーボード１０１が操作されることにより入力されたテキスト情報も含むものとする。

　雑談発話抽出部１５３は、意味解析処理部１５２より供給されたテキスト情報から認識される発話内容のうち、雑談発話を抽出し、応答生成部１５９に供給すると共に、音楽雑談DB１５６に蓄積させる。

　検索発話抽出部１５４は、意味解析処理部１５２より供給されたテキスト情報から認識される発話内容のうち、楽曲を検索させるための発話、すなわち、検索発話を抽出し、楽曲検索エンジン１５７に供給する。

　フィードバック発話抽出部１５５は、意味解析処理部１５２より供給されたテキスト情報から認識される発話内容のうち、検索結果に対するフィードバック発話を抽出し、楽曲検索エンジン１５７に供給する。

　ここで、雑談発話、検索発話、およびフィードバック発話について説明する。

　検索発話は、発話内容のうち、楽曲の検索を指示する発話内容である。より具体的には、検索発話としては、楽曲の詳細情報などからなるメタ情報を特定する発話であり、例えば、アーティスト、楽曲名、歌詞、レーベル、発売時期、ジャンル、テンポ、コード進行、利用楽器、映画主題歌曲であるか否か等を指定して楽曲の検索を指示する発話である。

　また、検索発話は、明るい楽曲、楽しくなる楽曲、哀しい楽曲、盛り上がる楽曲等の検索される楽曲の特徴を指示する発話も含む。

　フィードバック発話は、検索発話に基づいた検索結果に対する発話である。

　フィードバック発話は、例えば、検索結果となる楽曲に対して、もっとアップテンポの楽曲、もっと盛り上がる楽曲等の検索結果となる楽曲を基準として、差分となる情報を指定して、さらに楽曲の検索を指示する発話である。

　また、フィードバック発話は、検索結果となる楽曲に対して、再生の指示や、再生を開始した後の停止の指示などの発話も含む。

　雑談発話は、発話内容のうち、楽曲の検索や推薦に係る発話であって、検索発話およびフィードバック発話を除く発話である。

　雑談発話は、例えば、楽曲に係るユーザの思い出や感想等である。すなわち、「title Aの楽曲をよく聞いたなぁ」といった発話や、「Artist Bの楽曲はいいね」といった発話であり、楽曲を検索する際に参照される情報や、ユーザのキャラクタの推定に必要な情報である。

　音楽雑談DB１５６は、雑談発話を音楽雑談として記憶する。この音楽雑談は、例えば、楽曲検索エンジン１５７において、検索発話やフィードバック発話に基づいて楽曲が検索されるときに使用される。

　すなわち、例えば、楽曲検索エンジン１５７において、検索発話やフィードバック発話に基づいた楽曲の検索が行われるとき、音楽雑談として登録されているユーザの思い出の話に出てきた楽曲のジャンルやアーティストなどが、楽曲の絞り込みに使用される。

　楽曲検索エンジン１５７は、検索発話抽出部１５４から検索発話が抽出される場合、または、フィードバック発話抽出部１５５よりフィードバック発話が抽出される場合、抽出された検索発話、または、フィードバック発話に基づいて、楽曲DB１５８に登録されている楽曲の中から、対象となる楽曲を検索して応答生成部１５９に出力する。楽曲検索エンジン１５７は、具体的な検索方法としては、例えば、検索発話、または、フィードバック発話に基づいた、コンテンツベース型フィルタリング処理により楽曲を検索するようにしてもよい。

　また、楽曲検索エンジン１５７は、音楽雑談DB１５６に登録されている音楽雑談の情報も、検索発話、または、フィードバック発話と併せて利用して、楽曲DB１５８に登録されている楽曲の中から、対象となる楽曲を検索する。

　楽曲検索エンジン１５７は、検索発話、フィードバック発話、および音楽雑談DB１５６に登録された音楽雑談に基づいて、ユーザの嗜好を学習して、ユーザの意図を反映した楽曲を検索し、検索された楽曲に係る楽曲データ、および楽曲の詳細情報からなるメタデータを応答生成部１５９に出力する。

　例えば、検索発話、フィードバック発話、および音楽雑談DB１５６に登録された音楽雑談に基づいて、特定のジャンルＹの楽曲を検索させる指示が多いことがわかっているような場合（学習されている場合）、楽曲検索エンジン１５７は、「盛り上がる曲」といった要求があるときでも、検索された楽曲から、さらに特定のジャンルＹの楽曲に絞り込みを掛けるように検索する。このような検索により、ユーザの嗜好に近い楽曲が検索されるようになる。

　楽曲DB１５８には、楽曲の音源データとなる楽曲データに対応付けて、楽曲のメタ情報を登録している。メタ情報は、例えば、アーティスト、楽曲名、歌詞、レーベル、発売時期、ジャンル、テンポ、コード進行、利用楽器、採用された映画名などの情報である。従って、楽曲検索エンジン１５７は、ユーザの要求である、検索発話、または、フィードバック発話に応じて、楽曲のメタ情報を利用して楽曲を検索する。

　尚、楽曲DB１５８に登録される楽曲データと対応付けて登録されるメタ情報はこれ以外の情報であってもよい。

　応答生成部１５９は、意味解析処理部１５２により解析された雑談発話、検索発話、およびフィードバック発話のそれぞれに応じて生成される楽曲検索エンジン１５７により検索された楽曲の楽曲データ、およびメタデータ、または、雑談発話に基づいて、応答を生成して、音声合成部１６０、および楽曲再生部１６１に出力する。

　より具体的には、応答生成部１５９は、例えば、「盛り上がる曲かけてよ」といった検索発話や「もっとアップテンポの曲かけてよ」といったフィードバック発話があった場合、検索発話やフィードバック発話に応じて検索された楽曲の楽曲データと楽曲のメタ情報に基づいて、楽曲のリスト、および楽曲の特徴を表現する画像を生成し、楽曲データと共に応答結果として楽曲再生部１６１に出力する。

　また、このとき、応答生成部１５９は、検索発話に対して「あなたの好きな盛り上がるTitle Xを再生するよ」といったユーザの検索発話に対する応答発話を生成するためのテキスト情報からなる応答を音声合成部１６０に出力する。

　さらに、応答生成部１５９は、検索された楽曲の再生、一時停止、１曲戻る、１曲進むといった再生に係る操作の指示を、例えば、フィードバック発話として受けた場合、対応する操作を実現する。

　さらに、応答生成部１５９は、キャラクタ生成エンジン１８１を備えている。

　キャラクタ生成エンジン１８１は、雑談発話抽出部１５３より供給される雑談発話に基づいて、ユーザのキャラクタを解析して、解析結果であるユーザのキャラクタを応答に反映させて変化を加える。

　キャラクタ生成エンジン１８１は、例えば、雑談発話の発話内容が、楽曲の紹介や盛り上げるようなフレーズなどが多いときには、ユーザのキャラクタをDJであるものとみなして、キャラクタを生成する。

　そして、例えば、応答発話として、「あなたの好きな盛り上がるTitle Xを再生するよ」を生成するような場合、キャラクタ生成エンジン１８１により生成されたユーザのキャラクタがDJであるときには、応答生成部１５９は、「Title Xで盛り上がろうぜ！」といったDJのキャラクタが現れるように、応答発話を変換させて、音声合成部１６０に出力する。

　ユーザは、キャラクタ性の強い応答発話に対して、より多くのフィードバック発話を発することが実験的にわかっている。

　このため、このようにキャラクタ性の高い表現で応答発話が生成されることにより、より多くのフィードバック発話をユーザから得ることが可能となる。

　結果として、より多くのフィードバック発話に基づいて、ユーザが求める楽曲を適切に検索して再生することが可能となる。

　楽曲再生部１６１は、応答生成部１５９より供給される、応答としての、楽曲データに基づいて、スピーカからなる音声出力部１２１より音声として出力すると共に、楽曲のリスト、および楽曲の特徴を表現する画像を画像表示部１２２に表示する。

　このとき、楽曲再生部１６１は、楽曲データに基づいて、音声出力部１２１より出力する音声に合わせて、発光部１２３を発光させたり、振動部１２４を振動させる。

　音声合成部１６０は、応答発話を生成するためのテキスト情報に基づいて、対応する音声を合成して生成し、音声出力部１２１より音声として出力する。

　＜検索結果画像＞
　次に、楽曲検索エンジン１５７により検索された楽曲リストと楽曲データに基づいて、応答生成部１５９により生成される検索結果画像の例について説明する。

　例えば、検索発話が「盛り上がる曲」である場合、楽曲検索エンジン１５７は「盛り上がる曲」に基づいて、該当する楽曲が検索し、検索した楽曲の楽曲データと楽曲のメタ情報を応答生成部１５９に出力する。

　応答生成部１５９は、楽曲検索エンジン１５７より供給される検索された楽曲の楽曲データと楽曲のメタ情報に基づいて、図４の画像Ｐ１１で示されるような検索結果画像を生成し、楽曲再生部１６１に出力して、画像表示部１２２に表示させる。

　画像Ｐ１１においては、左上部に検索発話より抽出されるキーワードが表示されるキーワード表示欄Ｋが設けられ、図４の場合、「盛り上がる曲」と表記され、検索発話に基づいた検索キーワードが「盛り上がる曲」であることが示されている。

　その下には、検索キーワードにより検索された楽曲のリストである楽曲リストＴＬ１１が表示されており、左から再生表示欄、タイトル表示欄、アーティスト表示欄、およびテーマ表示欄（Theme）が設けられ、それぞれ上から検索された楽曲毎に再生中であるか否か、楽曲のタイトル、楽曲のアーティスト、および楽曲のテーマが表記されている。

　尚、再生中の楽曲については、再生表示欄に三角形状のマークが表示され、図４の場合、タイトルＡＡＡ１の楽曲が再生中であることが示されている。

　画像Ｐ１１の楽曲リストＴＬ１１においては、タイトル表示欄において上から「ＡＡＡ１」乃至「ＡＡＡ１２」が表記され、アーティスト表示欄において、上から「ＢＢＢ１」乃至「ＢＢＢ１２」が表記され、テーマ表示欄において、上から「ＸＸＸ１」乃至「ＸＸＸ１２」が表記されている。

　これによりタイトルＡＡＡ１乃至ＡＡＡ１２の楽曲は、それぞれアーティストＢＢＢ１乃至ＢｂＢ１２の楽曲であり、それぞれのテーマがＸＸＸ１乃至ＸＸＸ１２であることが示されている。

　尚、図４の楽曲リストＴＬ１１においては、タイトルＡＡＡ１乃至ＡＡＡ１２の１２曲分の楽曲が表記されているが、さらに多くの楽曲が検索されているような場合、スクロール表示することで、さらに多くの楽曲が表示されるようにしてもよい。

　また、画像Ｐ１１の右部には、検索された楽曲の特徴を表すアイコンが表示されている。

　より詳細には、画像Ｐ１１の右部においては、検索された楽曲のプレイリスト毎にアイコンＰＬ１１乃至ＰＬ１８が示されている。

　ここで、楽曲のプレイリストとは、例えば、同一ジャンルや同一アルバムとなる楽曲群のリストを示す。

　図４のアイコンＰＬ１１には、「EMD Party Mix」と表記され、アイコンＰＬ１１が「EMD Party Mix」に分類される楽曲群からなるプレイリストを表していることを示している。

　また、アイコンＰＬ１２には、「Up Hip Hop Dance」と表記され、アイコンＰＬ１２が「Up Hip Hop Dance」に分類される楽曲群からなるプレイリストを表していることを示している。

　さらに、アイコンＰＬ１３には、「Latin Dance」と表記され、アイコンＰＬ１３が「Latin Dance」に分類される楽曲群からなるプレイリストを表していることを示している。

　また、アイコンＰＬ１４には、「Sqing Jazz Dance」と表記され、アイコンＰＬ１２が「Sqing Jazz Dance」に分類される楽曲群からなるプレイリストを表していることを示している。

　さらに、アイコンＰＬ１５には、「J-popカラオケBest」と表記され、アイコンＰＬ１５が「J-popカラオケBest」に分類される楽曲群からなるプレイリストを表していることを示している。

　また、アイコンＰＬ１６には、「80's All day, all night」と表記され、アイコンＰＬ１６が「80's All day, all night」に分類される楽曲群からなるプレイリストを表していることを示している。

　さらに、アイコンＰＬ１７には、「Groovy 2000 in US」と表記され、アイコンＰＬ１７が「Groovy 2000 in US」に分類される楽曲群からなるプレイリストを表していることを示している。

　また、アイコンＰＬ１８には、「Pop's」と表記され、アイコンＰＬ１８が「Pop's」に分類される楽曲群からなるプレイリストを表していることを示している。

　さらに、アイコンＰＬ１１乃至ＰＬ１８は、それぞれポインタの操作等により選択することが可能とされており、いずれかのアイコンが選択されると、画像Ｐ１１の右部における表示が、対応するプレイリストに応じたプレイリスト選択画像に変化する。

　尚、アイコンＰＬ１１乃至ＰＬ１８のいずれかが選択された場合のプレイリスト選択画像については、図５を参照して、詳細を後述する。

　また、アイコンＰＬ１１乃至ＰＬ１８の中心には、検索結果となる楽曲の特徴を示す情報がバルーンＦ１１乃至Ｆ１３として表示されている。

　より詳細には、バルーンＦ１１には、「BPM 120～150」と表記され、検索された楽曲の特徴の１つであるBPMが120乃至150であることが表されている。

　また、バルーンＦ１２には、「DANCE」と表記され、検索された楽曲の特徴の１つであるジャンルがDANCEであることが表されている。

　さらに、バルーンＦ１３には、「CLUB MUSIC」と表記され、検索された楽曲の特徴の１つであるジャンルがCLUB MUSICであることが表されている。

　また、バルーンＦ１１乃至Ｆ１３は、それぞれ特徴をバルーンの大きさで表現しており、例えば、図４においては、バルーンＦ１１が最も大きく、バルーンＦ１２，Ｆ１３がバルーンＦ１１よりも小さく表記されているので、検索された楽曲群は、BPMが120乃至150であることが最も大きな特徴であり、ジャンルとして「DANCE」や「CLUB MUSIC」を含んでいる特徴が次いで大きいことが表されている。

　バルーンで表現される特徴の大きさは、例えば、検索結果となる複数の楽曲群のうち、その特徴を含む楽曲数の割合などにより決定されるようにしてもよい。

　すなわち、例えば、検索された楽曲数が１００であった場合、９０曲に第１の特徴があり、５０曲に第２の特量があるようなときには、第１の特徴を表現するバルーンの半径がRであるときには、第２の特徴を表現するバルーンについては、半径が5R/9となるようにしてもよい。

　このように特徴を表現するバルーンの大きさにより、検索された楽曲のうち、その特徴を備えた楽曲の割合を認識することが可能となり、検索された楽曲全体として、どのくらいの楽曲数が、どの特徴をどの程度備えているのかを視覚的に、かつ、直感的に認識することが可能となる。

　また、バルーンにより表現される特徴については、所定の半径以上となるバルーンのみとするようにしてもよい。このようにすることで、特徴と認識するに足らない大きさの特徴については表示されない状態となり、大きな特徴だけを認識し易くすることができる。

　また、特徴の大きさが認識できれば、バルーン以外の形状のものであってもよく、例えば、方形状のものや、星形の形状のものであってもよいし、大きさを同一にして色の濃さなどで特徴の大きさを表現するようにしてもよい。

　さらに、画像Ｐ１１の下部には、操作表示欄Ｃ１１が設けられており、図中の左から、再生する楽曲を１曲戻す（楽曲リストＴＬ１１における図中上方に１曲戻す）とき操作されるボタンＢ１３、再生を指示するとき操作されるボタンＢ１１、および再生する楽曲を１曲進める（楽曲リストＴＬ１１における図中下方に１曲進める）とき操作されるボタンＢ１２が設けられている。再生を指示するボタンＢ１１は、再生が開始されると、停止ボタンに切り替えて表示され、楽曲が再生している間、停止ボタンとして機能し、楽曲の再生が停止すると再び再生ボタンとして機能する。

　すなわち、楽曲リストＴＬ１１に表記された楽曲のいずれかが選択された状態で、ボタンＢ１１乃至Ｂ１３が操作されると、選択された楽曲に対して、操作されたボタンに対応して、１曲戻す、再生（停止）する、または１曲進む操作がなされる。

　このように検索された楽曲を、プレイリストを単位としてアイコンとして表示されるようにすることで、検索された楽曲群がどのような種別のプレイリストとして検索されているのかを視覚に認識することが可能となる。

　これにより、検索された楽曲群が、どのような特徴を備えた、どのようなプレイリストとして検索された楽曲群であるのかを直感的に認識することが可能となる。

　また、自らが意図した楽曲が検索されている場合については、検索された楽曲群が、どのような特徴を備えた、どのような種別のプレイリストであるのかを直感的に認識した上で、納得して再生することが可能となる。

　さらに、自らが意図した楽曲が検索されていない場合については、検索された楽曲群が、どのような特徴を備えた、どのようなプレイリストとして検索された楽曲群であるのかを直感的に認識した上で、自らが意図した楽曲群との差異を特徴に基づいて認識することが可能となり、自らが意図した楽曲を検索する上で必要となるさらなる要求、すなわち、フィードバックを、その差異となる特徴を備えた楽曲として指定することで、自らが意図した楽曲が検索され易くすることが可能となる。

　例えば、検索結果となる楽曲群のプレイリストの中に、自ら意図していた楽曲のジャンルＸからなるプレイリストが存在しないときには、フィードバックとして、自らが意図した楽曲のジャンルＸを指定することで、自らが意図していた楽曲を検索され易くできる。

　結果として、自らが意図した楽曲を効率よく検索させるようにすることが可能となる。

　＜プレイリスト選択画像＞
　次に、図５を参照して、図４のアイコンＰＬ１１乃至ＰＬ１８のいずれかが選択されたときに表示されるプレイリスト選択画像について説明する。

　例えば、図４における「EDM」と表記された点線で囲まれたアイコンＰＬ１１が選択されると、楽曲検索エンジン１５７は、選択されたプレイリストに属する楽曲データと対応するメタ情報を応答生成部１５９に出力する。

　応答生成部１５９は、選択されたプレイリストに属する楽曲データと対応するメタ情報に基づいて、例えば、図５の画像Ｐ３１で示されるようなプレイリスト選択画像を生成して楽曲再生部１６１に出力し、画像表示部１２２に表示させる。

　尚、図５の画像Ｐ３１において、図中の楽曲リストＴＬ１１と操作表示欄Ｃ１１については、図４の画像Ｐ１１と同一であるので、その説明は省略する。

　図５のプレイリスト選択画像である画像Ｐ３１において、図４の画像Ｐ１１と異なるのは、図中の右上部の表示である。

　図５の画像Ｐ３１における右上部の表示は、選択されたプレイリストに属する楽曲の特徴を表現するために、それぞれの特徴がバルーンとして、その大きさにより表現されている。

　より詳細には、図５の画像Ｐ３１においては、バルーンＦ２１乃至Ｆ２７が表示されている。

　バルーンＦ２１には、"BPM 120～150"と表記されて、選択されたプレイリストに含まれる楽曲の特徴の１つであるBPM（Beats Per Minute）が120乃至150であることが表されている。

　バルーンＦ２２には、"EDM"と表記されて、選択されたプレイリストに含まれる楽曲の特徴の１つであるジャンルがEDM（Electronic Dance Music）であることが表されている。

　バルーンＦ２３には、"Tropical"と表記されて、選択されたプレイリストに含まれる楽曲の特徴の１つであるジャンルがトロピカル（熱帯地域における雰囲気を持つ楽曲）であることが表されている。

　バルーンＦ２４には、"DANCE"と表記されて、選択されたプレイリストに含まれる楽曲の特徴の１つであるジャンルがダンスミュージックであることが表されている。

　バルーンＦ２５には、"CLUB MUSIC"と表記されて、選択されたプレイリストに含まれる楽曲の特徴の１つであるジャンルがクラブミュージックであることが表されている。

　バルーンＦ２６には、"clap hands"と表記されて、選択されたプレイリストに含まれる楽曲の特徴の１つであるジャンルがclap hands（手拍子を入れて盛り上がる）の楽曲であることが表されている。

　バルーンＦ２７には、"Four on the floor"と表記されて、選択されたプレイリストに含まれる楽曲の特徴の１つであるジャンルがFour on the floorであることが表されている。

　そして、バルーンＦ２１が最も大きなバルーンであるので、選択されたプレイリストに含まれる楽曲の最も大きな特徴が、BPMが120乃至150であることが表されている。

　また、バルーンＦ２２は、バルーンＦ２１に次ぐ大きさであるので、選択されたプレイリストに含まれる楽曲の２番目の特徴が、ジャンルがEDMであることが表されている。

　さらに、選択されたプレイリストに含まれる楽曲は、３番目以降の特徴として、ダンスミュージック、クラブミュージック、clap hands（手拍子を入れて盛り上がる）の楽曲、およびFour on the floorを含むことが表されている。

　また、バルーンＦ２１乃至Ｆ２７の下には、選択されたプレイリストの楽曲に関連するテキストＴＸ１１が表記されており、画像Ｐ３１においては、「Electo」、「Ultra FESTIVAL」、「Up beat」、および「パリピ」が表記されている。

　画像Ｐ３１で示されるように、選択されたプレイリストに含まれる楽曲の特徴を表現する要素毎にバルーンで示され、かつ、バルーンの大きさで特徴の大きさが表現されることにより、選択されたプレイリストに含まれる楽曲の特徴を認識することが可能となる。

　これにより、選択されたプレイリストに含まれる楽曲の特徴を認識することが可能となる。

　また、自らが意図した楽曲群からなるプレイリストが検索されている場合については、検索されたプレイリストの楽曲群が、どのような特徴を備えた、どのような種別の楽曲群を構成するプレイリストであるのかを直感的に認識した上で、納得して再生することが可能となる。

　さらに、自らが意図した楽曲群からなるプレイリストが検索されていない場合については、検索された楽曲群からなるプレイリストが、どのような特徴を備えた、どのような楽曲群からなるプレイリストであるのかを直感的に認識した上で、自らが意図した楽曲群からなるプレイリストとの差異を特徴に基づいて認識することが可能となり、自らが意図した楽曲群からなるプレイリストを検索する上で必要となるさらなる要求、すなわち、フィードバックを、その差異となる特徴を備えた楽曲群からなるプレイリストとして指定することで、自らが意図した楽曲群からなるプレイリストを検索され易くすることが可能となる。

　例えば、検索結果となるプレイリストを構成する楽曲群の中に、自ら意図していたジャンルＸの楽曲が存在しないときには、フィードバックとして、自らが意図したジャンルＸを指定することで、自らが意図していた楽曲を検索され易くすることができる。

　＜楽曲選択画像＞
　次に、図６の画像Ｐ５１を参照して、図４または図５の楽曲リストＴＬ１１のうち、いずれかの楽曲が選択された状態で、再生を指示するボタンＢ１１が操作されることにより、選択された楽曲が再生されている状態の楽曲選択画像について説明する。

　例えば、画像Ｐ５１における楽曲リストＴＬ１１のうち、いずれかの楽曲が選択されて、フィードバック応答として再生が指示されると、楽曲検索エンジン１５７は、再生が指示された楽曲データと対応するメタ情報を応答生成部１５９に出力する。

　応答生成部１５９は、選択された楽曲に属する楽曲データと対応するメタ情報に基づいて、例えば、図６の画像Ｐ５１で示されるような楽曲選択画像を生成して楽曲再生部１６１に出力し、画像表示部１２２に表示させる。

　画像Ｐ５１においては、楽曲リストＴＬ１１のうち、タイトルが「ＡＡＡ１」の楽曲が選択されていることが三角状のマークにより示されている。

　また、画像Ｐ５１の右部においては、選択され、かつ、再生中の楽曲を示すジャケットＪ１１と、再生中の楽曲の特徴を説明するためのバルーンＦ３１乃至Ｆ３６が示されている。

　より具体的には、ジャケットＪ１１においては、上部に"ＡＡＡ１"と表記されて、再生が指示されて、現在再生中の楽曲のタイトルが「ＡＡＡ１」であることが表され、下部に"ＢＢＢ１"と表記されて、再生中の楽曲のアーティストが「ＢＢＢ１」であることが表されている。

　また、ジャケットＪ１１の周囲には、円形のバルーンＦ３１乃至Ｆ３６が設けられており、それぞれが、再生が指示された楽曲の特徴と、その大きさを表現している。尚、ここでいうバルーンの大きさで表現される特徴の大きさは、例えば、再生時間のうち、所定の特徴を備えた状態の再生時間の長さの割合にしてもよい。

　すなわち、例えば、再生時間の全体において、BPMが120であるという特徴を備えており、BPMが120であるという特徴を表現するバルーンの半径が半径Rとして表現される場合、トロピカルな曲調の部分の再生時間の長さが全体の半分であるときには、トロピカルな曲調であることを示す特徴を表現するバルーンの半径を半径R/2とするようにしてもよい。

　ここで、バルーンＦ３１には、"BPM 120"と表記されて、再生が指示された楽曲の特徴の１つであるBPM（Beats Per Minute）が120であることが表されている。

　また、バルーンＦ３２には、"EDM"と表記されて、再生が指示された楽曲の特徴の１つであるジャンルがEDM（Electronic Dance Music）であることが表されている。

　さらに、バルーンＦ３３には、"Tropical"と表記されて、再生が指示された楽曲の特徴の１つが熱帯地域における雰囲気を持つ楽曲であることが表されている。

　バルーンＦ３４には、"Dance"と表記されて、再生が指示された楽曲の特徴の１つがダンスミュージックであることが表されている。

　バルーンＦ３５には、"CLUB MUSIC"と表記されて、再生が指示された楽曲の特徴の１つがクラブミュージックであることが表されている。

　バルーンＦ３６には、"clap hands"と表記されて、再生が指示された楽曲の特徴の１つが手拍子を入れて盛り上がる曲であることが表されている。

　そして、バルーンＦ３３が最も大きなバルーンであるので、再生が指示された楽曲の最も大きな特徴が、トロピカルな曲調（熱帯地域における雰囲気を持つ曲調）であることが表されている。

　また、バルーンＦ３１，Ｆ３２は、バルーンＦ３３に次ぐ大きさであるので、再生が指示された楽曲の２番目の特徴が、BPMが120で、かつ、ジャンルがEDMであることが表されている。

　さらに、再生が指示された楽曲の、４番目以降の大きさの特徴が、ダンスミュージック、クラブミュージック、および、手拍子を入れて盛り上がる要素を含むことが表されている。

　画像Ｐ５１で示されるように、再生が指示された楽曲の持つ特徴と、その大きさとが提示されることで、ユーザは、再生が指示された楽曲が、検索された理由や根拠となる特徴を認識することが可能となる。

　これにより、再生が指示された楽曲が、自らが意図した楽曲である場合、検索された理由や根拠をよく理解して、納得したうえで、検索された楽曲を再生させることが可能となる。

　また、検索された楽曲が、自らが意図した楽曲ではない場合、検索された理由や根拠となる楽曲の持つ特徴と、その大きさに基づいて、自らが意図した楽曲が検索されるようなフィードバックを考えることが可能となる。

　すなわち、ユーザの意図した楽曲が、トロピカルな曲調の楽曲（熱帯地域における雰囲気を持つ楽曲）としての特徴よりも、ダンスミュージックとしての特徴を持った楽曲を望む場合については、「もっとダンサブルに」といった要求をフィードバックすることで、自らが意図した楽曲を検索され易くすることが可能となる。

　また、ユーザの意図した楽曲のBPMが120よりも速い楽曲を望む場合については、「もっとアップテンポに」といった要求をフィードバックすることで、自らが意図した楽曲を検索され易くすることが可能となる。

　結果として、検索された楽曲の理由や根拠となる特徴を認識できる情報を提示することで、ユーザが意図した楽曲が検索された場合には、検索された楽曲を納得した状態で再生することが可能になると共に、意図しない楽曲が検索された場合には、適切なフィードバックを掛けられるようにして、ユーザが意図した楽曲が、効率よく検索されるようにすることが可能となる。

　さらに、操作表示欄Ｃ１１内には、再生が指示された楽曲の出力レベルが時系列に棒グラフ状に示されている時系列画像ＬＶが表示される。

　時系列画像ＬＶ内においては、現在再生中のタイミングが矢印で示されて、楽曲の再生が進行するにしたがって、図中の右方向に移動していく。

　また、時系列画像ＬＶ内において、検索対象となる「盛り上がる曲」の根拠となる情報が示される。

　より詳細には、時刻ｔ１乃至ｔ２で示される特徴となる状態が継続する期間（以下、特徴期間とも称する）においては、「ビートが激しくなって盛り上がります」と表記されたテキスト情報ＴＸ３１が表示されており、再生中の楽曲の時刻ｔ１乃至ｔ２においては、ビートが激しくなって盛り上がる期間であることが示されている。

　また、時刻ｔ３乃至ｔ４の特徴期間においては、「女性ボーカルがキーを上げます　ここも盛り上がります」と表記されたテキスト情報ＴＸ３２が表示されており、再生中の楽曲の時刻ｔ３乃至ｔ４の特徴期間は、女性ボーカルがキーを上げて、盛り上がる期間であることが示されている。

　さらに、時刻ｔ５の特徴期間においては、手拍子を示すマークＭ１１が表記されて、時刻ｔ５において手拍子を入れることで盛り上がることが示されている。

　また、時刻ｔ６乃至ｔ７の特徴期間においては、盛り上がりがあることを示すマークＭ１２が示されている。

　尚、楽曲が再生される際には、テキスト情報ＴＸ３１，ＴＸ３２が表記されている特徴期間や、マークＭ１１，Ｍ１２が表記されている特徴期間において、発光部１２３を制御してテンポに合わせて発光させるようにしたり、振動部１２４を制御してテンポに合わせて振動させるようにしてもよい。

　また、例えば、検索発話が「カッコいい曲をかけて」であるような場合、再生中における特徴期間においては、「ここのメロディがいいでしょ？」といった応答の音声が出力されるようにしてもよい。

　さらに、検索発話が「桜の曲を探して」であるような場合、さくらという歌詞が歌われている特徴期間で歌詞を表示するようにしてもよい。

　また、検索発話が「おしゃれな曲かけて」であるような場合、特徴期間において、「ここのコード進行がおしゃれ」といった、テキスト情報ＴＸ３１，ＴＸ３２のように表示するようにしてもよい。

　さらに、検索発話が「サビが盛り上がる曲をかけて」であるような場合、特徴期間の直前のタイミングにおいて、「このあとサビですよ～、３、２、１」とサビ直前に提示するようにしてもよい。

　また、検索発話が「ノリノリの曲かけて」であるような場合、特徴期間において、ビートに合わせて、発光部１２３を光らせ、振動部１２４を振動させるようにしてもよい。

　すなわち、時系列画像ＬＶの表示により、「盛り上がる曲」として検索された楽曲が再生される際に、検索された根拠や理由となる特徴が表れるタイミングである特徴期間が時系列に提示されることになるので、楽曲が検索された理由や根拠をユーザにわかりやすく認識させることが可能となる。

　これにより、検索された楽曲が、自らが意図した楽曲である場合、検索された理由や根拠となる特徴をよく理解して、納得したうえで、検索された楽曲を再生させることが可能となる。

　また、検索された楽曲が、自らが意図した楽曲ではない場合、検索された理由や根拠となる楽曲の持つ特徴と、その特徴の大きさに基づいて、自らが意図した楽曲が検索されるようなフィードバックを考えることが可能となる。

　すなわち、ユーザの意図した楽曲がトロピカルな曲調の楽曲（熱帯地域における雰囲気を持つ楽曲）としての特徴よりも、ダンスミュージックとしての特徴を持った楽曲を要望する場合、ダンスミュージックとしての特徴を持った楽曲が検索されるようなフィードバックを掛けることで、意図した楽曲を検索され易くさせることができる。

　より具体的には、ダンスミュージックとしての特徴を持った楽曲を望む場合については、「もっとダンサブルに」といった要求をフィードバックすることで、自らが意図した楽曲を検索され易くすることが可能となる。

　結果として、検索された楽曲の理由や根拠となる特徴を認識できる情報を提示することで、意図した楽曲が検索された場合には、検索された楽曲を納得した状態で再生させることが可能になると共に、意図しない楽曲が検索された場合には、適切なフィードバックを掛けることが可能となり、ユーザが意図した楽曲を、効率よく検索されるようにすることが可能となる。

　＜キャラクタ生成処理＞
　次に、図７のフローチャートを参照して、キャラクタ生成処理について説明する。尚、この処理においては、後述する楽曲エージェント処理により雑談発話抽出部１５３により雑談発話が抽出されて、音楽雑談DB１５６に登録されていることが前提となる。

　ステップＳ１１において、応答生成部１５９のキャラクタ生成エンジン１８１は、音楽雑談DB１５６にアクセスし、ユーザのキャラクタを推定するための、音楽雑談として登録されている雑談発話を抽出する。

　ステップＳ１２において、キャラクタ生成エンジン１８１は、抽出した音楽雑談としての雑談発話に基づいて、ユーザのキャラクタを推定する。

　より詳細には、キャラクタ生成エンジン１８１は、抽出した音楽雑談としての雑談発話を解析し、例えば、よく使用するフレーズやキーワードに基づいて、各職業の専門用語などと照合し、対応する職業などをキャラクタとして推定する。

　ステップＳ１３において、キャラクタ生成エンジン１８１は、推定したキャラクタをユーザのキャラクタとして設定する。

　ステップＳ１４において、キャラクタ生成エンジン１８１は、キャラクタ生成処理の終了が指示されたか否かを判定し、終了が指示されていない場合、処理は、ステップＳ１５に進む。

　ステップＳ１５において、キャラクタ生成エンジン１８１は、音楽雑談DB１５６にアクセスし、音楽雑談DB１５６に新たな雑談発話が登録されることにより変化が生じているか否かを判定し、変化がない場合、処理は、ステップＳ１４に戻る。

　すなわち、終了が指示されず、かつ、音楽雑談DB１５６に変化がない場合、ステップＳ１４，Ｓ１５の処理が繰り返される。

　そして、ステップＳ１５において、音楽雑談DB１５６に新たな雑談発話が登録されることにより変化が生じている場合、処理は、ステップＳ１１に戻る。

　すなわち、音楽雑談DB１５６に新たな雑談発話が登録されることにより変化が生じている場合、ステップＳ１１乃至Ｓ１４の処理により、再びユーザのキャラクタが推定されて、推定されたキャラクタに設定する処理がなされる。

　従って、処理の終了が指示されるまで、ユーザの雑談発話が新たに音楽雑談DB１５６に登録される度に、ユーザのキャラクタの推定と設定が繰り返される。

　これにより、推定されるユーザのキャラクタの精度を向上させることが可能となる。

　そして、ステップＳ１４において、処理の終了が指示された場合、処理は、終了する。

　以上の処理により、音楽雑談DB１５６に登録されたユーザの雑談発話からユーザのキャラクタを推定するようにしたので、適切にユーザのキャラクタを推定することが可能となる。

　＜楽曲エージェント処理＞
　次に、図８のフローチャートを参照して、楽曲エージェント処理について説明する。

　ステップＳ３１において、音声認識処理部１５１および意味解析処理部１５２は、キーボード１０１の操作、またはマイクロフォン１０２で音声が検出されることにより、ユーザから何らかの入力（発話）があったか否かを判定する。

　ステップＳ３１において、ユーザの入力がないとみなされた場合、ステップＳ３２乃至Ｓ４４の処理がスキップされる。

　また、ステップＳ３１において、ユーザからの入力（発話）があったとみなされた場合、処理は、ステップＳ３２に進む。

　ステップＳ３２において、音声認識処理部１５１は、マイクロフォン１０２より音声が検出されることにより、音声入力、すなわち、発話による入力があったか否かを判定する。

　ステップＳ３２において、音声入力、すなわち、発話があった場合、処理は、ステップＳ３３に進む。

　ステップＳ３３において、音声認識処理部１５１は、音声認識処理を実行し、入力された発話を解析して、テキスト情報からなる認識結果を意味解析処理部１５２に出力する。

　尚、ステップＳ３２において、音声入力ではない場合、キーボード１０１が操作されることにより入力されるテキスト情報であるので、ステップＳ３２の処理はスキップされる。

　ステップＳ３４において、意味解析処理部１５２は、キーボード１０１が操作されることにより入力されたテキスト情報からなる発話、または、音声認識処理部１５１の音声認識結果であるテキスト情報からなる発話のいずれかに基づいて、発話の意味を解析し、解析結果を雑談発話抽出部１５３、検索発話抽出部１５４、およびフィードバック発話抽出部１５５に出力する。

　ステップＳ３５において、検索発話抽出部１５４は、意味解析処理部１５２より供給される発話の解析結果に基づいて、発話が検索発話であるか否かを判定する。

　ステップＳ３５において、発話が検索発話である場合、処理は、ステップＳ３６に進む。

　ステップＳ３６において、検索発話抽出部１５４は、検索発話からなるテキスト情報を楽曲検索エンジン１５７に供給する。

　そして、楽曲検索エンジン１５７は、音楽雑談DB１５６に登録されている雑談発話の情報と、供給された検索発話とに基づいて、楽曲DB１５８に登録されている楽曲を検索して、検索結果となる楽曲データと楽曲のメタ情報とを応答生成部１５９に供給し、処理は、ステップＳ４２に進む。

　すなわち、検索発話である場合については、楽曲DB１５８に登録されている楽曲のうち、音楽雑談DB１５６に登録されている雑談発話の情報と、供給された検索発話とに基づいて、検索対象となる楽曲が検索される。

　一方、ステップＳ３５において、検索発話ではないと判定された場合、処理は、ステップＳ３７に進む。

　ステップＳ３７において、フィードバック発話抽出部１５５は、意味解析処理部１５２より供給される発話の解析結果に基づいて、発話がフィードバック発話であるか否かを判定する。

　ステップＳ３７において、フィードバック発話である場合、処理は、ステップＳ３８に進む。

　ステップＳ３８において、楽曲検索エンジン１５７は、フィードバック発話に基づいて、ユーザの嗜好を学習する。

　すなわち、フィードバック発話は、検索結果において、ユーザが意図した検索結果でなかったときになされる発話や、検索結果に対して、さらに絞り込みを掛けるような発話であるので、ユーザの嗜好が現れるので、楽曲検索エンジン１５７は、フィードバック発話の内容に基づいてユーザの嗜好を学習する。

　また、楽曲検索エンジン１５７は、検索結果となる楽曲の再生の指示において、再生が指示された楽曲、再生が指示されない楽曲、および再生が指示されたが直ぐに停止が指示された楽曲等によりユーザの嗜好を学習する。

　ステップＳ３９において、楽曲検索エンジン１５７は、フィードバック発話の内容が、検索結果からプレイリストや楽曲を選択するものであるか否かを判定する。

　ステップＳ３９において、フィードバック発話の内容が、検索結果からプレイリストや楽曲を選択するものではない場合、処理は、ステップＳ４０に進む。

　ステップＳ４０において、楽曲検索エンジン１５７は、音楽雑談DB１５６に登録されている雑談発話の情報と、フィードバック発話とに基づいて、楽曲DB１５８に登録されている楽曲を検索して、検索結果となる楽曲データとメタ情報とを応答生成部１５９に供給し、処理は、ステップＳ４２に進む。

　すなわち、フィードバック発話は、検索結果において、ユーザが意図した検索結果でなかったときになされる発話や、検索結果に対して、さらに絞り込みを掛けるような発話であるので、楽曲検索エンジン１５７は、フィードバック発話に基づいて、楽曲を検索して、検索結果となる楽曲データとメタ情報とを応答生成部１５９に供給する。

　ステップＳ３９において、フィードバック発話の内容が、検索結果からプレイリストや楽曲を選択するものである場合、処理は、ステップＳ４１に進む。

　ステップＳ４１において、楽曲検索エンジン１５７は、検索結果から選択されたプレイリストに属する楽曲群の楽曲データおよび楽曲のメタ情報、または、選択された楽曲の楽曲データおよび楽曲のメタ情報を応答生成部１５９に供給する。

　さらに、ステップＳ３７において、フィードバック発話ではないとみなされた場合、処理は、ステップＳ４２に進む。

　ステップＳ４２において、雑談発話抽出部１５３は、意味解析処理部１５２より供給される解析結果から、発話が、検索発話でも、フィードバック発話でもない場合については、雑談発話とみなし、発話を音楽雑談DB１５６に登録すると共に、応答生成部１５９に出力する。

　ステップＳ４３において、応答生成部１５９は、応答生成処理を実行し、楽曲検索エンジン１５７より供給される検索結果、検索結果からプレイリストや楽曲の選択結果、再生の係る指示、および、雑談発話のそれぞれに対する応答を生成する。

　尚、応答生成処理については、図９のフローチャートを参照して、詳細を後述する。

　ステップＳ４４において、応答生成部１５９は、生成した応答に対して、キャラクタ生成処理により設定されているユーザのキャラクタを付加して変換する。

　ステップＳ４５において、応答生成部１５９は、音声合成部１６０、および楽曲再生部１６１に応答結果を出力して、音声出力部１２１より音声として出力させると共に、検索結果画像、プレイリスト画像、および楽曲選択画像として画像表示部１２２に表示させる。

　この際、必要に応じて、楽曲再生部１６１は、楽曲を再生させている場合については、楽曲の特徴が表れるタイミングにおいて、発光部１２３を制御して、楽曲のテンポに合わせて発光させたり、振動部１２４を制御して、楽曲のテンポに合わせて振動させるようにしてもよい。

　ステップＳ４６において、制御部３１は、処理の終了が指示されたか否かを判定し、終了が指示されていない場合、処理は、ステップＳ３１に戻る。すなわち、終了が指示されるまで、ステップＳ３１乃至Ｓ４６の処理が繰り返される。

　そして、ステップＳ４６において、処理の終了が指示されると、処理が終了する。

　以上の処理により、キーボード１０１の操作や、マイクロフォン１０２からの音声入力によるユーザが検索して欲しい楽曲を指定する検索発話により、楽曲が検索されて、提示されると共に、楽曲を再生させることが可能となる。

　また、ユーザが意図した楽曲が検索されないときや、さらなる絞り込みを掛けたいような場合には、フィードバック発話がなされることにより、ユーザの意図した楽曲を検索され易くすることが可能となる。

　さらに、フィードバック発話である場合、楽曲検索エンジン１５７は、フィードバック発話に基づいて、ユーザの嗜好を学習するので、フィードバックを受け付ける度に学習が繰り返されることにより、楽曲の検索精度を向上させることが可能となる。

　また、検索結果の提示に際して、ユーザのキャラクタが付加されて提示されることにより、ユーザからのフィードバックをより多く取得することが可能となるので、より多くのユーザからのフィードバックにより楽曲を検索することで、楽曲の検索精度を向上させることが可能となる。

　結果として、いずれにおいても、ユーザの意図した楽曲の検索精度を向上させ、より効率よくユーザの意図した楽曲を検索することが可能となる。

　＜応答生成処理＞
　次に、図９のフローチャートを参照して、応答生成処理について説明する。

　ステップＳ８１において、応答生成部１５９は、生成すべき応答が、楽曲検索エンジン１５７より供給される、検索発話やフィードバック発話に基づいた検索結果に対応したものであるか否かを判定する。

　ステップＳ８１において、生成すべき応答が、楽曲検索エンジン１５７より供給される、検索発話やフィードバック発話に基づいた検索結果に対応したものである場合、処理は、ステップＳ８２に進む。

　ステップＳ８２において、応答生成部１５９は、楽曲検索エンジン１５７より供給される、検索発話やフィードバック発話に基づいた検索結果に基づいて、例えば、図４を参照して説明した検索結果画像を生成する。

　ステップＳ８１において、生成すべき応答が、楽曲検索エンジン１５７より供給される、検索発話やフィードバック発話に基づいた検索結果に対応したものではない場合、処理は、ステップＳ８３に進む。

　ステップＳ８３において、応答生成部１５９は、生成すべき応答が、フィードバック発話であって、かつ、検索結果画像におけるアイコン化されたプレイリストを選択する発話に対するものであるか否かを判定する。

　ステップＳ８３において、生成すべき応答が、フィードバック発話であって、かつ、検索結果画像におけるアイコン化されたプレイリストを選択する発話に対するものである場合、処理は、ステップＳ８４に進む。

　ステップＳ８４において、応答生成部１５９は、検索結果画像において選択されたアイコンに対応するプレイリストに基づいて、例えば、図５を参照して説明したプレイリスト選択画像を生成する。

　ステップＳ８３において、生成すべき応答が、フィードバック発話であって、かつ、プレイリストを選択する発話に対するものではない場合、処理は、ステップＳ８５に進む。

　ステップＳ８５において、応答生成部１５９は、生成すべき応答が、フィードバック発話であって、かつ、楽曲リストＴＬ１１におけるいずれかの楽曲を選択する発話に対するものであるか否かを判定する。

　ステップＳ８５において、生成すべき応答が、フィードバック発話であって、かつ、楽曲リストＴＬ１１におけるいずれかの楽曲を選択する発話に対するものである場合、処理は、ステップＳ８６に進む。

　ステップＳ８６において、応答生成部１５９は、楽曲リストＴＬ１１において選択された楽曲の情報に基づいて、例えば、図６を参照して説明した楽曲選択画像を生成する。

　ステップＳ８５において、生成すべき応答が、フィードバック発話であって、かつ、楽曲を選択する発話に対するものではない場合、処理は、ステップＳ８７に進む。

　ステップＳ８７において、応答生成部１５９は、生成すべき応答が、楽曲の再生に係る指示であるか否かを判定する。

　ステップＳ８７において、生成すべき応答が、楽曲の再生に係る指示である場合、処理は、ステップＳ８８に進む。

　ステップＳ８８において、応答生成部１５９は、例えば、図４乃至図６を参照して説明した操作表示欄Ｃ１１内のボタンＢ１１乃至Ｂ１３に対応する操作を実現する。

　ステップＳ８７において、生成すべき応答が、楽曲の再生に係る指示ではない場合、処理は、ステップＳ８９に進む。

　ステップＳ８９において、応答生成部１５９は、発話を雑談発話であるものとみなし、雑談発話の意味に応じた応答を生成する。

　以上の処理により、発話内容に応じた応答が生成されることにより、検索結果画像、プレイリスト選択画像、および楽曲選択画像が表示されることにより、検索された理由や根拠ともなる楽曲の特徴が提示される。

　これにより、ユーザは、検索された理由や根拠ともなる楽曲の特徴を認識することが可能となり、ユーザ自らが意図した楽曲が検索されているのか否かを認識することが可能となる。

　また、検索結果の全楽曲、プレイリスト毎、および楽曲毎のそれぞれの特徴を認識することが可能となるので、ユーザ自らが意図した楽曲が、検索結果の全楽曲、プレイリスト単位または楽曲単位で適切に検索されているのか否かを認識することが可能となる。

　さらに、楽曲選択画像が表示されることにより、楽曲におけるどのタイミングで、どのような特徴を持った楽曲が検索されたのかを認識することが可能となり、どのような理由や根拠で検索されているのかをユーザが認識することが可能となる。

　これにより、ユーザが意図していない楽曲が検索されているようなときには、ユーザが、自らが意図している楽曲が検索されるように、特徴を絞り込んだり、新たな特徴を指定するようなフィードバックを掛けることが可能となる。

　結果として、楽曲の検索に際して、ユーザの意図が適切に反映された楽曲を効率よく検索させるようにすることが可能となる。

　＜＜３．ソフトウェアにより実行させる例＞＞
　ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどに、記録媒体からインストールされる。

　図１０は、汎用のコンピュータの構成例を示している。このパーソナルコンピュータは、CPU(Central Processing Unit)１００１を内蔵している。CPU１００１にはバス１００４を介して、入出力インタフェース１００５が接続されている。バス１００４には、ROM(Read Only Memory)１００２およびRAM(Random Access Memory)１００３が接続されている。

　入出力インタフェース１００５には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部１００６、処理操作画面や処理結果の画像を表示デバイスに出力する出力部１００７、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部１００８、LAN（Local Area Network）アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部１００９が接続されている。また、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ(Mini Disc)を含む）、もしくは半導体メモリなどのリムーバブル記憶媒体１０１１に対してデータを読み書きするドライブ１０１０が接続されている。

　CPU１００１は、ROM１００２に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブル記憶媒体１０１１ら読み出されて記憶部１００８にインストールされ、記憶部１００８からRAM１００３にロードされたプログラムに従って各種の処理を実行する。RAM１００３にはまた、CPU１００１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　以上のように構成されるコンピュータでは、CPU１００１が、例えば、記憶部１００８に記憶されているプログラムを、入出力インタフェース１００５及びバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU１００１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記憶媒体１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記憶媒体１０１１をドライブ１０１０に装着することにより、入出力インタフェース１００５を介して、記憶部１００８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１００９で受信し、記憶部１００８にインストールすることができる。その他、プログラムは、ROM１００２や記憶部１００８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　尚、図１０におけるCPU１００１が、図２の制御部３１の機能を実現させる。

　また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本開示は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　尚、本開示は、以下のような構成も取ることができる。

＜１＞　ユーザの検索要求に基づいて、楽曲を検索する検索部と、
　前記検索部により検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果を、前記検索要求に対する応答として生成する応答生成部と
　を含む情報処理装置。
＜２＞　前記検索部は、前記検索要求に係る発話である検索発話に基づいて、前記楽曲を検索する
　＜１＞に記載の情報処理装置。
＜３＞　前記検索部は、前記検索発話に基づいた前記検索結果に対してなされる検索要求に係る発話であるフィードバック発話に基づいて、前記楽曲を検索する
　＜２＞に記載の情報処理装置。
＜４＞　前記検索部は、前記フィードバック発話に基づいて、前記楽曲の検索に係る前記ユーザの嗜好を学習する
　＜３＞に記載の情報処理装置。
＜５＞　前記応答生成部は、
　　前記検索発話およびフィードバック発話を含む、雑談からなる発話である雑談発話に基づいて、ユーザのキャラクタを推定するキャラクタ推定部をさらに含み、
　　前記キャラクタ推定部により推定された前記キャラクタに応じて、生成した前記応答を変換する
　＜３＞に記載の情報処理装置。
＜６＞　前記検索部は、検索された前記楽曲の楽曲データと、前記楽曲のメタ情報とを前記検索結果として出力し、
　前記応答生成部は、前記検索結果に含まれる、前記楽曲データと、前記メタ情報に基づいて、前記検索結果となる楽曲の特徴を表現する情報を含む画像である検索結果画像を、前記検索要求に対する応答として生成する
　＜１＞乃至＜５＞のいずれかに記載の情報処理装置。
＜７＞　前記応答生成部は、前記検索結果となる楽曲の特徴をプレイリスト単位のアイコンで表現する前記検索結果画像を、前記検索要求に対する応答として生成する
　＜６＞に記載の情報処理装置。
＜８＞　前記応答生成部は、前記検索結果となる楽曲の特徴を、対応するバルーンの大きさにより表現する前記検索結果画像を、前記検索要求に対する応答として生成する
　＜７＞に記載の情報処理装置。
＜９＞　前記応答生成部は、前記検索結果となる楽曲の特徴を、検索された全楽曲数に対する、前記特徴を備える楽曲数の割合で規定される大きさのバルーンにより表現する検索結果画像を、前記検索要求に対する応答として生成する
　＜８＞に記載の情報処理装置。
＜１０＞　前記応答生成部は、前記アイコンのうち、選択されたアイコンに対応するプレイリストに属する楽曲の特徴を表現するプレイリスト選択画像を、前記検索要求に対する応答として生成する
　＜８＞に記載の情報処理装置。
＜１１＞　前記応答生成部は、前記検索結果となる楽曲の特徴を、対応するバルーンの大きさにより表現する画像である前記プレイリスト選択画像を、前記検索要求に対する応答として生成する
　＜１０＞に記載の情報処理装置。
＜１２＞　前記応答生成部は、
　　前記検索結果に含まれる、前記楽曲データと、前記メタ情報に基づいて、前記検索結果となる楽曲のリストである楽曲リストをさらに生成し、
　　前記楽曲リストのいずれかの楽曲が選択されて、再生が指示されるとき、前記楽曲データと、前記メタ情報に基づいて、再生が指示された楽曲の楽曲データの音声を再生させると共に、前記再生が指示された楽曲の特徴を表現する画像である楽曲選択画像を、前記検索要求に対する応答として生成する
　＜６＞に記載の情報処理装置。
＜１３＞　前記応答生成部は、前記メタ情報に基づいて、前記再生が指示された楽曲の特徴を、対応するバルーンの大きさにより表現する楽曲選択画像を、前記検索要求に対する応答として生成する
　＜１２＞に記載の情報処理装置。
＜１４＞　前記応答生成部は、前記楽曲データと、前記メタ情報に基づいて、前記再生が指示された楽曲の特徴を、前記楽曲が再生されるとき、時系列に、検索された根拠となる情報を表示する時系列画像を含む前記楽曲選択画像を、前記検索要求に対する応答として生成する
　＜１２＞に記載の情報処理装置。
＜１５＞　前記時系列画像においては、検索された根拠となる情報が、テキスト、またはマークにより表示される
　＜１４＞に記載の情報処理装置。
＜１６＞　前記応答生成部は、前記楽曲データと、前記メタ情報に基づいて、前記再生が指示された楽曲の特徴を、前記楽曲が再生されるとき、時系列に、発光や振動により表現することで、前記検索要求に対する応答として生成する
　＜１２＞に記載の情報処理装置。
＜１７＞　前記メタ情報は、前記楽曲のアーティスト、楽曲名、歌詞、レーベル、発売時期、ジャンル、テンポ、コード進行、利用楽器、および映画主題歌曲であるか否かを示す情報のうち、少なくともいずれかを含む
　＜６＞に記載の情報処理装置。
＜１８＞　ユーザの検索要求に基づいて、楽曲を検索し、
　検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果を、前記検索要求に対する応答として生成する
　ステップを含む情報処理方法。
＜１９＞　ユーザの検索要求に基づいて、楽曲を検索する検索部と、
　前記検索部により検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果を、前記検索要求に対する応答として生成する応答生成部と
　してコンピュータを機能させるプログラム。

　１１　情報処理装置，　３１　制御部，　３２　入力部，　３３　出力部，　５１　楽曲エージェント処理部，　１０１　キーボード，　１０２　マイクロフォン，　１２１　音声出力部，　１２２　画像表示部，　１２３　発光部，　１２４　振動部，　１５１　音声認識処理部，　１５２　意味解析処理部，　１５３　雑談発話抽出部，　１５４　検索発話抽出部，　１５５　フィードバック発話抽出部，　１５６　音楽雑談DB，　１５７　楽曲検索エンジン，　１５８　楽曲DB，　１５９　応答生成部，　１６０　音声合成部，　１６１　楽曲再生部，　１８１　キャラクタ生成エンジン

Claims

　ユーザの検索要求に基づいて、楽曲を検索する検索部と、
　前記検索部により検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果を、前記検索要求に対する応答として生成する応答生成部と
　を含む情報処理装置。
　前記検索部は、前記検索要求に係る発話である検索発話に基づいて、前記楽曲を検索する
　請求項１に記載の情報処理装置。
　前記検索部は、前記検索発話に基づいた前記検索結果に対してなされる検索要求に係る発話であるフィードバック発話に基づいて、前記楽曲を検索する
　請求項２に記載の情報処理装置。
　前記検索部は、前記フィードバック発話に基づいて、前記楽曲の検索に係る前記ユーザの嗜好を学習する
　請求項３に記載の情報処理装置。
　前記応答生成部は、
　　前記検索発話およびフィードバック発話を含む、雑談からなる発話である雑談発話に基づいて、ユーザのキャラクタを推定するキャラクタ推定部をさらに含み、
　　前記キャラクタ推定部により推定された前記キャラクタに応じて、生成した前記応答を変換する
　請求項３に記載の情報処理装置。
　前記検索部は、検索された前記楽曲の楽曲データと、前記楽曲のメタ情報とを前記検索結果として出力し、
　前記応答生成部は、前記検索結果に含まれる、前記楽曲データと、前記メタ情報に基づいて、前記検索結果となる楽曲の特徴を表現する情報を含む画像である検索結果画像を、前記検索要求に対する応答として生成する
　請求項１に記載の情報処理装置。
　前記応答生成部は、前記検索結果となる楽曲の特徴をプレイリスト単位のアイコンで表現する前記検索結果画像を、前記検索要求に対する応答として生成する
　請求項６に記載の情報処理装置。
　前記応答生成部は、前記検索結果となる楽曲の特徴を、対応するバルーンの大きさにより表現する前記検索結果画像を、前記検索要求に対する応答として生成する
　請求項７に記載の情報処理装置。
　前記応答生成部は、前記検索結果となる楽曲の特徴を、検索された全楽曲数に対する、前記特徴を備える楽曲数の割合で規定される大きさのバルーンにより表現する検索結果画像を、前記検索要求に対する応答として生成する
　請求項８に記載の情報処理装置。
　前記応答生成部は、前記アイコンのうち、選択されたアイコンに対応するプレイリストに属する楽曲の特徴を表現するプレイリスト選択画像を、前記検索要求に対する応答として生成する
　請求項８に記載の情報処理装置。
　前記応答生成部は、前記検索結果となる楽曲の特徴を、対応するバルーンの大きさにより表現する画像である前記プレイリスト選択画像を、前記検索要求に対する応答として生成する
　請求項１０に記載の情報処理装置。
　前記応答生成部は、
　　前記検索結果に含まれる、前記楽曲データと、前記メタ情報に基づいて、前記検索結果となる楽曲のリストである楽曲リストをさらに生成し、
　　前記楽曲リストのいずれかの楽曲が選択されて、再生が指示されるとき、前記楽曲データと、前記メタ情報に基づいて、再生が指示された楽曲の楽曲データの音声を再生させると共に、前記再生が指示された楽曲の特徴を表現する画像である楽曲選択画像を、前記検索要求に対する応答として生成する
　請求項６に記載の情報処理装置。
　前記応答生成部は、前記メタ情報に基づいて、前記再生が指示された楽曲の特徴を、対応するバルーンの大きさにより表現する楽曲選択画像を、前記検索要求に対する応答として生成する
　請求項１２に記載の情報処理装置。
　前記応答生成部は、前記楽曲データと、前記メタ情報に基づいて、前記再生が指示された楽曲の特徴を、前記楽曲が再生されるとき、時系列に、検索された根拠となる情報を表示する時系列画像を含む前記楽曲選択画像を、前記検索要求に対する応答として生成する
　請求項１２に記載の情報処理装置。
　前記時系列画像においては、検索された根拠となる情報が、テキスト、またはマークにより表示される
　請求項１４に記載の情報処理装置。
　前記応答生成部は、前記楽曲データと、前記メタ情報に基づいて、前記再生が指示された楽曲の特徴を、前記楽曲が再生されるとき、時系列に、発光や振動により表現することで、前記検索要求に対する応答として生成する
　請求項１２に記載の情報処理装置。
　前記メタ情報は、前記楽曲のアーティスト、楽曲名、歌詞、レーベル、発売時期、ジャンル、テンポ、コード進行、利用楽器、および映画主題歌曲であるか否かを示す情報のうち、少なくともいずれかを含む
　請求項６に記載の情報処理装置。
　ユーザの検索要求に基づいて、楽曲を検索し、
　検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果を、前記検索要求に対する応答として生成する
　ステップを含む情報処理方法。
　ユーザの検索要求に基づいて、楽曲を検索する検索部と、
　前記検索部により検索された楽曲の、前記検索要求に応じた特徴を表現する情報を含む検索結果を、前記検索要求に対する応答として生成する応答生成部と
　してコンピュータを機能させるプログラム。