WO2020196100A1

WO2020196100A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2020196100A1
Application number: PCT/JP2020/011743
Authority: WO
Inventors: 宮嵜　充弘; 彰吾木村
Original assignee: ソニー株式会社
Priority date: 2019-03-28
Filing date: 2020-03-17
Publication date: 2020-10-01
Also published as: JP2020161076A; US20220188363A1

Abstract

この情報処理装置は、ユーザとの音声インタラクションを通じて取得した条件に基づき検索された第１の情報またはユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、検索のための条件に関する質問を生成してユーザに提示する第２の処理とを、条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える推薦部２６０を有する。

Description

情報処理装置、情報処理方法及びプログラム

　本技術は、ユーザにより指定された条件に基づいてコンテンツの検索およびユーザの嗜好に基づいてコンテンツを選択する情報処理装置、情報処理方法及びプログラムに関する。

　近年、ウェブ上に存在するショップ、レストラン、イベント、行楽スポットなどの様々な情報に関するコンテンツのなかから、ユーザにより指定された条件に合致するコンテンツの情報を検索して応答する音声対話型のアシスタントサービスが知られている。

　しかし、適切な条件がユーザより与えられる場合には問題ないが、条件の表現のしかたやその選択によっては、ユーザが希望する通りの検索結果が得られるとは限らない。そこで、特許文献１には、音声認識結果に応じて地点データベースを検索する際に、候補件数が所定値より大きい場合は候補を絞り込むための条件を、Ｗｈａｔ型の質問を通してユーザに出し、この質問に対するユーザの回答から条件を抽出して候補の絞り込みを行う技術が開示される。

特開２００６－１７８８９８号公報

　しかしながら、ユーザから与えられる条件に基づく情報検索には、未だ不十分な点が多々あり、結果的にユーザが希望する通りの検索結果が得られずに、ユーザに大きな負担を強いる場面もあった。

　本技術は、音声インラクションによる情報検索を利用するユーザの利便性の向上、並びに情報検索精度の向上を図ることのできる情報処理装置、情報処理方法及びプログラムを提供することを目的とするものである。

　上記の課題を解決するために、本技術に係る一形態の情報処理装置は、ユーザとの音声インタラクションを通じて取得した条件に基づき検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部を具備する。

　本技術に係る一形態の情報処理装置によれば、条件希少度に基づいて第１の処理と第２の処理とが適時切り替えられることによって、条件希少度が低いつまり情報検索結果の絞り込みが不十分な場合に、検索のための条件に関する質問を生成してユーザに提示することによってユーザに新たな条件の追加を明示的に促すことができる。

　前記第２の処理は選択肢形式の質問を生成することとしてよい。
　これにより、ユーザは正しい表現による条件を速やかに応答することができる。この結果、情報検索の速度および精度を共に向上させることができる。

　前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第１の処理と前記第２の処理とを切り替えるようにしてもよい。
　すなわち、インタラクション進捗度が高い場合に選択肢形式の質問をユーザに提示することによって、正しい表現による条件に基づく情報検索が可能となり、ユーザの負担減に加えて、情報検索の速度向上と精度向上を期待できる。

　前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第１の処理と前記第２の処理とを切り替えるものであってよい。
　すなわち、ユーザ反応明確度が低い場合には、選択肢形式の質問をユーザに提示することによって、不明確な条件による情報検索を回避でき、情報検索の効率向上を図ることができる。

　前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める。
　ユーザの顔の向きが正面を向いていない場合や、発話内容が不明確な場合にはユーザ反応明確度が低いことを判定し、検索のための条件に関する質問を生成してユーザに提示する第２の処理を実行することによって、不明確な条件による情報検索を回避できる。

　前記第１の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第１の情報および前記第２の情報のなかから選択するようにしてもよい。
　例えば、ユーザ反応明確度が低い場合には、音声インタラクションでユーザが指定した条件が妥当性を欠く可能性が高いので、この場合にはユーザの嗜好に応じた第２の情報をユーザに提示することによって、ユーザのまったく望まない情報がユーザに提示されることを回避できる。
　また、インタラクション進捗度が高い場合も、ユーザの嗜好に応じた第２の情報をユーザに提示することによって、ユーザの望まない情報ばからがユーザに提示されることを回避できる。

　前記制御部は、質問の種別を分類する観点が異なる複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択するものであってよい。

　前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択するものであってもよい。

　前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択してもよい。

　前記制御部は、前記選択肢形式の質問における選択肢内容を日時条件に基づいて選択してもよい。

　また、本技術に係る他の形態の情報処理方法は、制御部が、ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替えることを特徴とする。

　さらに、本技術に係る他の形態のプログラムは、ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部としてコンピュータを動作させるプログラムである。

　以上のように、本技術によれば、ユーザにより指定された条件に基づくコンテンツの検索およびユーザの嗜好に基づくコンテンツの選択における様々な課題を解決することができる。

ユーザから与えられた条件に対してサービスによって生成された情報検索・推薦結果のページの例を示す図である。本実施形態に係る情報処理装置を含むシステムの構成例を示すブロック図である。本実施形態に係る情報処理端末１０の機能構成例を示すブロック図である。本実施形態に係る情報処理サーバ２０の機能構成例を示すブロック図である。本実施形態に係る提示制御部２３０の機能構成例を示すブロック図である。メタデータの構造を示す図である。同じくメタデータの構造を示す図である。ｂｌｏａｄｃａｔｅｇｏｒｙの例を示す図である。ｓｔｙｌｅｃａｔｅｇｏｒｙの例を示す図ある。ｎｕｄｇｅｃａｔｅｇｏｒｙの例を示す図である。ｓｅｒｖｉｃｅｃａｔｅｇｏｒｙの例を示す図である。ユーザ履歴であるユーザ反応（ｆｅｅｄｂａｃｋ）のデータ構造の一例を示す図である。本実施形態に係る情報処理サーバ２０によるメタデータ解析から推薦結果の決定までの処理の流れを示すフローチャートである。本実施形態に係る音声インタラクションによるコンテンツ検索の全体的な流れを示すフローチャートである。本技術に係る質問モードの処理のフローチャートである。カテゴリタイプ（質問種別）を決定するためのルールの一例を示す図である。質問種別グループのルーレット選択方法を説明する図である。質問選択肢数を決定するルールの一例を示す図である。ｌｉｓｔＳｉｚｅ＝３、２、１、０の各ルーレット選択パターン間の回答数（ｎ）の値に対する選択確率分布を示すグラフである。質問選択肢内容の決定ルールを示す図である。質問文言を決定するルールを示す図である。質問ＩＤ毎の質問文言テンプレート表の例を示す図である。質問選択肢内容の決定に用いられる旬カテゴリ表の例を占め図である。提案モードの処理のフローチャートである。本技術に係る一実施形態に係る情報処理端末１０および情報処理サーバ２０のハードウェア構成例を示すブロック図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。
＜１．第１の実施形態＞
　［１－１．概要の説明］
　まず、本技術の一実施形態の概要について説明する。

　図１は、ユーザから与えられた"横浜駅近くの焼肉レストラン"という条件に対してサービスによって生成された情報検索・推薦結果のページの例を示す図である。この情報検索・推薦結果のページには、上記の条件に合致した３件のコンテンツ（焼肉レストラン）の情報１、２、３が存在する。コンテンツの情報１、２、３は、スポット（焼肉レストラン）毎の例えば店名、住所、電話番号、写真、お薦めコメント、ホームページのＵＲＬなどを含む。

　しかし、明確な条件がユーザより与えられる場合には問題ないが、ユーザによっては、不明確な表現の条件が指定されたり、検索結果を十分絞り込むには不向きな条件が指定される場合があり、ユーザ満足度の高い検索結果が得られない場合があり、結果的に何度も条件の指定をやり直さねばならないことがあった。

　そこで本技術に係る第１の実施形態の情報処理装置は、ユーザが指定した条件に対して情報検索結果を十分に絞り込めない場合、例えば「○○、××、△△のどれがよいですか？」といった選択肢形式の質問をユーザに提示することによって、ユーザに明確な条件の指定を促す推薦部２６０（図５）を有する。

　検索結果の絞り込みが十分かどうかを評価する指標として、本技術では「条件希少度（ｒａｒｉｔｙ）」が用いられる。条件希少度（ｒａｒｉｔｙ）は、条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である。条件希少度（ｒａｒｉｔｙ）は、例えば、存在する全体アイテムの数やシステムが初期条件に基づく検索によってヒットしたアイテム数などを"ｔｏｔａｌ"、ユーザが指定した条件に基づく検索によってヒットしたアイテム数を"ｈｉｔ"として、ｒａｒｉｔｙ＝１－ｈｉｔ／ｔｏｔａｌなどとして定義される。この条件希少度（ｒａｒｉｔｙ）の値が閾値以上であるとき検索結果の絞り込みが十分であると判定され、条件希少度（ｒａｒｉｔｙ）の値が閾値未満のとき検索結果の絞り込みが不十分であると判定される。

　本技術に係る第１の実施形態の情報処理装置は、音声インタラクションにおいて２つのモードを有する。その一つは、ユーザとの音声インタラクションを通じて取得した条件に応じた第１の情報またはユーザの嗜好に応じた第２の情報の少なくとも一方を提示する「提案モード」であり、もう一つは、検索のための条件に関する質問を生成してユーザに提示する「質問モード」である。

　推薦部２６０は、これら提案モードと質問モードを上記の条件希少度に基づいて切り替える。より具体的には、推薦部２６０は条件希少度が閾値以上であるとき提案モードに切り替える。あるいは、条件希少度が閾値未満であっても、インタラクション進捗度またはユーザ反応明確度のいずれか一方がそれぞれの閾値以上である場合にも提案モードに切り替えるようにしてもよい。また、推薦部２６０は、条件希少度が閾値未満であるとき質問モードに切り替えてよい。あるいは、推薦部２６０は、条件希少度が閾値以上であっても音声インタラクション進捗度およびユーザ反応明確度がそれぞれの閾値未満であるならば質問モードに切り替えるようにしてもよい。

　これにより、本技術に係る第１の実施形態の情報処理装置は、ユーザ満足度の高い情報検索・推薦結果をユーザに提供することができる。

　以上、本実施形態の概要について説明した。以下、本実施形態に係る情報処理装置についてより詳細に説明する。

　［１－２．システム構成例］
　図２は、本実施形態に係る情報処理装置を含むシステムの構成例を示すブロック図である。
　同図に示すように、本実施形態に係るシステムは、情報処理端末１０および情報処理サーバ２０を含む。情報処理端末１０および情報処理サーバ２０は、互いに通信が行えるようにネットワーク３０を介して接続される。

　情報処理端末１０は、ユーザとの音声インタラクションを通じて、情報処理サーバ２０により供給された情報検索・推薦結果の提示、情報処理サーバ２０により供給された質問の提示、およびこの質問に対するユーザからの回答を情報処理サーバ２０に送信することが可能な装置である。また、情報処理端末１０は、ユーザや周辺環境の状況を検出するための各種検出器を備え、ユーザ状況およびユーザ反応に関する各種の検出データを情報処理サーバ２０にネットワーク３０を介して送信することが可能である。

　情報処理サーバ２０は、情報処理端末１０のユーザから与えられた条件やユーザの嗜好情報に基づいて情報の検索、推薦、条件に関するユーザへの質問の生成などを行う装置である。なお、本実施形態において、特許請求の範囲の情報処理装置はこの「情報処理サーバ２０」にあたる。

　ネットワーク３０は、情報処理端末１０と情報処理サーバ２０とを接続する網である。ネットワーク３０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ－Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ－Ａｒｅａ　Ｎｅｔｗｏｒｋ）などであってよい。また、ネットワーク３０は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網であってよく、Ｗｉ－Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。

　［１－３．情報処理端末１０の構成例］
　次に、本実施形態に係る情報処理端末１０の機能の詳細を説明する。
　図３は、本実施形態に係る情報処理端末１０の機能の構成例を示すブロック図である。同図に示すように、情報処理端末１０は、表示部１１０、音声出力部１２０、音声入力部１３０、撮像部１４０、センサ部１５０、制御部１６０、およびサーバ通信部１７０を備える。

　表示部１１０は、画像やテキストなどの視覚情報を出力する機能を有する。表示部１１０は、例えば、情報処理サーバ２０による制御に基づいて、アイテムの検索結果や推薦結果、質問に関するテキストや画像を表示する。

　表示部１１０は、視覚情報を提示する表示デバイスなどを備える。表示デバイスには、例えば、液晶ディスプレイ（ＬＣＤ：ＬｉｑｕｉｄＣｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）装置、ＯＬＥＤ（Ｏｒｇａｎｉｃ　Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）装置、タッチパネルなどが挙げられる。また、本実施形態に係る表示部１１０は、プロジェクション機能により視覚情報を出力してもよい。

　音声出力部１２０は、音声インタラクションのための音声を出力する。音声出力部１２０は、スピーカやアンプなどの音声出力装置を備える。

　音声入力部１３０は、音声インタラクションのためのユーザの発話や情報処理端末１０の周囲の音などを収集する。音声入力部１３０は、音情報を収集するためのマイクロフォンを備える。

　撮像部１４０は、ユーザや情報処理端末１０の周囲環境を撮像して、静止画あるいは動画を生成する機能を有する。撮像部１４０は、画像を撮像するＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）イメージセンサ、ＣＣＤ（Ｃｈａｒｇｅｄ-ＣｏｕｐｌｅｄＤｅｖｉｃｅｓ）イメージセンサなどの撮像素子を含む。

　センサ部１５０は、ユーザの存在の有無、顔の向き、表情などのユーザ状況や情報処理端末１０の周囲環境を検出する機能を有する。センサ部１５０は、例えば、赤外線センサを含む光センサ、加速度センサ、ジャイロセンサ、地磁気センサ、熱センサ、振動センサ、ＧＮＳＳ（Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）信号受信装置などを備える。

　制御部１６０は、情報処理端末１０が備える各ブロックの制御、表示部１１０に表示させる表示信号の生成、音声出力部１２０を駆動するための音声信号の生成、音声入力部１３０によって収集された音声のデータ化、撮像部１４０によって得られた画像のデータ化、センサ部１５０の検出信号のデータ化などの演算処理を行う。制御部１６０は、データ化された音声、映像、センサ情報を通信の高速化のために圧縮符号化する機能を有するものであってもよい。

　サーバ通信部１７０は、ネットワーク３０を介して情報処理サーバ２０との間で情報通信を行う機能を有する。

　なお、情報処理端末１０は、例えば、音声対話型エージェント端末、あるいは音声対話型エージェント機能を有するパーソナルコンピュータ、同じく音声対話型エージェント機能を有する携帯電話、スマートホン、タブレット端末、ウエラブル端末、各種の家電機器、据え置き型または自律移動型の専用装置であってもよい。

　以上、本実施形態に係る情報処理端末１０の機能構成例について説明した。なお、図３を用いて説明した情報処理端末１０の機能構成はあくまで一例であり、上記の構成に限定されない。例えば、情報処理端末１０は、図３に示す構成のすべてを必ずしも備えなくてもよい。また、情報処理端末１０の制御部１６０は、後述する情報処理サーバ２０の提示制御部２３０と同等の機能を有するものであってもよい。この場合には情報処理端末１０が本技術に係る特許請求の範囲における「情報処理装置」にあたる。

　［１－４．情報処理サーバ２０の構成例］
　次に、本実施形態に係る情報処理サーバ２０の機能構成例について詳細に説明する。
　図４は、本実施形態に係る情報処理サーバ２０の機能構成例を示すブロック図である。同図に示すように、本実施形態に係る情報処理サーバ２０は、端末通信部２１０、記憶部２２０、および提示制御部２３０を備える。

　端末通信部２１０は、ネットワーク３０を介して情報処理端末１０との情報通信を行う機能を有する。

　記憶部２２０は、提示制御部２３０の処理に用いられるプログラムや演算パラメータ等を記憶するＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、および適宜変化するパラメータ等のデータを一時記憶するＲＡＭ（Ｒａｎｄｏｍ－Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などを含む。

　提示制御部２３０は、情報処理端末１０のユーザに対する情報検索・推薦結果の生成とその提示、さらには情報検索のための条件に関する質問の生成およびその提示を制御する。また、提示制御部２３０は、情報処理端末１０から取得した各種の検出データに基づきユーザ状況およびユーザ反応の解析、これらの解析結果からのインタラクション進捗度およびユーザ反応明確度の算出、さらには条件希少度の算出、そして条件希少度、インタラクション進捗度およびユーザ反応明確度に基づいて提案モードと質問モードとの切り替えの制御を行う。

　なお、本明細書において検索・推薦対象の情報は、ウェブページなどを通してその存在などが公開された一つ一つのショップ、レストラン、サービス、イベント、行楽スポットなどを指す。例えば、レストランの場合、"和食○○亭横浜店"、"横浜××中華"、"洋食△△横浜店"といった店舗などが、本システムによる検索・推薦対象である。

　［１－５．提示制御部２３０の構成例］
　次に、情報処理サーバ２０における提示制御部２３０の構成の詳細を説明する。
　図５は、本実施形態に係る提示制御部２３０の機能構成例を示すブロック図である。同図に示すように、提示制御部２３０は、情報収集部２４０、情報解析部２５０、推薦部２６０、ユーザ履歴管理部２７０、反応解析部２８０、状況解析部２９０および情報統合部３００を備える。

　（情報収集部２４０）
　情報収集部２４０は、例えば、ウェブページなどのコンテンツ情報から、マークアップ解析や構文解析などによって個々のコンテンツのメタデータを収集する。「コンテンツのメタデータ」とは、例えば、レストランなどのコンテンツの名前（店舗名）、場所、カテゴリ、電話番号、予算、評価、口コミなど、そのコンテンツに関するデータである。

　（情報解析部２５０）
　情報解析部２５０は、情報収集部２４０により収集されたコンテンツのメタデータを解析して情報推薦のためのマッチング用データを生成する。情報解析部２５０は、より具体的には、メタデータの属性値ごとにスコアを持つベクトル（コンテンツプロファイル）をマッチング用データとして得るものであってよい（例えば特開２００５－１７６４０４号公報）。

　（メタデータの構造）
　図６および図７にメタデータの構造を示す。
　なお、本例は、レストランのコンテンツを対象としたものである。
　メタデータは、「Ｉｄ」、「ＣｏｎｔｅｎｔＶｅｃｔｏｒ」、「ＣｏｎｔｅｎｔＩｎｆｏ」を含む。

　「Ｉｄ」は対象コンテンツを一意に識別する情報である。本例では、「Ｉｄ」の値としてレストランに割り当てられた"ｒｅｓｔａｕｒａｎｔＩｄ"が登録される。

　「ＣｏｎｔｅｎｔＶｅｃｔｏｒ」は、コンテンツ間の類似性や、コンテンツとユーザの嗜好情報との関連性を算出するために用いられるデータである。「ＣｏｎｔｅｎｔＶｅｃｔｏｒ」には、例えば、コンテンツの名前（ｎａｍｅ）、コンテンツのピーアール説明（ｐｒＳｈｏｒｔ、ｐｒＬｏｎｇ）、コンテンツのシステム上の定義などを含む。コンテンツのシステム上の定義には、大カテゴリである「ｂｌｏａｄｃａｔｅｇｏｒｙ」、中カテゴリである「ｓｔｙｌｅｃａｔｅｇｏｒｙ」、汎用カテゴリである「ｎｕｄｇｅｃａｔｅｇｏｒｙ」、小カテゴリである「ｓｅｒｖｉｃｅｃａｔｅｇｏｒｙ」などがある。

　ＣｏｎｔｅｎｔＩｎｆｏは、コンテンツ（レストラン）の場所、電話番号、営業時間、住所、料金、緯度経度、ホームページのＵＲＬ、評価、口コミなどの詳細情報である。

　なお、ＣｏｎｔｅｎｔＶｅｃｔｏｒとＣｏｎｔｅｎｔＩｎｆｏの区別はあくまで一例である。ＣｏｎｔｅｎｔＶｅｃｔｏｒとＣｏｎｔｅｎｔＩｎｆｏとは、一部重複していてもよいし、用途に応じて適宜定義してもよい。また、ｓｔｒｉｎｇ型のテキストは形態素解析され、キーワードのベクトル「（キーワード，頻度）」として表現される。

　口コミや紹介文などに対するクラスタリングにおいては、潜在トピックモデルの手法としてテキスト分類で広く用いられるＰＬＳＡ（Probabilistic　Latent　Semantic－Analysis）やＬＤＡ（Latent　Dirichlet－Allocation）を利用してもよい。ＰＬＳＡの詳細に関しては、非特許文献１：Thomas　Hofmann,"Probabilistic　latent　semantic　indexing"，1999，Proceedings　of　the　22nd　annual　international　ACM　SIGIR　conference　ON　Research　and　development　in　information　retrievalが参照される。また、ＬＤＡの詳細に関しては、非特許文献２：David　M．　Blei，　Andrew　Y．Ng，　Michael　I．　Jordan，　"Latent　Dirichlet　Allocation"，　2003，　Journal　of　Machine　Learning　Research，　Volume　3が参照される。

　ＰＬＳＡにおいては、例えば紹介文ｄにおける単語ｗの生起確率ｐ（ｗ｜ｄ）を潜在トピックｚを用いて下記式のように表現する。
　ｐ（ｗ｜ｄ）＝Σｐ（ｗ｜ｚ）ｐ（ｚ｜ｄ）

　つまり、潜在トピックｚを紹介文および単語が生起する潜在トピックと考えて、紹介文における単語の生起確率を「潜在トピックごとの単語生起確率」と「紹介文のトピック帰属確率」に分解することができる。トピックｚの次元数を５とした場合、あるスポットの紹介に関するトピックの帰属確率は｛０．４，０．１，０．７，０．２，０．５｝のように表現され、これがクラスタリングの結果となる。

　図８にｂｌｏａｄｃａｔｅｇｏｒｙの例を示す。
　ｂｌｏａｄｃａｔｅｇｏｒｙは、コンテンツが属する大カテゴリである。レストランの大カテゴリには例えば「和食」、「洋食」、「アジア料理」などがある。

　図９にｓｔｙｌｅｃａｔｅｇｏｒｙの例を示す。
　ｓｔｙｌｅｃａｔｅｇｏｒｙは、コンテンツが属する中カテゴリであり、例えば料理を「エスニック料理」、「飲み屋」、「うどん・そば」、「カレー」などのように、料理のスタイルによって、より細かく分類したカテゴリである。

　図１０にｎｕｄｇｅｃａｔｅｇｏｒｙの例を示す。
　ｎｕｄｇｅｃａｔｅｇｏｒｙは、アイテム（レストラン）の汎用的に分類したカテゴリである。

　図１１にｓｅｒｖｉｃｅｃａｔｅｇｏｒｙの例を示す。
　ｓｅｒｖｉｃｅｃａｔｅｇｏｒｙは、アイテムを料理の具体的な種類によって細かく分類したカテゴリである。
　以上が、情報解析部２５０と情報解析部２５０によって得られるメタデータの説明である。

　（推薦部２６０）
　推薦部２６０は、ユーザ履歴管理部２７０で管理されたユーザ履歴に含まれるユーザ行動履歴を分析して得たユーザの嗜好情報であるユーザプリファレンスと、上記のコンテンツプロファイルとをマッチングしてコンテンツの推薦結果を生成する。ここで、ユーザの嗜好情報であるユーザプリファレンスは、当該ユーザの履歴（図１２）に記述された操作対象のアイテムＩＤに対応するコンテンツのメタデータあるいはコンテンツプロファイルの重み付け和から生成される。ユーザプリファレンスとコンテンツプロファイルとのマッチングをとる方法としては、例えば、ユーザプリファレンスとコンテンツプロファイルとの間で項目ごとに内積を演算し、内積の総和を推薦スコアとして算出する手法などがある（例えば特開２００５－１７６４０４号公報）。この方法では、推薦スコアがより高いコンテンツプロファイルのコンテンツが推薦結果とされる。

　推薦部２６０は、推薦条件別に推薦結果を生成するために、条件の候補として、例えば季節（春、夏、秋、冬）、期間（日帰り、一泊、二泊以上）、目的（家族旅行、夫婦で外食、家族で外食、家族でお出かけ）があるとすると、ユーザ履歴から条件の組み合わせを複数生成する。例えば、「季節：春」、「期間：日帰り」、「目的：家族で外食」といった第１の組み合わせ、「季節：夏」、「期間：二泊以上」、「目的：家族旅行」といった第２の組み合わせ、さらには「季節：冬」、「期間：日帰り」、「目的：家族でお出かけ」といった第３の組み合わせなどが生成される。

　推薦部２６０は、各々の組み合わせに対して、例えば次のような推薦結果を生成する。
・第１の組み合わせ、
　　第１位：焼肉屋ＡＢＣ
　　第２位：和食亭ＡＢＣ
　　第３位：イタリアンＡＢＣ
・第２の組み合わせ
　　第１位：ＡＢＣホテル
　　第２位：ＡＢＣ旅館
　　第３位：ＡＢＣ遊園地
・第３の組み合わせ
　　第１位：ＡＢＣコンサート
　　第２位：ＡＢＣ水族館
　　第３位：ＡＢＣ博物館

　このように組み合わせ毎の推薦結果を生成する際、推薦部２６０は、既にユーザが訪れたことのあるスポットを推薦結果に含まないなど、所定のフィルタを設定してもよい。

　なお、推薦部２６０は、複数のユーザプリファレンスに基づいてユーザグループ（家族、友達グループ等）に対する推薦結果の生成を行うことも可能である。

　また、推薦部２６０は、音声インタラクションを通じてユーザにより指定された条件に合った情報（コンテンツ）を検索してユーザに提示することが可能である。この際、推薦部２６０は、上記の条件希少度、インタラクション進捗度、またはユーザ反応明確度に基づいて「提案モード」と「質問モード」とで切り替えを行う。「提案モード」が設定された場合には、音声インタラクションを通じてユーザにより指定された条件に合った情報または上記の推薦結果の少なくとも一方をユーザに提示する。また、推薦部２６０は、「質問モード」が設定された場合には、検索のための新たな条件をユーザに指定してもらうための質問を生成し、ユーザに提示するように制御を行う。

　（ユーザ履歴管理部２７０）
　ユーザ履歴管理部２７０は、情報処理端末１０のユーザがアクセスしたインターネット上のコンテンツに対するユーザ行動を、反応解析部２８０によって得られたユーザ反応、状況解析部２９０によって得られたユーザ状況などの情報とともにユーザ履歴として蓄積して管理する。

　図１２にユーザ履歴であるユーザ反応（ｆｅｅｄｂａｃｋ）のデータ構造の一例を示す。同図に示すように、ユーザ履歴であるユーザ反応（ｆｅｅｄｂａｃｋ）は、ユーザＩＤと、ユーザ反応の種類を示すフィードバックタイプ（ｆｅｅｄｂａｃｋＴｙｐｅ）と、対象コンテンツのＩＤと、対象コンテンツのカテゴリ属性を識別するＩＤと、属性値と、閲覧中のユーザの発言内容などのテキストと、登録日時などを含む。ユーザ反応の種類を示すフィードバックタイプ（ｆｅｅｄｂａｃｋＴｙｐｅ）には、お出かけ先スケジュールへの登録、お出かけ先ウィッシュリストへの追加、お出かけ先へ実際に出かけたこと、当該スポットを登録済みの出かけ先の一覧画面を見たこと、当該スポットを登録済みの出かけ先の詳細画面を見たこと、音声インタラクションの発話に対してユーザが回答したこと、などがある。

　（反応解析部２８０）
　反応解析部２８０は、情報処理端末１０からの取得した各種検出データに基づいて、インターネット上のコンテンツの閲覧時、スケジュールの登録・閲覧時、音声インタラクション時などにおけるユーザの反応を解析する。ユーザの反応を解析するために、反応解析部２８０は、例えば、情報処理端末１０のカメラによって撮像されるユーザの顔の向きや表情を認識する機能、情報処理端末１０のマイクによって得られるユーザの発話内容を解析する機能、ユーザより入力されたテキストの内容（文言）を解析する機能、生体反応測定器による脈拍（数、波形）、血圧などを解析する機能などを備える。

　（状況解析部２９０）
　状況解析部２９０は、情報処理端末１０からの取得した各種検出データに基づいて、インターネット上のコンテンツの閲覧時、スケジュールの登録・閲覧時、音声インタラクション時などにおけるユーザの状況を解析する。ユーザの状況を解析するために、状況解析部２９０は、例えば、情報処理端末１０のカメラによって撮像される映像などからのユーザの在／不在を判定する機能、情報処理端末１０（ユーザ）の位置情報を取得するＧＰＳ受信機能などを備える。

　（情報統合部３００）
　情報統合部３００は、上記各部の間での情報の受け渡しや、情報処理端末１０との情報通信を制御する。情報統合部３００は、例えば、情報収集部２４０が収集したメタデータを情報解析部２５０に出力したり、情報解析部２５０が解析した情報（コンテンツプロファイル）を推薦部２６０に出力する。また、情報統合部３００は、ユーザ履歴管理部２７０が管理するユーザ履歴を推薦部２６０に出力する。また、情報統合部３００は、反応解析部２８０が得たユーザ反応および状況解析部２９０が得たユーザ状況を推薦部２６０に出力する。

　［１－６．メタデータ解析から推薦結果決定までの処理］
　次に、本実施形態に係るメタデータ解析から推薦結果決定までの処理の流れの例を説明する。
　図１３は情報処理サーバ２０によるメタデータ解析から推薦結果決定までの処理の流れを示すフローチャートである。
　このフローは、例えば次に挙げるようなトリガで開始される。
　１．例えば１日一回、１時間一回などのように周期的。
　２．収集されたメタデータに更新が発生したとき。
　３．ユーザ反応履歴（ｆｅｅｄｂａｃｋ）がｎ件以上追加されたとき。
　これら１から３のトリガは２つ以上組み合わせてもよい。

　情報解析部２５０は、上記のトリガが成立したことを判断すると（ステップＳ１０１のＹ）、情報収集部２４０により収集されたコンテンツのメタデータの解析を開始して、コンテンツプロファイルを作成する（ステップＳ１０２）。

　次に、推薦部２６０は推薦を実行するか否かを判定する（ステップＳ１０３）。この判定は、後述する提案モードの実行時にインタラクション進捗度とユーザ反応明確度の２つのパラメータに基づいて行われる。この動作については後で詳細を説明する。推薦部２６０は、推薦を行わないことを判定した場合（ステップＳ１０３のＮｏ）、提示制御部２３０は処理を終了する。

　推薦を実行することが判定された場合（ステップＳ１０３のＹｅｓ）、推薦部２６０は、ユーザ履歴管理部２７０からユーザ履歴を取得する（ステップＳ１０４）。この際、推薦部２６０は、所定のフィードバックタイプをもつユーザ履歴の対象スポットのアイテムＩＤに対応するコンテンツプロファイルを取得し、当該コンテンツプロファイルに基づいてユーザの嗜好情報であるユーザプリファレンスを生成する。なお、その際、フィードバックタイプは複数選択されてもよく、あるいはフィードバックタイプ毎の重み付けがされてユーザプリファレンスが生成されてもよい。

　次に、推薦部２６０は、推薦条件の設定を行う（ステップＳ１０５）。推薦条件には、例えば、上述したように、日時、期間、目的などが含まれる。次いで推薦部２６０は、設定した推薦条件に基づいて、推薦スコアを算出し（ステップＳ１０６）、算出した推薦スコアとともに推薦結果を記憶部２２０（図４）に保存する（ステップＳ１０７）。

　（推薦スコアの算出の具体例）
　続いて、推薦スコアの算出について具体例を挙げて説明する。
　情報解析部２５０は、ステップＳ１０２において下記のようなコンテンツプロファイルを生成する。
　スポットＡ：
｛温泉＝１．０，草津＝１．０，露天風呂＝０．６，バイキング＝０．４，マッサージ＝０．２｝［緯度＝ｘｘｘ，経度＝ｘｘｘ，人気＝４．１，大人料金＝１５，０００円，子供料金＝１０，０００円］
　スポットＢ：
｛テーマパーク＝１．０，富士＝１．０，サファリ＝０．８，体験＝０．５，バス＝０．３｝［緯度＝ｘｘｘ，経度＝ｘｘｘ，人気＝４．４，大人料金＝２７，０００円，子供金＝１，５００円］
　スポットＣ：
｛キャンプ場＝１．０，丹沢＝１．０，ドッグラン＝０．７，コテージ＝０．５，パン＝０．４，｝［緯度＝ｘｘｘ，経度＝ｘｘｘ，人気＝３．６，料金＝４，０００円］

　また、推薦部２６０は、ステップＳ１０４において、下記のようなユーザ履歴を取得する。なお、ここでは、フィードバックタイプとしてスケジュール登録が行われたスポットに対する操作履歴を取得している。
　２０１５／０５「家族で旅行」－＞　一泊，スポットＸ：
｛温泉＝１．０，熱海＝１．０，露天風呂＝０．６，イタリアン＝０．４，エステ＝０．１｝［緯度＝ｘｘｘ，経度＝ｘｘｘ，人気＝３．８，大人料金＝１２，０００円，子供料金＝８，０００］
　２０１６／０５「家族で旅行」－＞　一泊，スポットＹ：
｛温泉＝１．０，那須高原＝１．０，コテージ＝０．５，和食＝０．３，マッサージ＝０．２｝［緯度＝ｘｘｘ，経度＝ｘｘｘ，人気＝４．２，大人料金＝１６，０００円，子供料金＝１０，０００］
　２０１６／１１「親子でお出かけ」－＞　一泊，スポットＺ：
｛キャンプ場＝１．０，南房総＝１．０，釣り＝０．７，テント＝０．３，ハイキング＝０．２｝［緯度＝ｘｘｘ，経度＝ｘｘｘ，人気＝３．７，料金＝５，０００円］

　また、推薦部２６０は、ステップＳ１０５において、下記のような推薦条件を設定する。
　日時：２０１７／０５／０１＝［春］，期間：［一泊］，目的：［家族で旅行］

　次に、推薦部２６０は、ステップＳ１０６において、下記のように推薦スコアを算出する。なお、下記におけるＵＰとは、ユーザプリファレンスを示す。
　ＵＰ［春］＝スポットＸ＋スポットＹ：
｛温泉＝２．０，熱海＝１．０，那須高原＝１．０，露天風呂＝０．６，イタリアン＝０．４，エステ＝０．１，コテージ＝０．５，和食＝０．３，マッサージ＝０．２｝
　ＵＰ［春］とスポットＡ，Ｂ，Ｃ間でベクトルｃｏｓ演算：
・ＵＰ－Ａ：｛１．０＊２．０（温泉）＋０．６＊０．６（露天風呂）＋０．２＊０．２（マッサージ）｝／｛√（２．０^２＋１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．１^２＋０．５^２＋０．３^２＋０．２^２）（ＵＰノルム）＊√（１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．２^２）（Ａノルム）｝＝２．４／｛√６．９１＊√２．５６｝＝０．５７０
・ＵＰ－Ｂ：０．００（共通メタデータなし）
・ＵＰ－Ｃ：｛０．５＊０．５（コテージ）／｛√（２．０^２＋１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．１^２＋０．５^２＋０．３^２＋０．２^２）（ＵＰノルム）＊ √（１．０^２＋１．０^２＋０．７^２＋０．５^２＋０．４^２）（Ｃノルム）｝＝０．２５／｛√６．９１＊√２．９｝＝０．０５５

　ＵＰ［一泊］＝スポットＸ＋スポットＹ＋スポットＺ：
｛温泉＝２．０，キャンプ場＝１．０，熱海＝１．０，那須高原＝１．０，南房総＝１．０，露天風呂＝０．６，イタリアン＝０．４，エステ＝０．１，コテージ＝０．５，和食＝０．３，マッサージ＝０．２，釣り＝０．７，テント＝０．３，ハイキング＝０．２｝
　ＵＰ［一泊］とスポットＡ，Ｂ，Ｃ間でベクトルｃｏｓ演算：
・ＵＰ－Ａ：｛１．０＊２．０（温泉）＋０．６＊０．６（露天風呂）＋０．２＊０．２（マッサージ）｝／｛√（２．０^２＋１．０^２＋１．０^２＋１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．１^２＋０．５ｖ＋０．３^２＋０．２^２＋０．７^２＋０．３^２＋０．２^２）（ＵＰノルム）＊√（１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．２^２）（Ａノルム）｝＝２．４／｛√９．５３＊√２．５６｝＝０．４８５
・ＵＰ－Ｂ：０．００（共通メタデータなし）
・ＵＰ－Ｃ：｛１．０＊１．０（キャンプ場）＋０．５＊０．５（コテージ）／｛√（２．０^２＋１．０^２＋１．０^２＋１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．１^２＋０．５^２＋０．３^２＋０．２^２＋０．７^２＋０．３^２＋０．２^２）（ＵＰノルム）＊ √（１．０^２＋１．０^２＋０．７^２＋０．５^２＋０．４^２）（Ｃノルム）｝＝１．２５／｛√９．５３＊√２．９｝＝０．２３７

　ＵＰ［家族で旅行］＝スポットＸ＋スポットＹ：
｛温泉＝２．０，熱海＝１．０，那須高原＝１．０，露天風呂＝０．６，イタリアン＝０．４，エステ＝０．１，コテージ＝０．５，和食＝０．３，マッサージ＝０．２｝
　ＵＰ［春］とスポットＡ，Ｂ，Ｃ間でベクトルｃｏｓ演算：
・ＵＰ－Ａ：｛１．０＊２．０（温泉）＋０．６＊０．６（露天風呂）＋０．２＊０．２（マッサージ）｝／｛√（２．０^２＋１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．１^２＋０．５^２＋０．３^２＋０．２^２）（ＵＰノルム）＊√（１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．２^２）（Ａノルム）｝＝２．４／｛√６．９１＊√２．５６｝＝０．５７０
・ＵＰ－Ｂ：０．００（共通メタデータなし）
・ＵＰ－Ｃ：｛０．５＊０．５（コテージ）／｛√（２．０^２＋１．０^２＋１．０^２＋０．６^２＋０．４^２＋０．１^２＋０．５^２＋０．３^２＋０．２^２）（ＵＰノルム）＊√（１．０^２＋１．０^２＋０．７^２＋０．５^２＋０．４^２）（Ｃノルム）｝＝０．２５／｛√６．９１＊√２．９｝＝０．０５５

　以上の演算により、下記のような推薦スコアが算出される。
　ＵＰ－Ａ［総合］＝ＵＰ－Ａ［春］＋ＵＰ－Ａ［一泊］＋ＵＰ－Ａ［家族で旅行］＝０．５７０＋０．４８５＋０．５７０＝１．６２５
　ＵＰ－Ｂ［総合］＝ＵＰ－Ｂ［春］＋ＵＰ－Ｂ［一泊］＋ＵＰ－Ｂ［家族で旅行］＝０．０００＋０．０００＋０．０００=０．０００
　ＵＰ－Ｃ［総合］＝ＵＰ－Ｃ［春］＋ＵＰ－Ｃ［一泊］＋ＵＰ－Ｃ［家族で旅行］＝０．０５５＋０．２３７＋０．０５５＝０．３４７

　なお、推薦部２６０は、算出した推薦スコアに基づいて対象スポットの絞り込みを行ってもよい。推薦部２６０は、例えば、人気＝３．５未満のものは推薦結果から除外するなどの条件フィルタリングを行うことができる。

　本実施形態に係るユーザには、ユーザ個人および当該ユーザが属するユーザグループの両方が含まれてよい。

　例えば、ユーザ個人が家庭における妻である場合、ユーザ個人が自身のために望む情報と、ユーザグループすなわち家族のために望む情報とには、差異があることが想定される。このため、本実施形態に係る推薦部２６０は、ユーザ個人またはユーザグループのいずれかを対象に推薦スコアを算出して推薦スポットを決定してもよい。
　以上、メタデータ解析から推薦結果決定までの処理の詳細を説明した。

　［１－５．音声インタラクションによる検索］
　次に、本実施形態に係る音声インタラクションによるコンテンツ検索について説明する。
　図１４は、音声インタラクションによるコンテンツ検索の全体的な流れを示すフローチャートである。
　まず、ユーザが情報処理端末１０の前に現れたことがカメラ、赤外線センサ、あるいは超音波センサなどの人感センサによって検出されること、あるいはユーザが情報処理端末１０に向けて所定の発話を行うことなどによって、音声インタラクションによるコンテンツ検索が起動される。

　音声インタラクションによるコンテンツ検索が起動されると、状況解析部２９０によるユーザ状況（音声インタラクション環境にユーザが存在するか、ユーザの顔の向きなど）の解析が行われる。状況解析部２９０によって得られたユーザ状況解析結果は情報統合部３００によって推薦部２６０に供給される（ステップＳ２０１）。

　さらに、反応解析部２８０によって、音声インタラクションにおけるユーザ反応の解析が行われ、その解析結果は情報統合部３００によって推薦部２６０に供給される（ステップＳ２０２）。

　続いて音声インタラクションの終了条件の成立の有無が判定される（ステップＳ２０３）。この音声インタラクションを終了条件の成立判定について後で説明する。

　音声インタラクションの終了条件が成立しない場合（ステップＳ２０３のＮ）、推薦部２６０は、上記の条件希少度を算出し、算出された条件希少度が条件希少度評価のための閾値以上であるかどうかを判定する（ステップＳ２０４）。条件希少度とその算出方法の詳細については後で説明する。

　推薦部２６０は、条件希少度が条件希少度評価のための閾値以上である場合（ステップＳ２０４のＹ）、提案モードのフローに従って、ユーザに提案するスポットを決定し、その結果を情報処理端末１０のユーザに提示する（ステップＳ２０８）。この質問モードの処理の詳細については後で説明する。また、推薦部２６０は、条件希少度が条件希少度評価のための閾値以上ではない場合（ステップＳ２０４のＮ）、次いで、インタラクション進捗度を算出し、その結果がインタラクション進捗度評価のための閾値以上であるかどうかを判定する（ステップＳ２０５）。

　推薦部２６０は、インタラクション進捗度がインタラクション進捗度評価のための閾値以上である場合（ステップＳ２０５のＹ）、前記同様に提案モードの処理に移行する（ステップＳ２０８）。推薦部２６０は、インタラクション進捗度がインタラクション進捗度評価のための閾値以上ではない場合（ステップＳ２０５のＮ）、ユーザ反応明確度を算出し、その結果がユーザ反応明確度評価のための閾値以上であるかどうかを判定する（ステップＳ２０６）。

　推薦部２６０は、ユーザ反応明確度がユーザ反応明確度評価のための閾値以上である場合（ステップＳ２０６のＹ）、前記同様に提案モードの処理に移行する（ステップＳ２０８）。また、推薦部２６０は、ユーザ反応明確度がユーザ反応明確度評価のための閾値以上でない場合には（ステップＳ２０６のＮ）、質問モードによる処理を実行する（ステップＳ２０７）。

　なお、上記のフローにおいて、ステップＳ２０４の条件希少度の評価、ステップＳ２０５のインタラクション進捗度の評価、ステップＳ２０６のユーザ反応明確度の評価の順番はこれに限定されない。これら３つの評価はどのような順番で行われてもよい。例えば、条件希少度の評価、ユーザ反応明確度の評価、インタラクション進捗度の評価の順、あるいはインタラクション進捗度の評価、ユーザ反応明確度の評価、条件希少度の評価の順、あるいは、インタラクション進捗度の評価、条件希少度の評価、ユーザ反応明確度の評価の順、あるいはユーザ反応明確度の評価、条件希少度の評価、インタラクション進捗度の評価の順、あるいはユーザ反応明確度の評価、インタラクション進捗度の評価、条件希少度の評価の順であってもよい。

　（音声インタラクションの終了条件）
　次に、ステップＳ２０３の音声インタラクションの終了条件について説明する。
　音声インタラクションの終了条件には、ユーザ状況とユーザ反応にそれぞれ関して別々の条件が設定される。ユーザ状況の終了条件としては、例えば、連続して所定時間以上ユーザが状況解析部２９０によって検出されないことなど、ユーザ状況に基づいて検出する方法などが挙げられる。また、ユーザ反応の終了条件としては、ユーザが顔認識によって検出されたとしても連続して所定時間以上ユーザの発話が反応解析部２８０によって検出されないことなど、ユーザ反応に基づいて検出する方法などが挙げられる。推薦部２６０は、例えば、少なくともいずれか一方の終了条件が成立したことを、音声インタラクションの終了条件が成立したこととして判定する。

　なお、音声インタラクションの終了条件は上記に限定されず、例えば、連続して所定時間以上カメラの撮影画像あるいは音声などからユーザ状況に変化がないことを、音声インタラクションの終了条件としてもよい。

　（条件希少度の算出・評価方法）
　条件希少度とは、コンテンツ検索において検索結果の絞り込みが十分であるかどうかを評価すための指標値である。条件希少度は、例えば、次のように求められ、評価される。
　検索対象のコンテンツ総数（情報母体数）をｔｏｔａｌ、ユーザが指定した条件にヒットしたコンテンツ数をｈｉｔ、条件希少度をｒａｒｉｔｙをとすると、
　ｈｉｔ＝０のとき、ｒａｒｉｔｙ＝０とし、
　ｈｉｔ＞０のとき、ｒａｒｉｔｙ＝１－ｈｉｔ／ｔｏｔａｌとする。
　具体的には、ｔｏｔａｌが"１０，０００"で、ｒａｒｉｔｙの閾値が"０．９９"であるとき、ｈｉｔが"１．００"未満であれば条件希少度は閾値以上となり、ｈｉｔが"１．００"以上であれば条件希少度が閾値未満となる。

　なお、上記の条件希少度の算出・評価方法は一例であり、その他、様々な変形が可能である。

　（インタラクション進捗度の算出・評価方法）
　インタラクション進捗度は、音声インタラクションでのシステムとユーザとの間のやりとりの回数的および時間的なコストを示す指標であり、例えば、次のような計算によって得られ、評価される。

　システムが質問または提示した回数をｓｈｏｗ、
　ユーザが回答した回数をｒｅａｃｔｉｏｎとすると、
　インタラクション回数（ｐｒｏｇｒｅｓｓ＿ｔｕｒｎ）は次式により算出される。
　　ｐｒｏｇｒｅｓｓ＿ｔｕｒｎ＝ｓｈｏｗ＊０．５＋ｒｅａｃｔｉｏｎ＊０．５　…（１）
　また、インタラクション回数のノルム（ｐｒｏｇｒｅｓｓ＿ｔｕｒｎ_ｎｏｒｍ）は、
ｐｒｏｇｒｅｓｓ＿ｔｕｒｎ＞１．０のとき１．０、
ｐｒｏｇｒｅｓｓ＿ｔｕｒｎ＜＝１．０のときｐｒｏｇｒｅｓｓ＿ｔｕｒｎ／１．００として与えられる。
　また、インタラクション時間（分）をｐｒｏｇｒｅｓｓ＿ｔｉｍｅとすると、
　そのノルム（ｐｒｏｇｒｅｓｓ＿ｔｉｍｅ_ｎｏｒｍ）は、
ｐｒｏｇｒｅｓｓ＿ｔｉｍｅ＞１．０のとき１．０、
ｐｒｏｇｒｅｓｓ＿ｔｉｍｅ＜＝１．０のときｐｒｏｇｒｅｓｓ＿ｔｉｍｅ／１．００として与えられる。

　そしてインタラクション進捗度（ｐｒｏｇｒｅｓｓ）は次式（２）により算出される。
　ｐｒｏｇｒｅｓｓ＝（ｐｒｏｇｒｅｓｓ＿ｔｕｒｎ_ｎｏｒｍ＋ｐｒｏｇｒｅｓｓ＿ｔｉｍｅ_ｎｏｒｍ／２．０　　　…（２）
　ｐｒｏｇｒｅｓｓの閾値には、例えば０．８が用いられる。

　なお、上記のインタラクション進捗度の算出・評価方法は一例であり、その他、様々な変形が可能である。例えば、インタラクションの回数または時間の少なくとも一方から得られる指標値をインタラクション進捗度としてもよい。

　（ユーザ反応明確度の算出・評価方法）
　ユーザ反応明確度は、音声インタラクションにおいてユーザが回答（反応）する際のユーザの様子や回答内容（文言）から推定されるユーザ反応の明確さを示す指標であり、例えば、次のような計算によって得られ、評価される。

　例えば、ユーザ反応明確度（ｃｌａｒｉｔｙ）は次式（３）により算出される。
ｃｌａｒｉｔｙ＝Σ｛（ｃｌａｒｉｔｙ_ｆａｃｅ＋ｃｌａｒｉｔｙ_ｓｐｅｅｃｈ）／２｝／回答数　　　…（３）
　ここでｃｌａｒｉｔｙ_ｆａｃｅは情報処理端末１０にユーザが顔を向けていた度合を示し、１回答につき０．０から１．０の範囲で与えられる。例えば、情報処理端末１０にユーザが完全に顔を向けているならばｃｌａｒｉｔｙ_ｆａｃｅ＝１．０、半分程度顔を向けているならばｃｌａｒｉｔｙ_ｆａｃｅ＝０．５、殆ど顔を向けていない場合にはｃｌａｒｉｔｙ_ｆａｃｅ＝０．０のように与えられる。

　ｃｌａｒｉｔｙ＿ｓｐｅｅｃｈは発話内容の明確さの度合に応じて０．０から１．０の範囲内で与えられる値である。例えば、「はい」、「いいえ」、「○○がいい」「××はいらない」のような意味が明確な発言にはｃｌａｒｉｔｙ＿ｓｐｅｅｃｈ＝１．０、「どちらでも」「わからない」のような曖昧な発言に対してはｃｌａｒｉｔｙ＿ｓｐｅｅｃｈ＝０．５、「えっと…」のように意味不明な発言に対してはｃｌａｒｉｔｙ＿ｓｐｅｅｃｈ＝０．０のように与えられる。
　ユーザ反応明確度（ｃｌａｒｉｔｙ）の閾値には、例えば０．２が用いられる。

　なお、上記のユーザ反応明確度の算出・評価方法は一例であり、その他、様々な変形が可能である。

　［１－６．質問モードの処理の流れ］
　次に、質問モードの処理の流れを説明する。
　図１５は質問モードの処理のフローチャートである。
　推薦部２６０は、選択肢形式の質問における質問種別を決定する処理（ステップＳ３０１）、質問選択肢数を決定する処理（ステップＳ３０２）、質問選択肢の内容を決定する処理（ステップＳ３０３）、質問の文言を決定する処理（ステップＳ３０４，）を順に実行する。以下にそれぞれの処理について詳細を説明する。

　（質問種別の決定）
　まず、ステップ３０１の質問種別を決定する処理の詳細を説明する。
　推薦部２６０は、質問の種別を分類する複数の質問種別のなかから、選択肢形式の質問に用いる質問種別を、複数の質問種別間で決められた優先度に従って確率的に選択する。

　図１６は上記の質問種別を決定するためのルールの一例を示す図である。
　同図はレストランに関するコンテンツ検索のための質問種別の決定に用いられるルールを示す表である。
　質問種別には、ｂｌｏａｄｃａｔｅｇｏｒｙ（Ｂカテゴリ）、ｓｔｙｌｅｃａｔｅｇｏｒｙ（Ｓｔカテゴリ）、ｎｕｄｇｅｃａｔｅｇｏｒｙ（Ｎカテゴリ）、ｓｅｒｖｉｃｅｃａｔｅｇｏｒｙ（Ｓカテゴリ）の他、ｓｅａｓｏｎｃａｔｅｇｏｒｙ、移動手段・移動時間、予算、駅名などがある。上記の質問種別のグループ化され、ｂｌｏａｄｃａｔｅｇｏｒｙ（Ｂカテゴリ）、ｓｔｙｌｅｃａｔｅｇｏｒｙ（Ｓｔカテゴリ）、ｎｕｄｇｅｃａｔｅｇｏｒｙ（Ｎカテゴリ）、ｓｅｒｖｉｃｅｃａｔｅｇｏｒｙ（Ｓカテゴリ）はｃａｔｅｇｏｒｙグループ、ｓｅａｓｏｎｃａｔｅｇｏｒｙはｓｅａｓｏｎグループ、移動手段・移動時間の質問種別はｔｒａｎｓｆｅｒグループ、予算の質問種別はｐｒｉｃｅグループ、駅名の質問種別はｓｔａｔｉｏｎグループとされる。

　各々の質問種別には、グループ間優先度とグループ内優先度が決められている。グループ間優先度は、質問種別グループ間の選択優先度であり、グループ内優先度は質問種別グループ内での各々の質問種別間での選択優先度である。

　グループ間優先度は、すべての質問種別グループに割り当てられる選択優先度の合計値を"１００"として、これを各グループ間で一定割合で分配した値によって与えられる。図１６の例では、ｃａｔｅｇｏｒｙグループに対して"４０"、ｓｅａｓｏｎグループに対して"１０"、ｔｒａｎｓｆｅｒグループに対して"１０"、ｐｒｉｃｅグループに対して"１０"、そしてｓｔａｔｉｏｎグルーブに対して"３０"がそれぞれ割り当てられている。

　一方、グループ内優先度についても同様に、同一グループに属するすべての質問種別に割り当てられる選択優先度の合計値を"１００"として、これを同一グループに属するすべての質問種別間で分配した値によって与えられる。

　図１６において、「発火条件」とは、各質問種別が、優先度に応じた選択候補となるための必要条件である。例えば、Ｂカテゴリが優先度に応じた選択候補となるための発火条件は、その時点までの音声インタラクションでＢカテゴリ、Ｓｔカテゴリ、Ｎカテゴリ、Ｓカテゴリ、あるいはｓｅａｓｏｎｃａｔｅｇｏｒｙのどの質問種別の質問に対してもユーザからの回答が完了していないことである。また、Ｓｔカテゴリが優先度に応じた選択候補となるための発火条件は、その時点までの音声インタラクションでＳｔカテゴリ、Ｎカテゴリ、Ｓカテゴリ、ｓｅａｓｏｎｃａｔｅｇｏｒｙのどの質問種別の質問に対してもユーザからの回答が完了していないこと、である。

　次に、図１６のルールに基づく質問種別の決定例を示す。
　いま、音声インタラクションおいて、Ｂカテゴリの質問種別の質問に対するユーザからの回答のみが完了している状況を考える。この場合、発火条件を満たす質問種別はＳｔカテゴリ、Ｎカテゴリ、Ｓカテゴリ、ｓｅａｓｏｎｃａｔｅｇｏｒｙの質問種別の他、移動手段・移動時間、予算、駅名の質問種別である。

　次に、これらの質問種別がそれぞれ属する各質問種別グループのグループ間優先度を図１６のルールから参照すると、ｃａｔｅｇｏｒｙ＝４０、ｓｅａｓｏｎ＝１０、ｔｒａｎｓｆｅｒ＝１０、ｐｒｉｃｅ＝１０、ｓｔａｔｉｏｎ＝３０である。

　次に、推薦部２６０は、ルーレット選択による質問種別グループの選択を行う。
　図１７は、質問種別グループのルーレット選択方法を説明する図である。ここで、ルーレットには、全ての質問種別グループのグルーフ刊優先度の合計値分の的が設定される。すなわち、すべての質問種別グループのグルーブ間優先度の合計値が"１００"であるから、"１"から"１００"までの数値の的が設定されたルーレットにおける"１"から"４０"の的の範囲にｃａｔｅｇｏｒｙグループ、"４１"から"５０"の的の範囲にｓｅａｓｏｎグループ、"５１"から"６０"の的の範囲にｔｒａｎｓｆｅｒグループ、"６１"から"７０"の的の範囲にｐｒｉｃｅグループ、そして"７１"から"１００"の的の範囲にｓｔａｔｉｏｎグループがそれぞれ割り当てられる。次に推薦部２６０は、"１"から"１００"までの間で乱数を用いて１つの数値を算出し、この数値が属する数値範囲の質問種別を選択結果とする。例えば、乱数を用いて"３２"の数値が得られた場合、ｃａｔｅｇｏｒｙグループが質問種別グループの選択結果として得られる。

　次に、推薦部２６０は、ｃａｔｅｇｏｒｙグループに属するＢカテゴリ以外の質問種別（Ｓｔカテゴリ、Ｎカテゴリ、Ｓカテゴリ）のなかから再度ルーレット選択による質問種別の選択を行う。Ｓｔカテゴリ、Ｎカテゴリ、Ｓカテゴリそれぞれのグループ内優先度を図１６のルールから参照すると、Ｓｔカテゴリ＝７０、Ｎカテゴリ＝１０、Ｓカテゴリ＝１０である。そこで推薦部２６０は、"１"から"９０"までの数値の的が設定されたルーレットにおける"１"から"７０"の的の範囲にＳｔカテゴリ、"７１"から"８０"の的の範囲にＮカテゴリ、"８１"から"９０"の的の範囲にＳカテゴリをそれぞれ割り当てる。次に推薦部２６０は、"１"から"９０"までの間で乱数を用いて１つの数値を決定し、この数値が属する的の範囲の質問種別を選択結果とする。例えば、乱数を用いて"５８"の数値が得られた場合、Ｓｔカテゴリの質問種別が選択結果として得られる。
　この結果、Ｓｔカテゴリが質問種別として最終的に決定される。

　（質問選択肢数の決定）
　次に、図１５のステップ３０２の質問選択肢数を決定する処理の詳細を説明する。
　質問選択肢数とは、例えば「Ａ、Ｂ、Ｃのどれがいいですか？」といった選択肢形式の質問における選択肢の数であり、この場合には"３"である。推薦部２６０は、選択肢形式の質問における選択肢の数を、音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する。

　図１８は質問選択肢数を決定するルールの一例を示す図である。
　この質問選択肢数の決定ルールでは、これまでの音声インタラクションでのユーザによる回答数（ｎ）とルーレット選択パターンとから質問選択肢数（ｌｉｓｔＳｉｚｅ）が決定されることとしている。ルーレット選択パターンは、質問選択肢数の候補毎に設けられる。本例では、ｌｉｓｔＳｉｚｅ＝３に対応するルーレット選択パターン、ｌｉｓｔＳｉｚｅ＝２に対応するルーレット選択パターン、ｌｉｓｔＳｉｚｅ＝１に対応するルーレット選択パターン、ｌｉｓｔＳｉｚｅ＝０に対応するルーレット選択パターンがある。それぞれのルーレット選択パターンには回答数（ｎ）の値に対する選択確率が割り当てられている。例えば、ｎ＝１に対して、ｌｉｓｔＳｉｚｅ＝３に対応するルーレット選択パターンには"５８"、ｌｉｓｔＳｉｚｅ＝２に対応するルーレット選択パターンには"２４"、ｌｉｓｔＳｉｚｅ＝１に対応するルーレット選択パターンには"１６"、そしてｌｉｓｔＳｉｚｅ＝０に対応するルーレット選択パターンには"２"がそれぞれ登録されている。これは、"１"から"１００"までの数値の的が設定されたルーレットにおいてｌｉｓｔＳｉｚｅ＝３が"１"から"５８"の範囲、ｌｉｓｔＳｉｚｅ＝２が"５９"から"８３"の範囲、ｌｉｓｔＳｉｚｅ＝１が"８４"から"９８"の範囲、そしてｌｉｓｔＳｉｚｅ＝０が"９９"から"１００"の範囲にそれぞれ割り当てられることを意味する。

　推薦部２６０は、"１"から"１００"までの数値範囲の中で、乱数を用いて算出された数値が属するｌｉｓｔＳｉｚｅを質問選択肢数の選択結果として決定する。例えば乱数を用いて算出された数値が"６４"である場合、推薦部２６０は"ｌｉｓｔＳｉｚｅ＝２"を質問選択肢数の選択結果として決定する。

　図１９は、ｌｉｓｔＳｉｚｅ＝３、２、１、０の各ルーレット選択パターン間の回答数（ｎ）の値に対する選択確率分布を示すグラフである。同グラフに示すように、回答数（ｎ）が増えるほど質問選択肢数の少ないルーレット選択パターンの選択確率が高くなるようにすることによって、ユーザにトータル的に過剰な数の質問選択肢が提示されるのを確率的に回避することができ、ユーザの負担減を期待できる。

　なお、質問選択肢数の決定ルールについても様々な変形が考えられる。例えば、ユーザからの回答数（ｎ）が多かった質問選択肢数ほど、あるいはユーザ反応の明確さが高かった質問選択肢数ほど、あるいはユーザからの回答において"Ｙｅｓ"の回数が多かった質問選択肢数ほど、優先的に選択されてもよい。

　（質問選択肢内容の決定）
　次に、図１５のステップ３０３の質問選択肢内容を決定する処理の詳細を説明する。
　推薦部は２６０は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する。

　図２０は質問選択肢内容の決定ルールの一部を示す図である。
　この質問選択肢内容の決定ルールでは、条件種別毎の質問選択肢内容の決定において"知識"を用いるか"分布"を用いるかが決められる。ここで、"知識"は固定の質問選択肢内容であり、"分布"はユーザ全般による回答使用頻度や人気順などの特定の条件に基づいて順位付けられたカテゴリ群から質問選択肢内容を生成することを意味する。"知識"に基づく質問選択肢内容の具体的な決定方法や、"分布"に基づく質問選択肢内容の具体的な決定方法は図２０に示すルールの質問選択肢内容生成ロジックとして決められている。例えば、Ｂカテゴリの質問種別に対する質問選択肢内容は"和食、洋食、アジア料理"を固定で用いるという知識に基づいて生成される。また、Ｓｔカテゴリの質問選択肢内容は、例えば、ユーザの自宅から１時間内に行くことのできるＳｔカテゴリのなかでユーザ全般の回答選択頻度などに基づいて順位付けられた上位ｎ個のＳｔカテゴリを抽出するという質問選択肢内容生成ロジックに基づいて生成される。例えば、図１５のステップＳ３０１においてＳｔカテゴリの質問種別が決定され、ステップＳ３０２において質問選択肢数が"２"に決定された場合には、人気順で１位と２位のＳｔカテゴリが質問選択肢内容として決定される。例えば、１位「とんかつ」、２位「天ぷら」などのように決定される。

　（質問文言の決定）
　次に、ステップ３０４の質問文言を決定する処理の詳細を説明する。
　図２１は質問文言を決定するルールを示す図である。
　本実施形態に係る質問文言決定ルールにおいては、質問種別と質問選択肢数（ｌｉｓｔＳｉｚｅ）との組み合わせ毎に、質問文言のテンプレートの識別番号（質問ＩＤ）が決められている。
　図２２は質問ＩＤ毎の質問文言テンプレート表の例を示す図である。例えば、質問ＩＤ＝ｑｃ０ａに対応して「好きな料理を教えてもらえますか？」という質問文言テンプレートが登録され、質問ＩＤ＝ｑｃ１ａに対応して「＄｛ａｒｇｓ［０］}はいかがですか？」という質問文言テンプレートが登録されている。ここで、＄｛ａｒｇｓ［０］}は全ユーザの回答選択頻度などに基づいて順位付けられたカテゴリ群の中の第１位のカテゴリを意味する。同様に、＄｛ａｒｇｓ［１］}は第２位のカテゴリを意味し、＄｛ａｒｇｓ［２］}は第３位のカテゴリを意味する。

　図２１の質問文言決定ルールにおいて、"ｑｃ１ａ, ｑｃ１ｂ"、"ｑｃ２ａ, ｑｃ２ｂ, ｑｃ２ｃ"のように、複数の質問ＩＤが登録されているところは、推薦部２６０によってルーレット選択等によりランダムに選択されることを意味する。例えば、図１５のステップＳ３０１においてＳｔカテゴリが質問種別として決定され、ステップＳ３０２において質問選択肢数（ｌｉｓｔＳｉｚｅ）として"２"が決定されたので、図２１のルールにならって"ｑｃ２ａ, ｑｃ２ｂ，ｑｃ２ｃ"の中からランダムに１つの質問ＩＤが選択される。仮に"ｑｃ２ｂ"が選択されたとすると、図２２の質問文言テンプレート表から「＄｛ａｒｇｓ［０］｝と＄｛ａｒｇｓ［１］｝なら、どちらが食べたいですか？」の質問文言テンプレートが検索され、ステップ３０３の質問選択肢内容の決定結果と組み合わされて「とんかつと天ぷらなら、どちらが食べたいですか？」の質問文が作成される。

　次に、図１５のステップＳ３０１で質問種別としてルーレットによってｓｅａｓｏｎｃａｔｅｇｏｒｙが選択された場合の動作を説明する。この場合、図２０の質問選択肢内容の決定ルールから、ｓｅａｓｏｎｃａｔｅｇｏｒｙの質問選択肢内容の決定ルールを参照すると、例えば図２３に示すような旬カテゴリ表から現在の旬のカテゴリを例えばランダムに検索した結果を１つだけ質問選択肢内容とすることが決められている。ここで、現在の日にちを３月５日とした場合、旬カテゴリ表から例えば"どじょう料理"がランダムに検索されたとする。一方、図２１の質問文言決定ルールから、ｓｅａｓｏｎｃａｔｅｇｏｒｙに対して利用する質問文言テンプレートの質問ＩＤは"ｑｃｓ１ａ, ｑｃｓ１ｂ, ｑｃｓ１ｃ, ｑｃｓ１ｄ,ｑｃｓ１ｅ, ｑｃｓ１ｆ, ｑｃｓ１ｇ, ｑｃｓ１ｈ"の中から季節に適した１つを選択することが定められている。現在の季節が春であったなら、春に適した質問ＩＤ例えば"ｑｃｓ１ｆ"が選択される。これにより旬カテゴリ表から検索された"どじょう料理"と質問ＩＤ"ｑｃｓ１ｆ"に対応する「春めいてきたので、＄｛ａｒｇｓ［０］｝なんてどうですか？」という質問文言テンプレートとを組み合わせて、「春めいてきたので、どじょう料理なんてどうですか？」という質問文言が生成される。

　なお、ここでは日にちに基づいて、旬カテゴリ表から旬のコンテンツを検索して質問の選択肢内容として決定する場合を説明したが、同様にイベントなどを日にちに基づいてイベント表から検索して質問の選択肢内容として決定してもよい。また、日にちではなく時刻を含む日時データから、広告データなどを含む様々な種類のコンテンツを検索して質問の選択肢内容としてもよい。
　以上が、質問生成の動作の説明である。

　［１－７．提案モードの処理の流れ］
　次に、ユーザとの音声インタラクションにおいて起動される提案モードの処理の流れを説明する。
　推薦部２６０は、提案モードにおいて、ユーザとの音声インタラクションを通じて取得した条件に応じた検索結果である第１の情報またはユーザの嗜好に応じた推薦情報である第２の情報の少なくとも一方を提示する。

　この提案モードは、図１４に示したコンテンツ検索のためのユーザとの音声インタラクションにおいて、例えば、条件希少度が閾値以上であるとき、あるいはインタラクション進捗度が閾値以上であるとき、あるいはユーザ反応明確度が閾値以上であるとき起動される。

　図２４は提案モードの処理のフローチャートである。
　提案モードにおいて、推薦部２６０は、インタラクション進捗度がインタラクション進捗度評価用閾値以下であるかどうかを判定する(ステップＳ４０１)。インタラクション進捗度がインタラクション進捗度評価用閾値以下である場合は、条件希少度が閾値以上であることによって質問モードに移行したことが分かるので、この場合には音声インタラクションでユーザが指定した条件（例えば質問モードでユーザに与えられた質問に対する回答を含む条件）に合致したスポットの条件によるコンテンツ検索結果の絞り込みが十分であるとして、そのコンテンツ検索結果を情報処理端末１０のユーザに提示する(ステップＳ４０２)。

　インタラクション進捗度がインタラクション進捗度評価用閾値以下ではない場合(ステップＳ４０１のＮ)、推薦部２６０はユーザ反応明確度がユーザ反応明確度評価用閾値以上であるかどうかを判定する(ステップＳ４０３)。ユーザ反応明確度がユーザ反応明確度評価用閾値以上でない場合には(ステップＳ４０３のＮ)、音声インタラクションでユーザが指定した条件が妥当性を欠く可能性が高いので、図１３で生成されたスポット推薦結果の中から推薦スコアの高い上位所定数のスポット推薦結果つまりユーザ履歴に基づきユーザの嗜好に合ったスポットを情報処理端末１０のユーザに提示する(ステップＳ４０５)。

　さらに、インタラクション進捗度がインタラクション進捗度評価用閾値以下ではなく(ステップＳ４０１のＮ)、かつユーザ反応明確度がユーザ反応明確度評価用閾値以上である場合には(ステップＳ４０３のＹ)、音声インタラクションでユーザが指定した条件（例えば質問モードでユーザに与えられた質問に対する回答を含む条件）に合致したスポットの検索結果に加えて、図１３で生成されたスポット推薦結果の中から推薦スコアの高い上位所定数のスポット推薦結果を情報処理端末１０のユーザに提示する(ステップＳ４０４)＞

　なお、図２４のフローにおけるインタラクション進捗度評価用閾値は、図１４のフローにおけるインタラクション進捗度評価用閾値と同じであってよいし、異なる値であってもよい。また、図２４のフローにおけるユーザ反応明確度評価用閾値についても、図１４のフローにおけるユーザ反応明確度評価用閾値と同じであってよいし、異なる値であってもよい。

　［１－８．ハードウェア構成例］
　次に、本開示の一実施形態に係る情報処理端末１０および情報処理サーバ２０に共通するハードウェア構成例について説明する。図２５は、本開示の一実施形態に係る情報処理端末１０および情報処理サーバ２０のハードウェア構成例を示すブロック図である。
　情報処理端末１０および情報処理サーバ２０は、例えば、ＣＰＵ８７１と、ＲＯＭ８７２と、ＲＡＭ８７３と、ホストバス８７４と、ブリッジ８７５と、外部バス８７６と、インターフェース８７７と、入力装置８７８と、出力装置８７９と、ストレージ８８０と、ドライブ８８１と、接続ポート８８２と、通信装置８８３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

　ＣＰＵ８７１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ８７２、ＲＡＭ８７３、ストレージ８８０、又はリムーバブル記録媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。

　ＲＯＭ８７２は、ＣＰＵ８７１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ８７３には、例えば、ＣＰＵ８７１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

　ＣＰＵ８７１、ＲＯＭ８７２、ＲＡＭ８７３は、例えば、高速なデータ伝送が可能なホストバス８７４を介して相互に接続される。一方、ホストバス８７４は、例えば、ブリッジ８７５を介して比較的データ伝送速度が低速な外部バス８７６に接続される。また、外部バス８７６は、インターフェース８７７を介して種々の構成要素と接続される。

　入力装置８７８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置８７８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８７８には、マイクロフォンなどの音声入力装置が含まれる。

　出力装置８７９は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、ＬＣＤ、又は有機ＥＬ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置８７９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

　ストレージ８８０は、各種のデータを格納するための装置である。ストレージ８８０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。

　ドライブ８８１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９０１に記録された情報を読み出し、又はリムーバブル記録媒体９０１に情報を書き込む装置である。

リムーバブル記録媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤ　ＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。

　接続ポート８８２は、例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９０２を接続するためのポートである。

　外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。

　通信装置８８３は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、又は各種通信用のモデム等である。

　［１－９．効果等］
　以上説明したように、本技術に係る一実施形態のシステムあるいは情報処理サーバ２０によれば、条件希少度に基づいて第１の処理と第２の処理とが適時切り替えられることによって、条件希少度が低いつまり情報検索結果の絞り込みが不十分な場合に、検索のための条件に関する質問を生成してユーザに提示することによってユーザに新たな条件の追加を明示的に促すことができる。また、その際、選択肢形式の質問をユーザに提示するとによって、ユーザは正しい表現による条件を速やかに応答することができる。この結果、ユーザの負担の軽減、情報検索の速度および精度の向上を図ることができる。さらに、インラクション進捗度やユーザ反応明確度に基づいて質問モードと提案モードとが適時切り替えられるので、無駄な条件あるいは不明確な条件による情報検索を回避することができる。

　なお、本技術は以下のような構成もとることができる。
（１）ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部
　を具備する情報処理装置。

（２）上記（１）に記載の情報処理装置であって、
　前記第２の処理は、選択肢形式の質問を生成する
　情報処理装置。

（３）上記（１）または（２）に記載の情報処理装置であって、
　前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第１の処理と前記第２の処理とを切り替える
　情報処理装置。

（４）上記（１）から（３）のいずれかに記載の情報処理装置であって、
　前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第１の処理と前記第２の処理とを切り替える
　情報処理装置。

（５）上記（４）に記載の情報処理装置であって、
　前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
　情報処理装置。

（６）上記（４）または（５）に記載の情報処理装置であって、
　前記第１の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第１の情報および前記第２の情報のなかから選択する
　情報処理装置。

（７）上記（２）から（６）のいずれかに記載の情報処理装置であって、
　前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
　情報処理装置。

（８）上記（２）から（７）のいずれかに記載の情報処理装置であって、
　前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
　情報処理装置。

（９）上記（２）から（８）のいずれかに記載の情報処理装置であって、
　前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
　情報処理装置。

（１０）上記（２）から（９）のいずれかに記載の情報処理装置であって、
　前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
　情報処理装置。

（１１）上記（１）から（９）のいずれかに記載の情報処理装置が情報処理サーバまたは情報処理端末である
　情報処理装置。

（１２）制御部が、ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える
　情報処理方法。

（１３）上記（１２）に記載の情報処理方法であって、
　前記第２の処理は、選択肢形式の質問を生成する
　情報処理方法。

（１４）上記（１２）または（１３）に記載の情報処理方法であって、
　前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第１の処理と前記第２の処理とを切り替える
　情報処理方法。

（１５）上記（１２）から（１４）のいずれかに記載の情報処理方法であって、
　前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第１の処理と前記第２の処理とを切り替える
　情報処理方法。

（１６）上記（１５）に記載の情報処理方法であって、
　前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
　情報処理方法。

（１７）上記（１５）または（１６）に記載の情報処理方法であって、
　前記第１の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第１の情報および前記第２の情報のなかから選択する
　情報処理方法。

（１８）上記（１３）から（１７）のいずれかに記載の情報処理方法であって、
　前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
　情報処理方法。

（１９）上記（１３）から（１８）のいずれかに記載の情報処理方法であって、
　前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
　情報処理方法。

（２０）上記（１３）から（１９）のいずれかに記載の情報処理方法であって、
　前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
　情報処理方法。

（２１）上記（１３）から（２０）のいずれかに記載の情報処理方法であって、
　前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
　情報処理方法。

（２２）ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部としてコンピュータを動作させるプログラム。

（２３）上記（２２）に記載のプログラムであって、
　前記第２の処理は、選択肢形式の質問を生成する
　プログラム。

（２４）上記（２２）または（２３）に記載のプログラムであって、
　前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第１の処理と前記第２の処理とを切り替える
　プログラム。

（２５）上記（２２）から（２４）のいずれかに記載のプログラムであって、
　前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第１の処理と前記第２の処理とを切り替える
　プログラム。

（２６）上記（２５）に記載のプログラムであって、
　前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
　プログラム。

（２７）上記（２５）または（２６）に記載のプログラムであって、
　前記第１の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第１の情報および前記第２の情報のなかから選択する
　プログラム。

（２８）上記（２３）から（２７）のいずれかに記載のプログラムであって、
　前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
　プログラム。

（２９）上記（２３）から（２８）のいずれかに記載のプログラムであって、
　前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
　プログラム。

（３０）上記（２３）から（２９）のいずれかに記載のプログラムであって、
　前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
　プログラム。

（３１）上記（２３）から（３０）のいずれかに記載のプログラムであって、
　前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
　プログラム。

　１０…情報処理端末
　２０…情報処理サーバ
　３０…ネットワーク
　２１０…端末通信部
　２２０…記憶部
　２３０…提示制御部
　２４０…情報収集部
　２５０…情報解析部
　２６０…推薦部
　２７０…ユーザ履歴管理部
　２８０…反応解析部
　２９０…状況解析部
　３００…情報統合部

Claims

　ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部
　を具備する情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記第２の処理は、選択肢形式の質問を生成する
　情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第１の処理と前記第２の処理とを切り替える
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第１の処理と前記第２の処理とを切り替える
　情報処理装置。
　請求項４に記載の情報処理装置であって、
　前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記第１の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第１の情報および前記第２の情報のなかから選択する
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
　情報処理装置。
　請求項７に記載の情報処理装置であって、
　前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
　情報処理装置。
　請求項８に記載の情報処理装置であって、
　前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
　情報処理装置。
　請求項９に記載の情報処理装置であって、
　前記制御部は、前記選択肢形式の質問における選択肢内容を日時条件に基づいて選択する
　情報処理装置。
　請求項１０に記載の情報処理装置が情報処理サーバまたは情報処理端末である
　情報処理装置。
　制御部が、ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える
　情報処理方法。
　ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第１の情報または前記ユーザの嗜好に基づいて選択された第２の情報の少なくとも一方を提示する第１の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第２の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部として
　コンピュータを動作させるプログラム。