WO2020196100A1 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- WO2020196100A1 WO2020196100A1 PCT/JP2020/011743 JP2020011743W WO2020196100A1 WO 2020196100 A1 WO2020196100 A1 WO 2020196100A1 JP 2020011743 W JP2020011743 W JP 2020011743W WO 2020196100 A1 WO2020196100 A1 WO 2020196100A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- user
- information processing
- question
- information
- condition
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Abstract
この情報処理装置は、ユーザとの音声インタラクションを通じて取得した条件に基づき検索された第1の情報またはユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、検索のための条件に関する質問を生成してユーザに提示する第2の処理とを、条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える推薦部260を有する。
Description
本技術は、ユーザにより指定された条件に基づいてコンテンツの検索およびユーザの嗜好に基づいてコンテンツを選択する情報処理装置、情報処理方法及びプログラムに関する。
近年、ウェブ上に存在するショップ、レストラン、イベント、行楽スポットなどの様々な情報に関するコンテンツのなかから、ユーザにより指定された条件に合致するコンテンツの情報を検索して応答する音声対話型のアシスタントサービスが知られている。
しかし、適切な条件がユーザより与えられる場合には問題ないが、条件の表現のしかたやその選択によっては、ユーザが希望する通りの検索結果が得られるとは限らない。そこで、特許文献1には、音声認識結果に応じて地点データベースを検索する際に、候補件数が所定値より大きい場合は候補を絞り込むための条件を、What型の質問を通してユーザに出し、この質問に対するユーザの回答から条件を抽出して候補の絞り込みを行う技術が開示される。
しかしながら、ユーザから与えられる条件に基づく情報検索には、未だ不十分な点が多々あり、結果的にユーザが希望する通りの検索結果が得られずに、ユーザに大きな負担を強いる場面もあった。
本技術は、音声インラクションによる情報検索を利用するユーザの利便性の向上、並びに情報検索精度の向上を図ることのできる情報処理装置、情報処理方法及びプログラムを提供することを目的とするものである。
上記の課題を解決するために、本技術に係る一形態の情報処理装置は、ユーザとの音声インタラクションを通じて取得した条件に基づき検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部を具備する。
本技術に係る一形態の情報処理装置によれば、条件希少度に基づいて第1の処理と第2の処理とが適時切り替えられることによって、条件希少度が低いつまり情報検索結果の絞り込みが不十分な場合に、検索のための条件に関する質問を生成してユーザに提示することによってユーザに新たな条件の追加を明示的に促すことができる。
前記第2の処理は選択肢形式の質問を生成することとしてよい。
これにより、ユーザは正しい表現による条件を速やかに応答することができる。この結果、情報検索の速度および精度を共に向上させることができる。
これにより、ユーザは正しい表現による条件を速やかに応答することができる。この結果、情報検索の速度および精度を共に向上させることができる。
前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第1の処理と前記第2の処理とを切り替えるようにしてもよい。
すなわち、インタラクション進捗度が高い場合に選択肢形式の質問をユーザに提示することによって、正しい表現による条件に基づく情報検索が可能となり、ユーザの負担減に加えて、情報検索の速度向上と精度向上を期待できる。
すなわち、インタラクション進捗度が高い場合に選択肢形式の質問をユーザに提示することによって、正しい表現による条件に基づく情報検索が可能となり、ユーザの負担減に加えて、情報検索の速度向上と精度向上を期待できる。
前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第1の処理と前記第2の処理とを切り替えるものであってよい。
すなわち、ユーザ反応明確度が低い場合には、選択肢形式の質問をユーザに提示することによって、不明確な条件による情報検索を回避でき、情報検索の効率向上を図ることができる。
すなわち、ユーザ反応明確度が低い場合には、選択肢形式の質問をユーザに提示することによって、不明確な条件による情報検索を回避でき、情報検索の効率向上を図ることができる。
前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める。
ユーザの顔の向きが正面を向いていない場合や、発話内容が不明確な場合にはユーザ反応明確度が低いことを判定し、検索のための条件に関する質問を生成してユーザに提示する第2の処理を実行することによって、不明確な条件による情報検索を回避できる。
ユーザの顔の向きが正面を向いていない場合や、発話内容が不明確な場合にはユーザ反応明確度が低いことを判定し、検索のための条件に関する質問を生成してユーザに提示する第2の処理を実行することによって、不明確な条件による情報検索を回避できる。
前記第1の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第1の情報および前記第2の情報のなかから選択するようにしてもよい。
例えば、ユーザ反応明確度が低い場合には、音声インタラクションでユーザが指定した条件が妥当性を欠く可能性が高いので、この場合にはユーザの嗜好に応じた第2の情報をユーザに提示することによって、ユーザのまったく望まない情報がユーザに提示されることを回避できる。
また、インタラクション進捗度が高い場合も、ユーザの嗜好に応じた第2の情報をユーザに提示することによって、ユーザの望まない情報ばからがユーザに提示されることを回避できる。
例えば、ユーザ反応明確度が低い場合には、音声インタラクションでユーザが指定した条件が妥当性を欠く可能性が高いので、この場合にはユーザの嗜好に応じた第2の情報をユーザに提示することによって、ユーザのまったく望まない情報がユーザに提示されることを回避できる。
また、インタラクション進捗度が高い場合も、ユーザの嗜好に応じた第2の情報をユーザに提示することによって、ユーザの望まない情報ばからがユーザに提示されることを回避できる。
前記制御部は、質問の種別を分類する観点が異なる複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択するものであってよい。
前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択するものであってもよい。
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択してもよい。
前記制御部は、前記選択肢形式の質問における選択肢内容を日時条件に基づいて選択してもよい。
また、本技術に係る他の形態の情報処理方法は、制御部が、ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替えることを特徴とする。
さらに、本技術に係る他の形態のプログラムは、ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部としてコンピュータを動作させるプログラムである。
以上のように、本技術によれば、ユーザにより指定された条件に基づくコンテンツの検索およびユーザの嗜好に基づくコンテンツの選択における様々な課題を解決することができる。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。
<1.第1の実施形態>
[1-1.概要の説明]
まず、本技術の一実施形態の概要について説明する。
<1.第1の実施形態>
[1-1.概要の説明]
まず、本技術の一実施形態の概要について説明する。
図1は、ユーザから与えられた"横浜駅近くの焼肉レストラン"という条件に対してサービスによって生成された情報検索・推薦結果のページの例を示す図である。この情報検索・推薦結果のページには、上記の条件に合致した3件のコンテンツ(焼肉レストラン)の情報1、2、3が存在する。コンテンツの情報1、2、3は、スポット(焼肉レストラン)毎の例えば店名、住所、電話番号、写真、お薦めコメント、ホームページのURLなどを含む。
しかし、明確な条件がユーザより与えられる場合には問題ないが、ユーザによっては、不明確な表現の条件が指定されたり、検索結果を十分絞り込むには不向きな条件が指定される場合があり、ユーザ満足度の高い検索結果が得られない場合があり、結果的に何度も条件の指定をやり直さねばならないことがあった。
そこで本技術に係る第1の実施形態の情報処理装置は、ユーザが指定した条件に対して情報検索結果を十分に絞り込めない場合、例えば「○○、××、△△のどれがよいですか?」といった選択肢形式の質問をユーザに提示することによって、ユーザに明確な条件の指定を促す推薦部260(図5)を有する。
検索結果の絞り込みが十分かどうかを評価する指標として、本技術では「条件希少度(rarity)」が用いられる。条件希少度(rarity)は、条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である。条件希少度(rarity)は、例えば、存在する全体アイテムの数やシステムが初期条件に基づく検索によってヒットしたアイテム数などを"total"、ユーザが指定した条件に基づく検索によってヒットしたアイテム数を"hit"として、rarity=1-hit/totalなどとして定義される。この条件希少度(rarity)の値が閾値以上であるとき検索結果の絞り込みが十分であると判定され、条件希少度(rarity)の値が閾値未満のとき検索結果の絞り込みが不十分であると判定される。
本技術に係る第1の実施形態の情報処理装置は、音声インタラクションにおいて2つのモードを有する。その一つは、ユーザとの音声インタラクションを通じて取得した条件に応じた第1の情報またはユーザの嗜好に応じた第2の情報の少なくとも一方を提示する「提案モード」であり、もう一つは、検索のための条件に関する質問を生成してユーザに提示する「質問モード」である。
推薦部260は、これら提案モードと質問モードを上記の条件希少度に基づいて切り替える。より具体的には、推薦部260は条件希少度が閾値以上であるとき提案モードに切り替える。あるいは、条件希少度が閾値未満であっても、インタラクション進捗度またはユーザ反応明確度のいずれか一方がそれぞれの閾値以上である場合にも提案モードに切り替えるようにしてもよい。また、推薦部260は、条件希少度が閾値未満であるとき質問モードに切り替えてよい。あるいは、推薦部260は、条件希少度が閾値以上であっても音声インタラクション進捗度およびユーザ反応明確度がそれぞれの閾値未満であるならば質問モードに切り替えるようにしてもよい。
これにより、本技術に係る第1の実施形態の情報処理装置は、ユーザ満足度の高い情報検索・推薦結果をユーザに提供することができる。
以上、本実施形態の概要について説明した。以下、本実施形態に係る情報処理装置についてより詳細に説明する。
[1-2.システム構成例]
図2は、本実施形態に係る情報処理装置を含むシステムの構成例を示すブロック図である。
同図に示すように、本実施形態に係るシステムは、情報処理端末10および情報処理サーバ20を含む。情報処理端末10および情報処理サーバ20は、互いに通信が行えるようにネットワーク30を介して接続される。
図2は、本実施形態に係る情報処理装置を含むシステムの構成例を示すブロック図である。
同図に示すように、本実施形態に係るシステムは、情報処理端末10および情報処理サーバ20を含む。情報処理端末10および情報処理サーバ20は、互いに通信が行えるようにネットワーク30を介して接続される。
情報処理端末10は、ユーザとの音声インタラクションを通じて、情報処理サーバ20により供給された情報検索・推薦結果の提示、情報処理サーバ20により供給された質問の提示、およびこの質問に対するユーザからの回答を情報処理サーバ20に送信することが可能な装置である。また、情報処理端末10は、ユーザや周辺環境の状況を検出するための各種検出器を備え、ユーザ状況およびユーザ反応に関する各種の検出データを情報処理サーバ20にネットワーク30を介して送信することが可能である。
情報処理サーバ20は、情報処理端末10のユーザから与えられた条件やユーザの嗜好情報に基づいて情報の検索、推薦、条件に関するユーザへの質問の生成などを行う装置である。なお、本実施形態において、特許請求の範囲の情報処理装置はこの「情報処理サーバ20」にあたる。
ネットワーク30は、情報処理端末10と情報処理サーバ20とを接続する網である。ネットワーク30は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local-Area Network)、WAN(Wide-Area Network)などであってよい。また、ネットワーク30は、IP-VPN(Internet Protocol-Virtual Private Network)などの専用回線網であってよく、Wi-Fi(登録商標)、Bluetooth(登録商標)など無線通信網を含んでもよい。
[1-3.情報処理端末10の構成例]
次に、本実施形態に係る情報処理端末10の機能の詳細を説明する。
図3は、本実施形態に係る情報処理端末10の機能の構成例を示すブロック図である。同図に示すように、情報処理端末10は、表示部110、音声出力部120、音声入力部130、撮像部140、センサ部150、制御部160、およびサーバ通信部170を備える。
次に、本実施形態に係る情報処理端末10の機能の詳細を説明する。
図3は、本実施形態に係る情報処理端末10の機能の構成例を示すブロック図である。同図に示すように、情報処理端末10は、表示部110、音声出力部120、音声入力部130、撮像部140、センサ部150、制御部160、およびサーバ通信部170を備える。
表示部110は、画像やテキストなどの視覚情報を出力する機能を有する。表示部110は、例えば、情報処理サーバ20による制御に基づいて、アイテムの検索結果や推薦結果、質問に関するテキストや画像を表示する。
表示部110は、視覚情報を提示する表示デバイスなどを備える。表示デバイスには、例えば、液晶ディスプレイ(LCD:LiquidCrystal Display)装置、OLED(Organic Light Emitting Diode)装置、タッチパネルなどが挙げられる。また、本実施形態に係る表示部110は、プロジェクション機能により視覚情報を出力してもよい。
音声出力部120は、音声インタラクションのための音声を出力する。音声出力部120は、スピーカやアンプなどの音声出力装置を備える。
音声入力部130は、音声インタラクションのためのユーザの発話や情報処理端末10の周囲の音などを収集する。音声入力部130は、音情報を収集するためのマイクロフォンを備える。
撮像部140は、ユーザや情報処理端末10の周囲環境を撮像して、静止画あるいは動画を生成する機能を有する。撮像部140は、画像を撮像するCMOS(Complementary Metal Oxide Semiconductor)イメージセンサ、CCD(Charged-Coupled Devices)イメージセンサなどの撮像素子を含む。
センサ部150は、ユーザの存在の有無、顔の向き、表情などのユーザ状況や情報処理端末10の周囲環境を検出する機能を有する。センサ部150は、例えば、赤外線センサを含む光センサ、加速度センサ、ジャイロセンサ、地磁気センサ、熱センサ、振動センサ、GNSS(Global Navigation Satellite System)信号受信装置などを備える。
制御部160は、情報処理端末10が備える各ブロックの制御、表示部110に表示させる表示信号の生成、音声出力部120を駆動するための音声信号の生成、音声入力部130によって収集された音声のデータ化、撮像部140によって得られた画像のデータ化、センサ部150の検出信号のデータ化などの演算処理を行う。制御部160は、データ化された音声、映像、センサ情報を通信の高速化のために圧縮符号化する機能を有するものであってもよい。
サーバ通信部170は、ネットワーク30を介して情報処理サーバ20との間で情報通信を行う機能を有する。
なお、情報処理端末10は、例えば、音声対話型エージェント端末、あるいは音声対話型エージェント機能を有するパーソナルコンピュータ、同じく音声対話型エージェント機能を有する携帯電話、スマートホン、タブレット端末、ウエラブル端末、各種の家電機器、据え置き型または自律移動型の専用装置であってもよい。
以上、本実施形態に係る情報処理端末10の機能構成例について説明した。なお、図3を用いて説明した情報処理端末10の機能構成はあくまで一例であり、上記の構成に限定されない。例えば、情報処理端末10は、図3に示す構成のすべてを必ずしも備えなくてもよい。また、情報処理端末10の制御部160は、後述する情報処理サーバ20の提示制御部230と同等の機能を有するものであってもよい。この場合には情報処理端末10が本技術に係る特許請求の範囲における「情報処理装置」にあたる。
[1-4.情報処理サーバ20の構成例]
次に、本実施形態に係る情報処理サーバ20の機能構成例について詳細に説明する。
図4は、本実施形態に係る情報処理サーバ20の機能構成例を示すブロック図である。同図に示すように、本実施形態に係る情報処理サーバ20は、端末通信部210、記憶部220、および提示制御部230を備える。
次に、本実施形態に係る情報処理サーバ20の機能構成例について詳細に説明する。
図4は、本実施形態に係る情報処理サーバ20の機能構成例を示すブロック図である。同図に示すように、本実施形態に係る情報処理サーバ20は、端末通信部210、記憶部220、および提示制御部230を備える。
端末通信部210は、ネットワーク30を介して情報処理端末10との情報通信を行う機能を有する。
記憶部220は、提示制御部230の処理に用いられるプログラムや演算パラメータ等を記憶するROM(Read Only Memory)、および適宜変化するパラメータ等のデータを一時記憶するRAM(Random-Access Memory)などを含む。
提示制御部230は、情報処理端末10のユーザに対する情報検索・推薦結果の生成とその提示、さらには情報検索のための条件に関する質問の生成およびその提示を制御する。また、提示制御部230は、情報処理端末10から取得した各種の検出データに基づきユーザ状況およびユーザ反応の解析、これらの解析結果からのインタラクション進捗度およびユーザ反応明確度の算出、さらには条件希少度の算出、そして条件希少度、インタラクション進捗度およびユーザ反応明確度に基づいて提案モードと質問モードとの切り替えの制御を行う。
なお、本明細書において検索・推薦対象の情報は、ウェブページなどを通してその存在などが公開された一つ一つのショップ、レストラン、サービス、イベント、行楽スポットなどを指す。例えば、レストランの場合、"和食○○亭横浜店"、"横浜××中華"、"洋食△△横浜店"といった店舗などが、本システムによる検索・推薦対象である。
[1-5.提示制御部230の構成例]
次に、情報処理サーバ20における提示制御部230の構成の詳細を説明する。
図5は、本実施形態に係る提示制御部230の機能構成例を示すブロック図である。同図に示すように、提示制御部230は、情報収集部240、情報解析部250、推薦部260、ユーザ履歴管理部270、反応解析部280、状況解析部290および情報統合部300を備える。
次に、情報処理サーバ20における提示制御部230の構成の詳細を説明する。
図5は、本実施形態に係る提示制御部230の機能構成例を示すブロック図である。同図に示すように、提示制御部230は、情報収集部240、情報解析部250、推薦部260、ユーザ履歴管理部270、反応解析部280、状況解析部290および情報統合部300を備える。
(情報収集部240)
情報収集部240は、例えば、ウェブページなどのコンテンツ情報から、マークアップ解析や構文解析などによって個々のコンテンツのメタデータを収集する。「コンテンツのメタデータ」とは、例えば、レストランなどのコンテンツの名前(店舗名)、場所、カテゴリ、電話番号、予算、評価、口コミなど、そのコンテンツに関するデータである。
情報収集部240は、例えば、ウェブページなどのコンテンツ情報から、マークアップ解析や構文解析などによって個々のコンテンツのメタデータを収集する。「コンテンツのメタデータ」とは、例えば、レストランなどのコンテンツの名前(店舗名)、場所、カテゴリ、電話番号、予算、評価、口コミなど、そのコンテンツに関するデータである。
(情報解析部250)
情報解析部250は、情報収集部240により収集されたコンテンツのメタデータを解析して情報推薦のためのマッチング用データを生成する。情報解析部250は、より具体的には、メタデータの属性値ごとにスコアを持つベクトル(コンテンツプロファイル)をマッチング用データとして得るものであってよい(例えば特開2005-176404号公報)。
情報解析部250は、情報収集部240により収集されたコンテンツのメタデータを解析して情報推薦のためのマッチング用データを生成する。情報解析部250は、より具体的には、メタデータの属性値ごとにスコアを持つベクトル(コンテンツプロファイル)をマッチング用データとして得るものであってよい(例えば特開2005-176404号公報)。
(メタデータの構造)
図6および図7にメタデータの構造を示す。
なお、本例は、レストランのコンテンツを対象としたものである。
メタデータは、「Id」、「ContentVector」、「ContentInfo」を含む。
図6および図7にメタデータの構造を示す。
なお、本例は、レストランのコンテンツを対象としたものである。
メタデータは、「Id」、「ContentVector」、「ContentInfo」を含む。
「Id」は対象コンテンツを一意に識別する情報である。本例では、「Id」の値としてレストランに割り当てられた"restaurantId"が登録される。
「ContentVector」は、コンテンツ間の類似性や、コンテンツとユーザの嗜好情報との関連性を算出するために用いられるデータである。「ContentVector」には、例えば、コンテンツの名前(name)、コンテンツのピーアール説明(prShort、prLong)、コンテンツのシステム上の定義などを含む。コンテンツのシステム上の定義には、大カテゴリである「bloadcategory」、中カテゴリである「stylecategory」、汎用カテゴリである「nudgecategory」、小カテゴリである「servicecategory」などがある。
ContentInfoは、コンテンツ(レストラン)の場所、電話番号、営業時間、住所、料金、緯度経度、ホームページのURL、評価、口コミなどの詳細情報である。
なお、ContentVectorとContentInfoの区別はあくまで一例である。ContentVectorとContentInfoとは、一部重複していてもよいし、用途に応じて適宜定義してもよい。また、string型のテキストは形態素解析され、キーワードのベクトル「(キーワード,頻度)」として表現される。
口コミや紹介文などに対するクラスタリングにおいては、潜在トピックモデルの手法としてテキスト分類で広く用いられるPLSA(Probabilistic Latent Semantic-Analysis)やLDA(Latent Dirichlet-Allocation)を利用してもよい。PLSAの詳細に関しては、非特許文献1:Thomas Hofmann,"Probabilistic latent semantic indexing",1999,Proceedings of the 22nd annual international ACM SIGIR conference ON Research and development in information retrievalが参照される。また、LDAの詳細に関しては、非特許文献2:David M. Blei, Andrew Y.Ng, Michael I. Jordan, "Latent Dirichlet Allocation", 2003, Journal of Machine Learning Research, Volume 3が参照される。
PLSAにおいては、例えば紹介文dにおける単語wの生起確率p(w|d)を潜在トピックzを用いて下記式のように表現する。
p(w|d)=Σp(w|z)p(z|d)
p(w|d)=Σp(w|z)p(z|d)
つまり、潜在トピックzを紹介文および単語が生起する潜在トピックと考えて、紹介文における単語の生起確率を「潜在トピックごとの単語生起確率」と「紹介文のトピック帰属確率」に分解することができる。トピックzの次元数を5とした場合、あるスポットの紹介に関するトピックの帰属確率は{0.4,0.1,0.7,0.2,0.5}のように表現され、これがクラスタリングの結果となる。
図8にbloadcategoryの例を示す。
bloadcategoryは、コンテンツが属する大カテゴリである。レストランの大カテゴリには例えば「和食」、「洋食」、「アジア料理」などがある。
bloadcategoryは、コンテンツが属する大カテゴリである。レストランの大カテゴリには例えば「和食」、「洋食」、「アジア料理」などがある。
図9にstylecategoryの例を示す。
stylecategoryは、コンテンツが属する中カテゴリであり、例えば料理を「エスニック料理」、「飲み屋」、「うどん・そば」、「カレー」などのように、料理のスタイルによって、より細かく分類したカテゴリである。
stylecategoryは、コンテンツが属する中カテゴリであり、例えば料理を「エスニック料理」、「飲み屋」、「うどん・そば」、「カレー」などのように、料理のスタイルによって、より細かく分類したカテゴリである。
図10にnudgecategoryの例を示す。
nudgecategoryは、アイテム(レストラン)の汎用的に分類したカテゴリである。
nudgecategoryは、アイテム(レストラン)の汎用的に分類したカテゴリである。
図11にservicecategoryの例を示す。
servicecategoryは、アイテムを料理の具体的な種類によって細かく分類したカテゴリである。
以上が、情報解析部250と情報解析部250によって得られるメタデータの説明である。
servicecategoryは、アイテムを料理の具体的な種類によって細かく分類したカテゴリである。
以上が、情報解析部250と情報解析部250によって得られるメタデータの説明である。
(推薦部260)
推薦部260は、ユーザ履歴管理部270で管理されたユーザ履歴に含まれるユーザ行動履歴を分析して得たユーザの嗜好情報であるユーザプリファレンスと、上記のコンテンツプロファイルとをマッチングしてコンテンツの推薦結果を生成する。ここで、ユーザの嗜好情報であるユーザプリファレンスは、当該ユーザの履歴(図12)に記述された操作対象のアイテムIDに対応するコンテンツのメタデータあるいはコンテンツプロファイルの重み付け和から生成される。ユーザプリファレンスとコンテンツプロファイルとのマッチングをとる方法としては、例えば、ユーザプリファレンスとコンテンツプロファイルとの間で項目ごとに内積を演算し、内積の総和を推薦スコアとして算出する手法などがある(例えば特開2005-176404号公報)。この方法では、推薦スコアがより高いコンテンツプロファイルのコンテンツが推薦結果とされる。
推薦部260は、ユーザ履歴管理部270で管理されたユーザ履歴に含まれるユーザ行動履歴を分析して得たユーザの嗜好情報であるユーザプリファレンスと、上記のコンテンツプロファイルとをマッチングしてコンテンツの推薦結果を生成する。ここで、ユーザの嗜好情報であるユーザプリファレンスは、当該ユーザの履歴(図12)に記述された操作対象のアイテムIDに対応するコンテンツのメタデータあるいはコンテンツプロファイルの重み付け和から生成される。ユーザプリファレンスとコンテンツプロファイルとのマッチングをとる方法としては、例えば、ユーザプリファレンスとコンテンツプロファイルとの間で項目ごとに内積を演算し、内積の総和を推薦スコアとして算出する手法などがある(例えば特開2005-176404号公報)。この方法では、推薦スコアがより高いコンテンツプロファイルのコンテンツが推薦結果とされる。
推薦部260は、推薦条件別に推薦結果を生成するために、条件の候補として、例えば季節(春、夏、秋、冬)、期間(日帰り、一泊、二泊以上)、目的(家族旅行、夫婦で外食、家族で外食、家族でお出かけ)があるとすると、ユーザ履歴から条件の組み合わせを複数生成する。例えば、「季節:春」、「期間:日帰り」、「目的:家族で外食」といった第1の組み合わせ、「季節:夏」、「期間:二泊以上」、「目的:家族旅行」といった第2の組み合わせ、さらには「季節:冬」、「期間:日帰り」、「目的:家族でお出かけ」といった第3の組み合わせなどが生成される。
推薦部260は、各々の組み合わせに対して、例えば次のような推薦結果を生成する。
・第1の組み合わせ、
第1位:焼肉屋ABC
第2位:和食亭ABC
第3位:イタリアンABC
・第2の組み合わせ
第1位:ABCホテル
第2位:ABC旅館
第3位:ABC遊園地
・第3の組み合わせ
第1位:ABCコンサート
第2位:ABC水族館
第3位:ABC博物館
・第1の組み合わせ、
第1位:焼肉屋ABC
第2位:和食亭ABC
第3位:イタリアンABC
・第2の組み合わせ
第1位:ABCホテル
第2位:ABC旅館
第3位:ABC遊園地
・第3の組み合わせ
第1位:ABCコンサート
第2位:ABC水族館
第3位:ABC博物館
このように組み合わせ毎の推薦結果を生成する際、推薦部260は、既にユーザが訪れたことのあるスポットを推薦結果に含まないなど、所定のフィルタを設定してもよい。
なお、推薦部260は、複数のユーザプリファレンスに基づいてユーザグループ(家族、友達グループ等)に対する推薦結果の生成を行うことも可能である。
また、推薦部260は、音声インタラクションを通じてユーザにより指定された条件に合った情報(コンテンツ)を検索してユーザに提示することが可能である。この際、推薦部260は、上記の条件希少度、インタラクション進捗度、またはユーザ反応明確度に基づいて「提案モード」と「質問モード」とで切り替えを行う。「提案モード」が設定された場合には、音声インタラクションを通じてユーザにより指定された条件に合った情報または上記の推薦結果の少なくとも一方をユーザに提示する。また、推薦部260は、「質問モード」が設定された場合には、検索のための新たな条件をユーザに指定してもらうための質問を生成し、ユーザに提示するように制御を行う。
(ユーザ履歴管理部270)
ユーザ履歴管理部270は、情報処理端末10のユーザがアクセスしたインターネット上のコンテンツに対するユーザ行動を、反応解析部280によって得られたユーザ反応、状況解析部290によって得られたユーザ状況などの情報とともにユーザ履歴として蓄積して管理する。
ユーザ履歴管理部270は、情報処理端末10のユーザがアクセスしたインターネット上のコンテンツに対するユーザ行動を、反応解析部280によって得られたユーザ反応、状況解析部290によって得られたユーザ状況などの情報とともにユーザ履歴として蓄積して管理する。
図12にユーザ履歴であるユーザ反応(feedback)のデータ構造の一例を示す。同図に示すように、ユーザ履歴であるユーザ反応(feedback)は、ユーザIDと、ユーザ反応の種類を示すフィードバックタイプ(feedbackType)と、対象コンテンツのIDと、対象コンテンツのカテゴリ属性を識別するIDと、属性値と、閲覧中のユーザの発言内容などのテキストと、登録日時などを含む。ユーザ反応の種類を示すフィードバックタイプ(feedbackType)には、お出かけ先スケジュールへの登録、お出かけ先ウィッシュリストへの追加、お出かけ先へ実際に出かけたこと、当該スポットを登録済みの出かけ先の一覧画面を見たこと、当該スポットを登録済みの出かけ先の詳細画面を見たこと、音声インタラクションの発話に対してユーザが回答したこと、などがある。
(反応解析部280)
反応解析部280は、情報処理端末10からの取得した各種検出データに基づいて、インターネット上のコンテンツの閲覧時、スケジュールの登録・閲覧時、音声インタラクション時などにおけるユーザの反応を解析する。ユーザの反応を解析するために、反応解析部280は、例えば、情報処理端末10のカメラによって撮像されるユーザの顔の向きや表情を認識する機能、情報処理端末10のマイクによって得られるユーザの発話内容を解析する機能、ユーザより入力されたテキストの内容(文言)を解析する機能、生体反応測定器による脈拍(数、波形)、血圧などを解析する機能などを備える。
反応解析部280は、情報処理端末10からの取得した各種検出データに基づいて、インターネット上のコンテンツの閲覧時、スケジュールの登録・閲覧時、音声インタラクション時などにおけるユーザの反応を解析する。ユーザの反応を解析するために、反応解析部280は、例えば、情報処理端末10のカメラによって撮像されるユーザの顔の向きや表情を認識する機能、情報処理端末10のマイクによって得られるユーザの発話内容を解析する機能、ユーザより入力されたテキストの内容(文言)を解析する機能、生体反応測定器による脈拍(数、波形)、血圧などを解析する機能などを備える。
(状況解析部290)
状況解析部290は、情報処理端末10からの取得した各種検出データに基づいて、インターネット上のコンテンツの閲覧時、スケジュールの登録・閲覧時、音声インタラクション時などにおけるユーザの状況を解析する。ユーザの状況を解析するために、状況解析部290は、例えば、情報処理端末10のカメラによって撮像される映像などからのユーザの在/不在を判定する機能、情報処理端末10(ユーザ)の位置情報を取得するGPS受信機能などを備える。
状況解析部290は、情報処理端末10からの取得した各種検出データに基づいて、インターネット上のコンテンツの閲覧時、スケジュールの登録・閲覧時、音声インタラクション時などにおけるユーザの状況を解析する。ユーザの状況を解析するために、状況解析部290は、例えば、情報処理端末10のカメラによって撮像される映像などからのユーザの在/不在を判定する機能、情報処理端末10(ユーザ)の位置情報を取得するGPS受信機能などを備える。
(情報統合部300)
情報統合部300は、上記各部の間での情報の受け渡しや、情報処理端末10との情報通信を制御する。情報統合部300は、例えば、情報収集部240が収集したメタデータを情報解析部250に出力したり、情報解析部250が解析した情報(コンテンツプロファイル)を推薦部260に出力する。また、情報統合部300は、ユーザ履歴管理部270が管理するユーザ履歴を推薦部260に出力する。また、情報統合部300は、反応解析部280が得たユーザ反応および状況解析部290が得たユーザ状況を推薦部260に出力する。
情報統合部300は、上記各部の間での情報の受け渡しや、情報処理端末10との情報通信を制御する。情報統合部300は、例えば、情報収集部240が収集したメタデータを情報解析部250に出力したり、情報解析部250が解析した情報(コンテンツプロファイル)を推薦部260に出力する。また、情報統合部300は、ユーザ履歴管理部270が管理するユーザ履歴を推薦部260に出力する。また、情報統合部300は、反応解析部280が得たユーザ反応および状況解析部290が得たユーザ状況を推薦部260に出力する。
[1-6.メタデータ解析から推薦結果決定までの処理]
次に、本実施形態に係るメタデータ解析から推薦結果決定までの処理の流れの例を説明する。
図13は情報処理サーバ20によるメタデータ解析から推薦結果決定までの処理の流れを示すフローチャートである。
このフローは、例えば次に挙げるようなトリガで開始される。
1.例えば1日一回、1時間一回などのように周期的。
2.収集されたメタデータに更新が発生したとき。
3.ユーザ反応履歴(feedback)がn件以上追加されたとき。
これら1から3のトリガは2つ以上組み合わせてもよい。
次に、本実施形態に係るメタデータ解析から推薦結果決定までの処理の流れの例を説明する。
図13は情報処理サーバ20によるメタデータ解析から推薦結果決定までの処理の流れを示すフローチャートである。
このフローは、例えば次に挙げるようなトリガで開始される。
1.例えば1日一回、1時間一回などのように周期的。
2.収集されたメタデータに更新が発生したとき。
3.ユーザ反応履歴(feedback)がn件以上追加されたとき。
これら1から3のトリガは2つ以上組み合わせてもよい。
情報解析部250は、上記のトリガが成立したことを判断すると(ステップS101のY)、情報収集部240により収集されたコンテンツのメタデータの解析を開始して、コンテンツプロファイルを作成する(ステップS102)。
次に、推薦部260は推薦を実行するか否かを判定する(ステップS103)。この判定は、後述する提案モードの実行時にインタラクション進捗度とユーザ反応明確度の2つのパラメータに基づいて行われる。この動作については後で詳細を説明する。推薦部260は、推薦を行わないことを判定した場合(ステップS103のNo)、提示制御部230は処理を終了する。
推薦を実行することが判定された場合(ステップS103のYes)、推薦部260は、ユーザ履歴管理部270からユーザ履歴を取得する(ステップS104)。この際、推薦部260は、所定のフィードバックタイプをもつユーザ履歴の対象スポットのアイテムIDに対応するコンテンツプロファイルを取得し、当該コンテンツプロファイルに基づいてユーザの嗜好情報であるユーザプリファレンスを生成する。なお、その際、フィードバックタイプは複数選択されてもよく、あるいはフィードバックタイプ毎の重み付けがされてユーザプリファレンスが生成されてもよい。
次に、推薦部260は、推薦条件の設定を行う(ステップS105)。推薦条件には、例えば、上述したように、日時、期間、目的などが含まれる。次いで推薦部260は、設定した推薦条件に基づいて、推薦スコアを算出し(ステップS106)、算出した推薦スコアとともに推薦結果を記憶部220(図4)に保存する(ステップS107)。
(推薦スコアの算出の具体例)
続いて、推薦スコアの算出について具体例を挙げて説明する。
情報解析部250は、ステップS102において下記のようなコンテンツプロファイルを生成する。
スポットA:
{温泉=1.0,草津=1.0,露天風呂=0.6,バイキング=0.4,マッサージ=0.2}[緯度=xxx,経度=xxx,人気=4.1,大人料金=15,000円,子供料金=10,000円]
スポットB:
{テーマパーク=1.0,富士=1.0,サファリ=0.8,体験=0.5,バス=0.3}[緯度=xxx, 経度=xxx, 人気=4.4,大人料金=27,000円, 子供金=1,500円]
スポットC:
{キャンプ場=1.0,丹沢=1.0,ドッグラン=0.7,コテージ=0.5,パン=0.4,}[緯度=xxx,経度=xxx,人気=3.6,料金=4,000円]
続いて、推薦スコアの算出について具体例を挙げて説明する。
情報解析部250は、ステップS102において下記のようなコンテンツプロファイルを生成する。
スポットA:
{温泉=1.0,草津=1.0,露天風呂=0.6,バイキング=0.4,マッサージ=0.2}[緯度=xxx,経度=xxx,人気=4.1,大人料金=15,000円,子供料金=10,000円]
スポットB:
{テーマパーク=1.0,富士=1.0,サファリ=0.8,体験=0.5,バス=0.3}[緯度=xxx, 経度=xxx, 人気=4.4,大人料金=27,000円, 子供金=1,500円]
スポットC:
{キャンプ場=1.0,丹沢=1.0,ドッグラン=0.7,コテージ=0.5,パン=0.4,}[緯度=xxx,経度=xxx,人気=3.6,料金=4,000円]
また、推薦部260は、ステップS104において、下記のようなユーザ履歴を取得する。なお、ここでは、フィードバックタイプとしてスケジュール登録が行われたスポットに対する操作履歴を取得している。
2015/05 「家族で旅行」-> 一泊,スポットX:
{温泉=1.0,熱海=1.0,露天風呂=0.6,イタリアン=0.4,エステ=0.1}[緯度=xxx,経度=xxx,人気=3.8,大人料金=12,000円,子供料金=8,000]
2016/05「家族で旅行」-> 一泊,スポットY:
{温泉=1.0,那須高原=1.0, コテージ=0.5,和食=0.3,マッサージ=0.2}[緯度=xxx, 経度=xxx,人気=4.2,大人料金=16,000円, 子供料金=10,000]
2016/11「親子でお出かけ」-> 一泊,スポットZ:
{キャンプ場=1.0,南房総=1.0,釣り=0.7,テント=0.3,ハイキング=0.2}[緯度=xxx,経度=xxx,人気=3.7,料金=5,000円]
2015/05 「家族で旅行」-> 一泊,スポットX:
{温泉=1.0,熱海=1.0,露天風呂=0.6,イタリアン=0.4,エステ=0.1}[緯度=xxx,経度=xxx,人気=3.8,大人料金=12,000円,子供料金=8,000]
2016/05「家族で旅行」-> 一泊,スポットY:
{温泉=1.0,那須高原=1.0, コテージ=0.5,和食=0.3,マッサージ=0.2}[緯度=xxx, 経度=xxx,人気=4.2,大人料金=16,000円, 子供料金=10,000]
2016/11「親子でお出かけ」-> 一泊,スポットZ:
{キャンプ場=1.0,南房総=1.0,釣り=0.7,テント=0.3,ハイキング=0.2}[緯度=xxx,経度=xxx,人気=3.7,料金=5,000円]
また、推薦部260は、ステップS105において、下記のような推薦条件を設定する。
日時:2017/05/01=[春],期間:[一泊],目的:[家族で旅行]
日時:2017/05/01=[春],期間:[一泊],目的:[家族で旅行]
次に、推薦部260は、ステップS106において、下記のように推薦スコアを算出する。なお、下記におけるUPとは、ユーザプリファレンスを示す。
UP[春]=スポットX+スポットY:
{温泉=2.0,熱海=1.0,那須高原=1.0,露天風呂=0.6,イタリアン=0.4,エステ=0.1,コテージ=0.5,和食=0.3,マッサージ=0.2}
UP[春]とスポットA,B,C間でベクトルcos演算:
・UP-A:{1.0*2.0(温泉)+0.6*0.6(露天風呂)+0.2*0.2(マッサージ)}/{√(2.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22)(UPノルム)*√(1.02+1.02+0.62+0.42+0.22)(Aノルム)}=2.4/{√6.91*√2.56}=0.570
・UP-B:0.00(共通メタデータなし)
・UP-C:{0.5*0.5(コテージ)/{√(2.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22)(UPノルム)* √(1.02+1.02+0.72+0.52+0.42)(Cノルム)}=0.25/{√6.91*√2.9} =0.055
UP[春]=スポットX+スポットY:
{温泉=2.0,熱海=1.0,那須高原=1.0,露天風呂=0.6,イタリアン=0.4,エステ=0.1,コテージ=0.5,和食=0.3,マッサージ=0.2}
UP[春]とスポットA,B,C間でベクトルcos演算:
・UP-A:{1.0*2.0(温泉)+0.6*0.6(露天風呂)+0.2*0.2(マッサージ)}/{√(2.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22)(UPノルム)*√(1.02+1.02+0.62+0.42+0.22)(Aノルム)}=2.4/{√6.91*√2.56}=0.570
・UP-B:0.00(共通メタデータなし)
・UP-C:{0.5*0.5(コテージ)/{√(2.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22)(UPノルム)* √(1.02+1.02+0.72+0.52+0.42)(Cノルム)}=0.25/{√6.91*√2.9} =0.055
UP[一泊]=スポットX+スポットY+スポットZ:
{温泉=2.0,キャンプ場=1.0,熱海=1.0,那須高原=1.0,南房総=1.0,露天風呂=0.6,イタリアン=0.4,エステ=0.1,コテージ=0.5,和食=0.3,マッサージ=0.2,釣り=0.7,テント=0.3,ハイキング=0.2}
UP[一泊]とスポットA,B,C間でベクトルcos演算:
・UP-A:{1.0*2.0(温泉)+0.6*0.6(露天風呂)+0.2*0.2(マッサージ)}/{√(2.02+1.02+1.02+1.02+1.02+0.62+0.42+0.12+0.5v+0.32+0.22+0.72+0.32+0.22)(UPノルム)*√(1.02+1.02+0.62+0.42+0.22)(Aノルム)}=2.4/{√9.53*√2.56}=0.485
・UP-B:0.00(共通メタデータなし)
・UP-C:{1.0*1.0(キャンプ場)+0.5*0.5(コテージ)/{√(2.02+1.02+1.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22+0.72+0.32+0.22)(UPノルム)* √(1.02+1.02+0.72+0.52+0.42)(Cノルム)}=1.25/{√9.53*√2.9}=0.237
{温泉=2.0,キャンプ場=1.0,熱海=1.0,那須高原=1.0,南房総=1.0,露天風呂=0.6,イタリアン=0.4,エステ=0.1,コテージ=0.5,和食=0.3,マッサージ=0.2,釣り=0.7,テント=0.3,ハイキング=0.2}
UP[一泊]とスポットA,B,C間でベクトルcos演算:
・UP-A:{1.0*2.0(温泉)+0.6*0.6(露天風呂)+0.2*0.2(マッサージ)}/{√(2.02+1.02+1.02+1.02+1.02+0.62+0.42+0.12+0.5v+0.32+0.22+0.72+0.32+0.22)(UPノルム)*√(1.02+1.02+0.62+0.42+0.22)(Aノルム)}=2.4/{√9.53*√2.56}=0.485
・UP-B:0.00(共通メタデータなし)
・UP-C:{1.0*1.0(キャンプ場)+0.5*0.5(コテージ)/{√(2.02+1.02+1.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22+0.72+0.32+0.22)(UPノルム)* √(1.02+1.02+0.72+0.52+0.42)(Cノルム)}=1.25/{√9.53*√2.9}=0.237
UP[家族で旅行]=スポットX+スポットY:
{温泉=2.0,熱海=1.0,那須高原=1.0,露天風呂=0.6,イタリアン=0.4,エステ=0.1,コテージ=0.5,和食=0.3,マッサージ=0.2}
UP[春]とスポットA,B,C間でベクトルcos演算:
・UP-A:{1.0*2.0(温泉)+0.6*0.6(露天風呂)+0.2*0.2(マッサージ)}/{√(2.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22)(UPノルム)*√(1.02+1.02+0.62+0.42+0.22)(Aノルム)}=2.4/{√6.91*√2.56}=0.570
・UP-B:0.00(共通メタデータなし)
・UP-C:{0.5*0.5(コテージ)/{√(2.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22)(UPノルム)*√(1.02+1.02+0.72+0.52+0.42)(Cノルム)}=0.25/{√6.91*√2.9}=0.055
{温泉=2.0,熱海=1.0,那須高原=1.0,露天風呂=0.6,イタリアン=0.4,エステ=0.1,コテージ=0.5,和食=0.3,マッサージ=0.2}
UP[春]とスポットA,B,C間でベクトルcos演算:
・UP-A:{1.0*2.0(温泉)+0.6*0.6(露天風呂)+0.2*0.2(マッサージ)}/{√(2.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22)(UPノルム)*√(1.02+1.02+0.62+0.42+0.22)(Aノルム)}=2.4/{√6.91*√2.56}=0.570
・UP-B:0.00(共通メタデータなし)
・UP-C:{0.5*0.5(コテージ)/{√(2.02+1.02+1.02+0.62+0.42+0.12+0.52+0.32+0.22)(UPノルム)*√(1.02+1.02+0.72+0.52+0.42)(Cノルム)}=0.25/{√6.91*√2.9}=0.055
以上の演算により、下記のような推薦スコアが算出される。
UP-A[総合]=UP-A[春]+UP-A[一泊]+UP-A[家族で旅行]=0.570+0.485+0.570=1.625
UP-B[総合]=UP-B[春]+UP-B[一泊]+UP-B[家族で旅行]=0.000+0.000+0.000=0.000
UP-C[総合]=UP-C[春]+UP-C[一泊]+UP-C[家族で旅行]=0.055+0.237+0.055=0.347
UP-A[総合]=UP-A[春]+UP-A[一泊]+UP-A[家族で旅行]=0.570+0.485+0.570=1.625
UP-B[総合]=UP-B[春]+UP-B[一泊]+UP-B[家族で旅行]=0.000+0.000+0.000=0.000
UP-C[総合]=UP-C[春]+UP-C[一泊]+UP-C[家族で旅行]=0.055+0.237+0.055=0.347
なお、推薦部260は、算出した推薦スコアに基づいて対象スポットの絞り込みを行ってもよい。推薦部260は、例えば、人気=3.5未満のものは推薦結果から除外するなどの条件フィルタリングを行うことができる。
本実施形態に係るユーザには、ユーザ個人および当該ユーザが属するユーザグループの両方が含まれてよい。
例えば、ユーザ個人が家庭における妻である場合、ユーザ個人が自身のために望む情報と、ユーザグループすなわち家族のために望む情報とには、差異があることが想定される。このため、本実施形態に係る推薦部260は、ユーザ個人またはユーザグループのいずれかを対象に推薦スコアを算出して推薦スポットを決定してもよい。
以上、メタデータ解析から推薦結果決定までの処理の詳細を説明した。
以上、メタデータ解析から推薦結果決定までの処理の詳細を説明した。
[1-5.音声インタラクションによる検索]
次に、本実施形態に係る音声インタラクションによるコンテンツ検索について説明する。
図14は、音声インタラクションによるコンテンツ検索の全体的な流れを示すフローチャートである。
まず、ユーザが情報処理端末10の前に現れたことがカメラ、赤外線センサ、あるいは超音波センサなどの人感センサによって検出されること、あるいはユーザが情報処理端末10に向けて所定の発話を行うことなどによって、音声インタラクションによるコンテンツ検索が起動される。
次に、本実施形態に係る音声インタラクションによるコンテンツ検索について説明する。
図14は、音声インタラクションによるコンテンツ検索の全体的な流れを示すフローチャートである。
まず、ユーザが情報処理端末10の前に現れたことがカメラ、赤外線センサ、あるいは超音波センサなどの人感センサによって検出されること、あるいはユーザが情報処理端末10に向けて所定の発話を行うことなどによって、音声インタラクションによるコンテンツ検索が起動される。
音声インタラクションによるコンテンツ検索が起動されると、状況解析部290によるユーザ状況(音声インタラクション環境にユーザが存在するか、ユーザの顔の向きなど)の解析が行われる。状況解析部290によって得られたユーザ状況解析結果は情報統合部300によって推薦部260に供給される(ステップS201)。
さらに、反応解析部280によって、音声インタラクションにおけるユーザ反応の解析が行われ、その解析結果は情報統合部300によって推薦部260に供給される(ステップS202)。
続いて音声インタラクションの終了条件の成立の有無が判定される(ステップS203)。この音声インタラクションを終了条件の成立判定について後で説明する。
音声インタラクションの終了条件が成立しない場合(ステップS203のN)、推薦部260は、上記の条件希少度を算出し、算出された条件希少度が条件希少度評価のための閾値以上であるかどうかを判定する(ステップS204)。条件希少度とその算出方法の詳細については後で説明する。
推薦部260は、条件希少度が条件希少度評価のための閾値以上である場合(ステップS204のY)、提案モードのフローに従って、ユーザに提案するスポットを決定し、その結果を情報処理端末10のユーザに提示する(ステップS208)。この質問モードの処理の詳細については後で説明する。また、推薦部260は、条件希少度が条件希少度評価のための閾値以上ではない場合(ステップS204のN)、次いで、インタラクション進捗度を算出し、その結果がインタラクション進捗度評価のための閾値以上であるかどうかを判定する(ステップS205)。
推薦部260は、インタラクション進捗度がインタラクション進捗度評価のための閾値以上である場合(ステップS205のY)、前記同様に提案モードの処理に移行する(ステップS208)。推薦部260は、インタラクション進捗度がインタラクション進捗度評価のための閾値以上ではない場合(ステップS205のN)、ユーザ反応明確度を算出し、その結果がユーザ反応明確度評価のための閾値以上であるかどうかを判定する(ステップS206)。
推薦部260は、ユーザ反応明確度がユーザ反応明確度評価のための閾値以上である場合(ステップS206のY)、前記同様に提案モードの処理に移行する(ステップS208)。また、推薦部260は、ユーザ反応明確度がユーザ反応明確度評価のための閾値以上でない場合には(ステップS206のN)、質問モードによる処理を実行する(ステップS207)。
なお、上記のフローにおいて、ステップS204の条件希少度の評価、ステップS205のインタラクション進捗度の評価、ステップS206のユーザ反応明確度の評価の順番はこれに限定されない。これら3つの評価はどのような順番で行われてもよい。例えば、条件希少度の評価、ユーザ反応明確度の評価、インタラクション進捗度の評価の順、あるいはインタラクション進捗度の評価、ユーザ反応明確度の評価、条件希少度の評価の順、あるいは、インタラクション進捗度の評価、条件希少度の評価、ユーザ反応明確度の評価の順、あるいはユーザ反応明確度の評価、条件希少度の評価、インタラクション進捗度の評価の順、あるいはユーザ反応明確度の評価、インタラクション進捗度の評価、条件希少度の評価の順であってもよい。
(音声インタラクションの終了条件)
次に、ステップS203の音声インタラクションの終了条件について説明する。
音声インタラクションの終了条件には、ユーザ状況とユーザ反応にそれぞれ関して別々の条件が設定される。ユーザ状況の終了条件としては、例えば、連続して所定時間以上ユーザが状況解析部290によって検出されないことなど、ユーザ状況に基づいて検出する方法などが挙げられる。また、ユーザ反応の終了条件としては、ユーザが顔認識によって検出されたとしても連続して所定時間以上ユーザの発話が反応解析部280によって検出されないことなど、ユーザ反応に基づいて検出する方法などが挙げられる。推薦部260は、例えば、少なくともいずれか一方の終了条件が成立したことを、音声インタラクションの終了条件が成立したこととして判定する。
次に、ステップS203の音声インタラクションの終了条件について説明する。
音声インタラクションの終了条件には、ユーザ状況とユーザ反応にそれぞれ関して別々の条件が設定される。ユーザ状況の終了条件としては、例えば、連続して所定時間以上ユーザが状況解析部290によって検出されないことなど、ユーザ状況に基づいて検出する方法などが挙げられる。また、ユーザ反応の終了条件としては、ユーザが顔認識によって検出されたとしても連続して所定時間以上ユーザの発話が反応解析部280によって検出されないことなど、ユーザ反応に基づいて検出する方法などが挙げられる。推薦部260は、例えば、少なくともいずれか一方の終了条件が成立したことを、音声インタラクションの終了条件が成立したこととして判定する。
なお、音声インタラクションの終了条件は上記に限定されず、例えば、連続して所定時間以上カメラの撮影画像あるいは音声などからユーザ状況に変化がないことを、音声インタラクションの終了条件としてもよい。
(条件希少度の算出・評価方法)
条件希少度とは、コンテンツ検索において検索結果の絞り込みが十分であるかどうかを評価すための指標値である。条件希少度は、例えば、次のように求められ、評価される。
検索対象のコンテンツ総数(情報母体数)をtotal、ユーザが指定した条件にヒットしたコンテンツ数をhit、条件希少度をrarityをとすると、
hit=0のとき、rarity=0とし、
hit>0のとき、rarity=1-hit/totalとする。
具体的には、totalが"10,000"で、rarityの閾値が"0.99"であるとき、hitが"1.00"未満であれば条件希少度は閾値以上となり、hitが"1.00"以上であれば条件希少度が閾値未満となる。
条件希少度とは、コンテンツ検索において検索結果の絞り込みが十分であるかどうかを評価すための指標値である。条件希少度は、例えば、次のように求められ、評価される。
検索対象のコンテンツ総数(情報母体数)をtotal、ユーザが指定した条件にヒットしたコンテンツ数をhit、条件希少度をrarityをとすると、
hit=0のとき、rarity=0とし、
hit>0のとき、rarity=1-hit/totalとする。
具体的には、totalが"10,000"で、rarityの閾値が"0.99"であるとき、hitが"1.00"未満であれば条件希少度は閾値以上となり、hitが"1.00"以上であれば条件希少度が閾値未満となる。
なお、上記の条件希少度の算出・評価方法は一例であり、その他、様々な変形が可能である。
(インタラクション進捗度の算出・評価方法)
インタラクション進捗度は、音声インタラクションでのシステムとユーザとの間のやりとりの回数的および時間的なコストを示す指標であり、例えば、次のような計算によって得られ、評価される。
インタラクション進捗度は、音声インタラクションでのシステムとユーザとの間のやりとりの回数的および時間的なコストを示す指標であり、例えば、次のような計算によって得られ、評価される。
システムが質問または提示した回数をshow、
ユーザが回答した回数をreactionとすると、
インタラクション回数(progress_turn)は次式により算出される。
progress_turn=show*0.5+reaction*0.5 …(1)
また、インタラクション回数のノルム(progress_turn_norm)は、
progress_turn>1.0のとき1.0、
progress_turn<=1.0 のときprogress_turn/1.00として与えられる。
また、インタラクション時間(分)をprogress_timeとすると、
そのノルム(progress_time_norm)は、
progress_time>1.0 のとき1.0、
progress_time<=1.0 のときprogress_time/1.00として与えられる。
ユーザが回答した回数をreactionとすると、
インタラクション回数(progress_turn)は次式により算出される。
progress_turn=show*0.5+reaction*0.5 …(1)
また、インタラクション回数のノルム(progress_turn_norm)は、
progress_turn>1.0のとき1.0、
progress_turn<=1.0 のときprogress_turn/1.00として与えられる。
また、インタラクション時間(分)をprogress_timeとすると、
そのノルム(progress_time_norm)は、
progress_time>1.0 のとき1.0、
progress_time<=1.0 のときprogress_time/1.00として与えられる。
そしてインタラクション進捗度(progress)は次式(2)により算出される。
progress=(progress_turn_norm+progress_time_norm/2.0 …(2)
progressの閾値には、例えば0.8が用いられる。
progress=(progress_turn_norm+progress_time_norm/2.0 …(2)
progressの閾値には、例えば0.8が用いられる。
なお、上記のインタラクション進捗度の算出・評価方法は一例であり、その他、様々な変形が可能である。例えば、インタラクションの回数または時間の少なくとも一方から得られる指標値をインタラクション進捗度としてもよい。
(ユーザ反応明確度の算出・評価方法)
ユーザ反応明確度は、音声インタラクションにおいてユーザが回答(反応)する際のユーザの様子や回答内容(文言)から推定されるユーザ反応の明確さを示す指標であり、例えば、次のような計算によって得られ、評価される。
ユーザ反応明確度は、音声インタラクションにおいてユーザが回答(反応)する際のユーザの様子や回答内容(文言)から推定されるユーザ反応の明確さを示す指標であり、例えば、次のような計算によって得られ、評価される。
例えば、ユーザ反応明確度(clarity)は次式(3)により算出される。
clarity=Σ{(clarity_face+clarity_speech)/2} /回答数 …(3)
ここでclarity_faceは情報処理端末10にユーザが顔を向けていた度合を示し、1回答につき0.0から1.0の範囲で与えられる。例えば、情報処理端末10にユーザが完全に顔を向けているならばclarity_face=1.0、半分程度顔を向けているならばclarity_face=0.5、殆ど顔を向けていない場合にはclarity_face=0.0のように与えられる。
clarity=Σ{(clarity_face+clarity_speech)/2} /回答数 …(3)
ここでclarity_faceは情報処理端末10にユーザが顔を向けていた度合を示し、1回答につき0.0から1.0の範囲で与えられる。例えば、情報処理端末10にユーザが完全に顔を向けているならばclarity_face=1.0、半分程度顔を向けているならばclarity_face=0.5、殆ど顔を向けていない場合にはclarity_face=0.0のように与えられる。
clarity_speechは発話内容の明確さの度合に応じて0.0から1.0の範囲内で与えられる値である。例えば、「はい」、「いいえ」、「○○がいい」「××はいらない」のような意味が明確な発言にはclarity_speech=1.0、「どちらでも」「わからない」のような曖昧な発言に対してはclarity_speech=0.5、「えっと…」のように意味不明な発言に対してはclarity_speech=0.0のように与えられる。
ユーザ反応明確度(clarity)の閾値には、例えば0.2が用いられる。
ユーザ反応明確度(clarity)の閾値には、例えば0.2が用いられる。
なお、上記のユーザ反応明確度の算出・評価方法は一例であり、その他、様々な変形が可能である。
[1-6.質問モードの処理の流れ]
次に、質問モードの処理の流れを説明する。
図15は質問モードの処理のフローチャートである。
推薦部260は、選択肢形式の質問における質問種別を決定する処理(ステップS301)、質問選択肢数を決定する処理(ステップS302)、質問選択肢の内容を決定する処理(ステップS303)、質問の文言を決定する処理(ステップS304,)を順に実行する。以下にそれぞれの処理について詳細を説明する。
次に、質問モードの処理の流れを説明する。
図15は質問モードの処理のフローチャートである。
推薦部260は、選択肢形式の質問における質問種別を決定する処理(ステップS301)、質問選択肢数を決定する処理(ステップS302)、質問選択肢の内容を決定する処理(ステップS303)、質問の文言を決定する処理(ステップS304,)を順に実行する。以下にそれぞれの処理について詳細を説明する。
(質問種別の決定)
まず、ステップ301の質問種別を決定する処理の詳細を説明する。
推薦部260は、質問の種別を分類する複数の質問種別のなかから、選択肢形式の質問に用いる質問種別を、複数の質問種別間で決められた優先度に従って確率的に選択する。
まず、ステップ301の質問種別を決定する処理の詳細を説明する。
推薦部260は、質問の種別を分類する複数の質問種別のなかから、選択肢形式の質問に用いる質問種別を、複数の質問種別間で決められた優先度に従って確率的に選択する。
図16は上記の質問種別を決定するためのルールの一例を示す図である。
同図はレストランに関するコンテンツ検索のための質問種別の決定に用いられるルールを示す表である。
質問種別には、bloadcategory(Bカテゴリ)、stylecategory(Stカテゴリ)、nudgecategory(Nカテゴリ)、servicecategory(Sカテゴリ)の他、seasoncategory、移動手段・移動時間、予算、駅名などがある。上記の質問種別のグループ化され、bloadcategory(Bカテゴリ)、stylecategory(Stカテゴリ)、nudgecategory(Nカテゴリ)、servicecategory(Sカテゴリ)はcategoryグループ、seasoncategoryはseasonグループ、移動手段・移動時間の質問種別はtransferグループ、予算の質問種別はpriceグループ、駅名の質問種別はstationグループとされる。
同図はレストランに関するコンテンツ検索のための質問種別の決定に用いられるルールを示す表である。
質問種別には、bloadcategory(Bカテゴリ)、stylecategory(Stカテゴリ)、nudgecategory(Nカテゴリ)、servicecategory(Sカテゴリ)の他、seasoncategory、移動手段・移動時間、予算、駅名などがある。上記の質問種別のグループ化され、bloadcategory(Bカテゴリ)、stylecategory(Stカテゴリ)、nudgecategory(Nカテゴリ)、servicecategory(Sカテゴリ)はcategoryグループ、seasoncategoryはseasonグループ、移動手段・移動時間の質問種別はtransferグループ、予算の質問種別はpriceグループ、駅名の質問種別はstationグループとされる。
各々の質問種別には、グループ間優先度とグループ内優先度が決められている。グループ間優先度は、質問種別グループ間の選択優先度であり、グループ内優先度は質問種別グループ内での各々の質問種別間での選択優先度である。
グループ間優先度は、すべての質問種別グループに割り当てられる選択優先度の合計値を"100"として、これを各グループ間で一定割合で分配した値によって与えられる。図16の例では、categoryグループに対して"40"、seasonグループに対して"10"、transferグループに対して"10"、priceグループに対して"10"、そしてstationグルーブに対して"30"がそれぞれ割り当てられている。
一方、グループ内優先度についても同様に、同一グループに属するすべての質問種別に割り当てられる選択優先度の合計値を"100"として、これを同一グループに属するすべての質問種別間で分配した値によって与えられる。
図16において、「発火条件」とは、各質問種別が、優先度に応じた選択候補となるための必要条件である。例えば、Bカテゴリが優先度に応じた選択候補となるための発火条件は、その時点までの音声インタラクションでBカテゴリ、Stカテゴリ、Nカテゴリ、Sカテゴリ、あるいはseasoncategoryのどの質問種別の質問に対してもユーザからの回答が完了していないことである。また、Stカテゴリが優先度に応じた選択候補となるための発火条件は、その時点までの音声インタラクションでStカテゴリ、Nカテゴリ、Sカテゴリ、seasoncategoryのどの質問種別の質問に対してもユーザからの回答が完了していないこと、である。
次に、図16のルールに基づく質問種別の決定例を示す。
いま、音声インタラクションおいて、Bカテゴリの質問種別の質問に対するユーザからの回答のみが完了している状況を考える。この場合、発火条件を満たす質問種別はStカテゴリ、Nカテゴリ、Sカテゴリ、seasoncategoryの質問種別の他、移動手段・移動時間、予算、駅名の質問種別である。
いま、音声インタラクションおいて、Bカテゴリの質問種別の質問に対するユーザからの回答のみが完了している状況を考える。この場合、発火条件を満たす質問種別はStカテゴリ、Nカテゴリ、Sカテゴリ、seasoncategoryの質問種別の他、移動手段・移動時間、予算、駅名の質問種別である。
次に、これらの質問種別がそれぞれ属する各質問種別グループのグループ間優先度を図16のルールから参照すると、category=40、season=10、transfer=10、price=10、station=30である。
次に、推薦部260は、ルーレット選択による質問種別グループの選択を行う。
図17は、質問種別グループのルーレット選択方法を説明する図である。ここで、ルーレットには、全ての質問種別グループのグルーフ刊優先度の合計値分の的が設定される。すなわち、すべての質問種別グループのグルーブ間優先度の合計値が"100"であるから、"1"から"100"までの数値の的が設定されたルーレットにおける"1"から"40"の的の範囲にcategoryグループ、"41"から"50"の的の範囲にseasonグループ、"51"から"60"の的の範囲にtransferグループ、"61"から"70"の的の範囲にpriceグループ、そして"71"から"100"の的の範囲にstationグループがそれぞれ割り当てられる。次に推薦部260は、"1"から"100"までの間で乱数を用いて1つの数値を算出し、この数値が属する数値範囲の質問種別を選択結果とする。例えば、乱数を用いて"32"の数値が得られた場合、categoryグループが質問種別グループの選択結果として得られる。
図17は、質問種別グループのルーレット選択方法を説明する図である。ここで、ルーレットには、全ての質問種別グループのグルーフ刊優先度の合計値分の的が設定される。すなわち、すべての質問種別グループのグルーブ間優先度の合計値が"100"であるから、"1"から"100"までの数値の的が設定されたルーレットにおける"1"から"40"の的の範囲にcategoryグループ、"41"から"50"の的の範囲にseasonグループ、"51"から"60"の的の範囲にtransferグループ、"61"から"70"の的の範囲にpriceグループ、そして"71"から"100"の的の範囲にstationグループがそれぞれ割り当てられる。次に推薦部260は、"1"から"100"までの間で乱数を用いて1つの数値を算出し、この数値が属する数値範囲の質問種別を選択結果とする。例えば、乱数を用いて"32"の数値が得られた場合、categoryグループが質問種別グループの選択結果として得られる。
次に、推薦部260は、categoryグループに属するBカテゴリ以外の質問種別(Stカテゴリ、Nカテゴリ、Sカテゴリ)のなかから再度ルーレット選択による質問種別の選択を行う。Stカテゴリ、Nカテゴリ、Sカテゴリそれぞれのグループ内優先度を図16のルールから参照すると、Stカテゴリ=70、Nカテゴリ=10、Sカテゴリ=10である。そこで推薦部260は、"1"から"90"までの数値の的が設定されたルーレットにおける"1"から"70"の的の範囲にStカテゴリ、"71"から"80"の的の範囲にNカテゴリ、"81"から"90"の的の範囲にSカテゴリをそれぞれ割り当てる。次に推薦部260は、"1"から"90"までの間で乱数を用いて1つの数値を決定し、この数値が属する的の範囲の質問種別を選択結果とする。例えば、乱数を用いて"58"の数値が得られた場合、Stカテゴリの質問種別が選択結果として得られる。
この結果、Stカテゴリが質問種別として最終的に決定される。
この結果、Stカテゴリが質問種別として最終的に決定される。
(質問選択肢数の決定)
次に、図15のステップ302の質問選択肢数を決定する処理の詳細を説明する。
質問選択肢数とは、例えば「A、B、Cのどれがいいですか?」といった選択肢形式の質問における選択肢の数であり、この場合には"3"である。推薦部260は、選択肢形式の質問における選択肢の数を、音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する。
次に、図15のステップ302の質問選択肢数を決定する処理の詳細を説明する。
質問選択肢数とは、例えば「A、B、Cのどれがいいですか?」といった選択肢形式の質問における選択肢の数であり、この場合には"3"である。推薦部260は、選択肢形式の質問における選択肢の数を、音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する。
図18は質問選択肢数を決定するルールの一例を示す図である。
この質問選択肢数の決定ルールでは、これまでの音声インタラクションでのユーザによる回答数(n)とルーレット選択パターンとから質問選択肢数(listSize)が決定されることとしている。ルーレット選択パターンは、質問選択肢数の候補毎に設けられる。本例では、listSize=3に対応するルーレット選択パターン、listSize=2に対応するルーレット選択パターン、listSize=1に対応するルーレット選択パターン、listSize=0に対応するルーレット選択パターンがある。それぞれのルーレット選択パターンには回答数(n)の値に対する選択確率が割り当てられている。例えば、n=1に対して、listSize=3に対応するルーレット選択パターンには"58"、listSize=2に対応するルーレット選択パターンには"24"、listSize=1に対応するルーレット選択パターンには"16"、そしてlistSize=0に対応するルーレット選択パターンには"2"がそれぞれ登録されている。これは、"1"から"100"までの数値の的が設定されたルーレットにおいてlistSize=3が"1"から"58"の範囲、listSize=2が"59"から"83"の範囲、listSize=1が"84"から"98"の範囲、そしてlistSize=0が"99"から"100"の範囲にそれぞれ割り当てられることを意味する。
この質問選択肢数の決定ルールでは、これまでの音声インタラクションでのユーザによる回答数(n)とルーレット選択パターンとから質問選択肢数(listSize)が決定されることとしている。ルーレット選択パターンは、質問選択肢数の候補毎に設けられる。本例では、listSize=3に対応するルーレット選択パターン、listSize=2に対応するルーレット選択パターン、listSize=1に対応するルーレット選択パターン、listSize=0に対応するルーレット選択パターンがある。それぞれのルーレット選択パターンには回答数(n)の値に対する選択確率が割り当てられている。例えば、n=1に対して、listSize=3に対応するルーレット選択パターンには"58"、listSize=2に対応するルーレット選択パターンには"24"、listSize=1に対応するルーレット選択パターンには"16"、そしてlistSize=0に対応するルーレット選択パターンには"2"がそれぞれ登録されている。これは、"1"から"100"までの数値の的が設定されたルーレットにおいてlistSize=3が"1"から"58"の範囲、listSize=2が"59"から"83"の範囲、listSize=1が"84"から"98"の範囲、そしてlistSize=0が"99"から"100"の範囲にそれぞれ割り当てられることを意味する。
推薦部260は、"1"から"100"までの数値範囲の中で、乱数を用いて算出された数値が属するlistSizeを質問選択肢数の選択結果として決定する。例えば乱数を用いて算出された数値が"64"である場合、推薦部260は"listSize=2"を質問選択肢数の選択結果として決定する。
図19は、listSize=3、2、1、0の各ルーレット選択パターン間の回答数(n)の値に対する選択確率分布を示すグラフである。同グラフに示すように、回答数(n)が増えるほど質問選択肢数の少ないルーレット選択パターンの選択確率が高くなるようにすることによって、ユーザにトータル的に過剰な数の質問選択肢が提示されるのを確率的に回避することができ、ユーザの負担減を期待できる。
なお、質問選択肢数の決定ルールについても様々な変形が考えられる。例えば、ユーザからの回答数(n)が多かった質問選択肢数ほど、あるいはユーザ反応の明確さが高かった質問選択肢数ほど、あるいはユーザからの回答において"Yes"の回数が多かった質問選択肢数ほど、優先的に選択されてもよい。
(質問選択肢内容の決定)
次に、図15のステップ303の質問選択肢内容を決定する処理の詳細を説明する。
推薦部は260は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する。
次に、図15のステップ303の質問選択肢内容を決定する処理の詳細を説明する。
推薦部は260は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する。
図20は質問選択肢内容の決定ルールの一部を示す図である。
この質問選択肢内容の決定ルールでは、条件種別毎の質問選択肢内容の決定において"知識"を用いるか"分布"を用いるかが決められる。ここで、"知識"は固定の質問選択肢内容であり、"分布"はユーザ全般による回答使用頻度や人気順などの特定の条件に基づいて順位付けられたカテゴリ群から質問選択肢内容を生成することを意味する。"知識"に基づく質問選択肢内容の具体的な決定方法や、"分布"に基づく質問選択肢内容の具体的な決定方法は図20に示すルールの質問選択肢内容生成ロジックとして決められている。例えば、Bカテゴリの質問種別に対する質問選択肢内容は"和食、洋食、アジア料理"を固定で用いるという知識に基づいて生成される。また、Stカテゴリの質問選択肢内容は、例えば、ユーザの自宅から1時間内に行くことのできるStカテゴリのなかでユーザ全般の回答選択頻度などに基づいて順位付けられた上位n個のStカテゴリを抽出するという質問選択肢内容生成ロジックに基づいて生成される。例えば、図15のステップS301においてStカテゴリの質問種別が決定され、ステップS302において質問選択肢数が"2"に決定された場合には、人気順で1位と2位のStカテゴリが質問選択肢内容として決定される。例えば、1位「とんかつ」、2位「天ぷら」などのように決定される。
この質問選択肢内容の決定ルールでは、条件種別毎の質問選択肢内容の決定において"知識"を用いるか"分布"を用いるかが決められる。ここで、"知識"は固定の質問選択肢内容であり、"分布"はユーザ全般による回答使用頻度や人気順などの特定の条件に基づいて順位付けられたカテゴリ群から質問選択肢内容を生成することを意味する。"知識"に基づく質問選択肢内容の具体的な決定方法や、"分布"に基づく質問選択肢内容の具体的な決定方法は図20に示すルールの質問選択肢内容生成ロジックとして決められている。例えば、Bカテゴリの質問種別に対する質問選択肢内容は"和食、洋食、アジア料理"を固定で用いるという知識に基づいて生成される。また、Stカテゴリの質問選択肢内容は、例えば、ユーザの自宅から1時間内に行くことのできるStカテゴリのなかでユーザ全般の回答選択頻度などに基づいて順位付けられた上位n個のStカテゴリを抽出するという質問選択肢内容生成ロジックに基づいて生成される。例えば、図15のステップS301においてStカテゴリの質問種別が決定され、ステップS302において質問選択肢数が"2"に決定された場合には、人気順で1位と2位のStカテゴリが質問選択肢内容として決定される。例えば、1位「とんかつ」、2位「天ぷら」などのように決定される。
(質問文言の決定)
次に、ステップ304の質問文言を決定する処理の詳細を説明する。
図21は質問文言を決定するルールを示す図である。
本実施形態に係る質問文言決定ルールにおいては、質問種別と質問選択肢数(listSize)との組み合わせ毎に、質問文言のテンプレートの識別番号(質問ID)が決められている。
図22は質問ID毎の質問文言テンプレート表の例を示す図である。例えば、質問ID=qc0aに対応して「好きな料理を教えてもらえますか?」という質問文言テンプレートが登録され、質問ID=qc1aに対応して「${args[0]}はいかがですか?」という質問文言テンプレートが登録されている。ここで、${args[0]}は全ユーザの回答選択頻度などに基づいて順位付けられたカテゴリ群の中の第1位のカテゴリを意味する。同様に、${args[1]}は第2位のカテゴリを意味し、${args[2]}は第3位のカテゴリを意味する。
次に、ステップ304の質問文言を決定する処理の詳細を説明する。
図21は質問文言を決定するルールを示す図である。
本実施形態に係る質問文言決定ルールにおいては、質問種別と質問選択肢数(listSize)との組み合わせ毎に、質問文言のテンプレートの識別番号(質問ID)が決められている。
図22は質問ID毎の質問文言テンプレート表の例を示す図である。例えば、質問ID=qc0aに対応して「好きな料理を教えてもらえますか?」という質問文言テンプレートが登録され、質問ID=qc1aに対応して「${args[0]}はいかがですか?」という質問文言テンプレートが登録されている。ここで、${args[0]}は全ユーザの回答選択頻度などに基づいて順位付けられたカテゴリ群の中の第1位のカテゴリを意味する。同様に、${args[1]}は第2位のカテゴリを意味し、${args[2]}は第3位のカテゴリを意味する。
図21の質問文言決定ルールにおいて、"qc1a, qc1b"、"qc2a, qc2b, qc2c"のように、複数の質問IDが登録されているところは、推薦部260によってルーレット選択等によりランダムに選択されることを意味する。例えば、図15のステップS301においてStカテゴリが質問種別として決定され、ステップS302において質問選択肢数(listSize)として"2"が決定されたので、図21のルールにならって"qc2a, qc2b,qc2c"の中からランダムに1つの質問IDが選択される。仮に"qc2b"が選択されたとすると、図22の質問文言テンプレート表から「${args[0]}と${args[1]}なら、どちらが食べたいですか?」の質問文言テンプレートが検索され、ステップ303の質問選択肢内容の決定結果と組み合わされて「とんかつと天ぷらなら、どちらが食べたいですか?」の質問文が作成される。
次に、図15のステップS301で質問種別としてルーレットによってseasoncategoryが選択された場合の動作を説明する。この場合、図20の質問選択肢内容の決定ルールから、seasoncategoryの質問選択肢内容の決定ルールを参照すると、例えば図23に示すような旬カテゴリ表から現在の旬のカテゴリを例えばランダムに検索した結果を1つだけ質問選択肢内容とすることが決められている。ここで、現在の日にちを3月5日とした場合、旬カテゴリ表から例えば"どじょう料理"がランダムに検索されたとする。一方、図21の質問文言決定ルールから、seasoncategoryに対して利用する質問文言テンプレートの質問IDは"qcs1a, qcs1b, qcs1c, qcs1d,qcs1e, qcs1f, qcs1g, qcs1h"の中から季節に適した1つを選択することが定められている。現在の季節が春であったなら、春に適した質問ID例えば"qcs1f"が選択される。これにより旬カテゴリ表から検索された"どじょう料理"と質問ID"qcs1f"に対応する「春めいてきたので、${args[0]}なんてどうですか?」という質問文言テンプレートとを組み合わせて、「春めいてきたので、どじょう料理なんてどうですか?」という質問文言が生成される。
なお、ここでは日にちに基づいて、旬カテゴリ表から旬のコンテンツを検索して質問の選択肢内容として決定する場合を説明したが、同様にイベントなどを日にちに基づいてイベント表から検索して質問の選択肢内容として決定してもよい。また、日にちではなく時刻を含む日時データから、広告データなどを含む様々な種類のコンテンツを検索して質問の選択肢内容としてもよい。
以上が、質問生成の動作の説明である。
以上が、質問生成の動作の説明である。
[1-7.提案モードの処理の流れ]
次に、ユーザとの音声インタラクションにおいて起動される提案モードの処理の流れを説明する。
推薦部260は、提案モードにおいて、ユーザとの音声インタラクションを通じて取得した条件に応じた検索結果である第1の情報またはユーザの嗜好に応じた推薦情報である第2の情報の少なくとも一方を提示する。
次に、ユーザとの音声インタラクションにおいて起動される提案モードの処理の流れを説明する。
推薦部260は、提案モードにおいて、ユーザとの音声インタラクションを通じて取得した条件に応じた検索結果である第1の情報またはユーザの嗜好に応じた推薦情報である第2の情報の少なくとも一方を提示する。
この提案モードは、図14に示したコンテンツ検索のためのユーザとの音声インタラクションにおいて、例えば、条件希少度が閾値以上であるとき、あるいはインタラクション進捗度が閾値以上であるとき、あるいはユーザ反応明確度が閾値以上であるとき起動される。
図24は提案モードの処理のフローチャートである。
提案モードにおいて、推薦部260は、インタラクション進捗度がインタラクション進捗度評価用閾値以下であるかどうかを判定する(ステップS401)。インタラクション進捗度がインタラクション進捗度評価用閾値以下である場合は、条件希少度が閾値以上であることによって質問モードに移行したことが分かるので、この場合には音声インタラクションでユーザが指定した条件(例えば質問モードでユーザに与えられた質問に対する回答を含む条件)に合致したスポットの条件によるコンテンツ検索結果の絞り込みが十分であるとして、そのコンテンツ検索結果を情報処理端末10のユーザに提示する(ステップS402)。
提案モードにおいて、推薦部260は、インタラクション進捗度がインタラクション進捗度評価用閾値以下であるかどうかを判定する(ステップS401)。インタラクション進捗度がインタラクション進捗度評価用閾値以下である場合は、条件希少度が閾値以上であることによって質問モードに移行したことが分かるので、この場合には音声インタラクションでユーザが指定した条件(例えば質問モードでユーザに与えられた質問に対する回答を含む条件)に合致したスポットの条件によるコンテンツ検索結果の絞り込みが十分であるとして、そのコンテンツ検索結果を情報処理端末10のユーザに提示する(ステップS402)。
インタラクション進捗度がインタラクション進捗度評価用閾値以下ではない場合(ステップS401のN)、推薦部260はユーザ反応明確度がユーザ反応明確度評価用閾値以上であるかどうかを判定する(ステップS403)。ユーザ反応明確度がユーザ反応明確度評価用閾値以上でない場合には(ステップS403のN)、音声インタラクションでユーザが指定した条件が妥当性を欠く可能性が高いので、図13で生成されたスポット推薦結果の中から推薦スコアの高い上位所定数のスポット推薦結果つまりユーザ履歴に基づきユーザの嗜好に合ったスポットを情報処理端末10のユーザに提示する(ステップS405)。
さらに、インタラクション進捗度がインタラクション進捗度評価用閾値以下ではなく(ステップS401のN)、かつユーザ反応明確度がユーザ反応明確度評価用閾値以上である場合には(ステップS403のY)、音声インタラクションでユーザが指定した条件(例えば質問モードでユーザに与えられた質問に対する回答を含む条件)に合致したスポットの検索結果に加えて、図13で生成されたスポット推薦結果の中から推薦スコアの高い上位所定数のスポット推薦結果を情報処理端末10のユーザに提示する(ステップS404)>
なお、図24のフローにおけるインタラクション進捗度評価用閾値は、図14のフローにおけるインタラクション進捗度評価用閾値と同じであってよいし、異なる値であってもよい。また、図24のフローにおけるユーザ反応明確度評価用閾値についても、図14のフローにおけるユーザ反応明確度評価用閾値と同じであってよいし、異なる値であってもよい。
[1-8.ハードウェア構成例]
次に、本開示の一実施形態に係る情報処理端末10および情報処理サーバ20に共通するハードウェア構成例について説明する。図25は、本開示の一実施形態に係る情報処理端末10および情報処理サーバ20のハードウェア構成例を示すブロック図である。
情報処理端末10および情報処理サーバ20は、例えば、CPU871と、ROM872と、RAM873と、ホストバス874と、ブリッジ875と、外部バス876と、インターフェース877と、入力装置878と、出力装置879と、ストレージ880と、ドライブ881と、接続ポート882と、通信装置883と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
次に、本開示の一実施形態に係る情報処理端末10および情報処理サーバ20に共通するハードウェア構成例について説明する。図25は、本開示の一実施形態に係る情報処理端末10および情報処理サーバ20のハードウェア構成例を示すブロック図である。
情報処理端末10および情報処理サーバ20は、例えば、CPU871と、ROM872と、RAM873と、ホストバス874と、ブリッジ875と、外部バス876と、インターフェース877と、入力装置878と、出力装置879と、ストレージ880と、ドライブ881と、接続ポート882と、通信装置883と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
CPU871は、例えば、演算処理装置又は制御装置として機能し、ROM872、RAM873、ストレージ880、又はリムーバブル記録媒体901に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。
ROM872は、CPU871に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。RAM873には、例えば、CPU871に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。
CPU871、ROM872、RAM873は、例えば、高速なデータ伝送が可能なホストバス874を介して相互に接続される。一方、ホストバス874は、例えば、ブリッジ875を介して比較的データ伝送速度が低速な外部バス876に接続される。また、外部バス876は、インターフェース877を介して種々の構成要素と接続される。
入力装置878には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置878としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ(以下、リモコン)が用いられることもある。また、入力装置878には、マイクロフォンなどの音声入力装置が含まれる。
出力装置879は、例えば、CRT(Cathode Ray Tube)、LCD、又は有機EL等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置879は、触覚刺激を出力することが可能な種々の振動デバイスを含む。
ストレージ880は、各種のデータを格納するための装置である。ストレージ880としては、例えば、ハードディスクドライブ(HDD)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。
ドライブ881は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体901に記録された情報を読み出し、又はリムーバブル記録媒体901に情報を書き込む装置である。
リムーバブル記録媒体901は、例えば、DVDメディア、Blu-ray(登録商標)メディア、HD DVDメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体901は、例えば、非接触型ICチップを搭載したICカード、又は電子機器等であってもよい。
接続ポート882は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS-232Cポート、又は光オーディオ端子等のような外部接続機器902を接続するためのポートである。
外部接続機器902は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はICレコーダ等である。
通信装置883は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線LAN、Bluetooth(登録商標)、又はWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は各種通信用のモデム等である。
[1-9.効果等]
以上説明したように、本技術に係る一実施形態のシステムあるいは情報処理サーバ20によれば、条件希少度に基づいて第1の処理と第2の処理とが適時切り替えられることによって、条件希少度が低いつまり情報検索結果の絞り込みが不十分な場合に、検索のための条件に関する質問を生成してユーザに提示することによってユーザに新たな条件の追加を明示的に促すことができる。また、その際、選択肢形式の質問をユーザに提示するとによって、ユーザは正しい表現による条件を速やかに応答することができる。この結果、ユーザの負担の軽減、情報検索の速度および精度の向上を図ることができる。さらに、インラクション進捗度やユーザ反応明確度に基づいて質問モードと提案モードとが適時切り替えられるので、無駄な条件あるいは不明確な条件による情報検索を回避することができる。
以上説明したように、本技術に係る一実施形態のシステムあるいは情報処理サーバ20によれば、条件希少度に基づいて第1の処理と第2の処理とが適時切り替えられることによって、条件希少度が低いつまり情報検索結果の絞り込みが不十分な場合に、検索のための条件に関する質問を生成してユーザに提示することによってユーザに新たな条件の追加を明示的に促すことができる。また、その際、選択肢形式の質問をユーザに提示するとによって、ユーザは正しい表現による条件を速やかに応答することができる。この結果、ユーザの負担の軽減、情報検索の速度および精度の向上を図ることができる。さらに、インラクション進捗度やユーザ反応明確度に基づいて質問モードと提案モードとが適時切り替えられるので、無駄な条件あるいは不明確な条件による情報検索を回避することができる。
なお、本技術は以下のような構成もとることができる。
(1)ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部
を具備する情報処理装置。
(1)ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部
を具備する情報処理装置。
(2)上記(1)に記載の情報処理装置であって、
前記第2の処理は、選択肢形式の質問を生成する
情報処理装置。
前記第2の処理は、選択肢形式の質問を生成する
情報処理装置。
(3)上記(1)または(2)に記載の情報処理装置であって、
前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理装置。
前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理装置。
(4)上記(1)から(3)のいずれかに記載の情報処理装置であって、
前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理装置。
前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理装置。
(5)上記(4)に記載の情報処理装置であって、
前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
情報処理装置。
前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
情報処理装置。
(6)上記(4)または(5)に記載の情報処理装置であって、
前記第1の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第1の情報および前記第2の情報のなかから選択する
情報処理装置。
前記第1の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第1の情報および前記第2の情報のなかから選択する
情報処理装置。
(7)上記(2)から(6)のいずれかに記載の情報処理装置であって、
前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
情報処理装置。
前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
情報処理装置。
(8)上記(2)から(7)のいずれかに記載の情報処理装置であって、
前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
情報処理装置。
前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
情報処理装置。
(9)上記(2)から(8)のいずれかに記載の情報処理装置であって、
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理装置。
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理装置。
(10)上記(2)から(9)のいずれかに記載の情報処理装置であって、
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理装置。
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理装置。
(11)上記(1)から(9)のいずれかに記載の情報処理装置が情報処理サーバまたは情報処理端末である
情報処理装置。
情報処理装置。
(12)制御部が、ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える
情報処理方法。
情報処理方法。
(13)上記(12)に記載の情報処理方法であって、
前記第2の処理は、選択肢形式の質問を生成する
情報処理方法。
前記第2の処理は、選択肢形式の質問を生成する
情報処理方法。
(14)上記(12)または(13)に記載の情報処理方法であって、
前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理方法。
前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理方法。
(15)上記(12)から(14)のいずれかに記載の情報処理方法であって、
前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理方法。
前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理方法。
(16)上記(15)に記載の情報処理方法であって、
前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
情報処理方法。
前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
情報処理方法。
(17)上記(15)または(16)に記載の情報処理方法であって、
前記第1の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第1の情報および前記第2の情報のなかから選択する
情報処理方法。
前記第1の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第1の情報および前記第2の情報のなかから選択する
情報処理方法。
(18)上記(13)から(17)のいずれかに記載の情報処理方法であって、
前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
情報処理方法。
前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
情報処理方法。
(19)上記(13)から(18)のいずれかに記載の情報処理方法であって、
前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
情報処理方法。
前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
情報処理方法。
(20)上記(13)から(19)のいずれかに記載の情報処理方法であって、
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理方法。
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理方法。
(21)上記(13)から(20)のいずれかに記載の情報処理方法であって、
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理方法。
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理方法。
(22)ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部としてコンピュータを動作させるプログラム。
(23)上記(22)に記載のプログラムであって、
前記第2の処理は、選択肢形式の質問を生成する
プログラム。
前記第2の処理は、選択肢形式の質問を生成する
プログラム。
(24)上記(22)または(23)に記載のプログラムであって、
前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第1の処理と前記第2の処理とを切り替える
プログラム。
前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第1の処理と前記第2の処理とを切り替える
プログラム。
(25)上記(22)から(24)のいずれかに記載のプログラムであって、
前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第1の処理と前記第2の処理とを切り替える
プログラム。
前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第1の処理と前記第2の処理とを切り替える
プログラム。
(26)上記(25)に記載のプログラムであって、
前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
プログラム。
前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
プログラム。
(27)上記(25)または(26)に記載のプログラムであって、
前記第1の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第1の情報および前記第2の情報のなかから選択する
プログラム。
前記第1の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第1の情報および前記第2の情報のなかから選択する
プログラム。
(28)上記(23)から(27)のいずれかに記載のプログラムであって、
前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
プログラム。
前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
プログラム。
(29)上記(23)から(28)のいずれかに記載のプログラムであって、
前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
プログラム。
前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
プログラム。
(30)上記(23)から(29)のいずれかに記載のプログラムであって、
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
プログラム。
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
プログラム。
(31)上記(23)から(30)のいずれかに記載のプログラムであって、
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
プログラム。
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
プログラム。
10…情報処理端末
20…情報処理サーバ
30…ネットワーク
210…端末通信部
220…記憶部
230…提示制御部
240…情報収集部
250…情報解析部
260…推薦部
270…ユーザ履歴管理部
280…反応解析部
290…状況解析部
300…情報統合部
20…情報処理サーバ
30…ネットワーク
210…端末通信部
220…記憶部
230…提示制御部
240…情報収集部
250…情報解析部
260…推薦部
270…ユーザ履歴管理部
280…反応解析部
290…状況解析部
300…情報統合部
Claims (13)
- ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部
を具備する情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記第2の処理は、選択肢形式の質問を生成する
情報処理装置。 - 請求項2に記載の情報処理装置であって、
前記制御部は、さらに、前記音声インタラクションの回数または時間の少なくとも一方に関する指標値であるインタラクション進捗度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理装置。 - 請求項3に記載の情報処理装置であって、
前記制御部は、さらに、前記音声インタラクション時のユーザ反応明確度に基づいて前記第1の処理と前記第2の処理とを切り替える
情報処理装置。 - 請求項4に記載の情報処理装置であって、
前記制御部は、前記音声インタラクション時の前記ユーザの顔の向きまたは発話内容に基づいて前記ユーザ反応明確度を求める
情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記第1の処理は、前記インタラクション進捗度および前記ユーザ反応明確度に基づいて、提示する情報を前記第1の情報および前記第2の情報のなかから選択する
情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記制御部は、質問の種別を分類する複数の質問種別のなかから、前記選択肢形式の質問に用いる質問種別を、前記複数の質問種別間で決められた優先度に従って確率的に選択する
情報処理装置。 - 請求項7に記載の情報処理装置であって、
前記制御部は、前記選択肢形式の質問における選択肢の数を、前記音声インタラクションによるユーザからの回答数に応じて決められた優先度に従って確率的に選択する
情報処理装置。 - 請求項8に記載の情報処理装置であって、
前記制御部は、前記選択肢形式の質問における選択肢内容を、発話または質問に対する回答での使用頻度に基づいて選択する
情報処理装置。 - 請求項9に記載の情報処理装置であって、
前記制御部は、前記選択肢形式の質問における選択肢内容を日時条件に基づいて選択する
情報処理装置。 - 請求項10に記載の情報処理装置が情報処理サーバまたは情報処理端末である
情報処理装置。 - 制御部が、ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える
情報処理方法。 - ユーザとの音声インタラクションを通じて取得した条件に基づいて検索された第1の情報または前記ユーザの嗜好に基づいて選択された第2の情報の少なくとも一方を提示する第1の処理と、前記検索のための条件に関する質問を生成して前記ユーザに提示する第2の処理とを、前記条件に合致した情報数の検索対象の情報母体数に対する割合に関する指標値である条件希少度に基づいて切り替える制御部として
コンピュータを動作させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/441,438 US20220188363A1 (en) | 2019-03-28 | 2020-03-17 | Information processing apparatus, information processing method, and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019062944A JP2020161076A (ja) | 2019-03-28 | 2019-03-28 | 情報処理装置、情報処理方法及びプログラム |
JP2019-062944 | 2019-03-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020196100A1 true WO2020196100A1 (ja) | 2020-10-01 |
Family
ID=72610544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2020/011743 WO2020196100A1 (ja) | 2019-03-28 | 2020-03-17 | 情報処理装置、情報処理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220188363A1 (ja) |
JP (1) | JP2020161076A (ja) |
WO (1) | WO2020196100A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069657A (zh) * | 2019-04-30 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 一种交互式音乐点播方法、装置及终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07168854A (ja) * | 1993-08-24 | 1995-07-04 | At & T Corp | データベースについての質問処理結果の表示装置 |
JP2004110633A (ja) * | 2002-09-20 | 2004-04-08 | Ricoh Co Ltd | 異表記辞書作成装置および異表記辞書作成方法およびその方法をコンピュータに実行させるためのプログラム |
JP2015138540A (ja) * | 2014-01-25 | 2015-07-30 | 司 窪田 | 被検索拒否可能データベース、被検索拒否可能データベース検索方法、データベース検索システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030217052A1 (en) * | 2000-08-24 | 2003-11-20 | Celebros Ltd. | Search engine method and apparatus |
US6647383B1 (en) * | 2000-09-01 | 2003-11-11 | Lucent Technologies Inc. | System and method for providing interactive dialogue and iterative search functions to find information |
US8266131B2 (en) * | 2006-07-25 | 2012-09-11 | Pankaj Jain | Method and a system for searching information using information device |
US10884503B2 (en) * | 2015-12-07 | 2021-01-05 | Sri International | VPA with integrated object recognition and facial expression recognition |
-
2019
- 2019-03-28 JP JP2019062944A patent/JP2020161076A/ja active Pending
-
2020
- 2020-03-17 WO PCT/JP2020/011743 patent/WO2020196100A1/ja active Application Filing
- 2020-03-17 US US17/441,438 patent/US20220188363A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07168854A (ja) * | 1993-08-24 | 1995-07-04 | At & T Corp | データベースについての質問処理結果の表示装置 |
JP2004110633A (ja) * | 2002-09-20 | 2004-04-08 | Ricoh Co Ltd | 異表記辞書作成装置および異表記辞書作成方法およびその方法をコンピュータに実行させるためのプログラム |
JP2015138540A (ja) * | 2014-01-25 | 2015-07-30 | 司 窪田 | 被検索拒否可能データベース、被検索拒否可能データベース検索方法、データベース検索システム |
Also Published As
Publication number | Publication date |
---|---|
JP2020161076A (ja) | 2020-10-01 |
US20220188363A1 (en) | 2022-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11763580B2 (en) | Information processing apparatus, information processing method, and program | |
JP7214237B2 (ja) | プログラム、情報処理方法および情報処理装置 | |
Chon et al. | Automatically characterizing places with opportunistic crowdsensing using smartphones | |
US8577962B2 (en) | Server apparatus, client apparatus, content recommendation method, and program | |
US9122757B1 (en) | Personal concierge plan and itinerary generator | |
JP2016184409A (ja) | 環境入力に基づいて情報を提供するために、知識表現を使用するシステム及び方法 | |
US9720570B2 (en) | Dynamic sorting and inference using gesture based machine learning | |
KR101761999B1 (ko) | 관계 유형을 고려한 코칭 방법 및 시스템 | |
WO2019097785A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR20150016786A (ko) | 대화의 소재를 제공하는 장치, 서버 및 방법 | |
WO2016117382A1 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
KR101693429B1 (ko) | 대인 관계 유형 파악을 통한 코칭 정보 제공 시스템 | |
JP2019036191A (ja) | 判定装置、判定方法及び判定プログラム | |
WO2020196100A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR20200133976A (ko) | 콘텐츠 큐레이션 방법 및 장치 | |
JP2019056956A (ja) | 情報処理システム、情報処理プログラム、情報処理装置及び情報処理方法 | |
JP7053325B2 (ja) | 情報提供装置およびその制御方法 | |
JP7080079B2 (ja) | 情報提供装置およびその制御方法 | |
JP2024010563A (ja) | 情報処理装置及び情報処理システム | |
WO2018051596A1 (ja) | 情報処理装置 | |
JP2012043002A (ja) | 活動促進システム、サーバ、活動促進方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20778564 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20778564 Country of ref document: EP Kind code of ref document: A1 |