WO2020153028A1

WO2020153028A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2020153028A1
Application number: PCT/JP2019/048579
Authority: WO
Inventors: 克俊金盛; 真人西尾
Original assignee: ソニー株式会社
Priority date: 2019-01-22
Filing date: 2019-12-11
Publication date: 2020-07-30
Also published as: US20220076672A1; CN113168500A

Abstract

認識状況に基づいてユーザとの対話を制御する制御部、を備え、前記制御部は、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定する、情報処理装置が提供される。また、プロセッサが、認識状況に基づいてユーザとの対話を制御すること、を含み、前記制御することは、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定すること、をさらに含む、情報処理方法が提供される。

Description

情報処理装置、情報処理方法、およびプログラム

　本開示は、情報処理装置、情報処理方法、およびプログラムに関する。

　近年、音声認識技術等を用いてユーザとの対話を行う装置が普及している。また、上記のような装置による対話の性能をより向上させるための技術が提案されている。例えば、特許文献１には、分野別の辞書を用いることにより、専門分野に応じた音声認識を実現する技術が記載されている。

特開２００３－２８０６８３号公報

　特許文献１に記載の技術によれば、専門分野における語彙等を精度高く認識することが可能となる。一方、特許文献１に記載の技術では、専門知識等を対話に活用することが困難である。

　本開示によれば、認識状況に基づいてユーザとの対話を制御する制御部、を備え、前記制御部は、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定する、情報処理装置が提供される。

　また、本開示によれば、プロセッサが、認識状況に基づいてユーザとの対話を制御すること、を含み、前記制御することは、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定すること、をさらに含む、情報処理方法が提供される。

　また、本開示によれば、コンピュータを、認識状況に基づいてユーザとの対話を制御する制御部、を備え、前記制御部は、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定する、情報処理装置、として機能させるためのプログラムが提供される。

本開示の一実施形態の概要について説明するための図である。同実施形態に係る情報処理システムの構成例を示す図である。同実施形態に係る情報処理装置の機能構成例を示すブロック図である。同実施形態に係る情報処理サーバの機能構成例を示すブロック図である。同実施形態に係る発話テンプレートの生成例を示す図である。同実施形態に係る発話テンプレートを用いた発話内容の決定例を示す図である。同実施形態に係る知識セットを用いた発話制御の流れを示すフローチャートである。同実施形態に係る物体認識結果に基づく発話制御の一例を示す図である。同実施形態に係る環境認識結果に基づく発話制御の一例を示す図である。同実施形態に係る位置情報に基づく発話制御の一例を示す図である。同実施形態に係る対話履歴に基づく発話制御の一例を示す図である。同実施形態に係る知識セット追加の効果について説明するための図である。同実施形態に係る知識セットの生成について説明するための図である。同実施形態に係る手動入力に基づく知識セットの生成について説明するための図である。同実施形態に係る知識セットのシェアについて説明するための図である。同実施形態に係る知識セット追加の推薦機能について説明するための図である。同実施形態に係る知識セットの利用優先順位の設定について説明するための図である。同実施形態に係る技術思想の広告への応用について説明するための図である。同実施形態に係る技術思想を広告に応用した場合の制御の流れを示すフローチャートである。本開示の一実施形態に係るハードウェア構成例を示す図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．実施形態
　　１．１．概要
　　１．２．システム構成例
　　１．３．情報処理装置１０の機能構成例
　　１．４．情報処理サーバ２０の機能構成例
　　１．５．機能の詳細
　２．知識セットの記載例
　３．ハードウェア構成例
　４．まとめ

　＜１．実施形態＞
　＜＜１．１．概要＞＞
　まず、本開示の一実施形態の概要について説明する。上述したように、近年、ユーザとの対話を行う装置が普及している。上記のような装置は、例えば、ユーザの発話に係る音声認識結果や意図解析結果等に基づいて、当該ユーザとの対話を実現する。

　しかし、ここで、ユーザの発話の専門性が高い場合等においては、ユーザの発話を正確に認識できない状況や、ユーザの発話意図を正確に抽出できない状況が生じうる。例えば、ユーザが、「特許協力条約」と発話した場合において、当該語彙が音声認識辞書に存在しない場合、正確な音声認識結果が得ることが困難な場合がある。

　上記のような状況に対応するために、例えば、特許文献１では、分野別の辞書を用いることにより、特定の専門分野における語彙に対する音声認識精度を高めている。一方、特許文献１の技術では、認識した語彙を対話に活用する機構が考慮されていない。このため、特許文献１に記載の技術では、「特許協力条約」を高精度に認識できた場合であっても、当該語彙を用いた対話に活用することができず、例えば、「Ｗｅｂで検索します」などの定型的な応答を行うこととなる。

　本開示に係る技術思想は上記の点に着目して発想されたものであり、多様な知識に基づいてユーザとのより自然な対話を実現することを可能とする。このために、本開示の一実施形態に係る情報処理方法を実現する情報処理装置１０は、認識状況に基づいてユーザとの対話を制御する制御部１５０を備える。また、本開示の一実施形態に係る制御部１５０は、上記認識状況と知識上で関連する知識要素を知識セットから取得し、当該知識要素を発話テンプレートとに基づいて、発話内容を決定すること、を特徴の一つとする。

　図１は、本開示の一実施形態の概要について説明するための図である。図１には、ユーザＵと音声対話を行う情報処理装置１０が示されている。なお、図１では、本実施形態に係る情報処理装置１０が認識状況に基づいてユーザとの対話やその他の自律動作を行うロボット装置である場合の一例が示されている。

　例えば、図１に示すように、ユーザＵが、「おいしいラーメンを食べたいな」という発話ＵＯ１を行った場合、情報処理装置１０が収集したユーザの発話ＵＯ１に基づいて音声認識や意図解析が行われ、ユーザＵが「ラーメン」を「食べたい」と発話したことが認識状況として得られる。このように、本実施形態に係る認識状況には、例えば、ユーザの発話に係る音声認識結果や意図解析結果、すなわち対話履歴が含まれる。

　この際、本実施形態に係る情報処理装置１０は、発話ＵＯ１の音声認識結果に含まれる語彙「ラーメン」と関連する知識要素を自身が備える知識ＤＢ１６２から取得する。ここで、本実施形態に係る知識ＤＢ１６２には、知識ドメインごとに記載される複数の知識セットが保管される。なお、図１では、知識ＤＢ１６２に保管される知識ドメイン「中華料理」に関する知識セットの一例が例示されている。なお、本実施形態に係る知識ドメインは、階層構造であってもよく、例えば、知識ドメイン「料理」の下に「中華料理」、「中華料理」の後に「北京料理」と続いてもよい。

　また、本実施形態に係る知識セットには、複数の知識要素と、当該知識要素間の関係とが記載される。例えば、図１に示す中華料理に係る知識セットの場合、知識要素「ラーメン」と「中華料理」とが関係「ｉｓ‐ａ（上位語）」により示されている。同様に、知識要素「餃子」と「中華料理」とが関係「ｉｓ‐ａ（上位語）」により示されている。図中の記載は、知識要素「中華料理」が「ラーメン」および「餃子」の上位語であることを示している。

　この際、本実施形態に係る情報処理装置１０の制御部１５０は、ユーザＵの発話ＵＯ１に含まれる「ラーメン」と同様の上位語「中華料理」を有する知識要素「餃子」を知識ＤＢ１６２が保管する中華料理に関する知識セットから取得することが可能である。このように、本実施形態に係る知識要素は、例えば、語彙を含む。

　また、制御部１５０は、ユーザＵの発話意図に基づいて、情報処理装置１０が備えるテンプレートＤＢ１６４から、ユーザＵの発話意図に対応する発話テンプレートを選択し、当該発話テンプレートに取得した知識要素「餃子」を当てはめることで、発話内容を決定する。図１に示す一例の場合、制御部１５０は、推薦を意図する発話テンプレート「ＸＸＸも一緒にどう？」に知識セット「餃子」を当てはめ、「餃子も一緒にどう？」というシステム発話ＳＯ１を情報処理装置１０に出力させている。

　このように、本実施形態に係る情報処理装置１０によれば、知識セットと発話テンプレートとを用いて発話内容を決定することで、認識状況に応じた柔軟かつ自然な対話を実現することが可能である。

　さらには、本実施形態に係る知識セットは、追加や利用優先順位の設定が可能であってよい。これによれば、知識セットの追加や、利用優先順位の設定により、ユーザの嗜好やニーズに応じて、情報処理装置１０が発する発話を柔軟に変更（カスタマイズ）することが可能となる。

　このため、本実施形態に係る情報処理装置１０によれば、知識セットを用いることで多様な状況に対応することができ、また知識セットを追加することにより対話の種類やバリエーションを充実化させることが可能となる。さらには、本実施形態に係る情報処理装置１０によれば、知識セットを基に発話内容を動的に生成することができ、従来のルールベースやシナリオベース方式の対話よりも豊かなバリエーションを実現し、単なる機能の呼び出しとは異なる、柔軟かつ自然な対話を実現することが可能となる。

　＜＜１．２．システム構成例＞＞
　次に、本実施形態に係る情報処理システムの構成例について述べる。図２は、本実施形態に係る情報処理システムの構成例を示す図である。図２を参照すると、本実施形態に係る情報処理システムは、情報処理装置１０、情報処理サーバ２０、情報処理端末３０を備える。また、上記の各構成は、ネットワーク４０を介して通信が可能なように接続される。

　（情報処理装置１０）
　本実施形態に係る情報処理装置１０は、知識セットと発話テンプレートとを用いてユーザとの発話を行う各種の装置である。本実施形態に係る情報処理装置１０は、例えば、認識状況に基づいてユーザとの対話やその他の自律動作を行うロボット装置であってもよい。一方、本実施形態に係る情報処理装置１０は、上記の例に限定されず、対話機能を有するスマートフォン、タブレット、ＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）、専用装置などであってもよい。

　（情報処理サーバ２０）
　本実施形態に係る情報処理サーバ２０は、情報処理装置１０にダウンロードされる知識セットを蓄積する装置である。また、本実施形態に係る情報処理サーバ２０は、ユーザが情報処理装置１０に知識セットを追加するためのユーザインタフェースを制御する。

　（情報処理端末３０）
　本実施形態に係る情報処理端末３０は、情報処理装置１０に対する知識セットの追加等の操作を行うための装置である。本実施形態に係る情報処理端末３０は、情報処理サーバ２０による制御に基づいて、上記の操作を行うためのユーザインタフェースを表示する。本実施形態に係る情報処理端末３０は、例えば、スマートフォン、タブレット、ＰＣなどであってもよい。

　（ネットワーク４０）
　ネットワーク４０は、情報処理システムが備える各構成を接続する機能を有する。ネットワーク４０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク４０は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網を含んでもよい。また、ネットワーク４０は、Ｗｉ－Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。

　以上、本実施形態に係る情報処理システムの構成例について述べた。なお、図２を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理システムの構成は係る例に限定されない。本実施形態に係る情報処理システムの構成は、仕様や運用に応じて柔軟に変形可能である。

　＜＜１．３．情報処理装置１０の機能構成例＞＞
　次に、本実施形態に係る情報処理装置１０の機能構成例について述べる。図３は、本実施形態に係る情報処理装置１０の機能構成例を示すブロック図である。図３を参照すると、本実施形態に係る情報処理装置１０は、音声入力部１１０、撮影部１２０、センサ部１３０、認識部１４０、制御部１５０、記憶部１６０、音声出力部１７０、およびサーバ通信部１８０を備える。

　（音声入力部１１０）
　本実施形態に係る音声入力部１１０は、ユーザの発話音声や周囲の環境音などを収集する。このために、本実施形態に係る音声入力部１１０は、マイクロフォンを備える。

　（撮影部１２０）
　本実施形態に係る撮影部１２０は、ユーザや周囲の画像を撮影する。このために、本実施形態に係る撮影部１２０は、カメラ装置などを備える。

　（センサ部１３０）
　本実施形態に係るセンサ部１３０は、ユーザや情報処理装置１０、周囲環境などに係る各種のセンシング情報を収集する。このために、本実施形態に係るセンサ部１３０は、例えば、加速度センサ、ジャイロセンサ、地磁気センサ、光センサ、温度センサ、圧力センサ、ＧＮＳＳ（Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）信号受信機などを備える。

　（認識部１４０）
　本実施形態に係る認識部１４０は、音声入力部１１０が収集した音情報、撮影部１２０が取得した画像情報、センサ部１３０が収集したセンシング情報、また情報処理サーバ２０による音声認識や意図解析の結果等に基づいて、総合的に状況を認識する。

　（制御部１５０）
　本実施形態に係る制御部１５０は、情報処理装置１０が備える各構成を制御する。また、本実施形態に係る制御部１５０は、認識部１４０が認識した認識状況と知識上で関連する知識要素を知識セットから取得し、当該知識要素と発話テンプレートとに基づいて、発話内容を決定すること、を特徴の一つとする。本実施形態に係る制御部１５０が有する機能の詳細については別途後述する。

　（記憶部１６０）
　本実施形態に係る記憶部１６０は、知識セットを保管する知識ＤＢ１６２と発話テンプレートを保管するテンプレートＤＢ１６４とを備える。

　本実施形態に係る知識セットには、複数の知識要素と当該知識要素間の関係とが記載される。本実施形態に係る知識要素は、例えば、語彙や動作、画像、音などを含んでよい。

　本実施形態に係る知識セットは、例えば、知識要素や概念を含む３つ組から成るトリプル構造の集合であってもよい。上記の構造には、例えば、知識要素３つから成るＲＤＦ（Ｒｅｓｏｕｒｃｅ　Ｄｅｓｃｒｉｐｔｉｏｎ　Ｆｒａｍｅｗｏｒｋ）トリプル構造と、述語（Ｐｒｅｄｉｃａｔｅ）が「ｉｓ－ａ（上位語）」などの関係を表す二項関係の構造とを含む。下記の表１に、本実施形態に係る二項関係の一例を示す。

　なお、上記の表１に示す二項関係はあくまで一例であり、本実施形態に係る二項関係は係る例に限定されない。本実施形態に係る二項関係には、例えば、食べる、満たす、好き、嫌い、来る、行く、などの各種の動詞を含んでもよい。また、本実施形態に係る知識セットは、意味ネットワークやオントロジー構造により記載されてもよい。

　（音声出力部１７０）
　本実施形態に係る音声出力部１７０は、制御部１５０による制御に基づいて、制御部１５０が決定した発話内容に対応する音声を出力する。このために、本実施形態に係る音声出力部１７０は、スピーカやアンプなどを備える。

　（サーバ通信部１８０）
　本実施形態に係るサーバ通信部１８０は、ネットワーク４０を介して、情報処理サーバ２０との情報通信を行う。本実施形態に係るサーバ通信部１８０は、例えば、情報処理サーバ２０から知識セットに係る情報を受信する。

　以上、本実施形態に係る情報処理装置１０の機能構成例について述べた。なお、図３を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理装置１０の機能構成例は係る例に限定されない。本実施形態に係る情報処理装置１０は、例えば、制御部１５０が決定した発話内容に対応するテキストなどを表示する表示部や、各種の動作を実現するための駆動部などを備え得る。本実施形態に係る情報処理装置１０の機能構成は、仕様や運用に応じて柔軟に変形可能である。

　＜＜１．４．情報処理サーバ２０の機能構成例＞＞
　次に、本実施形態に係る情報処理サーバ２０の機能構成例について述べる。図４は、本実施形態に係る情報処理サーバ２０の機能構成例を示すブロック図である。図４を参照すると、本実施形態に係る情報処理サーバ２０は、音声認識部２１０、自然言語処理部２２０、インタフェース制御部２３０、知識生成部２４０、蓄積部２５０、および通信部２６０を備える。

　（音声認識部２１０）
　本実施形態に係る音声認識部２１０は、情報処理装置１０から受信したユーザの発話音声に基づく自動音声認識（ＡＳＲ：Ａｕｔｏｍａｔｉｃ　Ｓｐｅｅｃｈ　Ｒｅｃｏｇｎｉｔｉｏｎ）処理を行い、当該発話音声を文字列に変換する。

　（自然言語処理部２２０）
　本実施形態に係る自然言語処理部２２０は、音声認識部２１０が生成した文字列に基づく自然言語理解（ＮＬＵ：Ｎａｔｕｒａｌ　Ｌａｎｇｕａｇｅ　Ｕｎｄｅｒｓｔａｎｄｉｎｇ）処理を行い、ユーザの発話の意図を抽出する。

　（インタフェース制御部２３０）
　本実施形態に係るインタフェース制御部２３０は、情報処理装置１０に知識セットの追加などを行うためのユーザインタフェースを制御する。ユーザは、所有する情報処理端末３０を用いて上記のユーザインタフェースにアクセスし、情報処理装置１０に対する知識セットの追加などを行うことができる。

　（知識生成部２４０）
　本実施形態に係る知識生成部２４０は、知識セットの生成を行う。本実施形態に係る知識生成部２４０が有する機能の詳細については別途後述する。

　（蓄積部２５０）
　本実施形態に係る蓄積部２５０は、知識生成部２４０が生成した知識セットを蓄積する。

　（通信部２６０）
　本実施形態に係る通信部２６０は、ネットワーク４０を介して情報処理装置１０や情報処理端末３０との情報通信を行う。本実施形態に係る通信部２６０は、例えば、情報処理端末３０におけるユーザ操作に基づいて、情報処理装置１０に知識セットに係る情報を送信する。

　以上、本実施形態に係る情報処理サーバ２０の機能構成例について述べた。なお、図４を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理サーバ２０の機能構成は係る例に限定されない。本実施形態に係る情報処理サーバ２０の機能構成は、仕様や運用に応じて柔軟に変形可能である。

　＜＜１．５．機能の詳細＞＞
　次に、本実施形態に係る情報処理装置１０が有する機能について詳細に説明する。まず、本実施形態に係る発話テンプレートについて述べる。上述したように、本実施形態に係る発話テンプレートは、発話内容の決定に用いられるテンプレートである。本実施形態に係る発話テンプレートは、例えば、対話例コーパスなどから生成される。

　図５は、本実施形態に係る発話テンプレートの生成例を示す図である。図５に示す一例では、好きな果物に係る対話例コーパスが示されている。この際、まず、対話例コーパスに含まれる発話のそれぞれに関し、音声認識および自然言語処理が行われる。また、知識ＤＢ１６２に保管される知識セットから、対話例コーパスに係るトピックが、“Ｆｒｕｉｔｓ”の“Ｌｉｋｅ”に関するものであることが特定される。

　この際、制御部１５０は、元となる発話から名詞（ｆｒｕｉｔｓおよびａｐｐｌｅ）、動詞（ｌｉｋｅ）、形容詞（ｂｅｓｔ）を抽出した上で変数化し、例えば、図中に示すような“Ｉ　Ｘ１　Ｘ２　Ｘ３　ｏｆ　Ｘ４．”のような“Ｉｍｐｒｅｓｓｉｏｎ”に関する発話テンプレートを生成する。

　このように、本実施形態に係る制御部１５０は、対話例や対話履歴などから変数動詞の関係を制約として保存した発話テンプレートを生成することができる。係る機能によれば、発話テンプレートを効率的に増加させる共に、ユーザの発話等に基づいたより自然は発話テンプレートを生成することが可能となる。

　続いて、本実施形態に係る発話テンプレートを用いた発話内容の決定例について述べる。図６は、本実施形態に係る発話テンプレートを用いた発話内容の決定例を示す図である。図６に示す一例の場合、ユーザＵは、「昨日、彼氏が最悪だったんだ」という発話ＵＯ２を行っている。

　この際、情報処理サーバ２０は、情報処理装置１０が収集した発話ＵＯ２に係る音声を受信し、音声認識および自然言語処理を行う。図６に示す一例では、意図「報告」が抽出されている。続いて、制御部１５０は、情報処理サーバ２０から受信した音声認識結果および自然言語処理、およびテンプレートタイプ決定テーブルＴ１を用いて、ユーザの発話意図に対応する発話テンプレートのタイプを決定する。

　図６に示す一例の場合、制御部１５０は、意図「報告」に対応するテンプレートタイプ「同情」を選択している。制御部１５０は、発話の意図に加え、ユーザの感情の分析結果などに基づいて、テンプレートタイプを決定してもよい。

　続いて、制御部１５０は、決定したテンプレートタイプ「同情」に対応する発話テンプレートをテンプレートＤＢ１６４から取得するとともに、変数部Ｘ１に当てはめる概念を知識ＤＢ１６２から取得し、発話内容「男って面倒だよねー」を決定し、当該発話内容に対応するシステム発話ＳＯ２を音声出力部１７０に出力させる。なお、ここで、変数部に当てはめる概念がうまく取得できない場合、制御部１５０は、異なる発話テンプレートを選択し発話内容の決定を行ってもよい。

　以上、本実施形態に係る発話テンプレートを用いた発話内容の決定例について説明した。本実施形態に係る制御部１５０が有する上記の機能によれば、ユーザの発話意図に対応する発話テンプレートを選択し、当該発話テンプレートが有する変数部に状況に応じた概念を当てはめることで、柔軟かつ自然な対話を実現することが可能となる。

　次に、本実施形態に係る知識セットを用いた応答内容の生成についてより詳細に説明する。上述したように、本実施形態に係る制御部１５０は、知識ドメインごとに記載される複数の知識セットを用いることで、認識部１４０が認識した各種の状況（認識状況）に応じた対話を実現することが可能である。

　図７は、本実施形態に係る知識セットを用いた発話制御の流れを示すフローチャートである。図７を参照すると、まず、認識部１４０が、音情報、画像情報、センシング情報、および情報処理サーバ２０による各種の処理結果などに基づいて、状況認識を行う（Ｓ１１０１）。

　次に、制御部１５０は、ステップＳ１１０１において認識された認識状況と知識上で関連する知識要素が知識セット上に存在するか否かを判定する（Ｓ１１０２）。

　また、制御部１５０は、所定期間内において対象となる知識要素を用いた発話回数が閾値未満であるか否かを判定する（Ｓ１１０３）。

　認識状況と関連する知識要素が存在しない場合（Ｓ１１０２：ＮＯ）、または対象となる知識要素を用いた発話回数が閾値以上である（Ｓ１１０３：ＮＯ）、制御部１５０は、情報処理装置１０に他の自律動作（知識セットを用いた発話以外の動作）を実行させる（Ｓ１１０６）。

　一方、認識状況と関連する知識要素が存在し（Ｓ１１０２：ＹＥＳ）、かつ対象となる知識要素を用いた発話回数が閾値未満である（Ｓ１１０３：ＹＥＳ）、制御部１５０は、所定期間内において発話に用いた回数が閾値未満である発話テンプレートを選択する。この際、制御部１５０は、例えば、所定期間内に最も使用していない発話テンプレートを取得してもよい（Ｓ１１０４）。

　続いて、制御部１５０は、知識要素と発話テンプレートとに基づいて発話内容を決定し、当該発話内容に対応するシステム発話を音声出力部１７０に出力させる（Ｓ１１０５）。

　以上、本実施形態に係る知識セットを用いた発話制御の流れについて説明した。本実施形態に係る制御部１５０による上記の制御によれば、所定期間内に同一の知識要素や発話テンプレートが多用されることを防止し、多様な発話から成る対話を実現することが可能である。

　次に、本実施形態に係る発話制御の具体例について述べる。本実施形態に係る認識状況は、例えば、物体認識結果、環境認識結果、位置情報、音声認識結果、意図解析結果などを含んでよい。

　図８は、本実施形態に係る物体認識結果に基づく発話制御の一例を示す図である。図８に示す一例では、認識部１４０が、撮影部１２０が撮影した画像に基づく物体認識を行い、関連する語彙（人、女性、食事、紅茶など）を取得している。なお、物体認識は、情報処理サーバ２０により実行されてもよい。

　この際、本実施形態に係る制御部１５０は、物体認識の結果に関連する知識要素のうち発話に用いた回数が閾値未満である知識要素を知識ＤＢ１６２から取得する。また、制御部１５０は、テンプレートＤＢ１６４から発話テンプレートを取得し、当該発話テンプレートの変数部に上記のように取得した知識要素を当てはめることで発話内容を決定する。

　上記の制御によれば、図示するように、ユーザＵが紅茶を飲んでいる状況において、例えば、「飲み物なら緑茶がいいぞ」というシステム発話ＳＯ３を出力することができ、認識した物体に応じたより自然な対話を行うことができる。

　また、図９は、本実施形態に係る環境認識結果に基づく発話制御の一例を示す図である。図９に示す一例では、認識部１４０が、音声入力部１１０が収集した環境音に基づく環境認識（音解析）を行い、関連する語彙（雨）を取得している。なお、環境認識は、情報処理サーバ２０により実行されてもよい。

　この際、本実施形態に係る制御部１５０は、環境認識の結果に関連する知識要素のうち発話に用いた回数が閾値未満である知識要素を知識ＤＢ１６２から取得する。また、制御部１５０は、テンプレートＤＢ１６４から発話テンプレートを取得し、当該発話テンプレートの変数部に上記のように取得した知識要素を当てはめることで発話内容を決定する。

　上記の制御によれば、図示するように、雨が降っている状況において、例えば、「雨って飲めるのかな」というシステム発話ＳＯ４を出力することができ、天候などの各種の状況に応じたより自然な対話を行うことができる。

　また、図１０は、本実施形態に係る位置情報に基づく発話制御の一例を示す図である。図１０に示す一例では、認識部１４０が、位置情報に基づいて、関連する語彙（東京、浅草）を取得している。

　上記の制御によれば、図示するように、ユーザと情報処理装置１０が東京の浅草にいる状況において、例えば、「浅草寺寄って行こうよ」というシステム発話ＳＯ５を出力することができ、周辺位置に応じたより自然な対話を行うことができる。

　また、図１１は、本実施形態に係る対話履歴に基づく発話制御の一例を示す図である。図１１に示す一例では、ユーザとの対話履歴（発話ＵＯ２、システム発話ＳＯ６、および発話ＵＯ３）の音声認識結果、および意味解析の結果が取得されている。

　この際、本実施形態に係る制御部１５０は、上記の認識結果に関連する知識要素のうち発話に用いた回数が閾値未満である知識要素を知識ＤＢ１６２から取得する。また、制御部１５０は、テンプレートＤＢ１６４から発話テンプレートを取得し、当該発話テンプレートの変数部に上記のように取得した知識要素を当てはめることで発話内容を決定する。

　上記の制御によれば、図示するように、ラーメンを食べたいと発話したユーザとの対話履歴に基づいて、例えば、「中華料理ならチャーハンがいいぞ」というシステム発話ＳＯ７を出力することができ、文脈に応じたより自然な対話を行うことができる。

　以上、本実施形態に係る認識状況に基づく発話制御の具体例について述べた。なお、本実施形態に係る認識状況は、係る例に限定されず、例えば、ユーザの状態や時刻などであってもよい。例えば、ユーザが眠そうな表情をしていることが認識された状況では、制御部１５０は、睡眠や健康に関する知識を含む発話を音声出力部１７０に出力させることができる。また、例えば、制御部１５０は、夕飯時などには、流行の料理やレストランなどに関する知識を含む発話を音声出力部１７０に出力させるなど、時間帯に応じた発話を行うことも可能である。

　続いて、本実施形態に係る知識セットの追加について詳細に説明する。上述したように、本実施形態に係る情報処理装置１０には、ユーザ操作に基づき新たに知識セットを追加することが可能である。図１２は、本実施形態に係る知識セット追加の効果について説明するための図である。

　例えば、図１２の上段において、ユーザＵは、「ビーフストロガノフが食べたいな」という発話ＵＯ４を行っている。ここで、情報処理装置１０がビーフストロガノフを含む料理の知識セットを有していない場合、情報処理装置１０は、「それ何？」というシステム発話ＳＯ８や、「知りません」または「Ｗｅｂの情報によると…」などの定型的な発話しか行うことができない。

　一方、ここで、図中段に示すように、ビーフストロガノフに関する知識を含む料理知識セットＫ１を情報処理サーバ２０（外部装置）から情報処理装置１０に新たにダウンロードした場合、情報処理装置１０は、料理知識セットＫ１に含まれる知識要素を活用し、例えば、図中下段に示すように、「牛肉がトロトロでおいいしいよね」というシステム発話ＳＯ９を出力することが可能となる。

　このように、本実施形態に係る情報処理装置１０は、ユーザのニーズや嗜好に応じて知識セットを新たに追加することで、システム発話のバリエーションを増加させ、ユーザとのより豊かな対話を行うことができる。

　図１３は、本実施形態に係る知識セットの生成について説明するための図である。本実施形態に係る情報処理サーバ２０の知識生成部２４０は、ユーザやオペレータなどによる手動入力、Ｗｅｂや文書などからの自動収集、または、既存の知識セットからの抽出や抜粋などに用意された知識を、ＲＤＦをはじめとするオントロジー構造などを用いた知識表現に変換することで知識セットを生成してもよい。また、知識生成部２４０は、生成した知識セットを蓄積部２５０に蓄積させることで、情報処理装置１０へのダウンロードが可能な状態とする。

　図１４は、本実施形態に係る手動入力に基づく知識セットの生成について説明するための図である。上述したように、本実施形態に係る知識セットは、ユーザ自身が記載可能であってよい。例えば、ユーザは、図中上段に示すように、情報処理端末３０に表示されるユーザインタフェース（ＧＵＩ）上で、入力した複数の知識要素を繋ぎ、関係性を選択することなどにより、直感的かつ容易に新たな知識セットを生成できてもよい。

　また、ユーザやオペレータは、例えば、図中下段に示すように、ＣＳＶファイルなどに予め定められた文法で知識要素や関係を記載することで、効率的に大量の知識セットを生成できてもよい。なお、数学の基礎に関する知識セットの記載例を項目＜２．知識セットの記載例＞に添付する。

　次に、本実施形態に係る自動収集に基づく知識セットの生成について、より詳細に説明する。本実施形態に係る知識生成部２４０は、例えば、Ｗｅｂ上のリソースをスクレイピングする、既存の文書からのテキストマイニングを行うなどの手法により自動的に知識セットを生成することも可能である。

　この際、あらゆる分野の知識を隈なく収集することや、あらゆるフォーマットの文書から知識を抽出することは比較的困難であるが、ドメインや情報源を限定することで自動収集ルールを構築することで、知識の自動収集を行うことが可能となる。

　例えば、ドメインを料理に絞った場合、収集すべき知識を料理の作り方や材料、料理のカテゴリなどに限定することできる。また、特定のレシピサイトを情報源とすることで、作り方や材料、料理のカテゴリ同の記述が統一されたフォーマットからの取得ルール構築という単純な問題に落とし込むことが可能である。

　以上、本実施形態に係る知識セットの生成について説明した。ユーザは、上記のように生成された知識セットをユーザインタフェース上からダウンロードすることで、情報処理装置１０に知識セットを追加することが可能である。なお、ユーザは、この際、詳細ボタンを押下することなどにより、図１４の上段に示したような表示形式により知識セットの内容を視覚的に確認することができてもよい。

　また、例えば、ユーザが個人で生成した知識セットは、ユーザインタフェース上で公開、シェアされてもよい。図１５は、本実施形態に係る知識セットのシェアについて説明するための図である。図１５では、ユーザインタフェース上において、ユーザＤＥＦが生成した漫画の知識セットや、ユーザＧＨＩが生成したワインの知識セットが公開されている場合の一例が示されている。

　このように、本実施形態に係るユーザインタフェースによれば、自身が生成した知識セットを有償または無償でシェアすることができ、また他のユーザが生成した知識セットを自身が所有する情報処理装置１０にダウンロードすることが可能である。

　次に、本実施形態に係る知識セット追加の推薦機能について説明する。本実施形態に係る制御部１５０は、ユーザとの対話に不足していると予測される知識の追加をユーザに推奨する機能を有してもよい。図１６は、本実施形態に係る知識セット追加の推薦機能について説明するための図である。

　図１６に示す一例の場合、ユーザＵ１とＵ２とが、「ピアノ」に関する発話ＵＯ６を踏む対話を行っている。ここで、「ピアノ」に関連する知識ドメインの知識セットが情報処理装置１０にインストールされていない場合、制御部１５０は、知識ドメイン「楽器」の知識セットの購入を推薦するシステム発話ＳＯ１０を音声出力部１７０に出力させることができる。

　このように、本実施形態に係る制御部１５０は、ユーザの発話に含まれる語彙に基づいて、当該語彙に関連する知識セットの追加を推薦する発話内容を決定し、当該発話内容に対応する音声を音声出力部１７０に出力させてもよい。

　本実施形態に係る制御部１５０が有する上記の機能によれば、より豊かな対話を実現するための知識セットをユーザが把握することができるとともに、ユーザが当該知識セットを購入するよう誘導することで、収益を高めることが可能となる。

　次に、本実施形態に係る知識セットの利用優先順位の設定について説明する。本実施形態に係る知識セットは、ユーザにより利用優先順位が設定可能であってよい。図１７は、本実施形態に係る知識セットの利用優先順位の設定について説明するための図である。

　図中上段に示すように、ユーザは、例えば、情報処理端末３０に表示されるユーザインタフェース上において、知識セットをドラッグ＆ドロップなどにより操作することで、容易に利用優先順位を設定できてよい。

　この際、本実施形態に係る制御部１５０は、設定された利用優先順位に基づいて知識要素を取得する知識セットを決定し、取得した知識要素と発話テンプレートとに基づいて発話内容を決定する。

　例えば、ユーザＵが知識ドメイン「動物」の知識セットを、知識ドメイン「神話」の知識セットよりも優先的に設定している場合、本実施形態に係る制御部１５０は、ユーザＵの発話ＵＯ７に含まれる語彙「さそり」に関連する知識要素を知識ドメイン「動物」の知識セットから収集することで、「毒が怖いよね」というシステム発話ＳＯ１１ａを音声出力部１７０に出力させることができる。

　一方、ユーザＵが知識ドメイン「神話」の知識セットを、知識ドメイン「動物」の知識セットよりも優先的に設定している場合、本実施形態に係る制御部１５０は、ユーザＵの発話ＵＯ７に含まれる語彙「さそり」に関連する知識要素を知識ドメイン「神話」の知識セットから収集することで、「オリオンの天敵だよね」というシステム発話ＳＯ１１ｂを音声出力部１７０に出力させることができる。

　このように、本実施形態に係る情報処理装置１０は、複数の知識セットの利用優先順位に基づいて発話内容を生成することで、ユーザの嗜好により合致した対話を実現することができる。

　以上、本実施形態に係る制御部１５０による知識セットおよび発話テンプレートを用いた発話制御について説明した。係る制御によれば、状況やユーザの嗜好・ニーズに応じた、より柔軟かつ自然な対話を実現することが可能となる。

　続いて、本実施形態に技術思想の応用について例を述べる。本実施形態に係る技術思想は、ユーザとの自由対話のみではなく種々の分野に応用が可能である。本実施形態に係る技術思想は、例えば、企業等による公告に応用されてもよい。

　図１８は、本実施形態に係る技術思想の広告への応用について説明するための図である。図１８に示す一例では、ユーザＵと情報処理装置１０とが、ビールに関する対話を行っている。具体的には、情報処理装置１０は、ユーザＵの「喉乾いた」という発話ＵＯ８に対し、「ビールだね」というシステム発話ＳＯ１２を行い、「いいねー、飲もう！」という発話ＵＯ９に対し、広告の対象である「ＡＢＣビール」を推薦するシステム発話ＳＯ１３を行っている。

　このように、本実施形態に係る知識セットは、企業等から提供される広告に係る知識セットを含んでよい。この際、本実施形態に係る制御部１５０は、ユーザとの対話履歴に広告に係る彙（例えば、喉乾いた、や、ビール、など）、当該広告に係る知識セットから知識要素を取得し発話内容を決定することで、対象となる商品やサービスをユーザに推薦することが可能である。

　なお、広告に係る知識セットには、例えば、他社製品に係る知識要素などを含まれていてもよい。例えば、図１８に示す一例の場合、ユーザＵは、システム発話ＳＯ１３に対し、他社製品（または他のビール製造会社）の名称である「シロクマ」を含む発話ＵＯ１０を行っている。

　ここで、広告に係る知識セットに、「シロクマ」に対応する知識要素が存在しない場合、制御部１５０は、知識ドメイン「動物」から取得した知識要素や一般常識などに基づいて、「動物園行くの？」などのシステム発話ＳＯ１４ａを音声出力部１７０に出力させる可能性があり、対話が不自然となる。

　一方、広告に係る知識セットに知識要素「シロクマ」が含まれている場合、制御部１５０は、ユーザＵが他社製品を購入しようとしていると判断することができ、自社製の新商品を薦めるシステム発話ＳＯ１４ｂを音声出力部１７０に出力させることなどが可能となる。

　このように、本実施形態に係る技術思想を広告に応用することにより、自然な対話の中で対象となる製品やサービスをユーザに推薦することが可能となり、収益を効果的に向上させる効果が期待される。

　続いて、図１９を参照して、本実施形態に係る技術思想を広告に応用した場合の制御の流れについて説明する。

　図１９を参照すると、まず、制御部１５０は、ユーザが自身の意思について発話しているか否かを判定する（Ｓ１２０１）。

　ここで、ユーザが自身の意思について発話していないと判定した場合（Ｓ１２０１：ＮＯ）、制御部１５０は、広告以外の発話内容を設定し、当該発話内容に対応するシステム発話を音声出力部１７０に出力させる（Ｓ１２０６）。

　一方、ユーザが自身の意思について発話していると判定した場合（Ｓ１２０１：ＹＥＳ）、制御部１５０は、広告知識（広告に係る知識セットに含まれる知識要素）に関連する話題が対話履歴に存在するか否かを判定する（Ｓ１２０２）。

　ここで、広告知識に関連する話題が対話履歴に存在しない場合（Ｓ１２０２：ＮＯ）、制御部１５０は、広告以外の発話内容を設定し、当該発話内容に対応するシステム発話を音声出力部１７０に出力させる（Ｓ１２０６）。

　一方、広告知識に関連する話題が対話履歴に存在する場合（Ｓ１２０２：ＹＥＳ）、制御部１５０は、続いて、対象となる広告知識を用いた発話回数が閾値未満であるか否かを判定する（Ｓ１２０３）。

　ここで、対象となる広告知識を用いた発話回数が閾値以上である場合（Ｓ１２０３：ＮＯ）、制御部１５０は、広告以外の発話内容を設定し、当該発話内容に対応するシステム発話を音声出力部１７０に出力させる（Ｓ１２０６）。

　一方、対象となる広告知識を用いた発話回数が閾値未満である場合（Ｓ１２０３：ＹＥＳ）、制御部１５０は、所定期間内において最も使用していない発話テンプレートを取得する（Ｓ１２０４）。なお、この際、発話テンプレートには、商品特性やキャッチコピーなどが組み込まれていてもよい。

　続いて、制御部１５０は、広告知識と発話テンプレートとに基づいて発話内容を決定し、当該発話内容に対応するシステム発話を音声出力部１７０に出力させる（Ｓ１２０５）。

　以上、本実施形態に係る技術思想を広告に応用した場合の制御の流れについて説明した。上記の制御によれば、所定期間内に同一の広告知識や発話テンプレートが多用されることを防止し、ユーザを辟易とさせることを回避することができる。

　また、本実施形態に係る制御部１５０は、ユーザが、例えば、「どれがいいかな？」や「何にしようかな？」のような提案を求める発話を行った場合にのみ、広告知識を用いたシステム発話を音声出力部１７０に出力させることもできる。

　また、例えば、発話テンプレートに敢えて商品の不評な部分を組み込むことで第三者感を演出し（例えば、ＡＢＣ社のテレビは高いけど画質はいいよね、など）、より自然な対話とすることもできる。

　なお、本実施形態に係る技術思想は、広告以外にも広く応用が可能である。例えば、本実施形態に係る技術思想は、教育に応用されてもよい。この場合、算数、国語、理科、社会などの教育科目に対応した知識セットをインストールすることで、情報処理装置１０を介した教育システムを実現することができる。

　また、例えば、本実施形態に係る技術思想は、販促・宣伝などに応用されてもよい。この場合、３ｒｄパーティなどが自社の商品をＰＲするために、無料の知識セットを作成して配布することなども想定される。

　また、例えば、本実施形態に係る技術思想は、リハビリなどに応用されてもよい。この場合、例えば、日常生活で用いるやさしい言語表現の知識セットを情報処理装置１０にインストールすることで、言語障がいのあるユーザの会話のリハビリを補助することができる。

　また、例えば、本実施形態に係る技術思想は、趣味等の話し相手に適用されてもよい。この場合、ユーザは、自身との対話に必要なマニアックな専門知識や、人間関係などの個人情報に関する知識セットを情報処理装置１０にインストールすることで、より深い対話を享受することが可能である。

　＜２．知識セットの記載例＞
　数学の基礎に関する知識セットに関する記載例を以下に例示する。

　　$is-a,カントール,人間
　　$is-a,クロネッカー,人間
　　$is-a,ラッセル,人間
　　$is-a,ホワイトヘッド,人間
　　$is-a,ヒルベルト,人間
　　$is-a,ゲーデル,人間
　　$is-a,ゲンツェン,人間
　　$is-a,ブラウアー,人間
　　$is-a,フレーゲ,人間
　　$is-a,ツェルメロ,人間
　　$is-a,フレンケル,人間
　　$is-a,オイラー,人間
　　$is-a,ガウス,人間
　　$is-a,ユークリッド,人間
　　$is-a,カントール,数学者
　　$is-a,クロネッカー,数学者
　　$is-a,ラッセル,数学者
　　$is-a,ホワイトヘッド,数学者
　　$is-a,ヒルベルト,数学者
　　$is-a,ゲーデル,数学者
　　$is-a,ゲンツェン,数学者
　　$is-a,ブラウアー,数学者
　　$is-a,フレーゲ,数学者
　　$is-a,ツェルメロ,数学者
　　$is-a,フレンケル,数学者
　　$is-a,オイラー,数学者
　　$is-a,ガウス,数学者
　　$is-a,ユークリッド,数学者
　　$is-a,カントール,男
　　$is-a,クロネッカー,男
　　$is-a,ラッセル,男
　　$is-a,ホワイトヘッド,男
　　$is-a,ヒルベルト,男
　　$is-a,ゲーデル,男
　　$is-a,ゲンツェン,男
　　$is-a,ブラウアー,男
　　$is-a,フレーゲ,男
　　$is-a,論理,理論
　　$is-a,命題論理,論理
　　$is-a,命題論理,論理体系
　　$is-a,述語論理,論理
　　$is-a,述語論理,論理体系
　　$has-a,論理体系,論理演算
　　$is-a,命題,リテラル
　　$is-a,論理演算子,演算子
　　$is-a,含意,論理演算
　　$is-a,否定,論理演算
　　$is-a,論理和,論理演算
　　$is-a,論理積,論理演算
　　$is-a,排他的論理和,論理演算
　　$is-a,同値,論理演算
　　$is-a,恒真,論理演算
　　$is-a,演繹,論理演算
　　$is-a,演繹,推論
　　$is-a,一階述語論理,述語論理
　　$is-a,二階述語論理,述語論理
　　$is-a,二階述語論理,高階述語論理
　　$is-a,高階述語論理,高階論理
　　$導く,公理,定理
　　$is-a,三段論法,演繹
　　$is-a,三段論法,演繹
　　$is-a,定理,論理的帰結
　　$is-a,論理的帰結,正しい
　　$is-a,導出,論理演算
　　$is-a,公理的集合論,集合論
　　$is-a,素朴集合論,集合論
　　$is-a,論理式,式
　　$is-a,整論理式,論理式
　　$is-a,原始式,論理式
　　$is-a,原始式,式
　　$is-a,述語論理式,論理式
　　$is-a,命題論理式,論理式
　　$part-of,述語,リテラル
　　$part-of,リテラル,述語論理式
　　$part-of,論理演算子,述語論理式
　　$part-of,論理演算子,命題論理式
　　$part-of,命題,命題論理式
　　$part-of,式,命題論理式
　　$part-of,論理演算子,論理式
　　$member-of,公理,公理系
　　$has-a,公理系,公理
　　$is-a,公理的集合論,公理系
　　$member-of,ラッセル,論理主義
　　$member-of,ブラウアー,直観主義
　　$member-of,ヒルベルト,形式主義
　　$is-a,古典論理,論理
　　$has-a,古典論理,排中律
　　$has-a,形式主義論理,排中律
　　$著者,プリンキピア・マテマティカ
　　$著者,原論,ユークリッド
　　$is-a,方程式,恒真式
　　$is-a,方程式,式
　　$is-a,恒真式,式
　　$has-a,公理系,公理
　　$is-a,ツェルメロフレンケルの公理系,公理的集合論
　　$is-a,ツェルメロフレンケルの公理系,公理系
　　$has-a,ツェルメロフレンケルの公理系,外延性の公理
　　$has-a,ツェルメロフレンケルの公理系,空集合の公理
　　$has-a,ツェルメロフレンケルの公理系,対の公理
　　$has-a,ツェルメロフレンケルの公理系,和集合の公理
　　$has-a,ツェルメロフレンケルの公理系,無限公理
　　$has-a,ツェルメロフレンケルの公理系,冪集合公理
　　$has-a,ツェルメロフレンケルの公理系,置換公理
　　$has-a,ツェルメロフレンケルの公理系,正則性公理
　　$is-a,ZFC,公理的集合論
　　$is-a,ZFC,公理系
　　$has-a,ZFC,外延性の公理
　　$has-a,ZFC,空集合の公理
　　$has-a,ZFC,対の公理
　　$has-a,ZFC,和集合の公理
　　$has-a,ZFC,無限公理
　　$has-a,ZFC,冪集合公理
　　$has-a,ZFC,置換公理
　　$has-a,ZFC,正則性公理
　　$has-a,ZFC,選択公理
　　$is-a,ラッセルのパラドックス,パラドックス
　　$is-a,グロタンディーク宇宙,集合
　　$is-a,距離空間,集合
　　$has-a,距離空間,距離関数
　　$is-a,マンハッタン距離,距離
　　$is-a,編集距離,距離
　　$is-a,マハラノビス距離,距離
　　$is-a,ユークリッド距離,距離
　　$is-a,コサイン距離,距離
　　$is-a,ハミング距離,距離
　　$満たす,距離,三角不等式
　　$has-a,距離,非負性
　　$is-a,関数,写像
　　$has-a,関数,値域
　　$has-a,関数,定義域
　　$has-a,全単射,逆関数
　　$is-a,全射,関数
　　$is-a,単写,関数
　　$is-a,全単射,関数
　　$is-a,代数関数,関数
　　$is-a,初等関数,関数
　　$is-a,指数関数,関数
　　$is-a,対数関数,関数
　　$is-a,三角関数,関数
　　$is-a,逆三角関数,関数
　　$is-a,双曲線関数,関数
　　$is-a,逆三角関数,関数
　　$is-a,ガンマ関数,関数
　　$is-a,ベータ関数,関数
　　$is-a,誤差関数,関数
　　$is-a,テータ関数,関数
　　$is-a,ゼータ関数,関数
　　$is-a,マチウ関数,関数
　　$is-a,偶関数,関数
　　$is-a,奇関数,関数
　　$is-a,自然数,数
　　$is-a,自然数,整数
　　$is-a,自然数,有理数
　　$is-a,自然数,実数
　　$is-a,整数,数
　　$is-a,整数,有理数
　　$is-a,整数,実数
　　$is-a,有理数,数
　　$is-a,有理数,実数
　　$is-a,無理数,数
　　$is-a,実数,数
　　$is-a,超越数,数
　　$is-a,素数,数
　　$is-a,素数,自然数
　　$is-a,素数,有理数
　　$is-a,素数,実数
　　$is-a,複素数,数
　　$has-a,複素数,虚数
　　$part-of,虚数,複素数
　　$is-a,虚数,数
　　$has-a,虚数,複素数
　　$has-a,べき集合,束構造
　　$is-a,べき集合,集合
　　$is-a,直積集合,集合
　　$is-a,無限集合,集合
　　$is-a,有限集合,集合
　　$is-a,可算集合,集合
　　$has-a,可算集合,可算性
　　$is-a,非可算集合,集合
　　$has-a,集合,濃度
　　$is-a,実数,集合
　　$is-a,実数,連続体濃度
　　$is-a,和集合,集合
　　$is-a,順序集合,集合
　　$has-a,順序集合,順序関係
　　$is-a,順序関係,二項関係
　　$is-a,二項関係,関係
　　$is-a,半順序,二項関係
　　$has-a,半順序,推移性
　　$has-a,半順序,反射性
　　$has-a,半順序,半対称性
　　$満たす,半順序,推移律
　　$満たす,半順序,反射律
　　$満たす,半順序,反対象律
　　$is-a,全順序,二項関係
　　$has-a,全順序,推移性
　　$has-a,全順序,反射性
　　$has-a,全順序,半対称性
　　$満たす,全順序,推移律
　　$満たす,全順序,反射律
　　$満たす,全順序,反対象律
　　$is-a,半順序集合,順序集合
　　$is-a,全順序集合,順序集合
　　$has-a,半順序集合,半順序
　　$has-a,全順序集合,全順序
　　$is-a,和,演算
　　$member-of,和,四則演算
　　$is-a,差,演算
　　$member-of,差,四則演算
　　$is-a,積,演算
　　$member-of,積,四則演算
　　$is-a,商,演算
　　$member-of,商,四則演算
　　$is-a,足し算,演算
　　$member-of,足し算,四則演算
　　$is-a,引き算,演算
　　$member-of,引き算,四則演算
　　$is-a,掛け算,演算
　　$member-of,掛け算,四則演算
　　$is-a,割り算,演算
　　$member-of,割り算,四則演算
　　$member-of,代数学,数学
　　$member-of,幾何学,数学
　　$member-of,解析学,数学
　　$member-of,微分積分学,数学
　　$member-of,論理学,数学
　　$member-of,数学基礎論,数学
　　$member-of,位相幾何学,数学
　　$has-a,ラッセル,ラッセルのパラドックス
　　$has-a,ゲーデル,不完全性定理
　　$has-a,ゲーデル,完全性定理
　　$has-a,ヒルベルト,23の問題
　　$has-a,ラッセル,型の理論
　　$has-a,カントール,素朴集合論
　　$has-a,カントール,連続体仮設
　　$has-a,ツェルメロ,ツェルメロフレンケルの公理系
　　$has-a,フレンケル,ツェルメロフレンケルの公理系
　　$has-a,ツェルメロ,ZFC
　　$has-a,フレンケル,ZFC

　＜３．ハードウェア構成例＞
　次に、本開示の一実施形態に係る情報処理装置１０のハードウェア構成例について説明する。図２０は、本開示の一実施形態に係る情報処理装置１０のハードウェア構成例を示すブロック図である。図２０に示すように、情報処理装置１０は、例えば、プロセッサ８７１と、ＲＯＭ８７２と、ＲＡＭ８７３と、ホストバス８７４と、ブリッジ８７５と、外部バス８７６と、インタフェース８７７と、入力装置８７８と、出力装置８７９と、ストレージ８８０と、ドライブ８８１と、接続ポート８８２と、通信装置８８３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

　（プロセッサ８７１）
　プロセッサ８７１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ８７２、ＲＡＭ８７３、ストレージ８８０、又はリムーバブル記録媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。

　（ＲＯＭ８７２、ＲＡＭ８７３）
　ＲＯＭ８７２は、プロセッサ８７１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ８７３には、例えば、プロセッサ８７１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

　（ホストバス８７４、ブリッジ８７５、外部バス８７６、インタフェース８７７）
　プロセッサ８７１、ＲＯＭ８７２、ＲＡＭ８７３は、例えば、高速なデータ伝送が可能なホストバス８７４を介して相互に接続される。一方、ホストバス８７４は、例えば、ブリッジ８７５を介して比較的データ伝送速度が低速な外部バス８７６に接続される。また、外部バス８７６は、インタフェース８７７を介して種々の構成要素と接続される。

　（入力装置８７８）
　入力装置８７８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置８７８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８７８には、マイクロフォンなどの音声入力装置が含まれる。

　（出力装置８７９）
　出力装置８７９は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、ＬＣＤ、又は有機ＥＬ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置８７９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

　（ストレージ８８０）
　ストレージ８８０は、各種のデータを格納するための装置である。ストレージ８８０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。

　（ドライブ８８１）
　ドライブ８８１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９０１に記録された情報を読み出し、又はリムーバブル記録媒体９０１に情報を書き込む装置である。

　（リムーバブル記録媒体９０１）
　リムーバブル記録媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤ　ＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。

　（接続ポート８８２）
　接続ポート８８２は、例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９０２を接続するためのポートである。

　（外部接続機器９０２）
　外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。

　（通信装置８８３）
　通信装置８８３は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、又は各種通信用のモデム等である。

　＜４．まとめ＞
　以上説明したように、本開示の一実施形態に係る情報処理方法を実現する情報処理装置１０は、認識状況に基づいてユーザとの対話を制御する制御部１５０を備える。また、本開示の一実施形態に係る制御部１５０は、上記認識状況と知識上で関連する知識要素を知識セットから取得し、当該知識要素を発話テンプレートとに基づいて、発話内容を決定すること、を特徴の一つとする。係る構成によれば、多様な知識に基づいてユーザとのより自然な対話を実現することが可能となる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　また、コンピュータに内蔵されるＣＰＵ、ＲＯＭおよびＲＡＭなどのハードウェアに、情報処理サーバ２０が有する構成と同等の機能を発揮させるためのプログラムも作成可能であり、当該プログラムを記録した、コンピュータに読み取り可能な非一過性の記録媒体も提供され得る。

　また、本明細書の情報処理装置１０の処理に係る各ステップは、必ずしもフローチャートに記載された順序に沿って時系列に処理される必要はない。例えば、情報処理装置１０の処理に係る各ステップは、フローチャートに記載された順序と異なる順序で処理されても、並列的に処理されてもよい。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　認識状況に基づいてユーザとの対話を制御する制御部、
　を備え、
　前記制御部は、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定する、
情報処理装置。
（２）
　前記知識要素は少なくとも語彙を含む、
前記（１）に記載の情報処理装置。
（３）
　前記知識セットには、複数の前記知識要素と、前記知識要素間の関係とが記載される、前記（２）に記載の情報処理装置。
（４）
　前記知識セットを保管する記憶部、
　をさらに備える、
前記（３）に記載の情報処理装置。
（５）
　前記知識セットは、知識ドメインごとに記載される、
前記（４）に記載の情報処理装置。
（６）
　前記知識セットは、ユーザ操作に基づき追加が可能である、
前記（５）に記載の情報処理装置。
（７）
　前記知識セットは、外部装置からのダウンロードが可能である、
前記（６）に記載の情報処理装置。
（８）
　前記知識セットは、ユーザが記載可能である、
前記（５）～（７）のいずれかに記載の情報処理装置。
（９）
　前記知識セットの利用優先順位はユーザが設定可能であり、
　前記制御部は、前記利用優先順位に基づいて前記知識要素を取得する前記知識セットを決定し、取得した前記知識要素と前記発話テンプレートとに基づいて発話内容を決定する、
前記（５）～（８）のいずれかに記載の情報処理装置。
（１０）
　前記認識状況は、少なくともユーザとの対話履歴を含み、
　前記制御部は、前記対話履歴に含まれる語彙と関連する前記知識要素を前記知識セットから取得する、
前記（１）～（９）のいずれかに記載の情報処理装置。
（１１）
　前記制御部は、ユーザの発話意図に基づいて、対応する前記発話テンプレートを決定し、当該発話テンプレートに取得した前記知識要素を当てはめる、
前記（１０）に記載の情報処理装置。
（１２）
　前記認識状況は、物体認識結果、環境認識結果、位置情報のうち少なくともいずれかを含む、
前記（１）～（１１）のいずれかに記載の情報処理装置。
（１３）
　前記制御部は、所定期間内において発話に用いた回数が閾値未満である前記知識要素を前記知識セットから取得する、
前記（１）～（１２）のいずれかに記載の情報処理装置。
（１４）
　前記制御部は、所定期間内において発話に用いた回数が閾値未満である前記発話テンプレートを選択する、
前記（１）～（１３）のいずれかに記載の情報処理装置。
（１５）
　前記知識セットは、少なくとも広告に係る知識セットを含み、
　前記制御部は、ユーザとの対話履歴に前記広告に関連する語彙が含まれる場合、前記広告に係る知識セットから前記知識要素を取得する、
前記（１）～（１４）のいずれかに記載の情報処理装置。
（１６）
　前記制御部は、ユーザの発話に含まれる語彙に基づいて、前記語彙に関連する前記知識セットの追加を推薦する発話内容を決定する、
前記（１）～（１５）のいずれかに記載の情報処理装置。
（１７）
　前記制御部が決定した発話内容に対応する音声を出力する音声出力部、
　をさらに備える、
前記（１）～（１６）のいずれかに記載の情報処理装置。
（１８）
　プロセッサが、認識状況に基づいてユーザとの対話を制御すること、
　を含み、
　前記制御することは、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定すること、
　をさらに含む、
情報処理方法。
（１９）
　コンピュータを、
　認識状況に基づいてユーザとの対話を制御する制御部、
　を備え、
　前記制御部は、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定する、
　情報処理装置、
として機能させるためのプログラム。

　１０　　　情報処理装置
　１４０　　認識部
　１５０　　制御部
　１６２　　知識ＤＢ
　１６４　　テンプレートＤＢ
　１７０　　音声出力部
　２０　　　情報処理サーバ
　３０　　　情報処理端末

Claims

　認識状況に基づいてユーザとの対話を制御する制御部、
　を備え、
　前記制御部は、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定する、
情報処理装置。
　前記知識要素は少なくとも語彙を含む、
請求項１に記載の情報処理装置。
　前記知識セットには、複数の前記知識要素と、前記知識要素間の関係とが記載される、請求項２に記載の情報処理装置。
　前記知識セットを保管する記憶部、
　をさらに備える、
請求項３に記載の情報処理装置。
　前記知識セットは、知識ドメインごとに記載される、
請求項４に記載の情報処理装置。
　前記知識セットは、ユーザ操作に基づき追加が可能である、
請求項５に記載の情報処理装置。
　前記知識セットは、外部装置からのダウンロードが可能である、
請求項６に記載の情報処理装置。
　前記知識セットは、ユーザが記載可能である、
請求項５に記載の情報処理装置。
　前記知識セットの利用優先順位はユーザが設定可能であり、
　前記制御部は、前記利用優先順位に基づいて前記知識要素を取得する前記知識セットを決定し、取得した前記知識要素と前記発話テンプレートとに基づいて発話内容を決定する、
請求項５に記載の情報処理装置。
　前記認識状況は、少なくともユーザとの対話履歴を含み、
　前記制御部は、前記対話履歴に含まれる語彙と関連する前記知識要素を前記知識セットから取得する、
請求項１に記載の情報処理装置。
　前記制御部は、ユーザの発話意図に基づいて、対応する前記発話テンプレートを決定し、当該発話テンプレートに取得した前記知識要素を当てはめる、
請求項１０に記載の情報処理装置。
　前記認識状況は、物体認識結果、環境認識結果、位置情報のうち少なくともいずれかを含む、
請求項１に記載の情報処理装置。
　前記制御部は、所定期間内において発話に用いた回数が閾値未満である前記知識要素を前記知識セットから取得する、
請求項１に記載の情報処理装置。
　前記制御部は、所定期間内において発話に用いた回数が閾値未満である前記発話テンプレートを選択する、
請求項１に記載の情報処理装置。
　前記知識セットは、少なくとも広告に係る知識セットを含み、
　前記制御部は、ユーザとの対話履歴に前記広告に関連する語彙が含まれる場合、前記広告に係る知識セットから前記知識要素を取得する、
請求項１に記載の情報処理装置。
　前記制御部は、ユーザの発話に含まれる語彙に基づいて、前記語彙に関連する前記知識セットの追加を推薦する発話内容を決定する、
請求項１に記載の情報処理装置。
　前記制御部が決定した発話内容に対応する音声を出力する音声出力部、
　をさらに備える、
請求項１に記載の情報処理装置。
　プロセッサが、認識状況に基づいてユーザとの対話を制御すること、
　を含み、
　前記制御することは、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定すること、
　をさらに含む、
情報処理方法。
　コンピュータを、
　認識状況に基づいてユーザとの対話を制御する制御部、
　を備え、
　前記制御部は、前記認識状況と知識上で関連する知識要素を知識セットから取得し、前記知識要素と発話テンプレートとに基づいて、発話内容を決定する、
　情報処理装置、
として機能させるためのプログラム。