WO2020039726A1

WO2020039726A1 - 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム

Info

Publication number: WO2020039726A1
Application number: PCT/JP2019/024660
Authority: WO
Inventors: 早紀横山
Original assignee: ソニー株式会社
Priority date: 2018-08-20
Filing date: 2019-06-21
Publication date: 2020-02-27

Abstract

ユーザ発話の意図やユーザ属性に対応するラベルに信頼度を設定し、信頼度に基づく処理によりユーザ発話の高精度な意図解析を実現する。ユーザ発話の意図を解析する発話意味解析部と、学習データを格納した学習データ記憶部を有する。学習データ記憶部は学習処理によって生成するラベルとラベルの信頼度を記録した構成であり、発話意味解析部はユーザへの問い合わせに対するユーザ発話の解析結果に応じて信頼度を更新する。発話意味解析部は、ユーザ発話の意図に従った処理の実行に問題がある場合、意図確認のための問い合わせを実行する。また問い合わせに対するユーザ応答の解析結果に応じて処理を実行、または中止する。

Description

情報処理装置、情報処理システム、および情報処理方法、並びにプログラム

　本開示は、情報処理装置、情報処理システム、および情報処理方法、並びにプログラムに関する。さらに詳細には、ユーザ発話の音声認識処理と発話意味解析を実行して応答を行う情報処理装置、情報処理システム、および情報処理方法、並びにプログラムに関する。

　昨今、ユーザ発話の音声認識を行い、発話意味解析を実行して解析結果に基づく様々な処理や応答を行う音声認識システムの利用が増大している。
　この音声認識システムにおいては、マイクを介して入力するユーザ発話を認識理解して、それに応じた処理を行う。
　例えばユーザが、「明日の天気を教えて」と発話した場合、天気情報提供サーバから天気情報を取得して、取得情報に基づくシステム応答を生成して、生成した応答をスピーカーから出力する。具体的には、例えば、
　システム発話＝「明日の天気は晴れです。ただし、夕方、雷雨があるかもしれません」
　このようなシステム発話を出力する。

　このようにユーザ発話の音声認識を行いユーザとの会話を実現する装置は、エージェント機器、あるいはスマートスピーカー等と呼ばれ、昨今、利用が増大している。

　近年の音声認識システムでは、発話の多様性に対応するために、様々な発話データの学習を行い、学習データを用いて発話の意図理解精度を高める処理が行われている。
　しかし、このような学習処理を利用しても、多様なユーザ発話の全てについて正確な意図理解を行うことは困難である。システムが発話意図を理解してくれない場合、ユーザはシステムに対する話しかけを止めてしまうことが多い。

　音声対話システムの一般的な処理は以下のように行われる。
　音声入力部（マイク）から入力したユーザ発話音声を自動音声認識（ＡＳＲ：Ａｕｔｏｍａｔｉｃ　Ｓｐｅｅｃｈ　Ｒｅｃｏｇｎｉｔｉｏｎ）機能を有する音声認識部に入力して、音声データをテキストデータに変換する。
　音声認識部が生成したテキストデータを意図理解部に入力し、意図理解部が自然言語理解（ＮＬＵ）処理を実行して、テキストデータから発話意図を解析する。
　一般的な音声対話システムは、このような処理を実行する。

　例えば、上記処理に含まれる意図理解部において、誤った意図理解が行われると、ユーザの意図と違う処理が実行されてしまう可能性がある。例えば、ユーザが「写真」と発話した場合、「写真を見せて」なのか「写真を撮影して」なのか判別することが困難となる。

　ユーザは「写真を見せて」の意図で「写真」と発話したのに、システムが「写真を撮影して」と誤った解釈を行ってしまうと、システムは写真を撮影して写真を外部のサーバにアップロードしてしまい、多くのユーザに写真が閲覧されてしまうといった事態を引き起こす可能性もある。

　なお、音声認識システムの意図理解精度を高める構成を開示した従来技術として、例えば特許文献１（国際公開ＷＯ２０１６／１５１６９９号公報）や、特許文献２（特表２０１７－５１６１５３号公報）がある。

　特許文献１は、発話から得られたテキストデータの構成要素に基づくベクトル表現データを生成して、様々なテキストデータに基づくベクトル表現データとの類似度判定を行うことでユーザ発話の意図理解精度を向上させる構成を開示している。
　特許文献２は、音声認識システムがユーザに対して複数の発話を実行させて、第１発話と第２発話との意味論的なつながりに基づいて、ユーザ発話の意図把握の精度を高める構成を開示している。

国際公開ＷＯ２０１６／１５１６９９号公報特表２０１７－５１６１５３号公報

　上述したように、ユーザ発話の意図理解精度を向上させるための構成として、複数の技術が開示されている。しかし、これらの従来技術の構成を適用しても、ユーザの発話からユーザの意図を正確に把握することは困難である。

　本開示は、例えば、上記問題点に鑑みてなされたものであり、ユーザ発話の意図理解を、より確実に行う構成を実現する情報処理装置、情報処理システム、および情報処理方法、並びにプログラムを提供することを目的とする。

　本開示の第１の側面は、
　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理装置にある。

　さらに、本開示の第２の側面は、
　ユーザ端末と、データ処理サーバを有する情報処理システムであり、
　前記ユーザ端末は、
　ユーザ発話を入力する音声入力部を有し、
　前記データ処理サーバは、
　前記ユーザ端末から受信する前記ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理システムにある。

　さらに、本開示の第３の側面は、
　情報処理装置において実行する情報処理方法であり、
　前記情報処理装置は、
　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部が、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理方法にある。

　さらに、本開示の第４の側面は、
　ユーザ端末と、データ処理サーバを有する情報処理システムにおいて実行する情報処理方法であり、
　前記ユーザ端末が、
　ユーザ発話を入力する音声入力処理を実行し、
　前記データ処理サーバは、
　前記ユーザ端末から受信する前記ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部が、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理方法にある。

　さらに、本開示の第５の側面は、
　情報処理装置において情報処理を実行させるプログラムであり、
　前記情報処理装置は、
　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記プログラムは、前記発話意味解析部に、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行わせ、解析結果に応じて前記信頼度の更新処理を実行させるプログラムにある。

　なお、本開示のプログラムは、例えば、様々なプログラム・コードを実行可能な情報処理装置やコンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体によって提供可能なプログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、情報処理装置やコンピュータ・システム上でプログラムに応じた処理が実現される。

　本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。

　本開示の一実施例の構成によれば、ユーザ発話の意図やユーザ属性に対応するラベルに信頼度を設定し、信頼度に基づく処理によりユーザ発話の高精度な意図解析が実現される。
　具体的には、例えばユーザ発話の意図を解析する発話意味解析部と、学習データを格納した学習データ記憶部を有する。学習データ記憶部は学習処理によって生成するラベルとラベルの信頼度を記録した構成であり、発話意味解析部はユーザへの問い合わせに対するユーザ発話の解析結果に応じて信頼度を更新する。発話意味解析部は、ユーザ発話の意図に従った処理の実行に問題がある場合、意図確認のための問い合わせを実行する。また問い合わせに対するユーザ応答の解析結果に応じて処理を実行、または中止する。
　本構成により、ユーザ発話の意図やユーザ属性に対応するラベルに信頼度を設定し、信頼度に基づく処理によりユーザ発話の高精度な意図解析が実現される。
　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。

ユーザ発話を認識して応答を行う情報処理装置の具体的な処理例について説明する図である。情報処理装置の構成例と利用例について説明する図である。情報処理装置の具体的な構成例について説明する図である。情報処理装置の実行する処理の具体例について説明する図である。情報処理装置の実行する信頼度更新処理の具体例について説明する図である。情報処理装置の実行する処理の具体例について説明する図である。情報処理装置の実行する信頼度更新処理の具体例について説明する図である。情報処理装置の実行する処理のシーケンスについて説明するフローチャートを示す図である。情報処理装置の実行する処理のシーケンスについて説明するフローチャートを示す図である。情報処理装置の実行する処理の具体例について説明する図である。情報処理装置の実行する信頼度更新処理の具体例について説明する図である。情報処理装置の実行する処理の具体例について説明する図である。情報処理装置の実行する信頼度更新処理の具体例について説明する図である。情報処理装置の実行する処理のシーケンスについて説明するフローチャートを示す図である。情報処理システムの構成例について説明する図である。情報処理装置のハードウェア構成例について説明する図である。

　以下、図面を参照しながら本開示の情報処理装置、情報処理システム、および情報処理方法、並びにプログラムの詳細について説明する。なお、説明は以下の項目に従って行なう。
　１．情報処理装置の構成例について
　２．本開示の情報処理装置の実行する処理の具体例について
　３．本開示の情報処理装置が実行する処理のシーケンスについて
　４．ユーザ対応のラベルの信頼度更新処理について
　５．本開示の情報処理装置が実行するユーザ対応のラベルの信頼度更新処理のシーケンスについて
　６．情報処理装置、および情報処理システムの構成例について
　７．情報処理装置のハードウェア構成例について
　８．本開示の構成のまとめ

　　［１．情報処理装置の構成例について］
　まず、図１以下を参照して、本開示の一実施例の情報処理装置の構成例について説明する。

　図１は、ユーザ１の発するユーザ発話を認識して応答を行う情報処理装置１０の一処理例を示す図である。
　情報処理装置１０は、ユーザの発話、例えば、
　ユーザ発話＝「大阪の明日、午後の天気を教えて」
　このユーザ発話の音声認識処理を実行する。

　さらに、情報処理装置１０は、ユーザ発話の音声認識結果に基づく処理を実行する。
　図１に示す例では、ユーザ発話＝「大阪の明日、午後の天気を教えて」に応答するためのデータを取得し、取得データに基づいて応答を生成して生成した応答を、スピーカー１４を介して出力する。
　図１に示す例では、情報処理装置１０は、以下の装置応答を行っている。
　装置応答＝「大阪の明日、午後の天気は晴れですが、夕方、にわか雨がある可能性があります。」

　情報処理装置１０は、装置内の記憶部から取得した知識データ、またはネットワークを介して取得した知識データを利用して応答を生成して出力する。
　図１に示す情報処理装置１０は、カメラ１１、マイク１２、表示部１３、スピーカー１４を有しており、音声入出力と画像入出力が可能な構成を有する。

　図１に示す情報処理装置１０は、例えばスマートスピーカーあるいはエージェント機器と呼ばれる。
　本開示の情報処理装置１０は、図２に示すように、エージェント機器１０ａに限らず、スマホ１０ｂやＰＣ１０ｃ等のような様々な装置形態とすることが可能である。

　情報処理装置１０は、ユーザ１の発話を認識して、ユーザ発話に基づく応答を行う他、例えば、ユーザ発話に応じて図２に示すテレビ、エアコン等の外部機器３０の制御も実行する。
　例えばユーザ発話が「テレビのチャンネルを１に変えて」、あるいは「エアコンの設定温度を２０度にして」といった要求である場合、情報処理装置１０は、このユーザ発話の音声認識結果に基づいて、外部機器３０に対して制御信号（Ｗｉ－Ｆｉ、赤外光など）を出力して、ユーザ発話に従った制御を実行する。

　なお、情報処理装置１０は、ネットワークを介してサーバ２０と接続され、サーバ２０から、ユーザ発話に対する応答を生成するために必要となる情報を取得することが可能である。また、音声認識処理や意味解析処理をサーバに行わせる構成としてもよい。

　次に、図３を参照して、情報処理装置の具体的な構成例について説明する。
　図３は、ユーザ発話を認識して応答を行う情報処理装置１００の一構成例を示す図である。

　図３に示すように、情報処理装置１００は、音声入力部１０１、音声認識部１０２、発話意味解析部（学習処理部）１０３、画像入力部１０４、画像認識部１０５、センサー１０６、センサー情報解析部１０７、コーパス１１１、学習データ記憶部１１２、通信部１１５、応答生成部１２１、音声合成部１２２、音声出力部１２３、表示画像生成部１２４、画像出力部１２５を有する。
　なお、これらの構成要素は、全てを１つの情報処理装置１００内部に構成することも可能であるが、一部の構成や機能を他の情報処理装置や外部サーバに備える構成としてもよい。

　ユーザの発話音声はマイクなどの音声入力部１０１に入力される。
　音声入力部（マイク）１０１は、入力したユーザ発話音声を音声認識部１０２に入力する。
　音声認識部１０２は、例えばＡＳＲ（Ａｕｔｏｍａｔｉｃ　Ｓｐｅｅｃｈ　Ｒｅｃｏｇｎｉｔｉｏｎ）機能を有し、音声データを複数の単語から構成されるテキストデータに変換する。

　音声認識部１０２において生成されたテキストデータは、発話意味解析部（学習処理部）１０３に入力される。
　発話意味解析部（学習処理部）１０３は、テキストに含まれるユーザの意図候補を選択して出力する。
　発話意味解析部（学習処理部）１０３は学習処理部としての機能も備え、音声認識部１０２において生成されたテキストデータとユーザの意図の対応データや、ユーザ単位の趣味嗜好情報等を学習処理によって生成、更新し、学習データ記憶部１１２に格納する。

　発話意味解析部（学習処理部）１０３は、ＮＬＵ（Ｎａｔｕｒａｌ　Ｌａｎｇｕａｇｅ　Ｕｎｄｅｒｓｔａｎｄｉｎｇ）等の自然言語理解機能を有し、テキストデータから、ユーザ発話の意図（インテント：Ｉｎｔｅｎｔ）や、発話に含まれる意味のある要素（有意要素）である実体情報（エンティティ：Ｅｎｔｉｔｙ）を推定する。
　具体的には、例えば、様々な発話文例を構文解析データとともに記録したコーパス１１１を用いて、テキストデータに基づくユーザ意図の解析を実行する。

　ユーザ発話から、意図（エンティティ）と、実体情報（エンティティ）を正確に推定、取得することができれば、情報処理装置１００は、ユーザ発話に対する正確な処理を行うことができる。

　ただし、実際には、ユーザ発話とコーパス１１１に格納された文例とが一致しないことが多く、このような場合には、ユーザ発話の意図を正確に推定することができない場合がある。

　本開示の情報処理装置１００は、このような場合であっても、学習データ記憶部１１２に格納された学習データを用いることにより、ユーザ発話の意図を正確に把握することを可能とした構成を有する。

　発話意味解析部（学習処理部）１０３には、以下の各データが入力される。
　（１）音声認識部１０２が、ユーザ発話に基づいて生成したテキストデータ、
　（２）カメラなどの画像入力部１０４が取得した発話ユーザおよびその周囲の画像に対する画像認識部１０５の画像認識結果情報、
　（３）センサー１０６が取得した発話ユーザおよびその周囲の状態の検出情報に基づいて、センサー情報解析部１０７が解析したセンサー解析情報、

　発話意味解析部（学習処理部）１０３は、上記（１）～（３）の情報を入力して、ユーザ発話の学習データの生成、修正、更新、破棄処理を含むユーザ発話の学習処理を実行する。
　発話意味解析部（学習処理部）１０３において実行された学習処理の結果データである学習データは、学習データ記憶部１１２に格納される。また、通信部１１５を介して外部サーバの記憶部に格納してもよい。
　この発話意味解析部（学習処理部）１０３において実行される処理の詳細については後述する。

　発話意味解析部（学習処理部）１０３は、学習データ記憶部１１２に格納された学習データを参照して、ユーザ固有の発話に対する意図（インテント）と実体情報（エンティティ）を推定する。
　この推定処理は、学習データを利用することで、より高精度な処理として実行することができる。

　このように、発話意味解析部（学習処理部）１０３は、学習データ記憶部１１２に格納された学習データや、コーパス１１１に格納されたデータを用いて、ユーザ固有の発話に対する意図（インテント）と実体情報（エンティティ）を推定する。
　この推定結果は、応答生成部１２１に入力される。

　応答生成部１２１は、発話意味解析部（学習処理部）１０３において推定されたユーザ発話の意図（インテント）と実体情報（エンティティ）に基づいて、ユーザに対する応答を生成する。応答は、音声、または画像の少なくともいずれかによって構成される。
　応答音声を出力する場合は、音声合成部１２２において生成した音声情報が、スピーカー等の音声出力部１２３を介して出力される。
　応答画像を出力する場合は、表示画像合成部１２４において生成した表示画像情報が、ディスプレイ等の画像出力部１２５を介して出力される。

　通信部１１５は、例えば外部サーバとの通信を実行する。外部サーバには、情報処理装置１００による応答出力のための情報を提供するサービス提供サーバや、学習データやコーパスの提供を行うデータ処理サーバ等が含まれる。
　発話意味解析部（学習処理部）１０３における発話意味解析処理や学習処理は、通信部１１５を介して外部サーバから取得する情報を適用して行うことも可能である。
　サービス提供サーバは例えば天気情報提供サーバ、音楽情報提供サーバ等、様々な情報を提供するサーバであり、ユーザに対する応答や情報出力の際に利用される。

　　［２．本開示の情報処理装置の実行する処理の具体例について］
　次に、図４以下を参照して本開示の情報処理装置１００の実行する処理の具体例について説明する。
　本開示の情報処理装置１００は、ユーザとシステム（情報処理装置１００）との対話シーケンスにおいて情報処理装置１００がユーザ発話の意図を再確認する必要があると判定した場合、再確認するための問い合わせを行う。

　ユーザ発話の意図を再確認する必要があると判定する場合とは、例えば以下のような場合である。
　（ａ）ユーザ独自の言い方などを含むユーザ発話を入力し、コーパスに登録された文例のみではユーザ意図の推定が困難である場合、
　（ｂ）写真の撮影、メッセージの登録、スケジュールの削除などの処理のように誤作動した場合、秘密漏えいや、やり直しができない等の重大な問題を引き起こす恐れがある場合、
　情報処理装置１００は、例えば上記（ａ），（ｂ）のような場合に、ユーザ発話の意図を再確認する必要があると判定し、再確認するための問い合わせを行う。

　図４を参照して、ユーザ１と、本開示の情報処理装置１００との対話例を説明する。
　まず、ユーザ１は、ステップＳ０１において、以下の第１のユーザ発話を行う。
　第１のユーザ発話＝写真

　この第１のユーザ発話を入力した情報処理装置１００は、ステップＳ０２ａにおいて、処理実行（写真撮影）が重大な問題を発生させる可能性があると判断する。すなわち、写真を撮影し、撮影した写真を共有フォルダに保存する処理、あるいはサーバにアップロードする処理を行うと個人情報や秘密漏えい等が発生する恐れがあり、問題であると判断する。さらに、学習データ記憶部１１２に記録された信頼度を参照し、信頼度が規定しきい値より低いため問い合わせが必要と判断する。なお、学習データ記憶部１１２に記録される信頼度については後段で説明する。

　このような場合、情報処理装置１００は、ユーザ発話の意図を再確認する必要があると判定し、再確認するための問い合わせを行う。
　情報処理装置１００は、ステップＳ０２ｂにおいて、ユーザに対する意図確認のための問い合わせの発話、すなわち以下の問い合わせシステム発話を行う。
　問い合わせシステム発話＝写真を撮影したい場合は、再度、「写真」といってください

　その後、ユーザ１は、ステップＳ０３において、以下の第２のユーザ発話を行う。
　第２のユーザ発話＝写真

　この第２のユーザ発話を入力した情報処理装置１００は、ステップＳ０４ａにおいて、第１のユーザ発話の「写真」が、「写真の撮影要求」である意図を持つと判断して学習データ記憶部１１２に格納された学習データを更新する。学習データの更新処理の具体例については後述する。

　さらに、情報処理装置１００は、ステップＳ０４ｂにおいて、以下のシステム発話を行い、写真撮影を実行する。
　システム発話＝写真を撮ります。

　このように、本開示の情報処理装置１００は、学習データ記憶部１１２に格納された信頼度が規定しきい値より低く、またユーザ発話の意図に従った処理を行った場合に問題が発生すると判断した場合、ユーザに対する問い合わせを実行してユーザ意図を再確認する処理を実行する。

　次に、図５を参照して、学習データ記憶部１１２に格納される信頼度の詳細と、ステップＳ０４ａにおける学習データの更新処理、すなわち学習データ記憶部１１２に格納された学習データの更新処理の具体例について説明する。
　図５には、学習データ記憶部１１２に格納された以下の各データを示している。
　（Ａ）学習データ（更新前）
　（Ｂ）学習データ（更新後）

　（Ａ）学習データ（更新前）は、図４を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの実行前の学習データである。
　学習データは、以下の各データの対応データによって構成される。
　＊ユーザ発話テキスト（音声認識結果）
　＊ラベル（ユーザ発話意図（発話意味解析結果））
　＊信頼度（０～１００）
　なお、図５に示す学習データは学習データ記憶部１１２に格納された学習データの一部のデータである。

　「ユーザ発話テキスト（音声認識結果）」は、音声認識部１０２の音声認識結果として取得されるテキストデータである。
　「ラベル（ユーザ発話意図（発話意味解析結果））」は、発話意味解析部１０３の発話意味解析結果であり、また学習データ記憶部１１２に格納されるラベルである。

　ラベルは、例えば、音声認識結果であるテキストデータに対応して設定されるラベルであり、学習データ記憶部１１２に格納される。なお、学習データ記憶部１１２に格納されるラベルには様々な種類がある。例えば、図に示すような、音声認識結果（テキストデータ）対応の意図を示すラベルの他、ユーザ対応のラベルとして、ユーザの趣味、嗜好を示すラベル、ユーザ属性（性別、年齢等）を示すラベルなど、様々な種類のラベルが設定され、学習データ記憶部１１２に格納される。

　信頼度（０～１００）は、ラベルの信頼度を示すデータである。低信頼度＝０～高信頼度＝１００まで、ラベルの信頼度が記録される。この信頼度は、逐次、更新される。
　図に示す例では、
　ユーザ発話テキスト（音声認識結果）＝写真、
　に対して、
　ラベル（ユーザ発話意図（発話意味解析結果））＝意図：写真の撮影要求
　このラベルが設定されている。

　さらに、
　信頼度＝６０
　が設定されている。この信頼度＝６０は、
　ユーザ発話＝写真
　このユーザ発話のユーザ意図が「写真の撮影要求である」と判断した場合の信頼度が６０％程度であることを意味する。

　図５の下段に示す（Ｂ）学習データ（更新後）は、図４を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの実行後の学習データである。
　すなわち、図４を参照して説明したユーザ１と情報処理装置１００との対話シーケンスに基づいて、情報処理装置１００が更新した学習データである。
　この更新データにおいて、
　「信頼度」の値が、６０から８０に更新されている。

　これは、図４を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの結果、
　ユーザ発話＝写真
　このユーザ発話のユーザ意図が「写真の撮影要求である」確実性が高まったと情報処理装置１００が学習し、この学習結果として、信頼度の値を６０から８０に上昇させる更新処理を実行した結果である。

　この図５（Ｂ）に示す学習データは、学習データ記憶部１１２に格納され、その後のユーザ発話の意味解析処理に際して利用される。
　例えば、この学習データが学習データ記憶部１１２に格納された後に、ユーザ発話として、
　ユーザ発話＝写真
　この発話を入力した場合、先に図４を参照して説明したような問い合わせを行うことなく、写真撮影を行うといった処理が可能となる。これは、ユーザ発話＝「写真」のユーザ意図が「写真の撮影要求である」と推定する信頼度が８０と高い値であり、問い合わせを省略しても問題がないと判断することが可能であるからである。

　なお、問い合わせを実行するか否かの判断は、例えば、予め規定したしきい値、具体的には例えば、「信頼度しきい値＝７５」といったしきい値と現在の設定信頼度との比較に基づいて行うことができる。例えば、設定信頼度がしきい値以上であれば問い合わせを実行せず、しきい値未満であれば、問い合わせを行うといった処理を実行する。

　また、学習データは、ユーザ対応の学習データとして記録することが好ましい。すなわち、図５に示す学習データ記憶部１１２に記録される学習データを、ユーザ識別子に対応付けられたユーザ対応のデータとして記録する。このようなユーザ単位の学習データを格納する構成とすることで、ユーザ対応の意図判定を行うことが可能となる。
　すなわち、情報処理装置１００の発話意味解析部（学習処理部）１０３は、発話を行ったユーザを識別した上で、その識別ユーザに対応する学習データを参照して意図解析を行う。

　次に、図６、図７を参照して、学習データ記憶部１１２に格納されたラベル対応信頼度を低下させるデータ更新処理を行う場合の処理例について説明する。
　図６を参照して、ユーザ１と、本開示の情報処理装置１００との対話例を説明する。
　まず、ユーザ１は、ステップＳ１１において、以下の第１のユーザ発話を行う。
　第１のユーザ発話＝写真

　この第１のユーザ発話を入力した情報処理装置１００は、ステップＳ１２ａにおいて、処理実行（写真撮影）が重大な問題を発生させる可能性があると判断する。すなわち、写真を撮影し、撮影した写真を共有フォルダに保存する処理、あるいはサーバにアップロードする処理を行うと個人情報や秘密漏えい等が発生する恐れがあると判断する。さらに、学習データ記憶部１１２に記録された信頼度を参照し、信頼度が規定しきい値より低いと判断する。

　このような場合、情報処理装置１００は、ユーザ発話の意図を再確認する必要があると判定し、再確認するための問い合わせを行う。
　情報処理装置１００は、ステップＳ１２ｂにおいて、以下の問い合わせシステム発話を行う。
　問い合わせシステム発話＝写真を撮影したい場合は、再度、「写真」といってください

　その後、ユーザ１は、ステップＳ１３において、以下の第２のユーザ発話を行う。
　第２のユーザ発話＝違う
　あるいは、ユーザ１は、ステップＳ１３において、発話を行わない。

　この場合、情報処理装置１００は、ステップＳ１４ａにおいて、第１のユーザ発話の「写真」が、「写真の撮影要求」である意図を持たないと判定して、学習データを更新する。

　図７は、図６を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの実行前後の学習データを示す図である。
　図７には、学習データ記憶部１１２に格納された以下の各データを示している。
　（Ａ）学習データ（更新前）
　（Ｂ）学習データ（更新後）

　（Ａ）学習データ（更新前）は、図６を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの実行前の学習データである。
　学習データは、以下の各データの対応データである。
　＊ユーザ発話テキスト（音声認識結果）
　＊ラベル（ユーザ発話意図（発話意味解析結果））
　＊信頼度（０～１００）
　これらのデータは、先に説明した図５の（Ａ）学習データ（更新前）と同様のデータである。

　図７（Ａ）に示す例では、
　ユーザ発話テキスト（音声認識結果）＝写真、
　に対して、
　ラベル（ユーザ発話意図（発話意味解析結果））＝意図：写真の撮影要求
　このラベルが設定され、さらに、
　信頼度＝６０
　が設定されている。この信頼度＝６０は、
　ユーザ発話＝写真
　このユーザ発話のユーザ意図が「写真の撮影要求である」と判断した場合の信頼度が６０％であることを意味している。

　図７の下段に示す（Ｂ）学習データ（更新後）は、図６を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの実行後の学習データである。
　すなわち、図６を参照して説明したユーザ１と情報処理装置１００との対話シーケンスに基づいて、情報処理装置１００が更新した学習データである。
　この更新データにおいて、
　「信頼度」の値が、６０から４０に更新されている。

　これは、図６を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの結果、
　ユーザ発話＝写真
　このユーザ発話のユーザ意図が「写真の撮影要求である」確実性が低下したと情報処理装置１００が学習し、この学習結果として、信頼度の値を６０から４０に低下させる更新処理を実行した結果である。

　この図７（Ｂ）に示す学習データは、学習データ記憶部１１２に格納され、その後のユーザ発話の意味解析処理に際して利用される。
　例えば、この学習データが学習データ記憶部１１２に格納された後に、ユーザ発話として、
　ユーザ発話＝写真
　この発話を入力した場合、先に図４を参照して説明したような問い合わせを行うことになる。これは、ユーザ発話＝「写真」のユーザ意図が「写真の撮影要求である」と推定する信頼度が４０と、規定しきい値（例えば７５）より低い値であり、問い合わせを省略すると問題があると判断できるからである。

　　［３．本開示の情報処理装置が実行する処理のシーケンスについて］
　次に、本開示の情報処理装置が実行する処理のシーケンスについて説明する。

　図８～図９に示すフローチャートを参照して、本開示の情報処理装置１００の実行する処理のシーケンスについて説明する。
　図８、図９に示すフローチャートに従った処理は、例えば情報処理装置１００の記憶部に格納されたプログラムに従って実行することが可能である。例えばプログラム実行機能を有するＣＰＵ等のプロセッサによるプログラム実行処理として行うことができる。
　以下、図８～図９に示すフローの各ステップの処理について説明する。

　　（ステップＳ１０１）
　まず、ステップＳ１０１において、情報処理装置１００は、第１のユーザ発話の入力処理を実行する。
　この処理は、図３に示す音声入力部１０１において実行される。

　　（ステップＳ１０２）
　次に、ステップＳ１０２において、第１のユーザ発話の音声認識処理を実行する。
　この処理は、図３に示す音声認識部１０２が実行する。
　音声認識部１０２は、ユーザ発話の音声認識処理を実行し、認識結果としてのテキストデータを生成する。

　　（ステップＳ１０３）
　次に、ステップＳ１０３において、第１のユーザ発話の音声認識結果であるテキストデータに基づく発話意味解析処理を実行する。
　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する。

　　（ステップＳ１０４）
　次に、ステップＳ１０４において、第１のユーザ発話の意図を確認するための問い合わせが必要か否かを判定する。
　この処理は、発話意味解析部（学習処理部）１０３において実行される。
　発話意味解析部（学習処理部）１０３は、学習データ記憶部１１２に格納されたユーザの発話履歴や情報処理装置１００との対話履歴、さらに、画像入力部（カメラ）１０４、あるいはセンサー１０６からの入力情報、あるいは通信部１１５を介して入力する外部サーバからの情報等に基づいて問い合わせが必要か否かを判定する。

　具体的には、前述したように、発話意味解析部（学習処理部）１０３は、例えば以下のような場合にユーザ発話の意図を再確認するための問い合わせを行う必要があると判定する。
　（ａ）ユーザ独自の言い方などを含むユーザ発話を入力し、コーパスに登録された文例のみではユーザ意図の推定が困難である場合、
　（ｂ）写真の撮影、メッセージの登録、スケジュールの削除などの処理のように誤作動した場合、秘密漏えいや、やり直しができない等の重大な問題を引き起こす恐れがある場合、
　情報処理装置１００は、例えば上記（ａ），（ｂ）のような場合に、ユーザ発話の意図を再確認する必要があると判定し、再確認するための問い合わせを行う。

　なお、この判定処理に際しては、学習データ記憶部１１２に格納されたラベル対応の信頼度の値を考慮した処理を実行する。
　すなわち、学習データ記憶部１１２に格納されたラベル対応の信頼度の値が、規定しきい値以上であれば、問い合わせは行わない。一方、学習データ記憶部１１２に格納されたラベル対応の信頼度の値が、規定しきい値未満であれば、問い合わせを行うと判定する。

　　（ステップＳ１０５）
　ステップＳ１０５は、ステップＳ１０４の判定処理の結果としての分岐処理である。ステップＳ１０４において、ユーザ発話の意図を再確認する必要がないと判定した場合、ステップＳ１０７に進む。
　一方、ユーザ発話の意図を再確認する必要があると判定した場合、ステップＳ１０６に進む。

　　（ステップＳ１０６）
　ステップＳ１０４～Ｓ１０５において、ユーザ発話の意図を再確認する必要があると判定した場合、ステップＳ１０６に進む。
　この場合は、ステップＳ１０６において、第１のユーザ発話の発話意図確認のため、ユーザに対する問い合わせ応答を生成して出力する。
　その後、ステップＳ２０１に進む。

　この処理は、先に図４を参照して説明したステップＳ１２ｂの問い合わせシステム発話、すなわち、
　問い合わせシステム発話＝写真を撮影したい場合は、再度、「写真」といってください
　この問い合わせシステム発話の生成、出力処理に相当する。

　　（ステップＳ１０７）
　一方、ステップＳ１０４～Ｓ１０５において、ユーザ発話の意図を再確認する必要がないと判定した場合、ステップＳ１０７に進む。
　この場合は、ステップＳ１０７において、第１のユーザ発話の発話意図に基づく処理、例えばシステム応答や写真撮影等の処理を実行して処理を終了する。

　次に、図９を参照して、ステップＳ２０１以下の処理について説明する。
　ステップＳ２０１以下の処理は、ステップＳ１０６において、情報処理装置１００が、第１のユーザ発話の発話意図確認のため、ユーザに対する問い合わせ応答を生成して出力した後に行われる処理である。

　　（ステップＳ２０１）
　情報処理装置１００は、ステップＳ２０１において、ステップＳ１０６で実行した問い合わせシステム発話に対する第２のユーザ発話の入力を待機する。

　　（ステップＳ２０２）
　ステップＳ２０２において、第２のユーザ発話を入力したと判定した場合、ステップＳ２０３に進む。
　一方、予め規定した待機時間内に第２のユーザ発話を入力しなかった場合、ステップＳ２０９に進む。

　　（ステップＳ２０３）
　ステップＳ２０２において、第２のユーザ発話を入力したと判定した場合、ステップＳ２０３に進み、ステップＳ２０３において、第　　２のユーザ発話の音声認識処理を実行する。
　この処理は、図３に示す音声認識部１０２が実行する。
　音声認識部１０２は、ユーザ発話の音声認識処理を実行し、認識結果としてのテキストデータを生成する。

　　（ステップＳ２０４）
　次に、ステップＳ２０４において、第２のユーザ発話の音声認識結果であるテキストデータに基づく発話意味解析処理を実行する。
　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する。

　　（ステップＳ２０５）
　次に、ステップＳ２０５において、第２のユーザ発話が、第１のユーザ発話に対するシステムの解析意図を肯定する発話であるか否かを判定する。
　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する。

　例えば先に図４を参照して説明した例は、第２のユーザ発話（＝写真）が、第１のユーザ発話（＝写真）に対するシステムの解析意図（意図＝写真の撮影要求）を肯定する発話の例である。
　また、先に図６を参照して説明した例は、第２のユーザ発話（＝違う）が、第１のユーザ発話（＝写真）に対するシステムの解析意図（意図＝写真の撮影要求）を肯定しない発話の例である。

　　（ステップＳ２０６）
　ステップＳ２０６は、ステップＳ２０５の判定処理の結果としての分岐処理である。ステップＳ２０５の判定処理において、第２のユーザ発話が、第１のユーザ発話に対するシステムの解析意図を肯定する発話であると判定した場合、ステップＳ２０７に進む。
　一方、第２のユーザ発話が、第１のユーザ発話に対するシステムの解析意図を肯定しない発話であると判定した場合、ステップＳ２０９に進む。

　　（ステップＳ２０７）
　ステップＳ２０５～Ｓ２０６の判定処理において、第２のユーザ発話が、第１のユーザ発話に対するシステムの解析意図を肯定する発話であると判定した場合、ステップＳ２０７に進む。
　ステップＳ２０７では、第１のユーザ発話対応の学習データのラベル信頼度を高くする更新処理を実行する。

　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する処理であり、先に図５を参照して説明した学習データの更新処理に相当する処理である。

　　（ステップＳ２０８）
　次に、情報処理装置１００は、ステップＳ２０８において、第２のユーザ発話の発話意味解析結果に基づく処理、例えばシステム応答の発話や、写真撮影等の処理を実行する。

　　（ステップＳ２０９）
　一方、ステップＳ２０５～Ｓ２０６の判定処理において、第２のユーザ発話が、第１のユーザ発話に対するシステムの解析意図を肯定する発話でないと判定した場合、ステップＳ２０９に進む。
　また、ステップＳ２０２において、所定の待機時間内に第２のユーザ発話が入力されなかった場合もステップＳ２０９に進む。

　ステップＳ２０９では、第１のユーザ発話対応の学習データのラベル信頼度を低くする信頼度更新処理を実行する。
　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する処理であり、先に図７を参照して説明した学習データの更新処理に相当する処理である。

　以上、説明したように本開示の情報処理装置１００は、例えばユーザ発話の意図が正確に把握できない場合や、ユーザ発話の意図に従った処理を実行することに問題があり、学習データとして記録された発話テキスト対応のラベル（意図）の信頼度が、規定しきい値より低い場合などの際にユーザ意図を再確認するための問い合わせを実行する。
　さらに、この問い合わせに対するユーザ発話に基づいて、ユーザ意図を確認し、確認結果に基づいて学習データ記憶部１１２に格納されたラベル対応信頼度の値を更新する処理を実行する。

　これらの処理によって、信頼度の低いと判定される解析意図に対応する問題のある処理の実行や応答が一時的に中止される。その後の問い合わせに対するユーザ発話に基づいて解析意図の正しさが確認された後、処理や応答が行われる。
　また、学習処理によって信頼度が高まった場合は、再確認の問い合わせ応答を省略して処理を実行することが可能となり、ユーザ意図に従った処理を迅速に実行することが可能となる。

　　［４．ユーザ対応のラベルの信頼度更新処理について］
　上述した実施例は、ユーザ発話の意味解析結果として取得される意図に対応付けたラベルの信頼度に基づく処理例であった。次に、ユーザ対応のラベルの信頼度を更新する処理について説明する。

　前述したように、学習データ記憶部１１２に格納されるラベルには様々な種類がある。例えば、図５、図７を参照して説明したような音声認識結果（テキストデータ）対応の意図を示すラベルの他、ユーザ対応のラベルとして、ユーザの趣味、嗜好を示すラベル、ユーザ属性（性別、年齢等）を示すラベルなど、様々な種類のラベルが設定され、学習データ記憶部１１２に格納される。本開示の情報処理装置１００は、これら、様々なラベルに信頼度情報を対応付けて記録し、この信頼度情報をシステム（情報処理装置１００）とユーザとの対話に応じて、逐次、更新する。

　以下において説明する実施例は、ユーザ対応のラベルの一例として、ユーザの趣味、嗜好に対応付けたラベルの信頼度を更新する処理例について説明する。
　図１０を参照して、本実施例に従った処理を行う場合のユーザ１と情報処理装置１００との対話例について説明する。

　まず、情報処理装置１００は、ステップＳ３１ａにおいて、ユーザ１が、アニメ好きであるという仮説の確認が必要であると判断する。これは、例えば、ユーザ１のこれまでの対話履歴に従い、情報処理装置１００が、ユーザ１はアニメ好きであると推定し、この推定が正しいか否かを判定する処理を行うべきであると判断した場合に実行する処理である。

　例えば、この処理の結果、ユーザ１はアニメ好きであるという仮説が正しいことが確認されれば、ユーザ１の発話に対する意味解析処理に際して、アニメ好きのユーザグループ対応のコーパスや学習モデルを適用することが可能となる。すなわち、ユーザの趣味、嗜好に適合したコーパスや学習モデルを適用した発話意味解析が可能となり、より精度の高い、迅速な処理を行うことができる。

　このような処理を実現するため、図１０に示す処理が実行される。
　ステップＳ３１ａにおいて、情報処理装置１００が、ユーザ１がアニメ好きであるという仮説の確認が必要であると判断すると、情報処理装置１００は、ステップＳ３１ｂにおいて、ユーザに対する以下の問い合わせシステム発話を実行する。
　問い合わせシステム発話＝ゴールドクイーンＡ（アニメの主人公）が登場するアニメ作品の題名、知ってる？

　このシステム発話に対して、ユーザ１は、ステップＳ３２において以下のユーザ発話を行う。
　ユーザ発話＝コールドプラネットＡＢＣだよ

　「コールドプラネットＡＢＣ」は、ゴールドクイーンＡ（アニメの主人公）が登場するアニメ作品の正しい作品名であるとする。
　このユーザ発話を入力した情報処理装置１００は、ステップＳ３３ａにおいて、学習データ記憶部１１２に格納された学習データ中のユーザ対応のラベル、具体的には、ユーザの趣味、嗜好に対応付けたラベルの信頼度を上げるデータ更新処理を実行する。

　さらに、情報処理装置１００は、ステップＳ３３ｂにおいて、以下のシステム発話を行う。
　システム発話＝正解

　このように、本開示の情報処理装置１００は、学習データ記憶部１１２に格納されたユーザ属性（ユーザの趣味、嗜）対応のラベルの信頼度を更新するために、ユーザに対する問い合わせを実行してユーザの趣味、嗜好等のユーザ属性を確認する処理を実行する。

　次に、図１１を参照して、学習データ記憶部１１２に格納されるデータの詳細と学習データの更新処理の例について説明する。
　図１１には、学習データ記憶部１１２に格納された以下の各データを示している。
　（Ａ）学習データ（更新前）
　（Ｂ）学習データ（更新後）

　（Ａ）学習データ（更新前）は、図１０を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの実行前の学習データである。
　学習データは、以下の各データの対応データである。
　＊ユーザ識別子
　＊ラベル（ユーザの趣味、嗜好）
　＊信頼度（０～１００）

　「ユーザ識別子」は、例えば、ユーザによる登録処理、あるいは情報処理装置１００によって自動登録されたユーザの識別子（ＩＤ）である。
　情報処理装置１００は、例えば画像入力部（カメラ）１００の撮影画像や、音声入力部（マイク）１０１を介して入力する音声情報に基づいて、ユーザを自動識別子、識別ユーザ対応の識別子（ＩＤ）を設定して学習データ記憶部１１２に登録する。
　なお、ユーザが自ら、顔画像と音声データを入力してユーザ識別子を登録することも可能である。

　さらに、ユーザは、ユーザの属性情報、例えば性別、年齢、趣味、嗜好等の情報をユーザ識別子に対応付けて学習データ記憶部１１２に登録することができる。情報処理装置１００も、ユーザとの対話に基づいて推定したユーザ属性情報を学習データ記憶部１１２に記録する。

　図１１に示す「ラベル（ユーザの趣味、嗜好）」は、学習データ記憶部１１２に登録可能なユーザ属性の一つである。
　図に示す例では、ユーザ（ＩＤ＝Ｕ００１２３）に対応するユーザ属性を示す「ラベル」として、「趣味嗜好＝アニメ好き」というラベルが設定された例を示している。

　信頼度（０～１００）は、ラベルの信頼度を示すデータである。低信頼度＝０～高信頼度＝１００まで、ラベルの信頼度が記録される。この信頼度は、逐次、更新される。
　図に示す例では、
　ユーザ（ＩＤ＝Ｕ００１２３）対応の「趣味嗜好＝アニメ好き」というラベルに対して、
　信頼度＝６０が設定されている。

　この信頼度＝６０は、
　ユーザ（ＩＤ＝Ｕ００１２３）対応のラベル「趣味嗜好＝アニメ好き」の信頼度が６０％程度であることを意味している。

　図１１の下段に示す（Ｂ）学習データ（更新後）は、図１０を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの実行後の学習データである。
　すなわち、図１０を参照して説明したユーザ１と情報処理装置１００との対話シーケンスに基づいて、情報処理装置１００が更新した学習データである。
　この更新データにおいて、
　「信頼度」の値が、６０から８０に更新されている。

　これは、図１０を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの結果、
　ユーザ１がアニメ好きであるという仮説の確実性が高まったと、情報処理装置１００が学習し、この学習結果として、信頼度の値を６０から８０に上昇させる更新処理を実行した結果である。

　この図１１（Ｂ）に示す学習データは、学習データ記憶部１１２に格納され、その後のユーザ発話の意味解析処理に際して利用される。
　具体的には、例えば、ユーザ発話の意味解析処理に際して、アニメ好きのユーザに特化したコーパスや、学習データを優先的に利用した処理が行われる。
　このような処理を行うことでユーザ属性に適合したユーザ発話の意味解析処理を行うことが可能となり、ユーザ発話の意味解析処理の精度を向上させることが可能となり、また処理時間の短縮も実現される。

　図１０、図１１を参照して説明した処理は、学習データ記憶部１１２に格納された学習データ中のユーザ属性対応のラベルの信頼度を上げる更新処理を行った例である。
　次に、図１２、図１３を参照して、学習データ記憶部１１２に格納された学習データ中のユーザ属性対応のラベルの信頼度を下げる更新処理を行う例について説明する。

　図１２を参照してユーザ１と情報処理装置１００との対話例について説明する。
　まず、情報処理装置１００は、ステップＳ４１ａにおいて、ユーザ１が、アニメ好きであるという仮説の確認が必要であると判断する。これは、例えば、ユーザ１のこれまでの対話履歴に従い、情報処理装置１００が、ユーザ１はアニメ好きであると推定し、この推定が正しいか否かを判定する処理を行うべきであると判断した場合に実行する処理である。

　例えば、この処理の結果、ユーザ１はアニメ好きであるという仮説が正しいことが確認されれば、ユーザ１の発話に対する意味解析処理に際して、アニメ好きのユーザグループ対応のコーパスや学習モデルを適用することが可能となり、ユーザの趣味、嗜好に適合したコーパスや学習モデルを適用した発話意味解析が可能となり、より精度の高い、迅速な処理を行うことができる。

　このような処理を実現するため、図１２に示す処理が実行される。
　ステップＳ４１ａにおいて、情報処理装置１００が、ユーザ１がアニメ好きであるという仮説の確認が必要であると判断すると、情報処理装置１００は、ステップＳ４１ｂにおいて、ユーザに対する以下の問い合わせシステム発話を実行する。
　問い合わせシステム発話＝ゴールドクイーンＡ（アニメの主人公）が登場するアニメ作品の題名、知ってる？

　このシステム発話に対して、ユーザ１は、ステップＳ４２において以下のユーザ発話を行う。
　ユーザ発話＝分からない
　あるいは、ユーザ１は、ステップＳ４２において発話を行わない。

　次に、情報処理装置１００は、ステップＳ４３ａにおいて、学習データ記憶部１１２に格納された学習データ中のユーザ対応のラベル、具体的には、ユーザの趣味、嗜好に対応付けたラベルの信頼度を低下させるデータ更新処理を実行する。
　この更新処理は、図１２に示すユーザ１と情報処理装置１００との対話シーケンスの実行によって、ユーザ１がアニメ好きであるという仮説の確実性が低下したと情報処理装置１００が学習した結果に基づく処理である。

　このように、本開示の情報処理装置１００は、学習データ記憶部１１２に格納されたユーザ属性対応のラベルの信頼度を更新するために、ユーザに対する問い合わせを実行してユーザの趣味、嗜好等のユーザ属性を確認する処理を実行する。

　次に、図１３を参照して、学習データ記憶部１１２に格納されるデータの詳細と学習データの更新処理の例について説明する。
　図１３には、先に説明した図１１と同様、学習データ記憶部１１２に格納された以下の各データを示している。
　（Ａ）学習データ（更新前）
　（Ｂ）学習データ（更新後）

　（Ａ）学習データ（更新前）は、図１２を参照して説明したユーザ１と情報処理装置１００との対話シーケンスの実行前の学習データである。
　学習データは、以下の各データの対応データである。
　＊ユーザ識別子
　＊ラベル（ユーザの趣味、嗜好）
　＊信頼度（０～１００）

　先に図１１を参照して説明したデータ更新例では、「信頼度」の値を６０から８０に更新した例であった。図１１に示すデータ更新例は、図１０に示すユーザ１と情報処理装置１００との対話シーケンスの実行によって、ユーザ１がアニメ好きであるという仮説の確実性が高まったと情報処理装置１００が学習し、この学習結果として、信頼度の値を６０から８０に上昇させる更新処理例である。

　一方、図１３は、「信頼度」の値を６０から４０に低下させる更新処理例を示している。
　この更新処理は、図１２に示すユーザ１と情報処理装置１００との対話シーケンスの実行によって、ユーザ１がアニメ好きであるという仮説の確実性が低下したと情報処理装置１００が学習した結果である。
　すなわち、情報処理装置１００の発話意味解析部（学習処理部）１０３は、学習結果に基づいて、ユーザ（ＩＤ＝Ｕ００１２３）対応のラベル「趣味嗜好＝アニメ好き」の信頼度の値を６０から４０に低下させる更新処理を実行する。

　この図１３（Ｂ）に示す学習データは、学習データ記憶部１１２に格納され、その後のユーザ発話の意味解析処理に際して利用される。
　具体的には、例えば、ユーザ発話の意味解析処理に際して、アニメ好きのユーザに特化したコーパスや、学習データを優先的に利用した処理は行わなくなる。

　このような処理を行うことでユーザ属性に適合しないコーパスや、学習データの優先利用処理率が低下し、誤ったユーザ属性に応じたユーザ発話の意味解析処理が行われることが回避される。結果として、ユーザ発話の意味解析処理の精度を向上させることが可能となり、また処理時間の短縮も実現される。

　　［５．本開示の情報処理装置が実行するユーザ対応のラベルの信頼度更新処理のシーケンスについて］
　次に、上述した実施例、すなわち、本開示の情報処理装置が実行するユーザ対応のラベルの信頼度更新処理のシーケンスについて説明する。

　図１４に示すフローチャートを参照して、本開示の情報処理装置１００の実行する処理のシーケンスについて説明する。
　図１４に示すフローチャートに従った処理は、例えば情報処理装置１００の記憶部に格納されたプログラムに従って実行することが可能である。例えばプログラム実行機能を有するＣＰＵ等のプロセッサによるプログラム実行処理として行うことができる。
　以下、図１４に示すフローの各ステップの処理について説明する。

　　（ステップＳ３０１）
　まず、ステップＳ３０１において、情報処理装置１００は、学習データ記憶部１１２に格納されたユーザ対応のラベル、例えばユーザの趣味、嗜好等のユーザ属性の信頼度の確認のためのユーザに対する問い合わせ（質問）を実行する。

　この処理は、図３に示す発話意味解析部（学習処理部）１０３、応答生成部１２１、音声合成部１２２、、音声出力部１２３、表示画像生成部１２４、画像出力部１２５等において実行される。
　具体的には、例えば図１０、図１２を参照して説明した例では、以下のシステム発話の実行処理に対応する処理である。
　問い合わせシステム発話＝ゴールドクイーンＡ（アニメの主人公）が登場するアニメ作品の題名、知ってる？

　　（ステップＳ３０２）
　次に、情報処理装置１００は、ステップＳ３０２において、ユーザ発話の入力処理を実行する。
　この処理は、図３に示す音声入力部１０１において実行される。

　　（ステップＳ３０３）
　次に、ステップＳ３０３において、ユーザ発話の音声認識処理を実行する。
　この処理は、図３に示す音声認識部１０２が実行する。
　音声認識部１０２は、ユーザ発話の音声認識処理を実行し、認識結果としてのテキストデータを生成する。

　　（ステップＳ３０４）
　次に、ステップＳ３０４において、ユーザ発話の音声認識結果であるテキストデータに基づく発話意味解析処理を実行する。
　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する。

　　（ステップＳ３０５）
　次に、ステップＳ３０５において、ユーザ発話が、信頼度の確認対象のユーザ特性（ラベル）を肯定する発話であるか否かを判定する。
　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する。

　例えば先に図１０を参照して説明した例は、ユーザ発話（＝ゴールドプラネットＡＢＣだよ）が、信頼度の確認対象のラベル（ユーザ属性＝アニメ好き）を肯定する発話の例である。
　また、先に図１２を参照して説明した例は、ユーザ発話（＝分からない）が、信頼度の確認対象のラベル（ユーザ属性＝アニメ好き）を肯定しない発話の例である。

　　（ステップＳ３０６）
　ステップＳ３０５の判定処理において、ユーザ発話が、信頼度の確認対象のユーザ特性（ラベル）を肯定する発話であると判定した場合、ステップＳ３０６に進む。
　ステップＳ３０６では、ユーザ対応の学習データのラベル信頼度を高くする信頼度更新処理を実行する。

　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する処理であり、先に図１１を参照して説明した学習データの更新処理に相当する処理である。

　　（ステップＳ３０７）
　一方、ステップＳ３０５の判定処理において、ユーザ発話が、信頼度の確認対象のユーザ特性（ラベル）を肯定する発話でないと判定した場合、ステップＳ３０７に進む。
　ステップＳ３０７では、ユーザ対応の学習データのラベル信頼度を低くする信頼度更新処理を実行する。

　この処理は、図３に示す発話意味解析部（学習処理部）１０３において実行する処理であり、先に図１３を参照して説明した学習データの更新処理に相当する処理である。

　以上、説明したように本開示の情報処理装置１００は、学習データ記憶部１１２に格納されたユーザ対応のユーザ属性情報のラベル、例えばユーザの趣味嗜好のラベルの信頼度の確かさを確認するため、ユーザに対する質問形式の問い合わせを実行する。
　さらに、この問い合わせに対するユーザ発話に基づいて、学習データ記憶部１１２に格納されたユーザ対応のユーザ属性情報のラベルの信頼度の値を更新する処理を実行する。

　これらの処理によって、ユーザ属性情報のラベルの信頼度が、ユーザ属性を確実に反映したデータに逐次、更新される。
　この処理によって、ユーザ発話の意味解析処理を行う場合に、信頼度の高いユーザ属性対応のコーパスや学習データを優先的に利用することが可能となり、ユーザ発話の意味解析処理をより高精度にかつ迅速に実行することが可能となる。

　　［６．情報処理装置、および情報処理システムの構成例について］
　複数の実施例について説明したが、これらの実施例において説明した様々な処理機能、例えば、図３に示す情報処理装置１００の各構成要素の処理機能は、すべて一つの装置、例えばユーザの所有するエージェント機器、あるいはスマホやＰＣ等の装置内に構成することも可能であるが、その一部をサーバ等において実行する構成とすることも可能である。

　図１５にシステム構成例を示す。
　図１５（１）情報処理システム構成例１は、図３に示す情報処理装置のほぼ全ての機能を一つの装置、例えばユーザの所有するスマホやＰＣ、あるいは音声入出力と画像入出力機能を持つエージェント機器等のユーザ端末である情報処理装置４１０内に構成した例である。
　ユーザ端末に相当する情報処理装置４１０は、例えば応答文生成時に外部サーバの提供する情報を利用する場合にのみ、情報提供サーバ４２０と通信を実行する。

　情報提供サーバ４２０は、例えば天気情報提供サーバ、交通情報提供サーバ、医療情報提供サーバ、観光情報提供サーバ等であり、ユーザ発話に対する応答を生成するための情報を提供可能なサーバ群によって構成される。

　一方、図１５（２）情報処理システム構成例２は、図３に示す情報処理装置の機能の一部をユーザの所有するスマホやＰＣ、エージェント機器等のユーザ端末である情報処理装置４１０内に構成し、一部を情報処理装置と通信可能なデータ処理サーバ４６０において実行する構成としたシステム例である。

　例えば、図３に示す装置中の音声入力部１０１、画像入力部１０４、センサー１０６、音声出力部１２３、画像出力部１２５のみをユーザ端末側の情報処理装置４１０側に設け、その他の機能をすべてサーバ側で実行するといった構成等が可能である。
　なお、ユーザ端末側の機能と、サーバ側の機能の機能分轄態様は、様々な異なる設定が可能であり、また、１つの機能を双方で実行する構成も可能である。

　　［７．情報処理装置のハードウェア構成例について］
　次に、図１６を参照して、情報処理装置のハードウェア構成例について説明する。
　図１６を参照して説明するハードウェアは、先に図３を参照して説明した情報処理装置のハードウェア構成例であり、また、図１５を参照して説明したデータ処理サーバ４６０を構成する情報処理装置のハードウェア構成の一例である。

　ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）５０１は、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）５０２、または記憶部５０８に記憶されているプログラムに従って各種の処理を実行する制御部やデータ処理部として機能する。例えば、上述した実施例において説明したシーケンスに従った処理を実行する。ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）５０３には、ＣＰＵ５０１が実行するプログラムやデータなどが記憶される。これらのＣＰＵ５０１、ＲＯＭ５０２、およびＲＡＭ５０３は、バス５０４により相互に接続されている。

　ＣＰＵ５０１はバス５０４を介して入出力インタフェース５０５に接続され、入出力インタフェース５０５には、各種スイッチ、キーボード、マウス、マイクロホン、センサーなどよりなる入力部５０６、ディスプレイ、スピーカーなどよりなる出力部５０７が接続されている。ＣＰＵ５０１は、入力部５０６から入力される指令に対応して各種の処理を実行し、処理結果を例えば出力部５０７に出力する。

　入出力インタフェース５０５に接続されている記憶部５０８は、例えばハードディスク等からなり、ＣＰＵ５０１が実行するプログラムや各種のデータを記憶する。通信部５０９は、Ｗｉ－Ｆｉ通信、ブルートゥース（登録商標）（ＢＴ）通信、その他インターネットやローカルエリアネットワークなどのネットワークを介したデータ通信の送受信部として機能し、外部の装置と通信する。

　入出力インタフェース５０５に接続されているドライブ５１０は、磁気ディスク、光ディスク、光磁気ディスク、あるいはメモリカード等の半導体メモリなどのリムーバブルメディア５１１を駆動し、データの記録あるいは読み取りを実行する。

　　［８．本開示の構成のまとめ］
　以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。

　なお、本明細書において開示した技術は、以下のような構成をとることができる。
　（１）　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理装置。

　（２）　前記発話意味解析部は、
　ユーザ発話に対する解析結果として生成した意図に従った処理の実行に問題があると判定した場合、意図確認のためのユーザへの問い合わせを実行する（１）に記載の情報処理装置。

　（３）　前記発話意味解析部は、
　前記意図確認のためのユーザへの問い合わせに対するユーザ発話の解析処理を行い、
　前記情報処理装置は、解析結果に応じて前記意図に従った処理を実行、または中止する（２）に記載の情報処理装置。

　（４）　前記ラベルは、
　音声認識部の生成テキストに従って前記発話意味解析部が解析した意図に設定されたラベルであり、
　前記信頼度は、テキスト対応の意図の信頼度を示す情報である（１）～（３）いずれかに記載の情報処理装置。

　（５）　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、前記学習データ記憶部に格納された前記テキスト対応の意図が正しいことが確認された場合、該意図に対応する信頼度を上げる学習データの更新処理を実行する（４）に記載の情報処理装置。

　（６）　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、前記学習データ記憶部に格納された前記テキスト対応の意図が正しいことが確認されなかった場合、該意図に対応する信頼度を下げる学習データの更新処理を実行する（４）または（５）に記載の情報処理装置。

　（７）　前記発話意味解析部は、
　前記学習データ記憶部に格納された前記テキスト対応の意図に対応する信頼度が規定しきい値より低い場合、意図確認のためのユーザへの問い合わせを実行する（１）～（６）いずれかに記載の情報処理装置。

　（８）　前記学習データ記憶部は、
　テキスト対応の意図に設定されたラベルと信頼度をユーザ識別子に対応付けたユーザ単位の学習データとして記録した構成を有する（１）～（７）いずれかに記載の情報処理装置。

　（９）　前記ラベルは、
　ユーザ識別子に対応して記録されたユーザ属性に設定されたラベルであり、
　前記信頼度は、前記ユーザ属性の信頼度を示す情報である（１）～（８）いずれかに記載の情報処理装置。

　（１０）　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、前記学習データ記憶部に格納された前記ユーザ属性が正しいことが確認された場合、該ユーザ属性に対応する信頼度を上げる学習データの更新処理を実行する（９）に記載の情報処理装置。

　（１１）　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、前記学習データ記憶部に格納された前記ユーザ属性が正しいことが確認されなかった場合、該ユーザ属性に対応する信頼度を下げる学習データの更新処理を実行する（９）または（１０）に記載の情報処理装置。

　（１２）　前記ユーザ属性は、ユーザの趣味嗜好情報である（９）～（１１）いずれかに記載の情報処理装置。

　（１３）　ユーザ端末と、データ処理サーバを有する情報処理システムであり、
　前記ユーザ端末は、
　ユーザ発話を入力する音声入力部を有し、
　前記データ処理サーバは、
　前記ユーザ端末から受信する前記ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理システム。

　（１４）　情報処理装置において実行する情報処理方法であり、
　前記情報処理装置は、
　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部が、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理方法。

　（１５）　ユーザ端末と、データ処理サーバを有する情報処理システムにおいて実行する情報処理方法であり、
　前記ユーザ端末が、
　ユーザ発話を入力する音声入力処理を実行し、
　前記データ処理サーバは、
　前記ユーザ端末から受信する前記ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部が、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理方法。

　（１６）　情報処理装置において情報処理を実行させるプログラムであり、
　前記情報処理装置は、
　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記プログラムは、前記発話意味解析部に、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行わせ、解析結果に応じて前記信頼度の更新処理を実行させるプログラム。

　また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。

　なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。

　以上、説明したように、本開示の一実施例の構成によれば、ユーザ発話の意図やユーザ属性に対応するラベルに信頼度を設定し、信頼度に基づく処理によりユーザ発話の高精度な意図解析が実現される。
　具体的には、例えばユーザ発話の意図を解析する発話意味解析部と、学習データを格納した学習データ記憶部を有する。学習データ記憶部は学習処理によって生成するラベルとラベルの信頼度を記録した構成であり、発話意味解析部はユーザへの問い合わせに対するユーザ発話の解析結果に応じて信頼度を更新する。発話意味解析部は、ユーザ発話の意図に従った処理の実行に問題がある場合、意図確認のための問い合わせを実行する。また問い合わせに対するユーザ応答の解析結果に応じて処理を実行、または中止する。
　本構成により、ユーザ発話の意図やユーザ属性に対応するラベルに信頼度を設定し、信頼度に基づく処理によりユーザ発話の高精度な意図解析が実現される。

　　１０　情報処理装置
　　１１　カメラ
　　１２　マイク
　　１３　表示部
　　１４　スピーカー
　　２０　サーバ
　　３０　外部機器
　１００　情報処理装置
　１０１　音声入力部
　１０２　音声認識部
　１０３　発話意味解析部（学習処理部）
　１０４　画像入力部
　１０５　画像認識部
　１０６　センサー
　１０７　センサー情報解析部
　１１１　コーパス
　１１２　学習データ記憶部
　１２１　応答生成部
　１２２　音声合成部
　１２３　音声出力部
　１２４　表示画像生成部
　１２５　画像出力部
　４１０　情報処理装置
　４２０　情報提供サーバ
　４６０　データ処理サーバ
　５０１　ＣＰＵ
　５０２　ＲＯＭ
　５０３　ＲＡＭ
　５０４　バス
　５０５　入出力インタフェース
　５０６　入力部
　５０７　出力部
　５０８　記憶部
　５０９　通信部
　５１０　ドライブ
　５１１　リムーバブルメディア

Claims

　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理装置。
　前記発話意味解析部は、
　ユーザ発話に対する解析結果として生成した意図に従った処理の実行に問題があると判定した場合、意図確認のためのユーザへの問い合わせを実行する請求項１に記載の情報処理装置。
　前記発話意味解析部は、
　前記意図確認のためのユーザへの問い合わせに対するユーザ発話の解析処理を行い、
　前記情報処理装置は、解析結果に応じて前記意図に従った処理を実行、または中止する請求項２に記載の情報処理装置。
　前記ラベルは、
　音声認識部の生成テキストに従って前記発話意味解析部が解析した意図に設定されたラベルであり、
　前記信頼度は、テキスト対応の意図の信頼度を示す情報である請求項１に記載の情報処理装置。
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、前記学習データ記憶部に格納された前記テキスト対応の意図が正しいことが確認された場合、該意図に対応する信頼度を上げる学習データの更新処理を実行する請求項４に記載の情報処理装置。
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、前記学習データ記憶部に格納された前記テキスト対応の意図が正しいことが確認されなかった場合、該意図に対応する信頼度を下げる学習データの更新処理を実行する請求項４に記載の情報処理装置。
　前記発話意味解析部は、
　前記学習データ記憶部に格納された前記テキスト対応の意図に対応する信頼度が規定しきい値より低い場合、意図確認のためのユーザへの問い合わせを実行する請求項１に記載の情報処理装置。
　前記学習データ記憶部は、
　テキスト対応の意図に設定されたラベルと信頼度をユーザ識別子に対応付けたユーザ単位の学習データとして記録した構成を有する請求項１に記載の情報処理装置。
　前記ラベルは、
　ユーザ識別子に対応して記録されたユーザ属性に設定されたラベルであり、
　前記信頼度は、前記ユーザ属性の信頼度を示す情報である請求項１に記載の情報処理装置。
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、前記学習データ記憶部に格納された前記ユーザ属性が正しいことが確認された場合、該ユーザ属性に対応する信頼度を上げる学習データの更新処理を実行する請求項９に記載の情報処理装置。
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、前記学習データ記憶部に格納された前記ユーザ属性が正しいことが確認されなかった場合、該ユーザ属性に対応する信頼度を下げる学習データの更新処理を実行する請求項９に記載の情報処理装置。
　前記ユーザ属性は、ユーザの趣味嗜好情報である請求項９に記載の情報処理装置。
　ユーザ端末と、データ処理サーバを有する情報処理システムであり、
　前記ユーザ端末は、
　ユーザ発話を入力する音声入力部を有し、
　前記データ処理サーバは、
　前記ユーザ端末から受信する前記ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部は、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理システム。
　情報処理装置において実行する情報処理方法であり、
　前記情報処理装置は、
　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部が、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理方法。
　ユーザ端末と、データ処理サーバを有する情報処理システムにおいて実行する情報処理方法であり、
　前記ユーザ端末が、
　ユーザ発話を入力する音声入力処理を実行し、
　前記データ処理サーバは、
　前記ユーザ端末から受信する前記ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記発話意味解析部が、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行い、解析結果に応じて前記信頼度の更新処理を実行する情報処理方法。
　情報処理装置において情報処理を実行させるプログラムであり、
　前記情報処理装置は、
　ユーザ発話の意図を解析する発話意味解析部と、
　学習データを格納した学習データ記憶部を有し、
　前記学習データ記憶部は、
　学習処理によって生成されるラベルと該ラベルに対応づけられた信頼度を記録した構成であり、
　前記プログラムは、前記発話意味解析部に、
　ユーザへの問い合わせ発話に対するユーザ発話の解析処理を行わせ、解析結果に応じて前記信頼度の更新処理を実行させるプログラム。