JP6846617B2

JP6846617B2 - 情報提供方法、サーバ、情報端末装置、システム及び音声対話システム

Info

Publication number: JP6846617B2
Application number: JP2016574669A
Authority: JP
Inventors: 勝長辻
Original assignee: Panasonic Intellectual Property Management Co Ltd
Current assignee: Panasonic Intellectual Property Management Co Ltd
Priority date: 2015-02-12
Filing date: 2016-02-10
Publication date: 2021-03-24
Anticipated expiration: 2036-02-10
Also published as: JPWO2016129276A1; WO2016129276A1

Description

本開示は、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムにおける情報提供方法に関する。

音声認識、対話処理及び音声合成を組み合わせることで、ユーザが自然言語によって装置に命令を与えることができる音声対話装置が広く知られている。近年では、対話技術として一往復の応答にとどまらず、一つの話題に関して繰り返し応答を行う中で得た情報を保持して活用したり、複数の話題に対応できるなど、より自然な会話を実現できる対話システムが提案されている（例えば特許文献１の参照）。これにより、ある話題の対話中に、別の話題の対話を割り込ませるような複雑な対話を実現することも可能である。

また、対話処理をサーバで行い、クライアント装置がサーバとの通信する音声対話システム（サーバ・クライアント型の音声対話システム）では、上記のような複雑な対話を構築する場合に重要である対話シナリオ（対話の応答内容を記述する部分）のメンテナンスも容易に行え、かつ拡張性も高くなると考えられている。

また、特許文献２のようにプッシュ型の発話を行うシステムが提案されている。

特開２００７−５２０４３号公報特開平１１−３７７６６号公報

このような対話処理の一部をサーバで行う音声対話システムでは、クライアント装置が保持するデータベースの量を削減できるとともに、サーバとクライアント装置との間で伝送されるデータ量を削減できることが望まれている。

本開示は、クライアント装置が保持するデータベースの量を削減できるとともに、サーバとクライアント装置との間で伝送されるデータ量を削減できる情報提供方法を提供することを目的とする。

上記目的を達成するために、本開示の一態様に係る情報提供方法は、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムにおける情報提供方法である。音声対話システムは、音声を取得する情報端末装置と、サーバとを含み、情報提供方法は、サーバが、情報端末装置に、移動体又はユーザの状態の条件を示すトリガ情報を送信するトリガ情報送信ステップと、情報端末装置が、トリガ情報を受信した場合、条件が満たされたか否かを判定する判定ステップと、情報端末装置が、条件が満たされた場合に、サーバに、移動体の状態を示す情報を含まない通知信号を送信する送信ステップと、サーバが、通知信号を受信した場合、条件が満たされた場合の音声対話用処理を行うことで音声情報を生成する生成ステップと、サーバが、音声情報を情報端末装置に送信する音声情報送信ステップと、情報端末装置が、音声情報を受信し、音声情報をユーザに提供する提供ステップとを含む。

なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ−ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

本開示は、クライアント装置が保持するデータベースの量を削減できるとともに、サーバとクライアント装置との間で伝送されるデータ量を削減できる情報提供方法を提供する。

実施の形態における音声対話システムの全体構成を示す図実施の形態におけるクライアント装置の構成を示すブロック図実施の形態における対話処理部の構成を示すブロック図実施の形態における音声対話システムの動作を示す図実施の形態におけるクライアントシステムの動作を示すフローチャート実施の形態におけるサーバの動作を示すフローチャート実施の形態における音声対話システムの動作の一例を示す図実施の形態における音声対話システムの動作の一例を示す図実施の形態における音声対話システムの動作の一例を示す図実施の形態におけるキーワードＤＢに保持される情報の一例を示す図実施の形態における対話処理における状態遷移の一例を示す図実施の形態における合成文字列テンプレートの一例を示す図実施の形態におけるトリガテンプレートの一例を示す図実施の形態におけるトリガ条件の一例を示す図実施の形態における対話スタックの例を示す図実施の形態における音声対話システムの動作の一例を示す図実施の形態における音声対話システムの動作の一例を示す図実施の形態におけるトリガ条件の一例を示す図実施の形態におけるトリガ条件の一例を示す図

（本開示の基礎となった知見）
本発明者は、「背景技術」の欄において記載した、音声対話システムに関し、以下の問題が生じることを見出した。

プッシュ型の発話を行うシステムでは、車両の状態（例えば、車両の位置又は移動速度等）等の逐次変化する情報に基づき、音声対話システムからの発話が行なわれる。よって、サーバで全ての対話処理を行う場合には、クライアント装置で検出されたこれらの情報を、逐次サーバに送信する必要がある。これにより、サーバとクライアント装置との間で伝送されるデータ量が増加するという問題が生じる。

さらに、車両の位置情報等をサーバに送信することは、個人データ保護等の観点からも好ましくない。

一方で、このようなプッシュ型の対話を実現するための処理を、クライアント装置において行う場合には、予め決められた振る舞いをデータベースとしてクライアント装置に組み込んでおかなければならない。具体的には、このようなトリガは無数にあり、その条件の組み合わせを判定するためには、膨大なデータベースが必要になる。また、クライアント装置の処理量も増加するという問題が生じる。特に、サーバ・クライアント型の音声対話システムに組み込んだ場合、クライアント装置に膨大なデータベースを持たなければならず、サーバ・クライアント型にしたメリット（メンテナンス性及び拡張性）が活かされないという問題が生じる。

これらの問題に対して、本実施の形態は、サーバ・クライアント方式の音声対話装置において、クライアントに膨大なデータベースを持つことなく、サーバからの必要最小限の情報提供のみでプッシュ型の対話を行うことができ、かつユーザからの発話に応じた柔軟な振る舞いを行うことのできる音声対話システムを実現する。

本開示の一態様に係る情報提供方法は、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムに含まれるサーバにおける情報提供方法である。情報提供方法は、音声対話システムに含まれ、音声を取得し、ユーザに音声情報を提供する情報端末装置に、移動体又はユーザの状態の条件を示すトリガ情報を送信し、当該条件を満たすときに通知信号を送信することを依頼するトリガ情報送信ステップと、通知信号を受信した場合、条件が満たされた場合の音声対話用処理を行うことで音声情報を生成する生成ステップと、音声情報を情報端末装置に送信する音声情報送信ステップとを含む。

これによれば、サーバとクライアント装置（情報端末装置）との間で伝送されるデータ量を削減できる。また、クライアント装置では、条件の判定のみを行なうので、クライアント装置が対話処理のための膨大なデータベースを保持する必要がない。また、クライアント装置における処理量の増加を抑制できる。

例えば、条件は、移動体又は情報端末装置が備えるセンサにより取得される移動体又はユーザの状態の条件を含んでもよい。

例えば、条件は、移動体の位置の条件を含んでもよい。

例えば、条件は、移動体の移動距離の条件を含んでもよい。

例えば、通知信号は、当該通知信号に基づく音声対話用処理の優先度を示す情報を含み、生成ステップでは、優先度に基づき、現在実行中の音声対話用処理と、通知信号に基づく音声対話用処理とのうち、優先度の高い音声対話用処理を実行してもよい。

これによれば、優先度に応じた適切な対話処理を実現できる。また、サーバは、通知信号に含まれる優先度を用いて直ちに処理の優先度を把握できる。

例えば、通知信号は、当該通知信号に基づく音声対話用処理における状態遷移の遷移先を示す情報を含み、生成ステップでは、遷移先に状態を遷移させ、遷移後の状態に基づき音声情報を生成してもよい。

これによれば、サーバは、通知信号に含まれる遷移先の情報を用いて直ちに対話処理を実行できる。

また、本開示の一態様に係る情報提供方法は、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムに含まれ、音声を取得する情報端末装置における情報提供方法である。情報提供方法は、音声対話システムに含まれるサーバから、移動体又はユーザの状態の条件を示すトリガ情報を受信するトリガ情報受信ステップと、条件が満たされたか否かを判定する判定ステップと、条件が満たされた場合に、サーバに通知信号を送信する送信ステップと、サーバから、条件が満たされた場合の音声対話用処理により生成された音声情報を受信する音声情報受信ステップと、音声情報をユーザに提供する提供ステップとを含む。

また、本開示の一態様に係る情報提供方法は、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムにおける情報提供方法である。音声対話システムは、音声を取得する情報端末装置と、サーバとを含み、情報提供方法は、サーバが、情報端末装置に、移動体又はユーザの状態の条件を示すトリガ情報を送信するトリガ情報送信ステップと、情報端末装置が、トリガ情報を受信した場合、条件が満たされたか否かを判定する判定ステップと、情報端末装置が、条件が満たされた場合に、サーバに通知信号を送信する送信ステップと、サーバが、通知信号を受信した場合、条件が満たされた場合の音声対話用処理を行うことで音声情報を生成する生成ステップと、サーバが、音声情報を情報端末装置に送信する音声情報送信ステップと、情報端末装置が、音声情報を受信し、音声情報をユーザに提供する提供ステップとを含む。

また、本開示の一態様に係るサーバは、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムに含まれるサーバであって、情報端末装置と、トリガ情報送信部と、生成部と、音声情報送信部とを備える。

情報端末装置は、音声対話システムに含まれ、音声を取得し、ユーザに音声情報を提供する。トリガ情報送信部は、情報端末装置に、移動体又はユーザの状態の条件を示すトリガ情報を送信し、当該条件を満たすときに通知信号を送信することを依頼する。生成部は、通知信号を受信した場合、条件が満たされた場合の音声対話用処理を行うことで音声情報を生成する。音声情報送信部は、音声情報を情報端末装置に送信する。

また、本開示の一態様に係る情報端末装置は、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムに含まれ、トリガ情報受信部と、判定部と、送信部と、音声情報受信部と、提供部とを備える。

情報端末装置は音声を取得する。トリガ情報受信部は、音声対話システムに含まれるサーバから、移動体又はユーザの状態の条件を示すトリガ情報を受信する。判定部は、条件が満たされたか否かを判定する。送信部は、条件が満たされた場合に、サーバに通知信号を送信する。音声情報受信部は、サーバから、条件が満たされた場合の音声対話用処理により生成された音声情報を受信する。提供部は、音声情報をユーザに提供する。

また、本開示の一態様に係る音声対話システムは、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムであって、音声を取得し、ユーザに音声情報を提供する情報端末装置と、サーバとを含み、サーバは、情報送信部と、生成部と、音声情報送信部とを備え、情報端末装置は、トリガ情報受信部と、判定部と、送信部と、音声情報受信部と、提供部と備える。

トリガ情報送信部は、情報端末装置に、移動体又はユーザの状態の条件を示すトリガ情報を送信し、当該条件を満たすときに通知信号を送信することを依頼する。生成部は、通知信号を受信した場合、条件が満たされた場合の音声対話用処理を行うことで音声情報を生成する。音声情報送信部は、音声情報を情報端末装置に送信する。トリガ情報受信部は、サーバからトリガ情報を受信する。判定部は、条件が満たされたか否かを判定する。送信部は、条件が満たされた場合に、サーバに通知信号を送信する。音声情報受信部は、サーバから音声情報を受信する。提供部は、音声情報をユーザに提供する。

なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ−ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

以下、本開示の実施の形態について、図面を参照しながら説明する。なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

（実施の形態）
本実施の形態に係る音声対話システムでは、基本的には、サーバにおいて音声対話のための対話処理を行う。また、当該対話処理において、車両情報の条件を判定する処理が発生した場合には、当該条件が、クライアント装置に通知される。クライアント装置は、車両情報が上記条件を満たすかを判定し、判定結果をサーバに通知する。このように、条件の判定のみがクライアント装置で行われることにより、クライアント装置からサーバに車両情報を逐次送信する必要がない。これにより、サーバとクライアント装置との間で伝送されるデータ量を削減できる。また、クライアント装置では、条件の判定のみを行なうので、クライアント装置が対話処理のための膨大なデータベースを保持する必要がない。また、クライアント装置における処理量の増加を抑制できる。

まず、本実施の形態に係る音声対話システム１００の構成を説明する。図１は、本実施の形態における音声対話システム１００の全体構成を示す図である。図１に示す音声対話システム１００は、クライアントシステム１１０とサーバ１２０とを含む。クライアントシステム１１０とサーバ１２０とは、ネットワークを介して、通信可能である。クライアントシステム１１０は、例えば、ユーザが搭乗している車両（例えば自動車）内に設定されている。

クライアントシステム１１０は、サーバ１２０と通信を行うクライアント装置１０１と、ユーザの音声を取得するデバイスの一例であるマイク１０２と、合成音声を再生するデバイスの一例であるスピーカ１０３と、車両の状態を示す車両情報を取得する車両情報取得部１０４とを備える。

また、サーバ１２０は、ユーザの発話音声を示す発話音声信号を発話文字列に変換する音声認識部１０７と、発話文字列に基づき音声対話処理を行うことで合成文字列を生成する対話処理部１０８と、合成文字列を合成音声信号に変換する音声合成部１０９と備える。なお、以下では、音声認識部１０７、対話処理部１０８及び音声合成部１０９は、それぞれ個別のサーバ装置である場合の例を説明する。なお、音声認識部１０７、対話処理部１０８及び音声合成部１０９の全て又はいずれか２つが、単一のサーバ装置として実現されてもよい。

図２は、クライアント装置１０１のブロック図である。図２に示すように、クライアント装置１０１は、マイク１０２からのマイク入力信号から発話音声信号を生成する音声取得部２０１と、合成音声信号に基づくスピーカ出力信号をスピーカ１０３へ出力する音声出力部２０２と、サーバ１２０とのデータの送受信を行う通信部２０３とを備える。さらに、サーバ１２０から受け取ったトリガ情報を解釈するトリガ情報解釈部２０４と、トリガ情報で示されるトリガ条件を保持するクライアントトリガ条件保持部２０５と、車両情報取得部１０４で取得された車両情報を保持する車両状態管理部２０６と、トリガ条件の判定を行う判定部２０７と、トリガ条件が満たされたことをサーバ１２０に通知するための通知信号を生成する通知部２０８とを備える。

図３は、対話処理部１０８のブロック図である。図３に示すように、対話処理部１０８は、発話文字列及び通知信号を受信する入力文字列管理部３０１と、状態遷移処理を行う状態管理部３０２と、キーワードを保持するキーワードＤＢ（データベース）３０３と、発話文字列に対するマッチング処理を行うマッチング処理部３０４と、キーワード文字列を保持するキーワード保持部３０５と、対話処理を実行する対話処理実行部３０６とを備える。さらに合成文字列テンプレートを保持する合成文字列テンプレートＤＢ（データベース）３０７と、トリガテンプレートを保持するトリガテンプレートＤＢ（データベース）３０８と、合成文字列及びトリガ情報を出力する出力文字列管理部３０９と、トリガ条件を保持するサーバートリガ条件保持部３１０とを備える。

以下、以上のように構成された音声対話システム１００の動作を説明する。図４は、本実施の形態における音声対話システム１００の動作を示す図である。

まず、ユーザが発話すると、クライアント装置１０１のマイク１０２はマイク入力信号を生成する。音声取得部２０１は、マイク入力信号を取得し、当該マイク入力信号を符号化することでデジタル信号である発話音声信号を生成する。通信部２０３は、生成された発話音声信号を音声認識部１０７に送信する（Ｓ１０１）。

音声認識部１０７は、受信した発話音声信号を音声認識により発話文字列に変換し、発話文字列を、クライアント装置１０１を経由して対話処理部１０８に送信する（Ｓ１０２）。

対話処理部１０８の入力文字列管理部３０１は、発話文字列を受け取り、受け取った発話文字列を保持する。マッチング処理部３０４は、状態管理部３０２で管理されている現在の状態においてマッチング処理を行う対象のキーワードをキーワードＤＢ３０３から取得する。マッチング処理部３０４は、取得した発話文字列とキーワードとのマッチング処理を行い、合致したキーワードをキーワード保持部３０５に保持する（Ｓ１０３）。

そして、状態管理部３０２は、合致したキーワードに基づき状態遷移を行う。対話処理実行部３０６は、当該状態遷移に伴う対話処理を行うことで合成文字列及びトリガ情報を生成する。

具体的には、対話処理実行部３０６は、（１）データベースの取得、変更又は設定、（２）条件の判定、（３）情報の検索、取得又は加工、及び（４）合成文字列の生成などを行う。より具体的には、対話処理実行部３０６は、合成文字列テンプレートＤＢ３０７から合成文字列テンプレートを取得し、取得した合成文字列テンプレートに、キーワード保持部３０５から読み出した文字列を設定し、後述する＜ＶＯＩＣＥ＞タグによりタグ付けを行うことで合成文字列を生成する。

さらに、対話処理実行部３０６は、トリガテンプレートＤＢ３０８からトリガテンプレートを取得し、取得されたトリガテンプレートに、キーワード保持部３０５から読み出した文字列を設定することでトリガ情報を生成する。また、このトリガ情報で示されるトリガ条件はサーバートリガ条件保持部３１０に保持される。そして、対話処理実行部３０６は、生成されたトリガ情報に後述する＜ＲＵＬＥ＞タグによりタグ付けを行ったうえで合成文字列に付与する（Ｓ１０４）。

出力文字列管理部３０９は、生成された合成文字列をクライアント装置１０１経由で音声合成部１０９に送信する。このとき、クライアント装置１０１の通信部２０３は、合成文字列に付与されたトリガ情報を取得する。

音声合成部１０９は、受信した合成文字列から合成音声信号を生成し、生成された合成音声信号をクライアント装置１０１に送信する（Ｓ１０５）。クライアント装置１０１の通信部２０３は合成音声信号を受信し、音声出力部２０２は合成音声信号を復号化することでスピーカ出力信号を生成する。スピーカ１０３は、生成されたスピーカ出力信号に基づき合成音声を再生する（Ｓ１０６）。

一方、トリガ情報解釈部２０４は、通信部２０３で取得されたトリガ情報を解釈し、トリガ情報で示されるトリガ条件をクライアントトリガ条件保持部２０５に保持する。例えば、クライアントトリガ条件保持部２０５に保持されるトリガ条件は、サーバ１２０に含まれるサーバートリガ条件保持部３１０に保持されるトリガ条件と同じである。

この一連の流れが繰り返されることで音声対話が成立する。

さらに、クライアント装置１０１の車両状態管理部２０６は、車両情報取得部１０４で取得された車両情報を保持する。判定部２０７は、車両情報で示される車両状態が、クライアントトリガ条件保持部２０５に保持されたトリガ条件を満たすかを定期的に判定する（Ｓ１０７）。車両状態がトリガ条件に合致した場合（トリガ発火）、通知部２０８は通知信号を生成する。また、通信部２０３は、生成された通知信号を対話処理部１０８に送信する。また、このとき、対話処理部１０８はクライアントトリガ条件保持部２０５に保持される、車両状態に合致したトリガ条件を削除する。

対話処理部１０８の入力文字列管理部３０１は、通知信号を受信する。マッチング処理部３０４は、通知信号が状態遷移を行うためのメッセージであることを解釈する。状態管理部３０２は通知信号に基づき状態遷移を行う。このとき状態管理部３０２は、サーバートリガ条件保持部３１０に保持され、通知信号に対応しているトリガ条件を削除する。また、対話処理実行部３０６は、遷移後の状態に基づき、合成文字列を生成する（Ｓ１０８）。また、出力文字列管理部３０９は、生成された合成文字列を、クライアント装置１０１を介して音声合成部１０９へ送信する。

音声合成部１０９は、合成文字列から合成音声信号を生成し、生成された合成音声信号をクライアント装置１０１に送信する（Ｓ１０９）。クライアント装置１０１の通信部２０３は合成音声信号を受信し、音声出力部２０２は合成音声信号を復号化することでスピーカ出力信号を生成する。スピーカ１０３は、生成されたスピーカ出力信号を出力することで合成音声を再生する（Ｓ１１０）。このようにして、プッシュ型の対話が実現される。

このとき、プッシュ型の対話におけるシステム側からの発話は、任意のタイミングで行われる。従って、既に対話の最中であることも考えられる。そこで、対話に優先度というパラメータが設定される。そして、現在行われている対話とプッシュ対話との優先度が比較され、優先度の高い方の対話が完了後に優先度の低い対話が行われる。

すなわち、通知信号に優先度が記載されることで、状態管理部３０２は、状態遷移を行うべきかを判断できる。プッシュ対話の優先度が低い場合は、この状態遷移処理は対話スタックに格納され、優先度の高い対話が終了後にロードされる。例えば、優先度は予め対話シナリオ内で記述される。優先度は、対話の内容に従い記述されており、クライアント側から通知される通知信号の優先度と現在行われている対話の優先度を比較し、状態遷移を行うかどうかを制御する。

次に、クライアントシステム１１０及びサーバ１２０の各々における処理の流れを説明する。

図５は、クライアントシステム１１０による処理の流れを示すフローチャートである。なお、図５の処理は、所定の周期毎に繰り返し行われる。

まず、クライアント装置１０１は、音声取得部２０１が発話音声（マイク入力信号）を取得したかを判定する（Ｓ２０１）。音声取得部２０１がマイク入力信号を取得した場合（Ｓ２０１でＹｅｓ）、音声取得部２０１は、マイク入力信号から発話音声信号を生成し、通信部２０３は、発話音声信号をサーバ１２０へ送信する（Ｓ２０２）。

また、クライアント装置１０１は、通信部２０３が音声合成信号を受信したかを判定する（Ｓ２０３）。通信部２０３が音声合成信号を受信した場合（Ｓ２０３でＹｅｓ）、音声出力部２０２は、合成音声信号を復号化することでスピーカ出力信号を生成する。スピーカ１０３は、生成されたスピーカ出力信号を出力する（Ｓ２０４）。

また、クライアント装置１０１は、通信部２０３がトリガ情報を受信したかを判定する（Ｓ２０５）。通信部２０３がトリガ情報を受信した場合（Ｓ２０５でＹｅｓ）、トリガ情報解釈部２０４は、通信部２０３で取得されたトリガ情報を解釈し、トリガ情報で示されるトリガ条件をクライアントトリガ条件保持部２０５に保持する。そして、判定部２０７は、車両状態管理部２０６で管理される車両状態が、クライアントトリガ条件保持部２０５に保持されたトリガ条件を満たすかのトリガ判定を開始する（Ｓ２０６）。

また、トリガ判定が行われている場合（Ｓ２０７でＹｅｓ）、判定部２０７は、トリガ判定を行う（Ｓ２０８）。車両状態がトリガ条件に合致した場合（トリガ発火）（Ｓ２０８でＹｅｓ）、通知部２０８は通知信号を生成する。また、通信部２０３は、生成された通知信号を対話処理部１０８に送信する（Ｓ２０９）。

なお、ステップＳ２０１及びＳ２０２の処理と、ステップＳ２０３及びＳ２０４の処理と、ステップＳ２０５及びＳ２０６の処理と、ステップＳ２０７〜Ｓ２０９の処理との順序は一例であり、図５に示す順序以外であってもよいし、一部の処理が同時（並列）あるいは、処理時間が重複して行なわれてもよい。

次に、サーバ１２０による処理の流れを説明する。図６は、サーバ１２０による処理の流れを示すフローチャートである。なお、図６の処理は、所定の周期毎に繰り返し行われる。

サーバ１２０は、発話音声信号を受信したかを判定する（Ｓ３０１）。発話音声信号が受信された場合（Ｓ３０１でＹｅｓ）、音声認識部１０７は、音声認識により発話音声信号を発話文字列に変換する（Ｓ３０２）。

次に、対話処理部１０８の入力文字列管理部３０１は、発話文字列を受け取り、受け取った発話文字列を保持する。マッチング処理部３０４は、状態管理部３０２で管理されている現在の状態において、マッチング処理を行う対象のキーワードをキーワードＤＢ３０３から取得する。マッチング処理部３０４は、取得した発話文字列とキーワードとのマッチング処理を行い、合致したキーワードをキーワード保持部３０５に保持する（Ｓ３０３）。

そして、状態管理部３０２は、合致したキーワードに基づき状態遷移を行う。対話処理実行部３０６は、当該状態遷移に伴う対話処理を行うことで合成文字列を生成する（Ｓ３０４）。

音声合成部１０９は、合成文字列から合成音声信号を生成し、生成された合成音声信号をクライアント装置１０１に送信する（Ｓ３０５）。

また、ステップＳ３０４での状態遷移に伴いトリガ条件を伴う判定が発生した場合（Ｓ３０６でＹｅｓ）、対話処理実行部３０６は、トリガ条件を示すトリガ情報を生成し、出力文字列管理部３０９は、生成されたトリガ情報をクライアント装置１０１へ送信する（Ｓ３０７）。

また、サーバ１２０は、通知信号を受信したかを判定する（Ｓ３０８）。通知信号が受信された場合（Ｓ３０８でＹｅｓ）、マッチング処理部３０４は、通知信号が状態遷移を行うためのメッセージであることを解釈する。状態管理部３０２は通知信号に基づき状態遷移を行う。また、対話処理実行部３０６は、遷移後の状態に基づき、対話処理を行うことで合成文字列を生成する（Ｓ３０９）。

音声合成部１０９は、合成文字列から合成音声信号を生成し、生成された合成音声信号をクライアント装置１０１に送信する（Ｓ３１０）。

なお、ステップＳ３０１〜Ｓ３０７の処理と、ステップＳ３０８〜Ｓ３１０の処理との順序は一例であり、図６に示す順序以外であってもよいし、一部の処理が同時（並列）あるいは、処理時間が重複して行なわれてもよい。

また、ここでは、サーバ１２０に含まれる音声認識部１０７、対話処理部１０８及び音声合成部１０９が、それぞれ個別のサーバ装置である場合の例を説明したが、音声認識部１０７、対話処理部１０８及び音声合成部１０９の全て又はいずれか２つが、単一のサーバ装置として実現されてもよい。この場合、発話文字列は、クライアント装置１０１を経由せずに、音声認識部１０７から対話処理部１０８に送られる。同様に、合成文字列は、クライアント装置１０１を経由せずに、対話処理部１０８から音声合成部１０９に送られる。

また、音声認識部１０７及び音声合成部１０９の少なくとも一方が、クライアントシステム１１０に含まれてもよい。

ここまでの流れの具体例を、図７Ａ〜図１２を用いて説明する。図７Ａ〜図７Ｃは、具体的な動作例を説明するための図である。図８は、キーワードＤＢ３０３に保持されるキーワードの一例を示す図である。図９は、対話処理における状態遷移の一例を示す図である。図１０は、合成文字列テンプレートＤＢ３０７に保持される合成文字列テンプレートの一例を示す図である。図１１は、トリガテンプレートＤＢ３０８に保持されるトリガテンプレートの一例を示す図である。図１２は、クライアントトリガ条件保持部２０５及びサーバートリガ条件保持部３１０に保持されるトリガ条件の一例を示す図である。

図７Ａに示すようにユーザが「ＡＡＡタワーに行きたい」と発話した音声を音声認識部１０７で認識する（Ｓ４０１）。対話処理部１０８のマッチング処理部３０４は、音声認識結果の発話文字列に対してキーワードマッチングを行う（Ｓ４０２）。ここで、図８に示すように、キーワードＤＢ３０３には、キーワード４１０と、参照キーワードグループ４２０とが格納されている。キーワード４１０は、複数のテーブル４０１〜４０５を含む。テーブル４０１〜４０５の各々は、１以上のキーワード（例えば、テーブル４０１における「｛場所｝に行きたい」）を含むキーワードリストである。また、テーブル４０１〜４０５の各々には、遷移元の状態と、遷移先の状態とが設定されている。

また、各キーワードにはキーワードグループ（図８では｛｝で示されている）が含まれる場合がある。参照キーワードグループ４２０は、各々がこのキーワードグループを示すリスト４０６〜４０９を含む。リスト４０６〜４０９の各々は、キーワードグループに含まれる複数の単語のリストである。

また、初期状態として遷移状態は、図９に示す「通常状態０１００」に設定されている。

まず、マッチング処理部３０４は、図８に示すキーワード４１０の中から、遷移元として現在の状態０１００が設定されているテーブル４０１、４０４及び４０５を取得し、テーブル４０１、４０４及び４０５に含まれるキーワードから、発話文字列に合致するキーワードを検索する。ここでは、テーブル４０１に含まれる「｛場所｝に行きたい」が検索される。

また、マッチング処理部３０４は、キーワードにキーワードグループが含まれている場合、参照キーワードグループ４２０からそのキーワードグループ（この例では｛場所｝のリスト４０６）の単語全てをキーワード保持部３０５に保持する。

また、状態管理部３０２は、テーブル４０１に設定されている遷移先の状態０１０１に状態遷移を行う。このように、状態管理部３０２は、「ＡＡＡタワーに行きたい」という発話文字列とマッチングした結果に基づき、遷移先を状態０１０１に決定できる。つまり、状態管理部３０２は、図９に示す通常状態０１００から目的地設定対話を行なうための目的地設定状態０１０１に状態遷移を行う。その際、キーワード保持部３０５は、「ＡＡＡタワー」を目的地として保持する。また、対話処理部１０８は、ＡＡＡタワーの位置取得などの処理を行う。

次に、対話処理実行部３０６は、遷移状態に基づき対話処理を行うことで合成文字列を生成する。

図１０に示すように、合成文字列テンプレートＤＢ３０７に格納されている合成文字列テンプレートは、遷移状態を示す状態５０１と、合成文字列を生成する条件５０２と、合成文字列のテンプレート５０３とを含む。

対話処理実行部３０６は、図１０に示す合成文字列テンプレートから状態５０１が０１０１であり、条件５０２を満たすテンプレート５０３「＜ＶＯＩＣＥ＞［目的地］を目的地に設定しますか？＜／ＶＯＩＣＥ＞」を取得する。次に、対話処理実行部３０６は、先ほど目的地に設定したキーワード「ＡＡＡタワー」をキーワード保持部３０５から取得し、取得した文字列を［目的地］にあてはめることで、「＜ＶＯＩＣＥ＞ＡＡＡタワーを目的地に設定しますか？＜／ＶＯＩＣＥ＞」という合成文字列を生成する（Ｓ４０３）。

また、対話処理実行部３０６は、トリガテンプレートＤＢ３０８からトリガテンプレートを取得する。図１１に示すように、トリガテンプレートは、遷移状態を示す状態５１１と、トリガ情報を生成する条件５１２と、トリガ条件のテンプレート５１３とを含む。

対話処理実行部３０６は、図１１に示すトリガテンプレートから状態５１１が０１０１であり、条件５１２を満たすテンプレート５１３を取得する。今回の例では合致するテンプレート５１３が存在しないので、合成文字列がそのままクライアント装置１０１に送信される。

クライアント装置１０１は、＜ＶＯＩＣＥ＞タグの中身を音声合成部１０９に送信し、音声合成結果である合成音声信号を受け取る。そして、クライアント装置１０１は、合成音声信号で示される「ＡＡＡタワーを目的に設定しますか？」を出音する（Ｓ４０４）。また、クライアント装置１０１は、トリガ情報を受け取っていないため、トリガ条件は更新しない。

次に、ユーザが「はい」と発話した音声を音声認識部１０７で認識した場合（Ｓ４０５）、対話処理部１０８のマッチング処理部３０４は、音声認識部１０７から取得した発話文字列「はい」に対してキーワードマッチングを行う。具体的には、テーブル４０２が選択され、状態管理部３０２は、図９に示す目的地設定状態０１０１から目的地決定状態０１０２へ状態を遷移させる（Ｓ４０６）。

また、対話処理実行部３０６は、図１０に示すテンプレート「＜ＶＯＩＣＥ＞［目的地］を目的地に設定しました＜／ＶＯＩＣＥ＞」を取得し、［目的地］に「ＡＡＡタワー」を設定することで、合成文字列「＜ＶＯＩＣＥ＞ＡＡＡタワーを目的地に設定しました＜／ＶＯＩＣＥ＞」を生成する（Ｓ４０７）。

さらに、対話処理実行部３０６は、トリガテンプレートＤＢ３０８からトリガテンプレートを取得し、トリガ情報を生成する（Ｓ４０８）。

具体的には、対話処理実行部３０６は、図１１に示すトリガテンプレートから状態５１１が０１０２であり、条件５１２を満たすテンプレート５１３「＜ＲＵＬＥ＞［ＩＤ］，ＧＰＳ，［緯度］，［経度］，５，０３０１，Ｍ＜／ＲＵＬＥ＞」を取得する。なお、ここでは、目的地が現在地から５ｋｍ圏内でなく、かつ駐車場のない施設であるとする。また、上記テンプレートは、目的地の５ｋｍ圏内に車両が入ったときに駐車場を案内する対話［図９に示す目的地接近状態０３０１］を優先度「中」でプッシュ発話するという内容である。

対話処理実行部３０６は、［ＩＤ］に固有の値（ここでは「ＡＡＡ」）を、［緯度］には目的地の緯度を、［経度］には目的地の経度を設定することで、トリガ情報を生成する。このトリガ情報の内容を元にサーバートリガ条件保持部３１０は、図１２に示すトリガ条件を保持する。図１２に示すように、トリガ条件は、トリガ条件を識別するための固有の識別子であるＩＤ５２１と、判定対象の条件を示す条件５２２と、判定内容を示す内容５２３と、トリガ条件が満たされた場合の遷移先の状態を示す遷移先５２４と、トリガ条件が満たされた後の処理の優先度を示す優先度５２５とを含む。

また、対話処理部１０８は、トリガ情報にタグ＜ＲＵＬＥＬＩＳＴ＞を追加し、合成文字列に付与することで、文字列「＜ＶＯＩＣＥ＞ＡＡＡタワーを目的地に設定しました＜／ＶＯＩＣＥ＞＜ＲＵＬＥＬＩＳＴ＞＜ＲＵＬＥ＞ＡＡＡ，ＧＰＳ，［緯度］，［経度］，５，０３０１，Ｍ＜／ＲＵＬＥ＞＜／ＲＵＬＥＬＩＳＴ＞」を生成し、生成された文字列をクライアント装置１０１に送信する。

クライアント装置１０１は＜ＶＯＩＣＥ＞タグの中身を音声合成部１０９に送信し、音声合成結果である合成音声信号を受け取る。そして、クライアント装置１０１は、合成音声信号で示される「ＡＡＡタワーを目的に設定しました」を出音する（Ｓ４０９）。

また、クライアント装置１０１は、＜ＲＵＬＥ＞タグの中身をトリガ情報として取得し、図１２に示すように、トリガ情報で示されるトリガ条件をクライアントトリガ条件保持部２０５に保持する。そして、クライアント装置１０１は、トリガ条件に従い判定を行う。すなわち、判定部２０７は、車両情報としてＧＰＳ情報を取得し、ＧＰＳ情報で示される車両の位置と目的地の緯度及び経度との距離を求め、求めた距離が５ｋｍ以上かどうかを判定する処理を、例えば、１０［ｓ］程度の周期で行う。

そして、目的地の距離が５ｋｍ以下になった場合、通知部２０８は、トリガ条件のＩＤ「ＡＡＡ」と、遷移先を示す「０３０１」と、優先度中を示す「Ｍ」とを含む通知信号「＜ＳＴＡＴＥ＞ＡＡＡ，０３０１，Ｍ＜／ＳＴＡＴＥ＞」を生成する。このように、通知信号は、トリガ条件を一意に識別するための情報と、トリガ条件が満たされた場合の遷移状態の遷移先を示す情報と、トリガ条件が満たされた場合に行われる対話処理の優先度を示す情報とを含む。そして、この通知信号が対話処理部１０８に送信される。また、クライアントトリガ条件保持部２０５に格納されているＩＤ「ＡＡＡ」のトリガ条件が削除される（Ｓ４１０）。

対話処理部１０８は、受信した通知信号に含まれる優先度に基づき、現在行われている対話処理と通知信号に基づく対話処理との優先度を判断する。図１３を用いて、この処理の具体例を説明する。なお、図１３では、通知信号に基づき、優先度が通常（中）の駐車場検索処理が行なわれる場合の例を示している。

（１）図１３の（ａ）に示すように対話中でない場合、または、（２）図１３の（ｂ）に示すように、優先度が低いスケジュール確認の対話中などの、通知信号に基づく駐車場検索処理の優先度の方が、現在行なわれている対話処理の優先度より高い場合は、状態管理部３０２は、通知信号に基づき、図９に示す通常状態０１００から目的地接近状態０３０１に状態を遷移させる。また、対話処理実行部３０６は、ＩＤ５２１が「ＡＡＡ」のトリガ条件をサーバートリガ条件保持部３１０から削除し、対話処理により「目的地近辺に到着しました。駐車場を案内いたしましょうか？」を示す合成文字列を生成し、生成された合成文字列をクライアント装置１０１に送信する（Ｓ４１１）。

これにより、クライアント装置１０１は、「目的地近辺に到着しました、駐車場を案内いたしましょうか？」を出音する（Ｓ４１２）。なお、その際に、クライアント装置１０１は、目的地近辺であることを表す何らかの音を再生してもよいし、車内のディスプレイに何らかのキャラクター又は絵を表示してもよい。

また、図１３の（ｃ）に示すように優先度が高いコンビニ検索処理の対話中などのように、通知信号に基づく駐車場検索処理の優先度の方が、現在行なわれている対話処理の優先度より低い場合は、駐車場検索処理は対話スタックに格納され、現在行われている対話処理が優先される。

なお、上記では、目的地近辺で駐車場を案内する例を説明したが、ユーザ側から条件付指示を与えられたときにも本実施の形態を対応できる。図１４Ａ及び図１４Ｂは、この動作例を説明するための図である。例えば、図１４Ａに示すように、ユーザが「あと１０ｋｍ走ったらガソリンを入れたい」と発話する（Ｓ５０１）。対話処理部１０８のマッチング処理部３０４は、音声認識結果の発話文字列に対してキーワードマッチングを行う（Ｓ５０２）。キーワードマッチングの結果に基づき、状態管理部３０２は、図９に示す通常状態０１００から条件付指示状態０２００に状態を遷移させる。

その際、トリガ条件が、車の走行距離に関する条件であること、あと１０ｋｍ走行することを条件とすることを示す情報（「走行距離」＝１０」、［条件］＝「１０ｋｍ走行」）がキーワード保持部３０５に保持される。

次に、遷移後の状態に基づき、対話処理実行部３０６は、「ガソリンを入れたい」に対応する対話状態であるガソリンスタンド検索状態０４００を取得する。その後、対話処理実行部３０６は、車のガソリンの状態からあと１０ｋｍ走行できることを確認したうえで、トリガリスト文字列テンプレート「＜ＲＵＬＥ＞［ＩＤ］，ＣＡＮ，ｄｉｓｔ，［走行距離］，［遷移対話状態］，Ｈ＜／ＲＵＬＥ＞」を呼び出す。そして、対話処理実行部３０６は、［ＩＤ］には固有の値「ＢＢＢ」を設定する。なお、ここでは、図１５に示すようにガソリン残量に関わるトリガ条件（ＩＤ５２１＝「ＢＢＢ］）が既に存在しており、かつこのトリガ条件を上書きされる場合を説明する。

また、対話処理実行部３０６は、［走行距離］に「１０」、［遷移対話状態］にガソリンスタンド検索状態を示す「０４００」を設定する。以上により、トリガ情報「＜ＲＵＬＥ＞ＢＢＢ，ＣＡＮ，ｄｉｓｔ，１０，０４００，Ｈ＜／ＲＵＬＥ＞」が生成される。また、対話処理実行部３０６は、この内容でトリガ条件を上書きする。これにより、サーバートリガ条件保持部３１０は、図１６に示すように更新される。また、対話処理実行部３０６は、合成文字列「＜ＶＯＩＣＥ＞了解しました。あと１０ｋｍ走ったらお知らせします。＜／ＶＯＩＣＥ＞」を生成し、生成されたトリガ情報及び合成文字列をクライアント装置１０１に送信する（Ｓ５０３）。

クライアント装置１０１は、合成文字列を受信し、「了解しました。あと１０ｋｍ走ったらお知らせします。」を出音する（Ｓ５０４）。

また、クライアント装置１０１は、トリガ情報を受信し、受信したトリガ情報で示されるトリガ条件にクライアントトリガ条件保持部２０５に格納されているトリガ条件を上書きする。例えば、クライアントトリガ条件保持部２０５には図１５に示すトリガ条件が保持されており、受信されたトリガ情報で示されるトリガ条件に、当該トリガ条件のＩＤと同じＩＤ「ＢＢＢ」のトリガ条件が上書きされる。これにより、クライアントトリガ条件保持部２０５は、図１６に示すように更新される。

また、クライアント装置１０１は、更新されたトリガ条件に従い目標走行距離と現在の走行距離とを比較し、走行距離が目標走行距離に達したかを定期的に判定する。走行距離が目標走行距離に達した場合、通知部２０８は、通知信号「＜ＳＴＡＴＥ＞ＢＢＢ，０４００，Ｈ＜／ＳＴＡＴＥ＞」を生成し、対話処理部１０８に送信する（Ｓ５０５）。

対話処理部１０８は、通知信号を受信し、状態管理部３０２は、図９に示す通常状態０１００からガソリンスタンド検索状態０４００に状態を遷移させる。対話処理実行部３０６は、遷移後の状態に基づき、「１０ｋｍ走行しました。ガソリンスタンドを検索しますか？」を示す合成文字列を生成する（Ｓ５０６）。生成された合成文字列は、クライアント装置１０１に送信され、クライアント装置１０１は、「１０ｋｍ走行しました。ガソリンスタンドを検索しますか？」を出音する（Ｓ５０７）。

このように、１０ｋｍ走行後にガソリンスタンドを検索するプッシュ対話を開始できる。

なお、上記説明では、対話処理部１０８のサーバートリガ条件保持部３１０と、クライアント装置１０１のクライアントトリガ条件保持部２０５との両方が、ＩＤ５２１、条件５２２、内容５２３、遷移先５２４及び優先度５２５をそれぞれ保持する例を述べたが、これらの情報の一部又は全てが一方の保持部にのみ保持されてもよい。

また、上記説明では、トリガ情報及び通知信号に、ＩＤと、遷移先を示す情報と、優先度を示す情報とが含まれているが、これらの少なくとも一つが含まれなくてもよい。

例えば、遷移先５２４及び優先度５２５の少なくとも一方は、対話処理部１０８でのみ管理されてもよい。この場合、トリガ情報及び通知信号にはこの情報は含まれない。対話処理部１０８は、通知信号を受信した際に、通知信号に含まれるＩＤと、管理している情報とに基づき、遷移先及び優先度を判断する。

または、遷移先５２４及び優先度５２５の少なくとも一方は、クライアント装置１０１でのみ管理されてもよい。この場合、トリガ情報及び通知信号にこの情報が含まれる。対話処理部１０８は、通知信号を受信した際に、通知信号に含まれる遷移先又は優先度に基づき、遷移先又は優先度を判断する。

また、通知信号に遷移先及び優先度が含まれる場合には、対話処理部１０８でトリガ条件を保持しておく必要はない。この場合、対話処理部１０８は、通知信号を受信した際に、通知信号に含まれる遷移先又は優先度に基づき、遷移先又は優先度を判断する。また、通知信号に遷移先が含まれる場合には、対話処理部１０８は、この遷移先のみに基づき処理を行うこともできるので、通知信号にＩＤが含まれなくてもよい。

つまり、トリガ情報は少なくともトリガ条件を示せばよい。また、通知信号はトリガ情報で示されるトリガ条件が満たされたことを示せばよい。

また、上記説明では、対話の内容をすぐにトリガ条件として活用したが、キーワード保持部３０５に過去の対話のキーワードが蓄積され、対話処理部１０８は、蓄積された情報に基づきトリガ条件を生成してもよい。例えば、対話処理部１０８は、初めて訪れる地域である旨の対話が行なわれていた場合に、ユーザがその地域に到着したことを判定する第１のトリガ条件が生成する。さらに、その第１のトリガ条件が満たされた場合に、観光地のスポット情報又は店舗のスポット広告に、ユーザが近付いたことを判定する第２のトリガ条件を生成する。この第２のトリガ条件が満たされた場合に、対話処理部１０８は、観光案内又は広告に関する対話を行う。このように、対話処理部１０８は、二段階のトリガ条件を生成してもよい。

また、ユーザが車に詳しくない旨がいくつかの対話（運転暦又は事故対応の回数に関する対話など）で確認された場合に、対話処理部１０８は、車に異常が発生したことを判定するトリガ条件を生成する。対話処理部１０８は、この条件が満たされた場合に、どのような異常が発生していて、どう対処すべきかを示す情報を対話により与える。これにより、複数の対話の結果を利用して、初心者だけを対象としたヘルプ機能を実現できる。

さらに、お昼にイタリアンレストランが頻繁に検索されている場合に、対話処理部１０８は、お昼の時間帯になったかを判定するトリガ条件を生成し、条件が満たされた場合に、イタリアンレストランの店を対話で案内する。これにより、レコメンド機能を実現することも可能である。

また、上記説明では、トリガ条件が、車両の走行距離等の条件である例を説明したが、トリガ条件は、車両の状態の条件であればよい。例えば、トリガ条件は、車に実装されているクライアント装置で取得可能なパラメータの条件であればよい。例えば、トリガ条件は、ＣＡＮ（ＣｏｎｔｒｏｌｌｅｒＡｒｅａＮｅｔｗｏｒｋ）などから取得される車両情報（アクセル踏み込み量、ブレーキの踏み込み量、ステアリングの蛇角、シフト位置、ウィンカーの状態、ワイパーの状態、ライト状態、ガソリン残量、走行距離、車速、車体加速度、車体角速度、車間距離、近接センサ、水温、オイル量、各種警告、ウィンドウの開閉度、又はエアコンの設定など）の条件であってもよい。

また、トリガ条件は、車に乗車しているユーザの状態の条件であってもよい。例えば、トリガ条件は、ドライバ周囲に配置されているセンサで得られるユーザの状態を示す情報（視線、顔の向き、音声、乗車人数、個人認識情報、体重、体温、脈拍、血圧、発汗、脳波、覚醒度又は集中度など）の条件であってもよい。

また、トリガ条件は、その他の車載のセンサで得られる情報（ＧＰＳ情報、車内温度、外気温、湿度又は時刻など）などの条件であってもよい。

つまり、トリガ条件は、車両又はクライアント装置が備えるセンサにより取得される車両又はユーザの状態の条件である。言い換えると、トリガ条件は、車両又はユーザの状態であって、逐次変化する状態の条件である。

さらに、上記説明では、クライアント装置１０１が自動車に搭載される例を述べたが、クライアント装置１０１は、移動体（例えば、電車、飛行機、又は自転車等）に搭載されてもよい。また、クライアント装置１０１は、これらの移動体に搭乗するユーザに所持又は携帯されてもよい。つまり、トリガ条件は、移動体の状態の条件、又は移動体に搭乗しているユーザの状態の条件であってもよい。

また、トリガ条件はＡＮＤ条件、ＯＲ条件又はその組み合わせであってもよい。例えば、＜ＲＵＬＥＬＩＳＴ＞＜ＡＮＤ＞＜ＲＵＬＥ＞［ＩＤ］，ＧＰＳ，［緯度］，［経度］，５，０３０１，Ｈ＜／ＲＵＬＥ＞＜ＲＵＬＥ＞［ＩＤ］，ＴＩＭＥ，［時刻］，０３０１，Ｈ＜／ＲＵＬＥ＞＜／ＡＮＤ＞＜／ＲＵＬＥＬＩＳＴ＞により、二つのルールのＡＮＤ条件が定義されてもよい。これにより、位置の条件と時刻の条件とが共に満たされた場合にプッシュ発話が行われる。

また、＜ＲＵＬＥＬＩＳＴ＞＜ＯＲ＞＜ＲＵＬＥ＞［ＩＤ］，ＧＰＳ，［緯度１］，［経度１］，５，０３０１，Ｈ＜／ＲＵＬＥ＞＜ＲＵＬＥ＞［ＩＤ］，ＧＰＳ，［緯度２］，［経度２］，５，０３０１，Ｈ＜／ＲＵＬＥ＞＜／ＡＮＤ＞＜／ＲＵＬＥＬＩＳＴ＞により、二つのルールのＯＲ条件が定義されてもよい。これにより、どちらかの条件が満たされた場合にプッシュ対話が開始される。

これらを組み合わせることによって、例えば、ユーザが、オートクルーズコントロールを使ってみたい旨を対話で話した場合、対話処理部１０８は、車両が高速道路付近でかつ高速定常走行している場合を検知し、オートクルーズコントロールの機能を音声で案内することも可能である。また、対話で目的地が設定されており、その目的地が遠い場合、対話処理部１０８は、ユーザの覚醒度の低下又は集中度の低下のいずれかを検知し、ユーザに休憩を勧めたりすることも可能である。

また、対話処理部１０８は、（１）車内の人同士の会話をモニタリングし、会話が途切れたとき、（２）運転負荷をモニタリングし、運転負荷が低くなったとき、（３）ユーザの脳波又は心拍などからユーザの精神状態を検知し、ユーザの精神状態が安静状態のときに、プッシュ型の発話を行ってもよい。

さらに、本実施の形態では、各機能をサーバ１２０とクライアントシステム１１０とに分けて説明したが、サーバ１２０の機能の一部をクライアントシステム１１０が有してもよい。

また、本実施の形態では、音声認識部１０７と対話処理部１０８と音声合成部１０９とが直接接続されていない例を述べたが、音声認識部１０７の出力信号が対話処理部１０８に直接入力されてもよいし、対話処理部１０８の出力信号のうち、合成文字列が音声合成部１０９に直接入力され、トリガ情報がクライアント装置１０１に送信されてもよい。

さらに、上記説明では、トリガ条件はその条件が満たされた場合に消去されていたが、トリガ条件に消去条件が付与され、消去条件が満たされた場合に、クライアント装置１０１のクライアントトリガ条件保持部２０５からトリガ条件が消去されてもよい。この場合、クライアント装置１０１はサーバ１２０に消去指令を送信し、消去命令を受信したサーバ１２０は、サーバートリガ条件保持部３１０のトリガ条件を削除する。

以上のように、本実施の形態に係る音声対話システム１００は、移動体に搭乗しているユーザからの音声に基づき、ユーザと対話する音声対話システムであって、ユーザからの音声を取得し、ユーザに音声情報を提供する情報端末装置であるクライアント装置１０１と、サーバ１２０とを含む。

サーバ１２０は、クライアント装置１０１に、移動体又はユーザの状態の条件を示すトリガ情報を送信し、当該条件を満たすときに通知信号をサーバ１２０に送信することを依頼する（図６のＳ３０７）。サーバ１２０は、通知信号を受信した場合（Ｓ３０８でＹｅｓ）、上記条件が満たされた場合の音声対話用処理を行うことで音声情報（合成文字列又は音声合成信号）を生成する（Ｓ３０９）。サーバ１２０は、音声情報をクライアント装置１０１に送信する（Ｓ３１０）。

また、クライアント装置１０１は、サーバ１２０からトリガ情報を受信し（図５のＳ２０５）、トリガ情報で示される条件が満たされたか否かを判定する（Ｓ２０６及びＳ２０８）。クライアント装置１０１は、トリガ情報で示される条件が満たされた場合に（Ｓ２０８でＹｅｓ）、サーバ１２０に通知信号を送信する（Ｓ２０９）。また、クライアント装置１０１は、サーバ１２０から音声情報（合成文字列又は音声合成信号）を受信し（Ｓ２０３）、受信された音声情報をユーザに提供する（Ｓ２０４）。

例えば、トリガ情報で示される条件は、移動体又はクライアント装置１０１が備えるセンサにより取得される移動体又はユーザの状態の条件を含む。例えば、この条件は、移動体の位置の条件又は移動体の移動距離の条件を含む。

このように、サーバ・クライアント型の音声対話システムにおいて、サーバ１２０で生成したトリガ条件をクライアント装置１０１で判断することにより、クライアント装置１０１を非常にシンプルで安価な構造で実現できる。また、サーバ１２０がプッシュ型対話の条件を保持できるためメンテナンス性及び拡張性を十分に確保できる。かつ、従来のシステムでは実現の難しかった、ユーザから「〜になったら、〜して」といった条件付指示を受けた場合についても、同様の仕組みで実現できる。

また、通知信号は、当該通知信号に基づく音声対話用処理の優先度を示す情報を含む。サーバ１２０は、優先度に基づき、現在実行中の音声対話用処理と、通知信号に基づく音声対話用処理とのうち、優先度の高い音声対話用処理を実行する。

また、通知信号は、当該通知信号に基づく音声対話用処理における状態遷移の遷移先を示す情報を含む。サーバ１２０は、上記情報で示される遷移先に状態を遷移させ、遷移後の状態に基づき音声情報を生成する。

以上、本開示の実施の形態に係る音声対話システムについて説明したが、本開示は、この実施の形態に限定されるものではない。

例えば、本開示は、上記音声対話システムに限らず、音声対話システムに含まれるサーバ、又はクライアント装置（情報端末装置）として実現されてもよいし、音声対話システム、サーバ又はクライアント装置における情報提供方法として実現されてもよい。

また、上記実施の形態に係る音声対話システムに含まれる処理部の一部又は全ては典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されてもよいし、一部又は全てを含むように１チップ化されてもよい。

また、集積回路化はＬＳＩに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。ＬＳＩ製造後にプログラムすることが可能なＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）、又はＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

また、上記実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。

さらに、本開示は上記プログラムであってもよいし、上記プログラムが記録された非一時的なコンピュータ読み取り可能な記録媒体であってもよい。また、上記プログラムは、インターネット等の伝送媒体を介して流通させることができるのは言うまでもない。

また、上記で用いた対話内容又は数字等は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された対話内容又は数字等に制限されない。

また、ブロック図における機能ブロックの分割は一例であり、複数の機能ブロックを一つの機能ブロックとして実現したり、一つの機能ブロックを複数に分割したり、一部の機能を他の機能ブロックに移してもよい。また、類似する機能を有する複数の機能ブロックの機能を単一のハードウェア又はソフトウェアが並列又は時分割に処理してもよい。

同様に、上記の音声対話システムにおける情報提供方法は、本開示を具体的に説明するために例示するためのものであり、本開示に係る情報提供方法は、上記ステップの全てを必ずしも含む必要はない。また、上記のステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時（並列）あるいは、処理時間が重複して実行されてもよい。

以上、一つまたは複数の態様に係る音声対話システムについて、実施の形態に基づいて説明したが、本開示は、この実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、一つまたは複数の態様の範囲内に含まれてもよい。

本開示は、音声対話システムに適用でき、例えば、車に搭乗しているユーザと音声対話を行なうシステムに有用である。

１００音声対話システム
１０１クライアント装置
１０２マイク
１０３スピーカ
１０４車両情報取得部
１０７音声認識部
１０８対話処理部
１０９音声合成部
１１０クライアントシステム
１２０サーバ
２０１音声取得部
２０２音声出力部
２０３通信部
２０４トリガ情報解釈部
２０５クライアントトリガ条件保持部
２０６車両状態管理部
２０７判定部
２０８通知部
３０１入力文字列管理部
３０２状態管理部
３０３キーワードＤＢ
３０４マッチング処理部
３０５キーワード保持部
３０６対話処理実行部
３０７合成文字列テンプレートＤＢ
３０８トリガテンプレートＤＢ
３０９出力文字列管理部
３１０サーバートリガ条件保持部
４０１，４０２，４０３，４０４，４０５テーブル
４０６，４０７，４０８，４０９リスト
４１０キーワード
４２０参照キーワードグループ
５０１，５１１状態
５０２，５１２，５２２条件
５０３，５１３テンプレート
５２１ＩＤ
５２３内容
５２４遷移先
５２５優先度

Claims

移動体に搭乗しているユーザからの音声に基づき、前記ユーザと対話する音声対話システムにおける情報提供方法であって、
前記音声対話システムは、
前記音声を取得する情報端末装置と、
サーバとを含み、
前記情報提供方法は、
前記サーバが、前記情報端末装置に、前記移動体又は前記ユーザの状態の条件を示すトリガ情報を送信するトリガ情報送信ステップと、
前記情報端末装置が、前記トリガ情報を受信した場合、前記条件が満たされたか否かを判定する判定ステップと、
前記情報端末装置が、前記条件が満たされた場合に、前記サーバに、前記移動体の状態を示す情報を含まない通知信号を送信する送信ステップと、
前記サーバが、前記通知信号を受信した場合、前記条件が満たされた場合の音声対話用処理を行うことで音声情報を生成する生成ステップと、
前記サーバが、前記音声情報を前記情報端末装置に送信する音声情報送信ステップと、
前記情報端末装置が、前記音声情報を受信し、前記音声情報を前記ユーザに提供する提供ステップとを含む
情報提供方法。
前記条件は、前記移動体又は前記情報端末装置が備えるセンサにより取得される前記移動体又は前記ユーザの状態の条件を含む
請求項１に記載の情報提供方法。
前記条件は、前記移動体の位置の条件を含む
請求項２に記載の情報提供方法。
前記条件は、前記移動体の移動距離の条件を含む
請求項２に記載の情報提供方法。
前記通知信号は、当該通知信号に基づく音声対話用処理の優先度を示す情報を含み、
前記生成ステップでは、前記優先度に基づき、現在実行中の音声対話用処理と、前記通知信号に基づく音声対話用処理とのうち、前記優先度の高い音声対話用処理を実行する
請求項１〜４のいずれか１項に記載の情報提供方法。
前記通知信号は、当該通知信号に基づく音声対話用処理における状態遷移の遷移先を示す情報を含み、
前記生成ステップでは、前記遷移先に状態を遷移させ、遷移後の状態に基づき前記音声情報を生成する
請求項１〜４のいずれか１項に記載の情報提供方法。
移動体に搭乗しているユーザからの音声に基づき、前記ユーザと対話する音声対話システムであって、
前記音声を取得し、前記ユーザに音声情報を提供する情報端末装置と、
サーバとを含み、
前記サーバは、
前記情報端末装置に、前記移動体又は前記ユーザの状態の条件を示すトリガ情報を送信し、当該条件を満たすときに、前記移動体の状態を示す情報を含まない通知信号を送信することを依頼するトリガ情報送信部と、
前記通知信号を受信した場合、前記条件が満たされた場合の音声対話用処理を行うことで前記音声情報を生成する生成部と、
前記音声情報を前記情報端末装置に送信する音声情報送信部とを備え、
前記情報端末装置は、
前記サーバから前記トリガ情報を受信するトリガ情報受信部と、
前記条件が満たされたか否かを判定する判定部と、
前記条件が満たされた場合に、前記サーバに前記通知信号を送信する送信部と、
前記サーバから前記音声情報を受信する音声情報受信部と、
前記音声情報を前記ユーザに提供する提供部とを備える
音声対話システム。
移動体に搭載される情報端末装置とサーバ間で情報を通信するシステムにおける情報提供方法であって、
前記情報提供方法は、
前記情報端末装置が、前記移動体に搭乗しているユーザからの入力情報を取得する情報取得ステップと、
前記情報端末装置が、前記入力情報を前記サーバへ送信する情報送信ステップと、
前記サーバが、前記入力情報から現在の状態に基づいて条件を生成する条件生成ステップと、
前記サーバが、前記条件を示すトリガ情報を前記情報端末装置へ送信するトリガ情報送信ステップと、
前記情報端末装置が、前記トリガ情報を受信した場合、前記条件が満たされたか否かを判定する判定ステップと、
前記情報端末装置が、前記条件が満たされた場合に、前記移動体の状態を示す情報を含まない通知信号を前記サーバへ返信する通知信号返信ステップと、
前記サーバが、前記通知信号を受信した場合、前記条件が満たされた場合の処理を行うことで文字列情報を生成する文字列情報生成ステップと、
前記サーバが、前記文字列情報を前記情報端末装置に送信する文字列情報送信ステップと、
前記情報端末装置が、前記文字列情報を受信し、前記文字列情報を出力する情報出力ステップとを含む
情報提供方法。
前記入力情報は、音声情報である
請求項８に記載の情報提供方法。
前記音声情報は、前記情報端末装置に入力された音声から生成される
請求項９に記載の情報提供方法。
前記入力情報は、前記情報端末装置が受信したセンサの情報である
請求項８に記載の情報提供方法。
前記入力情報は、前記情報端末装置に接続されたセンサの情報である
請求項８に記載の情報提供方法。
前記情報端末装置が受信したセンサの情報は、前記移動体に設置されたセンサ又は前記情報端末装置の周辺に位置するセンサの情報である
請求項１１に記載の情報提供方法。
前記文字列情報は、音声情報である
請求項８〜１３のいずれか１項に記載の情報提供方法。
前記条件は、前記移動体の位置の条件を含む
請求項１３に記載の情報提供方法。
前記条件は、前記移動体の移動距離の条件を含む
請求項１３に記載の情報提供方法。
前記条件生成ステップでは、前記文字列情報は前記音声情報の音声対話用処理により生成され、
前記通知信号は、当該通知信号に基づく音声対話用処理の優先度を示す情報を含み、
前記優先度に基づき、現在実行中の音声対話用処理と、前記通知信号に基づく音声対話用処理とのうち、優先度の高い音声対話用処理を実行する
請求項９又は１０に記載の情報提供方法。
前記通知信号は、当該通知信号に基づく処理における状態遷移の遷移先を示す情報を含み、
前記文字列情報生成ステップでは、前記遷移先に状態を遷移させ、遷移後の状態に基づき前記文字列情報を生成する
請求項８〜１７のいずれか１項に記載の情報提供方法。
移動体に搭載される情報端末装置とサーバ間で情報を通信するシステムであって、
前記サーバは、
情報受信部と、
条件生成部と、
トリガ情報送信部と、
通知信号受信部と、
文字列情報生成部と、
文字列情報送信部とを備え、
前記情報端末装置は、
情報取得部と、
情報送信部と、
トリガ情報受信部と、
判定部と、
通知信号送信部と、
文字列情報受信部と、
出力部とを備え、
前記情報取得部は、前記移動体に搭乗しているユーザからの入力情報を取得し、
前記情報送信部は、前記情報受信部に前記入力情報を送信し、
前記情報受信部は、前記入力情報を受信し、
前記条件生成部は、前記入力情報から現在の状態に基づいて条件を生成し、
前記トリガ情報送信部は、前記条件を示すトリガ情報を前記トリガ情報受信部に送信し、
前記トリガ情報受信部は、前記サーバから、前記トリガ情報を受信し、
前記判定部は、前記条件が満たされたか否かを判定し、
前記通知信号送信部は、前記条件が満たされた場合に、前記通知信号受信部に、前記移動体の状態を示す情報を含まない通知信号を返信し、
前記通知信号受信部は、前記条件が満たされた場合に、前記通知信号送信部から前記通知信号を受信し、
前記文字列情報生成部は、前記通知信号受信部が前記通知信号を受信した場合に、前記通知信号に基づき文字列情報を生成し、
前記文字列情報送信部は、前記文字列情報を前記文字列情報受信部に送信し、
前記文字列情報受信部は、前記文字列情報を受信し、
前記出力部は、前記文字列情報を出力する
システム。
前記入力情報は、音声情報である
請求項１９に記載のシステム。