JPWO2006040969A1

JPWO2006040969A1 - 対話支援装置

Info

Publication number: JPWO2006040969A1
Application number: JP2006540887A
Authority: JP
Inventors: 水谷　研治; 研治水谷; 純幸沖本
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2004-10-08
Filing date: 2005-10-05
Publication date: 2008-05-15
Anticipated expiration: 2025-10-05
Also published as: CN1842788A; US7835914B2; US20080215338A1; CN1842788B; US7346515B2; WO2006040969A1; JP3962766B2; US20060136227A1

Abstract

対話の相手がどのような相手であっても速やかに対話が完了するように対話を支援することができる対話支援装置を提供する。対話支援装置１００は、対話参加者の発話を受け付け、発話を特定するための発話情報を出力する発話受付部１０１、発話情報により特定される発話を他の発話形態に変換する発話処理部１０２、他の発話形態に変換された発話情報を他の対話参加者への発話として出力する発話出力部１０３、対話参加者の過去の２つ以上の発話情報を発話時刻の順に並べた対話履歴を格納している対話履歴データベース１０４、および、対話履歴に基づいて第１発話予測情報を作成するとともに、他の対話支援装置から第２発話予測情報を取得し、第１発話予測情報および第２発話予測情報に基づいて対話支援装置１００を使用する対話参加者の次の発話を予測する発話予測部１０５を備える。

Description

本発明は、人と人との対話を支援する対話支援装置に関するものである。

従来、一般の人々が海外旅行先等で現地の人々と対話をする際に、その異言語対話を支援することを目的として翻訳装置が開発されてきた。例えば代表的なものとして、例文や用例の対訳に基づく翻訳方式を、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｃｅ）などの小型の情報処理装置に実装した翻訳装置がある。そのような装置では、一般的な旅行会話をカバーするために数千以上の用例が用意されているので、ユーザに所望の用例をそのリストから目視で選択させるだけでは実際の使用状況における使い勝手、すなわち、ユーザビリティに問題がある。特に、用例のリストを見るための表示部が小さく、同時に見ることができる用例の数が少ない場合は、この問題は一層顕著になる。また、翻訳装置の一般的な使用状況を想定すると、相手との対話の中で数文以上の用例を使用しなければならない場合がほとんどであり、翻訳装置を介して１つの対話が完了するまでに予想以上の時間を要してしまう。そこで、人と人との対話支援を最終目的として、大量の用例リストの中からユーザに所望の用例を速やかに選択させるための、何らかの選択補助機能が必要とされている。

この問題を解決するための一方法として、見本対話モデルや会話練習履歴コーパスを利用してユーザの次の発話候補を絞り込む手法が提案されている（例えば特許文献１参照）。
特開２００３−３０１８７号公報

過去に翻訳装置のユーザが行った対話の履歴に基づく次発話候補の絞込みは、相手がその中に含まれている場合は有効である。また、事前にユーザが仮想的に対話の練習を行った履歴や典型的な対話のパターンに基づく次発話候補の絞込みは、自分が想定する対話のパターンに従う相手であれば有効である。しかしながら、対話のパターンは人によって異なるのが一般的である。例えば、レストランの予約をするために旅行者がレストランのウェイターと対話を開始する場合、旅行者の発話「席を予約したいのですが」に対して、あるウェイターは「何日ですか」という予約の日時についての発話から対話を開始する可能性もあれば、別のウェイターは「何人ですか」という予約の人数に関する発話から対話を開始する可能性もある。したがって、対話の相手によっては絞込みに失敗するだけでなく、誤った絞込みによって対話参加者を混乱させることになり、逆に対話が完了するまでに要する時間が増加するという問題がある。特に、通信インフラが整備されていない地域を旅行する場合には、ネットワークを利用せずにユーザの翻訳装置だけで解決しなければならない。

そこで、本発明は上記の事情に鑑みてなされたものであり、ネットワークが利用できない場合であっても、また対話の相手がどのような相手であっても速やかに対話が完了するように対話を支援することができる対話支援装置を提供することを目的とする。

上記目的を達成するため、本発明に係る対話支援装置は、対話参加者によって行われる対話を支援する対話支援装置であって、前記対話参加者の過去の対話履歴を格納している対話履歴データベースと、前記対話履歴データベースに格納されている前記対話履歴に基づいて第１発話予測情報を作成するとともに、他の対話支援装置から第２発話予測情報を取得し、前記第１発話予測情報および前記第２発話予測情報に基づいて、当該対話支援装置を使用する対話参加者の前記対話における次の発話を予測する発話予測手段とを備えることを特徴とする。

本発明に係る対話支援装置によれば、ユーザは次発話候補の中から用例を容易に選択することが可能になる。したがって、対話の相手を待たせることがないので対話支援装置を介した対話をスムーズに進行することができる。また、次発話候補は自分の対話履歴と相手の対話履歴だけから生成されるので、典型的な対話パターンなどの情報を装置の内外に実装する必要がなく、装置全体の実装規模を縮小することが可能になる。

図１は、本発明に係る対話支援装置の一実施の形態の構成を示すブロック図である。図２は、２つの対話支援装置を用いて対話を行う場合の実施の形態の構成を示すブロック図である。図３は、対話支援装置における入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図４、は対話支援装置における入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図５（ａ）、図５（ｂ）は、対話履歴データベースに格納される対話履歴の一例を示す図である。図６は、本発明に係る対話支援装置が利用される場面の一例を示す図である。図７は、発話予測部の動作の流れを示すフローチャートである。図８は、本発明に係る対話支援装置の表示例を示す図である。図９は、予測スタックの作成手順を示すフローチャートである。図１０は、対話履歴の発話数を調整する動的計画法のアルゴリズムを示す図である。図１１は、対話履歴ｘに対して動的計画法を適用した例を示す図である。図１２（ａ）、図１２（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１３（ａ）、図１３（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１４（ａ）、図１４（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１５（ａ）、図１５（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１６（ａ）、図１６（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１７（ａ）、図１７（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１８（ａ）、図１８（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１９は、本発明によって支援される対話を形式的に表現した図である。図２０は、新しく生成された対話ｄ’を示す図である。図２１（ａ）、図２１（ｂ）は、対話履歴の類似度を定義する数式と計算の例を示す図である。図２２は、対話履歴の類似度を比較した図である。図２３は、本発明による対話を形式的に表現した図である。図２４（ａ）、図２４（ｂ）は、新しく生成された対話ｄ’’と対話履歴の類似度の比較を示す図である。図２５は、対話支援装置における入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図２６は、対話支援装置における入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図２７（ａ）、図２７（ｂ）は、対話履歴データベースに格納される対話履歴の一例を示す図である。図２８は、本発明に係る対話支援装置の表示例を示す図である。図２９（ａ）、図２９（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３０（ａ）、図３０（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３１（ａ）、図３１（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３２（ａ）、図３２（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３３（ａ）、図３３（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３４（ａ）、図３４（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３５（ａ）、図３５（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３６は、本発明によって支援される対話を形式的に表現した図である。図３７は、新しく生成された対話ｆを示す図である。図３８は、対話履歴の類似度を比較した図である。図３９は、本発明による対話を形式的に表現した図である。図４０（ａ）、図４０（ｂ）は、新しく生成された対話ｆ’と対話履歴の類似度の比較を示す図である。図４１は、対話参加者が１台の対話支援装置を共有する様子を示す図である。図４２は、対話参加者が１台の対話支援装置を共有する様子を示す図である。図４３は、本発明に係る対話支援装置の他の実施の形態の構成を示すブロック図である。図４４は、本発明に係る対話支援装置の他の実施の形態の構成を示すブロック図である。図４５は、本発明に係る対話支援装置の他の実施の形態の構成を示すブロック図である。図４６（ａ）、図４６（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図４７（ａ）、図４７（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。

符号の説明

１０１発話受付部
１０２発話処理部
１０３発話出力部
１０４対話履歴データベース
１０５発話予測部
７０３対話参加者１のトピック入力領域
７０４対話参加者２のトピック入力領域
７０５対話参加者１の対話開始ボタン
７０６対話参加者２の対話開始ボタン
１１０１対話参加者１の発話入力領域
１１０２対話参加者２の発話入力領域
１１０３対話参加者２への発話出力領域
１１０４対話参加者１への発話出力領域
１１０５対話参加者１への予測候補の表示領域
１１０６対話参加者２への予測候補の表示領域
１１０７対話参加者１の対話の予測展開ボタン
１１０８対話参加者２の対話の予測展開ボタン
１８０１対話参加者に提示された予測候補と対話参加者が実際に入力した発話の対の時系列
１８０２対話の分岐点
２００１対話履歴ｄｂに対する対話履歴ｄａの類似度を定義する数式
２００２類似度計算の例
２２０１対話参加者に提示された予測候補と対話参加者が実際に入力した発話の対
２４０１対話参加者１の対話履歴を格納するメモリカード
２４０２対話参加者２の対話履歴を格納するメモリカード
２８０１対話参加者１に対するこれまでに交わした対話
２８０２対話参加者１に対する今後の対話の予測展開
２８０３対話参加者２に対するこれまでに交わした対話
２８０４対話参加者２に対する今後の対話の予測展開

本発明の実施の形態に係る対話支援装置は、対話参加者によって行われる対話を支援する対話支援装置であって、前記対話参加者の過去の対話履歴を格納している対話履歴データベースと、前記対話履歴データベースに格納されている前記対話履歴に基づいて第１発話予測情報を作成するとともに、他の対話支援装置から第２発話予測情報を取得し、前記第１発話予測情報および前記第２発話予測情報に基づいて、当該対話支援装置を使用する対話参加者の前記対話における次の発話を予測する発話予測手段とを備えることを特徴とする。

これによって、自分の対話の履歴と相手の対話の履歴だけを利用し、その履歴に基づいて次の発話を予測することができるので、対話の相手がどのような相手であっても速やかに対話が完了するように対話を支援することができる。

ここで、前記発話予測手段は、前記対話履歴データベースに格納されている前記対話履歴の中から前記対話における対話状況が最も近い対話履歴を抽出し、抽出した前記対話履歴を前記第１発話予測情報とすることが好ましい。

また、前記発話予測手段は、前記第１発話予測情報および前記第２発話予測情報に含まれるそれぞれの対話履歴に共通して含まれ、かつ、連続する発話の集合に基づいて予測スタックを作成することが好ましい。

これによって、対話状況が最も近い対話履歴に基づいて対話参加者の次の発話を予測することができる。

また、前記対話支援装置は、さらに、前記対話参加者の発話を受け付ける発話受付手段と、前記発話受付手段により受け付けられた前記発話を他の発話形態に変換する発話処理手段と、前記発話処理手段により変換された前記他の発話形態の前記発話を出力する発話出力手段とを備えてもよい。

これによって、例えば日本語と英語とによる対話等の異言語の対話を支援することができる。

なお、本発明は、このような対話支援装置として実現することができるだけでなく、このような対話支援装置が備える特徴的な手段をステップとする対話支援方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、ＣＤ−ＲＯＭ等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。

以下、本発明の実施の形態について、図面を参照しながら説明する。

図１は本発明に係る対話支援装置の一実施の形態の構成を示すブロック図である。

対話支援装置１００は、人と人との対話を支援するための装置であり、図１に示すように発話受付部１０１、発話処理部１０２、発話出力部１０３、対話履歴データベース１０４、および発話予測部１０５を備えている。ここで、発話受付部１０１は発話受付手段に、発話処理部１０２は発話処理手段に、発話出力部１０３は発話出力手段に、発話予測部１０５は発話予測手段に、それぞれ相当する。

発話受付部１０１は、対話参加者の発話を受け付け、発話を特定するための発話情報を出力する。発話処理部１０２は、発話受付部１０１から出力された発話情報により特定される発話を他の発話形態に変換する。発話出力部１０３は、他の発話形態に変換された発話情報を他の対話参加者への発話として出力する。対話履歴データベース１０４は、対話参加者の過去の２つ以上の発話情報を発話時刻の順に並べた対話履歴を格納している。

発話予測部１０５は、対話履歴データベース１０４に格納されている対話履歴に基づいて第１発話予測情報を作成する。また、発話予測部１０５は、他の対話支援装置から第２発話予測情報を取得する。さらに、発話予測部１０５は、対話参加者が開始する対話において、第１発話予測情報および第２発話予測情報に基づいて、対話支援装置１００を使用する対話参加者の次の発話を予測する。また、発話予測部１０５は、作成した第１発話予測情報を他の対話支援装置へ通知する。

図１に示す対話支援装置１００は本発明の基本構成であり、対話参加者１人が１つの構成を使用する。対話は一般に２名で行われるので、実際に対話を行う場合には２つの対話支援装置１００が用いられる。図２は２つの対話支援装置を用いて対話を行う場合の実施の形態の構成を示すブロック図である。

以下、上記のように構成された対話支援装置を用いて、異言語の対話を支援する場合の動作について説明する。ここでは、日本語を話す対話参加者１は対話支援装置１００ａを使用し、英語を話す対話参加者２は対話支援装置１００ｂを使用すると仮定する。図３は対話支援装置１００ａにおける入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。

発話受付部１０１ａは、受け付けた対話参加者１の発話を相当する発話情報に変換する。発話情報は、例えば図３における発話Ｎｏ．である。発話処理部１０２ａは、対話参加者１の発話（日本語）を対話参加者２への発話（英語）に変換して文字列を出力する。例えば、発話Ｎｏ．１が入力されたときは、発話出力部１０３ａに対して発話情報として文字列″ＭａｙＩｈｅｌｐｙｏｕ？″を出力する。

対話支援装置１００ａと全く対称的に、対話支援装置１００ｂの発話処理部１０２ｂは対話参加者２の発話を相当する発話情報に変換する。図４は対話支援装置１００ｂにおける入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図３と図４とでは発話Ｎｏ．は完全に同じであり、その処理方向が異なる。発話情報は、例えば図４の発話Ｎｏ．であり、発話受付部１０１ｂは対話参加者２の発話（英語）を対話参加者１への発話（日本語）に変換して文字列を出力する。例えば、発話Ｎｏ．１が入力されたときは、発話出力部１０３ｂに対して発話情報として文字列「いらっしゃいませ。」を出力する。以後、言語方向を考慮しながら説明を簡単にするために、対話参加者１からの発話Ｎｏ．１をＪ１、対話参加者２からの発話Ｎｏ．１をＥ１のように略記する。

発話受付部１０１ａは、図３の日本語のリストの部分を対話参加者１に直接選択させて、その発話Ｎｏ．を発話情報として出力する。また、発話受付部１０１ｂは図４の英語のリストの部分を対話参加者２に直接選択させてその発話Ｎｏ．を発話情報として出力する。なお、発話受付部１０１ａまたは発話受付部１０１ｂの構成については、音声認識処理を利用して対話参加者の音声を発話Ｎｏ．のいずれかに射影する処理で実現してもよい。また、キーボードから発話の表記や発音に相当する文字列を入力させて、それを発話Ｎｏ．のいずれかに射影して実現しても良い。

図５（ａ）、（ｂ）は対話履歴データベース１０４ａおよび対話履歴データベース１０４ｂに格納される対話履歴の一例を示す図である。対話履歴とは対話参加者によって過去に交わされた発話の履歴であり、各対話参加者の発話時刻の順に並べたものである。各発話は図３または図４で定義される発話のいずれかに相当する。なお、同じ発話Ｎｏ．でも対話参加者の立場によって区別する必要があるので、日本語についてはＪを、英語についてはＥをそれぞれ発話Ｎｏ．の前に付与して、対話履歴における発話のラベルとして定義する。以後、説明を簡単にするために、１つの対話履歴をそのラベルの列で記述する。例えば、対話履歴ｄ１はｄ１：Ｅ１，Ｊ２，Ｅ３，Ｊ４，Ｅ５，Ｊ６，Ｅ７，Ｅ８と記述する。対話履歴にはその対話を交わした対話参加者の情報と対話のトピックが記録されている。例えば対話履歴ｄ１は、対話参加者１がＪの立場で対話をしたという情報と、その対話のトピックがチェックインであったという情報が記されている。

以下、図６に示すように対話参加者１が日本人観光客で、対話参加者２が英語を話すホテルのフロントのスタッフであり、ホテルのチェックインを行うために対話を行う場合を例として説明する。

図７は発話予測部１０５ａおよび発話予測部１０５ｂの動作の流れを示すフローチャートである。発話予測部１０５ａと発話予測部１０５ｂは構成としては独立しているが、双方が連携して動作を行うために情報を交換する必要がある。この連係動作に必要な情報を発話予測情報と呼ぶ。

発話予測部１０５ａおよび発話予測部１０５ｂは、まず発話予測を行うために必要な対話履歴を対話履歴データベース１０４ａまたは対話履歴データベース１０４ｂから検索するために、対話のトピックの特定を行う（ステップＳ６０１）。発話予測部１０５ａは対話履歴データベース１０４ａに対して、発話予測部１０５ｂは対話履歴データベース１０４ｂに対して検索を行う。例えばＰＤＡとして実現された図８に示すような対話支援装置１００ａを対話参加者１が使用し、対話支援装置１００ｂを対話参加者２が使用する。対話のトピックはそれぞれトピック入力領域７０３およびトピック入力領域７０４を用いて、各対話参加者にタッチパネルから直接入力させることでトピックの情報を取得する。なお、対話のトピックの取得については、このような手動による方法以外にも、自動的に得られるＰＤＡの存在環境の情報（例えば、レストラン、病院、ホテルなどの場所情報）から、自動的に連想する方法で実現してもよい。

各対話参加者によって対話開始ボタン７０５および対話開始ボタン７０６が押されると、発話予測部１０５ａは対話参加者１に対して対話履歴ｄ１を、発話予測部１０５ｂは対話参加者２に対して対話履歴ｄ３を選択する。理由は、対話履歴ｄ１と対話履歴ｄ３の対話のトピックがホテルであるからである。対話履歴ｄ２および対話履歴ｄ４は対話のトピックが異なるために選択されない。そして、発話予測部１０５ａは対話履歴ｄ１を第１発話予測情報として発話予測部１０５ｂへ、発話予測部１０５ｂは対話履歴ｄ３を第２発話予測情報として発話予測部１０５ａへ通知する。

次に、発話予測部１０５ａと発話予測部１０５ｂは、対話履歴ｄ１：Ｅ１，Ｊ２，Ｅ３，Ｊ４，Ｅ５，Ｊ６，Ｅ７，Ｅ８と対話履歴ｄ３：Ｅ１，Ｅ３，Ｊ４，Ｊ２，Ｅ８，Ｅ５，Ｊ６，Ｅ７を用いて予測スタックの作成を開始する（ステップＳ６０２）。

図９は予測スタックの作成手順を示すフローチャートである。なお、対話履歴は発話の列によって構成されるので、発話列は対話履歴の部分集合の意味である。

発話予測部１０５ａおよび発話予測部１０５ｂは、それぞれの対話履歴の発話数が同じ数になるように図１０に示す動的計画法で調整する（ステップＳ９０１）。例えば、図５の対話履歴ｄ１（発話数は８）と図１１の対話履歴ｘ（発話数は６）を調整する場合、図１０に示す動的計画法を対話履歴ｘに適用すると、対話履歴ｘは調整されて対話履歴ｘ’となる。調整された対話履歴ｘ’において、ラベルがφの発話はｄ１との発話数が同じ数になるように追加された空の発話である。しかし、対話履歴ｄ１：Ｅ１，Ｊ２，Ｅ３，Ｊ４，Ｅ５，Ｊ６，Ｅ７，Ｅ８と対話履歴ｄ３：Ｅ１，Ｅ３，Ｊ４，Ｊ２，Ｅ８，Ｅ５，Ｊ６，Ｅ７については発話数が同じ８であるので、動的計画法が適用されても結果は同じである。

次に、発話予測部１０５ａおよび発話予測部１０５ｂは、各対話履歴について発話ブロックの決定を行う。発話ブロックとは各対話履歴に共通に含まれ、かつ、１つ以上連続する発話の集合である。ただし、各対話履歴に含まれる発話ブロックの数が最小になるような、発話数が最大の発話ブロックを決定する。すなわち、発話列Ａ（発話列Ｂ）に含まれる発話数をｍとする（ステップＳ９０２）。次に、ｉに１を代入する（ステップＳ９０３）。Ａ［ｉ］が発話列Ｂに存在するか否かを判定する（ステップＳ９０４）。なお、Ａ［ｉ］は発話列Ａにおけるｉ番目の発話を示す。また、φについては、Ａ［ｉ］＝φ、Ｂ［ｊ］＝φのとき、Ａ［ｉ］とＢ［ｊ］が同じであると見なさない。この判定の結果、Ａ［ｉ］が発話列Ｂに存在する場合（ステップＳ９０４でＹＥＳ）、その発話をＢ［ｊ］とする（ステップＳ９０５）。そして、Ａ［ｉ］からＡ［ｉ＋ｎ］が、発話列Ｂ［ｊ］からＢ［ｊ＋ｎ］が同じである最大のｎを求めて、それぞれを１つのブロックとする（ステップＳ９０６）。次に、ｉにｉ＋ｎ＋１を代入する（ステップＳ９０７）。

Ａ［ｉ］が発話列Ｂに存在するか否かの判定の結果、Ａ［ｉ］が発話列Ｂに存在しない場合（ステップＳ９０４でＮＯ）、Ａ［ｉ］を１つのブロックとする（ステップＳ９０８）。そして、ｉにｉ＋１を代入する（ステップＳ９０９）。

次に、ｉ＞ｍであるか否かを判定する（ステップＳ９１０）。ｉ＞ｍでない場合（ステップＳ９０７でＮＯ）には、再びＡ［ｉ］が発話列Ｂに存在するか否かを判定処理以降（ステップＳ９０４〜Ｓ９０７）を繰り返す。一方、ｉ＞ｍである場合（ステップＳ９０７でＹＥＳ）には、処理を終了する。

以上の動作により、例えば、対話履歴ｄ１：Ｅ１，Ｊ２，Ｅ３，Ｊ４，Ｅ５，Ｊ６，Ｅ７，Ｅ８と対話履歴ｄ３：Ｅ１，Ｅ３，Ｊ４，Ｊ２，Ｅ８，Ｅ５，Ｊ６，Ｅ７に対しては、対話履歴ｄ１：Ｅ１，Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８および対話履歴ｄ３：Ｅ１，（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）が得られる。括弧で囲まれた発話のラベルが１つの発話ブロックに相当する。ただし、１つの発話だけで構成される発話ブロックについては、表記を簡単にするために括弧を省略する。この対話履歴ｄ１：Ｅ１，Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびｄ３：Ｅ１，（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）が、それぞれ発話予測部１０５ａの予測スタックＪ：Ｅ１，Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８、および、発話予測部１０５ｂの予測スタックＥ：Ｅ１，（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）となる。

なお、予測スタックの作成手順において、２つの発話が同じか否かの判定処理（ステップＳ９０１、Ｓ９０４、Ｓ９０６）を行っているが、発話情報の一致、すなわち、発話Ｎｏ．の一致以外にも、自然言語処理を利用して発話の表層表現（文字表現）の一致、または、内容語の一致などで判定してもよい。例えば、一方の対話履歴に発話「ありがとう。」、他方の対話履歴に発話「ありがとうございます。」の場合などは、これらの発話が異なる発話Ｎｏ．であったとしても表層表現が近いので２つの対話履歴に共通に含まれる発話と判定することが可能である。一方の対話履歴に発話″Ｔｈａｎｋｙｏｕ．″、他方の対話履歴に発話″Ｔｈａｎｋｙｏｕｖｅｒｙｍｕｃｈ．″の場合も同様である。また、一方の対話履歴に発話「これを３セット贈答用に包んで下さい。」、他方の対話履歴に発話「贈答用に３セット、これを包んで下さい。」が含まれる場合などは、内容語が（これ、包む、３セット、贈答用）と定義されていれば、共通に含まれる内容語が多いので２つの対話履歴に共通に含まれる発話と判定することが可能である。また、これらの判定方法を組み合わせて用いても構わない。このように柔軟な判定にすることで、発話Ｎｏ．の一致だけでは発話ブロックの数が増加する場合でも、発話ブロックの数を抑制することが可能になる。

ここで、図７に示すフローチャートの説明に戻る。

発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックを構成した後、予測スタックが空であるか否かを判定する（ステップＳ６０３）。発話予測部１０５ａまたは発話予測部１０５ｂが何らかの理由で適当な予測スタックを構成できず、予測スタックが空である場合は（ステップＳ６０３でＹＥＳ）、発話予測部１０５ａまたは発話予測部１０５ｂは発話予測動作を行わず終了し、相手の発話予測部１０５ａまたは発話予測部１０５ｂの動作に従う。

一方、予測スタックが空でない場合（ステップＳ６０３でＮＯ）、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックの先頭の発話を次の発話候補として表示する（ステップＳ６０４）。図１２は対話が開始された時点の対話支援装置１００での表示状態を示す図である。

対話参加者１は用例のリスト１１０１、対話参加者２は用例のリスト１１０２を利用して図３および図４で定義されるすべての発話の中から任意の発話を選択して他の対話参加者に伝えることが可能である。発話処理部１０２ａで変換された発話は対話参加者２への発話出力部１１０３へ、発話処理部１０２ｂで変換された発話は対話参加者１への発話出力部１１０４へ、それぞれ出力され、例えばＰＤＡに内蔵される音声合成処理を利用して表示と同時に読上げられる。予測表示領域１１０５には発話予測部１０５ａによって予測された対話参加者１の発話、すなわち予測候補が表示される。予測表示領域１１０６には発話予測部１０５ｂによって予測された対話参加者２の発話、すなわち予測候補が表示される。対話参加者１または対話参加者２は、それぞれ予測表示領域１１０５または予測表示領域１１０６に表示される予測候補の発話を選択することで、用例のリスト１１０１または用例のリスト１１０２の中から所望の発話を検索して選択入力する操作を省略することが可能である。すなわち、相手への発話を迅速に入力することが可能である。

図１２において発話予測部１０５ａおよび発話予測部１０５ｂは、すでに次の発話候補として表示（ステップＳ６０４）を完了している（ステップＳ６０５）。すなわち、発話予測部１０５ａは予測スタックＪ：Ｅ１，Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８の先頭の発話がＥの立場の発話であり、Ｊの立場とは異なるので、予測表示領域１１０５には予測候補を表示していない。また、発話予測部１０５ｂは予測スタックＥ：Ｅ１，（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）の先頭の発話がＥの立場の発話であり、同立場なので対話参加者２に対する予測候補としてＥ１：″ＭａｙＩｈｅｌｐｙｏｕ？″を予測表示領域１１０６に表示している。対話参加者２は用例のリスト１１０２から発話を選択してもよいが、予測表示領域１１０６にすでに自分が発話したい内容が表示されているので、図１３に示すように予測候補を選択する。Ｅ１は発話処理部１０２ｂで日本語に変換されて、対話参加者１に対して発話「いらっしゃいませ。」が伝えられる。

このとき、発話予測部１０５ａおよび発話予測部１０５ｂは、対話参加者から発話が入力されたか否かを判定している（ステップＳ６０５）。対話参加者から発話が入力される（ステップＳ６０５でＹＥＳ）と、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタック上で一致する発話を先頭から検索（ステップＳ６０６）し、一致する発話があるか否かを判定する（ステップＳ６０７）。一致する発話がある場合（ステップＳ６０７でＹＥＳ）、一致する発話が予測スタックの先頭であるか否かを判定する（ステップＳ６０８）。先頭である場合（ステップＳ６０８でＹＥＳ）、予測スタックの先頭の発話を削除して予測スタックを更新する（ステップＳ６０９）。そして、発話の削除に伴って結合可能な発話ブロックが出現した場合には、予測スタックの中で結合可能な発話ブロックを結合する（ステップＳ６１１）。一方、先頭でない場合（ステップＳ６０８でＮＯ）、一致する発話を含むブロックを予測スタックの先頭に移動後、先頭からその発話までを削除して予測スタックを更新する（ステップＳ６１０）。そして、予測スタックが空であるか否かの判定処理（ステップＳ６０３）に戻る。

上記の例では、対話参加者の発話がＥ１であることから、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックの先頭であるＥ１を削除し、予測スタックをＪ：Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）と更新する。なお、予測スタックＪ：Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）については、結合可能な発話ブロックが存在しないので、予測スタックは変化しない。そして、予測スタックはまだ空ではないので、発話予測部１０５ａは予測スタックＪ：Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８の先頭の発話Ｊ２を予測候補とする。すなわち、図１４に示すように予測表示領域１１０５にＪ２：「チェックインをお願いします。」を表示する。また、発話予測部１０５ｂは予測スタックＥ：（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）の先頭の発話Ｅ３を予測候補として、予測表示領域１１０６にＥ３：″Ｈａｖｅｙｏｕｍａｄｅｒｅｓｅｒｖａｔｉｏｎ？″を表示する。発話予測部１０５ａおよび発話予測部１０５ｂは、対話参加者からの発話を待つ。

対話参加者１または対話参加者２は、それぞれ用例のリスト１１０１または用例のリスト１１０２から発話を選択してもよいが、予測表示領域１１０５または予測表示領域１１０６にすでに自分が発話したい内容が表示されているので予測候補から選択するのが得策である。ここで図１５に示すように対話参加者２が対話参加者１よりの早く予測表示領域１１０６を選択すると、Ｅ３は発話処理部１０２ｂで日本語に変換されて、対話参加者１に対して発話「予約はされていますか？」が伝えられる。発話予測部１０５ａは、対話参加者からの発話Ｅ３が予測スタックＪ：Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８の先頭の発話ブロックの中に存在しないので、Ｊ：（Ｅ３，Ｊ４），Ｊ２，（Ｅ５，Ｊ６，Ｅ７），Ｅ８として（ステップＳ６１０）、Ｊ：Ｊ４，Ｊ２，（Ｅ５，Ｊ６，Ｅ７），Ｅ８と更新する（ステップＳ６０９）。一方、発話予測部１０５ｂは、対話参加者からの発話Ｅ３が予測スタックＥ：（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）の先頭の発話ブロックの中に存在するので、Ｅ：Ｊ４，Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）と更新する。このとき、予測スタックの中に共通して含まれる連続する発話Ｊ４，Ｊ２が存在する（ステップＳ６１１）。そこで、発話予測部１０５ｂは、Ｊ４，Ｊ２を１つの発話ブロックに結合することで、予測スタックをＪ：（Ｊ４，Ｊ２），（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：（Ｊ４，Ｊ２），Ｅ８，（Ｅ５，Ｊ６，Ｅ７）と更新する。

発話予測部１０５ａは、同様に、予測スタックはＪ：（Ｊ４，Ｊ２），（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：（Ｊ４，Ｊ２），Ｅ８，（Ｅ５，Ｊ６，Ｅ７）となっているので、図１６に示すように予測表示領域１１０５に予測候補Ｊ４：「はい。」を表示する。発話予測部１０５ｂは、予測表示領域１１０６には対話参加者の立場が異なるので予測候補を表示しない。

対話参加者１は用例のリスト１１０１から発話を選択してもよいが、予測表示領域１１０５にすでに自分が発話したい内容が表示されているので、図１７に示すように予測表示領域１１０５を選択すると、Ｊ４は発話処理部１０２ａで英語に変換されて、対話参加者２に対して発話″Ｙｅｓ．″が伝えられる。同様に、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックをＪ：Ｊ２，（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）と更新し、図１８に示すように予測表示領域１１０５にＪ２：「チェックインをお願いします。」を表示し、予測表示領域１１０６には何も表示しない。このように対話参加者１または対話参加者２は、用例のリスト１１０１または用例のリスト１１０２の中から所望の発話を検索する必要がなく、速やかに相手に意図を伝えることで、対話の所要時間が削減される。

次に、本発明の効果について客観的に説明する。図１９は本実施の形態の対話支援装置１００によって支援される対話を形式的に表現した図である。対話は矢印の方向に沿って進行する。実線の矩形は予測スタックの状態であり、矢印に付属する点線の矩形は対話参加者に提示された予測候補と、対話参加者が実際に入力した発話の対の時系列である。例えば、点線の矩形１８０１は、予測候補として予測表示領域１１０５に何も表示されず、予測表示領域１１０６にＥ３：″Ｈａｖｅｙｏｕｍａｄｅｒｅｓｅｒｖａｔｉｏｎ？″が表示されて、対話参加者２がＥ３を入力し、その後、予測表示領域１１０５にＪ４：「はい。」が表示され、予測表示領域１１０６には何も表示されず、対話参加者１がＪ４を入力したことを示す。図１９はまた、対話参加者が入力する発話に応じて予測候補が変化することも示している。特に、矢印の分岐は予測候補に対して対話参加者が入力した発話が複数であったことを示している。例えば、分岐１８０２は、予測候補として予測表示領域１１０５にＪ２：「チェックインをお願いします。」、予測表示領域１１０６にＥ３：″Ｈａｖｅｙｏｕｍａｄｅｒｅｓｅｒｖａｔｉｏｎ？″が表示されているときに、対話参加者１がＪ２を対話参加者２よりも先に入力した場合と、対話参加者２がＥ３を対話参加者１よりも先に入力した場合を示す、対話の分岐点である。以下では、そのような複数の対話の進行パターンにおいて、太い矢印に沿って進行する対話を例として取り上げる。この例では、図２０に示す対話ｄ’が対話参加者の間で交わされたことになり、対話ｄ’は図５に示す対話履歴データベースの中には存在しないので、新しく生成された対話履歴である。

ここで対話履歴の類似度を定義する。ｒ（ｄａ｜ｄｂ）は対話履歴ｄｂに対する対話履歴ｄａの類似度であり、図２１（ａ）の数式２００１によって定義される。ただし、対話履歴ｄａと対話履歴ｄｂについては、図９で定義されている予測スタックの作成手順と同様の処理で発話ブロックを決定しておく。ｓｉｚｅ（ｄ）は対話履歴に含まれる発話ブロックの数であり、ｓｉｚｅ（ｂ）は発話ブロックｂに含まれる発話の数である。例えば、図２１（ｂ）の類似度計算の例２００２においては、対話履歴ｄａは４つの発話ブロックから構成されるので、ｓｉｚｅ（ｄａ）＝４である。また、各発話ブロックに含まれる発話の数は、それぞれ、ｓｉｚｅ（ｂ１）＝５，ｓｉｚｅ（ｂ２）＝２，ｓｉｚｅ（ｂ３）＝４，ｓｉｚｅ（ｂ４）＝１であるから、ｒ（ｄａ｜ｄｂ）はおよそ０．４２４と計算される。定性的には、ｒの値が大きいほど２つの対話履歴の類似度は高い。また、類似度は発話の集合の数に反比例し、共通する発話ブロックの数が少ないほど高い。また、類似度は各集合に含まれる発話数の平均に比例し、１つの発話ブロックに含まれる発話数が多いほど高い。したがって、対話参加者の対話履歴の類似度が高いほど、２人の間で交わされる対話の進行パターンが類似しているので、スムーズな対話が行われることになる。

図２２に示すように、対話ｄ’を開始する前の対話参加者の対話履歴ｄ１と対話履歴ｄ３の類似度は０．１６である。しかし、本発明の支援によって交わされた対話ｄ’に対する類似度はそれぞれ対話履歴ｄ１とは０．２９、対話履歴ｄ３とは０．５７である。したがって、一方の対話参加者の対話履歴に他方の対話参加者を従わせて対話をするよりも、よりスムーズな対話がなされたことは明らかである。

以下、対話参加者が予測候補を一部選択せずに対話を続行した場合にも、本発明の効果があることを示す。図２３は本実施の形態の対話支援装置１００によって支援される対話を形式的に表現した図である。図の解釈は図１９と同様であるが、点線の矩形２２０１は予測表示領域１１０５の予測候補Ｊ２が表示され、予測表示領域１１０６には何も表示されていないにもかかわらず、対話参加者２は発話Ｅ５を用例のリスト１１０２から入力したことを示している。太い矢印に沿って進行した対話は図２４に示す対話ｄ’’であり、ｄ’’は図５に示す対話履歴データベースの中には存在しないので、新しく生成された対話履歴である。

図２４に示すように対話ｄ’’を開始する前の対話履歴ｄ１とｄ３の類似度は０．１６であるが、交わされた対話に対する類似度はそれぞれ対話履歴ｄ１とは０．３３、対話履歴ｄ３とは０．５２である。したがって、対話参加者が一部の予測候補に従わなかったにもかかわらず、一方の対話参加者の対話履歴に他方の対話参加者を従わせて対話をするよりも、スムーズな対話がなされたことは明らかである。このように本発明では、対話参加者が予測候補を一部無視する場合でも、その時点からの対話の展開を可能な限り予測することで、対話参加者に対話の自由度を与えつつ、柔軟な対話支援をすることが可能である。

ここまでは、日本語を話す対話参加者１が対話支援装置１００ａを使用し、英語を話す対話参加者２が対話支援装置１００ｂを使用すると仮定した場合について説明したが、以下では、中国語を話す対話参加者１は対話支援装置１００ａを使用し、英語を話す対話参加者２は対話支援装置１００ｂを使用すると仮定した場合について説明する。図２５は対話支援装置１００ａにおける入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。

発話受付部１０１ａは、受け付けた対話参加者１の発話を相当する発話情報に変換する。発話情報は、例えば図２５における発話Ｎｏ．である。発話処理部１０２ａは、対話参加者１の発話（中国語）を対話参加者２への発話（英語）に変換して文字列を出力する。例えば、発話Ｎｏ．１が入力されたときは、発話出力部１０３ａに対して発話情報として文字列″ＭａｙＩｈｅｌｐｙｏｕ？″を出力する。

対話支援装置１００ａと全く対称的に、対話支援装置１００ｂの発話処理部１０２ｂは対話参加者２の発話を相当する発話情報に変換する。図２６は対話支援装置１００ｂにおける入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図２５と図２６とでは発話Ｎｏ．は完全に同じであり、その処理方向が異なる。発話情報は、例えば図２６の発話Ｎｏ．であり、発話受付部１０１ｂは対話参加者２の発話（英語）を対話参加者１への発話（中国語）に変換して文字列を出力する。例えば、発話Ｎｏ．１が入力されたときは、発話出力部１０３ｂに対して発話情報として文字列

を出力する。以後、言語方向を考慮しながら説明を簡単にするために、対話参加者１からの発話Ｎｏ．１をＣ１、対話参加者２からの発話Ｎｏ．１をＥ１のように略記する。

発話受付部１０１ａは、図２５の中国語のリストの部分を対話参加者１に直接選択させて、その発話Ｎｏ．を発話情報として出力する。また、発話受付部１０１ｂは図２６の英語のリストの部分を対話参加者２に直接選択させてその発話Ｎｏ．を発話情報として出力する。なお、発話受付部１０１ａまたは発話受付部１０１ｂの構成については、音声認識処理を利用して対話参加者の音声を発話Ｎｏ．のいずれかに射影する処理で実現してもよい。また、キーボードから発話の表記や発音に相当する文字列を入力させて、それを発話Ｎｏ．のいずれかに射影して実現しても良い。

図２７（ａ）、（ｂ）は対話履歴データベース１０４ａおよび対話履歴データベース１０４ｂに格納される対話履歴の一例を示す図である。対話履歴とは対話参加者によって過去に交わされた発話の履歴であり、各対話参加者の発話時刻の順に並べたものである。各発話は図２５または図２６で定義される発話のいずれかに相当する。なお、同じ発話Ｎｏ．でも対話参加者の立場によって区別する必要があるので、中国語についてはＣを、英語についてはＥをそれぞれ発話Ｎｏ．の前に付与して、対話履歴における発話のラベルとして定義する。以後、説明を簡単にするために、１つの対話履歴をそのラベルの列で記述する。例えば、対話履歴ｄ５はｄ５：Ｅ１，Ｃ２，Ｅ３，Ｃ４，Ｅ５，Ｃ６，Ｅ７，Ｅ８と記述する。対話履歴にはその対話を交わした対話参加者の情報と対話のトピックが記録されている。例えば対話履歴ｄ５は、対話参加者１がＣの立場で対話をしたという情報と、その対話のトピックがチェックインであったという情報が記されている。

以下、図６に示すように対話参加者１が中国語を話す観光客で、対話参加者２が英語を話すホテルのフロントのスタッフであり、ホテルのチェックインを行うために対話を行う場合を例として説明する。なお、発話予測部１０５ａおよび発話予測部１０５ｂの動作の流れは上記と同様であるので、図７に示すフローチャートを用いて説明し、上記と同様の部分については説明を省略する。

発話予測部１０５ａおよび発話予測部１０５ｂは、まず発話予測を行うために必要な対話履歴を対話履歴データベース１０４ａまたは対話履歴データベース１０４ｂから検索するために、対話のトピックの特定を行う（ステップＳ６０１）。発話予測部１０５ａは対話履歴データベース１０４ａに対して、発話予測部１０５ｂは対話履歴データベース１０４ｂに対して検索を行う。例えばＰＤＡとして実現された図２８に示すような対話支援装置１００ａを対話参加者１が使用し、対話支援装置１００ｂを対話参加者２が使用する。対話のトピックはそれぞれトピック入力領域７０３およびトピック入力領域７０４を用いて、各対話参加者にタッチパネルから直接入力させることでトピックの情報を取得する。

各対話参加者によって対話開始ボタン７０５および対話開始ボタン７０６が押されると、発話予測部１０５ａは対話参加者１に対して対話履歴ｄ５を、発話予測部１０５ｂは対話参加者２に対して対話履歴ｄ７を選択する。理由は、対話履歴ｄ５と対話履歴ｄ７の対話のトピックがホテルであるからである。対話履歴ｄ６および対話履歴ｄ８は対話のトピックが異なるために選択されない。そして、発話予測部１０５ａは対話履歴ｄ５を第１発話予測情報として発話予測部１０５ｂへ、発話予測部１０５ｂは対話履歴ｄ７を第２発話予測情報として発話予測部１０５ａへ通知する。

次に、発話予測部１０５ａと発話予測部１０５ｂは、対話履歴ｄ５：Ｅ１，Ｃ２，Ｅ３，Ｃ４，Ｅ５，Ｃ６，Ｅ７，Ｅ８と対話履歴ｄ７：Ｅ１，Ｅ３，Ｃ４，Ｃ２，Ｅ８，Ｅ５，Ｃ６，Ｅ７を用いて、上記同様に予測スタックを作成する（ステップＳ６０２）。そして、例えば、発話予測部１０５ａは、予測スタックＣ：Ｅ１，Ｃ２，（Ｅ３，Ｃ４），（Ｅ５，Ｃ６，Ｅ７），Ｅ８を、発話予測部１０５ｂは、予測スタックＥ：Ｅ１，（Ｅ３，Ｃ４），Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）をそれぞれ作成する。

一方、予測スタックが空でない場合（ステップＳ６０３でＮＯ）、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックの先頭の発話を次の発話候補として表示する（ステップＳ６０４）。図２９は対話が開始された時点の対話支援装置１００での表示状態を示す図である。

対話参加者１は用例のリスト１１０１、対話参加者２は用例のリスト１１０２を利用して図２５および図２６で定義されるすべての発話の中から任意の発話を選択して他の対話参加者に伝えることが可能である。発話処理部１０２ａで変換された発話は対話参加者２への発話出力部１１０３へ、発話処理部１０２ｂで変換された発話は対話参加者１への発話出力部１１０４へ、それぞれ出力され、例えばＰＤＡに内蔵される音声合成処理を利用して表示と同時に読上げられる。予測表示領域１１０５には発話予測部１０５ａによって予測された対話参加者１の発話、すなわち予測候補が表示される。予測表示領域１１０６には発話予測部１０５ｂによって予測された対話参加者２の発話、すなわち予測候補が表示される。対話参加者１または対話参加者２は、それぞれ予測表示領域１１０５または予測表示領域１１０６に表示される予測候補の発話を選択することで、用例のリスト１１０１または用例のリスト１１０２の中から所望の発話を検索して選択入力する操作を省略することが可能である。すなわち、相手への発話を迅速に入力することが可能である。

図２９において発話予測部１０５ａおよび発話予測部１０５ｂは、すでに次の発話候補として表示（ステップＳ６０４）を完了している（ステップＳ６０５）。すなわち、発話予測部１０５ａは予測スタックＣ：Ｅ１，Ｃ２，（Ｅ３，Ｃ４），（Ｅ５，Ｃ６，Ｅ７），Ｅ８の先頭の発話がＥの立場の発話であり、Ｃの立場とは異なるので、予測表示領域１１０５には予測候補を表示していない。また、発話予測部１０５ｂは予測スタックＥ：Ｅ１，（Ｅ３，Ｃ４），Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）の先頭の発話がＥの立場の発話であり、同立場なので対話参加者２に対する予測候補としてＥ１：″ＭａｙＩｈｅｌｐｙｏｕ？″を予測表示領域１１０６に表示している。対話参加者２は用例のリスト１１０２から発話を選択してもよいが、予測表示領域１１０６にすでに自分が発話したい内容が表示されているので、図３０に示すように予測候補を選択する。Ｅ１は発話処理部１０２ｂで中国語に変換されて、対話参加者１に対して発話「いらっしゃいませ。」が伝えられる。

上記の例では、対話参加者の発話がＥ１であることから、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックの先頭であるＥ１を削除し、予測スタックをＣ：Ｃ２，（Ｅ３，Ｃ４），（Ｅ５，Ｃ６，Ｅ７），Ｅ８およびＥ：（Ｅ３，Ｃ４），Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）と更新する。なお、予測スタックＣ：Ｃ２，（Ｅ３，Ｃ４），（Ｅ５，Ｃ６，Ｅ７），Ｅ８およびＥ：（Ｅ３，Ｃ４），Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）については、結合可能な発話ブロックが存在しないので、予測スタックは変化しない。そして、予測スタックはまだ空ではないので、発話予測部１０５ａは予測スタックＣ：Ｃ２，（Ｅ３，Ｃ４），（Ｅ５，Ｃ６，Ｅ７），Ｅ８の先頭の発話Ｃ２を予測候補とする。すなわち、図３１に示すように予測表示領域１１０５にＣ２：

を表示する。また、発話予測部１０５ｂは予測スタックＥ：（Ｅ３，Ｃ４），Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）の先頭の発話Ｅ３を予測候補として、予測表示領域１１０６にＥ３：″Ｈａｖｅｙｏｕｍａｄｅｒｅｓｅｒｖａｔｉｏｎ？″を表示する。発話予測部１０５ａおよび発話予測部１０５ｂは、対話参加者からの発話を待つ。

対話参加者１または対話参加者２は、それぞれ用例のリスト１１０１または用例のリスト１１０２から発話を選択してもよいが、予測表示領域１１０５または予測表示領域１１０６にすでに自分が発話したい内容が表示されているので予測候補から選択するのが得策である。ここで図３２に示すように対話参加者２が対話参加者１よりの早く予測表示領域１１０６を選択すると、Ｅ３は発話処理部１０２ｂで中国語に変換されて、対話参加者１に対して発話

が伝えられる。発話予測部１０５ａは、対話参加者からの発話Ｅ３が予測スタックＣ：Ｃ２，（Ｅ３，Ｃ４），（Ｅ５，Ｃ６，Ｅ７），Ｅ８の先頭の発話ブロックの中に存在しないので、Ｃ：（Ｅ３，Ｃ４），Ｃ２，（Ｅ５，Ｃ６，Ｅ７），Ｅ８として（ステップＳ６１０）、Ｃ：Ｃ４，Ｃ２，（Ｅ５，Ｃ６，Ｅ７），Ｅ８と更新する（ステップＳ６０９）。一方、発話予測部１０５ｂは、対話参加者からの発話Ｅ３が予測スタックＥ：（Ｅ３，Ｃ４），Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）の先頭の発話ブロックの中に存在するので、Ｅ：Ｃ４，Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）と更新する。このとき、予測スタックの中に共通して含まれる連続する発話Ｃ４，Ｃ２が存在する（ステップＳ６１１）。そこで、発話予測部１０５ｂは、Ｃ４，Ｃ２を１つの発話ブロックに結合することで、予測スタックをＣ：（Ｃ４，Ｃ２），（Ｅ５，Ｃ６，Ｅ７），Ｅ８およびＥ：（Ｃ４，Ｃ２），Ｅ８，（Ｅ５，Ｃ６，Ｅ７）と更新する。

発話予測部１０５ａは、同様に、予測スタックはＣ：（Ｃ４，Ｃ２），（Ｅ５，Ｃ６，Ｅ７），Ｅ８およびＥ：（Ｃ４，Ｃ２），Ｅ８，（Ｅ５，Ｃ６，Ｅ７）となっているので、図３３に示すように予測表示領域１１０５に予測候補Ｃ４：「是。」を表示する。発話予測部１０５ｂは、予測表示領域１１０６には対話参加者の立場が異なるので予測候補を表示しない。

対話参加者１は用例のリスト１１０１から発話を選択してもよいが、予測表示領域１１０５にすでに自分が発話したい内容が表示されているので、図３４に示すように予測表示領域１１０５を選択すると、Ｃ４は発話処理部１０２ａで英語に変換されて、対話参加者２に対して発話″Ｙｅｓ．″が伝えられる。同様に、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックをＣ：Ｃ２，（Ｅ５，Ｃ６，Ｅ７），Ｅ８およびＥ：Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）と更新し、図３５に示すように予測表示領域１１０５にＣ２：

を表示し、予測表示領域１１０６には何も表示しない。このように対話参加者１または対話参加者２は、用例のリスト１１０１または用例のリスト１１０２の中から所望の発話を検索する必要がなく、速やかに相手に意図を伝えることで、対話の所要時間が削減される。

次に、上記の日本語と英語の場合と同様に中国語と英語の場合の効果について客観的に説明する。図３６は本実施の形態の対話支援装置１００によって支援される対話（中国語と英語の場合）を形式的に表現した図である。図の解釈は図１９と同様であり、例えば点線の矩形３６０１は、予測候補として予測表示領域１１０５に何も表示されず、予測表示領域１１０６にＥ３：″Ｈａｖｅｙｏｕｍａｄｅｒｅｓｅｒｖａｔｉｏｎ？″が表示されて、対話参加者２がＥ３を入力し、その後、予測表示領域１１０５にＣ４：「是。」が表示され、予測表示領域１１０６には何も表示されず、対話参加者１がＣ４を入力したことを示す。図３６はまた、対話参加者が入力する発話に応じて予測候補が変化することも示している。特に、矢印の分岐は予測候補に対して対話参加者が入力した発話が複数であったことを示している。例えば、分岐３６０２は、予測候補として予測表示領域１１０５にＣ２：

、予測表示領域１１０６にＥ３：″Ｈａｖｅｙｏｕｍａｄｅｒｅｓｅｒｖａｔｉｏｎ？″が表示されているときに、対話参加者１がＣ２を対話参加者２よりも先に入力した場合と、対話参加者２がＥ３を対話参加者１よりも先に入力した場合を示す、対話の分岐点である。以下では、そのような複数の対話の進行パターンにおいて、太い矢印に沿って進行する対話を例として取り上げる。この例では、図３７に示す対話ｆが対話参加者の間で交わされたことになり、対話ｆは図３２に示す対話履歴データベースの中には存在しないので、新しく生成された対話履歴である。

図３８に示すように、対話ｆを開始する前の対話参加者の対話履歴ｄ５と対話履歴ｄ７の類似度は０．１６である。しかし、本発明の支援によって交わされた対話ｆに対する類似度はそれぞれ対話履歴ｄ５とは０．２９、対話履歴ｄ７とは０．５７である。したがって、一方の対話参加者の対話履歴に他方の対話参加者を従わせて対話をするよりも、よりスムーズな対話がなされたことは明らかである。

次に、対話参加者が予測候補を一部選択せずに対話を続行した場合にも、本発明の効果があることを示す。図３９は本実施の形態の対話支援装置１００によって支援される対話（中国語と英語の場合）を形式的に表現した図である。図の解釈は図１９と同様であるが、点線の矩形３９０１は予測表示領域１１０５の予測候補Ｃ２が表示され、予測表示領域１１０６には何も表示されていないにもかかわらず、対話参加者２は発話Ｅ５を用例のリスト１１０２から入力したことを示している。太い矢印に沿って進行した対話は図４０（ａ）に示す対話ｆ’であり、ｆ’は図３２に示す対話履歴データベースの中には存在しないので、新しく生成された対話履歴である。

図４０（ｂ）に示すように対話ｆ’を開始する前の対話履歴ｄ５とｄ７の類似度は０．１６であるが、交わされた対話に対する類似度はそれぞれ対話履歴ｄ５とは０．３３、対話履歴ｄ７とは０．５２である。したがって、対話参加者が一部の予測候補に従わなかったにもかかわらず、一方の対話参加者の対話履歴に他方の対話参加者を従わせて対話をするよりも、スムーズな対話がなされたことは明らかである。このように本発明では、対話参加者が予測候補を一部無視する場合でも、その時点からの対話の展開を可能な限り予測することで、対話参加者に対話の自由度を与えつつ、柔軟な対話支援をすることが可能である。

なお、図１に示す構成に加えて履歴登録部を備え、発話処理部で対話参加者の間で交わされる発話情報をすべて記録し、対話終了時に発話処理部から対話履歴データベースに蓄積するように構成することも可能である。これによって、今後の発話予測に有効な対話履歴を自動的に増やすことが可能になる。例えば対話ｄ’や対話ｄ’’を対話履歴データベース１０４ａおよび対話履歴データベース１０４ｂに蓄積する。特に、発話予測部の予測に従わずに対話がなされた場合は、対話履歴データベースに存在しない対話である場合が多く、それを蓄積することで次回の発話予測をより精度良く行うことが可能になる。

また、図４１および図４２に示すように対話参加者が１台の対話支援装置を共有するように構成することも可能である。対話履歴データベースをメモリカード２４０１、メモリカード２４０２で装置に挿入して利用してもよい。図４３はこの場合の対話支援装置の一実施の形態の構成を示すブロック図である。対話履歴データベースは図４１および図４２のようにメモリカードで構成してもよいし、あるいは、通信回線でアクセス可能なネットワーク上のデータベースで構成してもよい。図４３のような構成にすることで、対話支援装置のハードウェアを公共の装置として利用することが可能になる。

また、図２に示す構成の発話受付部１０１ａと発話受付部１０１ｂに替えて、図４４に示すように音声認識部４０１ａおよび音声認識部４０２ｂを備える構成とすることもできる。この場合、音声認識部４０１ａおよび音声認識部４０２ｂの認識対象語彙の中で、発話予測部１０５ａおよび発話予測部１０５ｂによって予測される発話に関連する語彙については優先的に扱うことで、音声認識の精度を向上させることが可能になる。関連する語彙としては、発話予測部１０５ａおよび発話予測部１０５ｂが出力する予測発話そのものであってもよいし、または、その予測発話に近い文であってもよいし、または、予測発話に含まれる単語であってもよいし、または、予測発話から連想される単語であってもよい。

なお、図４５に示すように発話出力部５０２ａと発話出力部５０２ｂを、相手の対話支援装置の発話出力部を利用するように実装し、相手の対話支援装置から発話処理された文字と音声を出力するようしてもよい。この場合、対話参加者は相手の発話を自分の手元の対話支援装置で見聞きすることができるので、聞き違いなどが低減されて対話がよりスムーズに進行することが可能になる。

また、図１２または図３５に示すボタン１１０７およびボタン１１０８は、対話参加者１および対話参加者２がそれぞれ対話の予測展開を見るためのボタンである。具体的にはこれらのボタンが押されたときに、発話予測部１０５ａおよび発話予測部１０５ｂは、これまでに交わされた発話と現時点の予測スタックの内容をすべて表示する。ただし、各発話はそれぞれの対話参加者の言語に変換して表示する。また、対話の予測展開としては、相手の予測スタックの内容を提示する。図４６は対話の予測展開の一例（日本語と英語の場合）を示す図である。これまでに交わされた発話がＥ１，Ｅ３，Ｊ４であり、現時点の予測スタックが、Ｊ：Ｊ２，（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）である。対話参加者１に対しては表示領域２８０１にこれまで交わされた対話としてＥ１，Ｅ３，Ｊ４と、今後の予測展開として表示領域２８０２にＪ２，Ｅ８，Ｅ５，Ｊ６，Ｅ７を表示する。また、対話参加者２に対しては表示領域２８０３にこれまでに交わされた対話としてＥ１，Ｅ３，Ｊ４を、表示領域２８０４に今後の予測展開としてＪ２，Ｅ５，Ｅ６，Ｅ７，Ｅ８を表示する。

また、図４７は対話の予測展開の一例（中国語と英語の場合）を示す図である。これまでに交わされた発話がＥ１，Ｅ３，Ｃ４であり、現時点の予測スタックが、Ｃ：Ｃ２，（Ｅ５，Ｃ６，Ｅ７），Ｅ８およびＥ：Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）である。対話参加者１に対しては表示領域２８０１にこれまで交わされた対話としてＥ１，Ｅ３，Ｃ４と、今後の予測展開として表示領域２８０２にＣ２，Ｅ８，Ｅ５，Ｃ６，Ｅ７を表示する。また、対話参加者２に対しては表示領域２８０３にこれまでに交わされた対話としてＥ１，Ｅ３，Ｃ４を、表示領域２８０４に今後の予測展開としてＣ２，Ｅ５，Ｅ６，Ｅ７，Ｅ８を表示する。このような予測展開を対話参加者に提示することにより、対話参加者は相手の発話と対話の展開パターンを前もって知ることが可能になり、対話を継続する際に頭を整理することでよりスムーズな対話が可能になる。

また、本実施の形態では、一例として日本語と英語の場合と、中国語と英語の場合とを取り上げたが、仏語など他の言語についても同様に実施可能であり、本発明は言語に依存しない。

本発明にかかる対話支援装置は、対話参加者の発話を速やかに入力させる機能を有し、携帯電話や携帯端末等の翻訳アプリケーションソフトウェア等として有用である。また公共の街頭端末や案内端末等の用途にも応用できる。さらに、同言語の対話では、定型文のチャットシステムなどの用途にも応用できる。

従来、一般の人々が海外旅行先等で現地の人々と対話をする際に、その異言語対話を支援することを目的として翻訳装置が開発されてきた。例えば代表的なものとして、例文や用例の対訳に基づく翻訳方式を、ＰＤＡ(Personal Digital Assistance)などの小型の情報処理装置に実装した翻訳装置がある。そのような装置では、一般的な旅行会話をカバーするために数千以上の用例が用意されているので、ユーザに所望の用例をそのリストから目視で選択させるだけでは実際の使用状況における使い勝手、すなわち、ユーザビリティに問題がある。特に、用例のリストを見るための表示部が小さく、同時に見ることができる用例の数が少ない場合は、この問題は一層顕著になる。また、翻訳装置の一般的な使用状況を想定すると、相手との対話の中で数文以上の用例を使用しなければならない場合がほとんどであり、翻訳装置を介して１つの対話が完了するまでに予想以上の時間を要してしまう。そこで、人と人との対話支援を最終目的として、大量の用例リストの中からユーザに所望の用例を速やかに選択させるための、何らかの選択補助機能が必要とされている。

発話受付部１０１ａは、受け付けた対話参加者１の発話を相当する発話情報に変換する。発話情報は、例えば図３における発話Ｎｏ．である。発話処理部１０２ａは、対話参加者１の発話（日本語）を対話参加者２への発話（英語）に変換して文字列を出力する。例えば、発話Ｎｏ．１が入力されたときは、発話出力部１０３ａに対して発話情報として文字列"May I help you?"を出力する。

発話予測部１０５ａおよび発話予測部１０５ｂは、それぞれの対話履歴の発話数が同じ数になるように図１０に示す動的計画法で調整する（ステップＳ９０１）。例えば、図５の対話履歴ｄ１（発話数は８）と図１１の対話履歴ｘ（発話数は６）を調整する場合、図１０に示す動的計画法を対話履歴ｘに適用すると、対話履歴ｘは調整されて対話履歴ｘ'となる。調整された対話履歴ｘ'において、ラベルがφの発話はｄ１との発話数が同じ数になるように追加された空の発話である。しかし、対話履歴ｄ１：Ｅ１，Ｊ２，Ｅ３，Ｊ４，Ｅ５，Ｊ６，Ｅ７，Ｅ８と対話履歴ｄ３：Ｅ１，Ｅ３，Ｊ４，Ｊ２，Ｅ８，Ｅ５，Ｊ６，Ｅ７については発話数が同じ８であるので、動的計画法が適用されても結果は同じである。

なお、予測スタックの作成手順において、２つの発話が同じか否かの判定処理（ステップＳ９０１、Ｓ９０４、Ｓ９０６）を行っているが、発話情報の一致、すなわち、発話Ｎｏ．の一致以外にも、自然言語処理を利用して発話の表層表現（文字表現）の一致、または、内容語の一致などで判定してもよい。例えば、一方の対話履歴に発話「ありがとう。」、他方の対話履歴に発話「ありがとうございます。」の場合などは、これらの発話が異なる発話Ｎｏ．であったとしても表層表現が近いので２つの対話履歴に共通に含まれる発話と判定することが可能である。一方の対話履歴に発話"Thank you."、他方の対話履歴に発話"Thank you very much."の場合も同様である。また、一方の対話履歴に発話「これを３セット贈答用に包んで下さい。」、他方の対話履歴に発話「贈答用に３セット、これを包んで下さい。」が含まれる場合などは、内容語が（これ、包む、３セット、贈答用）と定義されていれば、共通に含まれる内容語が多いので２つの対話履歴に共通に含まれる発話と判定することが可能である。また、これらの判定方法を組み合わせて用いても構わない。このように柔軟な判定にすることで、発話Ｎｏ．の一致だけでは発話ブロックの数が増加する場合でも、発話ブロックの数を抑制することが可能になる。

ここで、図７に示すフローチャートの説明に戻る。

図１２において発話予測部１０５ａおよび発話予測部１０５ｂは、すでに次の発話候補として表示（ステップＳ６０４）を完了している（ステップＳ６０５）。すなわち、発話予測部１０５ａは予測スタックＪ：Ｅ１，Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８の先頭の発話がＥの立場の発話であり、Ｊの立場とは異なるので、予測表示領域１１０５には予測候補を表示していない。また、発話予測部１０５ｂは予測スタックＥ：Ｅ１，（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）の先頭の発話がEの立場の発話であり、同立場なので対話参加者２に対する予測候補としてＥ１："May I help you?"を予測表示領域１１０６に表示している。対話参加者２は用例のリスト１１０２から発話を選択してもよいが、予測表示領域１１０６にすでに自分が発話したい内容が表示されているので、図１３に示すように予測候補を選択する。Ｅ１は発話処理部１０２ｂで日本語に変換されて、対話参加者１に対して発話「いらっしゃいませ。」が伝えられる。

上記の例では、対話参加者の発話がＥ１であることから、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックの先頭であるＥ１を削除し、予測スタックをＪ：Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）と更新する。なお、予測スタックＪ：Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）については、結合可能な発話ブロックが存在しないので、予測スタックは変化しない。そして、予測スタックはまだ空ではないので、発話予測部１０５ａは予測スタックＪ：Ｊ２，（Ｅ３，Ｊ４），（Ｅ５，Ｊ６，Ｅ７），Ｅ８の先頭の発話Ｊ２を予測候補とする。すなわち、図１４に示すように予測表示領域１１０５にＪ２：「チェックインをお願いします。」を表示する。また、発話予測部１０５ｂは予測スタックＥ：（Ｅ３，Ｊ４），Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）の先頭の発話Ｅ３を予測候補として、予測表示領域１１０６にＥ３："Have you made reservation?"を表示する。発話予測部１０５ａおよび発話予測部１０５ｂは、対話参加者からの発話を待つ。

対話参加者1は用例のリスト１１０１から発話を選択してもよいが、予測表示領域１１０５にすでに自分が発話したい内容が表示されているので、図１７に示すように予測表示領域１１０５を選択すると、Ｊ４は発話処理部１０２ａで英語に変換されて、対話参加者２に対して発話"Yes."が伝えられる。同様に、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックをＪ：Ｊ２，（Ｅ５，Ｊ６，Ｅ７），Ｅ８およびＥ：Ｊ２，Ｅ８，（Ｅ５，Ｊ６，Ｅ７）と更新し、図１８に示すように予測表示領域１１０５にＪ２：「チェックインをお願いします。」を表示し、予測表示領域１１０６には何も表示しない。このように対話参加者１または対話参加者２は、用例のリスト１１０１または用例のリスト１１０２の中から所望の発話を検索する必要がなく、速やかに相手に意図を伝えることで、対話の所要時間が削減される。

次に、本発明の効果について客観的に説明する。図１９は本実施の形態の対話支援装置１００によって支援される対話を形式的に表現した図である。対話は矢印の方向に沿って進行する。実線の矩形は予測スタックの状態であり、矢印に付属する点線の矩形は対話参加者に提示された予測候補と、対話参加者が実際に入力した発話の対の時系列である。例えば、点線の矩形１８０１は、予測候補として予測表示領域１１０５に何も表示されず、予測表示領域１１０６にＥ３："Have you made reservation?"が表示されて、対話参加者２がＥ３を入力し、その後、予測表示領域１１０５にＪ４：「はい。」が表示され、予測表示領域１１０６には何も表示されず、対話参加者１がＪ４を入力したことを示す。図１９はまた、対話参加者が入力する発話に応じて予測候補が変化することも示している。特に、矢印の分岐は予測候補に対して対話参加者が入力した発話が複数であったことを示している。例えば、分岐１８０２は、予測候補として予測表示領域１１０５にＪ２：「チェックインをお願いします。」、予測表示領域１１０６にＥ３："Have you made reservation?"が表示されているときに、対話参加者１がＪ２を対話参加者２よりも先に入力した場合と、対話参加者２がＥ３を対話参加者１よりも先に入力した場合を示す、対話の分岐点である。以下では、そのような複数の対話の進行パターンにおいて、太い矢印に沿って進行する対話を例として取り上げる。この例では、図２０に示す対話d'が対話参加者の間で交わされたことになり、対話ｄ'は図５に示す対話履歴データベースの中には存在しないので、新しく生成された対話履歴である。

ここで対話履歴の類似度を定義する。ｒ（ｄａ｜ｄｂ）は対話履歴ｄｂに対する対話履歴ｄａの類似度であり、図２１（ａ）の数式２００１によって定義される。ただし、対話履歴ｄａと対話履歴ｄｂについては、図９で定義されている予測スタックの作成手順と同様の処理で発話ブロックを決定しておく。ｓｉｚｅ（ｄ）は対話履歴に含まれる発話ブロックの数であり、ｓｉｚｅ（ｂ）は発話ブロックｂに含まれる発話の数である。例えば、図２１（ｂ）の類似度計算の例２００２においては、対話履歴ｄａは4つの発話ブロックから構成されるので、ｓｉｚｅ（ｄａ）＝４である。また、各発話ブロックに含まれる発話の数は、それぞれ、ｓｉｚｅ（ｂ１）＝５，ｓｉｚｅ（ｂ２）＝２，ｓｉｚｅ（ｂ３）＝４，ｓｉｚｅ（ｂ４）＝１であるから、ｒ（ｄａ｜ｄｂ）はおよそ０．４２４と計算される。定性的には、ｒの値が大きいほど２つの対話履歴の類似度は高い。また、類似度は発話の集合の数に反比例し、共通する発話ブロックの数が少ないほど高い。また、類似度は各集合に含まれる発話数の平均に比例し、１つの発話ブロックに含まれる発話数が多いほど高い。したがって、対話参加者の対話履歴の類似度が高いほど、２人の間で交わされる対話の進行パターンが類似しているので、スムーズな対話が行われることになる。

図２２に示すように、対話ｄ'を開始する前の対話参加者の対話履歴ｄ１と対話履歴ｄ３の類似度は０．１６である。しかし、本発明の支援によって交わされた対話ｄ'に対する類似度はそれぞれ対話履歴ｄ１とは０．２９、対話履歴ｄ３とは０．５７である。したがって、一方の対話参加者の対話履歴に他方の対話参加者を従わせて対話をするよりも、よりスムーズな対話がなされたことは明らかである。

以下、対話参加者が予測候補を一部選択せずに対話を続行した場合にも、本発明の効果があることを示す。図２３は本実施の形態の対話支援装置１００によって支援される対話を形式的に表現した図である。図の解釈は図１９と同様であるが、点線の矩形２２０１は予測表示領域１１０５の予測候補Ｊ２が表示され、予測表示領域１１０６には何も表示されていないにもかかわらず、対話参加者２は発話Ｅ５を用例のリスト１１０２から入力したことを示している。太い矢印に沿って進行した対話は図２４に示す対話ｄ''であり、ｄ''は図５に示す対話履歴データベースの中には存在しないので、新しく生成された対話履歴である。

図２４に示すように対話ｄ''を開始する前の対話履歴ｄ１とｄ３の類似度は０．１６であるが、交わされた対話に対する類似度はそれぞれ対話履歴ｄ１とは０．３３、対話履歴ｄ３とは０．５２である。したがって、対話参加者が一部の予測候補に従わなかったにもかかわらず、一方の対話参加者の対話履歴に他方の対話参加者を従わせて対話をするよりも、スムーズな対話がなされたことは明らかである。このように本発明では、対話参加者が予測候補を一部無視する場合でも、その時点からの対話の展開を可能な限り予測することで、対話参加者に対話の自由度を与えつつ、柔軟な対話支援をすることが可能である。

発話受付部１０１ａは、受け付けた対話参加者１の発話を相当する発話情報に変換する。発話情報は、例えば図２５における発話Ｎｏ．である。発話処理部１０２ａは、対話参加者１の発話（中国語）を対話参加者２への発話（英語）に変換して文字列を出力する。例えば、発話Ｎｏ．１が入力されたときは、発話出力部１０３ａに対して発話情報として文字列"May I help you?"を出力する。

図２９において発話予測部１０５ａおよび発話予測部１０５ｂは、すでに次の発話候補として表示（ステップＳ６０４）を完了している（ステップＳ６０５）。すなわち、発話予測部１０５ａは予測スタックＣ：Ｅ１，Ｃ２，（Ｅ３，Ｃ４），（Ｅ５，Ｃ６，Ｅ７），Ｅ８の先頭の発話がＥの立場の発話であり、Ｃの立場とは異なるので、予測表示領域１１０５には予測候補を表示していない。また、発話予測部１０５ｂは予測スタックＥ：Ｅ１，（Ｅ３，Ｃ４），Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）の先頭の発話がEの立場の発話であり、同立場なので対話参加者２に対する予測候補としてＥ１："May I help you?"を予測表示領域１１０６に表示している。対話参加者２は用例のリスト１１０２から発話を選択してもよいが、予測表示領域１１０６にすでに自分が発話したい内容が表示されているので、図３０に示すように予測候補を選択する。Ｅ１は発話処理部１０２ｂで中国語に変換されて、対話参加者１に対して発話「いらっしゃいませ。」が伝えられる。

を表示する。また、発話予測部１０５ｂは予測スタックＥ：（Ｅ３，Ｃ４），Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）の先頭の発話Ｅ３を予測候補として、予測表示領域１１０６にＥ３："Have you made reservation?"を表示する。発話予測部１０５ａおよび発話予測部１０５ｂは、対話参加者からの発話を待つ。

対話参加者1は用例のリスト１１０１から発話を選択してもよいが、予測表示領域１１０５にすでに自分が発話したい内容が表示されているので、図３４に示すように予測表示領域１１０５を選択すると、Ｃ４は発話処理部１０２ａで英語に変換されて、対話参加者２に対して発話"Yes."が伝えられる。同様に、発話予測部１０５ａおよび発話予測部１０５ｂは、予測スタックをＣ：Ｃ２，（Ｅ５，Ｃ６，Ｅ７），Ｅ８およびＥ：Ｃ２，Ｅ８，（Ｅ５，Ｃ６，Ｅ７）と更新し、図３５に示すように予測表示領域１１０５にＣ２：

次に、上記の日本語と英語の場合と同様に中国語と英語の場合の効果について客観的に説明する。図３６は本実施の形態の対話支援装置１００によって支援される対話（中国語と英語の場合）を形式的に表現した図である。図の解釈は図１９と同様であり、例えば点線の矩形３６０１は、予測候補として予測表示領域１１０５に何も表示されず、予測表示領域１１０６にＥ３："Have you made reservation?"が表示されて、対話参加者２がＥ３を入力し、その後、予測表示領域１１０５にＣ４：「是。」が表示され、予測表示領域１１０６には何も表示されず、対話参加者１がＣ４を入力したことを示す。図３６はまた、対話参加者が入力する発話に応じて予測候補が変化することも示している。特に、矢印の分岐は予測候補に対して対話参加者が入力した発話が複数であったことを示している。例えば、分岐３６０２は、予測候補として予測表示領域１１０５にＣ２：

、予測表示領域１１０６にＥ３："Have you made reservation?"が表示されているときに、対話参加者１がＣ２を対話参加者２よりも先に入力した場合と、対話参加者２がＥ３を対話参加者１よりも先に入力した場合を示す、対話の分岐点である。以下では、そのような複数の対話の進行パターンにおいて、太い矢印に沿って進行する対話を例として取り上げる。この例では、図３７に示す対話ｆが対話参加者の間で交わされたことになり、対話ｆは図３２に示す対話履歴データベースの中には存在しないので、新しく生成された対話履歴である。

次に、対話参加者が予測候補を一部選択せずに対話を続行した場合にも、本発明の効果があることを示す。図３９は本実施の形態の対話支援装置１００によって支援される対話（中国語と英語の場合）を形式的に表現した図である。図の解釈は図１９と同様であるが、点線の矩形３９０１は予測表示領域１１０５の予測候補Ｃ２が表示され、予測表示領域１１０６には何も表示されていないにもかかわらず、対話参加者２は発話Ｅ５を用例のリスト１１０２から入力したことを示している。太い矢印に沿って進行した対話は図４０（ａ）に示す対話ｆ'であり、ｆ'は図３２に示す対話履歴データベースの中には存在しないので、新しく生成された対話履歴である。

図４０（ｂ）に示すように対話ｆ'を開始する前の対話履歴ｄ５とｄ７の類似度は０．１６であるが、交わされた対話に対する類似度はそれぞれ対話履歴ｄ５とは０．３３、対話履歴ｄ７とは０．５２である。したがって、対話参加者が一部の予測候補に従わなかったにもかかわらず、一方の対話参加者の対話履歴に他方の対話参加者を従わせて対話をするよりも、スムーズな対話がなされたことは明らかである。このように本発明では、対話参加者が予測候補を一部無視する場合でも、その時点からの対話の展開を可能な限り予測することで、対話参加者に対話の自由度を与えつつ、柔軟な対話支援をすることが可能である。

なお、図１に示す構成に加えて履歴登録部を備え、発話処理部で対話参加者の間で交わされる発話情報をすべて記録し、対話終了時に発話処理部から対話履歴データベースに蓄積するように構成することも可能である。これによって、今後の発話予測に有効な対話履歴を自動的に増やすことが可能になる。例えば対話ｄ'や対話ｄ''を対話履歴データベース１０４ａおよび対話履歴データベース１０４ｂに蓄積する。特に、発話予測部の予測に従わずに対話がなされた場合は、対話履歴データベースに存在しない対話である場合が多く、それを蓄積することで次回の発話予測をより精度良く行うことが可能になる。

図１は、本発明に係る対話支援装置の一実施の形態の構成を示すブロック図である。図２は、２つの対話支援装置を用いて対話を行う場合の実施の形態の構成を示すブロック図である。図３は、対話支援装置における入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図４、は対話支援装置における入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図５（ａ）、図５（ｂ）は、対話履歴データベースに格納される対話履歴の一例を示す図である。図６は、本発明に係る対話支援装置が利用される場面の一例を示す図である。図７は、発話予測部の動作の流れを示すフローチャートである。図８は、本発明に係る対話支援装置の表示例を示す図である。図９は、予測スタックの作成手順を示すフローチャートである。図１０は、対話履歴の発話数を調整する動的計画法のアルゴリズムを示す図である。図１１は、対話履歴ｘに対して動的計画法を適用した例を示す図である。図１２（ａ）、図１２（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１３（ａ）、図１３（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１４（ａ）、図１４（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１５（ａ）、図１５（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１６（ａ）、図１６（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１７（ａ）、図１７（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１８（ａ）、図１８（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図１９は、本発明によって支援される対話を形式的に表現した図である。図２０は、新しく生成された対話ｄ'を示す図である。図２１（ａ）、図２１（ｂ）は、対話履歴の類似度を定義する数式と計算の例を示す図である。図２２は、対話履歴の類似度を比較した図である。図２３は、本発明による対話を形式的に表現した図である。図２４（ａ）、図２４（ｂ）は、新しく生成された対話ｄ''と対話履歴の類似度の比較を示す図である。図２５は、対話支援装置における入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図２６は、対話支援装置における入出力の発話と発話Ｎｏ．の対応関係の一例を示す図である。図２７（ａ）、図２７（ｂ）は、対話履歴データベースに格納される対話履歴の一例を示す図である。図２８は、本発明に係る対話支援装置の表示例を示す図である。図２９（ａ）、図２９（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３０（ａ）、図３０（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３１（ａ）、図３１（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３２（ａ）、図３２（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３３（ａ）、図３３（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３４（ａ）、図３４（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３５（ａ）、図３５（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図３６は、本発明によって支援される対話を形式的に表現した図である。図３７は、新しく生成された対話ｆを示す図である。図３８は、対話履歴の類似度を比較した図である。図３９は、本発明による対話を形式的に表現した図である。図４０（ａ）、図４０（ｂ）は、新しく生成された対話ｆ'と対話履歴の類似度の比較を示す図である。図４１は、対話参加者が１台の対話支援装置を共有する様子を示す図である。図４２は、対話参加者が１台の対話支援装置を共有する様子を示す図である。図４３は、本発明に係る対話支援装置の他の実施の形態の構成を示すブロック図である。図４４は、本発明に係る対話支援装置の他の実施の形態の構成を示すブロック図である。図４５は、本発明に係る対話支援装置の他の実施の形態の構成を示すブロック図である。図４６（ａ）、図４６（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。図４７（ａ）、図４７（ｂ）は、本発明に係る対話支援装置の表示例を示す図である。

符号の説明

上記目的を達成するため、本発明に係る対話支援装置は、対話参加者によって行われる対話を支援する対話支援装置であって、前記対話参加者の過去の発話の列である対話履歴を当該対話履歴における対話のトピックに対応づけて格納している対話履歴データベースと、前記対話履歴データベースに格納されている前記対話履歴に基づいて第１発話予測情報を作成し、作成した前記第１発話予測情報を前記他の対話支援装置へ通知するとともに、他の対話支援装置から第２発話予測情報を取得し、前記第１発話予測情報および前記第２発話予測情報に基づいて、当該対話支援装置を使用する対話参加者の前記対話における次の発話を予測する発話予測手段とを備え、前記発話予測手段は、対話のトピックを示す情報を取得し、取得した情報が示す対話のトピックに対応づけられた対話履歴を前記対話履歴データベースから抽出し、抽出した前記対話履歴を前記第１発話予測情報とし、前記第１発話予測情報および前記第２発話予測情報に含まれるそれぞれの対話履歴に共通して含まれ、かつ、連続する発話の集合を１つの発話とみなすことで、前記第１発話予測情報を発話の列に再構成した予測スタックを作成し、作成した前記予測スタックの先頭の発話を前記対話参加者の次の発話として予測することを特徴とする。

Claims

対話参加者によって行われる対話を支援する対話支援装置であって、
前記対話参加者の過去の対話履歴を格納している対話履歴データベースと、
前記対話履歴データベースに格納されている前記対話履歴に基づいて第１発話予測情報を作成するとともに、他の対話支援装置から第２発話予測情報を取得し、前記第１発話予測情報および前記第２発話予測情報に基づいて、当該対話支援装置を使用する対話参加者の前記対話における次の発話を予測する発話予測手段と
を備えることを特徴とする対話支援装置。
前記発話予測手段は、作成した前記第１発話予測情報を前記他の対話支援装置へ通知する
ことを特徴とする請求項１記載の対話支援装置。
前記発話予測手段は、前記対話履歴データベースに格納されている前記対話履歴の中から前記対話における対話状況が最も近い対話履歴を抽出し、抽出した前記対話履歴を前記第１発話予測情報とする
ことを特徴とする請求項１記載の対話支援装置。
前記発話予測手段は、前記第１発話予測情報および前記第２発話予測情報に含まれるそれぞれの対話履歴に共通して含まれ、かつ、連続する発話の集合に基づいて予測スタックを作成する
ことを特徴とする請求項３記載の対話支援装置。
前記発話予測手段は、前記予測スタックの先頭の発話を、前記対話参加者の次の発話として予測する
ことを特徴とする請求項４記載の対話支援装置。
前記発話予測手段は、前記対話参加者の発話が前記予測スタックの発話の集合に出現する場合は、前記集合を前記予測スタックの先頭に移動し、かつ、前記予測スタックの先頭から前記発話までを前記予測スタックから削除する
ことを特徴とする請求項４記載の対話支援装置。
前記発話予測手段は、前記対話履歴に共通して含まれる発話である否かを、発話を特定するための発話情報の一致、表層表現の一致、および内容語の一致の少なくとも１つにより判定する
ことを特徴とする請求項４記載の対話支援装置。
前記発話予測手段は、前記第１発話予測情報および前記第２発話予測情報に含まれるそれぞれの対話履歴の発話数を、動的計画法によって発話数が同じ数になるように調整する
ことを特徴とする請求項３記載の対話支援装置。
前記対話支援装置は、さらに、
前記対話参加者の発話を受け付ける発話受付手段と、
前記発話受付手段により受け付けられた前記発話を他の発話形態に変換する発話処理手段と、
前記発話処理手段により変換された前記他の発話形態の前記発話を出力する発話出力手段と
を備えることを特徴とする請求項１記載の対話支援装置。
前記発話受付手段は、入力される音声に対して、音声認識辞書を前記発話予測手段により予測された予測発話、前記予測発話に近い文、前記予測発話に含まれる単語、および前記予測発話から連想される単語のいずれかの範囲内に絞り込みを行った上で音声認識を行い、前記音声認識結果を前記発話として受け付ける
ことを特徴とする請求項９記載の対話支援装置。
前記対話支援装置は、さらに、表示手段を備え、
前記発話予測手段は、予測した予測発話を前記表示手段に表示し、
前記発話受付手段は、前記予測発話が前記対話参加者により選択されると、前記予測発話を前記発話として受け付ける
ことを特徴とする請求項９記載の対話支援装置。
前記対話支援装置は、さらに、表示手段を備え、
前記発話予測手段は、前記第１発話予測情報および前記第２発話予測情報に基づいて前記対話における前記対話参加者の発話の展開を予測し、予測した発話展開を前記表示手段に表示する
ことを特徴とする請求項９記載の対話支援装置。
前記発話予測手段は、予測した前記発話展開を他の対話支援装置へ通知する
ことを特徴とする請求項１２記載の対話支援装置。
前記対話支援装置は、さらに、
前記対話参加者により行われた前記対話の履歴を前記対話履歴データベースへ登録する履歴登録手段
を備えることを特徴とする請求項１記載の対話支援装置。
第１対話支援装置および第２対話支援装置を用いて対話参加者によって行われる対話を支援する対話支援システムであって、
前記第１対話支援装置は、
前記対話参加者の過去の対話履歴を格納している第１対話履歴データベースと、
前記対話履歴データベースに格納されている前記対話履歴に基づいて第１発話予測情報を作成するとともに、前記第２対話支援装置から第２発話予測情報を取得し、前記第１発話予測情報および前記第２発話予測情報に基づいて、当該第１対話支援装置を使用する対話参加者の前記対話における次の発話を予測する第１発話予測手段とを備え、
前記第２対話支援装置は、
前記対話参加者の過去の対話履歴を格納している第２対話履歴データベースと、
前記第２対話履歴データベースに格納されている前記対話履歴に基づいて前記第２発話予測情報を作成するとともに、前記第１対話支援装置から前記第１発話予測情報を取得し、前記第１発話予測情報および前記第２発話予測情報に基づいて、当該第２対話支援装置を使用する対話参加者の前記対話における次の発話を予測する第２発話予測手段とを備える
ことを特徴とする対話支援システム。
対話参加者によって行われる対話を支援する対話支援方法であって、
前記対話参加者の過去の対話履歴に基づいて第１発話予測情報を作成するとともに、他の対話支援装置から第２発話予測情報を取得し、前記第１発話予測情報および前記第２発話予測情報に基づいて、当該対話支援装置を使用する対話参加者の前記対話における次の発話を予測する発話予測ステップ
を含むことを特徴とする対話支援方法。
対話参加者によって行われる対話を支援するためのプログラムであって、
前記対話参加者の過去の対話履歴に基づいて第１発話予測情報を作成するとともに、他の対話支援装置から第２発話予測情報を取得し、前記第１発話予測情報および前記第２発話予測情報に基づいて、当該対話支援装置を使用する対話参加者の前記対話における次の発話を予測する発話予測ステップをコンピュータに実行させる
ことを特徴とするプログラム。