JP4888996B2

JP4888996B2 - 会話制御装置

Info

Publication number: JP4888996B2
Application number: JP2005307867A
Authority: JP
Inventors: 声揚黄; 裕勝倉
Original assignee: Universal Entertainment Corp; PtoPA Inc
Current assignee: Universal Entertainment Corp; PtoPA Inc
Priority date: 2005-10-21
Filing date: 2005-10-21
Publication date: 2012-02-29
Anticipated expiration: 2025-10-21
Also published as: CN1975857B; CN1975857A; JP2007115143A; US20070094008A1

Description

本発明は、ユーザからの発話に応じて回答又は返答を出力する会話制御装置に関する。

近年、ユーザの発話に対して応答を返す会話制御装置が、カーナビなど様々な用途で利用されるようになってきた（例えば、特許文献１、特許文献２、特許文献３）。この様な会話制御装置は、ユーザと会話を成立させながら、ユーザの質問に答えたり、ユーザを誘導したりすることを目的としている。
特開２００４−２５８９０２号公報特開２００４−２５８９０３号公報特開２００４−２５８９０４号公報

一般に、上記のような会話制御装置は、ユーザの発話内容に応じた回答・返答などをデータベースとして用意しておき、ユーザの発話内容に従って、回答・返答などをデータベースから抽出し、出力することにより、会話を成立させようとする。しかしながら、データベース内に用意されていないユーザ発話内容には応答することが出来ない。例えば、ユーザの発話文章に未知語（データベース内に用意されていない語）が、２つ以上含まれていると、「回答不能」状態となり、「私にはわかりません」などと回答するように設計されている。

このような未知語を含むユーザ発話が連続すると、従来の会話制御装置は「私にはわかりません」を繰り返すこととなり、会話が成立しなくなり、その結果ユーザに不自然さ、不便さを感じさせてしまうという欠点があった。

本発明の目的は、「回答不能」となるようなユーザ発話が入力されたときであっても、通り一辺倒の機械的な回答を返すだけではなく、ユーザ発話状態に応じて会話の成立を維持することが可能な回答を行える会話制御装置を提供することにある。

本発明は、上記課題を解決するための手段として、以下の特徴を有している。
本発明は、ユーザ発話に応じて回答文を出力する会話制御装置として提案される。この会話制御装置は、回答文と、当該回答文の次の順番で出力することが予定される回答文である次候補回答文を指定する次候補指定情報とをそれぞれが有する複数のプランを記憶する会話データベースと、第１のユーザ発話に応じて、前記会話データベースに記憶されたプランを選択し、そのプランが有する回答文を出力するとともに、その後発話された第２のユーザ発話が、当該プランが有する次候補指定情報により指定される次候補回答文に対応する場合には、当該次候補指定情報によって指定される次候補回答文を出力する一方、前記第２のユーザ発話が前記次候補回答文と関連性がないか、若しくは関連性が不明である場合には、前記次候補回答文の出力を保留するプラン会話処理部と、前記プラン会話処理部が次候補回答文の出力を保留した場合に、前記第２のユーザ発話に関連する話題を検索し、前記第２のユーザ発話に関連する話題を発見した場合には、当該話題に関連する回答文を出力し、一方、前記第２のユーザ発話に関連する話題を発見しない場合には、当該話題に関連する回答文の出力を保留する談話空間会話制御処理部と、前記談話空間会話制御処理部が回答文の出力を保留した場合に会話の成立を維持するための回答文を出力するＣＡ会話処理部と、入力されるユーザ発話の種類を示す発話文タイプを判定するための入力種類判定部とを有し、前記ＣＡ会話処理部が判定部と回答部とを有し、前記判定部は、前記談話空間会話制御処理部からユーザ発話文を受け取るとともに、このユーザ発話文に関して判定された発話文タイプを前記入力種類判定部から受け取り、受け取ったこれらの情報に基づいてユーザ発話意図を判定し、前記回答部は、複数種類の発話意図に対応する回答文を格納する複数種類の対応文テーブルを有しており、前記判定部によって判定された発話意図に対応する回答文を格納する対応文テーブルの中から会話の成立を維持するための前記回答文を決定することを特徴とする。

かかる会話制御装置は、ユーザ発話の内容に応じて、第１にプラン会話処理部が、第２に談話空間会話制御処理部が、回答文を出力し、ユーザとの会話を成立させる。プラン会話処理部、談話空間会話制御処理部のいずれもが回答できない場合には、会話制御装置がユーザ発話に対する回答をするための適切な知識（又はデータ）を有しない状態である。かかる状態であっても、本発明にかかる会話制御装置は、ＣＡ会話処理部がユーザ発話状態に応じて会話を維持するための回答を出力する。

上記会話制御装置はさらに以下の特徴を有しても良い。すなわち、ＣＡ会話処理部は、第２のユーザ発話が、何かを説明しているのか、何かを確認しているのか、避難又は攻撃しているのかを判定し、判定結果に応じた回答文を予め用意してある回答文群（例えば、説明会話対応文テーブル、確認会話対応文テーブル、非難攻撃会話対応文テーブル、反射会話文テーブル）から選択して出力するという特徴を会話制御装置はさらに備えていても良い。

かかる会話制御装置によれば、ユーザ発話の内容に応じて、会話の成立を維持する回答文の出力を行うことが可能となる。

本発明によれば、装置内に準備した知識では「回答不能」となるようなユーザ発話が入力されたときであっても、会話の成立を維持することが可能となる。

以下に図面を参照しながら本発明の第１の実施の形態を説明する。
本発明の第１の実施の形態は、ユーザ発話に対して回答を出力し、ユーザとの会話を成立させる会話制御装置として提案される。

［Ａ．第１の実施の形態］
［１．会話制御装置の構成例］
［１．１．全体構成］
図１は、本実施の形態に係る会話制御装置１の構成例を示す機能ブロック図である。

会話制御装置１は、その筐体内部に、たとえばコンピュータ、ワークステーションなどの情報処理装置若しくは情報処理装置に相当するハードウエアを搭載している。会話制御装置１が有する情報処理装置は、演算処理装置（ＣＰＵ）、主メモリ（ＲＡＭ）、読出し専用メモリ（ＲＯＭ）、入出力装置（Ｉ／Ｏ）、ハードディスク装置等の外部記憶装置を具備している装置で構成されている。前記ＲＯＭ、もしくは外部記憶装置などに情報処理装置を会話制御装置１として機能させるためのプログラム、もしくは会話制御方法をコンピュータに実行させるためのプログラムが記憶されており、該プログラムを主メモリ上に載せ、ＣＰＵがこれを実行することにより会話制御装置１又は会話処理方法が実現される。また、上記プログラムは必ずしも当該装置内の記憶装置に記憶されていなくともよく、磁気ディスク、光ディスク、光磁気ディスク、ＣＤ（Compact Disc）、ＤＶＤ（Digital Video Disc）などのコンピュータ読み取り可能なプログラム記録媒体や、外部の装置（例えば、ＡＳＰ（アプリケーション・サービス・プロバイダ）のサーバなど）から提供され、これを主メモリに乗せる構成であっても良い。

図１に示すように、会話制御装置１は、入力部１００と、音声認識部２００と、会話制御部３００と、文解析部４００と、会話データベース５００と、出力部６００と、音声認識辞書記憶部７００とを備えている。

［１．１．１．入力部］
入力部１００は、利用者から入力された入力情報（ユーザ発話）を取得するものである。入力部１００は、取得した発話内容に対応する音声を音声信号として音声認識部２００に出力する。なお、入力部１００は必ずしも、音声を扱うものに限られる必要はなく、キーボードや、タッチパネルなどの文字入力を扱うものであってもかまわない。この場合には後述する音声認識部２００をもうける必要はない。

［１．１．２．音声認識部］
音声認識部２００は、入力部１００で取得した発話内容に基づいて、発話内容に対応する文字列を特定するものである。具体的には、入力部１００から音声信号が入力された音声認識部２００は、入力された音声信号に基づいて、この音声信号を、音声認識辞書記憶部７００に格納されている辞書および会話データベース５００と照合して、音声信号から推測される音声認識結果を出力する。なお、図１に示す構成例では、音声認識部２００は、会話制御部３００に会話データベース５００の記憶内容の取得を要求し、会話制御部３００が要求に応じて取得した会話データベース５００の記憶内容を受け取るようになっているが、音声認識部２００が直接会話データベース５００の記憶内容を取得して音声信号との比較を行う構成であってもかまわない。

［１．１．２．１．音声認識部の構成例］
図２に、音声認識部２００の構成例を示す機能ブロック図を示す。音声認識部２００は、特徴抽出部２００Ａと、バッファメモリ（ＢＭ）２００Ｂと、単語照合部２００Ｃと、バッファメモリ（ＢＭ）２００Ｄと、候補決定部２００Ｅと、単語仮説絞込部２００Ｆを有している。単語照合部２００Ｃ及び単語仮説絞込部２００Ｆは音声認識辞書記憶部７００に接続されており、候補決定部２００Ｅは会話データベース５００に接続されている。

単語照合部２００Ｃに接続された音声認識辞書記憶部７００は、音素隠れマルコフモデル（以下、隠れマルコフモデルをＨＭＭという。）を記憶している。音素ＨＭＭは、各状態を含んで表され、各状態はそれぞれ以下の情報を有する。（ａ）状態番号、（ｂ）受理可能なコンテキストクラス、（ｃ）先行状態、及び後続状態のリスト、（ｄ）出力確率密度分布のパラメータ、及び（ｅ）自己遷移確率及び後続状態への遷移確率から構成されている。なお、本実施形態において用いる音素ＨＭＭは、各分布がどの話者に由来するかを特定する必要があるため、所定の話者混合ＨＭＭを変換して生成する。ここで、出力確率密度関数は３４次元の対角共分散行列をもつ混合ガウス分布である。また、単語照合部２００Ｃに接続された音声認識辞書記憶部７００は単語辞書を記憶している。単語辞書は、音素ＨＭＭの各単語毎にシンボルで表した読みを示すシンボル列を格納する。

話者の発声音声はマイクロホンなどに入力されて音声信号に変換された後、特徴抽出部２００Ａに入力される。特徴抽出部２００Ａは、入力された音声信号をＡ／Ｄ変換した後、特徴パラメータを抽出し、これを出力する。特徴パラメータを抽出し、これを出力する方法としては様々なものが考えられるが、例えば一例としては、ＬＰＣ分析を実行し、対数パワー、１６次ケプストラム係数、Δ対数パワー及び１６次Δケプストラム係数を含む３４次元の特徴パラメータを抽出する方法などが挙げられる。抽出された特徴パラメータの時系列はバッファメモリ（ＢＭ）２００Ｂを介して単語照合部２００Ｃに入力される。

単語照合部２００Ｃは、ワン−パス・ビタビ復号化法を用いて、バッファメモリ２００Ｂを介して入力される特徴パラメータのデータに基づいて、音声認識辞書記憶部７００に記憶された音素ＨＭＭと単語辞書とを用いて単語仮説を検出し、尤度を計算して出力する。ここで、単語照合部２００Ｃは、各時刻の各ＨＭＭの状態毎に、単語内の尤度と発声開始からの尤度を計算する。尤度は、尤度の計算対象となる単語の識別番号、その単語の発声開始時刻、その単語に先行して発声されている先行単語の違い毎に個別にもつ。また、計算処理量の削減のために、音素ＨＭＭ及び単語辞書とに基づいて計算される総尤度のうちの低い尤度のグリッド仮説を削減するようにしてもよい。単語照合部２００Ｃは、検出した単語仮説とその尤度の情報を発声開始時刻からの時間情報（具体的には、例えばフレーム番号）とともにバッファメモリ２００Ｄを介して候補決定部２００Ｅ及び単語仮説絞込部２００Ｆに出力する。

候補決定部２００Ｅは、会話制御部３００を参照して、検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定し、一致するものがある場合は、その一致する単語仮説を認識結果として出力し、一方一致するものがない場合は、単語仮説絞込部２００Ｆに単語仮説の絞込を行うよう要求する。

候補決定部２００Ｅの動作例を説明する。今、単語照合部２００Ｃが複数の単語仮説「カンタク」「カタク」「カントク」およびその尤度（認識率）を出力し、所定の談話空間は「映画」に関するものでありその話題特定情報には「カントク（監督）」は含まれているが、「カンタク（干拓）」及び「カタク（仮託）」は含まれていないとする。また「カンタク」「カタク」「カントク」の尤度（認識率）は「カンタク」が最も高く「カントク」は最も低く、「カタク」は両者の中間であったとする。

上記の状況において、候補決定部２００Ｅは、検出した単語仮説と所定の談話空間内の話題特定情報とを比較して、単語仮説「カントク」が、所定の談話空間内の話題特定情報と一致するものであると判定し、単語仮説「カントク」を認識結果として出力し、会話制御部３００に渡す。このように処理することにより、現在扱われている話題「映画」に関連した「カントク（監督）」が、より上位の尤度（認識率）を有する単語仮説「カンタク」「カタク」に優先されて選択され、その結果会話の文脈に即した音声認識結果を出力することが可能となる。

一方、一致するものがない場合は、候補決定部２００Ｅからの単語仮説の絞込を行う要求に応じて単語仮説絞込部２００Ｆが認識結果を出力するよう動作する。単語仮説絞込部２００Ｆは、単語照合部２００Ｃからバッファメモリ２００Ｄを介して出力される複数個の単語仮説に基づいて、音声認識辞書記憶部７００に記憶された統計的言語モデルを参照して、終了時刻が等しく開始時刻が異なる同一の単語の単語仮説に対して、当該単語の先頭音素環境毎に、発声開始時刻から当該単語の終了時刻に至る計算された総尤度のうちの最も高い尤度を有する１つの単語仮説で代表させるように単語仮説の絞り込みを行った後、絞り込み後のすべての単語仮説の単語列のうち、最大の総尤度を有する仮説の単語列を認識結果として出力する。本実施形態においては、好ましくは、処理すべき当該単語の先頭音素環境とは、当該単語より先行する単語仮説の最終音素と、当該単語の単語仮説の最初の２つの音素とを含む３つの音素並びをいう。

単語仮説絞込部２００Ｆによる単語絞込処理の例を図３を参照しながら説明する。図３は、単語仮説絞込部２００Ｆの処理の一例を示すタイミングチャートである。

例えば（ｉ−１）番目の単語Ｗi-１の次に、音素列ａ１，ａ２，…，ａnからなるｉ番目の単語Ｗiがくるときに、単語Ｗi-１の単語仮説として６つの仮説Ｗａ，Ｗｂ，Ｗｃ，Ｗｄ，Ｗｅ，Ｗｆが存在しているとする。ここで、前者３つの単語仮説Ｗａ，Ｗｂ，Ｗｃの最終音素は／ｘ／であるとし、後者３つの単語仮説Ｗｄ，Ｗｅ，Ｗｆの最終音素は／ｙ／であるとする。終了時刻ｔeにおいて単語仮説Ｗａ，Ｗｂ，Ｗｃを前提とする３つの仮説と、単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする１の仮説が残っているものとすると、先頭音素環境が等しい前者３つ仮説のうち、総尤度が最も高い仮説一つを残し、その他を削除する。

なお、単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする仮説は先頭音素環境が他の３つの仮説と違うため、すなわち、先行する単語仮説の最終音素がｘではなくｙであるため、この単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする仮説は削除しない。すなわち、先行する単語仮説の最終音素毎に１つのみ仮説を残す。

以上の実施形態においては、当該単語の先頭音素環境とは、当該単語より先行する単語仮説の最終音素と、当該単語の単語仮説の最初の２つの音素とを含む３つの音素並びとして定義されているが、本発明はこれに限らず、先行する単語仮説の最終音素と、最終音素と連続する先行する単語仮説の少なくとも１つの音素とを含む先行単語仮説の音素列と、当該単語の単語仮説の最初の音素を含む音素列とを含む音素並びとしてもよい。
以上の実施の形態において、特徴抽出部２００Ａと、単語照合部２００Ｃと、候補決定部２００Ｅと、単語仮説絞込部２００Ｆは、例えば、マイクロコンピュータなどのコンピュータで構成され、バッファメモリ２００Ｂ，２００Ｄと、音声認識辞書記憶部７００とは、例えばハードデイスクメモリなどの記憶装置で構成される。

以上実施形態においては、単語照合部２００Ｃ、単語仮説絞込部２００Ｆとを用いて音声認識を行っているが、本発明はこれに限らず、例えば、音素ＨＭＭを参照する音素照合部と、例えばＯｎｅＰａｓｓＤＰアルゴリズムを用いて統計的言語モデルを参照して単語の音声認識を行う音声認識部とで構成してもよい。
また、本実施の形態では、音声認識部２００は会話制御装置１の一部分として説明するが、音声認識部２００、音声認識辞書記憶部７００、及び会話データベース５００より構成される、独立した音声認識装置とすることも可能である。

［１．１．２．２．音声認識部の動作例］
つぎに図４を参照しながら音声認識部２００の動作について説明する。図４は、音声認識部２００の動作例を示すフローチャートである。入力部１００より音声信号を受け取ると、音声認識部２００は入力された音声の特徴分析を行い、特徴パラメータを生成する（ステップＳ４０１）。次に、この特徴パラメータと音声認識辞書記憶部７００に記憶された音素ＨＭＭ及び言語モデルとを比較して、所定個数の単語仮説及びその尤度を取得する（ステップＳ４０２）。次に、音声認識部２００は、取得した所定個数の単語仮説と検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定する（ステップＳ４０３、Ｓ４０４）。一致するものがある場合は、音声認識部２００はその一致する単語仮説を認識結果として出力する（ステップＳ４０５）。一方、一致するものがない場合は、音声認識部２００は取得した単語仮説の尤度に従って、最大尤度を有する単語仮説を認識結果として出力する（ステップＳ４０６）。

［１．１．３．音声認識辞書記憶部］
再び、図１に戻って、会話制御装置１の構成例の説明を続ける。
音声認識辞書記憶部７００は、標準的な音声信号に対応する文字列を格納するものである。この照合をした音声認識部２００は、その音声信号に対応する単語仮説に対応する文字列を特定し、その特定した文字列を文字列信号として会話制御部３００に出力する。

［１．１．４．文解析部］
次に、図５を参照しながら文解析部４００の構成例について説明する。図５は、会話制御装置１の部分拡大ブロック図であって、会話制御部３００及び文解析部４００の具体的構成例を示すブロック図である。なお、図５においては、会話制御部３００、文解析部４００、および会話データベース５００のみ図示しており、その他の構成要素は表示を省略している。

文解析部４００は、入力部１００又は音声認識部２００で特定された文字列を解析するものである。この文解析部４００は、本実施の形態では、図５に示すように、文字列特定部４１０と、形態素抽出部４２０と、形態素データベース４３０と、入力種類判定部４４０と、発話種類データベース４５０とを有している。文字列特定部４１０は、入力部１００及び音声認識部２００で特定された一連の文字列を一文節毎に区切るものである。この一文節とは、文法の意味を崩さない程度に文字列をできるだけ細かく区切った一区切り文を意味する。具体的に、文字列特定部４１０は、一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部４１０は、その区切った各文字列を形態素抽出部４２０及び入力種類判定部４４０に出力する。尚、以下で説明する「文字列」は、一文節毎の文字列を意味するものとする。

［１．１．４．１．形態素抽出部］
形態素抽出部４２０は、文字列特定部４１０で区切られた一文節の文字列に基づいて、その一文節の文字列の中から、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するものである。ここで、形態素とは、本実施の形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、例えば、名詞、形容詞、動詞などの品詞が挙げられる。

各形態素は、図６に示すように、本実施の形態ではm１、m２、m３…、と表現することができる。図６は、文字列とこの文字列から抽出される形態素との関係を示す図である。図６に示すように、文字列特定部４１０から文字列が入力された形態素抽出部４２０は、入力された文字列と、形態素データベース４３０に予め格納されている形態素群（この形態素群は、それぞれの品詞分類に属する各形態素についてその形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として用意されている）とを照合する。その照合をした形態素抽出部４２０は、その文字列の中から、予め記憶された形態素群のいずれかと一致する各形態素（m１、m２、…）を抽出する。この抽出された各形態素を除いた要素（n１、n２、n３…）は、例えば助動詞等が挙げられる。

この形態素抽出部４２０は、抽出した各形態素を第一形態素情報として話題特定情報検索蔀３２０に出力する。なお、第一形態素情報は構造化されている必要はない。ここで「構造化」とは、文字列の中に含まれる形態素を品詞等に基づいて分類し配列することをいい、たとえば発話文である文字列を、「主語＋目的語＋述語」などの様に、所定の順番で形態素を配列してなるデータに変換することを言う。もちろん、構造化した第一形態素情報を用いたとしても、それが本実施の形態を実現をさまたげることはない。

［１．１．４．２．入力種類判定部］
入力種類判定部４４０は、文字列特定部４１０で特定された文字列に基づいて、発話内容の種類（発話種類）を判定するものである。この発話種類は、発話内容の種類を特定する情報であって、本実施の形態では、例えば図７に示す「発話文のタイプ」を意味する。図７は、「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図である。

ここで、「発話文のタイプ」は、本実施の形態では、図７に示すように、陳述文（D ; Declaration）、時間文（T ; Time）、場所文（L ; Location）、反発文（N ; Negation）などから構成される。この各タイプから構成される文は、肯定文又は質問文で構成される。「陳述文」とは、利用者の意見又は考えを示す文を意味するものである。この陳述文は本実施の形態では、図７に示すように、例えば"私は佐藤が好きです"などの文が挙げられる。「場所文」とは、場所的な概念を伴う文を意味するものである。「時間文」とは、時間的な概念を伴う文を意味するものである。「反発文」とは、陳述文を否定するときの文を意味する。「発話文のタイプ」についての例文は図７に示す通りである。

入力種類判定部４４０が「発話文のタイプ」を判定するには、入力種類判定部４４０は、本実施の形態では、図８に示すように、陳述文であることを判定するための定義表現辞書、反発文であることを判定するための反発表現辞書等を用いる。具体的に、文字列特定部４１０から文字列が入力された入力種類判定部４４０は、入力された文字列に基づいて、その文字列と発話種類データベース４５０に格納されている各辞書とを照合する。その照合をした入力種類判定部４４０は、その文字列の中から、各辞書に関係する要素を抽出する。

この入力種類判定部４４０は、抽出した要素に基づいて、「発話文のタイプ」を判定する。例えば、入力種類判定部４４０は、ある事象について陳述している要素が文字列の中に含まれる場合には、その要素が含まれている文字列を陳述文として判定する。入力種類判定部４４０は、判定した「発話文のタイプ」を回答取得部３８０に出力する。

［１．１．５．会話データベース］
次に、会話データベース５００が記憶するデータのデータ構成例について図９を参照しながら説明する。図９は、会話データベース５００が記憶するデータの構成例を示す概念図である。

会話データベース５００は、図９に示すように、話題を特定するための話題特定情報８１０を予め複数記憶している。又、それぞれの話題特定情報８１０は、他の話題特定情報８１０と関連づけられていてもよく、例えば、図９に示す例では、話題特定情報Ｃ（８１０）が特定されると、この話題特定情報Ｃ（８１０）に関連づけられている他の話題特定情報Ａ（８１０）、話題特定情報Ｂ（８１０），話題特定情報Ｄ（８１０）が定まるように記憶されている。

具体的には、話題特定情報８１０は、本実施の形態では、利用者から入力されると予想される入力内容、又は利用者への回答文に関連性のある「キーワード」を意味する。

話題特定情報８１０には、一又は複数の話題タイトル８２０が対応付けられて記憶されている。話題タイトル８２０は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成されている。各話題タイトル８２０には、利用者への回答文８３０が対応付けられて記憶されている。また、回答文８３０の種類を示す複数の回答種類は、回答文８３０に対応付けられている。

次に、ある話題特定情報８１０と他の話題特定情報８１０との関連づけについて説明する。図１０は、ある話題特定情報８１０Ａと他の話題特定情報８１０Ｂ、８１０Ｃ_１〜８１０Ｃ_４、８１０Ｄ_１〜８１０Ｄ_３…との関連付けを示す図である。なお、以下の説明において「関連づけされて記憶される」とは、ある情報Ｘを読み取るとその情報Ｘに関連づけられている情報Ｙを読み取りできることをいい、例えば、情報Ｘのデータの中に情報Ｙを読み出すための情報（例えば、情報Ｙの格納先アドレスを示すポインタ、情報Ｙの格納先物理メモリアドレス、論理アドレスなど）が格納されている状態を、「情報Ｙが情報Ｘに『関連づけされて記憶され』ている」というものとする。

図１０に示す例では、話題特定情報は他の話題特定情報との間で上位概念、下位概念、同義語、対義語（本図の例では省略）が関連づけされて記憶させることができる。本図に示す例では、話題特定情報８１０Ａ（＝「映画」）に対する上位概念の話題特定情報として話題特定情報８１０Ｂ（＝「娯楽」）が話題特定情報８１０Ａに関連づけされて記憶されており、たとえば話題特定情報（「映画」）に対して上の階層に記憶される。

また、話題特定情報８１０Ａ（＝「映画」）に対する下位概念の話題特定情報８１０Ｃ_１（＝「監督」）、話題特定情報８１０Ｃ_２（＝「主演」）、話題特定情報８１０Ｃ_３（＝「配給会社」）、話題特定情報８１０Ｃ_４（＝「上映時間」）、および話題特定情報８１０Ｄ_１（＝「七人の侍」）、話題特定情報８１０Ｄ_２（＝「乱」）、話題特定情報８１０Ｄ_３（＝「用心棒」）、…、が話題特定情報８１０Ａに関連づけされて記憶されている。

又、話題特定情報８１０Ａには、同義語９００が関連付けられている。この例では、話題特定情報８１０Ａであるキーワード「映画」の同義語として「作品」、「内容」、「シネマ」が記憶されている様子を示している。このような同意語を定めることにより、発話にはキーワード「映画」は含まれていないが「作品」、「内容」、「シネマ」が発話文等に含まれている場合に、話題特定情報８１０Ａが発話文等に含まれているものとして取り扱うことを可能とする。

本実施の形態にかかる会話制御装置１は、会話データベース５００の記憶内容を参照することにより、ある話題特定情報８１０を特定するとその話題特定情報８１０に関連づけられて記憶されている他の話題特定情報８１０及びその話題特定情報８１０の話題タイトル８２０、回答文８３０などを高速で検索・抽出することが可能となる。

次に、話題タイトル８２０（「第二形態素情報」ともいう）のデータ構成例について、図１１を参照しながら説明する。図１１は、話題タイトル８２０のデータ構成例を示す図である。

話題特定情報８１０Ｄ_１、８１０Ｄ_２、８１０Ｄ_３、…はそれぞれ複数の異なる話題タイトル８２０_１、８２０_２、…、話題タイトル８２０_３、８２０_４、…、話題タイトル８２０_５、８２０_６、…を有している。本実施の形態では、図１１に示すように、それぞれの話題タイトル８２０は、第一特定情報１００１と、第二特定情報１００２と、第三特定情報１００３によって構成される情報である。ここで、第一特定情報１００１は、本実施の形態では、話題を構成する主要な形態素を意味するものである。第一特定情報１００１の例としては、例えば文を構成する主語が挙げられる。また、第二特定情報１００２は、本実施の形態では、第一特定情報１００１と密接な関連性を有する形態素を意味するものである。この第二特定情報１００２は、例えば目的語が挙げられる。更に、第三特定情報１００３は、本実施の形態では、ある対象についての動きを示す形態素、又は名詞等を修飾する形態素を意味するものである。この第三特定情報１００３は、例えば動詞、副詞又は形容詞が挙げられる。なお、第一特定情報１００１、第二特定情報１００２、第三特定情報１００３それぞれの意味は上述の内容に限定される必要はなく、別の意味（別の品詞）を第一特定情報１００１、第二特定情報１００２、第三特定情報１００３に与えても、これらから文の内容を把握可能な限り、本実施の形態は成立する。

例えば、主語が「七人の侍」、形容詞が「面白い」である場合には、図１１に示すように、話題タイトル（第二形態素情報）８２０_２は、第一特定情報１００１である形態素「七人の侍」と、第三特定情報１００３である形態素「面白い」とから構成されることになる。なお、この話題タイトル８２０_２には第二特定情報１００２に該当する形態素は含まれておらず、該当する形態素がないことを示すための記号「＊」が第二特定情報１００２として格納されている。

なお、この話題タイトル８２０_２（七人の侍；＊；面白い）は、「七人の侍は面白い」の意味を有する。この話題タイトル８２０を構成する括弧内は、以下では左から第一特定情報１００１、第二特定情報１００２、第三特定情報１００３の順番となっている。また、話題タイトル８２０のうち、第一から第三特定情報に含まれる形態素がない場合には、その部分については、「＊」を示すことにする。

なお、上記話題タイトル８２０を構成する特定情報は、上記のような第一から第三特定情報のように三つに限定されるものではなく、例えば更に他の特定情報（第四特定情報、およびそれ以上）を有するようにしてもよい。

次に、回答文８３０について図１２を参照して説明する。回答文８３０は、図１２に示すように、本実施の形態では、利用者から発話された発話文のタイプに対応した回答をするために、陳述（D ; Declaration）、時間（T ; Time）、場所（L ; Location）、否定（N ; Negation）などのタイプ（回答種類）に分類されて、各タイプごとに用意されている。また肯定文は「Ａ」とし、質問文は「Ｑ」とする。

話題特定情報８１０のデータ構成例について、図１３を参照して説明する。図１３は、ある話題特定情報８１０「佐藤」に対応付けされた話題タイトル８２０，回答文８３０の具体例を示す。
話題特定情報８１０「佐藤」には、複数の話題タイトル（８２０）１−１、１−２、…が対応付けされている。それぞれの話題タイトル（８２０）１−１，１−２，…には回答文（８３０）１−１，１−２、…が対応付けされて記憶されている。回答文８３０は、回答種類８４０ごとに用意されている。

話題タイトル（８２０）１−１が(佐藤；＊；好き){これは、「佐藤が好きです」に含まれる形態素を抽出したもの}である場合には、その話題タイトル（８２０）１-１に対応する回答文（８３０）１−１は、(DA；陳述肯定文「私も佐藤が好きです」)、(TA；時間肯定文「私は打席に立ったときの佐藤が好きです」)などが挙げられる。後述する回答取得部３８０は、入力種類判定部４４０の出力を参照しながらその話題タイトル８２０に対応付けられた一の回答文８３０を取得する。

各回答文には、当該回答文に対応するように、ユーザ発話に対して優先的に出力される回答文（「次回答文」とよぶ）を指定する情報である次プラン指定情報８４０が定められている。次プラン指定情報８４０は、次回答文を特定できる情報であれば、どのような情報であってもよく、たとえば、会話データベース５００に格納されているすべての回答文から少なくとも一つの回答文を特定できる回答文ＩＤ、などである。

なお、本実施の形態においては、次プラン指定情報８４０は、回答文単位で次回答文を特定する情報（例えば、回答文ＩＤ）として説明するが、次プラン指定情報８４０は、話題タイトル８２０、話題特定情報８１０単位で、次回答文（この場合には、複数の回答文が次回答文として指定されるので、次回答文群とよぶ。ただし、実際に回答文として出力されるのは、この回答文群に含まれるいずれかの回答文となる）を特定する情報であってもかまわない。たとえば、話題タイトルＩＤ、話題特定情報ＩＤを時プラン指定情報として使用しても本実施の形態は成立する。

［１．１．６．会話制御部］
ここで図５に戻り、会話制御部３００の構成例を説明する。
会話制御部３００は、会話制御装置１内の各構成要素（音声認識部２００，文解析部４００、会話データベース５００，出力部６００，音声認識辞書記憶部７００）間のデータの受け渡しを制御するとともに、ユーザ発話に応答する回答文の決定、出力を行う機能を有する。

会話制御部３００は、本実施の形態では、図５に示すように、管理部３１０と、プラン会話処理部３２０と，談話空間会話制御処理部３３０と、CA会話処理部３４０とを有している。以下これらの構成要素について説明する。
［１．１．６．１．管理部］
管理部３１０は談話履歴を記憶し、且つ必要に応じて更新する機能を有する。管理部３１０は話題特定情報検索部３５０と、省略文補完部３６０と、話題検索部３７０と、回答取得部３８０からの要求に応じて、記憶している談話履歴の全部又は一部をこれら各部に渡す機能を有する。

［１．１．６．２．プラン会話処理部］
プラン会話処理部３２０は、プランを実行し、プランに従った会話をユーザとの間で成立させる機能を有する。「プラン」とは、予め定めた順番に従って予め定めた回答をユーザに提供することをいう。以下、プラン会話処理部３２０について説明する。

プラン会話処理部３２０は、ユーザ発話に応じて、予め定めた順番に従って予め定めた回答を出力する機能を有する。

図１４は、プランを説明するための概念図である。図１４に示すように、プラン空間１４０１には複数のプラン１、プラン２，プラン３、プラン４など様々なプラン１４０２があらかじめ準備されている。プラン空間１４０１とは、会話データベース５００に格納された複数のプラン１４０２の集合をいう。会話制御装置１は、装置起動時若しくは会話開始時にあらかじめ開始用に定められたプランを選択し、若しくは各ユーザ発話の内容に応じて、プラン空間１４０１の中から適宜いずれかのプラン１４０２を選択し、選択したプラン１４０２を用いてユーザ発話に対する回答文の出力を行う。

図１５は、プラン１４０２の構成例を示す図である。プラン１４０２は、回答文１５０１と、これに関連づけられた次プラン指定情報１５０２を有している。次プラン指定情報１５０２は、当該プラン１４０２に含まれる回答文１５０１の次に、ユーザに出力する予定の回答文（次候補回答文と呼ぶ）を含むプラン１４０２を特定する情報である。この例では、プラン１は、プラン１実行時に会話制御装置１が出力する回答文Ａ（１５０１）と、この回答文Ａ（１５０１）に関連づけられた次プラン指定情報１５０２とを有している。次プラン指定情報１５０２は、回答文Ａ（１５０１）についての次候補回答文である回答文Ｂ（１５０１）を有するプラン１４０２を特定する情報「ＩＤ：００２」である。同様に、回答文Ｂ（１５０１）についても、次プラン指定情報１５０２が定められており、回答文Ｂ（１５０１）が出力された場合に、次候補回答文を含むプラン２（１４０２）が指定される。このように、プラン１４０２は次プラン指定情報１５０２により連鎖的につながり、一連の連続した内容をユーザに出力するというプラン会話を実現する。すなわち、ユーザに伝えたい内容（説明文、案内文、アンケート、など）を複数の回答文に分割し、かつ各回答文の順番を予め定めてプランとして準備しておくことにより、ユーザの発話に応じてこれら回答文を順番にユーザに提供することが可能となる。なお、次プラン指定情報１５０２によって指定されたプラン１４０２に含まれる回答文１５０２は、直前の回答文の出力に応答するユーザ発話があれば、必ずしも直ちに出力される必要はなく、ユーザと会話制御装置１との間で、当該プラントは別の話題についての会話を挟んだ後に、次プラン指定情報１５０２によって指定されたプラン１４０２に含まれる回答文１５０１が出力されることもあり得る。

なお、図１５に示す回答文１５０１は、図１３に示す回答文８３０の中のいずれか一の回答文文字列に対応し、また図１５に示す次プラン指定情報１５０２は、図１３に示す次プラン指定情報８４０に対応している。

なお、プラン１４０２のつながりは、図１５に示すような一次元的配列に限られるものではない。図１６は、図１５とは別のつながり方を有するプラン１４０２の例を示す図である。図１６に示す例では、プラン１（１４０２）は次候補回答文となる２つの回答文１５０１，すなわちプラン１４０２を指定できるよう、２つの次プラン指定情報１５０２を有している。ある回答文Ａ（１５０１）を出力した場合の次候補回答文を有するプラン１４０２として、回答文Ｂ（１５０１）を有するプラン２（１４０２）、及び回答文Ｃ（１５０１）を有するプラン３（１４０２）の２つのプラン１４０２が定まるよう、次プラン指定情報１５０２が２つ設けられる。なお、回答文Ｂ、回答文Ｃは選択的・択一的であり、一方が出力された場合は他方は出力されず、当該プラン１（１４０２）は終了する。このように、プラン１４０２のつながりは一次元的順列の形態に限定されるものではなく、樹形図的な連結、網的な連結であってもかまわない。

なお、各プランがいくつの次候補回答文を有するかは限定されるものではない。また、話の終了となるプラン１４０２については、次プラン指定情報１５０２が存在しないこともあり得る。

図１７に、ある一連のプラン１４０２の具体例を示す。この一連のプラン１４０２_１〜１４０２_４は、危機管理に関する情報をユーザに知らせるための４つの回答文１５０１_１〜１５０１_４に対応している。４つの回答文１５０１_１〜１５０１_４は全部で一つのまとまりのある話（説明文章）を構成する。各プラン１４０２_１〜１４０２_４はそれぞれ「１０００−０１」「１０００−０２」「１０００−０３」「１０００−０４」というＩＤデータ１７０２_１〜１７０２_４を有している。なお、ＩＤデータ中のハイフン以下の番号は、出力の順番を示す情報である。また、各プラン１４０２_１〜１４０２_４はそれぞれ次プラン指定情報１５０２_１〜１５０２_４を有している。次プラン指定情報１５０２_４の内容は、「１０００−０Ｆ」というデータであるが、このハイフン以下の番号「０Ｆ」は、次に出力する予定のプランは存在せず、当該回答文が一連の話（説明文章）の終わりであることを示す情報である。

この例では、ユーザ発話が「大地震が発生したときの危機管理を教えて」である場合に、プラン会話処理部３２０がこの一連のプランを実行開始する。すなわち、ユーザ発話「大地震が発生したときの危機管理を教えて」をプラン会話処理部３２０が受け付けると、プラン会話処理部３２０はプラン空間１４０１を検索して、ユーザ発話「大地震が発生したときの危機管理を教えて」に対応する回答文１５０１_１を有するプラン１４０２があるかどうかを調べる。この例では、「大地震が発生したときの危機管理を教えて」に対応するユーザ発話文字列１７０１_１が、プラン１４０２_１に対応するものとする。

プラン会話処理部３２０はプラン１４０２_１を発見すると、そのプラン１４０２_１に含まれる回答文１５０１_１を取得し、この回答文１５０１_１をユーザ発話に対する回答として出力するとともに、次プラン指定情報１５０２_１により次候補回答文を特定する。

つぎに、回答文１５０１_１の出力後に入力部１００や音声認識部２００などを介してユーザ発話を受け付けると、プラン会話処理部３２０は、プラン１４０２_２の実行を行う。すなわち、プラン会話処理部３２０は、次プラン指定情報１５０２_１により指定されたプラン１４０２_２の実行、すなわち２番目の回答文１５０１_２を出力するか否かを判定する。具体的には、プラン会話処理部３２０は当該回答文１５０１_２に対応づけられたユーザ発話文字列（用例文ともいう）１７０１_２、あるいは話題タイトル８２０（図１７において図略）と、受け付けたユーザ発話とを比較し、これらが一致するか否かを判定する。一致する場合には、２番目の回答文１５０１_２を出力する。また、２番目の回答文１５０１_２を含むプラン１４０２_２には、次プラン指定情報１５０２_２が記述されているので、次候補回答文が特定される。

同様に、これ以降継続して成されるユーザ発話に応じて、プラン会話処理部３２０はプラン１４０２_３、プラン１４０２_４に順に移行して、３番目の回答文１５０１_３、４番目の回答文１５０１_３の出力を行うことができる。なお、４番目の回答文１５０１_４は最終回答文であり、４番目の回答文１５０１_４の出力が完了すると、プラン会話処理部３２０はプラン実行を終了する。

このように、プラン１４０２_１〜１４０２_４を次々と実行することにより、あらかじめ用意した会話内容を定めた順番通りにユーザに提供することが可能となる。

［１．１．６．３．談話空間会話制御処理部］
図５に戻り、会話制御部３００の構成例の説明を続ける。
談話空間会話制御処理部３３０は、話題特定情報検索部３５０と、省略文補完部３６０と、話題検索部３７０と、回答取得部３８０とを有している。前記管理部３１０は、会話制御部３００の全体を制御するものである。

「談話履歴」とは、ユーザと会話制御装置１間の会話の話題や主題を特定する情報であって、談話履歴は後述する「着目話題特定情報」「着目話題タイトル」「利用者入力文話題特定情報」「回答文話題特定情報」の少なくともいずれか一つを含む情報である。また、談話履歴に含まれる「着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」は直前の会話によって定められたものに限定されず、過去の所定期間の間に着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」となったもの、若しくはそれらの累積的記録であってもよい。

以下、談話空間会話制御処理部３３０を構成するこれら各部について説明する。
［１．１．６．３．１．話題特定情報検索部］
話題特定情報検索部３５０は、形態素抽出部４２０で抽出された第一形態素情報と各話題特定情報とを照合し、各話題特定情報の中から、第一形態素情報を構成する形態素と一致する話題特定情報を検索するものである。具体的に、話題特定情報検索部３５０は、形態素抽出部４２０から入力された第一形態素情報が「佐藤」及び「好き」の二つの形態素で構成される場合には、入力された第一形態素情報と話題特定情報群とを照合する。

この照合をした話題特定情報検索部３２０は、着目話題タイトル８２０focus（前回までに検索された話題タイトル、他の話題タイトルと区別するため８２０focusと表記する）に第一形態素情報を構成する形態素（例えば「佐藤」）が含まれているときは、その着目話題タイトル８２０focusを回答取得部３８０に出力する。一方、着目話題タイトル８２０focusに第一形態素情報を構成する形態素が含まれていないときは、話題特定情報検索部３５０は、第一形態素情報に基づいて利用者入力文話題特定情報を決定し、入力された第一形態素情報及び利用者入力文話題特定情報を省略文補完部３６０に出力する。なお、「利用者入力文話題特定情報」は、第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する形態素に相当する話題特定情報、若しくは第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する可能性がある形態素に相当する話題特定情報をいう。

［１．１．６．３．２．省略文補完部］
省略文補完部３６０は、前記第一形態素情報を、前回までに検索された話題特定情報８１０（以下、「着目話題特定情報」と呼ぶ）及び前回の回答文に含まれる話題特定情報８１０（以下、「回答文話題特定情報」と呼ぶ）を利用して、補完することにより複数種類の補完された第一形態素情報を生成する。例えばユーザ発話が「好きだ」という文であった場合、省略文補完部３６０は、着目話題特定情報「佐藤」を、第一形態素情報「好き」に含めて、補完された第一形態素情報「佐藤、好き」を生成する。

すなわち、第一形態素情報を「Ｗ」、着目話題特定情報や回答文話題特定情報の集合を「Ｄ」とすると、省略文補完部３６０は、第一形態素情報「Ｗ」に集合「Ｄ」の要素を含めて、補完された第一形態素情報を生成する。

これにより、第一形態素情報を用いて構成される文が、省略文であって日本語として明解でない場合などにおいて、省略文補完部３６０は、集合「Ｄ」を用いて、その集合「Ｄ」の要素(例えば、"佐藤")を第一形態素情報「Ｗ」に含めることができる。この結果、省略文補完部３６０は、第一形態素情報「好き」を補完された第一形態素情報「佐藤、好き」にすることができる。なお、補完された第一形態素情報「佐藤、好き」は、「佐藤が好きだ」というユーザ発話に対応する。

すなわち、省略文補完部３６０は、利用者の発話内容が省略文である場合などであっても、集合「Ｄ」を用いて省略文を補完することができる。この結果、省略文補完部３６０は、第一形態素情報から構成される文が省略文であっても、その文が適正な日本語となるようにすることができる。

また、省略文補完部３６０が、前記集合「Ｄ」に基づいて、補完後の第一形態素情報に一致する話題タイトル８２０を検索する。補完後の第一形態素情報に一致する話題タイトル８２０を発見した場合は、省略文補完部３６０はこの話題タイトル８２０を回答取得部３８０に出力する。回答取得部３８０は、省略文補完部３６０で検索された適切な話題タイトル８２０に基づいて、利用者の発話内容に最も適した回答文８３０を出力することができる。

尚、省略文補完部３６０は、集合「Ｄ」の要素を第一形態素情報に含めるだけに限定されるものではない。この省略文補完部３６０は、着目話題タイトルに基づいて、その話題タイトルを構成する第一特定情報、第二特定情報又は第三特定情報のいずれかに含まれる形態素を、抽出された第一形態素情報に含めても良い。

［１．１．６．３．３．話題検索部］
話題検索部３７０は、省略文補完部３６０で話題タイトル８１０が決まらなかったとき、第一形態素情報と、利用者入力文話題特定情報に対応する各話題タイトル８１０とを照合し、各話題タイトル８１０の中から、第一形態素情報に最も適する話題タイトル８１０を検索するものである。
具体的に、省略文補完部３６０から検索命令信号が入力された話題検索部３７０は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトルの中から、その第一形態素情報に最も適した話題タイトル８１０を検索する。話題検索部３７０は、その検索した話題タイトル８１０を検索結果信号として回答取得部３８０に出力する。

先に掲げた図１３は、ある話題特定情報８１０（＝「佐藤」）に対応付けされた話題タイトル８２０，回答文８３０の具体例を示す。図１３に示すように、例えば、話題検索部３７０は、入力された第一形態素情報「佐藤、好き」に話題特定情報８１０（＝「佐藤」）が含まれるので、その話題特定情報８１０（＝「佐藤」）を特定し、次に、その話題特定情報８１０（＝「佐藤」）に対応付けられた各話題タイトル（８２０）１-１,１-２,…と入力された第一形態素情報「佐藤、好き」とを照合する。
話題検索部３７０は、その照合結果に基づいて、各話題タイトル（８２０）１-１〜１-２の中から、入力された第一形態素情報「佐藤、好き」と一致する話題タイトル（８２０）１-１(佐藤；＊；好き)を特定する。話題検索部３４０は、検索した話題タイトル（８２０）１-１(佐藤；＊；好き)を検索結果信号として回答取得部３８０に出力する。

［１．１．６．３．４．回答取得部］
回答取得部３８０は、省略文補完部３６０，或いは話題検索部３７０で検索された話題タイトル８２０に基づいて、その話題タイトル８２０に対応付けられた回答文８３０を取得する。また、回答取得部３８０は、話題検索部３７０で検索された話題タイトル８２０に基づいて、その話題タイトル８２０に対応付けられた各回答種類と、入力種類判定部４４０で判定された発話種類とを照合する。その照合をした回答取得部３８０は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する。

図１３に示す例においては、回答取得部３５０は、話題検索部３７０で検索された話題タイトルが話題タイトル１-１(佐藤；＊；好き)である場合には、その話題タイトル１-１に対応付けられている回答文１-１（DA,TAなど）の中から、入力種類判定部４４０で判定された「発話文のタイプ」(例えばDA)と一致する回答種類(DA)を特定する。この回答種類(DA)を特定した回答取得部３８０は、特定した回答種類(DA)に基づいて、その回答種類(DA)に対応付けられた回答文１-１（「私も佐藤が好きです。」）を取得する。
ここで、上記"DA"、"TA"等のうち、"A"は、肯定形式を意味する。従って、発話種類及び回答種類に"A"が含まれているときは、ある事柄について肯定することを示している。また、発話種類及び回答種類には、"DQ"、"TQ"等の種類を含めることもできる。この"DQ"、"TQ"等のうち"Q"は、ある事柄についての質問を意味する。

回答種類が上記質問形式(Q)からなるときは、この回答種類に対応付けられる回答文は、肯定形式(A)で構成される。この肯定形式(A)で作成された回答文としては、質問事項に対して回答する文等が挙げられる。例えば、発話文が「あなたはスロットマシンを操作したことがありますか?」である場合には、この発話文についての発話種類は、質問形式(Q)となる。この質問形式(Q)に対応付けられる回答文は、例えば「私はスロットマシンを操作したことがあります」(肯定形式(A))が挙げられる。

一方、発話種類が肯定形式(A)からなるときは、この回答種類に対応付けられる回答文は、質問形式(Q)で構成される。この質問形式(Q)で作成された回答文としては、発話内容に対して聞き返す質問文、又は特定の事柄を聞き出す質問文等が挙げられる。例えば、発話文が「私はスロットマシンで遊ぶのが趣味です」である場合には、この発話文についての発話種類は、肯定形式(A)となる。この肯定形式(A)に対応付けられる回答文は、例えば"パチンコで遊ぶのは趣味ではないのですか?"(特定の事柄を聞き出す質問文(Q))が挙げられる。

回答取得部３８０は、取得した回答文８３０を回答文信号として管理部３１０に出力する。回答取得部３５０から回答文信号が入力された管理部３１０は、入力された回答文信号を出力部６００に出力する。

［１．１．６．４．ＣＡ会話処理部］
ＣＡ会話処理部３４０は、ユーザ発話に対して、プラン会話処理部３２０および談話空間会話制御処理部３３０のいずれにおいても回答文が決定しない場合に、ユーザ発話の内容に応じて、ユーザとの会話を継続できるような回答文を出力する機能を有する。

図１に戻り、会話制御装置１の構成例を再開する。
［１．１．７．出力部］
出力部６００は、回答取得部３８０で取得された回答文を出力するものである。この出力部６００は、例えば、スピーカ、ディスプレイなどが挙げられる。具体的に、管理部３１０から回答文が入力された出力部６００は、入力された回答文に基づいて、音声をもってその回答文、例えば、「私も佐藤が好きです」を出力する。
以上で会話制御装置１の構成例の説明を終了する。

［２．会話制御方法］
上記構成を有する会話制御装置１は、以下のように動作することにより会話制御方法を実行する。

次に、本実施の形態にかかる会話制御装置１，より詳しくは会話制御部３００の動作について説明する。

図１８は、会話制御部３００のメイン処理の一例を示すフローチャートである。このメイン処理は、会話制御部３００がユーザ発話を受け付けるごとに実行される処理であり、このメイン処理が行われることによりユーザ発話に対する回答文の出力が行われ、ユーザと会話制御装置１間の会話（対話）が成立する。

メイン処理にはいると、会話制御部３００、より詳しくはプラン会話処理部３２０はまずプラン会話制御処理（Ｓ１８０１）を実行する。プラン会話制御処理は、プランを実行する処理である。

図１９、図２０はプラン会話制御処理の一例を示すフローチャートである。以下に図１９、図２０を参照しながら、プラン会話制御処理の例について説明する。

プラン会話制御処理を開始すると、プラン会話処理部３２０はまず、基本制御状態情報チェックを行う（Ｓ１９０１）。基本制御状態情報は、プラン１４０２の実行の完了の有無が、基本制御状態情報として所定の記憶領域に格納される。
基本制御状態情報は、プランの基本制御状態を記述する役割を有する。

図２１は、シナリオと呼ばれるタイプのプランについて生じうる４つの基本制御状態を示す図である。以下、それぞれの状態について説明する。

（１）結束
この基本制御状態は、ユーザ発話が実行中のプラン１４０２、より詳しくはプラン１４０２に対応する話題タイトル８２０や用例文１７０１に一致する場合である。この場合は、プラン会話処理部３２０は当該プラン１４０２を終了し、次プラン指定情報１５０２にて指定された回答文１５０１に対応するプラン１４０２に移行する。

（２）破棄
この基本制御状態は、ユーザ発話内容がプラン１４０２の終了を要求していると判断される場合、またはユーザの関心が実行中のプラン以外の事項に移ったと判定される場合に、設定される基本制御状態である。基本制御状態情報が破棄を示している場合は、プラン会話処理部３２０は、破棄の対象となったプラン１４０２以外にユーザ発話に対応するプラン１４０２がないかどうかを検索し、存在する場合にはそのプラン１４０２の実行を開始し、存在しない場合には、プランの実行を終了する。

（３）維持
この基本制御状態は、ユーザ発話が、実行中のプラン１４０２に対応する話題タイトル８２０（図１３参照）や用例文１７０１（図１７参照）に該当しない場合であって、かつユーザ発話が基本制御状態「破棄」に該当するものではないと判断される場合に、基本制御状態情報に記述される基本制御状態である。

この基本制御状態である場合には、プラン会話処理部３２０は、ユーザ発話を受け付けると、まず保留・中止しているプラン１４０２を再開するか否かを検討し、ユーザ発話がプラン１４０２再開に適さない場合、例えばユーザ発話がプラン１４０２に対応する話題タイトル８０２や用例文１７０２に対応しない場合は、他のプラン１４０２の実行を開始したり、或いは後述の談話空間会話制御処理（Ｓ１９０２）などをおこなう。ユーザ発話がプラン１４０２再開に適している場合は、記憶している次プラン指定情報１５０２に基づいて、回答文１５０１の出力を行う。

基本制御状態が「維持」である場合は、プラン会話処理部３２０は、当該プラン１４０２に対応する回答文１５０１以外の回答を出力できるように、他のプラン１４０２を検索し、あるいは後述の談話空間会話制御処理などをおこなうが、ユーザ発話が再びプラン１４０２に関するものとなった場合は、そのプラン１４０２の実行を再開する。

（４）継続
この状態は、ユーザ発話が、実行中のプラン１４０２に含まれる回答文１５０１に対応しない場合であって、かつユーザ発話内容が基本制御状態「破棄」に該当するものではないと判断され、かつユーザ発話から解釈されるユーザの意図が明瞭でない場合に、設定される基本制御状態である。

基本制御状態が「継続」である場合は、プラン会話処理部３２０は、ユーザ発話を受け付けるとまず保留・中止しているプラン１４０２を再開するか否かを検討し、ユーザ発話がプラン１４０２再開に適さない場合は、ユーザからさらなる発話を引き出すための回答文を出力できるように、後述のＣＡ会話制御処理などをおこなう。

図１９に戻り、プラン会話制御処理の説明を続ける。
基本制御状態情報を参照したプラン会話処理部３２０は、基本制御状態情報が示す基本制御状態が「結束」であるか否かを判定する（Ｓ１９０２）。基本制御状態が「結束」であると判定した場合（Ｓ１９０２、Ｙｅｓ）は、プラン会話処理部３２０は、基本制御状態情報が示す実行中のプラン１４０２において、回答文１５０１が最終回答文であるかどうかを判定する（Ｓ１９０３）。

最終回答文１５０１が出力済みであると判定した場合（Ｓ１９０３、Ｙｅｓ）、プラン会話処理部３２０は、すでにそのプラン１４０２においてユーザに回答すべき内容をすべて伝え終えているので、新たな別のプラン１４０２を開始するかいなかを判定するため、プラン空間内にユーザ発話に対応するプラン１４０２が存在するか検索を行う（Ｓ１９０４）。この検索の結果ユーザ発話に対応するプラン１４０２が発見できなかった場合（Ｓ１９０５、Ｎｏ）、ユーザに提供すべきプラン１４０２は存在していないので、プラン会話処理部３２０はそのままプラン会話制御処理を終了する。

一方、この検索の結果、ユーザ発話に対応するプラン１４０２を発見した場合（Ｓ１９０５、Ｙｅｓ）、プラン会話処理部３２０は当該プラン１４０２に移行する（Ｓ１９０６）。これは、ユーザに提供すべきプラン１４０２が存在しているため、当該プラン１４０２の実行（プラン１４０２に含まれる回答文１５０１の出力）を開始するためである。

次に、プラン会話処理部３２０は当該プラン１４０２の回答文１５０１を出力する（Ｓ１９０８）。出力された回答文１５０１は、ユーザ発話に対する回答となり、プラン会話処理部３２０はユーザに伝えたい情報を提供することとなる。
回答文出力処理（Ｓ１９０８）後、プラン会話処理部３２０はプラン会話制御処理を終了する。

一方、先に出力した回答文１５０１が最終の回答文１５０１であるか否かの判定（Ｓ１９０３）において、先に出力した回答文１５０１が最終の回答文１５０１でない場合（Ｓ１９０３，Ｎｏ）は、プラン会話処理部３２０は、先に出力した回答文１５０１に続く回答文１５０１、すなわち次プラン指定情報１５０２により特定されている回答文１５０１に対応するプラン１４０２に移行する（Ｓ１９０７）。

この後、プラン会話処理部３２０は該当するプラン１４０２に含まれる回答文１５０１を出力し、ユーザ発話に対する回答を行う（Ｓ１９０８）。出力された回答文１５０１は、ユーザ発話に対する回答となり、プラン会話処理部３２０はユーザに伝えたい情報を提供することとなる。回答文出力処理（Ｓ１９０８）後、プラン会話処理部３２０はプラン会話制御処理を終了する。

さて、Ｓ１９０２の判定処理において、基本制御状態情報が「結束」でない場合（Ｓ１９０２，Ｎｏ）は、プラン会話処理部３２０は基本制御状態情報が示す基本制御状態が「破棄」であるか否かを判定する（Ｓ１９０９）。基本制御状態が「破棄」であると判定した場合（Ｓ１９０９、Ｙｅｓ）は、継続すべきプラン１４０２が存在していないため、プラン会話処理部３２０は、開始すべき新たな別のプラン１４０２が存在するか判定すべく、プラン空間１４０１内にユーザ発話に対応するプラン１４０２が存在するか検索を行う（Ｓ１９０４）。この後、先に述べたＳ１９０３（Ｙｅｓ）における処理と同様に、Ｓ１９０５からＳ１９０８までの処理をプラン会話処理部３２０は実行する。

一方、基本制御状態情報が示す基本制御状態が「破棄」であるか否かの判定（Ｓ１９０９）において、基本制御状態が「破棄」でないと判定した場合（Ｓ１９０９，Ｎｏ）は、プラン会話処理部３２０は、基本制御状態情報が示す基本制御状態が「維持」であるか否かの判定（Ｓ１９１０）をさらに行う。

基本制御状態情報が示す基本制御状態が「維持」である場合（Ｓ１９１０、Ｙｅｓ）には、プラン会話処理部３２０は、保留・停止しているプラン１４０２についてユーザが再び関心を示したか否かを調べ、関心を示した場合には、一時保留・停止しているプラン１４０２を再開するように動作する。すなわち、プラン会話処理部３２０は、保留・停止中のプラン１４０２を検査（図２０；Ｓ２００１）し、ユーザ発話が保留・停止中の当該プラン１４０２が対応するか否かを判定する（Ｓ２００２）。

ユーザ発話が当該プラン１４０２に対応すると判定された場合（Ｓ２００２、Ｙｅｓ）は、プラン会話処理部３２０はそのユーザ発話に対応するプラン１４０２に移行し（Ｓ２００３）、その後、そのプラン１４０２に含まれる回答文１５０１を出力するように、回答文出力処理（図１９；Ｓ１９０８）を実行する。このように動作することにより、プラン会話処理部３２０は、保留・中断していたプラン１４０２を、ユーザ発話に応じて、再開することが可能となり、あらかじめ用意していたプラン１４０２に含まれる内容をすべてユーザに伝達することが可能となる。

一方、先のＳ２００２（図２０参照）において、保留・停止中のプラン１４０２がユーザ発話に対応しないと判定された場合（Ｓ２００２、Ｎｏ）は、プラン会話処理部３２０は、開始すべき新たな別のプラン１４０２が存在するか判定すべく、プラン空間１４０１内にユーザ発話に対応するプラン１４０２が存在するか検索を行う（図１９；Ｓ１９０４）。この後、先に述べたＳ１９０３（Ｙｅｓ）における処理と同様に、Ｓ１９０５からＳ１９０９までの処理をプラン会話処理部３２０は実行する。

さて、Ｓ１９１０の判定において、基本制御状態情報が示す基本制御状態が「維持」でない場合（Ｓ１９１０、Ｎｏ）は、基本制御状態情報が示す基本制御状態が「継続」であることを意味する。この場合には、プラン会話処理部３２０は、回答文の出力を行うことなく、プラン会話制御処理を終了する。
以上で、プラン会話制御処理の説明を終了する。

図１８に戻り、メイン処理の説明を続ける。
プラン会話制御処理（Ｓ１８０１）を終了すると、会話制御部３００は談話空間会話制御処理を開始する（Ｓ１８０２）。ただし、プラン会話制御処理（Ｓ１８０１）において回答文出力を行った場合は、会話制御部３００は談話空間会話制御処理（Ｓ１８０２）、および後に説明するＣＡ会話制御処理（Ｓ１８０３）のいずれも行わず、基本制御情報更新処理（Ｓ１９０４）を行ってメイン処理を終了する。

図２２は、本実施の形態に係る談話空間会話制御処理の一例を示すフローチャートである。
先ず、入力部１００が、利用者からの発話内容を取得するステップを行う（ステップＳ２２０１）。具体的には、入力部１００は、利用者の発話内容を構成する音声を取得する。入力部１００は、取得した音声を音声信号として音声認識部２００に出力する。なお、入力部１００は、利用者からの音声ではなく、利用者から入力された文字列（例えば、テキスト形式で入力された文字データ）を取得してもよい。この場合、入力部１００はマイクではなく、キーボードやタッチパネルなどの文字入力装置となる。

次いで、音声認識部２００が、入力部１００で取得した発話内容に基づいて、発話内容に対応する文字列を特定するステップを行う（ステップＳ２２０２）。具体的には、入力部１００から音声信号が入力された音声認識部２００は、入力された音声信号に基づいて、その音声信号に対応する単語仮説（候補）を特定する。音声認識部２００は、特定した単語仮説（候補）に対応付けられた文字列を取得し、取得した文字列を文字列信号として会話制御部３００、より詳しくは談話空間会話制御部３３０に出力する。

そして、文字列特定部４１０が、音声認識部２００で特定された一連の文字列を一文毎に区切るステップを行う（ステップＳ２２０３）。具体的には、管理部３１０から文字列信号（あるいは形態素信号）が入力された文字列特定部４１０は、その入力された一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部４１０は、その区切った各文字列を形態素抽出部４２０及び入力種類判定部４４０に出力する。なお、文字列特定部４１０は、入力された文字列がキーボードから入力された文字列である場合には、句読点又はスペース等のある部分で文字列を区切るのが好ましい。

その後、形態素抽出部４２０が、文字列特定部４１０で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップを行う（ステップＳ２２０４）。具体的に、文字列特定部４１０から文字列が入力された形態素抽出部４２０は、入力された文字列と、形態素データベース４３０に予め格納されている形態素群とを照合する。なお、その形態素群は、本実施の形態では、それぞれの品詞分類に属する各形態素について、その形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として準備されている。
この照合をした形態素抽出部４２０は、入力された文字列の中から、予め記憶された形態素群に含まれる各形態素と一致する各形態素（m１、m２、…）を抽出する。形態素抽出部４２０は、抽出した各形態素を第一形態素情報として話題特定情報検索部３５０に出力する。

次いで、入力種類判定部４４０が、文字列特定部４１０で特定された一文を構成する各形態素に基づいて、「発話文のタイプ」を判定するステップを行う（ステップＳ２２０５）。具体的には、文字列特定部４１０から文字列が入力された入力種類判定部４４０は、入力された文字列に基づいて、その文字列と発話種類データベース４５０に格納されている各辞書とを照合し、その文字列の中から、各辞書に関係する要素を抽出する。この要素を抽出した入力種類判定部４４０は、抽出した要素に基づいて、その要素がどの「発話文のタイプ」に属するのかを判定する。入力種類判定部４４０は、判定した「発話文のタイプ」（発話種類）を回答取得部３８０に出力する。

そして、話題特定情報検索部３５０が、形態素抽出部４２０で抽出された第一形態素情報と着目話題タイトル８２０focusとを比較するステップを行う（ステップＳ２２０６）。
第一形態素情報を構成する形態素と着目話題タイトル８２０focusとが一致する場合、話題特定情報検索部３５０は、その話題タイトル８２０を回答取得部３８０に出力する。一方、話題特定情報検索部３５０は、第一形態素情報を構成する形態素と話題タイトル８２０とが一致しなかった場合には、入力された第一形態素情報及び利用者入力文話題特定情報を検索命令信号として省略文補完部３６０に出力する。

その後、省略文補完部３６０が、話題特定情報検索部３５０から入力された第一形態素情報に基づいて、着目話題特定情報及び回答文話題特定情報を、入力された第一形態素情報に含めるステップを行う（ステップＳ２２０７）。具体的には、第一形態素情報を「Ｗ」、着目話題特定情報及び回答文話題特定情報の集合を「Ｄ」とすると、省略文補完部３６０は、第一形態素情報「Ｗ」に話題特定情報「Ｄ」の要素を含めて、補完された第一形態素情報を生成し、この補完された第一形態素情報と集合「Ｄ」に関連づけされたすべての話題タイトル８２０とを照合し、補完された第一形態素情報と一致する話題タイトル８２０があるか検索する。補完された第一形態素情報と一致する話題タイトル８２０がある場合は、省略文補完部３６０は、その話題タイトル８２０を回答取得部３８０に出力する。一方、補完された第一形態素情報と一致する話題タイトル８２０を発見しなかった場合は、省略文補完部３６０は、第一形態素情報と利用者入力文話題特定情報とを話題検索部３７０に渡す。

次いで、話題検索部３７０は、第一形態素情報と、利用者入力文話題特定情報とを照合し、各話題タイトル８２０の中から、第一形態素情報に適した話題タイトル８２０を検索するステップを行う（ステップＳ２２０８）。具体的には、省略文補完部３６０から検索命令信号が入力された話題検索部３７０は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトル８２０の中から、その第一形態素情報に適した話題タイトル８２０を検索する。話題検索部３７０は、その検索の結果得られた話題タイトル８２０を検索結果信号として回答取得部３８０に出力する。

次いで、回答取得部３８０が、話題特定情報検索部３５０、省略文補完部３６０，あるいは話題検索部３７０で検索された話題タイトル８２０に基づいて、文解析部４００により判定された利用者の発話種類と、話題タイトル８２０に対応付けられた各回答種類とを照合し、回答文８３０の選択を行う（ステップＳ２２０９）。

具体的には、以下のようにして回答文８３０の選択が行われる。すなわち、話題検索部３７０から検索結果信号と、入力種類判定部４４０から「発話文のタイプ」とが入力された回答取得部３８０は、入力された検索結果信号に対応する「話題タイトル」と、入力された「発話文のタイプ」とに基づいて、その「話題タイトル」に対応付けられている回答種類群の中から、「発話文のタイプ」（DAなど）と一致する回答種類を特定する。

続いて、回答取得部３８０は、管理部３１０を介して、ステップＳ２２０９において取得した回答文８３０を出力部６００に出力する（ステップＳ２２１０）。管理部３１０から回答文を受け取った出力部６００は、入力された回答文８３０を出力する。

以上で、談話空間会話制御処理の説明を終了し、図１８に戻りメイン処理の説明を再開する。
会話制御部３００は談話空間会話制御処理を終了すると、ＣＡ会話制御処理を実行する（Ｓ１８０３）。ただし、プラン会話制御処理（Ｓ１８０１）および談話空間会話制御処理（Ｓ１８０１）において回答文出力を行った場合は、会話制御部３００はＣＡ会話制御処理（Ｓ１８０３）を行わず、基本制御情報更新処理（Ｓ１８０４）を行ってメイン処理を終了する。

ＣＡ会話制御処理（Ｓ１８０３）は、ユーザ発話が、「何かを説明している」のか、「何かを確認している」のか、「非難や攻撃をしている」のか、「これら以外」なのかを判定し、ユーザ発話の内容および判定結果に応じた回答文を出力する処理である。このＣＡ会話制御処理を行うことにより、プラン会話制御処理、および談話空間会話制御処理のいずれにおいても、ユーザ発話に適した回答文が出力できなくとも、ユーザとの会話の流れをとぎれさせることなく継続できるような、いわば「つなぎ」の回答文を出力することを可能とする役割を有している。

図２３は、ＣＡ会話処理部３４０の構成例を示す機能ブロック図である。ＣＡ会話処理部３４０は、判定部２３０１と、回答部２３０２とを有している。
判定部２３０１は、管理部３１０又は談話空間会話制御処理部３３０からユーザ発話文を受け取ると共に、回答文出力命令を受け取る。この回答文出力命令は、前記プラン会話処理部２０及び談話空間会話制御処理部３３０が回答文出力を行わない、又は行えない場合になされる。また、判定部２３０１は、文解析部４００（より詳しくは入力種類判定部４４０）より入力種類、すなわちユーザ発話のタイプ（図１２参照）を受け取る。判定部２３０１は、これに基づいてユーザ発話意図を判定する。例えば、ユーザ発話が「佐藤が好きです」という文であった場合には、この文に含まれる「佐藤」「好き」という自立語と、ユーザ発話のタイプが陳述肯定文（ＤＡ）であることに基づいて、「佐藤」「好き」についてユーザが説明を行っていると判定する。

回答部２３０２は、判定部２３０１からの判定結果に応じて、回答文を決定し、出力する。この例では、回答部２３０２は、説明会話対応文テーブル、確認会話対応文テーブル、非難攻撃会話対応文テーブル、反射会話文テーブルを有している。

説明会話対応文テーブルは、ユーザ発話が何かを説明していると判定された場合にその発話に対する回答として出力する回答文を複数種類格納したテーブルである。例えば、回答文例としては、「はいそうなんですか。」のような聞き返しをされない回答文が用意されている。

確認会話対応文テーブルは、ユーザ発話が何かを確認・質問していると判定された場合にその発話に対する回答として出力する回答文を複数種類格納したテーブルである。例えば、回答文例としては、「ちょっとわかりません。」のような聞き返しをされない回答文が用意されている。

非難攻撃会話対応文テーブルは、ユーザ発話が会話制御装置を非難攻撃していると判定された場合にその発話に対する回答として出力する回答文を複数種類格納したテーブルである。例えば、回答文例としては、「ごめんなさい。」のような回答文が用意されている。

反射会話文テーブルは、ユーザ発話「『＊＊＊』なら興味ありません。」のような回答文が用意されている。なお、『＊＊＊』は当該ユーザ発話に含まれる自立語が格納されることを意味する。

回答部２３０２は、これら説明会話対応文テーブル、確認会話対応文テーブル、非難攻撃会話対応文テーブル、反射会話文テーブルを参照して、回答文を決定し、決定した回答文を管理部３１０に渡すように機能する。

次に、上記ＣＡ会話処理部３４０が実行する処理であるＣＡ会話処理（Ｓ１８０３）の具体例について説明する。図２４は、ＣＡ会話処理の具体例を示すフローチャートである。なお、先に述べた様に、プラン会話制御処理（Ｓ１８０１）および談話空間会話制御処理（Ｓ１８０２）において回答文出力を行った場合は、会話制御部３００はＣＡ会話制御処理（Ｓ１８０３）を行なわない。すなわち、ＣＡ会話制御処理（Ｓ１８０３）はプラン会話制御処理（Ｓ１８０１）および談話空間会話制御処理（Ｓ１８０２）において回答文出力が保留されている場合にのみ、回答文出力を行う。

ＣＡ会話処理（Ｓ１８０３）において、ＣＡ会話処理部３４０（判定部２３０１）はまず、ユーザ発話が何かを説明している文か否かを判定する（Ｓ２４０１）。ユーザ発話が何かを説明している文であると判定した場合（Ｓ２４０１，Ｙｅｓ）には、ＣＡ会話処理部３４０（回答部２３０２）は説明会話対応文テーブルを参照するなどの方法によって回答文を決定する。

一方、ユーザ発話が何かを説明している文ではないと判定した場合（Ｓ２４０１，Ｎｏ）には、ＣＡ会話処理部３４０（判定部２３０１）は、ユーザ発話が何かを確認又は質問している文か否かを判定する（Ｓ２４０３）。ユーザ発話が何かを確認又は質問している文であると判定した場合（Ｓ２４０３，Ｙｅｓ）には、ＣＡ会話処理部３４０（回答部２３０２）は確認会話対応文テーブルを参照するなどの方法によって回答文を決定する（Ｓ２４０４）。

一方、ユーザ発話が何かを確認又は質問している文ではないと判定した場合（Ｓ２４０３，Ｎｏ）には、ＣＡ会話処理部３４０（判定部２３０１）は、ユーザ発話が非難又は攻撃をしている文か否かを判定する（Ｓ２４０５）。ユーザ発話が非難又は攻撃をしている文であると判定した場合（Ｓ２４０５，Ｙｅｓ）には、ＣＡ会話処理部３４０（回答部２３０２）は攻撃非難会話対応文テーブルを参照するなどの方法によって回答文を決定する（Ｓ２４０６）。

一方、ユーザ発話が非難又は攻撃をしている文ではないと判定した場合（Ｓ２４０５，Ｎｏ）には、ＣＡ会話処理部３４０（判定部２３０１）は、回答部２３０２に反射会話回答文を決定するよう要求する。この要求に応じて、ＣＡ会話処理部３４０（回答部２３０２）は反射会話対応文テーブルを参照するなどの方法によって回答文を決定する（Ｓ２４０７）。

以上でＣＡ会話処理（Ｓ１９０３）は終了する。このＣＡ会話処理により、会話制御装置１はユーザ発話状態に応じて会話の成立を維持することが可能な回答を行える。

図１８に戻り、会話制御部３００のメイン処理を続ける。
ＣＡ会話処理（Ｓ１８０３）が終了すると、会話制御部３００は基本制御情報更新処理を行う（Ｓ１８０４）。この処理において、会話制御部３００，より詳しくは管理部３１０は、プラン会話処理部３２０が回答文出力を行った場合は基本制御情報を「結束」に設定し、プラン会話処理部３２０が回答文出力を停止した場合は基本制御情報を「破棄」に設定し、談話空間会話制御処理部３３０が回答文出力を行った場合は基本制御情報を「維持」に設定し、ＣＡ会話処理部３４０が回答文出力を行った場合は基本制御情報を「継続」に設定する。

この基本制御情報更新処理で設定された基本制御情報は、前述のプラン会話制御処理（Ｓ１８０１）において参照され、プランの継続や再開に利用される。

以上、メイン処理をユーザ発話を受け付けるごとに実行することにより、会話制御装置１は、ユーザ発話に応じて、予め用意したプランを実行できるとともに、プランに含まれない話題についても適宜応答することができる。

会話制御装置の構成例を示す機能ブロック図音声認識部の構成例を示す機能ブロック図単語仮説絞込部の処理の一例を示すタイミングチャート音声認識部の動作例を示すフローチャート会話制御装置の部分拡大ブロック図文字列とこの文字列から抽出される形態素との関係を示す図「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図文のタイプとそのタイプを判定するための辞書の関係を示す図会話データベースが記憶するデータのデータ構成の一例を示す概念図ある話題特定情報と他の話題特定情報との関連付けを示す図話題タイトル（「第二形態素情報」ともいう）のデータ構成例を示す図回答文のデータ構成例を説明するための図ある話題特定情報に対応付けされた話題タイトル，回答文、次プラン指定情報の具体例を示す図プラン空間を説明するための概念図プランの例を示す図別のプランの例を示す図プラン会話処理の具体例を示す図会話制御部のメイン処理の一例を示すフローチャートプラン会話制御処理の一例を示すフローチャート図１９に続く、プラン会話制御処理の一例を示すフローチャート基本制御状態を示す図談話空間会話制御処理の一例を示すフローチャートＣＡ会話処理部の構成例を示す機能ブロック図ＣＡ会話処理の一例を示すフローチャート

符号の説明

１ … 会話制御装置
１００ … 入力部
２００ … 音声認識部
３００ … 会話制御部
３２０ … プラン会話処理部
３３０ … 談話空間会話制御処理部
３４０ … ＣＡ会話処理部
４００ … 文解析部
５００ … 会話データベース
６００ … 出力部
７００ … 音声認識辞書記憶部

Claims

ユーザ発話に応じて回答文を出力する会話制御装置において、
回答文と、当該回答文の次の順番で出力することが予定される回答文である次候補回答文を指定する次候補指定情報とをそれぞれが有する複数のプランを記憶する会話データベースと、
第１のユーザ発話に応じて、前記会話データベースに記憶されたプランを選択し、そのプランが有する回答文を出力するとともに、その後発話された第２のユーザ発話が、当該プランが有する次候補指定情報により指定される次候補回答文に対応する場合には、当該次候補指定情報によって指定される次候補回答文を出力する一方、前記第２のユーザ発話が前記次候補回答文と関連性がないか、若しくは関連性が不明である場合には、前記次候補回答文の出力を保留するプラン会話処理部と、
前記プラン会話処理部が次候補回答文の出力を保留した場合に、前記第２のユーザ発話に関連する話題を検索し、前記第２のユーザ発話に関連する話題を発見した場合には、当該話題に関連する回答文を出力し、一方、前記第２のユーザ発話に関連する話題を発見しない場合には、当該話題に関連する回答文の出力を保留する談話空間会話制御処理部と、
前記談話空間会話制御処理部が回答文の出力を保留した場合に会話の成立を維持するための回答文を出力するＣＡ会話処理部と、
入力されるユーザ発話の種類を示す発話文タイプを判定するための入力種類判定部と、
を有し、
前記ＣＡ会話処理部が判定部と回答部とを有し、前記判定部は、前記談話空間会話制御処理部からユーザ発話文を受け取るとともに、このユーザ発話文に関して判定された発話文タイプを前記入力種類判定部から受け取り、受け取ったこれらの情報に基づいてユーザ発話意図を判定し、前記回答部は、複数種類の発話意図に対応する回答文を格納する複数種類の対応文テーブルを有しており、前記判定部によって判定された発話意図に対応する回答文を格納する対応文テーブルの中から会話の成立を維持するための前記回答文を決定する、
ことを特徴とする会話制御装置。