JP2000067047A - 対話制御装置および対話制御方法 - Google Patents

対話制御装置および対話制御方法

Info

Publication number
JP2000067047A
JP2000067047A JP10236851A JP23685198A JP2000067047A JP 2000067047 A JP2000067047 A JP 2000067047A JP 10236851 A JP10236851 A JP 10236851A JP 23685198 A JP23685198 A JP 23685198A JP 2000067047 A JP2000067047 A JP 2000067047A
Authority
JP
Japan
Prior art keywords
task
output
topic
natural language
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10236851A
Other languages
English (en)
Inventor
Munehiko Sasajima
宗彦 笹島
Yasuyuki Kono
恭之 河野
Takehide Yano
武秀 屋野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10236851A priority Critical patent/JP2000067047A/ja
Publication of JP2000067047A publication Critical patent/JP2000067047A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】話題範囲の定義が動的に変わっても話題転換を
検出追従可能にする。 【解決手段】計算機と人間が自然言語による音声やテキ
スト(txt) にて対話することにより協調的に問題解決す
るシステムにおいて、入力自然言語文を形態素解析及び
意味解析する文意味解釈部203 と、問題解決の解と解決
アルゴリズムが定義されたタスクオブジェクト(TO)と、
複数のTOにてなされた現在までの問題解決の処理進行状
況と解決対象問題を表現するタスク空間210 を監視・制
御することで対話制御する装置であって文意味解釈結果
にその発話者がタスク空間に対し意図した作用の記述を
付加した深層ユーザ意図表現を出力する意図合成部204
と、深層ユーザ意図表現、タスクスケジューラからのメ
ッセージで表現される外部状況表現入力を解釈しタスク
空間中のTOを管理するタスクマネージャ(TM)206 と、TM
や個々のTOの要求にて文を生成し音声やtxt で出力する
生成部211 からなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する利用分野】本発明は、対話処理システム
のための対話制御装置および対話制御方法に関する。
【0002】
【従来の技術】音声やテキストなどを用いて計算機(コ
ンピュータ)と人間、あるいは計算機同士が自然言語で
対話を行い協調的に問題解決を行うシステムにおいて
は、問題解決が収束する方向へ導くような発話を計算機
システムが提供することが重要である。
【0003】そのためには、ある問題の解決に向けて相
互に交わされる発話が問題解決に対してどのような影響
を与えるかをモデル化し、そのモデルを利用して問題解
決の流れを制御することが必要である。問題解決の流れ
を制御することが必要になるのは、主に、次の2つであ
る。
【0004】・P1:問題解決中に、別の新たな問題が
発生した時 ・P2:問題解決が終了した時 次の対話例1を例として説明する。対話がなされる状況
としては、ユーザがカーナビゲーションシステムを利用
して、東京から大阪府吹田市にある万博公園へ行こうと
している状況を仮定する。以下の事例では、カーナビゲ
ーションシステムをカーナビと略称している。なお、C
n(nは1,2,3,……)はカーナビ発話、Unはユ
ーザ発話を示し、“『”,“』”で括られた内容は発話
内容を示している。
【0005】〔対話例1〕 カーナビ(C1):『間もなく、吹田出口です。』 ユーザ(U1) :『神戸には何がある?』 カーナビ(C2):『神戸には中華街があります。』 ユーザ(U2) :『出口はどこ。』 カーナビ(C3):『阪神高速3号神戸線生田川出口で
す。』 ユーザ(U3) :『中華街にいく。』 カーナビ(C4):『万博公園に行くのはどうしますか
?』 ユーザ(U4) :『いく。』 カーナビ(C5):『では万博公園、中華街の順で行き
ますか?』 ユーザ(U5) :『はい。』 カーナビ(C6):『では万博公園を経由して中華街へ
行くルートを案内します。』 カーナビ発話C1に至るまで、既にユーザとカーナビ
は、「万博公園に至る」問題を解決するために協調して
対話を行っているが、ユーザ発話U1は、既存の経路上
に存在しない新たな目的地に関する質問をすることによ
って新たに問題を発生させている。つまり、解決すべき
問題、言い替えれば話題が転換している。
【0006】しかし、上記対話例において、ユーザ発話
U1を、 ・『吹田には何がある?』(発話のIDをU1′とす
る) と置き換えた場合を考えると、U1′は話題の転換を意
図した発話ではないと考えるのが自然である。
【0007】なぜなら、吹田は現在走行中の経路上にあ
る経由地点の1つであって、その地点の属性について尋
ねることは現状の対話の目的である万博公園に至る問題
の解決を止めたり、変更したりする行為ではないと考え
られるからである。
【0008】話題の転換を検出する従来の方式として
は、特開平8−137874号公報の開示技術に代表さ
れる、クルーと呼ばれる話題転換候補語の集合を文中か
ら検出し、あらかじめ定義された個々の話題転換候補語
の話題転換寄与指数を計算することによって話題転換発
生の有無を検出するものが挙げられる。
【0009】そして、従来の研究においては、クルーと
しては、例えば明示的に話題の転換を表現する「ところ
で」、とか「さて」などの語彙や、話題を表現する名詞
であることを示す助詞「は」(主語を表す)や「だ」
(強調を表す)が接続した自立語などが用いられてい
る。
【0010】しかし、対話例1に見られるように、現実
の問題解決の場面において「ところで」や「さて」など
の話題の転換を明示する語彙を用いることは少ない。そ
もそも、ユーザ自身、話題転換が発生していることを意
識している場合が少ないので、話題転換を直接表現する
語彙を、クルーに採用すると云うことは、実用的な対話
システムにおいて話題転換を検出するために有効な方法
とはいえない。
【0011】また、自立語に接続する助詞を用いてクル
ーを定義することも、特に音声を利用したシステムにお
いては現実的ではない。
【0012】このようなクルーを発話文から認識するた
めには、発話文中にクルーを示す助詞が含まれているこ
とを認識しなければならず、そのためには対話処理シス
テムの前処理部である音声認識部で助詞を認識しなけれ
ばならない。
【0013】しかし、音声認識部の認識語彙として助詞
を採用することは、音声認識結果に非常に多くの湧きだ
し誤り、すなわち、助詞が他の単語の一部であるかのよ
うな誤認識を多く発生させる事態を招き、処理速度の低
下や誤った文の認識、それに伴う意味処理部の負荷の増
大、などを招く。
【0014】また、特開平7−239694号公報開示
の技術が提供する方式などのように、クルーの一種であ
る話題語とその集合である話題グループを、予め分類し
ておき、ユーザの発話がどの話題グループの語彙を含ん
でいるかを判定して、現在の話題を検出する方式も知ら
れている。
【0015】この方式では話題の履歴を参照して話題転
換の発生を検出することができる。しかし、対話例1の
中でユーザ発話U1は、カーナビが案内中の経路に含ま
れない地点をユーザが尋ねたという理由で話題転換と見
做され、逆の理由でユーザ発話U1は話題転換と見做さ
れなかった。
【0016】故に、ナビゲーションシステムのように、
現実世界における問題解決の進行に伴って動的に話題の
示す範囲が変わるような対話状況下においては、あらか
じめ静的に分類された話題語のグループを用いて話題の
転換を検出するということは、甚だ困難である。
【0017】
【発明が解決しようとする課題】音声やテキストなどを
用いて計算機と人間、あるいは計算機同士が自然言語で
対話を行い、協調的に問題解決するようなシステムにお
いては、問題解決が収束する方向へ導くような発話を、
計算機システムが提供するようにすることが重要であ
る。
【0018】そのためには、ある問題の解決に向けて相
互に交わされる発話が、問題解決に対してどのような影
響を与えるかをモデル化し、そのモデルを利用して問題
解決の流れを制御することが必要である。
【0019】話題の転換を検出する従来の方式として
は、特開平8−137874号公報に代表される、クル
ーと呼ばれる話題転換候補語の集合を文中から検出し、
あらかじめ定義された個々の話題転換候補語の話題転換
寄与指数を計算することによって話題転換発生の有無を
検出するものが挙げられる。
【0020】従来の研究におけるクルーとしては、例え
ば明示的に話題の転換を表現する「ところで」とか、
「さて」などの語彙や、話題を表現する名詞であること
を示す助詞である「は」(主語を表す)や「だ」(強調
を表す)が接続した自立語などが用いられている。
【0021】しかし、対話例1に見られるように、現実
の問題解決の場面において「ところで」や「さて」など
のような話題の転換を明示する語彙を用いることは少な
い。そもそも、ユーザ自身、話題転換が発生しているこ
とを意識している場合が少ないと云うこともあり、話題
転換を直接表現する語彙をクルーに採用することは現実
的でないと云える。故に、話題転換を直接表現する語彙
をクルーに採用することは実用的な対話システムにおい
て話題転換を検出するために有効な方法とはいえない。
【0022】また、自立語に接続する助詞を用いてクル
ーを定義することも、特に音声を利用したシステムにお
いては現実的ではない。このようなクルーを発話文から
認識するためには、発話文中にクルーを示す助詞が含ま
れていることを認識しなければならず、そのためには対
話処理システムの前処理部である音声認識部で助詞を認
識しなければならない。
【0023】しかし、音声認識部の認識語彙として助詞
を採用することは、音声認識結果に非常に多くの湧きだ
し誤り、すなわち、助詞が他の単語の一部であるかのよ
うな誤認識を多く発生させる事態を招き、処理速度の低
下や誤った文の認識、それに伴う意味処理部の負荷の増
大、などを起こす。
【0024】また、特開平7−239694号公報に開
示されている方式などのように、クルーの一種である話
題語とその集合である話題グループをあらかじめ分類し
ておき、ユーザの発話がどの話題グループの語彙を含ん
でいるかを判定して、現在の話題を検出する方式も知ら
れている。
【0025】この方式では話題の履歴を参照して話題転
換の発生を検出することができる。しかし、対話例1の
中でユーザ発話U1は、カーナビが案内中の経路に含ま
れない地点をユーザが尋ねたという理由で話題転換と見
做され、逆の理由でユーザ発話U1′は話題転換と見做
されなかった。
【0026】ナビゲーションシステムのように、現実世
界における問題解決の進行に伴って動的に話題の示す範
囲が変わるような対話においては、予め静的に分類され
た話題語のグループを用いて話題の転換を検出すること
は困難である。
【0027】そこで、この発明の目的とするところは、
話題の範囲の定義が動的に変化するような対話からでも
話題の転換を検出可能で、かつ対話が話題転換に追従で
き、しかも、話題転換の発生をユーザに自然に認識させ
ることできて、対話の自然な流れと協調的な問題解決を
実現することができるようにした対話処理システムのた
めの対話制御装置および対話制御方法を提供ことにあ
る。
【0028】
【課題を解決するための手段】上記目的を達成するた
め、本発明は次のように構成する。すなわち、本発明シ
ステムは、人間と計算機(コンピュータ)、または計算
機同士が自然言語による音声またはテキストを媒体とし
ての対話により、協調的にタスクを遂行することを支援
する装置であって、地上での自己位置を測定して位置情
報を出力するセンサと、入力された自然言語文を意味解
析してその結果を出力する意味処理手段と、発話者がタ
スク空間に対して意図した作用の記述であるタスクマネ
ージルールを記憶するタスクマネージルール記憶手段
と、タスクオブジェクトのクラス定義を記憶したタスク
テンプレート記憶手段と、各種の問題解決の解と解決ア
ルゴリズムとが定義され、要求に応じて対応のアルゴリ
ズムを実行するタスクオブジェクトと、複数のタスクオ
ブジェクトによってなされた現在までの問題解決の処理
の進行状況とその時々に生じる解決すべき問題を表現す
るタスク空間とを制御することによって対話を制御する
装置であって、前記意味処理手段による文意味解釈結果
にその発話者がタスク空間に対して意図した作用の記述
(タスクマネージルール)を付加した深層ユーザ意図表
現を出力するユーザ意図合成手段と、タスクオブジェク
トの実行優先順位などを記憶し、問題解決のスケジュー
ルや実行命令などをメッセージの形で出力する作用を持
つタスクスケジュール記憶手段205と、このタスクス
ケジュール記憶手段からのメッセージを解釈し、複数の
異なった目的を持つタスクオブジェクトを制御するタス
クスケジューラ機能を持ち、前記深層ユーザ意図表現、
前記タスクスケジューラ機能にて得られるメッセージ、
前記センサからの位置情報などの形で表現される外部状
況表現入力を解釈し、タスクオブジェクトの生成時など
必要時にはタスクオブジェクトの定義記述を参照するこ
とによって少なくともタスク空間中に存在するタスクオ
ブジェクトの状態を表現するスロットの値の変更、タス
クオブジェクトの生成、初期化、消去、タスクオブジェ
クトのスロット値の変化として表現されるタスクオブジ
ェクトの状態変化の検出、を含むタスク空間の管理を行
うタスクマネージャと、タスクマネージャや個々のタス
クオブジェクトからの出力生成要求を受けて当該出力生
成要求対応に所要の自然言語を生成し、音声またはテキ
ストの形式で出力する出力生成手段とより構成すること
を特徴とする。
【0029】このような構成の本発明システムは、人間
が入力した自然言語文を形態素解析および意味解析した
結果を出力する言語処理モジュールである文意味解釈部
203の出力を利用し、問題解決の解と解決アルゴリズ
ムが定義された各種タスクオブジェクトを用いて、複数
のタスクオブジェクトによって現在までの問題解決の進
行状況と解決すべき問題を表現するタスク空間を監視・
制御することにより、対話を制御し、解を得ることを基
本としている。
【0030】タスクマネージルール記憶手段には、発話
者がタスク空間に対して意図した作用の記述であるタス
クマネージルールが記憶させてあり、深層ユーザ意図表
現を出力するユーザ意図合成手段は、このタスクマネー
ジルール記憶手段と構文解析結果とタスクマネージルー
ルをマップするためのルールを記述したテーブルを参照
して文意味解釈結果にタスクマネージルールを付加した
結果である深層ユーザ意図表現を出力する。タスクマネ
ージャは、深層ユーザ意図表現を解釈し、タスク空間中
の個々のタスクオブジェクトに対して少なくとも次の作
用をもたらす。
【0031】(作用1):タスクオブジェクトの状態を
表現するスロットの値を変更する。
【0032】(作用2):タスクテンプレート記憶部に
記憶されたタスクオブジェクトのクラス定義を参照し
て、タスクオブジェクトを生成、初期化する。
【0033】(作用3):タスクオブジェクトをタスク
空間から消去する。
【0034】タスク空間中の各々のタスクオブジェクト
には、少なくとも、問題解決手続きの定義、問題が解決
された結果を表現するスロットとその値、問題解決手続
きの実行状態が記述されている。深層ユーザ意図表現の
一部であるタスクマネージルールは、原則として、ユー
ザの発話が既存の問題解決に関係した質問であったり、
既存の問題解決を継続することを意図するような場合に
は、既存のタスクオブジェクトによって問題解決を行
い、解決結果を出力生成手段に出力する働きを持った手
続きとなる。また、ユーザの発話が既存の問題解決を変
更したり、新たな問題解決の実行を意図したりするよう
な場合には、タスク空間に既存のオブジェクトに対して
“(作用1)”の作用を及ぼすだけでなく、“(作用
2)”によって新たなタスクオブジェクトをタスク空間
に生成する手続きとなる。タスクオブジェクトによって
表現された問題解決が終了した場合や、ユーザ発話によ
って問題解決の放棄が表明された場合などには、主に
“(作用3)”により、不要となったタスクオブジェク
トをタスク空間から消去する手続きとなる。
【0035】経路案内をはじめとして、多くのタスクを
遂行するための対話において「話題」の概念は、問題解
決の対象領域についての知識と密接に関係している。こ
のような対話では、問題解決の対象領域が変化すると、
話題の概念が変化してしまう。
【0036】本発明では、話題転換をタスク空間におけ
る解決実行中のタスクオブジェクトの状態変化、あるい
は、新しいタスクオブジェクトの生成としてモデル化し
ている。
【0037】これによって、タスクマネージルール記憶
手段、ならびにタスクマネージャによるタスク空間への
作用の記述が正確になされてさえいれば、タスク空間の
状態変化を検出するだけで話題の転換を認識することが
できる。
【0038】さらに、タスクオブジェクトの実行優先順
位などを記憶し、問題解決のスケジュールや実行命令な
どをメッセージの形で出力する作用を持つタスクスケジ
ュール記憶手段からのメッセージを解釈することによっ
てタスクマネージャは複数の異なった目的を持つタスク
オブジェクトを制御するタスクスケジューラ機能が実現
される。これによって、ユーザが発話による異なった種
類の問題解決を実行する場合を含む対話の制御を実現可
能になる。
【0039】また、ユーザは、計算機による問題解決の
手順を意識しないで問題解決システムを利用することが
多く、計算機システムが実行する問題解決の観点から見
れば話題が転換したと言える場合でも「さて」とか「と
ころで」などの話題転換を明示的に表現するような語彙
を含まない発話をすることが多い。
【0040】本発明が提供する装置では、タスクマネー
ジャや個々のタスクオブジェクトからの出力生成要求を
入力として文を生成し、合成音声やテキストの形式で出
力する出力生成手段が、タスクマネージャから話題転換
の通知を受けた場合に出力インターフェースである音声
の音質を変えたり、画面に表示されるエージエントの姿
や動作を変えたりする機能を備えたことによって、ユー
ザの発話が問題解決の観点から見て話題を転換させたこ
とをユーザに認識させることが可能となり、ユーザに計
算機の問題解決状態が変化したことを知らせることでユ
ーザ側の問題解決への理解と協調が促進され、問題解決
を収束方向に向かわせる発話を促すことが可能となる。
【0041】このように、本発明は話題の範囲の定義が
動的に変化するような対話からでも話題の転換を検出可
能であり、かつ対話が話題転換に追従でき、さらに検出
結果を合成音の変化やディスプレイ表示の変化など、ユ
ーザインターフェース出力部の変化として自然にユーザ
にフィードバックすることによってユーザに話題転換の
発生を認識させ、対話の自然な流れと協調的な問題解決
を実現することができるようになる対話処理システムの
ための対話制御装置および対話制御方法を提供できる。
【0042】
【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。 (本発明の基本的概念)初めに本発明の基本的概念を図
1を参照して説明する。本発明システムは、人間と計算
機(コンピュータ)、または計算機同士が自然言語によ
る音声またはテキストを媒体としての対話により、協調
的にタスクを遂行することを支援する装置であって、地
上での自己位置を測定して位置情報を出力するセンサ2
12と、入力された自然言語文を意味解析してその結果
を出力する言語処理モジュールである文意味解釈部(言
語の意味処理手段)203と、発話者がタスク空間21
0に対して意図した作用の記述であるタスクマネージル
ールを記憶するタスクマネージルール記憶部207と、
タスクオブジェクトのクラス定義を記憶したタスクテン
プレート記憶部208と、各種の問題解決の解と解決ア
ルゴリズムとが定義され、要求に応じて対応のアルゴリ
ズムを実行するタスクオブジェクトと、複数のタスクオ
ブジェクトによってなされた現在までの問題解決の処理
の進行状況とその時々に生じる解決すべき問題を表現す
るタスク空間とを制御することによって対話を制御する
装置であって、前記意味処理部203による文意味解釈
結果にその発話者がタスク空間に対して意図した作用の
記述(タスクマネージルール)を付加した深層ユーザ意
図表現を出力するユーザ意図合成部204と、タスクオ
ブジェクトの実行優先順位などを記憶し、問題解決のス
ケジュールや実行命令などをメッセージの形で出力する
作用を持つタスクスケジュール記憶部205と、タスク
スケジュール記憶部205からのメッセージを解釈し、
複数の異なった目的を持つタスクオブジェクトを制御す
るタスクスケジューラ機能を持ち、前記深層ユーザ意図
表現、前記タスクスケジューラ機能にて得られるメッセ
ージ、前記センサからの位置情報などの形で表現される
外部状況表現入力を解釈し、タスクオブジェクトの生成
時など必要時にはタスクオブジェクトの定義記述を参照
することによって少なくともタスク空間中に存在するタ
スクオブジェクトの状態を表現するスロットの値の変
更、タスクオブジェクトの生成、初期化、消去、タスク
オブジェクトのスロット値の変化として表現されるタス
クオブジェクトの状態変化の検出、を含むタスク空間の
管理を行うタスクマネージャ206と、タスクマネージ
ャ206や個々のタスクオブジェクトからの出力生成要
求を受けて当該出力生成要求対応に所要の自然言語を生
成し、音声またはテキストの形式で出力する出力生成部
211とより構成することを特徴とする。
【0043】このような構成の本対話制御装置100
は、計算機(コンピュータ)と人間が、自然言語による
音声またはテキストを媒体として対話を行うことによっ
て協調的に問題解決を行うシステムにおいて、人間が入
力した自然言語文を形態素解析および意味解析した結果
を出力する言語処理モジュールである文意味解釈部20
3の出力を利用し、問題解決の解と解決アルゴリズムが
定義された各種タスクオブジェクトを用いて、複数のタ
スクオブジェクトによって現在までの問題解決の進行状
況と解決すべき問題を表現するタスク空間210を監視
・制御することにより、対話を制御し、解を得ることを
基本とする装置である。
【0044】タスクマネージルール記憶部207には、
発話者がタスク空間210に対して意図した作用の記述
であるタスクマネージルールが記憶させてあり、深層ユ
ーザ意図表現を出力するユーザ意図合成部204は、タ
スクマネージルール記憶部207と構文解析結果とタス
クマネージルールをマップするためのルールを記述した
テーブルを参照して文意味解釈結果にタスクマネージル
ールを付加した結果である深層ユーザ意図表現を出力す
る。タスクマネージャ206は、深層ユーザ意図表現を
解釈し、タスク空間210中の個々のタスクオブジェク
トに対して少なくとも次の作用をもたらす。
【0045】(作用1):タスクオブジェクトの状態を
表現するスロットの値を変更する。
【0046】(作用2):タスクテンプレート記憶部2
08に記憶されたタスクオブジェクトのクラス定義を参
照して、タスクオブジェクトを生成、初期化する。
【0047】(作用3):タスクオブジェクトをタスク
空間210から消去する。
【0048】タスク空間210中の各々のタスクオブジ
ェクトには、少なくとも、問題解決手続きの定義、問題
が解決された結果を表現するスロットとその値、問題解
決手続きの実行状態が記述されている。深層ユーザ意図
表現の一部であるタスクマネージルールは、原則とし
て、ユーザの発話が既存の問題解決に関係した質問であ
ったり、既存の問題解決を継続することを意図するよう
な場合には、既存のタスクオブジェクトによって問題解
決を行ない、解決結果を出力生成部211に出力する働
きを持った手続きとなる。また、ユーザの発話が既存の
問題解決を変更したり、新たな問題解決の実行を意図し
たりするような場合には、タスク空間210に既存のオ
ブジェクトに対して“(作用1)”の作用を及ぼすだけ
でなく、“(作用2)”によって新たなタスクオブジェ
クトをタスク空間210に生成する手続きとなる。タス
クオブジェクトによって表現された問題解決が終了した
場合や、ユーザ発話によって問題解決の放棄が表明され
た場合などには、主に“(作用3)”によって不要とな
ったタスクオブジェクトをタスク空間から消去する手続
きとなる。
【0049】経路案内をはじめとして、多くのタスクを
遂行するための対話において「話題」の概念は、問題解
決の対象領域についての知識と密接に関係している。こ
のような対話では、問題解決の対象領域が変化すると、
話題の概念が変化してしまう。従来、対話における現在
の話題の検出や話題転換の検出を行なう方式としてあら
かじめ話題の概念および概念を表現するための語彙を静
的に分類しておいてユーザの発話に含まれる語嚢と話題
グループに含まれる語彙とのパターンマッチによるもの
が提案されてきたが、話題の概念が動的に変化するよう
な対話において話題の転換を検出することは困難であっ
た。この問題に対して、本発明が提供する装置ならびに
方式では、話題転換をタスク空間における解決実行中の
タスクオブジェクトの状態変化、あるいは、新しいタス
クオブジェクトの生成としてモデル化している。
【0050】これによって、タスクマネージルール記憶
部207、ならびにタスクマネージャ206によるタス
ク空間210への作用の記述が正確になされていれば、
話題のグループを分類したり話題転換を表現する特定の
語彙を検出したりすることなくタスク空間210の状態
変化を検出するだけで話題の転換を認識する機能が実現
される。
【0051】さらに、タスクオブジェクトの実行優先順
位などを記憶し、問題解決のスケジュールや実行命令な
どをメッセージの形で出力する作用を持つタスクスケジ
ュール記憶部205からのメッセージを解釈することに
よってタスクマネージャ206は複数の異なった目的を
持つタスクオブジェクトを制御するタスクスケジューラ
機能が実現される。これによって、ユーザが発話によっ
て異なった種類の問題解決を実行する場合を含む対話の
制御を実現することが可能になる。
【0052】また、ユーザは、計算機による問題解決の
手順を意識しないで問題解決システムを利用することが
多く、計算機システムが実行する問題解決の観点から見
れば話題が転換したと言える場合でも「さて」とか「と
ころで」などの話題転換を明示的に表現するような語彙
を含まない発話をすることが多い。
【0053】本発明が提供する装置では、タスクマネー
ジャ206や個々のタスクオブジェクトからの出力生成
要求を入力として文を生成し、合成音声やテキストの形
式で出力する出力生成部211が、タスクマネージャ2
06から話題転換の通知を受けた場合に出力インターフ
ェースである音声の音質を変えたり、画面に表示される
エージエントの姿や動作を変えたりする機能を備えたこ
とによって、ユーザの発話が問題解決の観点から見て話
題を転換させたことをユーザに認識させることが可能と
なり、ユーザに計算機の問題解決状態が変化したことを
知らせることでユーザ側の問題解決への理解と協調が促
進され、問題解決を収束方向に向かわせる発話を促すこ
とが可能となる。
【0054】このように、本発明は話題の範囲の定義が
動的に変化するような対話からでも話題の転換を検出可
能で、かつ対話が話題転換に追従でき、さらに検出結果
を合成音の変化やディスプレイ表示の変化など、ユーザ
インターフェース出力部の変化として自然にユーザにフ
ィードバックすることによってユーザに話題転換の発生
を認識させ、対話の自然な流れと協調的な問題解決を実
現することができるようにした対話処理システムのため
の対話制御装置および対話制御方法を提供できる。
【0055】(実施形態)本発明を、より具体的に説明
する。図2は、本発明の対話制御装置を組み込んだカー
ナビゲーションシステムのブロック図である。本発明の
ナビゲーションシステムは、図2に示すように、音声認
識部201、形態素解析部202、文意味解釈部20
3、ユーザ意図合成部204、タスクスケジュール記憶
部205、タスクマネージャ206、タスク空間マネー
ジルール記憶部207、タスクテンプレート記憶部20
8、ドメイン問題解決器群209、タスク空間210、
出力生成部211、センサ212、設定経路記憶部21
3、予定行為記憶部214、走行済み経路記憶部21
5、実行済み行為記憶部216、地理情報記憶部217
等からなる。
【0056】これらのうち、センサ212は、GPS
(グローバル・ポジショニング・システム:global pos
itioning system 、全世界的衛星航法システム(GNS
S=glo bal navigation satellite system )航行用人
工衛星を用いた航法装置であって、位置が正確にわかる
GPS用の複数の衛星から発射された同期電波を受信
し、当該電波の受信されるまでの時間差から、自己位置
から各衛星までの距離を求めて位置を推定する装置)や
慣性航法システムなどにより得た地上での自己位置と時
刻情報を出力する位置センサである。
【0057】また、音声認識部201は、ユーザからの
発話を音声信号として受けてこれを自然言語のラティス
に変換する処理をするものであり、形態素解析部202
はあらかじめ規定された統語規則を参照しながらラティ
スを解析して文の候補を抽出し、各々の文候補全てにそ
の構文情報を付加して出力するものである。
【0058】また、文意味解釈部203は、各々の形態
素解析結果を問題解決器が解釈可能な表現形式(以下、
意図表現と呼ぶ)に変換して出力する言語処理モジュー
ルであり、タスク空間マネージルール記憶部207は、
意図表現とタスク空間の修正方式との対応関係を記憶す
るものである。
【0059】また、ユーザ意図合成部204は、タスク
空間マネージルール記憶部207を参照して意図表現を
発話者が意図するタスク空間の修正方式にマップし、意
図表現とタスク空間の修正方式を合成した深層ユーザ意
図表現を出力するものであり、タスクテンプレート記憶
部208は、問題解決モデルについて形式的に表現した
タスクテンプレート(タスクオブジェクトの定義記述)
を複数蓄積したものである。
【0060】タスクスケジュール記憶部205は、タス
クの実行順を形式的に表現したタスクスケジュールを記
憶するものである。
【0061】また、タスクマネージャ206は、前記セ
ンサ212から現在時刻と現在位置を受け、また、前記
ユーザ意図合成部204からの出力や、タスク空間21
0に存在する個々のタスクオブジェクトの状態変化を検
出し、タスクスケジュールに基づいてタスク空間210
の管理を行うものであって、深層ユーザ意図表現、タス
クスケジューラからのメッセージ、センサからの信号な
どの形で表現される外部状況表現入力を解釈し、タスク
オブジェクトの生成時など必要時にはタスクオブジェク
トの定義記述を記憶するタスクテンプレート記憶部20
8を参照することによって少なくともタスク空間210
中に存在するタスクオブジェクトの状態を表現するスロ
ットの値の変更、タスクオブジェクトの生成、初期化、
消去、タスクオブジェクトのスロット値の変化として表
現されるタスクオブジェクトの状態変化の検出、を含む
タスク空間210の管理を行うものである。尚、タスク
空間210は、発話の進行状態を表現するオブジェクト
の集合である。
【0062】また、ドメイン問題解決器群209は、各
々のタスクオブジェクトからの問題解決実行要求を受け
てドメイン知識を参照しながら問題解決を実行し、解を
出力するものであり、また、出力生成部211は、タス
クマネージャ206やタスク空間210中のタスクオブ
ジェクトから出力生成要求があったときにユーザに対し
て適切な出力を生成し、スピーカやディスプレイなどの
インターフェースに出力するものである。
【0063】なお、前記ドメイン問題解決器群209に
は場所解決器209a、区間解決器209b、経路解決
器209c、〜などがある。そして、場所解決器209
aは、場所に関する問題解決実行要求を受けてドメイン
知識を参照しながら問題解決を実行し、解を出力するも
のであり、区間解決器209bは、区間に関する問題解
決実行要求を受けてドメイン知識を参照しながら問題解
決を実行し、解を出力するものであり、経路解決器20
9cは、経路に関する問題解決実行要求を受けてドメイ
ン知識を参照しながら問題解決を実行し、解を出力する
ものである。
【0064】設定経路記憶部213は、現在地若しくは
ユーザの指定した起点とユーザの指定した行き先の情報
とに基づいてナビゲーションシステムが計算して求めた
経路情報を記憶する装置であり、予定行為記憶部214
は、処理予定の行為を記憶するものであり、走行済み経
路記憶部215は、走行予定の経路のうちの走行済み部
分の経路情報を記憶するものであり、実行済み行為記憶
部216は、予定行為のうちの実行済み行為を記憶する
ものであり、地理情報記憶部217ナビゲーションのた
めの基本データである地理情報を記憶するためのもので
ある。
【0065】図3(詳細は図3の部分拡大図である図4
乃至図7参照)は、本実施例におけるタスク空間の遷移
を表現する図である。図において、TSP−t1,TS
P−t2,… ,TSP−t6なるラベルが付いた1つ
1つの長方形枠は、時刻t1,t2,…,t6における
タスク空間の状態を表し、各々のタスク空間中の丸角長
方形枠は、各々の時刻においてタスク空間中に存在する
タスクオブジェクトの状態を表現している。
【0066】また、タスク空間左の時間軸は、時間が図
面上部から下部に向かって経過することを表している。
タスクマネージャ206はナビゲーションシステムのユ
ーザによる経路設定、経路や地理情報に関する質問受
理、発話からの経過時間やセンサからの情報受理などを
きっかけとして、各々タスクオブジェクトの内部状態を
変更する機能を持つ。
【0067】図8は、一般のタスクオブジェクトについ
ての状態遷移図である。タスクオブジェクトのそれぞれ
には問題解決モデルが定義されており、タスクマネージ
ャ206によって問題解決実行を要求されたタスクオブ
ジェクトは、自身に定義された問題解決アルゴリズムを
実行する。そして、その問題解決アルゴリズムを実行
中、必要に応じて問題解決領域固有の知識を参照するド
メイン問題解決器群209を呼出したり、音声合成器や
ディスプレイなどの出力生成モジュール(出力生成部2
11)ヘ出力したりする。
【0068】次に、本実施例の実施状況、特に車両の位
置に関する設定を、実施例中で用いる地点と各々の間の
関係を表す図9を参照して説明する。
【0069】本ナビゲーションシステムを搭載した車両
は、現在、「摩耶入口」から「阪神高速道路3号神戸
線」に入り、「西宮」、「阪神高速道路4号湾岸線」、
「天保山出口」を経由して目的地である「海遊館」へと
向かっているとする。
【0070】摩耶入口から海遊館までの経路は出発時に
指定された行き先の情報に基づいてナビゲーションシス
テムが既に計算しており、その計算済みの経路情報はナ
ビゲーションシステムの設定経路記憶部213に記憶さ
れている。現在地は、「摩耶入口」と「魚崎入口」付近
の間である。
【0071】現在地から「万博記念公園」に向かうため
の最短経路は、「西宮」から「名神高速道路」に乗り換
えて「吹田出口」を経由するものであり、「大阪城」へ
向かうためのそれは「阿波座出口」付近で「阪神高速道
路13号東大阪線2に乗り換えて「森之宮出口」を経由
するものであるとする。
【0072】現在地を走行している状態で、ドメイン問
題解決器群209に接続された各記憶部213〜217
には、図11の内容を含むナビゲーションに必要な情報
が記憶されている。
【0073】図11における行番号2から行番号7まで
の内容は、設定経路記憶部213の記憶内容を示す。こ
こでの設定経路情報としては、「経路の始点が摩耶入口
であり、終点が海遊館である」こと、また、「その間に
ユーザによって必ず通過することを指示された地点であ
る特別経由地点がない」こと、さらに、経路始点と経路
終点を結ぶ経路の情報が記憶されている。
【0074】また、図11における行番号10の内容
は、実行済み行為記憶部216の記憶内容を示す。ここ
には、「カーナビゲーションシステムが、時刻13:3
0:00に、摩耶入口を出発した旨をユーザに説明し
た」、という行為が記憶されている。
【0075】カーナビゲーションシステムが起動した直
後、まず図13に示す如きのタスクマネージャ動作定義
に従って、タスクマネージャ206が動作する。
【0076】<タスクマネージャの動作>本実施例にお
ける摩耶入口を通過した直後、タスクマネージャ206
は、ナビゲーションシステムが起動直後の状態であるこ
とを検出して、図13の行番号5のステップに進む。そ
して、同図13中の行番号6,7のステップを実行する
ことにより、設定経路記憶部、予定行為記憶部、実行済
み行為記憶部を参照して「経路を説明する」クラスを初
期化し、インスタンスを生成すると云う処理をする。
【0077】すなわち、これらのステップによってタス
クマネージャ206は、図11に示される各記憶部の初
期化情報を参照して、図10に示したタスククラス「経
路を説明する」の各スロット値を初期化する。なお、図
10に示したタスククラス「経路を説明する」の定義内
容は、タスクテンプレート記憶部208に記憶されてい
る。
【0078】タスクマネージャ206による以上の初期
動作によって初期化されたタスクオブジェクト「海遊館
への経路を説明する」の例を図12に示す。
【0079】このタスクマネージャ206の初期動作の
結果、タスク空間210は、図3(図3の部分拡大図で
ある図4参照)のTSP−t1のようになっている。図
3、図4のTSP−t1中にあるタスクオブジェクト
は、図12を図で表現したものである。なお、初期化に
際しては、タスクオブジェクトにタスクID(識別符
号)が与えられる。図12のタスクオブジェクトの場
合、IDはT1である。
【0080】上述の状況、すなわち、タスク空間210
が図3、図4のTSP−t1である状況下において、時
刻13:31:00の時点に、センサ212からタスク
マネージャ206に対して車両の現在位置が「魚崎入口
手前300メートル」地点である旨の通知があったとす
る。
【0081】すると、タスクマネージャ206は、図1
3の行番号25,26,27に示す現在位置情報を、セ
ンサ212から現在位置情報を受けた時の処理定義に従
って、タスク空間(現在、図3のTSP−t1の状態に
ある)からタスク状態が解決実行中である「経路を説明
する」クラスのタスクオブジェクトT1を同定する。
【0082】ここで「経路を説明する」クラスのタスク
状態は、スロット「TaskState」の値で表現さ
れる。そして、タスクオブジェクトT1に対して、セン
サ212から受けた現在地情報である「魚崎入口手前3
00メートル」と、出力生成部211へのポインタを引
数として、経路を説明するクラスで定義された手続き
「地点説明」を実行するようにメッセージを通知する。
図10に示したタスククラス「経路を説明する」の定義
記述中、行番号16から行番号20までが、手続き「地
点説明」の定義である。タスクオブジェクトT1は、図
12の行番号16に示される通り、タスクポインタが現
在「摩耶入口での説明生成」を指している。
【0083】手続き「地点説明」は、はじめに、タスク
ポインタが指す地点の次の地点、すなわち、摩耶入口の
次に説明を生成する予定の地点を、「TaskPara
meter」の2地点間経路を参照しながら解決する。
本実施例の場合、解決結果は「魚崎入口付近」となる。
【0084】次に、図10の行番号17と行番号18に
示したif文の条件部を、ドメイン問題解決器群209
へ解決要求のメッセージを通知することによって、判定
する。
【0085】ドメイン問題解決器群209は、タスクオ
ブジェクトT1が経路として持つ「魚崎入口付近」と呼
ばれるものが、センサ212から通知されてきた地点
「魚崎入口手前300メートル」と、地理的に近い距離
にあることを、ドメイン問題解決器群209における場
所解決器209aにより、判定する。
【0086】最後に、条件部が“真”になったことを受
けて、タスクオブジェクトT1は図10の行番号19の
ステップを実行し、魚崎入口付近を通過する旨の文を出
力することを出力生成部211に要求する。出力生成部
211は要求に従って、例えば『まもなく魚崎入口付近
を通過します』という文を生成し、インタフェースに与
えて音声としてアナウンス出力させる。
【0087】以上のメッセージ処理の結果、タスクオブ
ジェクトT1の最終発話時刻スロットの値が「13:3
1:00」、タスクポインタスロットの値が「説明生成
(魚崎入口付近)」に書き換えられ、タスク空間210
は、図3中のTSP−t2で表現される状態に遷移す
る。
【0088】次にユーザが、時刻t2に『出口はどこ
?』という質問文を音声入力したとする。当該ユーザの
発話は、音声認識部201で音声認識され、形態素解析
部202により構文解析され、文意味解釈部203にて
その文を発声したユーザが解決を意図する問題の表現に
変換される。
【0089】構文解析、意味解析の方法としては様々な
方式が提案されており、例えば、構文解析の方式として
は、本件発明者等が開発して既に特許出願済みの技術で
ある特願平−64432号に開示した技術等も本発明と
の親和性が高い。
【0090】本実施例では、構文解析部として当該特願
平−64432号に開示した技術を採用するものと仮定
して話を進めるが、勿論、これに限定されるものではな
く、他の方式であっても構わない。
【0091】ここで、特願平−64432号に開示した
当該構文解析技術について、簡単に触れておく。この開
示の技術は、音声で利用者が文発声をしたり、文章を文
字認識したりするような場合において、候補となる単語
や文字が格子状に組み合わされた形式である「ラティス
形式」で表現できるような認識結果を使用して情報解析
するもので、品詞系列のハッシュ辞書を参照しながら入
力ラティス、すなわち、「利用者の入力の認識結果とし
て得られるラティス構造」を展開することなく、かつ、
高速に解析処理を行い、尤もらしい入力要素カテゴリ系
列を導くことができるようにした情報解析方式を提供す
る。
【0092】具体的に代表例を説明すると、開始ノード
と終了ノードと一つ以上のデータノードから構成される
有向グラフであって、各ノードが他の一つ以上のノード
と順序関係を持つ有向枝で連結され、一つ以上の開始ノ
ードから終了ノードに到達し得る経路である解経路候補
を持つようなグラフ構造に変換可能な入力情報を、当該
入力情報の各要素の表象となり得る終端記号の集合と前
記各終端記号が所属するカテゴリであるカテゴリ記号の
集合の和集合の要素の系列で表される受理可能な受理パ
ターン記号列の集合に基づいて解析し、零個以上の尤も
らしい受理パターン記号列を出力する情報解析方法にお
いて、前記開始ノードもしくは終了ノードから前記グラ
フ構造の解析を開始する解析開始ノード決定ステップ
と、前記グラフ構造の各ノードの解析の途中経過におい
てそのノードが解経路候補の開始点または終了点からあ
る順番で解経路候補に含まれる場合にとり得る受理パタ
ーン記号列を計算してノードに記録する受理パターン記
号列計算・蓄積ステップと、前記グラフ構造の各ノード
の解析の途中経過においてそのノードに対する解析の経
路パターンを網羅したか否かを判定するノード解析網羅
判定ステップと、あるノードについてそのノードの解析
経路パターンが網羅された場合に零回以上の受理パター
ン記号列計算・蓄積ステップの実行によって蓄積された
そのノードへの受理パターン記号列を、解析においてそ
のノードの次に接続されている一個以上のノードに伝播
させる受理パターン記号列伝播ステップと、解析が終了
したかどうかを判定する解析終了判定ステップと、解析
が終了した際に前記開始ノードもしくは終了ノードに蓄
積されている受理パターン記号列情報を用いて前記解析
結果の出力である零個以上の尤もらしい受理パターン記
号列を収集し、出力する受理パターン記号列収集・出力
ステップとからなることを特徴としている。
【0093】すなわち、この情報解析方法は、処理開始
により、まず初期化処理(S1)が行われる。その後終
了が選択されるまで、入力に対する解析処理を行うルー
プに入る。そして、入力の認識結果が伝達されると(S
2)、それを入力ラティスに再構成し(S5)、入力ラ
ティス上で解釈処理を行って受理可能な入力要素カテゴ
リ系列の集合を構成し(S3)、得られた入力要素カテ
ゴリ系列集合を元に入力ラティスを再スキャンすること
で、受理可能な入力要素系列集合を得る(S4)。ここ
で文発声に対する音声ワードスポッティングの場合、
(S3)の出力である入力要素カテゴリ系列集合とは受
理可能な品詞系列の集合であり、(S4)の出力である
入力要素系列集合とは単語系列の集合となる。
【0094】この技術によれば、展開により極めて多数
の入力要素系列候補を導く入力ラティス様のデータを構
築し得る入力認識結果の解析において、与えられた受理
可能構文規則を満足する尤もらしい入力要素系列を合理
的に導くことができる。
【0095】また、この解析方法は、開始ノードと終了
ノードと一つ以上のデータノードから構成される有向グ
ラフであって、各ノードが他の一つ以上のノードと順序
関係を持つ有向枝で連結され、一つ以上の開始ノードか
ら終了ノードに到達し得る経路である解経路候補を持つ
形式のグラフ構造に変換可能な入力情報を、当該入力情
報の各要素の表象となり得る終端記号の集合と前記各終
端記号が所属するカテゴリであるカテゴリ記号の集合の
和集合の要素の系列で表される受理可能な受理パターン
記号列の集合に基づいて解析することにより、零個以上
の尤もらしい受理パターン記号列を出力する情報解析方
法において、前記受理可能な受理パターン記号列のう
ち、特定の部分系列である部分受理パターン記号列を構
成し、また、その部分受理パターン記号列を一つのカテ
ゴリ記号として利用し、受理パターン記号列を再帰的に
構成し、階層受理パターン記号列集合を生成する階層受
理パターン記号列生成ステップと、前記階層受理パター
ン記号列集合の中から、全てのカテゴリ記号が既知であ
る前記部分受理パターン記号列を選択する部分受理パタ
ーン記号列選択ステップと、前記階層部分受理パターン
記号列集合の中の、各部分受理パターン記号列が既に選
択されたか否かを記憶する処理状態管理ステップと、こ
の処理状態管理ステップにて記憶した情報から、選択さ
れた部分受理パターン記号列が最終の記号列か否かを判
定し、最後でない場合は無条件で前記開始ノードと終了
ノードとに全てのデータノードを連結して、前記選択さ
れた部分受理パターン記号列を受理パターンとした前記
解析を実施し、最後の場合は、前記選択された部分受理
パターン記号列を受理パターンとした前記解析を実施す
ることにより、尤もらしい部分受理パターン記号列を出
力する解析ステップと、前記収集された尤もらしい部分
受理パターン記号列集合と前記各ノードに蓄積された各
ノードの受理パターン記号列の情報を用いて前記グラフ
構造を探索し、前記尤もらしい受理パターン記号列集合
の各要素を生成し得る零個以上の解経路候補の集合を発
見し、各経路に存在するノードをマージし、その所属カ
テゴリを該当する部分受理パターンとする新たなノード
を作成する新規ノード生成ステップと、前記処理状態管
理ステップから、全ての部分受理パターン記号列につい
て解析ステップを通過したか否かを判定し、全ての部分
受理パターン記号列につて解析ステップを通過した場合
に処理を終了する終了条件判定ステップとを具備するこ
とを特徴としている。
【0096】このような本解析手法は、従来、該当受理
パターン記号列伝搬法において、正解となり得る品詞系
列の集合が増大した場合に、記憶すベきハッシュ辞書の
規模が大きくなり、膨大な量のメモリを必要とするこ
と、また、解析途中の伝搬処理に必要な集合演算の規模
が大きくなるため、計算量においても大きなコストを必
要とし、また、正解となり得る品詞系列を生成するため
の、文型辞書にも配慮が必要であったという問題を解決
し、正解となり得る品詞系列の集合が増大した場合にお
いても、使用するメモリ量の増加を抑制し、解析時の伝
搬処理の際の計算量の増加を抑制するラティス解析手法
を提供できる。また、該当受理パターン記号列伝搬法に
おける品詞系列を生成するための文型辞書についても、
システム管理者が管理し易い形式を与えることができ
る。
【0097】例えば、このような構文解析方法により、
前述したようにユーザが、時刻t2に発した『出口はど
こ?』という質問文に対して、音声認識部201、形態
素解析部202を通って構文解析され、文意味解釈部2
03を通ってその文を発声したユーザが解決を意図する
問題の表現に変換される。
【0098】このユーザ発話『出口はどこ?』の場合、
まず初めに構文解析器である形態素解析部202に入力
され、形態素解析されて図14中のL1のような構文情
報に加工される。
【0099】つまり、L1は、 文型ID:GType:Where1 品詞列:経由地 疑問詞WHERE 単語列:出口 どこ といった内容である。
【0100】このL1は、文意味解釈部203に入力さ
れる。文意味解釈部203では、あらかじめ用意され
た、ユーザ発話文の文型と表層意図表現を対応づけたも
のを参照して、構文情報にその構文を用いたユーザの意
図を表現する情報を付加する。
【0101】図15に、本実施例で用いる構文情報とユ
ーザ意図をマップするためのテーブルを示す。図15の
テーブルの第1列は、文に対して付与された文型のID
(識別符号)を示す。前述の『出口はどこ?』の文に
は、「Where1」なるIDが付与されている。
【0102】テーブルの第2列には、第1列のIDを付
与された文を用いたユーザが意図する問題解決の手続き
の名称が記述されている。文型IDとして「Where
1」を付与されたユーザ発話『出口はどこ?』に対応す
るユーザ意図は、図15のテーブルの第2列を参照する
と、「場所の名前と位置をたずねる」である。
【0103】参考までに、この「場所の名前と位置をた
ずねる」というのは、「現在注目している経路の上で、
出口と呼ばれるものの名前と位置を教えて欲しい」とい
う問題解決手続きの名称である。
【0104】以上の文意味解釈部203の動作の結果、
『出口はどこ?』と云う内容のユーザ発話L1は、図1
4中の表層意図表現S1に変換される。
【0105】つまり、ユーザ発話L1は、 文型ID:GType:Where1 品詞列:経由地 疑問詞WHERE 単語列:出口 どこ 解決方式:場所解決(出口) 要求値:解決された場所の名前と位置 といった内容の表層意図表現S1になる。
【0106】この表層意図表現S1はユーザ意図合成部
204に渡される。すると、ユーザ意図合成部204
は、ユーザ意図表現によって表された1つの問題解決が
タスク空間210にどのような影響を与えるかという情
報を、表層意図表現に付加して深層ユーザ意図表現を合
成する。
【0107】ユーザの発話意図と深層ユーザ意図の対応
は、図15中の表の第2列と第3列に記述されている。
例えば、構文情報中の文型IDが「Where1」であ
る文は、文意味解釈部203の動作の結果「場所の名前
と位置を尋ねる」という名称で参照される表層ユーザ意
図表現に変換され、さらに、表の第3列を参照して「地
点の名前と位置を尋ねる」という名称で参照されるタス
ク空間マネージルールが付加され、深層ユーザ意図表現
となる。
【0108】例えば、上述のユーザ発話『出口はどこ
?』の場合、図14中の表層意図表現S1には、「地点
の名前と位置を尋ねる」という名称のタスク空間マネー
ジルールが付加される。タスク空間マネージルール「地
点の名前と位置を尋ねる」は、具体的には図16に示す
フローチャートで表現される手続きであり、これを図1
4中の表層意図表現S1に付加することで深層ユーザ意
図表現D1が生成される。
【0109】すなわち、表層意図表現S1は、 文型ID:GType:Where1 品詞列:経由地 疑問詞WHERE 単語列:出口 どこ 解決方式:場所解決(出口) 要求値:解決された場所の名前と位置 タスク空間マネージルール:地点の位置をたずねる といった内容の深層ユーザ意図表現D1になる。
【0110】この深層ユーザ意図表現D1はタスクマネ
ージャ206に与えられる。これにより、タスクマネー
ジャ206は、図13の行番号12から行番号15まで
の手続きを実行する。つまり、図13の行番号12から
行番号15までに記述されたプログラム内容を実行す
る。
【0111】まず、行番号13のステップを実行するこ
とより、タスク空間マネージルールを抽出する。「出口
はどこ?」のタスク空間マネージルールは、「地点の名
前と位置を尋ねる」であり、上述した通り、その手続き
は図16に示すフローチャートで表現される。
【0112】すなわち、「出口はどこ?」という「地点
表現1」を受けたことにより、この処理に入る前段階の
準備として、現在解決実行中のタスクXを取り出し(ス
テップS101)、そのタスク状態を解決中断待機中の
状態に設定する(ステップS102)。そして、「地点
表現1」は直接KB(キーボード)から検索可能か否か
をチェックする(ステップS103)。
【0113】その結果、直接実行可能ならば、タスク状
態が解決中断待機中のタスクXを取り出す(ステップS
114)。そして、取り出したタスクXの設定経路に
「地点1」が含まれるか否かをチェックする(ステップ
S115)。その結果、含まれているならば、「地点
1」の地名と位置を出力し(ステップS117)、タス
クXのタスク状態を解決実行中にする(ステップS11
8)。また、ステップS115での判断の結果、取り出
したタスクXの設定経路に「地点1」が含まれていない
場合には、タスククラスを「経路説明」に、タスク状態
を「解決実行待ち」に、そして、経路終点を「地点1」
にしたタスクYを、新規に生成する。
【0114】一方、ステップS103におけるチェック
である「地点表現1」は直接KBから検索可能か否かの
チェックの結果、直接実行できないならば、タスク状態
を解決実行待ちであって、発話時刻最新のタスクAを検
出する(ステップS104)。そして、その検出したタ
スクAが空であるか否かをチェックし(ステップS10
5)、その結果、空であれば解決中断中のタスクkを取
り出す(ステップS111)。そして、そのタスクkの
タスク状態を解決実行中に設定し、タスクkについて
「地点表現1」を解決して出力する(ステップS11
2,S113)。
【0115】また、ステップS105におけるチェック
の結果、タスクAが空でない場合には、タスクAの設定
経路が空であるか否かをチェックし(ステップS10
6)、その結果、空であればタスクAの経路始点を現在
地にし、タスクAの経路設定を経路始点,経路終点、そ
して、タスクAのタスク状態を解決実行待ちとしてから
ステップS108に移る(ステップS107)。
【0116】ステップS106でのチェックであるタス
クAの設定経路が空であるか否かのチェックの結果、空
でなければタスクAについて「地点表現1」を解決して
出力する(ステップS108)。そして、解決中断中の
タスクLを取り出し、実行再開させると共に、このタス
クLのタスク状態を解決実行中にする(ステップS10
9,S110)。
【0117】このような処理によりタスク空間マネージ
ルールを抽出することができる。
【0118】図13における行番号13のステップの実
行により、タスク空間マネージルールを抽出したなら
ば、次に、図13の行番号14のステップに進み、タス
ク空間マネージルールの解釈を行う。ここで云うタスク
空間マネージルールの解釈とは、タスク空間マネージル
ールとして定義されている手続きの実行のことである。
【0119】<タスク空間マネージルールの解釈処理の
概要>本タスク空間マネージルールの解釈処理の概要
を、図16および当該図16の部分拡大図である図1
7,図18を参照して説明する。ここでは、発話『出口
はどこ?』に対する処理を例にとる。ステップS10
1,S102では、それまで行っていたナビゲーション
タスクを一旦退避させている。
【0120】ユーザがナビゲーションシステムに対して
地点の位置を尋ねるときには、現在ガイド中の経路につ
いて、より詳しい情報を得ることを意図している場合
と、新しい目的地を設定してルートの変更を意図してい
る場合がある。後者の変更後のルートとしては、「現在
案内中の目的地へ行くのを止めて新しい目的地だけに行
く」ものや、「新しい目的地を経由して現在案内中の目
的地に向かう」もの、さらに、「現在案内中の目的地に
向かってから新しい目的地に向かう」ものなどが挙げら
れる。このようなルート変更を実現するために、このス
テップでは現在のルート案内に対応するタスクを退避さ
せる。
【0121】次にステップS103では、ユーザが地点
の位置を固有名称で尋ねているのか、代名詞や別名など
を用いて間接的に尋ねているのかを判定する。ナビゲー
ションシステムのユーザが『万博公園はどこ?』のよう
に固有名称を用いて地点の位置を尋ねる場合に、それは
設定中のルートにある「万博公園」までの距離を知りた
い場合であったり、あるいは現在案内中のルート設定を
取り消して、新たに万博公園を目指すルートの設定を意
図する場合であったりすることが考えられる。
【0122】本ステップS103は、そのような場合を
区別して対話システムが応答することを意図している。
『出口はどこ?』の地点表現「出口」は、固有名称では
ないので、「出口」という別名で呼ばれる地点を検索す
る。
【0123】次にステップS104では、ユーザが代名
詞や別名などを用いて間接的に尋ねている地点がタスク
空間中のどのタスクに含まれているかを判定する。ユー
ザが間接表現を用いて参照する場所は、ユーザが現在最
も興味のある話題、すなわち、最も最近設定された経路
であると考えられる。従って、このことを反映させる必
要がある。
【0124】そこで、この考えを実行に反映するため
に、ステップS104では、解決実行待ちタスクのう
ち、生成時刻最新のものを検出し、そのタスクがユーザ
の興味の対象であると判断する。この例の場合、『出口
はどこ?』の発声がなされた時点で、解決実行待ちのタ
スクはないので、処理はステップS111に進み、解決
中断中のタスク、すなわち、「海遊館に至る経路を説明
するタスク」が検出される。この経路について地点参照
表現「出口」を解決したものは「天保山出口」となる。
【0125】最後にステップS113において、タスク
オブジェクトが出力生成部211に対して、「出口は天
保山である」ことを文表現に直して音声合成出力するよ
うに要求し、出力生成部211はこの要求に従って出力
生成処理をする結果、出力インターフェースであるスピ
ーカから『出口は天保山です』と云う音声が出力され
る。以上がタスク空間マネージルール抽出処理である。
【0126】続けてナビゲーションシステムのユーザ
が、『大阪には何がある?』と発声したとする。ユーザ
の当該発話は、音声認識部201で音声認識され、形態
素解析部202で形態素解析され、文意味解釈部203
で意味解釈され、更にユーザ意図合成部204にて意図
合成処理される結果、図14中のL3(形態素解析結
果)、S3(意味解析結果)、D3(深層意図合成結
果)と変換され、図19に示すタスク空間マネージルー
ルを付加されてタスクマネージャ206に入力されるこ
とになる。
【0127】タスクマネージャ206は、ユーザの発話
を「範囲から条件を満たす地点を検索する」というメッ
セージに加工して、タスク空間の操作を行う。発話『大
阪には何がある?』の場合、範囲表現は「大阪」であ
り、地点表現は発話文中に陽に現れていない。従って、
ここではデフォルト処理をして、その結果、図19の範
囲Xは大阪、地点表現Yは「観光地」となる。
【0128】ステップS203では、ユーザの質問が現
在システムが案内中の経路について尋ねているのか、新
たな経路設定を目的として情報収集のために発した質問
なのかを判断している。
【0129】発話『大阪には何がある?』の場合、現在
システムが案内している魚崎から海遊館へ至る経路は、
大阪城を含む「大阪」と呼ばれる範囲を通過しないの
で、処理はステップS205へと進む。
【0130】ステップS205、S206においては経
路説明クラスに属するタスクが新規に生成され、解決実
行待ち状態に初期化される。「ユーザが現在案内中の経
路にない地点を尋ねる」と云うことは、「違う地点に向
かうための新たな経路設定を意図している」と考えられ
る。従って、このステップS205、S206の処理を
経ることによって、将来ユーザによる目的地の変更要求
があった場合に対処が可能になる。
【0131】以上、図19に示した手続きによる解釈の
結果、質問「大阪には何がある?」に対する解答とし
て、「大阪城があります」という発話が合成され、出力
されることになる。
【0132】タスク空間210は、図3中のTSP−t
3で表現される状態に遷移する。
【0133】図3中のTSP−t3で表現されるタスク
空間状態にあるシステムに対して、30秒以上の時間を
空けずに『出口はどこ?』とユーザが発話したとする。
ユーザ発話は構文としては時刻t2、タスク空間TPS
−t2に対しての『出口はどこ?』発話と同様であり、
同様の処理によって図19に示すタスク空間マネージル
ールを付加された深層ユーザ意図表現に加工される。
【0134】タスクマネージャ206は「地点の位置を
尋ねるタスクマネージルール」の解釈を行い、ステップ
S104の処理を実行することによってタスク空間21
0から「大阪城への経路を案内する」タスクを検出する
ことになる。そして、更にタスクマネージャ206は当
該「大阪城への経路を案内する」タスクについての出力
生成要求を出力生成部211に要求する。この場合、
「大阪城への経路を案内するタスク」について「出口」
を解決した結果は「森之宮」であり、これを解として例
えば『出口は、阪神高速13号東大阪線森之宮出口で
す』という発話が出力生成部211によって合成され、
ユーザインターフェースに出力され、アナウンスされる
ことになる。
【0135】こうして森之宮出口の案内がユーザインタ
ーフェースより成された後、さらにユーザが、『大阪城
に行く』と発話したとする。このユーザ発話内容は音声
認識部201により音声認識され、形態素解析部20
2、文意味解釈部203、ユーザ意図合成部204によ
る処理を経ることによって、図14中のL4,S4,D
4のように加工され、図20に示すタスクマネージルー
ルが付加されて深層ユーザ意図表現になる。
【0136】図20に示すタスクマネージルールがタス
クマネージャ206によって解釈され、ステップS30
1,S302の処理を経ることによって、現在解決実行
中の「海遊館へ至る経路の説明」タスクが退避される。
タスク空間210は、図3中のTSP−t5で表現され
る状態に遷移する。
【0137】次に、ステップS303での処理によりユ
ーザ発話中の地点表現が解決される。『大阪城に行く』
の場合、「大阪城」が地点の表現である。ステップS3
04は、ユーザがA地点に向かうという行為が、解決中
だったタスクと等しいか違うかを判定する。
【0138】カーナビゲーションユーザは、いろいろな
経路候補を考えた末に、結局、それらを破棄して元の経
路に戻ることがあり、このような場合においてもこのス
テップにより適切に対応できる。
【0139】より詳細に説明すると、現在のタスク空間
TSP−t5には解決中断状態の経路を説明するクラス
のタスクとして「海遊館への経路を説明する」があり、
解決実行待機中のタスクとしては、「大阪城への経路を
説明する」がある。
【0140】解決中断中のタスクの目的地は「大阪城」
ではないので、処理はステップS305に進む。
【0141】ステップS305の出力であるタスクリス
トTL1は、例えば、タスクオブジェクトへのポインタ
のリストとして実現される。
【0142】「大阪城へ行く」の例の場合、次のように
1要素のリストLS305になる。
【0143】LS305:[大阪城への経路を説明す
る] 次に処理はS308,S310,S311の各ステップ
を経て、ステップS313へと進む。ステップS31
3、S306、およびS315では、タスクのマージが
行われる。タスクのマージとは、複数の異なったタスク
を順に実行する場合の順序を決めたり、複数のタスクか
ら1つのタスクを合成したりすることを言う。
【0144】例えば、「海遊館への経路を説明する」と
いうタスクと、「大阪城への経路を説明する」というタ
スクを合成した結果は、「大阪城を経由して海遊館へ至
る経路を説明する」、「海遊館へ行った後で大阪城へ行
く」、などになる。
【0145】タスク合成結果の望ましさを評価する軸
は、ユーザ毎に異なるものと考えられるので、対話的に
タスク合成を行うのが1つの望ましい方式であると考え
られる。なお、タスク合成のアルゴリズムは、各々のタ
スクオブジェクトに記述しても、タスクマージ専門のモ
ジュールに管理させてもよい。
【0146】本実施例の場合、タスクマージの対象とな
るのは、 .大阪城への経路を説明する(T2) ・海遊館への経路を説明する(T1) の2つのタスクである。タスクT2のタスク状態は「解
決実行中」なので、タスクマージ担当のモジュールは、
タスクT1、すなわち海遊館への経路案内を行なうか行
わないかを尋ねるような質問文を出力して、ユーザの返
答を待つ。例えば、 『海遊館行きはどうしますか? 行きますか?』 のような質問文を出力する。
【0147】これに対してユーザが、『はい』と返答し
た場合、システムはT1とT2それぞれの、2つの目的
地を巡回するためのタスク合成を行う。
【0148】タスク合成を実現するためには例えばタス
クマージ専門のモジュールにタスク合成ヒューリスティ
ックとして「複数個の地点を巡回する経路を対話的に作
成する場合には、現在地に対して近い地点から順に巡回
するような経路を最初の候補とする。」と記述しておく
ことによって、「大阪城」、「海遊館」の順で経由する
経路が作成され、ユーザに、 『大阪城、海遊館の順で行きますか?』 のようにルートの候補を提示することができる。このル
ート提示に対してユーザが、『はい』と返答したとす
る。この場合、提示したルートを新たなルートとして設
定経路記憶部213に記憶し、記憶した旨を 『大阪城を経由して海遊舘へ行きます。ルートを再設定
します』 のように発話させ、ユーザに提示する。同時に、タスク
空間210上で解決が不要となったT1,T2のそれぞ
れは、タスク状態を「消滅」と書き換える。この書き換
えによって、T1,T2は解決の対象ではなくなる。
【0149】以上のように、本発明のシステムは、話題
の範囲の定義が動的に変化するような対話からでも話題
の転換を検出可能で、かつ対話が話題転換に追従でき、
さらに検出結果を合成音の変化やディスプレイ表示の変
化など、ユーザインターフェース出力部の変化として自
然にユーザにフィードバックすることによって対話の自
然な流れを実現できるようにしたものであって、計算機
と人間が、自然言語で音声またはテキストを媒体として
対話を行うことによって協調的に問題解決を行うシステ
ムにおいて、例えば、人間が入力した自然言語文を形態
素解析および意味解析した結果を出力する言語処理モジ
ュールである文意味解釈部と、問題解決の解と解決アル
ゴリズムが定義されたタスクオブジェクトと、複数のタ
スクオブジェクトによってなされた現在までの問題解決
の処理の進行状況と解決すべき問題を表現するタスク空
間を監視・制御することによって対話を制御する装置で
あって、文意味解釈結果にその発話者がタスク空間に対
して意図した作用の記述を付加した深層ユーザ意図表現
を出力するユーザ意図合成部と、深層ユーザ意図表現、
タスクスケジューラからのメッセージ、センサからの信
号などの形で表現される外部状況表現入力、を解釈し必
要に応じてタスクテンプレート記憶部を参照することに
よってタスク空間中のタスクオブジェクトの管理を行う
タスクマネージャと、タスクマネージャや個々のタスク
オブジェクトからの出力生成要求を入力として文を生成
し合成音声やテキストの形式で出力する出力生成部とで
構成し、ナビゲーション対話のような話題の範囲の定義
が動的に変化するような対話からでも話題の転換を検出
可能で、かつ対話が話題転換に追従でき、さらに検出結
果を合成音の変化やディスプレイ表示の変化など、ユー
ザインターフェース出力部の変化として自然にユーザに
フィードバックすることによって対話の自然な流れを実
現することを可能としたものである。
【0150】すなわち、対話を、ユーザの発話やセンサ
入力などの外乱をきっかけとして、タスクオブジェクト
が生成、合成、消滅される過程としてモデル化しておき
さえすれば、本発明におけるタスクマネージャ206を
システムに導入することによって、対話の過程において
本題から逸れた脇道的話題が発生した場合であっても、
脇道的話題が解決したら適切に元の本題へ復帰したり、
脇道的話題と本題とを合成したりする、と云った知的な
文脈処理が可能となる。
【0151】また、本実施例で示したナビゲーションタ
スクは、「話題」の概念を静的に定義することができな
い問題解決の代表例である「天保山へ向かう経路」を説
明している場面で、大阪城は話題語、すなわち現在の話
題またはその一部を表現する語彙ではなかったが、「大
阪城へ向かう経路」を説明する場面では大阪城は話題語
になった。
【0152】このように、同じクラスの問題解決を行っ
ているにもかかわらず問題解決の場面によって「話題」
の概念が指すものが変化してしまうようなタスクを対象
として、話題の転換を検出するためには、従来の、静的
に分類された「クルー」や「話題語」を用いて話題を同
定する方式では対応できないと考えられる。
【0153】しかし、本発明におけるタスクマネージャ
206は、「脇道的話題」の発生だけを監視していれ
ば、話題の転換を検出することが可能である。
【0154】本実施例でいえば解決実行中状態のタスク
についてそのタスク状態が解決中断状態に移行し、さら
に解決実行待ちのタスクが発生すれば、それはユーザの
興味がその話題に移行したということを表している。す
なわち、タスク空間210のマネージルールを正確に記
述しておきさえすれば、本発明の対話制御装置を用いる
ことによって、タスクマネージャ206が簡単なルール
で話題の転換を検出できるようになる。
【0155】例えば、本実施例において、ユーザが海遊
館に向かう途中で大阪城に関する情報を要求したことに
よってタスク空間210は図3中のTSP−t2から同
図中のTSP‐t3へと遷移したが、このときユーザの
興味は一時的に大阪城とそこへ至る経路に向いている。
【0156】このことは、タスク空間210におけるT
SP‐t3の中で本題であった海遊館へ向かう経路を説
明するタスクオブジェクトT1のタスク状態が解決実行
中から実行中断待機に変化し、大阪城へ向かう経路を説
明するタスクオブジェクトT2のタスク状態が解決実行
待ちになったことに表わされている。すなわち、受理可
能な発話を、当該発話によって遂行されるタスクの観点
からクラスタリングしておき、個々のクラスに対してタ
スク空間210を変更するためのルールをあらかじめ用
意しておけば、話題転換を表すキーワード検出や転換確
率の統計処理などをせずに汎用なタスクマネージャによ
って話題の転換を検出することが可能になる。
【0157】さらに、話題転換を検出したことをユーザ
に通知することによって、ユーザとシステムのより協調
的な対話を支援することができるようになる。例えば、
話題転換を検出した場合に、音声の質を変えるといった
具合である。この場合、出力生成部211の出力音声を
男性声音質と女性声音質の2種類用意しておき、本実施
例における海遊館へ至る経路、すなわち、本題について
は男性の声で発声するようにし、途中で大阪城について
の話題が発生した時には女性の声で説明を生成するよう
にする。すると、説明を聞いたユーザは、ユーザの興味
が本題からずれたことをシステムが検出できた、という
ことを合成音の変化として認知できるようになり、便利
である。
【0158】また、話題毎にコンピュータグラフイック
スを用意しておいて、転換した話題に応じてディスプレ
イにグラフイックスを表示したり、音声、グラフィック
スを連動させて話題転換を知らせるのもよい。また、ナ
ビゲーションタスクにおいてユーザが対話的に行うタス
クとしては、経路を説明するタスクなどの他に、音声出
力の大きさを変更する、特定の地点を拡大表示するな
ど、ナビゲーションシステム自体を制御するタスクも含
まれる。
【0159】問題解決の性質や対象が異なったり、解決
の緊急性が異なる複数のタスクを含むような対話を本発
明のシステムで制御するには、例えばタスクスケジュー
ル記憶部205内部にタスク間の実行優先度や個々のタ
スクの実行コストなどをあらかじめ定義しておいて、こ
れらの定義に従ってタスクマネージャ206の実行順序
を制御する機能を具備すればよい。
【0160】なお、実施形態に記載した上述の手法は、
コンピュータに実行させることのできるプログラムとし
て、磁気ディスク(フロッピーディスク、ハードディス
クなど)、光ディスク(CD−ROM、DVDなど)、
半導体メモリなどの記録媒体に格納して頒布することも
できる。
【0161】
【発明の効果】以上、詳述したように、本発明によれ
ば、話題の範囲の定義が動的に変化するような対話から
でも話題の転換を検出可能で、かつ対話が話題転換に追
従でき、さらに検出結果を合成音の変化やディスプレイ
表示の変化など、ユーザインターフェース出力部の変化
として自然にユーザにフィードバックすることによって
対話の自然な流れを実現することができる対話処理方法
とその装置が提供できる。
【図面の簡単な説明】
【図1】本発明を説明するための図であって、本発明の
基本的な構成例を説明するブロック図。
【図2】本発明を説明するための図であって、カーナビ
ゲーションシステムへの適用例として示す本発明の具体
的な実施形態としてのブロック構成図。
【図3】本発明を説明するための図であって、本発明シ
ステムで使用するタスク空間の状態遷移を説明するため
の図。
【図4】図3の部分拡大図。
【図5】図3の部分拡大図。
【図6】図3の部分拡大図。
【図7】図3の部分拡大図。
【図8】本発明を説明するための図であって、本発明シ
ステムで使用するタスクオブジェクトの状態遷移を説明
する図。
【図9】本発明を説明するための図であって、本発明シ
ステムを装着した車両の走行状況を説明する図。
【図10】本発明を説明するための図であって、本発明
システムで使用するタスククラス定義記述:経路を説明
する図。
【図11】海遊館へ至る経路を説明するタスクオブジェ
クトを初期化するための情報を説明する図。
【図12】本発明を説明するための図であって、本発明
システムで実施する海遊館へ至る経路を説明するタスク
オブジェクトの初期状態を説明する図。
【図13】本発明を説明するための図であって、本発明
システムで使用するタスクマネージャの動作定義例を説
明する図。
【図14】本発明を説明するための図であって、本発明
システムで使用する構文解析、意味解析、深層意図表現
を説明する図。
【図15】本発明を説明するための図であって、本発明
システムで使用する形態素、意図表現、深層意図表現の
マップテーブル(抜粋)を説明する図。
【図16】本発明を説明するための図であって、本発明
システムで使用する「地点の位置を尋ねる」タスクマネ
ージルール(タスク空間マネージルール)の解釈処理の
概要を説明するフローチャート。
【図17】図16の部分拡大図。
【図18】図16の部分拡大図。
【図19】本発明を説明するための図であって、本発明
システムで使用する「範囲からある条件を満たす地点を
検索する」タスクマネージルールの処理を説明するフロ
ーチャート。
【図20】本発明を説明するための図であって、本発明
システムで使用するユーザ意図:「A地点に行く」のタ
スクマネージルールの処理を説明するフローチャート。
【符号の説明】
201…音声認識部 202…形態素解析部 203…文意味解釈部 204…ユーザ意図合成部 205…タスクスケジュール記憶部 206…タスクマネージャ 207…タスク空間マネージルール記憶部 208…タスクテンプレート記憶部 209…ドメイン問題解決器群 211…出力生成部 212…センサ 213…設定経路記憶部 214…予定行為記憶部 215…走行済み経路記憶部 216…実行済み行為記憶部 217…地理情報記憶部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 屋野 武秀 兵庫県神戸市東灘区本山南町8丁目6番26 号 株式会社東芝関西研究所内 Fターム(参考) 5B091 AA15 CA12 CA14 CB12 CB32 CD01 DA06 EA02 EA24

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】人間と計算機、または計算機同士が自然言
    語による音声またはテキストを媒体としての対話によ
    り、協調的にタスクを遂行することを支援する装置であ
    って、 入力された自然言語文を意味解析してその結果を出力す
    る意味処理手段と、 各種の問題解決の解と解決アルゴリズムとが定義され、
    要求に応じて対応のアルゴリズムを実行するタスクオブ
    ジェクトと、 複数のタスクオブジェクトによってなされた現在までの
    問題解決の処理の進行状況とその時々に生じる解決すべ
    き問題を表現するタスク空間とを制御することによって
    対話を制御する装置であって、前記意味処理手段にて得
    た文意味解釈結果にその発話者がタスク空間に対して意
    図した作用の記述を付加した深層ユーザ意図表現を出力
    するユーザ意図合成手段と、 タスクオブジェクトの実行優先順位などを記憶し、問題
    解決のスケジュールや実行命令などをメッセージの形で
    出力する作用を持つタスクスケジュール記憶手段と、 このタスクスケジュール記憶手段からのメッセージを解
    釈し、複数の異なった目的を持つタスクオブジェクトを
    制御するタスクスケジューラ機能を持ち、前記深層ユー
    ザ意図表現、前記タスクスケジューラ機能にて得られる
    メッセージなどで表現される外部状況表現入力を解釈
    し、タスクオブジェクトの生成時など必要時にはタスク
    オブジェクトの定義記述を参照することによって少なく
    ともタスク空間中に存在するタスクオブジェクトの状態
    を表現するスロットの値の変更、タスクオブジェクトの
    生成、初期化、消去、タスクオブジェクトのスロット値
    の変化として表現されるタスクオブジェクトの状態変化
    の検出、を含むタスク空間の管理を行うタスクマネージ
    ャと、 このタスクマネージャや個々のタスクオブジェクトから
    の出力生成要求を受けて当該出力生成要求対応に所要の
    自然言語を生成し、出力する出力生成手段と、を具備し
    たことを特徴とする対話制御装置。
  2. 【請求項2】人間と計算機、または計算機同士が自然言
    語による音声またはテキストを媒体としての対話によ
    り、協調的にタスクを遂行することを支援する装置であ
    って、 地上での自己位置を測定して位置情報を出力するセンサ
    と、 入力された自然言語文を意味解析してその結果を出力す
    る意味処理手段と、 各種の問題解決の解と解決アルゴリズムとが定義され、
    要求に応じて対応のアルゴリズムを実行するタスクオブ
    ジェクトと、 複数のタスクオブジェクトによってなされた現在までの
    問題解決の処理の進行状況とその時々に生じる解決すべ
    き問題を表現するタスク空間とを制御することによって
    対話を制御する装置であって、前記意味処理手段にて得
    た文意味解釈結果にその発話者がタスク空間に対して意
    図した作用の記述を付加した深層ユーザ意図表現を出力
    するユーザ意図合成手段と、 タスクオブジェクトの実行優先順位などを記憶し、問題
    解決のスケジュールや実行命令などをメッセージの形で
    出力する作用を持つタスクスケジュール記憶手段と、 このタスクスケジュール記憶手段からのメッセージを解
    釈し、複数の異なった目的を持つタスクオブジェクトを
    制御するタスクスケジューラ機能を持ち、前記深層ユー
    ザ意図表現、前記タスクスケジューラ機能にて得られる
    メッセージ、前記センサからの位置情報などで表現され
    る外部状況表現入力を解釈し、タスクオブジェクトの生
    成時など必要時にはタスクオブジェクトの定義記述を参
    照することによって少なくともタスク空間中に存在する
    タスクオブジェクトの状態を表現するスロットの値の変
    更、タスクオブジェクトの生成、初期化、消去、タスク
    オブジェクトのスロット値の変化として表現されるタス
    クオブジェクトの状態変化の検出、を含むタスク空間の
    管理を行うタスクマネージャと、 このタスクマネージャや個々のタスクオブジェクトから
    の出力生成要求を受けて当該出力生成要求対応に所要の
    自然言語を生成し、出力する出力生成手段と、を具備し
    たことを特徴とする対話制御装置。
  3. 【請求項3】前記タスクマネージャは、タスク空間に存
    在するオブジェクトの状態から問題解決が進行中である
    話題を検出する機能と、タスク空間に存在するオブジェ
    クトの状態変化を検出することによって話題の転換を検
    出する機能との少なくとも1つを具備したことを特徴と
    する請求項1または2いずれか1項に記載の対話制御装
    置。
  4. 【請求項4】前記出力生成手段は、前記タスクマネージ
    ャによる話題転換の検出に応じて出力である自然言語の
    表層表現を変更する機能を具備したことを特徴とする請
    求項1または2いずれか1項に記載の対話制御装置。
  5. 【請求項5】前記出力生成手段は、前記タスクマネージ
    ャによる話題の検出に応じて出力である自然言語の表層
    表現を変更する機能を具備したことを特徴とする請求項
    1または2いずれか1項に記載の対話制御装置。
  6. 【請求項6】前記出力生成手段は、コンピュータグラフ
    ィックスなどの画像によって擬人化表現されたキャラク
    タの身振りや動作と自然言語から合成された音声を同期
    させて出力する機能と、複数の擬人化されたキャラクタ
    を切替えて表示する機能と、キャラクタに結びつけられ
    た音質の合成音によって出力を生成する機能と、合成音
    声を切替えることによって異なる音質の合成音声を出力
    する機能との、少なくとも1つを具備し、話題転換の発
    生に応じてキャラクタ、キャラクタの動作、音声の質、
    の少なくとも1つを切替えて出力文を生成する機能を具
    備したことを特徴とする請求項1または2いずれか1項
    に記載の対話制御装置。
  7. 【請求項7】前記出力生成手段は、コンピュータグラフ
    イックスなどの画像によって擬人化表現されたキャラク
    タの身振りや動作と自然言語から合成された音声を同期
    させて出力する機能と、複数の擬人化されたキャラクタ
    を切替えて表示する機能と、キャラクタに結びつけられ
    た音質の合成音によって出力を生成する機能と、合成音
    声を切替えることによって異なる音質の合成音声を出力
    する機能との、少なくとも1つを具備し、話題に応じて
    キャラクタ、キャラクタの動作、音声の質、の少なくと
    も1つを切替えて出力文を生成する機能を具備したこと
    を特徴とする請求項1または2いずれか1項に記載の対
    話制御装置。
  8. 【請求項8】人間と計算機、または、計算機同士が自然
    言語で音声またはテキストを媒体として対話によって協
    調的にタスクを遂行することを支援する対話方法とし
    て、 入力された自然言語文を意味解析する意味処理ステップ
    と、 問題解決の解と解決アルゴリズムが定義された各種タス
    クオブジェクトを用い、意味処理ステップにて解析され
    た結果をもとに問題解決の解を得る処理ステップと、 複数のタスクオブジェクトの状態が現在までの問題解決
    の進行状況と解決すべき問題を表現するタスク空間とを
    制御することによって対話を制御するものであって、意
    味処理ステップにて解析された結果に、発話者がタスク
    空間に対して意図した作用の記述を付加した深層ユーザ
    意図表現を出力するユーザ意図合成ステップと、 前記深層ユーザ意図表現、前記タスクスケジューラから
    のメッセージなどの形で表現される外部状況表現入力を
    解釈し、タスクオブジェクトの生成時など必要時にはタ
    スクオブジェクトの定義記述を参照することによって少
    なくともタスク空間中に存在するタスクオブジェクトの
    状態を表現するスロットの値の変更、タスクオブジェク
    トの生成、初期化、消去、タスクオブジェクトのスロッ
    ト値の変化として表現されるタスクオブジェクトの状態
    変化の検出、を含むタスク空間の管理を行うタスクマネ
    ージャステップと、 タスクマネージャステップや個々のタスクオブジェクト
    からの出力生成要求を入力として自然言語を生成し合成
    音声やテキストの形式で出力する出力生成ステップと、
    を具備したことを特徴とする対話制御方法。
  9. 【請求項9】前記タスクマネージャステップは、タスク
    空間に存在するオブジェクトの状態から問題解決が進行
    中である話題を検出するステップとタスク空間に存在す
    るオブジェクトの状態変化を検出することによって話題
    の転換を検出するステップとのうち、少なくとも1つを
    具備したことを特徴とする請求項7に記載の対話制御方
    法。
  10. 【請求項10】前記出力生成ステップは、タスクマネー
    ジャステップによる話題転換の検出に応じて出力である
    自然言語の表層表現を変更するステップを具備したこと
    を特徴とする請求項8に記載の対話制御方法。
  11. 【請求項11】前記出力生成ステップは、タスクマネー
    ジャステップによる話題の検出に応じて出力である自然
    言語の表層表現を変更するステップを具備したことを特
    徴とする請求項8に記載の対話制御方法。
  12. 【請求項12】前記出力生成ステップは、コンピュータ
    グラフィックスなどの画像によって擬人化表現されたキ
    ャラクタの身振りや動作と自然言語から合成された音声
    を同期させて出力するステップと、複数の擬人化された
    キャラクタを切替えて表示するステップと、キャラクタ
    に結びつけられた音質の合成音によって出力を生成する
    ステップと、合成音声を切替えることによって異なる音
    質の合成音声を出力するステップのうち、少なくとも1
    つを具備し、話題転換の発生に応じてキャラクタ、キャ
    ラクタの動作、音声の質、の少なくとも1つを切替えて
    出力文を生成するステップを具備したことを特徴とする
    請求項8に記載の対話制御方法。
  13. 【請求項13】前記出力生成ステップは、コンピュータ
    グラフィックスなどの画像によって擬人化表現されたキ
    ャラクタの身振りや動作と自然言語から合成された音声
    を同期させて出力するステップと、複数の擬人化された
    キャラクタを切替えて表示するステップと、キャラクタ
    に結びつけられた音質の合成音によって出力を生成する
    ステップと、合成音声を切替えることによって異なる音
    質の合成音声を出力するステップのうち、少なくとも1
    つを具備し、話題に応じてキャラクタ、キャラクタの動
    作、音声の質、の少なくとも1つを切替えて出力文を生
    成するステップを具備したことを特徴とする請求項8に
    記載の対話制御方法。
  14. 【請求項14】計算機を、人間と計算機、または、計算
    機同士が自然言語で音声またはテキストを媒体として対
    話によって協調的にタスクを遂行することを支援する対
    話処理方法として、 入力された自然言語文を意味解析する意味処理ステップ
    と、 問題解決の解と解決アルゴリズムが定義された各種タス
    クオブジェクトを用い、意味処理ステップにて解析され
    た結果をもとに問題解決の解を得る処理ステップと、 複数のタスクオブジェクトの状態が現在までの問題解決
    の進行状況と解決すべき問題を表現するタスク空間とを
    制御することによって対話を制御するものであって、意
    味処理ステップにて解析された結果に、発話者がタスク
    空間に対して意図した作用の記述を付加した深層ユーザ
    意図表現を出力するユーザ意図合成ステップと、 深層ユーザ意図表現、タスクスケジューラからのメッセ
    ージ、センサからの信号などで表現される外部状況表現
    入力を解釈し、タスクオブジェクトの生成時など必要時
    にはタスクオブジェクトの定義記述を参照することによ
    って少なくともタスク空間中に存在するタスクオブジェ
    クトの状態を表現するスロットの値の変更、タスクオブ
    ジェクトの生成、初期化、消去、タスクオブジェクトの
    スロット値の変化として表現されるタスクオブジェクト
    の状態変化の検出、を含むタスク空間の管理を行うタス
    クマネージャステップと、 このタスクマネージャステップや個々のタスクオブジェ
    クトからの出力生成要求を入力として自然言語を生成
    し、合成音声やテキストの形式で出力する出力生成ステ
    ップと、よりなるコンピュータにて読み取りと実行が可
    能な対話制御プログラムを記憶した媒体。
  15. 【請求項15】前記タスクマネージャステップは、タス
    ク空間に存在するオブジェクトの状態から問題解決が進
    行中である話題を検出するステップとタスク空間に存在
    するオブジェクトの状態変化を検出することによって話
    題の転換を検出するステップとの少なくとも1つを具備
    したことを特徴とする請求項14に記載の対話制御プロ
    グラムを記憶した媒体。
  16. 【請求項16】前記出力生成ステップは、タスクマネー
    ジャステップによる話題転換の検出に応じて出力である
    自然言語の表層表現を変更するステップを具備したこと
    を特徴とする請求項14に記載の対話制御プログラムを
    記憶した媒体。
  17. 【請求項17】前記出力生成ステップは、タスクマネー
    ジャステップによる話題の検出に応じて出力である自然
    言語の表層表現を変更するステップを具備したことを特
    徴とする請求項14に記載の対話制御プログラムを記憶
    した媒体。
  18. 【請求項18】前記出力生成ステップは、コンピュータ
    グラフィックスなどの画像によって擬人化表現されたキ
    ャラクタの身振りや動作と自然言語から合成された音声
    を同期させて出力するステップと、複数の擬人化された
    キャラクタを切替えて表示するステップと、キャラクタ
    に結びつけられた音質の合成音によって出力を生成する
    ステップと、合成音声を切替えることによって異なる音
    質の合成音声を出力するステップとの、少なくとも1つ
    を具備し、話題転換の発生に応じてキャラクタ、キャラ
    クタの動作、音声の質、の少なくとも1つを切替えて出
    力文を生成するステップを具備したことを特徴とする請
    求項14に記載の対話制御プログラムを記憶した媒体。
  19. 【請求項19】前記出力生成ステップは、コンピュータ
    グラフィックスなどの画像によって擬人化表現されたキ
    ャラクターの身振りや動作と自然言語から合成された音
    声を同期させて出力するステップと、複数の擬人化され
    たキャラクターを切替えて表示するステップと、キャラ
    クタに結びつけられた音質の合成音によって出力を生成
    するステップと、合成音声を切替えることによって異な
    る音質の合成音声を出力するステップとの、少なくとも
    1つを具備し、話題に応じてキャラクタ、キャラクタの
    動作、音声の質、の少なくとも1つを切替えて出力文を
    生成するステップを具備したことを特徴とする請求項1
    4に記載の対話制御プログラムを記憶した媒体。
JP10236851A 1998-08-24 1998-08-24 対話制御装置および対話制御方法 Pending JP2000067047A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10236851A JP2000067047A (ja) 1998-08-24 1998-08-24 対話制御装置および対話制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10236851A JP2000067047A (ja) 1998-08-24 1998-08-24 対話制御装置および対話制御方法

Publications (1)

Publication Number Publication Date
JP2000067047A true JP2000067047A (ja) 2000-03-03

Family

ID=17006748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10236851A Pending JP2000067047A (ja) 1998-08-24 1998-08-24 対話制御装置および対話制御方法

Country Status (1)

Country Link
JP (1) JP2000067047A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001273473A (ja) * 2000-03-24 2001-10-05 Atr Media Integration & Communications Res Lab 会話用エージェントおよびそれを用いる会話システム
JP2003271892A (ja) * 2002-03-18 2003-09-26 Nippon Telegraph & Telephone East Corp シナリオ自動生成システム、シナリオ自動生成方法、コンピュータプログラムおよびそのプログラムを記録した記録媒体
JP2004534299A (ja) * 2001-04-27 2004-11-11 アクセンチュア リミテッド ライアビリティ パートナーシップ 位置に基づくサービス
JP2006268428A (ja) * 2005-03-24 2006-10-05 Kenwood Corp 情報呈示装置、情報呈示方法、および、情報呈示用プログラム
US7412260B2 (en) 2001-04-27 2008-08-12 Accenture Llp Routing call failures in a location-based services system
US7437295B2 (en) 2001-04-27 2008-10-14 Accenture Llp Natural language processing for a location-based services system
US7698228B2 (en) 2001-04-27 2010-04-13 Accenture Llp Tracking purchases in a location-based services system
US7970648B2 (en) 2001-04-27 2011-06-28 Accenture Global Services Limited Advertising campaign and business listing management for a location-based services system
US8738437B2 (en) 2001-04-27 2014-05-27 Accenture Global Services Limited Passive mining of usage information in a location-based services system
US11335334B2 (en) * 2017-11-02 2022-05-17 Sony Corporation Information processing device and information processing method

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001273473A (ja) * 2000-03-24 2001-10-05 Atr Media Integration & Communications Res Lab 会話用エージェントおよびそれを用いる会話システム
JP2004534299A (ja) * 2001-04-27 2004-11-11 アクセンチュア リミテッド ライアビリティ パートナーシップ 位置に基づくサービス
US7412260B2 (en) 2001-04-27 2008-08-12 Accenture Llp Routing call failures in a location-based services system
US7437295B2 (en) 2001-04-27 2008-10-14 Accenture Llp Natural language processing for a location-based services system
US7698228B2 (en) 2001-04-27 2010-04-13 Accenture Llp Tracking purchases in a location-based services system
US7860519B2 (en) 2001-04-27 2010-12-28 Accenture Global Services Limited Location-based services system
US7970648B2 (en) 2001-04-27 2011-06-28 Accenture Global Services Limited Advertising campaign and business listing management for a location-based services system
US8738437B2 (en) 2001-04-27 2014-05-27 Accenture Global Services Limited Passive mining of usage information in a location-based services system
JP2003271892A (ja) * 2002-03-18 2003-09-26 Nippon Telegraph & Telephone East Corp シナリオ自動生成システム、シナリオ自動生成方法、コンピュータプログラムおよびそのプログラムを記録した記録媒体
JP2006268428A (ja) * 2005-03-24 2006-10-05 Kenwood Corp 情報呈示装置、情報呈示方法、および、情報呈示用プログラム
JP4508917B2 (ja) * 2005-03-24 2010-07-21 株式会社ケンウッド 情報呈示装置、情報呈示方法、および、情報呈示用プログラム
US11335334B2 (en) * 2017-11-02 2022-05-17 Sony Corporation Information processing device and information processing method

Similar Documents

Publication Publication Date Title
Goddeau et al. GALAXY: a human-language interface to on-line travel information.
JP5142720B2 (ja) デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話
US20230206911A1 (en) Processing natural language using machine learning to determine slot values based on slot descriptors
US5884249A (en) Input device, inputting method, information processing system, and input information managing method
US20080228496A1 (en) Speech-centric multimodal user interface design in mobile technology
US11016968B1 (en) Mutation architecture for contextual data aggregator
JP3930138B2 (ja) 情報解析方法および情報解析プログラムを記憶した媒体
US7974835B2 (en) Method, system, and apparatus for natural language mixed-initiative dialogue processing
JP5257330B2 (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
KR100998566B1 (ko) 음성인식을 이용한 언어 번역 방법 및 장치
JP2021501926A (ja) 音声駆動コンピューティングインフラストラクチャによるグラフィカルユーザインターフェースレンダリング管理
US20100281435A1 (en) System and method for multimodal interaction using robust gesture processing
JP7213943B2 (ja) 車載機器の音声処理方法、装置、機器及び記憶媒体
US6549887B1 (en) Apparatus capable of processing sign language information
KR20030078388A (ko) 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
CN110126843A (zh) 行车服务推荐方法、装置、设备和介质
US20200219487A1 (en) Information processing apparatus and information processing method
JP2001022779A (ja) 対話型情報検索装置、コンピュータを用いた対話型情報検索方法及び対話型情報検索処理を行うプログラムを記録したコンピュータ読取り可能な媒体
Minker et al. Stochastically-based semantic analysis
Minker et al. Speech and human-machine dialog
JP2000067047A (ja) 対話制御装置および対話制御方法
Withanage et al. Voice-based road navigation system using natural language processing (nlp)
JPH06266779A (ja) 制御装置
Gruenstein et al. Scalable and portable web-based multimodal dialogue interaction with geographical databases
JP2001012963A (ja) ナビゲーション装置、ナビゲーション方法およびナビゲーションプログラムを格納するコンピュータ読み取り可能な記録媒体