JP2006268332A - 対話情報処理装置及び対話情報処理方法 - Google Patents

対話情報処理装置及び対話情報処理方法 Download PDF

Info

Publication number
JP2006268332A
JP2006268332A JP2005084287A JP2005084287A JP2006268332A JP 2006268332 A JP2006268332 A JP 2006268332A JP 2005084287 A JP2005084287 A JP 2005084287A JP 2005084287 A JP2005084287 A JP 2005084287A JP 2006268332 A JP2006268332 A JP 2006268332A
Authority
JP
Japan
Prior art keywords
net
processing
input
item
status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005084287A
Other languages
English (en)
Other versions
JP4682322B2 (ja
JP2006268332A5 (ja
Inventor
Yasushi Sato
寧 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu Institute of Technology NUC
Original Assignee
Kyushu Institute of Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu Institute of Technology NUC filed Critical Kyushu Institute of Technology NUC
Priority to JP2005084287A priority Critical patent/JP4682322B2/ja
Priority to PCT/JP2006/305815 priority patent/WO2006101164A1/ja
Priority to US11/886,916 priority patent/US7743027B2/en
Publication of JP2006268332A publication Critical patent/JP2006268332A/ja
Publication of JP2006268332A5 publication Critical patent/JP2006268332A5/ja
Application granted granted Critical
Publication of JP4682322B2 publication Critical patent/JP4682322B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】シナリオの追加・削除が容易で、複数のイベントが同時入力された場合でも適切に処理内容を実行できる対話情報処理装置を提供する。
【解決手段】各ネットのネットステータスを記憶するネット状態テーブル10、{処理項目,当該処理項目の入力ネット,及び当該処理項目の出力ネット}の組を記憶する処理項目テーブル12、各処理項目に対応して設けられ当該処理項目の処理内容を実行しその結果に応じて出力ネットのネットステータスの更新を行う処理項目実行モジュール4−i、処理項目テーブル12内の全ての処理項目を順次選択し、選択した処理項目に対応する処理項目実行モジュール4−iを実行する選択実行手段13、並びにネット状態テーブル12の何れかのネットステータスが変化した場合に選択実行手段13により各処理項目実行モジュール4−iを実行させる状態変化判定手段14を備えた。
【選択図】 図1

Description

本発明は、音声等により使用者と対話しながら情報処理を行う対話情報処理技術に関する。
近年、カーナビゲーション装置や家庭用の種々の機器において、対話型のユーザインタフェースを有するものが研究開発されてきている。かかる対話型のユーザインタフェースにおいて、使用者との対話情報処理を行う機器を対話情報処理装置という。
対話情報処理装置においては、使用者との対話を通じて情報を取得し、その情報に基づく処理を行う。例えば、使用者の発話内容を音声認識装置により認識し、それに対して音声合成装置により回答や問いかけを行うことを繰り返し、使用者の意図に沿った機器の操作を行うという具合である。なお、ここにいう「対話」とは、音声による対話のみならず、スイッチ操作による対話や画像による対話等も含まれる。
対話情報処理装置においては、使用者に違和感を持たせることなく、自然な対話を行うことが必要とされる。すなわち、使用者側の発話選択の自由度を高くすることが重要となる。
そこで、各種機器の操作を行うためのアプリケーションプログラム(実行モジュール。以下「AP」という。)と対話処理を行うプログラム(対話モジュール)とを独立させ、APに対応して用意されたシナリオに基づき対話処理を行う対話情報処理装置が開発されている(特許文献1,2参照)。
特許文献1記載の対話情報処理装置では、対話処理の記述自体をAPから独立させると共に、APの処理手順に対話の流れが左右されないようにして、使用者側の自由度が高い対話を実現している。
また、特許文献2記載の対話情報処理装置では、更に、シナリオを階層構造とすることによって、使用者の発話による異なるAPへの移行を自然に行う技術が記載されている。
活性状態は特許文献2記載の対話情報処理装置におけるシナリオの階層構造を表す図である。シナリオは、3つのAPに対応してA−APシナリオグループ、B−APシナリオグループ、及びC−APシナリオグループが用意されている。そして、各APシナリオグループと分離して、アプリケーション分岐処理を行うルートシナリオが設けられている。ルートシナリオにおけるアプリケーション分岐処理は、使用者からの入力情報に応じてAPを起動すると共に、そのAPに対応するAPシナリオグループを呼び出すものである。これにより、あるAPシナリオグループにおいて処理を実行中に、使用者が他のAPシナリオグループの処理へ移るように指示した場合、ルートシナリオへ移行すればよいため、異なるAPへの移行を自然に行うことが可能となる。
また、アプリケーション分岐処理をAPシナリオグループから独立させてルートシナリオにまとめることによって、AP数がいくら多くなっても、各APシナリオグループには他のAPシナリオグループへの移行処理を記述する必要がなくなるため、APシナリオグループの記述が簡単となる。
特開2001−56694号公報 特開2001−296943号公報
しかしながら、上述の従来の対話情報処理装置においては、新たなアプリケーションを追加する場合、そのアプリケーションに関するAPシナリオグループを作成するとともに、他のAPシナリオグループとの間のアプリケーション分岐処理の定義をルートシナリオに追加する必要がある。従って、シナリオの追加・削除の作業が複雑である。
また、使用者の発話により複数のAPに対して同時に指示が入力された場合、複数のAPを同時に制御することはできない。すなわち、あるAPシナリオグループ(A)の処理を実行中に、使用者から他のAPシナリオグループ(B)の処理についての指示が入力された場合、対話情報処理装置はAPシナリオグループ(A)の処理を中断して、APシナリオグループ(B)の処理へ移行しなければならない。そして、次に使用者からAPシナリオグループ(A)の処理内容についての発話が入力されると、対話情報処理装置は、APシナリオグループ(B)の処理を中断してAPシナリオグループ(A)の処理へ移行するが、この場合、APシナリオグループ(A)の処理は最初から実行されるため、使用者が先に入力した指示内容を再度繰り返して入力する必要がある。従って、使用者にとっての利便性の点で問題がある。
そこで、本発明の目的は、シナリオの追加・削除を容易に行うことが可能であると共に、使用者から複数のイベントが同時に入力された場合にも、適切にそれに対する処理内容を同時に実行することが可能な対話情報処理技術を提供することにある。
本発明に係る対話情報処理装置の第1の構成は、予め用意された複数の処理項目に対して、入力イベントに対応して対話的に各処理項目を適宜選択し実行する対話情報処理装置であって、前記各処理項目間の情報伝達関係を指定するネットについて、前記各ネットを介して伝達される状態情報を表す変数(以下「ネットステータス」という。)をテーブルとして記憶するネット状態テーブル;前記処理項目、当該処理項目の入力側に接続するネット(以下「入力ネット」という。)、及び当該処理項目の出力側に接続するネット(以下「出力ネット」という。)、の組をテーブルとして記憶する処理項目テーブル;前記各処理項目に対応して設けられ、前記入力ネットのネットステータスが活性状態にある場合には当該処理項目の処理内容を実行しその結果に応じて前記出力ネットのネットステータスの更新を行う、複数の処理項目実行モジュール;前記処理項目テーブル内の全ての前記処理項目を順次選択し、選択した前記処理項目の前記入力ネットのネットステータスを前記ネット状態テーブルから読み出し、当該処理項目に対応する前記処理項目実行モジュールに入力して実行させる選択実行手段;並びに、前記ネット状態テーブルの何れかのネットステータスが変化した場合に前記選択実行手段により前記各処理項目実行モジュールを実行させる状態変化判定手段;を備えたことを特徴とする。
入力イベントが入力され、それに対応してネット状態テーブルの何れかのネットのネットステータスが変更された場合、まず状態変化判定手段がネットステータスの変化を検出し、選択実行手段により各処理項目実行モジュールを実行する。
選択実行手段は、処理項目テーブルから処理項目を順次読み出し、その処理項目の入力ネットのネットステータスをネット状態テーブルから取得する。そして、取得したネットステータスを当該処理項目に対応する処理項目実行モジュールに入力し実行させる。
各処理項目実行モジュールは、入力ネットのネットステータスが活性化(アサート)状態にある場合にはその処理項目に関する処理を実行する。そして、その実行結果より必要に応じて、ネット状態テーブル内の出力ネットのネットステータスを更新する。一方、入力ネットのネットステータスが非活性(ネゲート)状態の場合には、処理項目に関する処理は実行されない。
選択実行手段が処理項目テーブル内のすべての処理項目について、対応する処理項目実行モジュールの実行が終了すると、状態変化判定手段は再びネット状態テーブル内のネットステータスの変化を検出し、変化が検出された場合には上述の操作を繰り返す。
最終的に状態変化判定手段によるネット状態テーブル内のネットステータスの変化が検出されなくなった状態(定常状態)に達すると、対話情報処理が終了する。
このように、入力イベントに対して対応するネットステータスを活性化(アサート)し、ネット状態テーブルのネットステータスが安定化するまで、ネットステータスに応じて全処理項目実行モジュールの実行を繰り返すことにより、複数の入力イベントが同時に入力された場合でも、それらに対応する処理項目を正しく実行することができる。
また、新たに処理項目を追加したい場合には、処理項目テーブルにその処理項目及び入出力ネットに追加し、必要に応じてネット状態テーブルに新たに生じるネットを追加するだけでよい。また、処理項目を削除したい場合には、処理項目テーブルにその処理項目及び入出力ネットに追加し、必要に応じてネット状態テーブルから不要なネットを削除するだけでよい。従って、処理項目の追加・削除が極めて容易であり、処理項目の変化に柔軟に対応することが可能となる。
ここで、前記ネットステータスは、複数の状態を採ることが可能である。例えば、活性状態及び非活性状態の2状態であってもよいし、それ以上の状態を採るようにしてもよい。
本発明に係る対話情報処理装置の第2の構成は、前記第1の構成において、入力イベントが入力された場合、当該入力イベントに対応する前記ネットのネットステータスを活性状態に更新する初期ネット状態更新手段;を備えたことを特徴とする。
この構成によれば、入力イベントに対して初期ネット状態更新手段が活性状態に更新する。これがトリガーとなって、上述のように、ネット状態テーブルのネットステータスが安定化するまで、全処理項目実行モジュールの実行を繰り返す。これにより、入力イベントに対する処理項目を実行することができる。
本発明に係る対話情報処理装置の第3の構成は、前記第2の構成において、前記初期ネット状態更新手段は、複数の入力イベントが同時に入力された場合、当該各入力イベントに対応する前記ネットのネットステータスを各々更新することを特徴とする。
この構成により、複数の入力イベントが同時に入力された場合にも、それに対応する処理項目をそれぞれ実行することができる。
本発明に係る対話情報処理装置の第4の構成は、前記第2又は3の構成において、使用者の操作により入力イベントを発生させる入力装置を備え、前記初期ネット状態更新手段は、各入力イベントと所定の認識情報との対応関係を記憶する認識辞書;前記入力イベントに対して前記認識辞書を参照し、対応する認識情報を出力する入力イベント認識手段;及び、前記入力イベント認識手段が出力する認識情報に対応する前記ネットのネットステータスを当該認識情報により指定される状態に更新する認識情報入力手段;を備えていることを特徴とする。
この構成によれば、入力装置から入力イベントが出力されると、入力イベント認識手段が入力イベントを認識し、認識情報を出力する。そして、認識情報入力手段は、この認識情報に応じて、適宜ネットのネットステータスを当該認識情報により指定される状態に更新する。
ここで、入力装置としては、音声入力装置、画像入力装置(カメラ、スキャナー等)、タッチパネル、キー入力装置、ポインティングデバイス等の、コンピュータで使用される各種入力機器を使用することができる。入力イベントとしては、音声信号、画像信号、キー入力信号等を挙げることができる。認識情報としては、例えば、単語情報、ON/OFF情報等などが挙げられる。これにより、入力イベントに対する処理項目を実行することができる。
本発明に係るプログラムは、コンピュータに読み込ませて実行することにより、コンピュータを前記第1乃至4の何れか一の構成の対話情報処理装置として機能させることを特徴とする。
本発明に係る対話情報処理方法は、予め用意された複数の処理項目に対して、前記各処理項目間の情報伝達関係を指定するネットについて、前記各ネットを介して伝達される状態情報を表す変数(以下「ネットステータス」という。)をテーブルとして記憶するネット状態テーブル;前記処理項目、当該処理項目の入力側に接続するネット(以下「入力ネット」という。)、及び当該処理項目の出力側に接続するネット(以下「出力ネット」という。)、の組をテーブルとして記憶する処理項目テーブル;並びに、前記各処理項目に対応して設けられ、前記入力ネットのネットステータスに対する当該処理項目の処理内容を実行しその結果に応じて前記出力ネットのネットステータスの更新を行う、複数の処理項目実行モジュール;を備えたシステムにおいて、入力イベントに対応して対話的に各処理項目を適宜選択し実行する対話情報処理方法であって、入力イベントが入力された場合、前記ネット状態テーブルの各ネットのうち、当該入力イベントに対応するネットのネットステータスを更新する初期ネット状態更新ステップ;及び、入力イベントに対して前記処理項目実行モジュールを適宜選択し実行する処理項目実行ステップ;を備え、前記処理項目実行ステップにおいては、ネット状態テーブルの何れかのネットステータスが変化を検出するネット状態変化検出ステップ;及び、ネットステータスの変化が検出された場合には前記処理項目テーブル内の全ての前記処理項目を順次選択し、選択した前記処理項目の前記入力ネットのネットステータスを前記ネット状態テーブルから読み出し、当該処理項目に対応する前記処理項目実行モジュールに入力して実行させる選択実行ステップ;を前記ネットステータスの変化が検出されなくなるまで繰り返して実行することを特徴とする。
以上のように、本発明によれば、入力イベントに対して対応するネットステータスを活性化(アサート)し、ネット状態テーブルのネットステータスが安定化するまで、全処理項目実行モジュールの実行を繰り返すことにより、複数の入力イベントが同時に入力された場合でも、それらに対応する処理項目を正しく実行することが可能となる。
また、各処理項目の実行制御を処理項目テーブル及びネット状態テーブルを用いて行う構成としたことにより、処理項目の追加・削除が極めて容易であり、処理項目の変化に柔軟に対応することが可能となる。
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
図1は本発明の実施例1に係る対話情報処理装置1の構成を表すブロック図である。対話情報処理装置1は、初期ネット状態更新手段である対話認識モジュール2と、対話処理エンジン3と、処理実行モジュール集合4と、入力装置5と、出力装置6とを備えている。
入力装置5は、使用者の操作により入力イベントを発生させる装置である。本実施例では、入力装置5としてマイクが使用されているものとする。
出力装置6は、使用者により入力される指示に応じて実際に各種の処理を行う装置である。例えば、音声出力処理を行うスピーカー、室内の空調を行うエアコン、窓の開閉を行うモータなどである。
処理実行モジュール集合4は、予め用意された各種処理項目に対応して設けられた処理項目実行モジュール4−1,4−2,…,4−nの集合である。各処理項目実行モジュール4−1,4−2,…,4−nは、各種処理項目に対する演算・制御処理を実行するモジュールである。
ここで、「処理項目」とは、入力イベントに対応して各種機器(出力装置6)において実際に行われる処理の項目をいう。例えば、「エアコンをつけて」という入力イベントに対して「エアコンをつけます」と発語する処理や実際にエアコンを作動させる処理、「窓を閉めて」という入力イベントに対して「窓を閉めます」と発語する処理や実際に窓を閉めるモータを作動させる処理をいう。
これらの処理項目間には、遷移順序関係が定義されている。例えば、「下げて」という入力イベントに対して「エアコンか窓か?」と発語する処理項目TTS1の次には、次の入力イベントが「エアコン」、「窓」又はその他の何れかであるかを判定する処理項目QB1がくるという具合に遷移順序関係が定義されている(図2参照)。この遷移順序関係が定義された各処理項目について、処理項目間の情報伝達関係を指定するものを「ネット」という。例えば、上記例では、処理項目TTS1と処理項目QB1がネットで接続されている。ネットは方向性を有する。処理項目の入力側に接続するネットを「入力ネット」、処理項目の出力側に接続するネットを「出力ネット」という。すなわち、処理項目の集合をN、ネットの集合をEとすると、G=(N,E)は有向グラフを構成する。
各ネットは活性(アサート)状態と非活性(ネゲート)状態との2状態を有する(必要に応じて、活性状態を更に2以上の状態に定義してもよい)。このネットの状態のことを「ネットステータス」という。各処理項目実行モジュール4−1,4−2,…,4−nは、入力ネットのネットステータスが活性状態にある場合には当該処理項目の処理内容を実行する。そして、その実行結果に応じて出力ネットのネットステータスの更新を行う。
対話認識モジュール2は、マイク等の入力装置5から入力される使用者の発話等の入力イベントを認識し、所定の形式の認識情報として出力する装置である。対話認識モジュール2は、認識辞書7、入力イベント認識手段8、及び認識情報入力手段9を備えている。認識辞書7は、単語、文章、音声波形等の使用者の発話を認識するための各種認識情報を記憶する。入力イベント認識手段8は、入力装置5から入力される入力イベントを、認識辞書7を参照しながら認識し、認識情報として出力する。認識情報入力手段9は、入力イベント認識手段8から出力される認識情報に基づき、後述するネット状態テーブル10を書き換える。
対話処理エンジン3は、ネット状態テーブル10、前状態ネット状態テーブル11、処理項目テーブル12、選択実行手段13、及び状態変化判定手段14を備えている。
ネット状態テーブル10は、各ネットのネットステータスをテーブルとして記憶する。前状態ネット状態テーブル11は、各処理項目に関する処理が一巡実行され各ネットのネットステータスが更新された場合、その更新前の各ネットのネットステータスを記憶する。尚、前状態ネット状態テーブル11は、すべてのネットの前状態のネットステータスを記憶するようにしてもよいが、変更されたネットのみを記憶するようにしてもよい。また、ネット状態テーブル10と併合して1つのテーブルとして記憶するように構成してもよい。各処理項目実行モジュール4−1,4−2,…,4−nは、ネットステータスの更新を行う場合には、このネット状態テーブル10のネットステータスを更新する。
処理項目テーブル12は、{処理項目,当該処理項目の入力側に接続する入力ネット,当該処理項目の出力側に接続する出力ネット}の組をテーブルとして記憶する。
選択実行手段13は、処理項目テーブル12内の全ての処理項目を順次選択し、選択した処理項目の入力ネットのネットステータスをネット状態テーブル10から読み出す。そして、当該処理項目に対応する処理項目実行モジュール4−iにネットステータスを入力して実行させる。
状態変化判定手段14は、ネット状態テーブル10の何れかのネットステータスが変化した場合に選択実行手段13により各処理項目実行モジュール4−1,4−2,…,4−nを実行させる。
ここで、本実施例の対話情報処理装置1における処理項目とネットの関係について、実例に沿ってより具体的に説明しておく。図2は、実施例1に係る対話情報処理装置1における対話シナリオ構造の一例を表す図である。この対話シナリオは、自動車における空調を対話方式により実行する例を示している。
図2において、処理項目はFCT,QB,TTS,STS,BR,TRMの記号が付された部分である。
「FCT」は、音声認識用のXML(Extensible Markup Language)形式で記述された指定のキーワードを入力音声から抽出する処理項目を表している。各FCTに付されている「<FCT>」は、当該FCTに入るためのコーパス(キーワード)を表している。実際には「FCT」は対話認識モジュール2(初期ネット状態更新手段)により実行される処理項目であり、この対話シナリオのカテゴリーに入るためのキーワードとして扱われる。
「QB」は、指定のXMLを利用して音声認識より音声単語を抽出し対話のフローを分岐させる処理を表す。
「TTS(Text to Speech)」は、テキスト音声合成処理を表す。これは、出力装置6(スピーカー)により指定された文章を読み上げる処理に相当する。各TTSに付されている「<SP>」は、当該TTSにおいて読み上げるテキストの内容を表している。
このTTSとQBを併用して質問を記述することができる。例えば、TTS1において「エアコンか窓か?」と発話させ、これに対する認識を行うQB1では、想定される答え方(「エアコン」、「窓」)を入れたXMLファイルを指定することにより質問に対する回答の認識処理が実現されている。
「STS」は内部のステータス情報を表す。例えば、STS1は窓が開いた状態にあるか否かの内部ステータス情報、STS2はエアコンがON状態か否かの内部ステータス情報を表している。
「BR」は、音声認識以外の内部のステータス情報によって対話のフローを分岐させる処理を表す。例えば、BR1では、エアコンの電源がON状態かOFF状態かによって会話の内容を変更させている。
「TRM」は終端処理を表す。すなわち、TRMにおいて、この対話シナリオは終了する。
各処理項目(FCT,QB,TTS,STS,BR,TRM)の間を結ぶ線はネットを表す。各ネットに付された番号はネット番号を表す。以下、ネット番号xのネットを「NETx」と記す。「JA」及び「JC」はネットの接続点を表す。
例えば、最初の入力イベントとして「下げて」というキーワードが入力された場合、対話認識モジュール2により処理項目FCT6が実行され、NET6が活性化される。続いて、処理項目TTS1において「エアコンか窓か?」という発話処理が行われ、NET6が非活性化されるとともにNRT19が活性化される。それに伴い、NET20が活性化される。そして処理項目QB1が実行されて入力イベントして「エアコン」,「窓」,その他の何れが入力されたかを判定する。それに応じて対話のフローを分岐させる処理が行われ、NET19,20が非活性化されるとともにNRT27,31,29の何れかが活性化される。このようにして、図2の対話シナリオに従って対話処理が実行される。
図3は、処理項目テーブル12の構造を表す図である。図3においては、一例として、図2の対話シナリオに対する処理項目テーブル12の構造を示した。
「処理項目」の欄には、図2の各処理項目に対応する処理項目実行モジュール4−iを呼び出すためのポインタが格納されている。尚、ここではネットの接続点「JA」も、何も実行しない処理項目として、仮想的に一つの処理項目として取り扱っている。
「入力ネット」の欄には、当該処理項目に対する入力ネットの指定子が格納されている。すなわち、ネット状態テーブル10における当該入力ネットのネットステータスを指すポインタが格納されている。
「出力ネット」の欄には、当該処理項目に対する出力ネットの指定子が格納されている。すなわち、ネット状態テーブル10における当該出力ネットのネットステータスを指すポインタが格納されている。
「コーパス」の欄には、その処理項目におけるキーワードが格納されている。例えば、処理項目FCT1では、コーパスとして「エアコンをつけて」が格納されている。また、処理項目QB1では、コーパスとして「窓」及び「エアコン」が格納されている。
図4は、ネット状態テーブル10の構造を表す図である。尚、図1においては、理解を容易にするためにネット状態テーブル10と前状態ネット状態テーブル11を分けて記載しているが、図4では、ネット状態テーブル10及び前状態ネット状態テーブル11を併合して1つのテーブルとしている。「ネットステータス」の欄には、左欄のネットのネットステータスが格納されている。ここでは、ネットステータスは「0」が非活性状態、「1」が活性状態を表すものとする。「変更フラグ」の欄には、ネットステータスが変更されたか否かを示す変更フラグが格納されている。変更フラグが「0」が未変更、「1」が変更を表す。
以上のように構成された実施例1に係る対話情報処理装置1について、以下その動作を説明する。
図5は対話認識モジュール2の動作を表すフローチャートである。
ステップS1において、使用者の発話等により入力装置5から入力イベント認識手段8へ入力イベントが入力される。
例えば、使用者の発話として入力装置5に「エアコンをつけて」と入力したとする。その場合、入力装置5はその音声波形を入力イベント認識手段8に出力する。
ステップS2において、入力イベント認識手段8は、認識辞書7を参照することによって入力イベントを認識し、その認識結果を認識情報として認識情報入力手段9へ出力する。
例えば、上記例で「エアコンをつけて」という音声波形が入力イベントとして入力された場合、入力イベント認識手段8は、認識辞書7を参照し、その音声波形を解析し「エアコンをつけて」というテキスト情報を認識情報として出力する。
ステップS3において、認識情報入力手段9は、処理項目テーブル12を参照し、当該認識情報に一致するキーワードを有する処理項目FCTを探索する。そして、キーワードが一致した処理項目の出力ネットについて、ネット状態テーブル10内のネットステータスを活性状態に変更するとともに、その変更フラグを1とする。
また、認識情報入力手段9は、入力ネットが活性状態にある処理項目QBのうち、当該認識情報に一致するキーワードを有する処理項目QBを探索する。そして、探索により検出された処理項目QBの出力ネットのうちキーワードが一致した枝の出力ネットについて、ネット状態テーブル10内のネットステータスを活性状態に変更するとともに、その変更フラグを1とする。
例えば、「エアコンをつけて」というテキスト認識情報が認識情報入力手段9に入力された場合、認識情報入力手段9は処理項目FCT1の出力ネットであるNET1を活性状態とする。また、処理項目QB1の入力ネットであるNET20が活性状態の場合に、「窓」というテキスト認識情報が認識情報入力手段9に入力された場合、認識情報入力手段9は処理項目QB1の「窓」に相当する枝の出力ネットであるNET31を活性状態とする。
以上のステップS1〜S3の処理が終了すると、対話認識モジュール2はすべての処理を終了し、再び入力イベントが入力されるのを待つ状態となる。
次に、対話処理エンジン3と各処理項目実行モジュール4−iの動作について説明する。図6は、対話処理エンジン3と各処理項目実行モジュール4−iの動作を表すフローチャートである。
まず、ステップS11において、状態変化判定手段14は、ネット状態テーブル10のネットステータスが変更されたか否かを監視する。ネットステータスが変更された場合には、ステップS12に進む。
ステップS12において、選択実行手段13は、処理項目テーブル12の最上行から順番に処理項目を1つ選択する。
ステップS13において、選択実行手段13は、選択した処理項目の入力ネットのネットステータスをネット状態テーブル10から取得する。
ステップS14において、選択実行手段13は、選択した処理項目に対応する処理項目実行モジュール4−iを呼び出して、取得したネットステータスを渡す。そして、選択した処理項目の入力ネットを非活性状態に戻す。尚、選択した処理項目が接続点(JA)の場合、選択実行手段13は、その接続点の出力ネットを活性状態とし、その入力ネットを非活性状態に戻す。
各処理項目実行モジュール4−iにおいては、選択実行手段13から呼び出されると、ステップS21において、まず入力ネットのネットステータスを取得し、ステップS22において入力ネットのネットステータスが活性状態か否かを検査する。ここで非活性状態であれば何も実行せずに終了する。
一方、活性状態であれば、ステップS23において、その処理項目を実行する。そして、ステップS24において必要に応じて、ネット状態テーブル10における出力ネットのネットステータスを活性状態に変更し終了する。
例えば、処理項目BR1では、エアコンがON状態か否かを判定する処理を行い、ON状態であればNET17、OFF状態であればNET16のネットステータスを活性状態に変更して終了する。処理項目TTS1では、「エアコンか窓か?」という発語処理を行ったのち、出力ネットのネットステータスは活性状態として終了する。処理項目QB1では、使用者からの入力イベントの入力待ち状態となって、出力ネットのネットステータスは変更することなく終了する。
ステップS15において、選択実行手段13は、処理項目テーブル12内のすべての処理項目に対して上記ステップS12〜S14の処理が終わったか否かを判定し、終わっていなければステップS12に戻る。すべて終わった場合、再びステップS11に戻る。
このように、ネット状態テーブル10内のネットステータスの状態変化がなくなるまで、処理項目テーブル12のすべての処理項目が繰り返し実行される。そして、定常状態まで到達すると再び入力イベントを待つ状態となる。
以上のような処理とすることで、複数の入力イベントが同時に入力された場合であっても、それに対応した処理項目を実行することができる。例えば、「エアコンをつけて」という入力イベントと「閉めて」という入力イベントが同時に入力された場合、NET1とNET4が活性状態となる。NET1の活性状態はNET1→NET15→TTS7→NET57→END4と伝達され、その間、処理項目TTS7が実行されて定常状態に達する。一方、NET4の活性状態はNET4→TTS9→NET59→END6と伝達され、その間、処理項目TTS9が実行されて定常状態に達する。このように、処理項目テーブル12とネット状態テーブル10を用いてネットステータスの活性状態の遷移によって対話情報処理を制御することで、同時に複数の入力イベントがあっても、適切な応答処理が可能となる。
また、対話シナリオに新たな処理項目を追加し、又は対話シナリオから処理項目を削除したい場合には、処理項目テーブル12に処理項目を追加し、追加・削除した箇所のネットの接続関係を整合させるとともに、追加・削除されたネットをネット状態テーブル10に追加又は削除するだけでよい。すなわち、対話シナリオの全体構造を考慮した変更は必要なく、追加・削除したい処理項目の部分のみを変更すればよい。従って、対話シナリオへの処理項目の追加や削除が極めて容易となる。
本発明の実施例1に係る対話情報処理装置1の構成を表すブロック図である。 実施例1に係る対話情報処理装置1におけるシナリオ構造の一例を表す図である。 処理項目テーブル12の構造を表す図である。 ネット状態テーブル10の構造を表す図である。 対話認識モジュール2の動作を表すフローチャートである。 対話処理エンジン3と各処理項目実行モジュール4−iの動作を表すフローチャートである。 特許文献2記載の対話情報処理装置におけるシナリオの階層構造を表す図である。
符号の説明
1 対話情報処理装置
2 対話認識モジュール
3 対話処理エンジン
4 処理実行モジュール集合
4−1,4−2,4−3,…,4−i,…,4−n 処理項目実行モジュール
5 入力装置
6 出力装置
7 認識辞書
8 入力イベント認識手段
9 認識情報入力手段
10 ネット状態テーブル
11 前状態ネット状態テーブル
12 処理項目テーブル
13 選択実行手段
14 状態変化判定手段

Claims (6)

  1. 予め用意された複数の処理項目に対して、入力イベントに対応して対話的に各処理項目を適宜選択し実行する対話情報処理装置であって、
    前記各処理項目間の情報伝達関係を指定するネットについて、前記各ネットを介して伝達される状態情報を表す変数(以下「ネットステータス」という。)をテーブルとして記憶するネット状態テーブル;
    前記処理項目、当該処理項目の入力側に接続するネット(以下「入力ネット」という。)、及び当該処理項目の出力側に接続するネット(以下「出力ネット」という。)、の組をテーブルとして記憶する処理項目テーブル;
    前記各処理項目に対応して設けられ、前記入力ネットのネットステータスが活性状態にある場合には当該処理項目の処理内容を実行しその結果に応じて前記出力ネットのネットステータスの更新を行う、複数の処理項目実行モジュール;
    前記処理項目テーブル内の全ての前記処理項目を順次選択し、選択した前記処理項目の前記入力ネットのネットステータスを前記ネット状態テーブルから読み出し、当該処理項目に対応する前記処理項目実行モジュールに入力して実行させる選択実行手段;
    並びに、前記ネット状態テーブルの何れかのネットステータスが変化した場合に前記選択実行手段により前記各処理項目実行モジュールを実行させる状態変化判定手段;
    を備えたことを特徴とする対話情報処理装置。
  2. 入力イベントが入力された場合、当該入力イベントに対応する前記ネットのネットステータスを活性状態に更新する初期ネット状態更新手段;
    を備えたことを特徴とする請求項1記載の対話情報処理装置。
  3. 前記初期ネット状態更新手段は、複数の入力イベントが同時に入力された場合、当該各入力イベントに対応する前記ネットのネットステータスを各々更新することを特徴とする請求項2記載の対話情報処理装置。
  4. 使用者の操作により入力イベントを発生させる入力装置を備え、
    前記初期ネット状態更新手段は、
    各入力イベントと所定の認識情報との対応関係を記憶する認識辞書;
    前記入力イベントに対して前記認識辞書を参照し、対応する認識情報を出力する入力イベント認識手段;
    及び、前記入力イベント認識手段が出力する認識情報に対応する前記ネットのネットステータスを当該認識情報により指定される状態に更新する認識情報入力手段;
    を備えていることを特徴とする請求項2又は3記載の対話情報処理装置。
  5. コンピュータに読み込ませて実行することにより、コンピュータを請求項1乃至4の何れか一に記載の対話情報処理装置として機能させるプログラム。
  6. 予め用意された複数の処理項目に対して、前記各処理項目間の情報伝達関係を指定するネットについて、前記各ネットを介して伝達される状態情報を表す変数(以下「ネットステータス」という。)をテーブルとして記憶するネット状態テーブル;
    前記処理項目、当該処理項目の入力側に接続するネット(以下「入力ネット」という。)、及び当該処理項目の出力側に接続するネット(以下「出力ネット」という。)、の組をテーブルとして記憶する処理項目テーブル;
    並びに、前記各処理項目に対応して設けられ、前記入力ネットのネットステータスに対する当該処理項目の処理内容を実行しその結果に応じて前記出力ネットのネットステータスの更新を行う、複数の処理項目実行モジュール;
    を備えたシステムにおいて、入力イベントに対応して対話的に各処理項目を適宜選択し実行する対話情報処理方法であって、
    入力イベントが入力された場合、前記ネット状態テーブルの各ネットのうち、当該入力イベントに対応するネットのネットステータスを更新する初期ネット状態更新ステップ;
    及び、入力イベントに対して前記処理項目実行モジュールを適宜選択し実行する処理項目実行ステップ;
    を備え、
    前記処理項目実行ステップにおいては、
    ネット状態テーブルの何れかのネットステータスが変化を検出するネット状態変化検出ステップ;
    及び、ネットステータスの変化が検出された場合には前記処理項目テーブル内の全ての前記処理項目を順次選択し、選択した前記処理項目の前記入力ネットのネットステータスを前記ネット状態テーブルから読み出し、当該処理項目に対応する前記処理項目実行モジュールに入力して実行させる選択実行ステップ;
    を前記ネットステータスの変化が検出されなくなるまで繰り返して実行すること
    を特徴とする対話情報処理方法。




JP2005084287A 2005-03-23 2005-03-23 対話情報処理装置及び対話情報処理方法 Active JP4682322B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005084287A JP4682322B2 (ja) 2005-03-23 2005-03-23 対話情報処理装置及び対話情報処理方法
PCT/JP2006/305815 WO2006101164A1 (ja) 2005-03-23 2006-03-23 対話情報処理装置及び対話情報処理方法
US11/886,916 US7743027B2 (en) 2005-03-23 2006-03-23 Interaction information processing apparatus and interaction information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005084287A JP4682322B2 (ja) 2005-03-23 2005-03-23 対話情報処理装置及び対話情報処理方法

Publications (3)

Publication Number Publication Date
JP2006268332A true JP2006268332A (ja) 2006-10-05
JP2006268332A5 JP2006268332A5 (ja) 2007-10-18
JP4682322B2 JP4682322B2 (ja) 2011-05-11

Family

ID=37023821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005084287A Active JP4682322B2 (ja) 2005-03-23 2005-03-23 対話情報処理装置及び対話情報処理方法

Country Status (3)

Country Link
US (1) US7743027B2 (ja)
JP (1) JP4682322B2 (ja)
WO (1) WO2006101164A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103869982A (zh) * 2014-03-13 2014-06-18 小米科技有限责任公司 操作项选择方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249296A (ja) * 1995-03-10 1996-09-27 Fuji Electric Co Ltd マルチプロセッサシステム
JPH10320187A (ja) * 1997-05-19 1998-12-04 Mitsubishi Electric Corp システムモデル化方式及びデータ通信方式
JP2003044088A (ja) * 2001-07-27 2003-02-14 Sony Corp プログラム、記録媒体、並びに音声対話装置および方法
JP2003076543A (ja) * 2001-08-31 2003-03-14 Cats Kk プログラム生成装置、プログラム生成方法およびその方法をコンピュータに実行させるプログラム
JP2003334785A (ja) * 2002-03-15 2003-11-25 Sony Corp ロボットの行動制御システム及び行動制御方法、並びにロボット装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63317805A (ja) * 1987-06-22 1988-12-26 Hitachi Ltd ペトリネットに基づくシミュレ−ション装置
CA2071309C (en) * 1991-11-15 1998-01-20 Daryl J. Kahl Method and apparatus utilizing data icons
US5659794A (en) * 1995-03-31 1997-08-19 Unisys Corporation System architecture for improved network input/output processing
EP0895194A1 (en) * 1997-01-24 1999-02-03 Sony Corporation Pattern data generator, pattern data generating method and its medium
US5950190A (en) * 1997-05-13 1999-09-07 Aptek, Inc. Dynamic, self-modifying graphical user interface for relational database applications
US6081814A (en) * 1997-07-07 2000-06-27 Novell, Inc. Document reference environment manager
US6014647A (en) * 1997-07-08 2000-01-11 Nizzari; Marcia M. Customer interaction tracking
JPH11234753A (ja) * 1998-02-16 1999-08-27 Mitsubishi Electric Corp 移動通信システムおよび移動通信システムに適用される移動通信装置
AUPP624698A0 (en) * 1998-09-29 1998-10-22 Canon Kabushiki Kaisha Method and apparatus for multimedia editing
JP2001056694A (ja) 1999-08-19 2001-02-27 Denso Corp 対話型ユーザインタフェース装置
JP3674453B2 (ja) * 2000-04-14 2005-07-20 株式会社デンソー 対話型ユーザインターフェース装置
US20020165724A1 (en) * 2001-02-07 2002-11-07 Blankesteijn Bartus C. Method and system for propagating data changes through data objects
US7464091B2 (en) * 2002-11-27 2008-12-09 Sap Ag Method and software for processing data objects in business applications

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249296A (ja) * 1995-03-10 1996-09-27 Fuji Electric Co Ltd マルチプロセッサシステム
JPH10320187A (ja) * 1997-05-19 1998-12-04 Mitsubishi Electric Corp システムモデル化方式及びデータ通信方式
JP2003044088A (ja) * 2001-07-27 2003-02-14 Sony Corp プログラム、記録媒体、並びに音声対話装置および方法
JP2003076543A (ja) * 2001-08-31 2003-03-14 Cats Kk プログラム生成装置、プログラム生成方法およびその方法をコンピュータに実行させるプログラム
JP2003334785A (ja) * 2002-03-15 2003-11-25 Sony Corp ロボットの行動制御システム及び行動制御方法、並びにロボット装置

Also Published As

Publication number Publication date
WO2006101164A1 (ja) 2006-09-28
JP4682322B2 (ja) 2011-05-11
US20090013000A1 (en) 2009-01-08
US7743027B2 (en) 2010-06-22

Similar Documents

Publication Publication Date Title
JP4509039B2 (ja) 音声対話インターフェース装置及び方法
US7546382B2 (en) Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms
JP7204690B2 (ja) 作成者が提供したコンテンツに基づいて対話型ダイアログアプリケーションを調整すること
Bohus et al. The RavenClaw dialog management framework: Architecture and systems
KR101066741B1 (ko) 컴퓨터 시스템과 동적으로 상호작용하기 위한 컴퓨터 구현 방법, 시스템, 및 컴퓨터 판독가능 기록 매체
US7024368B1 (en) Man-machine dialogue system, controls dialogue between system and user using dialogue specification employing augmented transition networks propagating tokens
Milhorat et al. Building the next generation of personal digital assistants
JP4186992B2 (ja) 応答生成装置、方法及びプログラム
JP2003216574A (ja) ダイアログを目的とするアプリケーション抽象化のための記録媒体及び方法
US7461344B2 (en) Mixed initiative interface control
KR20080040644A (ko) 음성 애플리케이션 계측 및 로깅
KR102527107B1 (ko) 음성에 기반하여 기능을 실행하기 위한 방법 및 이를 지원하는 사용자 전자 장치
JP2004021920A (ja) 情報処理装置、情報処理方法、プログラム、記憶媒体
JP2002301675A (ja) ロボット、ロボット制御システム、およびそのプログラム
TW201025075A (en) Method and system for generating vocal user interface code from a data meta-model
JP4682322B2 (ja) 対話情報処理装置及び対話情報処理方法
WO2017159207A1 (ja) 処理実行装置、処理実行装置の制御方法、および制御プログラム
JP2001056694A (ja) 対話型ユーザインタフェース装置
Turunen Jaspis-a spoken dialogue architecture and its applications
JPWO2019026716A1 (ja) 情報処理装置、及び情報処理方法
US11488600B2 (en) Efficient dialogue configuration
JP2003280687A (ja) シナリオ作成支援装置及びプログラム
WO2015140975A1 (ja) 動作設計装置及び動作設計プログラム
JP2015179481A (ja) 動作設計装置及び動作設計プログラム
Potamianos et al. Information seeking spoken dialogue systems—part ii: Multimodal dialogue

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070904

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150