WO2005062294A1

WO2005062294A1 - 機器制御装置、音声認識装置、エージェント装置､データ構造及び機器制御方法

Info

Publication number: WO2005062294A1
Application number: PCT/IB2004/004001
Authority: WO
Inventors: Yasushi Sato
Original assignee: Kabushikikaisha Kenwood
Priority date: 2003-12-05
Filing date: 2004-12-06
Publication date: 2005-07-07
Also published as: JP4905522B2; EP1691345A1; JP4516918B2; EP1691345A4; JP2009288815A; CN1890710A; JPWO2005062294A1; CN1890710B; US20080228492A1

Description

明細書

機器制御装置、音声認識装置、エージェント装置、データ構造及び機器制御方法

技術分野

[0001] この発明は、機器制御装置、音声認識装置、エージェント装置、データ構造及び機器制御方法に関する。

背景技術

[0002] 近年、音声認識の技術を用いて音声を認識し、認識結果に応答して電気機器などを制御する手法が用いられている。この手法は、具体的には、入力した音声が表す単語を識別し、識別された単語が所定のキーワードに合致するカゝ否かを判別して、判別結果に基づレ、て外部の機器を制御するものである (例えば、特許文献 1参照)。特許文献 1：特開平 8 _ 339288号公報

発明の開示

発明が解決しょうとする課題

[0003] しかし、人間が言語の形で発する指示を完全に認識するのは困難である。このため、上述の手法では、人間が言語の形で発する指示に適切に応答することができない場合があった。

[0004] この発明は上記実状に鑑みてなされたものであり、人間が言語の形で発する指示に適切に応答して機器を制御できる機器制御装置、音声認識装置、エージェント装置、データ構造及び機器制御方法を提供することを目的とする。

課題を解決するための手段

[0005] 上記目的を達成するため、この発明の第 1の観点にかかる機器制御装置は、入力される入力情報を認識する入力情報認識手段（2)と、

入力情報認識手段 (2)によって認識された認識情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段 (D4)と、

複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段 (D5)と、を備え、前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、少なくとも前記認識情報とそれぞれの遷移定義データの条件から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、

ことを特徴とする。

[0006] 前記認識情報は、入力情報と比較対象情報との尤度 (スコア)を有してなり、

前記一の遷移定義データの選択は、前記尤度 (スコア)を用いて行われる、ようにしてあよい。

[0007] 所定の処理項目力遷移定義データによって遷移を定義されていない処理項目若しくは遷移定義データにジャンプされるとき、当該所定の処理項目カゝらジャンプされた処理項目若しくは遷移定義データに対しての遷移定義データを生成する、ことができる。

[0008] 前記入力情報は音声信号であり、

前記遷移定義データの条件は、当該遷移定義データに関連付けられた単語である、よう〖こしてもよレヽ。

[0009] 前記遷移定義データの条件は、複数設定されてなる、ようにしてもょレ、。

[0010] この発明の第 2の観点に力かる機器制御装置は、

入力情報に対応する処理を実行する処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを記憶し、入力情報に応じて一の遷移定義データを選択し、選択された一の遷移定義データによって指定される処理項目に状態を遷移する機器制御装置 (6)であって、

前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、

前記重み係数を算出するための基準であって、当該遷移定義データに対してそれぞれ設定される定数と、を有し、

状態が遷移している一の処理項目に連なる他の処理項目に係る遷移定義データの重み係数は、一の処理項目に係る遷移定義データの前記定数から、他の処理項目に係る遷移定義データまでの定数が累積されて算出される、 - ことを特徴とする。

[0011] この発明の第 3の観点にかかる機器制御装置は、

入力される入力情報を認識する入力情報認識手段（2)と、

複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段 (D5)と、を備え、

前記遷移定義データのそれぞれは、入力情報に対応する条件と、前記条件に対応する重み係数と、を有し、

前記認識情報は、前記入力情報と前記遷移定義データが有する条件との一致状態を示す尤度 (スコア)を有し、

前記遷移定義データの条件に対応する尤度 (スコア）に前記重み係数を対応させて、それぞれの遷移定義データの条件につ!ヽての判別結果を得、

前記判別結果に基づレ、て一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、

ことを特徴とする。

[0012] 所定の処理項目から遷移定義データによって遷移を定義されていない処理項目若しくは遷移定義データにジャンプされるとき、当該所定の処理項目からジャンプされた処理項目若しくは遷移定義データに対しての遷移定義データを生成する、ことができる。

[0013] 前記重み係数の算出基準である遷移定数は、前記遷移定義データに対応して定数として設定され、

状態が遷移している一の処理項目に連なる他の処理項目に係る遷移定義データの重み係数は、一の処理項目に係る遷移定義データの前記定数から、他の処理項目に係る遷移定義デタまでの定数が累積されて算出される、ようにしてもよい。

[0014] 前記遷移定数は、

当該遷移定数に係る遷移定義データが選択されたことを条件に変化される、ようにしてもよレ、。

[0015] 一の処理項目に状態が遷移している場合であっても、所定の処理項目に係る遷移定義データの重み係数は、所定の値より高く設定されてなる、ようにしてもよい。

[0016] 前記入力情報は音声信号であり、

前記遷移定義データの条件は音声認識を行う対象の単語である、ようにしてもよい

[0017] 前記条件は、一の遷移定義データに対して複数設定されてなる、ようにしてもよい。

[0018] この発明の第 4の観点にかかる機器制御装置は、

入力情報を認識することによって得られた認識情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段 (D4)を備え、

遷移定義データによって複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義し、

必要とされる処理項目の連なりに応じて、前記遷移定義データを追加若しくは削除することによって、処理項目のフローチャートが生成されてなる、

ことを特徴とする。

[0019] 前記処理項目データ記憶手段 (D4)は、

処理項目を適宜追加可能なように構成されてなる、ようにしてもよ！/、。

[0020] 前記遷移定義データは、入力情報に対応する条件をそれぞれ有する、ようにしてもよい。

[0021] 前記認識情報は、入力情報と前記遷移定義データの条件との一致状態を示す尤度 (スコア)を有し、

前記遷移定義データの条件に対応する前記尤度 (スコア)が前記遷移定義データに設定される、よう〖こしてもよい。

[0022] 前記入力情報は音声信号であり、

前記遷移定義データの条件は、音声認識を行う対象単語であり、

前記認識情報は、音声信号と前記遷移定義データの対象単語との一致状態を示す尤度 (スコア)を有し、

前記遷移定義データの対象単語に対応する前記尤度 (スコア)が前記遷移定義データに設定され、

前記尤度 (スコア）に応じて一の前記遷移定義データを選択し、選択された一の遷移定義データによって示される処理項目に状態を遷移させる、ようにしてもよい。

[0023] 前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、を有する、ようにしてもよい。

[0024] 前記重み係数の算出基準である遷移定数は、前記遷移定義データに対応して定数として設定され、

状態が遷移している一の処理項目に連なる他の処理項目に係る遷移定義データの重み係数は、一の処理項目に係る遷移定義データの前記定数から、他の処理項目に係る遷移定義データまでの定数が累積されて算出される、ようにしてもよい。

[0025] この発明の第 5の観点に力かる音声認識装置は、

入力される入力情報を認識する入力情報認識手段 (2)と、

入力情報認識手段（2)によって認識された認識情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段 (D4)と、

複数の処理項目のうちの一の処理項目から他の処理項目.への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段 (D5)と、

を備え、

前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、少なくとも前記認識情報とそれぞれの遷移定義データの条件から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、

ことを特徴とする。

[0026] この発明の第 6の観点に力かる音声認識装置は、

入力情報に対応する処理を実行する処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを記憶し、入力情報に応じて一の遷移定義データを選択し、選択された一の遷移定義データによって指定される処理項目に状態を遷移する機器制御装置 (6)を備え、前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、

状態が遷移している一の処理項目に連なる他の処理項目に係る遷移定義データの重み係数は、一の処理項目に係る遷移定義データの前記定数から、他の処理項目に係る遷移定義データまでの定数が累積されて算出される、

ことを特徴とする。

[0027] この発明の第 7の観点に力かる音声認識装置は、

入力される入力情報を認識する入力情報認識手段 (2)と、

前記認識情報は、前記入力情報と前記遷移定義データが有する条件との一致状 '態を示す尤度 (スコア)を有し、 ·

前記遷移定義データの条件に対応する尤度 (スコア）に前記重み係数を対応させて、それぞれの遷移定義データの条件にっレ、ての判別結果を得、

前記判別結果に基づレヽて一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、

ことを特 ί敷とする。

[0028] この発明の第 8の観点に力かる音声認識装置は、

ことを特徴とする。

[0029] この明の第 9の観点に力かるエージェント装置は、

入力される入力情報を認識する入力情報認識手段 (2)と、

ことを特徴とする。

[0030] この発明の第 10の観点に力かるエージェント装置は、

入力情報に対応する処理を実行する処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを記憶し、入力情報に応じて一の遷移定義データを選択し、選択された一の遷移定義データによって指定される処理項目に状態を遷移する機器制御装置 (6)を備え、

前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、

前記重み係数を算出するための基準であって、当該遷移定義データに対してそれぞれ設定される定数と、

を有し、

ことを特徴とする。

[0031] この発明の第 11の観点に力かるエージェント装置は、

入力される入力情報を認識する入力情情報認識手段 (6)と、

入力情報認識手段 ('2)によって認識された認識情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段 (D4)と、

前記遷移定義データの条件に対応する尤度 (スコア）に前記重み係数を対応させて、それぞれの遷移定義データの条件についての判別結果を得、

ことを特徴とする。

[0032] この発明の第 12の観点に力かるエージェント装置は、

遷移定義データによって複数の処理項目のうちの一の処理項目力他の処理項目への遷移を定義し、

ことを特徴とする。

[0033] この発明の第 13の観点に；^かるデータ構造は、

入力情報に対応する処理を実行する処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データのデータ構造であって、前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、を有し、

前記重み係数の算出基準である遷移定数は、遷移定義データに対応して定数として設定され、

状態が遷移している一の処理項目に連なる他の処理項目に係る遷移定義データの重み係数は、一の処理項目に係る遷移定義データの前記遷移定数から、他の処理項目に係る遷移定義データまでの定数が累積されて算出される、

ことを特徴とする。

[0034] 前記入力情報は音声信号であり、

前記入力情報に対応する条件は、音声認識を行う対象単語である、ようにしてもよレ、。

[0035] この発明の第 14の観点に力かる機器制御方法は、

入力情報認識手段 (2)によって認識された認識情報に対応する処理を実行する処理項目を複数記憶し、複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶した機器 (6)の機器制御方法であつて、

入力される入力情報を認識する入力情報認識ステップと、'

少なくとも前記入力情報認識ステップで認識された認識情報と、前記遷移定義データに対応して設定された条件から一の遷移定義データを選択するステップと、選択された遷移定義データによって指定される処理項目に状態を遷移させるステツプと、

を有することを特徴とする。

[0036] この発明の第 15の観点に力かる機器制御方法は、

入力される入力情報を認識する入力情報認識ステップと、

前記入力情報認識ステップで認識された認識情報から、複数の処理項目のうちの —の処理項目から他の処理項目への遷移を定義する遷移定義データに対応付けられた条件と前記入力情報との一致状態を示す尤度 (スコア)を特定するステップと、前記遷移定義データに対応付けられ 7 重み係数を、前記尤度 (スコア）に対応させることによって判別結果を得るステップと、

前記判別結果に基づいて一の遷移定義データを選択するステップと、選択された遷移定義データによって指定される処理項目に状態を遷移させるステツプと、

を有することを特徴とする。

[0037] この発明の第 16の観点にかかる機器制御方法は、

入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶ステップと、

遷移定義データによって複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定養し、必要とされる処理項目の連なりに応じて、前記遷移定義データを追加若しくは削除することによって、処理項目のフローチャートを生成するステップとを有することを特徴とする。

発明の効果

[0038] この発明によれば、人間が言語の形で発する指示に適切に応答して機器を制御できる機器制御装置、音声認識装置、エージェント装置、データ構造及び機器制御方法が実現される。

図面の簡単な説明

[0039] [図 1]この発明の実施の形態に係る車内空調システムを示す図である。

[図 2]この実施の形態に係る車内空調システムのより詳細な構成図である。

[図 3]グルーピング用のフラグの具体例を模式的に示す図である。

[図 4]トリガ取得処理を説明するための図である。

[図 5]判別処理を説明するための図である。

[図 6]問い合わせ付きの判別処理を説明するための図である。

[図 7]入出力処理を説明するための図である。

[図 8]ワイヤを示す図である。

[図 9]処理項目データベース及びワイヤデータベースが全体として表しているフローを示す図である。

[図 10]重み係数の設定を説明するための図である。

[図 11]エージェント処理部の動作を説明するためのフローチャートである。

符号の説明

[0040] 1 音声入力部

2 言語解析部

3 音声合成処理部

4 音声出力部

5 入出力対象機器群

51 エアコン

52 窓開閉制御部

6 エージェント処理部

発明を実施するための最良の形態

[0041] 以下、図面を参照して、この発明の実施の形態を、車両内に設置された車内空調システムを例として説明する。尚、本発明によれば、入力情報に応じて状態を遷移させて処理を行うエージェント装置として車内空調システムを機能させることができる。また、車内空調システムの一部は、音声認識装置として機能する。

図 1は、この車内空調システムの構成を示すプロック図である。図示するように、この車内空調システムは、音声入力部 1と、言語解析部 2と、音声合成処理部 3と、音声出力部 4と、入出力対象機器群 5と、エージェント処理部 6とより構成されている。

[0042] 音声入力部 1は、音声を入力し、入力した音声力デジタル形式の音声データを生成し、この音声データを言語解析部 2へと供給する。具体的には、音声入力部 1は、図 2に示すように、例えば、マイクロフォン 11と、 AF (Audio Frequency)増幅器 12と、サンプルホールド回路を内蔵する A/D (Analog- to- Digital)コンバータ 13などより構成されている。マイクロフォン 11は音声を音声信号に変換して出力する。 AF増幅器 12は、マイクロフォン 11からの音声信号を増幅して出力する。 AZDコンバータ 13は、 AF増幅器 12からの増幅された音声信号をサンプリング、 AZD変換することにより、ディジタル音声データを生成し、言語解析部 2へと供給する。 [0043] 言語解析部 2と音声合成処理部 3とエージェント処理部 6とは、図 2に示すように、それぞれ、例えば、 CPU (Central Processing Unit)等からなるプロセッサ 21、 31, 61と、このプロセッサ 21、 31、 61が実行するプログラムを記憶するハードディスク装置等の不揮発性メモリ 22、 32、 62と、プロセッサのワークエリアとなる記憶領域を有する R AM (Random Access Memory)等の揮発性メモリ 23、 33, 63とより構成されている。なお、言語解析部 2、音声合成処理部 3及ぴエージェント処理部 6の一部又は全部の機能を 1つのプロセッサや 1つの不揮発性メモリや 1つの揮発性メモリで構成してもよい。

[0044] 言語解析部 2は、音声入力部 1より供給された音声データに音声認識処理を行う。

言語解析部 2は、音声認識処理により、音声データが表している単語の候補と、この候補の尤度 (スコア） Sとを特定する。スコア Sの値が所定値を下回る単語については、候捕として選択しない。音声認識の手法は任意であり、また、候補は複数特定されてよい。そして、特定した候捕及び当該候補のスコア Sを示すデータ (以下、単語データと呼ぶ）を生成し、エージェント処理部 6へと供給する。尚、単語データは、単語情報そのものとスコア Sを含むものとしても良いが、実際には単語 IDとスコア Sを含むものとした方が、データの取扱上有利である。

[0045] 音声合成処理部 3の不揮発性メモリ 32は、単語の波形を表すデータを記憶する音片データベース D1と、音素を構成するための波形を表すデータを記憶する素片データベース D2とを記憶する。

音片データベース D1は、単語の波形を表すデータを記憶する。素片データベース D2は、音素を構成するための波形を表すデータを記憶する。音声合成処理部 3は、音片データベース D1及ぴ Z又は素片データベース D2に格納されているデータを用レ、て、エージェント処理部 6より供給された文章データを読み上げる音声を表すデジタル音声データを生成する。

音声合成部 3は、生成した音声データを音声出力部 4に供給する。

デジタル音声データを生成する手法は任意であるが、例えば、録音編集方式ゃ規則合成方式 (Rule- based synthesis)を使用できる。なお、録音編集方式は、例えば、単語単位の音声を予めアナウンサーに読んでもらい、それらをつなぎあわせて出力する方式である。また、規則合成方式は、音韻 (子音や母音)や仮名のような比較的小さな単位をつなぎあわせて出力する方式である。

[0046] 音声出力部 4は、音声合成処理部 3から供給されたデジタル音声データが表す音声を再生する。より詳細には、音声出力部 4は、図 2に示すように、 D/A(

Digital-to- Analog)コンバータ 41、 AF増幅器 42及びスピーカ 43を備える。

D/Aコンバータ 41は、音声合成処理部 3より供給されたデジタル音声データを D /A変換して、アナログ音声信号に変換する。 AF増幅器 42は、アナログ音声信号を増幅する。スピーカ 43は、アナログ音声信号に従って振動し、アナログ音声データが表す音声を再生し、放音する。

[0047] 入出力対象機器群 5は、例えば、エアコン (エアコンディショナ) 51や、窓開閉制御部 52などより構成されている。

[0048] エアコン 51は、自己に供給される制御信号に従って、冷房、暖房又は送風の動作を行う。また、エアコン 51は、自己の動作状態を表すデータとして、例えば、自己が冷房動作中、暖房動作中、設定温度へ向けた温度調整中、送風動作中及び停止中のうちどの状態にあるかを示すデータを生成して出力する。また、エアコン 51は、設定状態を表すデータとして、例えば、現在の設定温度を示すデータを生成して出力する。

[0049] 窓開閉制御部 52は、モーターや、制御信号に従ってモータの回転及ぴ停止を制御する制御回路や、モーターの回転に従って窓枠を動かすためのウィンチ等力構成されており、自己に供給される制御信号に従って、窓の開閉を行う。また、窓開閉制御部 52の制御回路は、窓開閉制御部 52の動作状態を表すデータとして、例えば、開閉する対象の窓が開いている量を示すデータを生成して出力する。

[0050] エージェント処理部 6の不揮発性メモリ 62は、単語データベース D3を記憶する。単語データベース D3は、複数の単語のデータと、複数の単語のグルーピングを示すための単語グルーピング用のフラグ 1個以上とを、互いに対応付けて格納する。

[0051] 1個の単語に対応付けられている各フラグは、互いに異なる概念に対応付けられている。そして、フラグが所定の値 (以下では、この値は" 1"であるとする)を示す場合は、このフラグに対応付けられた単語が、このフラグに対応付けられた概念の下にダル一ビングされてレ、ることを示す。一方、このフラグが他の値 (例えば" 0")を示す場合は、この単語力 Sこの概念の下にはグルーピングされていないことを示す。

[0052] 図 3は、グルーピング用のフラグの具体例を模式的に示す図である。

図 3の例では、単語「上がる」、「暑い」及び「開ける」に、単語グルーピング用のフラグカビットずつ対応付けられている。

4ビットビット群の最上位 (MSB)のフラグは「温度」と!/、う概念に対応付けられてレ、る。上位から 2ビット目のフラグカ^ェアーコンデショナの操作」という概念に対応付けられている。上位から 3ビット目のフラグが「窓の開閉」という概念に対応付けられている。最下位のフラグ力 S「故障」という概念に対応付けられている。一方、図示するように、単語「上がる」に対応付けられている 4ビットのフラグ群の値が 2進数" 1110"であり、単語「暑い」に対応付けられているフラグ群の値が 2進数" 1100"であり、単語「開ける」に対応付けられて)/、るフラグ群の値が 2進数" 1010"である。

この場合、このフラグ群は、概念「温度」の下には単語「上がる」、「暑い」及び「開ける」がグルーピングされており、概念「エアコンの操作」の下には単語「上がる」及び「暑い」がグルーピングされており、概念「窓の開閉」の下には単語「暑い」及び「開ける」がグルーピングされており、概念「故障」の下には単語「上力 ¾」、「暑い」又は「開ける」のいずれもグルーピングされていないことを示す。当然、ビット数を増加させれば、多くの概念との関連を示すことができる。

なお、各単語及び各概念は、処理項目データベース D4に格納されている各処理項目の「判別条件」として使用される。

[0053] エージェント処理部 6の不揮発性メモリは、更に、処理項目データベース D4及ぴヮィャデータベース D5を記憶して!/、る。

[0054] 処理項目データベース D4は、エージェント処理部 6が行うトリガ取得処理 (TGxx) 、判別処理 (CNxx又は QBxx)及び入出力処理 (後述する EXxx)の内容を、処理項目（ポインタ)毎に記述するデータ (処理項目データ)を格納したデータベースである。なお、「XX」は識別番号である。

[0055] 処理項目データベース D4に格納される処理項目のうち、「トリガ取得処理 (TGxx) Jの内容を記述するデータは、これらの処理を開始させるトリガを特定するトリガデータ（トリガとして取得するデータの内容を指定するデータ）と、後述する進行方向決定用の遷移定数 (その進行方向に遷移する程度を示すもので、後述する重み係 ¾1の算出基準となる定数)とを含む。

トリガデータは任意であり、例えば、エアーコンデショナが冷房動作中、暖房動作中、温度調整中、送風動作中及び停止中のうちどの状態にあるかを示すデータや、窓が開いている量を示すデータや、室内の温度を示すデータや、言語解析部 2より供給される上述の単語データである。あるいは、トリガデータは、エージェント処理部 6 自身が行う処理から引き渡されるデータであってもよい。また、トリガデータ（トリガ取得処理で取得されるデータ）が単語データである場合は、当該単語データが表す単語が属すグルーピングに割り当てられている「概念」を示すデータでもよい。ただし、トリガ取得処理の内容は、後述するように、複数のトリガ取得処理が互いに同一の単語を表す単語データを取得することがないように記述されるものとする。

図 4 (a)にトリガ取得処理 TGxxの例を示す。この例では、トリガ TG01は、トリガとしての概念「暑い」を取得する（単語「暑い」にグルーピングされている単語（図 3の例では、単語「温度」又は「エアコンの操作」）を識別する)処理であり、その処理に後続する処理に進む (遷移する）か否かを決定するための遷移定数 kは 0. 8である。図 4 (b) には、トリガ取得処理 TG01のフローチャートを示す。

トリガ取得処理 TG02は単語「開けて」を取得する処理である。トリガ取得処理 TG0 3は概念「温度」に対応するグループに属す単語を取得する（図 3では、「上がる」、「暑い」、「開ける」のいずれかを取得する）処理である。 TG04は、概念「エアコンの操作」に対応するグループに属す単語（図 3では、「上がる」、「暑レ、」のいずれかを取得する）処理である。

処理項目データベース D4に格納されてレ、る「判別処理 (CNxx)」の内容を記述するデータは、判別条件と、判別結果としてとり得る結果のリストと、後述する戻り方向の遷移定数 kとを、判別処理別に記述したデータを含んでいる。判別処理の内容を記述するデータは、進行方向を決定するための遷移定数 kを、判別結果毎に記述したデータを含んでいる。

図 5 (a)に判別処理 CNxxの例を示す。この例では、判別処理 CN01は、「窓が開ヽてレ、るか否かを判別する処理」であり、開いて!/、ると判別したときに後続する処理に進むか否かを決定するための遷移定数 kが 0. 3、開いていないと判別したときにそれに後続する処理に進むか否かを決定するため遷移定数 kが 0. 4である。この例のフローチャートを図 5 (b)に示す。図 5 (b)に示すノード CN01. 1は、処理の開始点を示す始点ノード、ノード CN01. 2は、窓が閉じていると判別したときの進行方向のノードであり、その遷移定数 kは 0. 4である。さらに、ノード CN01. 3は、窓が開いていると判別したときの進行方向のノードであり、その遷移定数 kは 0. 3である。また、判別処理 CN02は、エアコン 51のステータスがオン (動作中力否かを判別する処理であり、動作中であると判別したときに後続する処理に進む力否力を決定するための遷移定数 kが 0. 5、オフである（動作していない）と判別したときの遷移定数 kが 0. 3である。

[0057] 「判別処理」は、判別に用いるデータを任意の取得源力取得する場合があってもよいとする。取得源としては、例えば、言語解析部 2や、エージェント処理部 6が実行する他の処理や、入出力対象機器群 5に属する機器や、その他外部の機器などが考えられる。そしてこの場合、判別処理の内容を記述するデータは、例えば、判別に用 V、るデータの取得源を指定するデータを更に含んで！/、ればよ!/、。

[0058] また、「判別処理」では、所定のデータを、判別に先立って所定の出力先に出力するようにしてもよい（この場合は、処理を示す記号を例えば QBxxとする)。例えば、所定の質問を表すデータを、判別に先立って音声合成処理部 3に引き渡す、等が考えられる。判別処理において所定のデータを判別に先立って所定のデータを出力する場合、判別処理の内容を記述するデータは、例えば、出力するデータの内容と、このデータの出力先とを指定するデータを含む。

図 6 (a)に判別処理 QBxxの例を示す。この例では、例えば、判別処理 QB01は、「窓を開けますか？それともエアコンをつけますか？」と利用者に問い合わせ、その応答 (利用者の回答）力「エアコンをつける」であったときの進行方向の遷移定数 kが 0. 7、「窓を開ける」であったときの進行方向の遷移定数 kが 0. 4である。この例のフローチャートを図 6 (b)に示す。図 6 (b)に示すノード QB01. 1は、処理の開始点を示す始点ノード、ノード QB01. 2は、問い合わせに対して、「エアコン」をつけることが指定されたことを判別したときの進行方向のノードであり、その遷移定数 kは 0. 7である。さらに、ノード QB01. 3は、窓を開けることが指定されたことを判別したときの進行方向のノードであり、その遷移定数 kは 0. 4である。また、判別処理 QB02は、「窓を閉じますか？」と利用者に問い合わせ、その応答 (利用者の回答)力「閉じる」であったときの進行方向の遷移定数 kが 0. 5、「閉じない」であったときの進行方向の遷移定数 k が 0. 3である。

[0059] 処理項目データベース D4に格納されている「入出力処理」の内容を記述するデータは、入力あるいは出力するデータの内容を指定するデータ力構成されている。入力データ及ぴ出力データは任意の内容を有していてよい。例えば、出力データは、音声合成処理部 3を介して音声出力部 4に発生させる音声の読みを表すデータや外部の機器を制御する制御信号であってもよい。また、入力データは、例えば、外部の機器から供給されるデータであってもよい。

図 7 (a)に出力処理 EXxxの例を示す。この例では、例えば、出力処理 EX01は、「窓を閉める且つエアコンを動作させる」という動作であり、動作後の処理を行う進行方向の遷移定数 kが 0. 8である。この例のフローチャートを図 7 (b)に示す。図 7 (b)に示すノード EX01. 1は、処理の開始点を示す始点ノード、ノード EX01. 2は、処理の終了を示すノードであり、遷移定数 kは 0. 8である。尚、出力処理 EXxxについては、遷移定数 kの設定等を行わずに、処理の終了を示すノードの選択を必須の処理としてもよい。

[0060] ワイヤデータベース D5は、複数の処理 (TG、 CNxx, QBxx, EXxx)間の遷移を . 記述するデタ (以下、この遷移定義データをワイヤと呼ぶ)の集合から構成されている。ワイヤは、例えば図 8に示すような書式で記述されたデータから構成されている。ワイヤ Wn(Wl、 W2...)は図示するように、先行する処理 X (From (X))から後続する処理 Y(To(Y))への遷移 (From (X) To (Y))について、当該先行の処理 (X)と、当該後続の処理 (Υ)と、当該遷移に対して与えられた重み係 ¾1と、を指定するデータである。なお、先行の処理 Xが判別処理である場合は、当該判別処理のどの判別結果からの遷移であるか、まで記述される必要がある。

また、遷移元処理 Xと遷移先 Υは、それぞれ、各処理のノード番号で特定される。各ワイヤの重み係 ¾Jは、固定値ではなぐ処理の進行に応じて、適宜計算され、設定されるものである。ワイヤの重み係對の計算は図 9を参照して後述する。

[0061] 処理項目データベース D4及びワイヤデータベース D5が全体として表して!/、るフ口一を実行する。処理項目データベース D4及ぴワイヤデータベース D5は、例えば、図 3〜図 7の例に基づくと、全体として図 9に示すようなフローを記述することができる

[0062] 図 9に示すフローにおいては、エージェント処理部 6は、トリガ処理ステップ TG01では、「暑！/ヽ」とレヽぅ単語を示す単語データを言語解析部 2より供給されるのを待機する。「暑!/、」と！/、う単語を示す単語データが供給されるとこれを取得し、入力された音声が「暑い」であったと判断されると、判別処理ステップ CN01に引き渡す (ワイヤ W1)。ここで、「暑い」という単語を示す単語データのスコア Sと、前述の重み係 ¾!とから、音声認識の判別結果を向上させることができる力 S、これについては後述する。

[0063] エージェント処理部 6は、判別処理ステップ CN01では、窓が開いているか否かを示す情報を窓開閉制御部 52より取得し、開いていると判別すると入出力処理ステツプ EX01に処理を移し (ワイヤ W2)、入出力処理 EX01では、窓開閉制御部 52に、窓を閉めることを指示する制御信号を出力し、エアコン 51に、冷房動作を開始することを指示する制御信号を出力する。この結果、窓開閉制御部 52は窓を閉め、ェアコン 51は冷房動作を開始する。

[0064] 一方、判別処理ステップ CN01で、窓が閉じて、ると判別すると、質問を含む判別処理 QB01に処理を移す（ワイヤ W3)。判別処理ステップ QBO 1でエージェント処理部 6は、まず、「窓を開けますか。それともエアコンをつけます力。」という文章を表すデータを音声合成処理部 3に供給する。音声合成処理部 3は、音声出力部 4を介して、この文章を読み上げる音声を再生させる。

[0065] 判別処理ステップ QB01でエージェント処理部 6は、次に、言語解析部 2から、単語「窓」又は単語「エアコン」を表す単語データが供給されるのを待機し、該当する単語データが供給されると、この単語データが単語「窓」又は単語「エアコン」のどちらを表すカゝを判別する。そして、単語「窓」を表すと判別すると入出力処理ステップ EX03に処理を移し (ワイヤ W5)、単語「エアコン」を表すと判別すると、入出力処理ステップ E X02に処理を移す（ワイヤ W6) ₀ [0066] エージェント処理部 6は、入出力処理ステップ EX02では、エアコン 51に、冷房を開始することを指示する制御信号を出力する。一方、エージェント処理部 6は、入出力処理ステップ EX03では、窓開閉制御部 52に、換気用の窓を開けることを指示する制御信号を出力する。

[0067] 一方、エージェント処理部 6は、「窓を開けて」という単語を示す単語データを言語解析部 2より供給されるのを待機し (トリガ処理ステップ TG02)、「窓を開けて」という単語を示す単語データが供給され、入力された音声が「窓を開けて」という単語であつたと判別すると、入出力処理ステップ EX03へと処理を移す (ワイヤ W4)。

[0068] エージェント処理部 6は、例えば言語解析部 2が単語データを複数供給した場合などにおいては、複数の判別処理を並行して行う。またこの場合、エージェント処理部 6 は同一の単語を入力の対象とする処理 (例えば、トリガ取得処理や、判別処理におけるデータの入力）が複数があって、該当する単語を表す単語データが言語解析部 2 より供給された場合は、これらの処理すベてを並行して行う。このとき、入力された単語が何であったかの最終的な判別は、前述のように単語データの示すスコア Sと重み係 #Jを用いて行うことができる力これについては後述する。

[0069] 次に、各ワイヤの重み係 ¾Jを計算する方法を説明する。

複数の処理力 Sワイヤ Wにより連結されて！/、る場合には、注目するワイヤ Wの重み係對は、現在処理中の処理を起点として、注目しているワイヤ Wに至るまでの遷移の経路上の進行方向決定用の遷移定数 kを順次乗算することにより求められる。

理解を容易にするため、図 10 (a)にフローを示す処理を想定する。

この例では、先行する第 1の処理 (この例では、トリガ取得処理 TGxx)を実行して後続の第 2の処理 (この例では、判別処理 CNxx)に遷移するようにワイヤ W51により定' 義されており、また、第 2の処理を実行して後続の第 3の処理 (この例では、 QBxx)に遷移するようにワイヤ W52によって定義され、さらに、第 3の処理を実行して後続の処理に遷移するようにワイヤ W53によって定義されている。

なお、第 1〜第 3の処理のいずれについても、各進行方向決定用の遷移定数 kはいずれも 0. 5であるものとする。

この場合、ワイヤは、例えば、図 10 (b)に示すように、定義される。 [0070] 例えば、エージェント処理部 6の処理 (又は制御）が第 1の処理に到達しているとき、エージェント処理部 6は、第 1の処理を起点として、進行方向の遷移定数 kを遷移経路に沿って順次乗算することにより、ワイヤ W51〜W55 (図示していないワイヤが存在する場合にはそれらを含むすべて)のそれぞれの重み係を計算し、計算結果をワイヤ W51~W55に対応つけてワイヤデータベース DB5に書き込む。

[0071] 具体的には、第 1の処理に到達したとき、例えば、ワイヤ W51の重み係 ¾Jは、第 1 の処理の第 2の処理に繋がるノードに割り当てられている遷移定数 kの値すなわち 0 . 5となる。第 2の処理のワイヤ W52の重み係 ¾Jは、第 1の処理のワイヤ W51に係る遷移定数 k=0. 5に第 2の処理のワイヤ W52に繋がるノードの遷移定数 k=0. 5を乗じた結果すなわち 0· 25となる。

ワイヤ W53の重み係 ¾Jは、第 1の処理のワイヤ W51に係る遷移定数 k=0. 5に第 2の処理のワイヤ W52に係る遷移定数 k=0. 5を乗じた結果に更に第 3の処理のヮィャ W53に係る遷移定数 k=0. 5を乗じた結果、すなわち 0. 125となる。

[0072] このようにして、処理中の処理を基点としたときのそれぞれのワイヤの重み係 ¾Jが計算される。よって、現在の状態が遷移すると、現在の処理を基点にしてその都度各ワイヤの重み係が計算されることになる。

[0073] 具体的には、現在の状態が第 2の処理に遷移すると、ワイヤ W54の重み係 Uは、第 2の処理のワイヤ W52に係る遷移定数 kに等しい値 0. 5となり、ワイヤ W55の重み係 ¾Γは第 2の処理のワイヤ W52に係る遷移定数 k=0. 5と第 3の処理のワイヤ W55 に係る遷移定数 k=0. 5との積すなわち 0. 25となる。このとき、エージェント処理部 6 は、逆方向、つまり第 1の処理に戻る方向に係るワイヤ W51の重み係對も計算しデータベースに書き込む。第 2の処理に遷移した場合では、ワイヤ W51に係る戻り方向の遷移定数 kを 0· 1とすると、 0. 1がそのままワイヤ W51の重み係 ¾Jとなる。第 3の処理に遷移した場合は更に、ワイヤ W52に係る戻り方向の遷移定数 k=0. 1がそのままワイヤ W52の重み係 Uとなる。そして、第 3の処理に遷移した状態におけるワイャ W51の重み係は、第 3の処理に遷移した状態におけるワイヤ W52の重み係数 J(=遷移定数 k) 0. 1に、第 2処理の戻り方向の遷移定数 k=0. 1を乗じた値すなわち 0. 01となる。各ワイヤ Wnの重み係 ¾Jの変化を図 10 (c)に示す。

重み係 Jの計算は、関連するフローの処理のみではなく、全てのフローの全てのワイヤについて実行され、計算された重み係が各ワイヤに設定される。ここで現在の処理に関連のないワイヤについては、予め定められた低い計数値を害 ijり当てるようにすればよい。しかし、特にトリガ取得処理を先行の処理とするワイヤについては、遷移定数 kをある程度高く設定するようにする。こうすることによって、直前までなされていた会話と著しく異なる内容の会話にもジャンプすることが可能になる。

尚、各ワイヤには条件がそれぞれ設定されている。具体的には、 W01には単語「暑い」が条件として設定され、 W05には単語「窓」が設定される。そして、言語解析部 2 から単語データが供給されたとき、その単語データが単語「暑い」を示すものである場合には、当該単語データが示すスコア Sを W01に対して設定する。また、言語解析部 2から供給された単語データが単語「窓」を示すものである場合には、当該単語データが示すスコア Sを W05に対して設定する。

更に、各ワイヤに設定される条件は、単一の単語が設定される場合に限られない。例えば、同一の意味を表す複数の単語が条件として設定されるようにしてもよい。この条件の設定は、これらの単語とワイヤの関係が記憶されていれば足り、スコア算出の対象となる単語は前述の単語データベースに記憶される。

例えば、音声認識を行う場合に、入力された音声について、言語解析部 2は単語データベースに登録されている全ての単語に対してスコア Sの計算を行い、単語データを生成して、エージェント処理部 6に単語データを出力する。次に、エージェント処理部 6は、入力された各単語データが、いずれのワイヤに関連付けられてレ、るかを判別し、単語データが示すスコア Sを関連する各ワイヤに設定する。このようにすれば、複数のワイヤに対して、同じ単語が条件として設定されている場合でも、入力された音声信号と単語とのスコア Sの計算は一度で足りることになる。そして、得られた各単語のスコア Sが、それぞれ関連付けられているワイヤに対して設定される。尚、 1つのワイヤに対して複数のスコア Sが得られる場合が生じることになる力 S、この場合には、例えば最も値が高レ、スコア Sを選択するようにすればよい。

これによつて、例えば、「イエス」「はい」「そうだね」等、同一の意味を示す単語データがそれぞれ 1つのワイヤに対して設定されていれば、ユーザが「イエス」「はい」「そうだね」のいずれの音声で指示を出しても、音声認識のスコア Sとして適切な結果を得ることができる。 '

また、判別処理によっては、入出力対象機器群 5からの情報が入力情報として得られる場合がある。この場合、入出力対象機器群 5に係る各機器の状態を示すデータ力状態データベースとして管理され (上述の「単語データベース」に相当）、入力情報がどの機器のどの状態を示すもの力を状態データベースを参照して決定され、これとスコア Sとが状態データとしてエージェント処理部 6に出力される。尚、音声認識の場合と異なり、対応する状態が状態データベースにあれば、スコア Sは必ず 100% になる。そして、エージェント処理部 6は、状態データが示す状態に関連するワイヤを判別し、各ワイヤに対してスコア Sを設定する。

次に、このように構成されたシステム全体の動作を、図 11を参照して説明する。音声入力部 1と言語解析部 2とは、独自に動作して、音声を取り込み、解析し、単語データをエージェント処理部 6に提供する。

そして、エージェント処理部 6は、判別条件に係る（1個又は複数個の）単語データが言語解析部 2より供給されると、以下の処理を行う。

供給された単語を認識 (識別）し (ステップ S 11)、それ力単語データベース DB4 に登録されて!/、る単語に相当するか否かを判別する (ステップ S 12)。登録されてレヽなければ (ステップ S12, No)、単語入力処理を終了する。

一方、登録されていれば (ステップ S 12, Yes)、その単語又はその単語の属すダループの「概念」が条件となって!/、る処理に関し、単語の尤度 Sとワイヤの重み係 ¾Jの積 S .Jを計算する (ステップ S 13)。

例えば、図 10 (a)に示すフローを実行している場合において、処理ポインタ PPが第;!の処理を指示しているとする。この場合の、各ワイヤの重み係 Uは図 10 (c)に図す通りである。

この状態で、スコア Sが 80%の単語「暑い」と、スコア Sが 50%の単語「窓」を示す単語データが入力されたと仮定する。

図 10 (a)と (b)に示す例では、第 1の処理では、単語「暑い」が判別条件に関連し、第 3の処理では、単語「窓」が判別条件に関連する。

図 10 (c— 1)示すように、単語「暑い」を示す単語データを入力する処理を先行の処理とするワイヤ W51の重み係 Uが 0. 5、単語「窓」を示す単語データを入力する処理を先行の処理とするワイヤ W53の重み係衡が 0. 125である。この場合、ワイヤ W51及 I W53について求められる尤度 Sと重み係 #Jの積 S 'Jは、数式 1及ぴ 2に示すとおりとなる。

[0076] (数 1) ワイヤ W51についての積 S 'J:「暑い」のスコア S ( = 80%) Xワイヤ W51の重み係 ¾J ( = 0. 5) =40

[0077] (数 2) ワイヤ W53についての積 S 'J:「窓」のスコア S ( = 50%) Xワイヤ W53の重み係 ¾J ( = 0. 125) =6. 25

[0078] エージェント処理部 6は、スコア Sと重み係 #Jとの積 S 'Jを求める上述の処理を、フローが有するすべてのワイヤにっ、て行う。

続いて、エージェント制御部 6は、計算された積 S'Jがもっとも大きいワイヤを選択する（図 11のステップ S14)。エージェント制御部 6は、選択したワイヤに後続する処理に制御を進める (ステップ S15)。例えばワイヤ W51につ！/、て求めた積 S が最も高い値を示した場合、入力された単語データは単語「暑い」を示すものであつたと認識して、ワイヤ W51が後続の処理としてレ、る第 2の処理に遷移する。通常、現在の実行中の処理を起点するとワイヤの重み係 #Jが比較的大きい。このため、一般的には、次の処理に移る力従前と全く異なる単語で尤度 Sの高いものが入力された場合には、その単語に対応する処理が開始されることもある。

[0079] エージェント処理部 6は、処理が遷移すると、遷移後の状態に基づいて、各ワイヤの重み係慰を再計算する (ステップ S 16)。

以後は、その処理の内容に従って処理を進める (ステップ S17)。この例では、第 2 の処理を実行する。すなわち、エージェント処理部 6は、窓開閉制御部 52から窓の開閉の情報を取り込み、取り込んだ情報に基づいてワイヤ W52についての尤度 Sと重 - み係 #Jの積 S 'Jを求め、ワイヤ W54についての尤度 Sと重み係對の積 S 'Jを求めて、いずれかのワイヤを選択して、選択したワイヤに後続する処理を実行する。

[0080] なお、窓開閉制御部 52からの窓の開閉を示す信号は、開の尤度 Sが 100%又は 0 %、閉の尤度 Sが 0%又は 100%でもよく。また、開度に応じて変ィ匕させるようにしてもよい。そして、処理の過程で、入出力処理 EXxxがあり、エージェント処理部 6がその処理を実行してにより音声データを出力すれば、それが音声として放音される。また、処理の過程で、入出力処理 EX01のように、エアコンや窓開閉制御部 52への制御を行う処理を実行すると、その処理内容に従って、エアコン 51や窓開閉制御部 52への制御を行う。

[0081] なお、図 8，図 9では、「単語」に基づく判別処理を主に説明したが、図 11にも示したように概念に基づく判別処理でも同様になされる。また、単語或いは概念に基づくトリガ取得処理からのワイヤも判断の対象となる。トリガ取得処理からの遷移に対しては、ある程度高い遷移定数 kを設定しておくとよい。具体的には、例えば図 8のワイヤ群、すなわち、図 9のフローにおいて、「窓を開けて」という単語を示す単語データを取得するトリガ取得処理 TG02からの遷移に対しては、例えば遷移定数 k=0. 8を与えておく。そうすると、例えばエージェント処理部 6の処理がトリガ取得処理 TG01に係属してレ、る場合において、ユーザー力 S「窓を開けて」と発音し、例えば単語「窓を開けて」に対するスコア Sが 90%である単語データが得られれば、このスコア Sと、「ユーザが「窓を開けて」と言ったか否かの判断」に係るワイヤ W5の重み係 s (=遷移定数 k)との積 S'Jは、 90% X O. 8すなわち 72となる。この値が他のワイヤで得られないような大きな値であれば、入力された音声は「窓を開けて」であったと認識され、エージ工ント処理部 6の処理が入出力処理 EX03にジャンプする可能性が高くなる。一方で、他のワイヤの重み係 Uを極めて低く設定しておけば、これら他のワイヤにより定義されている遷移が起こる可能性は極めて低くなり、結果として、ある程度想定される会話の流れに沿って認識率を向上させて制御処理を行うことができる。

[0082] この実施の形態では、戻り方向への遷移も起こり得る。しかし、現実的には会話を戻すことは好ましくなレ、ことが多い。そこで、戻り方向の遷移定数 kは、進行方向の遷移定数 kに比べて低い値に設定するようにすればよい。そうすると、入力された音声力高いスコア Sの単語データが仮に得られても、戻り方向の遷移定数 k力 S重み係数 Jとして書き込まれたワイヤについて求めた積 S 'Jは低い値となるため、戻り方向への遷移の可能性を低く抑えることができる。また、エージェント処理部 6は、求めた積 S 'Jの値が所定の条件に合致しなレ、ような処理 (たとえば、積 S 'Jの値が所定値に達しなレヽような処理）は、遷移を実行する対象力除外するよう取り扱ってもよレ、。

[0083] なお、例えば図 8に示しているように、ワイヤは、処理項目力処理項目へという形で遷移を定義する。そして、ワイヤを図 8に示すような形態で記述してワイヤデータべース D5に格納することにより、各処理項目同士の関係を、あた力もコンピュータのマクロ処理のように定義することが可能になる。これによつて、各処理項目を容易に接続することができる。

[0084] また、トリガとなる処理項目は、実際には接続されるワイヤに係る認識対象単語等 ( 他の入力対象機器群からの入力の場合もあり得る）のスコア Sの判定になるので、ヮィャにおいてトリガ処理項目はワイヤの開始点として定義されず、ワイヤそのものが遷移元として定義されることになる。

[0085] 更に、上述のように各処理項目の接続関係をワイヤによって定義することによって、簡単にワイヤを追加することができる。例えば、「暑い」という音声入力の後に、ユーザ一が休憩することを意図して「ファミリーレストランを探して」という音声を入力する機会が多い場合、ファミリーレストランの検索処理項目に対して自動でワイヤを追加する。そうすると、ワイヤが自動で追加された後には、ファミリーレストラン検索処理項目に接続されたワイヤの重み係銜をある程度大きくすることで、当該入力「ファミリーレストランを探して」に適切に対応することができるようになる。（ただしこの場合、エージェント処理部 6は、例えばファミリーレストランの位置を示す情報を含んだ地図データ等を記憶し、あるいは外部の地図データ等にアクセスするものとする。 )

このワイヤの自動追加は、ある処理項目からある処理項目へのジャンプの回数を計数し、これが所定回数に達したときに自動で行うようにすればよい。

[0086] 以上説明したこの車内空調システムは、処理の内容を示すデータやワイヤが適切に記述されれば、制御する対象である機器や加える制御の内容を完全に特定することを必ずしも必要とせずに、ユーザが発した言語に応答し、この言語からユーザの欲求を推測し、この欲求を満たすためにどの機器にどのような制御を加えればよいかを適切に判断して、判断結果に従った制御を機器に加えることができるようになる。 [0087] なお、この車内空調システムの構成は上述のものに限られない。

例えば、入出力対象機器群 5に属する機器は、必ずしも直接にユーザの欲求を満たす結果をもたらす機器である必要はなぐ例えば、外部の表示装置等を制御してユーザに特定の行動をとるよう促すメッセージを出力する機器 (例えば、液晶ディスプレイ等の表示装置)からなつていてもよい。

[0088] また、単語データベースは、必ずしも単語を示すデータのみならず、複数の単語からなる語句を示すデータを単語データベースの要素として記憶するようにしてもよいし、単語の一部あるいは音素を構成するためのデータを単語データベースの要素として記憶するようにしてもよい。また、単語等は必ずしも特定の概念の下にグルーピングされてレ、る必要はなぐグルーピングを行う場合も、グルーピングを行うために用いられるデータは、必ずしもフラグの集合の形をとつていなくてもよい。

[0089] また、エージェント処理部 6は、'ワイヤに対応する遷移定数 kを、過去に当該ワイヤが表す遷移を実行した数などに基づき所定の基準に従って変化させ、重み係 Uが変化後の遷移定数 kに基づいて計算された値となるようにワイヤを書き換えてもよい。具体的には、例えば、ワイヤデータベースに、それぞれのワイヤについて、当該ワイャが表す遷移が実行された回数を記憶しておく。そしてエージェント処理部 6は、当該遷移が新たに行われる毎に、この回数の値を書き換えることにより、この回数の値 'を 1ずつインクリメントし、それぞれのワイヤに対応する遷移定数 kを、例えば、当該ヮィャについて記憶された回数に比例した値と書き換える。

尚、上述の実施例では.、ワイヤに設定される条件は、それぞれのワイヤに対して設定されるとして説明した力これには限られない。例えば、判別処理の中に各ワイヤの条件を記述するようにしてもよい。この場合、各条件がいずれのワイヤに对応するものかを予め特定しておく。

[0090] また、エージェント処理部 6は、判別処理や入出力処理において出力するデータを、これらの処理に引き渡されたデータや、これらの処理に伴って入力したデータや、その他任意の条件に従って変化させるようにしてもよい。

[0091] また、この車内空調システムは、エージェント処理部 6の制御に従って画像を出力するための表示装置 (例えば、液晶ディスプレイ等)を備えていてもよぐエージェント ' 処理部 6は、入出力処理や判別処理において、処理毎に所定の画像を表示させるようこの表示装置を制御してもよい。

[0092] また、エージェント処理部 6は、 1個の入力処理や 1個の判別処理において、連続して発話される等した複数の単語データを一括して取得するようにしてもよい。また、ェージェント処理部 6は、一括して取得した複数の単語データがどの概念の下で同一のグループ内にグルーピングされているかを特定し、特定した概念が所定の概念に合致する場合にのみ、取得した単語データの一部または全部を処理に用いるものとしてもよい。

[0093] また、エージェント処理部 6は、トリガ取得処理、判別処理、入出力処理等の各種処理とワイヤとが全体として形成するフローを分担して行う、互いに接続された複数のデータ処理装置 (例えば、コンピュータ等)から構成されていてもよい。この場合、ェージェント処理部 6を構成するそれぞれのデータ処理装置は、エージェント処理部 6 が実行し得るフロー全体のうち、自己が実行する可能性がある部分を表すデータを、処理項目データベース D4やワイヤデータベース D5の要素として記憶すれば十分である。そして、それぞれのデータ処理装置が記憶するデータが、当該データ処理装置が実行する部分の処理をマクロ定義するようなデータとなっていれば、複数のデータ処理装置に分散処理を行わせることも容易である。

[0094] また、この車内空調システムは、音声入力部 1や言語解析部 2あるいは音声出力部

4も複数備えていてよい。

また、音声入力部 1は、たとえば、音声を表すデータが記録された記録媒体 (たとえば、フロッピー（登録商標）ディスクや、 CD (Compact Disc)や、 MO (

Magneto-Optical Disk)など)力波形信号を読み出して言語解析部 2に供給する記録媒体ドライブ装置 (たとえば、フロッピー (登録商標)ディスクドライブや、 CD— RO

Mドライブや、 MOドライブなど）を備えていてもよい。

[0095] 以上、この発明の実施の形態を説明したが、この発明にかかる機器制御装置は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。例えば、入出力対象機器群 5に接続されたパーソナルコンピュータ上述の音声入力部 1、言語解析部 2、音声合成処理部 3、音声出力部 4及びエージェント処理部 6の動作を実行させるためのプログラムを格納した記録媒体力該プログラムをインストールすることにより、上述の処理を実行する車内空調システムを構成することができる。そして、このプログラムを実行するパーソナルコンピュータ力図 1の車内空調システムの動作に相当する処理として、例えば、図 9に示すフ口を実行するものとする

[0096] なお、パーソナルコンピュータに上述の車内空調システムの機能を行わせるプログラムは、例えば、通信回線の掲示板 (BBS)にアップロードし、これを通信回線を介して配信してもよぐまた、このプログラムを表す信号により搬送波を変調し、得られた変調波を伝送し、この変調波を受信した装置が変調波を復調してこのプログラムを復元するようにしてもよい。そして、このプログラムを起動し、 OSの制御下に、他のアプリケーシヨンプログラムと同様に実行することにより、上述の処理を実行することができる。

[0097] なお、 OSが処理の一部を分担する場合、あるいは、 OSが本願発明の 1つの構成要素の一部を構成するような場合には、記録媒体には、その部分を除いたプログラムを格納してもよい。この場合も、この発明では、その記録媒体には、コンピュータが実行する各機能又はステップを実行するためのプログラムが格納されているものとする産業上の利用可能性

[0098] 本発明は、人間が言語の形で発する指示に適切に応答して機器を制御できる種々の機器制御装置等に利用可能である。

Claims

請求の範囲

[1] 入力される入力情報を認識する入力情報認識手段（2)と、

入力情報認識手段 (2)によって認識された認識情報に对応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段 (D4)と、

ことを特徴とする機器制御装置。

[2] 前記認識情報は、入力情報と比較対象情報との尤度 (スコア)を有してなり、

前記一の遷移定義データの選択は、前記尤度 (スコア）を用いて行われる、ことを特徴とする請求項 1に記載の機器制御装置。

[3] 所定の処理項目から遷移定義データによって遷移を定義されてレ、な！/ヽ処理項目若しくは遷移定義データにジャンプされるとき、当該所定の処理項目力ジャンプされた処理項目若しくは遷移定義データに対しての遷移定義データを生成する、ことを特徴とする請求項 1に記載の機器制御装置。

[4] 前記入力情報は音声信号であり、

前記遷移定義データの条件は、当該遷移定義データに関連付けられた単語であることを特徴とする請求項 1に記載の機器制御装置。

[5] 前記遷移定義データの条件は、複数設定されてなる、

ことを特徴とする請求項 1に記載の機器制御装置。

[6] 入力情報に対応する処理を実行する処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを記憶し、入力情報に応じて一の遷移定義データを選択し、選択された一の遷移定義データによって指定される処理項目に状態を遷移する機器制御装置であって、前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、

ことを特徴とする機器制御装置。

[7] 入力される入力情報を認識する入力情報認識手段（2)と、

前記遷移定義データのそれぞれは、入力情報に对応する条件と、前記条件に対応する重み係数と、を有し、

前記遷移定義データの条件に対応する尤度 (スコア）に前記重み係数を对応させて、それぞれの遷移定義データの条件にっレ、ての判別結果を得、

ことを特徴とする機器制御装置。

[8] 所定の処理項目力遷移定義データによって遷移を定義されて！/、な！/、処理項目若しくは遷移定義データにジャンプされるとき、当該所定の処理項目からジャンプされた処理項目若しくは遷移定義データに対しての遷移定義データを生成する、ことを特徴とする請求項 7に記載の機器制御装置。

[9] 前記重み係数の算出基準である遷移定数は、前記遷移定義データに対応して定数として設定され、

ことを特徴とする請求項 7に記載の機器制御装置。

[10] 前記遷移定数は、

当該遷移定数に係る遷移定義データが選択されたことを条件に変化される、ことを特徴とする請求項 9に記載の機器制御装置。

[11] 一の処理項目に状態が遷移している場合であっても、所定の処理項目に係る遷移定義データの重み係数は、所定の値より高く設定されてなる、

ことを特徴とする請求項 7に記載の機器制御装置。

[12] 前記入力情報は音声信号であり、

前記遷移定義データの条件は音声認識を行う対象の単語である、

ことを特徴とする請求項 7に記載の機器制御装置。

[13] 前記条件は、一の遷移定義データに対して複数設定されてなる、

ことを特徴とする請求項 7に記載の機器制御装置。 '

[14] 入力情報を認識することによって得られた認識情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段 (D4)を備え、

ことを特徴とする機器制御装置。

[15] 前記処理項目データ記憶手段 (D4)は、

処理項目を適宜追加可能なように構成されてなる、

ことを特徴とする請求項 14に記載の機器制御装置。

[16] 前記遷移定義データは、入力情報に対応する条件をそれぞれ有する、

ことを特徴とする請求項 14に記載の機器制御装置。

[17] 前記認識情報は、入力情報と前記遷移定義データの条件との一致状態を示す尤度 (スコア)を有し、

前記遷移定義データの条件に対応する前記尤度 (スコア）が前記遷移定義データに設定される、

ことを特徴とする請求項 16に記載の機器制御装置。

[18] 前記入力情報は音声信号であり、

前記尤度 (スコア）に応じて一の前記遷移定義データを選択し、選択された一の遷移定義データによって示される処理項目に状態を遷移させる、

ことを特徴とする請求項 16に記載の機器制御装置。

[19] 前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、を有する、

ことを特徴とする請求項 14に記載の機器制御装置。

[20] 前記重み係数の算出基準である遷移定数は、前記遷移定義データに対応して定数として設定され、

ことを特徴とする請求項 19に記載の機器制御装置。

[21] 入力される入力情報を認識する入力情報認識手段（2)と、

前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、少なくとも前記認識情報とそれぞれの遷移定義データの条件から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、 . ことを特徴とする音声認識装置。

[22] 入力情報に対応する処理を実行する処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを記憶し、入力情報に応じて一の遷移定義データを選択し、選択された一の遷移定義データによって指定される処理項目に状態を遷移する機器制御装置 (6)を備え、

前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、

状態が遷移している一の処理項目に連なる他の処理項目に係る遷移定義データの重み係数は、一の処理項 ¾に係る遷移定義データの前記定数から、他の処理項目に係る遷移定義データまでの定数が累積されて算出される、

ことを特徴とする音声認識装置。

[23] 入力される入力情報を認識する入力情報認識手段 (2)と、

前記遷移定義データのそれぞれは、入力情報に対応する条件と、前記条件に対応する重み係数と、を有し、 ' . .

前記遷移定義データの条件に対応する尤度 (スコア）に前記重み係数を対応させて、それぞれの遷移定義データの条件につ！/ヽての判別結果を得、

前記判別結果に基づ!/ヽて一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、

ことを特徴とする音声認識装置。

[24] 入力情報を認識することによって得られた認識情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段 (D4)を備え、

ことを特徴とする音声認識装置。

[25] 入力される入力情報を認識する入力情報認識手段 (2)と、

ことを特徴とするエージェント装置。

[26] 入力情報に対応する処理を実行する処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを記憶し、入力情報に応じて一の遷移定義データを選択し、選択された一の遷移定義データによって指定される処理項目に状態を遷移する機器制御装置 (6)を備え、

前記遷移定義データは、入力情報に対応する条件と、

前記条件に対応する重み係数と、

ことを特徴とするエージェント装置。

[27] 入力される入力情報を認識する入力情情報認識手段 (6)と、

前記遷移定義データの条件に対応する尤度 (スコア）に前記重み係数を対応させて、それぞれの遷移定義データの条件につ V、ての判別結果を得、

ことを特徴とするエージェント装置。

[28] 入力情報を認識することによって得られた認識情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段 (D4)を備え、

必要とされる処理項目の連なりに応じて、前記遷移定義データを追加若しくは削除することによって、処理項目のフローチヤトが生成されてなる、ことを特徴とするエージェント装置。

[29] 入力情報に対応する処理を実行する処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データのデータ構造であって、

前記遷移定義データは、

入力情報に対応する条件と、

前記条件に対応する重み係数と、を有し、

ことを特徴とするデータ構造。

[30] 前記入力情報は音声信号であり、

前記入力情報に対応する条件は、音声認識を行う対象単語である、

ことを特徴とする請求項 29に記載のデータ構造。

[31] 入力情報認識手段（2)によって認識された認識情報に対応する処理を実行する処理項目を複数記憶し、複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶した機器 (2， 6)の機器制御方法であつて、

入力される入力情報を認識する入力情報認識ステップと、

を有することを特徴とする機器制御方法。

[32] 入力される入力情報を認識する入力情報認識ステップと、

前記入力情報認識ステップで認識された認識情報から、複数の処理項目のうちの —の処理項目から他の処理項目への遷移を定義する遷移定義データに対応付けら 062294

37

れた条件と前記入力情報との一致状態を示す尤度 (スコア)を特定するステップと、前記遷移定義データに対応付けられた重み係数を、前記尤度 (スコア）に対応させることによって判別結果を得るステップと、 '

前記判別結果に基づ!/、て一の遷移定義データを選択するステップと、

選択された遷移定義データによって指定される処理項目に状態を遷移させるステツプと、

を有することを特徴とする機器制御方法。

入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記億ステップと、

遷移定義データによって複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義し、必要とされる処理項目の連なりに応じて、前記遷移定義データを追加若しくは削除することによって、処理項目のフローチャートを生成するステップとを有することを特徴とする機器制御方法,