JPWO2005062295A1 - 機器制御装置、音声認識装置、エージェント装置及び機器制御方法 - Google Patents

機器制御装置、音声認識装置、エージェント装置及び機器制御方法 Download PDF

Info

Publication number
JPWO2005062295A1
JPWO2005062295A1 JP2005516406A JP2005516406A JPWO2005062295A1 JP WO2005062295 A1 JPWO2005062295 A1 JP WO2005062295A1 JP 2005516406 A JP2005516406 A JP 2005516406A JP 2005516406 A JP2005516406 A JP 2005516406A JP WO2005062295 A1 JPWO2005062295 A1 JP WO2005062295A1
Authority
JP
Japan
Prior art keywords
definition data
transition definition
item
transition
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005516406A
Other languages
English (en)
Other versions
JP4516919B2 (ja
Inventor
利佳 小山
利佳 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Publication of JPWO2005062295A1 publication Critical patent/JPWO2005062295A1/ja
Application granted granted Critical
Publication of JP4516919B2 publication Critical patent/JP4516919B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Air Conditioning Control Device (AREA)
  • Machine Translation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

言語解析部2は、音声入力部1が入力した音声に音声認識を施して、この音声が表している可能性のある単語とそのスコアとを特定し、これらを表す単語データをエージェント処理部6に供給する。エージェント処理部6は、単語データ等を取得するデータ取得処理や、判別処理、入出力処理を定義する処理項目データと、ひとつの処理から次の処理への遷移を定義しこの遷移に重み係数を与えるデータであるワイヤとを記憶しており、処理項目データとワイヤとが全体として表すフローを実行することにより、入出力対象機器群5に属する機器を制御する。フロー内のどの処理へと遷移するかは、処理が進んだ地点とワイヤの接続関係とにより決まる各ワイヤの重み係数と、単語データのスコアとにより決まる。ワイヤや処理項目データは外部サーバよりダウンロード可能である。

Description

この発明は、機器制御装置、音声認識装置、エージェント装置及び機器制御方法に関する。
近年、音声認識の技術を用いて音声を認識し、認識結果に応答して電気機器などを制御する手法が用いられている。例えば、特許文献1には、音声を入力し、入力した音声が表す単語を識別し、識別した単語が所定のキーワードに合致するか否かを判別して、判別結果に基づいて外部の機器を制御する手法が開示されている。
特開平8−339288号公報
しかし、人間が口頭で発する指示を完全に認識するのは困難である。このため、上述の手法では、人間が言語の形で発する指示に適切に応答することができない場合があった。
この発明は上記実状に鑑みてなされたものであり、人間が言語の形で発する指示に適切に応答して機器を制御できる機器制御装置、音声認識装置、エージェント装置及び機器制御方法を提供することを目的とする。
上記目的を達成するため、この発明の第1の観点にかかる機器制御装置は、
入力される入力情報を識別する入力情報識別手段と、
入力情報識別手段によって識別された入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段と、
複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段と、
外部にある、新たな処理項目又は遷移定義データの供給元にアクセスし、当該新たな処理項目又は遷移定義データを取得して、前記処理項目データ記憶手段に記憶されている古い処理項目、又は遷移定義データ記憶手段に記憶されている古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する更新手段と、
を備え、
前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、
入力された前記入力情報とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、
ことを特徴とする。
前記供給元は、前記新たな処理項目又は遷移定義データを圧縮して供給するものであり、
前記更新手段は、前記供給元より取得した当該新たな処理項目又は遷移定義データを解凍する手段を備えるものであってもよい。
また、この発明の第2の観点にかかる音声認識装置は、
入力される音声信号を識別する音声信号識別手段と、
音声信号識別手段によって識別された音声信号に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段と、
複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段と、
外部にある、新たな処理項目又は遷移定義データの供給元にアクセスし、当該新たな処理項目又は遷移定義データを取得して、前記処理項目データ記憶手段に記憶されている古い処理項目、又は遷移定義データ記憶手段に記憶されている古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する更新手段と、
を備え、
前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、
入力された前記音声信号とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、
ことを特徴とする。
前記供給元は、前記新たな処理項目又は遷移定義データを圧縮して供給するものであり、
前記更新手段は、前記供給元より取得した当該新たな処理項目又は遷移定義データを解凍する手段を備えるものであってもよい。
また、この発明の第3の観点にかかるエージェント装置は、
入力される入力情報を識別する入力情報識別手段と、
入力情報識別手段によって識別された入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段と、
複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段と、
外部にある、新たな処理項目又は遷移定義データの供給元にアクセスし、当該新たな処理項目又は遷移定義データを取得して、前記処理項目データ記憶手段に記憶されている古い処理項目、又は遷移定義データ記憶手段に記憶されている古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する更新手段と、
を備え、
前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、
入力された前記入力情報とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、
ことを特徴とする。
前記供給元は、前記新たな処理項目又は遷移定義データを圧縮して供給するものであり、
前記更新手段は、前記供給元より取得した当該新たな処理項目又は遷移定義データを解凍する手段を備えるものであってもよい。
また、この発明の第4の観点にかかる機器制御方法は、
入力情報識別ステップにおいて識別された入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶ステップと、
入力情報に対応する条件を各々有し、複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶ステップと、
外部にある、新たな処理項目又は遷移定義データの供給元にアクセスし、当該新たな処理項目又は遷移定義データを取得して、前記処理項目データ記憶ステップで記憶された古い処理項目、又は遷移定義データ記憶ステップで記憶された古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する更新ステップと、
を備え、
入力される入力情報を識別する前記入力情報識別ステップと、
入力された前記入力情報とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させるステップと、
を有することを特徴とする。
この発明によれば、人間が言語の形で発する指示に適切に応答して機器を制御できる機器制御装置、音声認識装置、エージェント装置及び機器制御方法が実現される。
[図1]この発明の実施の形態に係る車内空調システムを示す図である。
[図2]この実施の形態に係る車内空調システムのより詳細な構成図である。
[図3]グルーピング用のフラグの具体例を模式的に示す図である。
[図4]トリガ取得処理を説明するための図である
[図5]判別処理を説明するための図である
[図6]問い合わせ付きの判別処理を説明するための図である
[図7]入出力処理を説明するための図である
[図8]ワイヤを示す図である。
[図9]処理項目データベース及びワイヤデータベースが全体として表しているフローを示す図である。
[図10]重み係数の設定を説明するための図である。
[図11]エージェント処理部の動作を説明するためのフローチャートである。
[図12]外部サーバ(配信サーバ)の構成と、ネットワーク構成とを示す図である。
[図13]ダウンロード処理を説明するためのフローチャートである。
符号の説明
1 音声入力部
2 言語解析部
3 音声合成処理部
4 音声出力部
5 入出力対象機器群
51 エアコン
52 窓開閉制御部
6 エージェント処理部
以下、図面を参照して、この発明の実施の形態を、車両内に設置された車内空調システムを例として説明する。
図1は、この車内空調システムの構成を示すブロック図である。また、図2は、各部の物理的な構成の例を示すブロック図である。
図1に示すように、この車内空調システムは、音声入力部1と、言語解析部2と、音声合成処理部3と、音声出力部4と、入出力対象機器群5と、エージェント処理部6とより構成されている。
音声入力部1は、音声を入力し、入力した音声からデジタル形式の音声データを生成し、この音声データを言語解析部2へと供給する。具体的には、音声入力部1は、図2に示すように、例えば、マイクロフォン11と、AF(Audio Frequency)増幅器12と、サンプルホールド回路を内蔵するA/D(Analog−to−Digital)コンバータ13などより構成されている。マイクロフォン11は音声を音声信号に変換して出力する。AF増幅器12は、マイクロフォン11からの音声信号を増幅して出力する。A/Dコンバータ13は、AF増幅器12からの増幅された音声信号をサンプリング、A/D変換することにより、ディジタル音声データを生成し、言語解析部2へと供給する。
言語解析部2と音声合成処理部3とエージェント処理部6とは、図2に示すように、それぞれ、例えば、CPU(Central Processing Unit)等からなるプロセッサ21、31、61と、このプロセッサ21、31,61が実行するプログラムを記憶するハードディスク装置等の不揮発性メモリ22、32、62と、プロセッサのワークエリアとなる記憶領域を有するRAM(Random Access Memory)等の揮発性メモリ23、33、63とより構成されている。なお、言語解析部2、音声合成処理部3及びエージェント処理部6の一部又は全部の機能を1つのプロセッサや1つの不揮発性メモリや1つの揮発性メモリで構成してもよい。
言語解析部2は、音声入力部1より供給された音声データに音声認識処理を行う。言語解析部2は、音声認識処理により、音声データが表している単語の候補と、この候補の尤度(スコア)とを特定する。音声認識の手法は任意である。また、単語の候補は複数特定されてよい。言語解析部2は、特定した候補とその候補のスコアとを示すデータ(以下、単語データと呼ぶ)を生成し、エージェント処理部6へと供給する。
音声合成処理部3の不揮発性メモリ32は、単語の波形を表すデータを記憶する音片データベースD1と、音素を構成するための波形を表すデータを記憶する素片データベースD2とを記憶する。
音片データベースD1は、単語の波形を表すデータを記憶する。素片データベースD2は、音素を構成するための波形を表すデータを記憶する。音声合成処理部3は、音片データベースD1及び/又は素片データベースD2に格納されているデータを用いて、エージェント処理部6より供給された文章データを読み上げる音声を表すデジタル音声データを生成する。
音声合成処理部3は、生成した音声データを音声出力部4に供給する。デジタル音声データを生成する手法は任意であるが、例えば、録音編集方式や規則合成方式(Rule−based synthesis)を使用できる。なお、録音編集方式は、例えば、単語単位の音声を予めアナウンサーに読んでもらい、それらをつなぎあわせて出力する方式である。また、規則合成方式は、音韻(子音や母音)や仮名のような比較的小さな単位をつなぎあわせて出力する方式である。
音声出力部4は、音声合成処理部3から供給されたデジタル音声データが表す音声を再生する。より詳細には、音声出力部4は、図2に示すように、D/A(Digital−to−Analog)コンバータ41、AF増幅器42及びスピーカ43を備える。D/Aコンバータ41は、音声合成処理部3より供給されたデジタル音声データをD/A変換して、アナログ音声信号に変換する。AF増幅器42は、アナログ音声信号を増幅する。スピーカ43は、アナログ音声信号に従って振動し、アナログ音声データが表す音声を再生し、放音する。
入出力対象機器群5は、例えば、エアコン(エアコンディショナ)51や、窓開閉制御部52などより構成されている。
エアコン51は、制御信号に従って、冷房、暖房又は送風の動作を行う。また、エアコン51は、自己の動作状態を表すデータ、例えば、自己が冷房動作中、暖房動作中、設定温度へ向けた温度調整中、送風動作中及び停止中のうちどの状態にあるかを示すステータスデータを出力する。
窓開閉制御部52は、制御信号に従って窓の開閉を行うものであり、モータ、制御信号に従ってモータの回転及び停止を制御する制御回路、モータの回転に従って窓枠を動かすウインチ等を備える。また、窓開閉制御部52の制御回路は、窓開閉制御部52の動作状態を表すデータ、例えば、窓が開いている量(程度;開度)を示すデータを出力する。
エージェント処理部6は、モデムやパケット通信端末等からなる通信制御装置64を備え、この通信制御装置を介して外部のネットワーク(例えば、無線電話回線を介したインターネット)を介して後述する配信サーバ100に接続している。
エージェント処理部6の不揮発性メモリ62は、単語データベースD3を記憶する。単語データベースD3は、複数の単語のデータと、複数の単語のグルーピングを示すための単語グルーピング用のフラグ1個以上とを、互いに対応付けて格納する。
1個の単語に対応付けられている各フラグは、ある概念に対応付けられてグルーピングされている。そして、フラグが所定の値(以下では、この値は“1”であるとする)を示す場合は、このフラグに対応付けられた単語が、このフラグに対応付けられたグループにグルーピングされている。一方、このフラグが他の値(例えば“0”)を示す場合は、この単語は、そのフラグに対応付けられたグループにはグルーピングされていない。
図3は、グルーピング用のフラグの具体例を模式的に示す図である。
図3の例では、単語「上がる」、「暑い」及び「開ける」に、単語グルーピング用のフラグが4ビットずつ対応付けられている。4ビットビット群の最上位(MSB)のフラグは「温度」という概念に対応付けられている。上位から2ビット目のフラグが「エアコンの操作」という概念に対応付けられている。上位から3ビット目のフラグが「窓の開閉」という概念に対応付けられている。最下位のフラグが「故障」という概念に対応付けられている。
図示するように、単語「上がる」に対応付けられている4ビットのフラグ群の値が2進数“1110”であり、単語「暑い」に対応付けられているフラグ群の値が2進数“1100”であり、単語「開ける」に対応付けられているフラグ群の値が2進数“1010”である。
従って、このフラグ群は、概念「温度」の下には単語「上がる」、「暑い」及び「開ける」がグルーピングされており、概念「エアコンの操作」の下には単語「上がる」及び「暑い」がグルーピングされており、概念「窓の開閉」の下には単語「暑い」及び「開ける」がグルーピングされており、概念「故障」の下には単語「上がる」、「暑い」又は「開ける」のいずれもグルーピングされていないことを示す。
なお、各単語及び各概念は、処理項目データベースD4に格納されているトリガ検出処理の検出対象や各判断処理項目の判別対象として使用される。
エージェント処理部6の不揮発性メモリは、更に、処理項目データベースD4及びワイヤデータベースD5を記憶している。
処理項目データベースD4は、エージェント処理部6が実行する様々な処理、例えば、トリガ取得処理(TGxx)、判別処理(CNxx又はQBxx)及び入出力処理(後述するEXxx)の内容を、処理項目(ポインタ)毎に記述するデータ(処理項目データ)を格納したデータベースである。なお、「xx」は識別番号である。
処理項目データベースD4に格納される処理項目のうち、「トリガ取得処理(TGxx)」の内容を記述するデータは、これらの処理を開始させるトリガを特定するトリガデータ(トリガとして取得するデータの内容を指定するデータ)と、進行方向決定用の遷移定数k(その進行方向に遷移する程度を示すもので、後述する重み係数Jの算出基準となる定数)とを含む。
トリガデータは任意であり、例えば、エアコンが冷房動作中、暖房動作中、温度調整中、送風動作中及び停止中のうちどの状態にあるかを示すデータや、窓が開いている量を示すデータや、室内の温度を示すデータや、言語解析部2より供給される上述の単語データである。あるいは、トリガデータは、エージェント処理部6自身が行う処理から引き渡されるデータであってもよい。また、トリガデータ(トリガ取得処理で取得されるデータ)が単語データである場合は、当該単語データが表す単語が属すグルーピングに割り当てられている「概念」を示すデータでもよい。ただし、トリガ取得処理の内容は、複数のトリガ取得処理が互いに同一の単語を表す単語データを取得することがないように記述されるものとする。
図4(a)にトリガ取得処理TGxxの例を示す。この例では、トリガTG01は、トリガとしての単語「暑い」を取得する(単語「暑い」を識別する)処理であり、その処理に後続する処理に進む(遷移する)か否かを決定するための遷移定数kは0.8である。図4(b)には、トリガ取得処理TG01のフローチャートを示す。トリガ取得処理TG02は単語「開けて」を取得する処理である。トリガ取得処理TG03は概念「温度」に対応するグループに属す単語を取得する(図3では、「上がる」、「暑い」、「開ける」のいずれかを取得する)処理である。TG04は、概念「エアコンの操作」に対応するグループに属す単語(図3では、「上がる」、「暑い」のいずれかを取得する)処理である。
処理項目データベースD4に格納されている「判別処理(CNxx)」の内容を記述するデータは、判別条件と、判別結果としてとり得る結果のリストと、判別結果別に進行方向を決定するための遷移定数kと、後述する戻り方向の遷移定数kとを、判別処理別に記述したデータを含んでいる。
図5(a)に判別処理CNxxの例を示す。この例では、判別処理CN01は、「窓が開いているか否かを判別する処理」であり、開いていると判別したときに後続する処理に進むか否かを決定するための遷移定数kが0.3、開いていないと判別したときにそれに後続する処理に進むか否かを決定するための遷移定数kが0.4である。この例のフローチャートを図5(b)に示す。図5(b)に示すノードCN01.1は、処理の開始点を示す始点ノード、ノードCN01.2は、窓が閉じていると判別したときの進行方向のノードであり、その遷移定数kは0.4である。さらに、ノードCN01.3は、窓が開いていると判別したときの進行方向のノードであり、その遷移定数kは0.3である。また、判別処理CN02は、エアコン51のステータスがオン(動作中か)否かを判別する処理であり、動作中であると判別したときに後続する処理に進むか否かを決定するための遷移定数が0.5、オフである(動作していない)と判別したときに後続する処理に進むか否かを決定するための遷移定数kが0.3である。
「判別処理」は、判別に用いるデータを任意の取得源から取得する場合があってもよいとする。取得源としては、例えば、言語解析部2や、エージェント処理部6が実行する他の処理や、入出力対象機器群5に属する機器や、その他外部の機器などが考えられる。そしてこの場合、判別処理の内容を記述するデータは、例えば、判別に用いるデータの取得源を指定するデータを更に含んでいればよい。
また、「判別処理」では、所定のデータを、判別に先立って所定の出力先に出力するようにしてもよい(この場合は、処理を示す記号を例えばQBxxとする)。例えば、所定の質問を表すデータを、判別に先立って音声合成処理部3に引き渡す、等が考えられる。判別処理において所定のデータを判別に先立って所定のデータを出力する場合、判別処理の内容を記述するデータは、例えば、出力するデータの内容と、このデータの出力先とを指定するデータを含む。
図6(a)に判別処理QBxxの例を示す。この例では、例えば、判別処理QB01は、「窓を開けますか?エアコンをつけますか?」と利用者に問い合わせ、その応答(利用者の回答)が「エアコンをつける」であったときの進行方向の遷移定数kが0.7、「窓を開ける」であったときの進行方向の遷移定数kが0.4である。この例のフローチャートを図6(b)に示す。図6(b)に示すノードQE01.1は、処理の開始点を示す始点ノード、ノードQB01.2は、問い合わせに対して、「エアコン」をつけることが指定されたことを判別したときの進行方向のノードであり、その遷移定数kは0.7である。さらに、ノードQB01.3は、窓を開けることが指定されたことを判別したときの進行方向のノードであり、その遷移定数kは0.4である。また、判別処理QB02は、「窓を閉じますか?」と利用者に問い合わせ、その応答(利用者の回答)が「閉じる」であったときの進行方向の遷移定数kが0.5、「閉じない」であったときの進行方向の遷移定数kが0.3である。
処理項目データベースD4に格納されている「入出力処理」の内容を記述するデータは、入力あるいは出力するデータの内容を指定するデータから構成されている。入力データ及び出力データは任意の内容を有していてよい。例えば、出力データは、音声合成処理部3を介して音声出力部4に発生させる音声の読みを表すデータや外部の機器を制御する制御信号であってもよい。また、入力データは、例えば、外部の機器から供給されるデータであってもよい。
図7(a)に出力処理EXxxの例を示す。この例では、例えば、出力処理EX01は、「窓を閉める且つエアコンを動作させる」という動作であり、動作後の処理を行う進行方向の重み係数kが0.8である。この例のフローチャートを図7(b)に示す。図7(b)に示すノードEX01.1は、処理の開始点を示す始点ノード、ノードEX01.2は、処理の終了を示すノードであり、重み係数kは0.8である。尚、「入出力処理」については、進行方向の重み係数を設定しなくてもよく、この場合「入出力処理」が実行された後、進行方向のノードEX01.2の選択が必須であるようにすればよい。
ワイヤデータベースD5は、複数の処理(TG、CNxx、QBxx、EXxx)間の遷移を記述するデータ(以下、このデータをワイヤと呼ぶ)の集合から構成されている。ワイヤは、例えば図8に示すような書式で記述されたデータから構成されている。ワイヤWn(W1、W2...)は図示するように、先行する処理X(From(X))から後続する処理Y(To(Y))への遷移(From(X)To(Y))について、当該先行の処理(X)と、当該後続の処理(Y)と、当該遷移に対して与えられた重み係数Jと、を指定するデータである。なお、先行の処理Xが判別処理である場合は、当該判別処理のどの判別結果からの遷移であるか、まで記述される必要がある。また、遷移元処理Xと遷移先Yは、それぞれ、各処理のノード番号で特定される。各ワイヤの重み係数Jは、固定値ではなく、処理の進行に応じて、適宜計算され、設定されるものである。ワイヤの重み係数Jの計算は図10を参照して後述する。
エージェント処理部6は、処理項目データベースD4及びワイヤデータベースD5が全体として表しているフローを実行する。処理項目データベースD4及びワイヤデータベースD5は、例えば、図3〜図8の例に基づくと、全体として図9に示すようなフローを記述することができる。
図9に示すフローにおいては、エージェント処理部6は、トリガ処理TG01では、「暑い」という単語を示す単語データを言語解析部2より供給されるのを待機して、供給されるとこれを取得して判別処理CN01に引き渡す(ワイヤW1)。
エージェント処理部6は、判別処理CN01で、窓が開いているか否かを示す情報を窓開閉制御部52より取得し、開いていると判別すると入出力処理EX01に処理を移す(ワイヤW2)。入出力処理EX01では、窓開閉制御部52に、窓を閉めることを指示する制御信号を出力し、エアコン51に、冷房動作を開始することを指示する制御信号を出力する。この結果、窓開閉制御部52は窓を閉め、エアコン51は冷房動作を開始する。
一方、判別処理CN01で、窓が閉じていると判別すると、質問を含む判別処理QB01に処理を移す(ワイヤW3)。判別処理QB01でエージェント処理部6は、まず、「窓を開けますか。それともエアコンをつけますか。」という文章を表すデータを音声合成処理部3に供給する。音声合成処理部3は、音声出力部4を介して、この文章を読み上げる音声を再生させる。
判別処理QB01でエージェント処理部6は、次に、言語解析部2から、単語「窓」又は単語「エアコン」を表すデータが供給されるのを待機し、該当するデータが供給されると、このデータが単語「窓」又は単語「エアコン」のどちらを表すかを判別する。そして、単語「窓」を表すと判別すると入出力処理EX03に処理を移し(ワイヤW5)、単語「エアコン」を表すと判別すると、入出力処理EX02に処理を移す(ワイヤW6)。
エージェント処理部6は、入出力処理EX02では、エアコン51に、冷房を開始することを指示する制御信号を出力する。一方、エージェント処理部6は、入出力処理EX03では、窓開閉制御部52に、換気用の窓を開けることを指示する制御信号を出力する。
一方、エージェント処理部6は、「窓を開けて」或いは「開けて」という単語を示すデータを言語解析部2より供給されるのを待機して(トリガ処理TG02)、供給されると、入出力処理EX03へと処理を移す(ワイヤW4)。
エージェント処理部6は、例えば言語解析部2が単語データを複数供給した場合などにおいては、複数の判別処理を並行して行う。この場合、エージェント処理部6は同一の単語を入力の対象とする処理(例えば、トリガ取得処理や、判別処理におけるデータの入力)が複数があって、該当する単語を表す単語データが言語解析部2より供給された場合は、これらの処理すべてを並行して行う。
次に、各ワイヤの重み係数Jを計算する方法を図10(a)〜(c)を参照して説明する。
複数の処理がワイヤWにより連結されている場合には、注目するワイヤWの重み係数Jは、現在処理中の処理を起点として、注目しているワイヤWに至るまでの遷移の経路上の遷移定数kを順次乗算することにより求められる。
理解を容易にするため、図10(a)にフローを示す処理を想定する。
図10(a)の処理は、全体としては、ユーザが「暑い」と発話すると、これを検出してスタートし、まず、窓が開いているか否かを判別し、閉まっている場合に、窓を開けるかエアコンを入れるかをユーザに問い合わせて、ユーザの回答に応じた処理を行うものである。
図10(a)に示す処理では、処理TG101、CN101,QB101のいずれについても、各進行方向決定用の遷移定数kは、順方向についてはいずれも0.5、逆(戻り)方向については、いずれも0.1である。この場合、ワイヤは、例えば、図10(b)に示すように、定義される。
例えば、エージェント処理部6は、処理(又は制御)がトリガ取得処理TG101に位置するとき(処理ポインタPPがトリガ取得処理TG101を指しているとき)、トリガ取得処理TG101を起点として、注目するワイヤまでの経路上の遷移定数kを順次乗算することにより、ワイヤW51〜W55(図示していないワイヤが存在する場合にはそれらを含むすべて)のそれぞれの重み係数Jを計算し、計算結果をワイヤW51〜W55に対応付けてワイヤデータベースD5に書き込む。
具体的には、トリガ取得処理TG101に処理が位置するとき、例えば、ワイヤW51の重み係数Jは、トリガ取得処理TG101の判別処理CN101に繋がるノードに割り当てられている遷移定数kの値すなわち0.5となる。判別処理CN101のワイヤW52の重み係数Jは、トリガ取得処理TG101のワイヤW51に係る遷移定数k=0.5に判別処理CN101のワイヤW52に繋がるノードに割り当てられている遷移定数k=0.5を乗じた結果すなわち0.25となる。同様に、判別処理CN101のワイヤW54の重み係数Jは、トリガ取得処理TG101のワイヤW51に繋がるノードに割り当てられている遷移定数k=0.5に判別処理CN101のワイヤW54に繋がるノードの遷移定数k=0.5を乗じた結果すなわち0.25となる。
ワイヤW53の重み係数Jは、トリガ取得処理TG101のワイヤW51に繋がるノードに割り当てられている遷移定数k=0.5に、判別処理CN101のワイヤW52に繋がるノードに割り当てられている遷移定数k=0.5を乗じた結果に更に判別処理QB101のワイヤW53に繋がるノードに割り当てられている遷移定数k=0.5を乗じた結果、すなわち0.125となる。同様に、ワイヤW55の重み係数Jは、トリガ取得処理TG101のワイヤW51に繋がるノードに割り当てられている遷移定数k=0.5に、判別処理CN101のワイヤW52に繋がるノードに割り当てられている遷移定数k=0.5を乗じた結果に、更に判別処理QB101のワイヤW55に繋がるノードに割り当てられている遷移定数k=0.5を乗じた結果、すなわち0.125となる。
次に、処理が判別処理CN101に遷移すると、ワイヤW52の重み係数Jは、ワイヤW52に繋がるノードに割り当てられている遷移定数kに等しい値0.5となり、ワイヤW54の重み係数Jは、ワイヤW54に繋がるノードに割り当てられている遷移定数kに等しい値0.5となる。また、ワイヤW53の重み係数JはワイヤW52に繋がるノードに割り当てられている遷移定数k=0.5と判別処理QB101のワイヤW53に繋がるノードに割り当てられている遷移定数k=0.5との積すなわち0.25となり、ワイヤW55の重み係数JはワイヤW52に繋がるノードに割り当てられている遷移定数k=0.5と判別処理QB101のワイヤW55に繋がるノードに割り当てられている遷移定数k=0.5との積すなわち0.25となる。さらに、逆方向(トリガ取得処理TG101に戻る方向に係るワイヤW51の重み係数Jは、ワイヤW51に繋がるノードに割り当てられている戻り方向のノードの遷移定数k=0.1に等しい値0.1となる。
さらに、処理が判別処理QB101に遷移すると、ワイヤW53とW55の重み係数Jは、ワイヤW53とW55にそれぞれ繋がるノードに割り当てられている遷移定数kに等しい値0.5となる。
さらに、ワイヤW52の重み係数Jは、それに繋がる戻り方向のノードに割り当てられている戻り方向の遷移定数k=0.1となる。さらに、ワイヤW51の重み係数Jは、判別処理QB101のワイヤW52に繋がるノードに割り当てられている戻り方向の遷移定数k=0.1に、判別処理CN101のワイヤW51に繋がれている戻り方向のノードに割り当てられている戻り方向の遷移定数k=0.1の積の0.01となる。ワイヤW54の重み係数Jは、判別処理QB101のワイヤW52に繋がるノードに割り当てられている戻り方向の遷移定数k=0.1に、判別処理CN101のワイヤW54に繋がれているノードに割り当てられている遷移定数k=0.5の積の0.05となる。
各ワイヤWnの重み係数Jの変化の例を図10(c)に示す。
重み係数Jの計算は、関連するフローの処理のみではなく、全てのフローの全てのワイヤについて実行され、計算された重み係数Jが各ワイヤに設定される。現在の処理に関連のないワイヤについては、予め定められた低い係数値を割り当てるようにしてもよい。しかし、特に、トリガ取得処理TGxxを先行の処理とするワイヤについては、遷移定数kをある程度高く設定するようにする。こうすることによって、直前までなされていた会話と著しく異なる内容の会話にもジャンプすることが可能になる。
次に、このように構成されたシステム全体の動作を、図11を参照して説明する。
音声入力部1と言語解析部2とは、独自に動作して、音声を取り込み、解析し、単語データをエージェント処理部6に提供する。そして、エージェント処理部6は、判別条件に係る(1個又は複数個の)単語データが言語解析部2より供給されると、以下の処理を行う。
まず、エージェント処理6は、供給された単語を認識(識別)し(図11ステップS11)、それが、単語データベースD4に登録されている単語に相当するか否かを判別する(ステップS12)。登録されていなければ(ステップS12,No)、単語入力処理を終了する。
一方、登録されていれば(ステップS12,Yes)、その単語又はその単語の属すグループの「概念」が条件となっている処理に関し、単語の尤度(スコア)Sとワイヤの重み係数Jの積S・Jを計算する(ステップS13)。
例えば、図10(a)に示すフローを実行している場合において、処理ポインタPPがトリガ取得処理TG101を指示しているとする。この場合の、各ワイヤの重み計数Jは図10(c−1)に示す通りである。
この状態で、スコアが80%の単語「暑い」と、スコアが50%の単語「窓」を示す単語データが言語解析部2から入力されたと仮定する。
図10(a)に示す例では、トリガ取得処理TG101では、単語「暑い」が判別に関連し、判別処理QB101では、単語「窓」が判別に関連する。
図10(c−1)示すように、単語「暑い」を示す単語データを入力する処理を先行の処理とするワイヤW51の重み係数Jが0.5、単語「窓」を示す単語データを入力する処理を先行の処理とするワイヤW53の重み係数Jが0.125である。この場合、ワイヤW51及びW53について求められる尤度Sと重み係数Jの積は、数式1及び2に示すとおりとなる。
Figure 2005062295
Figure 2005062295
エージェント処理部6は、スコアと重み係数との積を求める上述の処理を、フローが有するすべてのワイヤについて行う。
続いて、エージェント制御部6は、計算された積S・Jが最も大きいワイヤを選択する(図11,ステップS14)。エージェント制御部6は、選択したワイヤに後続する処理に制御を進める(ステップS15)。例えばワイヤW51について求めた積が最も高い値を示した場合、入力された単語データは単語「暑い」を示すものであったと認識して、ワイヤW51が後続の処理としている判別処理CN101に遷移する。通常、現在の処理中の処理を起点すると現在の処理に係るワイヤの重み係数Jが比較的大きい。このため、一般的には、次の処理に移るが、従前と全く異なる単語で尤度の高いものが入力された場合には、その単語に対応する処理が開始されることもある。
エージェント処理部6は、処理が遷移すると、遷移後の状態に基づいて、各ワイヤの重み係数Jを再計算する(ステップS16)。
以後は、その処理の内容に従って処理を進める(ステップS17)。この例では、判別処理CN101を実行する。すなわち、エージェント処理部6は、窓開閉制御部52から窓の開閉の情報を取り込み、取り込んだ情報に基づいて処理を進める。なお、窓開閉制御部52からの窓の開閉を示す信号は、開の尤度が100%又は0%、閉の尤度が0%又は100%でもよく。また、開度に応じて変化させるようにしてもよい。そして、処理の過程で、入出力処理EXxxがあり、エージェント処理部6がその処理を実行して音声データを出力すれば、それが音声として放音される。
また、処理の過程で、入出力処理EX01のように、エアコンや窓開閉制御部52への制御を行う処理を実行すると、その処理内容に従って、エアコン51や窓開閉制御部52への制御を行う。
なお、図8、図9では、「単語」に基づく判別処理を主に説明したが、概念に基づく判別処理でも同様になされる。また、単語或いは概念に基づくトリガ取得処理からのワイヤも判断の対象となる。トリガ取得処理からの遷移に対しては、ある程度高い重み係数を設定しておくとよい。具体的には、例えば図8のワイヤ群、すなわち、図9のフローにおいて、「窓を開けて」という単語を示す単語データを取得するトリガ取得処理TG02からの遷移に対しては、例えば重み係数0.8を与えておく。そうすると、例えばエージェント処理部6の処理がトリガ取得処理TG01に係属している場合において、ユーザが「窓を開けて」と発音し、例えば単語「窓を開けて」に対するスコアが90%である単語データが得られれば、このスコアと、「ユーザが「窓を開けて」と言ったか否かの判断」に係るワイヤW5の重み係数との積は、90%×0.8すなわち72となる。この値が他のワイヤに関して計算されたスコアと重み係数Jの積より大きな値であれば、入力された音声は「窓を開けて」であったと認識され、エージェント処理部6の処理が判別処理QB101にジャンプする可能性が高くなる。一方で、他のワイヤの重み係数を極めて低く設定しておけば、これら他のワイヤにより定義されている遷移が起こる可能性は極めて低くなり、結果として、ある程度想定される会話の流れに沿って認識率を向上させて制御処理を行うことができる。
この実施の形態では、戻り方向への遷移も起こり得る。しかし、現実的には会話を戻すことは好ましくないことが多い。そこで、戻り方向の遷移定数kは、進行方向の遷移定数kに比べて低い値に設定するようにすればよい。そうすると、入力された音声から高いスコアの音声データが仮に得られても、戻り方向の遷移定数kに基づいた重み係数Jとして書き込まれたワイヤについて求めた積は低い値となるため、戻り方向への遷移の可能性を低く抑えることができる。また、エージェント処理部6は、求めた積の値が所定の条件に合致しないような処理(たとえば、積の値が所定値に達しないような処理)は、遷移を実行する対象から除外するよう取り扱ってもよい。
なお、例えば図8に示しているように、ワイヤは、処理項目から処理項目へという形で遷移を定義する。そして、ワイヤを図8に示すような形態で記述してワイヤデータベースD5に格納することにより、各処理項目同士の関係を、あたかもコンピュータのマクロ処理のように定義することが可能になる。これによって、各処理項目を容易に接続することができる。
また、トリガとなる処理項目は、実際には接続されるワイヤに係る認識対象単語等(他の入力対象機器群からの入力の場合もあり得る)のスコアの判定になるので、ワイヤにおいてトリガ取得処理項目はワイヤの開始点として定義されず、ワイヤそのものが遷移元として定義されることになる。
更に、上述のように各処理項目の接続関係をワイヤによって定義することによって、簡単にワイヤを追加することができる。例えば、「暑い」という音声入力の後に、ユーザが休憩することを意図して「ファミリーレストランを探して」という音声を入力する機会が多い場合、ファミリーレストランの検索処理項目に対して自動でワイヤを追加する。そうすると、ワイヤが自動で追加された後には、ファミリーレストラン検索処理項目に接続されたワイヤの重み係数をある程度大きくすることで、当該入力「ファミリーレストランを探して」に適切に対応することができるようになる。ただしこの場合、エージェント処理部6は、例えばファミリーレストランの位置を示す情報を含んだ地図データ等を記憶し、あるいは外部の地図データ等にアクセスするものとする。このワイヤの自動追加は、ある処理項目からある処理項目へのジャンプの回数を計数し、これが所定回数に達したときに自動で行うようにすればよい。
エージェント処理部6は、処理項目データベースD4やワイヤデータベースD5の内容を、外部から供給される新たな処理項目データやワイヤへと更新する機能を有する。具体的には、例えば、処理項目データ及び/又はワイヤを記憶する外部のサーバが、その内容が更新されると、ネットワークを介し、エージェント処理部6に、処理項目データ及び/又はワイヤの更新がある旨を通知する。すると、エージェント処理部6はこの通知に応答して、ネットワークを介し、このサーバにアクセスして、新たな処理項目データ及び/又はワイヤをダウンロードする。そして、自己の処理項目データベースD4やワイヤデータベースD5に格納されている、古い処理項目データ及び/又はワイヤを、ダウンロードした新たな処理項目データ及び/又はワイヤへと更新する。また、エージェント処理部6が、外部サーバにアクセスし、データベースが更新されていれば、これをダウンロードするようにしてもよい。
外部サーバの構成例を図12に示す。
この外部サーバ100は、単語データ、処理項目データ及び/又はワイヤデータを通信ネットワークを介して複数の車両のエージェント処理部6に配信するためのものであり、制御部110、通信制御部120、単語データベース130、処理項目データベース140、ワイヤベース150、入力部160、出力部170、から構成される。
制御部110は、例えばCPU(Central Processing Unit:中央演算処理装置)などから構成され、配信サーバ100の各部を制御するとともに、所定のプログラムを実行することで後述する各処理を実現する。
通信制御部120は、例えば、モデム、ルータなどの通信装置から構成され、配信サーバ100と車両のエージェント処理部6(通信制御部)との間のネットワークを介した通信を制御する。
ネットワークの構成は任意である。例えば、専用線、公衆回線網、ケーブルテレビ(CATV)網、無線通信網、有線放送網、などを採用することができる。
単語データベース130は、例えば、ハードディスク装置などの書換可能な記憶装置から構成され、配信サーバ100が配信する単語データをバージョン情報(例えば、タイムスタンプ)共に蓄積する。
処理項目データベース140は、例えば、ハードディスク装置などの書換可能な記憶装置から構成され、配信対象の処理項目データをバージョン情報(例えば、タイムスタンプ)共に蓄積する。
ワイヤデータベース150は、例えば、ハードディスク装置などの書換可能な記憶装置から構成され、配信対象のワイヤデータをバージョン情報(例えば、タイムスタンプ)共に蓄積している。
配信サーバ100の管理者は、適宜、入力部160を操作して、各DB130〜150の情報を更新する。
各車両のエージェント処理部6は、通信制御部(CCU)64を介して、配信サーバ100からの更新通知を受信すると、例えば、図13(a)の処理を開始し、セッションを確立し(ステップS21)、更新されたデータをダウンロードし、自己のデータベースを更新する(ステップS22)。或いは、各車両のエージェント処理部6は、定期的或いは適宜、配信サーバ100に通信制御部(CCU)64を介してアクセスしてセッションを確立し(ステップS31)、各データベースのバージョン情報(更新日付など)を取得する(ステップS32)。そして、両データのバージョンを比較し(ステップS33)、自己が記憶しているデータよりも新しいデータをダウンロードして、データベースにセットする(ステップS34)。
このような構成とすれば、配信サーバ100に記録されている情報を更新するだけで、配信サーバ100を利用可能なすべての車両制御システムのデータを適宜更新することができる。
なお、配信サーバ100には、データを圧縮及び暗号化して格納しておき、エージェント処理部6がダウンロードしてデータを伸張及び復号化してデータベースにセットすることが望ましい。このようにすることにより、通信の量を抑え、情報漏洩を防止できる。
また、上述のように、エージェント処理部6が処理項目データ及び/又はワイヤの更新がある旨を通知された場合に限られない。例えば、ユーザの要求に対応する処理項目及び/又はワイヤが記憶されていない場合、これを検出してネットワークを介してサーバにアクセスし、新たな処理項目データ及び/又はワイヤをダウンロードするようにしてもよい。更には、当該エージェント処理部6に接続される入出力対象機器5が新たに追加された場合や、新たな機能が追加された場合に、自動でこれを検出して、上述と同様、ネットワークを介してサーバにアクセスし、新たな処理項目データ及び/又はワイヤをダウンロードするようにしてもよい。
尚、エージェント処理部6は、新たなワイヤを自動で生成する機能を有するが、ダウンロードした新たな処理項目及び既存の処理項目に対して、どのような関係のワイヤを設定するかについて、これを記述したプログラムを一緒にダウンロードするようにしてもよい。
以上説明したこの車内空調システムは、処理の内容を示すデータやワイヤが適切に記述されれば、制御する対象である機器や加える制御の内容を完全に特定することを必ずしも必要とせずに、ユーザが発した言語に応答し、この言語からユーザの欲求を推測し、この欲求を満たすためにどの機器にどのような制御を加えればよいかを適切に判断して、判断結果に従った制御を機器に加えることができるようになる。
また、処理項目データやワイヤは随時新たなものへと更新されるので、エージェント処理部6の応答の仕方を変化させる余地が常にあり、ユーザはこの車内空調システムとの対話に飽きにくい。
なお、この車内空調システムの構成は上述のものに限られない。
例えば、入出力対象機器群5に属する機器は、必ずしも直接にユーザの欲求を満たす結果をもたらす機器である必要はなく、例えば、外部の表示装置等を制御してユーザに特定の行動をとるよう促すメッセージを出力する機器(例えば、液晶ディスプレイ等の表示装置)からなっていてもよい。
また、単語データベースは、必ずしも単語を示すデータのみならず、複数の単語からなる語句を示すデータを単語データベースの要素として記憶するようにしてもよいし、単語の一部あるいは音素を示すデータを単語データベースの要素として記憶するようにしてもよい。また、単語等は必ずしも特定の概念の下にグルーピングされている必要はなく、グルーピングを行う場合も、グルーピングを行うために用いられるデータは、必ずしもフラグの集合の形をとっていなくてもよい。
また、エージェント処理部6は、新たな処理項目データやワイヤを、外部の供給元からの通知を待たずに自発的にダウンロードしてもよいし、言語解析部2から供給される単語データに応答して新たな処理項目データやワイヤのダウンロードを開始するようにしてもよい。
また、エージェント処理部6は、各処理のノードに付与された遷移定数kを、過去に当該ワイヤが表す遷移を実行した数などに基づき所定の基準に従って変化させ、重み係数Jが変化後の値となるようにワイヤを書き換えてもよい。
具体的には、例えば、ワイヤデータベースD5に、それぞれのワイヤについて、当該ワイヤが表す遷移が実行された回数を記憶しておく。そしてエージェント処理部6は、当該遷移が新たに行われる毎に、この回数の値を書き換えることにより、この回数の値を1ずつインクリメントし、それぞれのワイヤ用の遷移定数kを、例えば、当該ワイヤについて記憶された回数に比例した値と書き換える。従って、重み係数Jが計算される際にも、変更された遷移定数kに基づいて計算されるので、重み係数Jも過去に当該ワイヤWが表す遷移を実行した数などに基づいて変化さされる。
また、エージェント処理部6は、判別処理や入出力処理において出力するデータを、これらの処理に引き渡されたデータや、これらの処理に伴って入力したデータや、その他任意の条件に従って変化させるようにしてもよい。
また、この車内空調システムは、エージェント処理部6の制御に従って画像を出力するための表示装置(例えば、液晶ディスプレイ等)を備えていてもよく、エージェント処理部6は、入出力処理や判別処理において、処理毎に所定の画像を表示させるようこの表示装置を制御してもよい。
また、エージェント処理部6は、1個の入力処理や1個の判別処理において、連続して発話される等した複数の単語データを一括して取得するようにしてもよい。また、エージェント処理部6は、一括して取得した複数の単語データがどの概念の下で同一のグループ内にグルーピングされているかを特定し、特定した概念が所定の概念に合致する場合にのみ、取得した単語データの一部または全部を処理に用いるものとしてもよい。また、複数の単語が入力された場合には、入力された音声の単語データベースD3に記憶された単語に対する尤度(スコア)を得、これらの単語が共通の概念に属している場合のみ、当該共通の概念が入力されたものと認識するようにしてもよい。この際に、概念のスコアを求めるようにしても良い。概念のスコアは、例えば各単語に対して得られたスコアを乗算したものを採用すればよい。そして、共通の概念と、当該共通の概念に対して得られたスコアを各ワイヤに対して出力する。
また、エージェント処理部6は、トリガ取得処理、判別処理、入出力処理等の各種処理とワイヤとが全体として形成するフローを分担して行う、互いに接続された複数のデータ処理装置(例えば、コンピュータ等)から構成されていてもよい。この場合、解析処理部3を構成するそれぞれのデータ処理装置は、解析処理部3が実行し得るフロー全体のうち、自己が実行する可能性がある部分を表すデータを、処理項目データベースやワイヤデータベースの要素として記憶すれば十分である。そして、それぞれのデータ処理装置が記憶するデータが、当該データ処理装置が実行する部分の処理をマクロ定義するようなデータとなっていれば、複数のデータ処理装置に分散処理を行わせることも容易である。
また、この車内空調システムは、音声入力部1や言語解析部2あるいは音声出力部4も複数備えていてよい。
また、音声入力部1は、たとえば、音声を表すデータが記録された記録媒体(たとえば、フロッピー(登録商標)ディスクや、CD(Compact Disc)や、MO(Magneto−Optical Disk)など)から波形信号を読み出して言語解析部2に供給する記録媒体ドライブ装置(たとえば、フロッピー(登録商標)ディスクドライブや、CD−ROMドライブや、MOドライブなど)を備えていてもよい。
以上、この発明の実施の形態を説明したが、この発明にかかる機器制御装置は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。
例えば、入出力対象機器群5に接続されたパーソナルコンピュータに上述の音声入力部1、言語解析部2、音声合成処理部3、音声出力部4及びエージェント処理部6の動作を実行させるためのプログラムを格納した記録媒体から該プログラムをインストールすることにより、上述の処理を実行する車内空調システムを構成することができる。そして、このプログラムを実行するパーソナルコンピュータが、図1の車内空調システムの動作に相当する処理として、例えば、図9及び図11に示すフローを実行するものとする。
なお、パーソナルコンピュータに上述の車内空調システムの機能を行わせるプログラムは、例えば、通信回線の掲示板(BBS)にアップロードし、これを通信回線を介して配信してもよく、また、このプログラムを表す信号により搬送波を変調し、得られた変調波を伝送し、この変調波を受信した装置が変調波を復調してこのプログラムを復元するようにしてもよい。そして、このプログラムを起動し、OSの制御下に、他のアプリケーションプログラ厶と同様に実行することにより、上述の処理を実行することができる。
なお、OSが処理の一部を分担する場合、あるいは、OSが本願発明の1つの構成要素の一部を構成するような場合には、記録媒体には、その部分を除いたプログラムを格納してもよい。この場合も、この発明では、その記録媒体には、コンピュータが実行する各機能又はステップを実行するためのプログラムが格納されているものとする。

Claims (8)

  1. 入力情報を識別する入力情報認識識別手段(6、61,S11)と、
    入力情報認識識別手段によって認識識別された認識入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段(D4)と、
    複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段(D5)と、
    外部にある、新たな処理項目及び/又は遷移定義データの供給元(100)にアクセスし、当該新たな処理項目及び/又は遷移定義データを取得して、前記処理項目データ記憶手段に記憶されている古い処理項目、又は遷移定義データ記憶手段に記憶されている古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する取得手段(6,61,64)と、
    を備え、
    前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、
    少なくとも前記認識情報とそれぞれの遷移定義データの条件から、入力された前記入力情報とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、
    ことを特徴とする機器制御装置。
  2. 前記供給元は、前記新たな処理項目又は遷移定義データを圧縮して供給するものであり、
    前記取得手段は、前記供給元より取得した当該新たな処理項目又は遷移定義データを解凍する手段を備える、
    ことを特徴とする請求項1に記載の機器制御装置。
  3. 入力される音声信号を認識識別する音声信号認識識別手段と、
    音声信号認識識別手段によって認識識別された音声信号に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段と、
    複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段と、
    外部にある、新たな処理項目及び/又は遷移定義データの供給元にアクセスし、当該新たな処理項目又は遷移定義データを取得して、前記処理項目データ記憶手段に記憶されている古い処理項目、又は遷移定義データ記憶手段に記憶されている古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する取得手段と、
    を備え、
    前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、
    少なくとも前記認識情報とそれぞれの遷移定義データの条件から、入力された前記音声信号とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、
    ことを特徴とする音声認識装置。
  4. 前記供給元は、前記新たな処理項目又は遷移定義データを圧縮して供給するものであり、
    前記取得手段は、前記供給元より取得した当該新たな処理項目又は遷移定義データを解凍する手段を備える、
    ことを特徴とする請求項3に記載の音声認識装置。
  5. 入力される入力情報を認識識別する入力情報認識識別手段(6,61,S11)と、
    入力情報認識識別手段によって認識識別された認識入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段(D4)と、
    複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段(D5)と、
    外部にある、新たな処理項目及び/又は遷移定義データの供給元(100)にアクセスし、当該新たな処理項目又は遷移定義データを取得して、前記処理項目データ記憶手段に記憶されている古い処理項目、又は遷移定義データ記憶手段に記憶されている古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する取得手段(6,61,64)と、
    を備え、
    前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、
    少なくとも前記認識情報とそれぞれの遷移定義データの条件から、入力された前記入力情報とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させる、
    ことを特徴とするエージェント装置。
  6. 前記供給元は、前記新たな処理項目又は遷移定義データを圧縮して供給するものであり、
    前記更新手段は、前記供給元より取得した当該新たな処理項目又は遷移定義データを解凍する手段を備える、
    ことを特徴とする請求項5に記載のエージェント装置。
  7. 入力情報認識識別ステップにおいて認識識別された入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶ステップと、
    入力情報に対応する条件を各々有し、複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶ステップと、
    外部にある、新たな処理項目又は遷移定義データの供給元にアクセスし、当該新たな処理項目又は遷移定義データを取得して、前記処理項目データ記憶ステップで記憶された古い処理項目、又は遷移定義データ記憶ステップで記憶された古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する取得更新ステップと、
    を備え、
    入力される入力情報を認識識別する前記入力情報認識識別ステップと、
    少なくとも前記認識情報とそれぞれの遷移定義データの条件から、入力された前記入力情報とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させるステップと、
    を有することを特徴とする機器制御方法。
  8. コンピュータを、
    入力情報を識別する入力情報認識識別手段(6、61,S11)、
    入力情報認識識別手段によって認識識別された認識入力情報に対応する処理を実行する処理項目を複数記憶する処理項目データ記憶手段(D4)、
    複数の処理項目のうちの一の処理項目から他の処理項目への遷移を定義する遷移定義データを複数記憶する遷移定義データ記憶手段(D5)、
    外部にある、新たな処理項目及び/又は遷移定義データの供給元(100)にアクセスし、当該新たな処理項目及び/又は遷移定義データを取得して、前記処理項目データ記憶手段に記憶されている古い処理項目、又は遷移定義データ記憶手段に記憶されている古い遷移定義データを、当該新たな処理項目又は遷移定義データへと更新する取得手段(6,61,64)、
    として機能させるコンピュータプログラムであって、
    前記遷移定義データのそれぞれは、入力情報に対応する条件を各々有し、少なくとも前記認識情報とそれぞれの遷移定義データの条件から、入力された前記入力情報とそれぞれの遷移定義データの条件との比較から、一の遷移定義データを選択し、選択された遷移定義データによって指定される処理項目に状態を遷移させるように構成されている、
    ことを特徴とするコンピュータプログラム。
JP2005516406A 2003-12-05 2004-12-06 機器制御装置、機器制御方法及びプログラム Expired - Fee Related JP4516919B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003406730 2003-12-05
JP2003406730 2003-12-05
PCT/IB2004/004005 WO2005062295A1 (ja) 2003-12-05 2004-12-06 機器制御装置、音声認識装置、エージェント装置及び機器制御方法

Publications (2)

Publication Number Publication Date
JPWO2005062295A1 true JPWO2005062295A1 (ja) 2007-07-19
JP4516919B2 JP4516919B2 (ja) 2010-08-04

Family

ID=34708669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005516406A Expired - Fee Related JP4516919B2 (ja) 2003-12-05 2004-12-06 機器制御装置、機器制御方法及びプログラム

Country Status (6)

Country Link
US (1) US7822614B2 (ja)
EP (1) EP1691346B1 (ja)
JP (1) JP4516919B2 (ja)
CN (1) CN100590710C (ja)
DE (1) DE602004017496D1 (ja)
WO (1) WO2005062295A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008089625A (ja) * 2006-09-29 2008-04-17 Honda Motor Co Ltd 音声認識装置、音声認識方法及び音声認識プログラム
JP2013529794A (ja) 2010-06-24 2013-07-22 本田技研工業株式会社 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法
DE102015216484A1 (de) * 2015-08-28 2017-03-02 Robert Bosch Gmbh Verfahren und Vorrichtung zum Bereitstellen eines Empfehlungssignals zum Steuern zumindest einer Funktion in einem Fahrzeug
US10089070B1 (en) * 2015-09-09 2018-10-02 Cisco Technology, Inc. Voice activated network interface
JP7004955B2 (ja) * 2017-12-11 2022-01-21 トヨタ自動車株式会社 サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法
CN108091322A (zh) * 2017-12-21 2018-05-29 重庆金鑫科技产业发展有限公司 一种语音合成器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222520A (ja) * 2000-02-10 2001-08-17 Sony Corp 情報処理装置及び方法
JP2002273036A (ja) * 2001-03-19 2002-09-24 Canon Inc 電子ゲーム装置および電子ゲーム装置における処理方法
JP2003117866A (ja) * 2001-10-16 2003-04-23 Nec Corp ロボット装置及びその制御方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08339288A (ja) 1995-06-14 1996-12-24 Canon Inc 情報処理装置及びその制御方法
JP3884160B2 (ja) * 1997-11-17 2007-02-21 富士通株式会社 用語付きデータを扱うデータ処理方法,データ処理装置およびプログラム記憶媒体
JP3886024B2 (ja) * 1997-11-19 2007-02-28 富士通株式会社 音声認識装置及びそれを用いた情報処理装置
JP2000181500A (ja) * 1998-12-15 2000-06-30 Equos Research Co Ltd 音声認識装置及びエ―ジェント装置
WO2000040377A1 (fr) * 1999-01-07 2000-07-13 Sony Corporation Appareil de type machine, procede d'actionnement de celui-ci et support enregistre
US20010044719A1 (en) * 1999-07-02 2001-11-22 Mitsubishi Electric Research Laboratories, Inc. Method and system for recognizing, indexing, and searching acoustic signals
JP2002297185A (ja) * 2001-03-29 2002-10-11 Pioneer Electronic Corp 情報処理装置および情報処理方法
JP2003108187A (ja) * 2001-09-28 2003-04-11 Fujitsu Ltd 類似性評価方法及び類似性評価プログラム
DE10338512A1 (de) * 2003-08-22 2005-03-17 Daimlerchrysler Ag Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen
US20080228492A1 (en) * 2003-12-05 2008-09-18 Kabushikikaisha Kenwood Device Control Device, Speech Recognition Device, Agent Device, Data Structure, and Device Control
WO2005064592A1 (ja) * 2003-12-26 2005-07-14 Kabushikikaisha Kenwood 機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222520A (ja) * 2000-02-10 2001-08-17 Sony Corp 情報処理装置及び方法
JP2002273036A (ja) * 2001-03-19 2002-09-24 Canon Inc 電子ゲーム装置および電子ゲーム装置における処理方法
JP2003117866A (ja) * 2001-10-16 2003-04-23 Nec Corp ロボット装置及びその制御方法

Also Published As

Publication number Publication date
CN1890709A (zh) 2007-01-03
DE602004017496D1 (de) 2008-12-11
EP1691346B1 (en) 2008-10-29
EP1691346A1 (en) 2006-08-16
US7822614B2 (en) 2010-10-26
US20070276672A1 (en) 2007-11-29
EP1691346A4 (en) 2007-08-29
WO2005062295A1 (ja) 2005-07-07
JP4516919B2 (ja) 2010-08-04
CN100590710C (zh) 2010-02-17

Similar Documents

Publication Publication Date Title
JP4533845B2 (ja) オーディオ機器制御装置、オーディオ機器制御方法及びプログラム
JP5172021B2 (ja) 自動音声認識音響モデルの適合
JP4533844B2 (ja) 機器制御装置、機器制御方法及びプログラム
JP2017513047A (ja) 音声認識における発音予測
JP4640178B2 (ja) エアコン制御装置及びエアコン制御方法
JP4905522B2 (ja) 機器制御装置、機器制御方法及びプログラム
JP5263875B2 (ja) 発話入力の音声認識のためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
EP3751393A1 (en) Information processing device, information processing system, information processing method, and program
JP4516919B2 (ja) 機器制御装置、機器制御方法及びプログラム
KR102485339B1 (ko) 차량의 음성 명령 처리 장치 및 방법
JP2003162293A (ja) 音声認識装置及び方法
US20210241771A1 (en) Electronic device and method for controlling the electronic device thereof
JP2004029354A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
CN113314115A (zh) 终端设备的语音处理方法、终端设备及可读存储介质
US11893996B1 (en) Supplemental content output
JP4198040B2 (ja) データ利用装置及びデータ利用方法
JP2003228393A (ja) 音声対話装置及び方法、音声対話プログラム並びにその記録媒体
JP2002007015A (ja) 情報処理装置およびコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100517

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees