JP4722499B2 - 音声認識型機器制御装置および車両 - Google Patents

音声認識型機器制御装置および車両 Download PDF

Info

Publication number
JP4722499B2
JP4722499B2 JP2005016959A JP2005016959A JP4722499B2 JP 4722499 B2 JP4722499 B2 JP 4722499B2 JP 2005016959 A JP2005016959 A JP 2005016959A JP 2005016959 A JP2005016959 A JP 2005016959A JP 4722499 B2 JP4722499 B2 JP 4722499B2
Authority
JP
Japan
Prior art keywords
control
state
dialogue
state quantity
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005016959A
Other languages
English (en)
Other versions
JP2006208460A (ja
Inventor
久幸 長島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2005016959A priority Critical patent/JP4722499B2/ja
Publication of JP2006208460A publication Critical patent/JP2006208460A/ja
Application granted granted Critical
Publication of JP4722499B2 publication Critical patent/JP4722499B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、音声認識型機器制御装置および該音声認識型機器制御装置を搭載した車両に関するものである。
従来、例えば作業者の視線や動作等の作業者状態と、作業装置の駆動状態と、作業者周囲の雑音状態とに対する各検出結果に基づき作業者の作業負荷を検知し、検知した作業負荷の大小に応じて音声対話の処理内容や音声認識用の辞書を変更する音声対話装置(例えば、特許文献1参照)が知られている。
特開2003−108191号公報
ところで、上記従来技術に係る音声対話装置では、単に、作業者の作業負荷の大小に応じて音声対話の処理内容が変更されるだけであるから、音声対話の処理内容に作業者の意志を的確に反映させることができないという問題が生じる。つまり作業負荷の大小と音声対話の処理内容に対する作業者の意志との間には、何等の関連性も認められない場合があり、例えば各種作業負荷が増大した状態であっても、作業者が音声対話に対する作業負荷や優先度を低下させることを望むとは限らず、音声対話の成立度や作業者の理解度等に応じて作業者の意志が多様に変化することになる。このため、作業者状態や作業装置の駆動状態や雑音状態等に対して複数の状態量を検出したとしても、これらの複数の検出結果を作業負荷の大小を検知することに利用するだけでは、多様に変化する作業者の意志を音声対話の制御に的確に反映させることは困難である。
しかも、作業負荷の大小は複数の状態量の検出結果に応じて設定されることから、音声対話の処理内容を制御する際に、作業負荷の大小に応じて単一の制御動作のみ(例えば、応答時間のみの変更や、音量のみの変更や、情報量のみの変更等)を適切に実行することは困難である。
さらに、複数の状態量の検出結果に応じて作業負荷の大小を検知する処理に対し、新たな状態量の検出結果を追加する場合、あるいは、既に利用されている状態量の検出結果を削除する場合には、作業負荷の大小を検知するための処理内容を大幅に変更する必要があり、煩雑な手間がかかるという問題が生じる。
本発明は上記事情に鑑みてなされたもので、音声対話および音声対話に応じた機器制御を適切に実行することが可能な音声認識型機器制御装置および車両を提供することを目的とする。
上記課題を解決して係る目的を達成するために、請求項1に記載の本発明の音声認識型機器制御装置は、話者の音声を入力する音声入力手段(例えば、実施の形態での音声入力装置11)と、前記音声入力手段により入力された音声を認識する音声認識手段(例えば、実施の形態での音声認識部21)と、前記音声認識手段による認識結果に基づき前記話者に対する応答を制御する応答制御手段と、話者の状態量を検知する話者状態量検知手段(例えば、実施の形態での話者状態量センサ16、音声認識部21)と、車両の状態を検知する車両状態検知手段(例えば、実施の形態での車両状態量センサ15)と、前記音声認識手段による認識結果と、前記話者状態量検知手段による検知結果と、前記車両状態検知手段による検知結果とに基づき、前記話者と前記応答制御手段との間の対話状態に係る複数の対話状態量(例えば、実施の形態での対話状態量x,…,x)を検知する対話状態量検知手段と、前記対話状態量検知手段により検知された前記複数の対話状態量に基づいて、前記対話状態を制御するための複数種類及び複数個の第1制御パラメータ(例えば、実施の形態での対話制御状態量a1〜k1,…,a10〜k10の値)設定する第1制御パラメータ設定手段(例えば、実施の形態での応答関数設定部24)と、前記第1制御パラメータ設定手段により設定された前記複数種類及び複数個の第1制御パラメータに基づいて、同一の種類の複数個の前記第1制御パラメータを統合して、複数種類の第2制御パラメータ(例えば、実施の形態での対話制御状態量P1,…,P10)設定する第2制御パラメータ設定手段(例えば、実施の形態での応答関数設定部24が兼ねる)とを備え、前記応答制御手段は、前記音声認識手段による認識結果および前記第2制御パラメータ設定手段により設定された前記複数種類の第2制御パラメータに基づき前記応答を制御する。
さらに、請求項2に記載の本発明の音声認識型機器制御装置では、前記第2制御パラメータ設定手段は、前記複数個の数を自然数nとし、前記複数種類の数を自然数mとし、前記複数種類及び複数個の第1制御パラメータを行列要素とするm行n列の行列を有する応答関数により前記第2制御パラメータを設定する。
また、請求項に記載の本発明の車両は、請求項1または請求項2に記載の音声認識型機器制御装置を搭載したことを特徴としている。
上記構成の車両によれば、車両および車両の乗員の環境状態が多様かつ頻繁に変動する場合であっても、話者に対する応答を適切に制御することができる。
以上説明したように、請求項1、2に記載の本発明の音声認識型機器制御装置によれば、第2制御パラメータに対して複数の対話状態量を容易に反映させることができ、適切な機器制御を行うことができると共に、第2制御パラメータを設定する処理の処理内容の汎用性を向上させることができる。
また、請求項に記載の本発明の車両によれば、車両および車両の乗員の環境状態が多様かつ頻繁に変動する場合であっても、話者に対する応答を適切に制御することができる。
以下、本発明の実施形態に係る音声認識型機器制御装置について添付図面を参照しながら説明する。
本実施の形態による音声認識型機器制御装置10は、例えば図1に示すように、車両に搭載され、音声入力装置11と、出力装置12と、電子制御ユニット(ECU)13と、制御機器14と、車両状態量センサ15と、話者状態量センサ16とを備えて構成され、例えばマイク等を具備する音声入力装置11に操作者から入力される音声入力に応じて、さらに、車両状態量センサ15および話者状態量センサ16から出力される各検出信号に基づき、例えばスピーカやディスプレイ等の出力装置12から適宜の応答を出力すると共に、例えばナビゲーション装置、空調装置、音響装置、放送受像装置、通信装置等の車両に搭載された各種の制御機器14の動作を制御する。
なお、車両状態量センサ15は、車両の走行状態や運転状態に係る状態量を検出する各種のセンサ(例えば、車速センサやジャイロセンサ等)や各種のスイッチ(例えば、ブレーキスイッチやワイパースイッチ等)等を備えて構成され、各種のセンサから出力される検出信号や各種のスイッチから出力されるオン/オフ信号を車両状態量として電子制御ユニット(ECU)13へ出力する。
ここで、車速センサは車両の速度(車速)を検出し、ジャイロセンサは水平面内での自車両の向きや鉛直方向に対する傾斜角度(例えば、車両の前後方向軸の鉛直方向に対する傾斜角度や車両重心の上下方向軸回りの回転角であるヨー角等)および傾斜角度の変化量(例えば、ヨーレート等)を検出する。
また、ブレーキスイッチは運転者によるブレーキ操作の有無に係るオン/オフ信号を出力し、ワイパースイッチは降雨や降雪等の天候状態に応じたワイパー作動の有無に係るオン/オフ信号を出力する。
また、話者状態量センサ16は、音声入力を行う操作者の生理状態や動作状態に係る状態量(例えば、発汗量や表情や動作等)を検出する各種のセンサ(例えば、皮膚抵抗センサや画像認識装置等)を備えて構成されている。
例えば皮膚抵抗センサは、ステアリングホイールの表面上に設けられた電極対間の抵抗値を検出することで電極対間に接触する運転者の掌表面の抵抗値に応じた運転者の発汗量を検知する。
また、例えば画像認識装置は、車室内のインストルメントパネルやダッシュボード等に設けられて車室内の乗員を可視光領域や赤外線領域にて撮像可能なCCDカメラやCMOSカメラ等のカメラを備え、カメラにより撮影して得た撮像画像に対して、話者の顔や上半身等を検知対象物とした特徴量算出および形状判別等の認識処理を行い、話者の表情や動作を検知する。
そして、電子制御ユニット(ECU)13は、例えば音声認識部21と、解析部22と、対話状態検知部23と、応答関数設定部24と、制御状態量記憶部25と、対話制御部26と、対話データ記憶部27と、機器制御部28とを備えて構成されている。
音声認識部21は、音声入力装置11を介して操作者から入力される音声入力に対して、予め記憶している語彙データに基づき音声認識処理を行い、音声入力に対応する文字データである認識言語を生成し、この認識言語を、語彙データに対する一致度に応じて設定される音声認識スコアと共に解析部22へ出力する。さらに、音声認識部21は、音声入力状態として、例えば、音声入力の入力タイミングと、音声入力に対する発話音量の時間変化と、単一の発話の継続時間(単発話継続時間)と、音高および音調と、雑音レベルとを検知し、各検知結果を解析部22へ出力する。
解析部22は、音声認識部21にて生成された認識言語を解析し、認識言語の意味内容を把握すると共に、この解析結果を対話状態検知部23へ出力する。例えば、解析部22は、制御機器14の制御動作に係る動作情報を認識言語から抽出し、対話状態検知部23へ出力する。
対話状態検知部23は、解析部22での解析結果、例えば認識言語から抽出された制御機器14の制御動作に係る動作情報と、解析部22を介して音声認識部21から入力される音声入力状態の各検知結果と、車両状態量センサ15および話者状態量センサ16から出力される各検出信号とに基づき、操作者と音声認識型機器制御装置10との間の対話状態に係る対話状態量を検知し、検知結果を応答関数設定部24へ出力する。
例えば下記表1に示すように、対話状態検知部23は、複数(例えば、11個)の対話状態量として、操作者の音声入力に対する発話音量の変動量x(以下、単に、発話音量xと呼ぶ)と、応答時間xと、単発話継続時間xと、音高または音調の変動量x(以下、単に、音高および音調xと呼ぶ)と、雑音レベルxと、音声認識スコアxと、操作者の動作xと、操作者の表情xと、車両の走行状態xと、操作者の発汗状態xと、対話成立度xとを設定している。
Figure 0004722499
なお、発話音量xと、単発話継続時間xと、音高および音調xと、雑音レベルxと、音声認識スコアxとは、例えば音声認識部21により検知され、各検知結果は解析部22を介して対話状態検知部23に入力される。また、対話状態検知部23は、出力装置12から出力される対話データの出力タイミングと、例えば音声認識部21により検知されて解析部22を介して入力される音声入力の入力タイミングとに基づき応答時間xを検知する。また、対話状態検知部23は、話者状態量センサ16に具備されるカメラの撮像画像に対する認識結果のうち、例えば出力装置12から出力される対話データに対する操作者の理解度に係る動作(例えば、うなづき等)および表情(例えば、困惑や不満等)を抽出し、操作者の動作xおよび表情xとして設定する。また、対話状態検知部23は、車両状態量センサ15から出力される各検出信号およびオン/オフ信号に基づき、例えば車両の走行状態に応じた運転操作の難易度や余裕度合等を検知し、車両の走行状態xとして設定する。また、操作者の発汗状態xは、話者状態量センサ16に具備される皮膚抵抗センサにより検知され、対話状態検知部23に入力される。また、対話状態検知部23は、出力装置12から出力される対話データに対する音声入力の解析結果、つまり音声入力の意味内容等に基づき対話成立度xを検知する。
応答関数設定部24は、対話状態検知部23による検知結果に応じて操作者と音声認識型機器制御装置10との間の対話状態を制御するための応答関数を設定する。
例えば上記表1に示すように、対話状態検知部23により検知される各対話状態量x,…,xに対応して、予め、所定の制御量を有する各対話制御状態量a1〜k1,…,a10〜k10が設定され、制御状態量記憶部25に格納されている。
応答関数設定部24は、先ず、検知された各対話状態量x,…,xの値に応じて、制御状態量記憶部25から検索して得た各対話制御状態量a1〜k1,…,a10〜k10の制御量の値を変更する。
例えば発話音量xに対しては、対話データの出力速度である発話速度a1と、音声入力の入力タイミングから対話データの出力タイミングまでの経過時間である応答時間a2と、対話データに含まれる情報量である要求情報量a3とが対応するように設定され、発話音量xの値に応じて変化する所定の制御量の値が設定されている。そして、発話音量xが大きくなることに伴い(つまり、発話音量の変動量が大きくなることに伴い)、操作者の余裕度合が低くなると判断され、操作者が実行する各種動作のうち対話動作の優先度が他の動作(例えば、運転操作等)の優先度に比べて低下するようにして、発話速度a1が低下傾向に変化するように、かつ、応答時間a2が増長傾向に変化するように、かつ、要求情報量a3が減少傾向に変化するように設定される。
また、応答時間xに対しては、応答時間b2と、対話データに含まれる情報の詳細度である情報レベルb4とが対応するように設定されている。そして、応答時間xが短くなることに伴い、操作者が迅速な対話を望んでいると判断され、応答時間b2が短縮傾向に変化するように、かつ、情報レベルb4が浅くなる方向に変化するように設定される。
また、単発話継続時間xに対しては、応答時間c2と、一連の対話が終了するまでに要する音声入力および発話データの出力の実行回数であるターン数c5とが対応するように設定されている。そして、単発話継続時間xが長くなることに伴い、音声入力の意味内容の曖昧さが増大すると判断され、応答時間c2が増長傾向に変化するように、かつ、ターン数c5が増加傾向(つまり、確認用の対話データの出力回数が増加傾向)に変化するように設定される。
また、音高および音調xに対しては、応答時間d2と、要求情報量d3とが対応するように設定されている。そして、音高および音調xが大きくなることに伴い(つまり、音高または音調の変動量が大きくなることに伴い)、操作者の余裕度合が低くなると判断され、応答時間d2が増長傾向に変化するように、かつ、要求情報量d3が減少傾向に変化するように設定される。
また、雑音レベルxに対しては、対話データ音量e8が対応するように設定されている。そして、雑音レベルxが増大することに伴い、対話データ音量e8が増大傾向に変化するように設定される。
また、音声認識スコアxに対しては、応答時間f2と、情報レベルf4と、対話データ音量f8とが対応するように設定されている。そして、音声認識スコアxが低下することに伴い、出力装置12から出力される対話データに対する応答の曖昧さが増大すると判断され、応答時間f2が増長傾向に変化するように、かつ、情報レベルf4が浅くなる方向に変化するように、かつ、対話データ音量f8が増大傾向に変化するように設定される。
また、操作者の動作xおよび表情xに対しては、各要求情報量g3,h3と、各情報レベルg4、h4とが対応するように設定されている。そして、動作xまたは表情xにおいて操作者の理解度の低下を示す状態量が増大することに伴い、要求情報量g3,h3が減少傾向に変化するように、かつ、情報レベルg4、h4が浅くなる方向に変化するように設定される。
また、車両の走行状態xに対しては、ターン数i5と、一連の対話が終了するまでに要する時間である対話継続時間i6と、対話データでの表現の丁寧さi7とが対応するように設定されている。そして、走行状態xにおいて運転操作の負荷の増大や余裕度合の低下を示す状態量が増大することに伴い、ターン数i5が増加傾向(つまり、確認用の対話データの出力数が増加傾向)に変化するように、かつ、対話継続時間i6が短縮傾向に変化するように、かつ、表現の丁寧さi7が低下傾向(つまり、表現が簡潔となる方向)に変化するように設定される。
また、操作者の発汗状態xに対しては、ターン数j5と、対話継続時間j6とが対応するように設定されている。そして、発汗状態xにおいて発汗量が増大することに伴い、ターン数i5が増加傾向(つまり、確認用の対話データの出力数が増加傾向)に変化するように、かつ、対話継続時間i6が短縮傾向に変化するように設定される。
また、対話成立度xに対しては、要求情報量k3と、情報レベルk4と、警報音の有無k9と、音調k10とが対応するように設定されている。そして、対話成立度xが低下することに伴い、要求情報量k3が減少傾向に変化するように、かつ、情報レベルk4が浅くなる方向に変化するように、かつ、警報音の有無k9が有りの状態(例えば、対話データの出力以前のタイミングで警報音が出力される状態)に変化するように、かつ、音調k10が、例えば対話データの所定箇所を強調するようにして、強調傾向に変化するように設定される。
そして、応答関数設定部24は、例えば下記数式(1)に示すように、各対話状態量x,…,x毎に所定の各対話制御状態量a1〜a10,…,k1〜k10を行列要素とする列ベクトルf(x),…,f(x)を設定し、これらの列ベクトルf(x),…,f(x)によって構成される行列において、例えば下記表2に示すように、各対話制御状態量a1〜k1,…,a10〜k10毎に行列要素を統合して対話制御状態量P1,…,P10を設定し、これらの対話制御状態量P1,…,P10により応答関数F(P)を構成する。
Figure 0004722499
Figure 0004722499
なお、単一の対話状態量に対して複数の異なる検知結果が存在する場合には、各検知結果毎に対応する対話制御状態量が統合、あるいは、各検知結果を統合して得た値に対応する対話制御状態量が設定される。例えば図2に示すように、音声入力装置11を構成する複数の第1マイクおよび第2マイクにより検出された各発話音量xa1,xa2が存在する場合には、発話音量xに対する列ベクトルf(x)として、(fa1(xa1)+fa2(xa2))あるいはf(xa1+xa2)が設定される。
対話制御部26は、予め対話データ記憶部27に格納された文字データや音声データ等の複数の対話データから、解析部22において把握された意味内容に応じた適宜の対話データを検索し、出力装置12へ出力する。ここで、対話制御部26は、対話データを検索する際、さらに、検索した対話データを出力装置12から出力させる際に、応答関数設定部24により設定された応答関数F(P)に応じた制御を行う。
そして、機器制御部28は、解析部22での解析結果、例えば認識言語から抽出された制御機器14の制御動作に係る動作情報に応じて制御機器14を制御する。
本実施の形態による音声認識型機器制御装置10は上記構成を備えており、次に、この音声認識型機器制御装置10の動作、特に、応答関数F(P)を設定して対話状態を制御する処理について添付図面を参照しながら説明する。
先ず、例えば図3に示すステップS01においては、音声入力装置11を介して操作者から入力された音声入力を取得する。
次に、ステップS02においては、取得した音声入力に対して音声認識処理を実行し、音声入力に対応する文字データである認識言語を生成する。
次に、ステップS03においては、生成された認識言語を解析し、認識言語の意味内容を把握するために必要となる情報、例えば制御機器14の制御動作に係る動作情報を抽出する。
次に、ステップS04においては、複数の対話状態量x,…,xの各検知結果を取得する。
次に、ステップS05においては、後述する応答関数設定処理を実行する。
次に、ステップS06においては、設定された応答関数F(P)を参照しつつ、認識言語の解析結果に応じた対話データを検索する。
次に、ステップS07においては、設定された応答関数F(P)を参照しつつ、検索して得た対話データを出力装置12から出力して、一連の処理を終了する。
以下に、上述したステップS05での応答関数設定処理の一例、特に、対話状態量として応答時間xが検知された場合について説明する。
先ず、図4に示すステップS11においては、検知した応答時間xが所定上限時間TH(例えば、1.3秒等)よりも長いか否かを判定する。
この判定結果が「NO」の場合には、後述するステップS13に進む。
一方、この判定結果が「YES」の場合には、ステップS12に進む。
そして、ステップS12においては、出力された対話データに対する操作者の理解度の低下や運転操作の負荷の増大等が生じていると判断し、応答時間b2が増長傾向に変化するようにして制御量を所定量(例えば、−100≦制御量≦+100に対して、所定量=+20等)だけ増大させ、かつ、情報レベルb4が浅くなる方向に変化するようにして制御量を所定量(例えば、−100≦制御量≦+100に対して、所定量=−20等)だけ減少させ、一連の処理を終了する。
そして、ステップS13においては、検知した応答時間xが所定下限時間TL(例えば、0.7秒等)よりも短いか否かを判定する。
この判定結果が「NO」の場合、つまり応答時間xが所定下限時間TL以上かつ所定上限時間TH以下である場合には、ステップS14に進み、このステップS14においては、応答時間b2および情報レベルb4の各制御量が適切であると判断して、各制御量を変更せず、一連の処理を終了する。
一方、この判定結果が「YES」の場合には、ステップS15に進む。
そして、ステップS15においては、操作者が迅速な対話を望んでいると判断し、応答時間b2が短縮傾向に変化するようにして制御量を所定量(例えば、−100≦制御量≦+100に対して、所定量=−20等)だけ減少させ、かつ、応答時間b2の短縮に伴い情報レベルb4が浅くなる方向に変化するようにして制御量を所定量(例えば、−100≦制御量≦+100に対して、所定量=−10等)だけ減少させ、一連の処理を終了する。
例えば車両始動時に運転者が車両に乗車した後の最初の音声入力が、
(A1)「ルート案内して」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報として、例えばナビゲーション装置の経路設定に係る制御動作が検索される。
そして、この音声入力に対する応答の対話データが対話データ記憶部27から検索され、例えば、
(A2)「はい、目的地はどちらでしょうか?」
が出力装置12から出力される。
そして、出力装置12から出力された対話データの問い合わせに対する応答として、音声入力が、例えば、
(A3)「成田空港」
であった場合には、この応答に対して各対話状態量x,…,xが検知される。
ここで、応答時間xが所定下限時間TL(例えば、0.7秒等)よりも短く、操作者が迅速な対話を望んでいると判定されると、例えば図5に示すように、応答時間b2が短縮傾向に変化するように、かつ、情報レベルb4が浅くなる方向に変化するように設定される(例えば、b2←(b2−20)、かつ、b4←(b4−10))。さらに、単発話継続時間xが所定継続時間よりも短く、操作者が迅速な対話を望んでいると判定されると、例えば図5に示すように、応答時間c2が短縮傾向に変化するように、かつ、ターン数c5が減少傾向(つまり、確認用の対話データの出力回数が減少傾向)に変化するように設定される(例えば、c2←(c2−20)、かつ、c5←(c5−20))。
そして、設定された各対話制御状態量b2,b4,c2,c5を行列要素とする列ベクトルf(x),…,f(x)が設定され、これらの列ベクトルf(x),…,f(x)によって構成される行列において、各対話制御状態量a1〜k1,…,a10〜k10毎に行列要素が統合されて対話制御状態量P1,…,P10が設定され、これらの対話制御状態量P1,…,P10により応答関数F(P)が設定される。
そして、設定された応答関数F(P)に応じた対話データ、例えば応答時間P2が短く、かつ、情報レベルP4が浅く、かつ、ターン数P5が少なくなるような対話データが対話データ記憶部27から検索され、例えば、
(A4)「成田空港まで、最短ルートでご案内します」
が出力装置12から出力される。
また、例えば車両始動時に運転者が車両に乗車した後の最初の音声入力が、
(A1)「ルート案内して」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報として、例えばナビゲーション装置の経路設定に係る制御動作が検索される。
そして、この音声入力に対する応答の対話データが対話データ記憶部27から検索され、例えば、
(A2)「はい、目的地はどちらでしょうか?」
が出力装置12から出力される。
そして、出力装置12から出力された対話データの問い合わせに対する応答として、音声入力が、例えば、
(B3)「えーっと、成田空港まで生きたい」
であった場合には、この応答に対して各対話状態量x,…,xが検知される。
ここで、応答時間xが所定上限時間TH(例えば、1.3秒等)よりも長いと判定されると、例えば図6に示すように、応答時間b2が増長傾向に変化するように、かつ、情報レベルb4が浅くなる方向に変化するように設定される(例えば、b2←(b2+20)、かつ、b4←(b4−10))。さらに、単発話継続時間xが所定継続時間よりも長いと判定されると、例えば図6に示すように、応答時間c2が増長傾向に変化するように、かつ、ターン数c5が増加傾向(つまり、確認用の対話データの出力回数が増加傾向)に変化するように設定される(例えば、c2←(c2+10)、かつ、c5←(c5+30))。
そして、設定された各対話制御状態量b2,b4,c2,c5を行列要素とする列ベクトルf(x),…,f(x)が設定され、これらの列ベクトルf(x),…,f(x)によって構成される行列において、各対話制御状態量a1〜k1,…,a10〜k10毎に行列要素が統合されて対話制御状態量P1,…,P10が設定され、これらの対話制御状態量P1,…,P10により応答関数F(P)が設定される。
そして、設定された応答関数F(P)に応じた対話データ、例えば応答時間P2が長く、かつ、情報レベルP4が浅く、かつ、ターン数P5が多くなるような対話データが対話データ記憶部27から検索され、例えば、
(B4)「目的地は成田空港で宜しいですか?」
が出力装置12から出力される。
上述したように、本実施の形態による音声認識型機器制御装置10によれば、複数の各対話状態量x,…,x毎に対して少なくとも1つ以上の各対話制御状態量a1〜a10,…,k1〜k10を対応させると共に、検出された複数の対話状態量x,…,xに亘って各対話制御状態量a1〜k1,…,a10〜k10を統合して対話制御状態量P1,…,P10を設定することにより、各対話制御状態量P1,…,P10に対して複数の対話状態量x,…,xを容易に反映させることができる。しかも、各対話制御状態量P1,…,P10を設定する際に、新たな対話状態量の追加あるいは既存の対話状態量の削除を行う場合であっても、各対話制御状態量P1,…,P10を設定する処理の処理内容(つまり、複数の対話状態量x,…,xに亘って各対話制御状態量a1〜k1,…,a10〜k10を統合して各対話制御状態量P1,…,P10を設定する処理内容)を大幅に変更する必要が無く、処理内容の汎用性を向上させることができ、適切な機器制御を行うことができる。
なお、上述した実施の形態では、制御状態量記憶部25に格納された各対話制御状態量a1〜a10,…,k1〜k10の制御量の値を、各対話状態量x,…,xの値に応じて増減させるとしたが、これに限定されず、例えば、各対話制御状態量a1〜a10,…,k1〜k10の制御量の値を、予め各対話状態量x,…,xの値を変数とする適宜の関数により記述したり、各対話制御状態量a1〜a10,…,k1〜k10の制御量の値と各対話状態量x,…,xの値との対応関係を示すマップ等を作成し、制御状態量記憶部25に格納してもよい。
本発明の実施形態に係る音声認識型機器制御装置の構成図である。 各対話状態量x,…,x(例えば、発話音量x)と、各対話制御状態量P1,…,P10(例えば、発話速度P1および応答時間P2および要求情報量P3)との対応関係の一例を示す図である。 本発明の実施形態に係る音声認識型機器制御装置の動作を示すフローチャートである。 図3に示す応答関数設定処理を示すフローチャートである。 各対話状態量x,…,x(例えば、応答時間xおよび単発話継続時間x)と、各対話制御状態量P1,…,P10(例えば、応答時間P2および情報レベルP4およびターン数P5)との対応関係の一例を示す図である。 各対話状態量x,…,x(例えば、応答時間xおよび単発話継続時間x)と、各対話制御状態量P1,…,P10(例えば、応答時間P2および情報レベルP4およびターン数P5)との対応関係の一例を示す図である。
符号の説明
10 音声認識型機器制御装置
11 音声入力装置(音声入力手段)
14 制御機器(機器)
15 車両状態量センサ(環境状態検出手段)
16 話者状態量センサ(環境状態検出手段)
21 音声認識部(音声認識手段、環境状態検出手段)
24 応答関数設定部(第1制御パラメータ算出手段、第2制御パラメータ設定手段)
28 機器制御部(機器制御手段)

Claims (3)

  1. 話者の音声を入力する音声入力手段と、
    前記音声入力手段により入力された音声を認識する音声認識手段と、
    前記音声認識手段による認識結果に基づき前記話者に対する応答を制御する応答制御手段と、
    話者の状態量を検知する話者状態量検知手段と、
    車両の状態を検知する車両状態検知手段と、
    前記音声認識手段による認識結果と、前記話者状態量検知手段による検知結果と、前記車両状態検知手段による検知結果とに基づき、前記話者と前記応答制御手段との間の対話状態に係る複数の対話状態量を検知する対話状態量検知手段と、
    前記対話状態量検知手段により検知された前記複数の対話状態量に基づいて、前記対話状態を制御するための複数種類及び複数個の第1制御パラメータ設定する第1制御パラメータ設定手段と、
    前記第1制御パラメータ設定手段により設定された前記複数種類及び複数個の第1制御パラメータに基づいて、同一の種類の複数個の前記第1制御パラメータを統合して、複数種類の第2制御パラメータ設定する第2制御パラメータ設定手段とを備え、
    前記応答制御手段は、前記音声認識手段による認識結果および前記第2制御パラメータ設定手段により設定された前記複数種類の第2制御パラメータに基づき前記応答を制御することを特徴とする音声認識型機器制御装置。
  2. 前記第2制御パラメータ設定手段は、前記複数個の数を自然数nとし、前記複数種類の数を自然数mとし、前記複数種類及び複数個の第1制御パラメータを行列要素とするm行n列の行列を有する応答関数により前記第2制御パラメータを設定することを特徴とする請求項1に記載の音声認識型機器制御装置。
  3. 請求項1または請求項2に記載の音声認識型機器制御装置を搭載したことを特徴とする車両。
JP2005016959A 2005-01-25 2005-01-25 音声認識型機器制御装置および車両 Expired - Fee Related JP4722499B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005016959A JP4722499B2 (ja) 2005-01-25 2005-01-25 音声認識型機器制御装置および車両

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005016959A JP4722499B2 (ja) 2005-01-25 2005-01-25 音声認識型機器制御装置および車両

Publications (2)

Publication Number Publication Date
JP2006208460A JP2006208460A (ja) 2006-08-10
JP4722499B2 true JP4722499B2 (ja) 2011-07-13

Family

ID=36965427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005016959A Expired - Fee Related JP4722499B2 (ja) 2005-01-25 2005-01-25 音声認識型機器制御装置および車両

Country Status (1)

Country Link
JP (1) JP4722499B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10088853B2 (en) 2012-05-02 2018-10-02 Honeywell International Inc. Devices and methods for interacting with an HVAC controller
US10145579B2 (en) 2013-05-01 2018-12-04 Honeywell International Inc. Devices and methods for interacting with a control system that is connected to a network
US10030878B2 (en) 2013-08-21 2018-07-24 Honeywell International Inc. User interaction with building controller device using a remote server and a duplex connection
US20150053779A1 (en) 2013-08-21 2015-02-26 Honeywell International Inc. Devices and methods for interacting with an hvac controller
US10514677B2 (en) 2014-04-11 2019-12-24 Honeywell International Inc. Frameworks and methodologies configured to assist configuring devices supported by a building management system
JP2015215433A (ja) * 2014-05-09 2015-12-03 株式会社ナビタイムジャパン 情報提供システム、端末装置、情報提供サーバ、情報提供方法、および、プログラム
JP2019060941A (ja) * 2017-09-25 2019-04-18 ヤマハ株式会社 音声処理方法
US10524046B2 (en) 2017-12-06 2019-12-31 Ademco Inc. Systems and methods for automatic speech recognition
US20190390866A1 (en) 2018-06-22 2019-12-26 Honeywell International Inc. Building management system with natural language interface

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219582A (ja) * 1994-01-28 1995-08-18 Fujitsu Ten Ltd 車載用音声認識装置
JPH10301595A (ja) * 1997-04-24 1998-11-13 Nec Robotics Eng Ltd 音声認識応答装置
JP2000075894A (ja) * 1998-09-01 2000-03-14 Ntt Data Corp 音声認識方法及び装置、音声対話システム、記録媒体
JP2000194386A (ja) * 1998-12-24 2000-07-14 Omron Corp 音声認識応答装置及び方法
JP2003108191A (ja) * 2001-10-01 2003-04-11 Toyota Central Res & Dev Lab Inc 音声対話装置
JP2004126413A (ja) * 2002-10-07 2004-04-22 Mitsubishi Electric Corp 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
JP2004333543A (ja) * 2003-04-30 2004-11-25 Matsushita Electric Ind Co Ltd 音声対話システム及び音声対話方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219582A (ja) * 1994-01-28 1995-08-18 Fujitsu Ten Ltd 車載用音声認識装置
JPH10301595A (ja) * 1997-04-24 1998-11-13 Nec Robotics Eng Ltd 音声認識応答装置
JP2000075894A (ja) * 1998-09-01 2000-03-14 Ntt Data Corp 音声認識方法及び装置、音声対話システム、記録媒体
JP2000194386A (ja) * 1998-12-24 2000-07-14 Omron Corp 音声認識応答装置及び方法
JP2003108191A (ja) * 2001-10-01 2003-04-11 Toyota Central Res & Dev Lab Inc 音声対話装置
JP2004126413A (ja) * 2002-10-07 2004-04-22 Mitsubishi Electric Corp 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
JP2004333543A (ja) * 2003-04-30 2004-11-25 Matsushita Electric Ind Co Ltd 音声対話システム及び音声対話方法

Also Published As

Publication number Publication date
JP2006208460A (ja) 2006-08-10

Similar Documents

Publication Publication Date Title
JP4722499B2 (ja) 音声認識型機器制御装置および車両
CN106796786B (zh) 语音识别系统
JP4973722B2 (ja) 音声認識装置、音声認識方法、及びナビゲーション装置
US9753459B2 (en) Method for operating a motor vehicle
JP2008058409A (ja) 音声認識方法及び音声認識装置
JP4894300B2 (ja) 車載装置調整装置
JP7235441B2 (ja) 音声認識装置及び音声認識方法
JP5677650B2 (ja) 音声認識装置
JP2016007989A (ja) 車両制御装置及び車両制御方法
JP2009015148A (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP4400951B2 (ja) 車載用音声認識装置、及び車載用音声認識制御方法
JP4141895B2 (ja) 車両用走行制御装置
JP2016215793A (ja) 自動運転制御装置
JP6385624B2 (ja) 車載情報処理装置、車載装置および車載情報処理方法
US11164578B2 (en) Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program
EP3842327A1 (en) Information delivery device for open vehicle
WO2006025106A1 (ja) 音声認識システム、音声認識方法およびそのプログラム
JP4663342B2 (ja) 音声認識型機器制御装置
JP2009098217A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識方法、音声認識プログラム、および記録媒体
JP2004301875A (ja) 音声認識装置
JP4520555B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JP7172120B2 (ja) 音声認識装置及び音声認識方法
JP2020106997A (ja) 車載装置、通信システム
JP4652504B2 (ja) 音声認識装置および音声認識ナビゲーション装置
CN111798842A (zh) 对话系统和对话处理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110406

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140415

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees