JP4722499B2 - 音声認識型機器制御装置および車両 - Google Patents
音声認識型機器制御装置および車両 Download PDFInfo
- Publication number
- JP4722499B2 JP4722499B2 JP2005016959A JP2005016959A JP4722499B2 JP 4722499 B2 JP4722499 B2 JP 4722499B2 JP 2005016959 A JP2005016959 A JP 2005016959A JP 2005016959 A JP2005016959 A JP 2005016959A JP 4722499 B2 JP4722499 B2 JP 4722499B2
- Authority
- JP
- Japan
- Prior art keywords
- control
- state
- dialogue
- state quantity
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
しかも、作業負荷の大小は複数の状態量の検出結果に応じて設定されることから、音声対話の処理内容を制御する際に、作業負荷の大小に応じて単一の制御動作のみ(例えば、応答時間のみの変更や、音量のみの変更や、情報量のみの変更等)を適切に実行することは困難である。
さらに、複数の状態量の検出結果に応じて作業負荷の大小を検知する処理に対し、新たな状態量の検出結果を追加する場合、あるいは、既に利用されている状態量の検出結果を削除する場合には、作業負荷の大小を検知するための処理内容を大幅に変更する必要があり、煩雑な手間がかかるという問題が生じる。
本発明は上記事情に鑑みてなされたもので、音声対話および音声対話に応じた機器制御を適切に実行することが可能な音声認識型機器制御装置および車両を提供することを目的とする。
上記構成の車両によれば、車両および車両の乗員の環境状態が多様かつ頻繁に変動する場合であっても、話者に対する応答を適切に制御することができる。
また、請求項3に記載の本発明の車両によれば、車両および車両の乗員の環境状態が多様かつ頻繁に変動する場合であっても、話者に対する応答を適切に制御することができる。
本実施の形態による音声認識型機器制御装置10は、例えば図1に示すように、車両に搭載され、音声入力装置11と、出力装置12と、電子制御ユニット(ECU)13と、制御機器14と、車両状態量センサ15と、話者状態量センサ16とを備えて構成され、例えばマイク等を具備する音声入力装置11に操作者から入力される音声入力に応じて、さらに、車両状態量センサ15および話者状態量センサ16から出力される各検出信号に基づき、例えばスピーカやディスプレイ等の出力装置12から適宜の応答を出力すると共に、例えばナビゲーション装置、空調装置、音響装置、放送受像装置、通信装置等の車両に搭載された各種の制御機器14の動作を制御する。
ここで、車速センサは車両の速度(車速)を検出し、ジャイロセンサは水平面内での自車両の向きや鉛直方向に対する傾斜角度(例えば、車両の前後方向軸の鉛直方向に対する傾斜角度や車両重心の上下方向軸回りの回転角であるヨー角等)および傾斜角度の変化量(例えば、ヨーレート等)を検出する。
また、ブレーキスイッチは運転者によるブレーキ操作の有無に係るオン/オフ信号を出力し、ワイパースイッチは降雨や降雪等の天候状態に応じたワイパー作動の有無に係るオン/オフ信号を出力する。
例えば皮膚抵抗センサは、ステアリングホイールの表面上に設けられた電極対間の抵抗値を検出することで電極対間に接触する運転者の掌表面の抵抗値に応じた運転者の発汗量を検知する。
また、例えば画像認識装置は、車室内のインストルメントパネルやダッシュボード等に設けられて車室内の乗員を可視光領域や赤外線領域にて撮像可能なCCDカメラやCMOSカメラ等のカメラを備え、カメラにより撮影して得た撮像画像に対して、話者の顔や上半身等を検知対象物とした特徴量算出および形状判別等の認識処理を行い、話者の表情や動作を検知する。
解析部22は、音声認識部21にて生成された認識言語を解析し、認識言語の意味内容を把握すると共に、この解析結果を対話状態検知部23へ出力する。例えば、解析部22は、制御機器14の制御動作に係る動作情報を認識言語から抽出し、対話状態検知部23へ出力する。
例えば下記表1に示すように、対話状態検知部23は、複数(例えば、11個)の対話状態量として、操作者の音声入力に対する発話音量の変動量xa(以下、単に、発話音量xaと呼ぶ)と、応答時間xbと、単発話継続時間xcと、音高または音調の変動量xd(以下、単に、音高および音調xdと呼ぶ)と、雑音レベルxeと、音声認識スコアxfと、操作者の動作xgと、操作者の表情xhと、車両の走行状態xiと、操作者の発汗状態xjと、対話成立度xkとを設定している。
例えば上記表1に示すように、対話状態検知部23により検知される各対話状態量xa,…,xkに対応して、予め、所定の制御量を有する各対話制御状態量a1〜k1,…,a10〜k10が設定され、制御状態量記憶部25に格納されている。
応答関数設定部24は、先ず、検知された各対話状態量xa,…,xkの値に応じて、制御状態量記憶部25から検索して得た各対話制御状態量a1〜k1,…,a10〜k10の制御量の値を変更する。
また、応答時間xbに対しては、応答時間b2と、対話データに含まれる情報の詳細度である情報レベルb4とが対応するように設定されている。そして、応答時間xbが短くなることに伴い、操作者が迅速な対話を望んでいると判断され、応答時間b2が短縮傾向に変化するように、かつ、情報レベルb4が浅くなる方向に変化するように設定される。
また、音高および音調xdに対しては、応答時間d2と、要求情報量d3とが対応するように設定されている。そして、音高および音調xdが大きくなることに伴い(つまり、音高または音調の変動量が大きくなることに伴い)、操作者の余裕度合が低くなると判断され、応答時間d2が増長傾向に変化するように、かつ、要求情報量d3が減少傾向に変化するように設定される。
また、音声認識スコアxfに対しては、応答時間f2と、情報レベルf4と、対話データ音量f8とが対応するように設定されている。そして、音声認識スコアxfが低下することに伴い、出力装置12から出力される対話データに対する応答の曖昧さが増大すると判断され、応答時間f2が増長傾向に変化するように、かつ、情報レベルf4が浅くなる方向に変化するように、かつ、対話データ音量f8が増大傾向に変化するように設定される。
また、車両の走行状態xiに対しては、ターン数i5と、一連の対話が終了するまでに要する時間である対話継続時間i6と、対話データでの表現の丁寧さi7とが対応するように設定されている。そして、走行状態xiにおいて運転操作の負荷の増大や余裕度合の低下を示す状態量が増大することに伴い、ターン数i5が増加傾向(つまり、確認用の対話データの出力数が増加傾向)に変化するように、かつ、対話継続時間i6が短縮傾向に変化するように、かつ、表現の丁寧さi7が低下傾向(つまり、表現が簡潔となる方向)に変化するように設定される。
また、対話成立度xkに対しては、要求情報量k3と、情報レベルk4と、警報音の有無k9と、音調k10とが対応するように設定されている。そして、対話成立度xkが低下することに伴い、要求情報量k3が減少傾向に変化するように、かつ、情報レベルk4が浅くなる方向に変化するように、かつ、警報音の有無k9が有りの状態(例えば、対話データの出力以前のタイミングで警報音が出力される状態)に変化するように、かつ、音調k10が、例えば対話データの所定箇所を強調するようにして、強調傾向に変化するように設定される。
そして、機器制御部28は、解析部22での解析結果、例えば認識言語から抽出された制御機器14の制御動作に係る動作情報に応じて制御機器14を制御する。
先ず、例えば図3に示すステップS01においては、音声入力装置11を介して操作者から入力された音声入力を取得する。
次に、ステップS02においては、取得した音声入力に対して音声認識処理を実行し、音声入力に対応する文字データである認識言語を生成する。
次に、ステップS03においては、生成された認識言語を解析し、認識言語の意味内容を把握するために必要となる情報、例えば制御機器14の制御動作に係る動作情報を抽出する。
次に、ステップS04においては、複数の対話状態量xa,…,xkの各検知結果を取得する。
次に、ステップS05においては、後述する応答関数設定処理を実行する。
次に、ステップS06においては、設定された応答関数F(P)を参照しつつ、認識言語の解析結果に応じた対話データを検索する。
次に、ステップS07においては、設定された応答関数F(P)を参照しつつ、検索して得た対話データを出力装置12から出力して、一連の処理を終了する。
先ず、図4に示すステップS11においては、検知した応答時間xbが所定上限時間TH(例えば、1.3秒等)よりも長いか否かを判定する。
この判定結果が「NO」の場合には、後述するステップS13に進む。
一方、この判定結果が「YES」の場合には、ステップS12に進む。
そして、ステップS12においては、出力された対話データに対する操作者の理解度の低下や運転操作の負荷の増大等が生じていると判断し、応答時間b2が増長傾向に変化するようにして制御量を所定量(例えば、−100≦制御量≦+100に対して、所定量=+20等)だけ増大させ、かつ、情報レベルb4が浅くなる方向に変化するようにして制御量を所定量(例えば、−100≦制御量≦+100に対して、所定量=−20等)だけ減少させ、一連の処理を終了する。
この判定結果が「NO」の場合、つまり応答時間xbが所定下限時間TL以上かつ所定上限時間TH以下である場合には、ステップS14に進み、このステップS14においては、応答時間b2および情報レベルb4の各制御量が適切であると判断して、各制御量を変更せず、一連の処理を終了する。
一方、この判定結果が「YES」の場合には、ステップS15に進む。
そして、ステップS15においては、操作者が迅速な対話を望んでいると判断し、応答時間b2が短縮傾向に変化するようにして制御量を所定量(例えば、−100≦制御量≦+100に対して、所定量=−20等)だけ減少させ、かつ、応答時間b2の短縮に伴い情報レベルb4が浅くなる方向に変化するようにして制御量を所定量(例えば、−100≦制御量≦+100に対して、所定量=−10等)だけ減少させ、一連の処理を終了する。
(A1)「ルート案内して」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報として、例えばナビゲーション装置の経路設定に係る制御動作が検索される。
そして、この音声入力に対する応答の対話データが対話データ記憶部27から検索され、例えば、
(A2)「はい、目的地はどちらでしょうか?」
が出力装置12から出力される。
そして、出力装置12から出力された対話データの問い合わせに対する応答として、音声入力が、例えば、
(A3)「成田空港」
であった場合には、この応答に対して各対話状態量xa,…,xkが検知される。
そして、設定された各対話制御状態量b2,b4,c2,c5を行列要素とする列ベクトルfa(xa),…,fk(xk)が設定され、これらの列ベクトルfa(xa),…,fk(xk)によって構成される行列において、各対話制御状態量a1〜k1,…,a10〜k10毎に行列要素が統合されて対話制御状態量P1,…,P10が設定され、これらの対話制御状態量P1,…,P10により応答関数F(P)が設定される。
(A4)「成田空港まで、最短ルートでご案内します」
が出力装置12から出力される。
(A1)「ルート案内して」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報として、例えばナビゲーション装置の経路設定に係る制御動作が検索される。
そして、この音声入力に対する応答の対話データが対話データ記憶部27から検索され、例えば、
(A2)「はい、目的地はどちらでしょうか?」
が出力装置12から出力される。
そして、出力装置12から出力された対話データの問い合わせに対する応答として、音声入力が、例えば、
(B3)「えーっと、成田空港まで生きたい」
であった場合には、この応答に対して各対話状態量xa,…,xkが検知される。
そして、設定された各対話制御状態量b2,b4,c2,c5を行列要素とする列ベクトルfa(xa),…,fk(xk)が設定され、これらの列ベクトルfa(xa),…,fk(xk)によって構成される行列において、各対話制御状態量a1〜k1,…,a10〜k10毎に行列要素が統合されて対話制御状態量P1,…,P10が設定され、これらの対話制御状態量P1,…,P10により応答関数F(P)が設定される。
(B4)「目的地は成田空港で宜しいですか?」
が出力装置12から出力される。
11 音声入力装置(音声入力手段)
14 制御機器(機器)
15 車両状態量センサ(環境状態検出手段)
16 話者状態量センサ(環境状態検出手段)
21 音声認識部(音声認識手段、環境状態検出手段)
24 応答関数設定部(第1制御パラメータ算出手段、第2制御パラメータ設定手段)
28 機器制御部(機器制御手段)
Claims (3)
- 話者の音声を入力する音声入力手段と、
前記音声入力手段により入力された音声を認識する音声認識手段と、
前記音声認識手段による認識結果に基づき前記話者に対する応答を制御する応答制御手段と、
話者の状態量を検知する話者状態量検知手段と、
車両の状態を検知する車両状態検知手段と、
前記音声認識手段による認識結果と、前記話者状態量検知手段による検知結果と、前記車両状態検知手段による検知結果とに基づき、前記話者と前記応答制御手段との間の対話状態に係る複数の対話状態量を検知する対話状態量検知手段と、
前記対話状態量検知手段により検知された前記複数の対話状態量に基づいて、前記対話状態を制御するための複数種類及び複数個の第1制御パラメータを設定する第1制御パラメータ設定手段と、
前記第1制御パラメータ設定手段により設定された前記複数種類及び複数個の第1制御パラメータに基づいて、同一の種類の複数個の前記第1制御パラメータを統合して、複数種類の第2制御パラメータを設定する第2制御パラメータ設定手段とを備え、
前記応答制御手段は、前記音声認識手段による認識結果および前記第2制御パラメータ設定手段により設定された前記複数種類の第2制御パラメータに基づき前記応答を制御することを特徴とする音声認識型機器制御装置。 - 前記第2制御パラメータ設定手段は、前記複数個の数を自然数nとし、前記複数種類の数を自然数mとし、前記複数種類及び複数個の第1制御パラメータを行列要素とするm行n列の行列を有する応答関数により前記第2制御パラメータを設定することを特徴とする請求項1に記載の音声認識型機器制御装置。
- 請求項1または請求項2に記載の音声認識型機器制御装置を搭載したことを特徴とする車両。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005016959A JP4722499B2 (ja) | 2005-01-25 | 2005-01-25 | 音声認識型機器制御装置および車両 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005016959A JP4722499B2 (ja) | 2005-01-25 | 2005-01-25 | 音声認識型機器制御装置および車両 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006208460A JP2006208460A (ja) | 2006-08-10 |
JP4722499B2 true JP4722499B2 (ja) | 2011-07-13 |
Family
ID=36965427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005016959A Expired - Fee Related JP4722499B2 (ja) | 2005-01-25 | 2005-01-25 | 音声認識型機器制御装置および車両 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4722499B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10088853B2 (en) | 2012-05-02 | 2018-10-02 | Honeywell International Inc. | Devices and methods for interacting with an HVAC controller |
US10145579B2 (en) | 2013-05-01 | 2018-12-04 | Honeywell International Inc. | Devices and methods for interacting with a control system that is connected to a network |
US10030878B2 (en) | 2013-08-21 | 2018-07-24 | Honeywell International Inc. | User interaction with building controller device using a remote server and a duplex connection |
US20150053779A1 (en) | 2013-08-21 | 2015-02-26 | Honeywell International Inc. | Devices and methods for interacting with an hvac controller |
US10514677B2 (en) | 2014-04-11 | 2019-12-24 | Honeywell International Inc. | Frameworks and methodologies configured to assist configuring devices supported by a building management system |
JP2015215433A (ja) * | 2014-05-09 | 2015-12-03 | 株式会社ナビタイムジャパン | 情報提供システム、端末装置、情報提供サーバ、情報提供方法、および、プログラム |
JP2019060941A (ja) * | 2017-09-25 | 2019-04-18 | ヤマハ株式会社 | 音声処理方法 |
US10524046B2 (en) | 2017-12-06 | 2019-12-31 | Ademco Inc. | Systems and methods for automatic speech recognition |
US20190390866A1 (en) | 2018-06-22 | 2019-12-26 | Honeywell International Inc. | Building management system with natural language interface |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07219582A (ja) * | 1994-01-28 | 1995-08-18 | Fujitsu Ten Ltd | 車載用音声認識装置 |
JPH10301595A (ja) * | 1997-04-24 | 1998-11-13 | Nec Robotics Eng Ltd | 音声認識応答装置 |
JP2000075894A (ja) * | 1998-09-01 | 2000-03-14 | Ntt Data Corp | 音声認識方法及び装置、音声対話システム、記録媒体 |
JP2000194386A (ja) * | 1998-12-24 | 2000-07-14 | Omron Corp | 音声認識応答装置及び方法 |
JP2003108191A (ja) * | 2001-10-01 | 2003-04-11 | Toyota Central Res & Dev Lab Inc | 音声対話装置 |
JP2004126413A (ja) * | 2002-10-07 | 2004-04-22 | Mitsubishi Electric Corp | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム |
JP2004333543A (ja) * | 2003-04-30 | 2004-11-25 | Matsushita Electric Ind Co Ltd | 音声対話システム及び音声対話方法 |
-
2005
- 2005-01-25 JP JP2005016959A patent/JP4722499B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07219582A (ja) * | 1994-01-28 | 1995-08-18 | Fujitsu Ten Ltd | 車載用音声認識装置 |
JPH10301595A (ja) * | 1997-04-24 | 1998-11-13 | Nec Robotics Eng Ltd | 音声認識応答装置 |
JP2000075894A (ja) * | 1998-09-01 | 2000-03-14 | Ntt Data Corp | 音声認識方法及び装置、音声対話システム、記録媒体 |
JP2000194386A (ja) * | 1998-12-24 | 2000-07-14 | Omron Corp | 音声認識応答装置及び方法 |
JP2003108191A (ja) * | 2001-10-01 | 2003-04-11 | Toyota Central Res & Dev Lab Inc | 音声対話装置 |
JP2004126413A (ja) * | 2002-10-07 | 2004-04-22 | Mitsubishi Electric Corp | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム |
JP2004333543A (ja) * | 2003-04-30 | 2004-11-25 | Matsushita Electric Ind Co Ltd | 音声対話システム及び音声対話方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2006208460A (ja) | 2006-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4722499B2 (ja) | 音声認識型機器制御装置および車両 | |
CN106796786B (zh) | 语音识别系统 | |
JP4973722B2 (ja) | 音声認識装置、音声認識方法、及びナビゲーション装置 | |
US9753459B2 (en) | Method for operating a motor vehicle | |
JP2008058409A (ja) | 音声認識方法及び音声認識装置 | |
JP4894300B2 (ja) | 車載装置調整装置 | |
JP7235441B2 (ja) | 音声認識装置及び音声認識方法 | |
JP5677650B2 (ja) | 音声認識装置 | |
JP2016007989A (ja) | 車両制御装置及び車両制御方法 | |
JP2009015148A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP4400951B2 (ja) | 車載用音声認識装置、及び車載用音声認識制御方法 | |
JP4141895B2 (ja) | 車両用走行制御装置 | |
JP2016215793A (ja) | 自動運転制御装置 | |
JP6385624B2 (ja) | 車載情報処理装置、車載装置および車載情報処理方法 | |
US11164578B2 (en) | Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program | |
EP3842327A1 (en) | Information delivery device for open vehicle | |
WO2006025106A1 (ja) | 音声認識システム、音声認識方法およびそのプログラム | |
JP4663342B2 (ja) | 音声認識型機器制御装置 | |
JP2009098217A (ja) | 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識方法、音声認識プログラム、および記録媒体 | |
JP2004301875A (ja) | 音声認識装置 | |
JP4520555B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP7172120B2 (ja) | 音声認識装置及び音声認識方法 | |
JP2020106997A (ja) | 車載装置、通信システム | |
JP4652504B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
CN111798842A (zh) | 对话系统和对话处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110329 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110406 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140415 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |