JP2006071794A - 車両の音声認識装置 - Google Patents

車両の音声認識装置 Download PDF

Info

Publication number
JP2006071794A
JP2006071794A JP2004252788A JP2004252788A JP2006071794A JP 2006071794 A JP2006071794 A JP 2006071794A JP 2004252788 A JP2004252788 A JP 2004252788A JP 2004252788 A JP2004252788 A JP 2004252788A JP 2006071794 A JP2006071794 A JP 2006071794A
Authority
JP
Japan
Prior art keywords
vehicle
voice
input
voice input
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004252788A
Other languages
English (en)
Inventor
Shinichi Satomi
真一 里見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Subaru Corp
Original Assignee
Fuji Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Heavy Industries Ltd filed Critical Fuji Heavy Industries Ltd
Priority to JP2004252788A priority Critical patent/JP2006071794A/ja
Publication of JP2006071794A publication Critical patent/JP2006071794A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】ドライバの様々な状況を考慮して音声区間を正確に検出し、ドライバの音声を精度良く認識する。
【解決手段】音声認識装置1は、マイク3から音声が入力されると、音声入力の開始を発話開始条件と比較して検出する一方、音声入力レベルが予め設定しておいたレベル以下となる状態が終話検出時間連続した場合に音声入力の終了を検出して、入力された音声を認識処理する。終話検出時間は、車内CAN通信網2から入力される車両情報やドライバによる操作情報(住所の音声入力、カーブ走行中、ターンシグナルスイッチON、シフトポジションR、加減速時)の場合には延長して設定される。
【選択図】図2

Description

本発明は、車室内で発せられた音声を正確に認識する車両の音声認識装置に関する。
近年、車両においては、ドライバの利便性を図るため、煩わしいスイッチ入力等を省き、ドライバの発する音声を感知して、該当する車載装置の作動が行える様々なシステムが開発されている。
例えば、特開2003−255972号公報では、入力した音声信号のパワーが所定の閾値以上の区間を音声区間候補として検出し、その音声区間候補間のポーズ区間が所定の閾値、例えば350msec未満ならば、その二つの音声区間候補を一つの音声区間として検出し、検出した音声区間の音声信号を音響分析して認識する技術が開示されている。
特開2003−255972号公報
しかしながら、上述の特許文献1で開示される音声認識装置では、ポーズ区間が所定の閾値未満の際に二つの音声区間候補を一つの音声区間として検出するようにしているが、ドライバが発話をするときに発話以外の行為に集中していると、発話と発話の間に間が空くことがあり、音声区間を正確に検出できなくなるという問題がある。
本発明は上記事情に鑑みてなされたもので、ドライバの様々な状況を考慮して音声区間を正確に検出し、ドライバの音声を精度良く認識可能な車両の音声認識装置を提供することを目的とする。
本発明は、音声を入力する音声入力手段と、車両情報を検出する車両情報検出手段と、上記音声入力手段による音声入力の開始を予め設定しておいた発話開始条件と比較して検出する一方、音声入力レベルが予め設定しておいたレベル以下となる状態が予め設定する時間連続した場合に上記音声入力の終了を検出して、入力された音声を認識処理する音声認識手段とを備えた車両の音声認識装置において、上記音声入力の終了を検出する際の上記予め設定する時間は、予め設定する条件が成立する場合に延長して設定することを特徴としている。
本発明による車両の音声認識装置によれば、ドライバの様々な状況を考慮して音声区間を正確に検出し、ドライバの音声を精度良く認識可能となる。
以下、図面に基づいて本発明の実施の形態を説明する。
図1〜図4は本発明の実施の一形態を示し、図1は車両の音声認識装置の概略構成図、図2は音声認識プログラムのフローチャート、図3は音声入力における発話検出と終話検出の説明図、図4は音声入力に対する本実施の形態の適用の一例を示す説明図である。
図1において、符号1は車両の音声認識装置を示し、この音声認識装置1には、車両に構築した車両情報検出手段としての車内CAN通信(Controller Area Network(ISO規格)に準拠した通信)網2と接続されている。この車内CAN通信網2には、車載した様々な制御ユニット(例えば、エンジン制御ユニット、トランスミッション制御ユニット、ブレーキ制御ユニット、ナビゲーション装置等)が連結されており、車両に設けた車速センサ、ハンドル角センサ、シフトポジションセンサ、前後加速度センサ、ターンシグナルスイッチ、アクセルペダルスイッチ、ブレーキペダルスイッチ等のセンサ、スイッチ類の信号や、各制御ユニットで演算されたデータが共有可能となっている。
具体的には、音声認識装置1には、車内CAN通信網2を通じて、ナビゲーション装置に付属された音声入力スイッチのON−OFF、ハンドル角センサからのハンドル角、シフトポジションセンサからのシフトポジション、前後加速度センサからの前後加速度、ターンシグナルスイッチからの左旋回或いは右旋回のON−OFF等の信号が入力される。
また、音声認識装置1には、ドライバからの音声を捉える音声入力手段としてのマイク3が接続されている。
マイク3から音声が入力されると、音声認識装置1は、音声入力の開始を予め設定しておいた発話開始条件と比較して検出する一方、音声入力レベルが予め設定しておいたレベル以下となる状態が予め設定する時間(終話検出時間)連続した場合に音声入力の終了を検出して、入力された音声を予め設定しておいた単語辞書等を用いて認識処理する。
ここで、発話開始条件とは、例えば、図3に示すように、音声入力レベルが予め設定しておいたレベルLsを超え、発話検出時間(t1−t2)を経過した際に、音声入力の開始を検出する。そして、音声入力レベルが予め設定しておいたレベルLe以下となる状態が終話検出時間(t3−t4)連続した場合に音声入力の終了を検出し、t1−t3までの音声を音声区間として認識対象とし、音声認識処理するのである。
この際、上述の終話検出時間(t3−t4)は、後述する音声認識プログラムで示すように、車内CAN通信網2から入力される車両情報やドライバによる操作情報に応じて延長して設定される。このように、音声認識装置1は、音声認識手段としての機能を有して構成されている。
そして、音声認識装置1は、認識した音声に基づき該当する車載機器4に対して信号を出力して作動させる。ここで、車載機器4としては、上述のナビゲーション装置の住所入力や、エアコン(温度の上下調整、ON−OFF)、ヘッドライト(ON−OFF)、ワイパー(ON−OFF)、リアデフォッガ(ON−OFF)等である。
次に、音声認識装置1で実行される音声認識プログラムを、図2のフローチャートで説明する。
まず、ステップ(以下、「S」と略称)101で、音声が入力されて発話開始条件が満足されると、S102に進み、車両状態及び操作状態の検出が行われる。この車両状態及び操作状態とは、具体的には、前述したように、ナビゲーション装置に付属された音声入力スイッチのON−OFF、ハンドル角センサからのハンドル角、シフトポジションセンサからのシフトポジション、前後加速度センサからの前後加速度、ターンシグナルスイッチからの左旋回或いは右旋回のON−OFF等の信号である。
次いで、S103に進み、ナビゲーション装置に付属された音声入力スイッチがONされており、ドライバが住所を音声入力しようとしているか否か判定する。
このS103の判定の結果、音声入力スイッチがONされておらず、音声入力が住所ではないと判定される場合には、S104に進み、ハンドル角センサからの値(絶対値)が設定値以上でカーブ走行中とみなせるか否か判定する。
S104の判定の結果、ハンドル角センサからの値(絶対値)が設定値未満であり、カーブ走行中とはみなされない場合は、S105に進み、ターンシグナルスイッチが左旋回或いは右旋回にONとなっているか否か判定する。
S105の判定の結果、ターンシグナルスイッチが左旋回と右旋回のどちらにもONとなっていない場合は、車線変更や交差点での信号待ち等の操作を行っている途中ではないと判定して、S106に進み、シフトポジションがR(Reverse)に位置しているか否か判定する。
S106の判定の結果、シフトポジションがRではなく、車庫入れや後退操作中ではないと判定される場合には、S107に進み、前後加速度Gxが予め設定しておいた閾値CGx1以上であり加速操作中か否か判定する。
S107の判定の結果、前後加速度Gxが予め設定しておいた閾値CGx1未満であり、加速中ではないと判定される場合には、S108に進み、前後加速度Gxが予め設定しておいた閾値(−CGx2)以下であり減速操作中か否か判定する。
S108の判定の結果、前後加速度Gxが予め設定しておいた閾値(−CGx2)よりも大きく減速中ではないと判定される場合には、S109に進む。
S103〜S108の全ての判定で否とされて進むS109では、通常の終話検出時間(例えば、600msec)を設定し、S110に進み、S109で設定した終話検出時間により、音声入力の終了を検出して、入力された音声を予め設定しておいた単語辞書等を用いて認識処理し、プログラムを抜ける。
一方、S103〜S108の処理の何れか一つにおいて、「YES」となった場合には、S111に進み、終話検出時間の変更、すなわち、終話検出時間を通常の終話検出時間より延長して(例えば、2sec)設定し、S110に進む。そして、S111で設定した延長された終話検出時間により、音声入力の終了を検出して、入力された音声を予め設定しておいた単語辞書等を用いて認識処理し、プログラムを抜ける。
尚、上述のS110の音声認識処理においては、特に、S111で設定した延長された終話検出時間を用いて音声入力の終了を検出した場合には、この延長された終話検出時間の間にノイズが混入してしまうことがある。従って、例えば、「アー」、「ウー」、或いは、「ノ」等の助詞類を、予め設定した語彙のノイズ信号として設定しておき、延長された終話検出時間に、このノイズ信号が入力された場合は、これらノイズ信号を音声認識の対象から除外するようになっている。このようにノイズ信号を初めから除外して音声認識を行うことにより、無駄が無く、より早い音声認識が可能となっている。
次に、音声入力に対する本実施の形態の適用の一例を、図4により説明する。ここでは、例えば、ドライバがナビゲーション装置に付属された音声入力スイッチをONして、「A県」、「B市」、「C町」、「D番」の音声入力を順に行う、住所入力について説明する。
住所の音声入力では、ドライバが思い出しながら入力することが考えられるため、上述のプログラムのS103からS111への処理により、終話検出時間が延長して設定される。
図4では「A県」の音声入力がt11〜t12の間に、「B市」の音声入力がt13〜t14の間に、「C町」の音声入力がt15〜t17の間に、「D番」の音声入力がt18〜t19の間に行われたものとなっている。
ここで、ドライバが住所を思い出しながら音声入力をしたため、「B市」と「C町」の間が通常より長く空き、t14〜t15の無音の間隔が長くなってしまっている。もし、本願発明を適用していない通常の終話検出時間では、t21で終話が検出されてしまうため、「A県」、「B市」で音声入力の終了が検出され、後の「C町」、「D番」と音声区間が分離されてしまう。このため、「C町」、「D番」の音声入力では、音声認識が不可能になってしまい、ドライバに再入力をしてもらう必要が生じてしまう。
しかしながら、本願発明を適用することにより、終話検出時間はt16まで延長して設定されるため、「B市」と「C町」の間が途切れることなく、連続した音声区間として検出することができるようになっている。また、このように終話検出時間を延長して設定すると、図4の破線で示すSnzのように、例えば、「ノ」等の助詞が含まれることがあるが、これは、予め設定した語彙のノイズ信号として除去されて認識処理が行われるため、無駄が無く、より早い音声認識が可能となっている。
このように本実施の形態によれば、音声入力の音声入力レベルが予め設定しておいたレベル以下となる状態が終話検出時間連続した場合に音声入力の終了を検出して、入力された音声を認識処理する音声認識装置1において、住所を入力する場合や音声入力以外の車両操作中であることを検出した場合に、終話検出時間を延長して設定するようにしたので、音声区間を不要に中断することなく検出でき、ドライバの様々な状況を考慮してドライバの音声を精度良く認識することが可能となる。
尚、本実施の形態は、ドライバの様々な操作を上述の検出方法に限定するものではなく、例えば、ドライバの加速操作はアクセルペダルスイッチのON−OFFから、ドライバの減速操作はブレーキペダルスイッチのON−OFFから検出するようにしても良い。同様に、車速とターンシグナルスイッチとを組み合わせて車線変更等の状況を、より細かく確実に検出するようにしても良い。また、カーブ走行については車両に発生する横加速度に基づいて判断する構成としても良い。
車両の音声認識装置の概略構成図 音声認識プログラムのフローチャート 音声入力における発話検出と終話検出の説明図 音声入力に対する本実施の形態の適用の一例を示す説明図
符号の説明
1 音声認識装置(音声認識手段)
2 車内CAN通信網(車両情報検出手段)
3 マイク(音声入力手段)
4 車載機器
代理人 弁理士 伊 藤 進

Claims (9)

  1. 音声を入力する音声入力手段と、
    車両情報を検出する車両情報検出手段と、
    上記音声入力手段による音声入力の開始を予め設定しておいた発話開始条件と比較して検出する一方、音声入力レベルが予め設定しておいたレベル以下となる状態が予め設定する時間連続した場合に上記音声入力の終了を検出して、入力された音声を認識処理する音声認識手段とを備えた車両の音声認識装置において、
    上記音声入力の終了を検出する際の上記予め設定する時間は、予め設定する条件が成立する場合に延長して設定することを特徴とする車両の音声認識装置。
  2. 上記予め設定する条件は、上記音声入力が住所の入力であると判定した場合に、上記予め設定する時間を延長して設定することを特徴とする請求項1記載の車両の音声認識装置。
  3. 上記予め設定する条件は、上記音声入力以外の車両操作中であることを検出した場合に、上記予め設定する時間を延長して設定することを特徴とする請求項1又は請求項2記載の車両の音声認識装置。
  4. 上記車両操作は、ハンドル操作を検出した場合であることを特徴とする請求項3記載の車両の音声認識装置。
  5. 上記車両操作は、ターンシグナルスイッチの操作を検出した場合であることを特徴とする請求項3記載の車両の音声認識装置。
  6. 上記車両操作は、シフトレバーの位置が後退にセットされていることを検出した場合であることを特徴とする請求項3記載の車両の音声認識装置。
  7. 上記車両操作は、車両の加速を検出した場合であることを特徴とする請求項3記載の車両の音声認識装置。
  8. 上記車両操作は、車両の減速を検出した場合であることを特徴とする請求項3記載の車両の音声認識装置。
  9. 予め設定した語彙のノイズ信号を設定し、上記予め設定する時間を延長した場合に上記ノイズ信号が入力した場合は、上記音声認識手段は音声認識の対象から上記ノイズ信号を除外することを特徴とする請求項1乃至請求項8の何れか一つに記載の車両の音声認識装置。
JP2004252788A 2004-08-31 2004-08-31 車両の音声認識装置 Pending JP2006071794A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004252788A JP2006071794A (ja) 2004-08-31 2004-08-31 車両の音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004252788A JP2006071794A (ja) 2004-08-31 2004-08-31 車両の音声認識装置

Publications (1)

Publication Number Publication Date
JP2006071794A true JP2006071794A (ja) 2006-03-16

Family

ID=36152537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004252788A Pending JP2006071794A (ja) 2004-08-31 2004-08-31 車両の音声認識装置

Country Status (1)

Country Link
JP (1) JP2006071794A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019235858A1 (en) * 2018-06-05 2019-12-12 Samsung Electronics Co., Ltd. A voice assistant device and method thereof
US11195535B2 (en) 2018-11-19 2021-12-07 Toyota Jidosha Kabushiki Kaisha Voice recognition device, voice recognition method, and voice recognition program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019235858A1 (en) * 2018-06-05 2019-12-12 Samsung Electronics Co., Ltd. A voice assistant device and method thereof
US11100935B2 (en) 2018-06-05 2021-08-24 Samsung Electronics Co., Ltd. Voice assistant device and method thereof
US11195535B2 (en) 2018-11-19 2021-12-07 Toyota Jidosha Kabushiki Kaisha Voice recognition device, voice recognition method, and voice recognition program

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
WO2017081960A1 (ja) 音声認識制御システム
JP6361565B2 (ja) 車載機器の動作制御装置
US20090222265A1 (en) Voice Recognition Apparatus
JP2006308848A (ja) 車両機器制御装置
US20230373467A1 (en) Setting change assist apparatus
JP2006208460A (ja) 音声認識型機器制御装置および車両
JP3654045B2 (ja) 音声認識装置
JP2008309966A (ja) 音声入力処理装置および音声入力処理方法
JP2000322078A (ja) 車載型音声認識装置
JP4910563B2 (ja) 音声認識装置
JP2006071794A (ja) 車両の音声認識装置
JP2000321080A (ja) 雑音抑圧装置,音声認識装置及び車両用ナビゲーション装置
JP3384165B2 (ja) 音声認識装置
JP2007101892A (ja) 音声認識装置
JP3925056B2 (ja) 車両用音声操作装置
JP2004301875A (ja) 音声認識装置
CN115042780A (zh) 一种横向辅助驾驶系统接管方法及系统
JP4736404B2 (ja) 音声認識装置
JP6332072B2 (ja) 対話装置
JP2011232637A (ja) 車両の制御装置
JP6708531B2 (ja) 音声対話装置、音声対話方法および音声対話プログラム
JP2008026464A (ja) 車両用音声認識装置
JP7187812B2 (ja) 機器の操作支援装置及び操作支援方法
WO2002035518A1 (fr) Appareil de reconnaissance de la parole situe dans un vehicule