JP3524370B2

JP3524370B2 - 音声起動システム

Info

Publication number: JP3524370B2
Application number: JP03737498A
Authority: JP
Inventors: 昌宏神谷; 和広崎山; 英樹北尾
Original assignee: Denso Ten Ltd
Current assignee: Denso Ten Ltd
Priority date: 1998-02-19
Filing date: 1998-02-19
Publication date: 2004-05-10
Anticipated expiration: 2018-02-19
Also published as: JPH11231896A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声起動システムに
関し、より詳細には、音声認識によって各種機器の操作
制御を行なう、いわゆる音声制御装置の音声起動システ
ムに関する。

【０００２】

【従来の技術】音声認識による機器制御は手を使わず
（ハンズフリー）、また視線移動を必要としない（アイ
ズフリー）ので、別の動作をしながらでも音声によって
機器の操作制御を行なうことができる。例えば、車両運
転中に、前方への視線を移動させたり、ハンドルから手
を離さずとも、機器の操作制御を行なうことができ、車
両運転中の安全性の確保が容易となる。

【０００３】上記のような音声制御装置を使う場合、通
常の制御モード（音声認識による操作制御の可能でない
状態）から音声制御モード（音声認識による操作制御の
可能な状態）へ切り替わるのが普通であり、その切換方
法として、通常では音声キーワードが発声された否かと
いった音声認識方法が採用されている。

【０００４】

【発明が解決しようとする課題】上記したように、音声
制御装置はその利点（ハンズフリー、アイズフリー）か
ら車両機器制御への利用に大変効果がある。しかしなが
ら、車両内では周囲の物音や、話し声等を登録されてい
る音声キーワードと誤認し、必要のないときに音声制御
モードへ切り替わってしまうといった不具合が生じやす
い状況にある。

【０００５】また、車載用ハンズフリー電話機と音声制
御装置とで音声入力手段、すなわちマイク等を共有する
システムを使用する場合、通話中における音声制御モー
ドへの切り替えは困難を極める。それは、通話中の話し
声を登録されている音声キーワードと誤認してしまう可
能性が極めて高いからである。

【０００６】本発明は上記課題に鑑みなされたものであ
って、音声キーワードを用いた音声制御装置の起動制御
であったとしても、誤認を招くおそれの少ない音声起動
システムを提供することを目的としている。

【０００７】

【課題を解決するための手段及びその効果】上記目的を
達成するために本発明に係る音声起動システム（１）
は、入力された音声が登録されている音声キーワードで
あるか否かを判断するキーワード判断手段を備えると共
に、その判断結果に基づいて音声制御装置の起動制御を
行なう音声起動システムにおいて、入力音声と音声キー
ワードとの類似値を計測し、計測された類似値が所定値
以下であれば、前記入力音声が前記音声キーワードであ
ると判断するように、前記キーワード判断手段が構成さ
れ、さらに、音声キーワードとの類似値が所定値以下で
ある入力音声の入力前後の所定時間が無音状態であった
か否かを判断する第１の無音状態判断手段を備えると共
に、前記所定時間が無音状態でなかったならば、前記入
力音声が前記音声キーワードでないと判断するように、
前記キーワード判断手段が構成されていることを特徴と
している。また、本発明に係る音声起動システム（２）
は、入力された音声が登録されている音声キーワードで
あるか否かを判断するキーワード判断手段を備えると共
に、その判断結果に基づいて音声制御装置の起動制御を
行なう音声起動システムにおいて、入力音声と音声キー
ワードとの類似値を計測し、計測された類似値が所定値
以下であれば、前記入力音声が前記音声キーワードであ
ると判断するように、前記キーワード判断手段が構成さ
れ、さらに、入力された音声と通話先からの音声とを比
較し、同一と判断すれば、前記入力音声を前記キーワー
ド判断手段に出力しないようにする比較手段を備えてい
ることを特徴としている。

【０００８】上記音声起動システム（１）又は（２）に
よれば、入力音声と登録されている音声キーワードとの
類似度が低ければ、前記音声制御装置を起動させないの
で、周囲の物音や、話し声等で誤って前記音声制御装置
が起動する可能性、すなわち音声制御モードへ切り替わ
る可能性を低減させることができる。従って、従来では
通話中においては誤認する可能性の高かった、車載用ハ
ンズフリー電話機と音声制御装置とでマイク等を共有さ
せたシステムであっても、上記音声起動システム（１）
又は（２）を採用することによって、その誤認の可能性
を大幅に低減させることができる。さらに、上記音声起
動システム（１）によれば、入力音声と登録されている
音声キーワードとの類似値が所定値以下であっても、前
記入力音声における入力前後の所定時間が無音状態でな
ければ、前記入力音声は通常の会話中における音声等で
あるとみなして、音声制御モードに切り替わらないよう
にすることができる。従って、音声キーワード以外の発
声音で誤って音声制御モードに切り替わることをほとん
どなくすことができる。また、上記音声起動システム
（２）によれば、通話先からの音声によって誤って音声
制御モードに切り替わることをなくすことができる。

【０００９】また、上記音声起動システム（１）又は
（２）において、入力された音声パターンと予め記憶さ
せておいた音素標準パターンとから、パターンマッチン
グ処理によって計測されたパターン間距離に基づいて、
前記類似値を決定するような構成とすることによって、
下記のような効果が得られる。

【００１０】上記構成とすることによって、パターン間
距離に基づいて決定された値を類似値として採用するの
で、システムの信頼性を向上させることができる。

【００１１】また、上記音声起動システム（１）又は
（２）において、入力された音声が音声キーワードであ
ると判断された場合の過去の最大類似値に基づいて、所
定値を設定する第１の設定手段を備えることによって、
下記のような効果が得られる。

【００１２】上記構成とすることによって、過去の判断
実績（過去の最大類似値）に基づいて、所定値を設定す
るので、より一層、誤認の可能性を低減させることがで
きる。例えば、入力音声が音声キーワードであると判断
された場合の類似値（過去の実績）が４０、２０、３
０、５０、２０、１０である場合、過去の実績から入力
音声が音声キーワードであると判断する類似値は５０
（最大類似値）以下で良いことが分かる。このときに設
定されている所定値が２００であれば５０〜２００は不
要であり、むしろ誤認の可能性を高めてしまう。そこ
で、誤認の可能性を低減させるためには、所定値を最大
類似値に基づいて設定し直すのが効果的である。例え
ば、所定値を７０｛＝５０（最大類似値）＋２０
（幅）｝に設定する。これにより、特定の使用者に対し
て、通常の会話音や周囲の物音等で誤って音声制御モー
ドに切り替わることをほとんどなくすことができる。

【００１３】また、上記音声起動システム（１）又は
（２）において、前記第１の設定手段を備えるだけでな
く、さらに、前記第１の設定手段により設定された所定
値ではなく、予め設定しておいた所定値に設定し直す第
２の設定手段と、該第２の設定手段を稼働させるための
第１の入力手段とを備えることによって、下記のような
効果が得られる。

【００１４】特定の使用者にとって最適となるように設
定した所定値では、他の使用者にとって不具合が生じる
といった問題が考えられるが、上記構成とすることによ
って、前記問題は解決される。

【００１５】また、上記音声起動システム（１）又は
（２）において、所定値をより大きな値に設定し直す第
３の設定手段と、該第３の設定手段を稼働させるための
第２の入力手段とを備えることによって、下記のような
効果が得られる。

【００１６】上記構成とすることによって、使用者が前
記第２の入力手段を用いて、所定値をより大きな値に設
定することができるので、音声キーワードを何度発声し
ても音声制御モードに切り替わらないといった場合に、
大変有効である。

【００１７】

【００１８】

【００１９】また、上記音声起動システム（１）又は
（２）において、前記音声制御装置の起動後から引き続
いて所定時間、無音状態であったか否かを判断する第２
の無音状態判断手段を備えると共に、前記所定時間の間
が連続的に無音状態であれば、前記音声制御装置の起動
を解除するように制御する解除制御手段を備えることに
よって、下記のような効果が得られる。

【００２０】上記構成とすることによって、前記音声制
御装置が起動したとしても、すなわち音声制御モードに
切り替わったとしても、切り替わった（起動）後から前
記所定時間の間が連続的に無音状態であれば、前記起動
は誤認によるものとみなして、前記音声制御装置の起動
を解除することができる。従って、音声キーワード以外
の発声音で誤って音声制御モードに切り替わったとして
も、自動的に通常の制御モードに戻すことができる。

【００２１】

【００２２】

【００２３】

【発明の実施の形態】以下、本発明に係る音声起動シス
テムの実施の形態を図面に基づいて説明する。図１は、
実施の形態に係る音声起動システム（１）の要部を概略
的に示したブロック図である。図中１はアンテナを示
し、アンテナ１は電話本体部２に接続されている。ま
た、スピーカ４、及び車載用ハンドフリー電話機と音声
制御装置９とで共有されるマイク５はアンプ３を介し
て、電話本体部２と音声認識手段６とにそれぞれ接続さ
れている。

【００２４】キーワード判断手段７を含んで構成された
音声認識手段６は、音声制御装置９の起動制御を行なう
起動制御手段８に接続され、起動制御手段８は音声制御
装置９に接続されている。

【００２５】実施の形態に係る音声起動システム（１）
におけるキーワード判断手段７の動作を、図２に示した
フローチャートに基づいて説明する。まず、ステップ１
において、マイク５より入力された音声を取り込み、次
にステップ２において、入力音声と登録されている音声
キーワードとの類似値ｄを計測し、そしてステップ３に
移る。

【００２６】類似値ｄの計測方法としては、音声が入力
されると、入力された音声パターン（以下、入力パター
ンと記す）と予め記憶させておいた音素標準パターンと
のパターン間距離（類似度）をＤＰマッチング法等のパ
ターンマッチングによって計測し、入力パターンが記憶
されている標準パターンのうちのどれに属するかを決定
し、そのときのパターン間距離を類似値ｄとする方法等
がある。また、パターン間距離としてはユークリッド距
離等が挙げられる。

【００２７】ステップ３では、類似値ｄが所定値ｔ以下
であるか否かを判断し、所定値ｔ以下であると判断すれ
ば、ステップ４に移って、音声制御装置９を起動させる
ように起動制御手段８に信号を出力し、一方、所定値ｔ
以下でないと判断すれば、ステップ１に戻る。

【００２８】上記実施の形態に係る音声起動システム
（１）によれば、入力音声と登録されている音声キーワ
ードとの類似度が低ければ、音声制御装置９を起動させ
ないので、周囲の物音や、話し声等で誤って音声制御装
置９が起動する可能性、すなわち音声制御モードへ切り
替わる可能性を低減させることができる。従って、従来
では通話中においては誤認する可能性の高かった、車載
用ハンズフリー電話機と音声制御装置９とでマイク５を
共有させたシステムであっても、その誤認の可能性を大
幅に低減させることができる。

【００２９】図３は、実施の形態に係る音声起動システ
ム（２）の要部を概略的に示したブロック図である。こ
こでは、図１に示した音声起動システムと同様の構成に
ついては、その説明を省略する。

【００３０】キーワード判断手段７には、所定値ｔを設
定し直す第１の設定手段１０、第２の設定手段１１、及
び第３の設定手段１３が接続され、また第２の設定手段
１１、第３の設定手段１３にはそれぞれ第１の入力手段
１２、第２の入力手段１４が接続されている。

【００３１】実施の形態に係る音声起動システム（２）
における第１の設定手段１０の動作を、図４に示したフ
ローチャートに基づいて説明する。まず、ステップ１１
において、初期設定として最大類似値ｄ_MAX を０とし、
カウンタｎを０とする。次にステップ１２において、キ
ーワード判断手段７によって算出された類似値ｄ（図２
のステップ２参照）を取り込み、そしてステップ１３に
進む。

【００３２】ステップ１３では、類似値ｄが最大類似値
ｄ_MAX よりも大であるか否かを判断し、大であると判断
すれば、ステップ１４に移り、最大類似値ｄ_MAX を類似
値ｄとして、ステップ１５に進む。一方、大でないと判
断すれば、ステップ１４を飛ばしてそのままステップ１
５に進む。

【００３３】ステップ１５では、カウンタｎに１を加え
て、ステップ１６に進み、ステップ１６では、カウンタ
ｎが所定回数Ｎ以上であるか否かを判断する。所定回数
Ｎ以上であると判断すれば、ステップ１７に移り、最大
類似値ｄ_MAX に所定幅αを加えたものを値ｔ₁ として、
ステップ１８に進む。一方、所定回数Ｎ未満であると判
断すれば、ステップ１２に戻る。ステップ１８では、キ
ーワード判断手段７に設定されている所定値ｔを値ｔ₁
にして、ステップ１２に戻る。

【００３４】次に、第２の設定手段１１を説明する。第
２の設定手段１１は、第１の設定手段１０により設定さ
れた所定値ｔ₁ を、予め設定しておいた所定値ｔ₀ に設
定し直すものであり、第１の入力手段１２からの信号に
基づいて稼働するように構成されている。

【００３５】続いて、第３の設定手段１３を説明する。
第３の設定手段１３は、所定距離ｔをより大きな値に設
定するものであり、例えば、所定距離ｔ₀ を１．５倍し
たものを所定距離ｔとするものである。また、第２の入
力手段１４からの信号に基づいて稼働するように構成さ
れている。

【００３６】上記実施の形態に係る音声起動システム
（２）によれば、過去の判断実績（過去の最大類似値ｄ
_MAX ）に基づいて、所定値ｔを設定するので、より一
層、誤認の可能性を低減させることができる。例えば、
入力音声が音声キーワードであると判断された場合の類
似値が４０、２０、３０、５０、２０、１０である場
合、過去の実績から入力音声が音声キーワードであると
判断する類似値は５０（最大類似値ｄ_MAX ）以下で良い
ことが分かる。このときに設定されている所定値ｔ₀ が
２００であれば５０〜２００は不要であり、むしろ誤認
の可能性を高めてしまう。そこで、誤認の可能性を低減
させるためには所定値ｔ₀ を最大類似値ｄ_MAX に基づい
て、設定し直すのが効果的である。例えば、所定値ｔを
７０｛＝５０（最大類似値ｄ_MAX ）＋２０（幅α）｝に
設定する。これにより、特定の使用者に対して、通常の
会話音や周囲の物音等で誤って音声制御モードに切り替
わることをほとんどなくすことができる。

【００３７】また、特定の使用者にとって最適となるよ
うに設定した所定値ｔでは、他の使用者にとって不具合
が生じるといった問題があるが、第２の設定手段１１を
稼働させることによって、前記問題は解決される。

【００３８】さらに、使用者が第２の入力手段１４を用
いることによって、所定値ｔを大きく設定することがで
きるので、音声キーワードを何度発声しても、音声制御
装置９が起動しない場合に、すなわち音声制御モードに
切り替わらないといった場合に、大変有効である。

【００３９】また、カウンタｎが所定回数Ｎ以上である
か否かを判断する処理（ステップ１５）を行なっている
のは、所定回数Ｎに満たない過去の実績からでは適切な
所定値ｔを設定することが困難であるからである。

【００４０】図５は、実施の形態に係る音声起動システ
ム（３）の要部を概略的に示したブロック図である。こ
こでは、図１に示した音声起動システムと同様の構成に
ついては、その説明を省略する。

【００４１】第１の無音状態判断手段１５はキーワード
判断手段７に接続され、キーワード判断手段７にて判断
対象となる音声の入力前後における音声情報を取り込ん
で、前記音声の入力前後の所定時間が無音状態であった
か否かを判断し、その判断結果をキーワード判断手段７
に出力するように構成されている。

【００４２】実施の形態に係る音声起動システム（３）
におけるキーワード判断手段７の動作を、図６に示した
フローチャートに基づいて説明する。

【００４３】まず、ステップ２１において、マイク５よ
り入力された音声を取り込み、次にステップ２２におい
て、入力音声と登録されている音声キーワードとの類似
値ｄを算出し、そしてステップ２３に移る。ステップ２
３では、類似値ｄが所定値ｔ以下であるか否かを判断
し、所定値ｔ以下であると判断すれば、ステップ２４に
移り、一方、所定値ｔ以下でないと判断すれば、ステッ
プ２１に戻る。

【００４４】ステップ２４では、第１の無音状態判断手
段１５における判断結果を取り込み、そしてステップ２
５に進み、取り込んだ判断結果が前記入力音声の入力前
後が無音状態であったことを示すものであれば、ステッ
プ２６に移り、音声制御装置９を起動させるように起動
制御手段８に信号を出力し、一方、無音状態を示すもの
でなければ、ステップ２１に戻る。

【００４５】上記実施の形態に係る音声起動システム
（３）によれば、入力音声と登録されている音声キーワ
ードとの類似値ｄが所定値ｔ以下であっても、前記入力
音声における入力前後の所定時間が無音状態でなけれ
ば、前記入力音声は通常の会話中における音声等である
とみなして、音声制御装置９を起動させないように、す
なわち音声制御モードに切り替わらないようにすること
ができる。従って、音声キーワード以外の発声音で誤っ
て音声制御モードに切り替わることをほとんどなくすこ
とができる。

【００４６】図７は、実施の形態に係る音声起動システ
ム（４）の要部を概略的に示したブロック図である。こ
こでは、図１に示した音声起動システムと同様の構成に
ついては、その説明を省略する。図中１６は、第２の無
音状態判断手段を示しており、第２の無音状態判断手段
１６は音声認識手段６、及び起動制御手段８に接続され
ている。

【００４７】実施の形態に係る音声起動システム（４）
における第２の無音状態判断手段１６の動作を、図８に
示したフローチャートに基づいて説明する。まず、ステ
ップ３１において、マイク５より入力された音声のう
ち、音声制御装置９の起動後から所定時間、音声情報を
取り込み、次にステップ３２において、前記所定時間の
間が無音状態であったか否かを判断する。無音状態であ
ったと判断すれば、ステップ３３に移って、音声制御装
置９の起動を解除するように起動制御手段８に信号を出
力し、一方、無音状態ではなかったと判断すれば、前記
動作は終了する。

【００４８】上記実施の形態に係る音声起動システム
（４）によれば、音声制御装置９が起動したとしても、
すなわち音声制御モードに切り替わったとしても、切り
替わった（起動）後から所定時間の間が連続的に無音状
態であれば、前記起動は誤認によるものとみなして、音
声制御装置９の起動を解除することができる。従って、
音声キーワード以外の発声音で誤って音声制御モードに
切り替わったとしても、自動的に通常の制御モードに戻
すことができる。

【００４９】図９は、実施の形態に係る音声起動システ
ム（５）の要部を概略的に示したブロック図である。こ
こでは、図１に示した音声起動システムと同様の構成に
ついては、その説明を省略する。図中１７は、比較手段
を示している。電話本体部２、及びアンプ３は比較手段
１７に接続され、比較手段１７は音声認識手段６に接続
されている。

【００５０】比較手段１７は、通話先からの音声と、マ
イク５より入力された音声との相関係数を算出し、相関
係数が所定値以上であれば、マイク５より入力された音
声がスピーカ４より出力された通話先からの音声とみな
して、入力された音声を音声認識手段６に出力しないよ
うにするように構成されている。また、比較手段１７と
しては、エコーキャンセル装置等が挙げられる。

【００５１】上記実施の形態に係る音声起動システム
（５）によれば、通話先からの音声によって誤って音声
制御モードに切り替わることをなくすことができる。

【図面の簡単な説明】

【図１】本発明の実施の形態に係る音声起動システム
（１）の要部を概略的に示したブロック図である。

【図２】実施の形態に係る音声起動システム（１）にお
けるキーワード判断手段の動作を示したフローチャート
である。

【図３】実施の形態に係る音声起動システム（２）の要
部を概略的に示したブロック図である。

【図４】実施の形態に係る音声起動システム（２）にお
ける第１の設定手段の動作を示したフローチャートであ
る。

【図５】実施の形態に係る音声起動システム（３）の要
部を概略的に示したブロック図である。

【図６】実施の形態に係る音声起動システム（３）にお
けるキーワード判断手段の動作を示したフローチャート
である。

【図７】実施の形態に係る音声起動システム（４）の要
部を概略的に示したブロック図である。

【図８】実施の形態に係る音声起動システム（４）にお
ける第２の無音状態判断手段の動作を示したフローチャ
ートである。

【図９】実施の形態に係る音声起動システム（５）の要
部を概略的に示したブロック図である。

【符号の説明】

１アンテナ２電話本体部３アンプ４スピーカ５マイク６音声認識手段８起動制御手段

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平６−43896（ＪＰ，Ａ) 特開平９−212189（ＪＰ，Ａ) 特開昭63−306499（ＪＰ，Ａ) 特開平８−263093（ＪＰ，Ａ) 特開平３−160499（ＪＰ，Ａ) 特開平１−222299（ＪＰ，Ａ) 特開昭61−94093（ＪＰ，Ａ) 特開平４−152399（ＪＰ，Ａ) 実開平７−36199（ＪＰ，Ｕ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/00 - 15/28 H04M 1/60

Claims

(57)【特許請求の範囲】

【請求項１】入力された音声が登録されている音声キ
ーワードであるか否かを判断するキーワード判断手段を
備えると共に、その判断結果に基づいて音声制御装置の
起動制御を行なう音声起動システムにおいて、入力音声と音声キーワードとの類似値を計測し、計測さ
れた類似値が所定値以下であれば、前記入力音声が前記
音声キーワードであると判断するように、前記キーワー
ド判断手段が構成され、さらに、音声キーワードとの類似値が所定値以下である
入力音声の入力前後の所定時間が無音状態であったか否
かを判断する第１の無音状態判断手段を備えると共に、
前記所定時間が無音状態でなかったならば、前記入力音
声が前記音声キーワードでないと判断するように、前記
キーワード判断手段が構成されていることを特徴とする
音声起動システム。
【請求項２】入力された音声が登録されている音声キ
ーワードであるか否かを判断するキーワード判断手段を
備えると共に、その判断結果に基づいて音声制御装置の
起動制御を行なう音声起動システムにおいて、入力音声と音声キーワードとの類似値を計測し、計測さ
れた類似値が所定値以下であれば、前記入力音声が前記
音声キーワードであると判断するように、前記キーワー
ド判断手段が構成され、さらに、入力された音声と通話先からの音声とを比較
し、同一と判断すれば、前記入力音声を前記キーワード
判断手段に出力しないようにする比較手段を備えている
ことを特徴とする音声起動システム。