JPH05216492A

JPH05216492A - 音声起動制御方法

Info

Publication number: JPH05216492A
Application number: JP4041909A
Authority: JP
Inventors: Nobuo Hagimoto; 信男萩本
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 1992-01-31
Filing date: 1992-01-31
Publication date: 1993-08-27

Abstract

(57)【要約】（修正有）【目的】リジェクト発生時の再発声の回数を削減でき
る音声起動制御方法。【構成】スタートすると、カウンタＣＴはゼロクリア
され、ステップＳ１０１、音声が入力されると、登録さ
れた標準パターンとマッチング処理を行う、ステップＳ
１０２、認識結果が音声起動用キーワード対応コードの
とき、発声期間制限タイマをスタートし、そうでないと
きは、Ｓ１０１に戻る。タイマ値が予定値かどうかのチ
ェックを行う。タイマのタイムアップまでの期間は、キ
ーワード音声の受入れ可能で、音声入力の有無のチェッ
クを行い、入力がないと、タイマチェックを再び行う。
入力があれば、ステップＳ１０５へいく。ステップＳ１
０５で入力音声が音声起動用のキーワードと判定する
と、カウンタＣＴの値はインクリメントされタイマを停
止、初期化し、次の入力のタイマのスタートに備える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は所定の制限時間中に取り
込まれたキーワード音声と所定の基準音声との比較を行
うマッチング処理による音声認識の結果に基づいて所定
の制御対象機器を音声起動するための音声起動制御方法
に係り、特にリジェクト発生時の処理を改善したステッ
プを有する音声起動制御方法に関する。

【０００２】

【従来の技術】従来の音声制御装置の音声起動方法とし
ては、２つのキーワードを用いたものが優れている。図
８はこのような方法を示すフローチャートで、第１のキ
ーワードではＳ４００〜Ｓ４２０のステップが実行さ
れ、第２のキーワードではＳ４３０〜Ｓ４５０のステッ
プが実行される。

【０００３】このような方法の具体例としては、例え
ば、電話機の音声自動ダイヤル装置の音声起動であれ
ば、音声起動用の２つのキーワード「ＴＵＲＮＯＮ」
及び「ＴＥＬＥＰＨＯＮＥ」を別々の単語音声として登
録し、音声起動時には「ＴＵＲＮＯＮＴＥＬＥＰＨＯ
ＮＥ」のように読み手ユーザに発声させるものである。
これにより第１のキーワード「ＴＵＲＮＯＮ」と第２
のキーワード「ＴＥＬＥＰＨＯＮＥ」の両方が認識され
た時に装置が起動される。

【０００４】一方、従来の音声ダイヤル装置には、種々
の音声ダイヤル機能をもつものがある。例えば、動作モード（１）：電話番号と一意に対応する音声キー
ワードを音声認識する方法。動作モード（２）：電話番号の数字を１つずつ音声認識
する方法。など複数の音声認識方法をとるのが普通である。従って
従来の方法によれば、音声起動により音声制御モードと
なった時、上述のように複数の動作モードがあるので、
これらを指定するためのキーワードの音声認識が必要で
ある。例えば、前記動作モード（１）及び（２）の夫々
に音声認識用のキーワード「ＤＩＡＬ」及び「ＥＮＴＥ
Ｒ」が割り当てられているとすると、発声のシーケンス
の例は以下のようになる。

【０００５】（ｉ）「ＴＵＲＮＯＮＴＥＬＥＰＨＯ
ＮＥ」音声起動用ワード(発声２回) （ii）「ＤＩＡＬ」動作モード（１）の選択用キーワー
ド（発声１回）（iii）「ｏｆｆｉｃｅ」電話番号に対応したキーワー
ド（発声１回）上述したように、目的の動作モードに入るまで最低３回
の発声が必要であり、また誤認識があると、発声をやり
直さなければならない。

【０００６】音声制御装置には複数の音声制御モードが
あり、モード指定のための音声認識を行う必要がある。
しかし従来の方法によると、上述したように音声起動と
併用した場合、音声認識が完了して目的の制御を行うま
でに、ユーザが音声キーワードを発声する回数が多くな
るという問題点がある。発声回数が多いと、ユーザへの
負担が増大するほか、それだけ誤認識の機会もふえるた
め不都合である。しかも、音声起動のためのキーワード
の音声認識結果で、いずれか１つのキーワードが不確か
（リジェクト）であると判定された時、音声起動を正し
く行うためには、再度２つのキーワードを発声する必要
があるので、上記の不都合はなおさら解決すべき問題で
あることが理解できる。

【０００７】

【発明が解決しようとする課題】そこで本件出願人は音
声制御装置において、音声キーワードの発声回数を少な
くし、効率的な音声制御機能指定を可能とする音声起動
方法を特願平３−３２９４４１号において提案した。

【０００８】上記出願の方法は何れか１つのキーワード
がリジェクトされた場合は、リジェクトされた音声キー
ワードのみの発声要求を音声メッセージで行い、ユーザ
に最低限必要なキーワードのみを発声させるという方法
で発声回数を減らすものである。なお、この種の技術は
例えば特公昭６１−１７００５号又は特公平２−４５２
００号にも開示されている。

【０００９】しかし、従来の方法や上記出願の音声起動
方法では、リジェクトされた音声キーワードを再発声要
求するために、音声メッセージを出力していた。音声メ
ッセージが終了するまで待ってから発声する必要がある
ので、素早く音声起動をかけるには限界がある。ユーザ
にとってみれば、音声認識の発声になれてくると音声起
動の実行シーケンスは決まりきったものとなるので、少
しでも応答性の良いものが要求される。従って、リジェ
クトされた場合には素早く音声起動を行えるような方式
が必要である。

【００１０】また、音声起動は、しかるべき時にしかる
べき人が、音声キーワードを発声したときのみ成功する
のが望ましい。しかし、第三者が発声しても、認識され
ることは音声認識装置にとって少なくない。従って、い
たずらに第三者が発声した音声でも装置が簡単に音声起
動されてしまう可能性がある。これは、不特定多数の人
にも起動がかけられるということからは、利便性のある
こととも考えられるが、プライベートな使い方を好むユ
ーザには自分の声のみに反応する装置は魅力的なもので
あり、そのような使い方もできることが望ましい。

【００１１】本発明の目的は、音声認識装置を用いた音
声制御装置の音声起動において、リジェクト発生時の再
発声の回数を少なくすることができる方法を提案するこ
とにある。

【００１２】

【課題を解決するための手段】上記目的を達成するた
め、本願の第１の発明は、所定のキーワード音声を取り
込む音声入力ステップと、前記キーワード音声の入力の
待機状態に所定の制限時間を与える時間制限ステップ
と、前記所定の制限時間中に前記取り込まれたキーワー
ド音声を予め定められた基準音声と比較しマッチング処
理に基づいて音声認識を行う音声認識ステップと、前記
音声認識の結果に基づいて所定の制御対象機器を音声起
動する音声起動ステップと、を有する音声起動制御方法
において、連続的に入力された前記キーワード音声の認
識回数を計数する計数ステップと、前記音声認識ステッ
プで第１段階の音声認識を行い、認識されない時には再
度音声認識を行うように制御し、認識された時には前記
時間制限ステップでタイムスタートしてタイムアップ制
御する認識・時間制限ステップと、前記音声認識ステッ
プで前記タイムアップまでに第２段階の音声認識を行
い、認識された時には前記計数ステップで計数すると共
に前記時間制限ステップを初期化するように制御し、認
識されない時には再度音声認識するように制御する計数
制御ステップと、前記第２段階の認識がなされた後、前
記計数ステップでの計数値が予め定められた最大計数値
になったか否かを判定し、最大計数値の時には前記音声
起動ステップで音声起動させる認識回数判定ステップ
と、を有し、予め定められた認識回数だけ迅速かつ連続
的にキーワード音声の認識を行って制御対象機器の起動
を行うことを特徴とする。

【００１３】また、本願の第２の発明は、前記第１の発
明の音声起動制御方法において、前記音声認識ステップ
で第１段階の音声認識がなされた時には、次のキーワー
ド音声の受入れ可能な期間を報知する報知信号を出力
し、前記第２段階の音声認識がされない時には報知信号
を停止するように制御する報知制御ステップと、前記音
声起動ステップの最大計数値の判定で最大計数値でない
時には、前記報知信号の周波数成分を認識時よりも変更
して出力する報知信号制御ステップと、を有することを
特徴とする。

【００１４】更に、本願の第３の発明は、前記第１又は
第２の音声起動制御方法において、前記音声認識ステッ
プで第１段階の音声認識がなされた時には、入力された
音声と登録された話者の音声との音声判定を行うための
話者照合処理を行い、照合されない時には、再度音声認
識を行い、照合された時には前記時間制限ステップでタ
イムスタートしてタイムアップ制御させる話者照合ステ
ップを有することを特徴とする。

【００１５】

【作用】本願の第１の発明による方法では、キーワード
装置が連続的に入力されると、その認識回数が計数され
る。音声認識は２段階で行われ、第１段階の音声認識で
認識されない時は再度音声認識が行われ、認識された時
はタイムアップ制御が行われる。

【００１６】また、第２段階の音声認識で、認識された
時は、上記認識回数の計数を行うと共に、時間制限ステ
ップを初期化し、認識されない時は再度音声認識を行
う。第２段階の音声認識の後、認識回数の計数値が所定
の最大値に達すると、所定の制御対象機器を音声起動さ
せる。

【００１７】次に本願の第２の発明では、上述した第１
の発明の方法で、前記第１段階の音声認識が行われた時
には、所定報知信号により次のキーワード音声の受入れ
可能期間を報知し、かつ第２段階の音声認識がされない
時にはこの報知信号を停止する。

【００１８】また、本願の第３の発明では、上述した第
１又は第２の発明の方法で、第１段階の音声認識がなさ
れた時には、入力された音声と登録された話者の音声を
照合するための音声判定が行われ、照合されない時は再
度音声認識を行うが、照合された時はタイムアップ制御
させる。

【００１９】

【実施例】以下図面を参照して本発明の各実施例を説明
する。図１は前記第１の発明の方法、即ち、音声認識の
ための音声入力の待機状態に制限時間を設け、音声キー
ワードの認識が複数回連続して成功した時のみ、音声起
動を行う方法の各動作ステップを示すフローチャート
で、この方法を実施するためのシステムとしては、例え
ば図７に示す構成をとる。

【００２０】図８において、１は音声認識装置、２はホ
ストコンピュータ、３は音声入力用マイクロホン、４は
増幅器、５は制御対象機器、例えば、電話機である。な
お、ホストコンピュータ２は後述のカウンタ機能及びタ
イマ機能を有している。

【００２１】図１のフローチャートにおいて、カウンタ
ＣＴは、キーワードが連続して認識されたときの回数を
カウントするためのものである。ＮＭＡＸを繰り返し回
数の最大値としたとき、ＣＴ＝ＮＭＡＸのとき音声起動
がなされる。システムの動作がスタートすると、カウン
タＣＴはゼロクリアされる（ステップＳ１０１）。音声
認識装置は音声認識のための音声入力待ちの状態とな
る。音声が入力されると、音声認識処理を行い、予め登
録された標準パターンとマッチング処理が行われる（ス
テップＳ１０２）。

【００２２】認識結果が音声起動用のキーワードに対応
するコードであったときには、発声時間に制限をつける
ためのタイマをスタートさせる。そうでないときは、
（ステップＳ１０１）に戻る。

【００２３】次に、タイマの値が予め定めた値に達した
かどうかのチェックを行う。タイマがスタートしてか
ら、タイムアップするまでの期間は、キーワード音声の
受入れ可能時間となる。この期間に、音声入力がなされ
たかどうかのチェックをあわせて行い、音声入力がなけ
れば、タイマのチェックを再び行う。音声入力があれ
ば、（ステップＳ１０５）へいく。

【００２４】ステップＳ１０５では、入力音声に対して
音声認識処理が行われ、音声起動用のキーワードである
と判定されると、カウンタＣＴの値がインクリメントさ
れる。同時にタイマを停止させ、値を初期化して、次の
音声入力の時間制限タイマのスタートに備える。

【００２５】ステップＳ１０６では、現在のカウンタＣ
Ｔの値のチェックが行われ、予め決めた値ＮＭＡＸと等
しくなったかを判定する。図２には、キーワードを３回
発声したときに、音声起動がなされるときの、発声タイ
ミングとそれぞれの音声の受入れ可能期間の関係の例を
示した。図２に示した例は、ＭＭＡＸ＝３の場合であ
る。ＣＴ＝ＮＭＡＸとなった場合、音声起動がなされた
制御対象機器の制御が可能となる（ステップＳ１０
７）。

【００２６】ところで、リジェクトが発生するような状
況で本方式の利点を発揮するためには、キーワードの発
声回数を、上記の説明で示したＮＭＡＸよりも多くとる
ことが有効である。即ち、発声した音声の認識結果がリ
ジェクトされた場合、音声起動がなされるためには、そ
れ以降の音声の認識がＮＭＡＸである必要があるからで
ある。

【００２７】例えば、ＮＭＡＸ＝２としたときは、発声
回数を３又は４程度にしておくことで、リジェクトに対
応することができる。即ち、１回目の発声がリジェクト
されれば、都合３回の発声が必要であり、１回目はＯＫ
で２回目の発声がリジェクトされると、４回の発声が
（この場合は従来方式の発声回数と同じになる）必要と
なる。

【００２８】従来方式は、２つの音声の発声がペアにな
っていたために、何れか１つのキーワードがリジェクト
されると、２つのキーワードを発声しなおさなければな
らなかったが、本方式によれば単一キーワードを複数回
発声するために、認識に関する精度はそのままで、１つ
のリジェクトは１回の音声の発声ですむという利点があ
る。

【００２９】１つのリジェクトがあった場合に従来方式
と本方式を発声回数で比較すると、従来方式４回本方式３回〜４回（ＮＭＡＸ＝１のとき）となる。時間制限つきで、２回の連続した認識がなされ
たときのみ、音声起動がなされるという、音声認識に関
する制限は同じでありながら、前述した従来に比して本
方式により発声回数を削減できることになる。

【００３０】以上に示した例以外に、勿論ＮＭＡＸの値
を１，２以外の値にする場合も考えられる。そうするこ
とで、誤認識による音声起動の確率は減少するが、使い
やすさや、従来方式と比較した場合の利点を重視する
と、ＮＭＡＸの値は１〜２が適当であると考えられる。

【００３１】なお、前記実施例の説明において、発声回
数を従来方式４回、本方式３回としたがこれについて、
以下更に詳しく説明する。ＮＭＡＸ＝１としたとき、本
方式では２回連続して、キーワードが認識されたとき
に、初めて音声起動がなされるように構成されている。

【００３２】例えば、音声起動用のキーワードとして
「スタート」という音声を使うとすれば、発声の様子
は、「スタート」「スタート」「スタート」「スター
ト」などのように単一キーワードを続けて発声するよう
になる。

【００３３】ここで発声回数を４回としているのはリジ
ェクト対策のためである（もちろん、リジェクトがなけ
れば、最初の２回で音声起動がかかり、システムから音
声メッセージが出力されるなど何等かのアクションがあ
るので、３，４回目の発声は必要なくなり、ユーザは
３，４回目の発声を中止できる。このときは、都合２回
の発声で音声起動は完了する）。

【００３４】この例では、ＮＭＡＸ＝１であるので、リ
ジェクトがなければ、２回の発声で音声起動がなされる
ので２回の発声を行えば十分であるのだが、第１回目の
発声がリジェクトされると２回のみの発声では発声回数
が足りなくなる。ユーザは予め、設定されている発声回
数よりもおおめに発声することで確実に音声起動をかけ
ることができるのである。また、第３のキーワード以降
がリジェクトされると４回でも発声が足りなくなるが、
この時の対処としてユーザはシステムが音声起動されな
いのを確認し、音声起動されるまでキーワードの発声を
更に続けることで目的を達成できる。このとき、ユーザ
が発声するのは単一キーワードであるので認識させよう
という心理的な緊張が従来のときに比べ緩和されるの
で、楽に発声できるという利点がある。詳しくは、以下
に述べる従来技術との比較で更に明確になる。

【００３５】従来技術は、２つのキーワード、例えば
「スタート」「システム」などが連続して認識されたと
きにのみ、音声起動がなされるようにしたものである。
図８にこの動作を説明するフローチャートを示す。ユー
ザは第１回目の発声で「スタート」を発声するが、シス
テムはこのキーワードが認識されない（リジェクトな
ど）限り、第２のキーワード「システム」の入力待ちの
状態にはならず、キーワード「スタート」の入力待ちと
なる（ステップＳ４１０）、このような場合、以下に示
すような不具合がある。

【００３６】ユーザは２つのキーワードを発声する必要
があり、それは「スタート」「システム」という具合に
続けて離散発声される。ユーザは第１のキーワード「ス
タート」を発声したときに、これがリジェクトされたか
否かは、知ることができないので、第１のキーワードが
リジェクトされたときでも、第２のキーワードを発声し
てしまう。このとき、システムは第１のキーワードがリ
ジェクトされたので、再度第１のキーワードの音声入力
待ちの状態となる（ステップＳ４１０）。

【００３７】即ち、このとき、ユーザは第２のキーワー
ド「システム」の発声を行い、システム側は第１のキー
ワード「スタート」の入力待ちの状態となっており、両
者の対処がちぐはぐなものになってしまう。対象とする
認識単語は異なるので第２のキーワードは必然的にリジ
ェクトされてしまう。このように２つのキーワードを用
いる方法は、第１のキーワードがリジェクトされると第
２のキーワードの発声は無駄なものとなってしまうとい
う不具合がある。また、第１のキーワードが確実に認識
されないと、第２のキーワードの受付けが可能にならな
いので、ユーザからみると、発声を慎重に行わなければ
ならないので、緊張感があり、使いにくい面がある。

【００３８】第１のキーワード又は第２のキーワードが
リジェクトされた場合、発声回数で比較すると、従来方
式では、「スタート」でリジェクトし、「システム」は
必然的にリジェクトされ、次の「スタート」「システ
ム」が成功し、音声起動がなされる。合計４回の発声で
音声起動がかかる。

【００３９】本方式では、第１回目の発声「スタート」
でリジェクトした場合、次からの「スタート」「スター
ト」が認識されて音声起動がかかり、合計３回の発声と
なり、従来より発声回数を減らすことができる。第２回
目の発声でリジェクトすると、「スタート」「スター
ト」でリジェクト、次の「スタート」「スタート」で認
識が成功し、音声起動がかかる。合計４回の発声とな
り、この場合、従来と同回数となる。

【００４０】なお、ＮＭＡＸの値は、固定で使われるこ
とが多い。従って、その場合、ＮＭＡＸの値は制御コン
トローラのプログラムＲＯＭ内で定義されるので、変更
できないが、ユーザによっては発声回数を調整したい場
合もある。そこで、外部入力手段（例えば、スイッチな
ど）でＮＭＡＸの値を入力できるようにして、発声回数
を可変にできるような余地をユーザに残すことも考えら
れる。このときは、ＮＭＡＸの値はプログラムＲＡＭ内
におかれる。また図１において、Ｓ１０５で認識不成功
の場合、点線で示すようにＳ１０３のタイマースタート
に戻ってもよい。

【００４１】次に本願の第２の発明の方法、即ち、第１
の発明の方法に対し、更に音声キーワードが認識された
後に、次回のキーワード音声の受入れ可能期間をユーザ
に報知するために、報知信号を出力するステップを付加
した方法について説明する。

【００４２】図４は上記方法を実施するためのシステム
の一例で、図５はその各動作ステップを示すフローチャ
ートである。図４において、１１はスタロホン、１２は
音声認識装置、１３は制御対象機器、１４ａは制御部、
１４ｂは話者照合部、１５は報知信号発声器、１６はス
ピーカ、である。制御部１４ａ、話者照合部１４ｂは、
例えば、コンピュータにより構成される。

【００４３】制御部１４ａは、カウンタＣＴをゼロクリ
アし、報知信号発声器１５の出力を停止するような設定
を行う（ステップＳ２０１）。続いて、音声認識装置１
２は音声認識モードとなり、音声入力の待機状態とな
る。音声が入力され、音声起動用のキーワードが認識さ
れると、ステップＳ２０３へいく（ステップＳ２０
２）。

【００４４】ステップＳ２０３では、次の音声の受入れ
可能時間を計数するタイマをスタートさせる。ステップ
Ｓ２０４では、報知信号発声器１５により、報知信号が
スピーカ１６より出力される。このときの、報知信号の
占める周波数帯域を図３に示す。音声認識装置１２が音
声分析を行う帯域は、図３における（Ａ）の部分であ
る。

【００４５】図３には、分析方法にＢＰＦバンクを用い
ているときのものを示した。ｆｍａｘは可聴周波数帯に
おける、最大周波数（約２０ｋHz）である。図３の
（Ｂ）に示した帯域は可聴域であり、なおかつ音声認識
装置の分析対象外の部分である。この範囲の周波数を報
知信号の成分とすれば、音声認識処理には影響を与え
ず、ユーザが報知信号として聞き取ることが可能にな
る。ステップＳ２０５では、タイムアップにならない間
は報知信号が、スピーカ１６より出力されるので、ユー
ザは先に発声した音声キーワードが正しく認識され、次
の発声の受入れ期間がスタートしたことを知ることがで
きる。音声が入力されると、認識処理を行い、音声起動
用のキーワードであると判定されると、カウンタＣＴは
インクリメントされ、タイマは初期化される。

【００４６】ステップＳ２０７では、ＣＴとＮＭＡＸと
の比較を行い、キーワードが所定回数だけ、連続して認
識されたかをチェックする。ＣＴとＮＭＡＸが等しけれ
ば、音声起動が行われ、各種制御の実行が行われる（ス
テップＳ２０８）。ＣＴとＮＭＡＸが等しくなければ、
次のキーワードの認識の受入れ期間がスタートしたこと
をユーザに報知するために、今までの報知信号とは、異
なる音色に報知信号発声器を再設定する（ステップＳ２
０９）。

【００４７】図６のフローチャートは本願の第３の発明
の方法、即ち、第１又は第２の発明に対し、音声キーワ
ードの認識が成功した後に、同じ音声パターンに対して
話者照合処理を行い、予め登録されている話者の音声で
あると判定された時のみ、次回のキーワード音声の受入
れを可能とする動作ステップを付加した方法を示す。図
６において、ステップＳ３０１では、カウンタＣＴの初
期化を行い、音声認識モードとし音声起動のためのキー
ワードが入力されたかどうかのチェックを行う。音声起
動のためのキーワードが認識されるとステップＳ３０２
へいく。

【００４８】ステップＳ３０２では、先の音声認識時
に、入力された音声パターンを用いて、予め登録されて
いる音声照合用の音声パターンとの話者照合（あるい
は、話者判定）の処理を行う。ここで、登録している話
者の音声であると判定されると、ステップＳ３０３へい
き、そうでなければステップＳ３０１のはじめに戻る。

【００４９】ステップＳ３０３では、音声入力の待機状
態に時間制限をするためのタイマをスタートさせる。ス
テップＳ３０４では、タイムアップするまでの間に、音
声の入力があればステップＳ３０５へいき、タイムアッ
プであればステップＳ３０１のはじめに戻る。更に、入
力された音声の認識結果が音声起動用のキーワードであ
ると判定されたならば、ステップＳ３０６へいく。そう
でなければ、ステップＳ３０１のはじめに戻る。ステッ
プＳ３０５〜ステップＳ３０６は、発明［１］の実施例
でのステップＳ１０６〜ステップＳ１０７の説明と同様
である。

【００５０】

【発明の効果】以上説明したように、本願の第１の発明
によれば、音声起動時にリジェクトが発生するような場
合においても、単一キーワードを連続して発声すること
で、発声回数を削減できる場合があり、かつリジェクト
発生時に、素早く音声起動を完了できるという利点があ
る。

【００５１】また、本願の第２の発明によれば、単一キ
ーワードを複数回認識させるときに、システム側が現在
何回目の音声を認識対象としているかをユーザに報知す
ることが可能となり、リジェクトにより発声音声が拒絶
された場合にも、あと何回発声すればよいかを、リアル
タイムでユーザに知らしめることができるので、音声メ
ッセージなどにより発声要求を行う従来の方法に比べ
て、より素早い発声指定を行えるという利点がある。ま
た、報知信号として、音声認識装置が対象としている音
声の分析帯域外の周波数成分を持つ信号を用いれば、報
知信号が音声認識装置の性能を落とす原因にはならな
い。

【００５２】更に、本願の第３の発明によれば、音声起
動のためのキーワードの入力がなされても、予め登録さ
れた話者以外の音声である場合、次のキーワードの受入
れ期間が開始されないので、登録話者以外が音声起動の
キーワードを発声しても、装置が反応しないようにする
ことができる。従って、プライベートな装置の実現が可
能となるという利点がある。

【図面の簡単な説明】

【図１】本願の第１の発明の各動作ステップを説明する
フローチャートである。

【図２】キーワード発声シーケンスのタイミングチャー
トである。

【図３】本願の第２の発明の使用帯域の説明図である。

【図４】本願の第２の発明を説明するブロックである。

【図５】本願の第２の発明の各動作ステップを示すフロ
ーチャートである。

【図６】本願の第３の発明の各動作ステップを示すフロ
ーチャートである。

【図７】図１の方法を実施するシステムの一例を示すブ
ロック図である。

【図８】従来の音声起動制御方法を示すフローチャート
である。

【符号の説明】

１音声認識装置２ホストコンピュータ３マイクロホン５電話機１１マイク１２音声認識装置１３制御対象機器１４ａ制御部１４ｂ話者照合部１５報知信号発声器１６スピーカ

Claims

【特許請求の範囲】

【請求項１】所定のキーワード音声を取り込む音声入
力ステップと、前記キーワード音声の入力の待機状態に所定の制限時間
を与える時間制限ステップと、前記所定の制限時間中に前記取り込まれたキーワード音
声を予め定められた基準音声と比較しマッチング処理に
基づいて音声認識を行う音声認識ステップと、前記音声認識の結果に基づいて所定の制御対象機器を音
声起動する音声起動ステップと、を有する音声起動制御方法において、連続的に入力された前記キーワード音声の認識回数を計
数する計数ステップと、前記音声認識ステップで第１段階の音声認識を行い、認
識されない時には再度音声認識を行うように制御し、認
識された時には前記時間制限ステップでタイムスタート
してタイムアップ制御する認識・時間制限ステップと、前記音声認識ステップで前記タイムアップまでに第２段
階の音声認識を行い、認識された時には前記計数ステッ
プで計数すると共に前記時間制限ステップを初期化する
ように制御し、認識されない時には再度音声認識するよ
うに制御する計数制御ステップと、前記第２段階の認識がなされた後、前記計数ステップで
の計数値が予め定められた最大計数値になったか否かを
判定し、最大計数値の時には前記音声起動ステップで音
声起動させる認識回数判定ステップと、を有し、予め定められた認識回数だけ迅速かつ連続的にキーワー
ド音声の認識を行って制御対象機器の起動を行うことを
特徴とする音声起動制御方法。
【請求項２】前記音声認識ステップで第１段階の音声
認識がなされた時には、次のキーワード音声の受入れ可
能な期間を報知する報知信号を出力し、前記第２段階の
音声認識がされない時には報知信号を停止するように制
御する報知制御ステップと、前記音声起動ステップの最大計数値の判定で最大計数値
でない時には、前記報知信号の周波数成分を認識時より
も変更して出力する報知信号制御ステップと、を有することを特徴とする請求項１に記載の音声起動制
御方法。
【請求項３】前記音声認識ステップで第１段階の音声
認識がなされた時には、入力された音声と登録された話
者の音声との音声判定を行うための話者照合処理を行
い、照合されない時には、再度音声認識を行い、照合さ
れた時には前記時間制限ステップでタイムスタートして
タイムアップ制御させる話者照合ステップを有すること
を特徴とする請求項１又は２に記載の音声起動制御方
法。