JPH05216492A - 音声起動制御方法 - Google Patents

音声起動制御方法

Info

Publication number
JPH05216492A
JPH05216492A JP4041909A JP4190992A JPH05216492A JP H05216492 A JPH05216492 A JP H05216492A JP 4041909 A JP4041909 A JP 4041909A JP 4190992 A JP4190992 A JP 4190992A JP H05216492 A JPH05216492 A JP H05216492A
Authority
JP
Japan
Prior art keywords
voice
recognition
keyword
voice recognition
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4041909A
Other languages
English (en)
Inventor
Nobuo Hagimoto
信男 萩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP4041909A priority Critical patent/JPH05216492A/ja
Publication of JPH05216492A publication Critical patent/JPH05216492A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Selective Calling Equipment (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 リジェクト発生時の再発声の回数を削減でき
る音声起動制御方法。 【構成】 スタートすると、カウンタCTはゼロクリア
され、ステップS101、音声が入力されると、登録さ
れた標準パターンとマッチング処理を行う、ステップS
102、認識結果が音声起動用キーワード対応コードの
とき、発声期間制限タイマをスタートし、そうでないと
きは、S101に戻る。タイマ値が予定値かどうかのチ
ェックを行う。タイマのタイムアップまでの期間は、キ
ーワード音声の受入れ可能で、音声入力の有無のチェッ
クを行い、入力がないと、タイマチェックを再び行う。
入力があれば、ステップS105へいく。ステップS1
05で入力音声が音声起動用のキーワードと判定する
と、カウンタCTの値はインクリメントされタイマを停
止、初期化し、次の入力のタイマのスタートに備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は所定の制限時間中に取り
込まれたキーワード音声と所定の基準音声との比較を行
うマッチング処理による音声認識の結果に基づいて所定
の制御対象機器を音声起動するための音声起動制御方法
に係り、特にリジェクト発生時の処理を改善したステッ
プを有する音声起動制御方法に関する。
【0002】
【従来の技術】従来の音声制御装置の音声起動方法とし
ては、2つのキーワードを用いたものが優れている。図
8はこのような方法を示すフローチャートで、第1のキ
ーワードではS400〜S420のステップが実行さ
れ、第2のキーワードではS430〜S450のステッ
プが実行される。
【0003】このような方法の具体例としては、例え
ば、電話機の音声自動ダイヤル装置の音声起動であれ
ば、音声起動用の2つのキーワード「TURN ON」
及び「TELEPHONE」を別々の単語音声として登
録し、音声起動時には「TURNON TELEPHO
NE」のように読み手ユーザに発声させるものである。
これにより第1のキーワード「TURN ON」と第2
のキーワード「TELEPHONE」の両方が認識され
た時に装置が起動される。
【0004】一方、従来の音声ダイヤル装置には、種々
の音声ダイヤル機能をもつものがある。例えば、 動作モード(1):電話番号と一意に対応する音声キー
ワードを音声認識する方法。 動作モード(2):電話番号の数字を1つずつ音声認識
する方法。 など複数の音声認識方法をとるのが普通である。従って
従来の方法によれば、音声起動により音声制御モードと
なった時、上述のように複数の動作モードがあるので、
これらを指定するためのキーワードの音声認識が必要で
ある。例えば、前記動作モード(1)及び(2)の夫々
に音声認識用のキーワード「DIAL」及び「ENTE
R」が割り当てられているとすると、発声のシーケンス
の例は以下のようになる。
【0005】(i)「TURN ON TELEPHO
NE」音声起動用ワード(発声2回) (ii)「DIAL」動作モード(1)の選択用キーワー
ド(発声1回) (iii)「office」電話番号に対応したキーワー
ド(発声1回) 上述したように、目的の動作モードに入るまで最低3回
の発声が必要であり、また誤認識があると、発声をやり
直さなければならない。
【0006】音声制御装置には複数の音声制御モードが
あり、モード指定のための音声認識を行う必要がある。
しかし従来の方法によると、上述したように音声起動と
併用した場合、音声認識が完了して目的の制御を行うま
でに、ユーザが音声キーワードを発声する回数が多くな
るという問題点がある。発声回数が多いと、ユーザへの
負担が増大するほか、それだけ誤認識の機会もふえるた
め不都合である。しかも、音声起動のためのキーワード
の音声認識結果で、いずれか1つのキーワードが不確か
(リジェクト)であると判定された時、音声起動を正し
く行うためには、再度2つのキーワードを発声する必要
があるので、上記の不都合はなおさら解決すべき問題で
あることが理解できる。
【0007】
【発明が解決しようとする課題】そこで本件出願人は音
声制御装置において、音声キーワードの発声回数を少な
くし、効率的な音声制御機能指定を可能とする音声起動
方法を特願平3−329441号において提案した。
【0008】上記出願の方法は何れか1つのキーワード
がリジェクトされた場合は、リジェクトされた音声キー
ワードのみの発声要求を音声メッセージで行い、ユーザ
に最低限必要なキーワードのみを発声させるという方法
で発声回数を減らすものである。なお、この種の技術は
例えば特公昭61−17005号又は特公平2−452
00号にも開示されている。
【0009】しかし、従来の方法や上記出願の音声起動
方法では、リジェクトされた音声キーワードを再発声要
求するために、音声メッセージを出力していた。音声メ
ッセージが終了するまで待ってから発声する必要がある
ので、素早く音声起動をかけるには限界がある。ユーザ
にとってみれば、音声認識の発声になれてくると音声起
動の実行シーケンスは決まりきったものとなるので、少
しでも応答性の良いものが要求される。従って、リジェ
クトされた場合には素早く音声起動を行えるような方式
が必要である。
【0010】また、音声起動は、しかるべき時にしかる
べき人が、音声キーワードを発声したときのみ成功する
のが望ましい。しかし、第三者が発声しても、認識され
ることは音声認識装置にとって少なくない。従って、い
たずらに第三者が発声した音声でも装置が簡単に音声起
動されてしまう可能性がある。これは、不特定多数の人
にも起動がかけられるということからは、利便性のある
こととも考えられるが、プライベートな使い方を好むユ
ーザには自分の声のみに反応する装置は魅力的なもので
あり、そのような使い方もできることが望ましい。
【0011】本発明の目的は、音声認識装置を用いた音
声制御装置の音声起動において、リジェクト発生時の再
発声の回数を少なくすることができる方法を提案するこ
とにある。
【0012】
【課題を解決するための手段】上記目的を達成するた
め、本願の第1の発明は、所定のキーワード音声を取り
込む音声入力ステップと、前記キーワード音声の入力の
待機状態に所定の制限時間を与える時間制限ステップ
と、前記所定の制限時間中に前記取り込まれたキーワー
ド音声を予め定められた基準音声と比較しマッチング処
理に基づいて音声認識を行う音声認識ステップと、前記
音声認識の結果に基づいて所定の制御対象機器を音声起
動する音声起動ステップと、を有する音声起動制御方法
において、連続的に入力された前記キーワード音声の認
識回数を計数する計数ステップと、前記音声認識ステッ
プで第1段階の音声認識を行い、認識されない時には再
度音声認識を行うように制御し、認識された時には前記
時間制限ステップでタイムスタートしてタイムアップ制
御する認識・時間制限ステップと、前記音声認識ステッ
プで前記タイムアップまでに第2段階の音声認識を行
い、認識された時には前記計数ステップで計数すると共
に前記時間制限ステップを初期化するように制御し、認
識されない時には再度音声認識するように制御する計数
制御ステップと、前記第2段階の認識がなされた後、前
記計数ステップでの計数値が予め定められた最大計数値
になったか否かを判定し、最大計数値の時には前記音声
起動ステップで音声起動させる認識回数判定ステップ
と、を有し、予め定められた認識回数だけ迅速かつ連続
的にキーワード音声の認識を行って制御対象機器の起動
を行うことを特徴とする。
【0013】また、本願の第2の発明は、前記第1の発
明の音声起動制御方法において、前記音声認識ステップ
で第1段階の音声認識がなされた時には、次のキーワー
ド音声の受入れ可能な期間を報知する報知信号を出力
し、前記第2段階の音声認識がされない時には報知信号
を停止するように制御する報知制御ステップと、前記音
声起動ステップの最大計数値の判定で最大計数値でない
時には、前記報知信号の周波数成分を認識時よりも変更
して出力する報知信号制御ステップと、を有することを
特徴とする。
【0014】更に、本願の第3の発明は、前記第1又は
第2の音声起動制御方法において、前記音声認識ステッ
プで第1段階の音声認識がなされた時には、入力された
音声と登録された話者の音声との音声判定を行うための
話者照合処理を行い、照合されない時には、再度音声認
識を行い、照合された時には前記時間制限ステップでタ
イムスタートしてタイムアップ制御させる話者照合ステ
ップを有することを特徴とする。
【0015】
【作用】本願の第1の発明による方法では、キーワード
装置が連続的に入力されると、その認識回数が計数され
る。音声認識は2段階で行われ、第1段階の音声認識で
認識されない時は再度音声認識が行われ、認識された時
はタイムアップ制御が行われる。
【0016】また、第2段階の音声認識で、認識された
時は、上記認識回数の計数を行うと共に、時間制限ステ
ップを初期化し、認識されない時は再度音声認識を行
う。第2段階の音声認識の後、認識回数の計数値が所定
の最大値に達すると、所定の制御対象機器を音声起動さ
せる。
【0017】次に本願の第2の発明では、上述した第1
の発明の方法で、前記第1段階の音声認識が行われた時
には、所定報知信号により次のキーワード音声の受入れ
可能期間を報知し、かつ第2段階の音声認識がされない
時にはこの報知信号を停止する。
【0018】また、本願の第3の発明では、上述した第
1又は第2の発明の方法で、第1段階の音声認識がなさ
れた時には、入力された音声と登録された話者の音声を
照合するための音声判定が行われ、照合されない時は再
度音声認識を行うが、照合された時はタイムアップ制御
させる。
【0019】
【実施例】以下図面を参照して本発明の各実施例を説明
する。図1は前記第1の発明の方法、即ち、音声認識の
ための音声入力の待機状態に制限時間を設け、音声キー
ワードの認識が複数回連続して成功した時のみ、音声起
動を行う方法の各動作ステップを示すフローチャート
で、この方法を実施するためのシステムとしては、例え
ば図7に示す構成をとる。
【0020】図8において、1は音声認識装置、2はホ
ストコンピュータ、3は音声入力用マイクロホン、4は
増幅器、5は制御対象機器、例えば、電話機である。な
お、ホストコンピュータ2は後述のカウンタ機能及びタ
イマ機能を有している。
【0021】図1のフローチャートにおいて、カウンタ
CTは、キーワードが連続して認識されたときの回数を
カウントするためのものである。NMAXを繰り返し回
数の最大値としたとき、CT=NMAXのとき音声起動
がなされる。システムの動作がスタートすると、カウン
タCTはゼロクリアされる(ステップS101)。音声
認識装置は音声認識のための音声入力待ちの状態とな
る。音声が入力されると、音声認識処理を行い、予め登
録された標準パターンとマッチング処理が行われる(ス
テップS102)。
【0022】認識結果が音声起動用のキーワードに対応
するコードであったときには、発声時間に制限をつける
ためのタイマをスタートさせる。そうでないときは、
(ステップS101)に戻る。
【0023】次に、タイマの値が予め定めた値に達した
かどうかのチェックを行う。タイマがスタートしてか
ら、タイムアップするまでの期間は、キーワード音声の
受入れ可能時間となる。この期間に、音声入力がなされ
たかどうかのチェックをあわせて行い、音声入力がなけ
れば、タイマのチェックを再び行う。音声入力があれ
ば、(ステップS105)へいく。
【0024】ステップS105では、入力音声に対して
音声認識処理が行われ、音声起動用のキーワードである
と判定されると、カウンタCTの値がインクリメントさ
れる。同時にタイマを停止させ、値を初期化して、次の
音声入力の時間制限タイマのスタートに備える。
【0025】ステップS106では、現在のカウンタC
Tの値のチェックが行われ、予め決めた値NMAXと等
しくなったかを判定する。図2には、キーワードを3回
発声したときに、音声起動がなされるときの、発声タイ
ミングとそれぞれの音声の受入れ可能期間の関係の例を
示した。図2に示した例は、MMAX=3の場合であ
る。CT=NMAXとなった場合、音声起動がなされた
制御対象機器の制御が可能となる(ステップS10
7)。
【0026】ところで、リジェクトが発生するような状
況で本方式の利点を発揮するためには、キーワードの発
声回数を、上記の説明で示したNMAXよりも多くとる
ことが有効である。即ち、発声した音声の認識結果がリ
ジェクトされた場合、音声起動がなされるためには、そ
れ以降の音声の認識がNMAXである必要があるからで
ある。
【0027】例えば、NMAX=2としたときは、発声
回数を3又は4程度にしておくことで、リジェクトに対
応することができる。即ち、1回目の発声がリジェクト
されれば、都合3回の発声が必要であり、1回目はOK
で2回目の発声がリジェクトされると、4回の発声が
(この場合は従来方式の発声回数と同じになる)必要と
なる。
【0028】従来方式は、2つの音声の発声がペアにな
っていたために、何れか1つのキーワードがリジェクト
されると、2つのキーワードを発声しなおさなければな
らなかったが、本方式によれば単一キーワードを複数回
発声するために、認識に関する精度はそのままで、1つ
のリジェクトは1回の音声の発声ですむという利点があ
る。
【0029】1つのリジェクトがあった場合に従来方式
と本方式を発声回数で比較すると、 従来方式 4回 本方式 3回〜4回(NMAX=1のとき) となる。時間制限つきで、2回の連続した認識がなされ
たときのみ、音声起動がなされるという、音声認識に関
する制限は同じでありながら、前述した従来に比して本
方式により発声回数を削減できることになる。
【0030】以上に示した例以外に、勿論NMAXの値
を1,2以外の値にする場合も考えられる。そうするこ
とで、誤認識による音声起動の確率は減少するが、使い
やすさや、従来方式と比較した場合の利点を重視する
と、NMAXの値は1〜2が適当であると考えられる。
【0031】なお、前記実施例の説明において、発声回
数を従来方式4回、本方式3回としたがこれについて、
以下更に詳しく説明する。NMAX=1としたとき、本
方式では2回連続して、キーワードが認識されたとき
に、初めて音声起動がなされるように構成されている。
【0032】例えば、音声起動用のキーワードとして
「スタート」という音声を使うとすれば、発声の様子
は、「スタート」「スタート」「スタート」「スター
ト」などのように単一キーワードを続けて発声するよう
になる。
【0033】ここで発声回数を4回としているのはリジ
ェクト対策のためである(もちろん、リジェクトがなけ
れば、最初の2回で音声起動がかかり、システムから音
声メッセージが出力されるなど何等かのアクションがあ
るので、3,4回目の発声は必要なくなり、ユーザは
3,4回目の発声を中止できる。このときは、都合2回
の発声で音声起動は完了する)。
【0034】この例では、NMAX=1であるので、リ
ジェクトがなければ、2回の発声で音声起動がなされる
ので2回の発声を行えば十分であるのだが、第1回目の
発声がリジェクトされると2回のみの発声では発声回数
が足りなくなる。ユーザは予め、設定されている発声回
数よりもおおめに発声することで確実に音声起動をかけ
ることができるのである。また、第3のキーワード以降
がリジェクトされると4回でも発声が足りなくなるが、
この時の対処としてユーザはシステムが音声起動されな
いのを確認し、音声起動されるまでキーワードの発声を
更に続けることで目的を達成できる。このとき、ユーザ
が発声するのは単一キーワードであるので認識させよう
という心理的な緊張が従来のときに比べ緩和されるの
で、楽に発声できるという利点がある。詳しくは、以下
に述べる従来技術との比較で更に明確になる。
【0035】従来技術は、2つのキーワード、例えば
「スタート」「システム」などが連続して認識されたと
きにのみ、音声起動がなされるようにしたものである。
図8にこの動作を説明するフローチャートを示す。ユー
ザは第1回目の発声で「スタート」を発声するが、シス
テムはこのキーワードが認識されない(リジェクトな
ど)限り、第2のキーワード「システム」の入力待ちの
状態にはならず、キーワード「スタート」の入力待ちと
なる(ステップS410)、このような場合、以下に示
すような不具合がある。
【0036】ユーザは2つのキーワードを発声する必要
があり、それは「スタート」「システム」という具合に
続けて離散発声される。ユーザは第1のキーワード「ス
タート」を発声したときに、これがリジェクトされたか
否かは、知ることができないので、第1のキーワードが
リジェクトされたときでも、第2のキーワードを発声し
てしまう。このとき、システムは第1のキーワードがリ
ジェクトされたので、再度第1のキーワードの音声入力
待ちの状態となる(ステップS410)。
【0037】即ち、このとき、ユーザは第2のキーワー
ド「システム」の発声を行い、システム側は第1のキー
ワード「スタート」の入力待ちの状態となっており、両
者の対処がちぐはぐなものになってしまう。対象とする
認識単語は異なるので第2のキーワードは必然的にリジ
ェクトされてしまう。このように2つのキーワードを用
いる方法は、第1のキーワードがリジェクトされると第
2のキーワードの発声は無駄なものとなってしまうとい
う不具合がある。また、第1のキーワードが確実に認識
されないと、第2のキーワードの受付けが可能にならな
いので、ユーザからみると、発声を慎重に行わなければ
ならないので、緊張感があり、使いにくい面がある。
【0038】第1のキーワード又は第2のキーワードが
リジェクトされた場合、発声回数で比較すると、従来方
式では、「スタート」でリジェクトし、「システム」は
必然的にリジェクトされ、次の「スタート」「システ
ム」が成功し、音声起動がなされる。合計4回の発声で
音声起動がかかる。
【0039】本方式では、第1回目の発声「スタート」
でリジェクトした場合、次からの「スタート」「スター
ト」が認識されて音声起動がかかり、合計3回の発声と
なり、従来より発声回数を減らすことができる。第2回
目の発声でリジェクトすると、「スタート」「スター
ト」でリジェクト、次の「スタート」「スタート」で認
識が成功し、音声起動がかかる。合計4回の発声とな
り、この場合、従来と同回数となる。
【0040】なお、NMAXの値は、固定で使われるこ
とが多い。従って、その場合、NMAXの値は制御コン
トローラのプログラムROM内で定義されるので、変更
できないが、ユーザによっては発声回数を調整したい場
合もある。そこで、外部入力手段(例えば、スイッチな
ど)でNMAXの値を入力できるようにして、発声回数
を可変にできるような余地をユーザに残すことも考えら
れる。このときは、NMAXの値はプログラムRAM内
におかれる。また図1において、S105で認識不成功
の場合、点線で示すようにS103のタイマースタート
に戻ってもよい。
【0041】次に本願の第2の発明の方法、即ち、第1
の発明の方法に対し、更に音声キーワードが認識された
後に、次回のキーワード音声の受入れ可能期間をユーザ
に報知するために、報知信号を出力するステップを付加
した方法について説明する。
【0042】図4は上記方法を実施するためのシステム
の一例で、図5はその各動作ステップを示すフローチャ
ートである。図4において、11はスタロホン、12は
音声認識装置、13は制御対象機器、14aは制御部、
14bは話者照合部、15は報知信号発声器、16はス
ピーカ、である。制御部14a、話者照合部14bは、
例えば、コンピュータにより構成される。
【0043】制御部14aは、カウンタCTをゼロクリ
アし、報知信号発声器15の出力を停止するような設定
を行う(ステップS201)。続いて、音声認識装置1
2は音声認識モードとなり、音声入力の待機状態とな
る。音声が入力され、音声起動用のキーワードが認識さ
れると、ステップS203へいく(ステップS20
2)。
【0044】ステップS203では、次の音声の受入れ
可能時間を計数するタイマをスタートさせる。ステップ
S204では、報知信号発声器15により、報知信号が
スピーカ16より出力される。このときの、報知信号の
占める周波数帯域を図3に示す。音声認識装置12が音
声分析を行う帯域は、図3における(A)の部分であ
る。
【0045】図3には、分析方法にBPFバンクを用い
ているときのものを示した。fmaxは可聴周波数帯に
おける、最大周波数(約20kHz)である。図3の
(B)に示した帯域は可聴域であり、なおかつ音声認識
装置の分析対象外の部分である。この範囲の周波数を報
知信号の成分とすれば、音声認識処理には影響を与え
ず、ユーザが報知信号として聞き取ることが可能にな
る。ステップS205では、タイムアップにならない間
は報知信号が、スピーカ16より出力されるので、ユー
ザは先に発声した音声キーワードが正しく認識され、次
の発声の受入れ期間がスタートしたことを知ることがで
きる。音声が入力されると、認識処理を行い、音声起動
用のキーワードであると判定されると、カウンタCTは
インクリメントされ、タイマは初期化される。
【0046】ステップS207では、CTとNMAXと
の比較を行い、キーワードが所定回数だけ、連続して認
識されたかをチェックする。CTとNMAXが等しけれ
ば、音声起動が行われ、各種制御の実行が行われる(ス
テップS208)。CTとNMAXが等しくなければ、
次のキーワードの認識の受入れ期間がスタートしたこと
をユーザに報知するために、今までの報知信号とは、異
なる音色に報知信号発声器を再設定する(ステップS2
09)。
【0047】図6のフローチャートは本願の第3の発明
の方法、即ち、第1又は第2の発明に対し、音声キーワ
ードの認識が成功した後に、同じ音声パターンに対して
話者照合処理を行い、予め登録されている話者の音声で
あると判定された時のみ、次回のキーワード音声の受入
れを可能とする動作ステップを付加した方法を示す。図
6において、ステップS301では、カウンタCTの初
期化を行い、音声認識モードとし音声起動のためのキー
ワードが入力されたかどうかのチェックを行う。音声起
動のためのキーワードが認識されるとステップS302
へいく。
【0048】ステップS302では、先の音声認識時
に、入力された音声パターンを用いて、予め登録されて
いる音声照合用の音声パターンとの話者照合(あるい
は、話者判定)の処理を行う。ここで、登録している話
者の音声であると判定されると、ステップS303へい
き、そうでなければステップS301のはじめに戻る。
【0049】ステップS303では、音声入力の待機状
態に時間制限をするためのタイマをスタートさせる。ス
テップS304では、タイムアップするまでの間に、音
声の入力があればステップS305へいき、タイムアッ
プであればステップS301のはじめに戻る。更に、入
力された音声の認識結果が音声起動用のキーワードであ
ると判定されたならば、ステップS306へいく。そう
でなければ、ステップS301のはじめに戻る。ステッ
プS305〜ステップS306は、発明[1]の実施例
でのステップS106〜ステップS107の説明と同様
である。
【0050】
【発明の効果】以上説明したように、本願の第1の発明
によれば、音声起動時にリジェクトが発生するような場
合においても、単一キーワードを連続して発声すること
で、発声回数を削減できる場合があり、かつリジェクト
発生時に、素早く音声起動を完了できるという利点があ
る。
【0051】また、本願の第2の発明によれば、単一キ
ーワードを複数回認識させるときに、システム側が現在
何回目の音声を認識対象としているかをユーザに報知す
ることが可能となり、リジェクトにより発声音声が拒絶
された場合にも、あと何回発声すればよいかを、リアル
タイムでユーザに知らしめることができるので、音声メ
ッセージなどにより発声要求を行う従来の方法に比べ
て、より素早い発声指定を行えるという利点がある。ま
た、報知信号として、音声認識装置が対象としている音
声の分析帯域外の周波数成分を持つ信号を用いれば、報
知信号が音声認識装置の性能を落とす原因にはならな
い。
【0052】更に、本願の第3の発明によれば、音声起
動のためのキーワードの入力がなされても、予め登録さ
れた話者以外の音声である場合、次のキーワードの受入
れ期間が開始されないので、登録話者以外が音声起動の
キーワードを発声しても、装置が反応しないようにする
ことができる。従って、プライベートな装置の実現が可
能となるという利点がある。
【図面の簡単な説明】
【図1】本願の第1の発明の各動作ステップを説明する
フローチャートである。
【図2】キーワード発声シーケンスのタイミングチャー
トである。
【図3】本願の第2の発明の使用帯域の説明図である。
【図4】本願の第2の発明を説明するブロックである。
【図5】本願の第2の発明の各動作ステップを示すフロ
ーチャートである。
【図6】本願の第3の発明の各動作ステップを示すフロ
ーチャートである。
【図7】図1の方法を実施するシステムの一例を示すブ
ロック図である。
【図8】従来の音声起動制御方法を示すフローチャート
である。
【符号の説明】
1 音声認識装置 2 ホストコンピュータ 3 マイクロホン 5 電話機 11 マイク 12 音声認識装置 13 制御対象機器 14a 制御部 14b 話者照合部 15 報知信号発声器 16 スピーカ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 所定のキーワード音声を取り込む音声入
    力ステップと、 前記キーワード音声の入力の待機状態に所定の制限時間
    を与える時間制限ステップと、 前記所定の制限時間中に前記取り込まれたキーワード音
    声を予め定められた基準音声と比較しマッチング処理に
    基づいて音声認識を行う音声認識ステップと、 前記音声認識の結果に基づいて所定の制御対象機器を音
    声起動する音声起動ステップと、 を有する音声起動制御方法において、 連続的に入力された前記キーワード音声の認識回数を計
    数する計数ステップと、 前記音声認識ステップで第1段階の音声認識を行い、認
    識されない時には再度音声認識を行うように制御し、認
    識された時には前記時間制限ステップでタイムスタート
    してタイムアップ制御する認識・時間制限ステップと、 前記音声認識ステップで前記タイムアップまでに第2段
    階の音声認識を行い、認識された時には前記計数ステッ
    プで計数すると共に前記時間制限ステップを初期化する
    ように制御し、認識されない時には再度音声認識するよ
    うに制御する計数制御ステップと、 前記第2段階の認識がなされた後、前記計数ステップで
    の計数値が予め定められた最大計数値になったか否かを
    判定し、最大計数値の時には前記音声起動ステップで音
    声起動させる認識回数判定ステップと、 を有し、 予め定められた認識回数だけ迅速かつ連続的にキーワー
    ド音声の認識を行って制御対象機器の起動を行うことを
    特徴とする音声起動制御方法。
  2. 【請求項2】 前記音声認識ステップで第1段階の音声
    認識がなされた時には、次のキーワード音声の受入れ可
    能な期間を報知する報知信号を出力し、前記第2段階の
    音声認識がされない時には報知信号を停止するように制
    御する報知制御ステップと、 前記音声起動ステップの最大計数値の判定で最大計数値
    でない時には、前記報知信号の周波数成分を認識時より
    も変更して出力する報知信号制御ステップと、 を有することを特徴とする請求項1に記載の音声起動制
    御方法。
  3. 【請求項3】 前記音声認識ステップで第1段階の音声
    認識がなされた時には、入力された音声と登録された話
    者の音声との音声判定を行うための話者照合処理を行
    い、照合されない時には、再度音声認識を行い、照合さ
    れた時には前記時間制限ステップでタイムスタートして
    タイムアップ制御させる話者照合ステップを有すること
    を特徴とする請求項1又は2に記載の音声起動制御方
    法。
JP4041909A 1992-01-31 1992-01-31 音声起動制御方法 Pending JPH05216492A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4041909A JPH05216492A (ja) 1992-01-31 1992-01-31 音声起動制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4041909A JPH05216492A (ja) 1992-01-31 1992-01-31 音声起動制御方法

Publications (1)

Publication Number Publication Date
JPH05216492A true JPH05216492A (ja) 1993-08-27

Family

ID=12621411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4041909A Pending JPH05216492A (ja) 1992-01-31 1992-01-31 音声起動制御方法

Country Status (1)

Country Link
JP (1) JPH05216492A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173325A (ja) * 2011-02-17 2012-09-10 Toshiba Corp 音声認識操作装置及び音声認識操作方法
CN111415684A (zh) * 2020-03-18 2020-07-14 歌尔微电子有限公司 语音模组的测试方法、装置及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173325A (ja) * 2011-02-17 2012-09-10 Toshiba Corp 音声認識操作装置及び音声認識操作方法
CN111415684A (zh) * 2020-03-18 2020-07-14 歌尔微电子有限公司 语音模组的测试方法、装置及计算机可读存储介质
CN111415684B (zh) * 2020-03-18 2023-12-22 歌尔微电子股份有限公司 语音模组的测试方法、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
JP3363630B2 (ja) 音声認識方法
EP0757342B1 (en) User selectable multiple threshold criteria for voice recognition
JP5332798B2 (ja) 通信制御装置、通信制御方法、及び通信制御プログラム
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
WO2018100391A1 (en) Speaker identification
US20030023439A1 (en) Method and apparatus for automatic recognition of long sequences of spoken digits
JPH05216492A (ja) 音声起動制御方法
JP4486235B2 (ja) 音声認識装置
JP2001154694A (ja) 音声認識装置及び方法
JPH08263092A (ja) 応答音声生成方法および音声対話システム
JP2000122678A (ja) 音声認識機器制御装置
JPH06161488A (ja) 音声認識装置
JP2754960B2 (ja) 音声認識装置
JP2656234B2 (ja) 会話音声理解方法
JP4622106B2 (ja) 人物特定システム
JPH04177400A (ja) 音声起動方式
JPH05108091A (ja) 音声認識装置
JPH02103599A (ja) 音声認識装置
JP2010230994A (ja) 受付装置
JP2004062076A (ja) 本人認証装置および本人認証方法、コンピュータプログラム
JPH04152397A (ja) 音声認識装置
JPH0511200U (ja) 音声認識装置
JPH0643896A (ja) 音声起動制御方法
JPH07210186A (ja) 音声登録装置
JPH0769713B2 (ja) 音声認識応答装置