JPH0643896A - 音声起動制御方法 - Google Patents

音声起動制御方法

Info

Publication number
JPH0643896A
JPH0643896A JP3329441A JP32944191A JPH0643896A JP H0643896 A JPH0643896 A JP H0643896A JP 3329441 A JP3329441 A JP 3329441A JP 32944191 A JP32944191 A JP 32944191A JP H0643896 A JPH0643896 A JP H0643896A
Authority
JP
Japan
Prior art keywords
voice
recognition
keyword
rejected
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3329441A
Other languages
English (en)
Inventor
Nobuo Hagimoto
信男 萩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP3329441A priority Critical patent/JPH0643896A/ja
Publication of JPH0643896A publication Critical patent/JPH0643896A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声制御装置において音声キーワードの発声
回数を少なくし、効率的な音声制御機能指定を行えるよ
うにすることである。 【構成】 ステップS100,S110において、第
1,第2の音声認識結果を記憶する。ステップS14
0,S150では、第1,第2の音声認識結果が夫々リ
ジェクトされたか否かを判定し、リジェクトの時、第
1,第2の音声キーワードの発声要求を行い、これに応
じて再度そのキーワードの音声認識を行う。第1の音声
キーワードがリジェクトされない時は第2の音声認識を
行うための判定ステップに行く。第2の音声キーワード
がリジェクトされない時は、ステップS160〜S18
0に行く。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はモード識別用の第1のキ
ーワードと、制御対象選択用の第2のキーワードの2つ
の音声キーワードを用いる音声制御装置の音声起動方法
に係り、特に音声起動のための音声キーワードが、その
目的以外に音声制御機器の特定と動作モードの指定を兼
用する音声起動方法に関する。
【0002】
【従来の技術】音声制御装置の音声起動方法として従来
から2つのキーワードを用いた音声起動方法が用いられ
ている。この方法は、例えば、電話機の音声自動ダイヤ
ル装置の音声起動であれば、音声起動用の2つのキーワ
ード「TURN ON」及び「TELEPHONE」を
別々の単語音声として登録し、音声起動時には「TUR
N ON TELEPHONE」のように読み手ユーザ
に発声させるものである。これにより第1のキーワード
「TURN ON」と第2のキーワード「TELEPH
ONE」の両方が認識された時に装置が起動される。
【0003】一方、従来の音声ダイヤル装置には、種々
の音声ダイヤル機能をもつものがある。例えば、 動作モード(1):電話番号と一意に対応する音声キー
ワードを音声認識する方法。 動作モード(2):電話番号の数字を1つずつ音声認識
する方法。 など複数の音声認識方法をとるのが普通である。従って
従来の方法によれば、音声起動により音声制御モードと
なった時、上述のように複数の動作モードがあるので、
これらを指定するためのキーワードの音声認識が必要で
ある。例えば、前記動作モード(1)及び(2)の夫々
に音声認識用のキーワード「DIAL」及び「ENTE
R」が割り当てられているとすると、発声のシーケンス
の例は以下のようになる。
【0004】(i)「TURN ON TELEPHO
NE」音声起動用ワード(発声2回) (ii)「DIAL」動作モード(1)の選択用キーワー
ド(発声1回) (iii)「office」電話番号に対応したキーワー
ド(発声1回) 上述したように、目的の動作モードに入るまで最低3回
の発声が必要であり、また誤認識があると、発声をやり
直さなければならない。
【0005】
【発明が解決しようとする課題】音声制御装置には複数
の音声制御モードがあり、モード指定のための音声認識
を行う必要がある。しかし従来の方法によると、上述し
たように音声起動と併用した場合、音声認識が完了して
目的の制御を行うまでに、ユーザーが音声キーワードを
発声する回数が多くなるという問題点がある。発声回数
が多いと、ユーザへの負担が増大するほか、それだけ誤
認識の機会もふえるため不都合である。しかも、音声起
動のためのキーワードの音声認識結果で、いずれか1つ
のキーワードが不確か(リジェクト)であると判定され
た時、音声起動を正しく行うためには、再度2つのキー
ワードを発声する必要があるので、上記の不都合はなお
さら解決すべき問題であることが理解できる。
【0006】本発明の目的は音声制御装置において、音
声キーワードの発声回数を少なくし、効率的な音声制御
機能指定を可能とする音声起動方法を提案することにあ
る。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本発明の音声起動制御方法は第1の音声キーワード
により第1の音声認識を行い、その第1の音声認識結果
に基づいて、第2の音声キーワードにより第2の音声認
識を行い、第2の音声認識結果により制御対象機器の音
声起動制御を行う音声起動制御方法において、前記第1
及び第2の音声認識結果を記憶する記憶ステップと、前
記記憶された第1及び第2の音声認識結果が夫々リジェ
クトされたか否かを判定する第1判定ステップと、前記
第1及び第2の音声認識結果が夫々リジェクトの時、前
記第1及び第2の音声キーワードの発声要求を行う発声
要求ステップと、前記第1及び第2の音声キーワードの
発声要求に応じて再度そのキーワードの音声認識を行う
再音声認識ステップと、前記再音声認識結果がリジェク
トされたか否かを判定し、前記第1の音声キーワードが
リジェクトされない時は前記第2の音声認識を行うため
に前記第1の判定ステップに行く実行をすると共に、前
記第2の音声キーワードがリジェクトされない時は第1
及び第2の音声認識に対応した制御対象機器の音声制御
を実行させる第2判定ステップと、を有することを特徴
とする。
【0008】
【作用】本発明の起動制御方法では、第1及び第2の音
声認識結果を記憶しておき、夫々の結果がリジェクトさ
れたか否かを判定する。その判定がリジェクトの時、第
1、第2の音声キーワードの発声要求を行い、これに応
じて再度そのキーワードの音声認識を行う。この再認識
の結果、第1の音声キーワードがリジェクトされない時
は第2の音声認識を行うため第1の判定ステップに行
く。また、第2の音声キーワードがリジェクトされない
時は、第1、第2の音声認識に対応した制御対象機器の
音声制御を実行させる。
【0009】
【実施例】以下図面を参照して本発明の実施例を説明す
る。図1は音声制御装置の一例としての音声ダイヤルシ
ステムで、1は音声認識装置、2はホストコンピュー
タ、3はマイクロホン、4は増幅器、5は制御対象機器
としての電話機であり、本発明による音声起動制御方法
が下記のように適用される。
【0010】図2a及び図2bは図1のシステムの本発
明の方法による動作の各ステップを説明するフローチャ
ート、図3はその動作例を示す。音声ダイヤルシステム
の音声制御機能としては次の2つのモードがある。 (i)キーワード認識方式:電話番号に対応した音声キ
ーワードを音声認識することで、ダイヤリング操作を簡
単化する。 (ii)電話番号認識方式:電話番号列を数字1つずつ音
声認識することで、ダイヤリング操作を簡単化する。 (i),(ii)の方式を識別させるための音声キーワー
ドを夫々「turn on」,「enter」とし、音声制御対象機
器の種別として電話機を示すキーワードを「telephon
e」とする。
【0011】ユーザは制御対象機器として電話機、動作
モードとして(i)のキーワード認識方式を使用すると
き、音声起動するために、モード識別用キーワード(第
1の音声キーワード)「turn on」と制御対象機器選択
用キーワード(第2の音声キーワード)「telephone」
を用いる。なお、図4に各認識対象単語と認識結果とし
て返されるコードの割付けを示す。認識装置1を制御す
るホストコンピュータ2には、この割付けがテーブルと
して内蔵のメモリに記憶されており、コードが与えられ
れば、動作モード及び制御対象機器が特定できるように
なっている。
【0012】また、図5は上記メモリにマッピングされ
る第1及び第2格納エリアの様子を示す。音声認識結果
をホストコンピュータ2が受け取ると、上記メモリにあ
らかじめマッピングされた特定のアドレスX1,X2に
夫々第1及び第2の認識結果が格納される。
【0013】更に図6は後述のリジェクトが発声した時
の第1及び第2の格納エリアの内容の様子を示す。次
に、図2a及び図2bを参照して本発明の音声起動制御
方法の一実施例の動作をあらわす各ステップを説明す
る。
【0014】(ステップS100)音声制御装置のデフ
ォルトでの動作は、音声認識をするための音声入力待ち
の状態となっている。音声が入力されたと判定される
と、第1の音声キーワードの認識対象単語(モード認識
用キーワード)の候補パターン「TURN ON」や
「ENTER」などとの認識処理が行われる。音声認識
結果は第1の音声キーワードの認識結果格納用のメモリ
エリアへ格納される。
【0015】(ステップS120)ステップS100で
の音声認識モードの音声入力待ちの状態において、音声
の入力がない時は、現在の制御対象機器のデフォルトの
処理を行う。この時点では、制御対象機器は選択されて
いないので、ダイナミックな制御を行うのではなく、音
声制御状態を継続可能であるかどうかのチェックを行
う。例えば、チェックの対象が電話機である場合、音声
制御を継続できない状態というのは、電話機の電源がオ
フになっており、電話をかけることができないときなど
である。
【0016】このような場合は、その理由をユーザを報
知するなどして、音声起動をかけようとしているのを中
止するなどの措置をとることができる。
【0017】(ステップS110)第1の音声キーワー
ドの音声認識が終了すると、第2の音声キーワードの音
声認識モードとなる。このモードは時間制限つきであ
り、ホストコンピュータ内のタイマが所定の値に達する
までに音声入力がなされない時は音声認識モードを終了
しデフォルトの状態に戻る(ステップS130)。
【0018】第1の音声キーワードの認識に続いて第2
の音声キーワードの認識に時間制限を設けると、誤認識
を減らすことができる。第2の音声認識モードで音声が
入力されると、第2の認識対象単語(制御対象選択用キ
ーワード)との認識処理が行われる。第2の認識対象単
語は制御対象機器を指定する機能をも兼用するものであ
り、ここでは電話機に対応する音声キーワード「「TE
LEPHONE」がある。この他に、例えば制御対象機
器としてオーディオ装置があれば、対応する音声キーワ
ード「AUDIO」などが、この場合の認識対象単語で
ある。第2の認識モードでの認識結果は所定のメモリエ
リアに格納される。
【0019】ところで上述した第1及び第2の音声認識
において、本発明においては、音声が入力されたものと
しての認識結果がリジェクトであるか否かの判断をして
いない。従来の2つの音声キーワードを用いた音声起動
方式では、まず第1の音声キーワードの認識結果のチェ
ックを行い、リジェクトであれば、音声認識のやり直し
をするのが普通である。第2の認識モードへは第1の認
識モードがリジェクトでなく、正しく認識するまで入る
ことはない。
【0020】しかし本発明の方法ではあえて第1の認識
処理のチェックは行わず、音声が入力されたと判断した
ら、その認識処理を行い、第2の認識モードとなるよう
になっている。その理由は後述するように、誤認識した
時の発声回数を最小限にするための配慮である。また、
上記の例では、第1の認識モードでの認識対象単語をモ
ード識別コード、第2の認識モードでの認識対象単語を
制御対象機器選択用キーワードとなっているが、この逆
としてもよい。
【0021】(ステップS140)以上のように2つの
音声認識処理が行われると、所定のメモリエリアに格納
されている音声認識結果のチェックを行う。この例で
は、第1の認識結果はモード認識用キーワードが認識対
象単語となっているとして説明する。
【0022】第1の音声認識がリジェクトの場合、第1
の認識対象単語の再発声要求を行う。例えば、「使用す
る動作モードはなんですか?」なる音声メッセージを出
力して、第1の音声認識がうまくいかなかったことをユ
ーザに報知する。音声認識モードとなり制限時間内に音
声入力がされないときはステップS100へ戻る。認識
結果がリジェクトであった場合は、前記タイマの設定を
初期化して音声認識をやり直す。認識処理がうまくいっ
たならば、第2の認識結果のチェックを行う。
【0023】(ステップS150)次に、第2の認識結
果のチェックを行う。先の第2の音声認識結果の格納さ
れている所定のメモリエリアの認識結果は制御対象機器
の種別を示すキーワードに対応するものである。認識結
果がリジェクトであるならば、第1の認識結果のチェッ
クのときと同様に第2の認識対象単語の再発声要求を行
う。例えば「使用する制御対象機器はなんですか?」な
る音声メッセージなどを出力する。以下、前記ステップ
S140と同様である。
【0024】第1及び第2の認識の両者がリジェクトの
場合は、発声要求を行わず、ステップS100に行くよ
うにすることもできる。こうすることで、周囲の物音な
どで、リジェクトが多発するような状況(ユーザは音声
起動する状況ではない)ではステップS100,S11
0の認識処理の関門を通過して音声の再発声要求のメッ
セージが出力されてしまうような状況を回避することが
できる。
【0025】(ステップS160)選択された制御対象
単語に対応する制御を選択する。多種の制御機器がマル
チプレクスされて接続されているときなどは、セレクト
信号をマルチプレクサに出力する処理に対応する。
【0026】(ステップS170)選択された音声制御
の動作モードにデフォルトのモードから切り換えられ
る。
【0027】(ステップS180)ユーザの所望する音
声制御機器の音声制御モードが実行される。なお、前述
したように第1、第2の認識結果のリジェクト時、ステ
ップS140,S150において、再度キーワード認識
を行い、ここで更にリジェクトする。そして、リジェク
トしない時はステップS160,S170に行くことに
なるが、このステップでは前記リジェクトしたキーワー
ドは記憶されていないが、制御対象機器及び動作モード
は次のようにして選択する。
【0028】即ち、ステップS160に達していれば、
第1,第2の格納エリアにはリジェクトコード100は
格納されておらず、第1の格納エリアには動作モードを
指定するキーワードの認識結果が、第2の格納エリアに
は制御対象機器を指定するキーワードの認識結果が格納
されている。従ってステップS160では、制御対象機
器を選択するために、図5に示した第2の格納エリアの
アドレスX2の内容を読み出し、図4に示した割付けに
従ってどの制御対象機器が選択されたかを検出する。
【0029】また、ステップS170においては、同様
に動作モードを特定するために、第1の格納エリアより
認識結果を読み出し図3の割付けテーブルを参照して動
作モードを決定する。更に図5は「turn on」「telepho
n」を認識させたときに、リジェクトがでた例である。
リジェクトがでると、リジェクトコード100が所定の
格納エリア(X1又はX2)に格納される。リジェクト
でなければ、認識した単語に対応するコードが格納され
る(ステップS100,S110)。次に、前記ステッ
プS150,S140でのリジェクトYesで何回もキ
ーワード発声要求を繰り返さないように下記のように処
理する。
【0030】即ち、再発声を行ってもなおかつリジェク
トが発声するということは類似単語が存在するか、又は
周囲騒音により認識不能の状態になっていることであ
る。このような状態は、発声の受付可能時間を経過する
まで待ってタイムアップとして処理を終了する。
【0031】
【発明の効果】以上説明したように本発明によれば、2
つの音声キーワードを用いる音声起動方式において、認
識結果がリジェクトになった場合でもユーザの発声回数
を最小限にすることができる。
【図面の簡単な説明】
【図1】音声ダイヤルシステムを示すブロック図であ
る。
【図2a】本発明の音声起動制御方法の一実施例を示す
フローチャートである。
【図2b】本発明の音声起動制御方法の一実施例を示す
フローチャートである。
【図3】本発明の方法の動作例を示す説明図である。
【図4】各認識対象単語と認識結果として返されるコー
ドの割付けを示す説明図である。
【図5】第1、第2の格納エリアを示す説明図である。
【図6】リジェクトが発声した時の第1,第2の格納エ
リアの内容の様子を示す説明図である。
【図7】図2aと図2bの合成図である。
【符号の説明】
S100〜S180 本発明の方法の各動作ステップを
示す。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 第1の音声キーワードにより第1の音声
    認識を行い、その第1の音声認識結果に基づいて、第2
    の音声キーワードにより第2の音声認識を行い、第2の
    音声認識結果により制御対象機器の音声起動制御を行う
    音声起動制御方法において、 前記第1及び第2の音声認識結果を記憶する記憶ステッ
    プと、 前記記憶された第1及び第2の音声認識結果が夫々リジ
    ェクトされたか否かを判定する第1判定ステップと、 前記第1及び第2の音声認識結果が夫々リジェクトの
    時、前記第1及び第2の音声キーワードの発声要求を行
    う発声要求ステップと、 前記第1及び第2の音声キーワードの発声要求に応じて
    再度そのキーワードの音声認識を行う再音声認識ステッ
    プと、 前記再音声認識結果がリジェクトされたか否かを判定
    し、前記第1の音声キーワードがリジェクトされない時
    は前記第2の音声認識を行うために前記第1の判定ステ
    ップに行く実行をすると共に、前記第2の音声キーワー
    ドがリジェクトされない時は第1及び第2の音声認識に
    対応した制御対象機器の音声制御を実行させる第2判定
    ステップと、 を有することを特徴とする音声起動制御方法。
  2. 【請求項2】 前記第2判定ステップでは、前記第1及
    び第2の音声キーワードがリジェクトされた時は、その
    キーワードの前記発声要求ステップに行く実行をするこ
    とを特徴とする請求項1に記載の音声起動制御方法。
  3. 【請求項3】 前記音声認識ステップでは、その認識が
    不可の時には、所定時間経過後、その旨を報知するメッ
    セージを出力し前記第1の音声認識に行く実行を行わせ
    ることを特徴とする請求項1に記載の音声起動制御方
    法。
JP3329441A 1991-11-18 1991-11-18 音声起動制御方法 Pending JPH0643896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3329441A JPH0643896A (ja) 1991-11-18 1991-11-18 音声起動制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3329441A JPH0643896A (ja) 1991-11-18 1991-11-18 音声起動制御方法

Publications (1)

Publication Number Publication Date
JPH0643896A true JPH0643896A (ja) 1994-02-18

Family

ID=18221410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3329441A Pending JPH0643896A (ja) 1991-11-18 1991-11-18 音声起動制御方法

Country Status (1)

Country Link
JP (1) JPH0643896A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1207517A1 (en) * 2000-11-16 2002-05-22 Sony International (Europe) GmbH Method for recognizing speech

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1207517A1 (en) * 2000-11-16 2002-05-22 Sony International (Europe) GmbH Method for recognizing speech

Similar Documents

Publication Publication Date Title
US6246986B1 (en) User barge-in enablement in large vocabulary speech recognition systems
US6584439B1 (en) Method and apparatus for controlling voice controlled devices
US8380514B2 (en) Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands
JP3363630B2 (ja) 音声認識方法
US5960393A (en) User selectable multiple threshold criteria for voice recognition
US7502742B2 (en) Method and system for voice recognition menu navigation
EP0653701B1 (en) Method and system for location dependent verbal command execution in a computer based control system
US20020193989A1 (en) Method and apparatus for identifying voice controlled devices
US20030093281A1 (en) Method and apparatus for machine to machine communication using speech
US20080154596A1 (en) Solution that integrates voice enrollment with other types of recognition operations performed by a speech recognition engine using a layered grammar stack
US20070118380A1 (en) Method and device for controlling a speech dialog system
JP2008033198A (ja) 音声対話システム、音声対話方法、音声入力装置、プログラム
EP1063636A2 (en) Method and apparatus for standard voice user interface and voice controlled devices
JP2001154694A (ja) 音声認識装置及び方法
US7636661B2 (en) Microphone initialization enhancement for speech recognition
JPH0643896A (ja) 音声起動制御方法
KR100433550B1 (ko) 스피드 음성 다이얼 장치와 방법
JP2003177788A (ja) 音声対話システムおよびその方法
JPS59180599A (ja) 車載用音声認識制御装置
JP6920730B2 (ja) 対話装置および対話プログラム
JPH11109987A (ja) 音声認識装置
KR0173914B1 (ko) 음성 다이얼링 시스템에서의 명칭 검색 방법
WO1992000586A1 (en) Keyword-based speaker selection
JPS5915990A (ja) 音声認識方式
JPH05216492A (ja) 音声起動制御方法