JPH03200298A - 音声制御装置 - Google Patents

音声制御装置

Info

Publication number
JPH03200298A
JPH03200298A JP89341189A JP34118989A JPH03200298A JP H03200298 A JPH03200298 A JP H03200298A JP 89341189 A JP89341189 A JP 89341189A JP 34118989 A JP34118989 A JP 34118989A JP H03200298 A JPH03200298 A JP H03200298A
Authority
JP
Japan
Prior art keywords
pattern
recognition
voice
input
primary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP89341189A
Other languages
English (en)
Inventor
Nobuo Hagimoto
萩本 信男
Kenichi Ozawa
尾沢 憲一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP89341189A priority Critical patent/JPH03200298A/ja
Publication of JPH03200298A publication Critical patent/JPH03200298A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ 本発明は音声制御装置に係り、特に単語音声認識装置を
用いた音声制御装置の改良に関する。
[発明の概要] 単語音声認識装置を用いて、ワードスポツティング法に
より入力音声パターンと連続的に所定のパターンと比較
し、一致した時に入力音声パターンと複数のパターンと
を比較し、その比較結果に応じて制御対象機器の制御を
行うようにした音声制御装置である。
[従来の技術] 単語音声認識装置を用いて各種装置を音声により制御す
るシステムが実用化されている。音声認識装置はあらか
じめキーワードとなる使用者の音声パターンと、それに
対応する制御コードが登録されるメモリを持っている。
認識したキーワードはメモリ内のキーワード列と比較、
照合され一致したキーワードに対応した制御コードを出
力する機能を持っている。
[発明が解決しようとする課題] 従来の装置は、音声入力があったかどうかを音声のパワ
ーレベルの変化を監視して判定している。
したがって雑音の多い環境で使用した場合、音声入力の
無い区間においても音声入力があったとみなして認識処
理をし、その雑音パターンがたまたま、認識用登録パタ
ーンに近似していると、誤認識してしまい、使用者の意
に反して機器が誤動作してしまうことがしばしばあった
また、音声認識により制御する機器が多く成ると、認識
用登録パターンが膨大と成り、使用者と他の人との会話
にたまたま登録パターンと近似あるいは同一のものがあ
ると、やはり誤動作の原因と成ってしまっていた。
なお、外部騒音による誤動作防止を図った従来の音声制
御装置として、例えば特開昭56−22500号に開示
されたものがある。この従来装置は音声入力時の周波数
特性と騒音入力時の周波数特性との違いを判別し、騒音
入力時には、認識を中断せしめるようにしたもので、そ
れなりの効果は認められるが、登録パターンが騒音のパ
ターンに近い場合は、使用者の音声を騒音と判定してし
まい、機器を動作できない時や、会話による誤動作は防
止できないという欠点があった。
[発明の目的] 従って本発明の目的は上記従来技術の欠点に鑑みて、多
騒音環境下や、会話による誤動作を防止した音声制御装
置を提供することにある。
[課題を解決するための手段] 上記目的を達成するため、本願の第1の発明は、単語音
声認識装置を用いた音声制御装置において、ワードスポ
ツティング法により、連続的に所定のパターンと入力音
声パターンとの比較を行う一次認識手段と、該一次認識
手段により、入力音声パターンが所定のパターンと一致
した際に、所定時間だけ複数のパターンと入力音声パタ
ーンとを比較し、この比較結果に対応して制御対象機器
の制御を行う二次認識手段と、を含むことを要旨とする
また本願の第2の発明は、単語音声認識装置を用いた音
声制御装置において、ワードスポッティフグ法により、
連続的に複数のパターンから成る第1のパターン群と入
力音声パターンとの比較を行い、入力音声パターンと上
記第1のパターン群のパターンとの一致に応じて制御対
象機器の選択を行う一次認識手段と、該一次認識手段に
より入力音声パターンが上記複数のパターンのいずれか
に一致した際に上記一次認識手段により選択された制御
対象機器に対応した複数のパターンから成る第2のパタ
ーン群と入力音声とを所定時間だけ比較し、この比較結
果に応じて制御対象機器の制御を行う二次認識手段とを
含むことを要旨とする。
また本願の第3の発明は、単語音声認識装置を用いた音
声制御装置において、ワードスポツティング法により、
連続的に所定のパターンと入力音声パターンとの比較を
行う一次認識手段と、該一次認識手段により、入力音声
パターンが所定のパターンと一致した際に、耐ノイズ制
御を行う耐ノイズ操作手段と、該一次認識手段により、
入力音声パターンが所定のパターンと一致した際に、所
定時間だけ複数のパターンと入力音声パターンとを比較
し、この比較結果に対応して制御対象機器の制御を行う
二次認識手段と、を含むことを要旨とする。
更に本願の第4の発明は、単語音声認識装置を用いた音
声制御装置において、ワードスポツティング法により、
連続的に複数のパターンから成る第1のパターン群と入
力音声パターンとの比較を行い、入力音声パターンと上
記第1のパターン群のパターンとの一致に応じて、制御
対象機器の選択を行う一次認識手段と、該一次認識手段
により、入力音声パターンが上記複数のパターンのいず
れかに一致した際に耐ノイズ制御を行う耐ノイズ操作手
段と、上記一次認識手段により、入力音声パターンが上
記複数のいずれかに一致した際に該一次認識手段により
選択された制御対象機器に対応した複数のパターンから
成る第2のパターン群と入力音声パターンとを所定時間
だけ比較し、この比較結果に応じて制御対象機器の制御
を行う二次認識手段と、を含むことを要旨とする。
[作用] 一次の音声認識がなされて後、一定時間内に二次認識が
なされると、その時のパターン比較の結果に応じて機器
の制御が行われる6二次認識が一定時間内になされない
時は機器の制御が行われな%N。
[実施例] 以下図面に示す実施例を参照して本発明を説明する。
第1図は本発明装置の基本的構成を示す。同図において
、1はマイクロホン、2は音声認識装置。
3は耐ノイズ制御装置、4は第1のマイクロコンピュー
タ部、16は音声合成装置、17はスピーカである。第
1のマイクロコンピュータ部4は第1の中央演算装[C
PU1及び第1のメモリROM1.RAMIを備えてい
る。
マイクロホン1で音声信号を電気信号に変換し。
その信号に応答して音声認識装置2により音声パターン
のマツチング処理を行い第1のマイクロコンピュータ部
4に結果を出力する。耐ノイズ制御装置3は音声認識の
動作フローの中で第1のマイクロコンピュータ部4のC
PULが音声認識装置2の負担を軽減するた−めに外部
的にノイズを低減するための操作を行う。音声合成装置
16は、CPUIの指令に基づいて所望の音声メツセー
ジをスピーカ17から出力する。
音声認識装置2及び耐ノイズ制御装置3の構成例を第2
図及び第3図に示す。
第2図において、5はアンプ、6はAGC回路、7はバ
ンドパスフィルタバンク、8はマルチプレクサ、9はA
/Dコンバータ、10はパターンメモリ、11は第2の
マイクロコンピュータ部、12は入出力インターフェー
スである。
第2のマイクロコンピュータ部11は第2の中央演算装
置CPU2及び第2のメモリROM2、RAM2を有す
る。
第2図の音声認識装置2において、マイクロホン1から
の音声信号はアンプ5で十分な振幅にまで増幅されてか
らAGC回路6で一定振幅に制限される。その後AGC
回路6の出力はバンドパスフィルタバンク7により周波
数分析をしマルチブレクサ8で各フィルタ出力が次々に
切り換えられA/Dコンバータ9で量子化される。量子
化されたデータはパターンメモリ10に格納される。
パターンメモリ1oは1例えばマイクロホン1からのデ
ータを一時的に記憶する第1のエリアと、一次認識で上
記データと対比される登録パターンが記憶されている第
2のエリアと、二次認識で新たにマイクロホン1から入
力され上記第1のエリアに一時的に記憶されたデータと
対比される登録パターンが記憶されている第3のエリア
を有する。
第2のマイクロコンピュータ部11は音声認識の処理を
専用に行うもので第1図の装置全体をコントロールする
第1のマイクロコンピュータ部4とは異なる。音声認識
の結果は入出力インターフェースを通して第1のマイク
ロコンピュータ部4に伝えられる。
第3図で、13は入出力インターフェース、14はスイ
ッチ、15は耐ノイズ制御対象装置である。第3図の耐
ノイズ制御装置において、入出力インターフェース13
を通して第1のマイクロコンピュータ部4のCPUIか
らの制御を受けて耐ノイズ制御対象装置15(パワウィ
ンドなど)のコントロールをスイッチ14で行う。
一次認識の後に行う耐ノイズ操作というのはこの装置に
対する制御を意味していてノイズ環境の状況を改善する
外部的な操作すべてを含むものとする。
音声認識装置2の動作モードとしては2つあり、これら
をそれぞれ一次認識、二次認識と呼ぶことにする。
一次認識は二次認識を起動するためのキーワードを認識
するためのものでありキーワードが認識されて初めて二
次認識に移る。このキーワードは、例えば第10図に示
す如く、一次認識で認識された「電話機」という音声パ
ターンであり、この認識が行われると、標準パターン群
の中から標準ブロック1が選ばれ、ここに登録しである
音声パターンが二次認識における標準パターンとなる。
二次認識では指定された標準パターンブロックを用いて
音声認識を行い、対象機器を音声制御する。
一次認識では発声されたキーワードを音声の含まれる区
間からスポツティングするワードスポツティング手法に
より認識する。ワードスポツティング法は電子情報通信
学会技術研究報告5P88−18の53頁〜第59頁等
に示されるように音声を含む十分な広い区間に対してそ
の部分区間と単語標準パターンとの照合を連続的に行い
単語をスポツティングする方法であり、雑音を含む音声
の中から特定の単語があるかないかを判定するのに用い
ることができる。
また、ワードスポツティング手法による単語認識は従来
の単語認識に比べて処理時間が多いので認識の対象とな
る単語の数は少ない方が処理時間のうえで好ましい。こ
のモードはシステムの電源が入ったときからスタートし
、絶えず処理が行われ二次′L!PMja、モードにな
ったときのみ処理が中断される。
一次認識で用いるキーワードの登録語数は制御対象機器
の数程度であるので比較的少ない、また音声制御を開始
する直前のノイズ環境の状況は単語認識装置に好ましく
ないこともある。このように一次認識では登録語数が少
ないので、処理時間のかかる手法をある程度、許容でき
ることや、ノイズ環境に強い手法が必要であるという意
味からもワードスポツティング手法を一次認識で用いる
ことの有効性が説明できる。
一次認識であらかじめ定められた単語がスポツティング
されると外部的な処理で耐ノイズ操作を行う。この操作
は例えば車室内でこの制御装置を使うのであればラジオ
やカーステレオなどのボリュームを下げる、ミュートを
かけるまたは電源を切ったりパワウィンドを閉じたりす
ることで音声以外の音を遮断する目的で行うものである
。耐ノイズ操作の後に、次のモード(二次認ra)に入
る。
ここでは制御対象機器の制御に使うキーワードの認識を
行うので認識の対象となるキーワードの数が比較的多い
、また耐ノイズ操作をほどこしているのでノイズ環境の
状況も緩和されている。このことからここで従来と同様
の認識処理を行える。
このモードで従来と異なる点は二次認識モードに入った
時から一定期間内にユーザからの発声によるキーワード
入力がなければ、すなわち二次認識で登録キーワードと
の一致が見られなければ二次認識モードに戻り、さきに
スポツティングした特定単語を再び入力しなければ二次
認識モードに入らないようにすることである。こうする
ことにより音声認識装置2が外部ノイズ等により機器を
誤動作させてしまう機会は二次認識に入ってからの一定
期間に限られることになる。また、一次認識を通過した
のちは前述の耐ノイズ操作が行われていることから音声
認識装置2の誤動作の確率は更に低いものとなる。
二次認識で機器の制御について1つのキーワードでなく
、複数のキーワードを用いて制御したいときがある。こ
のとき、1つのキーワードの認識が終わる毎に二次認識
モードに戻っているとユーザに負担をかける場合がある
ので、特定のキーワードを二次認識で発声すると一次認
識に戻らずに現在の制御対象機器を複数のキーワードで
制御することも考えられることができる。一次認識にも
どるときも同様に特定のキーワードで対応するようにす
る。但しこのときは、二次認識モードにとどまることに
なるので、誤動作の機会は従来装置と同様に入ってくる
ことになる。従って発声のタイミングをブザーなどでユ
ーザに伝えてブザーが鳴ってから一定期間、二次認識を
行い、音声入力が無かった場合、再びブザーを鳴らしユ
ーザに入力を促すようにするのがよい。ブザーのなって
いる間は音声を受は付けないようにすれば二次認識にお
いて1つのキーワードで機器を制御する場合と同様の処
理を行える。
次に上述した本発明の装置の第1〜第4の実施例を、第
4図〜第9図を参照して説明する。第4図及び第5図は
本発明の第1の実施例の動作を説明するフローチャート
である。同図から明らかなように電源ONにより、直ち
にCPU2は、一次認識モードに入る。
二次認識照合用登録パターンとして例えば「ネクスト」
を登録しておき、常時、マイクロホン1から入力された
音声パターンとの照合をCPU2にて計算し、一致領域
であると判定されると、CPUIに二次モード通過を示
す信号を出力する。
CPUIは第5図の如く、CPU2から二次モード通過
信号が入力すると、内蔵のタイマのカウントアツプを行
うとともに、CPU2へ二次認識モード実行出力を出す
。そして第1図の音声合成装置16へ、二次認識モード
へ移行したことを示す信号を出力する。音声合成袋[1
6は、その入力に伴い例えば「操作指示して下さい。」
なる音声アナログ信号をスピーカ17へ出力する。
再度、第4図にもどり、CPUIから二次認識実行信号
がCPU2に入力される。CPU2の内蔵タイマ(図示
しない)のカウント値が所定値に達していなければ入力
された音声パターンがいくつかの登録パターン、例えば
「プレイJ  rFFJrREWJ  rアップ」 「
ダウン」等のいずれかに一致すると、一致したパターン
に対応する信号をCPUIへ出力する。
CPUIでは、二次モードで一致が検出されると、上記
した一致パターンに対応する機器制御信号を、制御対象
機器15へ出力する。
本発明の第2の実施例は制御したい機器が複数ある場合
に対応するもので、第6図、第7図及び第10図を参照
してその動作を説明する。
一次認識で、登録パターンを機器の数だけ用意しておき
、例えば「ラジオ」 「デツキ」等それらのいずれかに
一致判別されると、CPU2から一致した機器に対応す
る種別信号がCPUIへ出力される。CPUIはその種
別信号を受け、一致した機器に応じて登録されているパ
ターンの二次認識モード実行を指示する信号を出力する
。CPU2はその出力信号を受け、対象となっている機
器に対応したパターンとの照合を行うための二次認識モ
ードを実行し、タイムアウト信号がCPUIから出力さ
れない状態で、入力音声パターンが例えばラジオモード
に対応する登録パターンと一致すると、CPUIに制御
対象機器を示す種別信号と、一致に対応したモード種別
信号を出力し、CPUIは該当する機器に制御信号を出
力する。このように第2の実施例の特徴は二次認識モー
ドで複数の制御対象機器の認識用パターンを登録してお
き、一次ではまず対象機器を選択し、二次認識モードで
選択された機器を制御するパターンを認識する点にある
本発明の第3の実施例は、第8図に示されるように、第
1の実施例において、一次認識が判別されると、耐ノイ
ズ対象機器(第1図のパワウィンドやエアコンやステレ
オ)の状態をRAMIヘメモリする。そして直ちにエア
コンのスイッチをオフしたり、パワウィンドを閉じたり
の実行信号を第3図の耐ノイズ制御装置14へ出力する
。なおCPU2の動作のフローは第1の実施例と同一で
ある。
更に本発明の第4の実施例は、第9図に示されるように
、第2の実施例において、一次認識が判別されると、第
3の実施例同様、耐ノイズ処理を行うものである。
なおCPU2の動作のフローは第1の実施例と同一であ
る。
[発明の効果] 以上説明したように本発明によれば下記のような優れた
効果が得られる。
即ち、第1の発明によれば、一次認識がされた後一定時
間内に二次モードの認識がされない限り、機器は制御さ
れないため、誤動作は殆どなくなる。
また第2の発明によれば制御対象機器が多い場合、二次
認識処理時間が短くなり、第1の発明の効果に更にすば
やい機器制御が実現できる。
また第3の発明によれば、一次認識判別時に耐ノイズ操
作をするために、第1の発明の効果が更に完全なものと
成る。
更に第4の発明によれば、上記第2.第3の発明による
効果を加えた効果が得られる。
【図面の簡単な説明】
第1図は本発明の基本的構成を示すブロック図、第2図
は音声認識装置の構成例を示すブロック図、第3図は耐
ノイズ制御装置の構成例を示すブロック図、第4図乃至
第9図は夫々本発明の第1乃至第4の実施例の動作説明
用フローチャート、第10図は標準パターン群と標準パ
ターンブロックの説明図である。 1・・・・・・・・・マイクロホン、2・・・・・・・
・・音声認識装置。 3・・・・・・・・・耐ノイズ制御装置、4・・・・・
・・・・第1のマイクロコンピュータ部、15・・・・
・・・・・制御対象機器、16・・・・・・・・・音声
合成装置、17・・・・・・・・・スピーカ。

Claims (4)

    【特許請求の範囲】
  1. (1)単語音声認識装置を用いた音声制御装置において
    、ワードスポッティング法により、連続的に所定のパタ
    ーンと入力音声パターンとの比較を行う一次認識手段と
    、 該一次認識手段により、入力音声パターンが所定のパタ
    ーンと一致した際に、所定時間だけ複数のパターンと入
    力音声パターンとを比較し、この比較結果に対応して制
    御対象機器の制御を行う二次認識手段と、を含むことを
    特徴とする音声制御装置。
  2. (2)単語音声認識装置を用いた音声制御装置において
    、ワードスポッティング法により、連続的に複数のパタ
    ーンから成る第1のパターン群と入力音声パターンとの
    比較を行い、入力音声パターンと上記第1のパターン群
    のパターンとの一致に応じて制御対象機器の選択を行う
    一次認識手段と、該一次認識手段により入力音声パター
    ンが上記複数のパターンのいずれかに一致した際に、該
    一次認識手段により選択された制御対象機器に対応した
    複数のパターンから成る第2のパターン群と入力音声と
    を所定時間だけ比較し、この比較結果に応じて制御対象
    機器の制御を行う二次認識手段と、を含むことを特徴と
    する音声制御装置。
  3. (3)単語音声認識装置を用いた音声制御装置において
    、ワードスポッティング法により、連続的に所定のパタ
    ーンと入力音声パターンとの比較を行う一次認識手段と
    、 該一次認識手段により、入力音声パターンが所定のパタ
    ーンと一致した際に、耐ノイズ制御を行う耐ノイズ操作
    手段と、 上記一次認識手段により、入力音声パターンが所定のパ
    ターンと一致した際に、所定時間だけ複数のパターンと
    入力音声パターンとを比較し、この比較結果に対応して
    制御対象機器の制御を行う二次認識手段と、を含むこと
    を特徴とする音声制御装置。
  4. (4)単語音声認識装置を用いた音声制御装置において
    、ワードスポッティング法により、連続的に複数のパタ
    ーンから成る第1のパターン群と入力音声パターンとの
    比較を行い、入力音声パターンと上記第1のパターン群
    のパターンとの一致に応じて、制御対象機器の選択を行
    う一次認識手段と、 該一次認識手段により、入力音声パターンが上記複数の
    パターンのいずれかに一致した際に耐ノイズ制御を行う
    耐ノイズ操作手段と、 上記一次認識手段により、入力音声パターンが上記複数
    のパターンのいずれかに一致した際に該一次認識手段に
    より選択された制御対象機器に対応した複数のパターン
    から成る第2のパターン群と入力音声パターンとを所定
    時間だけ比較し、この比較結果に応じて制御対象機器の
    制御を行う二次認識手段と、を含むことを特徴とする音
    声制御装置。
JP89341189A 1989-12-28 1989-12-28 音声制御装置 Pending JPH03200298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP89341189A JPH03200298A (ja) 1989-12-28 1989-12-28 音声制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP89341189A JPH03200298A (ja) 1989-12-28 1989-12-28 音声制御装置

Publications (1)

Publication Number Publication Date
JPH03200298A true JPH03200298A (ja) 1991-09-02

Family

ID=18344054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP89341189A Pending JPH03200298A (ja) 1989-12-28 1989-12-28 音声制御装置

Country Status (1)

Country Link
JP (1) JPH03200298A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007147962A (ja) * 2005-11-28 2007-06-14 Fujitsu Ten Ltd 車両用音声認識装置、開閉体制御装置及び音声認識方法
JP2008134502A (ja) * 2006-11-29 2008-06-12 Nissan Motor Co Ltd 音声認識装置、および音声認識方法
JP2017520012A (ja) * 2014-04-21 2017-07-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated スピーチ入力によってアプリケーションをアクティブ化するための方法および装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007147962A (ja) * 2005-11-28 2007-06-14 Fujitsu Ten Ltd 車両用音声認識装置、開閉体制御装置及び音声認識方法
JP2008134502A (ja) * 2006-11-29 2008-06-12 Nissan Motor Co Ltd 音声認識装置、および音声認識方法
JP2017520012A (ja) * 2014-04-21 2017-07-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated スピーチ入力によってアプリケーションをアクティブ化するための方法および装置
US10770075B2 (en) 2014-04-21 2020-09-08 Qualcomm Incorporated Method and apparatus for activating application by speech input

Similar Documents

Publication Publication Date Title
US9571617B2 (en) Controlling mute function on telephone
EP1681670A1 (en) Voice activation
JPH07191715A (ja) 位置従属の言語コマンドを実行する方法及びコンピュータ制御システム
JPH03200298A (ja) 音声制御装置
JPS6332394B2 (ja)
JPH0627986A (ja) 音声認識装置利用の機器制御システム
JPS59180599A (ja) 車載用音声認識制御装置
JPH01321499A (ja) 音声認識装置
JP2754960B2 (ja) 音声認識装置
JP2003255987A (ja) 音声認識を利用した機器の制御方法、制御装置及び制御プログラム
JP2825272B2 (ja) エレベータ装置
JPH0451376B2 (ja)
JPS6330639B2 (ja)
JP3003130B2 (ja) 音声認識装置
JPS5914769B2 (ja) 音声機器
JPS5885498A (ja) 音声入力装置
JP3294286B2 (ja) 音声認識システム
JPH05210397A (ja) 音声認識装置
JPH11109987A (ja) 音声認識装置
JPH04246696A (ja) 音声認識装置
JPH03155599A (ja) 音声認識装置
JPH06202690A (ja) 音声認識による音響機器制御装置
JPH04199197A (ja) 音声認識装置
JPS58176700A (ja) 音声認識装置
JPH044646A (ja) 自動ダイヤリングシステム