JPS6136238B2

JPS6136238B2 -

Info

Publication number: JPS6136238B2
Application number: JP55183595A
Authority: JP
Inventors: Kyoshi Tajima; Masayuki Iida; Hiroki Oonishi
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1980-12-23
Filing date: 1980-12-23
Publication date: 1986-08-16
Also published as: JPS57105799A

Description

【発明の詳細な説明】本発明は音声認識装置に関し、特に音声のみに
依つてモードの変更を可能とした装置を提供する
ものである。音声認識装置に於て、認識率が悪い
等の理由から予め登録されている音声の参照デー
タの変更を行う必要が生じた場合、通常は登録モ
ード、或いはテストモードに変更するモード変更
スイツチを操作してモードを変更し、参照データ
の書き換え、或いは修正を行う。ところが電話回
線等を介してこの遠隔認識の場合にはこのように
モード変更スイツチを操作する事は出来ず、操作
手段としては音声のみである。従つてそのモード
変更の為に“登録”とか“テスト”とかの音声を
認識せしめ、登録モードとかテストモードとかす
れば良い訳であるが、認識率が低い場合、このモ
ード変更の為の音声さえも認識出来ない場合が考
えられる。本発明はこのような点に鑑みて為され
たものであつて、具体的な音声の認識は不可能で
あつても音の存在の有無の判定は簡単であるから
これを利用してモード登録、又はテストに変更せ
んとするものである。本発明の原理は、次の通り
である。即ち単語単位の認識方式（パターンマツ
チング法）を採るものは一般的に音が発生した時
から一定時間、具体的には１〜２秒間のみ音声入
力を受け付け、その時間以上の音が入力されると
その音（長音）は認識以外の単語、例えば雑音と
看做している。この長音が通常の音声よりはるか
に長い時間継続した場合に登録又はテストへモー
ド変更せんとするものである。第１図は本発明装
置の構成を示すブロツク図であつて、１は音声を
電気信号に変換するマイクロフオン、２はアン
プ、３，４，５は該アンプ２で増巾された信号か
らゼロクロスを検出するゼロクロス検出回路、音
声スペクトルを抽出する音声スペクトル抽出回
路、音声領域を検出する音声領域検出回路、６は
このゼロクロス検出回路３、並びに音声スペクト
ル抽出回路４に連つたA/D変換並びにアナログス
イツチ、７は音声認識の為に必要な音声データを
予め登録しておく参照データメモリ、８はこの参
照データメモリ７に予め登録された音声データ
と、マイクロフオン１からの音声データとの類似
度を検出してその音声の認識をする認識回路を含
む制御回路で、その認識結果に基づいて例えば門
灯とかクーラとかの電気機器のオン、オフを制御
するとかの制御信号CTLを出力する。９はこの
制御回路８にアンプ１０を介して連つたスピーカ
で、音声認識動作の開始時点を示す開始音を発す
る。１１は上記制御回路８に接続されたモード切
り換えスイツチで、音声認識モード、音声登録モ
ード、並びにテストモードに夫々該当するスイツ
チを持つている。１２は上記音声領域検出回路５
に連つた単安定回路から成る長音検出回路で、音
声領域検出回路５で音声信号が検出された時点で
トリガーされ、通常の音声では存在し得ないよう
な長い時間、例えば10秒間程度の時間設定が為さ
れている。そしてこの10秒間断える事なく連続し
て音声領域検出回路５から音声信号が得られる
と、この長音検出回路１２はタイムアツプして長
音検出信号を制御回路８に出力し、上記モード切
り換えスイツチ１１を操作した場合と同様に登録
又はテストにモード変更するものである。次に第
２図のタイムチヤートを参照しつつ動作説明を行
う。スピーカ１０から音声認識動作の開始時点を
示す開始音Ａが発せられ、それに先導されて認識
音声が入力されると、ゼロクロス検出回路３、音
声スペクトル抽出回路４、音声領域検出回路５
A/D変換並びにアナログスイツチ６及び制御回路
８で音声認識動作を行い、その認識結果に基いて
制御信号CTLを出力している。この時マイクロ
フオン１から得られる入力音声Ｂは周期T₀，T₁
に示す如く、音が存在する時間は非常に短いの
で、この入力音声Ｂに依つてトリガーされる長音
検出回路１２はタイムアツプする事はない。従つ
て長音検出信号Ｃは出力されない。

ところが、例えば音声の認識率が低下して来て
参照データメモリ７の参照データを書き換えるか
或いは修正を加える必要が生じた時は周期T₂で
示す如くマイクロフオン１から長音検出回路１２
の設定時間より長い連続した音声Ｂを入力する事
に依つて長音検出回路１２がタイムアツプして長
音検出信号Ｃを出力する。この長音検出信号Ｃの
到来に依つてモードを認識モードから参照データ
メモリ７に記憶されている参照データの再登録の
為の登録モード、或いはその参照データの修正の
為のテストモードに切り換える。本発明の以上の
説明に於ては認識動作を先導する開始音としては
機械的音を採用したが、第１図の破線で示す如
く、合成音データメモリ１３と音声合成器１４と
を追加して、開始音に代えて“お話し下さい”と
か“Please Speak”とかの認識音声の先導に適
した合成音声を用いる事も出来る。本発明は以上
の説明から明らかな如く、長音状態が予め定めら
れた時間以上断える事なく連続して到来した時に
音声認識装置のモードを登録、或いはテストに変
更する構成であるので、音声のみに依つてモード
変更が可能となり、電話回線を用いた遠隔地から
の音声認識の場合の認識等の低下を補う事が出来
る。更に本発明に於てモード変更の際に用いられ
る音声も音声として認識が出来なくでも音の存在
のみを判断しているので、非常に認識条件の悪い
場合でもモード変更が可能となり、その悪条件に
即応した状態で認識動作を行う事が出来、結果的
に認識率を高め得る。

【図面の簡単な説明】

第１図は本発明装置の構成を示すブロツク図、
第２図はその動作説明の為のタイミングチヤート
であつて、８は制御回路、１２は長音検出回路、
を夫々示している。

Claims

【特許請求の範囲】

１参照データを登録する為の音声登録モード
と、登録音声のテストを行うテストモードと、入
力音声を登録音声と比較し認識する認識モード
と、を備えて成る音声認識装置に於て、音声を電
気信号に変換する機械電気変換手段と、音声登録
モードに於て登録した登録音声を記憶する参照デ
ータメモリと、上記機械電気変換手段から得られ
る音声信号と参照データメモリに貯えられている
登録音声とを比較し認識する音声認識回路と、一
定時間以上有音が継続する長音状態を検出する長
音検出手段と、から成り、認識モードに於てこの
長音検出手段が検出信号を出力した時には認識モ
ードから登録モード、或いはテストモードにモー
ド変更する事を特徴とした音声認識装置。