JPS6136238B2 - - Google Patents
Info
- Publication number
- JPS6136238B2 JPS6136238B2 JP55183595A JP18359580A JPS6136238B2 JP S6136238 B2 JPS6136238 B2 JP S6136238B2 JP 55183595 A JP55183595 A JP 55183595A JP 18359580 A JP18359580 A JP 18359580A JP S6136238 B2 JPS6136238 B2 JP S6136238B2
- Authority
- JP
- Japan
- Prior art keywords
- mode
- voice
- sound
- recognition
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001514 detection method Methods 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Description
【発明の詳細な説明】
本発明は音声認識装置に関し、特に音声のみに
依つてモードの変更を可能とした装置を提供する
ものである。音声認識装置に於て、認識率が悪い
等の理由から予め登録されている音声の参照デー
タの変更を行う必要が生じた場合、通常は登録モ
ード、或いはテストモードに変更するモード変更
スイツチを操作してモードを変更し、参照データ
の書き換え、或いは修正を行う。ところが電話回
線等を介してこの遠隔認識の場合にはこのように
モード変更スイツチを操作する事は出来ず、操作
手段としては音声のみである。従つてそのモード
変更の為に“登録”とか“テスト”とかの音声を
認識せしめ、登録モードとかテストモードとかす
れば良い訳であるが、認識率が低い場合、このモ
ード変更の為の音声さえも認識出来ない場合が考
えられる。本発明はこのような点に鑑みて為され
たものであつて、具体的な音声の認識は不可能で
あつても音の存在の有無の判定は簡単であるから
これを利用してモード登録、又はテストに変更せ
んとするものである。本発明の原理は、次の通り
である。即ち単語単位の認識方式(パターンマツ
チング法)を採るものは一般的に音が発生した時
から一定時間、具体的には1〜2秒間のみ音声入
力を受け付け、その時間以上の音が入力されると
その音(長音)は認識以外の単語、例えば雑音と
看做している。この長音が通常の音声よりはるか
に長い時間継続した場合に登録又はテストへモー
ド変更せんとするものである。第1図は本発明装
置の構成を示すブロツク図であつて、1は音声を
電気信号に変換するマイクロフオン、2はアン
プ、3,4,5は該アンプ2で増巾された信号か
らゼロクロスを検出するゼロクロス検出回路、音
声スペクトルを抽出する音声スペクトル抽出回
路、音声領域を検出する音声領域検出回路、6は
このゼロクロス検出回路3、並びに音声スペクト
ル抽出回路4に連つたA/D変換並びにアナログス
イツチ、7は音声認識の為に必要な音声データを
予め登録しておく参照データメモリ、8はこの参
照データメモリ7に予め登録された音声データ
と、マイクロフオン1からの音声データとの類似
度を検出してその音声の認識をする認識回路を含
む制御回路で、その認識結果に基づいて例えば門
灯とかクーラとかの電気機器のオン、オフを制御
するとかの制御信号CTLを出力する。9はこの
制御回路8にアンプ10を介して連つたスピーカ
で、音声認識動作の開始時点を示す開始音を発す
る。11は上記制御回路8に接続されたモード切
り換えスイツチで、音声認識モード、音声登録モ
ード、並びにテストモードに夫々該当するスイツ
チを持つている。12は上記音声領域検出回路5
に連つた単安定回路から成る長音検出回路で、音
声領域検出回路5で音声信号が検出された時点で
トリガーされ、通常の音声では存在し得ないよう
な長い時間、例えば10秒間程度の時間設定が為さ
れている。そしてこの10秒間断える事なく連続し
て音声領域検出回路5から音声信号が得られる
と、この長音検出回路12はタイムアツプして長
音検出信号を制御回路8に出力し、上記モード切
り換えスイツチ11を操作した場合と同様に登録
又はテストにモード変更するものである。次に第
2図のタイムチヤートを参照しつつ動作説明を行
う。スピーカ10から音声認識動作の開始時点を
示す開始音Aが発せられ、それに先導されて認識
音声が入力されると、ゼロクロス検出回路3、音
声スペクトル抽出回路4、音声領域検出回路5
A/D変換並びにアナログスイツチ6及び制御回路
8で音声認識動作を行い、その認識結果に基いて
制御信号CTLを出力している。この時マイクロ
フオン1から得られる入力音声Bは周期T0,T1
に示す如く、音が存在する時間は非常に短いの
で、この入力音声Bに依つてトリガーされる長音
検出回路12はタイムアツプする事はない。従つ
て長音検出信号Cは出力されない。
依つてモードの変更を可能とした装置を提供する
ものである。音声認識装置に於て、認識率が悪い
等の理由から予め登録されている音声の参照デー
タの変更を行う必要が生じた場合、通常は登録モ
ード、或いはテストモードに変更するモード変更
スイツチを操作してモードを変更し、参照データ
の書き換え、或いは修正を行う。ところが電話回
線等を介してこの遠隔認識の場合にはこのように
モード変更スイツチを操作する事は出来ず、操作
手段としては音声のみである。従つてそのモード
変更の為に“登録”とか“テスト”とかの音声を
認識せしめ、登録モードとかテストモードとかす
れば良い訳であるが、認識率が低い場合、このモ
ード変更の為の音声さえも認識出来ない場合が考
えられる。本発明はこのような点に鑑みて為され
たものであつて、具体的な音声の認識は不可能で
あつても音の存在の有無の判定は簡単であるから
これを利用してモード登録、又はテストに変更せ
んとするものである。本発明の原理は、次の通り
である。即ち単語単位の認識方式(パターンマツ
チング法)を採るものは一般的に音が発生した時
から一定時間、具体的には1〜2秒間のみ音声入
力を受け付け、その時間以上の音が入力されると
その音(長音)は認識以外の単語、例えば雑音と
看做している。この長音が通常の音声よりはるか
に長い時間継続した場合に登録又はテストへモー
ド変更せんとするものである。第1図は本発明装
置の構成を示すブロツク図であつて、1は音声を
電気信号に変換するマイクロフオン、2はアン
プ、3,4,5は該アンプ2で増巾された信号か
らゼロクロスを検出するゼロクロス検出回路、音
声スペクトルを抽出する音声スペクトル抽出回
路、音声領域を検出する音声領域検出回路、6は
このゼロクロス検出回路3、並びに音声スペクト
ル抽出回路4に連つたA/D変換並びにアナログス
イツチ、7は音声認識の為に必要な音声データを
予め登録しておく参照データメモリ、8はこの参
照データメモリ7に予め登録された音声データ
と、マイクロフオン1からの音声データとの類似
度を検出してその音声の認識をする認識回路を含
む制御回路で、その認識結果に基づいて例えば門
灯とかクーラとかの電気機器のオン、オフを制御
するとかの制御信号CTLを出力する。9はこの
制御回路8にアンプ10を介して連つたスピーカ
で、音声認識動作の開始時点を示す開始音を発す
る。11は上記制御回路8に接続されたモード切
り換えスイツチで、音声認識モード、音声登録モ
ード、並びにテストモードに夫々該当するスイツ
チを持つている。12は上記音声領域検出回路5
に連つた単安定回路から成る長音検出回路で、音
声領域検出回路5で音声信号が検出された時点で
トリガーされ、通常の音声では存在し得ないよう
な長い時間、例えば10秒間程度の時間設定が為さ
れている。そしてこの10秒間断える事なく連続し
て音声領域検出回路5から音声信号が得られる
と、この長音検出回路12はタイムアツプして長
音検出信号を制御回路8に出力し、上記モード切
り換えスイツチ11を操作した場合と同様に登録
又はテストにモード変更するものである。次に第
2図のタイムチヤートを参照しつつ動作説明を行
う。スピーカ10から音声認識動作の開始時点を
示す開始音Aが発せられ、それに先導されて認識
音声が入力されると、ゼロクロス検出回路3、音
声スペクトル抽出回路4、音声領域検出回路5
A/D変換並びにアナログスイツチ6及び制御回路
8で音声認識動作を行い、その認識結果に基いて
制御信号CTLを出力している。この時マイクロ
フオン1から得られる入力音声Bは周期T0,T1
に示す如く、音が存在する時間は非常に短いの
で、この入力音声Bに依つてトリガーされる長音
検出回路12はタイムアツプする事はない。従つ
て長音検出信号Cは出力されない。
ところが、例えば音声の認識率が低下して来て
参照データメモリ7の参照データを書き換えるか
或いは修正を加える必要が生じた時は周期T2で
示す如くマイクロフオン1から長音検出回路12
の設定時間より長い連続した音声Bを入力する事
に依つて長音検出回路12がタイムアツプして長
音検出信号Cを出力する。この長音検出信号Cの
到来に依つてモードを認識モードから参照データ
メモリ7に記憶されている参照データの再登録の
為の登録モード、或いはその参照データの修正の
為のテストモードに切り換える。本発明の以上の
説明に於ては認識動作を先導する開始音としては
機械的音を採用したが、第1図の破線で示す如
く、合成音データメモリ13と音声合成器14と
を追加して、開始音に代えて“お話し下さい”と
か“Please Speak”とかの認識音声の先導に適
した合成音声を用いる事も出来る。本発明は以上
の説明から明らかな如く、長音状態が予め定めら
れた時間以上断える事なく連続して到来した時に
音声認識装置のモードを登録、或いはテストに変
更する構成であるので、音声のみに依つてモード
変更が可能となり、電話回線を用いた遠隔地から
の音声認識の場合の認識等の低下を補う事が出来
る。更に本発明に於てモード変更の際に用いられ
る音声も音声として認識が出来なくでも音の存在
のみを判断しているので、非常に認識条件の悪い
場合でもモード変更が可能となり、その悪条件に
即応した状態で認識動作を行う事が出来、結果的
に認識率を高め得る。
参照データメモリ7の参照データを書き換えるか
或いは修正を加える必要が生じた時は周期T2で
示す如くマイクロフオン1から長音検出回路12
の設定時間より長い連続した音声Bを入力する事
に依つて長音検出回路12がタイムアツプして長
音検出信号Cを出力する。この長音検出信号Cの
到来に依つてモードを認識モードから参照データ
メモリ7に記憶されている参照データの再登録の
為の登録モード、或いはその参照データの修正の
為のテストモードに切り換える。本発明の以上の
説明に於ては認識動作を先導する開始音としては
機械的音を採用したが、第1図の破線で示す如
く、合成音データメモリ13と音声合成器14と
を追加して、開始音に代えて“お話し下さい”と
か“Please Speak”とかの認識音声の先導に適
した合成音声を用いる事も出来る。本発明は以上
の説明から明らかな如く、長音状態が予め定めら
れた時間以上断える事なく連続して到来した時に
音声認識装置のモードを登録、或いはテストに変
更する構成であるので、音声のみに依つてモード
変更が可能となり、電話回線を用いた遠隔地から
の音声認識の場合の認識等の低下を補う事が出来
る。更に本発明に於てモード変更の際に用いられ
る音声も音声として認識が出来なくでも音の存在
のみを判断しているので、非常に認識条件の悪い
場合でもモード変更が可能となり、その悪条件に
即応した状態で認識動作を行う事が出来、結果的
に認識率を高め得る。
第1図は本発明装置の構成を示すブロツク図、
第2図はその動作説明の為のタイミングチヤート
であつて、8は制御回路、12は長音検出回路、
を夫々示している。
第2図はその動作説明の為のタイミングチヤート
であつて、8は制御回路、12は長音検出回路、
を夫々示している。
Claims (1)
- 1 参照データを登録する為の音声登録モード
と、登録音声のテストを行うテストモードと、入
力音声を登録音声と比較し認識する認識モード
と、を備えて成る音声認識装置に於て、音声を電
気信号に変換する機械電気変換手段と、音声登録
モードに於て登録した登録音声を記憶する参照デ
ータメモリと、上記機械電気変換手段から得られ
る音声信号と参照データメモリに貯えられている
登録音声とを比較し認識する音声認識回路と、一
定時間以上有音が継続する長音状態を検出する長
音検出手段と、から成り、認識モードに於てこの
長音検出手段が検出信号を出力した時には認識モ
ードから登録モード、或いはテストモードにモー
ド変更する事を特徴とした音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP55183595A JPS57105799A (en) | 1980-12-23 | 1980-12-23 | Device for identifying sound |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP55183595A JPS57105799A (en) | 1980-12-23 | 1980-12-23 | Device for identifying sound |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS57105799A JPS57105799A (en) | 1982-07-01 |
JPS6136238B2 true JPS6136238B2 (ja) | 1986-08-16 |
Family
ID=16138562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP55183595A Granted JPS57105799A (en) | 1980-12-23 | 1980-12-23 | Device for identifying sound |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS57105799A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001034293A (ja) * | 1999-06-30 | 2001-02-09 | Internatl Business Mach Corp <Ibm> | 音声を転写するための方法及び装置 |
-
1980
- 1980-12-23 JP JP55183595A patent/JPS57105799A/ja active Granted
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001034293A (ja) * | 1999-06-30 | 2001-02-09 | Internatl Business Mach Corp <Ibm> | 音声を転写するための方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS57105799A (en) | 1982-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0077194B1 (en) | Speech recognition system | |
US5960393A (en) | User selectable multiple threshold criteria for voice recognition | |
US4426733A (en) | Voice-controlled operator-interacting radio transceiver | |
JP3674990B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JP3284832B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
JPH0782351B2 (ja) | 音声コマンドによりデジットシーケンスを入力するための方法 | |
JPH096390A (ja) | 音声認識対話処理方法および音声認識対話装置 | |
JP3000999B1 (ja) | 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体 | |
US11437022B2 (en) | Performing speaker change detection and speaker recognition on a trigger phrase | |
US4109104A (en) | Vocal timing indicator device for use in voice recognition | |
JPS6136238B2 (ja) | ||
JPS6136237B2 (ja) | ||
JP2000122678A (ja) | 音声認識機器制御装置 | |
WO1994002936A1 (en) | Voice recognition apparatus and method | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JPH02103599A (ja) | 音声認識装置 | |
JP2500761Y2 (ja) | 音声認識装置 | |
JPH06233359A (ja) | 制御装置 | |
JPH04177400A (ja) | 音声起動方式 | |
JP2975808B2 (ja) | 音声認識装置 | |
JPH039400A (ja) | 音声認識装置 | |
JP3629145B2 (ja) | 音声認識装置 | |
KR940005044B1 (ko) | 음성 인식장치 및 그의 음성 등록방법 | |
JPH06202690A (ja) | 音声認識による音響機器制御装置 | |
JPS60205600A (ja) | 音声認識装置 |