JPH05134694A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH05134694A JPH05134694A JP3326933A JP32693391A JPH05134694A JP H05134694 A JPH05134694 A JP H05134694A JP 3326933 A JP3326933 A JP 3326933A JP 32693391 A JP32693391 A JP 32693391A JP H05134694 A JPH05134694 A JP H05134694A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- noise
- input
- unit
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000004044 response Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 abstract description 18
- 230000007613 environmental effect Effects 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【目的】 音声の認識率を良くする。
【構成】 A/D変換器2を介してマイク1より供給さ
れた騒音信号は、フーリエ変換部11において、フーリ
エ変換され、パワースペクトルが計算される。システム
制御部6において、現在マイク1より出力されている信
号のパワースペクトルの平均値と、現在騒音メモリ5に
記憶されている騒音信号のパワースペクトルの平均値と
が比較され、現在マイク1より出力されている信号のパ
ワースペクトルの平均値と現在騒音メモリ5に記憶され
ている騒音信号のパワースペクトルの平均値との差が、
所定の基準値Aを越えたと判定された場合、現在マイク
1より出力されている信号を騒音メモリ5に記憶するよ
うに、音声記憶読み出し部3に制御信号が出力され、現
在マイク1より出力されている信号が、現在記憶されて
いる信号(騒音信号)に変わって、騒音メモリ5に記憶
し直される。
れた騒音信号は、フーリエ変換部11において、フーリ
エ変換され、パワースペクトルが計算される。システム
制御部6において、現在マイク1より出力されている信
号のパワースペクトルの平均値と、現在騒音メモリ5に
記憶されている騒音信号のパワースペクトルの平均値と
が比較され、現在マイク1より出力されている信号のパ
ワースペクトルの平均値と現在騒音メモリ5に記憶され
ている騒音信号のパワースペクトルの平均値との差が、
所定の基準値Aを越えたと判定された場合、現在マイク
1より出力されている信号を騒音メモリ5に記憶するよ
うに、音声記憶読み出し部3に制御信号が出力され、現
在マイク1より出力されている信号が、現在記憶されて
いる信号(騒音信号)に変わって、騒音メモリ5に記憶
し直される。
Description
【0001】
【産業上の利用分野】本発明は、音声を認識する場合に
用いて好適な音声認識装置に関する。
用いて好適な音声認識装置に関する。
【0002】
【従来の技術】従来の音声認識装置では、任意または特
定の話者の音声から抽出された例えば線形予測係数など
の特徴パラメータを用いて、あらかじめ作成された標準
パターンと、装置に入力された音声から抽出された特徴
パラメータを用いて作成された音声パターンとが比較さ
れ、この音声パターンに、より類似した(音声パターン
との距離が、より近い)標準パターンに対応する音声
が、装置に入力された音声の認識結果として出力され
る。
定の話者の音声から抽出された例えば線形予測係数など
の特徴パラメータを用いて、あらかじめ作成された標準
パターンと、装置に入力された音声から抽出された特徴
パラメータを用いて作成された音声パターンとが比較さ
れ、この音声パターンに、より類似した(音声パターン
との距離が、より近い)標準パターンに対応する音声
が、装置に入力された音声の認識結果として出力され
る。
【0003】
【発明が解決しようとする課題】ところで、上述した標
準パターンを作成するための音声は、その音声以外の
音、即ち騒音を遮断することができる例えば防音室など
で、一般的に録音(記憶)される。そして、このように
録音されたS/Nの良い状態の音声から標準パターンが
作成されるが、装置はこのように騒音が遮断された状況
で使用される場合より、例えば自動車のエンジン音や通
行人の話声などの騒音(環境騒音)が存在する状況で使
用される場合がはるかに多いので、認識しようとしてい
る音声の他に、このような環境騒音が装置に入力され、
認識率が劣化する課題があった。
準パターンを作成するための音声は、その音声以外の
音、即ち騒音を遮断することができる例えば防音室など
で、一般的に録音(記憶)される。そして、このように
録音されたS/Nの良い状態の音声から標準パターンが
作成されるが、装置はこのように騒音が遮断された状況
で使用される場合より、例えば自動車のエンジン音や通
行人の話声などの騒音(環境騒音)が存在する状況で使
用される場合がはるかに多いので、認識しようとしてい
る音声の他に、このような環境騒音が装置に入力され、
認識率が劣化する課題があった。
【0004】そこで、環境騒音により劣化する認識率を
改善するために、装置が使用される場所で発生すること
が予想される環境騒音を、あらかじめ付加した標準パタ
ーンを作成する方法が有効であることが知られている。
しかしながら、予想して付加した環境騒音が、常に定常
的に発生している場合は少なく、予想して付加した環境
騒音とは異なる環境騒音が発生したり、逆に予想して付
加した環境騒音が発生しない場合には、さらに認識率が
劣化してしまう課題があった。
改善するために、装置が使用される場所で発生すること
が予想される環境騒音を、あらかじめ付加した標準パタ
ーンを作成する方法が有効であることが知られている。
しかしながら、予想して付加した環境騒音が、常に定常
的に発生している場合は少なく、予想して付加した環境
騒音とは異なる環境騒音が発生したり、逆に予想して付
加した環境騒音が発生しない場合には、さらに認識率が
劣化してしまう課題があった。
【0005】本発明は、このような状況に鑑みてなされ
たものであり、音声の認識率を向上させるものである。
たものであり、音声の認識率を向上させるものである。
【0006】
【課題を解決するための手段】請求項1に記載の音声認
識装置は、注目音声および騒音を入力する例えばマイク
1などよりなる入力手段と、マイク1より入力された注
目音声を記憶する例えば音声メモリ4などよりなる音声
記憶手段と、マイク1より入力された騒音を記憶する例
えば騒音メモリ5などよりなる騒音記憶手段と、マイク
1より入力された注目音声より音声パターンを作成する
とともに、音声メモリ4に記憶された注目音声と騒音メ
モリ5に記憶された騒音とを加算して標準パターンを作
成する例えばパターン作成部8などよりなるパターン作
成手段と、標準パターンを記憶する例えばパターン記憶
部10などよりなる標準パターン記憶手段と、標準パタ
ーンと音声パターンとを比較して、マイク1より入力さ
れた注目音声を認識する例えば音声認識部9などよりな
る認識手段とを備え、騒音メモリ5は、マイク1より入
力される騒音の変化に対応して、記憶している騒音を順
次更新することを特徴とする。
識装置は、注目音声および騒音を入力する例えばマイク
1などよりなる入力手段と、マイク1より入力された注
目音声を記憶する例えば音声メモリ4などよりなる音声
記憶手段と、マイク1より入力された騒音を記憶する例
えば騒音メモリ5などよりなる騒音記憶手段と、マイク
1より入力された注目音声より音声パターンを作成する
とともに、音声メモリ4に記憶された注目音声と騒音メ
モリ5に記憶された騒音とを加算して標準パターンを作
成する例えばパターン作成部8などよりなるパターン作
成手段と、標準パターンを記憶する例えばパターン記憶
部10などよりなる標準パターン記憶手段と、標準パタ
ーンと音声パターンとを比較して、マイク1より入力さ
れた注目音声を認識する例えば音声認識部9などよりな
る認識手段とを備え、騒音メモリ5は、マイク1より入
力される騒音の変化に対応して、記憶している騒音を順
次更新することを特徴とする。
【0007】この音声認識装置は、マイク1より入力さ
れる騒音の変化を周期的に検出する例えばフーリエ変換
部11およびシステム制御部6などよりなる検出手段を
さらに備えることができ、騒音メモリ5は、フーリエ変
換部11およびシステム制御部6により検出された騒音
の変化に対応して、記憶している騒音を順次更新するこ
とができる。
れる騒音の変化を周期的に検出する例えばフーリエ変換
部11およびシステム制御部6などよりなる検出手段を
さらに備えることができ、騒音メモリ5は、フーリエ変
換部11およびシステム制御部6により検出された騒音
の変化に対応して、記憶している騒音を順次更新するこ
とができる。
【0008】また、この音声認識装置は、音声認識部9
による認識結果に対応して音声メモリ4に記憶された注
目音声を再生する例えばD/A変換器12およびスピー
カ13などよりなる再生手段をさらに備えることができ
る。
による認識結果に対応して音声メモリ4に記憶された注
目音声を再生する例えばD/A変換器12およびスピー
カ13などよりなる再生手段をさらに備えることができ
る。
【0009】
【作用】請求項1に記載の音声認識装置においては、マ
イク1より入力された注目音声および騒音を音声メモリ
4、および騒音メモリ5にそれぞれ記憶し、記憶された
注目音声および騒音を加算して標準パターンを作成する
とともに、マイク1より入力された注目音声より音声パ
ターンを作成し、標準パターンと音声パターンとを比較
して、注目音声を認識する。さらに、騒音メモリ5は、
マイク1より入力される騒音の変化に対応して、記憶し
ている騒音を順次更新する。従って、環境に対応した騒
音を付加した標準パターンが作成されるので、常に良好
な認識率を得ることができる。
イク1より入力された注目音声および騒音を音声メモリ
4、および騒音メモリ5にそれぞれ記憶し、記憶された
注目音声および騒音を加算して標準パターンを作成する
とともに、マイク1より入力された注目音声より音声パ
ターンを作成し、標準パターンと音声パターンとを比較
して、注目音声を認識する。さらに、騒音メモリ5は、
マイク1より入力される騒音の変化に対応して、記憶し
ている騒音を順次更新する。従って、環境に対応した騒
音を付加した標準パターンが作成されるので、常に良好
な認識率を得ることができる。
【0010】マイク1より入力される騒音の変化を周期
的に検出し、検出された騒音の変化に対応して、騒音メ
モリ5の記憶している騒音を順次更新する場合において
は、環境に対応した騒音を付加した標準パターンが作成
されるので、環境の変化によらず、良好な認識率を得る
ことができる。
的に検出し、検出された騒音の変化に対応して、騒音メ
モリ5の記憶している騒音を順次更新する場合において
は、環境に対応した騒音を付加した標準パターンが作成
されるので、環境の変化によらず、良好な認識率を得る
ことができる。
【0011】音声認識部9による認識結果に対応して音
声メモリ4に記憶された注目音声を再生する場合におい
ては、認識結果を確認するための音声を記憶させる例え
ばメモリを用意する必要がなくなり、コストを削減する
ことができる。
声メモリ4に記憶された注目音声を再生する場合におい
ては、認識結果を確認するための音声を記憶させる例え
ばメモリを用意する必要がなくなり、コストを削減する
ことができる。
【0012】
【実施例】図1は、本発明の音声認識装置の一実施例の
構成を示すブロック図である。マイク1は、入力された
例えば音声や装置が使用される環境における騒音などの
音を電気信号(アナログ信号)に変換する。A/D変換
器2は、マイク1より出力されたアナログ信号をディジ
タル信号に変換するA/D変換処理を行う。音声メモリ
4は、A/D変換器2および音声記憶読み出し部3を介
してマイク1より出力される、認識パターンを作成する
ための音声(音声信号)を記憶する。騒音メモリ5は、
A/D変換器2および音声記憶読み出し部3を介してマ
イク1より出力される騒音(騒音信号)を記憶する。
構成を示すブロック図である。マイク1は、入力された
例えば音声や装置が使用される環境における騒音などの
音を電気信号(アナログ信号)に変換する。A/D変換
器2は、マイク1より出力されたアナログ信号をディジ
タル信号に変換するA/D変換処理を行う。音声メモリ
4は、A/D変換器2および音声記憶読み出し部3を介
してマイク1より出力される、認識パターンを作成する
ための音声(音声信号)を記憶する。騒音メモリ5は、
A/D変換器2および音声記憶読み出し部3を介してマ
イク1より出力される騒音(騒音信号)を記憶する。
【0013】ここで、騒音とは、装置により認識する音
声以外の音声および音である。
声以外の音声および音である。
【0014】音声記憶読み出し部3は、システム制御部
6に制御され、A/D変換器2より出力されたディジタ
ル信号を音声メモリ4または騒音メモリ5に記憶させ
る。また、音声記憶読み出し部3は、音声メモリ4およ
び騒音メモリ5に記憶させた音声信号および騒音信号を
読み出し、音声加算部7に出力する。さらに、音声記憶
読み出し部3は、システム制御部6を介して音声認識部
9より供給される認識結果に対応して、音声メモリ4に
記憶されている音声信号を読み出し、D/A変換器12
に出力する。
6に制御され、A/D変換器2より出力されたディジタ
ル信号を音声メモリ4または騒音メモリ5に記憶させ
る。また、音声記憶読み出し部3は、音声メモリ4およ
び騒音メモリ5に記憶させた音声信号および騒音信号を
読み出し、音声加算部7に出力する。さらに、音声記憶
読み出し部3は、システム制御部6を介して音声認識部
9より供給される認識結果に対応して、音声メモリ4に
記憶されている音声信号を読み出し、D/A変換器12
に出力する。
【0015】D/A変換器12は、音声記憶読み出し部
3によって音声メモリ4より読み出された音声信号(デ
ィジタル信号)をアナログ信号に変換するD/A変換処
理を行う。スピーカ13は、D/A変換器12より出力
されたアナログ信号(音声信号)を音声に変換し、出力
する。
3によって音声メモリ4より読み出された音声信号(デ
ィジタル信号)をアナログ信号に変換するD/A変換処
理を行う。スピーカ13は、D/A変換器12より出力
されたアナログ信号(音声信号)を音声に変換し、出力
する。
【0016】音声加算部7は、音声記憶読み出し部3に
よって音声メモリ4および騒音メモリ5より読み出され
た音声信号および騒音信号を加算する。パターン作成部
8は、音声加算部7より出力された音声信号および騒音
信号を加算した信号、およびA/D変換器2を介してマ
イク1より出力される音声(騒音を含む音声)(認識す
る音声)信号より、例えば線形予測係数などの特徴パラ
メータを抽出し、標準パターン、および音声パターンを
作成する。パターン記憶部10は、パターン作成部8よ
り出力される標準パターンを記憶する。
よって音声メモリ4および騒音メモリ5より読み出され
た音声信号および騒音信号を加算する。パターン作成部
8は、音声加算部7より出力された音声信号および騒音
信号を加算した信号、およびA/D変換器2を介してマ
イク1より出力される音声(騒音を含む音声)(認識す
る音声)信号より、例えば線形予測係数などの特徴パラ
メータを抽出し、標準パターン、および音声パターンを
作成する。パターン記憶部10は、パターン作成部8よ
り出力される標準パターンを記憶する。
【0017】音声認識部9は、パターン作成部8より出
力される音声パターンと、パターン記憶部10に記憶さ
れている標準パターンとを比較し、音声認識を行う。
力される音声パターンと、パターン記憶部10に記憶さ
れている標準パターンとを比較し、音声認識を行う。
【0018】フーリエ変換部11は、A/D変換器2よ
り出力されるディジタル信号をフーリエ変換し、その信
号のパワースペクトルを計算し、システム制御部6に供
給する。システム制御部6は、フーリエ変換部11より
供給されるパワースペクトルおよび音声認識部9におけ
る認識結果に対応して、音声記憶読み出し部3を制御す
るなど、装置の各ブロックを制御する。
り出力されるディジタル信号をフーリエ変換し、その信
号のパワースペクトルを計算し、システム制御部6に供
給する。システム制御部6は、フーリエ変換部11より
供給されるパワースペクトルおよび音声認識部9におけ
る認識結果に対応して、音声記憶読み出し部3を制御す
るなど、装置の各ブロックを制御する。
【0019】次に、標準パターンを作成するための音声
信号を登録(記憶)する場合の動作について説明する。
まず最初に、システム制御部6に標準パターンを登録す
ることを知らせるために、登録/認識スイッチ(図示せ
ず)を登録側に切り換える。そして、標準パターンを作
成する音声以外の音、即ち騒音を遮断することができる
例えば防音室などにおいて、マイク1に所定の音声(標
準パターンを作成するための音声)を入力する。マイク
1に入力された音声は、電気信号(音声信号)に変換さ
れ、A/D変換器2に出力される。A/D変換器2にお
いて、A/D変換処理された音声信号は、音声記憶読み
出し部3に供給される。音声記憶読み出し部3におい
て、A/D変換器2より供給された音声信号は、システ
ム制御部6より出力される制御信号にしたがって、音声
メモリ4に記憶される。
信号を登録(記憶)する場合の動作について説明する。
まず最初に、システム制御部6に標準パターンを登録す
ることを知らせるために、登録/認識スイッチ(図示せ
ず)を登録側に切り換える。そして、標準パターンを作
成する音声以外の音、即ち騒音を遮断することができる
例えば防音室などにおいて、マイク1に所定の音声(標
準パターンを作成するための音声)を入力する。マイク
1に入力された音声は、電気信号(音声信号)に変換さ
れ、A/D変換器2に出力される。A/D変換器2にお
いて、A/D変換処理された音声信号は、音声記憶読み
出し部3に供給される。音声記憶読み出し部3におい
て、A/D変換器2より供給された音声信号は、システ
ム制御部6より出力される制御信号にしたがって、音声
メモリ4に記憶される。
【0020】以上のようにして、標準パターンを作成す
るためのS/Nの良い音声信号が登録される。
るためのS/Nの良い音声信号が登録される。
【0021】次に、登録された音声により音声認識を行
う場合の動作について説明する。最初に、登録/認識ス
イッチを認識側に切り換え、システム制御部6に音声認
識を行うことを知らせると、マイク1に入力されている
装置を使用する環境における騒音(環境騒音)が、A/
D変換器2を介して、音声記憶読み出し部3、およびフ
ーリエ変換部11に出力される。音声記憶読み出し部3
において、A/D変換器2を介してマイク1より供給さ
れた騒音信号は、システム制御部6より出力される制御
信号にしたがって、騒音メモリ5に記憶される。
う場合の動作について説明する。最初に、登録/認識ス
イッチを認識側に切り換え、システム制御部6に音声認
識を行うことを知らせると、マイク1に入力されている
装置を使用する環境における騒音(環境騒音)が、A/
D変換器2を介して、音声記憶読み出し部3、およびフ
ーリエ変換部11に出力される。音声記憶読み出し部3
において、A/D変換器2を介してマイク1より供給さ
れた騒音信号は、システム制御部6より出力される制御
信号にしたがって、騒音メモリ5に記憶される。
【0022】一方、フーリエ変換部11において、A/
D変換器2を介してマイク1より供給された騒音信号
は、フーリエ変換され、パワースペクトルが計算され
る。システム制御部6において、フーリエ変換部11よ
り供給されるパワースペクトルの平均値が所定の基準周
期ごとに計算される。さらに、システム制御部6におい
て、現在マイク1より出力されている信号のパワースペ
クトルの平均値と、マイク1より出力された信号を騒音
メモリ5に記憶させるように音声記憶読み出し部3に制
御信号を供給したときに計算されたパワースペクトルの
平均値、即ち現在騒音メモリ5に記憶されている騒音信
号のパワースペクトルの平均値とが比較される。
D変換器2を介してマイク1より供給された騒音信号
は、フーリエ変換され、パワースペクトルが計算され
る。システム制御部6において、フーリエ変換部11よ
り供給されるパワースペクトルの平均値が所定の基準周
期ごとに計算される。さらに、システム制御部6におい
て、現在マイク1より出力されている信号のパワースペ
クトルの平均値と、マイク1より出力された信号を騒音
メモリ5に記憶させるように音声記憶読み出し部3に制
御信号を供給したときに計算されたパワースペクトルの
平均値、即ち現在騒音メモリ5に記憶されている騒音信
号のパワースペクトルの平均値とが比較される。
【0023】システム制御部6において、現在マイク1
より出力されている信号のパワースペクトルの平均値
と、現在騒音メモリ5に記憶されている騒音信号のパワ
ースペクトルの平均値との差が、所定の基準値Aを越え
たと判定された場合、現在マイク1より出力されている
信号を騒音メモリ5に記憶するように、音声記憶読み出
し部3に制御信号が出力される。音声記憶読み出し部3
において、システム制御部6より出力される制御信号に
したがって、現在マイク1より出力されている信号が、
現在記憶されている信号(騒音信号)に変わって、騒音
メモリ5に記憶し直される。
より出力されている信号のパワースペクトルの平均値
と、現在騒音メモリ5に記憶されている騒音信号のパワ
ースペクトルの平均値との差が、所定の基準値Aを越え
たと判定された場合、現在マイク1より出力されている
信号を騒音メモリ5に記憶するように、音声記憶読み出
し部3に制御信号が出力される。音声記憶読み出し部3
において、システム制御部6より出力される制御信号に
したがって、現在マイク1より出力されている信号が、
現在記憶されている信号(騒音信号)に変わって、騒音
メモリ5に記憶し直される。
【0024】ここで、例えば一時的な騒音がマイク1に
入力されたり、また話者により発声された認識しようと
している音声がマイク1に入力されているなど、マイク
1に信号レベルの大きい入力がなされた場合、システム
制御部6において、現在マイク1より出力されている信
号のパワースペクトルの平均値と、現在騒音メモリ5に
記憶されている騒音信号のパワースペクトルの平均値と
の差が所定の基準値Aを越えたと判定され、現在マイク
1より出力されている信号、即ち一時的な騒音や話者に
より発声された認識しようとしている音声が、現在記憶
されている信号(騒音信号)に変わって、騒音メモリ5
に記憶し直されてしまう。そこで、システム制御部6に
おいて、現在マイク1より出力されている信号のパワー
スペクトルの平均値と、現在騒音メモリ5に記憶されて
いる騒音信号のパワースペクトルの平均値との差が、所
定の基準値Bを越えたと判定された場合、一時的な騒音
や話者により発声された認識しようとしている音声が、
マイク1に入力されているものとみなし、音声記憶読み
出し部3に制御信号が出力されないようになされてい
る。但し、基準値Aと基準値Bとの関係は、A<Bであ
る。
入力されたり、また話者により発声された認識しようと
している音声がマイク1に入力されているなど、マイク
1に信号レベルの大きい入力がなされた場合、システム
制御部6において、現在マイク1より出力されている信
号のパワースペクトルの平均値と、現在騒音メモリ5に
記憶されている騒音信号のパワースペクトルの平均値と
の差が所定の基準値Aを越えたと判定され、現在マイク
1より出力されている信号、即ち一時的な騒音や話者に
より発声された認識しようとしている音声が、現在記憶
されている信号(騒音信号)に変わって、騒音メモリ5
に記憶し直されてしまう。そこで、システム制御部6に
おいて、現在マイク1より出力されている信号のパワー
スペクトルの平均値と、現在騒音メモリ5に記憶されて
いる騒音信号のパワースペクトルの平均値との差が、所
定の基準値Bを越えたと判定された場合、一時的な騒音
や話者により発声された認識しようとしている音声が、
マイク1に入力されているものとみなし、音声記憶読み
出し部3に制御信号が出力されないようになされてい
る。但し、基準値Aと基準値Bとの関係は、A<Bであ
る。
【0025】このように、騒音メモリ5に記憶される騒
音(騒音信号)は、装置を使用する環境における騒音の
変化に対応して、順次記憶し直される(更新される)。
音(騒音信号)は、装置を使用する環境における騒音の
変化に対応して、順次記憶し直される(更新される)。
【0026】以上のように騒音メモリ5に記憶された騒
音信号と、標準パターンを作成するために音声メモリ4
に記憶されたS/Nの良い音声信号とは、システム制御
部6より出力される制御信号にしたがって、騒音メモリ
5の記憶内容が更新されるたびに(更新された後に)、
音声記憶読み出し部3に読み出され、音声加算部7に供
給される。音声加算部7において、騒音信号とS/Nの
良い音声信号とが加算され、パターン作成部8に供給さ
れる。パターン作成部8において、騒音信号とS/Nの
良い音声信号とを加算した信号は、その特徴パラメータ
が抽出され、標準パターンが作成され、この標準パター
ンは、パターン記憶部10に記憶される。
音信号と、標準パターンを作成するために音声メモリ4
に記憶されたS/Nの良い音声信号とは、システム制御
部6より出力される制御信号にしたがって、騒音メモリ
5の記憶内容が更新されるたびに(更新された後に)、
音声記憶読み出し部3に読み出され、音声加算部7に供
給される。音声加算部7において、騒音信号とS/Nの
良い音声信号とが加算され、パターン作成部8に供給さ
れる。パターン作成部8において、騒音信号とS/Nの
良い音声信号とを加算した信号は、その特徴パラメータ
が抽出され、標準パターンが作成され、この標準パター
ンは、パターン記憶部10に記憶される。
【0027】一方、認識しようとしている音声は、装置
が置かれている環境における騒音とともにマイク1に入
力されると、A/D変換器2によりA/D変換され、パ
ターン作成部8に出力される。パターン作成部8におい
て、A/D変換器2より出力された騒音を含む音声信号
は、その特徴パラメータが抽出され、音声パターンが作
成され、音声認識部9に出力される。音声認識部9にお
いて、パターン作成部8より出力された、騒音を含む音
声の音声パターンと、パターン記憶部10に記憶された
標準パターンとが比較され、マイク1に入力された雑音
を含む音声の認識が行われ、その認識結果がシステム制
御部6に出力される。
が置かれている環境における騒音とともにマイク1に入
力されると、A/D変換器2によりA/D変換され、パ
ターン作成部8に出力される。パターン作成部8におい
て、A/D変換器2より出力された騒音を含む音声信号
は、その特徴パラメータが抽出され、音声パターンが作
成され、音声認識部9に出力される。音声認識部9にお
いて、パターン作成部8より出力された、騒音を含む音
声の音声パターンと、パターン記憶部10に記憶された
標準パターンとが比較され、マイク1に入力された雑音
を含む音声の認識が行われ、その認識結果がシステム制
御部6に出力される。
【0028】システム制御部6を介して、音声認識部9
より出力された認識結果が音声記憶読み出し部3に供給
され、音声記憶読み出し部3において、認識結果に対応
する音声信号が音声メモリ4より読み出され、D/A変
換器12に供給される。D/A変換器12において、認
識結果に対応する音声信号はD/A変換処理され、スピ
ーカ13に供給され、認識結果を確認するための音声
が、スピーカ13より出力される。
より出力された認識結果が音声記憶読み出し部3に供給
され、音声記憶読み出し部3において、認識結果に対応
する音声信号が音声メモリ4より読み出され、D/A変
換器12に供給される。D/A変換器12において、認
識結果に対応する音声信号はD/A変換処理され、スピ
ーカ13に供給され、認識結果を確認するための音声
が、スピーカ13より出力される。
【0029】以上説明したように、本発明の音声認識装
置においては、本装置を使用する環境における騒音を付
加した標準パターンを、その騒音の変化に対応して作成
するようにしたので、騒音を含んだ音声の認識率を良く
することができる。
置においては、本装置を使用する環境における騒音を付
加した標準パターンを、その騒音の変化に対応して作成
するようにしたので、騒音を含んだ音声の認識率を良く
することができる。
【0030】なお、音声加算部7において、音声メモリ
4に記憶された音声信号、または騒音メモリ5に記憶さ
れた騒音信号に重み付けがなされた後に、それぞれが加
算されるようにすることもできる。
4に記憶された音声信号、または騒音メモリ5に記憶さ
れた騒音信号に重み付けがなされた後に、それぞれが加
算されるようにすることもできる。
【0031】
【発明の効果】請求項1に記載の音声認識装置によれ
ば、入力手段より入力された注目音声および騒音を音声
記憶手段および騒音記憶手段にそれぞれ記憶し、記憶さ
れた注目音声および騒音を加算して標準パターンを作成
するとともに、入力手段より入力された騒音を含む注目
音声より音声パターンを作成し、標準パターンと音声パ
ターンとを比較して、注目音声を認識する。さらに、騒
音記憶手段は、入力手段より入力される騒音の変化に対
応して、記憶している騒音を順次更新する。従って、環
境に対応した騒音を付加した標準パターンが作成される
ので、常に良好な認識率を得ることができる。
ば、入力手段より入力された注目音声および騒音を音声
記憶手段および騒音記憶手段にそれぞれ記憶し、記憶さ
れた注目音声および騒音を加算して標準パターンを作成
するとともに、入力手段より入力された騒音を含む注目
音声より音声パターンを作成し、標準パターンと音声パ
ターンとを比較して、注目音声を認識する。さらに、騒
音記憶手段は、入力手段より入力される騒音の変化に対
応して、記憶している騒音を順次更新する。従って、環
境に対応した騒音を付加した標準パターンが作成される
ので、常に良好な認識率を得ることができる。
【0032】請求項2に記載の音声認識装置によれば、
入力手段より入力される騒音の変化を周期的に検出し、
騒音記憶手段は、検出された騒音の変化に対応して、記
憶している騒音を順次更新する。従って、環境に対応し
た騒音を付加した標準パターンが作成されるので、環境
の変化によらず、良好な認識率を得ることができる。
入力手段より入力される騒音の変化を周期的に検出し、
騒音記憶手段は、検出された騒音の変化に対応して、記
憶している騒音を順次更新する。従って、環境に対応し
た騒音を付加した標準パターンが作成されるので、環境
の変化によらず、良好な認識率を得ることができる。
【0033】請求項3に記載の音声認識装置によれば、
認識手段による認識結果に対応して音声記憶手段に記憶
された注目音声を再生する。従って、認識結果を容易に
確認することができる。
認識手段による認識結果に対応して音声記憶手段に記憶
された注目音声を再生する。従って、認識結果を容易に
確認することができる。
【図1】本発明の音声認識装置の一実施例の構成を示す
ブロック図である。
ブロック図である。
1 マイク 2 A/D変換器 3 音声記憶読み出し部 4 音声メモリ 5 騒音メモリ 6 システム制御部 7 音声加算部 8 パターン作成部 9 音声認識部 10 パターン記憶部 11 フーリエ変換部 12 D/A変換器 13 スピーカ
フロントページの続き (72)発明者 藤中 明彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内
Claims (3)
- 【請求項1】 注目音声および騒音を入力する入力手段
と、 前記入力手段より入力された注目音声を記憶する音声記
憶手段と、 前記入力手段より入力された騒音を記憶する騒音記憶手
段と、 前記入力手段より入力された注目音声より音声パターン
を作成するとともに、前記音声記憶手段に記憶された注
目音声と前記騒音記憶手段に記憶された騒音とを加算し
て標準パターンを作成するパターン作成手段と、 前記パターン作成手段により作成された標準パターンを
記憶する標準パターン記憶手段と、 前記標準パターン記憶手段に記憶された標準パターンと
前記パターン作成手段により作成された音声パターンと
を比較して、前記入力手段より入力された注目音声を認
識する認識手段とを備え、 前記騒音記憶手段は、前記入力手段より入力される騒音
の変化に対応して、記憶している前記騒音を順次更新す
ることを特徴とする音声認識装置。 - 【請求項2】 前記入力手段より入力される騒音の変化
を周期的に検出する検出手段をさらに備え、 前記騒音記憶手段は、前記検出手段により検出された騒
音の変化に対応して、記憶している前記騒音を順次更新
することを特徴とする請求項1に記載の音声認識装置。 - 【請求項3】 前記認識手段による認識結果に対応して
前記音声記憶手段に記憶された注目音声を再生する再生
手段をさらに備えることを特徴とする請求項1または2
に記載の音声認識装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3326933A JPH05134694A (ja) | 1991-11-15 | 1991-11-15 | 音声認識装置 |
KR1019920019901A KR930010852A (ko) | 1991-11-15 | 1992-10-28 | 음성인식장치 |
US07/974,230 US5390280A (en) | 1991-11-15 | 1992-11-10 | Speech recognition apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3326933A JPH05134694A (ja) | 1991-11-15 | 1991-11-15 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05134694A true JPH05134694A (ja) | 1993-05-28 |
Family
ID=18193392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3326933A Withdrawn JPH05134694A (ja) | 1991-11-15 | 1991-11-15 | 音声認識装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5390280A (ja) |
JP (1) | JPH05134694A (ja) |
KR (1) | KR930010852A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0629054A3 (en) * | 1993-06-08 | 1997-01-29 | Matsushita Electric Ind Co Ltd | Interference suppression device which can prevent the deterioration of the signal high-frequency characteristic occurring after interference suppression and in symmetrical signal transmission systems. |
US7840308B2 (en) | 2004-09-10 | 2010-11-23 | Honda Motor Co., Ltd. | Robot device control based on environment and position of a movable robot |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2687496B1 (fr) * | 1992-02-18 | 1994-04-01 | Alcatel Radiotelephone | Procede de reduction de bruit acoustique dans un signal de parole. |
JP2737624B2 (ja) * | 1993-12-27 | 1998-04-08 | 日本電気株式会社 | 音声認識装置 |
US6001131A (en) * | 1995-02-24 | 1999-12-14 | Nynex Science & Technology, Inc. | Automatic target noise cancellation for speech enhancement |
GB2317084B (en) * | 1995-04-28 | 2000-01-19 | Northern Telecom Ltd | Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals |
JP3716870B2 (ja) * | 1995-05-31 | 2005-11-16 | ソニー株式会社 | 音声認識装置および音声認識方法 |
JP3452443B2 (ja) * | 1996-03-25 | 2003-09-29 | 三菱電機株式会社 | 騒音下音声認識装置及び騒音下音声認識方法 |
JP2982689B2 (ja) * | 1996-04-19 | 1999-11-29 | 日本電気株式会社 | 情報量基準を用いた標準パターン作成方式 |
US6006186A (en) * | 1997-10-16 | 1999-12-21 | Sony Corporation | Method and apparatus for a parameter sharing speech recognition system |
US6223150B1 (en) | 1999-01-29 | 2001-04-24 | Sony Corporation | Method and apparatus for parsing in a spoken language translation system |
US6266642B1 (en) | 1999-01-29 | 2001-07-24 | Sony Corporation | Method and portable apparatus for performing spoken language translation |
US6278968B1 (en) | 1999-01-29 | 2001-08-21 | Sony Corporation | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system |
US6442524B1 (en) | 1999-01-29 | 2002-08-27 | Sony Corporation | Analyzing inflectional morphology in a spoken language translation system |
US6282507B1 (en) | 1999-01-29 | 2001-08-28 | Sony Corporation | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection |
US6243669B1 (en) | 1999-01-29 | 2001-06-05 | Sony Corporation | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation |
US6356865B1 (en) * | 1999-01-29 | 2002-03-12 | Sony Corporation | Method and apparatus for performing spoken language translation |
US6374224B1 (en) | 1999-03-10 | 2002-04-16 | Sony Corporation | Method and apparatus for style control in natural language generation |
KR100762588B1 (ko) * | 2001-06-26 | 2007-10-01 | 엘지전자 주식회사 | 화자적응과 오입력 거절을 결합한 음성인식 방법 |
JP4765461B2 (ja) * | 2005-07-27 | 2011-09-07 | 日本電気株式会社 | 雑音抑圧システムと方法及びプログラム |
CN102055312B (zh) * | 2009-11-06 | 2013-07-31 | 盛玉林 | 语音控制开关 |
US20150149169A1 (en) * | 2013-11-27 | 2015-05-28 | At&T Intellectual Property I, L.P. | Method and apparatus for providing mobile multimodal speech hearing aid |
CN104868915B (zh) * | 2015-05-30 | 2017-12-01 | 宁波摩米创新工场电子科技有限公司 | 一种基于模数转换电路的线性驱动式语音识别系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4852181A (en) * | 1985-09-26 | 1989-07-25 | Oki Electric Industry Co., Ltd. | Speech recognition for recognizing the catagory of an input speech pattern |
US4811404A (en) * | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
US5222147A (en) * | 1989-04-13 | 1993-06-22 | Kabushiki Kaisha Toshiba | Speech recognition LSI system including recording/reproduction device |
US5168524A (en) * | 1989-08-17 | 1992-12-01 | Eliza Corporation | Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation |
CA2042926C (en) * | 1990-05-22 | 1997-02-25 | Ryuhei Fujiwara | Speech recognition method with noise reduction and a system therefor |
-
1991
- 1991-11-15 JP JP3326933A patent/JPH05134694A/ja not_active Withdrawn
-
1992
- 1992-10-28 KR KR1019920019901A patent/KR930010852A/ko not_active Application Discontinuation
- 1992-11-10 US US07/974,230 patent/US5390280A/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0629054A3 (en) * | 1993-06-08 | 1997-01-29 | Matsushita Electric Ind Co Ltd | Interference suppression device which can prevent the deterioration of the signal high-frequency characteristic occurring after interference suppression and in symmetrical signal transmission systems. |
US7840308B2 (en) | 2004-09-10 | 2010-11-23 | Honda Motor Co., Ltd. | Robot device control based on environment and position of a movable robot |
Also Published As
Publication number | Publication date |
---|---|
KR930010852A (ko) | 1993-06-23 |
US5390280A (en) | 1995-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH05134694A (ja) | 音声認識装置 | |
EP2592546B1 (en) | Automatic Gain Control in a multi-talker audio system | |
JP4764995B2 (ja) | 雑音を含む音響信号の高品質化 | |
JP3702978B2 (ja) | 認識装置および認識方法、並びに学習装置および学習方法 | |
JPH11249693A (ja) | 収音装置 | |
JP3434730B2 (ja) | 音声認識方法および装置 | |
JP3555490B2 (ja) | 声質変換システム | |
US20100249961A1 (en) | Environmental sound reproducing device | |
KR100262576B1 (ko) | 운전자의 음성 신호 구간 검출 장치 및 그 방법 | |
JPS6367197B2 (ja) | ||
JP3350106B2 (ja) | 音声認識装置 | |
JP2990051B2 (ja) | 音声認識装置 | |
JP3223552B2 (ja) | メッセージ出力装置 | |
JP2617851B2 (ja) | 音響選別導入方法 | |
JP2975808B2 (ja) | 音声認識装置 | |
JP2648014B2 (ja) | 音声切り出し装置 | |
JPH03160499A (ja) | 音声認識装置 | |
JP2003037650A (ja) | 携帯電話機 | |
JP2000155600A (ja) | 音声認識システムおよび入力音声レベル警告方法 | |
JPS60200299A (ja) | 音声認識装置 | |
JP2000010594A (ja) | 音声認識装置 | |
JPH05316186A (ja) | 音声認識電話機 | |
JPH1165591A (ja) | 音声処理装置 | |
JPH06202690A (ja) | 音声認識による音響機器制御装置 | |
JPS63183498A (ja) | 登録式音声入出力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19990204 |