JPH03180900A - 音声認識装置の雑音除去システム - Google Patents
音声認識装置の雑音除去システムInfo
- Publication number
- JPH03180900A JPH03180900A JP32175389A JP32175389A JPH03180900A JP H03180900 A JPH03180900 A JP H03180900A JP 32175389 A JP32175389 A JP 32175389A JP 32175389 A JP32175389 A JP 32175389A JP H03180900 A JPH03180900 A JP H03180900A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- section
- pattern
- speech
- acoustic signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 claims description 13
- 230000002411 adverse Effects 0.000 abstract description 3
- 239000006185 dispersion Substances 0.000 description 15
- 230000003595 spectral effect Effects 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ)産業上の利用分野
本発明は音声認識装置の雑音除去システムに関する。
lロン従来の技術
現存する音声認識装置では、音声の特徴を有効に保持し
た音声パタンを作成し、これをパタンマンチングするこ
とで音声の識別を行うものが一般的である。
た音声パタンを作成し、これをパタンマンチングするこ
とで音声の識別を行うものが一般的である。
しかしながら、この種音声認識装置は無冴響下τ使用さ
れることはむしろ稀であるため、背景雑音下でもM度の
高い音声パタンを作成できないと実用に供することはで
きない。
れることはむしろ稀であるため、背景雑音下でもM度の
高い音声パタンを作成できないと実用に供することはで
きない。
このような雑音対策としては、1足来は特公昭6l−z
96o号公報に開示の如く、入力の音声の音響パラメー
タ(例えば、スペクトルパラメータ)時系列の各サンプ
ルから既知のN音響パラメータ全差し引いて、雑音の影
響のない音響パラメータ時系列を得、これ・に基づいて
雑訝が除去された音声パタンを作成していた。
96o号公報に開示の如く、入力の音声の音響パラメー
タ(例えば、スペクトルパラメータ)時系列の各サンプ
ルから既知のN音響パラメータ全差し引いて、雑音の影
響のない音響パラメータ時系列を得、これ・に基づいて
雑訝が除去された音声パタンを作成していた。
このような従来の雑音除去システムに於ては、雑音が重
畳した音声信号の第1サンプル(第1フレーム)の音響
パラメータをKi、既知の雑音音響パラメータをX、雑
音除去後の第1サンプルの音響パラメータを 8Kiと
した場合、これらの関係は以下の式(1)となる。
畳した音声信号の第1サンプル(第1フレーム)の音響
パラメータをKi、既知の雑音音響パラメータをX、雑
音除去後の第1サンプルの音響パラメータを 8Kiと
した場合、これらの関係は以下の式(1)となる。
”Ki=Ki−N・・・・・・(])
これらのパパラメタの時系列サンプル0Kp、Kp、N
は16チヤネルのスペクトルパラメータの場合、夫々1
6次元のベクトルで表される。
は16チヤネルのスペクトルパラメータの場合、夫々1
6次元のベクトルで表される。
しかしながら、このような、T!fN響パラメータ\と
しては、雑音区間の数サンプルの平均値が用いられるた
めに、雑音のパワーの変動の程度(パワー分散)は全く
考慮されていない。
しては、雑音区間の数サンプルの平均値が用いられるた
めに、雑音のパワーの変動の程度(パワー分散)は全く
考慮されていない。
即ち、雑音のパワー分散が大きい峙には、K声区間の音
響パラメータの中で、パワーが著しく大きい雑音を含む
サンプルとそれが著しく =j・さい雑音を含むサンプ
ルとが存在する。従って、これらサンプルから上述の如
く一律に雑音音響パラメータXを差し引いても、相当な
大きさの雑音成分が残存することになり、有効な雑音除
去には限界があった。
響パラメータの中で、パワーが著しく大きい雑音を含む
サンプルとそれが著しく =j・さい雑音を含むサンプ
ルとが存在する。従って、これらサンプルから上述の如
く一律に雑音音響パラメータXを差し引いても、相当な
大きさの雑音成分が残存することになり、有効な雑音除
去には限界があった。
第3図(a)及び(b)に8響パラメータであるスペク
トルパラメータの特定周波数のスペクトルレベル信号を
模式的に示し、該模式図を用いて上述の雑音除去動作に
ついて説明する。
トルパラメータの特定周波数のスペクトルレベル信号を
模式的に示し、該模式図を用いて上述の雑音除去動作に
ついて説明する。
例えば雑音のパワーが同図(a)の々口<、極大値と極
小値との間にΔPの差をもって変動している場合は、式
(1)に基づく雑音除去システムによれば、同図(b)
の如く、MEレベルを持つ雑音が残存する。この残存雑
音レベルΔEは雑音のパワー分散が大きいほど大きくな
り、音声区間にもこのレベルの雑音が存在することにな
り、このようなスペクトルパラメータレベル信号に基づ
く音声パタンは残存雑音レベルムE分だけ歪むことにな
る。
小値との間にΔPの差をもって変動している場合は、式
(1)に基づく雑音除去システムによれば、同図(b)
の如く、MEレベルを持つ雑音が残存する。この残存雑
音レベルΔEは雑音のパワー分散が大きいほど大きくな
り、音声区間にもこのレベルの雑音が存在することにな
り、このようなスペクトルパラメータレベル信号に基づ
く音声パタンは残存雑音レベルムE分だけ歪むことにな
る。
また、このように雑音のパワー分散を考慮しない場合に
は、雑音音響パラメータXのパワーの身声区間の音響パ
ラメータのそれに対する比率が大きい時、即ちパワーS
/N比が小さい時、上述のパワー分散の程度に応じた音
声パタンの歪みを回避することはできなかった。
は、雑音音響パラメータXのパワーの身声区間の音響パ
ラメータのそれに対する比率が大きい時、即ちパワーS
/N比が小さい時、上述のパワー分散の程度に応じた音
声パタンの歪みを回避することはできなかった。
(ハ)発明か解決すべき課題
本発明は上述の点に鑑みてなされたものであって、雑音
のパワー分散の度(いによる悪影響を低減して有効な雑
音除去を可能とした音声認識装置の雑音除去システムを
実現するものである。
のパワー分散の度(いによる悪影響を低減して有効な雑
音除去を可能とした音声認識装置の雑音除去システムを
実現するものである。
(ニ)課題を解決するための手段
第1の本発明音声認識装置の雑音除去システムは、雑音
中に音声が存在する音響信号から音声の存在時間領域を
音声区間として検出する音声区間検出手段、該検出部で
検出された音声区間外の雑音区間音響信号のパワー成分
の分散を算出する分散算出手段、雑音区間音響信号から
抽出した音響パラメータを時間軸正規化した雑音パタン
を得る雑音パタン作成手段、該雑音パタンの重み付けを
上記分散値に基づいて制御し、該重み付け制御された雑
音パタンを音声区間音響信号の音響パラメータから差し
引く雑音除去手段を備えるものである。
中に音声が存在する音響信号から音声の存在時間領域を
音声区間として検出する音声区間検出手段、該検出部で
検出された音声区間外の雑音区間音響信号のパワー成分
の分散を算出する分散算出手段、雑音区間音響信号から
抽出した音響パラメータを時間軸正規化した雑音パタン
を得る雑音パタン作成手段、該雑音パタンの重み付けを
上記分散値に基づいて制御し、該重み付け制御された雑
音パタンを音声区間音響信号の音響パラメータから差し
引く雑音除去手段を備えるものである。
第2の音声認識装置の雑音除去システムは、雑音中に音
声が存在する音響信号から音声の存在時間領域を音声区
間として検出する音声区間検出手段、該検出部で検出さ
れた音声区間音響信号のパワー成分と音声区間外の雑音
区間音響信号のパワー成分とを比較してS、、’N比を
算出するS、/N比算出手段、雑音区間音響信号から抽
出した音響パラメータを時間軸正規化した雑音パタンを
得る雑音パタン作成手段、該雑音ノくタンの重み付けを
上記3 、/ N比に基づいて制御し、該重み付け制御
された雑音パタンを音声区間音響信号の音響パラメータ
から差し引く雑音除去手段を備えるものである。
声が存在する音響信号から音声の存在時間領域を音声区
間として検出する音声区間検出手段、該検出部で検出さ
れた音声区間音響信号のパワー成分と音声区間外の雑音
区間音響信号のパワー成分とを比較してS、、’N比を
算出するS、/N比算出手段、雑音区間音響信号から抽
出した音響パラメータを時間軸正規化した雑音パタンを
得る雑音パタン作成手段、該雑音ノくタンの重み付けを
上記3 、/ N比に基づいて制御し、該重み付け制御
された雑音パタンを音声区間音響信号の音響パラメータ
から差し引く雑音除去手段を備えるものである。
(ホ)作用
本発明の音声認識装置の雑音除去システムによれば、上
述の式(1)は下記の式(2)に拡張される。
述の式(1)は下記の式(2)に拡張される。
”Ki=Ki−βX・・・・・・!2ノ同式(2)のβ
は、従来の式(1)では定数β=1に固定されていたも
のを変数として処理するものである。即ち、第1の本発
明ではこれを雑音のパワー分散の関数とし、第2の本発
明ではこれをS /” N比の関数とすることができる
。
は、従来の式(1)では定数β=1に固定されていたも
のを変数として処理するものである。即ち、第1の本発
明ではこれを雑音のパワー分散の関数とし、第2の本発
明ではこれをS /” N比の関数とすることができる
。
従って、第1の本発明では、雑音のパワー分散の大きさ
に応じて式f2)のβを適応的に変更することにより、
′Kiのサンプル列に基づく音声認識用音声パタンの雑
音による歪みを有効に低減することが可能となる。更に
、第2の本発明では、S/X比の大きさに応じて式(2
;のβを適応的に変更することにより、1Kiのサンプ
ル列に基づく音声認識用音声パタンの雑ぎによる歪みを
有効に低減することが可能となる。
に応じて式f2)のβを適応的に変更することにより、
′Kiのサンプル列に基づく音声認識用音声パタンの雑
音による歪みを有効に低減することが可能となる。更に
、第2の本発明では、S/X比の大きさに応じて式(2
;のβを適応的に変更することにより、1Kiのサンプ
ル列に基づく音声認識用音声パタンの雑ぎによる歪みを
有効に低減することが可能となる。
(へ)実施例
第1図に第1の本発明音声認識装置の雑音除去システム
の構成を示す。
の構成を示す。
同図に於て、lはマイクロホン。
2はマイクロホン1から得られる音響信号を周波数分析
してスペクトルパラメータのサンプル時系列を抽出する
分析部であり、例えば16チヤンネルのバンドパスフィ
ルター構成からなる。
してスペクトルパラメータのサンプル時系列を抽出する
分析部であり、例えば16チヤンネルのバンドパスフィ
ルター構成からなる。
3はき響信号からその音声区間を検出する音声区間検出
部であり、この場合、上記分析部2のスペクトルパラメ
ータのサンプル時系列出力の各スペクトルレベルの平均
値を音響信号のレベルと見倣して、音声が存在する場合
の最低レベルに相当する特定の数値と比較し、この数値
以上の時間領域が特定時間以上連続する区間を音声区間
と判定する。従って、この音声区間以外の区間は背景雑
音のみが存在する雄片区間と判定される。
部であり、この場合、上記分析部2のスペクトルパラメ
ータのサンプル時系列出力の各スペクトルレベルの平均
値を音響信号のレベルと見倣して、音声が存在する場合
の最低レベルに相当する特定の数値と比較し、この数値
以上の時間領域が特定時間以上連続する区間を音声区間
と判定する。従って、この音声区間以外の区間は背景雑
音のみが存在する雄片区間と判定される。
4は雑音区間のスペクトルパラメータの1サンプル、或
は特定数サンプル時系列を時間平均した平均サンプルの
いずれかからなる正規化パタンを雑音スペクトルパタン
として作成する雑音パタン作成部であり、この場合音声
区間検出部から音声区間前の雑音区間に得られる雑音ス
ペクトルパラメータに基づいて雑音パタンNが作成され
る。
は特定数サンプル時系列を時間平均した平均サンプルの
いずれかからなる正規化パタンを雑音スペクトルパタン
として作成する雑音パタン作成部であり、この場合音声
区間検出部から音声区間前の雑音区間に得られる雑音ス
ペクトルパラメータに基づいて雑音パタンNが作成され
る。
5は雑音スペクトルパラメータのサンプル時系列に対し
てそのパワー分散を計算する分散算出部であり、上記雑
音パタン作成部4での雑音パタン作成時の雑音区間に於
いて上記音声区間検出部3から得られる雑音スペクトル
パラメータからそのパワー分散を算出する。更に該分散
算出部5では算出された分散結果に基づき、上述の式(
2)の変数βを決定する。
てそのパワー分散を計算する分散算出部であり、上記雑
音パタン作成部4での雑音パタン作成時の雑音区間に於
いて上記音声区間検出部3から得られる雑音スペクトル
パラメータからそのパワー分散を算出する。更に該分散
算出部5では算出された分散結果に基づき、上述の式(
2)の変数βを決定する。
こ−f’+t′4r↑の分゛;二は、雑音スペクトルパ
ラメータノ’) 、、) +−サンフル数そJ、サンプ
、ル番号を」とした時、例えば、 ■=Σl Kj−M I 、但1.M=():Kj)
、′Jで表され、例えばこの値\Iに比例した重み付け
係数β(V )が得られる。
ラメータノ’) 、、) +−サンフル数そJ、サンプ
、ル番号を」とした時、例えば、 ■=Σl Kj−M I 、但1.M=():Kj)
、′Jで表され、例えばこの値\Iに比例した重み付け
係数β(V )が得られる。
6は音声区間検出部3から得られる音声区間のスペクト
ルパラメータのサンプル時系列Kiの夫々からβで重み
付けされた雑音パタンβXを差し引く雑音除去部であり
、式(2)を実現する。
ルパラメータのサンプル時系列Kiの夫々からβで重み
付けされた雑音パタンβXを差し引く雑音除去部であり
、式(2)を実現する。
7は音声認識用の標準パタン記憶部であり、標1liE
的な音声のスペクトルパラメータを時間軸正規化(例え
ば32サンプル)した音声パタンを複数の音声について
予じめ記憶している。この記tta理は、特定話者を対
称とする場合には、音声の登録処理と呼ばれ、この登録
処理は音声認Q処理;;先だって、特定話者がマイクロ
ホンlに発声した音声から上記各処理部2〜6の動作に
よって雑音除去された音声パタンを得、このパタンか該
標準パタンに憶部7に記憶されることになる。
的な音声のスペクトルパラメータを時間軸正規化(例え
ば32サンプル)した音声パタンを複数の音声について
予じめ記憶している。この記tta理は、特定話者を対
称とする場合には、音声の登録処理と呼ばれ、この登録
処理は音声認Q処理;;先だって、特定話者がマイクロ
ホンlに発声した音声から上記各処理部2〜6の動作に
よって雑音除去された音声パタンを得、このパタンか該
標準パタンに憶部7に記憶されることになる。
8は一ヒ記雑音除去部6から得られる式(2)の音声区
間全領域に亘たる”Kiのサンプル時系列に基づき、こ
れを上記標準パタン記憶部7のパタン同様に時間軸正規
化した8声パタンを得、更にこの背声パタンと上記標準
パタン記憶部7の各標準音声パタンとをパタンマツチン
グするマツチング部であり、最もマツチング誤差の小さ
い標準音声パタンに対応した認識結果信号を出力する。
間全領域に亘たる”Kiのサンプル時系列に基づき、こ
れを上記標準パタン記憶部7のパタン同様に時間軸正規
化した8声パタンを得、更にこの背声パタンと上記標準
パタン記憶部7の各標準音声パタンとをパタンマツチン
グするマツチング部であり、最もマツチング誤差の小さ
い標準音声パタンに対応した認識結果信号を出力する。
上述の構成の音声認識装置の雑音除去システムによれば
、第3図(a)のΔPが大きい時には、分散算出部5で
算出される分散値Vが大きくなるので、β(、V )も
大きくなり、βNレベルが高くなるため、雑音除去部6
では式r2)に従って、同図(b)の残存雑音ΔEが低
減された0Ki時系列が得られる。従って、雑音成分が
適切に除去された音声パタンが得られることになり、標
準パタン記憶部7並びにマツチング部8の音声認識処理
によって背景雑音に影響されない有効な音声認識が行わ
れる。
、第3図(a)のΔPが大きい時には、分散算出部5で
算出される分散値Vが大きくなるので、β(、V )も
大きくなり、βNレベルが高くなるため、雑音除去部6
では式r2)に従って、同図(b)の残存雑音ΔEが低
減された0Ki時系列が得られる。従って、雑音成分が
適切に除去された音声パタンが得られることになり、標
準パタン記憶部7並びにマツチング部8の音声認識処理
によって背景雑音に影響されない有効な音声認識が行わ
れる。
次に、第2の本発明音声認識装置の雑音除去システムの
1fflを第2図に従って以下に解説する。
1fflを第2図に従って以下に解説する。
本発明システムは上述の雑音パワーの分散Vが大きい時
には、雑音のパワー自体も大きくなっていることに着目
したものであって、第1図の分散算出部5に代えてS
、/ N算出部9を備えることで適切な雑音除去を、実
現するものである。
には、雑音のパワー自体も大きくなっていることに着目
したものであって、第1図の分散算出部5に代えてS
、/ N算出部9を備えることで適切な雑音除去を、実
現するものである。
該S 、/’ N算出部9は音声区間検出部3から得ら
れる音声区間のスペクトルパラメータKi と予じめ作
成された雑音パタン作成部4の雑音パタンXとに基づい
てS/:’、’W出部9炉部9、/ N比を算出するも
のであり、更にこのS 、/ N比の逆数に比例して式
(2)の変数βを決定する。
れる音声区間のスペクトルパラメータKi と予じめ作
成された雑音パタン作成部4の雑音パタンXとに基づい
てS/:’、’W出部9炉部9、/ N比を算出するも
のであり、更にこのS 、/ N比の逆数に比例して式
(2)の変数βを決定する。
なお、−時記憶部lOは、S/N算出部9がSl、/X
比を算出している間に、上記音声区間検出部3から得ら
れる音声区間のスペクトルパラメータを一時記憶してお
くために備えられている。従って、雑音除去部6では上
記分散算出部5で重み付けされた雑音パタンβNを算出
した後、このパタンβXを該−時記憶部IOの音声区間
スペクトルパラメータのサンプル時系列Siから差し引
く式2)の雑音除去処理を実行できる。
比を算出している間に、上記音声区間検出部3から得ら
れる音声区間のスペクトルパラメータを一時記憶してお
くために備えられている。従って、雑音除去部6では上
記分散算出部5で重み付けされた雑音パタンβNを算出
した後、このパタンβXを該−時記憶部IOの音声区間
スペクトルパラメータのサンプル時系列Siから差し引
く式2)の雑音除去処理を実行できる。
このような構成の第2の本発明システムによれば、S
/ N算出部9で算出しなS /’ N比が小さい時、
第3図(a)のΔPが大きくなるが、これに応じて式1
2)の変数βが大きくなり、βXレベルが高くなる。従
って、雑音除去部6では、式(2)に従い、同図(b)
の残存雑音ΔEが低減されたサンプル1Si時系列が得
られるので、前述の第1の本発明同様に雑音成分が適切
に除去された音声パタンが得られることになり、標準パ
タン記憶部7並びにマツチング部8の音声認識処理によ
って背景雑音に影響されない有効な音声認識が行われる
。
/ N算出部9で算出しなS /’ N比が小さい時、
第3図(a)のΔPが大きくなるが、これに応じて式1
2)の変数βが大きくなり、βXレベルが高くなる。従
って、雑音除去部6では、式(2)に従い、同図(b)
の残存雑音ΔEが低減されたサンプル1Si時系列が得
られるので、前述の第1の本発明同様に雑音成分が適切
に除去された音声パタンが得られることになり、標準パ
タン記憶部7並びにマツチング部8の音声認識処理によ
って背景雑音に影響されない有効な音声認識が行われる
。
以上の説明に於ては、変数βについて、第1の発明では
雑音のパワー分散Vに比例する場合、並びに第2の発明
ではS/Nの逆数に比例する場合について示したが、こ
の場合の比例は線形な比例関係に限定されず、また比例
走数も固定的なものでなくても良い。即ち、この変数β
は経験的に求められた関数β(V)並びにβ(N/’S
)で適宜設定され得る。
雑音のパワー分散Vに比例する場合、並びに第2の発明
ではS/Nの逆数に比例する場合について示したが、こ
の場合の比例は線形な比例関係に限定されず、また比例
走数も固定的なものでなくても良い。即ち、この変数β
は経験的に求められた関数β(V)並びにβ(N/’S
)で適宜設定され得る。
(ト)発明の効果
本発明の音声認識装置の雑音除去システムは、パタン化
された雑音音響パラメータXに対して、雑音のパワー分
散或はS/N比に適応した重み付けを行ったパタンβX
そ得、これを音声区間のき響パラメータ時系列がら差し
引くことにより、雑ぎのパワー分散の度合いによる悪影
響を低減した音声パタンを作成できるので、認識率の高
い音声認識装置を実現することができる。
された雑音音響パラメータXに対して、雑音のパワー分
散或はS/N比に適応した重み付けを行ったパタンβX
そ得、これを音声区間のき響パラメータ時系列がら差し
引くことにより、雑ぎのパワー分散の度合いによる悪影
響を低減した音声パタンを作成できるので、認識率の高
い音声認識装置を実現することができる。
第1図は第1の本発明の雑音除去システムの一実施例を
示す構成図、第2図は第2の本発明の雑音除去システム
の一実施例を示す構成図、第3図Ca’)&び(b)は
特定周波数のスペクトルレベル信号図である。 l・・・マイクロホン、2・・・分析部、3・・・ぎ声
区間検出部、4・・・N音パタン作成部、 5・・・分
散算出部、6・・・雑音除去部、7・・・標準パタン記
憶部、8・・・マツチング部、9・・・S 、// N
!山部、10・・・−時記憶部。
示す構成図、第2図は第2の本発明の雑音除去システム
の一実施例を示す構成図、第3図Ca’)&び(b)は
特定周波数のスペクトルレベル信号図である。 l・・・マイクロホン、2・・・分析部、3・・・ぎ声
区間検出部、4・・・N音パタン作成部、 5・・・分
散算出部、6・・・雑音除去部、7・・・標準パタン記
憶部、8・・・マツチング部、9・・・S 、// N
!山部、10・・・−時記憶部。
Claims (2)
- (1)雑音中に音声が存在する音響信号から音声の存在
時間領域を音声区間として検出する音声区間検出手段、
該検出部で検出された音声区間外の雑音区間音響信号の
パワー成分の分散を算出する分散算出手段、雑音区間音
響信号から抽出した音響パラメータを時間軸正規化した
雑音パタンを得る雑音パタン作成手段、該雑音パタンの
重み付けを、上記分散値に基づいて制御し、該重み付け
制御された雑音パタンを音声区間音響信号の音響パラメ
ータから差し引く雑音除去手段を備え、 該雑音除去手段によって雑音が除去された音響パラメー
タに基づいて音声認識に供する音声パタンを得ることを
特徴をした音声認識装置の雑音除去システム。 - (2)雑音中に音声が存在する音響信号から音声の存在
時間領域を音声区間として検出する音声区間検出手段、
該検出部で検出された音声区間音響信号のパワー成分と
音声区間外の雑音区間音響信号のパワー成分とを比較し
てS/N比を算出するS/N比算出手段、雑音区間音響
信号から抽出した音響パラメータを時間軸正規化した雑
音パタンを得る雑音パタン作成手段、該雑音パタンの重
み付けを上記S/N比に基づいて制御し、該重み付け制
御された雑音パタンを音声区間音響信号の音響パラメー
タから差し引く雑音除去手段を備え、該雑音除去手段に
よって雑音が除去された音響パラメータに基づいて音声
認識に供する音声パタンを得ることを特徴をした音声認
識装置の雑音除去システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1321753A JP2966452B2 (ja) | 1989-12-11 | 1989-12-11 | 音声認識装置の雑音除去システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1321753A JP2966452B2 (ja) | 1989-12-11 | 1989-12-11 | 音声認識装置の雑音除去システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03180900A true JPH03180900A (ja) | 1991-08-06 |
JP2966452B2 JP2966452B2 (ja) | 1999-10-25 |
Family
ID=18136063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1321753A Expired - Fee Related JP2966452B2 (ja) | 1989-12-11 | 1989-12-11 | 音声認識装置の雑音除去システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2966452B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012506073A (ja) * | 2008-10-15 | 2012-03-08 | クゥアルコム・インコーポレイテッド | オーディオ信号における雑音推定の方法および装置 |
WO2017063516A1 (zh) * | 2015-10-13 | 2017-04-20 | 阿里巴巴集团控股有限公司 | 噪音信号确定方法、语音去噪方法及装置 |
-
1989
- 1989-12-11 JP JP1321753A patent/JP2966452B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012506073A (ja) * | 2008-10-15 | 2012-03-08 | クゥアルコム・インコーポレイテッド | オーディオ信号における雑音推定の方法および装置 |
US8380497B2 (en) | 2008-10-15 | 2013-02-19 | Qualcomm Incorporated | Methods and apparatus for noise estimation |
WO2017063516A1 (zh) * | 2015-10-13 | 2017-04-20 | 阿里巴巴集团控股有限公司 | 噪音信号确定方法、语音去噪方法及装置 |
US10796713B2 (en) | 2015-10-13 | 2020-10-06 | Alibaba Group Holding Limited | Identification of noise signal for voice denoising device |
Also Published As
Publication number | Publication date |
---|---|
JP2966452B2 (ja) | 1999-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6038532A (en) | Signal processing device for cancelling noise in a signal | |
CA2319995C (en) | Method and apparatus for suppressing audible noise in speech transmission | |
US5212764A (en) | Noise eliminating apparatus and speech recognition apparatus using the same | |
US6370255B1 (en) | Loudness-controlled processing of acoustic signals | |
US7418379B2 (en) | Circuit for improving the intelligibility of audio signals containing speech | |
MX2008013753A (es) | Control de ganancia de audio que utiliza deteccion de evento auditivo basado en intensidad acustica especifica. | |
WO2000022444A1 (en) | A method and system for updating noise estimates during pauses in an information signal | |
JP2006503330A (ja) | サブバンド音声信号のノイズ削減 | |
JP2006323336A (ja) | 音声を含むオーディオ信号のための回路配列もしくは方法 | |
RU2007131662A (ru) | Способ формирования отпечатка для звукового сигнала | |
JPH04505372A (ja) | 波形の分析 | |
JPH03180900A (ja) | 音声認識装置の雑音除去システム | |
KR101993991B1 (ko) | 잡음 제거 방법 및 그 장치 | |
JP2001215992A (ja) | 音声認識装置 | |
Khoubrouy et al. | Howling detection in hearing aids based on generalized Teager–Kaiser operator | |
JPH04227338A (ja) | 音声信号処理装置 | |
JP2642694B2 (ja) | 雑音除去方法 | |
KR930008721A (ko) | 음성인식 시스템의 특징추출방법 | |
JPH03122699A (ja) | 雑音除去装置及び該装置を用いた音声認識装置 | |
JPS6075898A (ja) | 単語音声認識装置 | |
JPS60106216A (ja) | 拡声器の音響強さを拡声器設置場所に存在する妨害雑音レベルに適合するための方法および装置 | |
JPS5999497A (ja) | 音声認識装置 | |
JPH0424692A (ja) | 音声区間検出方式 | |
JP3391031B2 (ja) | 騒音制御装置 | |
JPH01200294A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070813 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080813 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090813 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |