JP5153886B2 - 雑音抑圧装置および音声復号化装置 - Google Patents
雑音抑圧装置および音声復号化装置 Download PDFInfo
- Publication number
- JP5153886B2 JP5153886B2 JP2010534608A JP2010534608A JP5153886B2 JP 5153886 B2 JP5153886 B2 JP 5153886B2 JP 2010534608 A JP2010534608 A JP 2010534608A JP 2010534608 A JP2010534608 A JP 2010534608A JP 5153886 B2 JP5153886 B2 JP 5153886B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- noise
- signal
- unit
- noise suppression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 233
- 238000001228 spectrum Methods 0.000 claims abstract description 572
- 238000009499 grossing Methods 0.000 claims description 83
- 230000015556 catabolic process Effects 0.000 claims description 28
- 238000006731 degradation reaction Methods 0.000 claims description 28
- 230000009466 transformation Effects 0.000 claims description 13
- 230000006866 deterioration Effects 0.000 abstract description 25
- 238000012545 processing Methods 0.000 description 149
- 238000000034 method Methods 0.000 description 97
- 230000008569 process Effects 0.000 description 48
- 238000006243 chemical reaction Methods 0.000 description 32
- 230000003595 spectral effect Effects 0.000 description 27
- 230000000694 effects Effects 0.000 description 26
- 239000013598 vector Substances 0.000 description 24
- 238000004364 calculation method Methods 0.000 description 20
- 230000005236 sound signal Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000003094 perturbing effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
特許文献1の音信号加工方法は、雑音抑圧処理や、低ビットレート音声符号化処理によって発生する歪感を聴感的に軽減することを目的としており、入力信号と、入力信号を平滑化した加工信号を、音声・雑音状態判別手段によって求められた信号中の雑音比率の推定値に基づいて重み付け加算を行うことで、背景騒音など劣化成分が多く含まれる区間を中心に主観品質を改善するようにしたものである。
実施の形態1.
図1は本実施の形態による雑音抑圧装置100の全体構成を示したものである。
図1に示す雑音抑圧装置100は、時間・周波数変換部2、雑音抑圧部3、信号加工部4、周波数・時間変換部5で構成されている。雑音抑圧部3は、雑音スペクトル抑圧部7と、音声・雑音判定部9および雑音スペクトル更新部10からなる雑音スペクトル推定部8とで構成されている。信号加工部4は、信号加算部11と、振幅平滑部12と、加工成分算出部14および位相擾乱部15からなる信号変形部13とで構成されている。
まず、所定のサンプリング周波数(例えば、8kHz)でサンプリングされ、所定のフレーム周期(例えば、20msec)にフレーム分割された入力信号1が、雑音抑圧装置100内の時間・周波数変換部2と、後述説明する雑音スペクトル推定部8内部の音声・雑音判定部9に入力される。
VAD=wACF・ACFmax+wSNR・SNRfr・SNRnorm (3)
信号変形部13は、雑音スペクトル抑圧部7が出力する雑音抑圧スペクトル18と、雑音スペクトル推定部8が出力する推定雑音スペクトル17とを用いて、加工スペクトル19を生成する。まず、加工成分算出部14は、推定雑音スペクトル17の周波数成分毎に、その振幅値に所定値を乗算した値(後述する変形推定雑音スペクトル)を得て、その得られた値と同じ振幅値を持つように雑音抑圧スペクトル18を変形し、変形雑音抑圧スペクトル18aとして位相擾乱部15へ出力する。なお、推定雑音スペクトル17に乗算する所定値としては、例えば雑音抑圧処理における最大抑圧量近傍の値が好適である。例えば、最大抑圧量が−12dBであれば、所定値は0.25〜0.2程度で設定すればよく、雑音の種類、雑音抑圧方法、劣化の度合い、または使用者の好みに合わせて予め調整すれば良い。また、複数の値をメモリ等に保持しておき、加工成分算出部14が雑音の種類および雑音パワーなどに応じて好適な値に切り替えることなども可能である。
図2(a)は雑音抑圧スペクトル18と推定雑音スペクトル17との関係の一例を図示したものであり、雑音抑圧スペクトル18のベクトル101、推定雑音スペクトル17のベクトル102、推定雑音スペクトル17の振幅に所定値を乗算したスカラ値103、スカラ値103と同じ振幅値となるようにベクトル101を変形した、変形雑音抑圧スペクトル18aのベクトル104により表現される。
また、図2(b)は雑音抑圧スペクトル18、加工スペクトル19および加算スペクトル20の関係の一例を図示したものであり、雑音抑圧スペクトル18のベクトル101、変形雑音抑圧スペクトル18aのベクトル104、変形雑音抑圧スペクトル18aを位相擾乱して得た加工スペクトル19のベクトル105、加算スペクトル20のベクトル106により表現される。またθはベクトル104を位相擾乱するための位相角である。位相擾乱の範囲(加工スペクトル19の存在範囲)Aを点線円で示す。
X(n,0)=SADD(n,0)
X(n,k)=(1−β(k))・SADD(n,k−1)
+β(k)・SADD(n,k)
ただし、k=1,...,M (5)
Y(n,k)=(1−γ(k))・Y(n−1,k)+γ(k)・X(n,k)
ただし、k=0,...,M (6)
そのため、雑音抑圧処理等によって劣化した雑音抑圧スペクトル18に対して信号加工部4が所定の加工処理を行うにあたり、雑音抑圧スペクトル18の周波数成分の値と、推定雑音スペクトル17の周波数成分の値に基づいて、雑音抑圧スペクトル18に含まれる劣化成分を主観的に気にならないようにした平滑化成分である加工スペクトル19を求めて、雑音抑圧スペクトル18の周波数成分に加算し、劣化成分を抑圧することができる。この結果、従来の方法では必要であった音声・雑音区間判定が要らなくなり、この結果、区間判定誤りによるエコー感や雑音感の発生無しに主観品質を改善できる効果がある。
図5は、本実施の形態による雑音抑圧装置100の全体構成を示したものであり、上記実施の形態1の雑音抑圧装置100に信号減算部22を追加した構成である。以下の実施の形態の説明において、先立って説明した実施の形態1(図1)の構成要素と同一または相当するものには同一の符号を付し、説明を省略する。
図6(a)は、図2(a)と同様に、雑音抑圧スペクトル18と推定雑音スペクトル17との関係の一例を図示したものであり、雑音抑圧スペクトル18のベクトル101、推定雑音スペクトル17のベクトル102、推定雑音スペクトル17の振幅に所定値を乗算したスカラ値103、変形雑音抑圧スペクトル18aのベクトル104、雑音抑圧スペクトル18から変形雑音抑圧スペクトル18aを減算したスペクトルの成分ベクトル107により表現される。
また、図6(b)は、図2(b)と同様に、雑音抑圧スペクトルと、図6(a)にて得られた加工スペクトル、および加算スペクトルとの関係の一例を図示したものであり、雑音抑圧スペクトル18のベクトル101、変形雑音抑圧スペクトル18aのベクトル104、加工スペクトル19のベクトル105、雑音抑圧スペクトル18から変形雑音抑圧スペクトル18aを減算したスペクトルの成分ベクトル107、加算スペクトル20のベクトル108により表現される。
信号加工部4が雑音抑圧スペクトル18に対し、変形雑音抑圧スペクトル18aを減算すると共に加工スペクトル19を加算するようにしたので、上記実施の形態1にて述べた効果に加えて、出力信号6の雑音感の増加を抑制しつつ、更に主観品質を改善できる効果がある。
上記実施の形態1および2では、信号変形部13内部の加工成分算出部14の処理において、推定雑音スペクトル17の周波数毎に乗算する所定値として、雑音抑圧処理における最大抑圧量近傍の値を用いる構成であった。本実施の形態では、推定雑音スペクトル17の周波数毎に乗算する所定値に、例えば低周波数では大きい値、高周波数では小さい値というような、周波数軸方向の重み付けを行う構成とする。本実施の形態の雑音抑圧装置の構成は、図1に示す上記実施の形態1または図5に示す実施の形態2の雑音抑圧装置100の構成と図面上では同様であり、加工成分算出部14の処理のみが異なる。
上記実施の形態1では、雑音抑圧処理を周波数領域(またはスペクトル領域と言う)にて実施していたが、必ずしもこの構成である必要は無く、時間領域に実施しても構わない。図7は、本実施の形態による雑音抑圧装置100の全体構成を示したものであり、上記実施の形態1の雑音スペクトル抑圧部7に代えて雑音抑圧フィルタ部23と時間・周波数変換部24とを備える構成である。以下の実施の形態の説明において、先立って説明した実施の形態1(図1)の構成要素と同一または相当するものには同一の符号を付し、説明を省略する。
実施の形態1の雑音抑圧装置100を変形して、本実施の形態に示す音声復号化装置200を構成してもよい。図8は、本実施の形態による音声復号化装置200の全体構成を示すものである。音声復号化装置200は、入力信号に代えて符号データ25が入力されるものとし、符号データ25を復号化処理する音声復号部26を新たに備える。図8において図1と同一または相当の部分については同一の符号を付す。
そのため、音声符号化処理によって劣化した復号信号スペクトル28に対して信号加工部4が所定の加工処理を行うにあたり、復号信号スペクトル28の周波数成分の値と、推定雑音スペクトル17の周波数成分の値に基づいて、復号信号スペクトル28に含まれる劣化成分を主観的に気にならないようにした平滑化成分である加工スペクトル19を求めて、復号信号スペクトル28の周波数成分に加算し、劣化成分を抑圧することができる。この結果、従来の方法では必要であった音声・雑音区間判定が要らなくなり、この結果、区間判定誤りによるエコー感や雑音感の発生無しに主観品質を改善できる効果がある。
上記実施の形態5と同様に、上記実施の形態2の雑音抑圧装置100を変形して、本実施の形態に示すような音声復号化装置200を構成してもよい。図9は、本実施の形態による音声復号化装置200の全体構成を示すものである。図9において図5または図8と同一または相当の部分については同一の符号を付し説明を省略する。
信号加工部4が復号信号スペクトル28に対し、変形復号信号スペクトル28aを減算すると共に加工スペクトル19を加算するようにしたので、上記実施の形態5にて述べた効果に加えて、出力信号6の雑音感の増加を抑制しつつ、更に主観品質を改善できる効果がある。
上記実施の形態5および6では、信号変形部13内部の加工成分算出部14の処理において、推定雑音スペクトル17の周波数毎に乗算する所定値として、周波数軸方向に一定の値を用いる構成であった。本実施の形態では、推定雑音スペクトル17の周波数毎に乗算する所定値に、例えば低周波数では大きな値、高周波数では小さい値というような、周波数軸方向の重み付けを行う構成とする。本実施の形態の音声復号化装置200の構成は、図8に示す実施の形態5または図9に示す実施の形態6の音声復号化装置200の構成と図面上では同様であり、加工成分算出部14の処理のみが異なる。
上記実施の形態1では、信号加工部4が推定雑音スペクトル17と雑音抑圧スペクトル18に基づく比に応じて加工スペクトル19を生成する構成であったが、本実施の形態では推定雑音スペクトル17と雑音抑圧スペクトル18に基づく比に応じて雑音抑圧スペクトル18の位相擾乱の幅を制御する構成とする。
この構成の場合には、雑音抑圧処理の手法として周波数領域および時間領域を問わず、その主観品質を改善できる効果がある。
上記実施の形態8と同様に、上記実施の形態5の音声復号化装置200を変形して、信号加工部4が復号信号スペクトル28と推定雑音スペクトル17に基づく比に応じて加工スペクトル19を生成する代わりに、復号信号スペクトル28と推定雑音スペクトル17に基づく比に応じて復号信号スペクトル28の位相擾乱の幅を制御してもよい。
上記実施の形態5〜7および9では、信号加工部4は復号信号スペクトル28を加工対象にして加工処理を実施する構成としたが、図12に示すように、雑音スペクトル抑圧部7が復号信号27の雑音抑圧処理を行った後で信号加工部4が信号加工を行う構成であっても良い。図12は本実施の形態による音声復号化装置200の全体構成を示したものである。図12では、雑音抑圧処理を行うために雑音スペクトル抑圧部7を備える構成を示すが、雑音スペクトル抑圧部7に代えて雑音抑圧フィルタ部23および時間・周波数変換部24(図7)を備える構成にしてもよい。なお、図12において図1〜11と同一または相当の部分については同一の符号を付し説明を省略する。
上記実施の形態1〜10では、時間・周波数変換部2がFFTによってスペクトル成分を算出し、周波数・時間変換部5が加工処理の実施されたスペクトル成分を逆FFT処理によって時間領域の信号に戻す構成としているが、FFTの代わりにバンドパスフィルタ群の各出力に対して、加工処理を実施し、帯域別信号の加算によって出力信号を得る構成も可能であるし、ウェーブレット(Wavelet)変換等の変換関数を用いることも可能である。
Claims (12)
- 入力信号を周波数成分である入力信号スペクトルに変換する時間・周波数変換部と、
前記入力信号から推定雑音スペクトルを推定する雑音スペクトル推定部と、
前記推定雑音スペクトルに基づいて前記入力信号スペクトルの雑音抑圧を行い、雑音抑圧スペクトルを生成する雑音スペクトル抑圧部と、
前記雑音抑圧スペクトルと前記推定雑音スペクトルに基づく比に応じて前記雑音抑圧スペクトルを変形すると共に平滑化した加工スペクトルを生成する信号変形部と、
前記雑音抑圧スペクトルに前記加工スペクトルを加算して、当該雑音抑圧スペクトルに含まれる劣化成分を抑圧する信号加算部とを備える雑音抑圧装置。 - 信号変形部は、周波数軸方向の重み付けをした加工スペクトルを生成することを特徴とする請求項1記載の雑音抑圧装置。
- 入力信号を周波数成分である入力信号スペクトルに変換する時間・周波数変換部と、
前記入力信号から推定雑音スペクトルを推定する雑音スペクトル推定部と、
前記推定雑音スペクトルに基づいて前記入力信号スペクトルの雑音抑圧を行い、雑音抑圧スペクトルを生成する雑音スペクトル抑圧部と、
前記雑音抑圧スペクトルと前記推定雑音スペクトルに基づく比に応じて前記雑音抑圧スペクトルを変形した変形雑音抑圧スペクトルを生成すると共に、当該変形雑音抑圧スペクトルを平滑化した加工スペクトルを生成する信号変形部と、
前記雑音抑圧スペクトルから前記変形雑音抑圧スペクトルを減算する信号減算部と、
前記信号減算部により前記変形雑音抑圧スペクトルが減算された前記雑音抑圧スペクトルに前記加工スペクトルを加算して、当該雑音抑圧スペクトルに含まれる劣化成分を抑圧する信号加算部とを備える雑音抑圧装置。 - 信号変形部は、周波数軸方向の重み付けをした加工スペクトルを生成することを特徴とする請求項3記載の雑音抑圧装置。
- 入力信号を周波数成分である入力信号スペクトルに変換する時間・周波数変換部と、
前記入力信号から推定雑音スペクトルを推定する雑音スペクトル推定部と、
前記推定雑音スペクトルに基づいて前記入力信号スペクトルの雑音抑圧を行い、雑音抑圧スペクトルを生成する雑音スペクトル抑圧部と、
前記雑音抑圧スペクトルと前記推定雑音スペクトルに基づく比に応じた度合いで、前記雑音抑圧スペクトルの位相を擾乱する位相擾乱部とを備える雑音抑圧装置。 - 位相擾乱部は、周波数軸方向の重み付けをした位相擾乱の度合いを求めることを特徴とする請求項5記載の雑音抑圧装置。
- 所定の符号データを復号化して復号信号を生成する音声復号部と、
前記復号信号を周波数成分である復号信号スペクトルに変換する時間・周波数変換部と、
前記復号信号から推定雑音スペクトルを推定する雑音スペクトル推定部と、
前記復号信号スペクトルと前記推定雑音スペクトルに基づく比に応じて前記復号信号スペクトルを変形すると共に平滑化した加工スペクトルを生成する信号変形部と、
前記復号信号スペクトルに前記加工スペクトルを加算して、当該復号信号スペクトルに含まれる劣化成分を抑圧する信号加算部とを備える音声復号化装置。 - 信号変形部は、周波数軸方向の重み付けをした加工スペクトルを生成することを特徴とする請求項7記載の音声復号化装置。
- 所定の符号データを復号化して復号信号を生成する音声復号部と、
前記復号信号を周波数成分である復号信号スペクトルに変換する時間・周波数変換部と、
前記復号信号から推定雑音スペクトルを推定する雑音スペクトル推定部と、
前記復号信号スペクトルと前記推定雑音スペクトルに基づく比に応じて前記復号信号スペクトルを変形した変形復号信号スペクトルを生成すると共に、当該変形復号信号スペクトルを平滑化した加工スペクトルを生成する信号変形部と、
前記復号信号スペクトルから前記変形復号信号スペクトルを減算する信号減算部と、
前記信号減算部により前記変形復号信号スペクトルが減算された前記復号信号スペクトルに前記加工スペクトルを加算して、当該復号信号スペクトルに含まれる劣化成分を抑圧する信号加算部とを備える音声復号化装置。 - 信号変形部は、周波数軸方向の重み付けをした加工スペクトルを生成することを特徴とする請求項9記載の音声復号化装置。
- 所定の符号データを復号化して復号信号を生成する音声復号部と、
前記復号信号を周波数成分である復号信号スペクトルに変換する時間・周波数変換部と、
前記復号信号から推定雑音スペクトルを推定する雑音スペクトル推定部と、
前記復号信号スペクトルと前記推定雑音スペクトルに基づく比に応じた度合いで、前記復号信号スペクトルの位相を擾乱する位相擾乱部とを備える音声復号化装置。 - 位相擾乱部は、周波数軸方向の重み付けをした位相擾乱の度合いを求めることを特徴とする請求項11記載の音声復号化装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2008/003021 WO2010046954A1 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置および音声復号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010046954A1 JPWO2010046954A1 (ja) | 2012-03-15 |
JP5153886B2 true JP5153886B2 (ja) | 2013-02-27 |
Family
ID=42119013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010534608A Active JP5153886B2 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置および音声復号化装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20110125490A1 (ja) |
EP (1) | EP2346032B1 (ja) |
JP (1) | JP5153886B2 (ja) |
CN (1) | CN102150206B (ja) |
WO (1) | WO2010046954A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8725506B2 (en) * | 2010-06-30 | 2014-05-13 | Intel Corporation | Speech audio processing |
JP5183828B2 (ja) | 2010-09-21 | 2013-04-17 | 三菱電機株式会社 | 雑音抑圧装置 |
US9531344B2 (en) | 2011-02-26 | 2016-12-27 | Nec Corporation | Signal processing apparatus, signal processing method, storage medium |
CN103137133B (zh) * | 2011-11-29 | 2017-06-06 | 南京中兴软件有限责任公司 | 非激活音信号参数估计方法及舒适噪声产生方法及系统 |
US9137600B2 (en) | 2012-02-16 | 2015-09-15 | 2236008 Ontario Inc. | System and method for dynamic residual noise shaping |
US20150271439A1 (en) * | 2012-07-25 | 2015-09-24 | Nikon Corporation | Signal processing device, imaging device, and program |
GB2520048B (en) * | 2013-11-07 | 2018-07-11 | Toshiba Res Europe Limited | Speech processing system |
US9721580B2 (en) * | 2014-03-31 | 2017-08-01 | Google Inc. | Situation dependent transient suppression |
CN105338148B (zh) * | 2014-07-18 | 2018-11-06 | 华为技术有限公司 | 一种根据频域能量对音频信号进行检测的方法和装置 |
JP6379839B2 (ja) * | 2014-08-11 | 2018-08-29 | 沖電気工業株式会社 | 雑音抑圧装置、方法及びプログラム |
US9953661B2 (en) * | 2014-09-26 | 2018-04-24 | Cirrus Logic Inc. | Neural network voice activity detection employing running range normalization |
JP6669277B2 (ja) * | 2016-12-20 | 2020-03-18 | 三菱電機株式会社 | 音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法 |
US11282531B2 (en) * | 2020-02-03 | 2022-03-22 | Bose Corporation | Two-dimensional smoothing of post-filter masks |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134287A (ja) * | 1999-11-10 | 2001-05-18 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2003101445A (ja) * | 2001-09-20 | 2003-04-04 | Mitsubishi Electric Corp | エコー処理装置 |
JP3454190B2 (ja) * | 1999-06-09 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置および方法 |
JP2005258158A (ja) * | 2004-03-12 | 2005-09-22 | Advanced Telecommunication Research Institute International | ノイズ除去装置 |
JP2008076975A (ja) * | 2006-09-25 | 2008-04-03 | Fujitsu Ltd | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
JP3259759B2 (ja) * | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JP4230414B2 (ja) | 1997-12-08 | 2009-02-25 | 三菱電機株式会社 | 音信号加工方法及び音信号加工装置 |
KR100341044B1 (ko) * | 1997-12-08 | 2002-07-13 | 다니구찌 이찌로오, 기타오카 다카시 | 음성 신호 가공 방법 및 음성 신호 가공 장치 |
US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
WO2000046789A1 (fr) * | 1999-02-05 | 2000-08-10 | Fujitsu Limited | Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son |
EP1376539B8 (en) * | 2001-03-28 | 2010-12-15 | Mitsubishi Denki Kabushiki Kaisha | Noise suppressor |
JP3457293B2 (ja) * | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US20030055645A1 (en) * | 2001-09-18 | 2003-03-20 | Meir Griniasty | Apparatus with speech recognition and method therefor |
JP4162604B2 (ja) * | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
US7454332B2 (en) * | 2004-06-15 | 2008-11-18 | Microsoft Corporation | Gain constrained noise suppression |
GB2422237A (en) * | 2004-12-21 | 2006-07-19 | Fluency Voice Technology Ltd | Dynamic coefficients determined from temporally adjacent speech frames |
US20080243496A1 (en) * | 2005-01-21 | 2008-10-02 | Matsushita Electric Industrial Co., Ltd. | Band Division Noise Suppressor and Band Division Noise Suppressing Method |
US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
JP4670483B2 (ja) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | 雑音抑圧の方法及び装置 |
US8566086B2 (en) * | 2005-06-28 | 2013-10-22 | Qnx Software Systems Limited | System for adaptive enhancement of speech signals |
JP4765461B2 (ja) * | 2005-07-27 | 2011-09-07 | 日本電気株式会社 | 雑音抑圧システムと方法及びプログラム |
CN101336451B (zh) * | 2006-01-31 | 2012-09-05 | 西门子企业通讯有限责任两合公司 | 音频信号编码的方法和装置 |
ATE425532T1 (de) * | 2006-10-31 | 2009-03-15 | Harman Becker Automotive Sys | Modellbasierte verbesserung von sprachsignalen |
JP2008148179A (ja) * | 2006-12-13 | 2008-06-26 | Fujitsu Ltd | 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法 |
US9966085B2 (en) * | 2006-12-30 | 2018-05-08 | Google Technology Holdings LLC | Method and noise suppression circuit incorporating a plurality of noise suppression techniques |
JP5018193B2 (ja) * | 2007-04-06 | 2012-09-05 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
KR101437830B1 (ko) * | 2007-11-13 | 2014-11-03 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
US20110178800A1 (en) * | 2010-01-19 | 2011-07-21 | Lloyd Watts | Distortion Measurement for Noise Suppression System |
-
2008
- 2008-10-24 JP JP2010534608A patent/JP5153886B2/ja active Active
- 2008-10-24 EP EP08877520.0A patent/EP2346032B1/en not_active Not-in-force
- 2008-10-24 US US13/055,837 patent/US20110125490A1/en not_active Abandoned
- 2008-10-24 WO PCT/JP2008/003021 patent/WO2010046954A1/ja active Application Filing
- 2008-10-24 CN CN2008801310563A patent/CN102150206B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3454190B2 (ja) * | 1999-06-09 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置および方法 |
JP2001134287A (ja) * | 1999-11-10 | 2001-05-18 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2003101445A (ja) * | 2001-09-20 | 2003-04-04 | Mitsubishi Electric Corp | エコー処理装置 |
JP2005258158A (ja) * | 2004-03-12 | 2005-09-22 | Advanced Telecommunication Research Institute International | ノイズ除去装置 |
JP2008076975A (ja) * | 2006-09-25 | 2008-04-03 | Fujitsu Ltd | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN102150206A (zh) | 2011-08-10 |
WO2010046954A1 (ja) | 2010-04-29 |
EP2346032A1 (en) | 2011-07-20 |
JPWO2010046954A1 (ja) | 2012-03-15 |
EP2346032A4 (en) | 2012-10-24 |
EP2346032B1 (en) | 2014-05-07 |
US20110125490A1 (en) | 2011-05-26 |
CN102150206B (zh) | 2013-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5153886B2 (ja) | 雑音抑圧装置および音声復号化装置 | |
JP5300861B2 (ja) | 雑音抑圧装置 | |
RU2329550C2 (ru) | Способ и устройство для улучшения речевого сигнала в присутствии фонового шума | |
JP3591068B2 (ja) | 音声信号の雑音低減方法 | |
CN111899752B (zh) | 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端 | |
KR101120679B1 (ko) | 이득-제한된 잡음 억제 | |
US5706394A (en) | Telecommunications speech signal improvement by reduction of residual noise | |
JP4836720B2 (ja) | ノイズサプレス装置 | |
JP6169849B2 (ja) | 音響処理装置 | |
JP5245714B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
WO2008121436A1 (en) | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate | |
JPWO2006046293A1 (ja) | 雑音抑圧装置 | |
JP2008216720A (ja) | 信号処理の方法、装置、及びプログラム | |
JP5526524B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP2003280696A (ja) | 音声強調装置及び音声強調方法 | |
JP5840087B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
RU2707144C2 (ru) | Аудиокодер и способ для кодирования аудиосигнала | |
JP5131149B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
Esch et al. | Wideband noise suppression supported by artificial bandwidth extension techniques | |
JP6559576B2 (ja) | 雑音抑圧装置、雑音抑圧方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5153886 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |