JP5614261B2 - 雑音抑制装置、雑音抑制方法、及びプログラム - Google Patents
雑音抑制装置、雑音抑制方法、及びプログラム Download PDFInfo
- Publication number
- JP5614261B2 JP5614261B2 JP2010262922A JP2010262922A JP5614261B2 JP 5614261 B2 JP5614261 B2 JP 5614261B2 JP 2010262922 A JP2010262922 A JP 2010262922A JP 2010262922 A JP2010262922 A JP 2010262922A JP 5614261 B2 JP5614261 B2 JP 5614261B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- noise
- stationary
- suppression
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000001629 suppression Effects 0.000 title claims description 219
- 238000000034 method Methods 0.000 title claims description 114
- 238000001228 spectrum Methods 0.000 claims description 539
- 238000004364 calculation method Methods 0.000 claims description 58
- 230000005236 sound signal Effects 0.000 claims description 58
- 238000006243 chemical reaction Methods 0.000 claims description 32
- 230000009466 transformation Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 description 21
- 230000002123 temporal effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
まず、第一の技術として、入力された音響信号に存在する人の音声の信号成分が有声音か無声音かによって、雑音消去特性が異なる出力信号を選択するようにして、背景雑音の消去を行うという技術が知られている。この技術では、入力音響信号の時間軸上での短期平均及び長期平均を計算し、算出された短期平均と長時間平均との差が第一閾値を超えるときには、この音響信号には音声成分が含まれていると判定する。あるいは、入力音響信号の信号対雑音比と第一閾値との比較結果に基づいて入力音響信号中の音声成分の有無の検出を行う。また、この技術では、入力音響信号の信号対雑音比と第二閾値との大小関係、及び、入力音響信号の周波数軸上での最大値についての推定背景雑音に対するパワー比と第三閾値との大小関係に応じて、入力音響信号中の音声成分が有声音か無声音かを判定する。
抑圧ゲイン設定部2は、上述のスペクトルの周波数毎に、各スペクトルを抑圧する程度を表す抑圧ゲインを、各スペクトルについての非定常度の時間変化量に基づき設定する。
逆変換部4は、スペクトル抑圧処理部3による抑圧処理後のスペクトルに対して、変換部1による変換の逆変換を施す。
[1]の波形は、発音体の一例である、人の発声音を収音している途中で、瞬時的な非定常雑音が混入した場合の収音信号の波形例であり、波形上に描かれている楕円内の急峻なパルス状の波形が、瞬時的な非定常雑音を表している。
定常雑音成分推定部5は、前述のスペクトルの周波数毎に、各スペクトルに含まれている定常雑音成分の量を推定する。
すなわち、抑圧ゲイン設定部2は、まず、スペクトルの周波数毎に、各スペクトルの成分が非定常雑音であるか否かの判定を、各スペクトルについての非定常度の時間変化量に基づき行う。そして、抑圧ゲイン設定部2は、成分が非定常雑音であると判定したスペクトルについての抑圧ゲインをスペクトルの大きさが小さくなる値に設定する。その一方、抑圧ゲイン設定部2は、成分が非定常雑音ではないと判定したスペクトルについての抑圧ゲインをスペクトルの大きさが維持される値に設定する。
その判定の第一の手法では、抑圧ゲイン設定部2が、判定対象のスペクトルについての非定常度の時間変化量と所定の上限閾値との大小比較を行い、その比較結果を、前述の判定の結果として扱うというものである。すなわち、抑圧ゲイン設定部2は、判定対象のスペクトルについての非定常度の時間変化量がこの上限閾値よりも大きい場合には、当該スペクトルの成分が非定常雑音であるとの判定を下す。一方、抑圧ゲイン設定部2は、判定対象のスペクトルについての非定常度の時間変化量がこの上限閾値よりも小さい場合には、当該スペクトルの成分が非定常雑音ではないとの判定を下す。
また、前述の判定の第三の手法では、抑圧ゲイン設定部2は、第二の手法と同様に、スペクトルグループのうちで、前述の一対の隣接極小スペクトルの間に1グループのみ存在しているスペクトルグループをまず抽出する。次に、抑圧ゲイン設定部2は、周波数軸上において、抽出されたスペクトルグループと当該一対の隣接極小スペクトルとに挟まれている他のスペクトルの存在個数を、当該スペクトルグループに対する該周波数軸上での上側及び下側の各々において計数する。ここで、各々計数されたスペクトルの存在個数のどちらもが0若しくは所定の個数閾値以内である場合には、抑圧ゲイン設定部2は、そのスペクトルグループに含まれている極大スペクトルについて、スペクトルの成分が非定常雑音であるとの判定を下す。
なお、抑圧ゲイン設定部2は、成分が非定常雑音であると判定したスペクトルである抑圧対象スペクトルについて設定する抑圧ゲインの値を、以下に例示するどちらの手法により行ってもよい。
この手法では、非定常度算出部6は、まず、前述のスペクトルの周波数毎に、各スペクトルの信号対雑音比の算出を、各スペクトルの大きさを定常雑音成分推定部5により推定された各スペクトルについての定常雑音成分の量で除算して行う。そして、非定常度算出部6は、この信号対雑音比の値に基づき、この値が所定の第一閾値よりも小さいスペクトルについては、当該スペクトルについての非定常度を0とする。また、非定常度算出部6は、この信号対雑音比の値が、第一閾値よりも大きい所定の第二閾値よりも更に大きいスペクトルについては、当該スペクトルについての非定常度を1とする。更に、非定常度算出部6は、この信号対雑音比から第一閾値を減算した値を、第二閾値から第一閾値を減算した値で除算する。そして、非定常度算出部6は、信号対雑音比の値が第一閾値よりも大きく第二閾値よりも小さいスペクトルについては、前述した除算により得られる値を、当該スペクトルについての非定常度とする。
図3の雑音抑制装置は、FFT部11、定常雑音モデル推定部12、非定常度算出部13、非定常度時間変化量算出部14、雑音検出部15、ゲイン設定部16、出力用スペクトル生成部17、及びIFFT部18を備えており、マイク10が接続されている。
FFT(Fast Fourier Transform)部11は高速フーリエ変換を行うものであり、マイク10から出力される、時間領域で表現されている収音信号の所定のサンプル数分の信号波形を周波数領域のスペクトルに変換して出力する。なお、この高速フーリエ変換のために行う収音信号のサンプリングでは、収音信号で表現されている人の発声音を表現するために十分なサンプリング間隔で行うものとする。このFFT部11により、図1の雑音抑制装置における変換部1に相当する機能が提供される。
なお、図1や図3に図解した雑音抑制装置を、標準的なハードウェア構成のコンピュータを用いて構成することができる。
このコンピュータ20は、MPU21、ROM22、RAM23、ハードディスク装置24、入力装置25、表示装置26、インタフェース装置27、及び記録媒体駆動装置28を備えている。なお、これらの構成要素はバスライン29を介して接続されており、MPU21の管理の下で各種のデータを相互に授受することができる。
ROM(Read Only Memory)22は、所定の基本制御プログラムが予め記録されている読み出し専用半導体メモリである。MPU21は、この基本制御プログラムをコンピュータ20の起動時に読み出して実行することにより、このコンピュータ20の各構成要素の動作制御が可能になる。
MPU21は、ハードディスク装置24に記憶されている所定の制御プログラムを読み出して実行することにより、後述する制御処理を行えるようになる。
インタフェース装置27は、このコンピュータ20に接続される各種機器との間での各種データの授受の管理を行う。より具体的には、インタフェース装置27は、マイク10から送られてくる収音信号のアナログ−デジタル変換や、雑音抑制装置の出力信号の後続機器への送信などを行う。
図5において、まずS101では、FFT処理をFFT部11が行う。この処理は、マイク10から出力される、時間領域で表現されている収音信号の所定のサンプル数分の信号波形に対して高速フーリエ変換を施して周波数領域のスペクトルに変換する処理である。
まず、S102では、定常雑音モデル推定処理を定常雑音モデル推定部12が行う。この処理は、処理対象のスペクトルに含まれている定常雑音成分の量を推定する処理である。本実施例では、この処理では、前述したように、発声音が含まれていない期間の収音信号の信号レベルの平均値を算出し、その算出結果を、定常雑音成分の量の推定結果とする処理が行われる。なお、収音信号から発声音が含まれていない期間を検出する手法は、幾つもの手法が広く知られており、そのうちのいずれの手法を採用してもよい。
なお、図1に図解した雑音抑制装置が図5の雑音抑制制御処理を行う場合には、雑音抑制装置の各機能ブロックは、図5の各処理を、次のように分担して行う。すなわち、まず、S101のFFT処理は変換部1が行う。また、S102の定常雑音モデル推定処理、S103の非定常度算出処理、S104の非定常度時間変化量算出処理、S105の判定処理、並びにS106及びS107の抑圧ゲイン設定処理は抑圧ゲイン設定部2が行う。特に、S102の定常雑音モデル推定処理は定常雑音成分推定部5が行い、S103の非定常度算出処理は非定常度算出部6が行う。そして、S108の出力用スペクトル生成処理はスペクトル抑圧処理部3が行い、S109のIFFT処理は逆変換部4が行う。
まず図6について説明する。図6は、瞬時的な非定常雑音が混入した時刻及びその前後の時刻における収音信号のスペクトル分布の例であり、図2の[1]の波形に描かれている楕円内の収音信号のスペクトル分布の例である。
図6において、「τ」の波形は、瞬時的な非定常雑音が混入した時刻τにおける収音信号のスペクトル分布を表している。また、「τ−1」の波形は、当該時刻τよりもFFT変換における1フレーム前の時刻τ−1における収音信号のスペクトル分布を表しており、「τ+1」の波形は、当該時刻τよりも1フレーム後の時刻τ+1におけるそのスペクトル分布を表している。なお、破線の波形は、定常雑音モデル推定部12による定常雑音成分の量の推定結果(定常雑音モデル)を表している。
NSV = (SNR-a) / (b-a)……………[1]
その第一の設定手法は、予め設定しておいた固定値(例えばa=2.5、b=6.0)を用いるというものである。
図9における横軸は周波数を表しており、縦軸は非定常度の大きさを表している。
本実施例における非定常度算出部13による非定常度の算出は、以上のようにして行われる。
δNSV(τ) = {|NSV(τ)-NSV(τ-1)| + |NSV(τ+1)-NSV(τ)|} / 2………[2]
図9の分布から求めた、時刻τにおける収音信号の非定常度時間変化量の分布を図10に示す。
まず、周波数軸上に並べられている収音信号のスペクトルの一部を極大スペクトルと極小スペクトルとに分類する。ここで、極大スペクトルとは、収音信号のスペクトルのうちで、非定常度の時間変化量が所定の上限閾値(具体的な数値は例えば「0.9」)よりも大きいスペクトルである。また、極小スペクトルとは、収音信号のスペクトルのうちで、非定常度の時間変化量が所定の下限閾値(具体的な数値は例えば「0.1」)よりも大きいスペクトルである。
ゲイン設定部16は、まず、雑音検出部15による非定常雑音の検出結果として、抑圧ゲインの設定対象であるスペクトルが非定常雑音成分でないと判定されていた場合には、当該スペクトルについての抑圧ゲインを「1.0」とする。この値が抑圧ゲインとして設定されたスペクトルに対して、出力用スペクトル生成部17で当該抑圧ゲインを乗算しても、乗算後の当該スペクトルの大きさは乗算前のものから変わらず、維持される。
ゲイン設定部16は、非定常雑音成分であると判定されたスペクトルについての抑圧ゲインの設定を、上述した3種類の設定手法のいずれか1つを用いて行う。
(付記1)
発音体の発音を収音して得た収音信号であって時間領域で表現されている該収音信号を周波数領域のスペクトルに変換する変換部と、
前記スペクトルの周波数毎に、各スペクトルを抑圧する程度を表す抑圧ゲインを、該各スペクトルについての非定常度の時間変化量に基づき設定する抑圧ゲイン設定部と、
前記抑圧ゲイン設定部により前記スペクトルの周波数毎に設定された前記抑圧ゲインに基づいて、前記各スペクトルを抑圧する処理を行うスペクトル抑圧処理部と、
前記スペクトル抑圧処理部による抑圧処理後のスペクトルに対して、前記変換部による変換の逆変換を施す逆変換部と、
を備えることを特徴とする雑音抑制装置。
(付記2)
前記抑圧ゲイン設定部は、
前記スペクトルの周波数毎に、各スペクトルに含まれている定常雑音成分の量を推定する定常雑音成分推定部と、
前記スペクトルの周波数毎に、各スペクトルの大きさと前記定常雑音成分推定部により推定された該各スペクトルについての前記定常雑音成分の量とに基づき、該各スペクトルに含まれる非定常成分の比率を、該各スペクトルについての非定常度として算出する非定常度算出部と、
を備え、前記非定常度算出部が前記スペクトルの周波数毎に算出した各スペクトルについての非定常度についての時間変化量に基づき、前記スペクトルの周波数毎の前記抑圧ゲインを設定する、
ことを特徴とする付記1に記載の雑音抑制装置。
(付記3)
前記定常雑音成分推定部は、前記スペクトルの周波数毎に、前記収音信号において前記発音体の発音が含まれていない期間におけるスペクトルの大きさの平均値を算出し、該平均値を前記定常雑音成分の量の推定結果とすることを特徴とする付記2に記載の雑音抑制装置。
(付記4)
前記抑圧ゲイン設定部は、前記スペクトルの周波数毎に、各スペクトルの成分が非定常雑音であるか否かの判定を、該各スペクトルについての非定常度の時間変化量に基づき行い、成分が非定常雑音であると判定したスペクトルについての抑圧ゲインをスペクトルの大きさが小さくなる値に設定し、成分が非定常雑音ではないと判定したスペクトルについての抑圧ゲインをスペクトルの大きさが維持される値に設定することを特徴とする付記1から3のうちのいずれか一項に記載の雑音抑制装置。
(付記5)
前記抑圧ゲイン設定部は、前記判定において、前記非定常度の時間変化量が所定の上限閾値よりも大きいスペクトルについては、スペクトルの成分が非定常雑音であるとの判定を下し、該時間変化量が該上限閾値よりも小さいスペクトルについては、スペクトルの成分が非定常雑音ではないとの判定を下すことを特徴とする付記4に記載の雑音抑制装置。
(付記6)
前記抑圧ゲイン設定部は、前記判定において、周波数軸上に並べられている前記スペクトルのうちで、前記非定常度の時間変化量が所定の上限閾値よりも大きいものを極大スペクトルとすると共に該時間変化量が所定の下限閾値よりも小さいものを極小スペクトルとし、該極大スペクトルを1つのみ含む、若しくは、該周波数軸上において連続している複数の該極大スペクトルを含むスペクトルグループであって、該周波数軸上に周波数順に並んでいる極小スペクトルのうちの1つと周波数軸上において該1つの極小スペクトルの次の周波数順である極小スペクトルとからなる一対の隣接極小スペクトルの間に該スペクトルグループが1グループのみ存在している場合の該スペクトルグループに含まれている極大スペクトルについては、スペクトルの成分が非定常雑音であるとの判定を下し、該スペクトルのうちのその他のスペクトルについては、スペクトルの成分が非定常雑音ではないとの判定を下すことを特徴とする付記4に記載の雑音抑制装置。
(付記7)
前記抑圧ゲイン設定部は、前記判定において、周波数軸上に並べられている前記スペクトルのうちで、前記非定常度の時間変化量が所定の上限閾値よりも大きいものを極大スペクトルとすると共に該時間変化量が所定の下限閾値よりも小さいものを極小スペクトルとし、該極大スペクトルを1つのみ含む、若しくは、該周波数軸上において連続している複数の該極大スペクトルを含むスペクトルグループであって、該周波数軸上に周波数順に並んでいる極小スペクトルのうちの1つと周波数軸上において該1つの極小スペクトルの次の周波数順である極小スペクトルとからなる一対の隣接極小スペクトルの間に該スペクトルグループが1グループのみ存在し、且つ、該周波数軸上において該スペクトルグループと該一対の隣接極小スペクトルとに挟まれている他のスペクトルの存在個数が、該スペクトルグループに対する該周波数軸上での上側及び下側の各々においてどちらも0若しくは所定の個数閾値以内である場合の該スペクトルグループに含まれている極大スペクトルについては、スペクトルの成分が非定常雑音であるとの判定を下し、該スペクトルのうちのその他のスペクトルについては、スペクトルの成分が非定常雑音ではないとの判定を下すことを特徴とする付記4に記載の雑音抑制装置。
(付記8)
前記抑圧ゲイン設定部は、周波数軸上に並べられている前記スペクトルのうちで前記上限閾値よりも小さいスペクトルから、周波数が、前記判定において成分が非定常雑音であると判定したスペクトルである抑圧対象スペクトルの周波数の上下でそれぞれ最も近いものを1つずつ選択し、選択した2つのスペクトルの大きさの平均値を該抑圧対象スペクトルの大きさで除算した値を、該抑圧対象スペクトルについての抑圧ゲインとして設定することを特徴とする付記5から7のうちのいずれか一項に記載の雑音抑制装置。
(付記9)
前記抑圧ゲイン設定部は、
前記収音信号に含まれている定常雑音成分の量を、前記スペクトルの周波数毎に推定する定常雑音成分推定部を備え、
前記スペクトルの周波数毎に、各スペクトルの成分が非定常雑音であるか否かの判定を、該各スペクトルについての非定常度の時間変化量に基づき行い、成分が非定常雑音であると判定したスペクトルである抑圧対象スペクトルについての抑圧ゲインとしては、該定常雑音成分推定部が該抑圧対象スペクトルの周波数について推定した定常雑音成分の量を該抑圧対象スペクトルの大きさで除算した値を設定し、該成分が非定常雑音ではないと判定したスペクトルについての抑圧ゲインとしては、スペクトルの大きさが維持される値を設定する、
ことを特徴とする付記1に記載の雑音抑制装置。
(付記10)
前記非定常度算出部は、前記スペクトルの周波数毎に、各スペクトルの信号対雑音比の算出を、各スペクトルの大きさを前記定常雑音成分推定部により推定された該各スペクトルについての前記定常雑音成分の量で除算して行い、算出された信号対雑音比が所定の第一閾値よりも小さいスペクトルについては、該スペクトルについての非定常度を0とし、算出された信号対雑音比が、該第一閾値よりも大きい所定の第二閾値よりも更に大きいスペクトルについては、該スペクトルについての非定常度を1とし、算出された信号対雑音比が該第一閾値よりも大きく該第二閾値よりも小さいスペクトルについては、該信号対雑音比から該第一の閾値を減算した値を、該第二閾値から該第一閾値を減算した値で除算して得られる値を、該スペクトルについての非定常度とすることを特徴とする付記2に記載の雑音抑制装置。
(付記11)
前記非定常度算出部は、前記第一閾値と前記第二閾値との組み合わせを複数組有しており、前記非定常度の算出対象であるスペクトルの周波数に応じて1組選択される組み合わせに属している第一閾値及び第二閾値を用いて、該スペクトルについての非定常度の算出を行うことを特徴とする付記10に記載の雑音抑制装置。
(付記12)
前記非定常度算出部は、前記スペクトルの周波数毎に、前記収音信号において前記発音体の発音が含まれていない期間における、各スペクトルの大きさと前記定常雑音成分推定部が推定した該定常雑音成分の量との差分の絶対値の平均値を算出して、定常雑音成分の量に差分の絶対値の平均値を加算し定常雑音成分の量で除した値を該各スペクトルについての前記第一閾値とし、該第一閾値に所定の定数値を加算した値を該各スペクトルについての前記第二閾値とし、該第一閾値及び該第二閾値を用いて、該各スペクトルについての非定常度の算出を行うことを特徴とする付記10に記載の雑音抑制装置。
(付記13)
発音体の発音を収音して得た収音信号であって時間領域で表現されている該収音信号を周波数領域のスペクトルに変換し、
前記スペクトルの周波数毎に、各スペクトルを抑圧する程度を表す抑圧ゲインを、該各スペクトルについての非定常度の時間変化量に基づき設定し、
前記スペクトルの周波数毎に設定した前記抑圧ゲインに基づいて、前記各スペクトルを抑圧する処理を行い、
前記各スペクトルを抑圧する処理後のスペクトルに対して、前記変換の逆変換を施す、
ことを特徴とする雑音抑制方法。
(付記14)
発音体の発音を収音して得た収音信号であって時間領域で表現されている該収音信号を周波数領域のスペクトルに変換し、
前記スペクトルの周波数毎に、各スペクトルを抑圧する程度を表す抑圧ゲインを、該各スペクトルについての非定常度の時間変化量に基づき設定し、
前記スペクトルの周波数毎に設定した前記抑圧ゲインに基づいて、前記各スペクトルを抑圧し、
前記各スペクトルを抑圧する処理後のスペクトルに対して、前記変換の逆変換を施す、
処理をコンピュータに実行させるプログラム。
2 抑圧ゲイン設定部
3 スペクトル抑圧処理部
4 逆変換部
5 定常雑音成分推定部
6 非定常度算出部
10 マイク
11 FFT部
12 定常雑音モデル推定部
13 非定常度算出部
14 非定常度時間変化量算出部
15 雑音検出部
16 ゲイン設定部
17 出力用スペクトル生成部
18 IFFT部
20 コンピュータ
21 MPU
22 ROM
23 RAM
24 ハードディスク装置
25 入力装置
26 表示装置
27 インタフェース装置
28 記録媒体駆動装置
29 バスライン
30 可搬型記録媒体
Claims (7)
- 発音体の発音を収音して得た収音信号であって時間領域で表現されている該収音信号を周波数領域のスペクトルに変換する変換部と、
前記スペクトルの周波数毎に、各スペクトルの成分が非定常雑音であるか否かの判定を、該各スペクトルについての非定常度の時間変化量に基づき行い、成分が非定常雑音であると判定したスペクトルについては該スペクトルを抑圧する程度を表す抑圧ゲインをスペクトルの大きさが小さくなる値に設定し、成分が非定常雑音ではないと判定したスペクトルについては該抑圧ゲインをスペクトルの大きさが維持される値に設定する抑圧ゲイン設定部と、
前記抑圧ゲイン設定部により前記スペクトルの周波数毎に設定された前記抑圧ゲインに基づいて、前記各スペクトルを抑圧する処理を行うスペクトル抑圧処理部と、
前記スペクトル抑圧処理部による抑圧処理後のスペクトルに対して、前記変換部による変換の逆変換を施す逆変換部と、
を備えることを特徴とする雑音抑制装置。 - 前記抑圧ゲイン設定部は、
前記スペクトルの周波数毎に、各スペクトルに含まれている定常雑音成分の量を推定する定常雑音成分推定部と、
前記スペクトルの周波数毎に、各スペクトルの大きさと前記定常雑音成分推定部により推定された該各スペクトルについての前記定常雑音成分の量とに基づき、該各スペクトルに含まれる非定常成分の比率を、該各スペクトルについての非定常度として算出する非定常度算出部と、
を備え、前記非定常度算出部が前記スペクトルの周波数毎に算出した各スペクトルについての非定常度についての時間変化量に基づき、前記スペクトルの周波数毎の前記抑圧ゲインを設定する、
ことを特徴とする請求項1に記載の雑音抑制装置。 - 前記定常雑音成分推定部は、前記スペクトルの周波数毎に、前記収音信号において前記発音体の発音が含まれていない期間におけるスペクトルの大きさの平均値を算出し、該平均値を前記定常雑音成分の量の推定結果とすることを特徴とする請求項2に記載の雑音抑制装置。
- 前記抑圧ゲイン設定部は、前記判定において、前記非定常度の時間変化量が所定の上限閾値よりも大きいスペクトルについては、スペクトルの成分が非定常雑音であるとの判定を下し、該時間変化量が該上限閾値よりも小さいスペクトルについては、スペクトルの成分が非定常雑音ではないとの判定を下すことを特徴とする請求項1から3のうちのいずれか一項に記載の雑音抑制装置。
- 前記抑圧ゲイン設定部は、周波数軸上に並べられている前記スペクトルのうちで前記上限閾値よりも小さいスペクトルから、周波数が、前記判定において成分が非定常雑音であると判定したスペクトルである抑圧対象スペクトルの周波数の上下でそれぞれ最も近いものを1つずつ選択し、選択した2つのスペクトルの大きさの平均値を該抑圧対象スペクトルの大きさで除算した値を、該抑圧対象スペクトルについての抑圧ゲインとして設定することを特徴とする請求項4に記載の雑音抑制装置。
- 発音体の発音を収音して得た収音信号であって時間領域で表現されている該収音信号を周波数領域のスペクトルに変換し、
前記スペクトルの周波数毎に、各スペクトルの成分が非定常雑音であるか否かの判定を、該各スペクトルについての非定常度の時間変化量に基づき行い、
成分が非定常雑音であると判定したスペクトルについては、該スペクトルを抑圧する程度を表す抑圧ゲインをスペクトルの大きさが小さくなる値に設定し、
成分が非定常雑音ではないと判定したスペクトルについては、前記抑圧ゲインをスペクトルの大きさが維持される値に設定し、
前記スペクトルの周波数毎に設定した前記抑圧ゲインに基づいて、前記各スペクトルを抑圧する処理を行い、
前記各スペクトルを抑圧する処理後のスペクトルに対して、前記変換の逆変換を施す、
ことを特徴とする雑音抑制方法。 - 発音体の発音を収音して得た収音信号であって時間領域で表現されている該収音信号を周波数領域のスペクトルに変換し、
前記スペクトルの周波数毎に、各スペクトルの成分が非定常雑音であるか否かの判定を、該各スペクトルについての非定常度の時間変化量に基づき行い、
成分が非定常雑音であると判定したスペクトルについては、該スペクトルを抑圧する程度を表す抑圧ゲインをスペクトルの大きさが小さくなる値に設定し、
成分が非定常雑音ではないと判定したスペクトルについては、前記抑圧ゲインをスペクトルの大きさが維持される値に設定し、
前記スペクトルの周波数毎に設定した前記抑圧ゲインに基づいて、前記各スペクトルを抑圧し、
前記各スペクトルを抑圧する処理後のスペクトルに対して、前記変換の逆変換を施す、
処理をコンピュータに実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010262922A JP5614261B2 (ja) | 2010-11-25 | 2010-11-25 | 雑音抑制装置、雑音抑制方法、及びプログラム |
US13/279,830 US9117456B2 (en) | 2010-11-25 | 2011-10-24 | Noise suppression apparatus, method, and a storage medium storing a noise suppression program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010262922A JP5614261B2 (ja) | 2010-11-25 | 2010-11-25 | 雑音抑制装置、雑音抑制方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012113173A JP2012113173A (ja) | 2012-06-14 |
JP5614261B2 true JP5614261B2 (ja) | 2014-10-29 |
Family
ID=46126668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010262922A Expired - Fee Related JP5614261B2 (ja) | 2010-11-25 | 2010-11-25 | 雑音抑制装置、雑音抑制方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9117456B2 (ja) |
JP (1) | JP5614261B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9484043B1 (en) * | 2014-03-05 | 2016-11-01 | QoSound, Inc. | Noise suppressor |
CN105225673B (zh) * | 2014-06-09 | 2020-12-04 | 杜比实验室特许公司 | 用于噪声水平估计的方法、系统和介质 |
JP6520276B2 (ja) * | 2015-03-24 | 2019-05-29 | 富士通株式会社 | 雑音抑圧装置、雑音抑圧方法、及び、プログラム |
JP2016182298A (ja) * | 2015-03-26 | 2016-10-20 | 株式会社東芝 | 騒音低減システム |
JP6547451B2 (ja) * | 2015-06-26 | 2019-07-24 | 富士通株式会社 | 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム |
DE102019214220A1 (de) * | 2019-09-18 | 2021-03-18 | Sivantos Pte. Ltd. | Verfahren zum Betrieb eines Hörgeräts und Hörgerät |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3135937B2 (ja) * | 1991-05-16 | 2001-02-19 | 株式会社リコー | 雑音除去装置 |
JP3264831B2 (ja) | 1996-06-14 | 2002-03-11 | 沖電気工業株式会社 | 背景雑音消去装置 |
JP2000172283A (ja) | 1998-12-01 | 2000-06-23 | Nec Corp | 有音検出方式及び方法 |
JP3566197B2 (ja) * | 2000-08-31 | 2004-09-15 | 松下電器産業株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP2004341339A (ja) | 2003-05-16 | 2004-12-02 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2005284016A (ja) * | 2004-03-30 | 2005-10-13 | Iwatsu Electric Co Ltd | 音声信号の雑音推定方法およびそれを用いた雑音除去装置 |
JP4912036B2 (ja) | 2006-05-26 | 2012-04-04 | 富士通株式会社 | 指向性集音装置、指向性集音方法、及びコンピュータプログラム |
JP2008309955A (ja) * | 2007-06-13 | 2008-12-25 | Toshiba Corp | ノイズサプレス装置 |
JP5050698B2 (ja) | 2007-07-13 | 2012-10-17 | ヤマハ株式会社 | 音声処理装置およびプログラム |
JP4886715B2 (ja) * | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
JP2010122617A (ja) * | 2008-11-21 | 2010-06-03 | Yamaha Corp | ノイズゲート、及び収音装置 |
JP2010156725A (ja) * | 2008-12-26 | 2010-07-15 | Renesas Electronics Corp | ノイズ除去方法及び回路 |
-
2010
- 2010-11-25 JP JP2010262922A patent/JP5614261B2/ja not_active Expired - Fee Related
-
2011
- 2011-10-24 US US13/279,830 patent/US9117456B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20120134509A1 (en) | 2012-05-31 |
US9117456B2 (en) | 2015-08-25 |
JP2012113173A (ja) | 2012-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5614261B2 (ja) | 雑音抑制装置、雑音抑制方法、及びプログラム | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
Kim et al. | Nonlinear enhancement of onset for robust speech recognition. | |
JP5387459B2 (ja) | 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム | |
US9454976B2 (en) | Efficient discrimination of voiced and unvoiced sounds | |
EP2962299B1 (en) | Audio signal analysis | |
JP2014123011A (ja) | 雑音検出装置および方法、並びに、プログラム | |
EP2742435A1 (en) | System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain | |
KR20040075771A (ko) | 윈드 노이즈를 억제하는 시스템 | |
US20140177853A1 (en) | Sound processing device, sound processing method, and program | |
Mittal et al. | Study of characteristics of aperiodicity in Noh voices | |
JP2015118361A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6439682B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
KR20120034777A (ko) | 호흡 신호들의 잡음 감소 | |
KR20150032390A (ko) | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 | |
CN115346561A (zh) | 基于语音特征的抑郁情绪评估预测方法及系统 | |
Virebrand | Real-time monitoring of voice characteristics usingaccelerometer and microphone measurements | |
CN113593604B (zh) | 检测音频质量方法、装置及存储介质 | |
CN112669797B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN112151055B (zh) | 音频处理方法及装置 | |
CN104036785A (zh) | 语音信号的处理方法和装置、以及语音信号的分析系统 | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP5325130B2 (ja) | Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム | |
US20130322644A1 (en) | Sound Processing Apparatus | |
JP2007025296A (ja) | 音声特徴量算出装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140812 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140825 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5614261 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |