JP2004317993A - 雑音低減回路および雑音低減方法 - Google Patents
雑音低減回路および雑音低減方法 Download PDFInfo
- Publication number
- JP2004317993A JP2004317993A JP2003114951A JP2003114951A JP2004317993A JP 2004317993 A JP2004317993 A JP 2004317993A JP 2003114951 A JP2003114951 A JP 2003114951A JP 2003114951 A JP2003114951 A JP 2003114951A JP 2004317993 A JP2004317993 A JP 2004317993A
- Authority
- JP
- Japan
- Prior art keywords
- gain
- input
- original sound
- noise
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】スペクトル減算による音質劣化を緩和、改善できる雑音低減回路および雑音低減方法を提供する。
【解決手段】周波数データと音声区間判定結果とから適応的に入力対雑音レベル比を推定してその入力対雑音レベル比に応じたゲインを算出するゲイン算出部を有する。ゲイン算出部は、入力対雑音レベル比から原音付加率を算出する原入力スペクトル付加率算出部(214)と、その原音付加率を基に原音対応ゲインを算出する原音付加ゲイン計算部(215)と、入力対雑音レベル比から平滑化重み係数を算出する平滑化重み係数算出部(216)と、原音対応ゲインを平滑化重み係数を基に平滑化することで、入力対雑音レベル比に対して適応的に最適なゲインを算出するゲイン平滑化部(217)とを有する。
【選択図】 図2
【解決手段】周波数データと音声区間判定結果とから適応的に入力対雑音レベル比を推定してその入力対雑音レベル比に応じたゲインを算出するゲイン算出部を有する。ゲイン算出部は、入力対雑音レベル比から原音付加率を算出する原入力スペクトル付加率算出部(214)と、その原音付加率を基に原音対応ゲインを算出する原音付加ゲイン計算部(215)と、入力対雑音レベル比から平滑化重み係数を算出する平滑化重み係数算出部(216)と、原音対応ゲインを平滑化重み係数を基に平滑化することで、入力対雑音レベル比に対して適応的に最適なゲインを算出するゲイン平滑化部(217)とを有する。
【選択図】 図2
Description
【0001】
【発明の属する技術分野】
本発明は、雑音が混入した入力から雑音成分を低減する雑音低減技術に関し、特に高性能な雑音低減を行う雑音低減回路および雑音低減方法に関する。
【0002】
【従来の技術】
従来、雑音が混入した入力から雑音成分を低減する方法としてはスペクトル減算法が知られている(例えば非特許文献1など)。また、その典型的な実現例が特許文献1の図2に示されている。同図には、高速フェーリ変換(FFT)処理部、振幅2乗処理部、音声検出器、ブロックワイズの平均化器、ブロックワイズのゲイン計算処理部、乗算器、および逆高速フェーリ変換(IFFT)処理部を含む雑音低減回路が記載されている。
【0003】
上記文献にも記載されているように、一般に、スペクトル減算法では、入力データに含まれる加法性雑音成分の周波数スペクトルもしくはパワースペクトルを推定して、入力対雑音比を算出する。算出された入力対雑音比に応じたゲインが入力スペクトルに乗算されて、周波数領域で雑音成分に相当する量だけ抑圧される。この抑圧された周波数成分を周波数逆変換して、雑音が除去された出力データを得ることができる。
【0004】
しかし、このスペクトル減算法を用いた従来の雑音低減処理は、雑音低減性能自体は高いものの、音質が劣化する可能性のあることが知られている。例えば、雑音スペクトルの推定誤差により、ミュージカルノイズという雑音の消し残りが発生しやすく、雑音低減処理後の音声品質が低下する。これを緩和するために、非特許文献2では、入力対雑音比に応じたある割合で原音を付加することで主観評価結果を向上することができたと記載されている。また、非特許文献3では、フレーム間でゲインを時間的に平滑化することでミュージカルノイズを減らすことができると記載されている。
【0005】
【特許文献1】
特表2002−517021号公報
【0006】
【非特許文献1】
S. F. Boll「Suppression of Acoustic Noise in Speech using Spectral Subtraction(スペクトルサブ トラクションによる音声中の音響ノイズの抑圧)」 IEEE Trans, Acoust. Speech and Sig. Proc., 27, P.113−120, 1979年
【0007】
【非特許文献2】
佐々木、中村「マスキング効果を用いた低歪み雑音低減方式の検討」信学技法 EA98−106, P.37−42, 1998年
【0008】
【非特許文献3】
H. Kim, D, Ruwisch「Speech Enhancement in Non−stationary Noise Environments(変動する雑音環境でのスピーチの向上)」 ICSLP 2002, P.1829−1832, 2002年
【0009】
【発明が解決しようとする課題】
しかし、上述したスペクトル減算の音質劣化を緩和、改善しようという従来の試みは、ある条件下でその効果が限定的に確認できるものの、普遍的に十分に最適化されているとは言えない。更に、不適切な設定で実装を行うと、逆に音質を劣化させる可能性もある。
【0010】
例えば、非特許文献2では、原音付加率を決める入力対雑音比の具体的な推定方法については記述されていない。また、入力対雑音比と原音付加率との相関性についても主観評価を行った結果から、定性的な言及をするにとどまっている。
【0011】
また、非特許文献3では、平滑化重み係数は適切に設定しないと、残響が強調されて、逆に音声品質が劣化すると指摘されている。
【0012】
本発明は、上記の点に鑑みてなされたもので、その目的は、スペクトル減算を基にした雑音低減回路および雑音低減方法において、高い雑音低減性能を実現し、同時に音質劣化を最小限に抑えることにある。
【0013】
【課題を解決するための手段】
上記目的を達成するため、本発明の雑音低減回路は、デジタル音声入力データを周波数データに変換する周波数変換部と、前記周波数データから音声区間か非音声区間かを判定する音声区間判定部と、前記周波数データと前記音声区間判定部の判定結果とから適応的に入力対雑音レベル比を推定して該入力対雑音レベル比に応じたゲインを算出するゲイン算出部と、前記ゲインを前記周波数データに乗じる乗算部と、前記ゲインを乗じられた周波数データを音声出力時間データに変換する周波数逆変換部とを有する雑音低減回路であって、前記ゲイン算出部が、前記入力対雑音レベル比から原音付加率を算出する原入力スペクトル付加率算出部と、算出された前記原音付加率を基に原音対応ゲインを算出する原音付加ゲイン計算部と、前記入力対雑音レベル比から平滑化重み係数を算出する平滑化重み係数算出部と、前記平滑化重み係数を基に前記原音対応ゲインを平滑化するゲイン平滑化部とを含むことを特徴とする。
【0014】
ここで、前記原音付加率と、前記平滑化重み係数が共に、前記入力対雑音レベル比に応じて適応的に制御され、前記ゲイン平滑化部が前記原音対応ゲインと前記平滑化重み係数とにより前記入力対雑音レベル比に対して適応的に最適なゲインを算出することを特徴とすることができる。
【0015】
上記目的を達成するため、本発明の雑音低減方法は、デジタル音声入力データを周波数データに変換する周波数変換ステップと、前記周波数データから音声区間か非音声区間かを判定する音声区間判定ステップと、前記周波数データと前記音声区間判定ステップでの判定結果とから適応的に入力対雑音レベル比を推定して該入力対雑音レベル比に応じたゲインを算出するゲイン算出ステップと、前記ゲインを前記周波数データに乗じる乗算ステップと、前記ゲインを乗じられた周波数データを音声出力時間データに変換する周波数逆変換ステップとを有する雑音低減方法であって、前記ゲイン算出ステップが、前記入力対雑音レベル比から原音付加率を算出する原入力スペクトル付加率算出ステップと、算出された前記原音付加率を基に原音対応ゲインを算出する原音付加ゲイン計算ステップと、前記入力対雑音レベル比から平滑化重み係数を算出する平滑化重み係数算出ステップと、前記平滑化重み係数を基に前記原音対応ゲインを平滑化するゲイン平滑化ステップとを包含することを特徴とする。
【0016】
ここで、前記原音付加率と、前記平滑化重み係数が共に、前記入力対雑音レベル比に応じて適応的に制御され、前記ゲイン平滑化ステップにおいて前記原音対応ゲインと前記平滑化重み係数とにより前記入力対雑音レベル比に対して適応的に最適なゲインを算出することを特徴とすることができる。
【0017】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0018】
図1は本発明の一実施形態における雑音低減回路の全体の構成を示す。本実施形態の雑音低減回路は、周波数変換(FFT)部110、音声区間判定部111、ゲイン算出部112、および周波数逆変換(逆FFT)部114を有する。
【0019】
周波数変換部110はデジタル音声入力データを周波数データに変換する。音声区間判定部111は周波数変換部110で変換された周波数データから音声区間か非音声区間かの判定を行う。ゲイン算出部112は周波数変換部110で変換された周波数データと音声区間判定部111の音声区間判定結果とから適応的に入力対雑音レベル比を推定してその入力対雑音レベル比に応じたゲインを算出する。乗算部113はゲイン算出部112で算出されたゲインを周波数変換部110で変換された周波数データに乗じる。周波数逆変換部114は乗算部113でゲインを乗じられた周波数データを音声出力時間データに変換する。
【0020】
図2には図1のゲイン算出部112の内部構成を示す。図2に示すように、ゲイン算出部112は、スペクトルレベル算出部210、スイッチ211、ブロック平均部212、入力対雑音レベル比算出部213、原入力スペクトル付加率算出部214、原音付加ゲイン計算部215、平滑化重み係数算出部216、およびゲイン平滑化部217を有する。
【0021】
スペクトルレベル算出部210は入力(周波数データ)のスペクトルレベルを算出する。スイッチ211は上記の音声区間判定結果に応じてオン・オフの切り替え動作をする。ブロック平均部212は非音声区間の入力スペクトルレベルの平均を算出して、その算出結果を雑音のみのスペクトルレベルと推定する。入力対雑音レベル比算出部213は、入力のスペクトルレベルと上記雑音のスペクトルレベルとから入力対雑音レベル比(SNR)を算出する。原入力スペクトル付加率算出部214は入力対雑音レベル比(SNR)から原入力スペクトル付加率(原音付加率)βを算出する。原音付加ゲイン計算部215は原入力スペクトル付加率βから原音付加ゲインG1を計算する。平滑化重み係数算出部216は入力対雑音レベル比(SNR)から平滑化重み係数αを算出する。ゲイン平滑化部217は平滑化重み係数αを基に原音付加ゲインG1を平滑化して入力対雑音レベル比に応じたゲインGを出力する。
【0022】
次に、図1および図2を用いて、本発明の実施形態の動作を説明する。
【0023】
図1において、入力信号Xは音声と雑音を含んだ時間領域の信号である。この信号Xはある周期でサンプリングされた後に、ある数単位でまとめられて(フレーム処理)、本雑音低減回路に入力し、周波数変換部110によって周波数データ系列に変換される。周波数変換部110では一般的に用いられる高速フーリエ変換を実行している。
【0024】
周波数変換部110から出力された周波数データ系列は、音声区間判定部111とゲイン算出部112と乗算部113とにそれぞれ供給される。
【0025】
音声区間判定部111では、入力スペクトル(周波数データ系列)から音声区間であるか非音声区間であるかの判定を行い、その判定結果をゲイン算出部112のスイッチ211へ伝える。
【0026】
図2に示すように、ゲイン算出部112内の入力信号スペクトルレベル算出部210において、入力スペクトル(周波数データ系列)は振幅スペクトルまたはパワースペクトルなどの、ある次元のスペクトル量1・1aに変換される。ここで、a=1の時は振幅スペクトル、a=2の時はパワースペクトルに対応する。
【0027】
音声区間判定部111の音声区間判定結果はスイッチ211の動作を制御する。音声区間判定結果が非音声区間である場合は、スイッチ211はオン状態となり、入力スペクトルレベル信号が後続のブロック平均部212に渡される。音声区間判定結果が音声区間である場合、スイッチ211はオフ状態となり、入力スペクトルレベル信号はブロック平均部212には伝わらない。このようにスイッチ211を制御して、ブロック平均部211で非音声区間の入力スペクトルレベルの平均を求めることにより、雑音を含んだ入力スペクトルレベルから、雑音のみのスペクトルレベルを推定することができる。
【0028】
入力対雑音レベル比算出部213は入力スペクトルレベルと上記推定された雑音スペクトルレベルとから入力対雑音レベル比(SNR)を算出する。算出された入力対雑音レベル比(SNR)は、原入力スペクトル付加率算出部214と平滑化重み係数算出部216とにそれぞれ供給される。
【0029】
原入力スペクトル付加率算出部214は入力対雑音レベル比(SNR)から原入力スペクトル付加率(原音付加率)βを算出する。入力対雑音レベル比(SNR)から原入力スペクトル付加率βへの変換は後述で例示するような予め決めた変換関数hにより規定される。この対応関係は、次式(1)で表わされる。
β=h(SNR) …(1)
算出された原入力スペクトル付加率βは原音付加ゲイン計算部215へ受け渡される。原音付加ゲイン計算部215は原入力スペクトル付加率βを用いて原音付加対応ゲインG1を算出する。G1とβの関係は、次式(2)で与えられる。
G1=β+(1−β)(1−K/SNR) …(2)
ここで、Kはパラメータであり、通常1から5程度の値を設定する。
【0030】
平滑化重み係数算出部216は入力対雑音レベル比(SNR)から平滑化重み係数αを算出する。入力対雑音レベル比(SNR)から平滑化重み係数αへの変換は後述で例示するような予め決めた変換関数fにより規定される。この対応関係は、次式(3)で表わされる。
α=f(SNR) …(3)
原音付加ゲイン計算部215で算出された原音付加対応ゲインG1と平滑化重み係数算出部216で算出された平滑化重み係数αはゲイン平滑化部217に渡される。
【0031】
ゲイン平滑化部217は平滑化重み係数αと原音付加対応ゲインG1とを用いて最終ゲインGを算出する。この関係は次式(4)で与えられる。
G=αG2+(1−α)G1 …(4)
ここで、G2は1フレーム前の原音付加対応ゲインG1を表す。
【0032】
ゲイン平滑化部217は、図2に示すように、(1−α)G1を演算する第1の乗算器と、1フレーム前の原音付加対応ゲインG1を表すG2を得るための遅延器と、αG2を演算する第2の乗算器と、αG2と(1−α)G1とを加算する加算器とから構成することができる。
【0033】
ゲイン平滑化部217で得られた最終ゲインGと、周波数変換部110で変換された入力スペクトルとを図1の乗算部113で乗算し、その結果得られた周波数データを周波数逆変換部114で音声出力時間データに変換する。
【0034】
本明細書の[発明が解決しようとする課題]の項で述べたように、従来技術においては、雑音スペクトルレベルの推定誤差がミュージカルノイズを生じさせるために処理後の音声の品質を劣化させていた。この推定誤差は入力対雑音レベル比が小さい場合に、より音声品質に影響する。
【0035】
これに対し、本発明では、ミュージカルノイズが発生して音声品質劣化に影響が大きい場合には、雑音を低減する通常の処理に加えて、原音を付加することで聴感上の品質を保つことができることを利用している。
【0036】
即ち、原入力スペクトル付加率算出部214の演算処理を入力対雑音レベル比SNRに応じて適応的に作用するように設計し、またその結果、原音付加ゲイン計算部215で算出された原音付加対応ゲインG1を用いることで、聴感上の品質を保つことを容易に実現することができる。
【0037】
ゲイン平滑部217は、原音付加対応ゲインG1の値を前のフレームの原音付加対応ゲインG2と重み付き平均を取ることにより、最終的なゲインGを算出する。この重み付き平均処理により、ミュージカルノイズ削減効果の更なる向上が得られる。
【0038】
(実施の一例)
本発明の実施の一例として、以下の仕様でシミュレーションを行い、音質の向上と動作安定性を確認することができた。
パラメータ:
a=2(パワースペクトル)
K=4
関数h:
β=0.50(SNR < 0.25)
=0.00(SNR >= 0.25)
関数f:
α=0.50(SNR < 0.25)
=0.25(0.25 <=SNR< 5.00)
=0.10(SNR >=5.00)
【0039】
(他の実施の形態)
以上、本発明の実施形態を詳述したが、本発明は、図1、図2に示すような機能を実現するのに、必ずしも回路部品に限らず、実施形態の機能を実現するソフトウエア・プログラムを用いた超小型演算処理装置(MPU)のようなコンピュータシステムを利用しても実施可能である。
【0040】
即ち、本発明は、前述した実施形態の機能を実現するソフトウエアのプログラムを、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータがその供給されたプログラムを読み出して実行することによっても達成される場合を含む。その場合、プログラムの機能を有していれば、形態は、プログラムである必要はない。プログラムを供給するための記録媒体としては、例えば、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード(ICメモリカード)、ROM、DVD(DVD−ROM、DVD−R)などがある。
【0041】
【発明の効果】
以上説明したように、本発明によれば、ゲイン算出部内に、原入力の周波数データを付加する原音付加対応ゲインの計算を行う原音付加ゲイン計算部と、原音付加効果に対応するゲインを平滑化するゲイン平滑化部を有することで、スペクトル減算を基にした雑音低減回路において、高い雑音低減性能を実現でき、同時に音質劣化を最小限に抑えることができる効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施形態における雑音低減回路の全体の構成を示すブロック図である。
【図2】図1のゲイン算出部の内部構成を示すブロック図である。
【符号の説明】
110 周波数変換部
111 音声区間判定部
112 ゲイン算出部
113 乗算部
114 周波数逆変換部
210 スペクトルレベル算出部
211 スイッチ
212 ブロック平均部
213 入力対雑音レベル比算出部
214 原入力スペクトル付加率算出部
215 原音付加ゲイン計算部
216 平滑化重み係数算出部
217 ゲイン平滑化部
【発明の属する技術分野】
本発明は、雑音が混入した入力から雑音成分を低減する雑音低減技術に関し、特に高性能な雑音低減を行う雑音低減回路および雑音低減方法に関する。
【0002】
【従来の技術】
従来、雑音が混入した入力から雑音成分を低減する方法としてはスペクトル減算法が知られている(例えば非特許文献1など)。また、その典型的な実現例が特許文献1の図2に示されている。同図には、高速フェーリ変換(FFT)処理部、振幅2乗処理部、音声検出器、ブロックワイズの平均化器、ブロックワイズのゲイン計算処理部、乗算器、および逆高速フェーリ変換(IFFT)処理部を含む雑音低減回路が記載されている。
【0003】
上記文献にも記載されているように、一般に、スペクトル減算法では、入力データに含まれる加法性雑音成分の周波数スペクトルもしくはパワースペクトルを推定して、入力対雑音比を算出する。算出された入力対雑音比に応じたゲインが入力スペクトルに乗算されて、周波数領域で雑音成分に相当する量だけ抑圧される。この抑圧された周波数成分を周波数逆変換して、雑音が除去された出力データを得ることができる。
【0004】
しかし、このスペクトル減算法を用いた従来の雑音低減処理は、雑音低減性能自体は高いものの、音質が劣化する可能性のあることが知られている。例えば、雑音スペクトルの推定誤差により、ミュージカルノイズという雑音の消し残りが発生しやすく、雑音低減処理後の音声品質が低下する。これを緩和するために、非特許文献2では、入力対雑音比に応じたある割合で原音を付加することで主観評価結果を向上することができたと記載されている。また、非特許文献3では、フレーム間でゲインを時間的に平滑化することでミュージカルノイズを減らすことができると記載されている。
【0005】
【特許文献1】
特表2002−517021号公報
【0006】
【非特許文献1】
S. F. Boll「Suppression of Acoustic Noise in Speech using Spectral Subtraction(スペクトルサブ トラクションによる音声中の音響ノイズの抑圧)」 IEEE Trans, Acoust. Speech and Sig. Proc., 27, P.113−120, 1979年
【0007】
【非特許文献2】
佐々木、中村「マスキング効果を用いた低歪み雑音低減方式の検討」信学技法 EA98−106, P.37−42, 1998年
【0008】
【非特許文献3】
H. Kim, D, Ruwisch「Speech Enhancement in Non−stationary Noise Environments(変動する雑音環境でのスピーチの向上)」 ICSLP 2002, P.1829−1832, 2002年
【0009】
【発明が解決しようとする課題】
しかし、上述したスペクトル減算の音質劣化を緩和、改善しようという従来の試みは、ある条件下でその効果が限定的に確認できるものの、普遍的に十分に最適化されているとは言えない。更に、不適切な設定で実装を行うと、逆に音質を劣化させる可能性もある。
【0010】
例えば、非特許文献2では、原音付加率を決める入力対雑音比の具体的な推定方法については記述されていない。また、入力対雑音比と原音付加率との相関性についても主観評価を行った結果から、定性的な言及をするにとどまっている。
【0011】
また、非特許文献3では、平滑化重み係数は適切に設定しないと、残響が強調されて、逆に音声品質が劣化すると指摘されている。
【0012】
本発明は、上記の点に鑑みてなされたもので、その目的は、スペクトル減算を基にした雑音低減回路および雑音低減方法において、高い雑音低減性能を実現し、同時に音質劣化を最小限に抑えることにある。
【0013】
【課題を解決するための手段】
上記目的を達成するため、本発明の雑音低減回路は、デジタル音声入力データを周波数データに変換する周波数変換部と、前記周波数データから音声区間か非音声区間かを判定する音声区間判定部と、前記周波数データと前記音声区間判定部の判定結果とから適応的に入力対雑音レベル比を推定して該入力対雑音レベル比に応じたゲインを算出するゲイン算出部と、前記ゲインを前記周波数データに乗じる乗算部と、前記ゲインを乗じられた周波数データを音声出力時間データに変換する周波数逆変換部とを有する雑音低減回路であって、前記ゲイン算出部が、前記入力対雑音レベル比から原音付加率を算出する原入力スペクトル付加率算出部と、算出された前記原音付加率を基に原音対応ゲインを算出する原音付加ゲイン計算部と、前記入力対雑音レベル比から平滑化重み係数を算出する平滑化重み係数算出部と、前記平滑化重み係数を基に前記原音対応ゲインを平滑化するゲイン平滑化部とを含むことを特徴とする。
【0014】
ここで、前記原音付加率と、前記平滑化重み係数が共に、前記入力対雑音レベル比に応じて適応的に制御され、前記ゲイン平滑化部が前記原音対応ゲインと前記平滑化重み係数とにより前記入力対雑音レベル比に対して適応的に最適なゲインを算出することを特徴とすることができる。
【0015】
上記目的を達成するため、本発明の雑音低減方法は、デジタル音声入力データを周波数データに変換する周波数変換ステップと、前記周波数データから音声区間か非音声区間かを判定する音声区間判定ステップと、前記周波数データと前記音声区間判定ステップでの判定結果とから適応的に入力対雑音レベル比を推定して該入力対雑音レベル比に応じたゲインを算出するゲイン算出ステップと、前記ゲインを前記周波数データに乗じる乗算ステップと、前記ゲインを乗じられた周波数データを音声出力時間データに変換する周波数逆変換ステップとを有する雑音低減方法であって、前記ゲイン算出ステップが、前記入力対雑音レベル比から原音付加率を算出する原入力スペクトル付加率算出ステップと、算出された前記原音付加率を基に原音対応ゲインを算出する原音付加ゲイン計算ステップと、前記入力対雑音レベル比から平滑化重み係数を算出する平滑化重み係数算出ステップと、前記平滑化重み係数を基に前記原音対応ゲインを平滑化するゲイン平滑化ステップとを包含することを特徴とする。
【0016】
ここで、前記原音付加率と、前記平滑化重み係数が共に、前記入力対雑音レベル比に応じて適応的に制御され、前記ゲイン平滑化ステップにおいて前記原音対応ゲインと前記平滑化重み係数とにより前記入力対雑音レベル比に対して適応的に最適なゲインを算出することを特徴とすることができる。
【0017】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0018】
図1は本発明の一実施形態における雑音低減回路の全体の構成を示す。本実施形態の雑音低減回路は、周波数変換(FFT)部110、音声区間判定部111、ゲイン算出部112、および周波数逆変換(逆FFT)部114を有する。
【0019】
周波数変換部110はデジタル音声入力データを周波数データに変換する。音声区間判定部111は周波数変換部110で変換された周波数データから音声区間か非音声区間かの判定を行う。ゲイン算出部112は周波数変換部110で変換された周波数データと音声区間判定部111の音声区間判定結果とから適応的に入力対雑音レベル比を推定してその入力対雑音レベル比に応じたゲインを算出する。乗算部113はゲイン算出部112で算出されたゲインを周波数変換部110で変換された周波数データに乗じる。周波数逆変換部114は乗算部113でゲインを乗じられた周波数データを音声出力時間データに変換する。
【0020】
図2には図1のゲイン算出部112の内部構成を示す。図2に示すように、ゲイン算出部112は、スペクトルレベル算出部210、スイッチ211、ブロック平均部212、入力対雑音レベル比算出部213、原入力スペクトル付加率算出部214、原音付加ゲイン計算部215、平滑化重み係数算出部216、およびゲイン平滑化部217を有する。
【0021】
スペクトルレベル算出部210は入力(周波数データ)のスペクトルレベルを算出する。スイッチ211は上記の音声区間判定結果に応じてオン・オフの切り替え動作をする。ブロック平均部212は非音声区間の入力スペクトルレベルの平均を算出して、その算出結果を雑音のみのスペクトルレベルと推定する。入力対雑音レベル比算出部213は、入力のスペクトルレベルと上記雑音のスペクトルレベルとから入力対雑音レベル比(SNR)を算出する。原入力スペクトル付加率算出部214は入力対雑音レベル比(SNR)から原入力スペクトル付加率(原音付加率)βを算出する。原音付加ゲイン計算部215は原入力スペクトル付加率βから原音付加ゲインG1を計算する。平滑化重み係数算出部216は入力対雑音レベル比(SNR)から平滑化重み係数αを算出する。ゲイン平滑化部217は平滑化重み係数αを基に原音付加ゲインG1を平滑化して入力対雑音レベル比に応じたゲインGを出力する。
【0022】
次に、図1および図2を用いて、本発明の実施形態の動作を説明する。
【0023】
図1において、入力信号Xは音声と雑音を含んだ時間領域の信号である。この信号Xはある周期でサンプリングされた後に、ある数単位でまとめられて(フレーム処理)、本雑音低減回路に入力し、周波数変換部110によって周波数データ系列に変換される。周波数変換部110では一般的に用いられる高速フーリエ変換を実行している。
【0024】
周波数変換部110から出力された周波数データ系列は、音声区間判定部111とゲイン算出部112と乗算部113とにそれぞれ供給される。
【0025】
音声区間判定部111では、入力スペクトル(周波数データ系列)から音声区間であるか非音声区間であるかの判定を行い、その判定結果をゲイン算出部112のスイッチ211へ伝える。
【0026】
図2に示すように、ゲイン算出部112内の入力信号スペクトルレベル算出部210において、入力スペクトル(周波数データ系列)は振幅スペクトルまたはパワースペクトルなどの、ある次元のスペクトル量1・1aに変換される。ここで、a=1の時は振幅スペクトル、a=2の時はパワースペクトルに対応する。
【0027】
音声区間判定部111の音声区間判定結果はスイッチ211の動作を制御する。音声区間判定結果が非音声区間である場合は、スイッチ211はオン状態となり、入力スペクトルレベル信号が後続のブロック平均部212に渡される。音声区間判定結果が音声区間である場合、スイッチ211はオフ状態となり、入力スペクトルレベル信号はブロック平均部212には伝わらない。このようにスイッチ211を制御して、ブロック平均部211で非音声区間の入力スペクトルレベルの平均を求めることにより、雑音を含んだ入力スペクトルレベルから、雑音のみのスペクトルレベルを推定することができる。
【0028】
入力対雑音レベル比算出部213は入力スペクトルレベルと上記推定された雑音スペクトルレベルとから入力対雑音レベル比(SNR)を算出する。算出された入力対雑音レベル比(SNR)は、原入力スペクトル付加率算出部214と平滑化重み係数算出部216とにそれぞれ供給される。
【0029】
原入力スペクトル付加率算出部214は入力対雑音レベル比(SNR)から原入力スペクトル付加率(原音付加率)βを算出する。入力対雑音レベル比(SNR)から原入力スペクトル付加率βへの変換は後述で例示するような予め決めた変換関数hにより規定される。この対応関係は、次式(1)で表わされる。
β=h(SNR) …(1)
算出された原入力スペクトル付加率βは原音付加ゲイン計算部215へ受け渡される。原音付加ゲイン計算部215は原入力スペクトル付加率βを用いて原音付加対応ゲインG1を算出する。G1とβの関係は、次式(2)で与えられる。
G1=β+(1−β)(1−K/SNR) …(2)
ここで、Kはパラメータであり、通常1から5程度の値を設定する。
【0030】
平滑化重み係数算出部216は入力対雑音レベル比(SNR)から平滑化重み係数αを算出する。入力対雑音レベル比(SNR)から平滑化重み係数αへの変換は後述で例示するような予め決めた変換関数fにより規定される。この対応関係は、次式(3)で表わされる。
α=f(SNR) …(3)
原音付加ゲイン計算部215で算出された原音付加対応ゲインG1と平滑化重み係数算出部216で算出された平滑化重み係数αはゲイン平滑化部217に渡される。
【0031】
ゲイン平滑化部217は平滑化重み係数αと原音付加対応ゲインG1とを用いて最終ゲインGを算出する。この関係は次式(4)で与えられる。
G=αG2+(1−α)G1 …(4)
ここで、G2は1フレーム前の原音付加対応ゲインG1を表す。
【0032】
ゲイン平滑化部217は、図2に示すように、(1−α)G1を演算する第1の乗算器と、1フレーム前の原音付加対応ゲインG1を表すG2を得るための遅延器と、αG2を演算する第2の乗算器と、αG2と(1−α)G1とを加算する加算器とから構成することができる。
【0033】
ゲイン平滑化部217で得られた最終ゲインGと、周波数変換部110で変換された入力スペクトルとを図1の乗算部113で乗算し、その結果得られた周波数データを周波数逆変換部114で音声出力時間データに変換する。
【0034】
本明細書の[発明が解決しようとする課題]の項で述べたように、従来技術においては、雑音スペクトルレベルの推定誤差がミュージカルノイズを生じさせるために処理後の音声の品質を劣化させていた。この推定誤差は入力対雑音レベル比が小さい場合に、より音声品質に影響する。
【0035】
これに対し、本発明では、ミュージカルノイズが発生して音声品質劣化に影響が大きい場合には、雑音を低減する通常の処理に加えて、原音を付加することで聴感上の品質を保つことができることを利用している。
【0036】
即ち、原入力スペクトル付加率算出部214の演算処理を入力対雑音レベル比SNRに応じて適応的に作用するように設計し、またその結果、原音付加ゲイン計算部215で算出された原音付加対応ゲインG1を用いることで、聴感上の品質を保つことを容易に実現することができる。
【0037】
ゲイン平滑部217は、原音付加対応ゲインG1の値を前のフレームの原音付加対応ゲインG2と重み付き平均を取ることにより、最終的なゲインGを算出する。この重み付き平均処理により、ミュージカルノイズ削減効果の更なる向上が得られる。
【0038】
(実施の一例)
本発明の実施の一例として、以下の仕様でシミュレーションを行い、音質の向上と動作安定性を確認することができた。
パラメータ:
a=2(パワースペクトル)
K=4
関数h:
β=0.50(SNR < 0.25)
=0.00(SNR >= 0.25)
関数f:
α=0.50(SNR < 0.25)
=0.25(0.25 <=SNR< 5.00)
=0.10(SNR >=5.00)
【0039】
(他の実施の形態)
以上、本発明の実施形態を詳述したが、本発明は、図1、図2に示すような機能を実現するのに、必ずしも回路部品に限らず、実施形態の機能を実現するソフトウエア・プログラムを用いた超小型演算処理装置(MPU)のようなコンピュータシステムを利用しても実施可能である。
【0040】
即ち、本発明は、前述した実施形態の機能を実現するソフトウエアのプログラムを、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータがその供給されたプログラムを読み出して実行することによっても達成される場合を含む。その場合、プログラムの機能を有していれば、形態は、プログラムである必要はない。プログラムを供給するための記録媒体としては、例えば、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード(ICメモリカード)、ROM、DVD(DVD−ROM、DVD−R)などがある。
【0041】
【発明の効果】
以上説明したように、本発明によれば、ゲイン算出部内に、原入力の周波数データを付加する原音付加対応ゲインの計算を行う原音付加ゲイン計算部と、原音付加効果に対応するゲインを平滑化するゲイン平滑化部を有することで、スペクトル減算を基にした雑音低減回路において、高い雑音低減性能を実現でき、同時に音質劣化を最小限に抑えることができる効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施形態における雑音低減回路の全体の構成を示すブロック図である。
【図2】図1のゲイン算出部の内部構成を示すブロック図である。
【符号の説明】
110 周波数変換部
111 音声区間判定部
112 ゲイン算出部
113 乗算部
114 周波数逆変換部
210 スペクトルレベル算出部
211 スイッチ
212 ブロック平均部
213 入力対雑音レベル比算出部
214 原入力スペクトル付加率算出部
215 原音付加ゲイン計算部
216 平滑化重み係数算出部
217 ゲイン平滑化部
Claims (6)
- デジタル音声入力データを周波数データに変換する周波数変換部と、
前記周波数データから音声区間か非音声区間かを判定する音声区間判定部と、
前記周波数データと前記音声区間判定部の判定結果とから適応的に入力対雑音レベル比を推定して該入力対雑音レベル比に応じたゲインを算出するゲイン算出部と、
前記ゲインを前記周波数データに乗じる乗算部と、
前記ゲインを乗じられた周波数データを音声出力時間データに変換する周波数逆変換部とを有する雑音低減回路であって、
前記ゲイン算出部が、前記入力対雑音レベル比から原音付加率を算出する原入力スペクトル付加率算出部と、算出された前記原音付加率を基に原音対応ゲインを算出する原音付加ゲイン計算部と、前記入力対雑音レベル比から平滑化重み係数を算出する平滑化重み係数算出部と、前記平滑化重み係数を基に前記原音対応ゲインを平滑化するゲイン平滑化部とを含むことを特徴とする雑音低減回路。 - 前記原音付加率と、前記平滑化重み係数が共に、前記入力対雑音レベル比に応じて適応的に制御され、前記ゲイン平滑化部が前記原音対応ゲインと前記平滑化重み係数とにより前記入力対雑音レベル比に対して適応的に最適なゲインを算出することを特徴とする請求項1に記載の雑音低減回路。
- 前記原音付加率βへの変換は変換関数hにより規定され、
β=h(SNR) …(1)
前記原音対応ゲインG1と前記原音付加率βの関係は、次式(2)で与えられ、
G1=β+(1−β)(1−K/SNR) …(2)
(ただし、Kはパラメータ)
前記平滑化重み係数αへの変換は変換関数fにより規定され、
α=f(SNR) …(3)
前記最終のゲインGは次式(4)
G=αG2+(1−α)G1 …(4)
(ただし。G2は1フレーム前の原音付加対応ゲインG1を表す。)
で与えられることを特徴とする請求項2に記載の雑音低減回路。 - 前記ゲイン算出部は、
入力スペクトルを振幅スペクトルまたはパワースペクトルなどの、ある次元のスペクトル量に変換するスペクトルレベル算出部と、
前記音声区間判定部の音声区間判定結果に応じて動作するスイッチと、
前記スイッチから受け渡された非音声区間の入力スペクトルレベルの平均を算出して、その算出結果を雑音のみのスペクトルレベルと推定するブロック平均部と、
前記スペクトルレベル算出部から与えられる入力のスペクトルレベルと前記ブロック平均部から与えられる前記雑音のスペクトルレベルとから入力対雑音レベル比を算出する入力対雑音レベル比算出部と
を有することを特徴とする請求項1ないし3のいずれかに記載の雑音低減回路。 - デジタル音声入力データを周波数データに変換する周波数変換ステップと、
前記周波数データから音声区間か非音声区間かを判定する音声区間判定ステップと、
前記周波数データと前記音声区間判定ステップでの判定結果とから適応的に入力対雑音レベル比を推定して該入力対雑音レベル比に応じたゲインを算出するゲイン算出ステップと、
前記ゲインを前記周波数データに乗じる乗算ステップと、
前記ゲインを乗じられた周波数データを音声出力時間データに変換する周波数逆変換ステップとを有する雑音低減方法であって、
前記ゲイン算出ステップが、前記入力対雑音レベル比から原音付加率を算出する原入力スペクトル付加率算出ステップと、算出された前記原音付加率を基に原音対応ゲインを算出する原音付加ゲイン計算ステップと、前記入力対雑音レベル比から平滑化重み係数を算出する平滑化重み係数算出ステップと、前記平滑化重み係数を基に前記原音対応ゲインを平滑化するゲイン平滑化ステップとを包含することを特徴とする雑音低減方法。 - 前記原音付加率と、前記平滑化重み係数が共に、前記入力対雑音レベル比に応じて適応的に制御され、前記ゲイン平滑化ステップにおいて前記原音対応ゲインと前記平滑化重み係数とにより前記入力対雑音レベル比に対して適応的に最適なゲインを算出することを特徴とする請求項5に記載の雑音低減方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003114951A JP2004317993A (ja) | 2003-04-18 | 2003-04-18 | 雑音低減回路および雑音低減方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003114951A JP2004317993A (ja) | 2003-04-18 | 2003-04-18 | 雑音低減回路および雑音低減方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004317993A true JP2004317993A (ja) | 2004-11-11 |
Family
ID=33474368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003114951A Pending JP2004317993A (ja) | 2003-04-18 | 2003-04-18 | 雑音低減回路および雑音低減方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004317993A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007285875A (ja) * | 2006-04-17 | 2007-11-01 | Nsk Ltd | 異常診断装置及び異常診断方法 |
KR101432102B1 (ko) * | 2011-09-02 | 2014-08-21 | 에스케이텔레콤 주식회사 | 음향 신호 품질 개선 장치 및 방법 |
JP2015034898A (ja) * | 2013-08-09 | 2015-02-19 | キヤノン株式会社 | 音声処理装置及び撮像装置 |
US9584087B2 (en) | 2012-03-23 | 2017-02-28 | Dolby Laboratories Licensing Corporation | Post-processing gains for signal enhancement |
-
2003
- 2003-04-18 JP JP2003114951A patent/JP2004317993A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007285875A (ja) * | 2006-04-17 | 2007-11-01 | Nsk Ltd | 異常診断装置及び異常診断方法 |
KR101432102B1 (ko) * | 2011-09-02 | 2014-08-21 | 에스케이텔레콤 주식회사 | 음향 신호 품질 개선 장치 및 방법 |
US9584087B2 (en) | 2012-03-23 | 2017-02-28 | Dolby Laboratories Licensing Corporation | Post-processing gains for signal enhancement |
US10311891B2 (en) | 2012-03-23 | 2019-06-04 | Dolby Laboratories Licensing Corporation | Post-processing gains for signal enhancement |
US10902865B2 (en) | 2012-03-23 | 2021-01-26 | Dolby Laboratories Licensing Corporation | Post-processing gains for signal enhancement |
US11308976B2 (en) | 2012-03-23 | 2022-04-19 | Dolby Laboratories Licensing Corporation | Post-processing gains for signal enhancement |
US11694711B2 (en) | 2012-03-23 | 2023-07-04 | Dolby Laboratories Licensing Corporation | Post-processing gains for signal enhancement |
JP2015034898A (ja) * | 2013-08-09 | 2015-02-19 | キヤノン株式会社 | 音声処理装置及び撮像装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3454206B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP4423300B2 (ja) | 雑音抑圧装置 | |
JP5245714B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
EP2987314B1 (en) | Echo suppression | |
US9747919B2 (en) | Sound processing apparatus and recording medium storing a sound processing program | |
JP5526524B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
US9418677B2 (en) | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program | |
JP3454403B2 (ja) | 帯域分割型雑音低減方法及び装置 | |
JP2000082999A (ja) | 雑音低減処理方法、その装置及びプログラム記憶媒体 | |
JP2015037239A (ja) | 残響抑圧装置とその方法と、プログラムとその記録媒体 | |
JP5152799B2 (ja) | 雑音抑圧装置およびプログラム | |
JP2005258158A (ja) | ノイズ除去装置 | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP2004317993A (ja) | 雑音低減回路および雑音低減方法 | |
JP2004020679A (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP2002140100A (ja) | 騒音抑圧装置 | |
JP2020160290A (ja) | 信号処理装置、信号処理システム及び信号処理方法 | |
JP2002175099A (ja) | 雑音抑制方法および雑音抑制装置 | |
JP6707914B2 (ja) | ゲイン処理装置及びプログラム、並びに、音響信号処理装置及びプログラム | |
JP2010020013A (ja) | 雑音抑圧評価装置およびプログラム | |
CN114596874A (zh) | 一种基于多麦克风的风噪抑制方法与装置 | |
JP5131149B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP4460256B2 (ja) | 雑音低減処理方法、この方法を実施する装置、プログラム、記録媒体 | |
JP5316127B2 (ja) | 音処理装置およびプログラム | |
JP5056654B2 (ja) | 雑音抑制装置、及び雑音抑制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060403 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090522 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091023 |