JP6737133B2 - 雑音推定装置、プログラム及び方法 - Google Patents

雑音推定装置、プログラム及び方法 Download PDF

Info

Publication number
JP6737133B2
JP6737133B2 JP2016213018A JP2016213018A JP6737133B2 JP 6737133 B2 JP6737133 B2 JP 6737133B2 JP 2016213018 A JP2016213018 A JP 2016213018A JP 2016213018 A JP2016213018 A JP 2016213018A JP 6737133 B2 JP6737133 B2 JP 6737133B2
Authority
JP
Japan
Prior art keywords
noise
power
threshold value
input power
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016213018A
Other languages
English (en)
Other versions
JP2018072593A (ja
Inventor
大 藤枝
大 藤枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2016213018A priority Critical patent/JP6737133B2/ja
Publication of JP2018072593A publication Critical patent/JP2018072593A/ja
Application granted granted Critical
Publication of JP6737133B2 publication Critical patent/JP6737133B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、雑音推定装置、プログラム及び方法に関し、例えば、入力信号に含まれる雑音成分の推定結果を用いて、入力信号に重畳された雑音成分を抑圧する装置に適用し得る。
自然環境において雑音はいたる所に存在するため、一般に実世界で観測される音声は種々の発信元からの雑音を含む。雑音を含んで観測された入力信号から音声だけを強調させるために、様々な雑音抑圧方法が開発されている。これらのうちのほとんどは、抑圧すべき雑音を推定する方法と、雑音を抑圧するフィルタを計算する方法とに対応している。従来の入力信号から雑音を抑圧する音声処理装置では、周波数領域で雑音のパワーを推定するものがある。
従来、最も単純な雑音推定方法の例として、入力スペクトルを音声が存在しない区間で平均する方法がある。しかし、このような従来の雑音推定方法は、事前に音声が存在しない区間を推定しなければならない。そのため、音声が存在する区間を推定する音声区間検出(Voice Activity Detection:VAD)という技術も盛んに開発されているが、完全なVADは未だ達成されていない。雑音推定処理において、音声区間の推定を誤ると、推定雑音が目的音声を含んでしまうため、強調音声や残留雑音を歪ませるという問題が生じる。また、上述のような雑音推定方法では、雑音区間でしか雑音を推定しないため、長い音声区間があると雑音の変化に追従できないという欠点もある。
このような背景から、音声区間でも雑音の推定を継続する雑音推定方法として、従来非特許文献1、非特許文献2、及び特許文献1の記載技術がある。いずれの文献も雑音抑圧方法(音声強調方法とも言う)に関する。
非特許文献1に記載の従来の雑音推定方法は、入力パワーの時間方向のピークが目的音声の存在を表す一方で、谷が平滑化した雑音パワーの推定に使えるという発見に基づいている。具体的には、現在から所定時間(T秒)過去までの入力パワーの最小値を、雑音パワーの第1の推定値とする。しかし、雑音パワーの第1の推定値はバイアスを有しており、真の雑音パワーよりも小さくなる性質を持つ。このバイアスは、雑音パワーの第1の推定値の期待値から推定され、得られたバイアス推定値を用いて雑音パワーの第1の推定値を補正して、雑音パワーの第2の推定値(最終的な推定値)を得る。
非特許文献2に記載の従来の雑音推定方法は、目的音声と雑音の複素スペクトルの分布がいずれも平均ゼロの複素正規分布に従うという仮説に基づいて、雑音の複素スペクトルの分散の最尤推定値を雑音パワーの推定値とする。この仮説に基づくと、入力信号の複素スペクトルの分布は音声の複素スペクトルの分散と雑音の複素スペクトルの分散の和を分散とする平均ゼロの複素正規分布となる。ここに現在の入力が劣化音声と雑音のどちらであるかに関する隠れ変数を導入して、忘却係数を伴ったオンラインEMアルゴリズムを適用することで、雑音の複素スペクトルの最尤推定値を算出することができる。
特許文献1に記載の従来の雑音推定方法は、入力パワーに適切な重み係数を乗じて、得られた加重入力パワーを所定時間(T秒)分記憶しておき、記憶された加重入力パワーの平均値を雑音パワーの推定値とする。適切な重み係数は、現在の入力パワーを雑音パワーの直前の推定値で除した事後SNR(Signal−to−Noise Ratio:信号対雑音比)によって算出される。具体的には、事後SNRが所定の値G1以下では重み係数を1とし、事後SNRがG1以上では事後SNRに反比例するように重み係数を設定し、事後SNRが所定の値G2以上では重み係数を0とする。また、重み係数が0の場合には、加重入力パワーは記憶しない。
特開2002−204175号公報
R.Martin,"Spectral Subtraction Based on Minimum Statistics,"in Proceedings of 7th European Signal Processing Conference,1994,pp.1182−1185 M.Souden, M.Delcroix, K.Kinsoshita, T.Yoshicika, and T.Nakatani,"Noise Power Spectral Density Tracking: A Maximum Likelihood Perspective,"IEEE Signal Processing Letters,Vol.19,No.8,2012,pp.495−498
しかしながら、従来の雑音推定方法には以下に述べるような問題点が存在する。
非特許文献1の方法は、雑音が急に大きくなった場合に、後段の雑音抑圧方法によって不快に感じる雑音が残留するという問題を有している。具体的には、雑音が大きくなってから所定時間の間は、雑音パワーの推定値は小さいままである。そして、雑音が大きくなってから所定時間後に、雑音パワーの推定値は急激に増大する。そのような雑音パワーの推定値を用いて雑音抑圧方法を動作させると、雑音が大きくなった瞬間に残留雑音も急に大きくなり、その所定時間後に残留雑音が急に小さくなる。残留雑音の急激な音量の変化は、聴取者に聴感上の不快感を与える。
非特許文献2の方法は、雑音レベルが変化すると雑音パワーの推定値が過大になったり過小になったりするという問題を有している。この雑音推定方法で用いられているオンラインEMアルゴリズムは、次のような追従の速さと最尤推定の安定性とのトレードオフを有する忘却係数を大きくすると安定性が増して追従が遅くなり、忘却係数を小さくすると追従が速くなって安定性が下がる。その結果、忘却係数を大きくしても小さくしても雑音パワーの推定値は不正確となり、後段の雑音抑圧方法によって得られる強調音声の歪みを増大させたり残留雑音が大きくなったりする。
特許文献1の方法は、雑音パワーの推定値が、誤って音声に追従してしまうことや、非定常雑音に追従して不安定になることが比較的少なく、それでいて雑音が変化した場合にも比較的速やかに追従することができる。しかし、雑音区間において直前の雑音パワーの推定値よりG1倍以上大きい入力パワーには1未満の重み係数を乗じてしまうため、加重入力パワーが真の雑音パワーより小さくなる。そのため、雑音パワーの推定値も、真の雑音パワーの平均値より小さくなる問題がある。
以上のように、従来の雑音推定方法は、雑音パワー推定値が不安定になるか不正確になる問題を有する。
そのため、入力信号について、雑音パワーを安定的かつ正確に推定できる雑音推定装置、プログラム及び方法が望まれている。
第1の本発明は、入力信号を複数の帯域に分割した信号の入力パワーごとに雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段を備える雑音推定装置において、(1)それぞれの前記雑音推定手段は、(1−1)過去の推定雑音パワーにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定する閾値決定手段と、(1−2)前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得する判定手段と、(1−3)前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する推定雑音パワー算出手段とを有することを特徴とする。
第2の本発明は、入力信号の入力パワーに含まれる雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段を備える雑音推定装置において、(1)前記雑音推定手段は、(1−1)前記入力パワーと過去の推定雑音パワーとにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定する閾値決定手段と、(1−2)前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得する判定手段と、(1−3)前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する推定雑音パワー算出手段とを有することを特徴とする。
第3の本発明の雑音推定プログラムは、コンピュータを(1)入力信号を複数の帯域に分割した信号の入力パワーごとに雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段として機能させ、(2)それぞれの前記雑音推定手段は、(2−1)過去の推定雑音パワーにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定する閾値決定手段と、(2−2)前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得する判定手段と、(2−3)前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する推定雑音パワー算出手段とを有することを特徴とする。
第4の本発明の雑音推定プログラムは、コンピュータを(1)入力信号の入力パワーに含まれる雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段として機能させ、(2)前記雑音推定手段は、(2−1)前記入力パワーと過去の推定雑音パワーとにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定する閾値決定手段と、(2−2)前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得する判定手段と、(2−3)前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する推定雑音パワー算出手段とを有することを特徴とする。
第5の本発明は、入力信号を複数の帯域に分割した信号の入力パワーごとに雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定方法において、(1)前記入力パワーごとに雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段を備え、(2)それぞれの前記雑音推定手段は、閾値決定手段、判定手段、及び推定雑音パワー算出手段を備え、(3)前記閾値決定手段は、過去の推定雑音パワーにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定し、(4)前記判定手段は、前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得し、(5)前記推定雑音パワー算出手段は、前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得することを特徴とする。
第6の本発明は、入力信号の入力パワーに含まれる雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定方法において、(1)前記入力パワーに含まれる雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段を備え、(2)前記雑音推定手段は、閾値決定手段、判定手段、及び推定雑音パワー算出手段を備え、(3)前記閾値決定手段は、前記入力パワーと過去の推定雑音パワーとにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定し、(4)前記判定手段は、前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得し、(5)前記推定雑音パワー算出手段は、前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得することを特徴とする。
本発明によれば、雑音パワーを安定的かつ正確に推定できる雑音推定装置、プログラム及び方法を提供することができる。
第1の実施形態に係る雑音推定手段の機能的構成について示したブロック図である。 第1の実施形態に係る雑音推定装置の機能的構成について示したブロック図である。 第1の実施形態に係る推定雑音算出手段の機能的構成について示したブロック図である。 レストラン雑音に埋もれた音声成分(750Hz帯域)の入力パワーについて示したグラフである。 レストラン雑音に埋もれた音声成分(750Hz帯域)の入力パワーと音声パワーについて示したグラフである。 第2の実施形態に係る雑音推定手段の機能的構成について示したブロック図である。 第2の実施形態に係る閾値決定手段の機能的構成について示したブロック図である。 第3の実施形態に係る雑音推定手段の機能的構成について示したブロック部である。 第3の実施形態に係る推定雑音算出手段の機能的構成について示したブロック図である。 第4の実施形態に係る雑音推定装置の機能的構成について示したブロック図である。
(A)第1の実施形態
以下、本発明による雑音推定装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図2は、第1の実施形態に係る雑音推定装置1の機能的構成について示したブロック図である。
図2に示すように、雑音推定装置1は、帯域分割手段10と、K個のパワー算出手段20(20−1〜20−K)と、K個の雑音推定手段30(30−1〜30−K)を有している。
雑音推定装置1は、すべてハードウェア的に構成(例えば、専用チップを用いて構成)するようにしてもよいし、一部または全部をソフトウェア的に構成するようにしてもよい。例えば、雑音推定装置1は、プロセッサ及びメモリを備えるコンピュータにプログラム(実施形態に係る雑音推定プログラムを含む)をインストールすることにより実現するようにしてもよい。
帯域分割手段10は、入力信号xを周波数解析して周波数スペクトル(以下、「入力スペクトル」とも呼ぶ)を算出し、得られた入力スペクトルをK個に分割して、分割した入力スペクトル(以下、「周波数帯域信号」と呼ぶ)を、パワー算出手段20−1〜20−K(以下、枝番「1」〜「K」を適宜省略して説明する)に与える。周波数解析には、例えば、高速フーリエ変換(Fast Fourier Transform:FFT)やウェーブレット変換やフィルタバンクなどを適用することができるが、FFTが好適である。
入力信号xは、例えば、電話端末のマイクにより捕捉される音響信号である。電話端末のマイクにより捕捉される音響信号には、例えば、目的音としての話者の音声と非目的音としての雑音(例えば、背景雑音等)が含まれる。
パワー算出手段20(20−1〜20−K)は、入力された周波数帯域信号に基づく入力パワーを算出し、雑音推定手段30(30−1〜30−K)に与える。各パワー算出手段20では、パワーの算出方法として、種々の算出方法を適用することができる。パワー算出手段20は、例えば、絶対値の2乗和若しくは絶対値和を入力パワーとして算出するようにしても良い。以下では、各パワー算出手段20(20−1〜20−K)が出力する入力パワーをPX(PX〜PX)と表すものとする。
各雑音推定手段30(30−1〜30−K)は、各パワー算出手段20(20−1〜20−K)から供給される入力パワーPX(PX〜PX)に含まれる雑音成分のパワーを推定し、その結果(以下、「推定雑音パワー」とも呼ぶ)を出力する。以下では、各雑音推定手段30(30−1〜30−K)が出力する推定雑音パワーを、PN(PN〜PN)と表すものとする。
各雑音推定手段30(30−1〜30−K)が、推定雑音パワーPN(PN〜PN)を出力する際の方式(例えば、信号形式やデータ形式)や出力先については限定されないものである。例えば、雑音推定手段30(30−1〜30−K)は、入力パワーPX(t)の目的音を強調(雑音を抑圧)する図示しない音声処理装置等に推定雑音パワーPN(PN〜PN)を供給するようにしてもよい。また、雑音推定装置1は、上述のような音声処理装置の一部として構成するようにしてもよい。
次に、各雑音推定手段30(30−1〜30−K)の内部構成について説明する。
図1は、任意の雑音推定手段30の内部構成について示したブロック図である。この実施形態では、各雑音推定手段30(30−1〜30−K)の内部構成は、図1を用いて示されるものとする。すなわち、各雑音推定手段30(30−1〜30−K)は、入力される周波数帯域信号(帯域)が異なるのみで同様な構成を有する。図1に示すように、任意の雑音推定手段30は、入力パワーPX(t)の雑音成分のパワーを推定してPN(t)を出力するものとして以下の説明を行う。
図1に示すように、雑音推定手段30は、閾値決定手段110、判定手段120、推定雑音算出手段130、及び雑音遅延手段140を有している。
閾値決定手段110は、入力パワーPX(t)が定常雑音であると判定するための入力パワーPX(t)の範囲(上限値及び下限値)を決定する。この実施形態の閾値決定手段110は、当該範囲の下限値としての閾値L(t)と、当該範囲の上限値としての閾値U(t)を決定するものとする。具体的には、閾値決定手段110は、過去(d時間分過去)の推定雑音パワーPN(t−d)に基づいて第1の閾値L(t)と第2の閾値U(t)を決定する処理を行う。
判定手段120は、第1の閾値L(t)と第2の閾値U(t)に基づいて入力パワーPX(t)が定常な雑音成分か否かを判定して判定結果D(t)を得る処理を行う。
推定雑音算出手段130は、判定結果D(t)に応じて入力パワーPX(t)と過去の推定雑音パワーPN(t−d)に基づいて雑音パワーを推定して推定雑音パワーPN(t)を得る処理行う。
雑音遅延手段140は、推定雑音パワーPN(t)をd時間遅延させて出力する処理を行う。
次に、推定雑音算出手段130の内部構成について図3を用いて説明する。
推定雑音算出手段130は、雑音入力記憶手段131、平均手段132、及びスイッチ手段133を有する。
雑音入力記憶手段131は、判定結果D(t)に応じて、音声成分を含まない入力パワーPX(t)を所定の時間分記憶(バッファリング)する処理を行う。
平均手段132は、判定結果D(t)に応じて、雑音入力記憶手段131が記憶(バッファリング)している入力パワー(入力パワーの集合)を平均して平均雑音入力パワーPA(t)を得る処理を行う。
スイッチ手段133は、判定結果D(t)に応じて、平均雑音入力パワーPA(t)と過去の推定雑音パワーPN(t−d)とのいずれかを選択して推定雑音パワーPN(t)を得る処理を行う。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の雑音推定装置1の動作(実施形態の雑音推定方法)を説明する。
上述の通り、各雑音推定手段30−1〜30−Kの構成及び動作はすべて同様であるため、以下では、任意の雑音推定手段30内部の動作について説明する。
まず、雑音推定手段30の全体の動作について図1を用いて説明する。
閾値決定手段110は、入力パワーPX(t)と所定の遅延時間dだけ過去に得られた推定雑音パワーPN(t−d)とに基づいて2つの閾値を決定し、得られた第1の閾値L(t)と第2の閾値U(t)を判定手段120に与える。ここで、L(t)は、U(t)より必ず小さくなるように決定される。予め雑音パワーの平均的な大きさがわかっている場合には、2つの閾値は定数としても良い。例えば、L(t)=0.5、U(t)=2.0としてもよい。しかし、雑音パワーの平均的な大きさは、一般に、時間経過と共に少しずつ変化する。したがって、例えば、L(t)及びU(t)を、PN(t−d)に所定の係数(適用する係数の値については限定されない)を乗じた値とするのが好適である。例えば、L(t)=0.3×PN(t−d)、U(t)=3.0×PN(t−d)としても良い。
判定手段120は、入力パワーPX(t)が定常雑音(定常雑音のみ)であるか否かを判定する。
判定手段120は、「第1の閾値L(t)より大きくかつ第2の閾値U(t)より小さい場合」(すなわち、PX(t)が閾値決定手段110の設定した範囲内の場合)、PX(t)を定常雑音(音声成分を含まない定常雑音)であると判断し、D(t)=Trueを出力するまた、判定手段120は、「PX(t)がL(t)より小さい場合」、又は「PX(t)が第2の閾値U(t)より大きい場合」(すなわち、PX(t)が閾値決定手段110の設定した範囲外の場合)、PX(t)は定常雑音でない(例えば、PX(t)が音声成分を含む状態)であると判断して、D(t)=Falseを出力する。そして、判定手段120から出力された判定結果D(t)は推定雑音算出手段130に供給する。
判定手段120において、第2の閾値U(t)による判定処理は、入力パワーが定常な雑音成分か否かを判定するだけでなく、従来技術と同様に、入力パワーPX(t)が音声か雑音かを判断する機能に対応する。そして、判定手段120において、第1の閾値L(t)による判定は、小さな入力パワーPX(t)に対して、入力パワーが定常な雑音成分かだけを判定している。つまり、判定手段120では、定常雑音であると判断するには小さ過ぎる入力パワーPX(t)は、定常雑音の成分ではないと判断される。もし、この小さな入力パワーに対する第1の閾値L(t)による判定がない場合、判定手段120は、真に雑音成分しか含まない小さな入力パワーPX(t)に推定雑音パワーPN(t)を追従させてしまうので、その後の真に雑音成分しか含まない大きな推定雑音パワーPN(t)を音声であると誤認識し、結果として雑音パワーの推定精度の低下や真の雑音パワーへの追従の遅れが生じてしまう。したがって、判定手段120では、第1の閾値による判定を行うことによって、定常な雑音成分を安定的かつ正確に推定できる。
推定雑音算出手段130は、D(t)がTrueの場合には入力パワーPX(t)に基づいて推定雑音パワーPN(t)を推定し、D(t)がFalseの場合には過去の推定雑音パワーPN(t−d)をPN(t)とし、得られたPN(t)を雑音遅延手段140に与えると共に、雑音推定手段30の出力とする。推定雑音算出手段130の詳細な動作は後述する。
雑音遅延手段140は、推定雑音パワーPN(t)を所定の遅延時間dだけ遅延させて、得られたPN(t−d)を閾値決定手段110と推定雑音算出手段130に与える。所定の遅延時間dは、単位時間(つまりd=1)とするのが好適だが、雑音推定手段30の動作を安定させるためにより大きな遅延時間を設定しでも良い。
次に、推定雑音算出手段130の詳細な動作について、図3を用いて説明する。
雑音入力記憶手段131は、判定結果D(t)がTrueのときだけ所定の入力セットサイズN個の単位時間数の入力パワーのセット(集合)を記憶(N個の入力パワーPXを記憶)する。入力セットサイズN個は限定されないものであるが、例えば、単位時間に応じた値や、実験等により得られた好適な値を設定するようにしてもよい。
以下では、雑音入力記憶手段131が時刻tの時点で記憶している入力パワーのセット(集合)を、雑音入力パワーセットMN(t)と表すものとする。そして、雑音入力記憶手段131は、得られた雑音入力パワーセットMN(t)を平均手段132に与える。すなわち、MN(t)は入力パワーPX(t)が定常な雑音成分しか含まないと判定されたとき(D(t)がTrueのとき)の、入力パワーPX(t)の集合となる。
平均手段132は、判定結果D(t)がTrueのときだけ、雑音入力記憶手段131が記憶しているMN(t)が記憶している雑音入力パワーセットMN(t)の各値(各入力パワーPX)の平均値(以下、「平均雑音入力パワーPA(t)」と表す)を算出し、得られた平均雑音入力パワーPA(t)をスイッチ手段133に供給する。
スイッチ手段133は、判定結果D(t)がTrueのときには平均雑音入力パワーPA(t)を推定雑音パワーPN(t)として出力し、判定結果D(t)がFalseのときにはd時間だけ過去の推定雑音パワーPN(t−d)を推定雑音パワーPN(t)として出力する。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
(A−3−1)第1の実施形態の雑音推定装置1(雑音推定手段30)、過去の推定雑音パワーPN(t−d)に基づいて、定常雑音と判定可能な入力パワーPX(t)の範囲を示す2つの閾値L(t)とU(t)を決定し、当該範囲内に入る入力パワーPX(t)、すなわち定常な雑音成分であると判断された入力パワーだけを平均して雑音パワー(PN(t))を推定する。これにより、雑音推定装置1(雑音推定手段30)では、音声成分と雑音成分を含む入力パワーPX(t)から、定常な雑音パワーを安定的かつ正確に推定することができる。
(A−3−2)ところで、非特許文献1の問題点は、雑音パワーの推定値を不連続に(単位時間以上空けて)選択された過去の値としたことに起因する。雑音パワーの推定値は、滑らかとなるように、連続的に算出されるべきである。また、非特許文献2の問題点は、音声の複素スペクトルを定常な複素正規分布で、モデリングしたことに起因する。音声は本来非定常かつ優ガウス性であるから、分散や隠れ変数を正しく推定できないので、忘却係数によるトレードオフが生じてしまう。さらに、特許文献1の問題点は、小さな入力パワーに対しては無配慮であることに起因する。
以上の要因を解消するために、第1の実施形態の雑音推定装置1(雑音推定手段30)では、推定する対象を定常雑音に限定している。非特許文献1および特許文献1では、いずれも推定対象が定常か否かに言及していない。また、非特許文献2では評価実験において非定常な雑音を推定対象としているが、非定常性に言及していない。しかし、音声成分も非定常であることを考慮すると、高々1つの帯域だけの観察によって非定常雑音を推定することは、極めて困難である。
図4および図5は、音声信号に非定常なレストラン雑音を重畳した際の、750Hz帯域の入力パワーの時間変化を表すグラフである。図4では、入力パワー(点線)だけが描画されており、図5では入力パワー(点線)と音声成分のパワー(実線)が重ね書きされている。
図4を観察して分かるように、0.5秒や4.0秒の成分が音声成分ではない(図5参照)ことを特定するのは、専門家でも難しい。以上が、本発明が推定対象を定常雑音に限定している理由である。
定常雑音には、以下に説明するような有用な特性を有する。まず、ガウス過程に従う雑音において、その複素スペクトルが複素正規分布に従い、その振幅スペクトルがレイリー分布に従い、さらにそのパワースペクトルが指数分布に従うことが、よく知られている。一般に、ガウス過程に従わない雑音の帯域ごとのパワーは、ガウス過程に従う雑音の帯域ごとのパワーとは厳密には異なる分布となると考えられていた。ところが、本願発明者は、ガウス過程に従わなくとも定常であれば雑音のパワースペクトル(つまり雑音パワー)は指数分布することを発見した(詳細については、以下の「参考文献1」参照)。
参考文献1:藤枝大、矢頭隆、「定常雑音推定の為の有色雑音のパワースペクトルの分布に関する調査」、平成28年電気学会 電子・情報・システム部門大会、TC16−13、pp.553〜558、兵庫県、2016年9月
つまり、定常雑音の雑音パワーが指数分布に従うということが厳密にわかっているから、入力パワーが所定の値の範囲内にあれば定常雑音であると言える。そこで、第1の実施形態の雑音推定手段30では、(a)雑音パワーを連続的に推定し、(b)「音声か雑音か」という基準ではなく「定常雑音か否か」という基準を用い、かつ(c)入力パワーが所定の2つの閾値の間に収まっているか否かを判断する(これにより小さな入力パワーをも配慮することができる)ことで、雑音パワーを安定的かつ正確に推定する。
(B)第2の実施形態
以下、本発明による雑音推定装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
第2の実施形態の雑音推定装置1Aの全体構成についても上述の図2を用いて示すことができる。以下では、第2の実施形態の雑音推定装置1Aについて、第1の実施形態との差異を説明する。
第2の実施形態の雑音推定装置1Aでは、雑音推定手段30(30−1〜30−K)が、雑音推定手段30A(30A−1〜30A−K)に置き換わっている点で第1の実施形態と異なっている。
第1の実施形態の雑音推定手段30では、2つの閾値L(t)、U(t)について、過去の推定雑音パワーPN(t−d)を定数倍することで求めた。これに対して、第2の実施形態の雑音推定装置1A(雑音推定手段30A)では、過去の推定雑音パワーが指数分布する真の雑音パワーの期待値の推定値となっていることを利用して、統計の技法である区間推定に基づいた閾値決定法を用いる。これにより、雑音推定手段30Aでは、第1の実施形態よりも雑音パワーの推定精度を向上させる。
次に、第2の実施形態の雑音推定装置1A(雑音推定手段30A)において、定常雑音であるか否かを判定するための2つの閾値L(t)、U(t)を求める方式の概要(理論)について説明する。
上述の通り、雑音パワーは、定常で、かつ指数分布することがわかっているので、雑音パワーの期待値(標本平均)に関する区間推定を行うことが可能である。指数分布はガンマ分布の特別なケースなので、母数λ(ラムダ)の指数分布に従う確率変数Xは、形状母数1、尺度母数1/λのガンマ分布に従うとも言える((1)式参照)。ガンマ分布は再生性を有するので、n個の確率変数Xの和は形状母数n、尺度母数1/λのガンマ分布に従う((2)式参照)。確率変数Xの標本平均X(エックスバー)は、和の1/n倍(つまり尺度変換した結果)である。ガンマ分布における確率変数の尺度の変換は、ガンマ分布の尺度母数に同様の変換を施すのと同じであるから、標本平均X(指数分布の期待値)は、形状母数n、尺度母数1/(n・λ)のガンマ分布に従う((3)式参照)。そして、(3)式を尺度変換すると(4)式が得られる。
そして、信頼係数をα(アルファ)とすると、期待値の信頼区間は該期待値が100×α(%)の確率で得られる区間なので、信頼区間下限と上限はそれぞれ該期待値の累積密度関数がα/2と(1−α/2)となる値として定義される。したがって、信頼区間θ−(シータ・マイナス)とθ+(シータ・プラス)((5)式参照)は、(6)式、(7)式、および(8)式によって計算できる。信頼係数αには、0.90、0.95、0.99などが好適に用いられる。(5)式は信頼区間を表す式となっているが、雑音推定には使いにくい。そこで、(5)式を式変形して、(9)式を得る。ここで、λを過去の推定雑音パワーの逆数(指数分布の母数λは、該指数分布の期待値の逆数と一致する)とし、X〜Xn−1を過去の入力パーとし、Xを現在の入力パワーとすると、(9)式を満たす入力パワーX〜Xは信頼係数αで母数λの指数分布に従うので、現在の入力パワーXは該指数分布に従う雑音パワーであると考えられる。逆に、(9)式を満たさない入力パワーXは該指数分布に従わないと考えられるので、入力パワーXは少なくとも定常な雑音成分ではないと考えられる。
Figure 0006737133
第2の実施形態の雑音推定装置1A(雑音推定手段30A)では、以上のように、区間推定から厳密に導出された(9)式を満たす入力パワーのみを平均することによって定常雑音の雑音パワーを推定するものとする。これにより、雑音推定装置1A(雑音推定手段30A)では、非定常な雑音パワーや音声成分を含む入力パワーを誤って平均することを回避し、安定かつ正確な推定雑音パワーを得ることができる。
次に、第2の実施形態の雑音推定手段30A(30A−1〜30A−K)について、図6を用いて説明する。
図6では、上述の図1と同様に、任意の雑音推定手段30Aの機能的構成について示している。図6では、上述の図1と同一部分又は対応部分には同一符号又は対応符号を付している。
第2の実施形態の雑音推定手段30Aでは、閾値決定手段110が閾値決定手段210に置き換わっている点で第1の実施形態と異なっている。
閾値決定手段210は、入力パワーPX(t)と過去の推定雑音パワーPN(t−d)に基づいて第1の閾値L(t)と第2の閾値U(t)を算出する処理を行う。
図7は、閾値決定手段210の機能的構成について示したブロック図である。
閾値決定手段210は、入力遅延手段211、入力記憶手段212、及び閾値算出手段213を有している。
入力遅延手段211は、入力パワーPX(t)を単位時間遅延させる処理を行う。
入力記憶手段212は、入力パワーPX(t)を所定の時間分記憶する処理を行う。以下では、入力記憶手段212が、時刻tの時点で記憶する所定時間分の入力パワーのセット(集合)を、入力パワーセットMX(t)と表すものとする。
閾値算出手段213は、入力パワーセットMX(t)と過去の推定雑音パワーPN(t−d)に基づいて第1の閾値L(t)と第2の閾値U(t)を得る処理を行う。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の雑音推定装置1Aの動作(実施形態の雑音推定方法)を説明する。
以下では、各雑音推定手段30A−1〜30A−Kの構成及び動作はすべて同様であるため、以下では、第1の実施形態と同様に、任意の雑音推定手段30A内部の動作について説明する。
第2の実施形態の雑音推定手段30Aにおける判定手段120、推定雑音算出手段130、および雑音遅延手段140の動作は、第1の実施形態の雑音推定手段30と同様の動作であるため説明を省略する。第2の実施形態の雑音推定手段30Aでは、閾値決定手段210の動作のみが第1の実施形態と異なる。
閾値決定手段210は、入力パワーPX(t)と所定の遅延時間dだけ過去に得られた推定雑音パワーPN(t−d)とに基づいて2つの閾値を決定し、得られた第1の閾値L(t)と第2の閾値U(t)を判定手段120に与える。ここで、L(t)は、U(t)より必ず小さくなるように決定される。
次に、図7を用いて、閾値決定手段210内部の動作を説明する。
入力遅延手段211は、入力パワーPX(t)を単位時間だけ遅延させて、得られたPX(t−1)を入力記憶手段212に与える。
入力記憶手段212は、所定の入力セットサイズNXより1小さい単位時間数の入力パワーを記憶し、得られた入力パワーセットMX(t)を閾値算出手段213に与える。MX(t)は入力パワーの集合である((10)式参照)。なお、NXは(2)式〜(9)式のnに相当する。MX(t)のサイズを(NX−1)としたのは、(9)式において(n−1)個の和を計算するためである。
閾値算出手段213は、入力パワーセットMX(t)とd時間だけ過去の推定雑音パワーPN(t−d)とに基づいて2つの閾値を算出し、得られた第1の閾値L(t)と第2の閾値U(t)を出力する。閾値算出手段213では、(9)式に倣い、L(t)とU(t)はそれぞれ(11)式と(12)式によって算出される。なお、閾値算出手段213では、θ−(シータ・マイナス)とθ+(シータ・プラス)は、n=NXとして(6)式、(7)式、および(8)式によって事前に計算しておく。
Figure 0006737133
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
第2の実施形態の雑音推定装置1A(雑音推定手段30A)では、真の雑音パワーが指数分布に従うという事実から、入力パワーPX(t)が定常な雑音成分であるか否かを判定するために使用する2つの閾値L(t)とU(t)を、統計の技法である区間推定に基づいて厳密に算出する。これにより、雑音推定装置1A(雑音推定手段30A)では、第1の実施形態と比較して、音声成分と雑音成分を含む入力パワーPX(t)から、定常な雑音パワーをより安定的かつより正確に推定することができる。
(C)第3の実施形態
以下、本発明による雑音推定装置、プログラム及び方法の第3の実施形態を、図面を参照しながら詳述する。
(C−1)第3の実施形態の構成及び動作
第3の実施形態の雑音推定装置1Bの全体構成についても上述の図2を用いて示すことができる。以下では、第3の実施形態の雑音推定装置1Bについて、第2の実施形態との差異を説明する。
第3の実施形態の雑音推定装置1Bでは、雑音推定手段30A(30A−1〜30A−K)が、雑音推定手段30B(30B−1〜30B−K)に置き換わっている点で第2の実施形態と異なっている。
次に、第3の実施形態の雑音推定手段30B(30B−1〜30B−K)について、図8を用いて説明する。
図8では、上述の図6と同様に、任意の雑音推定手段30Bの機能的構成について示している。図8では、上述の図6と同一部分又は対応部分には同一符号又は対応符号を付している。
第3の実施形態の雑音推定手段30Bでは、推定雑音算出手段130が推定雑音算出手段230に置き換わっている点で第2の実施形態と異なっている。
次に、第3の実施形態の推定雑音算出手段230の構成について図9を用いて説明する。
図9は、推定雑音算出手段230の機能的構成について示したブロック図である。図9では、上述の図3と同一部分又は対応部分には同一符号又は対応符号を付している。
推定雑音算出手段230では、雑音入力記憶手段131の前段に遅延手段134が挿入されている点で、第1の実施形態と異なっている。
遅延手段134は、供給された入力パワーPX(t)を一定時間遅延させて雑音入力記憶手段131に供給する処理(バッファ処理)を行う。なお、遅延手段134は、判定結果D(t)に関わりなく、常時入力パワーPX(t)に対して遅延処理を行う。また、遅延手段134が保持するサンプル数(遅延時間)については、例えば、雑音入力記憶手段131で用いられたNに応じた値(例えば、N/2個)としてもよいし、実験等により好適な値を取得して設定するようにしてもよい。
なお、第1の実施形態の雑音推定手段30において、推定雑音算出手段130を推定雑音算出手段230に置き換える構成としてもよい。
(C−2)第3の実施形態の効果
第3の実施形態によれば、第2の実施形態の効果に加えて以下のような効果を奏することができる。
2つの閾値L(t)とU(t)の算出に用いられる区間推定は、統計の技法である。つまり、判定手段120にて行われる定常雑音か否かの判定は統計的に行われるので、判定に用いられるデータが定常雑音でない成分を充分(およそ10〜数十%)に含まない期間は「定常雑音である」と判定される。一方、推定雑音パワーPN(t)を更新する際には、雑音入力パワーセットMN(t)にわずか(およそ数%)でも定常雑音でない成分が含まれると、得られる推定値は不安定になる。このように、第2の実施形態の雑音推定装置1Aでは、「定常雑音でない」という判定結果が得られるタイミングは実際に定常雑音でない成分が入力されたタイミングよりも遅れてしまうため、雑音入力パワーセットMN(t)に定常雑音でない成分が格納され、推定雑音パワーPN(t)が不安定になる場合があるという問題が生じる。この問題を回避するために、第3の実施形態の雑音推定装置1B(雑音推定手段30B)では、雑音入力パワーセットMN(t)に格納する入力パワーを遅延させることで、「定常雑音である」と判定されている期間は雑音入力パワーセットMN(t)に定常雑音でない成分が含まれないようにした。これにより、雑音推定装置1B(雑音推定手段30B)では、第2の実施形態と比較して、音声成分と雑音成分を含む入力パワーPX(t)から、定常な雑音パワーをより安定的かつより正確に推定することができる。
(D)第4の実施形態
以下、本発明による雑音推定装置、プログラム及び方法の第4の実施形態を、図面を参照しながら詳述する。
図10は、第4の実施形態の雑音推定装置1Cの全体構成について示したブロック図である。図10では、上述の図1と同一部分又は対応部分には同一符号又は対応符号を付している。以下では、第4の実施形態の雑音推定装置1Cについて、第1の実施形態との差異を説明する。
図10に示すように、第4の実施形態の雑音推定装置1Cでは、帯域分割手段10が除外されている点で第1の実施形態と異なっている。そして、第4の実施形態の雑音推定装置1Cは、パワー算出手段20及び雑音推定手段30を、それぞれ1つ有している。パワー算出手段20及び雑音推定手段30の構成自体は第1の実施形態と同様であるため詳しい説明を省略する。
第4の実施形態の雑音推定装置1Cでは、入力信号Xの帯域を分割せずにそのまま雑音推定処理を行う。したがって、図10に示すように第4の実施形態の雑音推定装置1Cでは、入力信号Xが帯域分割されずにそのままパワー算出手段20に供給されて入力パワーPX(t)に変換(入力信号Xの全ての帯域に基づく入力パワーに変換)されて雑音推定手段30に供給される。そして、雑音推定装置1Cでは、パワー算出手段20が、パワー算出手段20から供給された入力パワーPX(t)にもとづいて雑音推定処理を行いその結果としての推定雑音パワーPN(t)を出力する。
なお、雑音推定装置1Cにおいて、雑音推定手段30は、第2の実施形態の雑音推定手段30Aや、第3の実施形態の雑音推定手段30Bに置き換えるようにしても良い。
第4の実施形態の雑音推定装置1Cでは、帯域分割せずに雑音推定を行うため、第1〜第3の実施形態のように帯域ごと(成分ごと)の正確な雑音推定処理はできないが、入力信号X全体に含まれる雑音成分についてある程度の精度での雑音推定処理を行うことはできる。また、雑音推定装置1Cでは、パワー算出手段20及び雑音推定手段30がそれぞれ1つだけで良いため、第1〜第3の実施形態と比較して極少ない処理量で、雑音推定処理を行うことはできる。したがって、例えば、推定雑音パワーPN(t)に対して高い精度が用いられない場合には、雑音推定装置1Cを用いることで、極少ない処理量である程度の精度で雑音推定処理を行うことが可能となる。
(E)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(E−1)第1〜第3の実施形態の雑音推定装置1、1A、1Bでは、帯域分割手段10及びパワー算出手段20が備えられているが、帯域分割手段10及びパワー算出手段20については除外し、雑音推定手段30(30−1〜30−K)に直接入力パワーPX(t)を供給(外部から供給)するようにしてもよい。また、第4の実施形態においても、パワー算出手段20を除外して、雑音推定手段30に直接入力パワーPX(t)を供給(外部から供給)するようにしてもよい。
1…雑音推定装置、10…帯域分割手段、20、20−1〜20−K…パワー算出手段、30、30−1〜30−K…雑音推定手段、110…閾値決定手段、120…判定手段、130…推定雑音算出手段、140…雑音遅延手段、131…雑音入力記憶手段、132…平均手段、133…スイッチ手段。

Claims (11)

  1. 入力信号を複数の帯域に分割した信号の入力パワーごとに雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段を備える雑音推定装置において、
    それぞれの前記雑音推定手段は、
    過去の推定雑音パワーにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定する閾値決定手段と、
    前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得する判定手段と、
    前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する推定雑音パワー算出手段とを有する
    ことを特徴とする雑音推定装置。
  2. 前記閾値決定手段は、前記入力パワーを定常な雑音成分であると判定する範囲の下限を前記第1の閾値として決定し、当該範囲の上限を前記第2の閾値として決定し、
    前記判定手段は、前記入力パワーが前記第1の閾値より大きく、且つ、前記第2の閾値より小さい場合に、前記入力パワーが定常な雑音成分であると判定する
    ことを特徴とする請求項1に記載の雑音推定装置。
  3. 前記閾値決定手段は、
    前記入力パワーを所定の時間分記憶して入力パワーセットを保持する入力パワー記憶手段と、
    前記入力パワー記憶手段に記憶されている入力パワーセットと過去の推定雑音パワーに基づいて前記第1の閾値と前記第2の閾値を算出する閾値算出手段と
    を有することを特徴とする請求項1又は2に記載の雑音推定装置。
  4. 前記推定雑音パワー算出手段は、
    前記判定手段で前記入力パワーが定常な雑音成分であると判定された場合、前記入力パワーと過去の推定雑音パワーに基づいて現在の推定雑音パワーを算出し、
    前記判定手段で前記入力パワーが定常な雑音成分でないと判定された場合、過去の推定雑音パワーを現在の推定雑音パワーとして取得する
    ことを特徴とする請求項1〜3のいずれかに記載の雑音推定装置。
  5. 前記推定雑音パワー算出手段は、
    前記入力パワーが定常な雑音成分であるときだけ前記入力パワーを所定の時間分記憶して雑音入力パワーセットを保持する雑音入力記憶手段と、
    前記入力パワーが定常な雑音成分であるときだけ前記雑音入力記憶手段に保持されている雑音入力パワーセットを平均して平均雑音入力パワーを得る平均手段と、
    前記入力パワーが定常な雑音成分であるなら前記平均雑音入力パワーを推定雑音パワーとして出力し、前記入力パワーが定常な雑音成分でないなら過去の推定雑音パワーを推定雑音パワーとして出力するスイッチ手段とを有する
    ことを特徴とする、請求項1〜4のいずれかに記載の雑音推定装置。
  6. 前記閾値算出手段は、前記入力パワーに含まれる定常な雑音成分のパワーが指数分布に従うと仮定した場合の統計処理により、前記第1の閾値と前記第2の閾値を算出することを特徴とする、請求項3に記載の雑音推定装置。
  7. 入力信号の入力パワーに含まれる雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段を備える雑音推定装置において、
    前記雑音推定手段は、
    前記入力パワーと過去の推定雑音パワーとにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定する閾値決定手段と、
    前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得する判定手段と、
    前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する推定雑音パワー算出手段とを有する
    ことを特徴とする雑音推定装置。
  8. コンピュータを入力信号を複数の帯域に分割した信号の入力パワーごとに雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段として機能させ、
    それぞれの前記雑音推定手段は、
    過去の推定雑音パワーにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定する閾値決定手段と、
    前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得する判定手段と、
    前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する推定雑音パワー算出手段とを有する
    ことを特徴とする雑音推定プログラム。
  9. コンピュータを入力信号の入力パワーに含まれる雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段として機能させ、
    前記雑音推定手段は、
    前記入力パワーと過去の推定雑音パワーとにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定する閾値決定手段と、
    前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得する判定手段と、
    前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する推定雑音パワー算出手段とを有する
    ことを特徴とする雑音推定プログラム。
  10. 入力信号を複数の帯域に分割した信号の入力パワーごとに雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定方法において、
    前記入力パワーごとに雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段を備え、
    それぞれの前記雑音推定手段は、閾値決定手段、判定手段、及び推定雑音パワー算出手段を備え、
    前記閾値決定手段は、過去の推定雑音パワーにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定し、
    前記判定手段は、前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得し、
    前記推定雑音パワー算出手段は、前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する
    ことを特徴とする雑音推定方法。
  11. 入力信号の入力パワーに含まれる雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定方法において、
    前記入力パワーに含まれる雑音成分のパワーを推定して推定雑音パワーを出力する雑音推定手段を備え、
    前記雑音推定手段は、閾値決定手段、判定手段、及び推定雑音パワー算出手段を備え、
    前記閾値決定手段は、前記入力パワーと過去の推定雑音パワーとにもとづいて、前記入力パワーを定常な雑音成分であるか否か判定するための第1の閾値と前記第1の閾値よりも大きい第2の閾値を決定し、
    前記判定手段は、前記第1の閾値と前記第2の閾値に基づいて前記入力パワーが定常な雑音成分か否かを判定して判定結果を取得し、
    前記推定雑音パワー算出手段は、前記判定手段の判定結果、前記入力パワー及び過去の推定雑音パワーを用いて推定雑音パワーを取得する
    ことを特徴とする雑音推定方法。
JP2016213018A 2016-10-31 2016-10-31 雑音推定装置、プログラム及び方法 Active JP6737133B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016213018A JP6737133B2 (ja) 2016-10-31 2016-10-31 雑音推定装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016213018A JP6737133B2 (ja) 2016-10-31 2016-10-31 雑音推定装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2018072593A JP2018072593A (ja) 2018-05-10
JP6737133B2 true JP6737133B2 (ja) 2020-08-05

Family

ID=62111606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016213018A Active JP6737133B2 (ja) 2016-10-31 2016-10-31 雑音推定装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6737133B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5387459B2 (ja) * 2010-03-11 2014-01-15 富士通株式会社 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
JP2013148724A (ja) * 2012-01-19 2013-08-01 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム

Also Published As

Publication number Publication date
JP2018072593A (ja) 2018-05-10

Similar Documents

Publication Publication Date Title
JP6361156B2 (ja) 雑音推定装置、方法及びプログラム
WO2014054314A1 (ja) 音声信号処理装置、方法及びプログラム
KR20090122251A (ko) 스피치 개선을 위한 노이즈 분산 추정기
JP2011145372A (ja) 雑音抑圧装置
JP2003337594A (ja) 音声認識装置、その音声認識方法及びプログラム
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
CN108200526B (zh) 一种基于可信度曲线的音响调试方法及装置
JP6064566B2 (ja) 音響処理装置
Lee et al. A new a priori SNR estimator based on multiple linear regression technique for speech enhancement
JP5187666B2 (ja) 雑音抑圧装置およびプログラム
JP6737133B2 (ja) 雑音推定装置、プログラム及び方法
Tu et al. Fast distributed multichannel speech enhancement using novel frequency domain estimators of magnitude-squared spectrum
JP5387442B2 (ja) 信号処理装置
JP6361148B2 (ja) 雑音推定装置、方法及びプログラム
CN115995234A (zh) 音频降噪方法、装置、电子设备及可读存储介质
JP6716933B2 (ja) 雑音推定装置、プログラム及び方法、並びに、音声処理装置
Eaton et al. A comparison of non-intrusive SNR estimation algorithms and the use of mapping functions
Fodor et al. Speech enhancement using a joint map estimator with Gaussian mixture model for (non-) stationary noise
JP7380361B2 (ja) 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置
US20210174820A1 (en) Signal processing apparatus, voice speech communication terminal, signal processing method, and signal processing program
JP6536322B2 (ja) 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP6679881B2 (ja) 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP5147012B2 (ja) 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体
JP7139822B2 (ja) 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置
JP2015169901A (ja) 音響処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190815

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200616

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200629

R150 Certificate of patent or registration of utility model

Ref document number: 6737133

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150