JP6892598B2 - ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム - Google Patents

ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム Download PDF

Info

Publication number
JP6892598B2
JP6892598B2 JP2017118374A JP2017118374A JP6892598B2 JP 6892598 B2 JP6892598 B2 JP 6892598B2 JP 2017118374 A JP2017118374 A JP 2017118374A JP 2017118374 A JP2017118374 A JP 2017118374A JP 6892598 B2 JP6892598 B2 JP 6892598B2
Authority
JP
Japan
Prior art keywords
noise
input signal
amplitude spectrum
spectrum
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017118374A
Other languages
English (en)
Other versions
JP2019003087A (ja
Inventor
池田 昇一
昇一 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Icom Inc
Original Assignee
Icom Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Icom Inc filed Critical Icom Inc
Priority to JP2017118374A priority Critical patent/JP6892598B2/ja
Priority to US15/956,796 priority patent/US10438608B2/en
Publication of JP2019003087A publication Critical patent/JP2019003087A/ja
Application granted granted Critical
Publication of JP6892598B2 publication Critical patent/JP6892598B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Description

本発明は、ノイズを減衰させるノイズ抑圧回路、ノイズ抑圧方法、および、プログラムに関する。
通信機での通話において、音声をマイクで集音する際に、周囲のノイズが混入すると、音声の認識率が低下してしまう。音声の認識率の低下を抑制するため、送信時には、音声信号に含まれるノイズを減衰させてから音声信号を送信し、受信時には、受信信号に含まれるノイズを減衰させてから受信信号を出力する必要がある。
特許文献1に開示される音声認識装置は、単一マイクの入力信号から音声区間の直前の信号のスペクトルをノイズのスペクトルとみなす。該音声認識装置は、音声区間全域からノイズのスペクトルを差し引くことで、ノイズを除去した音声区間のスペクトルを得る。特許文献2に開示される音声処理装置は、スペクトルパターンの内、連続する複数のスペクトルのエネルギーを加算し、1つ分ずつシフトしながら、順次、総和エネルギーを算出し、判定対象の複数のスペクトルの総和エネルギーと、隣接する複数のスペクトルの総和エネルギーとのエネルギー比に基づいてピークスペクトルを検出する。該音声処理装置は、ピークスペクトルの重心周波数に基づき、倍音関係が成り立つ重心周波数の個数に応じてノイズのスペクトルを決定し、ノイズのスペクトルを抑制する。
特開1999−231897号公報 特開2012−133346号公報
特許文献1に開示される音声認識装置では、音声区間の直前の信号のスペクトルを音声区間全域から差し引くため、音声区間のノイズは減衰させることができるが、無音区間のノイズを減衰させることができない。通信機においては、音声区間だけでなく、例えばトーン信号の送受信が行われる無音区間においても、ノイズを減衰させる必要がある。また特許文献1に開示される音声認識装置は、ノイズの特性が変化した場合に、ノイズを十分に減衰させることができない、または、音声を誤って減衰させてしまう可能性がある。該音声認識装置は、信号の振幅が閾値を超えたところを音声区間として検出するため、ノイズが多くなるにつれて、誤動作の可能性が高くなる。
特許文献2に開示される音声処理装置は、ピークスペクトル算出処理およびノイズスペクトルの決定処理が煩雑であり、処理に時間を要するという課題がある。該音声処理装置は、倍音構造でない信号、および倍音構造を有するが周期性のない信号をノイズとして判断する。そのため、該音声処理装置は、周期性のない無声音、例えば、歯擦音をノイズと判断してしまうことがある。
本発明は上述の事情に鑑みてなされたものであり、ノイズの変化に応じてノイズを減衰させるノイズ抑圧の処理を簡易化することが目的である。
上記目的を達成するため、本発明の第1の観点に係るノイズ抑圧回路は、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部と、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部と、
前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部と、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部と、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部と、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部と、
前記周波数領域データに前記スペクトルゲインを乗算する乗算器と、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部と、
を備え
前記第2のスペクトル算出部は、前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルの前記ノイズ指標に応じた係数で重み付けされた移動平均値を、前記ノイズの振幅スペクトルとして算出し、
前記ノイズ指標に応じた係数は、前記ノイズ指標と指標調節係数の乗算値であって、
前記入力信号の振幅スペクトルが直前の前記フレームにおける前記ノイズの振幅スペクトル以上である場合の前記指標調節係数は、前記入力信号の振幅スペクトルが前記直前のフレームにおける前記ノイズの振幅スペクトル未満である場合の前記指標調節係数より小さい
好ましくは、前記入力信号の振幅スペクトルの前記ノイズ指標に応じた係数で重み付けされた移動平均値は、前記ノイズ指標に応じた係数に基づく一次の低域通過フィルタを用いて算出される。
本発明の第2の観点に係るノイズ抑圧回路は、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部と、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部と、
前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部と、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部と、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部と、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部と、
前記周波数領域データに前記スペクトルゲインを乗算する乗算器と、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部と、
を備え、
前記分散指標は、前記入力信号の振幅スペクトルと基準値との差の絶対値である偏差の移動平均値である。
好ましくは、前記基準値は、前記入力信号の振幅スペクトルの移動平均値である。
好ましくは、前記分散指標は、第1係数に基づく一次の低域通過フィルタを用いて算出され、
前記基準値は、第2係数に基づく一次の低域通過フィルタを用いて算出され、
前記偏差が、直前の前記フレームにおける前記偏差以上である場合、前記第1係数は前記第2係数より大きく、
前記偏差が、前記直前のフレームにおける前記偏差未満である場合、前記第1係数は前記第2係数より小さい。
好ましくは、前記ノイズ指標は、前記分散指標を前記基準値で除算した値を変数とする関数である。
本発明の第3の観点に係るノイズ抑圧回路は、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部と、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部と、
前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部と、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部と、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部と、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部と、
前記周波数領域データに前記スペクトルゲインを乗算する乗算器と、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部と、
を備え、
前記ゲイン算出部は、前記スペクトルゲインに0以上、1以下のゲイン調節係数を乗算して、1を加算した結果から、前記ゲイン調節係数を減算することで、前記スペクトルゲインを調節し、
前記乗算器は、前記周波数領域データに、前記調節された前記スペクトルゲインを乗算する。
本発明の第4の観点に係るノイズ抑圧方法は、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成し、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出し、
前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出し、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出し、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルの前記ノイズ指標に応じた係数で重み付けされた移動平均値を、前記ノイズの振幅スペクトルとして算出し、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出し、
前記周波数領域データに前記スペクトルゲインを乗算し、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成し、
前記ノイズ指標に応じた係数は、前記ノイズ指標と指標調節係数の乗算値であって、
前記入力信号の振幅スペクトルが直前の前記フレームにおける前記ノイズの振幅スペクトル以上である場合の前記指標調節係数は、前記入力信号の振幅スペクトルが前記直前のフレームにおける前記ノイズの振幅スペクトル未満である場合の前記指標調節係数より小さい。
本発明の第5の観点に係るノイズ抑圧方法は、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成し、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出し、
前記周波数成分ごとに、前記入力信号の振幅スペクトルと基準値との差の絶対値である偏差の移動平均値を、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標として算出し、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出し、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出し、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出し、
前記周波数領域データに前記スペクトルゲインを乗算し、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成する。
本発明の第6の観点に係るノイズ抑圧方法は、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成し、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出し、
前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出し、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出し、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出し、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出し、
前記スペクトルゲインに0以上、1以下のゲイン調節係数を乗算して、1を加算した結果から、前記ゲイン調節係数を減算することで、前記スペクトルゲインを調節し、
前記周波数領域データに前記調節された前記スペクトルゲインを乗算し、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成する。
本発明の第7の観点に係るプログラムは、
コンピュータを、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部、
前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部、
前記周波数領域データに前記スペクトルゲインを乗算する乗算器、ならびに、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部、
として機能させ、
前記第2のスペクトル算出部は、前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルの前記ノイズ指標に応じた係数で重み付けされた移動平均値を、前記ノイズの振幅スペクトルとして算出し、
前記ノイズ指標に応じた係数は、前記ノイズ指標と指標調節係数の乗算値であって、
前記入力信号の振幅スペクトルが直前の前記フレームにおける前記ノイズの振幅スペクトル以上である場合の前記指標調節係数は、前記入力信号の振幅スペクトルが前記直前のフレームにおける前記ノイズの振幅スペクトル未満である場合の前記指標調節係数より小さい。
本発明の第8の観点に係るプログラムは、
コンピュータを、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部、
前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部、
前記周波数領域データに前記スペクトルゲインを乗算する乗算器、ならびに、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部、
として機能させ、
前記分散指標は、前記入力信号の振幅スペクトルと基準値との差の絶対値である偏差の移動平均値である。
本発明の第の観点に係るプログラムは、
コンピュータを、
入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部、
前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部、
前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部、
前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部、
前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部、
前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部、
前記周波数領域データに前記スペクトルゲインを乗算する乗算器、ならびに、
前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部、
として機能させ
前記ゲイン算出部は、前記スペクトルゲインに0以上、1以下のゲイン調節係数を乗算して、1を加算した結果から、前記ゲイン調節係数を減算することで、前記スペクトルゲインを調節し、
前記乗算器は、前記周波数領域データに、前記調節された前記スペクトルゲインを乗算する
本発明によれば、入力信号の振幅スペクトルおよび入力信号に含まれるノイズの程度を示すノイズ指標に基づいて、ノイズの振幅スペクトルを算出することで、ノイズの変化に応じてノイズを減衰させるノイズ抑圧の処理を簡易化することが可能である。
本発明の実施の形態に係る通信機の構成例を示すブロック図 実施の形態に係るノイズ抑圧回路の構成例を示すブロック図 実施の形態に係るLPFの構成例を示すブロック図 実施の形態における正規化された分散指標の例を示す図 実施の形態における正規化された分散指標の例を示す図 実施の形態における正規化された分散指標の例を示す図 実施の形態におけるノイズ指標の例を示す図 実施の形態におけるスペクトルゲインの調節例を示す図 実施の形態に係るノイズ抑圧回路が行うノイズ抑圧処理の動作の一例を示すフローチャート 本発明の実施の形態に係るノイズ抑圧回路のハードウェアの構成例を示す図
以下、本発明の実施の形態について図面を参照して詳細に説明する。なお図中、同一または同等の部分には同一の符号を付す。
図1は、本発明の実施の形態に係る通信機の構成例を示すブロック図である。通信機1は、周囲の音を集音して音声信号を生成する入力部2、入力部2が生成した音声信号に対して、ノイズを低減する処理を行うノイズ抑圧回路3、ノイズ抑圧回路3の出力信号に基づいて送信信号を生成する送信処理部4を備える。通信機1は、送信と受信とを切り替える送受信切替部5を備える。通信機1は、アンテナ6、アンテナ6で受信した信号を復調して受信信号を生成する受信処理部7、受信処理部7が生成した受信信号に対して、ノイズを低減する処理を行うノイズ抑圧回路8、およびノイズ抑圧回路8の出力信号に基づいて音声を出力する出力部9を備える。
入力部2は、マイク21、およびマイク21の出力に対して信号処理を行って音声信号を生成する入力処理部22を備える。マイク21は、周囲の音声を集音し、電気信号に変換して出力する。入力処理部22は、増幅器、LPF(Low-Pass Filter:低域通過フィルタ)等を有する。入力処理部22は、マイク21が出力する電気信号に対し、増幅、高周波成分の除去等の信号処理を行い、音声信号を生成する。送信処理部4は、プリエンファシス回路41、変調部42、および周波数変換部43を備える。プリエンファシス回路41は、ノイズ抑圧回路3の出力信号に対し該出力信号の周波数に比例したレベルの信号を出力、すなわち周波数微分を行ったのち、受信側でのS/N(Signal-to-Noise:信号対雑音)比を改善するために、該出力信号の高周波成分の相対強度を予め増大させる処理を行う。変調部42は、図示しない局部発振器が出力する搬送波を、プリエンファシス回路41が出力する信号に応じて変調する。変調方式は、例えば、周波数変調、SSB(Single Side Band:単側波帯)変調等である。周波数変換部43は、変調部42で変調された搬送波の周波数をRF(Radio Frequency:無線周波数)帯に変換して、送信信号を生成する。送信信号は、送受信切替部5を介してアンテナ6に送られ、アンテナ6から送信される。
受信処理部7は、周波数変換部71、復調部72、およびディエンファシス回路73を備える。周波数変換部71は、送受信切替部5を介して入力されるアンテナ6で受信した信号の周波数をIF(Intermediate Frequency:中間周波数)帯に変換する。復調部72は、IF帯に周波数変換された信号に対して、復調処理を行う。ディエンファシス回路73は、復調部72で復調された信号の高周波成分を減衰させて、復調信号を生成する。出力部9は、復調信号に対して信号処理を行う出力処理部91、および出力処理部91で信号処理された復調信号から音声を出力するスピーカ92を備える。出力処理部91は、例えば、増幅器、LPF等を有する。出力処理部91は、復調信号に対し、増幅、高周波成分除去等の信号処理を行う。
通信機1の各部は、コントローラ10によって制御される。コントローラ10は、CPU(Central Processing Unit:中央処理装置)11、RAM(Random Access Memory)13、およびROM(Read-Only Memory)14を備える。複雑化を避け、理解を容易にするために、コントローラ10から各部への信号線が省略されている。コントローラ10は通信機1の各部にI/O(Input/Output)12を介して接続しており、それらの処理の開始、終了、処理内容の制御を行う。ROM14は、コントローラ10が通信機1の動作を制御するための制御プログラムを格納する。コントローラ10は、制御プログラムに基づいて、通信機1の各部を制御する。
図2は、実施の形態に係るノイズ抑圧回路の構成例を示すブロック図である。ノイズ抑圧回路3,8の構成および動作は同じであるため、ノイズ抑圧回路3の構成について説明する。ノイズ抑圧回路3は、入力信号をフレームとして切り出し、フレームごとに入力信号のFFT(Fast Fourier Transform:高速フーリエ変換)を行って、周波数領域データを生成するFFT部31を備える。ノイズ抑圧回路3において、入力信号は、入力処理部22が生成した音声信号である。ノイズ抑圧回路3は、周波数領域データから、周波数成分ごとの、入力信号の振幅スペクトルを算出する第1のスペクトル算出部32、直近の複数のフレームにおける振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部33、および分散指標に基づいて、入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部34を備える。ノイズ抑圧回路3は、さらに、ノイズの振幅スペクトルを算出する第2のスペクトル算出部35、ノイズを抑制するスペクトルゲインを算出するゲイン算出部36、乗算器37、および乗算器37でスペクトルゲインが乗算された周波数領域データのIFFT(Inverse Fast Fourier Transform:逆高速フーリエ変換)を行って出力信号を生成するIFFT部38を備える。
FFT部31は、入力信号x(t)に窓関数を乗算することで、入力信号をフレームとして切り出す。FFT部31は、フレームごとに入力信号x(t)のFFTを行って周波数領域データX(f)を生成する。X(f)は、複素数である。X(f)のk番目の要素は、実部Re[k]および虚部Im[k]を用いて、下記(1)式で表される。下記(1)式中におけるjは虚数単位である。kは整数であり、FFTサイズをNとすると、0≦k≦N−1である。サンプリング周波数をfとすると、X(f)のk番目の要素に対応する、k番目の周波数成分f[k]は、下記(2)式で表される。第1のスペクトル算出部32は、周波数領域データX(f)から、周波数成分f[k]ごとの、入力信号の振幅スペクトル|X|を算出する。振幅スペクトル|X|は、下記(3)式で表される。入力信号の振幅スペクトル|X|は、ノイズ抑圧回路3が有する、図示しないメモリに記憶される。
Figure 0006892598
Figure 0006892598
Figure 0006892598
分散指標算出部33は、周波数成分f[k]ごとに、直近の複数のフレームにおける入力信号の振幅スペクトル|X|のばらつきの程度を示す分散指標を算出する。分散指標として平均二乗偏差を用いることができるが、処理を簡易化するために、例えば、直近の複数のフレームにおける、入力信号の振幅スペクトルと基準値との差である偏差Dの移動平均値を分散指標としてもよい。基準値は、直近の複数のフレームにおける入力信号の振幅スペクトルの移動平均値、固定値等である。
偏差Dの移動平均値の算出に用いられるフレームの数および基準値の算出に用いられるフレームの数は任意に定めることができる。偏差Dの移動平均値の算出に用いられるフレームの数と、基準値の算出に用いられるフレームの数は同じでもよいし、異なってもよい。本実施の形態では、分散指標算出部33は、最初のフレームから最新のフレームまでの複数のフレームにおける、偏差Dの移動平均値および基準値を算出する。また基準値は、上記複数のフレームにおける入力信号の振幅スペクトル|X|の移動平均値である。偏差Dは、下記(4)式で表され、分散指標Vは、下記(5)式で表される。下記(4),(5)式において、|X|avgは、基準値であり、最初のフレームから最新のフレームまでの複数のフレームにおける、入力信号の振幅スペクトル|X|の移動平均値である。基準値|X|avg、偏差D、および分散指標Vは、ノイズ抑圧回路3が有する、図示しないメモリに記憶される。
Figure 0006892598
Figure 0006892598
最初のフレームとは、例えば、通信機1の起動後、最初にノイズ抑圧回路3に取り込まれた入力信号から生成された最初のフレームである。最初のフレームについて、分散指標算出部33は、入力信号の振幅スペクトル|X|を算出する。その後、分散指標算出部33は、|X|avgの初期値として、最初のフレームに基づいて算出した入力信号の振幅スペクトル|X|を設定する。また分散指標算出部33は、偏差Dおよび分散指標Vの初期値として、0を設定する。
通信機1は、送信側と受信側で共通のノイズ抑圧回路3を備えてもよい。その場合、上述の最初のフレームに加え、送受信の切り替え後、最初にノイズ抑圧回路3に取り込まれた入力信号から生成された最初のフレームも、上述の最初のフレームとみなすことができる。また通信機1の操作によって、ノイズ抑圧回路3の動作のオンとオフを切り替えられる場合、通信機1の起動後、ノイズ抑圧回路3がオフの状態が一定時間続いた後に、オンとなった場合、オンとなった後、最初にノイズ抑圧回路3に取り込まれた入力信号から生成された最初のフレームも、上述の最初のフレームとみなすことができる。
移動平均値は、例えば、単純移動平均、加重移動平均、指数移動平均によって算出される。分散指標Vは、第1係数に基づく、直流ゲインが一倍の一次のLPFを用いて算出することができる。直流ゲインが一倍の一次のLPFは、無限長の指数移動平均を算出するとみなすことができる。直流ゲインが一倍の一次のLPFを用いた分散指標Vの算出処理は、平均二乗偏差である分散指標の算出処理より簡易である。
図3は、実施の形態に係るLPFの構成例を示すブロック図である。LPF39は、フィルタ係数αを乗算する乗算器391、加算器392、遅延素子393、および(1−α)を乗算する乗算器394を備える。乗算器391、および加算器392は直列に接続される。LPF出力は、遅延素子393および乗算器394を介して、加算器392に帰還される。加算器392は、乗算器391,394の出力を加算した結果を出力する。LPF出力から、分散指標Vが得られる。図3に示すLPF39において、データバッファは1つでよく、処理回路の構造の簡易化が可能である。偏差Dについても同様に、第2係数に基づく、直流ゲインが一倍の一次のLPFを用いて算出することができる。フィルタ係数をαとすると、図3に示すLPF39の伝達関数H(z)は、下記(6)式で表される。
Figure 0006892598
第1係数および第2係数の大小関係を、偏差Dの変化に応じて変化させてもよい。m番目のフレームに対して、分散指標Vを算出する場合を例にして説明する。ノイズ抑圧回路3が有するメモリには、m−1番目のフレームに基づく、入力信号の振幅スペクトル|X|[m−1]、基準値|X|avg[m−1]、偏差D[m−1]、および分散指標V[m−1]が記憶されている。分散指標算出部33は、入力信号の振幅スペクトル|X|[m]を算出し、入力信号の振幅スペクトル|X|[m]および直前のフレームにおける基準値|X|avg[m−1]から、基準値|X|avg[m]を算出する。分散指標算出部33は、入力信号の振幅スペクトル|X|[m]および基準値|X|avg[m]から、偏差D[m]を算出する。
偏差D[m]が直前のフレームにおける偏差D[m−1]以上である場合、第2係数より大きい第1係数が設定される。分散指標算出部33は、第2係数より大きい第1係数に基づくLPF39を用いて、偏差D[m]および分散指標V[m−1]から、分散指標V[m]を算出する。また偏差D[m]が直前のフレームにおける偏差D[m−1]未満である場合、第2係数より小さい第1係数が設定される。分散指標算出部33は、第2係数より小さい第1係数に基づくLPF39を用いて、偏差D[m]および分散指標V[m−1]から、分散指標V[m]を算出する。第1係数が第2係数より大きく設定されることで、分散指標Vは、変化により速く追従する。一方、第1係数が第2係数より小さく設定されることで、分散指標Vの急激な変化が抑制される。
ノイズ指標算出部34は、分散指標Vに基づいて、入力信号に含まれるノイズの程度を示すノイズ指標を算出する。ノイズ指標は、例えば、分散指標Vを基準値で除算した値を変数とする関数である。本実施の形態において、分散指標Vを基準値で除算した値である、正規化された分散指標Vnormは、下記(7)式で表される。
Figure 0006892598
正規化された分散指標Vnormが取り得る値は、入力信号の特性に応じて変化する。図4から図6は、実施の形態における正規化された分散指標の例を示す図である。図4から図6において、横軸は、正規化された分散指標Vnormであり、縦軸は、正規化された分散指標Vnormの出現回数である。図4の例では、入力信号は、正規分布のノイズである。入力信号が正規分布のノイズである場合、正規化された分散指標が取り得る値の平均値は0.42である。図4の例において、正規化された分散指標Vnormの値が1に近づくにつれて、出現回数は、急激に減少する。正規化された分散指標Vnormの値が1以上である場合の出現回数は、正規化された分散指標Vnormの値が1未満である場合の出現回数と比べて、極めて少ない。
図5の例では、入力信号は、音声信号である。入力信号が音声信号である場合、正規化された分散指標が取り得る値の平均値は1.37である。図5の例において、正規化された分散指標Vnormの値が1に近づくにつれて、出現回数は増大する。すなわち、入力信号が音声信号である場合、入力信号の振幅スペクトルのばらつきは、入力信号がノイズである場合よりも大きい。
図6の例では、入力信号は、1kHzのトーン信号である。トーン信号の振幅スペクトルは、音声信号およびノイズと比べると、極めて安定している。図6の例では、正規化された分散指標Vnormが取り得る値の平均値は0.0であり、入力信号の振幅スペクトルにばらつきがないとみなせる。
本実施の形態では、正規化された分散指標Vnormに基づいて、入力信号に含まれるノイズの程度を示すノイズ指標を算出する。ノイズ指標yは、正規化された分散指標Vnormを変数xとして、例えば、下記(8)式で表される。図7は、実施の形態におけるノイズ指標の例を示す図である。図7において、横軸がx、縦軸がyである。xが定められた範囲にある場合に、ノイズ指標yが0以上、1以下の値を取るように、係数a,aの値を定めることができる。図7において、細い実線で示されるノイズ指標yの関数において、a=8、a=−16である。図7において、太い実線で示されるノイズ指標yの関数において、a=4、a=−4である。図7において、点線で示されるノイズ指標yの関数において、a=2.6667、a=−1.7778である。図7において、破線で示されるノイズ指標yの関数において、a=2、a=−1である。
Figure 0006892598
第2のスペクトル算出部35は、周波数成分ごとに、入力信号の振幅スペクトルおよびノイズ指標yに基づいて、ノイズの振幅スペクトルを算出する。第2のスペクトル算出部35は、周波数成分ごとに、直近の複数のフレームにおける入力信号の振幅スペクトルのノイズ指標yに応じた係数で重み付けされた移動平均値を、ノイズの振幅スペクトルとして算出する。本実施の形態においては、第2のスペクトル算出部35は、最初のフレームから最新のフレームまでの複数のフレームに基づいて、ノイズの振幅スペクトルを算出する。ノイズの振幅スペクトル|Y|は、分散指標Vおよび偏差Dと同様に、ノイズ指標yに応じた係数に基づく、直流ゲインが一倍の一次のLPFを用いて算出することができる。ノイズの振幅スペクトル|Y|は、ノイズ抑圧回路3が有する、図示しないメモリに記憶される。
ノイズ指標yの関数において、a=4、a=−4である場合、x≦0の範囲およびx≧1の範囲において、y=0である。y=0の場合、図3に示すLPF39の係数が0になるため、ノイズの振幅スペクトル|Y|は、直前のフレームにおけるノイズの振幅スペクトル|Y|から変化しない。すなわち、x≦0の範囲およびx≧1の範囲において、入力信号はノイズでないとみなせるため、該入力信号の振幅スペクトルは、ノイズの振幅スペクトルの算出には用いられない。
一方、上述の例において、0<x<1の範囲において、0<y≦1である。図3に示すLPF39の係数は、0より大きく、1以下の値である。ノイズ指標で重み付けされた入力信号の振幅スペクトル|X|が、ノイズの振幅スペクトル|Y|の算出に用いられるため、入力信号に含まれるノイズの程度に応じて、ノイズの振幅スペクトル|Y|を算出することが可能である。すなわち、第2のスペクトル算出部35が算出するノイズの振幅スペクトル|Y|は、入力信号に含まれるノイズの変化に追従する。ノイズ指標として、正規化された分散指標Vnormを変数とする関数を用いることで、信号の振幅に基づいてノイズの有無を判定する場合よりも、入力信号に含まれるノイズの程度を精度よく判定することが可能である。
本実施の形態においては、ノイズ指標に応じた係数は、ノイズ指標と指標調節係数の乗算値である。入力信号の振幅スペクトル|X|が直前のフレームにおけるノイズの振幅スペクトル|Y|以上である場合の指標調節係数は、入力信号の振幅スペクトル|X|が直前のフレームにおけるノイズの振幅スペクトル|Y|未満である場合の指標調節係数より小さい。
m番目のフレームに対して、ノイズの振幅スペクトル|Y|を算出する場合を例にして説明する。ノイズ抑圧回路3が有するメモリには、m−1番目のフレームに基づく、ノイズの振幅スペクトル|Y|[m−1]が記憶されている。入力信号の振幅スペクトル|X|[m]が、直前のフレームにおけるノイズの振幅スペクトル|Y|[m−1]以上である場合、指標調節係数bが設定される。第2のスペクトル算出部35は、ノイズ指標と指標調節係数bとの乗算値に基づくLPF39を用いて、入力信号の振幅スペクトル|X|[m]およびノイズの振幅スペクトル|Y|[m−1]から、ノイズの振幅スペクトル|Y|[m]を算出する。入力信号の振幅スペクトル|X|[m]が、直前のフレームにおけるノイズの振幅スペクトル|Y|[m−1]未満である場合、指標調節係数bが設定される。第2のスペクトル算出部35は、ノイズ指標と指標調節係数bとの乗算値に基づくLPF39を用いて、入力信号の振幅スペクトル|X|[m]およびノイズの振幅スペクトル|Y|[m−1]から、ノイズの振幅スペクトル|Y|[m]を算出する。なお指標調節係数bは、指標調節係数bより小さい。
上述のように指標調節係数を設定することで、入力信号の振幅スペクトル|X|が直前のフレームにおけるノイズの振幅スペクトル|Y|以上である場合は、ノイズの振幅スペクトル|Y|の急激な変化が抑制される。一方、入力信号の振幅スペクトル|X|が直近のノイズの振幅スペクトル|Y|未満である場合は、ノイズの振幅スペクトル|Y|は、変化により速く追従する。
ゲイン算出部36は、入力信号の振幅スペクトル|X|およびノイズの振幅スペクトル|Y|に基づいて、周波数成分ごとに、ノイズを抑制するスペクトルゲインを算出する。事後SNR(Signal-to-Noise Ratio:信号対雑音比)γは、下記(9)式で表される。
Figure 0006892598
m番目のフレームに対して、スペクトルゲインを算出する場合、事前SNRξは、例えば、Decision Directed法を用いて、下記(10)式で表される。周波数領域データX[m]に含まれる音声信号をS[m]とし、ノイズをY[m]とすると、X[m]=S[m]+Y[m]である。下記(10)式において、βは直前のフレームを利用する割合である。G[m−1]は、直前のフレーム、すなわちm−1番目のフレームに対して算出されたスペクトルゲインである。σは、音声信号の振幅スペクトルの分散であり、σは、ノイズの振幅スペクトルの分散である。
Figure 0006892598
音声信号の振幅スペクトルの確率密度分布形状は、例えば、下記(11)式で表されるνで決定される。kは上述の例と同様に、整数であり、FFTサイズをNとすると、0≦k≦N−1である。
Figure 0006892598
ゲイン算出部36は、下記(12)式によって、スペクトルゲインGを算出する。下記(12)式において、μは、音声信号の振幅スペクトルの分布形状を決定するパラメータである。
Figure 0006892598
ゲイン算出部36は、スペクトルゲインGに0以上、1以下のゲイン調節係数を乗算して、1を加算した結果から、ゲイン調節係数を減算することで、スペクトルゲインを調節してもよい。調節されたスペクトルゲインG’は、下記(13)式で表される。下記(13)式において、DEPTHは、ゲイン調節係数であり、0以上、1以下の値である。ゲイン調節係数を用いてスペクトルゲインGを調節することで、ノイズ抑圧処理を反映させる程度を調節することが可能である。
Figure 0006892598
上記演算は、Q15フォーマットで行われるため、DEPTHが取り得る値の最大値は0x7FFFであり、最小値は0x0001である。図8は、実施の形態におけるスペクトルゲインの調節例を示す図である。図8において、横軸は、スペクトルゲインG、縦軸は、調節されたスペクトルゲインG’である。図8において、細い実線は、DEPTH=0.25の場合の調節されたスペクトルゲインG’を示す。太い実線は、DEPTH=0.5の場合の調節されたスペクトルゲインG’を示す。点線は、DEPTH=0.75の場合の調節されたスペクトルゲインG’を示す。破線は、DEPTHが上記最大値である場合の調節されたスペクトルゲインG’を示す。
乗算器37は、周波数領域データの各要素に、周波数成分ごとに算出されたスペクトルゲインを乗算し、IFFT部38に出力する。ゲイン算出部36がゲイン調節係数に基づいてスペクトルゲインGを調節した場合は、乗算器37は、周波数領域データの各要素に、調節されたスペクトルゲインG’を乗算する。IFFT部38は、乗算器37でスペクトルゲインが乗算された周波数領域データのIFFT(Inverse Fast Fourier Transform:逆高速フーリエ変換)を行って、出力信号を生成する。
図9は、実施の形態に係るノイズ抑圧回路が行うノイズ抑圧動作の一例を示すフローチャートである。ノイズ抑圧回路3に、信号が入力されると、FFT部31は、入力信号をフレームとして切り出し、フレームごとに入力信号のFFTを行って、周波数領域データを生成する(ステップS11)。第1のスペクトル算出部32は、周波数領域データから、周波数成分ごとの、入力信号の振幅スペクトルを算出する(ステップS12)。最初のフレームの場合(ステップS13;Y)、分散指標算出部33は、初期値を設定する(ステップS14)。最初のフレームでない場合(ステップS13;N)、ステップS14の処理は行わずに、ステップS15に進む。分散指標算出部33は、最初のフレームから最新のフレームまでの複数のフレームにおける、偏差Dの移動平均値を分散指標Vとして算出する(ステップS15)。
ノイズ指標算出部34は、分散指標Vを基準値で除算した値を変数とする関数をノイズ指標として算出する(ステップS16)。第2のスペクトル算出部35は、周波数成分ごとに、入力信号の振幅スペクトルおよびノイズ指標に基づいて、ノイズの振幅スペクトルを算出する(ステップS17)。ゲイン算出部36は、入力信号の振幅スペクトルおよびノイズの振幅スペクトルに基づいて、周波数成分ごとに、ノイズを抑制するスペクトルゲインを算出する(ステップS18)。乗算器37は、周波数領域データの各要素に、周波数成分ごとに算出されたスペクトルゲインを乗算する(ステップS19)。IFFT部38は、乗算器37でスペクトルゲインが乗算された周波数領域データのIFFTを行って、出力信号を生成する(ステップS20)。ノイズ抑圧回路3は、各フレームに対して、上述の処理を行う。
以上説明したとおり、本実施の形態に係るノイズ抑圧回路3,8によれば、入力信号の振幅スペクトルおよびノイズ指標に基づいて、ノイズの振幅スペクトルを算出することで、ノイズの変化に応じてノイズを減衰させることができる。またノイズの振幅スペクトルを算出する際に、例えば、連続する複数のスペクトルのエネルギーの総和を順次算出する処理は必要ないため、本実施の形態に係るノイズ抑圧回路3,8によれば、ノイズ抑圧の処理を簡易化することが可能である。
図10は、本発明の実施の形態に係るノイズ抑圧回路のハードウェアの構成例を示す図である。ノイズ抑圧回路3,8は、回路を制御するハードウェア構成としてプロセッサ111、メモリ112、およびインターフェース113を備える。これらの装置の各機能は、プロセッサ111がメモリ112に記憶されたプログラムを実行することにより実現される。インターフェース113は、ノイズ抑圧回路3,8と、入力部2、送信処理部4、受信処理部7、出力部9、およびコントローラ10とを接続し、通信を確立させる。インターフェース113は、必要に応じて複数の種類のインターフェースから構成されてもよい。図10では、プロセッサ111およびメモリ112をそれぞれ1つで構成する例を示しているが、複数のプロセッサ111および複数のメモリ112が連携して各機能を実行してもよい。
プロセッサ111、メモリ112、およびインターフェース113で構成される制御処理を行う中心となる部分は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。たとえば、上述の動作を実行するためのコンピュータプログラムを、コンピュータが読み取り可能な記録媒体(フレキシブルディスク、CD−ROM、DVD−ROMなど)に格納して配布し、該コンピュータプログラムをコンピュータにインストールすることにより、上述の処理を実行するノイズ抑圧回路3,8を構成してもよい。また、通信ネットワーク上のサーバ装置が有する記憶装置に上記コンピュータプログラムを格納しておき、通常のコンピュータシステムがダウンロードすることでノイズ抑圧回路3,8を構成してもよい。
また、ノイズ抑圧回路3,8の機能を、OS(オペレーティングシステム)とアプリケーションプログラムの分担、またはOSとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。
また、搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して配信することも可能である。たとえば、通信ネットワーク上の掲示板(BBS:Bulletin Board System)に上記コンピュータプログラムを掲示し、通信ネットワークを介して上記コンピュータプログラムを配信してもよい。そして、このコンピュータプログラムを起動し、OSの制御下で、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行できるように構成してもよい。
本発明の実施の形態は上述の実施の形態に限られない。上述の実施の形態における回路構成は一例である。通信機1の構成は、上述の例に限られず、送信機または受信機でもよい。ノイズ抑圧回路3,8は、DSP(Digital Signal Processor)によって実現することが可能である。ノイズ抑圧回路3,8は、通信機1だけでなく、例えば、オーディオ録音装置、オーディオ再生装置、拡声器等に搭載することができる。
1 通信機
2 入力部
3,8 ノイズ抑圧回路
4 送信処理部
5 送受信切替部
6 アンテナ
7 受信処理部
9 出力部
10 コントローラ
11 CPU
12 I/O
13 RAM
14 ROM
21 マイク
22 入力処理部
31 FFT部
32 第1のスペクトル算出部
33 分散指標算出部
34 ノイズ指標算出部
35 第2のスペクトル算出部
36 ゲイン算出部
37,391,394 乗算器
38 IFFT部
39 LPF
41 プリエンファシス回路
42 変調部
43,71 周波数変換部
72 復調部
73 ディエンファシス回路
91 出力処理部
92 スピーカ
111 プロセッサ
112 メモリ
113 インターフェース
392 加算器
393 遅延素子

Claims (13)

  1. 入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部と、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部と、
    前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部と、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部と、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部と、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部と、
    前記周波数領域データに前記スペクトルゲインを乗算する乗算器と、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部と、
    を備え
    前記第2のスペクトル算出部は、前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルの前記ノイズ指標に応じた係数で重み付けされた移動平均値を、前記ノイズの振幅スペクトルとして算出し、
    前記ノイズ指標に応じた係数は、前記ノイズ指標と指標調節係数の乗算値であって、
    前記入力信号の振幅スペクトルが直前の前記フレームにおける前記ノイズの振幅スペクトル以上である場合の前記指標調節係数は、前記入力信号の振幅スペクトルが前記直前のフレームにおける前記ノイズの振幅スペクトル未満である場合の前記指標調節係数より小さい、
    イズ抑圧回路。
  2. 前記入力信号の振幅スペクトルの前記ノイズ指標に応じた係数で重み付けされた移動平均値は、前記ノイズ指標に応じた係数に基づく一次の低域通過フィルタを用いて算出される、
    請求項に記載のノイズ抑圧回路。
  3. 入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部と、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部と、
    前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部と、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部と、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部と、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部と、
    前記周波数領域データに前記スペクトルゲインを乗算する乗算器と、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部と、
    を備え、
    前記分散指標は、前記入力信号の振幅スペクトルと基準値との差の絶対値である偏差の移動平均値である、
    イズ抑圧回路。
  4. 前記基準値は、前記入力信号の振幅スペクトルの移動平均値である、
    請求項に記載のノイズ抑圧回路。
  5. 前記分散指標は、第1係数に基づく一次の低域通過フィルタを用いて算出され、
    前記基準値は、第2係数に基づく一次の低域通過フィルタを用いて算出され、
    前記偏差が、直前の前記フレームにおける前記偏差以上である場合、前記第1係数は前記第2係数より大きく、
    前記偏差が、前記直前のフレームにおける前記偏差未満である場合、前記第1係数は前記第2係数より小さい、
    請求項に記載のノイズ抑圧回路。
  6. 前記ノイズ指標は、前記分散指標を前記基準値で除算した値を変数とする関数である、
    請求項からのいずれか1項に記載のノイズ抑圧回路。
  7. 入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部と、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部と、
    前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部と、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部と、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部と、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部と、
    前記周波数領域データに前記スペクトルゲインを乗算する乗算器と、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部と、
    を備え、
    前記ゲイン算出部は、前記スペクトルゲインに0以上、1以下のゲイン調節係数を乗算して、1を加算した結果から、前記ゲイン調節係数を減算することで、前記スペクトルゲインを調節し、
    前記乗算器は、前記周波数領域データに、前記調節された前記スペクトルゲインを乗算する、
    イズ抑圧回路。
  8. 入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成し、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出し、
    前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出し、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出し、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルの前記ノイズ指標に応じた係数で重み付けされた移動平均値を、前記ノイズの振幅スペクトルとして算出し、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出し、
    前記周波数領域データに前記スペクトルゲインを乗算し、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成
    前記ノイズ指標に応じた係数は、前記ノイズ指標と指標調節係数の乗算値であって、
    前記入力信号の振幅スペクトルが直前の前記フレームにおける前記ノイズの振幅スペクトル以上である場合の前記指標調節係数は、前記入力信号の振幅スペクトルが前記直前のフレームにおける前記ノイズの振幅スペクトル未満である場合の前記指標調節係数より小さい、
    ノイズ抑圧方法。
  9. 入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成し、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出し、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルと基準値との差の絶対値である偏差の移動平均値を、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標として算出し、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出し、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出し、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出し、
    前記周波数領域データに前記スペクトルゲインを乗算し、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成する、
    ノイズ抑圧方法。
  10. 入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成し、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出し、
    前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出し、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出し、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出し、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出し、
    前記スペクトルゲインに0以上、1以下のゲイン調節係数を乗算して、1を加算した結果から、前記ゲイン調節係数を減算することで、前記スペクトルゲインを調節し、
    前記周波数領域データに前記調節された前記スペクトルゲインを乗算し、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成する、
    ノイズ抑圧方法。
  11. コンピュータを、
    入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部、
    前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部、
    前記周波数領域データに前記スペクトルゲインを乗算する乗算器、ならびに、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部、
    として機能させ
    前記第2のスペクトル算出部は、前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルの前記ノイズ指標に応じた係数で重み付けされた移動平均値を、前記ノイズの振幅スペクトルとして算出し、
    前記ノイズ指標に応じた係数は、前記ノイズ指標と指標調節係数の乗算値であって、
    前記入力信号の振幅スペクトルが直前の前記フレームにおける前記ノイズの振幅スペクトル以上である場合の前記指標調節係数は、前記入力信号の振幅スペクトルが前記直前のフレームにおける前記ノイズの振幅スペクトル未満である場合の前記指標調節係数より小さい、
    ログラム。
  12. コンピュータを、
    入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部、
    前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部、
    前記周波数領域データに前記スペクトルゲインを乗算する乗算器、ならびに、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部、
    として機能させ、
    前記分散指標は、前記入力信号の振幅スペクトルと基準値との差の絶対値である偏差の移動平均値である、
    プログラム。
  13. コンピュータを、
    入力信号をフレームとして切り出し、前記フレームごとに前記入力信号の高速フーリエ変換を行って、周波数領域データを生成するFFT部、
    前記周波数領域データから、周波数成分ごとの、前記入力信号の振幅スペクトルを算出する第1のスペクトル算出部、
    前記周波数成分ごとに、直近の複数の前記フレームにおける前記入力信号の振幅スペクトルのばらつきの程度を示す分散指標を算出する分散指標算出部、
    前記分散指標に基づいて、前記入力信号に含まれるノイズの程度を示すノイズ指標を算出するノイズ指標算出部、
    前記周波数成分ごとに、前記入力信号の振幅スペクトルおよび前記ノイズ指標に基づいて、前記ノイズの振幅スペクトルを算出する第2のスペクトル算出部、
    前記入力信号の振幅スペクトルおよび前記ノイズの振幅スペクトルに基づいて、前記周波数成分ごとに、前記ノイズを抑制するスペクトルゲインを算出するゲイン算出部、
    前記周波数領域データに前記スペクトルゲインを乗算する乗算器、ならびに、
    前記スペクトルゲインが乗算された前記周波数領域データの逆高速フーリエ変換を行って、出力信号を生成するIFFT部、
    として機能させ、
    前記ゲイン算出部は、前記スペクトルゲインに0以上、1以下のゲイン調節係数を乗算して、1を加算した結果から、前記ゲイン調節係数を減算することで、前記スペクトルゲインを調節し、
    前記乗算器は、前記周波数領域データに、前記調節された前記スペクトルゲインを乗算する、
    プログラム。
JP2017118374A 2017-06-16 2017-06-16 ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム Active JP6892598B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017118374A JP6892598B2 (ja) 2017-06-16 2017-06-16 ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム
US15/956,796 US10438608B2 (en) 2017-06-16 2018-04-19 Noise suppression circuit, communication device, noise suppression method, and non-transitory computer-readable recording medium storing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017118374A JP6892598B2 (ja) 2017-06-16 2017-06-16 ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム

Publications (2)

Publication Number Publication Date
JP2019003087A JP2019003087A (ja) 2019-01-10
JP6892598B2 true JP6892598B2 (ja) 2021-06-23

Family

ID=64656212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017118374A Active JP6892598B2 (ja) 2017-06-16 2017-06-16 ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム

Country Status (2)

Country Link
US (1) US10438608B2 (ja)
JP (1) JP6892598B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180627B (zh) * 2017-06-22 2020-10-09 潍坊歌尔微电子有限公司 去除噪声的方法和装置
JP7413545B2 (ja) 2020-01-21 2024-01-15 ドルビー・インターナショナル・アーベー ノイズフロア推定およびノイズ低減
CN114650203B (zh) * 2022-03-22 2023-10-27 吉林省广播电视研究所(吉林省广播电视局科技信息中心) 单频振幅抑噪测量方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11231897A (ja) 1998-02-12 1999-08-27 Hitachi Ltd 音声認識装置及び方法
US20020178004A1 (en) * 2001-05-23 2002-11-28 Chienchung Chang Method and apparatus for voice recognition
JP2008216720A (ja) * 2007-03-06 2008-09-18 Nec Corp 信号処理の方法、装置、及びプログラム
CN102792373B (zh) * 2010-03-09 2014-05-07 三菱电机株式会社 噪音抑制装置
US8818806B2 (en) 2010-11-30 2014-08-26 JVC Kenwood Corporation Speech processing apparatus and speech processing method
JP6064566B2 (ja) * 2012-12-07 2017-01-25 ヤマハ株式会社 音響処理装置
KR20160026317A (ko) * 2014-08-29 2016-03-09 삼성전자주식회사 음성 녹음 방법 및 장치
JP6693340B2 (ja) * 2016-08-30 2020-05-13 富士通株式会社 音声処理プログラム、音声処理装置、及び音声処理方法

Also Published As

Publication number Publication date
JP2019003087A (ja) 2019-01-10
US20180366137A1 (en) 2018-12-20
US10438608B2 (en) 2019-10-08

Similar Documents

Publication Publication Date Title
EP3348047B1 (en) Audio signal processing
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
EP1480494B1 (en) Feedback suppression in sound signal processing using frequency translation
EP2241099B1 (en) Acoustic echo reduction
JP6892598B2 (ja) ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム
US8306821B2 (en) Sub-band periodic signal enhancement system
US20040125962A1 (en) Method and apparatus for dynamic sound optimization
WO2010094966A2 (en) A method and system for noise cancellation
US9065409B2 (en) Method and arrangement for processing of audio signals
WO2017196382A1 (en) Enhanced de-esser for in-car communication systems
EP1275200B1 (en) Method and apparatus for dynamic sound optimization
US20230217166A1 (en) Bass enhancement for loudspeakers
EP3748626B1 (en) Mixing apparatus and mixing method
JP2002521945A (ja) 通信端末
JP6216546B2 (ja) ノイズ低減装置、放送受信装置及びノイズ低減方法
US8437386B2 (en) Communication system
US11322168B2 (en) Dual-microphone methods for reverberation mitigation
CN117475976A (zh) 音频处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210510

R150 Certificate of patent or registration of utility model

Ref document number: 6892598

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150