JP2006047639A - 雑音除去装置 - Google Patents

雑音除去装置 Download PDF

Info

Publication number
JP2006047639A
JP2006047639A JP2004227916A JP2004227916A JP2006047639A JP 2006047639 A JP2006047639 A JP 2006047639A JP 2004227916 A JP2004227916 A JP 2004227916A JP 2004227916 A JP2004227916 A JP 2004227916A JP 2006047639 A JP2006047639 A JP 2006047639A
Authority
JP
Japan
Prior art keywords
noise
frequency
signal
noise model
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004227916A
Other languages
English (en)
Other versions
JP4505597B2 (ja
Inventor
Shingo Kuroiwa
眞吾 黒岩
Toshiki Endo
俊樹 遠藤
Satoru Nakamura
哲 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2004227916A priority Critical patent/JP4505597B2/ja
Publication of JP2006047639A publication Critical patent/JP2006047639A/ja
Application granted granted Critical
Publication of JP4505597B2 publication Critical patent/JP4505597B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Abstract

【課題】非定常雑音下においても雑音を精度良く除去できる雑音除去装置を提供する。
【解決手段】雑音除去装置は、複数通りの雑音信号を周波数帯域に変換した複数通りの雑音モデル30、32、34を記憶する雑音モデル記憶部と、低周波帯域において入力信号のスペクトル形状22に最も類似したスペクトル形状40、42、44を持つ雑音モデルを選択し、さらに雑音レベルを推定して入力信号から雑音モデルを除算するスペクトルサブトラクション(SS)を行なうSS処理部とを含む。
【選択図】 図1

Description

この発明は雑音除去装置に関し、特に、風雑音などのように非定常的な雑音を除去するための装置に関する。
最近の電子機器技術の発達はめざましく、種々の装置が高性能になり、かつ小型化された。典型的な例がビデオカメラである。かつてはビデオカメラは、携帯できる形式のものであってもかなりの大きさであったが、最近のビデオカメラは非常に小さく、軽くなっている。また最近のビデオカメラは値段が安くなり、その結果多くの人がビデオカメラを入手し、様々なところにビデオカメラを持っていく機会が増加した。その結果、野外での撮影機会も増加した。
野外での撮影の問題として、風雑音の影響がある。風雑音はマイクに拾われやすく、その結果音質が劣化するという問題がある。
従来、風雑音対策として行なわれていた手法の一つは、マイクに風防を付けるなど,ハードウェアによるものである。しかしそのような手法には限界があり、風雑音を十分効果的に除去することはできない。
一方、風雑音に限らず、音声信号の雑音除去の一般的手法にスペクトルサブトラクション法(SS法)と呼ばれる手法が存在する。図4を参照して、SS法の概念を説明する。一般的にはマイクで得られる信号は、目的となる音声信号に雑音信号が重畳されたものとなる。そこで、例えば無音区間の音声信号から雑音信号を推定し、音声信号からこの雑音信号を除去することで、雑音のない音声信号を得る。
SS法では、まず図4の上段に示されるように雑音を含む音声信号100の周波数スペクトルを得て、これから、無音区間で推定された雑音102の周波数スペクトルを減算し、図4の下段に示す信号110を得る。
図5に、従来のSS法を用いる雑音除去装置の構成を示す。図5を参照して、従来の雑音除去装置120は、観測信号y(i)に対し短時間TFT(Short-Time Fourier Transformation)処理を実行して周波数領域に変換し、短時間音声パワースペクトルを示す、離散的な例えば128個の周波数成分|Y(t,kf0)|82(k=0〜127)と位相成分φy(kf0)80とを出力するためのSTFT処理部68と、周波数成分82と、無音区間から推定された雑音成分|^N(kf0)|132とから、以下の式にしたがうSS法によって雑音を除去した信号|^S(t,kf0)|134を出力するためのSS処理部72とを含む。
Figure 2006047639
雑音除去装置120はさらに、SS処理部72の出力する信号134に対して、STFT処理部68の出力する位相成分80を位相情報として用いてIFFT(Inverse FFT)処理を行なうためのIFFT処理部74と、IFFT処理部74の出力に対しインバースウィンドイング処理を実行するためのインバースウィンドイング処理部76と、インバースウィンドイング処理部76の出力に基づいて波形合成を行ない、信号^s(i)を出力するための波形合成処理部78とを含む。
STFT処理部68は、観測信号yを所定時間ごとにずらしながら所定長のフレームy(i)にデジタル信号化するためのフレーム化部140と、フレーム化部140から出力される各フレームy(i)に対し、所定の時間窓を掛ける処理を行なうためのウィンドイング処理部142と、ウィンドイング処理部142から出力される各フレームの観測信号に対してFFT(Fast Fourier Transform)処理を実行し、各フレームの位相成分80および周波数成分82を出力するためのFFT処理部144とを含む。
波形合成処理部78は、インバースウィンドイング処理部76の出力に対し窓関数を乗ずるためのウィンドイング処理部150と、ウィンドイング処理部150の出力に基づいて信号^s(i)を合成するための合成処理部152とを含む。
雑音除去装置120は概略以下のように動作する。観測信号yはフレーム化部140によりフレーム化される。フレーム化された観測信号y(i)に対してウィンドイング処理部142が窓掛け処理を行なう。窓掛けされた観測信号に対してFFT処理部144がFFT処理を行ない、位相成分80および周波数成分82を出力する。
SS処理部72は、周波数成分82から音声信号の無音区間より推定された雑音成分132を減算し、信号134としてIFFT処理部74に与える。この処理により、式(1)にしたがって観測信号から雑音成分の推定値が減算される。IFFT処理部74は、信号134に対し位相成分80を位相情報としてIFFT処理を実行し、インバースウィンドイング処理部76に与える。以下、インバースウィンドイング処理部76、ウィンドイング処理部150、および合成処理部152により、雑音の除去された信号^s(i)が合成される。
SS法は、簡単なアルゴリズムで観測信号の雑音を効率的に除去できる。しかし、SS法では雑音成分が定常的であることが仮定されているため、風雑音のように非定常的な雑音下では、雑音成分の予測の誤差が大きく、雑音の引きすぎまたは消し残りが発生する可能性が高いという問題がある。
したがって本発明の目的は、風雑音のような非定常雑音下において、雑音を精度良く除去できる雑音除去装置を提供することである。
本発明の他の目的は、風雑音のような非定常雑音下において、雑音レベルの変化に追従し、雑音を精度良く除去できる雑音除去装置を提供することである。
本発明のさらに他の目的は、風雑音のような非定常雑音下において、雑音レベルの変化に追従し、さらに雑音信号のスペクトル形状を考慮して雑音を精度良く除去できる雑音除去装置を提供することである。
本発明の第1の局面に係る雑音除去装置は、周波数帯域で表された複数通りの雑音モデルを記憶するための雑音モデル記憶手段と、入力される信号をフレームごとに周波数領域に変換するための周波数変換手段と、所定の第1の周波数帯域において、周波数変換手段により周波数領域に変換された信号のスペクトル形状に最も近いスペクトル形状を有する雑音モデルを、雑音モデル記憶手段に記憶された複数の雑音モデルからフレームごとに選択するための雑音モデル選択手段と、信号と、雑音モデル選択手段により選択された雑音モデルとの所定の第2の周波数帯域の周波数成分に基づいて、選択された雑音モデルのレベルをフレームごとに推定するためのレベル推定手段と、選択された雑音モデルの周波数成分をレベル推定手段により推定されたレベルにしたがって変換したものを、周波数変換手段により周波数領域に変換された信号の周波数成分からフレームごとに減算するための減算手段と、減算手段の出力を周波数帯域から時間領域に逆変換するための時間変換手段とを含む。
予め複数通りの雑音モデルを雑音モデル記憶手段に記憶させておく。入力される信号をフレームごとに周波数領域に変換し、その第1の周波数帯域のスペクトル形状に最も近いスペクトル形状を持つ雑音モデルをフレームごとに選択する。さらに、信号と、選択された雑音モデルとの第2の周波数帯域における周波数成分に基づいて、雑音モデルのレベルを推定し、雑音モデルを当該推定されたレベルに変換し、もとの信号からフレームごとに除算する。こうした構成により、フレームごとに、信号の第1の周波数帯域のスペクトル形状に最もよく似た雑音モデルを用いてSS法による雑音除去が行なえる。フレームごとに入力信号の雑音と最も良く似た雑音モデルを用いて信号から除算するので、信号に含まれる雑音が非定常なものでもその変化によく追従し、効率的に、かつ精度よく雑音を除去することができる。
好ましくは、第2の周波数帯域は、第1の周波数帯域よりも広く選ばれている。
さらに好ましくは、第1の周波数帯域は可変であり、雑音除去装置は、第1の周波数帯域を指定するための帯域指定手段をさらに含む。
周波数変換手段は、信号に対し、所定の周波数間隔ごとに周波数成分を算出するための離散的周波数成分算出手段を含み、雑音モデル選択手段は、以下の式にしたがって雑音モデル^Ngを選択するための手段を含んでもよい。
Figure 2006047639
ただしtは時刻、f0は離散的周波数成分算出手段における所定の周波数間隔、Y(t,kf0)は時刻tにおける、周波数kf0での信号の周波数成分、^Ni(kf0)は時刻tにおける、周波数kf0での雑音モデル^Niの周波数成分、h1はh10=第1の周波数帯域の下限となるような整数、h2はh20=第1の周波数帯域の上限となるような整数、をそれぞれ表す。
より好ましくは、レベル推定手段は、信号|Y(t,kf0)|と選択された雑音モデル^Ng(kf0)とから、以下の式にしたがって選択された雑音モデルのレベル^α(t)をフレームごとに推定するための手段を含む。
Figure 2006047639
ただし、j1はj10=第2の周波数帯域の下限となるような整数、j2はj20=第2の周波数帯域の上限となるような整数、をそれぞれ表す。
減算手段は、以下の式にしたがって信号から雑音をフレームごとに除去した信号^S(t,kf0)を出力するようにしてもよい。
Figure 2006047639
ただし^S(t,kf0)は時刻tにおける信号^Sの周波数kf0における周波数成分を、^Ng(kf0)は選択された雑音モデル^Ngの周波数kf0における周波数成分を、それぞれ表す。
好ましくは、雑音除去装置は、各々が複数通りの雑音モデルを含む複数個の信号源プロフィール情報を記憶するための手段と、複数個の信号源プロフィール情報のうちのいずれかを、ユーザの指定により選択して、当該選択された信号源プロフィール情報に含まれる複数個の雑音モデルを雑音モデル記憶手段に格納するための手段とをさらに含む。
[第1の実施の形態]
−動作の原理−
図1に、本発明の第1の実施の形態に係る雑音除去装置の動作原理を示す。図1上段を参照して、風雑音の場合、雑音22の成分は周波数スペクトルにおいて比較的低域に集中することが知られている。一方、信号20の周波数成分はより高域に集中している。そこで、予め特徴的な雑音のスペクトル形状を複数の雑音モデル30、32、34等として準備しておき、観測信号のうち、1点鎖線24で示される所定のしきい値TH0以下の周波数成分の形状に最も近いスペクトル形状(スペクトル形状40、42または44)を持つ雑音モデルを選択する。さらに雑音レベルを推定することにより、実際の雑音成分を推定し、観測信号から減算することにより雑音除去を行なう。
なお、雑音モデルは、音声を電気信号に変換するマイクの機種により異なる。したがって、例えばマイク製造者が予め雑音モデルを準備しておき、それを雑音除去装置に取込むような仕組みを設けておくことが望ましい。さらに、上記したように風雑音の場合には、所定のしきい値(例えば123Hz)以下の周波数に周波数成分が集中しているが、他の種類の雑音の場合には、これとは異なる別の帯域に集中していることも考えられる。または、複数の帯域に集中帯域が分散していることも考えられる。したがって、雑音モデルを選択するための帯域を利用者が選択できるようにすることが望ましい。以下に説明する実施の形態に係る雑音除去装置は、そのような仕組みを有している。
−構成−
図2は、本実施の形態に係る雑音除去装置50の構成を示すブロック図である。図2において、図5に示すものと同じ部品には同じ参照番号を付してある。それらの機能及び名称も同様である。したがって、それらについての詳細な説明は繰返さない。なお、図2に示す雑音除去装置50は、図5に示す従来の雑音除去装置120と同様のSS法による処理も可能であり、いずれを使用するかを選択できる。しかし図2においては、図および説明を分かりやすくするために、図2に示す各部品のうち、従来技術のみに使用される部分は示していない。
図2を参照して、雑音除去装置50は、上記した複数の雑音モデル及び雑音モデルを選択する信号の帯域を、マイクロフォンごとにマイクプロフィールとして記憶するためのマイクプロフィール記憶部62と、いわゆるインターネットに接続されると、例えばマイクロフォンメーカが準備したサーバからマイクプロフィールを自動的に取寄せ、取寄せたマイクプロフィールでマイクプロフィール記憶部62を更新するためのマイクプロフィール更新部60と、ユーザからの指示に応じてマイクプロフィール記憶部62に記憶されているマイクプロフィールおよび使用雑音帯域の一覧を表示し、ユーザにいずれかを選択させるためのマイクプロフィール/雑音帯域選択部66と、マイクプロフィール/雑音帯域選択部66により選択されたマイクプロフィールから複数の雑音モデルを読出し記憶するための雑音モデル記憶部64とを含む。
雑音除去装置50はさらに、観測信号y(i)に対し、STFT処理を行なって周波数領域に変換し、周波数成分82と位相成分80とを出力するためのSTFT処理部68と、STFT処理部68の出力する周波数成分82と、マイクプロフィール/雑音帯域選択部66から与えられる雑音帯域情報とにしたがって、雑音モデル記憶部64に記憶されている複数の雑音モデルから例えば以下の式(2)により最適と思われる雑音モデル|^Ng(kf0)|を選択して出力し、さらに当該雑音モデルと周波数成分82とに基づいて雑音信号のレベル推定値^α(t)を以下の式(3)により推定するための雑音推定部70とを含む。
Figure 2006047639
ただし、式(2)におけるhは雑音モデルの選択に用いるしきい値TH0(例えば123Hz)に対応するkの値を示す。また式(3)におけるjは雑音レベル推定の場合に使用されるしきい値TH1(例えば133Hz)に対応するkの値を示す。また、本実施の形態ではh≦jである。すなわち、雑音モデルの推定に用いる帯域よりも、レベル推定値^α(t)の推定に用いる帯域の方が大きく選ばれている。このようにすることにより、レベル推定がより精度高く行なえる。
なお、使用バンドが異なれば、式(2)(3)において合計の対象となるkの値の範囲(上限および下限)も異なってくる。上記した式(2)(3)はあくまで風雑音の場合の例である。また上の式におけるhおよびjの値はマイクプロフィールに記憶されており、マイクプロフィール/雑音帯域選択部66により選択されてそれぞれ雑音モデル選択部90および^α(t)推定部92に与えられる。
雑音除去装置50はさらに、STFT処理部68の出力する周波数成分|Y(t,kf0)|82に対し、雑音推定部70の出力する雑音モデル|^Ng(kf0)|84およびレベル推定値^α(t)86を用いて以下の式(4)にしたがうSS法により雑音除去を行ない、信号|^S(t,kf0)|88を出力するためのSS処理部94を含む。
Figure 2006047639
雑音除去装置50はさらに、SS処理部94の出力する信号|^S(t,kf0)|88に対し、STFT処理部68の出力する位相成分80(φy(kf0))を位相情報として用いてIFFT処理を実行するためのIFFT処理部74と、IFFT処理部74の出力を受けるインバースウィンドイング処理部76と、インバースウィンドイング処理部76の出力を受けて波形合成をし、信号^s(i)を出力するための波形合成処理部78とを含む。IFFT処理部74、インバースウィンドイング処理部76および波形合成処理部78により、雑音成分の除去された信号が周波数領域から時間領域に変換される。
雑音推定部70は、雑音モデル記憶部64に記憶された複数の雑音モデルから、マイクプロフィール/雑音帯域選択部66により指定された雑音帯域の形状が周波数成分82の当該帯域の形状に最も近いものを上記した式(2)にしたがって選択し、雑音モデル|^Ng(kf0)|84を出力するための雑音モデル選択部90と、雑音モデル選択部90が出力する雑音モデル|^Ng(kf0)|84とSTFT処理部68の出力する周波数成分82とに基づき、上記した式(3)にしたがって雑音のレベル推定値^α(t)86を出力するための^α(t)推定部92とを含む。
−動作−
雑音除去装置50は以下のように動作する。マイクプロフィール記憶部62には、雑音除去装置50が取付けられた機器(例えば携帯ビデオカメラ等)の出荷時に、機器の製造者により、当該機器で使用されているマイクのマイクプロフィールが記憶される。出荷後、マイクプロフィールに修正があったり、新たなマイクプロフィールの追加があったりしたときには、雑音除去装置50をインターネットに接続することにより、それらマイクプロフィールによりマイクプロフィール記憶部62に記憶されたマイクプロフィールが自動的に更新される。マイクプロフィールとしては、例えば風雑音除去用のマイクプロフィールがある。
撮影時、通常は図5に示すものと同様の従来のSS法による雑音除去を行なう。野外で、風雑音などがある場合には、ユーザはマイクプロフィール/雑音帯域選択部66を使用して、どのマイクプロフィールを使用するかを選択する。ここでは風雑音用のマイクプロフィールを選択するものとする。したがってマイクプロフィール/雑音帯域選択部66は当該帯域を示す情報(h)を雑音推定部70の雑音モデル選択部90に与える。マイクプロフィール/雑音帯域選択部66はまた、^α(t)推定の際に使用される帯域を示す情報(j)を雑音推定部70の^α(t)推定部92に与える。
雑音モデル選択部90は、式(2)にしたがい、周波数成分82との間の二乗誤差が最小となる雑音モデル|^Ng(kf0)|84を定め、^α(t)推定部92およびSS処理部94に与える。
^α(t)推定部92は、この雑音モデル|^Ng(kf0)|84と周波数成分82とに基づき、式(3)にしたがって雑音のレベル推定値^α(t)86を推定し、SS処理部94に与える。
SS処理部94は、STFT処理部68からの周波数成分82に対し、雑音モデル選択部90からの雑音モデル|^Ng(kf0)|84、^α(t)推定部92からの^α(t)86を用いて式(4)にしたがうSS処理を実行する。SS処理部94は、こうして雑音の除去された信号|^S(t,kf0)|88をIFFT処理部74に与える。
IFFT処理部74は、信号|^S(t,kf0)|88に対しSTFT処理部68からの位相成分80を位相情報として用いてIFFT処理を実行し、インバースウィンドイング処理部76に与える。インバースウィンドイング処理部76以下で行なわれる処理は、図5に示す従来のものと同様である。
−実験結果−
図3に、雑音除去装置50を用いて行なった実験によって得られた結果を示す。図3において、棒グラフ160、162および164はそれぞれ、従来のSS法におけるSNR(Signal-to-Noise Ratio)、上記実施の形態に係るSS法によるSNR、および理論的なSNR(いずれもdB)を示す。図3を参照して明らかなように、本実施の形態によれば従来のSS法を用いた場合と比較してはるかに高い精度で効率よく雑音を除去できる。条件にもよるが、図3に示すように上限値に近いSNRも得られる。
以上のように本発明の実施の形態においては、複数の雑音モデルを用意し、観測信号のスペクトルの所定帯域の形状に対応した雑音モデルをフレームごとに選択し、さらにフレームごとに雑音レベルを推定することにより、式(4)に示すSS法にしたがって雑音を除去する。そのため、風雑音などの非定常雑音下でもその変化に追従し、安定して効率よく雑音を除去することができる。
上記した実施の形態では、風雑音の雑音モデル選択のために、観測信号の周波数スペクトルのうち、所定のしきい値より低い周波数成分のみを用いている。しかし本発明はこうした実施の形態に限定されるわけではない。上記したように、雑音の種類によってはこのように雑音が低域ではなく他の帯域に集中することもある。そうした場合、その帯域が分かっていればその帯域の周波数成分を用いて雑音モデルの選択を行なえばよい。また、そのように雑音モデルの選択を行なうための帯域が一つに限定されるわけではなく、集中帯域が複数の帯域に分散していることもある。その場合には、複数の帯域にわたって上記した最小二乗法により雑音モデルを選択するようにしてもよい。
さらに、上記した帯域の選択を、フレームごとに変化させるようにしてもよい。この場合には何らかの形でフレームごとに雑音が集中している帯域を調べる機構が必要となる。
また、上記実施の形態では、雑音除去装置としてビデオカメラに組込んだ例を説明した。しかし本発明はそのような実施の形態に限定されるわけではない。例えば、テレビジョン受像機のように、映像を再生する装置にこの雑音除去装置を組込んでも良い。さらに、いわゆるパーソナルコンピュータなどで映像の編集を行なうための編集ソフトウェアに対するプラグインの形で、上記した雑音除去装置50をソフトウェアの形で組込んでもよい。その場合、マイクプロフィール/雑音帯域選択部66は、編集ソフトウェアのユーザインタフェースにあわせ、パーソナルコンピュータの画面とキーボード、マウスなどの入力装置を用いたGUI(Graphical User Interface)で実現することが望ましい。
また、上記実施の形態では、もっぱら雑音除去装置のみを示したが、この音声除去装置を音声認識装置の前段に設けることで、音声認識の精度を高めることができる。例えば人間の発声では、母音はハーモニクスを含むため、音声のパワースペクトル上では複数箇所で谷が生ずる。この場合、本実施例での雑音帯域としてそうした谷に対応する領域を用いて雑音モデルを選択できる。この雑音モデルを用いて音声から雑音を除去することで音声認識の精度を高めることができる。
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味および範囲内でのすべての変更を含む。
本発明の一実施の形態に係る雑音除去装置の動作原理を説明するための図である。 本発明の一実施の形態に係る雑音除去装置50のブロック図である。 本発明の一実施の形態を用いて行なった雑音除去の効果を、従来技術と対比して示すグラフである。 従来のSS法の原理を説明するための図である。 従来のSS法を用いた雑音除去装置120のブロック図である。
符号の説明
50,120 雑音除去装置、60 マイクプロフィール更新部、62 マイクプロフィール記憶部、64 雑音モデル記憶部、66 マイクプロフィール/雑音帯域選択部、68 STFT処理部、70 雑音推定部、72,94 SS処理部、74 IFFT処理部、76 インバースウィンドイング処理部、78 波形合成処理部、80 位相成分、82 周波数成分、84 雑音モデル、86 レベル推定値、88 信号、90 雑音モデル選択部、92 ^α(t)推定部

Claims (7)

  1. 周波数帯域で表された複数通りの雑音モデルを記憶するための雑音モデル記憶手段と、
    入力される信号をフレームごとに周波数領域に変換するための周波数変換手段と、
    所定の第1の周波数帯域において、前記周波数変換手段により周波数領域に変換された前記信号のスペクトル形状に最も近いスペクトル形状を有する雑音モデルを、前記雑音モデル記憶手段に記憶された前記複数の雑音モデルからフレームごとに選択するための雑音モデル選択手段と、
    前記信号と、前記雑音モデル選択手段により選択された雑音モデルとの所定の第2の周波数帯域の周波数成分に基づいて、前記選択された雑音モデルのレベルをフレームごとに推定するためのレベル推定手段と、
    前記選択された雑音モデルの周波数成分を前記レベル推定手段により推定されたレベルにしたがって変換したものを、前記周波数変換手段により周波数領域に変換された前記信号の周波数成分からフレームごとに減算するための減算手段と、
    前記減算手段の出力を周波数帯域から時間領域に逆変換するための時間変換手段とを含む、雑音除去装置。
  2. 前記第2の周波数帯域は、前記第1の周波数帯域よりも広く選ばれている、請求項1に記載の雑音除去装置。
  3. 前記第1の周波数帯域は可変であり、
    前記第1の周波数帯域を指定するための帯域指定手段をさらに含む、請求項1または請求項2に記載の雑音除去装置。
  4. 前記周波数変換手段は、前記信号に対し、所定の周波数間隔ごとに周波数成分を算出するための離散的周波数成分算出手段を含み、
    前記雑音モデル選択手段は、以下の式にしたがって雑音モデル^Ngを選択するための手段を含む、請求項3に記載の雑音除去装置。
    Figure 2006047639
    ただしtは時刻、f0は前記離散的周波数成分算出手段における前記所定の周波数間隔、Y(t,kf0)は時刻tにおける、周波数kf0での前記信号の周波数成分、^Ni(kf0)は時刻tにおける、周波数kf0での前記雑音モデル^Niの周波数成分、h1はh10=前記第1の周波数帯域の下限となるような整数、h2はh20=前記第1の周波数帯域の上限となるような整数、をそれぞれ表す。
  5. 前記レベル推定手段は、前記信号|Y(t,kf0)|と前記選択された雑音モデル^Ng(kf0)とから、以下の式にしたがって前記選択された雑音モデルのレベル^α(t)をフレームごとに推定するための手段を含む、請求項4に記載の雑音除去装置。
    Figure 2006047639
    ただし、j1はj10=前記第2の周波数帯域の下限となるような整数、j2はj20=前記第2の周波数帯域の上限となるような整数、をそれぞれ表す。
  6. 前記減算手段は、以下の式にしたがって前記信号から雑音をフレームごとに除去した信号^S(t,kf0)を出力する、請求項5に記載の雑音除去装置。
    Figure 2006047639
    ただし^S(t,kf0)は時刻tにおける信号^Sの周波数kf0における周波数成分を、^Ng(kf0)は前記選択された雑音モデル^Ngの周波数kf0における周波数成分を、それぞれ表す。
  7. 各々が複数通りの雑音モデルを含む複数個の信号源プロフィール情報を記憶するための手段と、
    前記複数個の信号源プロフィール情報のうちのいずれかを、ユーザの指定により選択して、当該選択された信号源プロフィール情報に含まれる複数個の雑音モデルを前記雑音モデル記憶手段に格納するための手段とをさらに含む、請求項1〜請求項6のいずれかに記載の雑音除去装置。
JP2004227916A 2004-08-04 2004-08-04 雑音除去装置 Expired - Lifetime JP4505597B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004227916A JP4505597B2 (ja) 2004-08-04 2004-08-04 雑音除去装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004227916A JP4505597B2 (ja) 2004-08-04 2004-08-04 雑音除去装置

Publications (2)

Publication Number Publication Date
JP2006047639A true JP2006047639A (ja) 2006-02-16
JP4505597B2 JP4505597B2 (ja) 2010-07-21

Family

ID=36026268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004227916A Expired - Lifetime JP4505597B2 (ja) 2004-08-04 2004-08-04 雑音除去装置

Country Status (1)

Country Link
JP (1) JP4505597B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008076975A (ja) * 2006-09-25 2008-04-03 Fujitsu Ltd 音信号補正方法、音信号補正装置及びコンピュータプログラム
JP2009036831A (ja) * 2007-07-31 2009-02-19 Canon Inc 情報処理装置、情報処理方法
JP2012132950A (ja) * 2010-12-17 2012-07-12 Fujitsu Ltd 音声認識装置、音声認識方法および音声認識プログラム
JP2012168477A (ja) * 2011-02-16 2012-09-06 Nikon Corp ノイズ推定装置、信号処理装置、撮像装置、及びプログラム
JP2013106327A (ja) * 2011-11-16 2013-05-30 Canon Inc 撮像装置及び情報処理装置、これらの制御方法並びに雑音除去方法及びプログラム
JP2014126856A (ja) * 2012-12-27 2014-07-07 Canon Inc 雑音除去装置及びその制御方法
CN110797041A (zh) * 2019-10-21 2020-02-14 珠海市杰理科技股份有限公司 语音降噪处理方法、装置、计算机设备及存储介质
WO2024069964A1 (ja) * 2022-09-30 2024-04-04 Tdk株式会社 ノイズ処理回路、信号処理装置、ノイズ処理方法、および記録媒体

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008076975A (ja) * 2006-09-25 2008-04-03 Fujitsu Ltd 音信号補正方法、音信号補正装置及びコンピュータプログラム
US8249270B2 (en) 2006-09-25 2012-08-21 Fujitsu Limited Sound signal correcting method, sound signal correcting apparatus and computer program
JP2009036831A (ja) * 2007-07-31 2009-02-19 Canon Inc 情報処理装置、情報処理方法
JP4590437B2 (ja) * 2007-07-31 2010-12-01 キヤノン株式会社 情報処理装置
JP2012132950A (ja) * 2010-12-17 2012-07-12 Fujitsu Ltd 音声認識装置、音声認識方法および音声認識プログラム
JP2012168477A (ja) * 2011-02-16 2012-09-06 Nikon Corp ノイズ推定装置、信号処理装置、撮像装置、及びプログラム
JP2013106327A (ja) * 2011-11-16 2013-05-30 Canon Inc 撮像装置及び情報処理装置、これらの制御方法並びに雑音除去方法及びプログラム
JP2014126856A (ja) * 2012-12-27 2014-07-07 Canon Inc 雑音除去装置及びその制御方法
US9247347B2 (en) 2012-12-27 2016-01-26 Canon Kabushiki Kaisha Noise suppression apparatus and control method thereof
CN110797041A (zh) * 2019-10-21 2020-02-14 珠海市杰理科技股份有限公司 语音降噪处理方法、装置、计算机设备及存储介质
WO2021078010A1 (zh) * 2019-10-21 2021-04-29 珠海市杰理科技股份有限公司 语音降噪处理方法、装置、计算机设备及存储介质
US12073846B2 (en) 2019-10-21 2024-08-27 Zhuhai Jieli Technology Co., Ltd Speech noise reduction processing method and apparatus, and computer device and storage medium
WO2024069964A1 (ja) * 2022-09-30 2024-04-04 Tdk株式会社 ノイズ処理回路、信号処理装置、ノイズ処理方法、および記録媒体

Also Published As

Publication number Publication date
JP4505597B2 (ja) 2010-07-21

Similar Documents

Publication Publication Date Title
US7065487B2 (en) Speech recognition method, program and apparatus using multiple acoustic models
JP4958303B2 (ja) 雑音抑圧方法およびその装置
JP5000647B2 (ja) 音声状態モデルを使用したマルチセンサ音声高品質化
US7406303B2 (en) Multi-sensory speech enhancement using synthesized sensor signal
US7957964B2 (en) Apparatus and methods for noise suppression in sound signals
JP6054142B2 (ja) 信号処理装置、方法およびプログラム
WO2014168021A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP3960834B2 (ja) 音声強調装置及び音声強調方法
JP4505597B2 (ja) 雑音除去装置
JP3907194B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP5152799B2 (ja) 雑音抑圧装置およびプログラム
JP4434813B2 (ja) 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
JP2009223210A (ja) 信号帯域拡張装置および信号帯域拡張方法
JP2005258158A (ja) ノイズ除去装置
JP4568193B2 (ja) 収音装置とその方法とそのプログラムとその記録媒体
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP5152800B2 (ja) 雑音抑圧評価装置およびプログラム
JP2020160290A (ja) 信号処理装置、信号処理システム及び信号処理方法
JP2003044077A (ja) 音声特徴量抽出方法と装置及びプログラム
JP2011053557A (ja) 悲鳴検出装置および悲鳴検出方法
JP2005099405A (ja) 雑音除去方法、雑音除去装置およびプログラム
JP2014026032A (ja) 信号処理装置、撮像装置、及び、プログラム
JPWO2015093025A1 (ja) 音声処理装置、音声処理方法、及び、音声処理プログラム
JP2013178458A (ja) 信号処理装置及び信号処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070719

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100331

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4505597

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250