JP2010028307A - 雑音低減装置及び方法、並びにプログラム - Google Patents

雑音低減装置及び方法、並びにプログラム Download PDF

Info

Publication number
JP2010028307A
JP2010028307A JP2008185103A JP2008185103A JP2010028307A JP 2010028307 A JP2010028307 A JP 2010028307A JP 2008185103 A JP2008185103 A JP 2008185103A JP 2008185103 A JP2008185103 A JP 2008185103A JP 2010028307 A JP2010028307 A JP 2010028307A
Authority
JP
Japan
Prior art keywords
frequency
signal
unit
amplitude
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008185103A
Other languages
English (en)
Inventor
Kazuhiko Ozawa
一彦 小沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008185103A priority Critical patent/JP2010028307A/ja
Publication of JP2010028307A publication Critical patent/JP2010028307A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 風雑音低減処理の際の同相成分の風雑音による誤動作を防ぐとともに、さらに低減効果を上げた風雑音低減装置を提供する。
【解決手段】 複数の音声チャンネルからの入力信号をFFT部52,53で周波数信号に変換し、風雑音帯域の周波数信号を取り出して、振幅比較部54及び位相比較部55により、複数の音声チャンネル間での差分を振幅と位相の両方から求めて、減衰係数生成部56により、風雑音成分を減衰するための振幅係数に変換し、周波数選択/減衰部部57,58により、振幅と位相の一方の係数を選択して、風雑音帯域の周波数信号に乗算し、帯域合成部59,60により、風雑音帯域以外の周波数信号と合成し、IFFT部61,62により時間信号に逆変換する。
【選択図】 図1

Description

本発明は、ビデオカメラ等のマイクロホン内蔵機器において生ずる風雑音を低減するための雑音低減装置及び方法、並びにプログラムに関する。
近年において、家庭用ビデオカメラ等のマイクロホン内蔵機器で、屋外使用時に常に問題となる風雑音(ウィンドノイズ)を除去する技術として、以下のようなさまざまな手法が提案されている。
例えば、特許文献1に記載の技術では、指向特性を風雑音発生時のみ無指向性にして風雑音を低減している。
特許文献2に記載の技術では、適応フィルタを利用して風雑音を含む音声信号から、風雑音を推定して除去している。
特許文献3に記載の技術は、風雑音が含まれる帯域のみ、指向特性を無指向性にするようにして、風雑音を低減するものである。
特許文献4には、複数の雑音モデルを用意してスペクトルサブトラクション(SS)法により風雑音を除去する手法が記載されている。
この他、種々の技術が知られているが、これらの風雑音を低減・除去する技術は、以下のように大別することができる。
1.マイクロホンの指向特性を単一指向性などの有指向特性から、無指向性(モノラル)に制御する。
2.ハイパスフィルタなどを利用して、風雑音帯域のレベルを減衰させる。
3.適応フィルタや、スペクトルサブトラクション(SS)法により、風雑音信号を推定して減算する。
そして、これらの対策を、単独もしくは複合して実施する場合も多い。
また、本件出願人は、特許文献5において、複数のマイクからの信号の所定期間毎にレベル検波を行い、常にそのレベルの小さい出力を選択することにより風雑音を低減する技術を提案している。
特開平10−126878号公報 特開平5−161191号公報 特開2006−237816号公報 特開2006−47639号公報 特開2007−81560号公報
ところで、上述のように大別した風雑音を低減・除去する上記技術1〜3において、技術1は、風雑音の低減効果が技術2や技術3と比較して少ない、という問題点がある。上記技術2の問題点は、風雑音帯域と音声帯域が重複している場合には、音声が同時に低減されてしまうことである。上記技術3は、風雑音を短時間(いわゆるリアルタイム)に推定するためには演算スピードを上げる必要があり、回路が高価となり、ソフトフェアが大規模化する、という問題点がある。
これに対して、本件出願人が上記特許文献5において提案した技術は、上記技術1〜3による問題点を改善しながら風雑音を抑えることが可能であるが、風雑音信号の一部が十分に低減しきれない場合があり、さらなる改善が望まれていた。
本発明は、このような従来の実情に鑑みて提案されたものであり、簡単な構成で風雑音の低減効果をより高くし得るような雑音低減装置及び方法、並びにプログラムを提供することを目的とする。
上述の課題を解決するために、本発明は、複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに周波数信号に変換する複数の周波数変換部と、前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較部と、前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較部と、前記振幅比較部からの信号レベルに応じて第1の減衰係数に変換すると共に、前記位相比較部からの信号レベルに応じた第2の減衰係数に変換する減衰係数生成部と、前記減衰係数生成部から出力される減衰係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル減衰するように前記減衰係数を選択し、選択された減衰係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる複数の選択/減衰部と、前記選択/減衰部からの信号と前記複数の周波数変換部における所定周波数以外の信号とを夫々の音声チャンネル毎に帯域合成する複数の帯域合成部と、前記帯域合成部からの出力を時間信号に変換する複数の逆周波数変換部とを有し、前記各逆周波数変換部の出力を各音声チャンネルの出力信号とする。
また、本発明は、複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに周波数信号に変換する複数の周波数変換部と、前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較部と、前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較部と、前記振幅比較部からの信号レベルに応じて第1の抽出係数に変換すると共に、前記位相比較部からの信号レベルに応じた第2の抽出係数に変換する抽出係数生成部と、前記抽出係数生成部から出力される抽出係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル抽出するように前記抽出係数を選択し、選択された抽出係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる複数の選択/抽出部と、前記選択/抽出部からの出力を時間信号に変換する複数の逆周波数変換部と、前記各逆周波数変換部の出力を前記入力された各音声チャンネルの信号から減算する複数の減算器とを有し、前記各減算器の出力を各音声チャンネルの出力信号とする。
また、本発明は、複数の音声チャンネルから入力された複数の音声信号に対して、入力信号のサンプリング周波数を所定周波数の最大周波数をナイキスト周波数とするサンプリング周波数付近まで間引き動作させる複数の間引き部と、前記間引き部からの信号を所定フレーム時間ごとに周波数信号に変換する複数の周波数変換部と、前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較部と、前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較部と、前記振幅比較部からの信号レベルに応じて第1の減衰係数に変換すると共に、前記位相比較部からの信号レベルに応じた第2の減衰係数に変換する減衰係数生成部と、前記減衰係数生成部から出力される減衰係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル減衰するように前記減衰係数を選択し、選択された減衰係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる複数の選択/減衰部と、前記選択/減衰部からの出力を時間信号に変換する複数の逆周波数変換部と、前記逆周波数変換部の出力を、前記所定周波数の最大周波数をナイキスト周波数とするサンプリング周波数付近から、前記音声チャンネルの出力信号のサンプリング周波数まで補間動作させる複数の補間部と、前記補間部からの信号と前記複数の音声チャンネルから入力された複数の音声信号の所定周波数以外の信号とを夫々の音声チャンネル毎に帯域合成する複数の帯域合成部とを有し、前記各帯域合成部の出力を各音声チャンネル出力信号とする。
次に、本発明は、複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに複数の周波数変換部により周波数信号に変換する周波数変換工程と、前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較工程と、前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較工程と、前記振幅比較工程からの信号レベルに応じて第1の減衰係数に変換すると共に、前記位相比較工程からの信号レベルに応じた第2の減衰係数に変換する減衰係数生成工程と、前記減衰係数生成工程から出力される減衰係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル減衰するように前記減衰係数を選択し、選択された減衰係数を前記複数の音声チャンネル毎に前記所定周波数信号に乗ずる選択/減衰工程と、前記選択/減衰工程からの信号と前記複数の周波数変換工程における所定周波数以外の信号とを夫々の音声チャンネル毎に帯域合成する帯域合成工程と、前記帯域合成工程からの出力を複数の逆周波数変換部により時間信号に変換する逆周波数変換工程とを有し、前記逆周波数変換工程の出力を各音声チャンネルの出力信号とする。
さらに、本発明は、複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに複数の周波数変換部により周波数信号に変換する周波数変換工程と、前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較工程と、前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較工程と、前記振幅比較工程からの信号レベルに応じて第1の抽出係数に変換すると共に、前記位相比較工程からの信号レベルに応じた第2の抽出係数に変換する抽出係数生成工程と、前記抽出係数生成工程から出力される抽出係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル抽出するように前記抽出係数を選択し、選択された抽出係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる選択/抽出工程と、前記選択/抽出工程からの出力を時間信号に変換する逆周波数変換工程と、前記各逆周波数変換工程からの出力を前記入力された各音声チャンネルの信号から減算する減算工程とを有し、前記減算工程からの出力を各音声チャンネルの出力信号とする。
また、本発明に係るプログラムは、上述した風雑音低減処理をコンピュータに実行させるものである。
本発明によれば、風雑音信号のように相関性がない信号は大きく振幅/位相が乱れる特徴を利用して風雑音信号のみを除去することができる。このとき、風雑音信号でも同じ振幅として検出される誤動作を、位相についてもみることで防ぐことができ、風雑音の低減効果をより高めることができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。
図1は、本発明の第1の実施の形態となる風雑音低減装置を概略的に示すブロック図である。この図1に示す風雑音低減装置は、複数の音声チャンネルから複数の音声信号、例えばステレオの右、左チャンネル(Rch,Lch)の音声信号が入力端子50,51から入力される。入力端子50,51からの入力音声信号は、複数の音声信号を所定フレーム時間ごとに時間領域から周波数領域の信号に変換する複数の周波数変換部、例えば高速フーリエ変換(FFT:Fast Fourier Transform)部52,53に送られる。FFT部52,53からの所定周波数(後述する風雑音帯域の周波数f1〜fn)は、位相比較部55及び振幅比較部54に送られる。振幅比較部54は、前記所定周波数において、それぞれ振幅値を算出して複数の音声チャンネル間での信号の振幅差を演算する。位相比較部55は、それぞれ位相値を算出して複数の音声チャンネル間での信号の位相差を演算する。減衰係数生成部56は、振幅比較部54からの信号レベルに応じて第1の減衰係数に変換すると共に位相比較部55からの信号レベルに応じて第2の減衰係数に変換する。周波数選択/減衰部57,58は、減衰係数生成部56から出力される第1の減衰係数及び第2の減衰係数で、複数の音声チャンネル毎に、振幅差もしくは位相差が大きい周波数信号を最もレベル減衰するように減衰係数を選択し、選択された減衰係数を乗ずる。帯域合成部59,60は、周波数選択/減衰部57,58からの信号と複数のFFT部52,53における所定周波数以外の信号とを夫々の音声チャンネル毎に帯域合成する。複数の逆周波数変換部である逆高速フーリエ変換(IFFT:Inverse FFT)部61,62は、帯域合成部59,60からの出力をそれぞれ時間信号に変換する。各IFFT部61,62の出力を各音声チャンネル出力信号として、複数の音声チャンネルの出力端子63,64より取り出している。
この図1に示す第1の実施の形態のより詳細な説明に先立ち、一般的なビデオカメラにおける風雑音信号の例と、本件出願人が先に提案した上記特許文献5(特開2007−81560号公報)に記載の技術について説明する。
図2は、一般的なビデオカメラにおける風雑音信号の周波数特性例を示す図である。この図2において、風雑音は、約1kHz〜2kHz程度から低周波数になるにしたがって1/f特性(fは周波数)でレベルが増加する。しかし、使用するマイクロホンユニットの特性や、入力段アナログ回路のカップリングコンデンサの影響で極低周波数ではレベルが減少するために、約200Hz付近にピークをもっている。さらに風雑音信号の特徴としては、マイクロホン近辺に発生する渦状の気流(カルマン渦と呼ばれる)が原因であるために、複数のマイクロホンからの風雑音信号は、音声信号と比較して各マイクロホン間で相関性がないランダム信号に近似することが可能である。
次に、図3は、前記特許文献5(特開2007−81560号公報)に記載されている風雑音低減装置を概略的に示すブロック図である。
この図3の風雑音低減装置においては、高速フーリエ変換(FFT)を利用して時間領域の入力信号を周波数領域に変換している。まず入力端子1、2から入力するステレオの右、左チャンネルのRch、Lch信号は、それぞれFFT部5、7で、音声帯域の時間領域信号を周波数f1〜fmのm個の周波数領域信号に変換する。また加算器3と1/2乗算器4を経た(L+R)ch信号も、同様にFFT部6で周波数f1〜fmのm個の周波数領域信号に変換する。ここで各FFT部5〜6では、周波数f1〜fmの周波数領域信号を、一例として風雑音帯域の周波数f1〜fnと、風雑音帯域以外の周波数f(n+1)〜fmに分割する。そして、周波数f1〜fnのRch及びLch信号を(L+R)ch信号とそれぞれにレベル比較/選択部8及び9に入力する。レベル比較/選択部8及び9は、周波数f1〜fnの各周波数毎にレベル比較を行い、最もレベルの小さいチャンネルの信号を選択する動作を、すべての周波数f1〜fnについて実施する。選択された信号を帯域合成部10、11に入力し、再び周波数f(n+1)〜fmの信号と帯域合成し、周波数f1〜fmの信号として、逆高速フーリエ変換(IFFT)部12,13に送る。IFFT部12,13は、周波数領域信号を時間領域信号に逆変換して、端子14,15からRch信号、Lch信号として出力する。
レベル比較/選択部8及び9の構成は同じであるため、レベル比較/選択部8について図4を参照しながら説明する。周波数領域のF(R)ch信号が端子20より入力し、同様にF(L+R)ch信号が端子21から入力し、それぞれ絶対値処理部22、23と選択部26に入力する。この絶対値処理部は、周波数領域上での処理なので、後で説明する。そしてレベル比較部24で各チャンネルのレベル比較が行われ、先の選択部26に判定情報25として送られる。選択部26は判定情報25により、入力するチャンネルのレベルの小さい方を選択して、端子27に出力する。レベル比較/選択部9も同様である。
次に、図5を参照しながら、風雑音低減の動作原理を簡単に説明する。図5の(a)、(b)、(c)は、それぞれレベル比較/選択部8及び9における各chの絶対値処理部の出力で、横軸は周波数、縦軸は絶対値レベルである。ここでは周波数f1からf5が風雑音信号を、f8からf12が音声信号を表している。そしてレベル比較/選択部8で(b)と(c)の絶対値レベルが各周波数ポイントごとに比較され、図5の(e)のようにレベルの小さい側のchが選択されて出力する。同様にレベル比較/選択部9で(a)と(c)の絶対値レベルが各周波数ポイントごとに比較され、図5の(d)のようにレベルの小さい側のchが選択されて出力する。ここで(d)、(e)において周波数f1からf5の風雑音帯域ではレベルの減少した出力が得られ、f8からf12の音声帯域には、ほとんど影響を与えないため、風雑音だけを低減して音声信号を抽出することが可能になる。
以上のような技術においては、風雑音信号と比較して音声信号が同相成分に近いことを利用して、音声信号のみを抽出するようにしていた。しかし、このように信号レベル(振幅)情報のみで、同相か否かを判断すると、一部においては風雑音信号を同相成分と判断する誤動作が発生し、これが抽出されることにより低減効果を落とす要因になっていた。
本発明は、このような点を考慮し、風雑音信号の一部に存在する同相成分による誤動作を防ぐとともに、さらに低減効果を上げて風雑音成分を入力信号より除去する低減手法を提案するものである。
以下に発明の要点を列挙する。
1.風雑音成分を、FFT(高速フーリエ変換)等により周波数領域に変換し、振幅と位相の両方から風雑音成分を検出して除去する。
2.各チャンネル間におけるFFT出力等の周波数変換出力信号の振幅差と位相差の両者から、それぞれ風雑音成分を減衰、もしくは抽出するための振幅係数及び位相係数に変換する際に、変換特性を自由に指定する。これにより、たとえばわずかな振幅差や位相差においても大きく低減する設定も可能にする。
3.風雑音信号の帯域が、オーディオサンプリング周波数に比較して、低域周波数にあるため、デシメーション(間引き)とインターポレーション(補間)を行うことで周波数領域における処理の簡略化を図る。
前記図1は、これらの点を考慮した本発明の第1の実施の形態を示すものである。
次に、前述した時間領域から周波数領域の信号に変換する周波数変換部となるFFT手段(例えば図1のFFT部52、53)の構成及び動作について、図6を参照しながら説明する。図6は、FFT手段の概略構成を示すブロック図である。端子30からの連続時間信号は、フレーム化部31により、所定数のフレーム単位に分割され、さらにWINDOW処理部32にてフレーム化したときの高調波発生(一般に、ギブス現象と呼ばれる)を抑えるためにWINDOW処理を施す。次段のFFT処理部33にて周波数領域信号に変換され、端子34より出力される。なお本発明では、FFTを用いているが、周波数変換部は、FFTのみに限定されない。
次に、図7は、前述した周波数領域の信号を時間領域の信号に変換する逆周波数変換部となるIFFT手段(例えば図1のIFFT部61,62)の概略構成を示すブロック図である。この図7において、端子40からの周波数信号は、IFFT処理部41にて時間領域信号に変換され、さらに逆フレーム化部42により、所定数のフレーム単位を連続時間信号に変換し、端子43より出力される。なお本発明では、IFFTを用いているが、逆周波数変換部は、IFFTのみに限定されない。
次に、図8を参照しながら、FFT処理とナイキスト周波数について説明する。FFTでは、時間領域の実数データが周波数領域の複素数データに変換されるが、一例でFFT処理単位をフレームと呼ぶ。その時間領域信号の1フレームのデータ数を1024、サンプリング周波数を44.1kHzとすると、FFT後の有効な実数(Re)データ数が512と、有効な虚数(Im)データ数が512に変換される。これはナイキスト周波数(サンプリング周波数/2)に支配されるためであり、周波数分解能は、ナイキスト周波数/512(22.1kHz/512=約43Hz)となる。
次に、図9を参照しながら、前述の複素数データを極座標表現で説明する。FFT後の複素数データは、x軸を実数部、y軸を虚数部とした極座標で表現でき、たとえば極座標上でP1ポイントは、実数値Re1と虚数値Im1のベクトル加算でとして表現される。そしてその振幅(レベル)と位相は以下式で求められる。
振幅=√((Re)+(Im)
位相=Tan−1(Im/Re)
同様にP2、P3ポイントもそれぞれの実数値と虚数値から振幅と位相が求められる。
ここで、前記特許文献5(特開2007−81560号公報)に記載されている技術においては、図5に示したように、上述の振幅のみをチャンネル間で比較していた。このため、例えば図9のP3ポイントの場合には、振幅はP1ポイントと同じであるが、位相が異なるような場合でも、同一信号として抽出されていた。言い換えれば、従来はチャンネル間で位相が異なる風雑音信号でも、振幅が同じであれば低減できない問題があった。これに対して本発明では、振幅に加えて位相情報も風雑音の検出に利用することで、より精度を高めるようにしている。
このような本発明の具体例として、前記図1は、第1の実施の形態となる風雑音低減装置を示している。
図1の第1の実施の形態において、入力端子50、51よりRch及びLchデジタル信号が入力され、それぞれFFT部52、53にて時間領域信号から周波数領域信号に変換される。さらに出力される周波数領域信号を風雑音帯域f1〜fnの信号と、それ以外の帯域fn+1〜fmの音声信号に分割して、風雑音帯域以外の音声信号は、前記図3の帯域合成部10、11と同様に構成される帯域合成部59、60に送られる。前記風雑音帯域の信号は、それぞれに周波数選択/減衰部57,58と、さらに振幅比較部54及び、位相比較部55に入力される。そして振幅比較部54及び、位相比較部55では、チャンネル間で同じ周波数ポイントにおいて、振幅と位相の両者について比較し、その差分成分を減衰係数生成部56に送る。減衰係数生成部56は、生成される減衰係数を周波数選択/減衰部57,58にて、それぞれの周波数ポイントf1〜fn毎に前記減衰係数を施す。周波数選択/減衰部57,58からの信号は、帯域合成部59、60にて風雑音帯域以外の帯域fn+1〜fmの音声信号と合成し、IFFT部61,62にて周波数領域信号から時間領域信号に変換されて出力端子63、64より出力される。
この第1の実施の形態においては、周波数領域信号を風雑音帯域f1〜fnと、風雑音帯域以外の帯域fn+1〜fmに分割して、風雑音帯域f1〜fnの信号について風雑音低減処理を行った後、風雑音帯域以外の帯域fn+1〜fmの音声信号と合成している。しかし、風雑音帯域f1〜fnの信号から風雑音成分のみを抽出して、元の入力信号から減算するようにしてもよい。このように、風雑音成分抽出して元の入力信号から減算する風雑音低減装置の例を図10に示す。
図10は、本発明の第2の実施の形態となる風雑音低減装置を概略的に示すブロック図である。この図10に示す風雑音低減装置において、入力端子70,71には複数の音声チャンネルから複数の音声信号、例えばステレオの右、左チャンネル(Rch,Lch)の音声信号が入力される。入力された複数チャンネルの音声信号は、複数の周波数変換部、例えばFFT(高速フーリエ変換)部72,73により、複数の音声信号が所定フレーム時間ごとに時間領域から周波数領域の信号に変換される。FFT部72,73からの所定周波数(前記風雑音帯域の周波数f1〜fn)において、振幅比較部74により、それぞれ振幅値を算出して複数の音声チャンネル間での信号の振幅差を演算する。また、位相比較部75により、それぞれ位相値を算出して複数の音声チャンネル間での信号の位相差を演算する。抽出係数生成部76は、振幅比較部74からの信号レベルに応じて第1の抽出係数に変換すると共に位相比較部75からの信号レベルに応じて第2の抽出係数に変換する。周波数選択/抽出部77,78は、抽出係数生成部76から出力される第1の抽出係数及び第2の抽出係数で、複数の音声チャンネル毎に、振幅差もしくは位相差が大きい周波数信号を最もレベル抽出するように抽出係数を選択し、選択された抽出係数を乗ずる。複数の逆周波数変換部であるIFFT(逆高速フーリエ変換)部79,80は、周波数選択/抽出部77,78からの信号を時間信号に変換する。各IFFT部79,80からの出力を、減算器83,84に送って、入力端子70,71より遅延器81,82をそれぞれ介した各音声チャンネル信号から減算する。各減算器83,84の出力を各音声チャンネル出力信号として、複数の音声チャンネルの出力端子85,86より取り出している。
この図10において、入力端子70、71よりRch及びLchデジタル信号が入力され、それぞれFFT部72、73にて時間領域信号から周波数領域信号に変換されるとともに、遅延器81、82に送られる。そしてFFT部72、73では、周波数領域の風雑音帯域f1〜fnの信号のみを出力するようにして、それぞれを周波数選択/抽出部77、78と、振幅比較部74及び位相比較部75に入力する。さらに振幅比較部74及び位相比較部75では、チャンネル間で同じ周波数ポイントにおいて、前記図9で示した振幅と位相の両者について比較し、その差分成分を抽出係数生成部77、78に送る。抽出係数生成部77、78で生成される抽出係数を、周波数選択/抽出部77,78にて、それぞれの周波数ポイントf1〜fn毎に前記抽出係数を施して、IFFT部79,80にて周波数領域信号から時間領域信号に変換する。
ここで、図1の第1の実施の形態では、全帯域f1〜fmのなかで風雑音帯域f1〜fnにおける風雑音信号だけを減衰するようにした。これに対して、図10の第2の実施の形態では、前記IFFT部79,80からは風雑音帯域f1〜fnにおける風雑音信号だけを抽出して時間領域信号に変換し出力している。したがって、前記遅延器81,82からの所定遅延が施された全帯域信号から、減算器83、84にて、前記抽出した風雑音信号(IFFT部79,80からの信号)をそれぞれ減算して、出力端子85、86から音声信号のみを出力している。前記遅延器81,82は、風雑音信号の処理遅延分を考慮している。このように、減算する信号のFFT/IFFTなどによる処理時間分を、減算される信号に施すことにより、風雑音の低減処理精度を上げることができる。
次に、第1、第2の実施の形態における風雑音成分の減衰係数もしくは抽出係数の生成のための構成例について、図11を参照しながら説明する。この図11中の振幅計算部92、93と減算器96と絶対値化処理部98と振幅差/係数変換部100とが、図1、図10の振幅比較部(54,74)に相当し、位相計算94、95と減算器97と絶対値化処理99と位相差/係数変換部101とが、位相比較部(55,75)に相当する。また、図11の係数選択部102が、図1の減衰係数生成部(56)もしくは図10の抽出係数生成部(76)に相当し、乗算器103、104が、図1の周波数選択/減衰部(57,78)もしくは図10の周波数選択/抽出部(77,78)に相当する。
図11において、前記FFT部(51,52,71,72)からのステレオ右、左チャンネル(Rch,Lch)の風雑音帯域の周波数領域信号F(r)、F(l)が端子90、91から入力される。ここでは周波数f1〜fnの各ポイントごとに、振幅計算部92、93で各チャンネルごとに、前記図9に示したように振幅を計算し、同様に位相計算部94、95で位相を算出し、それぞれ減算器96,97で各チャンネル(Rch,Lch)の間の差分を算出する。すなわち、振幅成分を減算器96にて振幅差分Diff_A(f1〜fn)を算出し、同様に減算器97で位相差分Diff_Φ(f1〜fn)を算出する。さらに絶対値化処理部98、99を介して絶対値化後に、それぞれ振幅差/係数変換部100と位相差/係数変換部101に送る。なお、ここでの絶対値化処理は符号統一処理であり、例えば正符号化を行い、レベルのみを算出する。
この振幅差/係数変換部100及び位相差/係数変換部101では、それぞれ例えば図12及び図13に示すような変換テーブル(変換特性)を用いて、振幅差分及び位相差分の絶対値を係数に変換している。これらの図12、図13の横軸は、それぞれ前記振幅差分Diff_A(f1〜fn)、位相差分Diff_Φ(f1〜fn)の絶対値化された信号レベルを示し、縦軸は、出力される係数を示す。ここでは簡単のために係数の値として0〜1を割り当てている。これらの図12、図13において、前記第1の実施の形態では破線aに示す減衰係数の変換テーブルを用いて変換し、第2の実施の形態では実線bに示す抽出係数の変換テーブルを用いて変換するようにしている。変換された係数0〜1は、係数選択部102にて、振幅係数と位相係数の値の一方が選択されて、各周波数ポイントごとに乗算器103及び104で周波数信号と係数が乗算されて、端子105、106より出力される。
ここで、係数選択部102は、振幅差/係数変換部100及び位相差/係数変換部101にてそれぞれ生成された振幅係数及び位相係数から一方の係数を選択する。この係数選択部102において、第1の実施の形態では値の小さい方の係数を選択し、第2の実施の形態では値の大きい方の係数を選択し、その変換係数を乗算器103と乗算器104へ乗算係数として供給している。またこの時の単位は、たとえば振幅差分は[dB]、位相差分は[度]、それぞれの変換係数は[無単位]となる。
より具体的に、図12、図13の破線aに示す第1の実施の形態の場合について説明する。振幅差分の変換テーブル(変換特性)を示す図14の(A)で、例えば振幅差分A1が検出されると振幅係数K1に変換され、位相差分の変換テーブル(変換特性)を示す図14の(B)で、例えば位相差分A2が検出されると位相係数K2に変換される。係数K1及びK2はどちらも最小値0〜最大値1の範囲内の値に正規化されているから、この場合はより値の小さいK2が選択されて、乗算器103と乗算器104において共通の乗算係数(減衰係数)となる。
同様に図12、図13の実線bに示す第2の実施の形態の場合において、振幅差分の図15の(A)で例えば振幅差分B1が検出されると振幅係数K1に変換され、位相差分の図15の(B)で例えば位相差分B2が検出されると位相係数K2に変換される。そしてこの場合は、より値の大きいK2が選択されて、乗算器103と乗算器104において共通の乗算係数(抽出係数)となる。
次に、図16を参照しながら、第1の実施の形態における風雑音低減処理の具体例について説明する。図16の(a)〜(d)は、それぞれ周波数領域の前記風雑音帯域f1〜fn内の信号を振幅(上段)と位相(下段)に分けて表しており、横軸の周波数はf1〜f5は風雑音信号を、f8〜f12は音声信号(風雑音帯域内の音声信号)を表している。図16の(a)は、Lch入力周波数信号で、図16の(b)は、Rch入力周波数信号である。前述したように風雑音はマイクロホン近辺に発生する渦状の気流が原因であるために、複数のマイクロホンからの風雑音信号は、各マイク間で相関性がないランダム信号に近似するために振幅も位相もチャンネル間で異なる。逆に音声信号は、マイクロホン間隔よりも十分に遠い音源から入力するために振幅も位相もチャンネル間で同じになりやすい。
したがってこのような信号を、図1に示した第1の実施の形態の風雑音低減装置を用いて図12及び図13の破線曲線a及びcにより処理すると、周波数選択/減衰部56、58の出力には、図16の(c)、(d)に示す信号が取り出される。すなわち、図16の(a)と(b)の同一周波数ポイントにおいて、振幅差成分と位相差成分から図12と図13の変換により独立に振幅係数と位相係数を求めて、係数の小さいほうを選択して振幅と位相の両者に乗算する。このとき、風雑音信号のようなランダム信号はAL1〜AL5及びAR1〜AR5のように減衰し、音声信号を多く含む信号では、AL8〜AL12及びAR8〜AR12のように音声信号のみが残ることになる。これにより、第1の実施の形態の風雑音低減装置の目的が達せられる。
次に、図17を参照しながら、第2の実施の形態における風雑音低減処理の具体例について説明する。図17の(a)〜(d)は、図16の(a)〜(d)と同様に、それぞれ周波数領域の前記風雑音帯域f1〜fn内の信号を振幅(上段)と位相(下段)に分けて表している。横軸の周波数はf1〜f5は風雑音信号を、f8〜f12は音声信号(風雑音帯域内の音声信号)を表している。図17の(a)は、Lch入力周波数信号で、図17の(b)は、Rch入力周波数信号である。このような信号を図10に示した第2の実施の形態の風雑音低減装置を用いて図12及び図13の実線曲線b及びdにより処理すると、周波数選択/抽出部77、78の出力には、図17の(c)、(d)に示す信号が取り出される。すなわち、図17の(a)と(b)同一周波数ポイントにおいて、振幅差成分と位相差成分から図12と図13の変換により独立に振幅係数と位相係数を求めて、第1の実施の形態とは逆に係数の大きいほうを選択して振幅と位相の両者に乗算する。このとき、風雑音信号のようなランダム信号がBL1〜BL5、及びBR1〜BR5のように抽出され、音声信号を多く含む信号では、BL8〜BL12、及びBR8〜BR12のように音声信号のみが減衰することになる。これにより、第2の実施の形態の風雑音低減装置の目的が達せられる。
なお、図12、図13は、変換特性曲線を自由に設定できるため、例えば傾きを大きくすれば、わずかな振幅差や位相差、言い換えれば微風などのわずかな風雑音でも低減効果を上げることができる。また振幅と位相で変換カーブを同じにする必要はなく、それぞれに最適化することも可能である。また変換特性を対数(Log)特性にすることで、変化率が人間の聴覚特性にマッチするようにもできる。さらに入力値が変化しても出力値が変化しない不感帯領域を設けることで、微小レベル差における変動や、突然の大きなレベル差による影響も避けることができる。
例えば、図18の変形例において、前記図12及び図13の実線曲線b及びdに示した第2の実施の形態の変換特性を、図18の(A)及び(B)の実線曲線e及びgに再度示している。この変換特性のような左上方向に凸の形状の曲線e及びgを、例えば破線曲線f及びhのようにそれぞれ右下方向に凸の形状に変形することにより、不感帯領域は同じでも変換特性が異なる。一例として、そよ風のような微風の場合には、検出される振幅差分や位相差分が比較的ゼロに近い、低レベル領域となるが、実線の変換特性曲線e及びgでは、低レベルでも特性が立っている(傾きが大きい)ために微風も低減できる。これに対して、破線の変換特性曲線f及びhでは、低レベルで特性が寝ている(傾きが小さい)ためにほとんど低減しない。逆に台風時のような強風の場合には、入力する振幅差分や位相差分が高レベルの不感帯領域となるため、どちらも低減が最大限に行われる。このように実線の変換特性曲線e及びgに比較して、破線の変換特性曲線f及びhでは低減効果が緩やかとなる。
次に、図19の変形例において、前記図12及び図13の実線曲線b及びdに示した第2の実施の形態の変換特性を、図19の(A)及び(B)の実線曲線e及びgに再度示し、変形例を破線の変換特性曲線f及びhにそれぞれ示している。この変換特性の変形例のように、実線の変換特性曲線e及びgの低レベルの不感帯領域を、破線の変換特性曲線f及びhのように広げる(拡張する)方向に変えることでも、低レベル領域の低減効果が抑制されて、同様の効果が得られる。
このような係数変換例は一例であり、本発明ではこのように変換特性を変えることにより容易に低減効果を制御できるため、複数の特性特性(変換テーブル)をあらかじめ用意しておき、ユーザが自由に切替えて使用することも可能である。
また、図18、図19には、第2の実施の形態の場合のみを図示して説明したが、第1の実施の形態の場合においても同様に変換特性を制御可能であることは勿論である。
ここで、上述したような本発明の実施の形態において、図11の振幅差/係数変換部100及び位相差/係数変換部101として、それぞれ独立した変換テーブル(変換特性)を用いて、振幅差分及び位相差分の絶対値を係数に変換することができる。これらの変換テーブル(変換特性)を独立に設定することで、複数のマイクロホン距離間隔などの実装条件や、風雑音レベルと低減効果の最適化、振幅と位相の検出比率などを状況に合わせて自由に設定することができる。また、前記変換特性を、対数(Log)特性にすることで、人間の聴感特性にあわせることができ、低減時の違和感を抑えることができる。さらに、前記変換特性に、入力する差分値が変化しても、変換される係数値が変化しない不感帯領域を設けることにより、微小レベルにおける変動や、巨大レベル変化などに不感となり、聴感上での違和感を抑えることができる。
次に、本発明の第3の実施の形態の風雑音低減装置について、図20を参照しながら説明する。この図20に示す第3の実施の形態は、前記図10の本発明の第2の実施の形態のFFT処理について、デシメーション(間引き)により処理帯域を落とすようにしたものである。図20における図10の各部構成に対応する部分については、同じ指示符号を付して説明を省略する。
すなわち、図20のFFT部72,73、振幅比較部74、位相比較部75、抽出係数生成部76、周波数選択/抽出部77,78、IFFT部79,80は、前記図10の各部と同様に構成されている。FFT部72、73の前段にデシメーション(間引き)部202、203を配し、またIFFT部79、80の後段にインターポレーション(補間)部206、207を配していることが相違している。図20の入力端子200,201には、図10の入力端子70,71と同様に、例えばステレオの右、左チャンネル(Rch,Lch)の音声信号が入力される。入力端子200からの信号がデシメーション部202及び遅延器204に送られ、入力端子201からの信号がデシメーション部203及び遅延器205に送られている。また、インターポレーション部206からの信号が減算器208に送られて、遅延器204を介した全帯域信号から減算され、インターポレーション部207からの信号が減算器209に送られて、遅延器205を介した全帯域信号から減算される。これらの各減算器208,209の出力を各音声チャンネル出力信号として、出力端子210,211より取り出している。
この第3の実施の形態の動作を説明するために、図21を参照しながらFFT処理におけるデシメーション(間引き)動作について説明する。
前述した第1,第2の実施の形態で用いられるFFT部は、前記図8において説明した一般的なFFT動作を行うことを前提にしているが、本発明がターゲットとする風雑音は、前記図2に示したように、1kHz〜2kHz以下の低域に集中している。このため、ナイキスト周波数(サンプリング周波数/2)に対して、処理周波数に無駄が多い。この点を考慮し、図21に示すように、デシメーション動作によりFFT処理帯域を落として動作させることにより、周波数分解能は不変でFFTの処理負荷と回路を少なくすることができる。図21は、周波数を1/2にデシメートした例を示す。
図21において、FFT部(51,52,71,72)に入力するフレームデータ数を図8と同様に1024とし、サンプリング周波数を44.1kHzとする。ここで、周波数を1/2にデシメート(間引き処理)する場合、ナイキスト周波数は44.1kHz/4(約11kHz)となる。このとき、出力される実数データ数及び虚数データ数はともに256と1/2になるが、周波数分解能は、約43Hz(11kHz/256)と変わらない。これにより振幅算出、位相算出、レベル比較、係数生成などの演算量も1/2となり、処理帯域も十分に確保できる。なお、図21の例では1/2デシメートの場合を示したが、さらに1/4、1/8にデシメートすることも可能である。
また逆に、図8と同じ処理演算量で、図22のように周波数分解能を上げることもできる。つまり、図8の例に対して、FFT部(51,52,71,72)に入力するフレームデータ数を2048と2倍にすれば、ナイキスト周波数は44.1kHz/4(約11kHz)で、周波数分解能を約22Hz(11kHz/512)にすることができる。出力される実数データ数及び虚数データ数は図8と同じでともに512となり、より高精度な周波数で振幅算出、位相算出、レベル比較、係数生成などを行うことができるために、風雑音の低減効果を上げることができる。
次に、図20のデシメーション部202、203については、例えば図23に示すような構成を用いることができる。この図23に示すデシメーション部(202,203)は、デシメーションフィルタ部110とダウンサンプリング部111で構成されている。1/mにデシメートする場合には、デシメーションフィルタ部110は、1/mに帯域制限を行うフィルタであり、サンプリング周波数Fsで動作させる。そしてダウンサンプリング部111では、入力データ数を1/mまで間引き動作を行い、図20のFFT部72、73に送られる。
また、図20のインターポレーション(補間)部206,207については、例えば図24に示すような構成を用いることができる。この図24に示すインターポレーション部(206,207)は、デシメートされた信号を元のサンプリング信号に戻す処理であり、インターポレーションフィルタ部121とアップサンプリング部120で構成される。m倍(×m)にインターポレートする場合には、まずアップサンプリング部120で、入力データ数をmまでゼロ補間動作を行い、さらにインターポレーションフィルタ部121で元のナイキスト周波数に帯域制限を行い出力される。
したがって図20に示す第3の実施の形態では、周波数領域の処理をすべて、風雑音帯域に制限して処理することができる。このため、音声信号と風雑音信号の周波数分離度を上げることができて、音声信号と風雑音信号の周波数がわずかでも異なれば、風雑音成分のみを除去することができ、また効率の良い低減処理が可能になる。
また、前記図1の本発明の第1の実施の形態のFFT処理について、デシメーションにより処理帯域を落とすようにしてもよく、この場合の例を、本発明の第4の実施の形態として図25に示す。すなわち、この図25に示す第4の実施の形態は、前記図1の第1の実施の形態のFFT処理をデシメートしたものであり、図1の各部構成に対応する部分については、同じ指示符号を付して説明を省略する。
図25において、振幅比較部54、位相比較部55、減衰係数生成部56、周波数選択/減衰57,58は、前記図1の各部と同様に構成されている。図25の入力端子300,301には、図1の入力端子50,51と同様に、例えばステレオの右、左チャンネル(Rch,Lch)の音声信号が入力される。入力端子300からの信号がデシメーション部302及びHPF(ハイパスフィルタ)306に送られ、入力端子301からの信号がデシメーション部303及びHPF307に送られている。デシメーション部302,303からの信号がFFT部304に送られ、デシメーション部303からの信号がFFT部305に送られている。周波数選択/減衰57,58からの信号がそれぞれIFFT部308,309に送られ、IFFT部308,309からの信号がそれぞれインターポレーション部310,311に送られている。インターポレーション部310からの信号が帯域合成部312に送られて、HPF306からの信号と合成され、インターポレーション部311からの信号が帯域合成部313に送られて、HPF307からの信号と合成される。これらの各減算器帯域合成部312,313の出力を各音声チャンネル出力信号として、出力端子314,315より取り出している。
この図25に示す第4の実施の形態のデシメーション部302,303は、前記図23と同様に構成される。1/mにデシメートする場合には、入力信号をデシメーションフィルタ部110で1/mに帯域制限し、ダウンサンプリング部111で入力データ数を1/mまで間引き動作を行い、図25のFFT部304,305に送る。FFT部304,305は、間引きされた風雑音帯域信号f1〜fnを出力し、この風雑音帯域信号f1〜fnに対して、振幅比較部54、位相比較部55、減衰係数生成部56、周波数選択/減衰部57,58により、図1の説明と同様な処理が行われる。周波数選択/減衰部57,58からの風雑音成分が減衰した帯域信号f1〜fnがIFFT部308,309に送られて周波数領域の信号が時間領域の信号に逆変換され、それぞれインターポレーション部310,311に送られる。
図25のインターポレーション部310,311は、前記図24と同様に構成され、m倍(×m)にインターポレートする場合には、入力データ数をmまでゼロ補間動作を行い、さらにインターポレーションフィルタで元のナイキスト周波数に帯域制限を行う。帯域合成部312,313で、HPF部306,307を介した音声信号fn+1〜fmと帯域合成する。このHPF部306,307は、入力信号から音声信号fn+1〜fmの帯域を抽出するフィルタであるが、図10における遅延器81,82と同様の時間遅延の役割も兼ねている。そして帯域合成されたf1〜fm信号は、出力端子314,315より出力される。
したがって、図25に示す第4の実施の形態でも、周波数領域の処理をすべて、風雑音帯域に制限して処理することができる。このため、音声信号と風雑音信号の周波数分離度を上げることができて、音声信号と風雑音信号の周波数がわずかでも異なれば、風雑音成分のみを除去することができ、また効率の良い低減処理が可能になる。
上述したような本発明の実施の形態によれば、入力信号をFFTにより周波数領域に変換し、複数チャンネルの同じ周波数ポイントごとに振幅と位相を比較している。よって、ビデオカメラの内蔵マイクからの音声信号のようにチャンネル間の相関性が強い信号は同振幅/同位相として検出され、風雑音信号のように相関性がない信号は大きく振幅/位相が乱れる特徴を利用して風雑音信号のみを除去することができる。このときに風雑音信号でも同じ振幅として検出される誤動作を位相もみることで防ぐことができる。
本発明の実施の形態は、マイクロホンを内蔵する機器、特にビデオカメラなどのように、マイクロホンが近接した機器に適用する場合の効果が大きい。内蔵マイクロホンのみならず、本体に外部取り付けされたマイクロホンからの入力信号でも効果が得られる。また、すでに記録された音声信号に含まれる風雑音を、再生時に除去することが可能である。
また、音響帯域である20Hz〜20kHzに対して、風雑音帯域である1kHz〜2kHz以下の低域のみをFFT出力信号から選択して処理し、それ以外の帯域は処理する必要がないため処理効率が良い。さらに、風雑音帯域にターゲットを絞り処理効率を上げるため、FFTの前にデシメーションを行い、IFFT後にインターポレーションを行うことで、周波数領域の処理データ量を少なくすることができる。また、処理データ量を同じにすればさらに周波数分解能を上げて処理することで低減効果を上げるとともに、音声信号と風雑音信号の分離度を上げることができ、音声信号と風雑音信号の周波数がわずかでも異なれば、風雑音成分のみを除去することができる。
従って、本発明の実施の形態によれば、従来における問題点のような、チャンネル間の信号が無指向性化や、モノラル化することがなく、風雑音信号と同時に音声信号が除去されることがない。また、FFT部/IFFT部もデシメーション動作により、演算量を抑えて、低減が可能になる。
また本発明は、風雑音信号と音声信号の振幅情報と位相情報から自動で風雑音信号のみを低減するが、前記特許文献5の図12に記載されているように、自動雑音低減装置化しても良い。この自動雑音低減装置化は、図26のブロック図に示すような構成により実現できる。
この図26において、端子130からのデジタル入力信号は、風雑音低減部131及びMIX比制御部132に送られる。風雑音低減部131としては、本発明の雑音低減装置、例えば前述した本発明の第1〜第4の実施の形態の風雑音低減装置が用いられる。すなわち、前記図1、図11、図20、図25に示すような構成の風雑音低減装置が、図26の風雑音低減部131として用いられる。これらの図1、図11、図20、図25に示す風雑音低減装置において、風雑音成分の減衰係数もしくは抽出係数の生成のためには、例えば前記図11に示した構成が用いられる。この図11に示す構成中の絶対値化処理部99から得られる絶対値化位相差分信号|Diff_Φ(f1〜fn)|を、図26の総和演算部134に送り、以下の式のように周波数f1〜fnの差分値の総和を演算する。
Figure 2010028307
この総和演算部134で、この式に示す総和値が、別途設定される閾値(Threshold値)と比較される。この総和値が閾値(Threshold値)よりも大きい場合には、MIX比制御部132で入力信号と風雑音低減部131の出力信号のMIX比を、風雑音低減部131の出力側を100%にするように、制御値生成部135で制御値を生成する。逆に総和値が閾値よりも小さい場合には、入力信号側を100%にするように、制御値生成部135で制御値を生成する。
このような構成により、各周波数において個別に低減処理をするのではなく、全風雑音信号成分の増減により本発明の風雑音低減回路がON/OFFするような自動化がなされる。なお、以上の説明では位相差分信号を使用したが、振幅差分信号を使用しても良いし、また両者を使用することも可能である。
なお、本発明は、上記実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、種々の変更が可能である。たとえば、入力チャンネル数としては、ステレオの右、左チャンネル(Rch,Lch)の2chで説明したが、3ch以上でも同様に実施可能である。
本発明の第1の実施の形態となる風雑音低減装置の概略構成を示すブロック図である。 一般的なビデオカメラにおける風雑音信号の周波数特性例を示す図である。 本発明の説明に供する風雑音低減装置を概略的に示すブロック図である。 図3の風雑音低減装置に用いられるレベル比較/選択部8構成の例を示すブロック図である。 図3の風雑音低減装置における風雑音低減の動作原理を説明するための図である。 時間領域から周波数領域の信号に変換する周波数変換部としてのFFT部の概略構成を示すブロック図である。 周波数領域の信号を時間領域の信号に変換する逆周波数変換部としてのIFFT部の概略構成を示すブロック図である。 FFT処理とナイキスト周波数を説明するための図である。 時間領域の実数データが周波数領域の複素数データに変換される場合の複素数データを極座標表現で示す図である。 本発明の第2の実施の形態となる風雑音低減装置の概略構成を示すブロック図である。 本発明の実施の形態における風雑音成分の減衰係数もしくは抽出係数の生成のための構成例を示すブロック図である。 本発明の実施の形態における振幅差/係数変換部の変換テーブル(変換特性)の一例を示す図である。 本発明の実施の形態における位相差/係数変換部の変換テーブル(変換特性)の一例を示す図である。 振幅差分もしくは位相差分に対する減衰係数の変換テーブル(変換特性)の他の例を示す図である。 振幅差分もしくは位相差分に対する抽出係数の変換テーブル(変換特性)の他の例を示す図である。 本発明の第1の実施の形態における風雑音低減の動作原理を説明するための図である。 本発明の第2の実施の形態における風雑音低減の動作原理を説明するための図である。 振幅差分もしくは位相差分に対する抽出係数の変換テーブル(変換特性)の変形例を示す図である。 振幅差分もしくは位相差分に対する抽出係数の変換テーブル(変換特性)の他の変形例を示す図である。 本発明の第3の実施の形態となる風雑音低減装置の概略構成を示すブロック図である。 FFT処理におけるデシメーション(間引き)動作(周波数1/2)を説明するための図である。 フレームデータ数を2倍にしたFFT処理におけるデシメーション(間引き)動作(周波数1/2)を説明するための図である。 間引き動作を行うデシメーション(間引き)部の構成例を示すブロック図である。 補間動作を行うインターポレーション(補間)部の構成例を示すブロック図である。 本発明の第4の実施の形態となる風雑音低減装置の概略構成を示すブロック図である。 本発明の実施の形態となる風雑音低減装置を自動雑音低減装置化した場合の概略構成を示すブロック図である。
符号の説明
50,51,70,71,200,201,300,301 入力端子、 52,53,72,73,210,211,314,315 FFT(高速フーリエ変換)部、 54,74 振幅比較部、 55,75 位相比較部、 56 減衰係数生成部、 57,58 周波数選択/減衰部、 59,60,312,313 帯域合成部、 61,62,79,80,308,309 IFFT(逆高速フーリエ変換)部、 63,64,85,86,210,211,314,315 出力端子、 76 抽出係数生成部、 77,78 周波数選択/抽出部、 81,82,204,205 遅延器、 83,84,208,209 減算器、 202,203,302,303 デシメーション(間引き)部、 206,207,310,311 インターポレーション(補間)部、 306,307 HPF(ハイパスフィルタ)

Claims (11)

  1. 複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに周波数信号に変換する複数の周波数変換部と、
    前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較部と、
    前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較部と、
    前記振幅比較部からの信号レベルに応じて第1の減衰係数に変換すると共に、前記位相比較部からの信号レベルに応じた第2の減衰係数に変換する減衰係数生成部と、
    前記減衰係数生成部から出力される減衰係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル減衰するように前記減衰係数を選択し、選択された減衰係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる複数の選択/減衰部と、
    前記選択/減衰部からの信号と前記複数の周波数変換部における所定周波数以外の信号とを夫々の音声チャンネル毎に帯域合成する複数の帯域合成部と、
    前記帯域合成部からの出力を時間信号に変換する複数の逆周波数変換部とを有し、
    前記各逆周波数変換部の出力を各音声チャンネルの出力信号とする雑音低減装置。
  2. 複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに周波数信号に変換する複数の周波数変換部と、
    前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較部と、
    前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較部と、
    前記振幅比較部からの信号レベルに応じて第1の抽出係数に変換すると共に、前記位相比較部からの信号レベルに応じた第2の抽出係数に変換する抽出係数生成部と、
    前記抽出係数生成部から出力される抽出係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル抽出するように前記抽出係数を選択し、選択された抽出係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる複数の選択/抽出部と、
    前記選択/抽出部からの出力を時間信号に変換する複数の逆周波数変換部と、
    前記各逆周波数変換部の出力を前記入力された各音声チャンネルの信号から減算する複数の減算器とを有し、
    前記各減算器の出力を各音声チャンネルの出力信号とする雑音低減装置。
  3. 前記周波数変換部は、高速フーリエ変換(FFT)処理を行うFFT部であり、前記逆周波数変換部は、逆高速フーリエ変換(IFFT)処理を行うIFFT部である請求項1又は2に記載の雑音低減装置。
  4. 前記FFT部及び前記IFFT部は、入力信号のサンプリング周波数を前記所定周波数の最大周波数をナイキスト周波数とするサンプリング周波数付近まで間引き動作させる請求項3記載の雑音低減装置。
  5. 前記IFFT部の出力を、前記所定周波数の最大周波数をナイキスト周波数とするサンプリング周波数付近から、前記音声チャンネルの出力信号のサンプリング周波数まで補間動作させる請求項3記載の雑音低減装置。
  6. 前記所定周波数は、風雑音帯域である請求項1又は2に記載の雑音低減装置。
  7. 複数の音声チャンネルから入力された複数の音声信号に対して、入力信号のサンプリング周波数を所定周波数の最大周波数をナイキスト周波数とするサンプリング周波数付近まで間引き動作させる複数の間引き部と、
    前記間引き部からの信号を所定フレーム時間ごとに周波数信号に変換する複数の周波数変換部と、
    前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較部と、
    前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較部と、
    前記振幅比較部からの信号レベルに応じて第1の減衰係数に変換すると共に、前記位相比較部からの信号レベルに応じた第2の減衰係数に変換する減衰係数生成部と、
    前記減衰係数生成部から出力される減衰係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル減衰するように前記減衰係数を選択し、選択された減衰係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる複数の選択/減衰部と、
    前記選択/減衰部からの出力を時間信号に変換する複数の逆周波数変換部と、
    前記逆周波数変換部の出力を、前記所定周波数の最大周波数をナイキスト周波数とするサンプリング周波数付近から、前記音声チャンネルの出力信号のサンプリング周波数まで補間動作させる複数の補間部と、
    前記補間部からの信号と前記複数の音声チャンネルから入力された複数の音声信号の所定周波数以外の信号とを夫々の音声チャンネル毎に帯域合成する複数の帯域合成部とを有し、
    前記各帯域合成部の出力を各音声チャンネル出力信号とする雑音低減装置。
  8. 複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに複数の周波数変換部により周波数信号に変換する周波数変換工程と、
    前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較工程と、
    前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較工程と、
    前記振幅比較工程からの信号レベルに応じて第1の減衰係数に変換すると共に、前記位相比較工程からの信号レベルに応じた第2の減衰係数に変換する減衰係数生成工程と、
    前記減衰係数生成工程から出力される減衰係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル減衰するように前記減衰係数を選択し、選択された減衰係数を前記複数の音声チャンネル毎に前記所定周波数信号に乗ずる選択/減衰工程と、
    前記選択/減衰工程からの信号と前記複数の周波数変換工程における所定周波数以外の信号とを夫々の音声チャンネル毎に帯域合成する帯域合成工程と、
    前記帯域合成工程からの出力を複数の逆周波数変換部により時間信号に変換する逆周波数変換工程とを有し、
    前記逆周波数変換工程の出力を各音声チャンネルの出力信号とする雑音低減方法。
  9. 複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに複数の周波数変換部により周波数信号に変換する周波数変換工程と、
    前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較工程と、
    前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較工程と、
    前記振幅比較工程からの信号レベルに応じて第1の抽出係数に変換すると共に、前記位相比較工程からの信号レベルに応じた第2の抽出係数に変換する抽出係数生成工程と、
    前記抽出係数生成工程から出力される抽出係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル抽出するように前記抽出係数を選択し、選択された抽出係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる選択/抽出工程と、
    前記選択/抽出工程からの出力を時間信号に変換する逆周波数変換工程と、
    前記各逆周波数変換工程からの出力を前記入力された各音声チャンネルの信号から減算する減算工程とを有し、
    前記減算工程からの出力を各音声チャンネルの出力信号とする雑音低減方法。
  10. 複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに複数の周波数変換部により周波数信号に変換する周波数変換工程と、
    前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較工程と、
    前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較工程と、
    前記振幅比較工程からの信号レベルに応じて第1の減衰係数に変換すると共に、前記位相比較工程からの信号レベルに応じた第2の減衰係数に変換する減衰係数生成工程と、
    前記減衰係数生成工程から出力される減衰係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル減衰するように前記減衰係数を選択し、選択された減衰係数を前記複数の音声チャンネル毎に前記所定周波数信号に乗ずる選択/減衰工程と、
    前記選択/減衰工程からの信号と前記複数の周波数変換工程における所定周波数以外の信号とを夫々の音声チャンネル毎に帯域合成する帯域合成工程と、
    前記帯域合成工程からの出力を複数の逆周波数変換部により時間信号に変換する逆周波数変換工程とを有し、
    前記逆周波数変換工程の出力を各音声チャンネルの出力信号とする雑音低減処理をコンピュータに行わせるためのプログラム。
  11. 複数の音声チャンネルから入力された複数の音声信号を所定フレーム時間ごとに複数の周波数変換部により周波数信号に変換する周波数変換工程と、
    前記周波数変換部からの所定周波数において、それぞれ振幅値を算出して、前記複数の音声チャンネル間での信号の振幅差を演算する振幅比較工程と、
    前記周波数変換部からの所定周波数において、それぞれ位相値を算出して、前記複数の音声チャンネル間での信号の位相差を演算する位相比較工程と、
    前記振幅比較工程からの信号レベルに応じて第1の抽出係数に変換すると共に、前記位相比較工程からの信号レベルに応じた第2の抽出係数に変換する抽出係数生成工程と、
    前記抽出係数生成工程から出力される抽出係数で、前記振幅差もしくは位相差が大きい周波数信号を最もレベル抽出するように前記抽出係数を選択し、選択された抽出係数を前記複数の音声チャンネル毎の前記所定周波数信号に乗ずる選択/抽出工程と、
    前記選択/抽出工程からの出力を時間信号に変換する逆周波数変換工程と、
    前記各逆周波数変換工程からの出力を前記入力された各音声チャンネルの信号から減算する減算工程とを有し、
    前記減算工程からの出力を各音声チャンネルの出力信号とする雑音低減処理をコンピュータに行わせるためのプログラム。
JP2008185103A 2008-07-16 2008-07-16 雑音低減装置及び方法、並びにプログラム Withdrawn JP2010028307A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008185103A JP2010028307A (ja) 2008-07-16 2008-07-16 雑音低減装置及び方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008185103A JP2010028307A (ja) 2008-07-16 2008-07-16 雑音低減装置及び方法、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2010028307A true JP2010028307A (ja) 2010-02-04

Family

ID=41733746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008185103A Withdrawn JP2010028307A (ja) 2008-07-16 2008-07-16 雑音低減装置及び方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2010028307A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012195772A (ja) * 2011-03-16 2012-10-11 Canon Inc 音声信号処理装置及びその制御方法、コンピュータプログラム
JP2013125197A (ja) * 2011-12-15 2013-06-24 Fujitsu Ltd 信号処理装置、信号処理方法および信号処理プログラム
WO2013108590A1 (ja) * 2012-01-20 2013-07-25 パナソニック株式会社 直交変換誤差補正装置
JP2014508466A (ja) * 2011-02-10 2014-04-03 ドルビー ラボラトリーズ ライセンシング コーポレイション 風の検出及び抑圧のためのシステム及び方法
JP5663112B1 (ja) * 2014-08-08 2015-02-04 リオン株式会社 音信号処理装置、及び、それを用いた補聴器
JP2015082808A (ja) * 2013-10-24 2015-04-27 トヨタ自動車株式会社 風検出装置
JP2015233200A (ja) * 2014-06-09 2015-12-24 ローム株式会社 オーディオ信号処理回路、それを用いた電子機器
US9357307B2 (en) 2011-02-10 2016-05-31 Dolby Laboratories Licensing Corporation Multi-channel wind noise suppression system and method

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015159605A (ja) * 2011-02-10 2015-09-03 ドルビー ラボラトリーズ ライセンシング コーポレイション 風の検出及び抑圧のためのシステム及び方法
US9761214B2 (en) 2011-02-10 2017-09-12 Dolby Laboratories Licensing Corporation System and method for wind detection and suppression
US9357307B2 (en) 2011-02-10 2016-05-31 Dolby Laboratories Licensing Corporation Multi-channel wind noise suppression system and method
JP2014508466A (ja) * 2011-02-10 2014-04-03 ドルビー ラボラトリーズ ライセンシング コーポレイション 風の検出及び抑圧のためのシステム及び方法
US9313597B2 (en) 2011-02-10 2016-04-12 Dolby Laboratories Licensing Corporation System and method for wind detection and suppression
JP2012195772A (ja) * 2011-03-16 2012-10-11 Canon Inc 音声信号処理装置及びその制御方法、コンピュータプログラム
US9271075B2 (en) 2011-12-15 2016-02-23 Fujitsu Limited Signal processing apparatus and signal processing method
JP2013125197A (ja) * 2011-12-15 2013-06-24 Fujitsu Ltd 信号処理装置、信号処理方法および信号処理プログラム
US8897350B2 (en) 2012-01-20 2014-11-25 Panasonic Corporation Orthogonal transform error corrector
WO2013108590A1 (ja) * 2012-01-20 2013-07-25 パナソニック株式会社 直交変換誤差補正装置
JP2015082808A (ja) * 2013-10-24 2015-04-27 トヨタ自動車株式会社 風検出装置
JP2015233200A (ja) * 2014-06-09 2015-12-24 ローム株式会社 オーディオ信号処理回路、それを用いた電子機器
JP5663112B1 (ja) * 2014-08-08 2015-02-04 リオン株式会社 音信号処理装置、及び、それを用いた補聴器

Similar Documents

Publication Publication Date Title
JP2010028307A (ja) 雑音低減装置及び方法、並びにプログラム
JP4356670B2 (ja) 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
JP6703525B2 (ja) 音源を強調するための方法及び機器
JP5272920B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP5338259B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
KR20090037692A (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
US9747919B2 (en) Sound processing apparatus and recording medium storing a sound processing program
JP2011139378A (ja) 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
US20140161271A1 (en) Noise eliminating device, noise eliminating method, and noise eliminating program
JP6226301B2 (ja) 指向性マイクロホン装置、音響信号処理方法およびプログラム
WO2016181752A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP5034734B2 (ja) 音処理装置およびプログラム
JP5232121B2 (ja) 信号処理装置
CN106941006B (zh) 用于音频信号的分离和低音增强的方法、装置和系统
JP2009044588A (ja) 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体
JP2011203414A (ja) 雑音及び残響抑圧装置及びその方法
JP2019068133A (ja) 収音装置、プログラム及び方法
JP5107956B2 (ja) 雑音抑圧方法、装置およびプログラム
JP2014102317A (ja) 雑音除去装置、雑音除去方法、及びプログラム
JP2017181761A (ja) 信号処理装置及びプログラム、並びに、ゲイン処理装置及びプログラム
JP5316127B2 (ja) 音処理装置およびプログラム
JP6263890B2 (ja) 音声信号処理装置及びプログラム
JP2020036139A (ja) 収音装置、プログラム及び方法
JP5060589B2 (ja) 収音再生装置、方法及びプログラム、ハンズフリー装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20111004