JP2012168477A - Noise estimation device, signal processor, imaging apparatus, and program - Google Patents
Noise estimation device, signal processor, imaging apparatus, and program Download PDFInfo
- Publication number
- JP2012168477A JP2012168477A JP2011031439A JP2011031439A JP2012168477A JP 2012168477 A JP2012168477 A JP 2012168477A JP 2011031439 A JP2011031439 A JP 2011031439A JP 2011031439 A JP2011031439 A JP 2011031439A JP 2012168477 A JP2012168477 A JP 2012168477A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- sound signal
- feature vector
- unit
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、ノイズ推定装置、信号処理装置、撮像装置、及びプログラムに関する。 The present invention relates to a noise estimation device, a signal processing device, an imaging device, and a program.
音信号に重畳しているノイズを低減する技術が知られている(例えば、特許文献1を参照)。非特許文献1に記載されている技術では、音信号に重畳している定常ノイズを、予め定められている推定ノイズによって低減する。
A technique for reducing noise superimposed on a sound signal is known (see, for example, Patent Document 1). In the technique described in
しかしながら、非特許文献1に記載されている技術では、例えば、大きさが非定常なノイズを低減するような場合、音信号に実際に混入しているノイズと推定ノイズとの間に差が生じ、ノイズの過大減算あるいは過小減算により、音の劣化もしくは雑音の残存が発生することがある。また、例えば、間欠的に発生するノイズを低減するような場合、ノイズが混入していない箇所では、ノイズを過大に減算してしまい、音の劣化が発生することがある。
つまり、非特許文献1に記載されている技術では、音信号に重畳しているノイズを適切に低減できないという問題がある。
However, in the technique described in
That is, the technique described in
本発明は、上記問題を解決すべくなされたもので、その目的は、音信号に重畳しているノイズを適切に低減することができるノイズ推定装置、信号処理装置、撮像装置、及びプログラムを提供することにある。 The present invention has been made to solve the above problems, and an object thereof is to provide a noise estimation device, a signal processing device, an imaging device, and a program capable of appropriately reducing noise superimposed on a sound signal. There is to do.
上記問題を解決するために、本発明は、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、前記音信号と前記ノイズとの類似の度合いを示すノイズ類似度を算出する算出部と、前記算出部により算出された前記ノイズ類似度に基づいて、前記音信号に含まれる推定ノイズを推定するノイズ推定部とを備えることを特徴とするノイズ推定装置である。 In order to solve the above problem, the present invention calculates a noise similarity indicating the degree of similarity between the sound signal and the noise based on the frequency spectrum of the input sound signal and the frequency spectrum of the noise. A noise estimation device comprising: a calculation unit; and a noise estimation unit that estimates an estimated noise included in the sound signal based on the noise similarity calculated by the calculation unit.
また、本発明は、上記のノイズ推定装置と、前記ノイズ推定装置によって推定された前記推定ノイズに基づいて、前記音信号に含まれるノイズを低減するノイズ低減処理部と、を備えることを特徴とする信号処理装置である。 In addition, the present invention includes the above noise estimation device, and a noise reduction processing unit that reduces noise included in the sound signal based on the estimated noise estimated by the noise estimation device. It is a signal processing device.
また、本発明は、上記の信号処理装置を備えることを特徴とする撮像装置である。 Moreover, this invention is an imaging device provided with said signal processing apparatus.
また、本発明は、ノイズ推定装置としてのコンピュータに、算出部が、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、前記音信号と前記ノイズとの類似の度合いを示すノイズ類似度を算出する算出手順と、ノイズ推定部が、前記算出手順により算出された前記ノイズ類似度に基づいて、前記音信号に含まれる推定ノイズを推定するノイズ推定手順とを実行させるためのプログラムである。 Further, according to the present invention, in a computer as a noise estimation device, the calculation unit indicates the degree of similarity between the sound signal and the noise based on the frequency spectrum of the input sound signal and the frequency spectrum of the noise. A calculation procedure for calculating a noise similarity, and a noise estimation unit for executing a noise estimation procedure for estimating an estimated noise included in the sound signal based on the noise similarity calculated by the calculation procedure It is a program.
本発明によれば、音信号に重畳しているノイズを適切に低減することができる。 According to the present invention, it is possible to appropriately reduce noise superimposed on a sound signal.
以下、本発明の一実施形態による信号処理装置及び撮像装置について図面を参照して説明する。
図1は、本実施形態による撮像装置1を示す概略ブロック図である。
この図において、本実施形態による撮像装置1は、撮像部10、バッファメモリ部30、画像処理部40、表示部50、記憶部60、通信部70、操作部80、CPU(Central Processing Unit)90、マイク21、A/D(Analog/Digital)変換部22、音信号処理部23、及びバス300を備えている。この撮像装置1が備える構成のうち、例えば、音信号処理部23と、記憶部60の一部とが、信号処理装置100に対応する。また、例えば、音信号処理部23の一部と、記憶部60の一部とが、ノイズ推定装置150に対応する。
Hereinafter, a signal processing apparatus and an imaging apparatus according to an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a schematic block diagram illustrating the
In this figure, the
撮像部10は、光学系11と、撮像素子19と、A/D変換部20とを含み、設定された撮像条件(例えば絞り値、露出値等)に従ってCPU90により制御され、光学系11による光学像を撮像素子19に結像させて、A/D変換部20によってデジタル信号に変換された当該光学像に基づく画像データを生成する。
The
光学系11は、焦点調整レンズ(以下、AF(Auto Focus)レンズという)12と、手振れ防止用レンズ(以下、VR(Vibration Reduction)レンズという)13と、ズームレンズ14と、ズームエンコーダ15と、レンズ駆動部16と、AFエンコーダ17と、手振れ防止部18とを備えている。
この光学系11は、ズームレンズ14、VRレンズ13、及びAFレンズ12を通過した光学像を撮像素子19の受光面に導く。
The optical system 11 includes a focus adjustment lens (hereinafter referred to as an AF (Auto Focus) lens) 12, a camera shake prevention lens (hereinafter referred to as a VR (Vibration Reduction) lens) 13, a zoom lens 14, a
The optical system 11 guides the optical image that has passed through the zoom lens 14, the VR lens 13, and the AF lens 12 to the light receiving surface of the
レンズ駆動部16は、後述するCPU90から入力される駆動制御信号に基づいて、ズームレンズ14又はAFエンコーダ17の位置を制御する。
手振れ防止部18は、後述するCPU90から入力される駆動制御信号に基づいて、VRレンズ13の位置を制御する。この手振れ防止部18は、VRレンズ13の位置を検出していてもよい。
The
The camera shake prevention unit 18 controls the position of the VR lens 13 based on a drive control signal input from a
ズームエンコーダ15は、ズームレンズ14の位置を表わすズームポジションを検出し、検出したズームポジションをCPU90に出力する。
AFエンコーダ17は、AFレンズ12の位置を表わすフォーカスポジションを検出し、検出したズームポジション及びフォーカスポジションをCPU90に出力する。
The
The
なお、上述した光学系11は、撮像装置1に取り付けられて一体とされていてもよいし、撮像装置1に着脱可能に取り付けられてもよい。
The optical system 11 described above may be attached to and integrated with the
撮像素子19は、例えば、受光面に結像した光学像を電気信号に変換して、A/D変換部20に出力する。
また、撮像素子19は、操作部80を介して撮影指示を受け付けた際に得られる画像データを、撮影された静止画の撮影画像データとして、A/D変換部20や画像処理部40を介して、記憶媒体200に記憶させる。
For example, the
In addition, the
一方、撮像素子19は、例えば、操作部80を介して撮像指示を受け付けていない状態において、連続的に得られる画像データをスルー画データとして、A/D変換部20や画像処理部40を介して、CPU90及び表示部50に出力する。
On the other hand, for example, the
A/D変換部20は、撮像素子19によって変換された電子信号をアナログ/デジタル変換し、この変換したデジタル信号である画像データを出力する。
The A /
バッファメモリ部30は、撮像部10によって撮像された画像データや、音信号処理部23により変換された音信号等を、一時的に記憶する。
画像処理部40は、記憶部60に記憶されている画像処理条件を参照して、バッファメモリ部30、又は、記憶媒体200に記録されている画像データに対して画像処理をする。
The buffer memory unit 30 temporarily stores the image data captured by the
The
表示部50は、例えば、液晶ディスプレイであって、撮像部10によって得られた画像データや、操作画面等を表示する。
The
記憶部60は、CPU90によってシーン判定の際に参照される判定条件や、撮像条件等を記憶する。また、記憶部60は、後述する音信号処理部23において音信号のノイズを低減するノイズ低減処理に使用する情報を記憶する。ここで、ノイズ低減処理に使用する情報とは、例えば、後述するノイズ周波数特徴ベクトル等である。
また、記憶部60は、ノイズ周波数特徴ベクトル記憶部61を備えている。
The
The
ノイズ周波数特徴ベクトル記憶部61は、後述するノイズ周波数特徴ベクトルを記憶する。ノイズ周波数特徴ベクトルは、例えば、撮像装置1の製造又は出荷検査の際に、予め記憶されている。また、ノイズ周波数特徴ベクトル記憶部61は、対応するノイズの種類に応じて、複数のノイズ周波数特徴ベクトルを記憶していてもよい。例えば、ズームレンズ14、VRレンズ13、及びAFレンズ12の機構音のうちのいずれか1つによるノイズ(雑音)に対応するノイズ周波数特徴ベクトルが、それぞれノイズ周波数特徴ベクトル記憶部61に記憶されていてもよい。
The noise frequency feature
マイク21は、音を収音し、収音した音に応じた音信号を出力する。この音信号は、アナログ信号である。
A/D変換部22は、マイク21から入力されたアナログ信号である音信号を、デジタル信号である音信号に、アナログデジタル変換する。
The microphone 21 collects sound and outputs a sound signal corresponding to the collected sound. This sound signal is an analog signal.
The A / D conversion unit 22 performs analog-to-digital conversion of a sound signal that is an analog signal input from the microphone 21 into a sound signal that is a digital signal.
音信号処理部23は、A/D変換部22によりデジタル信号に変換された音信号に対して、例えば、ノイズを低減するなどの音信号処理を実行し、この音信号処理した音信号を記憶媒体200に記憶させる。音信号処理部23は、ノイズ低減処理部24、周波数特徴ベクトル生成部231、内積算出部232、及びノイズ推定部233を備えている。この音信号処理部23の詳細については、後述する。
なお、音信号処理部23により音信号処理された音信号が記憶媒体200に記憶される場合、撮像素子19により撮像された画像データと、時間的に関係付けられて記憶されてもよいし、音信号を含む動画として記憶されてもよい。
The sound
When the sound signal processed by the sound
通信部70は、カードメモリ等の取り外しが可能な記憶媒体200と接続され、この記憶媒体200への情報の書込み、読み出し、あるいは消去を行う。
操作部80は、例えば、電源スイッチやシャッターボタン、その他の操作キーを含み、ユーザによって操作されることでユーザの操作入力を受け付け、CPU90に出力する。
The
The
記憶媒体200は、撮像装置1に対して着脱可能に接続される記憶部であって、例えば、撮像部10によって生成された(撮影された)画像データや、音信号処理部23により音信号処理された音信号を記憶する。
The
CPU90は、撮像装置1全体を制御するが、一例としては、ズームエンコーダ15から入力されるズームポジション、及び、AFエンコーダ17から入力されるフォーカスポジションと、操作部80から入力される操作入力とに基づいて、ズームエンコーダ15及びAFエンコーダ17の位置を制御する駆動制御信号を生成する。CPU90は、この駆動制御信号に基づいて、レンズ駆動部16を介してズームエンコーダ15及びAFエンコーダ17の位置を制御する。
The
バス300は、撮像部10と、音信号処理部23と、バッファメモリ部30と、画像処理部40と、表示部50と、記憶部60と、通信部70と、操作部80と、CPU90とに接続され、各部から出力されたデータ等を転送する。
The
次に、図2を参照して、図1の構成のうち、信号処理装置100及び音信号処理部23の詳細な構成について説明する。
図2は、本実施形態における信号処理装置100を示す概略ブロック図である。
この図において、信号処理装置100は、音信号処理部23とノイズ周波数特徴ベクトル記憶部61とを備えている。なお、ノイズ周波数特徴ベクトル記憶部61は、例えば、記憶部60に備えられ、記憶部60の一部である。また、信号処理装置100は、ノイズ推定装置150を備えており、信号処理装置100の構成のうち、例えば、周波数特徴ベクトル生成部231、内積算出部232、ノイズ推定部233、及びノイズ周波数特徴ベクトル記憶部61が、このノイズ推定装置150に対応する。
Next, detailed configurations of the
FIG. 2 is a schematic block diagram showing the
In this figure, the
音信号処理部23は、A/D変換部22によりデジタル信号に変換された音信号に対して、例えば、ノイズを低減するなどの音信号処理を実行し、この音信号処理した音信号を記憶媒体200に記憶させる。なお、本実施形態において、「ノイズ」とは、動作部による動作によって発生し、音信号に含まれる(すなわち、音信号に重畳している)ノイズ信号のことである。すなわち、「ノイズ」とは、非定常ノイズである。
The sound
ここでいう動作部とは、機構部とも呼び、一例としては、上述したズームレンズ14、VRレンズ13、AFレンズ12、又は操作部80のことである。この動作部とは、撮像装置1が備えている構成のうち、動作することにより、又は、動作されることにより、音が生じる(又は、音が生じる可能性がある)構成である。
また、この動作部とは、撮像装置1が備えている構成のうち、動作することにより生じた音、又は、動作されることにより生じた音が、マイク21により収音される(又は、収音される可能性のある)構成である。
The operation unit referred to here is also called a mechanism unit, and as an example, is the above-described zoom lens 14, VR lens 13, AF lens 12, or
In addition, the operation unit refers to a sound that is generated by operation or a sound that is generated by operation in the configuration of the imaging apparatus 1 (or is collected). It may be sounded).
また、音信号処理部23は、CPU90から供給される制御信号に基づいて、ノイズを低減するなどの音信号処理を実行する。
音信号処理部23は、周波数特徴ベクトル生成部231、内積算出部232、ノイズ推定部233、及びノイズ低減処理部24を備えている。
The sound
The sound
周波数特徴ベクトル生成部231は、A/D変換部22によりデジタル信号に変換された音信号を、フレーム単位でフーリエ変換(例えば、FFT(Fast Fourier Transform)変換)して周波数スペクトルに変換する。なお、フレームとは、音信号を分割した区間のことである。ここでは、例えば、予め定められた期間を2分の1期間ずつずらした区間をフレームをとした場合について説明する。
The frequency feature
そして、周波数特徴ベクトル生成部231は、変換した音信号の周波数スペクトルに基づいて入力周波数特徴ベクトルを生成する。つまり、周波数特徴ベクトル生成部231は、音信号を周波数スペクトルに変換し、変換した音信号の周波数スペクトルに基づいて、入力周波数特徴ベクトルを生成する。
Then, the frequency feature
なお、入力周波数特徴ベクトルは、音信号の周波数スペクトルにおける各周波数成分(周波数ビン)に対応する強度(例えば、絶対値)を要素として生成されたベクトルである。この入力周波数特徴ベクトルについての詳細は、図3を参照して後述する。 Note that the input frequency feature vector is a vector generated with elements (for example, absolute values) corresponding to frequency components (frequency bins) in the frequency spectrum of the sound signal. Details of the input frequency feature vector will be described later with reference to FIG.
さらに、周波数特徴ベクトル生成部231は、生成した入力周波数特徴ベクトルを内積算出部232及びノイズ低減処理部24に供給する。
Further, the frequency feature
内積算出部232(算出部)は、周波数特徴ベクトル生成部231から供給された入力周波数特徴ベクトルと、ノイズ周波数特徴ベクトル記憶部61から読み出したノイズ周波数特徴ベクトルとの内積値に基づいて、ノイズ類似度を算出する。一例として、内積算出部232(算出部)は、この入力周波数特徴ベクトルと、ノイズ周波数特徴ベクトルとの内積値を、ノイズ類似度として算出する。このノイズ類似度とは、音信号とノイズとの類似の度合いを示す情報である。すなわち、ノイズ類似度とは、音信号にノイズがどの程度含まれて(混入されて)いるかを示す値である。内積算出部232は、算出したノイズ類似度をノイズ推定部233に供給する。
The inner product calculation unit 232 (calculation unit) calculates noise based on the inner product value of the input frequency feature vector supplied from the frequency feature
ここで、ノイズ周波数特徴ベクトルとは、ノイズの周波数スペクトルに基づいて生成されたノイズの特徴を示すベクトルであり、ノイズ周波数特徴ベクトル記憶部61に予め記憶されている。また、このノイズ周波数特徴ベクトルは、ノイズの周波数スペクトルにおける各周波数成分(周波数ビン)に対応する強度(例えば、絶対値)を要素として生成される。
Here, the noise frequency feature vector is a vector indicating the feature of noise generated based on the frequency spectrum of noise, and is stored in advance in the noise frequency feature
つまり、ノイズ周波数特徴ベクトルは、ノイズの周波数スペクトルに基づいて生成され、入力周波数特徴ベクトルは、音信号の周波数スペクトルに基づいて生成される。そのため、言いかえると、内積算出部232は、周波数スペクトルとノイズの周波数スペクトルとに基づいて、上述のノイズ類似度を算出する。
That is, the noise frequency feature vector is generated based on the frequency spectrum of noise, and the input frequency feature vector is generated based on the frequency spectrum of the sound signal. Therefore, in other words, the inner
また、ノイズ周波数特徴ベクトルは、例えば、正規化した単位ベクトルでもよい。つまり、正規化前のノイズ周波数特徴ベクトルをn0とすると、正規化されたノイズ周波数特徴ベクトルnは、式(1)として示される。 The noise frequency feature vector may be a normalized unit vector, for example. That is, assuming that the noise frequency feature vector before normalization is n 0 , the normalized noise frequency feature vector n is expressed as Expression (1).
ノイズ推定部233は、内積算出部232により算出されたノイズ類似度に基づいて、音信号に含まれる推定ノイズを推定する。つまり、本実施形態では、ノイズ推定部233は、入力周波数特徴ベクトルと、ノイズ周波数特徴ベクトルnとの内積値に基づいて、推定ノイズを推定する。ここで推定ノイズ(ベクトル〜nk)は、式(2)として示される。なお、ここで、記号“〜”は推定値を表し、本文中の“〜”は直後の文字の真上に付けられた記号を表すこととする。
The
ここで、kは、フレーム番号を示し、ベクトルXkは、k番目のフレームにおける入力周波数ベクトルを示す。
ノイズ推定部233は、式(2)によって算出した推定ノイズ(ベクトル〜nk)をノイズ低減処理部24に供給する。
Here, k indicates a frame number, and vector X k indicates an input frequency vector in the k-th frame.
The
ノイズ低減処理部24は、周波数特徴ベクトル生成部231によって生成された入力周波数特徴ベクトルと、ノイズ推定部233によって推定された推定ノイズ(ベクトル〜nk)とに基づいて、音信号に含まれるノイズを低減する処理を実行する。つまり、ノイズ低減処理部24は、ノイズ推定装置150によって推定された推定ノイズに基づいて、音信号に含まれるノイズを低減する。そして、ノイズ低減処理部24は、このノイズを低減する処理を実行した音信号を記憶媒体200に記憶させる。
また、ノイズ低減処理部24は、ノイズ減算部234及び逆変換部235を備えている。
Noise
In addition, the noise
ノイズ減算部234は、周波数特徴ベクトル生成部231によって生成された入力周波数特徴ベクトルXkと、ノイズ推定部233によって推定された推定ノイズ(ベクトル〜nk)とに基づいて、音信号に含まれるノイズを減算して、ノイズを減算した目的音の推定周波数特徴ベクトル〜Skを算出する。ノイズ減算部234は、式(3)に示される関係式によって、目的音の推定周波数特徴ベクトル〜Skを算出する。なお、ここで目的音とは、使用者が、撮像装置1のマイク21によって収音しようとしている目的の音(録音対象の音)である。
ノイズ減算部234は、算出した目的音の推定周波数特徴ベクトル〜Skを、逆変換部235に供給する。
The
逆変換部235は、ノイズ減算部234によって算出された目的音の推定周波数特徴ベクトル〜Skを周波数スペクトルに戻す。そして、逆変換部235は、ノイズが混入した音信号の位相情報に基づいて時間波形に逆フーリエ変換(例えば、逆FFT変換)し、ノイズを低減した目的音の音信号を合成する。さらに、逆変換部235は、通信部70を介して、生成した音信号を記憶媒体200に記憶させる。
なお、逆変換部235は、推定周波数特徴ベクトル〜Skを変換した周波数スペクトルに負の値が含まれる場合には、その負の値を“0”に置き換えて、逆フーリエ変換する。
In addition, when a negative value is included in the frequency spectrum obtained by converting the estimated frequency feature vector to Sk, the
次に、図3を参照して、ノイズ推定装置150が音信号に含まれるノイズを推定する概念を詳細に説明する。
図3は、本実施形態における入力周波数特徴ベクトルとノイズ周波数特徴ベクトルの一例を示す概念図である。ここでは、本実施形態における概念を説明するために、周波数成分数(周波数ビン数)が2つの場合について説明する。
Next, with reference to FIG. 3, the concept that the
FIG. 3 is a conceptual diagram showing an example of an input frequency feature vector and a noise frequency feature vector in the present embodiment. Here, in order to explain the concept in the present embodiment, a case where the number of frequency components (number of frequency bins) is two will be described.
図3(a)は、ノイズの周波数スペクトルと音信号の周波数スペクトルの一例を示している。この図において、各グラフは、横軸が周波数成分(周波数ビンB1及びB2)を示し、縦軸が強度(例えば、PSD(Power Spectrum Density)など)を示している。 FIG. 3A shows an example of a frequency spectrum of noise and a frequency spectrum of a sound signal. In this graph, in each graph, the horizontal axis represents frequency components (frequency bins B1 and B2), and the vertical axis represents intensity (for example, PSD (Power Spectrum Density)).
また、この図において、周波数スペクトルW1は、ノイズの周波数スペクトルを示している。また、周波数スペクトルW2は、入力音信号(音信号)x1の周波数スペクトルを示し、周波数スペクトルW3は、入力音信号(音信号)x2の周波数スペクトルを示している。 Moreover, in this figure, the frequency spectrum W1 has shown the frequency spectrum of noise. The frequency spectrum W2 indicates the frequency spectrum of the input sound signal (sound signal) x1, and the frequency spectrum W3 indicates the frequency spectrum of the input sound signal (sound signal) x2.
図3(b)は、図3(a)に示したノイズの周波数スペクトルと音信号の周波数スペクトルとを周波数特徴ベクトルに変換したベクトル空間を示している。この図において、横軸は、周波数ビンB1の強度を示し、縦軸は、周波数ビンB2の強度を示している。 FIG. 3B shows a vector space obtained by converting the frequency spectrum of noise and the frequency spectrum of the sound signal shown in FIG. In this figure, the horizontal axis indicates the intensity of the frequency bin B1, and the vertical axis indicates the intensity of the frequency bin B2.
また、この図において、ベクトルnは、ノイズの周波数スペクトルW1に対応するノイズ周波数特徴ベクトル(正規化したノイズ周波数特徴ベクトル)を示している。なお、この正規化したノイズ周波数特徴ベクトルnは、上述した式(1)によって算出され、ノイズ周波数特徴ベクトル記憶部61に予め記憶されている。
In this figure, a vector n represents a noise frequency feature vector (normalized noise frequency feature vector) corresponding to the noise frequency spectrum W1. The normalized noise frequency feature vector n is calculated by the above-described equation (1) and stored in the noise frequency feature
また、この図において、ベクトルX1は、音信号x1の周波数スペクトルW2に対応する入力周波数特徴ベクトルを示し、ベクトルX2は、音信号x2の周波数スペクトルW3に対応する入力周波数特徴ベクトルを示している。
なお、音信号x1の周波数スペクトルW2、音信号x2の周波数スペクトルW3、入力周波数特徴ベクトルX1、及び入力周波数特徴ベクトルX2は、周波数特徴ベクトル生成部231によって生成される。
In this figure, a vector X1 indicates an input frequency feature vector corresponding to the frequency spectrum W2 of the sound signal x1, and a vector X2 indicates an input frequency feature vector corresponding to the frequency spectrum W3 of the sound signal x2.
The frequency spectrum W2 of the sound signal x1, the frequency spectrum W3 of the sound signal x2, the input frequency feature vector X1, and the input frequency feature vector X2 are generated by the frequency feature
また、この図において、内積値I1は、入力周波数特徴ベクトルX1とノイズ周波数特徴ベクトルnとの内積値を示し、内積値I2は、入力周波数特徴ベクトルX2とノイズ周波数特徴ベクトルnとの内積値を示している。 In this figure, the inner product value I 1 indicates the inner product value of the input frequency feature vector X1 and the noise frequency feature vector n, and the inner product value I 2 indicates the inner product of the input frequency feature vector X2 and the noise frequency feature vector n. The value is shown.
本実施形態では、ノイズ推定部233が、内積算出部232により算出された内積値に基づいて、音信号に含まれるノイズ(推定ノイズ)を推定する。
ここで、音信号x2は、内積値I2が内積値I1に比べて大きい。このことは、入力周波数特徴ベクトルX2の方向とノイズ周波数特徴ベクトルnの方向が近いことを示している。そのため、音信号x2の大部分がノイズであると推定される。
これに対して、音信号x1は、内積値I1が内積値I2に比べて小さい。このことは、入力周波数特徴ベクトルX2の方向とノイズ周波数特徴ベクトルnの方向が遠いことを示している。そのため、音信号x1のノイズ量が、音信号x2に比べて少ないと推定される。
つまり、ノイズ推定部233は、音信号に含まれる(重畳している)ノイズを適切に推定することができる。
In the present embodiment, the
Here, the sound signal x2 is the inner product value I 2 is larger than the inner product value I 1. This indicates that the direction of the input frequency feature vector X2 and the direction of the noise frequency feature vector n are close. Therefore, it is estimated that most of the sound signal x2 is noise.
In contrast, the sound signal x1 is the inner product value I 1 is smaller than the inner product value I 2. This indicates that the direction of the input frequency feature vector X2 is far from the direction of the noise frequency feature vector n. Therefore, it is estimated that the noise amount of the sound signal x1 is smaller than that of the sound signal x2.
That is, the
本実施形態におけるノイズ推定装置150は、上述のノイズの推定方法に基づいて、ノイズ推定部233が推定ノイズを推定し、推定した推定ノイズを上述したノイズ低減処理部24に供給する。なお、図3では、本実施形態における概念を説明するために、周波数ビン数が2つの場合を図示したが、内積算出部232は、実際にはより多数の要素を持ったベクトルの内積を算出することになる。例えば、1フレームのサンプル数が4096サンプルである場合、内積算出部232は、4096個の要素を持ったベクトルの内積を算出することになる。
In the
次に、本実施形態における撮像装置1及び信号処理装置100の動作について説明する。
Next, operations of the
まず、撮像装置1の撮像動作について説明する。
撮像装置1において、CPU90は、例えば、操作部80を介して撮像指示を受け付けた際に、撮像部10を介して得られる画像データを、記憶媒体200に記憶させる。この際に、CPU90は、レンズ駆動部16及び手振れ防止部18を制御して、ズームレンズ14、VRレンズ13、又はAFレンズ12を駆動させる。
First, the imaging operation of the
In the
なお、使用者が動画を撮像する場合には、マイク21により音信号が収音され、収音された音信号が、A/D変換部22及び音信号処理部23を介して、音信号が記憶媒体200に記憶される。この場合に、ズームレンズ14、VRレンズ13、又はAFレンズ12の駆動や操作部80の操作により、マイク21により収音された音信号にノイズが重畳されることがある。本実施形態における撮像装置1では、音信号処理部23を含む信号処理装置100を備えており、この信号処理装置100によって、音信号に重畳されたノイズを低減するノイズ低減処理を実行する。
When a user captures a moving image, a sound signal is collected by the microphone 21, and the collected sound signal is converted into a sound signal via the A / D conversion unit 22 and the sound
次に、信号処理装置100におけるノイズ低減処理に関する動作を説明する。
図4は、本実施形態におけるノイズ低減処理の動作を示すフローチャートである。
Next, operations related to noise reduction processing in the
FIG. 4 is a flowchart showing the operation of noise reduction processing in the present embodiment.
この図において、まず、信号処理装置100は、入力された音信号をフレーム単位でフーリエ変換する(ステップS101)。つまり、音信号処理部23の周波数特徴ベクトル生成部231は、A/D変換部22によりデジタル信号に変換された音信号をフレーム単位で音信号の周波数スペクトルに変換する。なお、周波数特徴ベクトル生成部231は、フーリエ変換する際に、例えば、ハミング窓を窓関数として使用する。
次に、周波数特徴ベクトル生成部231は、フレーム単位に変換した周波数スペクトルに基づいて入力周波数特徴ベクトル(Xk)を生成する(ステップS102)。
In this figure, first, the
Next, the frequency feature
次に、信号処理装置100は、入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値を算出する(ステップS103)。つまり、内積算出部232は、周波数特徴ベクトル生成部231から供給された入力周波数特徴ベクトル(Xk)と、ノイズ周波数特徴ベクトル記憶部61から読み出したノイズ周波数特徴ベクトル(n)との内積値をノイズ類似度として算出する。
Next, the
次に、信号処理装置100は、推定ノイズを推定する(ステップS104)。つまり、ノイズ推定部233は、内積算出部232により算出されたノイズ類似度(内積値<Xk,n>)に基づいて、音信号に含まれる推定ノイズ(ベクトル〜nk)を推定する。ノイズ推定部233は、例えば、上述した式(2)によって、この推定ノイズ(ベクトル〜nk)を算出する。
Next, the
次に、信号処理装置100は、推定ノイズによってノイズを減算する(ステップS105)。つまり、ノイズ低減処理部24のノイズ減算部234は、入力周波数特徴ベクトル(Xk)と、推定ノイズ(ベクトル〜nk)とに基づいて、音信号に含まれるノイズを減算して、ノイズを減算した目的音の推定周波数特徴ベクトル(〜Sk)を算出する。ノイズ減算部234は、例えば、上述した式(3)によって、この目的音の推定周波数特徴ベクトル(〜Sk)を算出する。
Next, the
次に、信号処理装置100は、逆フーリエ変換して、音信号を合成する(ステップS106)。つまり、逆変換部235は、まず、ノイズ減算部234によって算出された目的音の推定周波数特徴ベクトル(〜Sk)を周波数スペクトルに戻す。そして、逆変換部235は、ノイズが混入した音信号の位相情報に基づいて時間波形に変換し、ノイズを低減した目的音の音信号を合成する。さらに、逆変換部235は、通信部70を介して、生成した音信号を記憶媒体200に記憶させて、1フレームにおけるノイズ低減処理を終了させる。
Next, the
なお、ステップS101〜ステップS106の処理は、CPU90から制御信号によるノイズ低減処理の終了指示がされるまで繰り返し実行される。
Note that the processes in steps S101 to S106 are repeatedly executed until the
以上のように、ノイズ推定装置150は、内積算出部232が、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、音信号とノイズとの類似の度合いを示すノイズ類似度(内積値)を算出する。そして、ノイズ推定部233は、内積算出部232により算出されたノイズ類似度に基づいて、音信号に含まれる推定ノイズを推定する。
As described above, in the
これにより、ノイズ推定装置150は、音信号に含まれる推定ノイズを適切に推定することができる。また、信号処理装置100は、ノイズ低減処理部24がノイズ推定装置150によって推定された推定ノイズに基づいて、音信号に含まれるノイズを低減する。そのため、ノイズ推定装置150及び信号処理装置100は、例えば、大きさが非定常なノイズを低減するような場合であっても、ノイズの過大減算あるいは過小減算により、音の劣化もしくは雑音の残存が発生することを低減できる。
Thereby, the
また、ノイズ推定装置150及び信号処理装置100は、例えば、間欠的に発生するノイズを低減するような場合であっても、ノイズを過大に減算してしまうことを防止でき、音の劣化が発生することを低減できる。したがって、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
また、ノイズ推定装置150及び信号処理装置100は、非定常ノイズの推定ノイズを得るために、1チャンネルの音信号に対して、複数のマイクを必要としない。そのため、少数のマイクによって、非定常ノイズを適切に低減することができる。
In addition, the
In addition, the
また、本実施形態において、内積算出部232は、音信号の周波数スペクトルに基づいて生成された入力周波数特徴ベクトルと、ノイズの周波数スペクトルに基づいて生成されたノイズの特徴を示すノイズ周波数特徴ベクトルとの内積値に基づいて、ノイズ類似度を算出する。ここで、ノイズ周波数特徴ベクトルは、ノイズの周波数スペクトルにおける各周波数成分(各周波数ビン)に対応する強度を要素として生成されたベクトルである。また、入力周波数特徴ベクトルは、音信号の周波数スペクトルにおける各周波数成分に対応する強度を要素として生成されたベクトルである。
Further, in the present embodiment, the inner
入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値は、図3に示されるように、入力周波数特徴ベクトルの方向とノイズ周波数特徴ベクトルの方向との近さの度合いを示している。そのため、ノイズ推定装置150は、入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値に基づいて、適切に推定ノイズを推定することができる。よって、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
The inner product value of the input frequency feature vector and the noise frequency feature vector indicates the degree of closeness between the direction of the input frequency feature vector and the direction of the noise frequency feature vector, as shown in FIG. Therefore, the
また、本実施形態において、ノイズ周波数特徴ベクトルは、単位ベクトルである。
これにより、内積算出部232によって算出される内積値が、極端に大きな値になることを防止し、この内積値を制限することができる。
In the present embodiment, the noise frequency feature vector is a unit vector.
As a result, the inner product value calculated by the inner
なお、本実施形態では、内積算出部232によって内積する際に、ノイズ周波数特徴ベクトルとして単位ベクトル(n)を用いる形態を説明したが、正規化していないノイズ周波数特徴ベクトル(n0)を用いる形態でもよい。また、この場合、ノイズ推定部233は、式(4)に示すように、ノイズ類似度(例えば、内積値)に応じて定められる係数αを、ノイズ周波数特徴ベクトルに乗算して、推定ノイズを推定してもよい。ここで係数αは、例えば、AFレンズ12のノイズであれば、“0.5”、ズームレンズ14のノイズであれば、“0.1”というように、ノイズを発生する動作部(機構部)に応じて変更してもよい。
In the present embodiment, the mode in which the unit vector (n) is used as the noise frequency feature vector when the inner product is calculated by the inner
この場合、ノイズ減算部234は、式(5)に示される関係式によって、目的音の推定周波数特徴ベクトル〜Skを算出する。
In this case, the
これにより、ノイズ周波数特徴ベクトルを正規化する必要がなく、ノイズ周波数特徴ベクトルの生成処理を簡略化することができる。また、必要に応じて、係数αによって、ノイズの削減量を補正できるため、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
Thereby, it is not necessary to normalize the noise frequency feature vector, and the generation process of the noise frequency feature vector can be simplified. Further, since the noise reduction amount can be corrected by the coefficient α as necessary, the
次に、本実施形態におけるノイズ周波数特徴ベクトルの生成方法について説明する。
ノイズ周波数特徴ベクトルは、撮像装置1の製造又は出荷検査の際に、例えば、校正装置によって予め生成され、ノイズ周波数特徴ベクトル記憶部61に記憶される。
校正装置は、静かな環境(フロアノイズの低い環境)において、AFレンズ12などの動作部(機構部)を動作させて、撮像装置1のマイク21によって収音されたノイズの音信号を取得する。校正装置は、このノイズの音信号をフレーム単位でフーリエ変換して、ノイズの周波数スペクトルを生成する。
Next, a method for generating a noise frequency feature vector in the present embodiment will be described.
The noise frequency feature vector is generated in advance by a calibration device, for example, and stored in the noise frequency feature
The calibration device operates an operation unit (mechanism unit) such as the AF lens 12 in a quiet environment (an environment with low floor noise), and acquires a sound signal of noise collected by the microphone 21 of the
そして、校正装置は、ノイズの周波数スペクトルにおける各周波数成分(各周波数ビン)に対応する強度を要素として、ノイズ周波数特徴ベクトルを生成する。なお、ノイズ周波数特徴ベクトルは、上述したように、正規化したベクトル(n)でもよいし、正規化していないベクトル(n0)でもよい。校正装置は、生成したノイズ周波数特徴ベクトルをノイズ周波数特徴ベクトル記憶部61に記憶させる。
すなわち、ノイズ周波数特徴ベクトルは、ノイズを発生する動作部(機構部)を動作させた際に得られる音信号に基づいて予め生成される。
Then, the calibration device generates a noise frequency feature vector with the intensity corresponding to each frequency component (each frequency bin) in the frequency spectrum of noise as an element. The noise frequency feature vector may be a normalized vector (n) or a non-normalized vector (n 0 ) as described above. The calibration apparatus stores the generated noise frequency feature vector in the noise frequency feature
That is, the noise frequency feature vector is generated in advance based on a sound signal obtained when an operation unit (mechanism unit) that generates noise is operated.
これにより、本実施形態におけるノイズ推定装置150は、適切なノイズ周波数特徴ベクトルを得ることができるため、音信号に含まれるノイズを適切に推定することができる。したがって、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
Thereby, since the
なお、校正装置は、ノイズの音信号の所定の区間に対し、所定の時間で区切られた複数のフレームにおける周波数特徴ベクトルを算出し、ノイズ周波数特徴ベクトルの各周波数成分として、それらの最小値、平均値、中間値、最大値のいずれかを適用してもよい。
例えば、ノイズ低減を優先したい場合には、複数のフレームにおける周波数特徴ベクトルにおける最大値を適用する。また、例えば、目的音の劣化を抑えたい場合には、複数のフレームにおける周波数特徴ベクトルにおける最小値を適用する。また、例えば、ノイズ低減と目的音の劣化とをバランスよく、適切にノイズ低減したい場合には、複数のフレームにおける周波数特徴ベクトルにおける平均値又は中間値を適用する。
The calibration device calculates a frequency feature vector in a plurality of frames divided by a predetermined time for a predetermined section of the noise signal of noise, and each frequency component of the noise frequency feature vector has a minimum value thereof, Any one of an average value, an intermediate value, and a maximum value may be applied.
For example, when priority is given to noise reduction, the maximum value in the frequency feature vector in a plurality of frames is applied. For example, when it is desired to suppress the deterioration of the target sound, the minimum value in the frequency feature vector in a plurality of frames is applied. Further, for example, when it is desired to appropriately reduce noise with a good balance between noise reduction and target sound deterioration, an average value or an intermediate value in frequency feature vectors in a plurality of frames is applied.
次に、本実施形態におけるノイズ周波数特徴ベクトルの生成方法における別の一例について説明する。
図5は、本実施形態におけるノイズが重畳した音信号の例を示す説明図である。
この図において、横軸は、時間tを示す。図5(A)は、動作部の動作状態を示すグラフであり、H(ハイ)状態である場合に、動作部が動作している状態を示し、L(ロウ)状態である場合に、動作部が停止している状態を示す。図5(A)において、波形W4は、時刻T1において、動作部が動作を開始したことを示している。
Next, another example of the noise frequency feature vector generation method in this embodiment will be described.
FIG. 5 is an explanatory diagram illustrating an example of a sound signal on which noise is superimposed in the present embodiment.
In this figure, the horizontal axis indicates time t. FIG. 5A is a graph showing the operation state of the operation unit. When the operation unit is in the H (high) state, the operation unit is operating. When the operation unit is in the L (low) state, the operation is performed. The state where the part stops is shown. In FIG. 5A, a waveform W4 indicates that the operation unit has started operation at time T1.
次に、図5(B)は、音信号を分割するフレームの一例を示している。図5(B)において、予め定められた期間を2分の1期間ずつずらした区間を1つのフレームをとして、フレームF1からフレームF7に分割される例を示している。 Next, FIG. 5B shows an example of a frame into which the sound signal is divided. FIG. 5B shows an example in which a frame is divided from the frame F1 to the frame F7, with a section obtained by shifting a predetermined period by a half period as one frame.
図5(C)は、マイク21により収音された音信号の波形を示すグラフである。図5(C)において、波形W5は、時刻T1までの期間(ノイズが発生する前の期間)の音信号を示し、波形W6は、時刻T1以降の期間(ノイズが発生した後の期間)の音信号を示している。波形W6に示すように、時刻T1以降の期間において、上述の動作部の動作(ズームレンズ14、VRレンズ13、又はAFレンズ12の駆動や操作部80の操作)により、音信号にノイズが重畳される。 FIG. 5C is a graph showing the waveform of the sound signal collected by the microphone 21. In FIG. 5C, a waveform W5 indicates a sound signal in a period up to time T1 (period before noise is generated), and a waveform W6 is a period after time T1 (period after noise is generated). A sound signal is shown. As shown in the waveform W6, noise is superimposed on the sound signal during the period after time T1 due to the operation of the operation unit (the driving of the zoom lens 14, the VR lens 13, or the AF lens 12 and the operation of the operation unit 80). Is done.
本実施形態では、校正装置は、まず、図5に示されるような音信号(波形W5及び波形W6)を撮像装置1のマイク21によって取得する。そして、校正装置は、このように取得した音信号に基づいて、図6に示すように、ノイズの周波数スペクトル(W9)を算出する。 In the present embodiment, the calibration device first acquires a sound signal (waveform W5 and waveform W6) as shown in FIG. Then, the calibration device calculates the frequency spectrum (W9) of noise based on the sound signal acquired in this way, as shown in FIG.
図6は、本実施形態におけるノイズの周波数スペクトルの生成方法の一例を説明する説明図である。この図において、周波数スペクトルW7は、ノイズ発生前(時刻T1以前、例えば、フレームF1)の周波数スペクトルを示し、周波数スペクトルW8は、ノイズ発生後(時刻T1以降、例えば、フレームF4)の周波数スペクトルを示している。なお、周波数スペクトルW7は、音信号に定常ノイズとして含まれる背景ノイズ(フロアノイズ)の成分を示している。また、周波数スペクトルW9は、周波数スペクトルW8から周波数スペクトルW7を減算した(フレームF4からフレームF1を減算した)、ノイズの周波数スペクトルを示している。 FIG. 6 is an explanatory diagram illustrating an example of a method for generating a noise frequency spectrum in the present embodiment. In this figure, a frequency spectrum W7 indicates a frequency spectrum before noise generation (before time T1, for example, frame F1), and a frequency spectrum W8 indicates a frequency spectrum after noise generation (after time T1, for example, frame F4). Show. The frequency spectrum W7 indicates a background noise (floor noise) component included as a stationary noise in the sound signal. The frequency spectrum W9 indicates the frequency spectrum of noise obtained by subtracting the frequency spectrum W7 from the frequency spectrum W8 (subtracting the frame F1 from the frame F4).
つまり、校正装置は、図6に示すようにノイズの周波数スペクトルを算出し、算出したノイズの周波数スペクトルに基づいて、ノイズ周波数特徴ベクトルを生成する。すなわち、ノイズ周波数特徴ベクトルは、機構部を動作させた際に、音信号に定常ノイズとして含まれる背景ノイズの成分を、音信号から減算して生成される。校正装置は、生成したノイズ周波数特徴ベクトルをノイズ周波数特徴ベクトル記憶部61に記憶させる。
That is, the calibration apparatus calculates a noise frequency spectrum as shown in FIG. 6, and generates a noise frequency feature vector based on the calculated noise frequency spectrum. That is, the noise frequency feature vector is generated by subtracting the background noise component included as stationary noise in the sound signal from the sound signal when the mechanism unit is operated. The calibration apparatus stores the generated noise frequency feature vector in the noise frequency feature
これにより、ノイズ周波数特徴ベクトルから音信号に定常ノイズとして含まれる背景ノイズ(フロアノイズ)の成分が低減されるので、背景ノイズ(フロアノイズ)によって、入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値が大きな値になることを防止することができる。そのため、本実施形態におけるノイズ推定装置150は、音信号に含まれるノイズを適切に推定することができる。したがって、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
As a result, the background noise (floor noise) component contained as stationary noise in the sound signal from the noise frequency feature vector is reduced, so that the inner product of the input frequency feature vector and the noise frequency feature vector by the background noise (floor noise). It is possible to prevent the value from becoming a large value. Therefore, the
なお、上記の背景ノイズを減算してノイズ周波数特徴ベクトルする場合においても、上述した複数のフレームにおける周波数特徴ベクトルの最小値、平均値、中間値、最大値のいずれかを使用する手法を適用してもよい。 Even when the noise frequency feature vector is subtracted from the background noise described above, a method that uses any one of the minimum value, average value, intermediate value, and maximum value of the frequency feature vector in the plurality of frames described above is applied. May be.
なお、本発明の実施形態によれば、撮像装置1は、上述の信号処理装置100を備える。
これにより、撮像装置1は、信号処理装置100と同様の効果が期待でき、音信号に重畳しているノイズを適切に低減することができる。
According to the embodiment of the present invention, the
Thereby, the
また、本発明の実施形態によれば、ノイズ推定装置150としてのコンピュータに、内積算出部232が、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、音信号とノイズとの類似の度合いを示すノイズ類似度を算出する算出手順(ステップS103)と、ノイズ推定部233が、算出手順により算出されたノイズ類似度に基づいて、音信号に含まれる推定ノイズを推定するノイズ推定手順(ステップS104)とを実行させるためのプログラムである。
これにより、プログラムは、ノイズ推定装置150と同様の効果が期待でき、音信号に重畳しているノイズを適切に低減することができる。
Further, according to the embodiment of the present invention, the inner
Thereby, the program can expect the same effect as the
なお、本発明は、上記の各実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で変更可能である。
上記の各実施形態において、ノイズ推定部233は、ノイズ類似度として算出された、入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値に基づいて推定ノイズを推定する形態を説明したが、これに限定されるものではない。例えば、ノイズ類似度を算出する算出部が、音信号の周波数スペクトルと、ノイズの周波数スペクトルとの相関係数に基づいて、ノイズ類似度を算出し、ノイズ推定部233が、この相関係数に基づいて推定ノイズを推定する形態でもよい。この場合、ノイズ類似度を算出する算出部は、音信号の周波数スペクトルとノイズの周波数スペクトルとの各周波数成分(各周波数ビン)に対応する各組による相関係数を算出する。
The present invention is not limited to the above embodiments, and can be modified without departing from the spirit of the present invention.
In each of the embodiments described above, the
これにより、内積値に基づいて推定ノイズを推定する形態と同様に、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
また、ノイズ類似度は、例えば、マハラノビス距離に基づいて算出される形態でもよいし、他の形態でもよい。
Thereby, the
The noise similarity may be calculated based on, for example, the Mahalanobis distance, or may be in another form.
また、上記の各実施形態において、ノイズの周波数スペクトルの強度及び音信号の周波数スペクトルの強度として、絶対値を使用する形態を説明したが、虚数部も含めた複素数やパワーを使用する形態でもよい。 Further, in each of the embodiments described above, the form in which the absolute value is used as the intensity of the noise frequency spectrum and the intensity of the frequency spectrum of the sound signal has been described. However, a form using complex numbers and power including an imaginary part may be used. .
また、上記の各実施形態において、信号処理装置100は、動作部(機構部)のノイズの発生タイミングを検出する検出部を備え、この検出部によって検出した発生タイミングに基づいて、ノイズを低減する処理を行うか否かを判定してもよい。つまり、信号処理装置100は、検出部によって検出した発生タイミングに基づいて、ノイズが発生していると判定された場合に、ノイズを低減する処理を実行する形態でもよい。
In each of the above embodiments, the
また、ノイズ推定装置150は、この検出部によって検出した発生タイミングに基づいて、ノイズ周波数特徴ベクトル記憶部61に複数記憶されているノイズ周波数特徴ベクトルのうちの1つ又は複数を選択して使用する形態でもよい。例えば、ノイズ推定装置150は、この検出部によってズームレンズ14、VRレンズ13、及びAFレンズ12の機構音のうちのいずれか1つが動作していることを検出し、検出結果に応じて、ズームレンズ14、VRレンズ13、及びAFレンズ12のうちのいずれか1つに対応するノイズ周波数特徴ベクトルを選択してもよい。
Also, the
また、上記の実施形態において、ノイズ減算部234は、ノイズ推定部233によって推定された推定ノイズに基づいて、目的音の推定周波数特徴ベクトル〜Skを推定する形態を説明したが、さらに、重み付け係数を付加して算出する形態でもよい。例えば、推定ノイズに対するノイズ発生前の音信号の周波数スペクトルの比であるSNR(signal-noise ratio)やトーン度などを算出し、その算出値に基づいて重み付け係数を乗算して、推定ノイズ量を補正してもよい。
In the above embodiment, the
また、上記の各実施形態において、ノイズ周波数特徴ベクトルを校正装置が生成して、ノイズ周波数特徴ベクトル記憶部61に記憶させる形態を説明したが、撮像装置1、信号処理装置100、又はノイズ推定装置150が、ノイズ周波数特徴ベクトルを生成する生成部を備える形態でもよい。また、校正装置が、既に予め生成されているノイズ周波数特徴ベクトルをノイズ周波数特徴ベクトル記憶部61に記憶させる形態でもよい。
また、上記の各実施形態において、ノイズ周波数特徴ベクトル記憶部61は、ノイズ周波数特徴ベクトルを記憶する形態を説明したが、ノイズ周波数特徴ベクトル記憶部61は、ノイズの周波数スペクトルを記憶し、ノイズ推定装置150によって、ノイズ周波数特徴ベクトルが生成される形態でもよい。例えば、内積算出部232が、ノイズの周波数スペクトルに基づいて、ノイズ周波数特徴ベクトルを生成する形態でもよい。
In each of the above-described embodiments, the noise frequency feature vector is generated by the calibration device and stored in the noise frequency feature
Further, in each of the embodiments described above, the noise frequency feature
また、上記の各実施形態において、信号処理装置100を撮像装置1に適用する形態を説明したが、これに限定されるものではない。例えば、レコーダなどの録音装置や電話機などのキー操作による音がノイズとして目的音である音信号に重畳されるような装置に適用してもよい。
また、上記の各実施形態において、フーリエ変換としてFFTを用いる形態を説明したが、DFT(Discrete Fourier Transform)を用いる形態でもよいし、他の方式を用いる形態でもよい。
Further, in each of the above embodiments, the mode in which the
Further, in each of the embodiments described above, the form using FFT as the Fourier transform has been described. However, a form using DFT (Discrete Fourier Transform) may be used, or a form using another method may be used.
上述のノイズ推定装置150及び信号処理装置100は内部に、コンピュータシステムを有している。そして、上述したノイズ推定装置150及び信号処理装置100の処理過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここで、コンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしてもよい。
The
1…撮像装置、24…ノイズ低減処理部、61…ノイズ周波数特徴ベクトル記憶部、100…信号処理装置、150…ノイズ推定装置、231…周波数特徴ベクトル生成部、232…内積算出部、233…ノイズ推定部
DESCRIPTION OF
Claims (11)
前記算出部により算出された前記ノイズ類似度に基づいて、前記音信号に含まれる推定ノイズを推定するノイズ推定部と
を備えることを特徴とするノイズ推定装置。 A calculation unit that calculates a noise similarity indicating a degree of similarity between the sound signal and the noise based on the frequency spectrum of the input sound signal and the frequency spectrum of the noise;
A noise estimation device comprising: a noise estimation unit that estimates estimated noise included in the sound signal based on the noise similarity calculated by the calculation unit.
前記音信号の周波数スペクトルに基づいて生成された入力周波数特徴ベクトルと、前記ノイズの周波数スペクトルに基づいて生成された前記ノイズの特徴を示すノイズ周波数特徴ベクトルとの内積値に基づいて、前記ノイズ類似度を算出し、
前記ノイズ周波数特徴ベクトルは、前記ノイズの周波数スペクトルにおける各周波数成分に対応する強度を要素として生成されたベクトルであり、
前記入力周波数特徴ベクトルは、前記音信号の周波数スペクトルにおける各周波数成分に対応する強度を要素として生成されたベクトルである
ことを特徴とする請求項1に記載のノイズ推定装置。 The calculation unit includes:
Based on an inner product value of an input frequency feature vector generated based on the frequency spectrum of the sound signal and a noise frequency feature vector indicating the feature of the noise generated based on the frequency spectrum of the noise, the noise similarity Calculate the degree,
The noise frequency feature vector is a vector generated by using the intensity corresponding to each frequency component in the frequency spectrum of the noise as an element,
The noise estimation apparatus according to claim 1, wherein the input frequency feature vector is a vector generated using an intensity corresponding to each frequency component in a frequency spectrum of the sound signal as an element.
ことを特徴とする請求項2に記載のノイズ推定装置。 The noise estimation apparatus according to claim 2, wherein the noise frequency feature vector is a unit vector.
前記ノイズ類似度に応じて定められる係数を、前記ノイズ周波数特徴ベクトルに乗算して、前記推定ノイズを推定する
ことを特徴とする請求項2から請求項3のいずれか1項に記載のノイズ推定装置。 The noise estimation unit
The noise estimation according to any one of claims 2 to 3, wherein the estimated noise is estimated by multiplying the noise frequency feature vector by a coefficient determined in accordance with the noise similarity. apparatus.
前記音信号を周波数スペクトルに変換し、変換した前記音信号の周波数スペクトルに基づいて、前記入力周波数特徴ベクトルを生成する周波数特徴ベクトル生成部と
を備えることを特徴とする請求項2から請求項4のいずれか1項に記載のノイズ推定装置。 A storage unit in which the noise frequency feature vector is stored in advance;
The frequency feature vector generation part which converts the sound signal into a frequency spectrum, and generates the input frequency feature vector based on the converted frequency spectrum of the sound signal. The noise estimation apparatus according to any one of the above.
ことを特徴とする請求項2から請求項5のいずれか1項に記載のノイズ推定装置。 6. The noise frequency feature vector is generated in advance based on a sound signal obtained when a mechanism unit that generates the noise is operated. The noise estimation apparatus described in 1.
ことを特徴とする請求項6に記載のノイズ推定装置。 The noise frequency feature vector is generated by subtracting, from the sound signal, a background noise component included as stationary noise in the sound signal when the mechanism unit is operated. The noise estimation apparatus described in 1.
前記音信号の周波数スペクトルと、前記ノイズの周波数スペクトルとの相関係数に基づいて、前記ノイズ類似度を算出する
ことを特徴とする請求項1に記載のノイズ推定装置。 The calculation unit includes:
The noise estimation device according to claim 1, wherein the noise similarity is calculated based on a correlation coefficient between a frequency spectrum of the sound signal and a frequency spectrum of the noise.
前記ノイズ推定装置によって推定された前記推定ノイズに基づいて、前記音信号に含まれるノイズを低減するノイズ低減処理部と、
を備えることを特徴とする信号処理装置。 The noise estimation device according to any one of claims 1 to 8,
A noise reduction processing unit that reduces noise included in the sound signal based on the estimated noise estimated by the noise estimation device;
A signal processing apparatus comprising:
算出部が、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、前記音信号と前記ノイズとの類似の度合いを示すノイズ類似度を算出する算出手順と、
ノイズ推定部が、前記算出手順により算出された前記ノイズ類似度に基づいて、前記音信号に含まれる推定ノイズを推定するノイズ推定手順と
を実行させるためのプログラム。 In the computer as a noise estimation device,
A calculation procedure for calculating a noise similarity indicating a degree of similarity between the sound signal and the noise based on the frequency spectrum of the input sound signal and the frequency spectrum of the noise;
A noise estimation unit for executing a noise estimation procedure for estimating an estimated noise included in the sound signal based on the noise similarity calculated by the calculation procedure.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011031439A JP2012168477A (en) | 2011-02-16 | 2011-02-16 | Noise estimation device, signal processor, imaging apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011031439A JP2012168477A (en) | 2011-02-16 | 2011-02-16 | Noise estimation device, signal processor, imaging apparatus, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012168477A true JP2012168477A (en) | 2012-09-06 |
Family
ID=46972666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011031439A Pending JP2012168477A (en) | 2011-02-16 | 2011-02-16 | Noise estimation device, signal processor, imaging apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012168477A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115173971A (en) * | 2022-07-08 | 2022-10-11 | 电信科学技术第五研究所有限公司 | Broadband signal real-time detection method based on frequency spectrum data |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03273299A (en) * | 1990-03-23 | 1991-12-04 | Toshiba Corp | Voice recognizing device |
JP2006047639A (en) * | 2004-08-04 | 2006-02-16 | Advanced Telecommunication Research Institute International | Noise eliminator |
JP2006270591A (en) * | 2005-03-24 | 2006-10-05 | Nikon Corp | Electronic camera, data reproducing device and program |
JP2006279757A (en) * | 2005-03-30 | 2006-10-12 | Casio Comput Co Ltd | Imaging apparatus, and sound recording method and program |
JP2007027897A (en) * | 2005-07-12 | 2007-02-01 | Matsushita Electric Ind Co Ltd | Noise suppressing device |
JP2008076975A (en) * | 2006-09-25 | 2008-04-03 | Fujitsu Ltd | Sound signal correcting method, sound signal correcting apparatus and computer program |
JP2008108243A (en) * | 2006-09-28 | 2008-05-08 | Toshiba Corp | Person recognition device and person recognition method |
US20080124049A1 (en) * | 2006-09-21 | 2008-05-29 | Chan-Min Chou | Method for eliminating noise of a motor |
US20100063807A1 (en) * | 2008-09-10 | 2010-03-11 | Texas Instruments Incorporated | Subtraction of a shaped component of a noise reduction spectrum from a combined signal |
JP2010081100A (en) * | 2008-09-24 | 2010-04-08 | Casio Computer Co Ltd | Imaging device, imaging method, and imaging program |
JP2010211221A (en) * | 2001-03-28 | 2010-09-24 | Qualcomm Inc | Voice recognition system using implicit speaker adaption |
-
2011
- 2011-02-16 JP JP2011031439A patent/JP2012168477A/en active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03273299A (en) * | 1990-03-23 | 1991-12-04 | Toshiba Corp | Voice recognizing device |
JP2010211221A (en) * | 2001-03-28 | 2010-09-24 | Qualcomm Inc | Voice recognition system using implicit speaker adaption |
JP2006047639A (en) * | 2004-08-04 | 2006-02-16 | Advanced Telecommunication Research Institute International | Noise eliminator |
JP2006270591A (en) * | 2005-03-24 | 2006-10-05 | Nikon Corp | Electronic camera, data reproducing device and program |
JP2006279757A (en) * | 2005-03-30 | 2006-10-12 | Casio Comput Co Ltd | Imaging apparatus, and sound recording method and program |
JP2007027897A (en) * | 2005-07-12 | 2007-02-01 | Matsushita Electric Ind Co Ltd | Noise suppressing device |
US20080124049A1 (en) * | 2006-09-21 | 2008-05-29 | Chan-Min Chou | Method for eliminating noise of a motor |
JP2008076975A (en) * | 2006-09-25 | 2008-04-03 | Fujitsu Ltd | Sound signal correcting method, sound signal correcting apparatus and computer program |
JP2008108243A (en) * | 2006-09-28 | 2008-05-08 | Toshiba Corp | Person recognition device and person recognition method |
US20100063807A1 (en) * | 2008-09-10 | 2010-03-11 | Texas Instruments Incorporated | Subtraction of a shaped component of a noise reduction spectrum from a combined signal |
JP2010081100A (en) * | 2008-09-24 | 2010-04-08 | Casio Computer Co Ltd | Imaging device, imaging method, and imaging program |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115173971A (en) * | 2022-07-08 | 2022-10-11 | 电信科学技术第五研究所有限公司 | Broadband signal real-time detection method based on frequency spectrum data |
CN115173971B (en) * | 2022-07-08 | 2023-10-03 | 电信科学技术第五研究所有限公司 | Broadband signal real-time detection method based on frequency spectrum data |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101224755B1 (en) | Multi-sensory speech enhancement using a speech-state model | |
US8698911B2 (en) | Sound recording device, imaging device, photographing device, optical device, and program | |
JP4952769B2 (en) | Imaging device | |
JP5279629B2 (en) | Imaging device | |
US20150271439A1 (en) | Signal processing device, imaging device, and program | |
JP5024470B2 (en) | Imaging apparatus, signal processing apparatus, and recording medium | |
JP5361398B2 (en) | Imaging device | |
JP5278477B2 (en) | Signal processing apparatus, imaging apparatus, and signal processing program | |
JP2011114465A (en) | Voice processing apparatus and electronic camera | |
JP2012168477A (en) | Noise estimation device, signal processor, imaging apparatus, and program | |
JP4505597B2 (en) | Noise removal device | |
JP5158054B2 (en) | Recording device, imaging device, and program | |
JP2012185445A (en) | Signal processor, imaging apparatus and program | |
JP6182862B2 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
JP5428762B2 (en) | Imaging apparatus and program | |
JP2014026032A (en) | Signal processing device, imaging device, and program | |
JP2013178458A (en) | Signal processing device and signal processing program | |
JP2014022953A (en) | Signal processing device, image pickup device, and noise reduction processing method and program | |
JP2012173353A (en) | Signal processor, imaging apparatus, and program | |
JP5473786B2 (en) | Audio signal processing apparatus and control method thereof | |
JP6381367B2 (en) | Audio processing apparatus, audio processing method, and program | |
JP2005197956A (en) | Periodic noise suppressor | |
JP2015087601A (en) | Signal processing device, imaging device and program | |
JP2013178456A (en) | Signal processor, camera and signal processing program | |
JP2015087602A (en) | Signal processing device, imaging device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150519 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20151208 |