JP2012173353A - 信号処理装置、撮像装置、及びプログラム - Google Patents
信号処理装置、撮像装置、及びプログラム Download PDFInfo
- Publication number
- JP2012173353A JP2012173353A JP2011032467A JP2011032467A JP2012173353A JP 2012173353 A JP2012173353 A JP 2012173353A JP 2011032467 A JP2011032467 A JP 2011032467A JP 2011032467 A JP2011032467 A JP 2011032467A JP 2012173353 A JP2012173353 A JP 2012173353A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- frequency domain
- domain signal
- estimated noise
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Studio Devices (AREA)
Abstract
【課題】入力信号に重畳しているノイズを適切に低減する。
【解決手段】信号処理装置(100)は、入力信号を周波数領域信号に変換する変換部(231)と、入力信号に含まれるノイズが発生したタイミングに基づいて推定される第1の推定ノイズ周波数領域信号が、ノイズを入力信号から除去するための推定ノイズの周波数領域信号を示す第2の推定ノイズ周波数領域信号を変更する場合に適している度合いを、ノイズが発生する前の期間において変換部(231)によって変換された第1の周波数領域信号又はノイズが発生した後の期間において変換部(231)によって変換された第2の周波数領域信号に基づいて判定する判定部(232)と、判定部(232)の判定結果と第1の推定ノイズ周波数領域信号とに基づいて、第2の推定ノイズ周波数領域信号を変更する推定ノイズ変更部(24)とを備える。
【選択図】図2
【解決手段】信号処理装置(100)は、入力信号を周波数領域信号に変換する変換部(231)と、入力信号に含まれるノイズが発生したタイミングに基づいて推定される第1の推定ノイズ周波数領域信号が、ノイズを入力信号から除去するための推定ノイズの周波数領域信号を示す第2の推定ノイズ周波数領域信号を変更する場合に適している度合いを、ノイズが発生する前の期間において変換部(231)によって変換された第1の周波数領域信号又はノイズが発生した後の期間において変換部(231)によって変換された第2の周波数領域信号に基づいて判定する判定部(232)と、判定部(232)の判定結果と第1の推定ノイズ周波数領域信号とに基づいて、第2の推定ノイズ周波数領域信号を変更する推定ノイズ変更部(24)とを備える。
【選択図】図2
Description
本発明は、信号処理装置、撮像装置、及びプログラムに関する。
音信号に重畳しているノイズを低減する技術が知られている(例えば、特許文献1を参照)。特許文献1に記載されている技術では、モータ音などの機構音による非定常ノイズを、予め定められている推定ノイズによって低減する。
しかしながら、入力信号(音信号)に重畳している非定常ノイズ、例えば、撮像装置において、レンズのAF(オートフォーカス)音によるノイズは、装着するレンズの種類、焦点距離、及び合焦位置などによって変化する場合がある。そのため、特許文献1に記載されている技術では、音信号に重畳しているノイズを低減できないことがある。
つまり、特許文献1に記載されている技術では、入力信号に重畳しているノイズを適切に低減できないという問題がある。
つまり、特許文献1に記載されている技術では、入力信号に重畳しているノイズを適切に低減できないという問題がある。
本発明は、上記問題を解決すべくなされたもので、その目的は、入力信号に重畳しているノイズを、適切に低減することができる信号処理装置、撮像装置、及びプログラムを提供することにある。
上記問題を解決するために、本発明は、入力された入力信号を、周波数領域信号に変換する変換部と、前記入力信号に含まれるノイズが発生したタイミングに基づいて推定される第1の推定ノイズ周波数領域信号が、前記ノイズを前記入力信号から除去するための推定ノイズの周波数領域信号を示す第2の推定ノイズ周波数領域信号を変更する場合に適している度合いを、前記ノイズが発生する前の期間において前記変換部によって変換された第1の周波数領域信号又は前記ノイズが発生した後の期間において前記変換部によって変換された第2の周波数領域信号に基づいて、判定する判定部と、前記判定部の判定結果と前記第1の推定ノイズ周波数領域信号とに基づいて、前記第2の推定ノイズ周波数領域信号を変更する推定ノイズ変更部とを備えることを特徴とする信号処理装置である。
また、本発明は、上記の信号処理装置を備えることを特徴とする撮像装置である。
また、本発明は、信号処理装置としてのコンピュータに、変換部が、入力された入力信号を、周波数領域信号に変換する変換手順と、前記入力信号に含まれるノイズが発生したタイミングに基づいて推定される第1の推定ノイズ周波数領域信号が、前記ノイズを前記入力信号から除去するための推定ノイズの周波数領域信号を示す第2の推定ノイズ周波数領域信号を変更する場合に適している度合いを、前記ノイズが発生する前の期間において前記変換手順によって変換された第1の周波数領域信号又は前記ノイズが発生した後の期間において前記変換手順によって変換された第2の周波数領域信号に基づいて、判定部が判定する判定手順と、推定ノイズ変更部が、前記判定手順の判定結果と前記第1の推定ノイズ周波数領域信号とに基づいて、前記第2の推定ノイズ周波数領域信号を変更する推定ノイズ変更手順とを実行させるためのプログラムである。
本発明によれば、入力信号に重畳しているノイズを適切に低減することができる。
以下、本発明の一実施形態による信号処理装置及び撮像装置について図面を参照して説明する。
図1は、本実施形態による撮像装置1を示す概略ブロック図である。
この図において、本実施形態による撮像装置1は、撮像部10、バッファメモリ部30、画像処理部40、表示部50、記憶部60、通信部70、操作部80、CPU(Central Processing Unit)90、マイク21、A/D(Analog/Digital)変換部22、音信号処理部23、及びバス300を備えている。この撮像装置1が備える構成のうち、例えば、音信号処理部23と、記憶部60の一部と、CPU90の一部とが、信号処理装置100に対応する。
図1は、本実施形態による撮像装置1を示す概略ブロック図である。
この図において、本実施形態による撮像装置1は、撮像部10、バッファメモリ部30、画像処理部40、表示部50、記憶部60、通信部70、操作部80、CPU(Central Processing Unit)90、マイク21、A/D(Analog/Digital)変換部22、音信号処理部23、及びバス300を備えている。この撮像装置1が備える構成のうち、例えば、音信号処理部23と、記憶部60の一部と、CPU90の一部とが、信号処理装置100に対応する。
撮像部10は、光学系11と、撮像素子19と、A/D変換部20とを含み、設定された撮像条件(例えば絞り値、露出値等)に従ってCPU90により制御され、光学系11による光学像を撮像素子19に結像させて、A/D変換部20によってデジタル信号に変換された当該光学像に基づく画像データを生成する。
光学系11は、焦点調整レンズ(以下、AF(Auto Focus)レンズという)12と、手振れ防止用レンズ(以下、VR(Vibration Reduction)レンズという)13と、ズームレンズ14と、ズームエンコーダ15と、レンズ駆動部16と、AFエンコーダ17と、手振れ防止部18とを備えている。
この光学系11は、ズームレンズ14、VRレンズ13、及びAFレンズ12を通過した光学像を撮像素子19の受光面に導く。
この光学系11は、ズームレンズ14、VRレンズ13、及びAFレンズ12を通過した光学像を撮像素子19の受光面に導く。
レンズ駆動部16は、後述するCPU90から入力される駆動制御信号に基づいて、ズームレンズ14又はAFエンコーダ17の位置を制御する。
手振れ防止部18は、後述するCPU90から入力される駆動制御信号に基づいて、VRレンズ13の位置を制御する。この手振れ防止部18は、VRレンズ13の位置を検出していてもよい。
手振れ防止部18は、後述するCPU90から入力される駆動制御信号に基づいて、VRレンズ13の位置を制御する。この手振れ防止部18は、VRレンズ13の位置を検出していてもよい。
ズームエンコーダ15は、ズームレンズ14の位置を表わすズームポジションを検出し、検出したズームポジションをCPU90に出力する。
AFエンコーダ17は、AFレンズ12の位置を表わすフォーカスポジションを検出し、検出したズームポジション及びフォーカスポジションをCPU90に出力する。
AFエンコーダ17は、AFレンズ12の位置を表わすフォーカスポジションを検出し、検出したズームポジション及びフォーカスポジションをCPU90に出力する。
なお、上述した光学系11は、撮像装置1に取り付けられて一体とされていてもよいし、撮像装置1に着脱可能に取り付けられてもよい。
撮像素子19は、例えば、受光面に結像した光学像を電気信号に変換して、A/D変換部20に出力する。
また、撮像素子19は、操作部80を介して撮影指示を受け付けた際に得られる画像データを、撮影された静止画の撮影画像データとして、A/D変換部20や画像処理部40を介して、記憶媒体200に記憶させる。
また、撮像素子19は、操作部80を介して撮影指示を受け付けた際に得られる画像データを、撮影された静止画の撮影画像データとして、A/D変換部20や画像処理部40を介して、記憶媒体200に記憶させる。
一方、撮像素子19は、例えば、操作部80を介して撮像指示を受け付けていない状態において、連続的に得られる画像データをスルー画データとして、A/D変換部20や画像処理部40を介して、CPU90及び表示部50に出力する。
A/D変換部20は、撮像素子19によって変換された電子信号をアナログ/デジタル変換し、この変換したデジタル信号である画像データを出力する。
バッファメモリ部30は、撮像部10によって撮像された画像データや、音信号処理部23により変換された音信号等を、一時的に記憶する。
画像処理部40は、記憶部60に記憶されている画像処理条件を参照して、バッファメモリ部30、又は、記憶媒体200に記録されている画像データに対して画像処理をする。
画像処理部40は、記憶部60に記憶されている画像処理条件を参照して、バッファメモリ部30、又は、記憶媒体200に記録されている画像データに対して画像処理をする。
表示部50は、例えば液晶ディスプレイであって、撮像部10によって得られた画像データや、操作画面等を表示する。
記憶部60は、CPU90によってシーン判定の際に参照される判定条件や、撮像条件等を記憶する。また、記憶部60は、後述する音信号処理部23において音信号のノイズを低減するノイズ低減処理に使用する情報を記憶する。ここで、ノイズ低減処理に使用する情報とは、例えば、後述する変換信号、ノイズ候補、推定ノイズ等である。
記憶部60は、CPU90によってシーン判定の際に参照される判定条件や、撮像条件等を記憶する。また、記憶部60は、後述する音信号処理部23において音信号のノイズを低減するノイズ低減処理に使用する情報を記憶する。ここで、ノイズ低減処理に使用する情報とは、例えば、後述する変換信号、ノイズ候補、推定ノイズ等である。
マイク21は、音を収音し、収音した音に応じた音信号を出力する。この音信号は、アナログ信号である。
A/D変換部22は、マイク21から入力されたアナログ信号である音信号を、デジタル信号である音信号に、アナログデジタル変換する。
A/D変換部22は、マイク21から入力されたアナログ信号である音信号を、デジタル信号である音信号に、アナログデジタル変換する。
音信号処理部23は、A/D変換部22によりデジタル信号に変換された音信号に対して、例えば、ノイズを低減するなどの音信号処理を実行し、この音信号処理した音信号を記憶媒体200に記憶させる。この音信号処理部23の詳細については、後述する。
なお、音信号処理部23により音信号処理された音信号が記憶媒体200に記憶される場合、撮像素子19により撮像された画像データと、時間的に関係付けられて記憶されてもよいし、音信号を含む動画として記憶されてもよい。
なお、音信号処理部23により音信号処理された音信号が記憶媒体200に記憶される場合、撮像素子19により撮像された画像データと、時間的に関係付けられて記憶されてもよいし、音信号を含む動画として記憶されてもよい。
通信部70は、カードメモリ等の取り外しが可能な記憶媒体200と接続され、この記憶媒体200への情報の書込み、読み出し、あるいは消去を行う。
操作部80は、例えば、電源スイッチやシャッターボタン、その他の操作キーを含み、ユーザによって操作されることでユーザの操作入力を受け付け、CPU90に出力する。
操作部80は、例えば、電源スイッチやシャッターボタン、その他の操作キーを含み、ユーザによって操作されることでユーザの操作入力を受け付け、CPU90に出力する。
記憶媒体200は、撮像装置1に対して着脱可能に接続される記憶部であって、例えば、撮像部10によって生成された(撮影された)画像データや、音信号処理部23により音信号処理された音信号を記憶する。
CPU90は、撮像装置1全体を制御するが、一例としては、ズームエンコーダ15から入力されるズームポジション、及び、AFエンコーダ17から入力されるフォーカスポジションと、操作部80から入力される操作入力とに基づいて、ズームエンコーダ15及びAFエンコーダ17の位置を制御する駆動制御信号を生成する。CPU90は、この駆動制御信号に基づいて、レンズ駆動部16を介してズームエンコーダ15及びAFエンコーダ17の位置を制御する。
また、このCPU90は、タイミング検出部91を備えている。このタイミング検出部91は、撮像装置1が備えている動作部が動作するタイミングを検出する。
また、このCPU90は、タイミング検出部91を備えている。このタイミング検出部91は、撮像装置1が備えている動作部が動作するタイミングを検出する。
ここでいう動作部とは、一例としては、上述したズームレンズ14、VRレンズ13、AFレンズ12、又は操作部80のことであり、撮像装置1が備えている構成のうち、動作することにより、又は、動作されることにより、音が生じる(又は、音が生じる可能性がある)構成である。
また、この動作部とは、撮像装置1が備えている構成のうち、動作することにより生じた音、又は、動作されることにより生じた音が、マイク21により収音される(又は、収音される可能性のある)構成である。
また、この動作部とは、撮像装置1が備えている構成のうち、動作することにより生じた音、又は、動作されることにより生じた音が、マイク21により収音される(又は、収音される可能性のある)構成である。
このタイミング検出部91は、動作部を動作させる制御信号に基づいて、動作部が動作するタイミングを検出してもよい。この制御信号とは、動作部を動作させる駆動部に対して、動作部を動作させるようにする制御信号、又は、この駆動部を駆動させる制御信号である。
例えば、タイミング検出部91は、ズームレンズ14、VRレンズ13、又は、AFレンズ12を駆動させるためにレンズ駆動部16又は手振れ防止部18に入力される駆動制御信号に基づいて、又は、CPU90で生成される駆動制御信号に基づいて、動作部が動作するタイミングを検出してもよい。
例えば、タイミング検出部91は、ズームレンズ14、VRレンズ13、又は、AFレンズ12を駆動させるためにレンズ駆動部16又は手振れ防止部18に入力される駆動制御信号に基づいて、又は、CPU90で生成される駆動制御信号に基づいて、動作部が動作するタイミングを検出してもよい。
そして、タイミング検出部91は、撮像装置1が備えている動作部が動作するタイミングを検出し、この検出したタイミングを示す信号(タイミング信号)を、音信号処理部23に出力する(後述する図3(A)を参照)。このタイミング信号は、音信号(入力信号)に含まれるノイズが発生したタイミングを示す信号である。ここで、一例として、上述したノイズの発生源となる駆動部が動作している場合に、タイミング信号の状態は、H(ハイ)状態とし、駆動部が停止している場合に、タイミング信号の状態は、L(ロウ)状態とする。
バス300は、撮像部10と、音信号処理部23と、バッファメモリ部30と、画像処理部40と、表示部50と、記憶部60と、通信部70と、操作部80と、CPU90とに接続され、各部から出力されたデータ等を転送する。
次に、図2を参照して、図1の構成のうち、信号処理装置100及び音信号処理部23の詳細な構成について説明する。
図2は、本実施形態における信号処理装置100を示す概略ブロック図である。
この図において、信号処理装置100は、音信号処理部23、CPU90のタイミング検出部91、変換信号記憶部61、ノイズ候補記憶部62及び推定ノイズ記憶部63を備えている。なお、変換信号記憶部61、ノイズ候補記憶部62及び推定ノイズ記憶部63は、例えば、記憶部60に備えられ、記憶部60の一部である。
図2は、本実施形態における信号処理装置100を示す概略ブロック図である。
この図において、信号処理装置100は、音信号処理部23、CPU90のタイミング検出部91、変換信号記憶部61、ノイズ候補記憶部62及び推定ノイズ記憶部63を備えている。なお、変換信号記憶部61、ノイズ候補記憶部62及び推定ノイズ記憶部63は、例えば、記憶部60に備えられ、記憶部60の一部である。
音信号処理部23は、A/D変換部22によりデジタル信号に変換された音信号(入力信号)に対して、例えば、ノイズを低減するなどの音信号処理を実行し、この音信号処理した音信号を記憶媒体200に記憶させる。なお、本実施形態において、「ノイズ」とは、上述した動作部による動作によって発生し、音信号に含まれる(すなわち、音信号に重畳している)ノイズ信号のことである。
また、音信号処理部23は、タイミング検出部91によって検出されたタイミング信号に基づいて、入力信号に含まれるノイズの候補を示すノイズ候補を生成する。そして、音信号処理部23は、生成したノイズ候補に基づいて、上述のノイズを低減する処理における推定ノイズを変更(更新)する処理を実行する。
また、音信号処理部23は、変換部231、ノイズ候補判定部232、ノイズ候補生成部233、推定ノイズ算出部234、ノイズ低減処理部235及び逆変換部236を備えている。また、この音信号処理部23が備える構成のうち、例えば、ノイズ候補生成部233、及び推定ノイズ算出部234が、推定ノイズ変更部24に対応する。
また、音信号処理部23は、変換部231、ノイズ候補判定部232、ノイズ候補生成部233、推定ノイズ算出部234、ノイズ低減処理部235及び逆変換部236を備えている。また、この音信号処理部23が備える構成のうち、例えば、ノイズ候補生成部233、及び推定ノイズ算出部234が、推定ノイズ変更部24に対応する。
変換部231は、A/D変換部22によりデジタル信号に変換された音信号を、フレーム単位でフーリエ変換して周波数スペクトル(周波数領域信号)に分解する。つまり、変換部231は、A/D変換部22によりデジタル信号に変換された音信号(入力された入力信号)をフレーム単位で周波数領域信号に順次変換する。
なお、フレームとは、音信号を分割した区間のことである。ここでは、例えば、予め定められた期間を2分の1期間ずつずらした区間をフレームをとした場合について説明する(後述する図3(B)を参照)。
また、変換部231は、フレーム単位に変換した周波数スペクトルを、タイミング検出部91によって検出されたタイミング信号の状態と関連付けて、変換信号記憶部61に順次記憶させる。
なお、フレームとは、音信号を分割した区間のことである。ここでは、例えば、予め定められた期間を2分の1期間ずつずらした区間をフレームをとした場合について説明する(後述する図3(B)を参照)。
また、変換部231は、フレーム単位に変換した周波数スペクトルを、タイミング検出部91によって検出されたタイミング信号の状態と関連付けて、変換信号記憶部61に順次記憶させる。
推定ノイズ変更部24のノイズ候補生成部233は、音信号に含まれるノイズが発生したタイミングに基づいて推定されるノイズ候補(第1の推定ノイズ周波数領域信号)を生成する。つまり、ノイズ候補生成部233は、タイミング検出部91によって検出されたタイミング信号がL状態からH状態に遷移するタイミングに基づいて、ノイズ候補を生成する。
このノイズ候補は、後述する推定ノイズの候補となる周波数スペクトルであり、例えば、ノイズが発生する前後の期間において変換部231によって変換された周波数スペクトルに基づいて生成される。ここで、ノイズが発生する前の期間(例えば、図3のフレームF3)において変換部231によって変換された周波数スペクトルを第1の周波数スペクトル(第1の周波数領域信号)とする。また、ノイズが発生した後の期間(例えば、図3のフレームF6)において変換された周波数スペクトルを第2の周波数スペクトル(第2の周波数領域信号)とする。つまり、ノイズ候補生成部233(推定ノイズ変更部24)は、第1の周波数スペクトル(第1の周波数領域信号)と第2の周波数スペクトル(第2の周波数領域信号)とに基づいてノイズ候補を生成する。
また、ノイズ候補生成部233は、生成したノイズ候補をノイズ候補記憶部62に記憶させる。
また、ノイズ候補生成部233は、生成したノイズ候補をノイズ候補記憶部62に記憶させる。
ノイズ候補判定部232(判定部)は、上述したノイズ候補が推定ノイズ(第2の推定ノイズ周波数領域信号)を変更する場合に適している度合い(適合度)を、上述した第1の周波数スペクトル又は上述した第2の周波数スペクトルに基づいて判定する。ここで、「推定ノイズ(第2の推定ノイズ周波数領域信号)」とは、後述するノイズ低減処理部によってノイズを入力信号から除去(又は低減)するための推定ノイズの周波数スペクトルを示す。すなわち、「推定ノイズ(第2の推定ノイズ周波数領域信号)」とは、入力信号に含まれるノイズの推定値を示す。
また、ノイズ候補判定部232は、例えば、ノイズ候補に対する第1の周波数スペクトルの比であるSNR(signal-noise ratio)を算出し、算出したSNRの値に基づいて、上述の度合いを判定する(第1の方法)。そして、ノイズ候補判定部232は、判定結果を推定ノイズ変更部24の推定ノイズ算出部234に供給する。ここで、ノイズ候補判定部232が推定ノイズ算出部234に供給する判定結果は、算出したSNRの値でもよいし、算出したSNRの値に基づいて判定したレベルや“1”又は“0”の判定値でもよい。ここでは、一例として、判定結果がSNRの値である場合について説明する。
推定ノイズ変更部24の推定ノイズ算出部234は、例えば、上述のSNRの値に基づいて、推定ノイズを変更するか否かを判定する。推定ノイズ算出部234は、推定ノイズを変更すると判定した場合に、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する。そして、推定ノイズ算出部234は、算出した推定ノイズを推定ノイズ記憶部63に記憶させる。すなわち、推定ノイズ算出部234(推定ノイズ変更部24)は、ノイズ候補判定部232の判定結果とノイズ候補とに基づいて、推定ノイズを変更する。
なお、推定ノイズ算出部234は、新しい推定ノイズを算出する際に、ノイズ候補生成部233と、過去に生成されたノイズ候補又は既に推定ノイズ記憶部63に記憶されている推定ノイズとの平均値に基づいて、推定ノイズを算出してもよい。
また、推定ノイズ算出部234は、上述のSNRの値に基づいて重み付けして、過去に生成されたノイズ候補又は既に推定ノイズ記憶部63に記憶されている推定ノイズとの平均値に基づいて、推定ノイズを算出してもよい。この場合、推定ノイズ算出部234は、推定ノイズを変更するか否かを判定する処理を省略して、SNRの値に基づいて重み付け平均値に基づいて、推定ノイズを変更してもよい。
また、推定ノイズ算出部234は、上述のSNRの値に基づいて重み付けして、過去に生成されたノイズ候補又は既に推定ノイズ記憶部63に記憶されている推定ノイズとの平均値に基づいて、推定ノイズを算出してもよい。この場合、推定ノイズ算出部234は、推定ノイズを変更するか否かを判定する処理を省略して、SNRの値に基づいて重み付け平均値に基づいて、推定ノイズを変更してもよい。
ノイズ低減処理部235は、スペクトル減算法を用い、変換部231によって変換された音信号の周波数スペクトルから、推定ノイズを減算することで、収音された音信号からノイズを低減するノイズ低減処理を行う。このスペクトル減算法は、例えば、「BOLL, S. F. Suppression of Acoustic Noise in Speech Using Spectral Subtraction. IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP−27, pp. 113−120, Apr. 1979」に記載されている。
ノイズ低減処理部235は、フレーム単位に変換された周波数スペクトルから、推定ノイズ記憶部63に記憶されている推定ノイズを減算し、ノイズ除去後の周波数スペクトルを生成する。そして、ノイズ低減処理部235は、生成したノイズ除去後の周波数スペクトルを逆変換部236に順次供給する。
なお、ノイズ低減処理部235は、フレーム単位に変換された周波数スペクトルとタイミング信号の状態とを変換信号記憶部61から順次読み出して、タイミング信号の状態に基づいて、ノイズ低減処理を実行するか否かを判定し、ノイズ低減処理を実行すると判定した場合に、上述のノイズ低減処理を実行する。つまり、ノイズ低減処理部235は、ノイズ低減処理を実行しないと判定した場合に、ノイズ低減処理を実行せずに、周波数スペクトルを逆変換部236に順次供給する。
なお、ノイズ低減処理部235は、フレーム単位に変換された周波数スペクトルとタイミング信号の状態とを変換信号記憶部61から順次読み出して、タイミング信号の状態に基づいて、ノイズ低減処理を実行するか否かを判定し、ノイズ低減処理を実行すると判定した場合に、上述のノイズ低減処理を実行する。つまり、ノイズ低減処理部235は、ノイズ低減処理を実行しないと判定した場合に、ノイズ低減処理を実行せずに、周波数スペクトルを逆変換部236に順次供給する。
逆変換部236は、ノイズ低減処理部235から供給されるフレーム単位の周波数スペクトルを逆フーリエ変換し、この逆変換結果に基づいて音信号を合成する。そして、逆変換部236は、合成した音信号を、通信部70を介して記憶媒体200に記憶させる。
変換信号記憶部61は、変換部231によって、フレーム単位に変換した周波数スペクトルと、タイミング検出部91によって検出されたタイミング信号の状態とを関連付けて記憶する。
ノイズ候補記憶部62は、音信号に含まれるノイズが発生したタイミングに基づいて、ノイズ候補生成部233によって生成されたノイズ候補を記憶する。なお、このノイズ候補には、過去に生成されたノイズ候補が含まれてもよい。推定ノイズ記憶部63は、例えば、過去4回分のノイズ候補を記憶する。
推定ノイズ記憶部63は、推定ノイズ算出部234によって算出された推定ノイズを記憶する。
推定ノイズ記憶部63は、推定ノイズ算出部234によって算出された推定ノイズを記憶する。
次に、本実施形態における撮像装置1及び信号処理装置100の動作について説明する。
まず、撮像装置1の撮像動作について説明する。
撮像装置1において、CPU90は、例えば、操作部80を介して撮像指示を受け付けた際に、撮像部10を介して得られる画像データを、記憶媒体200に記憶させる。この際に、CPU90は、レンズ駆動部16及び手振れ防止部18を制御して、ズームレンズ14、VRレンズ13、又はAFレンズ12を駆動させる。
撮像装置1において、CPU90は、例えば、操作部80を介して撮像指示を受け付けた際に、撮像部10を介して得られる画像データを、記憶媒体200に記憶させる。この際に、CPU90は、レンズ駆動部16及び手振れ防止部18を制御して、ズームレンズ14、VRレンズ13、又はAFレンズ12を駆動させる。
なお、使用者が動画を撮像する場合には、マイク21により音信号が収音され、収音された音信号が、A/D変換部22及び音信号処理部23を介して、音信号が記憶媒体200に記憶される。この場合に、ズームレンズ14、VRレンズ13、又はAFレンズ12の駆動や操作部80の操作により、マイク21により収音された音信号にノイズが重畳されることがある。本実施形態における撮像装置1では、音信号処理部23を含む信号処理装置100を備えており、この信号処理装置100によって、音信号に重畳されたノイズを低減するノイズ低減処理を実行する。
図3は、本実施形態におけるノイズが重畳した音信号の例を示す説明図である。
図3(A)は、タイミング検出部91の出力であるタイミング信号の波形を示すグラフである。この図において、横軸は時刻tを示し、縦軸は、タイミング信号の状態(H状態又はL状態)を示している。また、この図では、時刻T1において、タイミング信号がL状態からH状態に遷移する場合の一例を示している。
図3(A)は、タイミング検出部91の出力であるタイミング信号の波形を示すグラフである。この図において、横軸は時刻tを示し、縦軸は、タイミング信号の状態(H状態又はL状態)を示している。また、この図では、時刻T1において、タイミング信号がL状態からH状態に遷移する場合の一例を示している。
図3(B)は、音信号を分割するフレームの一例を示す図である。この図において、横軸は、横軸は時刻tを示し、予め定められた期間を2分の1期間ずつずらした区間を1つのフレームをとして、フレームF1からフレームF7に分割される例を示している。
図3(C)は、マイク21により収音された音信号の波形を示すグラフである。この図において、横軸は時刻tを示し、縦軸は、音信号の電圧を示している。なお、波形W1は、時刻T1までの期間(ノイズが発生する前の期間)の音信号を示し、波形W2は、時刻T1以降の期間(ノイズが発生した後の期間)の音信号を示している。波形W2に示すように、時刻T1以降の期間において、上述のズームレンズ14、VRレンズ13、又はAFレンズ12の駆動や操作部80の操作により、音信号にノイズが重畳される。
次に、信号処理装置100におけるノイズ低減処理に関する動作を説明する。
図4は、本実施形態におけるノイズ低減処理の動作を示すフローチャートである。
図4は、本実施形態におけるノイズ低減処理の動作を示すフローチャートである。
この図において、まず、信号処理装置100は、入力された音信号をフレーム単位でフーリエ変換する(ステップS101)。つまり、音信号処理部23の変換部231は、A/D変換部22によりデジタル信号に変換された音信号をフレーム単位で周波数領域信号に変換する。なお、変換部231は、フーリエ変換する際に、例えば、ハミング窓を窓関数として使用する。そして、変換部231は、フレーム単位に変換した周波数スペクトルを、タイミング検出部91によって検出されたタイミング信号の状態と関連付けて、変換信号記憶部61に順次記憶させる。
次に、信号処理装置100は、ノイズのタイミング信号が検出されているか否かを判定する(ステップS102)。つまり、音信号処理部23は、変換信号記憶部61に記憶されたタイミング検出部91によって検出されたタイミング信号の状態に基づいて、ノイズが発生しているか否か(タイミング信号がH状態になっているか否か)を判定する。音信号処理部23は、ノイズが発生している(タイミング信号がH状態になっている)と判定した場合に、処理をステップS103に進める。また、音信号処理部23は、ノイズが発生していいない(タイミング信号がL状態になっている)と判定した場合に、処理をステップS106に進める。
次に、ステップS103において、信号処理装置100は、ステップS104における推定ノイズの変更処理を既に実行しているか否かを判定する。つまり、音信号処理部23は、推定ノイズ変更部24による推定ノイズの変更処理が実行されている状態か否かを判定する。音信号処理部23は、推定ノイズの変更処理が実行されている状態であると判定した場合には、処理をステップS105に進める。また、音信号処理部23は、推定ノイズの変更処理が実行されていない状態であると判定した場合には、処理をステップS104に進める。
なお、音信号処理部23において、推定ノイズの変更処理が実行されている状態か否かを判定する処理は、例えば、記憶部60に設けられえたフラグに基づいて、判定される。このフラグは、例えば、推定ノイズの変更処理が実行された際に、推定ノイズ変更部24によって“1”が書き込まれ、タイミング信号がL状態になったことを検出した場合に、変換部231によって“0”が書き込まれる。つまり、このフラグは、“1”である場合に、推定ノイズの変更処理が実行されたことを示し、“0”である場合に、推定ノイズの変更処理が実行されていないことを示す。
次に、ステップS104において、信号処理装置100は、推定ノイズの変更処理を実行する。つまり、ノイズ候補判定部232及び推定ノイズ変更部24が、推定ノイズの変更処理を実行する。このステップS104における推定ノイズの変更処理の詳細については、後述する。
次に、信号処理装置100は、推定ノイズによりノイズを低減するノイズ低減処理を実行する(ステップS105)。つまり、ノイズ低減処理部235は、変換信号記憶部61に記憶されているフレーム単位に変換された周波数スペクトルから、推定ノイズ記憶部63に記憶されている推定ノイズを減算し、ノイズ除去後の周波数スペクトルを生成する。そして、ノイズ低減処理部235は、生成したノイズ除去後の周波数スペクトルを逆変換部236に供給する。
次に、信号処理装置100は、フレーム単位で逆フーリエ変換する(ステップS106)。つまり、逆変換部236は、ノイズ低減処理部235から供給されるフレーム単位の周波数スペクトル(ノイズ除去後の周波数スペクトル又は変換部231によってフーリエ変換された周波数スペクトル)を逆フーリエ変換(逆変換)して、音信号を合成する。そして、逆変換部236は、合成した音信号を、通信部70を介して記憶媒体200に記憶させる。
次に、信号処理装置100は、録音終了か否かを判定する(ステップS107)。つまり、音信号処理部23は、CPU90の指示に基づいて、マイク21による収音を終了するか否かを判定し、収音を終了すると判定した場合に、このノイズ低減処理を終了させる。また、音信号処理部23は、マイク21による収音を継続する(終了しない)と判定した場合に、処理をステップS101に戻す。これにより、ステップS101〜S107の処理が繰り返され、フレーム単位で順次ノイズ低減処理が実行される。
次に、上述したステップS104の処理である推定ノイズの変更処理について、詳細に説明する。なお、ここでは、推定ノイズの変更処理として、第1〜第4の方法による実施形態を説明する。
図5は、本実施形態による第1の方法における推定ノイズの変更処理の一例を示す第1のフローチャートである。
また、図6は、本実施形態におけるノイズ候補を説明する説明図である。
この図において、各グラフは、周波数スペクトルを示す。また、各グラフにおいて、横軸が周波数領域を示し、縦軸が例えば、PSD(Power Spectrum Density)を示す。
図5は、本実施形態による第1の方法における推定ノイズの変更処理の一例を示す第1のフローチャートである。
また、図6は、本実施形態におけるノイズ候補を説明する説明図である。
この図において、各グラフは、周波数スペクトルを示す。また、各グラフにおいて、横軸が周波数領域を示し、縦軸が例えば、PSD(Power Spectrum Density)を示す。
[第1の方法]
なお、本実施形態による推定ノイズの変更処理における第1の方法は、ノイズ候補に対する第1の周波数スペクトルの比であるSNRの値に基づいて、推定ノイズを変更する方法である。
また、図5に示される本実施形態では、信号処理装置100は、ノイズ候補判定部232の判定結果に基づいて、推定ノイズを変更するか否かを判定し、この判定結果に基づいて、推定ノイズを変更する形態である。
なお、本実施形態による推定ノイズの変更処理における第1の方法は、ノイズ候補に対する第1の周波数スペクトルの比であるSNRの値に基づいて、推定ノイズを変更する方法である。
また、図5に示される本実施形態では、信号処理装置100は、ノイズ候補判定部232の判定結果に基づいて、推定ノイズを変更するか否かを判定し、この判定結果に基づいて、推定ノイズを変更する形態である。
図5において、まず、推定ノイズ変更部24のノイズ候補生成部233は、音信号に含まれるノイズが発生したタイミングに基づいて推定されるノイズ候補を生成(算出)する(ステップS201)。つまり、ノイズ候補生成部233は、図6に示すように、第1の周波数スペクトル(例えば、フレームF3における周波数スペクトル)と第2の周波数スペクトル(例えば、フレームF6における周波数スペクトル)との差分として、ノイズ候補を生成する。
例えば、図6(a)において、ノイズ候補である周波数スペクトルW5は、ノイズ候補生成部233によって、フレームF6における周波数スペクトルW4からフレームF3における周波数スペクトルW3を減算された差分として算出される。また、図6(b)において、ノイズ候補である周波数スペクトルW8は、ノイズ候補生成部233によって、フレームF6における周波数スペクトルW7からフレームF3における周波数スペクトルW6を減算された差分として算出される。
次に、推定ノイズ変更部24のノイズ候補判定部232は、ノイズ候補に対する第1の周波数スペクトルの大きさの比であるSNRを算出する(ステップS202)。例えば、図6(a)において、ノイズ候補判定部232は、ノイズ候補である周波数スペクトルW5に対するフレームF3における周波数スペクトルW3の比としてSNRを算出する。また、図6(b)において、ノイズ候補判定部232は、ノイズ候補である周波数スペクトルW8に対するフレームF3における周波数スペクトルW6の比としてSNRを算出する。
そして、ノイズ候補判定部232は、算出したSNRの値を判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。
そして、ノイズ候補判定部232は、算出したSNRの値を判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。
なお、図6(a)は、SNRの値が小さい場合の例を示し、図6(b)は、SNRの値が大きい場合の例を示しめしている。ここで、SNRの値が大きい場合とは、例えば、SNRの値が、予め定められた第1閾値以上である場合を示し、SNRの値が小さい場合とは、SNRの値が、予め定められた第1閾値より小さい場合を示す。
次に、推定ノイズ算出部234は、SNRの値が第1閾値以上であるか否かを判定する(ステップS203)。推定ノイズ算出部234は、SNRの値が第1閾値以上である場合には、推定ノイズの変更処理を中止し、処理を終了させる(例えば、図6(b)のような場合)。これは、ノイズ発生前の周波数スペクトルである第1の周波数スペクトルに対して、ノイズ候補が小さい場合である。
この場合、目的音がノイズ(ノイズ候補)に対して大きいため、ノイズ発生の前後で目的音が大きく変化した可能性が考えられ、このノイズ候補に基づいて推定ノイズを変更すると、推定ノイズと実際のノイズとの間に大きな誤差が生じてしまう。そのため、推定ノイズ算出部234は、ノイズ候補に基づいて推定ノイズを変更する場合に適していないと判定する。
この場合、目的音がノイズ(ノイズ候補)に対して大きいため、ノイズ発生の前後で目的音が大きく変化した可能性が考えられ、このノイズ候補に基づいて推定ノイズを変更すると、推定ノイズと実際のノイズとの間に大きな誤差が生じてしまう。そのため、推定ノイズ算出部234は、ノイズ候補に基づいて推定ノイズを変更する場合に適していないと判定する。
よって、この場合には、推定ノイズ算出部234は、推定ノイズの変更を行わず、ノイズ低減処理部235は、それ以前の推定ノイズを続けて使用して、ノイズの低減処理を実行する。ここで、目的音とは、使用者が、撮像装置1のマイク21によって収音しようとしている目的の音(録音対象の音)である。
また、推定ノイズ算出部234は、SNRの値が第1閾値未満である場合に、処理をステップS204に進める(例えば、図6(a)のような場合)。この場合、目的音がノイズ(ノイズ候補)に対して小さいため、ノイズ候補の信頼度が高いと考えられる。
次に、ステップS204において、推定ノイズ算出部234は、推定ノイズを変更する。つまり、推定ノイズ算出部234は、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する。そして、推定ノイズ算出部234は、算出した推定ノイズを推定ノイズ記憶部63に記憶させる。これにより、推定ノイズが変更(更新)される。
なお、推定ノイズ算出部234が変更する新しい推定ノイズは、ノイズ候補生成部233によって生成されたノイズ候補をそのままの値でもよいし、ノイズ候補生成部233によって生成されたノイズ候補と、過去に生成されたノイズ候補又は既に推定ノイズ記憶部63に記憶されている推定ノイズとの平均値でもよい。また、この新しい推定ノイズは、さらに、算出されたこの平均値に基づいて生成されてもよい。
ステップS204の処理が完了すると、推定ノイズ変更部24は、処理を終了させる。
ステップS204の処理が完了すると、推定ノイズ変更部24は、処理を終了させる。
次に、本実施形態による第1の方法における推定ノイズの変更処理の別の一例について説明する。
図7は、本実施形態による第1の方法における推定ノイズの変更処理の別の一例を示す第2のフローチャートである。
図7に示される本実施形態では、信号処理装置100は、ノイズ候補判定部232の判定結果に基づいて、重み付け平均値を算出し、算出した平均値に基づいて、推定ノイズを変更する形態である。
図7は、本実施形態による第1の方法における推定ノイズの変更処理の別の一例を示す第2のフローチャートである。
図7に示される本実施形態では、信号処理装置100は、ノイズ候補判定部232の判定結果に基づいて、重み付け平均値を算出し、算出した平均値に基づいて、推定ノイズを変更する形態である。
図5において、まず、推定ノイズ変更部24のノイズ候補生成部233は、音信号に含まれるノイズが発生したタイミングに基づいて推定されるノイズ候補を生成(算出)する(ステップS301)。つまり、ノイズ候補生成部233は、第1の周波数スペクトルと第2の周波数スペクトルとの差分として、ノイズ候補を生成する。このステップS301の処理は、図5におけるステップS201の処理と同様である。
次に、推定ノイズ変更部24のノイズ候補判定部232は、ノイズ候補に対する第1の周波数スペクトルの大きさの比であるSNRを算出する(ステップS302)。そして、ノイズ候補判定部232は、算出したSNRの値を判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。このステップS302の処理は、図5におけるステップS202の処理と同様である。
次に、推定ノイズ算出部234は、SNRの値に基づいて、ノイズ候補を重き付け平均する(ステップS303)。つまり、推定ノイズ算出部234は、SNRの値に基づいて重み付けして、ノイズ候補生成部233によって生成されたノイズ候補と過去に生成されたノイズ候補(例えば、過去4回分のノイズ候補)又は既に推定ノイズ記憶部63に記憶されている推定ノイズとの平均値を算出する。この重み付けは、SNRの値が小さい場合(例えば、図6(a)のような場合)に高く(重く)し、SNRの値が大きい場合(例えば、図6(b)のような場合)に低く(軽く)する。推定ノイズ算出部234は、例えば、SNRの逆数に基づいて、重み付け係数を算出してもよいし、SNRの値と重み付け係数とを関連付けた変換テーブルを用いて、重み付け係数を取得してもよい。
次に、推定ノイズ算出部234は、推定ノイズを変更する(ステップS304)。つまり、推定ノイズ算出部234は、上述のステップS303の処理において算出された平均値を、推定ノイズとして推定ノイズ記憶部63に記憶させる。これにより、推定ノイズが変更(更新)される。
なお、この図7に示されるノイズ候補の重み付け平均に基づいて、推定ノイズを変更する形態は、図5に示される形態を組み合わせて適用してもよい。例えば、推定ノイズ算出部234は、SNRの値が第1閾値未満である場合に、上述のステップS303及びステップS304の処理を実行してもよい。
以上のように、一例として、推定ノイズの変更処理における第1の方法を説明したが、以下のような方法を適用することも可能である。
[第2の方法]
推定ノイズの変更処理における第2の方法では、ノイズ発生前の周波数スペクトルである第1の周波数スペクトルの大きさに基づいて、推定ノイズを変更する。つまり、推定ノイズ変更部24のノイズ候補判定部232は、例えば、第1の周波数スペクトルの大きさとして、第1の周波数スペクトルにおける全周波数成分の振幅の和を算出する。そして、ノイズ候補判定部232は、算出した第1の周波数スペクトルの大きさを判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。
推定ノイズの変更処理における第2の方法では、ノイズ発生前の周波数スペクトルである第1の周波数スペクトルの大きさに基づいて、推定ノイズを変更する。つまり、推定ノイズ変更部24のノイズ候補判定部232は、例えば、第1の周波数スペクトルの大きさとして、第1の周波数スペクトルにおける全周波数成分の振幅の和を算出する。そして、ノイズ候補判定部232は、算出した第1の周波数スペクトルの大きさを判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。
次に、推定ノイズ算出部234は、第1の周波数スペクトルの大きさが予め定められた第2閾値以上であるか否かを判定する。推定ノイズ算出部234は、第1の周波数スペクトルの大きさが第2閾値以上である場合には、推定ノイズの変更処理を中止し、処理を終了させる。この場合、第1の周波数スペクトルが大きい、すなわち、ノイズ発生前に収音した音量が全体に大きいため、推定ノイズ算出部234は、ノイズ候補に基づいて推定ノイズを変更する場合に適していないと判定する。
また、推定ノイズ算出部234は、第1の周波数スペクトルの大きさが第2閾値未満である場合に、推定ノイズを変更する。つまり、推定ノイズ算出部234は、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する。そして、推定ノイズ算出部234は、算出した推定ノイズを推定ノイズ記憶部63に記憶させる。これにより、推定ノイズが変更(更新)される。
なお、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する処理は、上述した第1の方法と同様である。また、第1の方法と同様に、推定ノイズを重み付け平均に基づいて算出してもよい。
なお、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する処理は、上述した第1の方法と同様である。また、第1の方法と同様に、推定ノイズを重み付け平均に基づいて算出してもよい。
例えば、第2の方法において、重み付け平均に基づいて推定ノイズを算出する際には、推定ノイズ算出部234は、第1の周波数スペクトルの大きさが小さい場合に重み付けを高く(重く)し、第1の周波数スペクトルの大きさが大きい場合に重み付けを低く(軽く)する。
[第3の方法]
次に、推定ノイズの変更処理における第3の方法では、ノイズ発生後の周波数スペクトルである第2の周波数スペクトルの大きさとノイズ発生前の周波数スペクトルである第1の周波数スペクトルの大きさとの差に基づいて、推定ノイズを変更する。つまり、推定ノイズ変更部24のノイズ候補判定部232は、例えば、第2の周波数スペクトルの大きさとして、第2の周波数スペクトルにおける全周波数成分の振幅の和を算出する。
また、ノイズ候補判定部232は、例えば、第1の周波数スペクトルの大きさとして、第1の周波数スペクトルにおける全周波数成分の振幅の和を算出する。そして、ノイズ候補判定部232は、第2の周波数スペクトルの大きさと第1の周波数スペクトルの大きさとの差であるノイズ発生前後の周波数スペクトルの大きさの差ΔS(以下、ノイズ発生前後の差ΔSという)を算出する。ノイズ候補判定部232は、算出したこのノイズ発生前後の差ΔSを判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。
次に、推定ノイズの変更処理における第3の方法では、ノイズ発生後の周波数スペクトルである第2の周波数スペクトルの大きさとノイズ発生前の周波数スペクトルである第1の周波数スペクトルの大きさとの差に基づいて、推定ノイズを変更する。つまり、推定ノイズ変更部24のノイズ候補判定部232は、例えば、第2の周波数スペクトルの大きさとして、第2の周波数スペクトルにおける全周波数成分の振幅の和を算出する。
また、ノイズ候補判定部232は、例えば、第1の周波数スペクトルの大きさとして、第1の周波数スペクトルにおける全周波数成分の振幅の和を算出する。そして、ノイズ候補判定部232は、第2の周波数スペクトルの大きさと第1の周波数スペクトルの大きさとの差であるノイズ発生前後の周波数スペクトルの大きさの差ΔS(以下、ノイズ発生前後の差ΔSという)を算出する。ノイズ候補判定部232は、算出したこのノイズ発生前後の差ΔSを判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。
次に、推定ノイズ算出部234は、ノイズ発生前後の差ΔSが予め定められた第3閾値以上であるか否かを判定する。推定ノイズ算出部234は、ノイズ発生前後の差ΔSが第3閾値以上である場合には、推定ノイズの変更処理を中止し、処理を終了させる。この場合、ノイズ発生前後の差ΔSが大きい、すなわち、ノイズ発生前後において、収音した音量が大きく変化したことを示す。そのため、推定ノイズ算出部234は、ノイズ候補に基づいて推定ノイズを変更する場合に適していないと判定する。
また、推定ノイズ算出部234は、ノイズ発生前後の差ΔSが第3閾値未満である場合に、推定ノイズを変更する。つまり、推定ノイズ算出部234は、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する。そして、推定ノイズ算出部234は、算出した推定ノイズを推定ノイズ記憶部63に記憶させる。これにより、推定ノイズが変更(更新)される。
なお、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する処理は、上述した第1の方法と同様である。また、第1の方法と同様に、推定ノイズを重み付け平均に基づいて算出してもよい。
なお、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する処理は、上述した第1の方法と同様である。また、第1の方法と同様に、推定ノイズを重み付け平均に基づいて算出してもよい。
例えば、第3の方法において、重み付け平均に基づいて推定ノイズを算出する際には、推定ノイズ算出部234は、ノイズ発生前後の差ΔSが小さい場合に重み付けを高く(重く)し、ノイズ発生前後の差ΔSが大きい場合に重み付けを低く(軽く)する。
[第4の方法]
次に、推定ノイズの変更処理における第4の方法では、ノイズ発生後の周波数スペクトルである第2の周波数スペクトルの大きさに基づいて、推定ノイズを変更する。つまり、推定ノイズ変更部24のノイズ候補判定部232は、例えば、第2の周波数スペクトルの大きさとして、第2の周波数スペクトルにおける全周波数成分の振幅の和を算出する。そして、ノイズ候補判定部232は、算出した第2の周波数スペクトルの大きさを判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。
次に、推定ノイズの変更処理における第4の方法では、ノイズ発生後の周波数スペクトルである第2の周波数スペクトルの大きさに基づいて、推定ノイズを変更する。つまり、推定ノイズ変更部24のノイズ候補判定部232は、例えば、第2の周波数スペクトルの大きさとして、第2の周波数スペクトルにおける全周波数成分の振幅の和を算出する。そして、ノイズ候補判定部232は、算出した第2の周波数スペクトルの大きさを判定結果として推定ノイズ変更部24の推定ノイズ算出部234に供給する。
次に、推定ノイズ算出部234は、第2の周波数スペクトルの大きさが、第1の周波数スペクトルの大きさより小さいか否かを判定する。推定ノイズ算出部234は、第2の周波数スペクトルの大きさが、第1の周波数スペクトルの大きさより小さい場合には、推定ノイズの変更処理を中止し、処理を終了させる。この場合、第2の周波数スペクトルが第1の周波数スペクトルの大きさより小さいため、第2の周波数スペクトルから第1の周波数スペクトルを減算する差分としてノイズ候補を算出できない。そのため、推定ノイズ算出部234は、ノイズ候補に基づいて推定ノイズを変更する場合に適していないと判定する。
また、推定ノイズ算出部234は、第2の周波数スペクトルの大きさが、第1の周波数スペクトルの大きさ以上である場合に、推定ノイズを変更する。つまり、推定ノイズ算出部234は、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する。そして、推定ノイズ算出部234は、算出した推定ノイズを推定ノイズ記憶部63に記憶させる。これにより、推定ノイズが変更(更新)される。
なお、上述では、推定ノイズ算出部234は、第2の周波数スペクトルの大きさが、第1の周波数スペクトルの大きさより小さい場合に、推定ノイズの変更処理を中止しているが、第2の周波数スペクトルの大きさが、予め定められた第4閾値以下である場合に推定ノイズの変更処理を中止してもよい。
また、ノイズ候補生成部233によって生成されたノイズ候補に基づいて、推定ノイズを算出する処理は、上述した第1の方法と同様である。また、第1の方法と同様に、推定ノイズを重み付け平均に基づいて算出してもよい。
例えば、第4の方法において、重み付け平均に基づいて推定ノイズを算出する際には、推定ノイズ算出部234は、第2の周波数スペクトルの大きさが大きい場合に重み付けを高く(重く)し、第1の周波数スペクトルの大きさが小さい場合に重み付けを低く(軽く)する。
なお、本実施形態の信号処理装置100及び撮像装置1において、上述した第1〜第4の方法は、単独で適用されてもよいし、複数を組み合わせて使用してもよい。
以上のように、本実施形態による信号処理装置100は、変換部231が、入力された入力信号を、周波数領域信号に変換する。そして、ノイズ候補判定部232は、適合度(度合い)を、第1の周波数スペクトル(第1の周波数領域信号)又は第2の周波数スペクトル(第2の周波数領域信号)に基づいて判定する。ここで、適合度(度合い)は、ノイズ候補(第1の推定ノイズ周波数領域信号)が、ノイズを音信号(入力信号)から除去するための推定ノイズ(第2の推定ノイズ周波数領域信号)を変更する場合に適しているかの度合いを示す。また、第1の周波数スペクトルは、ノイズ発生前の周波数スペクトルであり、第2の周波数スペクトルは、ノイズ発生後の周波数スペクトルである。さらに、推定ノイズ変更部24は、ノイズ候補判定部232の判定結果とノイズ候補とに基づいて、推定ノイズを変更する。
これにより、本実施形態による信号処理装置100では、ノイズが発生したタイミングよって推定されるノイズ候補と、上述の適合度(度合い)とに基づいて、ノイズ低減処理に使用される推定ノイズが変更される。そのため、信号処理装置100は、音信号(入力信号)に重畳しているノイズを適切に低減することができる。例えば、撮像装置1に装着するレンズの種類、焦点距離、及び合焦位置などによってノイズが変化する場合であっても、信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。また、例えば、ノイズ発生の前後で目的音が大きく変化したなどの場合でも、信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
また、本実施形態において、ノイズ候補判定部232は、ノイズ候補に対する第1の周波数スペクトルの比(SNR)、第1の周波数スペクトルの大きさ、第2の周波数スペクトルの大きさ、及び、第2の周波数スペクトルと第1の周波数スペクトルとの差(ΔS)のうちのいずれか1つ、又は組み合わせに基づいて、上述の適合度(度合い)を判定する。
これにより、ノイズ発生前後で、目的音が大きく変化して、ノイズ候補の信頼度が低い場合に、対応することができる。そのため、信号処理装置100は、推定ノイズの精度を向上することができ、音信号から目的音を精度よく取り出すことができる。
これにより、ノイズ発生前後で、目的音が大きく変化して、ノイズ候補の信頼度が低い場合に、対応することができる。そのため、信号処理装置100は、推定ノイズの精度を向上することができ、音信号から目的音を精度よく取り出すことができる。
また、本実施形態において、推定ノイズ変更部24は、以下の(1)〜(4)の条件のうちのいずれか1つ、又は組み合わせを満たす場合に、推定ノイズを変更しない。
(1)ノイズ候補に対する第1の周波数スペクトルの比(SNR)が予め定められた第1閾値以上であるという条件(第1の方法による判定条件)。
(2)第1の周波数スペクトルの大きさが予め定められた第2閾値以上であるという条件(第2の方法による判定条件)。
(3)第2の周波数スペクトルの大きさが第1の周波数領域信号より小さいという条件(第4の方法による判定条件)。
(4)第2の周波数スペクトルと第1の周波数スペクトルとの差が予め定められた第3閾値以上であるという条件(第3の方法による判定条件)。
(1)ノイズ候補に対する第1の周波数スペクトルの比(SNR)が予め定められた第1閾値以上であるという条件(第1の方法による判定条件)。
(2)第1の周波数スペクトルの大きさが予め定められた第2閾値以上であるという条件(第2の方法による判定条件)。
(3)第2の周波数スペクトルの大きさが第1の周波数領域信号より小さいという条件(第4の方法による判定条件)。
(4)第2の周波数スペクトルと第1の周波数スペクトルとの差が予め定められた第3閾値以上であるという条件(第3の方法による判定条件)。
これにより、ノイズ発生前後で、目的音が大きく変化して、ノイズ候補の信頼度が低い場合に、推定ノイズ変更部24は、推定ノイズを変更(更新)しない。つまり、推定ノイズ変更部24は、ノイズ候補と実際のノイズとの間に大きな誤差が生じている可能性のある場合に、推定ノイズを変更(更新)しない。そのため、信号処理装置100は、推定ノイズの精度を向上することができ、音信号から目的音を精度よく取り出すことができる。
また、本実施形態において、推定ノイズ変更部24は、推定ノイズを変更する場合に、上述の適合度(度合い)に基づいて重み付けして、ノイズ候補と過去に取得されたノイズ候補(例えば、過去4回分)との平均値を算出し、算出した平均値に基づいて、推定ノイズを変更する。
これにより、推定ノイズ変更部24は、ノイズ候補と実際のノイズとの間に大きな誤差が生じている可能性のある場合に、その影響度を低減して(重み付けを低くして)、推定ノイズを変更する。そのため、信号処理装置100は、推定ノイズの精度を向上することができ、音信号から目的音を精度よく取り出すことができる。
これにより、推定ノイズ変更部24は、ノイズ候補と実際のノイズとの間に大きな誤差が生じている可能性のある場合に、その影響度を低減して(重み付けを低くして)、推定ノイズを変更する。そのため、信号処理装置100は、推定ノイズの精度を向上することができ、音信号から目的音を精度よく取り出すことができる。
また、本実施形態において、推定ノイズ変更部24は、第1の周波数スペクトルと第2の周波数スペクトルとに基づいて、ノイズ候補を算出する。
これにより、ノイズが発生したタイミングに基づいて毎回、ノイズ候補を算出するので、信号処理装置100は、最新のノイズに基づいて、推定ノイズを更新することができる。そのため、信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
これにより、ノイズが発生したタイミングに基づいて毎回、ノイズ候補を算出するので、信号処理装置100は、最新のノイズに基づいて、推定ノイズを更新することができる。そのため、信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
また、本実施形態において、撮像装置1は、上述の信号処理装置100を備える。
これにより、撮像装置1は、信号処理装置100と同様の効果が期待でき、音信号に重畳しているノイズを適切に低減することができる。
これにより、撮像装置1は、信号処理装置100と同様の効果が期待でき、音信号に重畳しているノイズを適切に低減することができる。
なお、本発明の実施形態によれば、プログラムは、信号処理装置100としてのコンピュータに、変換部231が、入力された入力信号を、周波数領域信号に変換する変換手順(ステップS101)と、入力信号に含まれるノイズが発生したタイミングに基づいて推定されるノイズ候補が、ノイズを入力信号から除去するための推定ノイズを変更する場合に適している度合いを、ノイズが発生する前の期間において変換手順によって変換された第1の周波数スペクトル又はノイズが発生した後の期間において変換手順によって変換された第2の周波数スペクトルに基づいて、ノイズ候補判定部232が判定する判定手順(ステップS202又はS302)と、推定ノイズ変更部24が、判定手順の判定結果とノイズ候補とに基づいて、推定ノイズを変更する推定ノイズ変更手順(ステップS203及びS204又はステップS303及びS304)とを実行させるためのプログラムである。
これにより、プログラムは、信号処理装置100と同様の効果が期待でき、音信号に重畳しているノイズを適切に低減することができる。
これにより、プログラムは、信号処理装置100と同様の効果が期待でき、音信号に重畳しているノイズを適切に低減することができる。
なお、本発明は、上記の各実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で変更可能である。
上記の各実施形態において、推定ノイズ変更部24(推定ノイズ算出部234)が、ノイズ候補判定部232の判定結果(度合い)に基づいて、重み付けした平均を算出する形態を説明したが、他の方法によって、重み付け平均を算出する形態でもよい。例えば、推定ノイズ変更部24は、推定ノイズを変更する場合に、ノイズ候補と過去に取得された複数のノイズ候補との平均値を、過去に取得された複数のノイズ候補の取得された順番が早いほど重み付けを低くして算出し、算出した平均値に基づいて、推定ノイズを変更する形態でもよい。この場合、最近のノイズ候補が重視されて推定ノイズを変更するので、信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
上記の各実施形態において、推定ノイズ変更部24(推定ノイズ算出部234)が、ノイズ候補判定部232の判定結果(度合い)に基づいて、重み付けした平均を算出する形態を説明したが、他の方法によって、重み付け平均を算出する形態でもよい。例えば、推定ノイズ変更部24は、推定ノイズを変更する場合に、ノイズ候補と過去に取得された複数のノイズ候補との平均値を、過去に取得された複数のノイズ候補の取得された順番が早いほど重み付けを低くして算出し、算出した平均値に基づいて、推定ノイズを変更する形態でもよい。この場合、最近のノイズ候補が重視されて推定ノイズを変更するので、信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
また、上記の各実施形態において、信号処理装置100は、記憶部60の一部(変換信号記憶部61、ノイズ候補記憶部62及び推定ノイズ記憶部63)とタイミング検出部91とを備える形態を説明したが、信号処理装置100の外部に備える形態でもよい。
また、上記の各実施形態において、信号処理装置100は、マイク21によって収音された音信号をノイズ低減する形態を説明したが、記憶部60又はバッファメモリ部30に記憶されている音信号をノイズ低減する形態でもよい。
また、上記の各実施形態において、信号処理装置100は、マイク21によって収音された音信号をノイズ低減する形態を説明したが、記憶部60又はバッファメモリ部30に記憶されている音信号をノイズ低減する形態でもよい。
また、上記の各実施形態において、タイミング検出部91は、駆動制御信号に基づいて、動作部が動作するタイミングを検出する形態を説明したが、これに限定されない。
例えば、タイミング検出部91は、操作部80から入力されるズームレンズ14、又は、AFレンズ12を駆動させることを示す信号に基づいて、動作部が動作するタイミングを検出してもよい。
例えば、タイミング検出部91は、操作部80から入力されるズームレンズ14、又は、AFレンズ12を駆動させることを示す信号に基づいて、動作部が動作するタイミングを検出してもよい。
また、このタイミング検出部91は、動作部が動作されたことを示す信号に基づいて、動作部が動作するタイミングを検出してもよい。
例えば、タイミング検出部91は、ズームエンコーダ15又はAFエンコーダ17の出力に基づいて、ズームレンズ14又はAFレンズ12が駆動されたことを検出することにより、動作部が動作するタイミングを検出してもよい。
また、タイミング検出部91は、手振れ防止部18からの出力に基づいて、VRレンズ13が駆動されたことを検出することにより、動作部が動作するタイミングを検出してもよい。
また、このタイミング検出部91は、操作部80からの入力に基づいて、操作部80が操作されたことを検出することにより、動作部が動作するタイミングを検出してもよい。
例えば、タイミング検出部91は、ズームエンコーダ15又はAFエンコーダ17の出力に基づいて、ズームレンズ14又はAFレンズ12が駆動されたことを検出することにより、動作部が動作するタイミングを検出してもよい。
また、タイミング検出部91は、手振れ防止部18からの出力に基づいて、VRレンズ13が駆動されたことを検出することにより、動作部が動作するタイミングを検出してもよい。
また、このタイミング検出部91は、操作部80からの入力に基づいて、操作部80が操作されたことを検出することにより、動作部が動作するタイミングを検出してもよい。
また、上記の各実施形態において、タイミング検出部91及び音信号処理部23は、専用のハードウェアによって実現されてもよい。また、タイミング検出部91及び音信号処理部23は、メモリ及びCPUにより構成され、タイミング検出部91及び音信号処理部23の各機能は、プログラムによって実現されてもよい。
また、上記の各実施形態において、信号処理装置100を撮像装置1に適用する形態を説明したが、これに限定されるものではない。例えば、レコーダなどの録音装置や電話機などのキー操作による音がノイズとして目的音である音信号に重畳されるような装置に適用してもよい。
また、上記の各実施形態において、信号処理装置100を撮像装置1に適用する形態を説明したが、これに限定されるものではない。例えば、レコーダなどの録音装置や電話機などのキー操作による音がノイズとして目的音である音信号に重畳されるような装置に適用してもよい。
上述の信号処理装置100は内部に、コンピュータシステムを有している。そして、上述した信号処理装置100の処理過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしてもよい。
1…撮像装置、100…信号処理装置、24…推定ノイズ変更部、231…変換部、232…ノイズ候補判定部
Claims (8)
- 入力された入力信号を、周波数領域信号に変換する変換部と、
前記入力信号に含まれるノイズが発生したタイミングに基づいて推定される第1の推定ノイズ周波数領域信号が、前記ノイズを前記入力信号から除去するための推定ノイズの周波数領域信号を示す第2の推定ノイズ周波数領域信号を変更する場合に適している度合いを、前記ノイズが発生する前の期間において前記変換部によって変換された第1の周波数領域信号又は前記ノイズが発生した後の期間において前記変換部によって変換された第2の周波数領域信号に基づいて、判定する判定部と、
前記判定部の判定結果と前記第1の推定ノイズ周波数領域信号とに基づいて、前記第2の推定ノイズ周波数領域信号を変更する推定ノイズ変更部と
を備えることを特徴とする信号処理装置。 - 前記判定部は、
前記第1の推定ノイズ周波数領域信号に対する前記第1の周波数領域信号の比、前記第1の周波数領域信号の大きさ、前記第2の周波数領域信号の大きさ、及び、前記第2の周波数領域信号と前記第1の周波数領域信号との差のうちのいずれか1つ、又は組み合わせに基づいて、前記度合いを判定する
ことを特徴とする請求項1に記載の信号処理装置。 - 前記推定ノイズ変更部は、
前記第1の推定ノイズ周波数領域信号に対する前記第1の周波数領域信号の比が予め定められた第1閾値以上であるという条件、
前記第1の周波数領域信号の大きさが予め定められた第2閾値以上であるという条件、
前記第2の周波数領域信号の大きさが前記第1の周波数領域信号より小さいという条件、
及び、前記第2の周波数領域信号と前記第1の周波数領域信号との差が予め定められた第3閾値以上であるという条件のうちのいずれか1つ、又は組み合わせを満たす場合に、前記第2の推定ノイズ周波数領域信号を変更しない
ことを特徴とする請求項2に記載の信号処理装置。 - 前記推定ノイズ変更部は、
前記第2の推定ノイズ周波数領域信号を変更する場合に、前記度合いに基づいて重み付けして、前記第1の推定ノイズ周波数領域信号と過去に取得された前記第1の推定ノイズ周波数領域信号との平均値を算出し、算出した前記平均値に基づいて、前記第2の推定ノイズ周波数領域信号を変更する
ことを特徴とする請求項2又は請求項3に記載の信号処理装置。 - 前記推定ノイズ変更部は、
前記第2の推定ノイズ周波数領域信号を変更する場合に、前記第1の推定ノイズ周波数領域信号と過去に取得された複数の前記第1の推定ノイズ周波数領域信号との平均値を、前記複数の前記第1の推定ノイズ周波数領域信号の取得された順番が早いほど重み付けを低くして算出し、算出した前記平均値に基づいて、前記第2の推定ノイズ周波数領域信号を変更する
ことを特徴とする請求項4に記載の信号処理装置。 - 前記推定ノイズ変更部は、
前記第1の周波数領域信号と前記第2の周波数領域信号とに基づいて、前記第1の推定ノイズ周波数領域信号を算出する
ことを特徴とする請求項1から請求項5のいずれか1項に記載の信号処理装置。 - 請求項1から請求項6のいずれか1項に記載の信号処理装置を備えることを特徴とする撮像装置。
- 信号処理装置としてのコンピュータに、
変換部が、入力された入力信号を、周波数領域信号に変換する変換手順と、
前記入力信号に含まれるノイズが発生したタイミングに基づいて推定される第1の推定ノイズ周波数領域信号が、前記ノイズを前記入力信号から除去するための推定ノイズの周波数領域信号を示す第2の推定ノイズ周波数領域信号を変更する場合に適している度合いを、前記ノイズが発生する前の期間において前記変換手順によって変換された第1の周波数領域信号又は前記ノイズが発生した後の期間において前記変換手順によって変換された第2の周波数領域信号に基づいて、判定部が判定する判定手順と、
推定ノイズ変更部が、前記判定手順の判定結果と前記第1の推定ノイズ周波数領域信号とに基づいて、前記第2の推定ノイズ周波数領域信号を変更する推定ノイズ変更手順と
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011032467A JP2012173353A (ja) | 2011-02-17 | 2011-02-17 | 信号処理装置、撮像装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011032467A JP2012173353A (ja) | 2011-02-17 | 2011-02-17 | 信号処理装置、撮像装置、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012173353A true JP2012173353A (ja) | 2012-09-10 |
Family
ID=46976342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011032467A Withdrawn JP2012173353A (ja) | 2011-02-17 | 2011-02-17 | 信号処理装置、撮像装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012173353A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242089A (zh) * | 2019-09-23 | 2020-06-05 | 神盾股份有限公司 | 基于空间频率移除背景噪声的电子装置及图像信号处理方法 |
-
2011
- 2011-02-17 JP JP2011032467A patent/JP2012173353A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242089A (zh) * | 2019-09-23 | 2020-06-05 | 神盾股份有限公司 | 基于空间频率移除背景噪声的电子装置及图像信号处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5594133B2 (ja) | 音声信号処理装置、音声信号処理方法及びプログラム | |
US9495950B2 (en) | Audio signal processing device, imaging device, audio signal processing method, program, and recording medium | |
US8698911B2 (en) | Sound recording device, imaging device, photographing device, optical device, and program | |
CN101969592A (zh) | 声音记录设备和方法 | |
US10535363B2 (en) | Audio processing apparatus and control method thereof | |
JP5279629B2 (ja) | 撮像装置 | |
JP2014085609A (ja) | 信号処理装置および方法、並びに、プログラム | |
JP4952769B2 (ja) | 撮像装置 | |
JP2011077604A (ja) | ノイズ除去装置、レンズ装置、撮像装置、ノイズ除去方法 | |
KR101457392B1 (ko) | 촬상장치 및 음성 처리장치 | |
US20110254979A1 (en) | Imaging apparatus, signal processing apparatus, and program | |
JP5963430B2 (ja) | 撮像装置、音声処理装置、及びそれらの制御方法 | |
US9734840B2 (en) | Signal processing device, imaging apparatus, and signal-processing program | |
JP2011114465A (ja) | 音声処理装置及び電子カメラ | |
JP2012173353A (ja) | 信号処理装置、撮像装置、及びプログラム | |
JP5158054B2 (ja) | 録音装置、撮像装置、および、プログラム | |
JP2012185445A (ja) | 信号処理装置、撮像装置、及び、プログラム | |
JP2012168477A (ja) | ノイズ推定装置、信号処理装置、撮像装置、及びプログラム | |
JP6902961B2 (ja) | 音声処理装置及びその制御方法 | |
JP2014022953A (ja) | 信号処理装置、撮像装置、ノイズ低減処理方法、およびプログラム | |
JP2014026032A (ja) | 信号処理装置、撮像装置、及び、プログラム | |
JP2013178458A (ja) | 信号処理装置及び信号処理プログラム | |
JP2013047710A (ja) | 音声信号処理装置、撮像装置、音声信号処理方法、プログラム及び記録媒体 | |
JP5736839B2 (ja) | 信号処理装置、撮像装置、及びプログラム | |
JP2011114406A (ja) | 撮像装置、撮像方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140513 |