JP2013178456A - 信号処理装置、カメラおよび信号処理プログラム - Google Patents

信号処理装置、カメラおよび信号処理プログラム Download PDF

Info

Publication number
JP2013178456A
JP2013178456A JP2012181819A JP2012181819A JP2013178456A JP 2013178456 A JP2013178456 A JP 2013178456A JP 2012181819 A JP2012181819 A JP 2012181819A JP 2012181819 A JP2012181819 A JP 2012181819A JP 2013178456 A JP2013178456 A JP 2013178456A
Authority
JP
Japan
Prior art keywords
signal
spectrum
environmental sound
frame
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012181819A
Other languages
English (en)
Inventor
Kosuke Okano
康介 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2012181819A priority Critical patent/JP2013178456A/ja
Publication of JP2013178456A publication Critical patent/JP2013178456A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】適切に雑音低減を行う信号処理装置を提供すること。
【解決手段】信号処理装置1は、音響信号を所定フレームごとにスペクトル信号に変換する変換手段16と、変換手段16が変換したスペクトル信号に基づいて、環境音に応じたスペクトル信号を生成する環境音閾値生成手段16と、変換手段16が変換したスペクトル信号のうち、環境音に応じたスペクトル信号より大となる周波数成分の信号を雑音低減対象とする雑音低減対象決定手段16と、変換手段16が変換したスペクトル信号から、雑音低減対象とされた周波数成分の信号を減算するスペクトル減算手段16と、スペクトル減算後のスペクトル信号を音響信号に逆変換する逆変換手段16と、を備える。
【選択図】図1

Description

本発明は、信号処理装置、カメラおよび信号処理プログラムに関する。
撮影中に取得した音響信号を撮影画像とともに記録する場合に、雑音となる撮影動作時の機構音をあらかじめスペクトル化した信号として記憶しておき、上記機構音が発生するタイミングに基づいて、上記スペクトル化信号に所定係数を乗じた信号を取得した音響信号から減算することにより、音響信号に混入する機構音を抑制する技術が知られている(特許文献1参照)。
特開2006−279185号公報
従来技術では、取得した音響信号から、雑音をあらかじめスペクトル化した信号に基づいた値を減算していたので、撮影対象に関連する特徴的な音(例えば雨音)であっても、特徴的な音の周波数成分が雑音の周波数成分と共通する場合は必ず減算処理で抑えられてしまうという問題があった。
本発明による信号処理装置は、音響信号を所定フレームごとにスペクトル信号に変換する変換手段と、変換手段が変換したスペクトル信号に基づいて、環境音に応じたスペクトル信号を生成する環境音閾値生成手段と、変換手段が変換したスペクトル信号のうち、環境音に応じたスペクトル信号より大となる周波数成分の信号を雑音低減対象とする雑音低減対象決定手段と、変換手段が変換したスペクトル信号から、雑音低減対象とされた周波数成分の信号を減算するスペクトル減算手段と、スペクトル減算後のスペクトル信号を音響信号に逆変換する逆変換手段と、を備えることを特徴とする。
本発明によれば、適切に雑音低減を行うことができる。
本発明の第一の実施形態による雑音低減用の信号処理装置を搭載する電子カメラの構成を例示するブロック図である。 CPUが実行する雑音低減処理の流れを説明するフローチャートである。 コンピュータ装置を例示する図である。 音響データを例示する図である。 第二の実施形態のCPUが環境音閾値スペクトルを決定する処理の流れを説明するフローチャートである。 CPUが実行する雑音低減処理の流れを説明するフローチャートである。
以下、図面を参照して本発明を実施するための形態について説明する。
(第一の実施形態)
図1は、本発明の第一の実施形態による雑音低減用の信号処理装置を搭載する電子カメラ1の構成を例示するブロック図である。図1において、電子カメラ1は、撮影光学系11と、撮像素子12と、画像処理部13と、RAM14と、LCDモニタ15と、CPU16と、不揮発性メモリ17と、カードインターフェース(I/F)18と、通信インターフェース(I/F)19と、操作部材20と、マイク21と、音響処理回路22とを備える。
CPU16、不揮発性メモリ17、カードインターフェース18、通信インターフェース19、音響処理回路22、画像処理部13、RAM14およびLCDモニタ15は、それぞれがバス25を介して接続されている。
撮影光学系11は、ズームレンズやフォーカシングレンズを含む複数のレンズ群で構成され、被写体像を撮像素子12の受光面に結像させる。なお、図1を簡単にするため、撮影光学系11を単レンズとして図示している。
撮像素子12は、受光素子が受光面に二次元配列されたCMOSイメージセンサなどによって構成される。撮像素子12は、撮影光学系11を通過した光束による像を光電変換し、デジタル画像信号を生成する。デジタル画像信号は、画像処理部13に入力される。画像処理部13は、デジタル画像データに対して各種の画像処理(色補間処理、階調変換処理、輪郭強調処理、ホワイトバランス調整処理など)を施す。
LCDモニタ15は液晶パネルなどによって構成される。LCDモニタ15は、CPU16からの指示に応じて画像や操作アイコン、メニュー画面などを表示する。RAM14は、画像処理部13による画像処理の前工程や後工程でのデジタル画像データを一時的に記憶する他、後述する雑音低減処理の前工程や後工程でのデジタル音響データを一時的に記憶したり、CPU16によるプログラム実行時の作業用メモリとして用いられる。不揮発性メモリ17は、フラッシュメモリなどによって構成される。不揮発性メモリ17は電源オフ時にも記憶内容を保持するので、CPU16が実行するプログラムなどを記憶させる。
CPU16は、不揮発性メモリ17が記憶するプログラムを実行することにより、電子カメラ1が行う動作を制御する。CPU16は、AF(オートフォーカス)動作制御や、自動露出(AE)演算も行う。AF動作は、例えば、ライブビュー画像のコントラスト情報に基づいてフォーカシングレンズ(不図示)の合焦位置を求める。ライブビュー画像は、レリーズ操作前に撮像素子12によって所定の時間間隔(例えば30コマ/毎秒)で繰り返し取得されるモニタ用画像のことをいう。
カードインターフェース18はコネクタ(不図示)を有し、該コネクタにメモリカードなどの記憶媒体30が接続される。カードインターフェース18は、接続された記憶媒体30に対するデータの書き込みや、記憶媒体30からのデータの読み込みを行う。記憶媒体30は、半導体メモリを内蔵したメモリカード、またはハードディスクドライブなどで構成される。
通信インターフェース19は、例えば、不図示のコネクタに接続された外部機器との間でTCP/IPプロトコルを用いた通信を行う。この通信により、外部機器からのコマンドやデータを受信したり、記憶媒体30が記憶している画像データや音響データなどを外部機器へ送信したりする。操作部材20は、電源スイッチをはじめ、レリーズボタンや録画ボタン、十字キースイッチなどの各操作部材を含む。操作部材20は、静止画撮影指示、録画(および録音)指示、モード切替え指示や各種選択指示など、各指示に応じた操作信号をCPU16へ送出する。
音響処理回路22は、マイク22で集音された音響信号を増幅し、増幅後の信号をA/D変換回路(不図示)によってデジタル音響データに変換する。レンズ駆動機構23は、CPU16からの指示に応じてフォーカシングレンズ(不図示)を光軸方向に進退移動させる。
電子カメラ1は、レリーズボタンの押下操作に応じて静止画像を撮影する機能と、録画ボタンの押下操作に応じて動画像の録画および録音を行う機能とを有する。録画時のCPU16は、録画ボタンが押下されると動画像の取得および録音を開始する。例えばライブビュー画像と同じ30コマ/毎秒のフレームレートで撮像を開始させるとともに、音響データの取得を開始させる。録画ボタンが再度押下されると画像取得および音響取得を終了し、取得したフレーム画像群によって構成される動画像を格納するファイル、および取得した音響データを格納するファイルを生成する。
なお、本実施形態のCPU16が生成した音響データファイルには、音響データと同じ時間軸で表されたレンズ駆動機構23の駆動情報が含まれる。駆動情報は、録音時にレンズ駆動機構23がフォーカシングレンズを駆動中であったか否かを示すデータである。例えば、駆動開始時刻と駆動終了時刻とを示すタイムデータでもよいし、駆動中を「1」で表し、非駆動中を「0」で表す2値データでもよい。
本実施形態は、上述した録画時に取得した音響データを対象にする雑音低減処理に特徴を有するので、以降の説明は雑音低減のためにCPU16が実行する処理を中心に行う。
図2は、CPU16が実行する雑音低減処理の流れを説明するフローチャートである。CPU16は、例えば、音響データを一時的にRAM14へ記憶しておき、雑音低減処理プログラムを実行後の音響データを記憶媒体30に記録する。CPU16は、音響データを構成する1フレームごとに雑音低減を行う処理を繰り返す。
図2のステップS10において、CPU16は、RAM14から1フレーム分の音響データおよびレンズ駆動機構23の駆動情報を読み出してステップS20へ進む。ステップS20において、CPU16は、対象フレームの音響データに対して短時間フーリエ変換を施してステップS30へ進む。これにより、音響信号の周波数成分ごとの振幅(周波数特徴スペクトルと呼ぶ)が得られる。例えば、サンプリング周波数が44.1kHzで約2000の周波数成分に分割する場合には、1周波数成分当たりのスペクトル幅は約20Hzである。
ステップS30において、CPU16は、音響データに音声が含まれているか否かを判定する。一般に、人の声は周波数2kHz以下において所定の周波数間隔で複数の「山」波形を有する。CPU16は、周波数特徴スペクトルにおいて2kHz以下の周波数帯に上記周波数間隔で複数の「山」波形が並び、かつ「山」波形のピーク値が第1所定値以上である場合には、ステップS30を肯定判定してステップS40へ進む。ステップS30を肯定判定する場合は、対象フレームの音響データに会話やナレーションなどが含まれる可能性が高いので、当該フレームの音響データを雑音低減対象とせず、当該フレームの音響データを環境音閾値の決定にも用いない。環境音閾値は、後述する雑音低減を行うか否かの判定に用いる判定閾値である。一方、CPU16は、2kHz以下の周波数帯において上記ピーク値が第1所定値以上となる「山」波形が上記周波数間隔で並んでいない場合には、ステップS30を否定判定してステップS60へ進む。
ステップS40において、CPU16は、対象フレームの周波数特徴スペクトルに対して短時間逆フーリエ変換を施してステップS50へ進む。ステップS50において、CPU16は、上記処理後の音響データをRAM14へ記録して図2による処理を終了する。なお、本実施形態では、後述するステップS110へ進む場合を除き、対象フレームの音響データを雑音低減の対象にしない。つまり、ステップS110へ進まない場合は対象フレームの音響データをそのまま保存対象とし、ステップS110へ進む場合には、S110およびS120による処理後の音響データを保存対象とする。
上述したステップS30を否定判定して進むステップS60において、CPU16は、対象フレームにおける周波数特徴スペクトルの総和(すなわち、上記約2000の周波数成分ごとの振幅値の総和)が第2所定値以上か否かを判定する。CPU16は、上記総和が第2所定値以上の場合にステップS60を肯定判定してステップS40へ進む。ステップS60を肯定判定する場合は、対象フレームの音響データに突発的な音が含まれる可能性が高いので、当該フレームの音響データを雑音低減対象とせず、当該フレームの音響データを環境音閾値の決定にも用いない。一方、CPU16は、上記総和が第2所定値未満の場合にはステップS60を否定判定し、ステップS70へ進む。
ステップS70において、CPU16は、対象フレームにおける音響データが可動部駆動中に取得されたデータか否かを判定する。CPU16は、例えば、当該フレームがフォーカシングレンズの駆動中に該当することが上述したレンズ駆動機構23の駆動情報によって示される場合は、ステップS70を肯定判定してステップS75へ進む。ステップS70を肯定判定する場合は、対象フレームの音響データに可動部駆動音が含まれている可能性が高いので、当該フレームの音響データを環境音閾値の決定に用いない。CPU16は、当該フレームがフォーカシングレンズの駆動中に該当しないことが上述したレンズ駆動機構23の駆動情報によって示される場合は、ステップS70を否定判定してステップS80へ進む。
ステップS80において、CPU16は、対象フレームの周波数特徴スペクトルを用いて環境音閾値を決定、更新してステップS40へ進む。CPU16は、例えば、音響データを構成する第1フレームから対象フレームまでの各フレームの周波数特徴スペクトルから、上記約2000の周波数成分ごとに最大値を抽出し、抽出した約2000の周波数成分からなる周波数特徴スペクトルを環境音閾値スペクトルとする。CPU16は、当該フレームの周波数特徴スペクトルのいずれかの周波数成分の値が最大値に該当する場合は、環境音閾値スペクトルの対応する周波数成分の値を上記最大値と置換することによって環境音閾値スペクトルを更新する。これにより、可動部駆動音が含まれていない直近のフレームの音響データを環境音閾値スペクトルに反映させることができる。
ステップS75において、CPU16は、ステップS110における公知のスペクトル減算に用いる雑音(ノイズ)スペクトルを推定してステップS90へ進む。この場合の雑音は、可動部駆動音に起因するものである。なお、雑音推定は公知なので説明を省略する。
ステップS90において、CPU16は、対象フレームにおける周波数特徴スペクトルが第3所定値以上変動したか否かを判定する。CPU16は、当該フレームにおける周波数特徴スペクトル(すなわち、上記約2000の周波数成分)のうち、少なくとも1つの周波数成分で前フレームに比べて第3所定値より大きく増減した場合にステップS90を肯定判定してステップS100へ進む。CPU16は、当該フレームにおける周波数特徴スペクトルの中で前フレームに比べて第3所定値より大きく増減した周波数成分が存在しない場合には、ステップS90を否定判定してステップS40へ進む。ステップS90を肯定判定する場合は、対象フレームの音響データが突発的に変化した可能性が高いので、当該フレームの音響データを雑音低減対象とせず、当該フレームの音響データを環境音閾値の決定にも用いない。
ステップS100において、CPU16は、対象フレームにおける周波数特徴スペクトル(すなわち、上記約2000の周波数成分)のうち、環境音閾値スペクトルの対応する周波数成分の値より大きい値を有する周波数成分があるか否かを判定する。CPU16は、当該フレームにおける周波数特徴スペクトルのうち、少なくとも1つの周波数成分で環境音閾値スペクトルの対応する周波数成分より大きな値を有する場合に、ステップS100を肯定判定してステップS110へ進む。CPU16は、当該フレームにおける周波数特徴スペクトルが環境音閾値スペクトルの対応する周波数成分の値より大きい値を有していない場合には、ステップS100を否定判定してステップS40へ進む。ステップS100を否定判定する場合は、当該フレームの音響データに含まれる可動部駆動音が許容範囲内と判断し、当該フレームの音響データを雑音低減対象としない。しかしながら、当該フレームの音響データは可動部駆動音を含むので、当該フレームの音響データを環境音閾値の決定には用いない。
ステップS110において、CPU16は、対象フレームにおける周波数特徴スペクトル(すなわち、上記約2000の周波数成分)のうち、環境音閾値スペクトルの対応する周波数成分の値より大きい値を有する周波数成分について、ステップS75で推定した雑音スペクトルのうち対応する周波数成分の値を減算してステップS120へ進む。ステップS120において、CPU16はフロアリング処理を行ってステップS40へ進む。フロアリングは、例えば、減算後に負の値になった周波数成分を補完してスペクトログラム上の不連続を解消させることをいう。
以上説明した第一の実施形態によれば、次の作用効果が得られる。
(1)雑音低減を行う信号処理装置を搭載する電子カメラ1は、音響信号を所定フレームごとに周波数特徴スペクトルにフーリエ変換するCPU16と、CPU16が変換した周波数特徴スペクトルに基づいて、環境音に応じた環境音閾値スペクトルを生成するCPU16と、CPU16が変換した周波数特徴スペクトルのうち、環境音に応じた環境音閾値スペクトルより大となる周波数成分の信号を雑音低減対象とするCPU16と、CPU16が変換したスペクトル信号から、雑音低減対象とした周波数成分の信号を減算するCPU16と、スペクトル減算後のスペクトル信号を音響信号に逆フーリエ変換するCPU16とを備えるようにしたので、適切に雑音低減を行うことができる。すなわち、環境音閾値スペクトルより小さい周波数成分はそのまま残し、環境音閾値スペクトルより大きい周波数成分のみスペクトル減算の対象にするため、雑音低減対象とする周波数成分の信号を常に減算する場合に比べて、信号振幅が小さい音(例えば雨音など)の消失を防ぐことができる。
(2)上記(1)の電子カメラ1において、音響信号がフォーカシングレンズの駆動中に取得されたか否かを判定するCPU16をさらに備え、CPU16は、上記肯定判定された音響信号に対応する周波数特徴スペクトルを対象に減算処理を行うようにしたので、可動部駆動に起因する音響信号の雑音を適切に低減することができる。
(3)上記電子カメラ1において、CPU16は、異なるフレームでそれぞれフーリエ変換された複数フレームの周波数特徴スペクトルの各周波数成分ごとに最大値を抽出し、抽出した各周波数成分の信号で構成される周波数特徴スペクトルを環境音に応じた環境音閾値スペクトルとしたので、雑音が許容範囲か否かの判断基準を適切に求めることができる。
(4)上記電子カメラ1において、CPU16は、音響信号がフォーカシングレンズの駆動中に取得されたか否かの判定で否定判定された音響信号に対応する周波数特徴スペクトルに基づいて環境音に応じた環境音閾値スペクトルを生成したので、フォーカシングレンズを非駆動中の環境音に応じた環境音閾値スペクトルを生成する。このため、雑音が許容範囲か否かの判断基準を適切に求めることができる。
(5)上記電子カメラ1において、CPU16がフーリエ変換した周波数特徴スペクトルのフレーム内の周波数成分の信号値の総和が第2所定値より大か否かを判定するCPU16をさらに備える。CPU16は、上記信号値の総和が第2所定値より小であることが判定された周波数特徴スペクトルに基づいて環境音に応じた環境音閾値スペクトルを生成する。このため、雑音が許容範囲か否かの判断基準を適切に求めることができる。
(6)上記電子カメラ1において、音響信号に音声が含まれるか否かを判定するCPU16をさらに備える。CPU16は、音声を含まないことが判定された音響信号に対応する周波数特徴スペクトルに基づいて環境音に応じた環境音閾値スペクトルを生成する。このため、雑音が許容範囲か否かの判断基準を適切に求めることができる。
(7)上記電子カメラ1において、CPU16は、音声を含まないことが判定された音響信号に対応する周波数特徴スペクトルを対象に減算処理を行うようにしたので、音声情報を減算しないように制御することができる。
(8)上記電子カメラ1において、CPU16がフーリエ変換した連続するフレーム間の周波数特徴スペクトルの変化が第3所定値より大か否かを判定するCPU16をさらに備える。CPU16は、連続するフレーム間の周波数特徴スペクトルの変化が第3所定値より小であることが判定された周波数特徴スペクトルを対象に減算処理を行うようにしたので、適切に雑音低減処理をすることができる。
(変形例1)
音響データファイルを記憶媒体30に記録する直前に図2に例示する雑音低減処理プログラムを起動する例を説明したが、音響データの取得と雑音低減処理とをリアルタイムに行うように構成してもよい。この場合のCPU16は、1フレームごとに雑音低減処理を行い、該雑音低減処理後の音響データを逐次記録媒体30に記録させることができる。
(変形例2)
対象フレームの周波数特徴スペクトルを用いて環境音閾値を決定、更新する(ステップS80)場合に、以下のように決定、更新してもよい。変形例2のCPU16は、例えば、音響データを構成する第1フレームから対象フレームまでの各フレームの周波数特徴スペクトルの総和(すなわち、上記約2000の周波数成分ごとの振幅値の総和)が最小となるフレームを選ぶ。そして、当該フレームについての上記約2000の周波数成分からなる周波数特徴スペクトルに第4所定値を乗じた周波数特徴スペクトルを従前の環境音閾値スペクトルと置換することによって環境音閾値スペクトルを更新する。
変形例2によれば、突発的な音を含まない可能性が高いフレームの音響データに基づいて環境音閾値スペクトルの決定、更新をするので、環境音閾値スペクトルが特定の周波数成分で大きな値を有することを避けられる。このため、特定の周波数成分において雑音低減が不十分となってしまうおそれを低減できる。
(変形例3)
対象フレームの周波数特徴スペクトルを用いて環境音閾値を決定、更新する(ステップS80)場合に、以下のように決定、更新してもよい。変形例3のCPU16は、例えば、音響データを構成する第1フレームから対象フレームまでの各フレームの周波数特徴スペクトルを用いて、上記約2000の周波数成分ごとに振幅値の平均値を算出する。そして、各周波数成分の平均値からなる周波数特徴スペクトルに第5所定値を乗じた周波数特徴スペクトルを従前の環境音閾値スペクトルと置換することによって環境音閾値スペクトルを更新する。
変形例3によれば、あるフレームに突発的に含まれる音の成分を平準化するように環境音閾値スペクトルの決定、更新をするので、環境音閾値スペクトルが特定の周波数成分で大きな値を有することを避けられる。このため、特定の周波数成分において雑音低減が不十分となってしまうおそれを低減できる。
(変形例4)
上述した音響データに音声が含まれているか否かの判定(ステップS30)において、音声信号の自己相関関数のピーク値を用いて検出してもよい。変形例4のCPU16は、音声信号の基本周波数(例えば50Hz〜400Hz)の1周期に相当する時間遅れ領域(サンプリング周波数が44.1kHzの場合、約880Point〜約110Point)における自己相関関数のピーク値を求める。そして、CPU16は、ピーク値が所定の判定閾値より大きい場合に音声が含まれていると判定する。ピーク値が所定の判定閾値より小さい場合には、音声が含まれていないと判定する。
(変形例5)
あるいは、音声スペクトル波形(横軸が信号周波数、縦軸が信号の振幅)の包絡線を用いて検出してもよい。変形例5のCPU16は、線形予測分析等によって音声スペクトル波形の包絡線を求める。そして、CPU16は、包絡線の時間変化量が所定の判定閾値より大きい場合に音声が含まれていると判定する。包絡線の時間変化量が所定の判定閾値より小さい場合には、音声が含まれていないと判定する。
(変形例6)
上述した実施形態では、電子カメラ1に雑音低減用の信号処理装置を搭載する例を説明したが、信号処理装置をパーソナルコンピュータによって構成するようにしてもよい。図2に例示したフローチャートに基づく処理を行うプログラムを図3に示すコンピュータ装置100に実行させることにより、信号処理装置を構成する。プログラムをパーソナルコンピュータ100に取込んで使用する場合には、パーソナルコンピュータ100のデータストレージ装置にプログラムをローディングした上で、当該プログラムを実行させることによって信号処理装置として使用する。
パーソナルコンピュータ100に対するプログラムのローディングは、プログラムを格納したCD−ROMなどの記憶媒体104をパーソナルコンピュータ100にセットして行ってもよいし、ネットワークなどの通信回線101を経由する方法でパーソナルコンピュータ100へローディングしてもよい。通信回線101を経由する場合は、通信回線101に接続されたサーバー(コンピュータ)102のハードディスク装置103などにプログラムを格納しておく。プログラムは、記憶媒体104や通信回線101を介する提供など、種々の形態のコンピュータプログラム製品として供給することができる。
以上説明した変形例6によれば、上記実施形態と同様の作用効果が得られる。なお、パーソナルコンピュータによって構成する他にも、再生機能を備えるデジタルフォトフレームやプロジェクタ等にも上述した雑音低減処理をさせるように構成して構わない。
(第二の実施形態)
第二の実施形態は、第一の実施形態と比べた場合に雑音低減用の信号処理装置を搭載する電子カメラ1の構成は共通であって、環境音閾値スペクトルの求め方が異なる。このため、環境音閾値スペクトルの求め方を中心に説明する。図4は、CPU16が雑音低減処理プログラムを実行する前の音響データを例示する図であり、一時的にRAM14へ記憶された音響データを表す。図4の横軸は、音響データを構成するフレームを表す。音響データは左側のフレームから順番に取得されているので、横軸は時間軸にも対応する。図4の縦軸は、音響振幅を表す。振幅が大きいほど大きな「音」が録音され、振幅が小さいほど録音されている「音」が小さい。
一般に、録画途中にAF動作が行われると、レンズ駆動機構23がフォーカシングレンズを駆動する音が音響データに含まれやすい。本例では「AF音発生範囲」において音響振幅が大きくなっていることから、音響データに駆動音が含まれる。ここで、「AF音発生範囲」とは、AF動作時にフォーカシングレンズを駆動していた区間のことを表す。音響データにおけるAF音発生区間は、上述したレンズ駆動機構23の駆動情報に基づいて特定できる。
CPU16は、音響データの時間軸上で対象フレームを左から右へ順番にずらしながら(時間的に前のフレームから後のフレームへ向けて走査しながら)、対象フレームに近い所定範囲の学習区間に含まれる複数フレーム(例えば10フレーム)に含まれる音響データに基づいて、以下のように環境音閾値スペクトルを求める。ここでは、対象フレームの位置が符号41、42、43、44、45で示される場合を例に説明する。
<AF音が発生していない範囲>
対象フレームの位置が符号41および45に該当する場合は、対象フレームの位置がAF音発生範囲の外に存在する場合である。この場合のCPU16は、対象フレームを含む所定範囲の学習区間(例えば10フレーム)に含まれる音響データに基づいて、環境音閾値スペクトルを求める。
具体的には、上記学習区間に含まれるフレームの周波数特徴スペクトルから、約2000の周波数成分ごとに最大値を抽出し、抽出した約2000の周波数成分からなる周波数特徴スペクトルを環境音閾値スペクトルとする。このように、対象フレームごとに、対応する学習区間に含まれる音響データを用いて環境音閾値スペクトルを決定する。これにより、対象フレームと時間的に近いフレームの音響データを環境音閾値スペクトルに反映できる。
<AF音が発生している範囲>
対象フレームの位置が符号42、43および44に該当する場合は、対象フレームの位置がAF音発生範囲の中に存在する場合である。この場合に対象フレームを含む所定範囲を学習区間(例えば10フレーム)に定めると、学習区間にフォーカシングレンズの駆動音を含むことになるため、環境音閾値スペクトルの決定に用いることは適切でない。そこでCPU16は、学習区間を次のように定める。
すなわち、対象フレームの位置がAF音発生範囲の中に存在する場合のCPU16は、AF音発生範囲の外であって時間的に対象フレームに近い位置に学習区間(例えば10フレーム)を定め、この学習区間に含まれる音響データに基づいて、環境音閾値スペクトルを決定する。例えば、対象フレームの位置が、AF音発生範囲の開始点直後の符号42で示す位置にある場合、CPU16は、AF音発生範囲の直前に学習期間「1」を設け、学習区間「1」に含まれる音響データを用いて環境音閾値スペクトルを決定する。
また、対象フレームの位置が、AF音発生範囲の終了点直前の符号44で示す位置にある場合、CPU16はAF音発生範囲の直後に学習期間「2」を設け、学習区間「2」に含まれる音響データを用いて環境音閾値スペクトルを決定する。
上述した構成にすることにより、フォーカシング時の駆動音を含む音響データを除外した上で、対象フレームと時間的に近いフレームの音響データを環境音閾値スペクトルに反映できる。
さらに、対象フレームの位置が、AF音発生範囲の中ほどの符号43で示す位置にある場合のCPU16は、AF音発生範囲の直前の学習期間「1」のうちAF音発生範囲に近い5フレームの音響データと、AF音発生範囲の直後の学習期間「2」のうちAF音発生範囲に近い5フレームの音響データとを用いて環境音閾値スペクトルを決定する。
上記構成にすることにより、フォーカシング時の駆動音を含む音響データを除外した上で、AF音発生範囲の前後において対象フレームまでの時間的な長さが共通するフレームの音響データを環境音閾値スペクトルに反映できる。
対象フレームの位置が、AF音発生範囲において上記符号42および符号43で示される位置の間に存在する場合のCPU16は、AF音発生範囲の直前の学習期間「1」のうちAF音発生範囲に近い(10−X)フレームの音響データと、AF音発生範囲の直後の学習期間「2」のうちAF音発生範囲に近いXフレームの音響データとを用いて環境音閾値スペクトルを決定する。Xの値は整数であり、対象フレームの位置が符号42の位置に近いほど0に近づけ、対象フレームの位置が符号43の位置に近いほど5に近づける。本実施形態では、環境音閾値スペクトルの決定に用いるフレーム数を、合計10フレームとする。
同様に、対象フレームの位置が、AF音発生範囲において上記符号43および符号44で示される位置の間に存在する場合のCPU16は、AF音発生範囲の直前の学習期間「1」のうちAF音発生範囲に近いYフレームの音響データと、AF音発生範囲の直後の学習期間「2」のうちAF音発生範囲に近い(10−Y)フレームの音響データとを用いて環境音閾値スペクトルを決定する。Yの値は整数であり、対象フレームの位置が符号44の位置に近いほど0に近づけ、対象フレームの位置が符号43の位置に近いほど5に近づける。
図5は、CPU16が実行する環境音閾値スペクトルを決定する処理の流れを説明するフローチャートである。CPU16は、対象フレームごとに、図5の処理によって環境音閾値スペクトルを決定する。
図5のステップS210において、CPU16は、対象フレームにおける音響データが可動部駆動中に取得されたデータか否かを判定する。CPU16は、対象フレームの位置がAF音発生範囲の中に存在する場合は、ステップS210を肯定判定してステップS220へ進む。ステップS220を肯定判定する場合は、対象フレームの音響データにAF音が含まれている可能性が高いので、当該フレームの音響データを環境音閾値の決定に用いない。CPU16は、対象フレームの位置がAF音発生範囲の外に存在する場合は、ステップS220を否定判定してステップS230へ進む。
ステップS220において、CPU16は、上述したようにAF音発生範囲の前後に定めた学習区間に基づいて環境音閾値スペクトルを決定し、図5による処理を終了する。ステップS230において、CPU16は、上述したように対象フレームを含む所定範囲の学習区間(例えば10フレーム)に含まれる音響データに基づいて、環境音閾値スペクトルを決定し、図5による処理を終了する。
図6は、CPU16が実行する雑音低減処理の流れを説明するフローチャートである。CPU16は、第一の実施形態による雑音低減処理(図2)に代えて、図6による雑音低減処理を実行する。なお、図6による雑音低減処理は、上述した図5による環境音閾値スペクトル決定処理と並行して行う。
図6においては、第一の実施形態による雑音低減処理(図2)と共通の処理ステップは図2の場合と同一のステップ番号を付加して説明を省略する。
図6のステップS100Bにおいて、CPU16は、対象フレームにおける周波数特徴スペクトル(上記約2000の周波数成分)のうち、図5の処理によって決定された環境音閾値スペクトルの対応する周波数成分の値より大きい値を有する周波数成分があるか否かを判定する。CPU16は、当該フレームにおける周波数特徴スペクトルのうち、少なくとも1つの周波数成分で環境音閾値スペクトルの対応する周波数成分より大きな値を有する場合に、ステップS100Bを肯定判定してステップS110へ進む。
CPU16は、当該フレームにおける周波数特徴スペクトルが環境音閾値スペクトルの対応する周波数成分の値より大きい値を有していない場合には、ステップS100Bを否定判定してステップS40へ進む。ステップS100Bを否定判定する場合は、当該フレームの音響データに含まれる音が許容範囲内と判断し、当該フレームの音響データを雑音低減対象としない。
これに対し、ステップS100Bを肯定判定したCPU16は、当該フレームの音響データに含まれる音が許容範囲を超えていると判断し、当該フレームの音響データを雑音低減対象とする。
以上説明した第二の実施形態によれば、次の作用効果が得られる。
(1)雑音低減を行う信号処理装置を搭載する電子カメラ1は、音響信号を所定フレームごとに周波数特徴スペクトルにフーリエ変換するCPU16と、CPU16が変換した周波数特徴スペクトルに基づいて、環境音に応じた環境音閾値スペクトルを生成するCPU16と、CPU16が変換した周波数特徴スペクトルのうち、環境音に応じた環境音閾値スペクトルより大となる周波数成分の信号を雑音低減対象とするCPU16と、CPU16が変換したスペクトル信号から、雑音低減対象とした周波数成分の信号を減算するCPU16と、スペクトル減算後のスペクトル信号を音響信号に逆フーリエ変換するCPU16とを備えるようにしたので、適切に雑音低減を行うことができる。すなわち、環境音閾値スペクトルより小さい周波数成分はそのまま残し、環境音閾値スペクトルより大きい周波数成分のみスペクトル減算の対象にするため、雑音低減対象とする周波数成分の信号を常に減算する場合に比べて、信号振幅が小さい音(例えば雨音など)の消失を防ぐことができる。
(2)上記(1)の電子カメラ1において、CPU16は、対象フレームごとに、CPU16が変換したスペクトル信号のうち、環境音に応じたスペクトル信号より大となる周波数成分の信号を雑音低減対象とし、CPU16は、時間軸上で対象フレームと近接する複数フレームにおいてそれぞれCPU16が変換したスペクトル信号に基づいて環境音に応じた環境音閾値スペクトルを生成するようにしたので、対象フレームと時間的に近いフレームの音響信号を環境音に応じた環境音閾値スペクトルに反映できる。この結果、雑音低減の開始時点と終了時点における聴感上の不連続感を軽減し得る。
(3)上記(2)の電子カメラ1において、対象フレームの音響信号がAF音発生範囲で取得されたか否かを判定するCPU16をさらに備え、CPU16は、肯定判定したフレームを除く時間軸上で対象フレームと近接する複数フレームにおいてそれぞれCPU16が変換したスペクトル信号に基づいて環境音に応じた環境音閾値スペクトルを生成するようにした。これにより、フォーカシング時の駆動音を含む音響信号を除外した上で、対象フレームと時間的に近いフレームの音響信号を環境音閾値スペクトルに反映できる。
(4)上記(3)の電子カメラ1において、CPU16は、対象フレームが否定判定されたフレームに該当する場合、対象フレームおよび時間軸上で対象フレームと近接する複数フレームにおいてそれぞれCPU16が変換したスペクトル信号に基づいて環境音に応じた環境音閾値スペクトルを生成するようにした。これにより、対象フレームと時間的に近いフレームの音響信号を環境音閾値スペクトルに反映できる。
上述した説明では、CPU16が音響データを一時的にRAM14へ記憶しておき、雑音低減処理プログラムを実行後の音響データを記憶媒体30に記録する例を説明した。この代わりに、雑音低減処理は、音響データをRAM14へ記憶しながらリアルタイムに実行するようにしてもよい。
以上の説明はあくまで一例であり、上記の実施形態の構成に何ら限定されるものではない。各実施形態および変形例は、適宜組み合わせても構わない。
1…電子カメラ
14…RAM
15…LCDモニタ
16…CPU
18…カードインターフェース
20…操作部材
21…マイク
22…音響処理回路
23…レンズ駆動機構
30…記憶媒体
100…パーソナルコンピュータ

Claims (15)

  1. 音響信号を所定フレームごとにスペクトル信号に変換する変換手段と、
    前記変換手段が変換したスペクトル信号に基づいて、環境音に応じたスペクトル信号を生成する環境音閾値生成手段と、
    前記変換手段が変換したスペクトル信号のうち、前記環境音に応じたスペクトル信号より大となる周波数成分の信号を雑音低減対象とする雑音低減対象決定手段と、
    前記変換手段が変換したスペクトル信号から、前記雑音低減対象とされた周波数成分の信号を減算するスペクトル減算手段と、
    前記スペクトル減算後のスペクトル信号を音響信号に逆変換する逆変換手段と、
    を備えることを特徴とする信号処理装置。
  2. 請求項1に記載の信号処理装置において、
    前記音響信号が雑音の発生タイミングで取得されたか否かを判定する取得タイミング判定手段をさらに備え、
    前記スペクトル減算手段は、前記取得タイミング判定手段によって肯定判定された音響信号に対応するスペクトル信号を対象に前記スペクトル減算を行うことを特徴とする信号処理装置。
  3. 請求項1または2に記載の信号処理装置において、
    前記環境音閾値生成手段は、前記変換手段によって異なるフレームでそれぞれ変換された複数フレームのスペクトル信号の各周波数成分ごとに最大値を抽出し、抽出した各周波数成分の信号で構成されるスペクトル信号を前記環境音に応じたスペクトル信号とすることを特徴とする信号処理装置。
  4. 請求項1または2に記載の信号処理装置において、
    前記環境音閾値生成手段は、前記変換手段によって異なるフレームでそれぞれ変換された複数フレームのスペクトル信号のうち、フレーム内の周波数成分の信号値の総和が最小となるフレームのスペクトル信号に所定値を乗じて前記環境音に応じたスペクトル信号とすることを特徴とする信号処理装置。
  5. 請求項1または2に記載の信号処理装置において、
    前記環境音閾値生成手段は、前記変換手段によって異なるフレームでそれぞれ変換された複数フレームのスペクトル信号の各周波数成分ごとに平均値を算出し、各平均値に所定値を乗じた信号で構成されるスペクトル信号を前記環境音に応じたスペクトル信号とすることを特徴とする信号処理装置。
  6. 請求項1〜5のいずれか一項に記載の信号処理装置において、
    前記環境音閾値生成手段は、前記取得タイミング判定手段によって否定判定された音響信号に対応するスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
  7. 請求項1〜6のいずれか一項に記載の信号処理装置において、
    前記変換手段が変換したスペクトル信号のフレーム内の周波数成分の信号値の総和が第1の判定閾値より大か否かを判定する総和判定手段をさらに備え、
    前記環境音閾値生成手段は、前記総和判定手段によって否定判定されたスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
  8. 請求項1〜7のいずれか一項に記載の信号処理装置において、
    前記音響信号に音声が含まれるか否かを判定する音声判定手段をさらに備え、
    前記環境音閾値生成手段は、前記音声判定手段によって否定判定された音響信号に対応するスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
  9. 請求項8に記載の信号処理装置において、
    前記スペクトル減算手段は、前記音声判定手段によって否定判定された音響信号に対応するスペクトル信号を対象に前記スペクトル減算を行うことを特徴とする信号処理装置。
  10. 請求項9に記載の信号処理装置において、
    前記変換手段が変換した連続するフレーム間のスペクトル信号の変化が第2の判定閾値より大か否かを判定する変化判定手段をさらに備え、
    前記スペクトル減算手段は、前記変化判定手段によって否定判定されたスペクトル信号を対象に前記スペクトル減算を行うことを特徴とする信号処理装置。
  11. 請求項1に記載の信号処理装置において、
    前記雑音低減対象決定手段は、対象フレームごとに、前記変換手段が変換したスペクトル信号のうち、前記環境音に応じたスペクトル信号より大となる周波数成分の信号を雑音低減対象とし、
    前記環境音閾値生成手段は、時間軸上で前記対象フレームと近接する複数フレームにおいてそれぞれ前記変換手段が変換したスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
  12. 請求項11に記載の信号処理装置において、
    前記対象フレームの音響信号が雑音の発生区間で取得されたか否かを判定する取得区間判定手段をさらに備え、
    前記環境音閾値生成手段は、前記取得区間判定手段によって肯定判定されたフレームを除く前記時間軸上で前記対象フレームと近接する複数フレームにおいてそれぞれ前記変換手段が変換したスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
  13. 請求項12に記載の信号処理装置において、
    前記環境音閾値生成手段は、前記対象フレームが前記取得区間判定手段によって否定判定されたフレームに該当する場合、前記対象フレームおよび前記時間軸上で前記対象フレームと近接する複数フレームにおいてそれぞれ前記変換手段が変換したスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
  14. 請求項1〜13のいずれか一項に記載の信号処理装置を搭載することを特徴とするカメラ。
  15. 音響信号を読み出す第1処理と、
    前記音響信号を所定フレームごとにスペクトル信号に変換する第2処理と、
    前記変換したスペクトル信号に基づいて、環境音に応じたスペクトル信号を生成する第3処理と、
    前記変換したスペクトル信号のうち、前記環境音に応じたスペクトル信号より大となる周波数成分の信号を前記雑音低減対象とする第4処理と、
    前記変換したスペクトル信号から、前記雑音低減対象とした周波数成分の信号を減算する第5処理と、
    前記スペクトル減算後のスペクトル信号を音響信号に逆変換する第6処理と、
    をコンピュータに実行させることを特徴とする信号処理プログラム。
JP2012181819A 2012-02-03 2012-08-20 信号処理装置、カメラおよび信号処理プログラム Pending JP2013178456A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012181819A JP2013178456A (ja) 2012-02-03 2012-08-20 信号処理装置、カメラおよび信号処理プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012021718 2012-02-03
JP2012021718 2012-02-03
JP2012181819A JP2013178456A (ja) 2012-02-03 2012-08-20 信号処理装置、カメラおよび信号処理プログラム

Publications (1)

Publication Number Publication Date
JP2013178456A true JP2013178456A (ja) 2013-09-09

Family

ID=49270130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012181819A Pending JP2013178456A (ja) 2012-02-03 2012-08-20 信号処理装置、カメラおよび信号処理プログラム

Country Status (1)

Country Link
JP (1) JP2013178456A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233687A (zh) * 2020-12-10 2021-01-15 统信软件技术有限公司 一种音频降噪装置以及计算设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233687A (zh) * 2020-12-10 2021-01-15 统信软件技术有限公司 一种音频降噪装置以及计算设备

Similar Documents

Publication Publication Date Title
US8698911B2 (en) Sound recording device, imaging device, photographing device, optical device, and program
JP2006270591A (ja) 電子カメラ、データ再生装置およびプログラム
JP2012142745A (ja) 音声信号処理装置、音声信号処理方法及びプログラム
CN103339923A (zh) 拍摄装置、程序、记录介质及噪音降低方法
JP5963430B2 (ja) 撮像装置、音声処理装置、及びそれらの制御方法
KR101457392B1 (ko) 촬상장치 및 음성 처리장치
JP2011095567A (ja) 撮像装置
US9734840B2 (en) Signal processing device, imaging apparatus, and signal-processing program
JP2011114465A (ja) 音声処理装置及び電子カメラ
JP2013178456A (ja) 信号処理装置、カメラおよび信号処理プログラム
JP5932399B2 (ja) 撮像装置及び音声処理装置
US8600070B2 (en) Signal processing apparatus and imaging apparatus
JP2012185445A (ja) 信号処理装置、撮像装置、及び、プログラム
JP6902961B2 (ja) 音声処理装置及びその制御方法
JP2013161041A (ja) 信号処理装置、カメラおよび信号処理プログラム
JP2011095378A (ja) 録音装置、撮像装置、および、プログラム
JP6061476B2 (ja) 音声処理装置
JP5018860B2 (ja) 信号処理装置及び撮像装置
US20140293095A1 (en) Image capturing apparatus, signal processing apparatus and method
JP5736839B2 (ja) 信号処理装置、撮像装置、及びプログラム
JP2013178458A (ja) 信号処理装置及び信号処理プログラム
JP5473786B2 (ja) 音声信号処理装置、及びその制御方法
JP3977406B2 (ja) オートフォーカス装置、オートフォーカス方法、撮像装置、プログラム、記憶媒体
JP2012118316A (ja) 信号処理装置、撮像装置および信号処理プログラム
JP5246134B2 (ja) 信号処理装置及び撮像装置