JP2008252389A - 撮像装置、雑音除去方法及びプログラム - Google Patents

撮像装置、雑音除去方法及びプログラム Download PDF

Info

Publication number
JP2008252389A
JP2008252389A JP2007089663A JP2007089663A JP2008252389A JP 2008252389 A JP2008252389 A JP 2008252389A JP 2007089663 A JP2007089663 A JP 2007089663A JP 2007089663 A JP2007089663 A JP 2007089663A JP 2008252389 A JP2008252389 A JP 2008252389A
Authority
JP
Japan
Prior art keywords
signal
sound
input
spectrum
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007089663A
Other languages
English (en)
Other versions
JP5034605B2 (ja
Inventor
Takao Sugaya
孝夫 菅家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2007089663A priority Critical patent/JP5034605B2/ja
Publication of JP2008252389A publication Critical patent/JP2008252389A/ja
Application granted granted Critical
Publication of JP5034605B2 publication Critical patent/JP5034605B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】雑音源となる機構部の駆動前後における原音声の音量変化を抑えて、入力音声から雑音を適切に除去する。
【解決手段】入力パワー演算部58および平滑化処理部59を通じてモータ21の駆動前に入力された音声信号の平均パワー値Power_Aveを算出する。フロアリング係数制御部60は、この平均パワー値Power_Aveに応じてフロアリング係数を変化させる。これにより、スペクトル減算部55では、雑音源となるモータ21の駆動前後における原音声の音量変化を抑えて、入力音声から雑音を適切に除去することができる。
【選択図】 図3

Description

本発明は、デジタルカメラ等の撮像装置に係り、特に撮影中に入力された音声信号を撮影画像と共に記録可能な機能を備えた撮像装置と、この撮像装置に用いられる雑音除去方法及びプログラムに関する。
例えば、音声記録機能を備えた撮像装置では、録画中にズーム操作を行うと、ズーム音(ズームモータの駆動音)が音声信号に雑音として入り込む。ここで、音声信号に重畳した雑音を除去するための手法として、スペクトルサブトラクション(spectral subtraction)法が知られている。
スペクトルサブトラクション法(以下、SS法と呼ぶ)とは、無音区間におけるスペクトルを雑音スペクトルと推定し、その雑音スペクトルに所定の係数(サブトラクト係数α)を乗じた信号を入力音声スペクトルから差し引くことで雑音成分を除去する方法である。
ここで、サブトラクト係数αは、雑音を抑制するために大きな値を取る。このため、音声と雑音とのレベル差によっては、スペクトル減算によって出力がゼロ以下になることもある。これを防ぐため、通常、フロアリング係数βと呼ばれる下限値設定用の係数が用いられる(例えば、特許文献1参照)。
今、雑音のスペクトルをN(ω)、雑音が混じった入力音声のスペクトルをY(ω)、雑音除去後の音声スペクトルをS(ω)とすると、次式で表される。
S(ω)=max(Y(ω)−α・N(ω),β・Y(ω)) …(1)
前記(1)式において、max(Y(ω)−α・N(ω),β・Y(ω))は、「Y(ω)−α・N(ω)」と「β・Y(ω)」のうち、値の大きい方を出力することを表す。αはサブトラクト係数(過推定係数とも呼ぶ)であり、通常、“1”よりも大きい固定値が用いられる。βはフロアリング係数であり、例えば0.01〜0.1程度の固定値が用いられる。
このように、入力音声をβ倍した値が下限値として設定され、スペクトル減算を行ったときに、その減算結果が下限値を下回らないように出力制御がなされる。
特開2001−228892号公報
上述したスペクトル減算は、モータの駆動タイミングでのみ実行され、また、サブトラクト係数αは1より大きな値であるため、モータの駆動前後に原音声がまたがっていると、雑音としての駆動音だけでなく、原音声のスペクトルも含めて過剰に減算してしまうことがある。
ここで、原音声の音量が小さければ、モータ駆動期間中に入力音声から雑音成分を減算したとしても(Y(ω)−α・N(ω))、元々の音量が小さいため、大きな音量変化は生じないが、原音声の音量が大きいと、減算後の原音声の音量が極端に低くなるため、違和感を生じるといった問題がある。この場合、フロアリング係数βによって下限値が補償されているが、原音声の音量に関係なく一定の値に設定されているため、上述したような原音声の極端な音量変化を抑えることはできない。
本発明は前記のような点に鑑みなされたもので、雑音源となる機構部の駆動前後における原音声の音量変化を抑えて、入力音声から雑音を適切に除去することのできる撮像装置、雑音除去方法及びプログラムを提供することを目的とする。
本発明の請求項1に係る撮像装置は、撮影時に音声信号を記録可能な撮像装置において、撮影操作に伴って駆動される機構部と、入力された音声信号をスペクトル信号に変換する変換手段と、予め前記機構部の駆動時に発生する音をスペクトル化した雑音スペクトル信号を記憶した記憶手段と、前記機構部の駆動時に前記変換手段によって得られる入力音声のスペクトル信号から前記記憶手段に記憶された雑音スペクトル信号に所定の係数を乗じた信号を減算処理すると共に、前記入力音声のスペクトル信号にフロアリング係数を乗じた値を下限値として設定し、前記減算処理により得られた値と前記下限値の大きい方を雑音除去後の音声スペクトル信号として出力するスペクトル減算手段と、前記機構部の駆動前に入力された音声信号のパワー値を取得するパワー取得手段と、このパワー取得手段によって取得された音声信号のパワー値に基づいて前記フロアリング係数を制御するフロアリング係数制御手段とを具備したことを特徴とする。
また、本発明の請求項2は、請求項1記載の撮像装置において、前記パワー取得手段は、前記変換手段によって変換されたスペクトル信号を全周波数にわたって総和をとることにより前記音声信号のパワー値を取得することを特徴とする。
また、本発明の請求項3は、請求項1記載の撮像装置において、前記パワー取得手段は、前記機構部の駆動前の所定期間の間に入力された音声信号のパワー値を平均化することにより前記音声信号のパワー値を取得することを特徴とする。
また、本発明の請求項4は、請求項1記載の撮像装置において、前記スペクトル減算手段によって得られた雑音除去後の音声スペクトル信号を元の音声信号に逆変換する逆変換手段と、この逆変換手段によって得られた音声信号を撮影画像と共に記録する記録手段とを具備したことを特徴とする。
また、本発明の請求項5は、請求項1乃至3のいずれかに記載の撮像装置において、前記フロアリング係数制御手段は、前記音声信号のパワー値が大きいほど、前記フロアリング係数を大きくし、前記音声信号のパワー値が小さいほど、前記フロアリング係数を小さく制御することを特徴とする。
また、本発明の請求項6は、請求項1記載の撮像装置において、音声信号の録音レベルを制御する録音レベル制御手段を備え、前記フロアリング係数制御手段は、前記録音レベル制御手段によって設定された録音レベルが大きいほど、前記フロアリング係数を小さくし、前記録音レベルが小さいほど、前記フロアリング係数を大きく制御することを特徴とする。
また、本発明の請求項7は、請求項6記載の撮像装置において、前記録音レベル制御手段は、入力された音声信号のパワー値の変化に応じて音声信号の録音レベルを制御することを特徴とする。
また、本発明の請求項8は、請求項1記載の撮像装置において、前記機構部の駆動前後に所定の遷移期間を設定する遷移期間設定手段を備え、前記フロアリング係数制御手段は、前記遷移期間設定手段によって設定された前記機構部の駆動前の遷移期間では前記フロアリング係数を所定の値から前記音声信号の平均パワー値に応じた最適値に緩やかに変化させ、前記機構部の駆動後の遷移期間では前記フロアリング係数を前記最適値から前記所定の値に緩やかに変化させることを特徴とする。
また、本発明の請求項9は、請求項1記載の撮像装置において、前記記憶手段に記憶された雑音スペクトル信号の特定の周波数を所定の値に置き換えておくことにより、前記スペクトル減算手段は、前記雑音スペクトル信号から前記所定の値を検出した場合に出力をゼロにすることを特徴とする。
また、本発明の請求項10は、請求項1記載の撮像装置において、前記記憶手段に記憶された雑音スペクトル信号の特定の周波数を指定するための制御データを記憶した制御データ記憶手段を備え、前記スペクトル減算手段は、前記音声信号のパワーが所定の値よりも小さい場合に、前記制御データ記憶手段に記憶された制御データに基づいて、前記特定の周波数の出力をゼロにすることを特徴とする。
本発明の請求項11に係る雑音除去方法は、音声付き動画撮影を行う場合に、入力音声から撮影操作に伴って駆動部から発生する音を雑音として除去する雑音除去方法であって、前記入力音声をスペクトル信号に変換するステップと、前記スペクトル変換によって得られた入力音声スペクトル信号から、予め前記機構音をスペクトル化して得られた機構音スペクトル信号に所定の係数を乗じた信号を減算処理すると共に、前記入力音声のスペクトル信号にフロアリング係数を乗じた値を下限値として設定し、前記減算処理の結果と前記下限値の大きい方を雑音除去後の音声スペクトル信号として出力するステップと、前記機構部の駆動前に入力された音声信号のパワー値を取得するステップと、前記音声信号のパワー値に基づいて前記フロアリング係数を制御するステップとを備えたことを特徴とする。
本発明の請求項12に係るプログラムは、音声付き動画撮影を行う場合に、入力音声から撮影操作に伴って駆動部から発生する音を雑音として除去する機能を備えたコンピュータによって実行されるプログラムであって、前記コンピュータに、前記入力音声をスペクトル信号に変換する機能と、前記スペクトル変換によって得られた入力音声スペクトル信号から、予め前記機構音をスペクトル化して得られた機構音スペクトル信号に所定の係数を乗じた信号を減算処理すると共に、前記入力音声のスペクトル信号にフロアリング係数を乗じた値を下限値として設定し、前記減算処理の結果と前記下限値の大きい方を雑音除去後の音声スペクトル信号として出力する機能と、前記機構部の駆動前に入力された音声信号のパワー値を取得する機能と、前記音声信号のパワー値に基づいて前記フロアリング係数を制御する機能とを実現させることを特徴とする。
本発明によれば、雑音源となる機構部の駆動前後における原音声の音量変化を抑えて、原音声に含まれる雑音を適切に除去することができる。
以下、図面を参照して本発明の実施形態を説明する。
(第1の実施形態)
図1は本発明の撮像装置としてデジタルカメラを例にした場合の外観構成を示す図であり、図1(a)は主に前面の構成、同図(b)は主に背面の構成を示す斜視図である。
このデジタルカメラ1は、略矩形の薄板状ボディ2の前面に、撮影レンズ3、セルフタイマランプ4、光学ファインダ窓5、ストロボ発光部6、マイクロホン部7などを有し、上面の(ユーザにとって)右端側には電源キー8及びシャッタキー9などが設けられている。
電源キー8は、電源のオン/オフ毎に操作するキーであり、シャッタキー9は、撮影時に撮影タイミングを指示するキーである。
また、デジタルカメラ1の背面には、撮影モード(R)キー10、再生モード(P)キー11、光学ファインダ12、スピーカ部13、マクロキー14、ストロボキー15、メニュー(MENU)キー16、リングキー17、セット(SET)キー18、表示部19などが設けられている。
撮影モードキー10は、電源オフの状態から操作することで自動的に電源オンとして静止画の撮影モードに移行する一方で、電源オンの状態から繰返し操作することで、静止画モード、動画モードを循環的に設定する。静止画モードは、静止画を撮影するためのモードである。また、動画モードは、動画を撮影するためのモードであり、特に本実施形態では音声付き動画撮影が可能であるとする。
前記シャッタキー9は、これらの撮影モードに共通に使用される。すなわち、静止画モードでは、シャッタキー9が押下されたときのタイミングで静止画の撮影が行われる。動画モードでは、シャッタキー9が押下されたときのタイミングで動画の撮影が開始され、シャッタキー9が再度押下されたときにその動画の撮影が終了する。
再生モードキー11は、電源オフの状態から操作することで自動的に電源オンとして再生モードに移行する。
マクロキー14は、静止画の撮影モードで通常撮影とマクロ撮影とを切換える際に操作する。ストロボキー15は、ストロボ発光部6の発光モードを切換える際に操作する。メニューキー16は、各種メニュー項目等を選択する際に操作する。リングキー17は、上下左右各方向への項目選択用のキーが一体に形成されたものであり、このリングキー17の中央に位置するセットキー18は、その時点で選択されている項目を設定する際に操作する。
表示部19は、バックライト付きのカラー液晶パネルで構成されるもので、撮影モード時には電子ファインダとしてスルー画像のモニタ表示を行う一方で、再生モード時には選択した画像等を再生表示する。
また、このデジタルカメラ1には、光学ズーム機能が備えられており、ズームキー20a,20bの操作により焦点距離を物理的に変化させて画像の拡大率を変更することができる。ズームキー20a,20bのうち、一方のズームキー20aはテレ端用であり、望遠側へズーム倍率を変更する場合に用いられる。他方のズームキー20bはワイド端用であり、広角側へズーム倍率を変更する場合に用いられる。
なお、図示はしないがデジタルカメラ1の底面には、記録媒体として用いられるメモリカードを着脱するためのメモリカードスロットや、外部のパーソナルコンピュータ等と接続するためのシリアルインタフェースコネクタとして、例えばUSB(Universal Serial Bus)コネクタ等が設けられている。
図2はデジタルカメラ1の電子回路構成を示すブロック図である。
このデジタルカメラ1には、前記撮影レンズ3を構成する図示せぬフォーカスレンズおよびズームレンズなどを含むレンズ光学系22が光軸方向に所定の範囲内で移動可能に設けられている。このレンズ光学系22は、モータ駆動部21aによって回転駆動されるモータ21により移動する。
なお、前記モータ21として、ズーム倍率調整用のモータ(ズームモータ)、フォーカス調整用のモータ(フォーカスモータ)などの複数の異なるモータを含み、それぞれに対応したモータ駆動部21aが設けられているものとする。
このモータ21の光軸後方に撮像素子であるCCD(charge coupled device)23が配設されている。このCCD23は、撮影レンズ3を通して入力される被写体の各部位からの光を受光し、その光の強度に応じた電気信号を出力する。
基本モードである記録モード時において、CCD23がタイミング発生器(TG)24、ドライバ25によって走査駆動され、一定周期毎に結像した光像に対応する光電変換出力を1画面分出力する。このCCD23の光電変換出力は、アナログ値の信号の状態でRGBの各原色成分毎に適宜ゲイン調整された後に、サンプルホールド回路26でサンプルホールドされ、A/D変換器27でデジタルデータに変換される。
そして、画像処理回路28において、画素補間処理及びγ補正処理を含む画像処理が行われて、デジタル値の輝度信号Y及び色差信号U,V(Cb,Cr)が生成され、DMA(Direct Memory Access)コントローラ29に出力される。
DMAコントローラ29は、画像処理回路28の出力する輝度信号Y及び色差信号U,Vを、同じく画像処理回路28からの複合同期信号、メモリ書込みイネーブル信号、及びクロック信号を用いて一度DMAコントローラ29内部のバッファに書き込み、DRAMインタフェース(I/F)30を介してバッファメモリとして使用されるDRAM31にDMA転送を行う。
制御部32は、デジタルカメラ1全体の制御を行うものであり、CPUと、このCPUで実行される動作プログラムを記憶したROM、及びワークメモリとして使用されるRAMなどを含むマイクロコンピュータにより構成される。この制御部32は、前記輝度及び色差信号のDRAM31へのDMA転送終了後に、この輝度及び色差信号をDRAMインタフェース30を介してDRAM31より読み出し、VRAMコントローラ33を介してVRAM34に書き込む。
デジタルビデオエンコーダ35は、前記輝度及び色差信号をVRAMコントローラ33を介してVRAM34より定期的に読み出し、これらのデータを元にビデオ信号を発生して表示部19に出力する。
この表示部19は、上述した如く撮影時にはモニタ表示部(電子ファインダ)として機能するもので、デジタルビデオエンコーダ35からのビデオ信号に基づいた表示を行うことで、その時点でVRAMコントローラ33から取込んでいる画像情報に基づく画像をリアルタイムに表示することとなる。
このように、表示部19にその時点での画像がモニタ画像としてリアルタイムに表示されている状態で、例えば静止画撮影を行いたいタイミングでシャッタキー9を押下操作すると、トリガ信号が発生する。
制御部32は、このトリガ信号に応じて、その時点でCCD23から取込んでいる1画面分の輝度及び色差信号のDRAM31へのDMA転送の終了後、直ちにCCD23からのDRAM31への経路を停止し、記録保存の状態に遷移する。
この記録保存の状態では、制御部32がDRAM31に書き込まれている1フレーム分の輝度及び色差信号をDRAMインタフェース30を介してY,Cb,Crの各コンポーネント毎に縦8画素×横8画素の基本ブロックと呼称される単位で読み出して、JPEG(Joint Photograph coding Experts Group)回路37に書き込み、このJPEG回路37でADCT(Adaptive Discrete Cosine Transform:適応離散コサイン変換)、エントロピ符号化方式であるハフマン符号化等の処理によりデータ圧縮する。
そして得た符号データを1画像のデータファイルとして該JPEG回路37から読み出して記録用のメモリ38に書き込む。このメモリ38としては、予め本体に内蔵されたフラッシュメモリ等の内部メモリの他に、記録媒体として着脱自在に装着されるメモリカードなどを含む。1フレーム分の輝度及び色差信号の圧縮処理及びメモリ38への全圧縮データの書込み終了に伴って、制御部32はCCD23からDRAM31への経路を再び起動する。
制御部32には、さらに音声処理部39、USBインタフェース(I/F)40、ストロボ駆動部41が接続される。
音声処理部39は、PCM音源等の音源回路を備え、音声の録音時には前記マイクロホン部(MIC)7より入力された音声信号をデジタル化し、所定のデータファイル形式、例えばMP3(MPEG−1 audio layer 3)規格に従ってデータ圧縮して音声データファイルを作成してメモリ38へ送出する一方、音声の再生時にはメモリ38から読み出された音声データファイルの圧縮を解いてアナログ化し、上述したデジタルカメラ1の背面側に設けられるスピーカ部(SP)13を通じて出力する。
USBインタフェース40は、USBコネクタを介して有線接続されるパーソナルコンピュータ等の他の情報端末装置との間で画像データ、その他の送受を行う場合の通信制御を行う。ストロボ駆動部41は、撮影時に図示せぬストロボ用の大容量コンデンサを充電した上で、制御部32からの制御に基づいてストロボ発光部6を閃光駆動する。
なお、前記キー入力部36は、上述したシャッタキー9の他に、電源キー8、撮影モードキー10、再生モードキー11、マクロキー14、ストロボキー15、メニューキー16、リングキー17、セットキー18、ズームキー20a,20bなどから構成され、それらのキー操作に伴う信号は直接制御部32へ送出される。
また、静止画像ではなく動画像の撮影時においては、シャッタキー9が押下操作されたときに、上述したJPEG回路37によりmotion−JPEG(Joint Photographic Experts Group)などの手法により撮影動画をデータ圧縮してメモリ38へ記録する。この場合、音声付き動画撮影であれば、その撮影中にマイクロホン部(MIC)7より入力された音声信号が動画データと共に前記メモリ38に記録されることになる。再度シャッタキー9が操作されると、動画データの記録を終了する。
一方、基本モードである再生モード時には、制御部32がメモリ38に記録されている画像データを選択的に読み出し、JPEG回路37で記録モード時にデータ圧縮した手順と全く逆の手順で、圧縮されている画像データを伸長する。そして、この伸長した画像データをDRAMインタフェース30を介してDRAM31に保持させた上で、このDRAM31の保持内容をVRAMコントローラ33を介してVRAM34に記憶させ、このVRAM34より定期的に画像データを読み出してビデオ信号を発生し、表示部19で再生出力させる。
選択した画像データが静止画像ではなく動画像であった場合には、その動画データを構成する複数フレームの静止画データを時系列の順で順次再生して表示し、すべての静止画データの再生を終了した時点で、例えば、次に再生の指示がなされるまで先頭に位置する静止画データを表示するなどを行う。その際、当該動画データに音声データが含まれていれば、その音声データがスピーカ部(SP)13を通じて出力されることになる。
次に、このデジタルカメラ1に用いられる雑音除去機能を備えた音声記録装置について説明する。
図3は本発明の第1の実施形態におけるデジタルカメラ1に用いられる音声記録装置の構成を示すブロック図である。
この音声記録装置は、主としてデジタルカメラ1の音声付き動画撮影に用いられるものであり、その撮影中に音声信号に混入するズーム機構の駆動音などを雑音として除去する機能を備えている。
第1の実施形態において、この音声記録装置は、モータ21、モータ駆動部21a、制御部32、キー入力部36、マイクロホン部7、A/D変換部51、フレーム分割部52、フーリエ変換部53、雑音スペクトル記憶部54、スペクトル減算部55、逆フーリエ変換部56、波形合成部57、入力パワー演算部58、平滑化処理部59、フロアリング係数制御部60を備える。なお、前記各構成部のうち、51〜57の部分は図2に示したデジタルカメラ1の音声処理部39に含まれる。
モータ21はズームレンズなどのレンズ光学系22を光軸方向に移動させるためのモータであり、モータ駆動部21aはそのモータ21を回転駆動させるための駆動機構である。
制御部32は、キー入力部36に含まれるズームキー20a,20bなどの操作信号を受けてモータ駆動制御信号をモータ駆動部21aに出力すると共に、ここでは、音声付き動画撮影中に入力パワー演算部58およびフロアリング係数制御部56を制御する機能を備える。
一方、マイクロホン部7を通じて入力された音声信号は、A/D変換部51を介してデジタル信号に変換された後、フレーム分割部52に与えられる。この場合、音声付き動画撮影中に例えばズーム操作が行われると、そのズーム操作に伴って発生するモータ音(ズーム音)がマイクロホン部7を通じて音声信号と共に入り込むことになる。
フレーム分割部52は、入力された音声信号を所定時間分のフレーム単位で分割する。フーリエ変換部53は、このフレーム分割部52によってフレーム単位で分割された音声信号をフーリエ変換し、周波数毎のパワーを示したスペクトル信号Y(ω)に変換する。
雑音スペクトル記憶部54には、予め雑音除去対象となる機構部の駆動音(ズーム音)をスペクトル化した雑音スペクトル信号N(ω)が記憶されている。スペクトル減算部55は、フーリエ変換部53によって得られた入力音声のスペクトル信号Y(ω)と雑音スペクトル記憶部54に記憶された雑音スペクトル信号N(ω)に基づいて、SS(spectral subtraction)法による雑音除去処理を行う。
詳しくは、入力音声のスペクトル信号Y(ω)から雑音スペクトル信号N(ω)に所定のサブトラクト係数αを乗じた信号を減算することで、入力音声に含まれる雑音成分を除去する処理を行う。減算後の音声スペクトル信号をS(ω)とする。
ここで、スペクトル減算部55による過度の雑音除去を防ぐために、下限値設定部55aが設けられている。この下限値設定部55aは、入力音声のスペクトル信号Y(ω)にフロアリング係数βを乗じた信号を下限値として設定し、スペクトル減算部55の出力信号S(ω)がこの下限値を下回らないように制御する。なお、後述するように、フロアリング係数βの値は、フロアリング係数制御部60によって適宜最適な値に調整される。
逆フーリエ変換部56は、スペクトル減算部55から出力された音声スペクトル信号S(ω)を逆フーリエ変換して元のフレーム単位毎の音声信号に戻す。
波形合成部57は、この逆フーリエ変換部56によって得られるフレーム単位毎の音声信号を合成することで時系的に連続した音声信号に復元する。この波形合成部57から出力された音声信号は、最終的な記録用の音声信号として用いられ、デジタルカメラ1の撮像系から得られる動画データと共に図2に示したメモリ38に記録される。
また、入力パワー演算部58は、モータ21の駆動期間前に入力された音声信号を算出する。平滑化処理部59は、入力パワー演算部58によって算出された音声信号のパワーを時間軸方向に平滑化する。フロアリング係数制御部60は、下限値設定部55aに用いられるフロアリング係数βをモータ21の駆動期間前に入力された音声信号のパワーに応じて変化させる。詳しくは、平滑化処理部59によって得られた音声信号のパワーの平均値が大きいほど、フロアリング係数βを大きくし、音声信号のパワーの平均値が小さいほど、フロアリング係数βを小さく制御する。
ここで、理解を容易にするため、SS法(スペクトルサブトラクション法)を用いた雑音除去処理の基本的な動作について説明しておく。
今、音声付き動画撮影を行っている最中に、例えばユーザがキー入力部36に含まれるズームキー20a,20bを操作したとする。
デジタルカメラ全体の動作を制御する制御部32は、キー入力部36に含まれるズームキー20a,20bのズーム操作信号を入力すると、モータ駆動部21aに対して駆動開始信号を送る。モータ駆動部21aは、この駆動開始信号を受けてモータ21を回転駆動する。このモータ21の回転に伴い、図2のレンズ光学系22に含まれる図示せぬズームレンズが光軸上に移動してズーム倍率が変化する。
また、ユーザがズーム操作を終了すると、制御部32はモータ駆動部21aに対して駆動停止信号を送る。これにより、モータ21の回転駆動が停止し、ズーム動作が終了する。
ここで、音声付き動画の撮影中は常にマイクロホン部7による音声入力機能がON状態にある。このため、前記ズーム操作に伴って発生するモータ音が入力音声の中に雑音として混入する問題がある。このようなモータ音を音声信号から除去して記録するべく、以下のような処理が行われる。
すなわち、まず、雑音除去対象となるモータ音(機構音)のスペクトル信号を事前に採取しておき、これを雑音スペクトル信号N(ω)として雑音スペクトル記憶部54に記憶しておく。以下では、ズーム操作時に発生するモータ音つまりズーム音を雑音除去対象として説明する。
ズーム音の採取方法は、無音状態でズーム操作を行い、そのときに発生するズーム音のみをマイクロホン部7から入力することで行う。この入力したズーム音をA/D変換部51にてデジタル信号に変換した後、フレーム分割部52により数10ms程度のフレーム区間に切り出し、フーリエ変換部53によりスペクトル信号に変換する。これをモータ駆動期間(ズームモータの駆動開始から駆動停止までの期間)について行い、その間にフレーム単位で順次得られるスペクトル信号の平均値を雑音スペクトル信号N(ω)として雑音スペクトル記憶部54に記憶しておく。
上述したように、ズーム操作を行っているとき、マイクロホン部7には原音声に加えて、そのときに発生するモータ音が雑音として入力されている。このため、フーリエ変換部53からは原音声とモータ音が混合したスペクトル信号Y(ω)が出力される。
スペクトル減算部55では、このモータ音を含んだ入力音声のスペクトル信号Y(ω)と、雑音スペクトル記憶部54に予め記憶された雑音スペクトル信号N(ω)とに基づいてSS法による雑音除去処理を行う。
この雑音除去処理について、図4を参照して詳しく説明する。
図4はSS法(スペクトルサブトラクション法)を用いた雑音除去処理を説明するための図である。図4(a)は入力音声の波形データ、同図(b)はこの入力音声をフレーム単位でフーリエ変換して得られた入力音声のスペクトル信号である。また、同図(c)は雑音除去対象となるモータ音のスペクトル信号(雑音スペクトル)、同図(d)はその雑音スペクトル信号に所定のサブトラクト係数αを乗じた信号である。同図(e)は入力音声のスペクトル信号から係数乗算後の雑音スペクトル信号を減算して得られるスペクトル信号つまり雑音除去後の音声スペクトル信号である。同図(f)はその雑音除去後の音声スペクトル信号を逆フーリエ変換して得られた音声信号、同図(g)はフレーム単位で分割された音声信号を時系列に合成して元の音声波形に戻した状態を示している。
今、図4(a)に示すような波形を有する音声信号が音声入力部51に入力されたとする。この音声信号には、例えばズーム操作に伴って発生するモータ音つまりズーム音が雑音として混入されている。
まず、フレーム分割部52において、例えば10ms程度のフレーム区間で入力信号を切り出し、同図(b)に示すように、フーリエ変換部53にて周波数毎のパワーを表したスペクトル信号Y(ω)を生成する。
ここで、同図(c)に示すように、雑音スペクトル記憶部54には予めモータ音をスペクトル化した雑音スペクトル信号N(ω)が記憶されている。そこで、同図(c)〜(e)に示すように、スペクトル減算部55において、入力音声のスペクトル信号Y(ω)から雑音スペクトル信号N(ω)に所定のサブトラクト係数αを乗じた信号を減算することにより、雑音除去後の音声スペクトル信号S(ω)が得られる。
なお、前記サブトラクト係数αは、雑音スペクトル記憶部54に記憶された雑音スペクトル信号N(ω)のレベルに応じて予め決められており、通常、“1”以上の値である。
図4(f)に示すように、この雑音除去後の音声スペクトル信号S(ω)は逆フーリエ変換部56にて逆フーリエ変換される。そして、同図(g)に示すように、波形合成部57にて各フレーム毎の音声信号が時系列に合成処理されて、元のアナログ波形信号である音声信号に復元される。この音声信号は、雑音除去後の音声信号として動画撮影中に画像データと共にメモリ38に記録される。
なお、前記のような雑音除去処理において、実際にはフレーム分割部52にて音声信号をフレーム分割してフーリエ変換する前に、音声信号に「ハニング窓」等の窓関数をかけておく。また、後段の波形合成部57で逆フーリエ変換後の音声信号をフレーム毎に合成処理する際にフレーム境界で不連続な波形になるのを防止するために、フレーム毎の音声信号を多少オーバーラップして合成していく。
例えば、フレーム長が256サンプルとして分析ポイントを128サンプルずつシフトしていく。この場合のハニング窓は(2)式のように表せる。
w(n)=0.5−cos{2*PI*n/(L−1)} …(2)
L:1フレームのサンプル数
n=0,1,…,L−1
このように、各信号を1/2フレームずらして重ね合わせると、振幅が一定で不連続点のない音声波形を得ることができる。
次に、第1の実施形態の動作を説明する。
第1の実施形態では、モータ駆動前後における原音声の急激な変化を防止するべく、駆動期間前に入力された音声信号(つまり、雑音であるズーム音を含まない原音声の信号)のパワーに基づいて、下限値設定用に用いられるフロアリング係数βを変化させるものである。
図5は第1の実施形態におけるデジタルカメラ1の動画記録時の音声処理の動作を示すフローチャートである。なお、このフローチャートで示される処理は、コンピュータである制御部32によって読み取り可能なプログラムの形態でROM等の記録媒体に予め記録されているものとする。
(a)ズーム動作がない場合
まず、ズーム動作がない場合の処理について説明する。
図3に示したように、マイクロホン部7より入力された音声信号は、A/D変換部51によりデジタル信号に変換された後、フレーム分割部52により、例えば256サンプル毎のフレーム単位に分割される(ステップA11)。このフレーム単位の音声データにハニング窓等の窓掛け処理を行った後、フーリエ変換部53により周波数領域信号に変換され、入力音声のスペクトル信号Y(ω)が生成される(ステップA12)。
ここで、ズーム動作がない場合には(ステップA13のNo)、入力パワー演算部10では、フーリエ変換部53から得られる入力音声のスペクトル信号Y(ω)を全周波数にわたって総和をとることにより、入力音声のパワー値を算出する(ステップA14)。この入力音声のパワー値をPowerとすると、次のような式で表される。
Power=Σ(|Y(ω)|*|Y(ω)|) …(3)
なお、入力音声のスペクトル信号Y(ω)は常時計算しているため、前記(3)式のために必要な処理は加算処理のみである。
平滑化処理部11では、入力音声のパワー値の小さい変動を抑えるために、ズーム動作期間以前の入力音声の平均パワー値を算出する(ステップA15)。このときの平均パワー値をPower_Aveとすると、次のような式で表される。
Power_Ave=K*Power_Ave(n−1)+(1−K)*Power …(4)
Power_Ave(n−1)は、前回の平滑化処理で得られた入力音声の平均パワー値であり、Kは平滑化の度合いを決定する平滑化係数であり、0から1までの間の値である。なお、平滑化処理の別の方法としては、過去の数フレーム分の入力パワー値の平均をとるようにしても良い。
次に、フロアリング係数制御部12では、フロアリング係数β=1とする(ステップA16)。
スペクトル減算部55は、入力音声のスペクトル信号Y(ω)と、雑音スペクトル記憶部54に記憶された雑音スペクトル信号N(ω)とにより前記(1)式に従ってスペクトル減算処理を行う(ステップA18)。
ここで、スペクトル減算後のスペクトル信号S(ω)は、フロアリング係数β=1であることから、S(ω)=Y(ω)となる。逆フーリエ変換部56にてスペクトル信号S(ω)を逆フーリエ変換して時間領域信号に変換すると(ステップA19)、フーリエ変換前の音声信号になる。波形合成部57で前後のフレームデータから連続的な音声信号を生成すると(ステップA20)、元の入力信号に戻り、動画データとタイミングを合わせて記録メディアであるメモリ38に記録される(ステップA21)。
このように、ズーム動作がない場合には、マイクロホン部7を通じて入力された音声信号がそのまま動画データと共にメモリ38に記録されることになる。
(b)ズーム動作があった場合の処理
次に、ズーム動作があった場合について説明する。
フーリエ変換部53により入力音声のスペクトル信号Y(ω)を生成するまでは、ズーム動作がない場合と同様である(ステップA11〜A12)。
ここで、ズーム動作があると(ステップA13のNo)、フロアリング係数制御部12では、ズーム期間以前に得られた入力音声の平均パワー値Power_Aveに基づいてフロアリング係数βを最適な値に制御する(ステップA17)。
詳しくは、入力音声の平均パワー値Power_Aveがズーム音に比べて大きく、ズーム音が目立たない時にはフロアリング係数βを1.0に近い値に設定しておき、Power_Aveが小さくなるに従ってフロアリング係数βを小さくしていき、Power_Aveが0の場合は例えばフロアリング係数βを0とするように制御する。
スペクトル減算部55では、前記(1)式に従ってスペクトル減算処理を行う(ステップA18)。その際、入力音声の平均パワー値Power_Aveがズーム音に比べて大きく、ズーム音が目立たない場合であれば、フロアリング係数βによって決定される下限値が上がるので、入力音声を過剰に減算することなく、ほぼ原形のままで出力することができる。また、Power_Aveがズーム音に比べて小さく、ズーム音が目立つ場合であれば、フロアリング係数βによって決定される下限値が下がることになり、入力音声から雑音であるズーム音を適切に除去することができる。
逆フーリエ変換部56では、スペクトル減算部55から出力される雑音除去後の音声スペクトル信号S(ω)を逆フーリエ変換して時間領域信号に変換する(ステップA19)。波形合成部57では、前後のフレームデータから連続的な音声信号を生成し(ステップA20)、動画データとタイミングをあわせて記録メディアであるメモリ38に記録する(ステップA21)。
このように、ズーム動作があった場合には、音声信号の平均パワー値Power_Aveに応じてフロアリング係数βが最適な値に設定され、そのフロアリング係数βを用いてスペクトル減算の下限値が調整される。これにより、過剰な減算による急激な音量変化を抑え、臨場感を損なうことなく、原音声の音量をできるだけ保持した状態で撮影画像と共に記録することが可能となる。
以上のように、第1の実施形態によれば、ズーム駆動前に入力された音声信号の平均パワー値Power_Aveに応じてフロアリング係数βを変化させたことにより、モータ駆動前後における原音声の音量変化を抑えて、入力音声からズーム音を雑音として適切に除去することができる。
また、ズーム期間以前の平均パワー値Power_Aveの算出は、入力音声のスペクトル信号Y(ω)の加算処理と、簡単な平滑化処理で得られることから、ソフト処理においては処理時間の節約、ハード処理においてはハード規模の節約を図ることができる。
(第1の実施形態の変形例1)
図6は第1の実施形態の変形例1における音声記録装置の構成を示すブロック図である。なお、図3と同一部分には同一符号を付して、その説明は省略するものとする。
図3と異なる点は、録音レベル制御部61および増幅器62が追加されている点である。録音レベル制御部61は、マイクロホン部7から入力される音声信号が小さいときには録音レベルを上げ、大きいときには録音レベルを下げるように増幅器62を制御するものである。この録音レベルの調整は、例えば、マイクロホン部7から入力される音声信号を積分することにより求めた音声信号のパワーの変化に応じて行われる。
デジタルカメラ1に録音レベルの制御機能が備えられている場合、録音レベルに応じて入力音声に含まれるズーム音の割合が変化する。すなわち、録音レベルが大きいときには、入力音声に含まれるズーム音の割合は大きくなり、録音レベルが小さいときには入力音声に含まれるズーム音の割合は小さくなる。
そこで、フロアリング係数制御部60では、録音レベル制御部12によって設定される録音レベルが大きいときにはフロアリング係数βを小さく、録音レベルが小さいときにはフロアリング係数βを大きく制御する。具体的には、入力パワー演算部58および平滑化処理部59によって得られる入力音声の平均パワー値Power_Aveに対応したフロアリング係数βの値に録音レベルの逆数を乗じることで、最終的なフロアリング係数βをスペクトル減算部55に与える。
これにより、録音レベルが大きく、入力音声に対してズーム音が目立つときには、フロアリング係数βを小さくして、入力音声からズーム音を雑音として適切に除去することができる。また、録音レベルが小さく、ズーム音が目立たないときには、フロアリング係数βを大きくすることで、過剰な減算を抑えて入力音声をほぼ原形のままで出力することができる。
(第1の実施形態の変形例2)
図7に示すように、ズーム期間の前後に遷移期間Aと遷移期間Bを設定する。遷移期間Aは、例えばズームがON操作されたから実際にズーム動作が開始されるまでの間に設定される。遷移期間Bは、例えばズームがOFF操作されたから実際にズーム動作が終了するまでの間に設定される。遷移期間Aではフロアリング係数βを1.0から前記第1の実施形態で設定された最適値まで滑らかに変化させ、遷移期間Bではフロアリング係数βをその最適値から1.0に滑らかに変化させる。
具体的に説明すると、図8に示すように、制御部32に遷移期間Aと遷移期間Bを設定するための遷移期間設定部32aが設けられる。遷移期間Aにおいて、ズーム動作を開始する一定期間前に制御部32からズーム予告信号をフロアリング係数制御部60に出力する。フロアリング係数制御部60は、その時点でズーム期間以前に得られた入力音声の平均パワー値Power_Aveに基づいてフロアリング係数βの最適値を算出し、フロアリング係数βを1.0から前記最適値になるように制御する。なお、実際には、例えば50msec毎にフロアリング係数βの値が段階的に変化するので、これを直線補間により滑らかに変化させる。
一方、遷移期間Bでは、ズーム動作が終了した時点で制御部32からズーム終了信号をフロアリング係数制御部60に出力する。フロアリング係数制御部60は、このズーム終了信号を時湯新することにより、現在のフロアリング係数βを前記最適値から1.0になるように制御する。この場合も直線補間により滑らかに変化させる。
このように、ズーム期間の前後の遷移期間Aと遷移期間Bでフロアリング係数βを滑らかに変化させることで、入力音声に対するスペクトル減算処理が緩やかなものになるため、ズーム期間前後での急激な音量変化をさらに抑えることができる。
なお、前記変形例1のように録音レベルに基づいてフロアリング係数βの最適値を算出した場合も同様であり、その最適値に合わせてフロアリング係数βを緩やかに変化させることで、ズーム期間前後での急激な音量変化をさらに抑えることができる。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。
第2の実施形態では、スペクトル減算を利用して、ズーム音だけでなく、デジタルカメラ1の電源がONしいるときに回路基板上の電子回路から定常的に発生している雑音を除去する構成としている。
音声記録装置として基本的な構成は図3と同様である。雑音スペクトル記憶部54には、ズーム期間中に発生する雑音つまりズーム音を周波数単位でスペクトル化した信号が雑音スペクトル信号N(ω)として記憶されている。この雑音スペクトル信号N(ω)の特定の周波数の値を所定の値に置き換えておく。「特定の周波数」とは、回路基板上の電子回路から定常的に発生している雑音に対応した周波数であり、ズーム音の周波数に比べて高い周波数である。また、「所定の値」とは、通常の雑音スペクトル信号N(ω)からは得られることのない大きな値とする。
なお、多数の電子回路から発生される雑音を除去する場合には、雑音スペクトル信号N(ω)の中の各電子回路の雑音周波数に対応した部分を所定の値にそれぞれ置き換えておくものとする。
以下に、このような構成の音声処理について説明する。
図9は第2の実施形態におけるデジタルカメラ1の動画記録時の音声処理の動作を示すフローチャートである。なお、このフローチャートで示される処理は、コンピュータである制御部32によって読み取り可能なプログラムの形態でROM等の記録媒体に予め記録されているものとする。
図9において、ステップB11〜B17までの処理は、図5のステップA11〜A17までの処理と同様である。すなわち、マイクロホン部7より入力された音声信号のスペクトル信号Y(ω)が生成された後(ステップB11,B12)、ズーム動作の有無に応じてフロアリング係数βの値が設定される(ステップB13〜B17)。上述したように、ズーム動作がない場合には、フロアリング係数β=1に設定されるので、S(ω)=Y(ω)となる。また、ズーム動作がある場合には、入力音声の平均パワー値Power_Aveに基づいてフロアリング係数βが最適値に設定され、そのときのフロアリング係数βの値によってS(ω)が制御されることになる。
ここで、スペクトル減算部55では、雑音スペクトル記憶部54に記憶された雑音スペクトル信号N(ω)と入力音声のスペクトル信号Y(ω)を照らし合わせながら、入力音声に含まれる雑音つまりズーム音を除去する処理(スペクトル減算処理)を行っている。その際、雑音スペクトル記憶部54に記憶された雑音スペクトル信号N(ω)から前記所定の値を検出した場合(ステップB18のYes)、スペクトル減算部55は、前記特定の周波数における出力S(ω)をゼロとして出力する(ステップB19)。一方、前記所定の値を検出しなかった場合には(ステップB18のNo)、前記(1)式に従ってS(ω)の値を求めて出力する(ステップB20)。
以後の処理は前記第1の実施形態と同様であり、逆フーリエ変換部56では、スペクトル減算部55から出力される雑音除去後の音声スペクトル信号S(ω)を逆フーリエ変換して時間領域信号に変換する(ステップB21)。波形合成部57では、前後のフレームデータから連続的な音声信号を生成し(ステップB22)、動画データとタイミングをあわせて記録メディアであるメモリ38に記録する(ステップB23)。
このようにして、N(ω)=所定の値(通常よりも大きな値)である場合には、フロアリング係数βの値に関係なく、スペクトル減算部55の出力S(ω)がゼロになるので、メモリ38に記録される音声信号は常に特定周波数の成分が欠落した信号となる。
以上のように、第2の実施形態によれば、スペクトル減算に用いられる雑音スペクトル信号N(ω)の特定の周波数を所定の値に変更しておくだけで、ノッチフィルタと同じ効果が得られる。したがって、専用のソフト的なノッチ処理やノッチフィルタ回路を使用することなく、ズーム音だけでなく、電子回路から混入してくる特定周波数帯の雑音を入力音声から適切に除去して記録することができる。
(第2の実施形態の変形例1)
図10は第2の実施形態の変形例1における音声記録装置の構成を示すブロック図である。なお、図3と同一部分には同一符号を付して、その説明は省略するものとする。
雑音スペクトル記憶部54に記憶された雑音スペクトル信号N(ω)はそのままとして、新たに制御データ記憶部63を設ける。この制御データ記憶部63には、上述した回路雑音である特定の周波数を指定するための制御データが記憶されている。具体的には、前記特定の周波数では“1”、その他の周波数では“0”の値を有するノッチ用のスペクトル信号が制御データとして制御データ記憶部63にプリセットされている。
ここで、ズーム期間以前の入力音声の平均パワー値Power_Aveが所定の値より小さい場合に、スペクトル減算部55は制御データ記憶部63を参照する。そして、制御データ記憶部63にプリセットされた制御データが“1”のときに、前記フロアリング係数βに関わらず、S(ω)=0とする。一方、入力音声の平均パワー値Power_Aveが所定の値より大きい場合には、前記(1)式に従ってスペクトル減算処理を行う。その他の処理については、前記第2の実施形態と同様である。
これにより、入力音声の信号レベルが大きく、電子回路から混入する特定周波数の雑音(回路雑音)が目立たない場合にはノッチフィルタ効果をなくし、信号レベルが小さく、(回路雑音)が目立つ場合のみノッチフィルタ効果が得られるようになり、結果的に原音声により近い音声信号を記録することができる。
なお、前記各実施形態では、音声付き動画撮影可能なデジタルカメラを例にして説明したが、本発明はデジタルカメラに限らず、例えばカメラ付きの携帯電話など、音声信号と共に撮影画像を記録可能な機能を備えた電子機器であれば、そのすべてに適用可能である。
また、ズーム音に限らず、例えばフォーカス音など、撮影操作に伴って発生する駆動音であれば、前記同様の手法にて除去することができる。
要するに、本発明は前記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
また、上述した実施形態において記載した手法は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD−ROM等)、半導体メモリなどの記録媒体に書き込んで各種装置に適用したり、そのプログラム自体をネットワーク等の伝送媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムあるいは伝送媒体を介して提供されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。
図1は本発明の撮像装置としてデジタルカメラを例にした場合の外観構成を示す図であり、図1(a)は主に前面の構成、同図(b)は主に背面の構成を示す斜視図である。 図2はデジタルカメラの電子回路構成を示すブロック図である。 図3は本発明の第1の実施形態に係るデジタルカメラに用いられる音声記録装置の構成を示すブロック図である。 図4はSS法(スペクトルサブトラクション法)を用いた雑音除去処理を説明するための図である。 図5は第1の実施形態におけるデジタルカメラ1の動画記録時の音声処理の動作を示すフローチャートである。 図6は第1の実施形態の変形例1における音声記録装置の構成を示すブロック図である。 図7は第1の実施形態の変形例2におけるフロアリング係数の変更方法を説明するための図である。 図8は第1の実施形態の変形例2における音声記録装置の構成を部分的に示すブロック図である。 図9は本発明の第2の実施形態におけるデジタルカメラの動画記録時の音声処理の動作を示すフローチャートである。 図10は第2の実施形態の変形例1における音声記録装置の構成を示すブロック図である。
符号の説明
1…デジタルカメラ、2…ボディ、3…撮影レンズ、7…マイクロホン部、9…シャッタキー、20a,20b…ズームキー、21…モータ、21a…モータ駆動部、32…制御部、32a…遷移期間設定部、36…キー入力部、51…A/D変換部、52…フレーム分割部、53…フーリエ変換部、54…雑音スペクトル記憶部、55…スペクトル減算部、55a…下限値設定部、56…逆フーリエ変換部、57…波形合成部、58…入力パワー演算部、59…平滑化処理部、60…フロアリング係数制御部、61…録音レベル制御部、62…増幅器、63…制御データ記憶部、Y(ω)…入力音声のスペクトル信号、N(ω)…雑音スペクトル信号、S(ω)…雑音除去後の音声スペクトル信号。

Claims (12)

  1. 撮影時に音声信号を記録可能な撮像装置において、
    撮影操作に伴って駆動される機構部と、
    入力された音声信号をスペクトル信号に変換する変換手段と、
    予め前記機構部の駆動時に発生する音をスペクトル化した雑音スペクトル信号を記憶した記憶手段と、
    前記機構部の駆動時に前記変換手段によって得られる入力音声のスペクトル信号から前記記憶手段に記憶された雑音スペクトル信号に所定の係数を乗じた信号を減算処理すると共に、前記入力音声のスペクトル信号にフロアリング係数を乗じた値を下限値として設定し、前記減算処理により得られた値と前記下限値の大きい方を雑音除去後の音声スペクトル信号として出力するスペクトル減算手段と、
    前記機構部の駆動前に入力された音声信号のパワー値を取得するパワー取得手段と、
    このパワー取得手段によって取得された音声信号のパワー値に基づいて前記フロアリング係数を制御するフロアリング係数制御手段と
    を具備したことを特徴とする撮像装置。
  2. 前記パワー取得手段は、前記変換手段によって変換されたスペクトル信号を全周波数にわたって総和をとることにより前記音声信号のパワー値を取得することを特徴とする請求項1記載の撮像装置。
  3. 前記パワー取得手段は、前記機構部の駆動前の所定期間の間に入力された音声信号のパワー値を平均化することにより前記音声信号のパワー値を取得することを特徴とする請求項1記載の撮像装置。
  4. 前記スペクトル減算手段によって得られた雑音除去後の音声スペクトル信号を元の音声信号に逆変換する逆変換手段と、
    この逆変換手段によって得られた音声信号を撮影画像と共に記録する記録手段と
    を具備したことを特徴とする請求項1記載の撮像装置。
  5. 前記フロアリング係数制御手段は、前記音声信号のパワー値が大きいほど、前記フロアリング係数を大きくし、前記音声信号のパワー値が小さいほど、前記フロアリング係数を小さく制御することを特徴とする請求項1乃至3のいずれかに記載の撮像装置。
  6. 音声信号の録音レベルを制御する録音レベル制御手段を備え、
    前記フロアリング係数制御手段は、前記録音レベル制御手段によって設定された録音レベルが大きいほど、前記フロアリング係数を小さくし、前記録音レベルが小さいほど、前記フロアリング係数を大きく制御することを特徴とする請求項1記載の撮像装置。
  7. 前記録音レベル制御手段は、入力された音声信号のパワー値の変化に応じて音声信号の録音レベルを制御することを特徴とする請求項6記載の撮像装置。
  8. 前記機構部の駆動前後に所定の遷移期間を設定する遷移期間設定手段を備え、
    前記フロアリング係数制御手段は、前記遷移期間設定手段によって設定された前記機構部の駆動前の遷移期間では前記フロアリング係数を所定の値から前記音声信号の平均パワー値に応じた最適値に緩やかに変化させ、前記機構部の駆動後の遷移期間では前記フロアリング係数を前記最適値から前記所定の値に緩やかに変化させることを特徴とする請求項1記載の撮像装置。
  9. 前記記憶手段に記憶された雑音スペクトル信号の特定の周波数を所定の値に置き換えておくことにより、前記スペクトル減算手段は、前記雑音スペクトル信号から前記所定の値を検出した場合に出力をゼロにすることを特徴とする請求項1記載の撮像装置。
  10. 前記記憶手段に記憶された雑音スペクトル信号の特定の周波数を指定するための制御データを記憶した制御データ記憶手段を備え、
    前記スペクトル減算手段は、前記音声信号のパワーが所定の値よりも小さい場合に、前記制御データ記憶手段に記憶された制御データに基づいて、前記特定の周波数の出力をゼロにすることを特徴とする請求項1記載の撮像装置。
  11. 音声付き動画撮影を行う場合に、入力音声から撮影操作に伴って駆動部から発生する音を雑音として除去する雑音除去方法であって、
    前記入力音声をスペクトル信号に変換するステップと、
    前記スペクトル変換によって得られた入力音声スペクトル信号から、予め前記機構音をスペクトル化して得られた機構音スペクトル信号に所定の係数を乗じた信号を減算処理すると共に、前記入力音声のスペクトル信号にフロアリング係数を乗じた値を下限値として設定し、前記減算処理の結果と前記下限値の大きい方を雑音除去後の音声スペクトル信号として出力するステップと、
    前記機構部の駆動前に入力された音声信号のパワー値を取得するステップと、
    前記音声信号のパワー値に基づいて前記フロアリング係数を制御するステップと
    を備えたことを特徴とする雑音除去方法。
  12. 音声付き動画撮影を行う場合に、入力音声から撮影操作に伴って駆動部から発生する音を雑音として除去する機能を備えたコンピュータによって実行されるプログラムであって、
    前記コンピュータに、
    前記入力音声をスペクトル信号に変換する機能と、
    前記スペクトル変換によって得られた入力音声スペクトル信号から、予め前記機構音をスペクトル化して得られた機構音スペクトル信号に所定の係数を乗じた信号を減算処理すると共に、前記入力音声のスペクトル信号にフロアリング係数を乗じた値を下限値として設定し、前記減算処理の結果と前記下限値の大きい方を雑音除去後の音声スペクトル信号として出力する機能と、
    前記機構部の駆動前に入力された音声信号のパワー値を取得する機能と、
    前記音声信号のパワー値に基づいて前記フロアリング係数を制御する機能と
    を実現させることを特徴とするプログラム。
JP2007089663A 2007-03-29 2007-03-29 撮像装置、雑音除去方法及びプログラム Expired - Fee Related JP5034605B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007089663A JP5034605B2 (ja) 2007-03-29 2007-03-29 撮像装置、雑音除去方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007089663A JP5034605B2 (ja) 2007-03-29 2007-03-29 撮像装置、雑音除去方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2008252389A true JP2008252389A (ja) 2008-10-16
JP5034605B2 JP5034605B2 (ja) 2012-09-26

Family

ID=39976845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007089663A Expired - Fee Related JP5034605B2 (ja) 2007-03-29 2007-03-29 撮像装置、雑音除去方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5034605B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012113103A (ja) * 2010-11-24 2012-06-14 Renesas Electronics Corp 音声処理装置および音声処理方法並びにプログラム、音声取得装置
WO2012102130A1 (ja) * 2011-01-27 2012-08-02 株式会社ニコン 撮像装置、プログラム、記録媒体およびノイズ低減方法
JP2012155184A (ja) * 2011-01-27 2012-08-16 Nikon Corp カメラ、プログラム、記録媒体、およびノイズ除去方法
JP2012173371A (ja) * 2011-02-18 2012-09-10 Nikon Corp 撮像装置及び撮像装置のノイズ低減方法
JP2014044313A (ja) * 2012-08-27 2014-03-13 Xacti Corp 雑音低減装置
US8687090B2 (en) 2010-11-24 2014-04-01 Samsung Electronics Co., Ltd. Method of removing audio noise and image capturing apparatus including the same
JP2017204715A (ja) * 2016-05-10 2017-11-16 キヤノン株式会社 電子機器及び制御方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102569365B1 (ko) 2018-12-27 2023-08-22 삼성전자주식회사 가전기기 및 이의 음성 인식 방법

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63309097A (ja) * 1987-06-11 1988-12-16 Matsushita Electric Ind Co Ltd 収音装置
JP2000347688A (ja) * 1999-06-09 2000-12-15 Mitsubishi Electric Corp 雑音抑圧装置
JP2002204493A (ja) * 2000-10-25 2002-07-19 Matsushita Electric Ind Co Ltd ズームマイクロホン装置
JP2002366200A (ja) * 2001-06-06 2002-12-20 Mitsubishi Electric Corp 雑音抑圧装置
JP2003223186A (ja) * 2002-01-29 2003-08-08 Toyota Central Res & Dev Lab Inc 音声認識方法及び音声認識装置
JP2004020945A (ja) * 2002-06-17 2004-01-22 Nec Corp 音声認識装置、音声認識方法、および、音声認識プログラム
JP2005165221A (ja) * 2003-12-05 2005-06-23 Canon Inc 雑音抑圧装置および方法、ならびに音声認識装置
JP2005195895A (ja) * 2004-01-07 2005-07-21 Denso Corp 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
JP2005257817A (ja) * 2004-03-09 2005-09-22 Internatl Business Mach Corp <Ibm> 雑音除去装置、方法、及びプログラム
JP2006279185A (ja) * 2005-03-28 2006-10-12 Casio Comput Co Ltd 撮像装置、音声記録方法及びプログラム
JP2006287387A (ja) * 2005-03-31 2006-10-19 Casio Comput Co Ltd 撮像装置、音声記録方法及びプログラム
JP2007079389A (ja) * 2005-09-16 2007-03-29 Yamaha Motor Co Ltd 音声分析方法および音声分析装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63309097A (ja) * 1987-06-11 1988-12-16 Matsushita Electric Ind Co Ltd 収音装置
JP2000347688A (ja) * 1999-06-09 2000-12-15 Mitsubishi Electric Corp 雑音抑圧装置
JP2002204493A (ja) * 2000-10-25 2002-07-19 Matsushita Electric Ind Co Ltd ズームマイクロホン装置
JP2002366200A (ja) * 2001-06-06 2002-12-20 Mitsubishi Electric Corp 雑音抑圧装置
JP2003223186A (ja) * 2002-01-29 2003-08-08 Toyota Central Res & Dev Lab Inc 音声認識方法及び音声認識装置
JP2004020945A (ja) * 2002-06-17 2004-01-22 Nec Corp 音声認識装置、音声認識方法、および、音声認識プログラム
JP2005165221A (ja) * 2003-12-05 2005-06-23 Canon Inc 雑音抑圧装置および方法、ならびに音声認識装置
JP2005195895A (ja) * 2004-01-07 2005-07-21 Denso Corp 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
JP2005257817A (ja) * 2004-03-09 2005-09-22 Internatl Business Mach Corp <Ibm> 雑音除去装置、方法、及びプログラム
JP2006279185A (ja) * 2005-03-28 2006-10-12 Casio Comput Co Ltd 撮像装置、音声記録方法及びプログラム
JP2006287387A (ja) * 2005-03-31 2006-10-19 Casio Comput Co Ltd 撮像装置、音声記録方法及びプログラム
JP2007079389A (ja) * 2005-09-16 2007-03-29 Yamaha Motor Co Ltd 音声分析方法および音声分析装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012113103A (ja) * 2010-11-24 2012-06-14 Renesas Electronics Corp 音声処理装置および音声処理方法並びにプログラム、音声取得装置
US8687090B2 (en) 2010-11-24 2014-04-01 Samsung Electronics Co., Ltd. Method of removing audio noise and image capturing apparatus including the same
WO2012102130A1 (ja) * 2011-01-27 2012-08-02 株式会社ニコン 撮像装置、プログラム、記録媒体およびノイズ低減方法
JP2012155184A (ja) * 2011-01-27 2012-08-16 Nikon Corp カメラ、プログラム、記録媒体、およびノイズ除去方法
US9153243B2 (en) 2011-01-27 2015-10-06 Nikon Corporation Imaging device, program, memory medium, and noise reduction method
JP2012173371A (ja) * 2011-02-18 2012-09-10 Nikon Corp 撮像装置及び撮像装置のノイズ低減方法
JP2014044313A (ja) * 2012-08-27 2014-03-13 Xacti Corp 雑音低減装置
JP2017204715A (ja) * 2016-05-10 2017-11-16 キヤノン株式会社 電子機器及び制御方法

Also Published As

Publication number Publication date
JP5034605B2 (ja) 2012-09-26

Similar Documents

Publication Publication Date Title
JP4639907B2 (ja) 撮像装置、音声記録方法及びプログラム
JP2006279185A (ja) 撮像装置、音声記録方法及びプログラム
JP4466261B2 (ja) 撮像装置、明るさ補正方法及びプログラム
JP5034605B2 (ja) 撮像装置、雑音除去方法及びプログラム
JP4569389B2 (ja) 撮像装置、画像処理方法及びプログラム
KR101595254B1 (ko) 화이트 밸런스 조정 방법, 상기 방법을 기록한 기록 매체, 화이트 밸런스 조정 장치
JP4639965B2 (ja) 撮像装置、画像処理方法及びプログラム
JP4639902B2 (ja) 撮像装置、音声記録方法及びプログラム
JP4375325B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4475165B2 (ja) 撮像装置、露出制御方法及びプログラム
JP2008252595A (ja) 撮像装置及びそのコンピュータプログラム
US20090040339A1 (en) Digital signal processor and digital image processing apparatus adopting the same
JP2004222236A (ja) 撮像装置、画像編集方法及びプログラム
JP2006352229A (ja) デジタルカメラ
JP4525459B2 (ja) 動画処理装置、動画処理方法及びプログラム
JP2004328034A (ja) 撮像装置、動画ファイルの記録制御方法及びプログラム
JP4337758B2 (ja) 撮像装置、動画撮影時の静止画表示方法、及びプログラム
US9013599B2 (en) Image pick-up and audio signal processing apparatus and method for controlling an image pick-up and audio signal processing apparatus
JP2010021710A (ja) 撮像装置、画像処理装置およびプログラム
JP4366485B2 (ja) 撮像装置、画像処理方法及びプログラム
JP2009033385A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び撮像装置
JP2005072729A (ja) 電子カメラ及び画像撮影方法
JP4177081B2 (ja) 画像再生装置および方法
JP2006094200A (ja) 撮像装置、合焦表示方法及びプログラム
JP2018023033A (ja) 画像データ生成装置、画像データ再生装置、および画像データ編集装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120321

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120516

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120618

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5034605

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees