JP2006279185A - 撮像装置、音声記録方法及びプログラム - Google Patents

撮像装置、音声記録方法及びプログラム Download PDF

Info

Publication number
JP2006279185A
JP2006279185A JP2005091142A JP2005091142A JP2006279185A JP 2006279185 A JP2006279185 A JP 2006279185A JP 2005091142 A JP2005091142 A JP 2005091142A JP 2005091142 A JP2005091142 A JP 2005091142A JP 2006279185 A JP2006279185 A JP 2006279185A
Authority
JP
Japan
Prior art keywords
sound
motor
signal
spectrum
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005091142A
Other languages
English (en)
Inventor
Takao Sugaya
孝夫 菅家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2005091142A priority Critical patent/JP2006279185A/ja
Publication of JP2006279185A publication Critical patent/JP2006279185A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】撮影中に入力された音声信号に含まれる機構音を雑音として適切に除去して記録する。
【解決手段】予め撮影動作に伴ってモータ21から発生するモータ音(機構音)をスペクトル化した信号をモータ音スペクトル記憶部54に記憶しておく。撮影中にモータ21が駆動された場合に、その駆動期間中のみサブトラクト部55を有効とし、入力音声スペクトル信号からモータ音スペクトル記憶部54に記憶されたモータ音スペクトル信号に所定の係数を乗じた信号を減算することで雑音成分を除去した後、逆フーリエ変換部57および波形合成部58を通じて元の音声信号に戻して撮影画像と共にメモリに記録する。
【選択図】図3

Description

本発明は、デジタルカメラ等の撮像装置に係り、特に撮影中に入力された音声信号を撮影画像と共に記録可能な機能を備えた撮像装置と、この撮像装置に用いられる音声記録方法及びプログラムに関する。
従来から音声信号に重畳した雑音を除去するための手法として、スペクトルサブトラクション(spectral subtraction)法が知られている。このスペクトルサブトラクション法(以下、SS法と呼ぶ)とは、無音区間におけるスペクトルを雑音スペクトルと推定し、その雑音スペクトルに所定の係数(サブトラクト係数)を乗じた信号を入力音声スペクトルから差し引くことで雑音成分を除去する方法である。
ここで、特許文献1では、前記SS法を用いた雑音除去システムにおいて、サブトラクト係数を音声信号のフレームパワーに依存してフレーム毎に変化させることにより、推定雑音スペクトルの引き過ぎによるスペクトル歪を減少させることが開示されている。すなわち、母音のような音声パワーが確保されている区間は通常のサブトラクト係数を掛け、破裂子音のような音声パワーの少ない部分ではサブトラクト係数を小さくすることにより、推定雑音スペクトルの引き過ぎによる入力音声スペクトルの歪を抑えるようにしている。
また、特許文献2では、雑音スペクトルを無音区間のスペクトルでは無く、別途設けた参照入力部から入力されたスペクトルから雑音スペクトルを推定する方式を提案している。
特開平8−221092号公報 特開平5−165492号公報
上述したように、SS法を用いて入力音声から雑音成分を除去する方法が知られている。しかしながら、音声付きの動画撮影機能を備えたデジタルカメラでは、その撮影中に音声入力とは無関係にズーム音やフォーカス音などの機構音が発生して入力音声に入り込む問題がある。
この場合、前記特許文献1のように、無音区間の音声スペクトル信号から雑音スペクトルを推定する方法では、音声入力とは無関係に発生する機構音を雑音として除去することはできない。
また、前記特許文献2のように、参照入力部を新たに設ける構成では、その分のコストが上がり、また参照入力部用の実装スペースが必要となるために、カメラ機器の外形寸法に影響を及ぼすなどの問題がある。
本発明は前記のような点に鑑みなされたもので、撮影中に入力された音声信号に含まれる機構音を雑音として適切に除去して記録することのできる撮像装置、音声記録方法及びプログラムを提供することを目的とする。
本発明の請求項1に係る撮像装置は、音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録機能を備えた撮像装置であって、前記入力音声信号をスペクトル信号に変換する変換手段と、予め前記機構音をスペクトル化して得られた機構音スペクトル信号を記憶した記憶手段と、撮影中に前記機構音の発生タイミングに基づいて、前記変換手段によって得られた入力音声スペクトル信号から前記記憶手段に記憶された機構音スペクトル信号に所定の係数を乗じた信号を減算することで雑音成分を除去する雑音除去手段と、この雑音除去手段によって得られた雑音除去後の音声スペクトル信号を元の音声信号に逆変換する逆変換手段と、この逆変換手段によって得られた音声信号を撮影画像と共に記録する記録手段とを具備したことを特徴とする。
このような構成によれば、予め撮影動作に伴って発生する機構音をスペクトル化した信号を記憶手段に記憶しておき、撮影中にその機構音の発生タイミングに基づいて、入力音声スペクトル信号から前記記憶手段に記憶された機構音スペクトル信号に所定の係数を乗じた信号を減算することで雑音成分を除去することで、撮影中に入力された音声信号に含まれる機構音を雑音として適切に除去して記録することができる。
また、本発明の請求項2は、前記請求項1記載の撮像装置において、前記変換手段によって得られた入力音声スペクトル信号と前記雑音除去手段によって得られた雑音除去後の音声スペクトル信号とを混合し、そのときの混合比を前記機構音の発生期間に応じて徐々に変える混合手段を備え、前記逆変換手段は、この混合手段によって混合処理された音声スペクトル信号を元の音声信号に逆変換することを特徴とする。
このような構成によれば、入力音声スペクトル信号と雑音除去後の音声スペクトル信号との混合比を機構音の発生期間に応じて徐々に変えることで、撮影時に入力音声に入り込む機構音を雑音としてより適切に除去することができると共に、スペクトルの急激な変化に依存する音質変化を防ぐことができる。
また、本発明の請求項3は、前記請求項2記載の撮像装置において、前記機構音は、撮影動作に関連した特定のモータの駆動音を含み、前記混合手段は、前記雑音除去後の音声スペクトル信号の比率を前記モータの駆動開始時に最低値から徐々に上げて所定時間後に最高値とすると共に、前記モータの駆動停止時に最高値から徐々に下げて所定時間後に最低値とするように混合比を変えることを特徴とする。
このような構成によれば、前記機構音として、撮影動作に関連した特定のモータの駆動音を含む場合において、前記雑音除去後の音声スペクトル信号の比率を前記モータの駆動開始時に最低値から徐々に上げて所定時間後に最高値とすると共に、前記モータの駆動停止時に最高値から徐々に下げて所定時間後に最低値とするように混合比を変えるようにしたことで、撮影時に入力音声から当該モータ音を雑音として適切に除去することができる。
また、本発明の請求項4は、前記請求項1記載の撮像装置において、前記機構音スペクトル信号に乗じる係数の値を前記機構音の発生期間に応じて徐々に変える係数可変手段を備えことを特徴とする。
このような構成によれば、機構音スペクトル信号に乗じる係数の値を機構音の発生期間に応じて徐々に変えることで、撮影時に入力音声に入り込む機構音を雑音としてより適切に除去することができると共に、スペクトルの急激な変化に依存する音質変化を防ぐことができる。
また、本発明の請求項5は、前記請求項4記載の撮像装置において、前記機構音は、撮影動作に関連した特定のモータの駆動音を含み、前記係数可変手段は、前記機構音スペクトル信号に乗じる係数を前記モータの駆動開始時に最低値から徐々に上げて所定時間後に最高値とすると共に、前記モータの駆動停止時に最高値から徐々に下げて所定時間後に最低値とするように変えることを特徴とする。
このような構成によれば、前記機構音として、撮影動作に関連した特定のモータの駆動音を含む場合において、前記機構音スペクトル信号に乗じる係数を前記モータの駆動開始時に最低値から徐々に上げて所定時間後に最高値とすると共に、前記モータの駆動停止時に最高値から徐々に下げて所定時間後に最低値とするように変えるようにしたことで、撮影時に入力音声から当該モータ音を雑音として適切に除去することができる。
また、本発明の請求項6は、前記請求項1記載の撮像装置において、前記機構音は、撮影動作に関連した特定のモータの駆動音を含み、前記記憶手段は、前記モータの駆動開始から停止までの各期間に応じて設定された複数のレベルの異なる機構音スペクトル信号を記憶し、前記雑音除去手段は、前記モータの各期間に基づいて前記記憶手段に記憶された各機構音スペクトル信号を選択的に使用して雑音除去処理を行うことを特徴とする。
このような構成によれば、前記機構音として、撮影動作に関連した特定のモータの駆動音を含む場合において、前記記憶手段に前記モータの駆動開始から停止までの各期間に応じて設定された複数のレベルの異なる機構音スペクトル信号を記憶しておき、前記モータの各期間に基づいて前記記憶手段に記憶された各機構音スペクトル信号を選択的に使用して雑音除去処理を行うようにしたことで、撮影時に入力音声から当該モータ音を雑音としてより適切に除去することができる。
また、本発明の請求項7は、前記請求項1記載の撮像装置において、前記機構音は、撮影動作に関連した特定のモータの駆動音を含み、前記記憶手段は、前記モータの回転数に応じて設定された複数のレベルの異なる機構音スペクトル信号を記憶し、前記雑音除去手段は、前記モータの回転数に基づいて前記記憶手段に記憶された各機構音スペクトル信号を選択的に使用して雑音除去処理を行うことを特徴とする。
このような構成によれば、前記機構音として、撮影動作に関連した特定のモータの駆動音を含む場合において、前記記憶手段に前記モータの回転数に応じて設定された複数のレベルの異なる機構音スペクトル信号を記憶しておき、前記モータの回転数に基づいて前記記憶手段に記憶された各機構音スペクトル信号を選択的に使用して雑音除去処理を行うようにしたことで、撮影時に入力音声から当該モータ音を雑音としてより適切に除去することができる。
また、本発明の請求項8は、前記請求項3乃至7のいずれか1つに記載の撮像装置において、前記特定のモータとは、ズーム倍率調整用のモータまたはフォーカス調整用のモータのであることを特徴とする。
このような構成によれば、撮影中にズーム倍率調整用のモータまたはフォーカス調整用のモータが駆動された場合に、そのモータ音を入力音声から適切に除去して記録することができる。
本発明の請求項9に係る音声記録方法は、音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録方法であって、前記入力音声信号をスペクトル信号に変換するステップと、撮影中に前記機構音の発生タイミングに基づいて、前記スペクトル変換によって得られた入力音声スペクトル信号から、予め前記機構音をスペクトル化して得られた機構音スペクトル信号に所定の係数を乗じた信号を減算することで雑音成分を除去するステップと、この雑音除去後の音声スペクトル信号を元の音声信号に逆変換するステップと、この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録するステップとを備えたことを特徴とする。
このような音声記録方法によれば、前記各ステップに従った処理を実行することにより、前記請求項1記載の発明と同様の作用効果が奏せられる。
本発明の請求項10に係るプログラムは、音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する機能を備えたコンピュータによって実行されるプログラムであって、前記コンピュータに、前記入力音声信号をスペクトル信号に変換する機能と、撮影中に前記機構音の発生タイミングに基づいて、前記スペクトル変換によって得られた入力音声スペクトル信号から、予め前記機構音をスペクトル化して得られた機構音スペクトル信号に所定の係数を乗じた信号を減算することで雑音成分を除去する機能と、この雑音除去後の音声スペクトル信号を元の音声信号に逆変換する機能と、この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録する機能とを実現させることを特徴とする。
したがって、コンピュータが前記各機能を実現するためのプログラムを実行することにより、前記請求項1記載の発明と同様の作用効果が奏せられる。
本発明によれば、音声付き動画撮影を行う場合において、その撮影中に撮影動作に伴って発生する機構音の発生タイミングに基づいて雑音除去処理を行うようにしたことで、撮影中に入力された音声信号に含まれる機構音を雑音として適切に除去して記録することができる。
以下、図面を参照して本発明の実施形態を説明する。
(第1の実施形態)
図1は本発明の撮像装置としてデジタルカメラを例にした場合の外観構成を示す図であり、図1(a)は主に前面の構成、同図(b)は主に背面の構成を示す斜視図である。
このデジタルカメラ1は、略矩形の薄板状ボディ2の前面に、撮影レンズ3、セルフタイマランプ4、光学ファインダ窓5、ストロボ発光部6、マイクロホン部7などを有し、上面の(ユーザにとって)右端側には電源キー8及びシャッタキー9などが設けられている。
電源キー8は、電源のオン/オフ毎に操作するキーであり、シャッタキー9は、撮影時に撮影タイミングを指示するキーである。
また、デジタルカメラ1の背面には、撮影モード(R)キー10、再生モード(P)キー11、光学ファインダ12、スピーカ部13、マクロキー14、ストロボキー15、メニュー(MENU)キー16、リングキー17、セット(SET)キー18、表示部19などが設けられている。
撮影モードキー10は、電源オフの状態から操作することで自動的に電源オンとして静止画の撮影モードに移行する一方で、電源オンの状態から繰返し操作することで、静止画モード、動画モードを循環的に設定する。静止画モードは、静止画を撮影するためのモードである。また、動画モードは、動画を撮影するためのモードであり、特に本実施形態では音声付き動画撮影が可能であるとする。
前記シャッタキー9は、これらの撮影モードに共通に使用される。すなわち、静止画モードでは、シャッタキー9が押下されたときのタイミングで静止画の撮影が行われる。動画モードでは、シャッタキー9が押下されたときのタイミングで動画の撮影が開始され、シャッタキー9が再度押下されたときにその動画の撮影が終了する。
再生モードキー11は、電源オフの状態から操作することで自動的に電源オンとして再生モードに移行する。
マクロキー14は、静止画の撮影モードで通常撮影とマクロ撮影とを切換える際に操作する。ストロボキー15は、ストロボ発光部6の発光モードを切換える際に操作する。メニューキー16は、各種メニュー項目等を選択する際に操作する。リングキー17は、上下左右各方向への項目選択用のキーが一体に形成されたものであり、このリングキー17の中央に位置するセットキー18は、その時点で選択されている項目を設定する際に操作する。
表示部19は、バックライト付きのカラー液晶パネルで構成されるもので、撮影モード時には電子ファインダとしてスルー画像のモニタ表示を行う一方で、再生モード時には選択した画像等を再生表示する。
また、このデジタルカメラ1には、光学ズーム機能が備えられており、ズームキー20a,20bの操作により焦点距離を物理的に変化させて画像の拡大率を変更することができる。ズームキー20a,20bのうち、一方のズームキー20aはテレ端用であり、望遠側へズーム倍率を変更する場合に用いられる。他方のズームキー20bはワイド端用であり、広角側へズーム倍率を変更する場合に用いられる。
なお、図示はしないがデジタルカメラ1の底面には、記録媒体として用いられるメモリカードを着脱するためのメモリカードスロットや、外部のパーソナルコンピュータ等と接続するためのシリアルインタフェースコネクタとして、例えばUSB(Universal Serial Bus)コネクタ等が設けられている。
図2はデジタルカメラ1の電子回路構成を示すブロック図である。
このデジタルカメラ1には、前記撮影レンズ3を構成する図示せぬフォーカスレンズおよびズームレンズなどを含むレンズ光学系22が光軸方向に所定の範囲内で移動可能に設けられている。このレンズ光学系22は、モータ駆動部21aによって回転駆動されるモータ21により移動する。
なお、前記モータ21として、ズーム倍率調整用のモータ(ズームモータ)、フォーカス調整用のモータ(フォーカスモータ)などの複数の異なるモータを含み、それぞれに対応したモータ駆動部21aが設けられているものとする。
このモータ21の光軸後方に撮像素子であるCCD(charge coupled device)23が配設されている。このCCD23は、撮影レンズ3を通して入力される被写体の各部位からの光を受光し、その光の強度に応じた電気信号を出力する。
基本モードである記録モード時において、CCD23がタイミング発生器(TG)24、ドライバ25によって走査駆動され、一定周期毎に結像した光像に対応する光電変換出力を1画面分出力する。このCCD23の光電変換出力は、アナログ値の信号の状態でRGBの各原色成分毎に適宜ゲイン調整された後に、サンプルホールド回路26でサンプルホールドされ、A/D変換器27でデジタルデータに変換される。
そして、画像処理回路28において、画素補間処理及びγ補正処理を含む画像処理が行われて、デジタル値の輝度信号Y及び色差信号U,V(Cb,Cr)が生成され、DMA(Direct Memory Access)コントローラ29に出力される。
DMAコントローラ29は、画像処理回路28の出力する輝度信号Y及び色差信号U,Vを、同じく画像処理回路28からの複合同期信号、メモリ書込みイネーブル信号、及びクロック信号を用いて一度DMAコントローラ29内部のバッファに書き込み、DRAMインタフェース(I/F)30を介してバッファメモリとして使用されるDRAM31にDMA転送を行う。
制御部32は、デジタルカメラ1全体の制御を行うものであり、CPUと、このCPUで実行される動作プログラムを記憶したROM、及びワークメモリとして使用されるRAMなどを含むマイクロコンピュータにより構成される。この制御部32は、前記輝度及び色差信号のDRAM31へのDMA転送終了後に、この輝度及び色差信号をDRAMインタフェース30を介してDRAM31より読み出し、VRAMコントローラ33を介してVRAM34に書き込む。
デジタルビデオエンコーダ35は、前記輝度及び色差信号をVRAMコントローラ33を介してVRAM34より定期的に読み出し、これらのデータを元にビデオ信号を発生して表示部19に出力する。
この表示部19は、上述した如く撮影時にはモニタ表示部(電子ファインダ)として機能するもので、デジタルビデオエンコーダ35からのビデオ信号に基づいた表示を行うことで、その時点でVRAMコントローラ33から取込んでいる画像情報に基づく画像をリアルタイムに表示することとなる。
このように、表示部19にその時点での画像がモニタ画像としてリアルタイムに表示されている状態で、例えば静止画撮影を行いたいタイミングでシャッタキー9を押下操作すると、トリガ信号が発生する。
制御部32は、このトリガ信号に応じて、その時点でCCD23から取込んでいる1画面分の輝度及び色差信号のDRAM31へのDMA転送の終了後、直ちにCCD23からのDRAM31への経路を停止し、記録保存の状態に遷移する。
この記録保存の状態では、制御部32がDRAM31に書き込まれている1フレーム分の輝度及び色差信号をDRAMインタフェース30を介してY,Cb,Crの各コンポーネント毎に縦8画素×横8画素の基本ブロックと呼称される単位で読み出して、JPEG(Joint Photograph coding Experts Group)回路37に書き込み、このJPEG回路37でADCT(Adaptive Discrete Cosine Transform:適応離散コサイン変換)、エントロピ符号化方式であるハフマン符号化等の処理によりデータ圧縮する。
そして得た符号データを1画像のデータファイルとして該JPEG回路37から読み出して記録用のメモリ38に書き込む。このメモリ38としては、予め本体に内蔵されたフラッシュメモリ等の内部メモリの他に、記録媒体として着脱自在に装着されるメモリカードなどを含む。1フレーム分の輝度及び色差信号の圧縮処理及びメモリ38への全圧縮データの書込み終了に伴って、制御部32はCCD23からDRAM31への経路を再び起動する。
制御部32には、さらに音声処理部39、USBインタフェース(I/F)40、ストロボ駆動部41が接続される。
音声処理部39は、PCM音源等の音源回路を備え、音声の録音時には前記マイクロホン部(MIC)7より入力された音声信号をデジタル化し、所定のデータファイル形式、例えばMP3(MPEG−1 audio layer 3)規格に従ってデータ圧縮して音声データファイルを作成してメモリ38へ送出する一方、音声の再生時にはメモリ38から読み出された音声データファイルの圧縮を解いてアナログ化し、上述したデジタルカメラ1の背面側に設けられるスピーカ部(SP)13を通じて出力する。
USBインタフェース40は、USBコネクタを介して有線接続されるパーソナルコンピュータ等の他の情報端末装置との間で画像データ、その他の送受を行う場合の通信制御を行う。ストロボ駆動部41は、撮影時に図示せぬストロボ用の大容量コンデンサを充電した上で、制御部32からの制御に基づいてストロボ発光部6を閃光駆動する。
なお、前記キー入力部36は、上述したシャッタキー9の他に、電源キー8、撮影モードキー10、再生モードキー11、マクロキー14、ストロボキー15、メニューキー16、リングキー17、セットキー18、ズームキー20a,20bなどから構成され、それらのキー操作に伴う信号は直接制御部32へ送出される。
また、静止画像ではなく動画像の撮影時においては、シャッタキー9が押下操作されたときに、上述したJPEG回路37によりmotion−JPEG(Joint Photographic Experts Group)などの手法により撮影動画をデータ圧縮してメモリ38へ記録する。この場合、音声付き動画撮影であれば、その撮影中にマイクロホン部(MIC)7より入力された音声信号が動画データと共に前記メモリ38に記録されることになる。再度シャッタキー9が操作されると、動画データの記録を終了する。
一方、基本モードである再生モード時には、制御部32がメモリ38に記録されている画像データを選択的に読み出し、JPEG回路37で記録モード時にデータ圧縮した手順と全く逆の手順で、圧縮されている画像データを伸長する。そして、この伸長した画像データをDRAMインタフェース30を介してDRAM31に保持させた上で、このDRAM31の保持内容をVRAMコントローラ33を介してVRAM34に記憶させ、このVRAM34より定期的に画像データを読み出してビデオ信号を発生し、表示部19で再生出力させる。
選択した画像データが静止画像ではなく動画像であった場合には、その動画データを構成する複数フレームの静止画データを時系列の順で順次再生して表示し、すべての静止画データの再生を終了した時点で、例えば、次に再生の指示がなされるまで先頭に位置する静止画データを表示するなどを行う。その際、当該動画データに音声データが含まれていれば、その音声データがスピーカ部(SP)13を通じて出力されることになる。
次に、このデジタルカメラ1に用いられる雑音除去機能を備えた音声記録装置について説明する。
図3は本発明の第1の実施形態に係るデジタルカメラ1に用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。
この音声記録装置は、主としてデジタルカメラ1の音声付き動画撮影に用いられるものであり、その撮影中に音声信号に混入するズーム音やフォーカス音などの機構音を雑音として除去する機能を備えている。
第1の実施形態において、この音声記録装置は、モータ21、モータ駆動部21a、制御部32、キー入力部36、音声入力部51、フレーム分割部52、フーリエ変換部53、モータ音スペクトル記憶部54、サブトラクト部55、スペクトル切り替え部56、逆フーリエ変換部57、波形合成部58を備える。なお、前記各構成部のうち、51〜58の部分は図2に示したデジタルカメラ1の音声処理部39に含まれる。
モータ21はズームレンズなどのレンズ光学系22を光軸方向に移動させるためのモータであり、モータ駆動部21aはそのモータ21を回転駆動させるための駆動機構である。
制御部32は、キー入力部36に含まれるズームキー20a,20bなどの操作信号を受けてモータ駆動制御信号をモータ駆動部21aに出力すると共に、ここでは、音声付き動画撮影中にモータ21の駆動タイミングに基づいてスペクトル切り換え部56を制御する機能を備える。
一方、音声入力部51は、図1に示すマイクロホン部7を通じて入力される音声信号Saを所定のゲインで増幅してフレーム分割部52に与える。この場合、音声付き動画撮影中に例えばズーム操作が行われると、そのズーム操作に伴って発生するモータ音(ズーム音)が音声入力部51を通じて音声信号Saと共に入り込むことになる。
フレーム分割部52は、この音声入力部51によって入力された音声信号Saを所定時間分のフレーム単位で分割する。フーリエ変換部53は、このフレーム分割部52によってフレーム単位で分割された音声信号Saをフーリエ変換し、周波数毎のパワーを示した入力音声スペクトル信号Sbに変換する。
モータ音スペクトル記憶部54には、予め雑音除去対象となるモータ音をスペクトル化したモータ音スペクトル信号Scが雑音スペクトルとして記憶されている。サブトラクト部55は、フーリエ変換部53によって得られた入力音声スペクトル信号Sbとモータ音スペクトル記憶部54に記憶されたモータ音スペクトル信号Scに基づいて、SS(spectral subtraction)法による雑音除去処理を行う。
詳しくは、入力音声スペクトル信号Sbから雑音スペクトルとして予め記憶されたモータ音スペクトル信号Scに所定のサブトラクト係数αを乗じた信号を減算することで、入力音声に含まれる雑音成分を除去する処理を行う。このサブトラクト部55による雑音除去後の音声スペクトル信号をSdとする。スペクトル切り替え部56は、フーリエ変換部53によって得られた入力音声スペクトル信号Sbと、このサブトラクト部55によって得られる雑音除去後の音声スペクトル信号Sdを制御部32から出力される選択信号によって切り替えて逆フーリエ変換部57に与える。
逆フーリエ変換部57は、スペクトル切り替え部56を通じて入力された入力音声スペクトル信号Sbまたは雑音除去後の音声スペクトル信号Sdを逆フーリエ変換して元のフレーム単位毎の音声信号Seに戻す。
波形合成部58は、この逆フーリエ変換部57によって得られるフレーム単位毎の音声信号Seを合成することで時系的に連続した音声信号Sfに復元する。この音声信号Sfは、最終的な記録用の音声信号として用いられ、デジタルカメラ1の撮像系から得られる動画データと共に図2に示したメモリ38に記録される。
次に、第1の実施形態の動作について説明する。
今、音声付き動画撮影を行っている最中に、例えばユーザがキー入力部36に含まれるズームキー20a,20bを操作したとする。
デジタルカメラ全体の動作を制御する制御部32は、キー入力部36に含まれるズームキー20a,20bのズーム操作信号を入力すると、モータ駆動部21aに対して駆動開始信号を送る。モータ駆動部21aは、この駆動開始信号を受けてモータ21を回転駆動する。このモータ21の回転に伴い、図2のレンズ光学系22に含まれる図示せぬズームレンズが光軸上に移動してズーム倍率が変化する。
また、ユーザがズーム操作を終了すると、制御部32はモータ駆動部21aに対して駆動停止信号を送る。これにより、モータ21の回転駆動が停止し、ズーム動作が終了する。
ここで、音声付き動画の撮影中は常にマイクロホン部7による音声入力機能がON状態にある。このため、前記ズーム操作に伴って発生するモータ音が入力音声の中に雑音として混入する問題がある。このようなモータ音を音声信号から除去して記録するべく、以下のような処理が行われる。
すなわち、まず、雑音除去対象となるモータ音(機構音)のスペクトル信号を事前に採取しておき、モータ音スペクトル記憶部54に記憶しておく。以下では、ズーム操作時に発生するモータ音つまりズーム音を雑音除去対象として説明する。
ズーム音の採取方法は、無音状態でズーム操作を行い、そのときに発生するズーム音のみを音声入力部51に入力することで行う。この入力したズーム音をデジタル信号に変換した後、フレーム分割部52により数10ms程度のフレーム区間に切り出し、フーリエ変換部53によりスペクトル信号に変換する。これをモータ駆動期間(ズームモータの駆動開始から駆動停止までの期間)について行い、その間にフレーム単位で順次得られるスペクトル信号の平均値をモータ音スペクトル信号Scとしてモータ音スペクトル記憶部54に記憶しておく。
ここで、ズーム操作が行われていない状態では、制御部32はフーリエ変換部53から得られる入力音声スペクトル信号Sbを選択するようにスペクトル切り替え部56を切り替え制御する。これにより、逆フーリエ変換部57および波形合成部58を通じて入力音声信号がそのまま出力されることになる。
一方、制御部32はキー入力部36からのズーム操作信号に基づいてズーム操作が開始されたことを判断すると、モータ21(ここではズームモータ)の駆動開始と同時にサブトラクト部55から得られる音声スペクトル信号Sdを選択するようにスペクトル切り替え部56を切り替え制御する。
上述したように、ズーム操作を行っているとき、音声入力部51には音声信号に加えて、そのときに発生するモータ音が雑音として入力されている。このため、フーリエ変換部53からは入力音声のスペクトルとモータ音のスペクトルが混合した入力音声スペクトル信号Sbが出力される。
サブトラクト部55では、このモータ音を含んだ入力音声スペクトル信号Sbと、前記モータ音スペクトル記憶部54に予め記憶されたモータ音スペクトル信号Scとに基づいてSS法による雑音除去処理を行う。
この雑音除去処理について、図4を参照して詳しく説明する。
図4はSS法(スペクトルサブトラクション法)を用いた雑音除去処理を説明するための図である。図4(a)は入力音声の波形データ、同図(b)はこの入力音声をフレーム単位でフーリエ変換して得られた音声スペクトル信号である。また、同図(c)は雑音除去対象となるモータ音のスペクトル信号(雑音スペクトル)、同図(d)はそのモータ音スペクトル信号に所定のサブトラクト係数αを乗じた信号である。同図(e)は音声スペクトル信号から係数乗算後のモータ音スペクトル信号を減算して得られるスペクトル信号つまり雑音除去後の音声スペクトル信号である。同図(f)はその雑音除去後の音声スペクトル信号を逆フーリエ変換して得られた音声信号、同図(g)はフレーム単位で分割された音声信号を時系列に合成して元の音声波形に戻した状態を示している。
今、図4(a)に示すような波形を有する音声信号Saが音声入力部51に入力されたとする。この音声信号Saには、例えばズーム操作に伴って発生するモータ音つまりズーム音が雑音として混入されている。
まず、フレーム分割部52において、例えば10ms程度のフレーム区間で音声信号Saを切り出し、同図(b)に示すように、フーリエ変換部53にて周波数毎のパワーを表した入力音声スペクトル信号Sbを生成する。
ここで、同図(c)に示すように、モータ音スペクトル記憶部54には予めモータ音スペクトル信号Scが雑音スペクトルとして記憶されている。そこで、同図(c)〜(e)に示すように、サブトラクト部55において、入力音声スペクトル信号Sbからモータ音スペクトル信号Scに所定のサブトラクト係数αを乗じた信号を減算することにより、雑音除去後の音声スペクトル信号Sdを得る。
なお、前記サブトラクト係数αは、モータ音スペクトル記憶部54に記憶されたモータ音スペクトル信号Scのレベルに応じて予め決められており、通常、“1”以上の値である。
制御部32では、ズーム操作が行われている間、つまり、ズームモータであるモータ21の駆動期間中(モータ駆動開始〜駆動停止までの期間)において、前記サブトラクト部55から得られる雑音除去後の音声スペクトル信号Sdを選択するようにスペクトル切り替え部56を制御する。
図4(f)に示すように、この雑音除去後の音声スペクトル信号Sdは逆フーリエ変換部57にて逆フーリエ変換される。そして、同図(g)に示すように、波形合成部58にて各フレーム毎の音声信号Seが時系列に合成処理されて、元のアナログ波形信号である音声信号Sfに復元される。この音声信号Sfは、雑音除去後の音声信号として動画撮影中に画像データと共にメモリ38に記録される。
なお、前記のような雑音除去処理において、実際にはフレーム分割部52にて音声信号Saをフレーム分割してフーリエ変換する前に、音声信号Saに「ハニング窓」等の窓関数をかけておく。また、後段の波形合成部58で逆フーリエ変換後の音声信号Seをフレーム毎に合成処理する際にフレーム境界で不連続な波形になるのを防止するために、フレーム毎の音声信号Seを多少オーバーラップして合成していく。
例えば、フレーム長が256サンプルとして分析ポイントを128サンプルずつシフトしていく。この場合のハニング窓は式(1)のように表せる。
w(n)=0.5−cos{2*PI*n/(L−1)} …(1)
L:1フレームのサンプル数
n=0,1,…,L−1
このように、各信号を1/2フレームずらして重ね合わせると、振幅が一定で不連続点のない音声波形を得ることができる。
以上のように、本発明の第1の実施形態によれば、予め雑音除去対象となるモータ音のスペクトル信号Scをモータ音スペクトル記憶部54に記憶しておき、そのモータ音スペクトル信号Scを用いて雑音除去処理(サブトラクト処理)を行うようにしたことで、音声付き動画撮影を行う場合において、その撮影中に音声入力とは関係なく入り込むモータ音を当該音声信号から雑音として適切に除去して撮影画像と共に高品質に記録することができる。
また、この雑音除去処理はモータ21の駆動期間中のみ実施される。したがって、モータ21が非駆動状態のときに雑音スペクトルの引き過ぎにより音声信号の品質を下げてしまうこともない。
さらに、モータ音スペクトル信号Scを記憶しておくためのモータ音スペクトル記憶部54は、カメラ機器に予め備えられている記憶装置を利用することができるため、新たな部品の追加なしに実現でき、また、カメラ機器の外形寸法が変更されることもない。
図5は第1の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。なお、このフローチャートで示される処理は、コンピュータである制御部32によって読取り可能なプログラムの形態でROM等の記録媒体に予め記録されているものとする。
制御部32は、まず、初期設定として、時刻t=0(ms)、Δt=20(ms)とする(ステップA11)。なお、Δtはフレーム切出し間隔を示し、その値は20(ms)に限らず、任意に設定可能である。
制御部32は、例えばシャッタキー9の操作により動画撮影の終了が明示的に指示されるまでの間、時刻tからt+Δtの間隔で以下のような処理を繰り返し実行する(ステップA12〜A25)。
すなわち、まず、制御部32は、時刻tからt+Δtまでの間に入力された音声波形データをフレームデータとして切り出し(ステップA12)、これをフーリエ変換処理して周波数毎のパワーを表したスペクトルデータを生成する(ステップA13)。
次に、制御部32は、予め図示せぬRAM等のメモリに記憶されたモータ音スペクトルデータを読み出し、そのモータ音スペクトルデータに対して所定の係数値を乗算した後(ステップA14)、前記ステップA13で得られた音声波形のスペクトルデータから前記係数乗算後のモータ音スペクトルデータを減算したデータを生成する(ステップA15)。
ここで、制御部32は、ズーム操作中であるか否かを判断する(ステップA16)。これは、キー入力部36に含まれるズームキー20a,20bの操作によって入力されるズーム操作信号によって判断される。
ズーム操作中であれば(ステップA16のYes)、制御部32は、前記ズーム操作信号に基づいてズーム用のモータ21をズーム指示方向へ駆動する(ステップA17)。その際、制御部32は、前記ステップA15で生成された音声スペクトルデータを選択する(ステップA18)。そして、この選択した音声スペクトルデータを逆フリー変換処理して元の音声波形データに戻し(ステップA21)、これを前の音声波形データと連続するようにフレーム単位で合成しながら(ステップA22)、撮影画像(動画データ)と同期させてメモリ38に記録していく(ステップA23)。
一方、ズーム操作中でなければ(ステップA16のNo)、制御部32は、ズーム用のモータ21を停止状態として(ステップA19)、その間には前記ステップA13で得られた音声スペクトルデータ(サブトラクト処理されていない音声スペクトルデータ)を選択する(ステップA20)。そして、この音声スペクトルデータを逆変換処理および合成処理しながら(ステップA21,A22)、撮影画像(動画データ)と同期させてメモリ38に記録していく(ステップA23)。
以降、動画撮影が終了するまで、Δtの間隔で前記同様の処理を繰り返して、音声データを撮影画像と共に連続して記録していく(ステップA24,A25)。
このように、本装置をソフトウェア的に実現した場合であっても前記図3に示した構成と同様の効果が得られる。
図6は前記第1の実施形態の変形例としての構成を示すブロック図である。
前記図3に示した構成では、スペクトル切り替え部56によって入力音声スペクトル信号Sbと雑音除去後の音声スペクトル信号Sdをモータ駆動タイミングに基づいて選択的に入力するようにしたが、図6に示すように、モータ音スペクトル信号Scに乗じるサブトラクト係数αを“0”か“1”に切り替えるような構成であっても良い。
すなわち、モータ音スペクトル記憶部54の出力先に、係数乗算用の乗算器59を設けておく。制御部32は、この乗算器59によってモータ音スペクトル信号Scに乗じるサブトラクト係数αを通常時(モータ非駆動時)は“0”とし、モータ駆動時は“1”とするように制御する。
これにより、サブトラクト係数α=0のときには、フーリエ変換部53から出力される入力音声スペクトル信号Sbのみがサブトラクト部55に与えられ、また、サブトラクト係数α=1のときには、フーリエ変換部53から出力される入力音声スペクトル信号Sbと乗算器59で係数乗算後のモータ音スペクトル信号Scの両方がサブトラクト部55に与えられることになる。
このような構成によれば、前記図3のスペクトル切り替え部56を使用した場合と同様に、モータ駆動期間ではサブトラクト処理を施した音声信号を入力信号として得ることができ、これを雑音除去後の音声信号として撮影画像と同期させてメモリ38に記録することができる。
なお、この図6の構成についても、前記同様に制御部32がプログラムに従って一連の処理を行うことで、ソフトウェア的に実現することが可能である。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。
図7は本発明の第2の実施形態に係るデジタルカメラ1に用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。なお、図3(第1の実施形態)の構成と同じ部分には同一符号を付して、その説明は省略するものとする。
図7において、図3の構成と異なる点は、スペクトル切り替え部56に代わってスペクトル混合部60が設けられ、また、このスペクトル混合部60の混合比kを発生する混合比発生部61が設けられていることである。
スペクトル混合部60は、フーリエ変換部53から得られる入力音声スペクトル信号Sbと、サブトラクト部55によって予めモータ音スペクトル記憶部54に記憶されたモータ音スペクトル信号Scによって雑音除去された音声スペクトル信号Sdとを混合比kに従って混合処理する。
混合比発生部61は、雑音除去後の音声スペクトル信号Sdを基準にした混合比kを発生してスペクトル混合部60に出力する。つまり、雑音除去後の音声スペクトル信号Sdを“k”、入力音声スペクトル信号Sbを“k−1”として両信号を混合する。
この混合比kは0〜1の値を有する。k=0(最低値)のとき、スペクトル混合部60は入力音声スペクトル信号Sbのみを入力信号として逆フーリエ変換部57に与える。一方、k=1(最高値)のときには、スペクトル混合部60は雑音除去後の音声スペクトル信号Sdのみを入力信号として逆フーリエ変換部57に与える。また、k=0,1以外のとき、スペクトル混合部60はそのときのkの値に応じて入力音声スペクトル信号Sbと音声スペクトル信号Sdを混合した信号を入力信号として逆フーリエ変換部57に与える。
図8は第2の実施形態における混合比kの時間的変化を示す図である。
モータ21が駆動されていないとき、混合比k=0である。そして、モータ21の駆動が開始されると、kの値は徐々に増加し、モータ駆動開始からt1時間後にk=1となる。この時間t1はモータ21の回転数が徐々に増加して定常状態に達するまでの時間と一致させることが考えられるが、必ずしもそうでなくても良い。
また、モータ駆動が停止されると、kの値は“1”から徐々に減少してt2時間後にk=0となる。この時間t2はモータ駆動が停止されて、実際にモータ21の回転が停止するまでの時間に一致させる。
次に、第2の実施形態の動作について説明する。
音声付き動画撮影を行っている最中に、例えばユーザがキー入力部36に含まれるズームキー20a,20bを操作したとする。
デジタルカメラ全体の動作を制御する制御部32は、キー入力部36に含まれるズームキー20a,20bのズーム操作信号を入力すると、モータ駆動部21aに対して駆動開始信号を送る。モータ駆動部21aは、この駆動開始信号を受けてモータ21を回転駆動する。このモータ21の回転に伴い、図2のレンズ光学系22に含まれる図示せぬズームレンズが光軸上に移動してズーム動作が開始され、撮影画像が拡大または縮小されてメモリ38に記録される。
また、ユーザがズーム操作を終了すると、制御部32はモータ駆動部21aに対して駆動終了信号を送る。これにより、モータ21の回転駆動が停止し、ズーム動作が終了する。
ここで、音声付きの動画撮影中は常にマイクロホン部7による音声入力機能がON状態にある。このため、前記ズーム操作に伴って発生するモータ音つまりズーム音が入力音声の中に雑音として混入する問題がある。このようなモータ音を音声信号から除去して記録するべく、以下のような処理が行われる。
すなわち、制御部32は、図8に示すようにモータ21の駆動開始時には混合比k=0とし、それから徐々に雑音除去後の音声スペクトル信号Sdの比率を上げていくように混合比発生部61を制御する。モータ駆動開始時点での混合比kを“0”としておくのは、まだモータ21が回転し始めたばかりであり、実際には雑音として音声信号Saに混入されていないからである。混合比k=0のときに、スペクトル混合部60によって入力音声スペクトル信号Sbのみが逆フーリエ変換部57に与えられる。
混合比kが“0”より大きくなると、スペクトル切り替え部56において、そのときの混合比kの値に応じて雑音除去後の音声スペクトル信号Sdが多く混合されることになり、その混合スペクトル信号が逆フーリエ変換部57に与えられる。モータ駆動開始からt1経過した時点で混合比k=1となり、以後は雑音除去後の音声スペクトル信号Sdのみが逆フーリエ変換部57に与えられる。つまり、モータ音スペクトル記憶部54に記憶されたモータ音スペクトル信号Scを用いて雑音除去された音声スペクトル信号Sdのみが逆フーリエ変換部57に与えられる。
一方、ズーム操作の終了により、モータ21の駆動が停止されると、制御部32は、混合比k=1から徐々に雑音除去後の音声スペクトル信号Sdの比率を下げていき、t2経過後にk=0となるように混合比発生部61を制御する。これにより、スペクトル混合部60において、再び入力音声スペクトル信号Sbと雑音除去後の音声スペクトル信号Sdとが混合され、その混合スペクトル信号が逆フーリエ変換部57に与えられる。そして、モータ21の回転が停止した時点で、入力音声スペクトル信号Sbのみが逆フーリエ変換部57に与えられることになる。
逆フーリエ変換部57に与えられた音声スペクトル信号は、逆フーリエ変換部57および波形合成部58を通じて元の音声信号に戻され、撮影画像と共にメモリ38に記録される。
このように、本発明の第2の実施形態によれば、入力音声スペクトル信号Sbと雑音除去後の音声スペクトル信号Sdをデジタル的に“1”か“0”かで切り替えるのではなく、モータ21の駆動期間に応じて入力音声スペクトル信号Sbと雑音除去後の音声スペクトル信号Sdの混合比kを変えるようにしたことで、撮影時に入力音声に入り込むモータ音を雑音としてより適切に除去することができる。
また、モータ駆動に合わせて混合比kを徐々に変えるようにしたことにより、スペクトルの急激な変化に依存する音質変化を防ぐことができるといった効果もある。
図9および図10は第2の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。なお、このフローチャートで示される処理は、コンピュータである制御部32によって読取り可能なプログラムの形態でROM等の記録媒体に予め記録されているものとする。
制御部32は、まず、初期設定として、時刻t=0(ms)、Δt=20(ms)、t1m=0(ms)、t2m=0(ms)、t1=200(ms)、t2=150(ms)とする(ステップA11)。
なお、Δtはフレーム切出し間隔を示し、その値は20(ms)に限らず、任意に設定可能である。t1mとt2mは、図8に示すようにモータ駆動開始時刻とモータ駆動停止時刻を示す。また、t1はモータ駆動開始から混合比k=1とするまでの時間、t1はモータ駆動停止から混合比k=0とするまでの時間を示す。
制御部32は、例えばシャッタキー9の操作により動画撮影の終了が明示的に指示されるまでの間、時刻tからt+Δtの間隔で、以下のような処理を繰り返し実行する(ステップB12〜B32)。
すなわち、まず、制御部32は、時刻tからt+Δtまでの間に入力された音声波形データをフレームデータとして切り出し(ステップB12)、これをフーリエ変換処理して周波数毎のパワーを表したスペクトルデータを生成する(ステップB13)。
次に、制御部32は、予め図示せぬRAM等のメモリに記憶されたモータ音スペクトルデータを読み出し、そのモータ音スペクトルデータに対して所定の係数値を乗算した後(ステップB14)、前記ステップB13で得られた音声波形のスペクトルデータから前記係数乗算後のモータ音スペクトルデータを減算したデータを生成する(ステップB15)。
ここで、制御部32は、ズーム操作中であるか否かを判断する(ステップB16)。これは、キー入力部36に含まれるズームキー20a,20bの操作によって入力されるズーム操作信号によって判断される。
ズーム操作中であれば(ステップB16のYes)、制御部32は、t2m=0とした後(ステップB17)、モータ駆動開始時にt1mをΔtずつ更新し、その値がt1に達するまでの間、以下のような式(2)により混合比kを算出する(ステップB18〜B20)
k=t1m/t1 …(2)
このようにして、モータ駆動開始時に用いる混合比kを算出した後、制御部32は、前記ズーム操作信号に基づいてズーム用のモータ21をズーム指示方向へ駆動する(ステップB21)。その間、制御部32は、前記ステップB21で算出した混合比kに従って、前記ステップB13で得られた音声波形のスペクトルデータと前記ステップB15で得られた音声スペクトルデータ(モータ音スペクトルデータを用いて雑音除去した音声スペクトルデータ)を混合する(ステップB27)。そして、この混合スペクトルデータを逆フリー変換処理して元の音声波形データに戻し(ステップB28)、これを前の音声波形データと連続するようにフレーム単位で合成しながら(ステップB29)、撮影画像(動画データ)と同期させてメモリ38に記録していく(ステップB30)。
一方、ズーム操作中なければ(ステップB16のNo)、制御部32は、t1m=0とした後(ステップB22)、モータ駆動停止時にt2mをΔtずつ更新し、その値がt2に達するまでの間、以下のような式(3)により混合比kを算出する(ステップB23〜B25)
k=1−(t2m/t2) …(3)
このようにして、モータ駆動停止時に用いる混合比kを算出した後、制御部32は、ズーム用のモータ21を停止状態とする(ステップB26)。その間、制御部32は、前記ステップB25で算出した混合比kに従って、前記ステップB13で得られた音声波形のスペクトルデータと前記ステップB15で得られた音声スペクトルデータ(モータ音スペクトルデータを用いて雑音除去した音声スペクトルデータ)を混合する(ステップB27)。
そして、この混合スペクトルデータを逆フリー変換処理して元の音声波形データに戻し(ステップB28)、これを前の音声波形データと連続するようにフレーム単位で合成しながら(ステップB29)、撮影画像(動画データ)と同期させてメモリ38に記録していく(ステップ30)。
以降、動画撮影が終了するまで、Δtの間隔で前記同様の処理を繰り返して、音声データを撮影画像と共に連続して記録していく(ステップB31,B32)。
このように、本装置をソフトウェア的に実現した場合であっても前記図7に示した構成と同様の効果が得られる。
なお、前記第2の実施形態では、モータ駆動定常状態における混合比kを“1”としたが、例えば最終出力の音質により“1”より小さい値としても良く、また、t1の時間は実際の最終出力の音質変化の状態やモータ起動特性等により、最も自然に感じるように調整しても良い。
また、変形例として、図6のような係数乗算用の乗算器59を用い、モータ21の駆動タイミングに基づいてサブトラクト係数αを徐々に変化させることでも良い。この場合モータ21の駆動開始時点では、サブトラクト係数αを最低値(例えば、α=0)としておき、モータ駆動開始後、その係数値を徐々に上げていき、所定時間t1後に最高値とする。また、モータ21の駆動停止時に最高値から徐々に下げて所定時間t2後に最低値つまりα=0とするように制御する。このように、雑音除去用のモータ音スペクトルに乗じるサブトラクト係数αを可変する構成でも、前記同様の効果が得られるものである。
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。
図11は本発明の第3の実施形態に係るデジタルカメラ1に用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。なお、図3(第1の実施形態)の構成と同じ部分には同一符号を付して、その説明は省略するものとする。
図11において、図3の構成と異なる点は、3種類のモータ音スペクトルPa,Pb,Pcを有するモータ音スペクトル記憶部62と、このモータ音スペクトル記憶部62から最適なモータ音スペクトルを選択するためのスペクトル選択部63が設けられていることである。
モータ音スペクトル記憶部62には、図12に示すように、予め設定された3種類のレベルの異なるモータ音スペクトルPa,Pb,Pcが記憶されている。モータ音スペクトルPaは、モータ21の駆動開始時から定常回転するまでのモータ音をスペクトル化した信号である。モータ音スペクトルPbは、モータ21が定常回転しているときのモータ音をスペクトル化した信号である。モータ音スペクトルPcは、モータ21の駆動停止時から実際に回転が停止するまでのモータ音をスペクトル化した信号である。
スペクトル選択部63は、制御部32からの指示に従って、モータ音スペクトル記憶部62に記憶されたモータ音スペクトルPa,Pb,Pcを選択的にサブトラクト部55に出力するように動作する。
この場合、図13に示すように、モータ21が駆動されていないときには、モータ音スペクトルの出力なしとする。一方、モータ21の駆動が開始されてから定常回転するまでの期間(t1)ではモータ音スペクトルPaを出力する。また、モータ21が定常回転状態にある期間ではモータ音スペクトルPbを出力し、モータ駆動を停止してから実際にモータ21の回転が停止するまでの期間(t2)ではモータ音スペクトルPcを出力するものとする。
なお、t1の期間はモータ21の回転数が徐々に増加して定常状態に達するまでの時間と一致させることが考えられるが、必ずしもそうでなくても良い。また、t2の期間はモータ駆動を停止してからモータ21が実際に停止するまでの時間に一致させる。
次に、第3の実施形態の動作について説明する。
音声付き動画撮影を行っている最中に、例えばユーザがキー入力部36に含まれるズームキー20a,20bを操作したとする。
デジタルカメラ全体の動作を制御する制御部32は、キー入力部36に含まれるズームキー20a,20bのズーム操作信号を入力すると、モータ駆動部21aに対して駆動開始信号を送る。モータ駆動部21aは、この駆動開始信号を受けてモータ21を回転駆動する。このモータ21の回転に伴い、図2のレンズ光学系22に含まれる図示せぬズームレンズが光軸上に移動してズーム動作が開始され、撮影画像が拡大または縮小されてメモリ38に記録される。
また、ユーザがズーム操作を終了すると、制御部32はモータ駆動部21aに対して駆動終了信号を送る。これにより、モータ21の回転駆動が停止し、ズーム動作が終了する。
ここで、音声付きの動画撮影中は常にマイクロホン部7による音声入力機能がON状態にある。このため、前記ズーム操作に伴って発生するモータ音つまりズーム音が入力音声の中に雑音として混入する問題がある。このようなモータ音を音声信号から除去して記録するべく、以下のような処理が行われる。
すなわち、制御部32は、モータ21が非駆動状態にあるときには出力ゼロとするようにスペクトル選択部63を制御する。これにより、サブトラクト部55には、フーリエ変換部53から得られる入力音声スペクトル信号Sbのみが与えられることになる。したがって、この入力音声スペクトル信号Sbがそのまま記録用の音声スペクトル信号Sdとして逆フーリエ変換部57に与えられる。逆フーリエ変換部57に与えられた音声スペクトル信号Sdは、逆フーリエ変換部57および波形合成部58を通じて元の音声信号に戻され、撮影画像と共にメモリ38に記録される。
一方、ズーム操作に伴いモータ21が駆動されると、制御部32は、モータ音スペクトル記憶部62に記憶されたモータ音スペクトルPa,Pb,Pcを選択的にサブトラクト部55に出力するようにスペクトル選択部63を制御する。
この場合、図13に示したように、モータ駆動開始から定常回転に達するまでの期間(t1)では開始時用に予め設定されたモータ音スペクトルPaを出力し、定常回転状態では定常時用に予め設定されたモータ音スペクトルPbを出力し、また、モータ駆動停止から実際にモータ21の回転が停止するまでの期間(t2)では停止時用に予め設定されたモータ音スペクトルPcを出力するように制御する。その結果、サブトラクト部55において、モータ駆動開始時、定常時、停止時のそれぞれの期間で最も適したモータ音スペクトルを用いて雑音成分を除去することができる。
このように、本発明の第3の実施形態によれば、モータ駆動開始時、定常時、停止時で3種類のモータ音スペクトルPa,Pb,Pcを選択的に使用して雑音除去処理(サブトラクト処理)を行う構成としたことにより、動画撮影中にモータ21が駆動された際に入力音声からそのモータ音を雑音としてより適切に除去することができる。
図14は第3の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。なお、このフローチャートで示される処理は、コンピュータである制御部32によって読取り可能なプログラムの形態でROM等の記録媒体に予め記録されているものとする。
また、動画撮影中に入力された音声信号をフレーム単位で分割しながら処理することについては図5と同様であり、この図14のフローチャートでは、説明を簡略化するため、モータ駆動タイミングに基づいてモータ音スペクトルPa,Pb,Pcを選択する場合の手順についてのみ記してある。
図14に示すように、モータ21が非駆動状態にあるとき(ステップC11のNo)、制御部32は、モータ音スペクトルの出力をゼロとして処理する(ステップC12)。これにより、動画撮影中に入力された音声信号がそのまま撮影画像と共にメモリ38に記録されることになる。
一方、動画撮影中にズーム操作があり、そのズーム用のモータ21を駆動する場合において(ステップC11のYes)、制御部32は、まず、モータ駆動を開始してから定常回転に達するまでのt1の間、開始時用に予め設定されたモータ音スペクトルPaを選択して、そのモータ音スペクトルPaを用いたサブトラクト処理を行う(ステップC13〜C15)。詳しくは、モータ音スペクトルPaに所定の係数値を乗じた後、入力音声のスペクトルデータからその係数乗算後のモータ音スペクトルPaを減算する。
また、t1が経過してモータ21が定常回転している期間では(ステップC15のYes)、制御部32は、定常時用に予め設定されたモータ音スペクトルPbを選択して、そのモータ音スペクトルPbを用いたサブトラクト処理を行う(ステップC16〜C18)。詳しくは、モータ音スペクトルPbに所定の係数値を乗じた後、入力音声のスペクトルデータからその係数乗算後のモータ音スペクトルPbを減算する。
また、ズーム操作の終了指示があり、モータ21の駆動を停止させた場合に(ステップC18のYes)、制御部32は、モータ駆動停止から実際にモータ21の回転が停止するまでのt2の間、停止時用に予め設定されたモータ音スペクトルPcを選択して、そのモータ音スペクトルPcを用いたサブトラクト処理を行う(ステップC19〜C21)。詳しくは、モータ音スペクトルPcに所定の係数値を乗じた後、入力音声のスペクトルデータからその係数乗算後のモータ音スペクトルPcを減算する。
このようにして、撮影中にズーム操作に伴いモータ21が駆動された場合において、モータ駆動開始時、定常時、停止時といった各期間に対応したモータ音スペクトルを用いてサブトラクト処理を行い、その処理結果として得られた音声信号を撮影画像に同期させてメモリ38に順次記録していく。これにより、音声信号に含まれるモータ音を適切に除去でき、雑音スペクトルの引き過ぎによる音声信号の品質低下を招くことなく記録することが可能となる。
なお、前記第3の実施形態では、サブトラクト処理に適用するモータ音スペクトルをモータ駆動タイミングに基づいて、モータ駆動開始時、定常時、停止時の3段階に切り替えるものとしたが、例えばモータ駆動開始時とモータ駆動停止時のスペクトルをさらに細かく分割して、これらを切り替えることでも良い。
(第4の実施形態)
次に、本発明の第4の実施形態について説明する。
図15は本発明の第4の実施形態に係るデジタルカメラ1に用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。なお、図3(第1の実施形態)の構成と同じ部分には同一符号を付して、その説明は省略するものとする。
図15において、図3の構成と異なる点は、2種類のモータ音スペクトルPd,Peを有するモータ音スペクトル記憶部64と、このモータ音スペクトル記憶部64から最適なモータ音スペクトルを選択するためのスペクトル選択部65と、モータ21の回転数を検出するためのモータ回転検出部66が設けられていることである。
モータ音スペクトル記憶部64には、図16に示すように、予め設定された2種類のレベルの異なるモータ音スペクトルPd,Peが記憶されている。モータ音スペクトルPdは、モータ回転数が定常回転数R0の1/2のときのモータ音をスペクトル化した信号である。モータ音スペクトルPeは、モータ回転数が定常回転数R0のときのモータ音をスペクトル化した信号である。
スペクトル選択部65は、モータ回転検出部66からの検出信号に従って、モータ音スペクトル記憶部64に記憶されたモータ音スペクトルPd,Peを選択的にサブトラクト部55に出力するように動作する。
この場合、図17に示すように、モータ回転検出部66によって検出されるモータ回転数R1が0の場合には(R1=0)、モータ音スペクトルの出力なしとする。一方、モータ回転数R1が定常回転数Ro未満の場合には(0<R1<R0)、モータ音スペクトルPdを出力し、モータ回転数R1が定常回転数R0の場合には(R1=R0)、モータ音スペクトルPeを出力する。
モータ回転検出部66は、例えばモータ21の回転軸に取り付けられたパルスエンコーダなどからなり、モータ21の回転数を検出し、その検出信号をスペクトル選択部65に出力する。
次に、第4の実施形態の動作について説明する。
音声付き動画撮影を行っている最中に、例えばユーザがキー入力部36に含まれるズームキー20a,20bを操作したとする。
デジタルカメラ全体の動作を制御する制御部32は、キー入力部36に含まれるズームキー20a,20bのズーム操作信号を入力すると、モータ駆動部21aに対して駆動開始信号を送る。モータ駆動部21aは、この駆動開始信号を受けてモータ21を回転駆動する。このモータ21の回転に伴い、図2のレンズ光学系22に含まれる図示せぬズームレンズが光軸上に移動してズーム動作が開始され、撮影画像が拡大または縮小されてメモリ38に記録される。
また、ユーザがズーム操作を終了すると、制御部32はモータ駆動部21aに対して駆動終了信号を送る。これにより、モータ21の回転駆動が停止し、ズーム動作が終了する。
ここで、音声付きの動画撮影中は常にマイクロホン部7による音声入力機能がON状態にある。このため、前記ズーム操作に伴って発生するモータ音つまりズーム音が入力音声の中に雑音として混入する問題がある。このようなモータ音を音声信号から除去して記録するべく、以下のような処理が行われる。
すなわち、モータ回転検出部66によってモータ21の回転数を検出し、その検出信号をスペクトル選択部65に出力する。
ここで、スペクトル選択部65は、モータ回転検出部66によって検出されるモータ回転数R1がゼロであれば、モータ音スペクトル信号の出力を禁止するように動作する。これにより、サブトラクト部55には、フーリエ変換部53から得られる入力音声スペクトル信号Sbのみが与えられることになる。したがって、この入力音声スペクトル信号Sbがそのまま記録用の音声スペクトル信号Sdとして逆フーリエ変換部57に与えられる。逆フーリエ変換部57に与えられた音声スペクトル信号Sdは、逆フーリエ変換部57および波形合成部58を通じて元の音声信号に戻され、撮影画像と共にメモリ38に記録される。
一方、モータ回転検出部66によって検出されるモータ回転数R1がゼロ以外であった場合、つまり、ズーム操作によりモータ21が駆動された状態において、スペクトル選択部65はそのときにモータ回転検出部66によって検出されるモータ回転数R1に応じてモータ音スペクトル記憶部62に記憶されたモータ音スペクトルPd,Peを選択的にサブトラクト部55に出力する。
この場合、図17に示したように、0<R1<R0のとき、つまり、モータ21が定常回転に達するまでの期間では、定常回転数R0の1/2のときのモータ音スペクトルPdを出力する。また、R1=R0のとき、つまり、モータ21が定常回転している場合には、定常回転数R0のときのモータ音スペクトルPeを出力する。その結果、サブトラクト部55において、モータ駆動期間全体にわたり適切なモータ音スペクトルを用いて雑音成分を除去することができる。
このように、本発明の第4の実施形態によれば、モータ回転数に応じて2種類のモータ音スペクトルPe,Peを選択的に使用して雑音除去処理(サブトラクト処理)を行う構成としたことにより、動画撮影中にモータ21が駆動された際に入力音声からそのモータ音を雑音としてより適切に除去することができる。
図18は第4の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。なお、このフローチャートで示される処理は、コンピュータである制御部32によって読取り可能なプログラムの形態でROM等の記録媒体に予め記録されているものとする。
また、動画撮影中に入力された音声信号をフレーム単位で分割しながら処理することについては図5と同様であり、この図18のフローチャートでは、説明を簡略化するため、モータ回転数に基づいてモータ音スペクトルPd,Peを選択する場合の手順についてのみ記してある。
図18に示すように、動画撮影中にズーム操作があり、そのズーム用のモータ21の駆動が開始される(ステップD11のYes)、制御部32はそのときのモータ21の回転数R1を検出する(ステップD12)。その結果、R1=0であれば、つまり、まだモータ21が回転を始めていない状態であれば(ステップD13のYes)、制御部32は、モータ音スペクトルの出力をゼロとして処理する(ステップD14)。なお、ズーム操作かせなく、モータ21が非駆動状態のときでも前記同様に出力ゼロとして処理する。これにより、動画撮影中に入力された音声信号がそのまま撮影画像と共にメモリ38に記録されることになる。
一方、モータ21の回転数R1が定常回転数Ro未満であった場合、つまり、0<R1<R0であれば(ステップD15のYes)、制御部32は、定常回転未満用予め設定されたモータ音スペクトルPdを選択して、そのモータ音スペクトルPdを用いたサブトラクト処理を行う(ステップD16〜D17,D20)。詳しくは、モータ音スペクトルPdに所定の係数値を乗じた後、入力音声のスペクトルデータからその係数乗算後のモータ音スペクトルPdを減算する。
また、モータ21の回転数R1が定常回転数Roであった場合、つまり、R1=R0であれば(ステップD15のNo)、制御部32は、定常回転用に予め設定されたモータ音スペクトルPeを選択して、そのモータ音スペクトルPeを用いたサブトラクト処理を行う(ステップD18〜D29,D20)。詳しくは、モータ音スペクトルPeに所定の係数値を乗じた後、入力音声のスペクトルデータからその係数乗算後のモータ音スペクトルPeを減算する。
このようにして、撮影中にズーム操作に伴いモータ21が駆動された場合において、そのときのモータ回転数に対応したモータ音スペクトルを用いてサブトラクト処理を行い、その処理結果として得られた音声信号を撮影画像に同期させてメモリ38に順次記録していく。これにより、音声信号に含まれるモータ音を適切に除去でき、雑音スペクトルの引き過ぎによる音声信号の品質低下を招くことなく記録することが可能となる。
なお、前記第4の実施形態では、サブトラクト処理に適用するモータ音スペクトルをモータ回転数に基づいて2段階に切り替えるものとしたが、例えばモータ回転数をさらに細かく分類にし、それらに対応したモータ音スペクトルを用いて適宜切り替えるようにしても良い。
また、前記各実施形態では、ズーム音を雑音除去対象として説明したが、ズーム音に限らず、例えばフォーカス音、さらにはシャッター音などでも同様であり、要は撮影動作に伴って発生する機構音を入力音声から除去する場合に適用可能である。
(変形例1)
ところで、入力音声のスペクトルから単純にモータ音のスペクトルを減算すると、SS法におけるサブトラクト係数は1より大きい値が使用されるため、ズーム音のように周波数帯域が広い音の場合には、サブトラクト処理が行われている間だけ周りの騒音も一緒に低減されてしまい不自然な音になる。
これを防止するために、無音区間に周囲騒音スペクトルを推定しておき、サブトラクト処理で音声スペクトルからモータ音スペクトルを減算したスペクトルに対して周囲騒音スペクトルを加算することで、周囲騒音は残すような処理を施すようにしも良い。
図19にその構成例を示す。なお、図3(第1の実施形態)の構成と同じ部分には同一符号を付してある。
まず、雑音除去対象となるモータ音(ここではズーム音とする)のみのスペクトル信号を予め採取してモータ音スペクトル記憶部54に記憶しておく。この採取方法は、ズーム音のみを音声入力部51から入力し、フレーム分割部52により数10ms程度のフレーム区間に切り出し、フーリエ変換部53によりスペクトル信号に変換する。このフレーム単位のスペクトル信号をモータ駆動期間中に順次抽出し、これらの平均値をモータ音スペクトル信号とする。
なお、モータ音スペクトル記憶部54に記憶しておくモータ音スペクトル信号としては、モータ駆動期間全体の平均値ではなく、モータ駆動開始直後のスペクトル信号、終了間際のスペクトル信号、または、定常状態におけるスペクトル信号を用いても良い。
また、無音区間検出部71は、入力信号が音声区間であるか無音区間であるかを検出する。具体的には、入力信号の短時間パワーを抽出し、閾値以上の短時間パワーが一定時間以上継続したか否かによって検出する。周囲雑音スペクトル推定部72は、無音区間におけるスペクトル信号により雑音スペクトルを推定する。
また、ズーム操作が行われていない状態では、制御部32からの指示により第1乗算部73と第2乗算部74の乗算係数はともに“0”であり、波形合成部58からは入力音声信号がそのまま出力されることになる。
一方、ズーム操作が開始されると、モータ音スペクトル記憶部54に記憶されているモータ音スペクトル信号に対し、第2乗算部74によって“1”より大きい係数値(例えば“2”)が乗算される。そして、スペクトル減算部75により、フーリエ変換部53からの入力音声のスペクトル信号から前記係数乗算後のモータ音スペクトル信号が減算される。つまり、入力音声のスペクトル信号に対してSS法による残音除去処理が施される。
この場合、モータ音スペクトル信号は周波数帯域が広いため、スペクトル減算部75からは当該音声スペクトル信号に含まれる周囲雑音のスペクトルも小さい音声スペクトル信号がスペクトル加算部76に出力されることになる。
一方、ズーム操作中は、第1乗算部73の乗算係数は1に設定されているため、周囲雑音スペクトル推定部72から得られる周囲雑音スペクトル信号がスペクトル加算部76に入力される。これにより、音声スペクトル信号に周囲雑音スペクトル信号が加算され、結果的に、波形合成部58からは入力音声からモータ音のみを除去した信号を得ることができる。
このように、スペクトル減算後の出力に周囲雑音スペクトルを加算することにより、除去対象とする雑音がズーム音のように周波数帯域が広い場合に、周りの騒音も一緒に低減されて不自然な音になってしまうことを防止できる。
(変形例2)
また、動画撮影を行っているときには、ズーム音だけなく、フォーカス音などの様々な機構音が雑音として入力音声に混入する可能性がある。そこで、変形例2として、複数の異なるモータ音を雑音除去対象とした場合について説明する。
図20にその構成例を示す。なお、図3(第1の実施形態)の構成と同じ部分には同一符号を付してある。
ここでは、雑音除去対象としてズーム音とフォーカス音を例にする。図中の81はズーム音スペクトル記憶部、82はフォーカス音スペクトル記憶部である。83はモータ音スペクトル加算部であり、制御部32からの指示によりズーム音スペクトル信号とフォーカス音スペクトル信号を加算処理してサブトラクト部55に出力する。
また、84は合焦判定部であり、撮影時にピントが合っているか否かを判定する。ピントが合っていない場合に、制御部32からの指示によりフォーカスモータ駆動部86aを通じてフォーカスモータ86が回転駆動され、これに伴い、図示せぬフォーカスレンズが光軸上を移動してピントが調整される。
また、キー入力部36に含まれるズームキー20a,20bによりズーム操作が行なわれると、制御部32からの指示によりズームモータ駆動部85aを通じてズームモータ85が回転駆動され、これに伴い、図示せぬズームレンズが光軸上を移動してズーム倍率が調整される。
このような構成において、まず、雑音除去対象となるズーム音のみのスペクトル信号と、フォーカス音のみのスペクトル信号を採取し、それぞれズーム音スペクトル記憶部81、フォーカス音スペクトル記憶部82に記憶しておく。
この採取方法は、ズーム音であれば、ズーム音のみを音声入力部51から入力し、フレーム分割部52により数10ms程度のフレーム区間に切り出し、フーリエ変換部53によりスペクトル信号に変換する。このフレーム単位のスペクトル信号をモータ駆動期間中に順次抽出し、これらの平均値をズーム音スペクトル信号とする。同様に、フォーカス音であれば、フォーカス音のみを音声入力部51から入力し、フレーム分割部52により数10ms程度のフレーム区間に切り出し、フーリエ変換部53によりスペクトル信号に変換する。このフレーム単位のスペクトル信号をモータ駆動期間中に順次抽出し、これらの平均値をフォーカス音スペクトル信号とする。
なお、ズーム音スペクトル記憶部81、フォーカス音スペクトル記憶部82にそれぞれに記憶しておくスペクトル信号としては、モータ駆動期間全体の平均値ではなく、モータ駆動開始直後のスペクトル信号、終了間際のスペクトル信号、または、定常状態におけるスペクトル信号を用いても良い。
次に、動画撮影時における音声記録処理について説明する。
まず、音声入力部51を通じて入力された音声信号はフレーム分割部52により数10ms程度のフレーム区間に切り出され、フーリエ変換部53によりスペクトル信号に変換される。
ここで、ズーム操作によってズームモータ85が駆動されている場合には、ズーム音スペクトル記憶部81に記憶されたズーム音スペクトル信号のみがモータ音スペクトル加算部83を通じてサブトラクト部55に与えられる。一方、合焦判定部84の判定結果に従ってフォーカスモータ86のみが駆動されている場合には、フォーカス音スペクトル記憶部82に記憶されたフォーカス音スペクトル信号のみがモータ音スペクトル加算部83を通じてサブトラクト部55に与えられる。
さらに、ズームモータ85とフォーカスモータ86の両方が駆動されている場合には、モータ音スペクトル加算部83によりズーム音スペクトル信号とフォーカス音スペクトル信号が加算され、その加算スペクトル信号がサブトラクト部55に与えられる。
サブトラクト部55では、モータ音スペクトル加算部83の出力信号に所定のサブトラクト係数αを乗じ、フーリエ変換部53から出力される音声スペクトル信号からその係数乗算後のスペクトル信号を減算することにより雑音成分を除去する。
このサブトラクト部55によって雑音除去された音声スペクトル信号は、逆フーリエ変換部57および波形合成部58を通じて元の音声信号に戻され、撮影画像と共にメモリ38に記録される。
このように、複数の異なるモータ音を雑音除去対象とした場合でも、入力音声信号からそれぞれのモータ音を適切に除去して記録することができる。
なお、前記各実施形態では、音声付き動画撮影可能なデジタルカメラを例にして説明したが、本発明はデジタルカメラに限らず、例えばカメラ付きの携帯電話など、音声信号と共に撮影画像を記録可能な機能を備えた電子機器であれば、そのすべてに適用可能である。
要するに、本発明は前記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
また、上述した実施形態において記載した手法は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD−ROM等)、半導体メモリなどの記録媒体に書き込んで各種装置に適用したり、そのプログラム自体をネットワーク等の伝送媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムあるいは伝送媒体を介して提供されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。
図1は本発明の撮像装置としてデジタルカメラを例にした場合の外観構成を示す図であり、図1(a)は主に前面の構成、同図(b)は主に背面の構成を示す斜視図である。 図2はデジタルカメラの電子回路構成を示すブロック図である。 図3は本発明の第1の実施形態に係るデジタルカメラに用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。 図4はSS法(スペクトルサブトラクション法)を用いた雑音除去処理を説明するための図である。 図5は第1の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。 図6は第1の実施形態の変形例としての構成を示すブロック図である。 図7は本発明の第2の実施形態に係るデジタルカメラに用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。 図8は第2の実施形態における混合比kの時間的変化を示す図である。 図9は第2の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。 図10は第2の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。 図11は本発明の第3の実施形態に係るデジタルカメラに用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。 図12は第3の実施形態におけるモータ音スペクトル記憶部の構成を示す図である。 図13は第3の実施形態におけるモータ音スペクトルの出力タイミングを示す図である。 図14は第3の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。 図15は本発明の第4の実施形態に係るデジタルカメラに用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。 図16は第4の実施形態におけるモータ音スペクトル記憶部の構成を示す図である。 図17は第4の実施形態におけるモータ音スペクトルの出力タイミングを示す図である。 図18は第4の実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。 図19は変形例1としてデジタルカメラに用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。 図20は変形例2としてデジタルカメラに用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。
符号の説明
1…デジタルカメラ、2…ボディ、3…撮影レンズ、7…マイクロホン部、9…シャッタキー、20a,20b…ズームキー、21…モータ、21a…モータ駆動部、32…制御部、36…キー入力部、51…音声入力部、52…フレーム分割部、53…フーリエ変換部、54…モータ音スペクトル記憶部、55…サブトラクト部、56…スペクトル切り替え部、57…逆フーリエ変換部、58…波形合成部、59…乗算器、60…スペクトル混合部、61…混合比発生部、62…モータ音スペクトル記憶部、63…スペクトル選択部、64…モータ音スペクトル記憶部、65…スペクトル選択部、66…モータ回転検出部、71…無音区間検出部、72…周囲雑音スペクトル推定部、73…第1乗算部、74…第2乗算部、75…スペクトル減算部、76…スペクトル加算部、81…ズーム音スペクトル記憶部、82…フォーカス音スペクトル記憶部、83…モータ音スペクトル加算部、84…合焦判定部、85…ズームモータ、85a…ズームモータ駆動部、86…フォーカスモータ、86a…フォーカスモータ駆動部、Sa…入力音声信号、Sb…入力音声スペクトル信号、Sc…モータ音スペクトル信号、Sd…雑音除去後の音声スペクトル信号、Se…逆フーリエ変換後の音声信号、Sf…波形合成後の音声信号。

Claims (10)

  1. 音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録機能を備えた撮像装置であって、
    前記入力音声信号をスペクトル信号に変換する変換手段と、
    予め前記機構音をスペクトル化して得られた機構音スペクトル信号を記憶した記憶手段と、
    撮影中に前記機構音の発生タイミングに基づいて、前記変換手段によって得られた入力音声スペクトル信号から前記記憶手段に記憶された機構音スペクトル信号に所定の係数を乗じた信号を減算することで雑音成分を除去する雑音除去手段と、
    この雑音除去手段によって得られた雑音除去後の音声スペクトル信号を元の音声信号に逆変換する逆変換手段と、
    この逆変換手段によって得られた音声信号を撮影画像と共に記録する記録手段と
    を具備したことを特徴とする撮像装置。
  2. 前記変換手段によって得られた入力音声スペクトル信号と前記雑音除去手段によって得られた雑音除去後の音声スペクトル信号とを混合し、そのときの混合比を前記機構音の発生期間に応じて徐々に変える混合手段を備え、
    前記逆変換手段は、この混合手段によって混合処理された音声スペクトル信号を元の音声信号に逆変換することを特徴とする請求項1記載の撮像装置。
  3. 前記機構音は、撮影動作に関連した特定のモータの駆動音を含み、
    前記混合手段は、前記雑音除去後の音声スペクトル信号の比率を前記モータの駆動開始時に最低値から徐々に上げて所定時間後に最高値とすると共に、前記モータの駆動停止時に最高値から徐々に下げて所定時間後に最低値とするように混合比を変えることを特徴とする請求項2記載の撮像装置。
  4. 前記機構音スペクトル信号に乗じる係数の値を前記機構音の発生期間に応じて徐々に変える係数可変手段を備えことを特徴とする請求項1記載の撮像装置。
  5. 前記機構音は、撮影動作に関連した特定のモータの駆動音を含み、
    前記係数可変手段は、前記機構音スペクトル信号に乗じる係数を前記モータの駆動開始時に最低値から徐々に上げて所定時間後に最高値とすると共に、前記モータの駆動停止時に最高値から徐々に下げて所定時間後に最低値とするように変えることを特徴とする請求項4記載の撮像装置。
  6. 前記機構音は、撮影動作に関連した特定のモータの駆動音を含み、
    前記記憶手段は、前記モータの駆動開始から停止までの各期間に応じて設定された複数のレベルの異なる機構音スペクトル信号を記憶し、
    前記雑音除去手段は、前記モータの各期間に基づいて前記記憶手段に記憶された各機構音スペクトル信号を選択的に使用して雑音除去処理を行うことを特徴とする請求項1記載の撮像装置。
  7. 前記機構音は、撮影動作に関連した特定のモータの駆動音を含み、
    前記記憶手段は、前記モータの回転数に応じて設定された複数のレベルの異なる機構音スペクトル信号を記憶し、
    前記雑音除去手段は、前記モータの回転数に基づいて前記記憶手段に記憶された各機構音スペクトル信号を選択的に使用して雑音除去処理を行うことを特徴とする請求項1記載の撮像装置。
  8. 前記特定のモータとは、ズーム倍率調整用のモータまたはフォーカス調整用のモータのであることを特徴とする請求項3乃至7のいずれか1つに記載の撮像装置。
  9. 音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録方法であって、
    前記入力音声信号をスペクトル信号に変換するステップと、
    撮影中に前記機構音の発生タイミングに基づいて、前記スペクトル変換によって得られた入力音声スペクトル信号から、予め前記機構音をスペクトル化して得られた機構音スペクトル信号に所定の係数を乗じた信号を減算することで雑音成分を除去するステップと、
    この雑音除去後の音声スペクトル信号を元の音声信号に逆変換するステップと、
    この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録するステップと
    を備えたことを特徴とする音声記録方法。
  10. 音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する機能を備えたコンピュータによって実行されるプログラムであって、
    前記コンピュータに、
    前記入力音声信号をスペクトル信号に変換する機能と、
    撮影中に前記機構音の発生タイミングに基づいて、前記スペクトル変換によって得られた入力音声スペクトル信号から、予め前記機構音をスペクトル化して得られた機構音スペクトル信号に所定の係数を乗じた信号を減算することで雑音成分を除去する機能と、
    この雑音除去後の音声スペクトル信号を元の音声信号に逆変換する機能と、
    この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録する機能と
    を実現させることを特徴とするプログラム。
JP2005091142A 2005-03-28 2005-03-28 撮像装置、音声記録方法及びプログラム Pending JP2006279185A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005091142A JP2006279185A (ja) 2005-03-28 2005-03-28 撮像装置、音声記録方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005091142A JP2006279185A (ja) 2005-03-28 2005-03-28 撮像装置、音声記録方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2006279185A true JP2006279185A (ja) 2006-10-12

Family

ID=37213519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005091142A Pending JP2006279185A (ja) 2005-03-28 2005-03-28 撮像装置、音声記録方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2006279185A (ja)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008058343A (ja) * 2006-08-29 2008-03-13 Casio Comput Co Ltd 機構駆動音低減装置および機構駆動音低減方法
JP2008252389A (ja) * 2007-03-29 2008-10-16 Casio Comput Co Ltd 撮像装置、雑音除去方法及びプログラム
WO2011055829A1 (ja) 2009-11-06 2011-05-12 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
JP2011095567A (ja) * 2009-10-30 2011-05-12 Nikon Corp 撮像装置
WO2011055834A1 (ja) 2009-11-06 2011-05-12 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
WO2011055832A1 (ja) 2009-11-06 2011-05-12 日本電気株式会社 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
JP2011097335A (ja) * 2009-10-29 2011-05-12 Nikon Corp 信号処理装置及び撮像装置
JP2011097419A (ja) * 2009-10-30 2011-05-12 Nikon Corp 撮影装置、光学装置、及びプログラム
WO2011148861A1 (ja) 2010-05-25 2011-12-01 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
WO2011148860A1 (ja) 2010-05-24 2011-12-01 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
JP2011253126A (ja) * 2010-06-03 2011-12-15 Canon Inc 音声信号処理装置、及びその制御方法
JP2012003021A (ja) * 2010-06-16 2012-01-05 Canon Inc 音声処理装置及び音声処理方法、撮像装置
JP2012068342A (ja) * 2010-09-22 2012-04-05 Nec Tokin Corp 雑音除去装置
WO2012070684A1 (ja) 2010-11-25 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
JP2012118464A (ja) * 2010-12-03 2012-06-21 Nikon Corp 音声処理装置、撮像装置、音声処理方法、及び音声処理プログラム
US20120250885A1 (en) * 2011-03-30 2012-10-04 Nikon Corporation Signal-processing device, imaging apparatus, and signal-processing program
JP2013081156A (ja) * 2011-09-21 2013-05-02 Panasonic Corp ノイズキャンセル装置
JP2013161041A (ja) * 2012-02-08 2013-08-19 Nikon Corp 信号処理装置、カメラおよび信号処理プログラム
US8600070B2 (en) 2009-10-29 2013-12-03 Nikon Corporation Signal processing apparatus and imaging apparatus
US8698911B2 (en) 2009-10-28 2014-04-15 Nikon Corporation Sound recording device, imaging device, photographing device, optical device, and program
US8698921B2 (en) 2010-11-24 2014-04-15 Renesas Electronics Corporation Audio processing device, audio processing method, program, and audio acquisition apparatus
US8842198B2 (en) 2010-12-28 2014-09-23 Sony Corporation Audio signal processing device, audio signal processing method, and program
US8913157B2 (en) 2010-07-30 2014-12-16 Sony Corporation Mechanical noise suppression apparatus, mechanical noise suppression method, program and imaging apparatus
US9288370B2 (en) 2010-11-26 2016-03-15 Canon Kabushiki Kaisha Imaging apparatus and audio processing apparatus
JPWO2014017371A1 (ja) * 2012-07-25 2016-07-11 株式会社ニコン 音処理装置、電子機器、撮像装置、プログラム、及び、音処理方法
US9462174B2 (en) 2014-09-04 2016-10-04 Canon Kabushiki Kaisha Electronic device and control method
KR101739942B1 (ko) * 2010-11-24 2017-05-25 삼성전자주식회사 오디오 노이즈 제거 방법 및 이를 적용한 영상 촬영 장치
JP2017187725A (ja) * 2016-04-08 2017-10-12 キヤノン株式会社 電子機器及び制御方法
JP2017220913A (ja) * 2016-06-10 2017-12-14 キヤノン株式会社 撮像装置及びその制御方法
US10535363B2 (en) 2017-06-05 2020-01-14 Canon Kabushiki Kaisha Audio processing apparatus and control method thereof

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0195314A (ja) * 1987-10-08 1989-04-13 Hitachi Maxell Ltd Icカードの電源供給回路
JPH08221092A (ja) * 1995-02-17 1996-08-30 Hitachi Ltd スペクトルサブトラクションを用いた雑音除去システム
JPH10177394A (ja) * 1996-12-19 1998-06-30 Toyota Motor Corp 音声認識装置
JPH11205891A (ja) * 1998-01-09 1999-07-30 Victor Co Of Japan Ltd 雑音低減回路及びビデオカメラ装置
JP2000082999A (ja) * 1998-09-07 2000-03-21 Nippon Telegr & Teleph Corp <Ntt> 雑音低減処理方法、その装置及びプログラム記憶媒体
JP2000222000A (ja) * 1999-01-29 2000-08-11 Canon Inc 音声認識装置
JP2003308092A (ja) * 2002-04-15 2003-10-31 Mitsubishi Electric Corp 雑音除去装置及び雑音除去方法
JP2004053965A (ja) * 2002-07-19 2004-02-19 Toyota Central Res & Dev Lab Inc 音声認識装置
JP2005031258A (ja) * 2003-07-09 2005-02-03 Canon Inc 認識モデル学習装置及び方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0195314A (ja) * 1987-10-08 1989-04-13 Hitachi Maxell Ltd Icカードの電源供給回路
JPH08221092A (ja) * 1995-02-17 1996-08-30 Hitachi Ltd スペクトルサブトラクションを用いた雑音除去システム
JPH10177394A (ja) * 1996-12-19 1998-06-30 Toyota Motor Corp 音声認識装置
JPH11205891A (ja) * 1998-01-09 1999-07-30 Victor Co Of Japan Ltd 雑音低減回路及びビデオカメラ装置
JP2000082999A (ja) * 1998-09-07 2000-03-21 Nippon Telegr & Teleph Corp <Ntt> 雑音低減処理方法、その装置及びプログラム記憶媒体
JP2000222000A (ja) * 1999-01-29 2000-08-11 Canon Inc 音声認識装置
JP2003308092A (ja) * 2002-04-15 2003-10-31 Mitsubishi Electric Corp 雑音除去装置及び雑音除去方法
JP2004053965A (ja) * 2002-07-19 2004-02-19 Toyota Central Res & Dev Lab Inc 音声認識装置
JP2005031258A (ja) * 2003-07-09 2005-02-03 Canon Inc 認識モデル学習装置及び方法

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008058343A (ja) * 2006-08-29 2008-03-13 Casio Comput Co Ltd 機構駆動音低減装置および機構駆動音低減方法
JP2008252389A (ja) * 2007-03-29 2008-10-16 Casio Comput Co Ltd 撮像装置、雑音除去方法及びプログラム
US8698911B2 (en) 2009-10-28 2014-04-15 Nikon Corporation Sound recording device, imaging device, photographing device, optical device, and program
JP2011097335A (ja) * 2009-10-29 2011-05-12 Nikon Corp 信号処理装置及び撮像装置
US8600070B2 (en) 2009-10-29 2013-12-03 Nikon Corporation Signal processing apparatus and imaging apparatus
JP2011097419A (ja) * 2009-10-30 2011-05-12 Nikon Corp 撮影装置、光学装置、及びプログラム
JP2011095567A (ja) * 2009-10-30 2011-05-12 Nikon Corp 撮像装置
US8860822B2 (en) 2009-10-30 2014-10-14 Nikon Corporation Imaging device
WO2011055834A1 (ja) 2009-11-06 2011-05-12 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
WO2011055832A1 (ja) 2009-11-06 2011-05-12 日本電気株式会社 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
US9548062B2 (en) 2009-11-06 2017-01-17 Nec Corporation Information processing apparatus, auxiliary device therefor, information processing system, control method therefor, and control program
US9190070B2 (en) 2009-11-06 2015-11-17 Nec Corporation Signal processing method, information processing apparatus, and storage medium for storing a signal processing program
US8736359B2 (en) 2009-11-06 2014-05-27 Nec Corporation Signal processing method, information processing apparatus, and storage medium for storing a signal processing program
WO2011055829A1 (ja) 2009-11-06 2011-05-12 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
WO2011148860A1 (ja) 2010-05-24 2011-12-01 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
US9837097B2 (en) 2010-05-24 2017-12-05 Nec Corporation Single processing method, information processing apparatus and signal processing program
WO2011148861A1 (ja) 2010-05-25 2011-12-01 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
EP2767978A1 (en) 2010-05-25 2014-08-20 Nec Corporation Audio signal processing
JP2011253126A (ja) * 2010-06-03 2011-12-15 Canon Inc 音声信号処理装置、及びその制御方法
JP2012003021A (ja) * 2010-06-16 2012-01-05 Canon Inc 音声処理装置及び音声処理方法、撮像装置
US8913157B2 (en) 2010-07-30 2014-12-16 Sony Corporation Mechanical noise suppression apparatus, mechanical noise suppression method, program and imaging apparatus
JP2012068342A (ja) * 2010-09-22 2012-04-05 Nec Tokin Corp 雑音除去装置
KR101739942B1 (ko) * 2010-11-24 2017-05-25 삼성전자주식회사 오디오 노이즈 제거 방법 및 이를 적용한 영상 촬영 장치
US8698921B2 (en) 2010-11-24 2014-04-15 Renesas Electronics Corporation Audio processing device, audio processing method, program, and audio acquisition apparatus
WO2012070684A1 (ja) 2010-11-25 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
US9443503B2 (en) 2010-11-25 2016-09-13 Nec Corporation Signal processing device, signal processing method and signal processing program
US9288370B2 (en) 2010-11-26 2016-03-15 Canon Kabushiki Kaisha Imaging apparatus and audio processing apparatus
JP2012118464A (ja) * 2010-12-03 2012-06-21 Nikon Corp 音声処理装置、撮像装置、音声処理方法、及び音声処理プログラム
US8842198B2 (en) 2010-12-28 2014-09-23 Sony Corporation Audio signal processing device, audio signal processing method, and program
US20120250885A1 (en) * 2011-03-30 2012-10-04 Nikon Corporation Signal-processing device, imaging apparatus, and signal-processing program
US9734840B2 (en) * 2011-03-30 2017-08-15 Nikon Corporation Signal processing device, imaging apparatus, and signal-processing program
JP2013081156A (ja) * 2011-09-21 2013-05-02 Panasonic Corp ノイズキャンセル装置
JP2013161041A (ja) * 2012-02-08 2013-08-19 Nikon Corp 信号処理装置、カメラおよび信号処理プログラム
JPWO2014017371A1 (ja) * 2012-07-25 2016-07-11 株式会社ニコン 音処理装置、電子機器、撮像装置、プログラム、及び、音処理方法
US9462174B2 (en) 2014-09-04 2016-10-04 Canon Kabushiki Kaisha Electronic device and control method
JP2017187725A (ja) * 2016-04-08 2017-10-12 キヤノン株式会社 電子機器及び制御方法
JP2017220913A (ja) * 2016-06-10 2017-12-14 キヤノン株式会社 撮像装置及びその制御方法
US10551730B2 (en) 2016-06-10 2020-02-04 Canon Kabushiki Kaisha Image capturing apparatus and method of controlling the same
US10535363B2 (en) 2017-06-05 2020-01-14 Canon Kabushiki Kaisha Audio processing apparatus and control method thereof

Similar Documents

Publication Publication Date Title
JP2006279185A (ja) 撮像装置、音声記録方法及びプログラム
JP4639907B2 (ja) 撮像装置、音声記録方法及びプログラム
JP4569389B2 (ja) 撮像装置、画像処理方法及びプログラム
JP5034605B2 (ja) 撮像装置、雑音除去方法及びプログラム
JP4466261B2 (ja) 撮像装置、明るさ補正方法及びプログラム
JP4639902B2 (ja) 撮像装置、音声記録方法及びプログラム
JP4639965B2 (ja) 撮像装置、画像処理方法及びプログラム
JP2013162425A (ja) 撮像装置、撮像方法およびプログラム
US20090109323A1 (en) Image pick-up apparatus, image playback apparatus, method of controlling a recording operation, method of controlling a displaying operation, and recording medium
JP4375325B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9154758B2 (en) Digital signal processor and digital image processing apparatus adopting the same with concurrent live view frame and picture image processing
JP2011151481A (ja) 音声信号処理装置、音声信号処理システム
JP2004222236A (ja) 撮像装置、画像編集方法及びプログラム
JP4525459B2 (ja) 動画処理装置、動画処理方法及びプログラム
JP5304080B2 (ja) 画像再生装置および画像再生プログラム
JP2012203040A (ja) 音声信号処理装置、及びその制御方法
JP2005072729A (ja) 電子カメラ及び画像撮影方法
JP2006094200A (ja) 撮像装置、合焦表示方法及びプログラム
JP4378278B2 (ja) 撮像装置
JP2006179996A (ja) 電子カメラ、ノイズ低減装置、ノイズ低減制御プログラム及びノイズ低減方法
JP5911253B2 (ja) 撮像装置
JP6071188B2 (ja) 音声信号処理装置
JP2006217111A (ja) 動画撮影装置、及び動画撮影方法
JP2022180927A (ja) 音声処理装置、制御方法、およびプログラム
JP2022039940A (ja) 音声処理装置、制御方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102