JP2006287387A - 撮像装置、音声記録方法及びプログラム - Google Patents

撮像装置、音声記録方法及びプログラム Download PDF

Info

Publication number
JP2006287387A
JP2006287387A JP2005101972A JP2005101972A JP2006287387A JP 2006287387 A JP2006287387 A JP 2006287387A JP 2005101972 A JP2005101972 A JP 2005101972A JP 2005101972 A JP2005101972 A JP 2005101972A JP 2006287387 A JP2006287387 A JP 2006287387A
Authority
JP
Japan
Prior art keywords
noise
signal
spectrum
sound
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005101972A
Other languages
English (en)
Other versions
JP4639907B2 (ja
Inventor
Takao Sugaya
孝夫 菅家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2005101972A priority Critical patent/JP4639907B2/ja
Publication of JP2006287387A publication Critical patent/JP2006287387A/ja
Application granted granted Critical
Publication of JP4639907B2 publication Critical patent/JP4639907B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】撮影時に雑音スペクトルを適切に使用して、音声信号に含まれる機構音の雑音成分を適切に除去する。
【解決手段】撮影時に参照入力部64(参照マイク)から入力されるモータ音のみを信号のパワーを短時間パワー算出部66にて算出し、そのモータ音パワーからモータ音の発生タイミングを判断して雑音除去処理(サブトラクト処理)を行う。また、音声入力部51(主マイク)からの入力音声を増幅器61にて増幅調整する機能を備える場合に、記憶部54に記憶された雑音スペクトル(Xv)に入力音声のレベルに応じた係数を乗じ、音声信号のスペクトル(Ia)からその係数乗算後の雑音スペクトル(Xv)を減算する。これにより、撮影時に雑音スペクトルを適切に使用して、音声信号に含まれる機構音の雑音成分を適切に除去することができる。
【選択図】 図3

Description

本発明は、デジタルカメラ等の撮像装置に係り、特に撮影中に入力された音声信号を撮影画像と共に記録可能な機能を備えた撮像装置と、この撮像装置に用いられる音声記録方法及びプログラムに関する。
従来から音声信号に重畳した雑音を除去するための手法として、スペクトルサブトラクション(spectral subtraction)法が知られている。このスペクトルサブトラクション法(以下、SS法と呼ぶ)とは、無音区間におけるスペクトルを雑音スペクトルと推定し、その雑音スペクトルに所定の係数(サブトラクト係数)を乗じた信号を入力音声スペクトルから差し引くことで雑音成分を除去する方法である。
ここで、特許文献1では、前記SS法を用いた雑音除去システムにおいて、サブトラクト係数を音声信号のフレームパワーに依存してフレーム毎に変化させることにより、推定雑音スペクトルの引き過ぎによるスペクトル歪を減少させることが開示されている。すなわち、母音のような音声パワーが確保されている区間は通常のサブトラクト係数を掛け、破裂子音のような音声パワーの少ない部分ではサブトラクト係数を小さくすることにより、推定雑音スペクトルの引き過ぎによる入力音声スペクトルの歪を抑えるようにしている。
特開平8−221092号公報
上述したように、SS法を用いて入力音声から雑音成分を除去する方法が知られている。しかしながら、音声付きの動画撮影機能を備えたデジタルカメラでは、その撮影中に音声入力とは無関係にズーム音やフォーカス音などの機構音が発生して入力音声に入り込む問題がある。
この場合、前記特許文献1のように、無音区間の音声スペクトル信号から雑音スペクトルを推定する方法では、音声入力とは無関係に発生する機構音を雑音として除去することはできない。
特に、デジタルカメラでは、ユーザがズーム操作を行った場合に、そのズーム操作に伴ってモータ駆動信号が出力されてから実際にモータが駆動されるまでに多少の時間がかかる。このため、入力音声のスペクトルから雑音スペクトルを減算するタイミングが実際のモータ音の発生時期と合わず、雑音成分を適切に除去できないことがある。
また、入力音声レベルの自動調整機能を備えたデジタルカメラでは、入力音声が小さくなると増幅率を上げ、入力音声が大きくなると増幅率を下げることにより、記録される音声レベルを一定に保っている。これにより、音声レベルは一定に保たれるが、入力音声に含まれるモータ音のレベルまでも変化してしまい、単純に雑音スペクトルを減算してしまうと、そのときのモータ音の入力レベルに合わずに引き過ぎや引き残しなどを招いてしまう問題がある。
このように、SS方式においては、雑音スペクトルを減算するタイミングや雑音スペクトルを減算する量(係数)にずれを生じさせる様々な要因がある。
本発明は前記のような点に鑑みなされたもので、撮影時に雑音スペクトルを適切に使用して、音声信号に含まれる機構音の雑音成分を適切に除去することのできる撮像装置、音声記録方法及びプログラムを提供することを目的とする。
本発明の請求項1に係る撮像装置は、音声付き動画撮影を行う場合に、音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録機能を備えた撮像装置であって、音声信号を入力する音声入力手段と、この音声入力手段から入力される音声信号をスペクトル信号に変換する変換手段と、前記音声入力手段を通じて事前に採取した機構音のスペクトルを雑音スペクトルとして記憶した記憶手段と、撮影時に音声信号と共に入力される機構音のパワーに基づいて雑音除去を行うタイミングを決定するタイミング決定手段と、このタイミング決定手段によって決定されたタイミングに従って、前記記憶手段に記憶された雑音スペクトルに当該入力音声のレベルに応じて設定される係数を乗じ、前記変換手段によって変換された音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去する雑音除去手段と、この雑音除去手段によって得られた雑音除去後の音声スペクトル信号を元の音声信号に逆変換する逆変換手段と、この逆変換手段によって得られた音声信号を撮影画像と共に記録する記録手段とを具備したことを特徴とする。
このような構成によれば、撮影時に音声信号と共に入力される機構音のパワーに基づいて雑音除去を行うタイミングが決定される。この決定されたタイミングに従って、雑音スペクトルに当該入力音声のレベルに応じた係数が乗じられ、音声信号のスペクトルから係数乗算後の雑音スペクトルが減算される。これにより、機構音の発生タイミングに合わせて雑音スペクトルを適切に使用して、音声信号に含まれる機構音の雑音成分を適切に除去でき、その雑音除去後の音声信号を撮影画像と共に記録することができる。
また、本発明の請求項2は、前記請求項1記載の撮像装置において、前記音声入力手段から入力される音声信号のパワーに応じて増幅率を調整する増幅調整手段を備え、前記変換手段は、この増幅調整手段によって増幅調整された音声信号を前記変換手段によるスペクトル変換対象として入力し、前記雑音除去手段は、前記雑音スペクトルに乗じる係数を前記増幅率に応じて変更することを特徴とする。
このような構成によれば、入力された音声信号の増幅率を調整する増幅率調整機能を備えた場合であっても、雑音スペクトルに乗じる係数を増幅率に合わせて調整することにより、雑音スペクトルを適切に使用して入力音声から雑音成分を適切に除去することができる。
また、本発明の請求項3は、前記請求項1記載の撮像装置において、機構音の発生源近傍に設けられた機構音入力手段と、この機構音入力手段から入力される機構音のパワーが所定値以上であるか否かを判定する判定手段とを備え、前記タイミング決定手段は、前記判定手段による判定結果に基づいて雑音除去を行うタイミングを決定することを特徴とする。
このような構成によれば、機構音のパワーに基づいて機構音の発生タイミングを正確に判断でき、その機構音の発生タイミングに合わせて雑音スペクトルを適切に使用して入力音声から雑音成分を適切に除去することができる。この場合、音声入力手段からの入力音ではタイミング判定のための閾値(所定値)を正確に設定できないが、機構音の発生源近傍に設けられた機構音入力手段を用いて機構音のみを入力するので、その機構音入力手段からの入力音に対してタイミング判定のための閾値を正確に設定して、雑音除去を適切に行うことが可能となる。
また、本発明の請求項4は、前記請求項3記載の撮像装置において、前記記憶手段は、モータ駆動に伴って発生する機構音の雑音スペクトルを複数のモータの各々に対応して記憶し、前記複数のモータの各々に対する駆動開始および駆動停止を独立して指示するモータ制御手段を備え、前記前記雑音除去手段は、前記モータ制御手段により前記各モータのいずれかのモータの駆動開始が指示された後に前記判定手段により機構音のパワーが所定値以上であると判定された場合に、前記記憶手段に記憶された当該モータに対応した雑音スペクトルに基づく雑音除去動作を開始し、前記モータ制御手段により当該モータの駆動停止が指示された後に前記判定手段により機構音のパワーが所定値より小さいと判定された場合に、その雑音除去動作を停止することを特徴とする。
このような構成によれば、複数のモータを備える場合であっても、それぞれのモータ駆動時に当該モータに対応した雑音スペクトルを適切なタイミングで使用して、入力音声から雑音成分を適切に除去することができる。
本発明の請求項5に係る撮像装置は、音声付き動画撮影を行う場合に、音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録機能を備えた撮像装置であって、音声信号を入力する音声入力手段と、前記音声入力手段から入力される音声信号のパワーに応じて増幅率を調整する増幅調整手段と、この増幅調整手段によって増幅調整された音声信号をスペクトル信号に変換する変換手段と、前記音声入力手段を通じて事前に採取した機構音のスペクトルを雑音スペクトルとして記憶した記憶手段と、撮影時に前記増幅調整手段によって調整される増幅率に基づいて前記雑音スペクトルに乗じる係数を決定する係数決定手段と、前記記憶手段に記憶された雑音スペクトルに前記係数決定手段によって決定された係数を乗じ、前記変換手段によって変換された音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去する雑音除去手段と、この雑音除去手段によって得られた雑音除去後の音声スペクトル信号を元の音声信号に逆変換する逆変換手段と、この逆変換手段によって得られた音声信号を撮影画像と共に記録する記録手段とを具備したことを特徴とする。
このような構成によれば、入力された音声信号の増幅率を調整する増幅率調整機能を備えた場合であっても、雑音スペクトルに乗じる係数を増幅率に合わせて調整することにより、雑音スペクトルを適切に使用して入力音声から雑音成分を適切に除去することができる。
本発明の請求項6に係る音声記録方法は、音声付き動画撮影を行う場合に、音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録方法であって、音声信号を入力するステップと、前記入力された音声信号をスペクトル信号に変換するステップと、撮影時の入力音のパワーに基づいて雑音除去を行うタイミングを決定するステップと、前記タイミングに従って、予め用意された雑音スペクトルに当該入力音声のレベルに応じて設定される係数を乗じ、前記音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去するステップと、この雑音除去後の音声スペクトル信号を元の音声信号に逆変換するステップと、この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録するステップとを備えたことを特徴とする。
このような音声記録方法によれば、前記各ステップに従った処理を実行することにより、前記請求項1記載の発明と同様の作用効果が奏せられる。
本発明の請求項7に係る音声記録方法は、音声付き動画撮影を行う場合に、音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録方法であって、音声信号を入力するステップと、前記入力された音声信号のパワーに応じて増幅率を調整するステップと、この増幅調整後の音声信号をスペクトル信号に変換するステップと、撮影時に前記増幅率に基づいて予め用意された雑音スペクトルに乗じる係数を決定するステップと、前記雑音スペクトルに前記増幅率に基づいて決定された係数を乗じ、前記音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去するステップと、この雑音除去後の音声スペクトル信号を元の音声信号に逆変換するステップと、この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録するステップとを備えたことを特徴とする。
このような音声記録方法によれば、前記各ステップに従った処理を実行することにより、前記請求項5記載の発明と同様の作用効果が奏せられる。
本発明の請求項8に係るプログラムは、音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する機能を備えたコンピュータによって実行されるプログラムであって、前記コンピュータに、音声信号を入力する機能と、前記入力された音声信号をスペクトル信号に変換する機能と、撮影時の入力音のパワーに基づいて雑音除去を行うタイミングを決定する機能と、前記タイミングに従って、予め用意された雑音スペクトルに当該入力音声のレベルに応じて設定される係数を乗じ、前記音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去する機能と、この雑音除去後の音声スペクトル信号を元の音声信号に逆変換する機能と、この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録する機能とを実現させることを特徴とする。
したがって、コンピュータが前記各機能を実現するためのプログラムを実行することにより、前記請求項1記載の発明と同様の作用効果が奏せられる。
本発明の請求項9に係るプログラムは、音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する機能を備えたコンピュータによって実行されるプログラムであって、前記コンピュータに、音声信号を入力する機能と、前記入力された音声信号のパワーに応じて増幅率を調整する機能と、この増幅調整後の音声信号をスペクトル信号に変換する機能と、撮影時に前記増幅率に基づいて予め用意された雑音スペクトルに乗じる係数を決定する機能と、前記雑音スペクトルに前記増幅率に基づいて決定された係数を乗じ、前記音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去する機能と、この雑音除去後の音声スペクトル信号を元の音声信号に逆変換する機能と、この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録する機能とを実現させることを特徴とする。
したがって、コンピュータが前記各機能を実現するためのプログラムを実行することにより、前記請求項5記載の発明と同様の作用効果が奏せられる。
以上のように本発明によれば、音声付き動画撮影を行う場合において、撮影時に音声信号と共に入力される機構音の発生タイミングや、機構音の入力レベルに合わせて雑音スペクトルを適切に使用して、入力音声から機構音の雑音成分を適切に除去することができ、その雑音除去後の音声信号を撮影画像と共に高品質に記録することができる。
以下、図面を参照して本発明の実施形態を説明する。
図1は本発明の撮像装置としてデジタルカメラを例にした場合の外観構成を示す図であり、図1(a)は主に前面の構成、同図(b)は主に背面の構成を示す斜視図である。
このデジタルカメラ1は、略矩形の薄板状ボディ2の前面に、撮影レンズ3、セルフタイマランプ4、光学ファインダ窓5、ストロボ発光部6、マイクロホン部7などを有し、上面の(ユーザにとって)右端側には電源キー8及びシャッタキー9などが設けられている。
電源キー8は、電源のオン/オフ毎に操作するキーであり、シャッタキー9は、撮影時に撮影タイミングを指示するキーである。
また、デジタルカメラ1の背面には、撮影モード(R)キー10、再生モード(P)キー11、光学ファインダ12、スピーカ部13、マクロキー14、ストロボキー15、メニュー(MENU)キー16、リングキー17、セット(SET)キー18、表示部19などが設けられている。
撮影モードキー10は、電源オフの状態から操作することで自動的に電源オンとして静止画の撮影モードに移行する一方で、電源オンの状態から繰返し操作することで、静止画モード、動画モードを循環的に設定する。静止画モードは、静止画を撮影するためのモードである。また、動画モードは、動画を撮影するためのモードであり、特に本実施形態では音声付き動画撮影が可能であるとする。
前記シャッタキー9は、これらの撮影モードに共通に使用される。すなわち、静止画モードでは、シャッタキー9が押下されたときのタイミングで静止画の撮影が行われる。動画モードでは、シャッタキー9が押下されたときのタイミングで動画の撮影が開始され、シャッタキー9が再度押下されたときにその動画の撮影が終了する。
再生モードキー11は、電源オフの状態から操作することで自動的に電源オンとして再生モードに移行する。
マクロキー14は、静止画の撮影モードで通常撮影とマクロ撮影とを切換える際に操作する。ストロボキー15は、ストロボ発光部6の発光モードを切換える際に操作する。メニューキー16は、各種メニュー項目等を選択する際に操作する。リングキー17は、上下左右各方向への項目選択用のキーが一体に形成されたものであり、このリングキー17の中央に位置するセットキー18は、その時点で選択されている項目を設定する際に操作する。
表示部19は、バックライト付きのカラー液晶パネルで構成されるもので、撮影モード時には電子ファインダとしてスルー画像のモニタ表示を行う一方で、再生モード時には選択した画像等を再生表示する。
また、このデジタルカメラ1には、光学ズーム機能が備えられており、ズームキー20a,20bの操作により焦点距離を物理的に変化させて画像の拡大率を変更することができる。ズームキー20a,20bのうち、一方のズームキー20aはテレ端用であり、望遠側へズーム倍率を変更する場合に用いられる。他方のズームキー20bはワイド端用であり、広角側へズーム倍率を変更する場合に用いられる。
なお、図示はしないがデジタルカメラ1の底面には、記録媒体として用いられるメモリカードを着脱するためのメモリカードスロットや、外部のパーソナルコンピュータ等と接続するためのシリアルインタフェースコネクタとして、例えばUSB(Universal Serial Bus)コネクタ等が設けられている。
図2はデジタルカメラ1の電子回路構成を示すブロック図である。
このデジタルカメラ1には、前記撮影レンズ3を構成する図示せぬフォーカスレンズおよびズームレンズなどを含むレンズ光学系22が光軸方向に所定の範囲内で移動可能に設けられている。このレンズ光学系22は、モータ駆動部21aによって回転駆動されるモータ21により移動する。
なお、前記モータ21として、ズーム倍率調整用のモータ(ズームモータ)、フォーカス調整用のモータ(フォーカスモータ)などの複数の異なるモータを含み、それぞれに対応したモータ駆動部21aが設けられているものとする。
このモータ21の光軸後方に撮像素子であるCCD(charge coupled device)23が配設されている。このCCD23は、撮影レンズ3を通して入力される被写体の各部位からの光を受光し、その光の強度に応じた電気信号を出力する。
基本モードである記録モード時において、CCD23がタイミング発生器(TG)24、ドライバ25によって走査駆動され、一定周期毎に結像した光像に対応する光電変換出力を1画面分出力する。このCCD23の光電変換出力は、アナログ値の信号の状態でRGBの各原色成分毎に適宜ゲイン調整された後に、サンプルホールド回路26でサンプルホールドされ、A/D変換器27でデジタルデータに変換される。
そして、画像処理回路28において、画素補間処理及びγ補正処理を含む画像処理が行われて、デジタル値の輝度信号Y及び色差信号U,V(Cb,Cr)が生成され、DMA(Direct Memory Access)コントローラ29に出力される。
DMAコントローラ29は、画像処理回路28の出力する輝度信号Y及び色差信号U,Vを、同じく画像処理回路28からの複合同期信号、メモリ書込みイネーブル信号、及びクロック信号を用いて一度DMAコントローラ29内部のバッファに書き込み、DRAMインタフェース(I/F)30を介してバッファメモリとして使用されるDRAM31にDMA転送を行う。
制御部32は、デジタルカメラ1全体の制御を行うものであり、CPUと、このCPUで実行される動作プログラムを記憶したROM、及びワークメモリとして使用されるRAMなどを含むマイクロコンピュータにより構成される。この制御部32は、前記輝度及び色差信号のDRAM31へのDMA転送終了後に、この輝度及び色差信号をDRAMインタフェース30を介してDRAM31より読み出し、VRAMコントローラ33を介してVRAM34に書き込む。
デジタルビデオエンコーダ35は、前記輝度及び色差信号をVRAMコントローラ33を介してVRAM34より定期的に読み出し、これらのデータを元にビデオ信号を発生して表示部19に出力する。
この表示部19は、上述した如く撮影時にはモニタ表示部(電子ファインダ)として機能するもので、デジタルビデオエンコーダ35からのビデオ信号に基づいた表示を行うことで、その時点でVRAMコントローラ33から取込んでいる画像情報に基づく画像をリアルタイムに表示することとなる。
このように、表示部19にその時点での画像がモニタ画像としてリアルタイムに表示されている状態で、例えば静止画撮影を行いたいタイミングでシャッタキー9を押下操作すると、トリガ信号が発生する。
制御部32は、このトリガ信号に応じて、その時点でCCD23から取込んでいる1画面分の輝度及び色差信号のDRAM31へのDMA転送の終了後、直ちにCCD23からのDRAM31への経路を停止し、記録保存の状態に遷移する。
この記録保存の状態では、制御部32がDRAM31に書き込まれている1フレーム分の輝度及び色差信号をDRAMインタフェース30を介してY,Cb,Crの各コンポーネント毎に縦8画素×横8画素の基本ブロックと呼称される単位で読み出して、JPEG(Joint Photograph coding Experts Group)回路37に書き込み、このJPEG回路37でADCT(Adaptive Discrete Cosine Transform:適応離散コサイン変換)、エントロピ符号化方式であるハフマン符号化等の処理によりデータ圧縮する。
そして得た符号データを1画像のデータファイルとして該JPEG回路37から読み出して記録用のメモリ38に書き込む。このメモリ38としては、予め本体に内蔵されたフラッシュメモリ等の内部メモリの他に、記録媒体として着脱自在に装着されるメモリカードなどを含む。1フレーム分の輝度及び色差信号の圧縮処理及びメモリ38への全圧縮データの書込み終了に伴って、制御部32はCCD23からDRAM31への経路を再び起動する。
制御部32には、さらに音声処理部39、USBインタフェース(I/F)40、ストロボ駆動部41が接続される。
音声処理部39は、PCM音源等の音源回路を備え、音声の録音時には前記マイクロホン部(MIC)7より入力された音声信号をデジタル化し、所定のデータファイル形式、例えばMP3(MPEG−1 audio layer 3)規格に従ってデータ圧縮して音声データファイルを作成してメモリ38へ送出する一方、音声の再生時にはメモリ38から読み出された音声データファイルの圧縮を解いてアナログ化し、上述したデジタルカメラ1の背面側に設けられるスピーカ部(SP)13を通じて出力する。
なお、この音声処理部39には、後述するように、マイクロホン部(MIC)7とは別にモータ21の近くに設置された参照マイク7aが接続されている。この参照マイク7aは、雑音除去用として主にモータ音を入力するための入力手段として用いられるものである。
USBインタフェース40は、USBコネクタを介して有線接続されるパーソナルコンピュータ等の他の情報端末装置との間で画像データ、その他の送受を行う場合の通信制御を行う。ストロボ駆動部41は、撮影時に図示せぬストロボ用の大容量コンデンサを充電した上で、制御部32からの制御に基づいてストロボ発光部6を閃光駆動する。
なお、前記キー入力部36は、上述したシャッタキー9の他に、電源キー8、撮影モードキー10、再生モードキー11、マクロキー14、ストロボキー15、メニューキー16、リングキー17、セットキー18、ズームキー20a,20bなどから構成され、それらのキー操作に伴う信号は直接制御部32へ送出される。
また、静止画像ではなく動画像の撮影時においては、シャッタキー9が押下操作されたときに、上述したJPEG回路37によりmotion−JPEG(Joint Photographic Experts Group)などの手法により撮影動画をデータ圧縮してメモリ38へ記録する。この場合、音声付き動画撮影であれば、その撮影中にマイクロホン部(MIC)7より入力された音声信号が動画データと共に前記メモリ38に記録されることになる。再度シャッタキー9が操作されると、動画データの記録を終了する。
一方、基本モードである再生モード時には、制御部32がメモリ38に記録されている画像データを選択的に読み出し、JPEG回路37で記録モード時にデータ圧縮した手順と全く逆の手順で、圧縮されている画像データを伸長する。そして、この伸長した画像データをDRAMインタフェース30を介してDRAM31に保持させた上で、このDRAM31の保持内容をVRAMコントローラ33を介してVRAM34に記憶させ、このVRAM34より定期的に画像データを読み出してビデオ信号を発生し、表示部19で再生出力させる。
選択した画像データが静止画像ではなく動画像であった場合には、その動画データを構成する複数フレームの静止画データを時系列の順で順次再生して表示し、すべての静止画データの再生を終了した時点で、例えば、次に再生の指示がなされるまで先頭に位置する静止画データを表示するなどを行う。その際、当該動画データに音声データが含まれていれば、その音声データがスピーカ部(SP)13を通じて出力されることになる。
次に、このデジタルカメラ1に用いられる雑音除去機能を備えた音声記録装置について説明する。
図3は本発明の一実施形態に係るデジタルカメラ1に用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。
この音声記録装置は、主としてデジタルカメラ1の音声付き動画撮影に用いられるものであり、その撮影中に音声信号に混入するズーム音やフォーカス音などの機構音を雑音として除去する機能を備えている。
本実施形態において、この音声記録装置は、モータ21、モータ駆動部21a、制御部32、キー入力部36、音声入力部51、フレーム分割部52、フーリエ変換部53、スペクトル記憶部54、サブトラクト部55、逆フーリエ変換部57、波形合成部58を備える。また、この音声記録装置は、増幅器61、入力パワー算出部62、サブトラクト係数制御部63を備える。さらに、別系統として、参照入力部64、フレーム分割部65、短時間パワー算出部66を備える。
なお、前記各構成部のうち、51〜55,57,58、61〜66の部分は図2に示したデジタルカメラ1の音声処理部39に含まれる。
モータ21はズームレンズなどのレンズ光学系22を光軸方向に移動させるためのモータであり、モータ駆動部21aはそのモータ21を回転駆動させるための駆動機構である。
制御部32は、キー入力部36に含まれるズームキー20a,20bなどの操作信号を受けてモータ駆動制御信号をモータ駆動部21aに出力すると共に、ここでは、音声付き動画撮影中にモータ21の駆動タイミングに基づいてサブトラクト係数制御部63を制御する機能を備える。
一方、音声入力部51は、図1に示すデジタルカメラ1の機器筐体上に設置されたマイクロホン部7を主マイクとして含み、この主マイクを通じて入力される音声信号を主信号として増幅器61を介してフレーム分割部52に与える。この場合、音声付き動画撮影中に例えばズーム操作が行われると、そのズーム操作に伴って発生するモータ音(ズーム音)が音声入力部51を通じて音声信号と共に入り込むことになる。
フレーム分割部52は、増幅器61を介して入力された音声信号(主信号)を所定時間分のフレーム単位で分割する。フーリエ変換部53は、このフレーム分割部52によってフレーム単位で分割された音声信号をフーリエ変換し、周波数毎のパワーを示したスペクトル信号(Ia)に変換する。
スペクトル記憶部54には、音声入力部51(主マイク)を通じて事前に採取したモータ音のスペクトル信号が雑音スペクトル信号として記憶されている。サブトラクト部55は、フーリエ変換部53によって得られた入力音声スペクトル信号(Ia)と、スペクトル記憶部54から出力された雑音スペクトル信号(Xv)に基づいて、SS(spectral subtraction)法による雑音除去処理を行う。
詳しくは、入力音声スペクトル信号(Ia)から雑音スペクトル信号(Xv)に所定のサブトラクト係数αを乗じた信号を減算することで、音声信号に含まれる雑音成分を除去する処理を行う。後述するように、このサブトラクト係数αの値は、入力音声のレベルに応じて調整される。
逆フーリエ変換部57は、このサブトラクト部55によって雑音除去処理された音声スペクトル信号(Ib)を逆フーリエ変換して元のフレーム単位毎の音声信号に戻す。
波形合成部58は、この逆フーリエ変換部57によって得られるフレーム単位毎の音声信号を合成することで時系的に連続した音声信号に復元する。この音声信号は、最終的な記録用の音声信号として用いられ、デジタルカメラ1の撮像系から得られる動画データと共に図2に示したメモリ38に記録される。
また、入力パワー算出部62は、入力音声信号の所定区間の短時間パワー(入力音声の音量)を算出し、そのパワー値を示す音声パワー信号を増幅器61およびサブトラクト係数制御部63にそれぞれ出力する。なお、入力パワー算出部62のパワー算出区間とフレーム分割部52のフレーム切出し区間は異なり、パワー算出区間の方が長くなる。
増幅器61は、この入力パワー算出部62から出力される音声パワー信号に従って、入力音声を増幅調整してからフレーム分割部52に出力する。サブトラクト係数制御部63は、撮影時にサブトラクト部55によって雑音スペクトル信号(Xv)に乗じるサブトラクト係数αの値を制御する。
一方、参照入力部64は、主としてモータ音を集音するための参照マイク7aを含み、この参照マイク7aを通じて入力されるモータ音のみの信号を参照信号としてフレーム分割部65に与える。参照マイク7aは、主マイクマイクロホン部(MIC)7とは別に機器筐体内のモータ21の近傍に設置されており、そのモータ駆動時に発生するモータ音のみを入力する。
フレーム分割部65は、この参照入力部61によって入力されたモータ音のみの信号(参照信号)を所定時間分のフレーム単位で分割する。短時間パワー算出部66は、参照入力部64から得られるモータ音信号のフレーム単位毎のパワー(モータ音の音量)を算出し、そのパワー値を示すモータパワー信号を制御部32に出力する。
制御部32では、この短時間パワー算出部66から出力されるモータパワー信号に基づいてモータ音の発生タイミングを判断し、そのタイミングに従って雑音スペクトル信号(Xv)に適切なサブトラクト係数αを乗じてサブトラクト処理(雑音除去処理)を行うようにサブトラクト係数制御部63を制御する。
次に、本実施形態の動作について説明する。
今、音声付き動画撮影を行っている最中に、例えばユーザがキー入力部36に含まれるズームキー20a,20bを操作したとする。
デジタルカメラ全体の動作を制御する制御部32は、キー入力部36に含まれるズームキー20a,20bのズーム操作信号を入力すると、モータ駆動部21aに対して駆動開始信号を送る。モータ駆動部21aは、この駆動開始信号を受けてモータ21を回転駆動する。このモータ21の回転に伴い、図2のレンズ光学系22に含まれる図示せぬズームレンズが光軸上に移動してズーム倍率が変化する。
また、ユーザがズーム操作を終了すると、制御部32はモータ駆動部21aに対して駆動停止信号を送る。これにより、モータ21の回転駆動が停止し、ズーム動作が終了する。
ここで、音声付き動画の撮影中は常にマイクロホン部7による音声入力機能がON状態にある。このため、前記ズーム操作に伴って発生するモータ音が入力音声の中に雑音として混入する問題がある。このようなモータ音を音声信号から除去して記録するべく、以下のような処理が行われる。
すなわち、まず、雑音除去対象となるモータ音(機構音)のスペクトル信号を事前に採取しておき、スペクトル記憶部54に記憶しておく。以下では、ズーム操作時に発生するモータ音つまりズーム音を雑音除去対象として説明する。
ズーム音の採取方法は、無音状態でズーム操作を行い、そのときに発生するズーム音のみを音声入力部51に入力することで行う。この入力したズーム音をデジタル信号に変換した後、フレーム分割部52により数10ms程度のフレーム区間に切り出し、フーリエ変換部53によりスペクトル信号に変換する。これをモータ駆動期間(ズームモータの駆動開始から駆動停止までの期間)について行い、その間にフレーム単位で順次得られるスペクトル信号の平均値を雑音スペクトル信号としてスペクトル記憶部54に記憶しておく。
上述したように、撮影中にズーム操作を行うと、音声入力部51には音声信号に加えて、そのときに発生するモータ音が雑音として入力される。このため、フーリエ変換部53からは入力音声のスペクトルとモータ音のスペクトルが混合したスペクトル信号Iaが出力されることになる。
サブトラクト部55では、このモータ音を含んだ入力音声スペクトル信号Iaと、前記スペクトル記憶部54に予め記憶された雑音スペクトル信号(Xv)とに基づいてSS法による雑音除去処理を行う。
この雑音除去処理について、図4を参照して詳しく説明する。
図4はSS法(スペクトルサブトラクション法)を用いた雑音除去処理を説明するための図である。図4(a)は入力音声の波形データ、同図(b)はこの入力音声をフレーム単位でフーリエ変換して得られた音声スペクトル信号である。
また、同図(c)は雑音除去用に採取したモータ音のスペクトルつまり雑音スペクトル信号(Xv)、同図(d)はその雑音スペクトル信号(Xv)に所定のサブトラクト係数αを乗じた信号である。同図(e)は入力音声スペクトル信号(Ia)から係数乗算後の雑音スペクトル信号(Xv)を減算して得られるスペクトル信号つまり雑音除去後の音声スペクトル信号(Ib)である。同図(f)はその雑音除去後の音声スペクトル信号(Ib)を逆フーリエ変換して得られた音声信号、同図(g)はフレーム単位で分割された音声信号を時系列に合成して元の音声波形に戻した状態を示している。
今、図4(a)に示すような波形を有する音声信号が音声入力部51に入力されたとする。この音声信号には、例えばズーム操作に伴って発生するモータ音つまりズーム音が雑音として混入されている。
まず、フレーム分割部52において、例えば10ms程度のフレーム区間で音声信号を切り出し、同図(b)に示すように、フーリエ変換部53にて周波数毎のパワーを表した入力音声スペクトル信号Iaを生成する。
ここで、同図(c)に示すように、スペクトル記憶部54には予め採取したモータ音のみのスペクトル信号が雑音スペクトル信号(Xv)として記憶されている。そこで、同図(c)〜(e)に示すように、サブトラクト部55において、入力音声スペクトル信号Iaから雑音スペクトル信号(Xv)に所定のサブトラクト係数αを乗じた信号を減算することにより、雑音除去後の音声スペクトル信号(Ib)を得る。
なお、前記サブトラクト係数αは、入力音声のレベルに応じて設定され、通常、“1”以上の値である。
制御部32では、ズーム操作が行われている間、つまり、ズームモータであるモータ21の駆動期間中(モータ駆動開始〜駆動停止までの期間)において、サブトラクト部55に所定のサブトラクト係数αを与えて雑音除去処理を行うようにサブトラクト係数制御部63を制御する。
図4(f)に示すように、この雑音除去後の音声スペクトル信号Ibは逆フーリエ変換部57にて逆フーリエ変換される。そして、同図(g)に示すように、波形合成部58にて各フレーム毎の音声信号が時系列に合成処理されて、元のアナログ波形信号である音声信号に復元される。この音声信号は、雑音除去後の音声信号として動画撮影中に画像データと共にメモリ38に記録される。
なお、前記のような雑音除去処理において、実際にはフレーム分割部52にて音声信号をフレーム分割してフーリエ変換する前に、音声信号に「ハニング窓」等の窓関数をかけておく。また、後段の波形合成部58で逆フーリエ変換後の音声信号をフレーム毎に合成処理する際にフレーム境界で不連続な波形になるのを防止するために、フレーム毎の音声信号を多少オーバーラップして合成していく。
例えば、フレーム長が256サンプルとして分析ポイントを128サンプルずつシフトしていく。この場合のハニング窓は式(1)のように表せる。
w(n)=0.5−cos{2*PI*n/(L−1)} …(1)
L:1フレームのサンプル数
n=0,1,…,L−1
このように、各信号を1/2フレームずらして重ね合わせると、振幅が一定で不連続点のない音声波形を得ることができる。
以上がサブトラクト処理を行う場合の基本的な流れである。
次に、(1)自動増幅率制御システム、(2)モータ音の発生タイミングに関する処理について説明する。
(1)自動増幅率制御システム
デジタルカメラ1における音声入力システムでは、入力音声のレベルをほぼ一定に保つために、入力音声を増幅する増幅器61と、入力音声のパワーを算出する入力パワー算出部62を有して、入力音声のパワーが小さい場合には増幅率を大きくし、逆に入力音声のパワーが大きい場合は増幅率を小さくしている。これを自動増幅率制御システム(AGC:Auto−Gain−ControlまたはALC:Auto−Leve1−Control)と呼ぶ。
このような自動増幅率制御システムが搭載されていると、音声入力部51から主信号として入力された音声信号は増幅器61にて所定の倍率kで増幅された後、フレーム分割部52にて数10ms程度のフレームに分割され、続いて、フーリエ変換部53にてスペクトル信号(Ia)に変換される。この入力音声スペクトル信号(Ia)に雑音として含まれるモータ音のスペクトルもk倍されている。
一方、スペクトル記憶部54に記憶された雑音スペクトル信号(Xv)は、通常レベル(k=1)で採取したモータ音のスペクトルであることから、そのままサブトラクト部55の雑音除去処理に適用すると、k=1より大きい場合には、スペクトルの引き残しが発生し、その結果、波形合成部58から出力される音声信号にはズーム音が残ってしまう。また、k=1より小さい場合には、入力音声スペクトル信号(Ia)から過大なスペクトルを減算してしまうことになる。このため、入力音声に含まれる雑音成分は除去されるが、スペクトルの引きすぎにより音声信号自体が歪んでしまう。
この様子を図5に示す。
図5は入力音声の増幅率に関係なくサブトラクト係数を一定である場合での各部の出力波形を示す図である。なお、図中のA部〜F部の付記は図3の各構成部に付した(A)〜(F)に対応している。
今、図5(a)に示すような音量の音声と周囲音を入力対象とする。撮影時に同図(b)に示すようなタイミングでモータ駆動信号が出力されると、そのモータ音が音声信号と共に音声入力部51から入り込むため、入力音声は同図(c)のようにモータ音を含んだ音量を有することになる。
ここで、入力音量に応じて同図(d)に示すような増幅率が増幅器61に設定され、同図(e)のようにレベル調整された音声スペクトル信号(Ia)がサブトラクト部55に与えられることになる。
ところが、同図(f)に示すように、サブトラクト係数αの値が増幅率に関係なく一定であると、サブトラクト部55にて雑音スペクトル信号(Xv)を減じる際に前記レベル調整後の音声スペクトル信号(Ia)の入力レベルと合わずに、出力音量が同図(g)のように歪んだものとなる。
このような問題を解消するため、本実施形態では、サブトラクト係数制御部63により入力音声の増幅率に応じてサブトラクト係数αを変更して雑音除去処理を行うことを第1の特徴としている。
すなわち、モータ駆動期間では、サブトラクト部55にて音声スペクトル信号(Ia)から雑音スペクトル信号(Xv)にサブトラクト係数αを乗じた信号を減算することで、入力音声に含まれる雑音成分を除去している。このときのサブトラクト部55の出力をIbとすると、以下のような式(2)で表せる。
Ib=Ia−α*Xv …(2)
ここで、サブトラクト係数制御部63は、増幅器61で調整される入力音声の増幅率が所定値よりも大きい時はサブトラクト係数αをその増幅率の増加量に合わせて大きくし、逆に増幅率が所定値よりも小さい時はサブトラクト係数αをその増幅率の減少量に合わせて小さくするようにサブトラクト部55の動作を制御する。なお、増幅器61の増幅率が現在どのくらいに調整設定されているのかは、入力パワー算出部62から出力される音声パワー信号から判断できる。
一方、モータ21が駆動されていない期間では、サブトラクト係数制御部63は、α=0としてサブトラクト部55の動作を制御する。これにより、サブトラクト部55からは音声スペクトル信号(Ia)がそのまま出力されることになる。
このように、入力音声のレベルを増幅調整する機能を備える場合において、その入力音声のレベルに合わせてサブトラクト係数αが適切な値に調整されるため、増幅調整された入力音声に含まれるモータ音を雑音成分として適切に除去することができる。また、モータ21が駆動されていない場合には、α=0に制御されるので、スペクトル減算は行われない。よって、不必要に音声スペクトルから雑音分のスペクトルを引き過ぎて、音声信号に歪みを生じさせることもない。
(2)モータ音の発生タイミング
モータ21を駆動する場合において、制御部32がモータ駆動信号を出力してから実際にモータ21が回転し始めるまでには多少の遅れがある。したがって、モータ駆動信号の出力と同時に雑音除去処理(サブトラクト処理)を開始してしまうと、まだモータ音(ここではズーム音)が発生していないにも関わらず、サブトラクト部55にて入力音声スペクトル信号(Ia)からモータ音分のスペクトルが減算されることになり、雑音成分を正しく除去できないばかりか、音声信号自体に歪みが生じる可能性がある。
この様子を図6に示す。
図6はモータ駆動動作とモータ音の発生タイミングが合わない場合での各部の出力波形を示す図である。なお、図中のA部,B部,E部,F部の付記は図3の各構成部に付した(A),(B),(E),(F)に対応している。
今、図6(a)に示すような音量の音声と周囲音を入力対象とする。撮影時に同図(b)に示すようなタイミングでモータ駆動信号が出力されると、そのモータ音が音声信号と共に音声入力部51から入り込むため、入力音声は同図(c)のようにモータ音を含んだ音量を有することになる。
ここで、モータ駆動信号が出力されてから、実際にモータ21が回転を始めて入力音声にモータ音が雑音として入り込むまでに多少のタイムラグがある。このようなタイムラグを考慮せずに、同図(d)に示すように、モータ駆動信号の出力と同時にサブトラクト部55にて雑音分のスペクトル減算を行ってしまうと、モータ音の発生タイミングと合わず、出力音量が同図(e)のように歪んだものとなる。
このような問題を解消するため、本実施形態では、参照入力部64(参照マイク)を用いてモータ音のみの信号を入力することで、モータ音の発生タイミングを正確に判断して雑音除去処理を行うことを第2の特徴としている。
すなわち、参照入力部64からの入力信号は略モータ音のみの信号であることに着目して、短時間パワー算出部66によって、その入力信号の短時間パワー(音量)を算出する。制御部32では、この短時間パワー算出部66によって算出されたモータ音パワーと予め設定された閾値とを比較する。その結果、モータ音パワーが閾値よりも小さい場合には、まだ実際にモータ音が発生していないものと判断し、モータ駆動信号が出力されていても、雑音除去動作を禁止するべく、α=0を出力するようにサブトラクト係数制御部63を制御する。これにより、サブトラクト部55では、フーリエ変換部53から得られた音声スペクトル信号(Ia)をスペクトル減算ぜずに、そのまま逆フーリエ変換部57に出力することになる。
一方、モータ音パワーが閾値以上であれば、制御部32は実際にモータ音が発生しているものと判断し、雑音除去動作を許可するべく、サブトラクト係数αとして有効値を出力するようにサブトラクト係数制御部63を制御する。上述したように、このとき出力されるサブトラクト係数αは、入力パワー算出部62によって算出された入力パワー値に基づいて、増幅器61による入力音声の増幅率に応じた値に調整される。
なお、モータ21を停止するときも同様であり、短時間パワー算出部66から得られるモータ音パワーに基づいてモータ21の回転が実際に停止したことを確認してからα=0に戻すように制御する。
これにより、モータ駆動動作と実際にモータ音が発生するタイミングとがずれる場合であっても、モータ音の発生タイミングに正確に合わせてスペクトル減算処理つまり雑音除去処理を行うことができる。その結果、雑音成分を適切に除去でき、波形合成部58から歪みのない音声信号を得ることができる。
この場合、主マイクである音声入力部51からの入力音ではタイミング判定のための閾値を正確に設定できないが、参照マイクである参照入力部64を用いてモータ音のみを入力するようにしたことで、その参照入力部64からの入力音に対してタイミング判定のための閾値を正確に設定して、雑音除去を適切に行うことが可能となる。
図7は本方式による各部の出力波形を示す図である。なお、図中のA部〜F部の付記は図3の各構成部に付した(A)〜(F)に対応している。図7(d)〜(g)に示すように、サブトラクト係数αの値が入力音声の増幅率に応じて変更され、また、参照マイクからの入力音量と閾値との比較によりモータ音発生タイミングに合わせてスペクトル減算が行われている。これにより、同図(h)に示すように、雑音成分が適切に除去された音声信号の波形を得ることができる。
図8は同実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。なお、このフローチャートで示される処理は、コンピュータである制御部32によって読取り可能なプログラムの形態でROM等の記録媒体に予め記録されているものとする。
音声付きの動画撮影を行う場合において、制御部32は、まず、主マイクである音声入力部51から入力された音声信号のパワー(音量)を算出し、その音声パワーに応じた増幅率に従って音声信号を増幅処理した後、その音声信号を所定単位でフレーム分割する(ステップA11)。なお、ここで実行される音声パワーと増幅率の算出処理について後に図9を用いて説明する。
一方、制御部32は、参照マイクである参照入力部64を通じて入力されたモータ音のパワー(音量)を算出し、そのモータ音パワーと所定の閾値とを比較する(ステップA12)。なお、ここで実行されるモータ音パワーの算出処理について後に図10を用いて説明する。
ここで、前記ステップA12にてモータ音パワーと所定の閾値とを比較した結果、モータ音パワーが所定の閾値よりも小さい場合であれば(ステップA13のNo)、モータ音が発生していないものと判断する。この場合、例えばモータ21に対する駆動信号が出力されていても、信号伝送速度やドライバの特性などを起因としたタイムラグによって、まだ実際にモータ21が回転していない状態にある。よって、制御部32は、当該入力音声信号に対して雑音除去処理(サブトラクト処理)を施すことなく、そのまま撮影画像(動画データ)と同期させてメモリ38に記録する(ステップA20)。
一方、モータ音パワーが所定の閾値以上であれば(ステップA13のNo)、モータ21が駆動状態にあり、そのときに発生するモータ音が入力音声に入り込んでいるものと判断する。そこで、図7(f)に示したように、モータ音パワーが所定の閾値以上になったときのタイミングで、制御部32は以下のような雑音除去処理(サブトラクト処理)を実行して、入力音声に含まれる雑音成分つまりモータ音を除去してからなメモリ38に記録する(ステップA14〜A20)。
すなわち、まず、制御部32は、前記ステップA11で得た入力音声の分割フレームを対象にしてフーリエ変換を行い、フレーム単位で区切ったスペクトルデータを生成する(ステップA14)。
ここで、制御部32は、当該入力音声の増幅率を取得することにより(ステップA15)、予め記憶された雑音スペクトルデータに対して前記増幅率に基づく係数(サブトラクト係数α)を乗算する(ステップA16)。この場合、従来方式では係数の値が固定であったが、本方式では、図7(g)に示したように入力音声の増幅率に応じて変更される。そして、制御部32は、入力音声のスペクトルデータから前記係数乗算後の雑音スペクトルデータを減算して雑音成分を除去する(ステップA17)。
以後は、雑音除去後の入力音声のスペクトルデータを逆フリー変換処理して元の音声波形データに戻し(ステップA18)、これを前の音声波形データと連続するようにフレーム単位で合成しながら(ステップA19)、撮影画像(動画データ)と同期させてメモリ38に記録していく(ステップA20)。
以上のような処理を例えばシャッタキー9の操作により動画撮影の終了が明示的に指示されるまでの間、繰り返し行う(ステップA21)。
(音声パワー・増幅率算出処理)
次に、前記図8のステップA11で実行される音声パワーと増幅率の算出処理について説明する。
図9はその算出処理を示すフローチャートである。制御部32は、主マイクである音声入力部51から入力された音声信号を所定単位でフレーム分割し(ステップB11)、その分割フレームにおけるスペクトルのパワーを算出する(ステップB12)。つまり、入力音声の短時間パワー(音量)をフレーム単位で求める。
そして、制御部32は、所定期間内で逐次算出された複数の分割フレームのパワーを積分して平滑化すると共に遅延させて当該入力音声の短時間パワーに対応した増幅率を算出して出力する(ステップB13,B14)。
以上のような処理を例えばシャッタキー9の操作により動画撮影の終了が明示的に指示されるまでの間、繰り返し行う(ステップB15)。
(モータ音パワー算出処理)
次に、前記図8のステップA12で実行されるモータ音パワーの算出処理について説明する。
図10はその算出処理を示すフローチャートである。制御部32は、参照マイクである参照入力部64から入力されたモータ音の信号を所定単位でフレーム分割し(ステップC11)、その分割フレームにおけるスペクトルのパワーを算出して出力する(ステップC12,C13)。つまり、参照マイクを通して得られるモータ音のみの信号を利用して、そのモータ音の短時間パワー(音量)をフレーム単位で求める。
以上のような処理を例えばシャッタキー9の操作により動画撮影の終了が明示的に指示されるまでの間、繰り返し行う(ステップC14)。
このように、本装置をソフトウェア的に実現した場合であっても前記図3に示した構成と同様の効果が得られる。
なお、前記実施形態では、ズーム音を雑音除去対象として説明したが、ズーム音に限らず、例えばフォーカス音、さらにはシャッター音などでも同様であり、要は撮影動作に伴って発生する機構音を入力音声から除去する場合に適用可能である。
また、複数の異なるモータ音を雑音除去対象として処理する場合には、以下のような構成とする。
すなわち、図3に示したスペクトル記憶部54に、モータ駆動に伴って発生するモータ音(機構音)の雑音スペクトルを複数のモータの各々に対応して記憶させておく。すなわち、複数のモータとは、例えばズームモータ、フォーカスモータなどであり、これらのモータ駆動にと伴って発生する音を事前に採取し、その音をスペクトル化した信号を雑音スペクトルとして各モータに対応付けてスペクトル記憶部54に記憶させておく。
ここで、制御部32は、前記各モータの各々に対する駆動開始および駆動停止を独立して指示する。そして、各モータのいずれかのモータの駆動開始を指示した後に短時間パワー算出部66から得られるモータ音のパワーが所定値以上であると判定された場合に、スペクトル記憶部54に記憶された当該モータに対応した雑音スペクトルに基づく雑音除去動作を開始する。また、当該モータの駆動停止が指示された後に短時間パワー算出部66から得られるモータ音のパワーが所定値より小さいと判定された場合に、その雑音除去動作を停止する。
このような構成によれば、複数のモータを備える場合であっても、それぞれのモータ駆動時に当該モータに対応した雑音スペクトルを適切なタイミングで使用して、入力音声から雑音成分を適切に除去することができる。
また、前記各実施形態では、音声付き動画撮影可能なデジタルカメラを例にして説明したが、本発明はデジタルカメラに限らず、例えばカメラ付きの携帯電話など、音声信号と共に撮影画像を記録可能な機能を備えた電子機器であれば、そのすべてに適用可能である。
要するに、本発明は前記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
また、上述した実施形態において記載した手法は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD−ROM等)、半導体メモリなどの記録媒体に書き込んで各種装置に適用したり、そのプログラム自体をネットワーク等の伝送媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムあるいは伝送媒体を介して提供されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。
図1は本発明の撮像装置としてデジタルカメラを例にした場合の外観構成を示す図であり、図1(a)は主に前面の構成、同図(b)は主に背面の構成を示す斜視図である。 図2はデジタルカメラの電子回路構成を示すブロック図である。 図3は本発明の一実施形態に係るデジタルカメラに用いられる雑音除去機能を備えた音声記録装置の構成を示すブロック図である。 図4はSS法(スペクトルサブトラクション法)を用いた雑音除去処理を説明するための図である。 図5は入力音声の増幅率に関係なくサブトラクト係数を一定である場合での各部の出力波形を示す図である。 図6はモータ駆動動作とモータ音の発生タイミングが合わない場合での各部の出力波形を示す図である。 図7は本方式による各部の出力波形を示す図である。 図8は同実施形態における音声記録処理をソフトウェア的に実現する場合のフローチャートである。 図9は前記図8のステップA11で実行される音声パワー・増幅率算出処理の算出処理を示すフローチャートである。 図10は前記図8のステップA12で実行されるモータ音パワーの算出処理を示すフローチャートである。
符号の説明
1…デジタルカメラ、2…ボディ、3…撮影レンズ、7…マイクロホン部(主マイク)、7a…参照マイク、9…シャッタキー、20a,20b…ズームキー、21…モータ、21a…モータ駆動部、32…制御部、36…キー入力部、51…音声入力部、52…フレーム分割部、53…フーリエ変換部、54…スペクトル記憶部、55…サブトラクト部、57…逆フーリエ変換部、58…波形合成部、61…増幅器、62…入力パワー算出部、63…フーリエ変換部、64…参照入力部、65…フレーム分割部、66…短時間パワー算出部、Ia…入力音声スペクトル信号、Ib…雑音除去後の音声スペクトル信号、Xv…雑音スペクトル信号。

Claims (9)

  1. 音声付き動画撮影を行う場合に、音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録機能を備えた撮像装置であって、
    音声信号を入力する音声入力手段と、
    この音声入力手段から入力される音声信号をスペクトル信号に変換する変換手段と、
    前記音声入力手段を通じて事前に採取した機構音のスペクトルを雑音スペクトルとして記憶した記憶手段と、
    撮影時に音声信号と共に入力される機構音のパワーに基づいて雑音除去を行うタイミングを決定するタイミング決定手段と、
    このタイミング決定手段によって決定されたタイミングに従って、前記記憶手段に記憶された雑音スペクトルに当該入力音声のレベルに応じて設定される係数を乗じ、前記変換手段によって変換された音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去する雑音除去手段と、
    この雑音除去手段によって得られた雑音除去後の音声スペクトル信号を元の音声信号に逆変換する逆変換手段と、
    この逆変換手段によって得られた音声信号を撮影画像と共に記録する記録手段と
    を具備したことを特徴とする撮像装置。
  2. 前記音声入力手段から入力される音声信号のパワーに応じて増幅率を調整する増幅調整手段を備え、
    前記変換手段は、この増幅調整手段によって増幅調整された音声信号を前記変換手段によるスペクトル変換対象として入力し、
    前記雑音除去手段は、前記雑音スペクトルに乗じる係数を前記増幅率に応じて変更することを特徴とする請求項1記載の撮像装置。
  3. 機構音の発生源近傍に設けられた機構音入力手段と、
    この機構音入力手段から入力される機構音のパワーが所定値以上であるか否かを判定する判定手段とを備え、
    前記タイミング決定手段は、前記判定手段による判定結果に基づいて雑音除去を行うタイミングを決定することを特徴とする請求項1記載の撮像装置。
  4. 前記記憶手段は、モータ駆動に伴って発生する機構音の雑音スペクトルを複数のモータの各々に対応して記憶し、
    前記複数のモータの各々に対する駆動開始および駆動停止を独立して指示するモータ制御手段を備え、
    前記前記雑音除去手段は、
    前記モータ制御手段により前記各モータのいずれかのモータの駆動開始が指示された後に前記判定手段により機構音のパワーが所定値以上であると判定された場合に、前記記憶手段に記憶された当該モータに対応した雑音スペクトルに基づく雑音除去動作を開始し、前記モータ制御手段により当該モータの駆動停止が指示された後に前記判定手段により機構音のパワーが所定値より小さいと判定された場合に、その雑音除去動作を停止することを特徴とする請求項3記載の撮像装置。
  5. 音声付き動画撮影を行う場合に、音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録機能を備えた撮像装置であって、
    音声信号を入力する音声入力手段と、
    前記音声入力手段から入力される音声信号のパワーに応じて増幅率を調整する増幅調整手段と、
    この増幅調整手段によって増幅調整された音声信号をスペクトル信号に変換する変換手段と、
    前記音声入力手段を通じて事前に採取した機構音のスペクトルを雑音スペクトルとして記憶した記憶手段と、
    撮影時に前記増幅調整手段によって調整される増幅率に基づいて前記雑音スペクトルに乗じる係数を決定する係数決定手段と、
    前記記憶手段に記憶された雑音スペクトルに前記係数決定手段によって決定された係数を乗じ、前記変換手段によって変換された音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去する雑音除去手段と、
    この雑音除去手段によって得られた雑音除去後の音声スペクトル信号を元の音声信号に逆変換する逆変換手段と、
    この逆変換手段によって得られた音声信号を撮影画像と共に記録する記録手段と
    を具備したことを特徴とする撮像装置。
  6. 音声付き動画撮影を行う場合に、音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録方法であって、
    音声信号を入力するステップと、
    前記入力された音声信号をスペクトル信号に変換するステップと、
    撮影時の入力音のパワーに基づいて雑音除去を行うタイミングを決定するステップと、
    前記タイミングに従って、予め用意された雑音スペクトルに当該入力音声のレベルに応じて設定される係数を乗じ、前記音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去するステップと、
    この雑音除去後の音声スペクトル信号を元の音声信号に逆変換するステップと、
    この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録するステップと
    を備えたことを特徴とする音声記録方法。
  7. 音声付き動画撮影を行う場合に、音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する音声記録方法であって、
    音声信号を入力するステップと、
    前記入力された音声信号のパワーに応じて増幅率を調整するステップと、
    この増幅調整後の音声信号をスペクトル信号に変換するステップと、
    撮影時に前記増幅率に基づいて予め用意された雑音スペクトルに乗じる係数を決定するステップと、
    前記雑音スペクトルに前記増幅率に基づいて決定された係数を乗じ、前記音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去するステップと、
    この雑音除去後の音声スペクトル信号を元の音声信号に逆変換するステップと、
    この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録するステップと
    を備えたことを特徴とする音声記録方法。
  8. 音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する機能を備えたコンピュータによって実行されるプログラムであって、
    前記コンピュータに、
    音声信号を入力する機能と、
    前記入力された音声信号をスペクトル信号に変換する機能と、
    撮影時の入力音のパワーに基づいて雑音除去を行うタイミングを決定する機能と、
    前記タイミングに従って、予め用意された雑音スペクトルに当該入力音声のレベルに応じて設定される係数を乗じ、前記音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去する機能と、
    この雑音除去後の音声スペクトル信号を元の音声信号に逆変換する機能と、
    この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録する機能と
    を実現させることを特徴とするプログラム。
  9. 音声付き動画撮影を行う場合に、入力音声信号から撮影動作に伴って発生する機構音を雑音として除去して記録する機能を備えたコンピュータによって実行されるプログラムであって、
    前記コンピュータに、
    音声信号を入力する機能と、
    前記入力された音声信号のパワーに応じて増幅率を調整する機能と、
    この増幅調整後の音声信号をスペクトル信号に変換する機能と、
    撮影時に前記増幅率に基づいて予め用意された雑音スペクトルに乗じる係数を決定する機能と、
    前記雑音スペクトルに前記増幅率に基づいて決定された係数を乗じ、前記音声信号のスペクトルから前記係数乗算後の雑音スペクトルを減算することで雑音成分を除去する機能と、
    この雑音除去後の音声スペクトル信号を元の音声信号に逆変換する機能と、
    この逆変換によって得られた音声信号を撮影画像と共に所定のメモリに記録する機能と
    を実現させることを特徴とするプログラム。
JP2005101972A 2005-03-31 2005-03-31 撮像装置、音声記録方法及びプログラム Expired - Fee Related JP4639907B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005101972A JP4639907B2 (ja) 2005-03-31 2005-03-31 撮像装置、音声記録方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005101972A JP4639907B2 (ja) 2005-03-31 2005-03-31 撮像装置、音声記録方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2006287387A true JP2006287387A (ja) 2006-10-19
JP4639907B2 JP4639907B2 (ja) 2011-02-23

Family

ID=37408848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005101972A Expired - Fee Related JP4639907B2 (ja) 2005-03-31 2005-03-31 撮像装置、音声記録方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4639907B2 (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008058343A (ja) * 2006-08-29 2008-03-13 Casio Comput Co Ltd 機構駆動音低減装置および機構駆動音低減方法
JP2008252389A (ja) * 2007-03-29 2008-10-16 Casio Comput Co Ltd 撮像装置、雑音除去方法及びプログラム
JP2009036831A (ja) * 2007-07-31 2009-02-19 Canon Inc 情報処理装置、情報処理方法
JP2010178295A (ja) * 2009-02-02 2010-08-12 Oki Electric Ind Co Ltd 雑音抑制装置、音声捕捉装置及び会議システム
JP2011028061A (ja) * 2009-07-27 2011-02-10 Canon Inc 音声記録装置及び方法、ならびに撮影装置
JP2011095478A (ja) * 2009-10-29 2011-05-12 Nikon Corp 信号処理装置及び撮像装置
WO2011055834A1 (ja) * 2009-11-06 2011-05-12 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
JP2011095378A (ja) * 2009-10-28 2011-05-12 Nikon Corp 録音装置、撮像装置、および、プログラム
JP2011100029A (ja) * 2009-11-06 2011-05-19 Nec Corp 信号処理方法、情報処理装置、及び信号処理プログラム
CN102280108A (zh) * 2010-06-10 2011-12-14 佳能株式会社 音频信号处理设备及其控制方法
JP2012003021A (ja) * 2010-06-16 2012-01-05 Canon Inc 音声処理装置及び音声処理方法、撮像装置
CN102347029A (zh) * 2010-07-30 2012-02-08 索尼公司 机械噪音抑制装置、机械噪音抑制方法、程序和成像装置
JP2012114842A (ja) * 2010-11-26 2012-06-14 Canon Inc 撮像装置及び駆動雑音除去装置
JP2012113103A (ja) * 2010-11-24 2012-06-14 Renesas Electronics Corp 音声処理装置および音声処理方法並びにプログラム、音声取得装置
CN102598126A (zh) * 2009-11-06 2012-07-18 日本电气株式会社 信息处理装置及其附属设备、信息处理系统及其控制方法和控制程序
JP2012142745A (ja) * 2010-12-28 2012-07-26 Sony Corp 音声信号処理装置、音声信号処理方法及びプログラム
US8698911B2 (en) 2009-10-28 2014-04-15 Nikon Corporation Sound recording device, imaging device, photographing device, optical device, and program
JPWO2012070684A1 (ja) * 2010-11-25 2014-05-19 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
JP2017204715A (ja) * 2016-05-10 2017-11-16 キヤノン株式会社 電子機器及び制御方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000004494A (ja) * 1998-06-16 2000-01-07 Matsushita Electric Ind Co Ltd 機器内蔵型マイクロホン装置
JP2004053965A (ja) * 2002-07-19 2004-02-19 Toyota Central Res & Dev Lab Inc 音声認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000004494A (ja) * 1998-06-16 2000-01-07 Matsushita Electric Ind Co Ltd 機器内蔵型マイクロホン装置
JP2004053965A (ja) * 2002-07-19 2004-02-19 Toyota Central Res & Dev Lab Inc 音声認識装置

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008058343A (ja) * 2006-08-29 2008-03-13 Casio Comput Co Ltd 機構駆動音低減装置および機構駆動音低減方法
JP2008252389A (ja) * 2007-03-29 2008-10-16 Casio Comput Co Ltd 撮像装置、雑音除去方法及びプログラム
JP2009036831A (ja) * 2007-07-31 2009-02-19 Canon Inc 情報処理装置、情報処理方法
JP4590437B2 (ja) * 2007-07-31 2010-12-01 キヤノン株式会社 情報処理装置
JP2010178295A (ja) * 2009-02-02 2010-08-12 Oki Electric Ind Co Ltd 雑音抑制装置、音声捕捉装置及び会議システム
JP2011028061A (ja) * 2009-07-27 2011-02-10 Canon Inc 音声記録装置及び方法、ならびに撮影装置
JP2011095378A (ja) * 2009-10-28 2011-05-12 Nikon Corp 録音装置、撮像装置、および、プログラム
US8698911B2 (en) 2009-10-28 2014-04-15 Nikon Corporation Sound recording device, imaging device, photographing device, optical device, and program
JP2011095478A (ja) * 2009-10-29 2011-05-12 Nikon Corp 信号処理装置及び撮像装置
WO2011055834A1 (ja) * 2009-11-06 2011-05-12 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
JP2011100029A (ja) * 2009-11-06 2011-05-19 Nec Corp 信号処理方法、情報処理装置、及び信号処理プログラム
JP2011100030A (ja) * 2009-11-06 2011-05-19 Nec Corp 信号処理方法、情報処理装置、及び信号処理プログラム
US9548062B2 (en) 2009-11-06 2017-01-17 Nec Corporation Information processing apparatus, auxiliary device therefor, information processing system, control method therefor, and control program
US9190070B2 (en) 2009-11-06 2015-11-17 Nec Corporation Signal processing method, information processing apparatus, and storage medium for storing a signal processing program
US8736359B2 (en) 2009-11-06 2014-05-27 Nec Corporation Signal processing method, information processing apparatus, and storage medium for storing a signal processing program
CN102598126A (zh) * 2009-11-06 2012-07-18 日本电气株式会社 信息处理装置及其附属设备、信息处理系统及其控制方法和控制程序
CN102598128A (zh) * 2009-11-06 2012-07-18 日本电气株式会社 信号处理方法、信息处理装置及用于存储信号处理程序的存储介质
CN102280108A (zh) * 2010-06-10 2011-12-14 佳能株式会社 音频信号处理设备及其控制方法
JP2012003021A (ja) * 2010-06-16 2012-01-05 Canon Inc 音声処理装置及び音声処理方法、撮像装置
JP2012032648A (ja) * 2010-07-30 2012-02-16 Sony Corp 機械音抑圧装置、機械音抑圧方法、プログラムおよび撮像装置
CN102347029A (zh) * 2010-07-30 2012-02-08 索尼公司 机械噪音抑制装置、机械噪音抑制方法、程序和成像装置
JP2012113103A (ja) * 2010-11-24 2012-06-14 Renesas Electronics Corp 音声処理装置および音声処理方法並びにプログラム、音声取得装置
JPWO2012070684A1 (ja) * 2010-11-25 2014-05-19 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
US9443503B2 (en) 2010-11-25 2016-09-13 Nec Corporation Signal processing device, signal processing method and signal processing program
JP2012114842A (ja) * 2010-11-26 2012-06-14 Canon Inc 撮像装置及び駆動雑音除去装置
US9288370B2 (en) 2010-11-26 2016-03-15 Canon Kabushiki Kaisha Imaging apparatus and audio processing apparatus
JP2012142745A (ja) * 2010-12-28 2012-07-26 Sony Corp 音声信号処理装置、音声信号処理方法及びプログラム
JP2017204715A (ja) * 2016-05-10 2017-11-16 キヤノン株式会社 電子機器及び制御方法

Also Published As

Publication number Publication date
JP4639907B2 (ja) 2011-02-23

Similar Documents

Publication Publication Date Title
JP4639907B2 (ja) 撮像装置、音声記録方法及びプログラム
JP2006279185A (ja) 撮像装置、音声記録方法及びプログラム
JP4466261B2 (ja) 撮像装置、明るさ補正方法及びプログラム
JP4569389B2 (ja) 撮像装置、画像処理方法及びプログラム
JP4914026B2 (ja) 画像処理装置及び画像処理方法
JP5034605B2 (ja) 撮像装置、雑音除去方法及びプログラム
JP4639902B2 (ja) 撮像装置、音声記録方法及びプログラム
JP2005260970A (ja) 複合撮影装置及びそれを利用したdscレンズ制御方法
JP4639965B2 (ja) 撮像装置、画像処理方法及びプログラム
JP4375325B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9154758B2 (en) Digital signal processor and digital image processing apparatus adopting the same with concurrent live view frame and picture image processing
JP2004222236A (ja) 撮像装置、画像編集方法及びプログラム
JP2005228400A (ja) 音声記録装置及び音声記録方法
JP4901673B2 (ja) 撮像装置、記録装置、再生装置、撮像方法、記録方法、再生方法及びプログラム
JP2010021710A (ja) 撮像装置、画像処理装置およびプログラム
JP4379921B2 (ja) 撮像装置及びそのプログラム
US20050200709A1 (en) Composition photographing apparatus and sound recording method using the same
JP2006094031A (ja) 撮像装置、画像処理方法及びプログラム
JP2005072729A (ja) 電子カメラ及び画像撮影方法
JP2006179996A (ja) 電子カメラ、ノイズ低減装置、ノイズ低減制御プログラム及びノイズ低減方法
JP2006094200A (ja) 撮像装置、合焦表示方法及びプログラム
JP5561044B2 (ja) 撮像装置、撮像方法及びプログラム
JP2006217111A (ja) 動画撮影装置、及び動画撮影方法
JP2004120279A (ja) 動画・テキスト編集装置、編集方法及び編集プログラム
JP4355857B2 (ja) 動画記録装置、ファイル作成方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101102

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101115

R150 Certificate of patent or registration of utility model

Ref document number: 4639907

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees