WO2013115385A1 - 音処理装置および音処理プログラム - Google Patents
音処理装置および音処理プログラム Download PDFInfo
- Publication number
- WO2013115385A1 WO2013115385A1 PCT/JP2013/052404 JP2013052404W WO2013115385A1 WO 2013115385 A1 WO2013115385 A1 WO 2013115385A1 JP 2013052404 W JP2013052404 W JP 2013052404W WO 2013115385 A1 WO2013115385 A1 WO 2013115385A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sound
- unit
- processing
- noise reduction
- relationship
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Studio Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
ノイズ低減処理に伴う音像の変位を抑制できる音処理装置および音処理プログラムを提供する。 複数の集音部によって集音された音のうち、第1集音部により集音された第1音と第2集音部により集音された第2音との関係である基準関係を算出する算出部と、前記第1音と前記第2音との関係が、前記算出部で算出された前記基準関係を含む所定の範囲に含まれるよう、前記複数の集音部によって集音された音を処理する処理部とを備えることを特徴とする音処理装置。
Description
本発明は、音処理装置および音処理プログラムに関するものである。
複数の集音装置を備えたステレオ録音が可能な撮像装置として、動画撮影時にオートフォーカス(以後、「AF」と略記する)等の駆動音の発生に合わせてノイズ低減処理を行うものがある。
ステレオ等の複数チャンネルの有する音信号の雑音を抑制する雑音抑制装置においては、ステレオ成分の雑音を抑制する技術が知られている(特許文献1等参照)。
ステレオ等の複数チャンネルの有する音信号の雑音を抑制する雑音抑制装置においては、ステレオ成分の雑音を抑制する技術が知られている(特許文献1等参照)。
また、録画可能なカメラ等においては、外部音声を録音する複数のマイク及び駆動部、を備えるものがある。このような装置において、録音された音声より、駆動部から発生する雑音を低減する技術が提案されている(特許文献2参照)。
ところで、ステレオ録音時において、駆動音の発生に合わせてノイズ低減処理を行うと、ノイズ低減処理に起因して音信号のバランスが変化してしまうことがあり、その結果、音像が変位し、再生時に違和感を生じさせるという問題がある。
本発明の課題は、ノイズ低減処理に伴う音像の変位を抑制できる音処理装置および音処理プログラムを提供することである。
本発明の一態様である音処理装置は、複数の集音部によって集音された音のうち、第1集音部により集音された第1音と第2集音部により集音された第2音との関係である基準関係を算出する算出部と、前記第1音と前記第2音との関係が、前記算出部で算出された前記基準関係を含む所定の範囲に含まれるよう、前記複数の集音部によって集音された音を処理する処理部とを備えることを特徴とする。
本発明の他の態様である音処理装置は、第1集音部と第2集音部とを有する集音部と、前記第1集音部により集音された第1音と前記第2集音部により集音された第2音との関係を基準関係とし、前記基準関係を含む所定の範囲に含まれるように処理された、前記集音部によって集音された音を出力する出力部とを備えたことを特徴とする。
本発明の他の態様である音処理プログラムは、コンピュータに、複数の集音部によって集音された音のうち、第1集音部により集音された第1音と第2集音部により集音された第2音との関係である基準関係を算出する算出部と、前記第1音と前記第2音との関係が、前記算出部で算出された前記基準関係を含む所定の範囲に含まれるよう、前記複数の集音部によって集音された音を処理する処理部と、の各機能を実行させる。
本発明の他の態様である音処理プログラムは、コンピュータに、第1集音部と第2集音部とを有する集音部と、前記第1集音部により集音された第1音と前記第2集音部により集音された第2音との関係である基準関係に対して、前記基準関係を含む所定の範囲に含まれるように処理された、前記集音部によって集音された音を出力する出力部と、の各機能を実行させる。
本発明の他の態様であるプログラムは、複数の集音部のうちの第1集音部により集音された第1音のノイズ推定を行ない、推定されたノイズを、前記第1音から低減し、前記複数の集音部のうちの第2集音部により集音された第2音と、ノイズ低減前の前記第1音との関係である基準関係を求め、ノイズ低減後の前記第1音との関係が前記基準関係を含む所定の範囲に含まれるよう前記第2音を調整する処理を、コンピュータ装置に実行させる。
本発明の態様によれば、ノイズ低減処理に伴う音像の変位を抑制できる音処理装置および音処理プログラムを提供できる。
以下、図面等を参照して、本発明の実施形態について説明する。
(第1実施形態)
図1は、第1実施形態にかかる音処理装置を備えたカメラを示し、図1(a)はそのブロック構成図、図1(b)はカメラ1の概念正面図である。
図1(a)に示すように、カメラ1は、カメラ本体10と、レンズ鏡筒20とにより構成されている。カメラ1は、自動的に合焦するオートフォーカス(以下AFと略記する)機能を備えている。また、カメラ1は、静止画と動画の何れも撮影可能であって、動画撮影時には画像と同時に音をステレオで記録可能である。
(第1実施形態)
図1は、第1実施形態にかかる音処理装置を備えたカメラを示し、図1(a)はそのブロック構成図、図1(b)はカメラ1の概念正面図である。
図1(a)に示すように、カメラ1は、カメラ本体10と、レンズ鏡筒20とにより構成されている。カメラ1は、自動的に合焦するオートフォーカス(以下AFと略記する)機能を備えている。また、カメラ1は、静止画と動画の何れも撮影可能であって、動画撮影時には画像と同時に音をステレオで記録可能である。
カメラ本体10は、撮像素子11と、画像処理部12と、ステレオ集音装置13と、音情報処理部14と、記憶部15と、制御部16と、出力部18と、入力部19とを備えている。
撮像素子11は、CCD等の光電変換素子により構成され、レンズ鏡筒20の結像光学系によって結像された被写体像光を電気信号に変換する。
画像処理部12は、撮像素子11から出力されるアナログの画像情報をA/D変換すると共に画像処理して画像データを生成する。
撮像素子11は、CCD等の光電変換素子により構成され、レンズ鏡筒20の結像光学系によって結像された被写体像光を電気信号に変換する。
画像処理部12は、撮像素子11から出力されるアナログの画像情報をA/D変換すると共に画像処理して画像データを生成する。
ステレオ集音装置13は、図1(b)に示すように、左右一対のマイク(左マイク13L,右マイク13R)を備えている。左マイク13Lと右マイク13Rとは、カメラ1を横位置で構えた状態においてレンズ鏡筒20の中心を通る鉛直線を挟む略対称位置に配置されている。各マイク13L,13Rは、それぞれ外部の音を集音してアナログ信号として検出し、音情報処理部14に出力する。
音情報処理部14は、ステレオ集音装置13から入力される音信号をA/D変換してデジタル信号とすると共にノイズ低減処理を行う。音情報処理部14は、ノイズ低減処理係る機能部として、ノイズ低減処理部14Aと、補正部14Bと、を備えている。これらについては、後に詳述する。
音情報処理部14は、ステレオ集音装置13から入力される音信号をA/D変換してデジタル信号とすると共にノイズ低減処理を行う。音情報処理部14は、ノイズ低減処理係る機能部として、ノイズ低減処理部14Aと、補正部14Bと、を備えている。これらについては、後に詳述する。
記憶部15は、画像処理部12が出力する画像データおよび音情報処理部14が出力する音データを記憶する。記憶部15は、バッファーやカメラに内蔵されたメモリでもよいし、またSDカードやHDD等の外部の記憶媒体でもよい。
出力部18は、記憶部15に記憶された画像データ及び音データを出力する。出力部18は、外部機器へ音情報(電気信号)を出力するためのインターフェース等である。外部機器とは、これに限定されないが、例えばPC、外部スピーカ、携帯電話等である。ただし、これに限定されず、出力部18は、カメラ1に設けられた背面液晶及びスピーカであってもよい。なお、出力部18がスピーカの場合、出力部18は音情報(電気信号)を音に変換する変換部も備える。
入力部19は、外部機器からデータを入力するためのインターフェース等である。
外部機器とデータのやり取り(通信)をする際には、出力部18と入力部19は別体となっていなくてもよく、入力部19と出力部18が一体となっているような構成であってもよい。
なお、外部機器とは、これに限定されないが、例えばPC、外部マイク、携帯電話等である。
外部機器とデータのやり取り(通信)をする際には、出力部18と入力部19は別体となっていなくてもよく、入力部19と出力部18が一体となっているような構成であってもよい。
なお、外部機器とは、これに限定されないが、例えばPC、外部マイク、携帯電話等である。
制御部16は、CPU等を備えて構成され、設定された撮像条件(例えば、絞り値、露出値等)に応じて、レンズ鏡筒20の後述する各構成要素を含めたカメラ1の各構成要素を統括制御する。たとえば、制御部16は、後述するレンズ鏡筒20におけるAF駆動用モータ22を駆動する駆動制御信号を生成し、レンズ制御部24に出力する。
レンズ鏡筒20は、フォーカシングレンズ、手振れ補正レンズ、ズーミングレンズ等を備える結像光学系(図示省略)と、AFエンコーダ21と、AF駆動用モータ22と、を備えている。
AFエンコーダ21は、フォーカシングレンズの位置を検出してレンズ制御部24に出力する。レンズ制御部24は、検出されたフォーカシングレンズの位置情報を制御部16に出力する。
AF駆動用モータ22は、レンズ制御部24から入力されるAFレンズの位置を制御するための駆動制御信号に応じて、AFレンズを移動駆動する。
AFエンコーダ21は、フォーカシングレンズの位置を検出してレンズ制御部24に出力する。レンズ制御部24は、検出されたフォーカシングレンズの位置情報を制御部16に出力する。
AF駆動用モータ22は、レンズ制御部24から入力されるAFレンズの位置を制御するための駆動制御信号に応じて、AFレンズを移動駆動する。
そして、カメラ1は、使用者による図示しないシャッタボタンの押圧操作によって撮影が指令されると、制御部16によって制御されて撮影作用を行う。
すなわち、撮像素子11によって被写体像光を電気信号に変換し、画像処理部12によって処理した画像データを、記憶部15に記憶させる(撮影する)。制御部16は、撮影時において、レンズ制御部24、AF駆動用モータ22を介してAFレンズを移動駆動するAF制御を行う。
すなわち、撮像素子11によって被写体像光を電気信号に変換し、画像処理部12によって処理した画像データを、記憶部15に記憶させる(撮影する)。制御部16は、撮影時において、レンズ制御部24、AF駆動用モータ22を介してAFレンズを移動駆動するAF制御を行う。
動画撮影時においては、撮像素子11は、被写体像光を電気信号に変換して順次取り込み、記憶部15を介して1秒間に所定のフレーム(コマ数)の画像を記憶する。また、前述したように、音情報処理部14が集音した音データを、画像データと共に記憶部15を介して記憶(録音)する。動画撮影時には、撮影期間を通してAF制御が行われる。
ここで、ステレオ集音装置13が集音した音情報は、音情報処理部14に入力される。音情報処理部14は、ステレオ集音装置13が集音した音に含まれるAF制御にかかる駆動ノイズ(AF駆動音)を低減処理する。そして、音情報処理部14は、駆動ノイズ(AF駆動音)が低減処理された音情報を記憶部15に出力する。
ただし、上記の処理の流れに限定されない。例えば変形形態として、1)制御部16は、ステレオ集音装置13が集音した音を、一旦、記憶部15に記憶させる、2)制御部16は、その記憶された音データをノイズ低減処理部14Aへ出力する、3)低減処理部14Aは音データに対して低減処理を施す、4)次いで、制御部16は、低減処理された音データを、再度、記憶部15に記憶する、といった処理の流れでも良い。
本実施形態の処理の流れに戻り、前述した図1に加えて図2~図4を参照し、音情報処理部14について詳細に説明する。図2は、音情報処理部14におけるノイズ低減処理とその補正の説明図である。図3は、音情報処理部14におけるノイズ低減処理と補正のフローチャートである。図4は、音像変位を説明する図である。
音情報処理部14は、前述したように、ノイズ低減処理部14Aと、補正部14Bとを備えている。
ノイズ低減処理部14Aは、ノイズ周波数スペクトルSNを用い、スペクトル減算法によってAF駆動音に対するノイズ低減処理を行う。ノイズ周波数スペクトルSNは、図2(b)に一例を示すような、予め記憶している動作ノイズ情報又は過去に集音した音情報から推定したものである。
ノイズ低減処理部14Aは、ノイズ周波数スペクトルSNを用い、スペクトル減算法によってAF駆動音に対するノイズ低減処理を行う。ノイズ周波数スペクトルSNは、図2(b)に一例を示すような、予め記憶している動作ノイズ情報又は過去に集音した音情報から推定したものである。
具体的に説明すると、ノイズ低減処理部14Aは、ステレオ集音装置13(左マイク13L,右マイク13R)から入力されてデジタル化された音信号を、所定の長さで区切ったフレーム単位でフーリエ変換等により周波数解析を行う。
そして、図2(a)に一例を示すような複数の周波数帯域(f1~f8)に分割した周波数スペクトルSIL,SIRを得る。
その周波数スペクトルSIL,SIRから図2(b)に示すノイズ周波数スペクトルSNを減算してノイズ成分を除去する。
さらに、必要に応じて、信号の下限規制等のフロアリング処理を行って、図2(c)に示すノイズ低減処理後の周波数スペクトルSSL,SSRを補正部14Bに出力する。
そして、図2(a)に一例を示すような複数の周波数帯域(f1~f8)に分割した周波数スペクトルSIL,SIRを得る。
その周波数スペクトルSIL,SIRから図2(b)に示すノイズ周波数スペクトルSNを減算してノイズ成分を除去する。
さらに、必要に応じて、信号の下限規制等のフロアリング処理を行って、図2(c)に示すノイズ低減処理後の周波数スペクトルSSL,SSRを補正部14Bに出力する。
このノイズ低減処理部14Aによるノイズ低減処理は、AF駆動音が含まれるフレームに対して、フレーム毎に行われる。
AF駆動音が含まれるフレームの検知は、たとえば、AFレンズの位置を検出するAFエンコーダ21の出力に基づいて(AFレンズが移動するとAFエンコーダ21の出力が変化する)行われる。
なお、図2(a)における周波数スペクトルSIL,SIRに対する網掛け部位は、AF駆動音が含まれない目的音のみの周波数スペクトルを参考的に示すものである。
AF駆動音が含まれるフレームの検知は、たとえば、AFレンズの位置を検出するAFエンコーダ21の出力に基づいて(AFレンズが移動するとAFエンコーダ21の出力が変化する)行われる。
なお、図2(a)における周波数スペクトルSIL,SIRに対する網掛け部位は、AF駆動音が含まれない目的音のみの周波数スペクトルを参考的に示すものである。
ここで、ノイズ低減処理部14Aによるノイズ低減処理は、ステレオ集音装置13における左右のマイク(左マイク13L,右マイク13R)からの音信号に対して、それぞれ独立して行われる。
ただし、左マイク13Lおよび右マイク13Rはレンズ鏡筒20に対して略対称に配置されているため、入力されるAFノイズ(AF駆動音)は同一であるものとしてノイズ周波数スペクトルSNは同一のものを用いる。
なお、左マイク13Lおよび右マイク13Rはレンズ鏡筒20に対して略対称に配置される形態に限定されず、光軸に対した左右非対称であってもよい。
ただし、左マイク13Lおよび右マイク13Rはレンズ鏡筒20に対して略対称に配置されているため、入力されるAFノイズ(AF駆動音)は同一であるものとしてノイズ周波数スペクトルSNは同一のものを用いる。
なお、左マイク13Lおよび右マイク13Rはレンズ鏡筒20に対して略対称に配置される形態に限定されず、光軸に対した左右非対称であってもよい。
補正部14Bは、
・ノイズ低減処理部14Aによるノイズ低減処理前の周波数スペクトル(処理前スペクトル)SIL,SIRの、各周波数帯域(f1~f8)における左右の信号比(処理前比、基準比)と、
・ノイズ低減処理部14Aによるノイズ低減処理後の周波数スペクトル(処理後スペクトル)SSL,SSRの各周波数帯域(f1~f8)における左右の信号比(処理後比、第1の関係)と、
を各々比較する。
・ノイズ低減処理部14Aによるノイズ低減処理前の周波数スペクトル(処理前スペクトル)SIL,SIRの、各周波数帯域(f1~f8)における左右の信号比(処理前比、基準比)と、
・ノイズ低減処理部14Aによるノイズ低減処理後の周波数スペクトル(処理後スペクトル)SSL,SSRの各周波数帯域(f1~f8)における左右の信号比(処理後比、第1の関係)と、
を各々比較する。
補正部14Bは、その比較結果に基づいて、処理後比RSが処理前比RIと、各周波数帯域において、それぞれ略一致するように補正して補正後比RC(第2の関係)、補正後の周波数スペクトル(補正後スペクトル)SCL,SCRを求める。
そして、補正部14Bは、この補正後スペクトルSCL,SCRを記憶部15に出力する。
そして、補正部14Bは、この補正後スペクトルSCL,SCRを記憶部15に出力する。
以下、この補正部14Bによる補正について、図2に即してより詳細に説明する。
(処理前スペクトル)
図2(a)に示すように、ノイズ低減処理部14Aによるノイズ低減処理前における左マイク13Lから入力した音(音信号L)の周波数スペクトル(処理前スペクトル(L))における各周波数帯域(f1~f8)の振幅をSIL1~SIL8とする。
右マイク13Rから入力した音(音信号R)の周波数スペクトル(処理前スペクトル(R))における各周波数帯域(f1~f8)の振幅をSIR1~SIR8とする。
処理前スペクトルの周波数帯域(f1~f8)ごとの振幅の左/右信号比(以下、この左/右信号比を処理前比とする)は、RI1=SIL1/SIR1,・・・,RI8=SIL8/SIR8となる。
(処理前スペクトル)
図2(a)に示すように、ノイズ低減処理部14Aによるノイズ低減処理前における左マイク13Lから入力した音(音信号L)の周波数スペクトル(処理前スペクトル(L))における各周波数帯域(f1~f8)の振幅をSIL1~SIL8とする。
右マイク13Rから入力した音(音信号R)の周波数スペクトル(処理前スペクトル(R))における各周波数帯域(f1~f8)の振幅をSIR1~SIR8とする。
処理前スペクトルの周波数帯域(f1~f8)ごとの振幅の左/右信号比(以下、この左/右信号比を処理前比とする)は、RI1=SIL1/SIR1,・・・,RI8=SIL8/SIR8となる。
(処理後スペクトル)
また、図2(c)に示すように、ノイズ低減処理部14Aによるノイズ低減処理後の音信号Lの周波数スペクトル(処理後スペクトル(L))における各周波数帯域(f1~f8)の振幅をSSL1~SSL8とする。
ノイズ低減処理部14Aによるノイズ低減処理後の音信号Rの周波数スペクトル(処理後スペクトル(R))における各周波数帯域(f1~f8)の振幅をSSR1~SSR8とする。
処理後スペクトルの周波数帯域(f1~f8)ごとの振幅の左/右信号比(以下、この左/右信号比を処理後比とする)は、RS1=SSL1/SSR1,・・・,RS8=SSL8/SSR8となる。
また、図2(c)に示すように、ノイズ低減処理部14Aによるノイズ低減処理後の音信号Lの周波数スペクトル(処理後スペクトル(L))における各周波数帯域(f1~f8)の振幅をSSL1~SSL8とする。
ノイズ低減処理部14Aによるノイズ低減処理後の音信号Rの周波数スペクトル(処理後スペクトル(R))における各周波数帯域(f1~f8)の振幅をSSR1~SSR8とする。
処理後スペクトルの周波数帯域(f1~f8)ごとの振幅の左/右信号比(以下、この左/右信号比を処理後比とする)は、RS1=SSL1/SSR1,・・・,RS8=SSL8/SSR8となる。
(補正後スペクトル)
補正部14Bは、処理前比(RI1~RI8)と、処理後比(RS1~RS8)と、
を各周波数帯域(f1~f8)において比較する。
そして、補正部14Bは、図2(d)に示すように、処理後比(RS1~RS8)が処理前比(RI1~RI8)と各々等しくなるように補正する。そして、補正後スペクトル(L)(SCL1~SCL8)及び補正後スペクトル(R)(SCR1~SCR8)を得る。
補正部14Bは、処理前比(RI1~RI8)と、処理後比(RS1~RS8)と、
を各周波数帯域(f1~f8)において比較する。
そして、補正部14Bは、図2(d)に示すように、処理後比(RS1~RS8)が処理前比(RI1~RI8)と各々等しくなるように補正する。そして、補正後スペクトル(L)(SCL1~SCL8)及び補正後スペクトル(R)(SCR1~SCR8)を得る。
ここで、補正後スペクトルを得る方式には、増加補正と、減少補正と、平均補正と、がある。
(増加補正)
増加補正は、処理後スペクトル(L)又は処理後スペクトル(R)の何れかの振幅を大きく補正して、処理後比RSを処理前比RIに一致させるものである。
1.処理後比RSnが処理前比RInより大きい場合
(1)補正後スペクトル(L)を求める(L固定)
処理後スペクトル(L)SSLnを補正後スペクトル(L)SCLnとする(SCLn=SSLn)
(2)補正後スペクトル(R)を求める
そして、(1)で求めた補正後スペクトル(L)SCLnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(R)SCRnを求める。
このとき、処理後比RSnは、処理前比RInより大きいので、処理後スペクトル(L)と同じ値の補正後スペクトル(L)SCLに対して処理前比を満たすように、処理後スペクトル(R)SSRを補正すると、補正後スペクトル(R)SCRnは、処理後スペクトル(R)SSRnより大きくなる(SCRn>SSRn)。
増加補正は、処理後スペクトル(L)又は処理後スペクトル(R)の何れかの振幅を大きく補正して、処理後比RSを処理前比RIに一致させるものである。
1.処理後比RSnが処理前比RInより大きい場合
(1)補正後スペクトル(L)を求める(L固定)
処理後スペクトル(L)SSLnを補正後スペクトル(L)SCLnとする(SCLn=SSLn)
(2)補正後スペクトル(R)を求める
そして、(1)で求めた補正後スペクトル(L)SCLnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(R)SCRnを求める。
このとき、処理後比RSnは、処理前比RInより大きいので、処理後スペクトル(L)と同じ値の補正後スペクトル(L)SCLに対して処理前比を満たすように、処理後スペクトル(R)SSRを補正すると、補正後スペクトル(R)SCRnは、処理後スペクトル(R)SSRnより大きくなる(SCRn>SSRn)。
2.処理後比RSnが処理前比RInより小さい場合
(1)補正後スペクトル(R)を求める(R固定)
処理後スペクトル(R)SSRnを補正後スペクトル(R)SCRnとする(SCRn=SSRn)
(2)補正後スペクトル(L)を求める
そして、(1)で求めた補正後スペクトル(R)SCRnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(L)SCLnを求める。
このとき、SCLn>SSLnとなる。
なお、上記「n」には、各周波数帯域を示す数字(1~8)が入る。
(1)補正後スペクトル(R)を求める(R固定)
処理後スペクトル(R)SSRnを補正後スペクトル(R)SCRnとする(SCRn=SSRn)
(2)補正後スペクトル(L)を求める
そして、(1)で求めた補正後スペクトル(R)SCRnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(L)SCLnを求める。
このとき、SCLn>SSLnとなる。
なお、上記「n」には、各周波数帯域を示す数字(1~8)が入る。
上記の増加補正において、補正後スペクトルの振幅は、本実施形態においてノイズ低減処理前の振幅以下であるが、これに限定されない。例えば、ノイズ低減処理後のスペクトルを一旦増幅した後にスペクトルの振幅を補正した場合には、補正後のスペクトルの振幅はノイズ低減処理前の振幅よりも大きくなることがある。
3.具体例
具体例として、図2(a)~(e)中に示すように、周波数スペクトルにおける周波数帯域f3に左右で差があり、周波数帯域f3における左右(L,R)の振幅値がノイズ低減処理前(6,3)で、ノイズ低減処理によって(4,1)に変化したとする。
この場合、処理前比RI3は6/3=2、処理後比RS3は4/1=4、と異なる。補正後における左右信号比(補正後比)RC3を処理前比RI3と等しくするため、ノイズ低減処理後の右(R)の振幅値を1から2に補正する。
その結果、補正後におけるL、Rの振幅値は(4,2)となり、処理前比2と等しくなる。
このような増加補正によれば、目的音の劣化を抑えることができ、人の音がある場合や目的音が大きくノイズがあまり気にならない場合等に適する。
具体例として、図2(a)~(e)中に示すように、周波数スペクトルにおける周波数帯域f3に左右で差があり、周波数帯域f3における左右(L,R)の振幅値がノイズ低減処理前(6,3)で、ノイズ低減処理によって(4,1)に変化したとする。
この場合、処理前比RI3は6/3=2、処理後比RS3は4/1=4、と異なる。補正後における左右信号比(補正後比)RC3を処理前比RI3と等しくするため、ノイズ低減処理後の右(R)の振幅値を1から2に補正する。
その結果、補正後におけるL、Rの振幅値は(4,2)となり、処理前比2と等しくなる。
このような増加補正によれば、目的音の劣化を抑えることができ、人の音がある場合や目的音が大きくノイズがあまり気にならない場合等に適する。
(減少補正)
減少補正は、処理後スペクトル(L)又は処理後スペクトル(R)の何れかの振幅を小さく補正して、処理後比RSを処理前比RIに一致させるものである。
1.処理後比RSnが処理前比RInより大きい場合
(1)補正後スペクトル(R)を求める(R固定)
処理後スペクトル(R)SSRnを補正後スペクトル(R)SCRnとする(SCRn=SSRn)
(2)補正後スペクトル(L)を求める
そして、(1)で求めた補正後スペクトル(R)SCRnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(L)SCLnを求める。
このとき、SCLn<SSLnとなる。
減少補正は、処理後スペクトル(L)又は処理後スペクトル(R)の何れかの振幅を小さく補正して、処理後比RSを処理前比RIに一致させるものである。
1.処理後比RSnが処理前比RInより大きい場合
(1)補正後スペクトル(R)を求める(R固定)
処理後スペクトル(R)SSRnを補正後スペクトル(R)SCRnとする(SCRn=SSRn)
(2)補正後スペクトル(L)を求める
そして、(1)で求めた補正後スペクトル(R)SCRnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(L)SCLnを求める。
このとき、SCLn<SSLnとなる。
2.処理後比RSnが処理前比RInより小さい場合
(1)補正後スペクトル(L)を求める(L固定)
処理後スペクトル(L)SSLnを補正後スペクトル(L)SCLnとする(SCLn=SSLn)
(2)補正後スペクトル(R)を求める
そして、(1)で求めた補正後スペクトル(L)SCLnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(R)SCRnを求める。
このとき、SCRn<SSRnとなる。
このような減少補正は、ノイズ低減効果が高く、人声のない静かな場合等に適する。
(1)補正後スペクトル(L)を求める(L固定)
処理後スペクトル(L)SSLnを補正後スペクトル(L)SCLnとする(SCLn=SSLn)
(2)補正後スペクトル(R)を求める
そして、(1)で求めた補正後スペクトル(L)SCLnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(R)SCRnを求める。
このとき、SCRn<SSRnとなる。
このような減少補正は、ノイズ低減効果が高く、人声のない静かな場合等に適する。
なお、上記の減少補正において、補正後スペクトルの振幅は、本実施形態においてノイズ低減処理後の振幅以下であるが、これに限定されない。例えば、ノイズ低減処理後のスペクトルを一旦増幅した後にスペクトルの振幅を補正した場合には、補正後のスペクトルの振幅はノイズ低減処理後の振幅よりも大きくなることがある。また、増幅の度合いに応じては、ノイズ低減処理前の振幅よりも大きくなることもある。
(平均補正)
平均補正は、前述した増加補正と減少補正とを折衷したものである。ノイズ低減処理後の左右の周波数スペクトルにおける振幅の和を、処理後比RSn=処理前比RInとなるように左右に振り分けて補正するものである。
平均補正は、前述した増加補正と減少補正とを折衷したものである。ノイズ低減処理後の左右の周波数スペクトルにおける振幅の和を、処理後比RSn=処理前比RInとなるように左右に振り分けて補正するものである。
上記各補正方式は、補正する対象や状況に応じて、補正方式を切り換えて適用するように構成してもよい。補正方式の切り換えは、公知の技術である音認識や撮像情報から顔認識や人物認識を利用して行うことができる。たとえば、人物が大きく撮影されている場合や人の音入力が認識された場合および入力が大きい場合には増加補正を適用し、人物が認識されないその他の場合には減少補正を適用するように構成すれば良い。
なお、本実施形態では、処理後比RS(第1の関係)を処理前比RI(基準関係)に一致させる例について説明した。しかし、本実施形態はそれに限定されない。補正後比RCは必ずしもRC=処理前比RIでなくても良く、RCは処理前比RIを含む所定の範囲内であればよい。また、補正後比RCの所定の範囲とは、処理後比RSよりも処理前比RIに近い値となる範囲である。
すなわち、仮に、処理後比RS(第1の関係)の音を聞くことができたとすると、補正後比RCの音の定位は、第1の関係(処理後比RS)の音の定位よりも、処理前比RIの音の定位に近い。
また、補正後比RCの所定の範囲とは、補正後比RCが処理前比RIのプラスマイナス5%以内に含まれるような範囲と定めてもよい。
また、補正後比RCの所定の範囲とは、補正後比RCが処理前比RIのプラスマイナス5%以内に含まれるような範囲と定めてもよい。
また、補正後比RCの所定の範囲とは、ノイズ低減処理前の音像の位置に対して、補正後の音像の位置がプラスマイナス30°以内に含まれるような範囲であってもよい。このように、補正後比RCの所定の範囲を、補正後の音像の位置が所定の角度の範囲に含まれるような範囲として定めてもよい。また補正後比RCの所定の範囲とは、補正後の音像の位置がプラスマイナス30°よりも狭い、プラスマイナス15°以内に含まれる範囲であってもよい。
つぎに、図3に示すフローチャートに沿って、ノイズ低減処理部14Aおよび補正部14Bによるノイズ低減処理と補正制御の流れを説明する。なお、図3中および以下の説明では、ステップを「S」とも略記する。
ノイズ低減処理部14Aによるノイズ低減処理と補正部14Bによる補正は、前述したようにAFエンコーダ21の出力等のAF駆動情報に基づいてスタートする。つまり、AF駆動時のみに機能する。
ノイズ低減処理部14Aによるノイズ低減処理と補正部14Bによる補正は、前述したようにAFエンコーダ21の出力等のAF駆動情報に基づいてスタートする。つまり、AF駆動時のみに機能する。
ノイズ低減処理と補正制御は、まず、補正部14Bがノイズ低減処理部14Aによるノイズ低減処理前におけるそのフレームの処理前比RIを演算し(S301)、ノイズ低減処理部14Aによってノイズ低減処理を行う(S302)。
ついで、補正部14Bが、ノイズ低減処理部14Aによるノイズ低減処理後の処理後比RSを演算し(S303)、その処理後比RSと処理前比RIとを比較する(S304)。
ステップ304において両者が等しくないと判断された場合(No)には、補正部14Bによってノイズ低減処理後の信号に補正を行う(S305)。一方、ステップ304において両者が等しいと判断された場合(Yes)には、補正することなく制御を終了する。
ついで、補正部14Bが、ノイズ低減処理部14Aによるノイズ低減処理後の処理後比RSを演算し(S303)、その処理後比RSと処理前比RIとを比較する(S304)。
ステップ304において両者が等しくないと判断された場合(No)には、補正部14Bによってノイズ低減処理後の信号に補正を行う(S305)。一方、ステップ304において両者が等しいと判断された場合(Yes)には、補正することなく制御を終了する。
上記のように、補正部14Bは、周波数スペクトルの各周波数帯域における処理後比を、処理前比と略一致するように補正する。
これにより、ステレオ信号をノイズ発生タイミングに合わせてノイズ低減処理を行った際に、そのノイズ低減処理に起因する目的音の音像変位を抑制することができる。
これにより、ステレオ信号をノイズ発生タイミングに合わせてノイズ低減処理を行った際に、そのノイズ低減処理に起因する目的音の音像変位を抑制することができる。
すなわち、図4に概念図を示すように、人物Mから見た目的音の音像位置に対して、ノイズ低減処理のみで補正しない処理音の音像が大きく移動してしまう場合でも、補正によって音像の移動を小さく抑えることができる。その結果、ノイズ低減処理時(AF駆動時)において映像と音像とが突然乖離するといった違和感のある音像変位を防ぐことができるものである。
また、本実施形態において音処理は、全周波数帯域において行うものでなくてもよく、一部の周波数帯域に対して音処理を行ってもよい。一部の周波数帯域の例としては、ノイズが特に検出される周波数帯域や、可聴の周波数帯域、極端な高周波や低周波をカットした周波数帯域があげられる。
また、本実施形態において音処理は、全周波数帯域において行うものでなくてもよく、一部の周波数帯域に対して音処理を行ってもよい。一部の周波数帯域の例としては、ノイズが特に検出される周波数帯域や、可聴の周波数帯域、極端な高周波や低周波をカットした周波数帯域があげられる。
(第2実施形態)
つぎに、第2実施形態について説明する。
図5は、第2実施形態にかかる音情報処理部14におけるノイズ低減処理と補正のフローチャートである。図2、図3と同様に、周波数スペクトルにおける周波数帯域f3について説明する。
本第2実施形態は、補正の基準とする左右信号比(処理前比)を、ノイズ(AF駆動音)発生の無い部分(フレーム)から取得するものである。なお、機構的な構成は、前述した第1実施形態と全く同様であり、説明は省略する。以下の説明中における構成要素の符号等は、図1参照のこと。
本第2実施形態では、補正の基準とする左右信号比を、ノイズ低減処理部分の直前または直後の部分から求める。なお、直前の信号比を利用する場合にはリアルタイムの処理(逐次処理)が可能であるが、直後の信号比を利用する場合には逐次処理が難しく後処理の場合にのみ適用可能である。
つぎに、第2実施形態について説明する。
図5は、第2実施形態にかかる音情報処理部14におけるノイズ低減処理と補正のフローチャートである。図2、図3と同様に、周波数スペクトルにおける周波数帯域f3について説明する。
本第2実施形態は、補正の基準とする左右信号比(処理前比)を、ノイズ(AF駆動音)発生の無い部分(フレーム)から取得するものである。なお、機構的な構成は、前述した第1実施形態と全く同様であり、説明は省略する。以下の説明中における構成要素の符号等は、図1参照のこと。
本第2実施形態では、補正の基準とする左右信号比を、ノイズ低減処理部分の直前または直後の部分から求める。なお、直前の信号比を利用する場合にはリアルタイムの処理(逐次処理)が可能であるが、直後の信号比を利用する場合には逐次処理が難しく後処理の場合にのみ適用可能である。
このように、ノイズ(AF駆動音)が混入していない部分から左右信号比を求めてこれを補正の基準とすることで、ノイズの影響を受けずに目的音の左右比を求めることができる。
ただし、目的音の時間変化が大きい場合は、ノイズ低減処理部分の直前と、ノイズ低減処理部分とで、目的音のスペクトル(左右信号比)が大きく変化することがあり、実際に発生している目的音の音像移動に追従できないことがある。このようなことを防ぐため、補正の基準とする左右信号比を、ノイズ低減処理部分の直前から求めた左右信号比と、前述した第1実施形態のようにノイズ低減処理部分の左右信号比と、の何れかを選択可能とすることが好ましい。
ただし、目的音の時間変化が大きい場合は、ノイズ低減処理部分の直前と、ノイズ低減処理部分とで、目的音のスペクトル(左右信号比)が大きく変化することがあり、実際に発生している目的音の音像移動に追従できないことがある。このようなことを防ぐため、補正の基準とする左右信号比を、ノイズ低減処理部分の直前から求めた左右信号比と、前述した第1実施形態のようにノイズ低減処理部分の左右信号比と、の何れかを選択可能とすることが好ましい。
この補正基準となる左右信号比を選択して適用する場合におけるノイズ低減処理および補正を、図5に示すフローチャートに沿って説明する。
まず、補正部14Bが、AFエンコーダ21の出力等のAF駆動情報に基づいてノイズ低減処理をスタートする直前のフレームの左右の信号比RIbを演算し(S501)、ノイズ低減処理に入った後にノイズ低減処理部14Aによるノイズ低減処理前における各フレームの左右の信号比RIaを演算する(S502)。
まず、補正部14Bが、AFエンコーダ21の出力等のAF駆動情報に基づいてノイズ低減処理をスタートする直前のフレームの左右の信号比RIbを演算し(S501)、ノイズ低減処理に入った後にノイズ低減処理部14Aによるノイズ低減処理前における各フレームの左右の信号比RIaを演算する(S502)。
そして、信号比RIbと信号比RIaとの差(絶対値)を、予め定められた閾値Aと比較判定する(S503)。
ステップ503において、信号比RIbと信号比RIaとの差が閾値A以下と判定された場合(Yes)には、信号比RIbを基準比RIとして設定する(S504)。一方、ステップ503において、信号比RIbと信号比RIaとの差が閾値Aを越えていると判定された場合(No)には、信号比RIaを基準比RIとして設定する(S505)。
ステップ503において、信号比RIbと信号比RIaとの差が閾値A以下と判定された場合(Yes)には、信号比RIbを基準比RIとして設定する(S504)。一方、ステップ503において、信号比RIbと信号比RIaとの差が閾値Aを越えていると判定された場合(No)には、信号比RIaを基準比RIとして設定する(S505)。
その後、ノイズ低減処理部14Aによってノイズ低減処理を行い(S506)、ついで、補正部14Bが、ノイズ低減処理部14Aによるノイズ低減処理後の左右の信号比RSを演算し(S507)、そのノイズ低減処理後左右信号比RSとノイズ低減処理前左右信号比RIとを比較する(S508)。
ステップ508において両者が等しくないと判断された場合(No)には、補正部14Bによってノイズ低減処理後の信号に補正を行う(S509)。一方、ステップ508において両者が等しいと判断された場合(Yes)には、補正することなく制御を終了する。
ステップ508において両者が等しくないと判断された場合(No)には、補正部14Bによってノイズ低減処理後の信号に補正を行う(S509)。一方、ステップ508において両者が等しいと判断された場合(Yes)には、補正することなく制御を終了する。
上記構成では、ノイズ低減処理部分の直前から求めた左右信号比RIbとノイズ低減処理部分の左右信号比RIaとを比較し、その差が小さい場合には、目的音の音像の移動が小さいと判断してノイズの影響を受けない信号比RIbを基準信号比RIとして採用し、差が所定量より大きい場合には、目的音の音像の移動が大きいと判断して信号比RIaを基準信号比RIとして採用するものである。
このような構成によれば、目的音の音像の移動が小さい場合には処理部分の直前と処理部分の音像の連続性を保つことができ、目的音の音像の移動が大きい場合には違和感のない円滑な音像移動を再現できる。
このような構成によれば、目的音の音像の移動が小さい場合には処理部分の直前と処理部分の音像の連続性を保つことができ、目的音の音像の移動が大きい場合には違和感のない円滑な音像移動を再現できる。
なお、事後処理(逐次処理でなく一旦記録した後に、読み出して行う処理)となるが、ノイズ低減処理部分の直前と直後の部分(フレーム)の左右信号比をそれぞれ求め、その変化率に対応させて左右の信号比率を変化させても良い。つまり、ノイズ低減処理部分の直前と直後において左右信号比が大きく異なる場合は、音源が左右に移動したと考えられるため、ノイズ低減処理部分の直前と直後の左右の信号比の変化と対応するように音像を移動させる処理を行うものである。
図6は、このような処理の説明図である。
図6(a)に示すように、フレーム4~10がノイズ低減処理フレームである場合、フレーム3が直前部分、フレーム11が直後部分のフレームである。
図6(b)において、SFL3は直前(フレーム3)の左スペクトル、SFR3は直前(フレーム3)の右スペクトル、SFL11は直後(フレーム11)の左スペクトル、SFR11は直後(フレーム11)の右スペクトルである。
図6(a)に示すように、フレーム4~10がノイズ低減処理フレームである場合、フレーム3が直前部分、フレーム11が直後部分のフレームである。
図6(b)において、SFL3は直前(フレーム3)の左スペクトル、SFR3は直前(フレーム3)の右スペクトル、SFL11は直後(フレーム11)の左スペクトル、SFR11は直後(フレーム11)の右スペクトルである。
ここで、たとえば、周波数帯域f3について見と、
左側:SFL11のf3(振幅1.5)は、SFL3のf3(振幅3)より減少している。
右側:SFR11のf3(振幅3)は、SFR3のf3(振幅1)より増加している。
これは、ノイズ低減処理フレーム4~10の間に音源が左側から右側に移動していることを示す。
左側:SFL11のf3(振幅1.5)は、SFL3のf3(振幅3)より減少している。
右側:SFR11のf3(振幅3)は、SFR3のf3(振幅1)より増加している。
これは、ノイズ低減処理フレーム4~10の間に音源が左側から右側に移動していることを示す。
そこで、ノイズ低減処理フレーム4~10における左右の信号比(処理前比)については、図6(c)に示すように、直前(フレーム3)の左右の信号比(3/1=3)から、直後(フレーム11)の左右の信号比(1.5/3=0.5)へ、連続して変化するようにして補正の基準値となる信号比を求める。
具体的には、直前と直後の値(3と0.5)と直前と直後の間にあるフレーム(7つ)とに基づいて、各フレームでの左右の信号比の値を求める。具体的にはフレーム4~10間で2.5/8の値ずつ左右比を減少させるような補正を行う。
f3以外の周波数帯域についても、各々同様の処理を行う。
その結果、処理直前から処理中、処理直後の左右の信号比が連続的に変化し、音像の移動が滑らかになり、違和感を軽減することができる。
具体的には、直前と直後の値(3と0.5)と直前と直後の間にあるフレーム(7つ)とに基づいて、各フレームでの左右の信号比の値を求める。具体的にはフレーム4~10間で2.5/8の値ずつ左右比を減少させるような補正を行う。
f3以外の周波数帯域についても、各々同様の処理を行う。
その結果、処理直前から処理中、処理直後の左右の信号比が連続的に変化し、音像の移動が滑らかになり、違和感を軽減することができる。
以上、本実施形態によると、以下の効果を有する。
(1)カメラ1における補正部14Bは、ノイズ低減処理後における周波数スペクトルの各周波数帯域における左右の信号比を、ノイズ低減処理前における周波数スペクトルの各周波数帯域における左右の信号比と略一致するように補正する。これにより、ステレオ信号をノイズ発生タイミングに合わせてノイズ低減処理する際に、そのノイズ低減処理に起因して生ずる目的音の音像変位を抑制することができる。その結果、ノイズ低減処理時(AF駆動時)における音像変位による違和感を防ぐことができる。
(1)カメラ1における補正部14Bは、ノイズ低減処理後における周波数スペクトルの各周波数帯域における左右の信号比を、ノイズ低減処理前における周波数スペクトルの各周波数帯域における左右の信号比と略一致するように補正する。これにより、ステレオ信号をノイズ発生タイミングに合わせてノイズ低減処理する際に、そのノイズ低減処理に起因して生ずる目的音の音像変位を抑制することができる。その結果、ノイズ低減処理時(AF駆動時)における音像変位による違和感を防ぐことができる。
(変形形態)
以上、説明した実施形態に限定されることなく、以下に示すような種々の変形や変更が可能であり、それらも本発明の範囲内である。
(1)上記実施形態は、本発明を音処理装置としてのカメラに適用して説明した。しかし、本発明はこれに限らず、コンピュータを上記各構成要素として機能させるプログラムとして提供されるものであっても良い。
以上、説明した実施形態に限定されることなく、以下に示すような種々の変形や変更が可能であり、それらも本発明の範囲内である。
(1)上記実施形態は、本発明を音処理装置としてのカメラに適用して説明した。しかし、本発明はこれに限らず、コンピュータを上記各構成要素として機能させるプログラムとして提供されるものであっても良い。
(2)上記実施形態は、本発明をカメラにおけるAF駆動音によるノイズを低減するように構成したもの例に挙げて説明した。しかし、本発明はこれに限らず、ズーミングやブレ補正装置の作動ノイズの低減にも適用可能なものであり、さらに、カメラに限らず録音機能を備える光学機器に適用可能である。
(3)本実施形態では、カメラ本体10に音情報処理部14が含まれている例について説明したが、これに限定されず、カメラに備わるステレオマイクで録音した後、音処理装置のほうにデータを送信し、音処理装置で低減処理を行ってもよい。すなわち、音を集音する部分と、音の低減処理を施す部分とが分離していてもよい。
この場合、一例として以下のような流れで処理が行われる。
カメラ等に備わるステレオマイクで周囲の音が録音される。
そして、そのステレオマイクで録音した音が音データに変換され、記憶部に記憶される。
録音の際にAF等のカメラ備わる機能の動作が行われた場合は、周囲の音を録音した音データとカメラに備わる機能の動作(例えばAFの動作)を行ったタイミングとを関連づけて記憶させる。
次に、記憶部に記憶された音データと動作タイミングとが出力部を介して、別体の音処理装置、例えばPC等に出力される。
音処理装置は、制御部、記憶部、ノイズ低減処理部(以下、これらをSP制御部、SP記憶部、SPノイズ低減処理部という)を備える。
SP制御部は、カメラから入力部を介して入力されたその音データと動作タイミングと音データをSP記憶部に記憶させる。
SP制御部は、SP記憶部に記憶された音データをSP低減処理部へ出力し、SP低減処理部は音データに対してAF音などの雑音の低減を行う。
なお、音の低減処理は、音データと共に記憶されている機能の動作タイミングに基づいて行う。その後、SP制御部は、低減処理された音データをSP記憶部に記憶させる。このようにして、音データに対して低減処理を施してもよい。
この場合、一例として以下のような流れで処理が行われる。
カメラ等に備わるステレオマイクで周囲の音が録音される。
そして、そのステレオマイクで録音した音が音データに変換され、記憶部に記憶される。
録音の際にAF等のカメラ備わる機能の動作が行われた場合は、周囲の音を録音した音データとカメラに備わる機能の動作(例えばAFの動作)を行ったタイミングとを関連づけて記憶させる。
次に、記憶部に記憶された音データと動作タイミングとが出力部を介して、別体の音処理装置、例えばPC等に出力される。
音処理装置は、制御部、記憶部、ノイズ低減処理部(以下、これらをSP制御部、SP記憶部、SPノイズ低減処理部という)を備える。
SP制御部は、カメラから入力部を介して入力されたその音データと動作タイミングと音データをSP記憶部に記憶させる。
SP制御部は、SP記憶部に記憶された音データをSP低減処理部へ出力し、SP低減処理部は音データに対してAF音などの雑音の低減を行う。
なお、音の低減処理は、音データと共に記憶されている機能の動作タイミングに基づいて行う。その後、SP制御部は、低減処理された音データをSP記憶部に記憶させる。このようにして、音データに対して低減処理を施してもよい。
(第3実施形態)
以下、図面等を参照して、第3実施形態について説明する。
図7は、第3実施形態にかかる音処理装置(音情報処理部)を備えたカメラ100の正面側から見た外観概略斜視図である。図8は、カメラ100のブロック構成図である。
以下、図面等を参照して、第3実施形態について説明する。
図7は、第3実施形態にかかる音処理装置(音情報処理部)を備えたカメラ100の正面側から見た外観概略斜視図である。図8は、カメラ100のブロック構成図である。
図7および図8に示すように、カメラ100は、カメラ本体110と、レンズ鏡筒120とにより構成されている。カメラ100は、自動的に合焦するオートフォーカス(以下AFと略記する)機能を備えている。また、カメラ100は、静止画と動画の何れも撮影可能であって、動画撮影時には画像と同時に音響をステレオで記録可能である。
なお、カメラ100は、カメラ本体110に対してレンズ鏡筒120が交換可能なものであってよく、また、カメラ本体110とレンズ鏡筒120とが一体のものであってもよい。
なお、カメラ100は、カメラ本体110に対してレンズ鏡筒120が交換可能なものであってよく、また、カメラ本体110とレンズ鏡筒120とが一体のものであってもよい。
カメラ本体110は、撮像部130と、録音部140と、記憶部111と、制御部112と、出力部118と、入力部119とを備えている。
撮像部130は、撮像素子131と、A/D変換部132と、画像処理部133と、により構成されている。
撮像素子131は、CCD等の光電変換素子により構成されている。撮像素子131は、レンズ鏡筒120の結像光学系によって結像された被写体像光をアナログの電気信号に変換し、A/D変換部132に出力する。
撮像部130は、撮像素子131と、A/D変換部132と、画像処理部133と、により構成されている。
撮像素子131は、CCD等の光電変換素子により構成されている。撮像素子131は、レンズ鏡筒120の結像光学系によって結像された被写体像光をアナログの電気信号に変換し、A/D変換部132に出力する。
A/D変換部132は、撮像素子131から入力されたアナログの画像信号をデジタル画像信号に変換して画像処理部133に出力する。
画像処理部133は、A/D変換部132から入力されたデジタル画像信号を画像処理して画像データを生成し、記憶部111に出力する。
画像処理部133は、A/D変換部132から入力されたデジタル画像信号を画像処理して画像データを生成し、記憶部111に出力する。
録音部140は、ステレオ集音装置141と、A/D変換部142と、音情報処理部150と、により構成されている。
ステレオ集音装置141は、図7に示すように、左右一対のマイクロフォン(左マイク141L,右マイク141R)を備えている。各マイク141L,141Rは、それぞれ外部の音を集音してアナログ信号としてA/D変換部142に出力する。
A/D変換部142は、ステレオ集音装置141から入力されたアナログ音信号を、デジタル音信号に変換して音情報処理部150に出力する。
ステレオ集音装置141は、図7に示すように、左右一対のマイクロフォン(左マイク141L,右マイク141R)を備えている。各マイク141L,141Rは、それぞれ外部の音を集音してアナログ信号としてA/D変換部142に出力する。
A/D変換部142は、ステレオ集音装置141から入力されたアナログ音信号を、デジタル音信号に変換して音情報処理部150に出力する。
音情報処理部150は、A/D変換部142から入力したステレオ集音装置141における左マイク141Lと右マイク141Rの音信号に含まれる動作ノイズをそれぞれ低減処理して音データを作成し、記憶部111に出力する。
なお、本実施形態において低減処理対象とする動作ノイズは、レンズ鏡筒120から発生するAF制御にかかる駆動ノイズ(AF駆動音)である。この音情報処理部150については、後に詳述する。
なお、本実施形態において低減処理対象とする動作ノイズは、レンズ鏡筒120から発生するAF制御にかかる駆動ノイズ(AF駆動音)である。この音情報処理部150については、後に詳述する。
記憶部111は、撮像部130(画像処理部133)が出力する画像データと、録音部140(音情報処理部150)が出力する音データを記憶する。記憶部15は、バッファーやカメラに内蔵されたメモリでもよいし、またSDカードやHDD等の外部の記憶媒体でもよい。
出力部118は、記憶部15に記憶された画像データ及び音データを出力する。出力部118は、外部機器へ音情報(電気信号)を出力するためのインターフェース等である。外部機器とは、これに限定されないが、例えばPC、外部スピーカ、携帯電話等である。ただし、これに限定されず、出力部118は、カメラ100に設けられた背面液晶及びスピーカであってもよい。なお、出力部118がスピーカの場合、出力部118は音情報(電気信号)を音に変換する変換部も備える。
入力部119は、外部機器からデータを入力するためのインターフェース等である。
外部機器とデータのやり取り(通信)をする際には、出力部118と入力部119は別体となっていなくてもよく、入力部119と出力部118が一体となっているよう21な構成であってもよい。
なお、外部機器とは、これに限定されないが、例えばPC、外部マイク、携帯電話等である。
外部機器とデータのやり取り(通信)をする際には、出力部118と入力部119は別体となっていなくてもよく、入力部119と出力部118が一体となっているよう21な構成であってもよい。
なお、外部機器とは、これに限定されないが、例えばPC、外部マイク、携帯電話等である。
制御部112は、CPU等を備えて構成され、設定された撮像条件(例えば、絞り値、露出値等)に応じて、レンズ鏡筒120の後述する各構成要素を含めた当該カメラ100の各構成要素を統括制御する。たとえば、制御部112は、後述するレンズ鏡筒120におけるAF駆動モータ123を駆動する駆動制御信号を生成し、AF駆動モータ123に出力する。
また、制御部112は、タイミング信号検出部112aを備える。タイミング信号検出部112aは、後述するが、レンズ鏡筒120から発生するAF制御のタイミングを検出する。
また、制御部112は、タイミング信号検出部112aを備える。タイミング信号検出部112aは、後述するが、レンズ鏡筒120から発生するAF制御のタイミングを検出する。
レンズ鏡筒120は、フォーカシングレンズ121と図示しない手振れ補正レンズおよびズーミングレンズ等により構成される結像光学系と、AFエンコーダ122と、AF駆動モータ123と、を備えている。
AFエンコーダ122は、フォーカシングレンズ121の位置を検出し、AF駆動モータ123の駆動制御情報としてカメラ本体110の制御部112に出力する。
AF駆動モータ123は、制御部16から入力されるフォーカシングレンズ121の位置を制御するための駆動制御信号に応じて、フォーカシングレンズ121を移動駆動する。このAF駆動モータ123の駆動音が、本実施形態における録音部140の音情報処理部150が低減処理対象とする主なAF駆動音である。
AFエンコーダ122は、フォーカシングレンズ121の位置を検出し、AF駆動モータ123の駆動制御情報としてカメラ本体110の制御部112に出力する。
AF駆動モータ123は、制御部16から入力されるフォーカシングレンズ121の位置を制御するための駆動制御信号に応じて、フォーカシングレンズ121を移動駆動する。このAF駆動モータ123の駆動音が、本実施形態における録音部140の音情報処理部150が低減処理対象とする主なAF駆動音である。
そして、カメラ100は、使用者による図示しないシャッタボタンの押圧操作によって撮影が指令されると、制御部112によって制御されて撮影作用を行う。すなわち、撮像部130が被写体像光を電気信号に変換すると共に画像処理して画像データとし、記憶部111を介して記録媒体に記録する(撮影する)。制御部112は、撮影時において、AF駆動モータ123を介してフォーカシングレンズ121を移動駆動するAF制御を行う。
動画撮影時においては、撮像部130がローリングシャッターで被写体像光を電気信号に変換して順次取り込み、記憶部111を介して1秒間に所定のフレーム(コマ数)の画像を記録媒体に記録する。
また、前述したように、録音部140が集音して音情報処理した音データを、画像データと共にフレーム毎に記憶部111を介して記録媒体に記録(録音)する。
動画撮影時には、撮影期間を通して被写体の位置変化に対応してAF制御を行い、AF駆動音は不定期に発生する。
また、前述したように、録音部140が集音して音情報処理した音データを、画像データと共にフレーム毎に記憶部111を介して記録媒体に記録(録音)する。
動画撮影時には、撮影期間を通して被写体の位置変化に対応してAF制御を行い、AF駆動音は不定期に発生する。
つぎに、録音部140における音情報処理部150について詳細に説明する。図9は、音情報処理部150における機能ブロック図である。
前述したように、音情報処理部150は、A/D変換部142から入力したステレオ集音装置141における左マイク141Lと右マイク141Rの音信号に含まれるAF駆動ノイズを低減処理する。
以下、左マイク141Lが集音した音情報の流れを左チャンネル(図中Lchと略記する)、右マイク141Rが集音した音情報の流れを右チャンネル(Rch)として説明する。なお、この左右は、撮影者側から見た左右である。
前述したように、音情報処理部150は、A/D変換部142から入力したステレオ集音装置141における左マイク141Lと右マイク141Rの音信号に含まれるAF駆動ノイズを低減処理する。
以下、左マイク141Lが集音した音情報の流れを左チャンネル(図中Lchと略記する)、右マイク141Rが集音した音情報の流れを右チャンネル(Rch)として説明する。なお、この左右は、撮影者側から見た左右である。
本実施形態における音情報処理部150は、一方のチャンネル(本実施形態では左チャンネル)の音情報に対してスペクトル減算法でノイズ低減処理すると共に、この情報を用いて他方のチャンネル(右チャンネル)の音情報に対してスペクトル調整処理を行う。
図9に示すように、音情報処理部150は、左右両チャンネルそれぞれのスペクトル変換部51L,51Rと、左チャンネルのノイズスペクトル推定部52Lと、左チャンネルのノイズスペクトル低減部53Lと、右チャンネルのスペクトル調整部54R(算出部,処理部,補正部)と、左右両チャンネルの逆変換部55L,55Rと、を備えている。
また、ノイズスペクトル低減部53Lは、さらに衝撃音ノイズ低減処理部53Aと駆動音ノイズ低減処理部53Bとを備える。
また、ノイズスペクトル低減部53Lは、さらに衝撃音ノイズ低減処理部53Aと駆動音ノイズ低減処理部53Bとを備える。
以下、音情報処理部150の各部についてさらに詳細に説明する。
(スペクトル変換部)
スペクトル変換部51L,51Rは、A/D変換部142から入力された左右両チャンネルの音信号に対して、それぞれ、予め決められた区間ごとに窓関数で重み付けするとともに、この区間毎の音信号を周波数領域毎の振幅を表わすスペクトルSL,SR(後述の図11参照)に変換する。
(スペクトル変換部)
スペクトル変換部51L,51Rは、A/D変換部142から入力された左右両チャンネルの音信号に対して、それぞれ、予め決められた区間ごとに窓関数で重み付けするとともに、この区間毎の音信号を周波数領域毎の振幅を表わすスペクトルSL,SR(後述の図11参照)に変換する。
図10はAFレンズを駆動した際に、マイクで集音されるマイク音信号の一例である。図10のグラフは、縦軸にマイク230によって集音されたマイク信号を、横軸に時間をそれぞれ示す。図10に示すように、AF駆動を行なう場合、図示の時刻t10~t11、時刻t20~t21の時間で衝撃音が発生している。
なお、図10は説明便宜のため、マイク音信号のうち、動作音の音信号のみを示し、目的音の音信号の図示を省略する。
なお、図10は説明便宜のため、マイク音信号のうち、動作音の音信号のみを示し、目的音の音信号の図示を省略する。
スペクトル変換部51L,51Rは、A/D変換部142から出力されたマイク音信号に対して、あらかじめ定められた区間ごとに窓関数で重み付けする。そして、この区間ごとのマイク音信号に対して、例えば、フーリエ変換、あるいは高速フーリエ変換(FFT:First Fourier Transform)を行い、周波数領域に変換し、窓関数の各区間に対応する周波数スペクトルを算出する。
ここで、窓関数のあらかじめ定められた区間とは、信号処理の単位(フレーム)であって、一定の間隔で繰り返される区間である。これらの窓関数の各区間は、他の窓関数の各区間と半分ずつオートフォーカスバラップしている。なお窓関数は、例えばハニング窓(ハニングウィンドウ)関数が利用可能である。
図10を参照してスペクトル変換部51L,51Rにより算出される窓関数の各区間に対応する周波数スペクトルの一例について説明する。
スペクトル変換部51L,51Rは、上述の通り、A/D変換部142から出力されたマイク音信号に対して、他の区間と半分づつオーバラップしている窓関数で重み付けする。これにより、マイク音信号は、窓関数のサイズに分割される。
このスペクトル変換部51L,51Rは、窓関数で重み付けされた各区間のマイク信号ごとに、例えばフーリエ変換を行い、図10に示すように、他の区間と半分づつオーバラップしている周波数スペクトルS1~S14を算出する。
スペクトル変換部51L,51Rは、上述の通り、A/D変換部142から出力されたマイク音信号に対して、他の区間と半分づつオーバラップしている窓関数で重み付けする。これにより、マイク音信号は、窓関数のサイズに分割される。
このスペクトル変換部51L,51Rは、窓関数で重み付けされた各区間のマイク信号ごとに、例えばフーリエ変換を行い、図10に示すように、他の区間と半分づつオーバラップしている周波数スペクトルS1~S14を算出する。
(ノイズスペクトル推定部)
ノイズスペクトルの推定は、左チャンネルから入力されて周波数スペクトルに変換された音信号に対して、タイミング信号検出部112aから検出されたタイミングに基づいて行なわれる。
ノイズスペクトルの推定は、左チャンネルから入力されて周波数スペクトルに変換された音信号に対して、タイミング信号検出部112aから検出されたタイミングに基づいて行なわれる。
タイミング信号検出部112aは、レンズ鏡筒120の動作状態が変化するタイミング(動作変化タイミング)を検出する。
この動作変化タイミングとしては、例えば、フォーカシングレンズ121が動作を開始する動作開始タイミングと、フォーカシングレンズ121の動作が停止する動作停止タイミングとがある。
この動作変化タイミングとしては、例えば、フォーカシングレンズ121が動作を開始する動作開始タイミングと、フォーカシングレンズ121の動作が停止する動作停止タイミングとがある。
タイミング信号検出部112aは、AF駆動モータ123に入力される駆動制御信号に基づいて、動作変化タイミングを検出することができる。
また、タイミング信号検出部112aは、駆動制御信号を生成する場合に制御部112内部で実行される処理やコマンドに基づいて、動作変化タイミングを検出してもよい。
さらに、タイミング信号検出部112aは、操作部から入力される操作信号に基づいて、動作変化タイミングを検出してもよい。
また、タイミング信号検出部112aは、例えば、エンコーダ122から出力されるパルス信号に基づきの出力に基づいて、動作変化タイミングを検出してもよい。
また、タイミング信号検出部112aは、駆動制御信号を生成する場合に制御部112内部で実行される処理やコマンドに基づいて、動作変化タイミングを検出してもよい。
さらに、タイミング信号検出部112aは、操作部から入力される操作信号に基づいて、動作変化タイミングを検出してもよい。
また、タイミング信号検出部112aは、例えば、エンコーダ122から出力されるパルス信号に基づきの出力に基づいて、動作変化タイミングを検出してもよい。
そして、タイミング信号検出部112aは、図10で示す衝撃音が発生している時刻t10からt11を示す情報を、動作開始タイミング信号として出力する。
また、タイミング信号検出部112aは、図10で示す衝撃音が発生している時刻t20からt21を示す情報を、動作停止タイミング信号として出力する。
また、タイミング信号検出部112aは、図10で示す衝撃音が発生している時刻t20からt21を示す情報を、動作停止タイミング信号として出力する。
この、タイミング信号検出部112aからの動作開始タイミング信号及び動作停止タイミング信号に基づき、ノイズスペクトル推定部52Lは、図10の周波数スペクトルS2~S4が、AFレンズ121の動作開始タイミングt10に対応する衝撃音発生期間t10からt11を含む音情報であると推定する。
また、ノイズスペクトル推定部52Lは、周波数スペクトルS9~S12が、AFレンズ121の動作停止タイミングt20に対応する衝撃音発生期間t20~t21を含む音情報であると推定する。
そして、ノイズスペクトル推定部52Lは、周波数スペクトルS5~S8が、AFレンズ121による駆動音の発生期間に対応する音情報であると推定する。
また、ノイズスペクトル推定部52Lは、周波数スペクトルS9~S12が、AFレンズ121の動作停止タイミングt20に対応する衝撃音発生期間t20~t21を含む音情報であると推定する。
そして、ノイズスペクトル推定部52Lは、周波数スペクトルS5~S8が、AFレンズ121による駆動音の発生期間に対応する音情報であると推定する。
ノイズスペクトル推定部52Lは、衝撃音発生期間に対応する周波数スペクトルの周波数成分の総和と、予め決められた閾値とを比較する。
この予め定められた閾値とは、衝撃音に対して目的音が大きいため、衝撃音による音声劣化が少ないとされる目的音の周波数スペクトルの周波数成分の総和である。
この予め定められた閾値とは、衝撃音に対して目的音が大きいため、衝撃音による音声劣化が少ないとされる目的音の周波数スペクトルの周波数成分の総和である。
衝撃音発生期間に対応する周波数スペクトルの周波数成分の総和が、予め定められた閾値未満であると判定した場合、ノイズスペクトル推定部52Lは、算出した周波数スペクトルS1~S14をノイズスペクトル低減部53Lの衝撃音ノイズ低減処理部53Aに出力する。
一方、衝撃音発生期間に対応する周波数スペクトルの周波数成分の総和が、予め定められた閾値以上であると判定した場合、ノイズスペクトル推定部52Lは、算出した周波数スペクトルS1~S14をノイズスペクトル低減部53Lの駆動音ノイズ低減処理部53Bに出力する。
(衝撃音ノイズ低減処理部)
衝撃音ノイズ低減処理部53Aは、例えば、周波数スペクトルS1~S14から、衝撃音が発生している可能性の高い期間に対応する周波数スペクトル(第1周波数スペクトル)を取得する。
例えば、衝撃音ノイズ低減処理部53Aは、動作開始タイミングt10に対応する衝撃音発生期間t10~t11に示す周波数スペクトルS2~S4を第1周波数スペクトルとして取得する。そして、衝撃音ノイズ低減処理部53Aは、動作停止タイミングt20に対応する衝撃音発生期間t20~t21に示す周波数スペクトルS9~S12を第1周波数スペクトルとして取得する。
衝撃音ノイズ低減処理部53Aは、例えば、周波数スペクトルS1~S14から、衝撃音が発生している可能性の高い期間に対応する周波数スペクトル(第1周波数スペクトル)を取得する。
例えば、衝撃音ノイズ低減処理部53Aは、動作開始タイミングt10に対応する衝撃音発生期間t10~t11に示す周波数スペクトルS2~S4を第1周波数スペクトルとして取得する。そして、衝撃音ノイズ低減処理部53Aは、動作停止タイミングt20に対応する衝撃音発生期間t20~t21に示す周波数スペクトルS9~S12を第1周波数スペクトルとして取得する。
また、衝撃音ノイズ低減処理部53Aは、周波数スペクトルS1~S14から、衝撃音が発生していない可能性の高い期間に対応する周波数スペクトル(第2周波数スペクトル)を取得する。
本実施形態において、衝撃音ノイズ低減処理部53Aは、第1周波数スペクトルと、時間軸方向において最も近い周波数スペクトルを第2周波数スペクトルとして取得する。
本実施形態において、衝撃音ノイズ低減処理部53Aは、第1周波数スペクトルと、時間軸方向において最も近い周波数スペクトルを第2周波数スペクトルとして取得する。
例えば、図10に示すように、衝撃音ノイズ低減処理部53Aは、第1周波数スペクトルである周波数スペクトルS2、S3に対応する第2周波数スペクトルとして、周波数スペクトルS2,3の時間軸の過去方向に最も近い周波数スペクトルS1を取得する。
また、第1周波数スペクトルである周波数スペクトルS4に対応する第2周波数スペクトルとして、周波数スペクトルS4の時間軸の未来方向に最も近い周波数スペクトルS5を取得する。
また、第1周波数スペクトルである周波数スペクトルS9、S10に対応する第2周波数スペクトルとして、周波数スペクトルS9,10の時間軸の過去方向に最も近い周波数スペクトルS8を取得する。
さらに、第1周波数スペクトルである周波数スペクトルS11,12に対応する第2周波数スペクトルとして、周波数スペクトルS11,12の時間軸の未来方向に最も近い周波数スペクトルS13を取得する。
また、第1周波数スペクトルである周波数スペクトルS4に対応する第2周波数スペクトルとして、周波数スペクトルS4の時間軸の未来方向に最も近い周波数スペクトルS5を取得する。
また、第1周波数スペクトルである周波数スペクトルS9、S10に対応する第2周波数スペクトルとして、周波数スペクトルS9,10の時間軸の過去方向に最も近い周波数スペクトルS8を取得する。
さらに、第1周波数スペクトルである周波数スペクトルS11,12に対応する第2周波数スペクトルとして、周波数スペクトルS11,12の時間軸の未来方向に最も近い周波数スペクトルS13を取得する。
そして、衝撃音ノイズ低減処理部53Aは、第1周波数スペクトルのうちの少なくとも一部を第2周波数スペクトルの対応する部分に置き換える。
この置き換えの一例として、例えば、衝撃音ノイズ低減処理部53Aは、第1周波数スペクトルのうち予め定められた閾値周波数以上の周波数スペクトルと、第2周波数スペクトルのうち予め定められた閾値周波数以上の周波数スペクトルとを、周波数成分ごとに比較して、第2周波数スペクトルのほうが第1周波数スペクトルに比べて小さいと判定した場合に、第1周波数スペクトルにおける当該周波数成分を第2周波数スペクトルの周波数成分に置き換える。
この置き換えの一例として、例えば、衝撃音ノイズ低減処理部53Aは、第1周波数スペクトルのうち予め定められた閾値周波数以上の周波数スペクトルと、第2周波数スペクトルのうち予め定められた閾値周波数以上の周波数スペクトルとを、周波数成分ごとに比較して、第2周波数スペクトルのほうが第1周波数スペクトルに比べて小さいと判定した場合に、第1周波数スペクトルにおける当該周波数成分を第2周波数スペクトルの周波数成分に置き換える。
(駆動音ノイズ低減処理部)
一方、駆動音ノイズ低減処理部53Bは、タイミング信号検出部112aから入力するタイミング信号に基づき、例えば、周波数スペクトルS1~S14から、駆動音が発生している可能性の高い期間に対応する周波数スペクトル(第3周波数スペクトル)を取得する。
例えば、駆動音ノイズ低減処理部53Bは、動作開始タイミングt10に対応する衝撃音発生期間t10~t11と、動作停止タイミングt20に対応する衝撃音発生期間t20~t21とに基づき、駆動音が発生している可能性のある期間に対応する周波数スペクトルS2~S12を、第3周波数スペクトルとして取得する。
一方、駆動音ノイズ低減処理部53Bは、タイミング信号検出部112aから入力するタイミング信号に基づき、例えば、周波数スペクトルS1~S14から、駆動音が発生している可能性の高い期間に対応する周波数スペクトル(第3周波数スペクトル)を取得する。
例えば、駆動音ノイズ低減処理部53Bは、動作開始タイミングt10に対応する衝撃音発生期間t10~t11と、動作停止タイミングt20に対応する衝撃音発生期間t20~t21とに基づき、駆動音が発生している可能性のある期間に対応する周波数スペクトルS2~S12を、第3周波数スペクトルとして取得する。
駆動音ノイズ低減処理部53Bは、取得した第3周波数スペクトルに対して、駆動パターンに応じて予め定められているノイズを低減する駆動音ノイズ低減処理を行なう。
例えば、駆動音ノイズ低減処理部53Bは、駆動パターンに応じて予め定められているノイズを表す周波数スペクトルの周波数成分を、第3周波数スペクトルの周波数成分から減算する周波数スペクトル減算法を用いる。
なお、駆動パターンに応じて予め定められているノイズの周波数スペクトルは、設定値として音情報処理部150に予め設定されている。しかし、これに限定されず駆動音ノイズ低減処理部53Bが過去のマイク音信号に基づいて、駆動音が発生している区間の周波数スペクトルから駆動音が発生していない区間の周波数スペクトルを減算することにより、推定される駆動音のノイズの周波数スペクトルを、駆動パターンとして算出しておくものであっても良い。
例えば、駆動音ノイズ低減処理部53Bは、駆動パターンに応じて予め定められているノイズを表す周波数スペクトルの周波数成分を、第3周波数スペクトルの周波数成分から減算する周波数スペクトル減算法を用いる。
なお、駆動パターンに応じて予め定められているノイズの周波数スペクトルは、設定値として音情報処理部150に予め設定されている。しかし、これに限定されず駆動音ノイズ低減処理部53Bが過去のマイク音信号に基づいて、駆動音が発生している区間の周波数スペクトルから駆動音が発生していない区間の周波数スペクトルを減算することにより、推定される駆動音のノイズの周波数スペクトルを、駆動パターンとして算出しておくものであっても良い。
以上のように、ノイズスペクトル低減部53Lの衝撃音ノイズ低減処理部53A及び駆動音ノイズ低減処理部53Bは、それぞれのフレームの周波数スペクトルごとに、AF駆動ノイズの発生が検知された左チャンネルの周波数スペクトルSLから、AF駆動ノイズ成分を低減処理した左チャンネルの周波数スペクトルSSLを算出する。
(スペクトル調整部)
図11は、左チャンネルから右チャンネルの周波数スペクトルSSRを得る方法を説明する。
図示するように、音情報処理部150のスペクトル調整部54Rは、スペクトル変換部51Lが算出した(ノイズ低減処理前の)左チャンネルの周波数スペクトルSLに対する、スペクトル変換部51Rが算出した右チャンネルの周波数スペクトルSRの周波数領域毎の振幅の比で、ノイズスペクトル低減部53Lによるノイズ低減処理後の左チャンネルの周波数スペクトルSSLの周波数領域毎の振幅を調整して、右チャンネルの周波数スペクトルSSRを得る。
図11は、左チャンネルから右チャンネルの周波数スペクトルSSRを得る方法を説明する。
図示するように、音情報処理部150のスペクトル調整部54Rは、スペクトル変換部51Lが算出した(ノイズ低減処理前の)左チャンネルの周波数スペクトルSLに対する、スペクトル変換部51Rが算出した右チャンネルの周波数スペクトルSRの周波数領域毎の振幅の比で、ノイズスペクトル低減部53Lによるノイズ低減処理後の左チャンネルの周波数スペクトルSSLの周波数領域毎の振幅を調整して、右チャンネルの周波数スペクトルSSRを得る。
すなわち、
SL(k):左チャンネルのノイズ低減前のスペクトル
SR(k):右チャンネルのノイズ低減前のスペクトル
SSL(k):左チャンネルのノイズ低減後のスペクトル
SSR(k):右チャンネルの調整後のスペクトル
なお、k:周波数成分番号
として、
右チャンネルの調整後のスペクトルSSR(k)を、
SSR(k)=SSL(k)*SR(k)/SL(k)
で求める。
SL(k):左チャンネルのノイズ低減前のスペクトル
SR(k):右チャンネルのノイズ低減前のスペクトル
SSL(k):左チャンネルのノイズ低減後のスペクトル
SSR(k):右チャンネルの調整後のスペクトル
なお、k:周波数成分番号
として、
右チャンネルの調整後のスペクトルSSR(k)を、
SSR(k)=SSL(k)*SR(k)/SL(k)
で求める。
換言すると、スペクトル調整部54Rは、ノイズ低減処理前の左チャンネルの周波数スペクトルSLに対する、右チャンネルの周波数スペクトルSRの、周波数領域毎の振幅の比(図11中における左右振幅比:R)を求め、ノイズ低減処理後の左チャンネルの周波数スペクトルSSLに対して周波数領域毎にこの左右振幅比:Rとなる右チャンネルの周波数スペクトルSSRを算出する。
たとえば、図11中に例示するように、
SL(f3)=1.0
SR(f3)=0.5
SSL(f3)=0.6
の場合には、
R(f3)=0.5/1.0=0.5
であって、
SSR(f3)=0.6×0.5=0.3
となる。
SL(f3)=1.0
SR(f3)=0.5
SSL(f3)=0.6
の場合には、
R(f3)=0.5/1.0=0.5
であって、
SSR(f3)=0.6×0.5=0.3
となる。
(逆変換部)
逆変換部55L,55Rは、ノイズスペクトル低減部53Lによってノイズ低減処理を行った周波数スペクトルSSL、または、スペクトル調整部54Rによって調整を行った周波数スペクトルSSRに対して、それぞれ、例えば逆フーリエ変換、あるいは逆高速フーリエ変換(IFFT:Inverse Fast Fourier Transform)を行うことで、時間領域に変換する。逆変換部55LはLchの入力音の位相情報を用いて逆変換を行い、逆変換部55RはRchの入力音の位相情報を用いて逆変換を行う。そして、逆変換部55L,55Rは、この時間領域に変換された音信号を、記憶部111に出力する。
逆変換部55L,55Rは、ノイズスペクトル低減部53Lによってノイズ低減処理を行った周波数スペクトルSSL、または、スペクトル調整部54Rによって調整を行った周波数スペクトルSSRに対して、それぞれ、例えば逆フーリエ変換、あるいは逆高速フーリエ変換(IFFT:Inverse Fast Fourier Transform)を行うことで、時間領域に変換する。逆変換部55LはLchの入力音の位相情報を用いて逆変換を行い、逆変換部55RはRchの入力音の位相情報を用いて逆変換を行う。そして、逆変換部55L,55Rは、この時間領域に変換された音信号を、記憶部111に出力する。
(動作のフローチャート)
次に、音情報処理部150における上述動作について図12のフローチャートに基づいて説明する。
次に、音情報処理部150における上述動作について図12のフローチャートに基づいて説明する。
まず、左右のマイク141L,141Rより入力された左右両チャンネルの音信号は、A/D変換部142でA/D変換が行なわれ、音情報処理部150に入力される(ステップS10)。
音情報処理部150のスペクトル変換部51L,51Rは、例えば、マイク音信号にフーリエ変換を行なうことで、窓関数の各区間に対応する周波数スペクトルを算出する(ステップS11)。
音情報処理部150のノイズスペクトル推定部52Lは、動作変化タイミング信号より、衝撃音発生期間を推定し、衝撃音が発生しているスペクトルを推定する(ステップS12)。
音情報処理部150のノイズスペクトル推定部52Lは、左チャンネルの音情報に対して、衝撃音発生期間に対応する周波数スペクトルの周波数成分の総和と、予め決められた閾値とを比較する(ステップS13)。
衝撃音発生期間に対応する周波数スペクトルの周波数成分の総和が閾値よりも小さい場合(ステップS13,YES)、音情報処理部150の衝撃音ノイズ低減処理部53Aは、衝撃音発生している可能性の高い期間に対応する周波数スペクトル(第1周波数スペクトル)を取得する。
また、衝撃音ノイズ低減処理部53Aは、周波数スペクトルS1~S14から、衝撃音が発生していない可能性の高い期間に対応する周波数スペクトル(第2周波数スペクトル)を取得する(ステップS14)。
また、衝撃音ノイズ低減処理部53Aは、周波数スペクトルS1~S14から、衝撃音が発生していない可能性の高い期間に対応する周波数スペクトル(第2周波数スペクトル)を取得する(ステップS14)。
衝撃音ノイズ低減処理部53Aは、第1周波数スペクトルのうちの少なくとも一部を第2周波数スペクトルの対応する部分に置き換えて衝撃音ノイズ低減スペクトルを取得する(ステップS15)。
駆動音ノイズ低減処理部53Bは、駆動音が発生している可能性のある期間に対応する周波数スペクトルを、第3周波数スペクトルとして取得する。そして、駆動音ノイズ低減処理部53Bは、衝撃音ノイズ低減スペクトルに対して、取得した第3周波数スペクトルをもとに、駆動パターンに応じて予め定められているノイズを低減する駆動音ノイズ低減処理を行なう(ステップS16)。
なお、衝撃音発生期間に対応する周波数スペクトルの周波数成分の総和が閾値以上の場合(ステップS13,NO)もステップS16に進む。
なお、衝撃音発生期間に対応する周波数スペクトルの周波数成分の総和が閾値以上の場合(ステップS13,NO)もステップS16に進む。
音情報処理部150のスペクトル調整部54Rは、スペクトル変換部51Lが算出した(ノイズ低減処理前の)左チャンネルの周波数スペクトルSLに対する、スペクトル変換部51Rが算出した右チャンネルの周波数スペクトルSRの周波数領域毎の振幅の比で、ノイズスペクトル低減部53Lによるノイズ低減処理後の左チャンネルの周波数スペクトルSSLの周波数領域毎の振幅を調整して、右チャンネルの周波数スペクトルSSRを得る(ステップS17)。
スペクトル調整部54Rは、ノイズスペクトル低減部53Lによってノイズ低減処理を行った周波数スペクトルSSL、または、スペクトル調整部54Rによって調整を行った周波数スペクトルSSRに対して、それぞれ、例えば逆フーリエ変換を行うことで、時間領域に変換する(ステップS18)。
上記のような音情報処理部150によるノイズ低減処理によれば、ノイズ低減処理後の周波数スペクトルの各周波数成分の左右比が、処理前後で保たれる。これにより、本来の定位感を保ったままノイズを低減した音声を得ることができる。
また、右チャンネルにおける推定ノイズスペクトルの算出およびノイズスペクトルの低減(左チャンネルにおけるノイズスペクトル推定部52Lとノイズスペクトル低減部53L)を省くことができる。これにより、演算量、および必要なメモリを削減することができる。
また、右チャンネルにおける推定ノイズスペクトルの算出およびノイズスペクトルの低減(左チャンネルにおけるノイズスペクトル推定部52Lとノイズスペクトル低減部53L)を省くことができる。これにより、演算量、および必要なメモリを削減することができる。
ここで、上記実施形態では、左チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行い、その情報に基づいて右チャンネルのスペクトル調整を行っている。
しかし、この左右チャンネルの分担は、逆であっても良い。つまり、右チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行い、その情報に基づいて左チャンネルのスペクトル調整を行うものであってもよい。さらに、状況に応じて切り替えるように構成しても良い。
しかし、この左右チャンネルの分担は、逆であっても良い。つまり、右チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行い、その情報に基づいて左チャンネルのスペクトル調整を行うものであってもよい。さらに、状況に応じて切り替えるように構成しても良い。
左右のチャンネルの処理を状況に応じて切り替える構成としては、たとえば、制御部112によってノイズの発生源に対してステレオ集音装置141における左マイク141Lと右マイク141Rのいずれが近いかを判断し、近い方のマイク入力のチャンネルの音情報に対して推定ノイズスペクトルの算出およびノイズスペクトルの低減を行い、その情報に基づいて他方のチャンネルのスペクトル調整を行うように構成してもよい。
また、左右のチャンネルの処理を状況に応じて切り替える他の構成として、AFエンコーダ122の出力信号に基づいて音信号内におけるAF駆動ノイズの発生を検知した際に、音信号入力が小さい側のチャンネルの音情報に対して推定ノイズスペクトルの算出およびノイズスペクトルの低減を行い、その情報に基づいて他方のチャンネルのスペクトル調整を行うように構成しても良い。
これは、ステレオ集音装置141における左マイク141Lと右マイク141Rから入力されるノイズの条件が略同一であれば、音信号入力が小さい方がノイズの割合が大きいと考えられるためである。これによれば、より精度の高いノイズ低減効果が得られる。
これは、ステレオ集音装置141における左マイク141Lと右マイク141Rから入力されるノイズの条件が略同一であれば、音信号入力が小さい方がノイズの割合が大きいと考えられるためである。これによれば、より精度の高いノイズ低減効果が得られる。
さらに、左右のチャンネルの処理を状況に応じて切り替える他の構成として、AF駆動の動作音の変動を検出し、その変動に伴って音信号が変動するチャンネルの音情報に対して推定ノイズスペクトルの算出およびノイズスペクトルの低減を行い、その情報に基づいて他方のチャンネルのスペクトル調整を行うように構成しても良い。
これは、AF駆動の動作音の変動に伴って音信号が変動するチャンネルの音情報にはAF駆動ノイズが含まれている可能性が高いためである。これにより、精度の高いノイズ低減効果が得られる。
また、左右のチャンネルの処理を状況に応じて切り替える更なる構成として、図7において点線で示すように、切り替え用のスイッチ143をカメラ本体110に設けても良い。
これは、AF駆動の動作音の変動に伴って音信号が変動するチャンネルの音情報にはAF駆動ノイズが含まれている可能性が高いためである。これにより、精度の高いノイズ低減効果が得られる。
また、左右のチャンネルの処理を状況に応じて切り替える更なる構成として、図7において点線で示すように、切り替え用のスイッチ143をカメラ本体110に設けても良い。
以上、第3実施形態によると、以下の効果を有する。
(1)ステレオ音声の場合、左耳用音声と右耳用音声にそれぞれ独立にノイズ低減処理を行なうと、左耳用音声に残存するノイズ成分と右耳用音声に残存するノイズ成分との比が時々刻々と変化し、残存ノイズの定位も時々刻々と変化する。また、左耳用音声の目的音の劣化成分と、右耳用音声の目的音の劣化成分の比も時々刻々と変化するため、目的音の定位も本来の定位から時々刻々と変化する。そのため、処理後の音声は本来の定位感、臨場感が損なわれた音声になってしまう。
カメラ100は、その音情報処理部150が、一方のチャンネルの音情報に対してスペクトル減算法でノイズ低減処理すると共に、この情報を用いて他方のチャンネル(右チャンネル)の音情報に対してスペクトル調整処理を行う。
スペクトル調整処理は、ノイズ低減処理前の一方のチャンネルの周波数スペクトルに対する、他方のチャンネルの周波数スペクトルの周波数領域毎の振幅の比で、一方のチャンネルのノイズ低減処理後の周波数スペクトルの周波数領域毎の振幅を調整して他方のチャンネルの周波数スペクトルを得る。
これにより、周波数スペクトルの各周波数成分の左右比が処理前後で保たれ、本来の定位感や臨場感を保ったままノイズを低減した音声を得ることができる。
(2)また、一方のチャンネルにおける推定ノイズスペクトルの算出およびノイズスペクトルの低減を省くことができる。これにより、演算量、および必要なメモリを削減することができる。
(1)ステレオ音声の場合、左耳用音声と右耳用音声にそれぞれ独立にノイズ低減処理を行なうと、左耳用音声に残存するノイズ成分と右耳用音声に残存するノイズ成分との比が時々刻々と変化し、残存ノイズの定位も時々刻々と変化する。また、左耳用音声の目的音の劣化成分と、右耳用音声の目的音の劣化成分の比も時々刻々と変化するため、目的音の定位も本来の定位から時々刻々と変化する。そのため、処理後の音声は本来の定位感、臨場感が損なわれた音声になってしまう。
カメラ100は、その音情報処理部150が、一方のチャンネルの音情報に対してスペクトル減算法でノイズ低減処理すると共に、この情報を用いて他方のチャンネル(右チャンネル)の音情報に対してスペクトル調整処理を行う。
スペクトル調整処理は、ノイズ低減処理前の一方のチャンネルの周波数スペクトルに対する、他方のチャンネルの周波数スペクトルの周波数領域毎の振幅の比で、一方のチャンネルのノイズ低減処理後の周波数スペクトルの周波数領域毎の振幅を調整して他方のチャンネルの周波数スペクトルを得る。
これにより、周波数スペクトルの各周波数成分の左右比が処理前後で保たれ、本来の定位感や臨場感を保ったままノイズを低減した音声を得ることができる。
(2)また、一方のチャンネルにおける推定ノイズスペクトルの算出およびノイズスペクトルの低減を省くことができる。これにより、演算量、および必要なメモリを削減することができる。
(第4実施形態)
つぎに、図13を参照して、第4実施形態を説明する。
図13は、第4実施形態における音情報処理部500の機能部のブロック図である。
なお、本第4実施形態における音情報処理部500は、前述した第3実施形態における音情報処理部150と置換されるものであり、それ以外の構成は第3実施形態と同様であるため説明は省略する。また、音情報処理部500内の各構成要素についても、前述した第3実施形態における音情報処理部150と同機能のものは同符号を付して説明を省略する。
また、音情報処理部500のノイズスペクトル低減部53L、ノイズスペクトル低減部53Rは、第3実施形態と同様であるので説明及び図示は省略するが、それぞれ、衝撃音ノイズ低減処理部53A及び駆動音ノイズ低減処理部53Bを含む。
つぎに、図13を参照して、第4実施形態を説明する。
図13は、第4実施形態における音情報処理部500の機能部のブロック図である。
なお、本第4実施形態における音情報処理部500は、前述した第3実施形態における音情報処理部150と置換されるものであり、それ以外の構成は第3実施形態と同様であるため説明は省略する。また、音情報処理部500内の各構成要素についても、前述した第3実施形態における音情報処理部150と同機能のものは同符号を付して説明を省略する。
また、音情報処理部500のノイズスペクトル低減部53L、ノイズスペクトル低減部53Rは、第3実施形態と同様であるので説明及び図示は省略するが、それぞれ、衝撃音ノイズ低減処理部53A及び駆動音ノイズ低減処理部53Bを含む。
図13に示す音情報処理部500は、左チャンネル優先処理部150Lと、右チャンネル優先処理部150Rと、平均値算出部56L,56Rと、を備えている。
左チャンネル優先処理部150Lは、前述した第3実施形態における音情報処理部150と同様の構成であって、左右両チャンネルそれぞれに対するスペクトル変換部51L,51Rと、左チャンネルに対するノイズスペクトル推定部52Lと、左チャンネルに対するノイズスペクトル低減部53Lと、右チャンネルに対するスペクトル調整部54Rと、左右両チャンネルに対する逆変換部55L,55Rと、を備えている。そして、左チャンネル優先処理部150Lは、左チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行うと共に、その情報に基づいて右チャンネルのスペクトル調整を行って、左チャンネルの音データを平均値算出部56Lに、右チャンネルの音データを平均値算出部56Rに、それぞれ出力する。
左チャンネル優先処理部150Lは、前述した第3実施形態における音情報処理部150と同様の構成であって、左右両チャンネルそれぞれに対するスペクトル変換部51L,51Rと、左チャンネルに対するノイズスペクトル推定部52Lと、左チャンネルに対するノイズスペクトル低減部53Lと、右チャンネルに対するスペクトル調整部54Rと、左右両チャンネルに対する逆変換部55L,55Rと、を備えている。そして、左チャンネル優先処理部150Lは、左チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行うと共に、その情報に基づいて右チャンネルのスペクトル調整を行って、左チャンネルの音データを平均値算出部56Lに、右チャンネルの音データを平均値算出部56Rに、それぞれ出力する。
右チャンネル優先処理部150Rは、左チャンネル優先処理部150Lとは左右のチャンネルの処理が入れ替わっており、左右両チャンネルそれぞれに対するスペクトル変換部51L,51Rと、右チャンネルに対するノイズスペクトル推定部52Rと、右チャンネルに対するノイズスペクトル低減部53Rと、左チャンネルに対するスペクトル調整部54Lと、左右両チャンネルに対する逆変換部55L,55Rと、を備えている。そして、右チャンネル優先処理部150Rは、右チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行うと共にその情報に基づいて左チャンネルのスペクトル調整を行って、左チャンネルの音データを平均値算出部56Lに、右チャンネルの音データを平均値算出部56Rに、それぞれ出力する。
平均値算出部56L,56Rは、左チャンネル優先処理部150Lと右チャンネル優先処理部150Rの左右チャンネルの出力から、それぞれ平均値を算出する。つまり、平均値算出部56Lは、左チャンネル優先処理部150Lの左チャンネル出力と右チャンネル優先処理部150Rの左チャンネルの出力との平均値を出力する。また、平均値算出部56Rは、左チャンネル優先処理部150Lの右チャンネル出力と右チャンネル優先処理部150Rの右チャンネルの出力との平均値を出力する。
本第4実施形態における音情報処理部500の処理によれば、たとえば、音源が左右に移動しているような場合であっても、左右対称な処理になり、音源の移動方向に関わらず同様なノイズ低減効果を得ることができる。つまり、左右いずれか一方側のみでノイズスペクトル推定とノイズ低減処理を行うと、音源が左側から右側に移動している場合と右側から左側に移動している場合とで、ノイズ低減効果が変わる可能性があるが、本構成ではこのようなことがない。
なお、音情報処理部500は、左チャンネル優先処理部150Lと、右チャンネル優先処理部150Rとを備え、左右のチャンネルにおいてノイズスペクトル推定とノイズ低減処理とを行う。これにより演算量の増加が懸念されるが、これはスペクトル変換におけるサンプリング数を調整して対応すれば良い。
以上、第4実施形態によると、以下の効果を有する。
(1)音情報処理部500は、左チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行うと共にその情報に基づいて右チャンネルのスペクトル調整を行う左チャンネル優先処理部150Lと、右チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行うと共にその情報に基づいて左チャンネルのスペクトル調整を行う右チャンネル優先処理部150Rと、両者の出力する左右チャンネルの音データをそれぞれ平均する平均値算出部56L,56Rを備えている。これにより、左右対称な処理になり、音源の移動等に関わらず同様なノイズ低減効果を得ることができる。
(1)音情報処理部500は、左チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行うと共にその情報に基づいて右チャンネルのスペクトル調整を行う左チャンネル優先処理部150Lと、右チャンネルにおいて推定ノイズスペクトルの算出およびノイズスペクトルの低減を行うと共にその情報に基づいて左チャンネルのスペクトル調整を行う右チャンネル優先処理部150Rと、両者の出力する左右チャンネルの音データをそれぞれ平均する平均値算出部56L,56Rを備えている。これにより、左右対称な処理になり、音源の移動等に関わらず同様なノイズ低減効果を得ることができる。
(変形形態)
以上、説明した第3、第4実施形態に限定されることなく、以下に示すような種々の変形や変更が可能であり、それらも本発明の範囲内である。
(1)本実施形態は、本発明を、1対(2個)のマイク(左マイク141Lおよび右マイク141R)を備えてステレオ録音するカメラ100に適用して説明をした。しかし、集音部(マイク)の数はこれに限るものではなく、3個以上のマイクを備えた、例えば多チャンネルのサラウンド録音を行うもの等に適用しても良い。
複数の集音部を備える場合には、定められた集音部の音情報に対してノイズ低減処理すると共にその情報を用いて他の集音部の音情報に対してスペクトル調整処理を行うが、処理は必ずしも他の全ての音情報に対して行う必要は無く、一部の集音部の音情報に対しては処理を行わない構成としても良い。
また、複数の集音部をグループに分け、グループ毎に特定の集音部の音情報に対してノイズ低減処理すると共にその情報を用いてグループ内の他の集音部の音情報に対してスペクトル調整処理を行うように構成しても良い。
以上、説明した第3、第4実施形態に限定されることなく、以下に示すような種々の変形や変更が可能であり、それらも本発明の範囲内である。
(1)本実施形態は、本発明を、1対(2個)のマイク(左マイク141Lおよび右マイク141R)を備えてステレオ録音するカメラ100に適用して説明をした。しかし、集音部(マイク)の数はこれに限るものではなく、3個以上のマイクを備えた、例えば多チャンネルのサラウンド録音を行うもの等に適用しても良い。
複数の集音部を備える場合には、定められた集音部の音情報に対してノイズ低減処理すると共にその情報を用いて他の集音部の音情報に対してスペクトル調整処理を行うが、処理は必ずしも他の全ての音情報に対して行う必要は無く、一部の集音部の音情報に対しては処理を行わない構成としても良い。
また、複数の集音部をグループに分け、グループ毎に特定の集音部の音情報に対してノイズ低減処理すると共にその情報を用いてグループ内の他の集音部の音情報に対してスペクトル調整処理を行うように構成しても良い。
(2)本実施形態では、録音部140の音情報処理部150が低減処理対象とするノイズは、フォーカシングレンズ121を移動駆動するAF駆動モータ123の駆動によるAF駆動音である。しかし、低減対象とするノイズはこれに限るものではない。たとえば、オートズームの駆動音、手振れ補正レンズの駆動音、およびスイッチ類の操作音等に適用しても良い。
(3)上記実施形態は、動画撮影と同時に録音可能なカメラに適用したものであるが、撮影機能を備えない音処理装置に適用しても良いものである。
なお、実施形態及び変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。また、本発明は以上説明した実施形態によって限定されることはない。
1:カメラ、13:ステレオ集音装置、13L:左マイク、13R:右マイク、14:音情報処理部、14A:ノイズ低減処理部、14B:補正部、20:レンズ鏡筒、21:AFエンコーダ、22:AF駆動用モータ、SIL,SIR:ノイズ低減処理前の周波数スペクトル、RI:処理前比、SN:ノイズ周波数スペクトル、SSL,SSR:ノイズ低減処理後の周波数スペクトル、RS:処理後比、SCL,SCR:補正後の周波数スペクトル、100:カメラ、110:カメラ本体、120:レンズ鏡筒、140:録音部、141:ステレオ集音装置、141L:左マイク、141R:右マイク、50,500:音情報処理部、50L:左チャンネル優先処理部、50R:右チャンネル優先処理部、51L:スペクトル変換部、51R:スペクトル変換部、52L:ノイズスペクトル推定部、52R:ノイズスペクトル推定部、53L:ノイズスペクトル低減部、53R:ノイズスペクトル低減部、54L:スペクトル調整部、54R:スペクトル調整部、55L:逆変換部、55R:逆変換部、56L:平均値算出部、56R:平均値算出部
Claims (19)
- 複数の集音部によって集音された音のうち、第1集音部により集音された第1音と第2集音部により集音された第2音との関係である基準関係を算出する算出部と、
前記第1音と前記第2音との関係が、前記算出部で算出された前記基準関係を含む所定の範囲に含まれるよう、前記複数の集音部によって集音された音を処理する処理部と
を備えることを特徴とする音処理装置。 - 第1集音部と第2集音部とを有する集音部と、
前記第1集音部により集音された第1音と前記第2集音部により集音された第2音との関係を基準関係とし、前記基準関係を含む所定の範囲に含まれるように処理された、前記集音部によって集音された音を出力する出力部と、
を備えたこと、を特徴とする音処理装置。 - 請求項2に記載の音処理装置であって、
前記基準関係を算出する算出部と、
前記第1音と前記第2音との関係が、前記基準関係を含む所定の範囲に含まれるように、前記第1音と前記第2音とを処理する処理部とを備え、
前記出力部は、前記処理部によって処理された音情報を出力する
ことを特徴とする音処理装置。 - 請求項1または3に記載の音処理装置であって、
前記処理部は、前記第1音と前記第2音とのうち少なくとも一方を処理する第1処理と、前記第1処理の後の前記第1音と前記第1処理の後の前記第2音との関係である第1の関係を、前記所定の範囲に含まれる第2の関係にする第2処理とを含み、
前記所定の範囲は、前記第2の関係が、前記第1の関係よりも前記基準関係に近づく範囲である
ことを特徴とする音処理装置。 - 請求項4に記載の音処理装置であって、
前記処理部は、前記集音部によって集音された音を減少する処理を行う
ことを特徴とする音処理装置。 - 請求項4または請求項5に記載の音処理装置であって、
駆動音の発生を検出する駆動音発生検出部とを備え、
前記処理部は、前記駆動音発生検出部の検出結果に基づいて、前記集音部で集音した音から前記駆動音を低減する処理である前記第1処理を行うノイズ低減処理部を含む
ことを特徴とする音処理装置。 - 請求項6に記載の音処理装置であって、
前記処理部は、前記基準関係と前記第2の関係とが略一致するように、前記ノイズ低減処理部によってノイズ低減処理された前記第1音と前記ノイズ低減処理部によってノイズ低減処理された前記第2音との少なくとも一方の音を補正する処理である前記第2処理を行う補正部を含む
ことを特徴とする音処理装置。 - 請求項7に記載の音処理装置であって、
前記補正部は、
前記駆動音発生検出部による前記駆動音発生検出前における、前記第1集音部により集音された第1音と前記第2集音部により集音された第2音との関係と、
前記ノイズ低減処理部によるノイズ低減処理前における、前記第1集音部により集音された第1音と前記第2集音部により集音された第2音との関係と、
を比較して何れかを前記基準関係とし、前記基準関係に基づいて前記補正を行う
ことを特徴とする音処理装置。 - 請求項7に記載の音処理装置であって、
前記補正部は、
前記駆動音発生検出部による前記駆動音発生検出前における、前記第1音の周波数スペクトルと前記第2音の周波数スペクトルとの比である事前比と、
前記ノイズ低減処理部によるノイズ低減処理前における、前記第1音の周波数スペクトルと前記第2音の周波数スペクトルとの比である事後比と、
を比較し、その差が所定値より小さい場合には前記事前比を基準比として、前記基準比に基づいて補正する
ことを特徴とする音処理装置。 - 請求項7に記載の音処理装置であって、
前記補正部は、
前記駆動音発生検出部による前記駆動音発生検出前における、前記第1音の周波数スペクトルと前記第2音の周波数スペクトルとの比と、
前記駆動音発生検出部による駆動音発生検出終了後における、前記第1音の周波数スペクトルと前記第2音の周波数スペクトルとの比と、
を比較して基準比を作成し、前記基準比に基づいて前記補正を行う
ことを特徴とする音処理装置。 - 請求項6~10のいずれか1項に記載の音処理装置であって、
前記ノイズ低減処理部は、前記音処理装置における駆動部の駆動時に前記集音部で集音した音から前記ノイズ低減処理を行う
ことを特徴とする音処理装置。 - コンピュータに、
複数の集音部によって集音された音のうち、第1集音部により集音された第1音と第2集音部により集音された第2音との関係である基準関係を算出する算出部と、
前記第1音と前記第2音との関係が、前記算出部で算出された前記基準関係を含む所定の範囲に含まれるよう、前記複数の集音部によって集音された音を処理する処理部と、
の各機能を実行させる音処理プログラム。 - コンピュータに、
第1集音部と第2集音部とを有する集音部と、
前記第1集音部により集音された第1音と前記第2集音部により集音された第2音との関係である基準関係に対して、前記基準関係を含む所定の範囲に含まれるように処理された、前記集音部によって集音された音を出力する出力部と、
の各機能を実行させる音処理プログラム。 - 請求項1または2に記載の音処理装置であって、
前記第1音に含まれるノイズを低減する第1ノイズ低減部と、
ノイズ低減後の前記第1音との関係が前記基準関係を含む前記所定の範囲に含まれるように前記第2音を補正する補正部とを備える
ことを特徴とする音処理装置。 - 請求項14に記載の音処理装置であって、
前記第1音のノイズ推定を行なう第1ノイズ推定部とを備える
ことを備えることを特徴とする音処理装置。 - 請求項14又は15に記載の音処理装置であって、
前記第2音のノイズ推定を行なう第2ノイズ推定部と、
前記第2ノイズ推定部により推定されたノイズを、前記第2音から低減する第2ノイズ低減部と、
ノイズ低減後の前記第2音との関係が、前記基準関係と同じになるように、前記第1音を調整する第1調整部と、
前記第1ノイズ低減部より前記ノイズが低減されたノイズ低減後の第1音と前記第1調整部により調整された調整後の第1音とを平均する第1平均部と、
前記第2ノイズ低減部により前記ノイズが低減された、ノイズ低減後の第2音と、前記補正部により調整された調整後の第2音とを平均する第2平均部とを備える
ことを特徴とする音処理装置。 - 請求項14から16のいずれか1項に記載の音処理装置であって、
前記第1音を、ノイズ推定又は調整前にスペクトル変換する第1変換部と、
ノイズ低減又は調整後の前記第1音をスペクトル逆変換する第1逆変換部と、
前記第2音を、ノイズ推定又は調整前にスペクトル変換する第2変換部と、
ノイズ低減又は調整後の前記第2音をスペクトル逆変換する第2逆変換部と、
を備える
ことを特徴とする音処理装置。 - 請求項14から17のいずれか1項に記載の音処理装置であって、
右耳用として、前記第1集音部または前記第2集音部のいずれかを一方を選択するとともに、左耳用としていずれか他方を選択する選択部とを備える
ことを特徴とする音処理装置。 - 複数の集音部のうちの第1集音部により集音された第1音のノイズ推定を行ない、
推定されたノイズを、前記第1音から低減し、
前記複数の集音部のうちの第2集音部により集音された第2音と、ノイズ低減前の前記第1音との関係である基準関係を求め、ノイズ低減後の前記第1音との関係が前記基準関係を含む所定の範囲に含まれるよう前記第2音を調整する処理を、コンピュータ装置に実行させるプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012019627 | 2012-02-01 | ||
JP2012-019627 | 2012-02-01 | ||
JP2012-164008 | 2012-07-24 | ||
JP2012164008A JP2014026002A (ja) | 2012-07-24 | 2012-07-24 | 録音装置及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2013115385A1 true WO2013115385A1 (ja) | 2013-08-08 |
Family
ID=48905412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2013/052404 WO2013115385A1 (ja) | 2012-02-01 | 2013-02-01 | 音処理装置および音処理プログラム |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2013115385A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000004494A (ja) * | 1998-06-16 | 2000-01-07 | Matsushita Electric Ind Co Ltd | 機器内蔵型マイクロホン装置 |
JP2001333489A (ja) * | 2000-05-19 | 2001-11-30 | Matsushita Electric Ind Co Ltd | マイクロホン装置 |
JP2004129038A (ja) * | 2002-10-04 | 2004-04-22 | Sony Corp | マイクロホンのレベル調整方法及びマイクロホンのレベル調整装置及び電子機器 |
JP2010245984A (ja) * | 2009-04-09 | 2010-10-28 | Yamaha Corp | マイクロホンアレイにおけるマイクロホンの感度を補正する装置、この装置を含んだマイクロホンアレイシステム、およびプログラム |
JP2011035708A (ja) * | 2009-08-03 | 2011-02-17 | Sanyo Electric Co Ltd | 音響信号処理装置、及び撮像装置 |
-
2013
- 2013-02-01 WO PCT/JP2013/052404 patent/WO2013115385A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000004494A (ja) * | 1998-06-16 | 2000-01-07 | Matsushita Electric Ind Co Ltd | 機器内蔵型マイクロホン装置 |
JP2001333489A (ja) * | 2000-05-19 | 2001-11-30 | Matsushita Electric Ind Co Ltd | マイクロホン装置 |
JP2004129038A (ja) * | 2002-10-04 | 2004-04-22 | Sony Corp | マイクロホンのレベル調整方法及びマイクロホンのレベル調整装置及び電子機器 |
JP2010245984A (ja) * | 2009-04-09 | 2010-10-28 | Yamaha Corp | マイクロホンアレイにおけるマイクロホンの感度を補正する装置、この装置を含んだマイクロホンアレイシステム、およびプログラム |
JP2011035708A (ja) * | 2009-08-03 | 2011-02-17 | Sanyo Electric Co Ltd | 音響信号処理装置、及び撮像装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6610725B2 (ja) | 音処理装置および音処理プログラム | |
KR101377470B1 (ko) | 음성신호처리장치 및 그 제어 방법 | |
JP4934968B2 (ja) | カメラ装置、カメラ制御プログラム及び記録音声制御方法 | |
US8736690B2 (en) | Image pickup apparatus | |
US9495950B2 (en) | Audio signal processing device, imaging device, audio signal processing method, program, and recording medium | |
JP2008263498A (ja) | 風雑音低減装置、音響信号録音装置及び撮像装置 | |
US9232146B2 (en) | Imaging device with processing to change sound data | |
JP6721084B2 (ja) | ズーム制御装置、ズーム制御方法およびプログラム | |
JP5299034B2 (ja) | 撮影装置 | |
JP2009130767A (ja) | 信号処理装置 | |
JP5998483B2 (ja) | 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体 | |
JP5063489B2 (ja) | 判定装置及びそれを備えた電子機器並びに判定方法 | |
JP2010193053A (ja) | 撮像装置及びノイズ低減方法 | |
JP2014026002A (ja) | 録音装置及びプログラム | |
WO2012029098A1 (ja) | レンズ制御装置、カメラシステム | |
WO2013115385A1 (ja) | 音処理装置および音処理プログラム | |
JP2010283706A (ja) | ビデオカメラ | |
JP2013223223A (ja) | 録音装置 | |
JP5750668B2 (ja) | カメラ、再生装置、および再生方法 | |
JP5984467B2 (ja) | 像ブレ補正装置、光学機器、撮像装置、および像ブレ補正装置の制御方法 | |
JP6793369B1 (ja) | 撮像装置 | |
US11729548B2 (en) | Audio processing apparatus, control method, and storage medium, each for performing noise reduction using audio signals input from plurality of microphones | |
JP2013207472A (ja) | デジタルカメラ | |
JP2011035708A (ja) | 音響信号処理装置、及び撮像装置 | |
JP2011166407A (ja) | 音響設定装置および音響設定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 13744266 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 13744266 Country of ref document: EP Kind code of ref document: A1 |