JP5018860B2 - Signal processing apparatus and imaging apparatus - Google Patents
Signal processing apparatus and imaging apparatus Download PDFInfo
- Publication number
- JP5018860B2 JP5018860B2 JP2009248953A JP2009248953A JP5018860B2 JP 5018860 B2 JP5018860 B2 JP 5018860B2 JP 2009248953 A JP2009248953 A JP 2009248953A JP 2009248953 A JP2009248953 A JP 2009248953A JP 5018860 B2 JP5018860 B2 JP 5018860B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- value
- frequency spectrum
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Studio Devices (AREA)
Description
本発明は、音声信号に含まれるノイズ信号を低減する信号処理装置及び撮像装置に関する。 The present invention relates to a signal processing device and an imaging device that reduce a noise signal included in an audio signal.
目的の音とノイズ音とが混合された音声信号からノイズ音に基づく成分(ノイズ成分)を低減する方法として、取得される音声信号からノイズ音を推定し、推定されたノイズ音の信号(以下、ノイズ信号)を音声信号から減算することが一般的である(例えば特許文献1参照)。 As a method of reducing the component (noise component) based on the noise sound from the sound signal in which the target sound and the noise sound are mixed, the noise sound is estimated from the acquired sound signal, and the estimated noise sound signal (hereinafter referred to as the noise signal) In general, the noise signal is subtracted from the audio signal (see, for example, Patent Document 1).
このような方法では、予めノイズ音を取得している場合やノイズ音が周期的な音からなる場合には、ノイズ音の大きさやノイズ音が含まれるタイミングは容易に推定できるので、音声信号からノイズ信号を適切に低減することができる。しかしながら、装置内部の各種機構などが駆動したときの音(以下、動作音)をノイズ音とした場合、上述した動作音は発生するタイミングが不定期であることから音声信号に含まれるノイズ音を推定することは難しい。このため、ノイズ信号を減算した後の音声信号には、ミュージカルノイズと呼ばれるノイズ成分が含まれてしまう恐れがある。 In such a method, when the noise sound is acquired in advance or when the noise sound is a periodic sound, the size of the noise sound and the timing including the noise sound can be easily estimated. The noise signal can be appropriately reduced. However, when the sound generated when various mechanisms in the device are driven (hereinafter referred to as operation sound) is a noise sound, the above-mentioned operation sound is generated at irregular timings, so that the noise sound included in the audio signal is not generated. It is difficult to estimate. For this reason, the audio signal after subtracting the noise signal may contain a noise component called musical noise.
本発明は、音声信号に含まれる動作音を適切に低減することができるようにした信号処理装置及び撮像装置を提供することを目的とする。 It is an object of the present invention to provide a signal processing apparatus and an imaging apparatus that can appropriately reduce operation sound included in an audio signal.
上述した課題を解決するために、本発明の信号処理装置は、目的音と動作音とが混合された時間関数で示される音声信号を所定時間幅で分割して得られる所定時間毎の複数の第1の音声信号を、周波数関数で示される第2の音声信号に変換する信号変換手段と、前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値と異なる場合に、前記第3の音声信号における周波数スペクトルの値を、前記対応する周波数スペクトルの値に置換する補正手段と、前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、を備えたことを特徴とする。 In order to solve the above-described problem, the signal processing apparatus according to the present invention provides a plurality of predetermined time intervals obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width. The influence of the operation sound is reduced from signal conversion means for converting the first sound signal into a second sound signal represented by a frequency function, the second sound signal, and the sound signal indicating the operation sound. Calculating means for obtaining the third audio signal, and using as a reference signal an audio signal indicating the target sound of the plurality of second audio signals, a value of a frequency spectrum in each frequency band of the third audio signal; The frequency spectrum value in the corresponding frequency band of the reference signal multiplied by the coefficient is compared, and the value of the frequency spectrum in the third audio signal corresponds to the reference signal multiplied by the coefficient. Is different from the value of the wavenumber spectrum, the value of the third frequency spectrum in the speech signal, and correcting means for replacing said on the value of the corresponding frequency spectrum, the audio signal correction processing has been performed by the correction means, And a signal reverse conversion means for performing reverse conversion from the sound signal indicated by the frequency function to the sound signal indicated by the time function.
また、本発明の信号処理装置は、目的音と動作音とが混合された時間関数で示される音声信号を所定時間幅で分割して得られる所定時間毎の複数の第1の音声信号を、周波数関数で示される第2の音声信号に変換する信号変換手段と、前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値未満となる場合に、前記第3の音声信号における周波数スペクトルの値を、前記対応する周波数スペクトルの値を下回らないように補正する補正手段と、前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、を備えたことを特徴とする Further, the signal processing apparatus of the present invention is configured to obtain a plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width. A third audio signal in which the influence of the operation sound is reduced from signal conversion means for converting to a second audio signal indicated by a frequency function, the second audio signal, and the audio signal indicating the operation sound. The calculation means to be obtained, and the reference obtained by multiplying the value of the frequency spectrum in each frequency band of the third audio signal by a coefficient, using the audio signal indicating the target sound of the plurality of second audio signals as a reference signal The frequency spectrum value in the corresponding frequency band of the signal is compared, and the frequency spectrum value in the third audio signal is less than the corresponding frequency spectrum value in the reference signal multiplied by the coefficient The correction means for correcting the frequency spectrum value in the third audio signal so as not to fall below the value of the corresponding frequency spectrum, and the audio signal subjected to the correction processing by the correction means, A signal reverse conversion means for performing reverse conversion from an audio signal represented by a frequency function to an audio signal represented by the time function.
また、本発明の信号処理装置は、目的音と動作音とが混合された時間関数で示される音声信号を所定時間幅で分割して得られる所定時間毎の複数の第1の音声信号を、周波数関数で示される第2の音声信号に変換する信号変換手段と、前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルを超過する場合に、前記第3の音声信号における周波数スペクトルの値を、前記対応する周波数スペクトルの値を上回らないように補正する補正手段と、前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、を備えたことを特徴とする。 Further, the signal processing apparatus of the present invention is configured to obtain a plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width. A third audio signal in which the influence of the operation sound is reduced from signal conversion means for converting to a second audio signal indicated by a frequency function, the second audio signal, and the audio signal indicating the operation sound. The calculation means to be obtained, and the reference obtained by multiplying the value of the frequency spectrum in each frequency band of the third audio signal by a coefficient, using the audio signal indicating the target sound of the plurality of second audio signals as a reference signal A frequency spectrum value in the corresponding frequency band of the signal is compared, and the frequency spectrum value in the third audio signal exceeds the corresponding frequency spectrum in the reference signal multiplied by the coefficient In this case, correction means for correcting the frequency spectrum value in the third audio signal so as not to exceed the value of the corresponding frequency spectrum, and the audio signal subjected to correction processing by the correction means, And a signal reverse conversion means for performing reverse conversion from the audio signal indicated by the function to the audio signal indicated by the time function.
また、本発明の信号処理装置は、目的音と動作音とが混合された時間関数で示される音声信号を所定時間幅で分割して得られる所定時間毎の複数の第1の音声信号を、周波数関数で示される第2の音声信号に変換する信号変換手段と、前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値と異なる場合に、前記第3の音声信号における周波数スペクトルの値を、前記係数が乗算された前記基準信号の周波数スペクトルのうち、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値を用いて算出される補正値に置換する補正手段と、前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、を備えたことを特徴とする。 Further, the signal processing apparatus of the present invention is configured to obtain a plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width. A third audio signal in which the influence of the operation sound is reduced from signal conversion means for converting to a second audio signal indicated by a frequency function, the second audio signal, and the audio signal indicating the operation sound. The calculation means to be obtained, and the reference obtained by multiplying the value of the frequency spectrum in each frequency band of the third audio signal by a coefficient, using the audio signal indicating the target sound of the plurality of second audio signals as a reference signal The frequency spectrum value in the corresponding frequency band of the signal is compared, and the frequency spectrum value in the third audio signal is different from the corresponding frequency spectrum value in the reference signal multiplied by the coefficient. The frequency spectrum value in the third audio signal is the value of the corresponding frequency spectrum and the frequency spectrum value in the vicinity of the frequency spectrum of the reference signal multiplied by the coefficient. A correction unit that replaces the correction value calculated by using the correction unit, and the audio signal that has been corrected by the correction unit is inversely converted from the audio signal represented by the frequency function to the audio signal represented by the time function. And a signal reverse conversion means .
また、本発明の信号処理装置は、目的音と動作音とが混合された時間関数で示される音声信号を所定時間幅で分割して得られる所定時間毎の複数の第1の音声信号を、周波数関数で示される第2の音声信号に変換する信号変換手段と、前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値を超過する場合に、前記第3の音声信号における周波数スペクトルの値を、前記係数が乗算された前記基準信号の周波数スペクトルのうち、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値を用いて算出される補正値を上回らないように補正する補正手段と、前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、を備えたことを特徴とする。Further, the signal processing apparatus of the present invention is configured to obtain a plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width. A third audio signal in which the influence of the operation sound is reduced from signal conversion means for converting to a second audio signal indicated by a frequency function, the second audio signal, and the audio signal indicating the operation sound. The calculation means to be obtained, and the reference obtained by multiplying the value of the frequency spectrum in each frequency band of the third audio signal by a coefficient, using the audio signal indicating the target sound of the plurality of second audio signals as a reference signal The frequency spectrum value in the corresponding frequency band of the signal is compared, and the frequency spectrum value in the third audio signal exceeds the corresponding frequency spectrum value in the reference signal multiplied by the coefficient. When the frequency spectrum value of the third audio signal is determined, the frequency spectrum value of the reference signal multiplied by the coefficient and the value of the corresponding frequency spectrum and the frequency spectrum value of the frequency band in the vicinity thereof are used. A correction means for correcting so as not to exceed a correction value calculated by using the sound signal, and a voice signal subjected to correction processing by the correction means from a voice signal indicated by the frequency function and a voice indicated by the time function And a signal reverse conversion means for performing reverse conversion to a signal.
また、本発明の信号処理装置は、目的音と動作音とが混合された時間関数で示される音声信号を所定時間幅で分割して得られる所定時間毎の複数の第1の音声信号を、周波数関数で示される第2の音声信号に変換する信号変換手段と、前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値未満となる場合に、前記第3の音声信号における周波数スペクトルの値を、前記係数が乗算された前記基準信号の周波数スペクトルのうち、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値を用いて算出される補正値を下回らないように補正する補正手段と、前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、を備えたことを特徴とする。Further, the signal processing apparatus of the present invention is configured to obtain a plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width. A third audio signal in which the influence of the operation sound is reduced from signal conversion means for converting to a second audio signal indicated by a frequency function, the second audio signal, and the audio signal indicating the operation sound. The calculation means to be obtained, and the reference obtained by multiplying the value of the frequency spectrum in each frequency band of the third audio signal by a coefficient, using the audio signal indicating the target sound of the plurality of second audio signals as a reference signal The frequency spectrum value in the corresponding frequency band of the signal is compared, and the frequency spectrum value in the third audio signal is less than the corresponding frequency spectrum value in the reference signal multiplied by the coefficient The frequency spectrum value in the third audio signal is the value of the corresponding frequency spectrum and the frequency spectrum value in the vicinity of the frequency spectrum of the reference signal multiplied by the coefficient. A correction unit that corrects the correction value so as not to fall below a correction value calculated by using the voice signal indicated by the time function from the voice signal indicated by the frequency function. And a signal reverse conversion means for performing reverse conversion to a signal.
なお、係数が乗算された基準信号の周波数スペクトルのうち、対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値を用いて補正値を算出する場合、前記補正値は、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値の平均、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値のうちの最大値、或いは前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値のうちの最小値のいずれかからなることが好ましい。In the case where the correction value is calculated using the corresponding frequency spectrum value and the frequency spectrum value in the frequency band in the vicinity of the frequency spectrum of the reference signal multiplied by the coefficient, the correction value corresponds to the corresponding frequency spectrum. The average of the frequency spectrum value and the frequency spectrum value of the nearby frequency band, the maximum value of the corresponding frequency spectrum value and the frequency spectrum value of the nearby frequency band, or the corresponding frequency spectrum value And the minimum value of the frequency spectrum values in the frequency band in the vicinity thereof.
また、本発明の撮像装置は、画像信号を取得する撮像手段と、前記撮像手段による前記画像信号の取得に同期して、音声信号を取得する収音手段と、上記に記載のいずれかの信号処理装置と、前記撮像手段により取得された画像信号と、前記信号処理装置により信号処理が施された音声信号とを記憶する記憶手段と、を備えたことを特徴とする。 The imaging device of the present invention includes an imaging unit that acquires an image signal, a sound collection unit that acquires an audio signal in synchronization with the acquisition of the image signal by the imaging unit, and any one of the signals described above The image processing apparatus includes a processing device, and a storage unit that stores an image signal acquired by the imaging unit and an audio signal subjected to signal processing by the signal processing device.
本発明によれば、音声信号に含まれる動作音を有効に低減することができる。 According to the present invention, it is possible to effectively reduce the operation sound included in the audio signal.
図1は、デジタルカメラ10の構成を示す機能ブロック図である。周知のように、デジタルカメラ10は、撮像光学系15によって取り込まれた被写体光を撮像素子16によって光電変換し、光電変換後の電気信号(画像信号)から画像データを取得する。
FIG. 1 is a functional block diagram showing the configuration of the digital camera 10. As is well known, the digital camera 10 photoelectrically converts the subject light captured by the imaging
撮像光学系15は、複数のレンズから構成される。この撮像光学系15を構成する各レンズは、ズーム倍率の変更時やフォーカス調整時に、レンズ駆動部18の駆動により光軸Lに沿って移動する。この撮像光学系15には、絞り19が設けられる。この絞り19は絞り開口の大きさを変化させることで、撮像素子16に向けて入射する被写体光の光量を変化させる。この絞り19は、予め設定された絞り値となるように、その絞り開口の大きさが絞り駆動部20により変更される。
The imaging
シャッタ21は、撮像光学系15と撮像素子16との間に配置される。このシャッタ21は、撮像光学系15を介して取り込まれる被写体光を撮像素子16に照射させる開放状態と、該被写体光を遮光する遮光状態との間で切り替えられる。なお、撮影時にはシャッタ21は、一旦遮光状態に保持された後、開放状態に切り替えられる。そして、シャッタ21が開放状態に切り替えられてから予め設定された時間経過すると、再度遮光状態に切り替えられる。なお、このシャッタ21における遮光状態と開放状態との間の切り替えは、シャッタ駆動部22により実行される。
The
撮像素子16は、例えばCCD(Charge Coupled Device)やCMOS(Complementary Metal−Oxide Semiconductor)などから構成される。撮像素子16は、撮像光学系15によって取り込まれる被写体光を受光し、受光した光量を信号電荷に変換(光電変換)して、変換した信号電荷を蓄積する。その後、撮像素子16にて蓄積された信号電荷は、AFE(Analog Front End)回路25に出力される。
The
AFE回路25は、図示しないAGC回路、CDS回路及びA/D変換回路を含んで構成される。AFE回路25は、入力された画像信号に対してゲインコントロール、雑音除去など処理を施す。これら処理の後、AFE回路25は、アナログの画像信号をデジタルの画像信号に変換する。このデジタルの画像信号は1コマ毎にまとめられて画像メモリ30に記録される。なお、撮像素子16やAFE回路25は、図示を省略したタイミングジェネレータによって、その駆動タイミングが制御される。
The
画像処理回路35は、画像メモリ30に記憶された画像信号に対して、ホワイトバランス処理、色補間処理、輪郭補償処理、ガンマ処理などの画像処理を施す。これら画像処理の後、画像処理回路35は、例えばJPEG方式などの記憶方式で圧縮するためのフォーマット処理を施す。また、画像処理回路35は、画像データに対して符号化処理や復号化処理を行う。なお、符号37は記録用I/Fである。
The
LCD38は、デジタルカメラ10にて取得された画像、記憶媒体36に記憶された画像、撮影待機状態時に取り込まれるスルー画像を表示する他に、撮影条件等の設定や設定変更を行う際の設定画像などを表示する。デジタルカメラ10にて取得された画像や記憶媒体36に記憶された画像としては、静止画像の他に動画像が挙げられる。このLCD38は、表示制御回路39により制御される。スピーカ40は、動画像をLCD38に表示する際に動画像に対応付けられた音声などを出力する。このスピーカ40における音声の出力制御は、音声制御回路41により実行される。
The
収音部43は、例えばマイクから構成され、例えば動画撮影や録音時の音声を取得する。この収音部43により取得される音声信号は、音声メモリ44に記録される。
The
信号処理装置45は、収音部43にて取得される音声信号に対して、該音声信号に含まれるノイズ音を低減する処理を施す。なお、ノイズ音としては、動画撮影や録音時に、デジタルカメラ10の内部に設けられた各機構が駆動されるときに発生する動作音や、各種機構を駆動させる際に操作される操作音などが挙げられる。また、信号処理装置45は、取得された音声信号(上述したノイズ音を低減する処理が施された音声信号を含む)に対する圧縮符号化する処理や、圧縮符号化する処理が施された音声信号を復号化する処理を行う。
The
CPU50は、内蔵メモリ51に記憶された制御プログラム(図示省略)を実行することで、デジタルカメラ10の各部を統括的に制御する。このCPU50における制御としては、レリーズボタン52の操作に基づいた制御や、設定操作部53の操作に基づいた制御が挙げられる。レリーズボタン52の操作に基づいた制御としては、周知のAE処理やAF処理、撮像処理などが挙げられる。また、設定操作部53の操作に基づいた制御としては、初期設定や撮影条件の設定等の処理が挙げられる。
The
また、CPU50は、撮影時に取得される画像データを記憶媒体36に書き込む処理を行う。例えば、静止画撮影を行った場合には、CPU50は、画像処理回路35にて符号化処理が施された画像データを、デジタルカメラ10の機種情報や撮影時の撮影情報などと1つのファイル(静止画像ファイル)としてまとめて記憶媒体36に書き込む。同様にして、動画撮影を行った場合には動画撮影にて取得された各フレーム画像データが画像処理回路35にて符号化処理が施されるので、これら符号化処理が施された各フレーム画像データと、信号処理回路45にて信号処理が施された音声データとを、デジタルカメラ10の機種情報や撮影時の撮影情報などと1つのファイル(動画像ファイル)としてまとめて記憶媒体36に書き込む。
In addition, the
次に、上述した信号処理装置45の構成について、図2の機能ブロック図を用いて説明する。図2に示すように、信号処理装置45は、周波数変換部61、信号算出部62、記憶部63、信号補正部64及び周波数逆変換部65を備えている。
Next, the configuration of the
周波数変換部61は、収音部43により取得された音声信号を、時間関数で示される信号(時間領域信号)から周波数関数で示される信号(周波数領域信号)に変換する。まず、周波数変換部61は、後述する窓関数における窓幅を決定する。この窓関数における窓幅を決定した後、周波数変換部61は、決定された窓幅を1フレームとしたときに、1フレーム当たりのサンプル数が例えば1024となるように、入力される音声信号を分割する。
The
次に、周波数変換部61は、0.5フレーム分ずらしながらハニング窓などの窓関数を掛けた後、窓関数が適用された音声信号にフーリエ変換処理を実行する。周知のように、ハニング窓と呼ばれる窓関数は、その両端値が0、中央値が1となる関数であることから、窓関数を掛け合わせた信号は、中心部分が強調された信号となる。このため、時間とともに変化する振動などの信号を1フレーム毎ずらして解析した場合には、特徴的な箇所を捕らえることが難しい。このため、0.5フレーム分ずらすことでオーバーラップさせた解析を行うことで、信号に特徴的な箇所を検出する。これら処理を行うことで、取得された音声信号が、0.5フレーム分ずらしながら、1フレーム毎に時間領域信号から周波数領域信号に変換される。これら処理が施された音声信号は、信号算出部62及び信号補正部64に出力される。
Next, the
信号算出部62は、取得された音声信号に含まれるノイズ音を低減する処理を行う。上述したように、収音部43により取得された音声信号は、目的の音(目的音)と、ノイズ音(動作音)とが混合された信号からなる。信号算出部62は、周波数変換部61から出力される音声信号から、ノイズ音に基づく信号(ノイズ信号)を減算することで、音声信号に含まれるノイズ音を低減する。このノイズ信号は、周波数変換部61から出力される音声信号と同一のフレーム幅に対応する周波数領域信号からなる。また、このノイズ信号は記憶部63に予め記憶されている。
The
なお、本実施形態では、ノイズ信号を記憶部63に予め記憶させておき、周波数変換部61から出力された1フレーム毎の音声信号から、記憶部63に記憶されたノイズ信号を減算するが、これに限定される必要はなく、係数を乗算したノイズ信号を、周波数変換部61から出力される各フレームの音声信号から減算することも可能である。
In the present embodiment, the noise signal is stored in the storage unit 63 in advance, and the noise signal stored in the storage unit 63 is subtracted from the audio signal for each frame output from the
また、ノイズ信号を記憶部63に予め記憶させておくのではなく、従来のノイズ推定の手法を用いてノイズ信号を取得し、取得したノイズ信号、又は該ノイズ信号に係数を乗算した後の信号を、周波数変換部61から出力された1フレーム毎の音声信号から減算してもよい。
In addition, the noise signal is not stored in the storage unit 63 in advance, but the noise signal is acquired using a conventional noise estimation method, or the acquired noise signal or a signal obtained by multiplying the noise signal by a coefficient is acquired. May be subtracted from the audio signal for each frame output from the
信号補正部64は、信号算出部62によりノイズ成分が低減された音声信号(以下、低減処理済みの音声信号)に対する補正を実行する。この信号補正部64には、各フレームの周波数領域信号のうち、ノイズ音が混合されていない、つまり目的音のみからなる音声信号が周波数変換部61から入力される。信号補正部64は、目的音のみの音声信号を基準信号とした上で、この基準信号に対して係数を乗算する。基準信号に対して係数を乗算した後、信号補正部64は、係数を乗算した基準信号に基づいて、低減処理済みの音声信号を補正する。この補正が行われた補正済み音声信号は、周波数逆変換部65に出力される。周波数逆変換部65は、補正済み音声信号を、周波数関数で示される信号から時間関数で示される信号に逆変換する。時間関数で示される信号に逆変換された音声信号は、音声メモリ44に書き込まれる。
The
次に、図3及び図4を用いて、信号処理装置45における信号処理の流れについて説明する。図3に示すように、収音部43により取得される音声は、数十ms程度の短時間においては、周期的な信号となる。上述したように、周波数変換部61は、音声信号が入力されると、窓関数における窓幅を設定した後、フレーム分割を行う。
Next, the flow of signal processing in the
上述したように、周波数変換部61は、0.5フレーム分ずらしながらハニング窓などの窓関数を掛けた後、窓関数が適用された音声信号にフーリエ変換処理を実行する。このため、周波数変換部61に入力される音声信号に対して上述した処理が施されると、符号71で示す領域及び符号72で示す領域を1フレームとする音声信号、符号72で示す領域及び符号73で示す領域を1フレームとする音声信号、・・・・の順で1フレーム毎の音声信号が生成され、信号算出部62に出力される。信号算出部62は、1フレーム毎の音声信号が入力されると、記録部63に記録された動作音からなるノイズ信号を読み出し、1フレーム毎の音声信号からノイズ信号を減算する。
As described above, the
例えば、収音部43により音声を取得している際にAF(オートフォーカス)処理が実行されるときには、AF動作信号が出力される。このAF動作信号が出力されることを受けて、レンズ駆動部18が駆動し、撮像光学系15を構成するレンズが光軸L方向に移動する。このレンズ駆動部18の駆動及び撮像光学系15を構成するレンズの移動時には、その動作音が生じる。このため、収音部43により取得される音声信号は、目的音とノイズ音とが混合された音声信号となる。例えばAF駆動信号が出力されたタイミングが符号76で示す領域内の場合には、それ以降の領域(符号77,78で示す領域)では、音声信号にノイズ成分が重畳されていると推定することができる。
For example, when AF (autofocus) processing is executed while sound is acquired by the
例えばノイズ成分が重畳された音声信号は、以下の(1)式で表すことができる。 For example, an audio signal on which a noise component is superimposed can be expressed by the following equation (1).
x(t)=s(t)+n(t)・・・(1)
ここで、x(t)は収音部43により取得される音声信号、s(t)は目的音の音声信号、n(t)は動作音などのノイズ信号である。なお、これら信号は時間関数で示される。
x (t) = s (t) + n (t) (1)
Here, x (t) is an audio signal acquired by the
上述したフーリエ変換を行うことで、目的音とノイズ音とが混合された音声信号は、時間関数で示される信号x(t)から、周波数関数で示される信号X(f)に変換される。なお、fは周波数を示す。 By performing the Fourier transform described above, the audio signal in which the target sound and the noise sound are mixed is converted from the signal x (t) indicated by the time function into the signal X (f) indicated by the frequency function. Note that f indicates a frequency.
ここで、目的音の音声信号をSe(f)とすると、目的音の音声信号をSe(f)は以下に示す(2)式で表される。 Here, if the sound signal of the target sound is Se (f), Se (f) of the sound signal of the target sound is expressed by the following equation (2).
|Se(f)|=|X(f)|−α|Ne(f)|・・・(2)
なお、Ne(f)はノイズ信号、αは減算係数である。このαの値は、上述した(2)式を用いて目的音のみの音声信号を求める際に、減算するノイズ信号の大きさによっては、算出される目的成分の信号の周波数特性が変化してしまう場合や、減算後の音声信号にミュージカルノイズなどを人工的に重畳させてしまうこともある。このため、αの値としては、0.5〜4の値が用いられることが望ましい。
| Se (f) | = | X (f) | -α | Ne (f) | (2)
Note that Ne (f) is a noise signal, and α is a subtraction coefficient. The value of α depends on the magnitude of the noise signal to be subtracted when obtaining the audio signal of only the target sound using the above-described equation (2). In some cases, musical noise or the like may be artificially superimposed on the audio signal after subtraction. For this reason, as a value of (alpha), it is desirable to use the value of 0.5-4.
図4は、各信号(81、82、83、83’、84、84’)の周波数スペクトルを示しており、各周波数スペクトルのグラフは、横軸が周波数帯域、縦軸が音の強度(以下、「周波数スペクトルの値」ともいう)を示している。 FIG. 4 shows the frequency spectrum of each signal (81, 82, 83, 83 ′, 84, 84 ′). In the graph of each frequency spectrum, the horizontal axis is the frequency band, and the vertical axis is the sound intensity (hereinafter referred to as the sound intensity). , Also referred to as “frequency spectrum value”).
以下、図4に示されるように、取得された音声信号に対して符号81を、ノイズ信号に対して符号82を付して説明する。信号算出部62は、記憶部63に記憶されたノイズ信号82を読み出した後、フーリエ変換された音声信号81における周波数スペクトル81a〜81hから、ノイズ信号82における周波数スペクトル82a〜82hをそれぞれ周波数帯域毎に減算する。この減算処理により、ノイズ成分が低減された低減処理済みの音声信号83が生成される。
Hereinafter, as illustrated in FIG. 4, the acquired audio signal is denoted by reference numeral 81 and the noise signal is denoted by reference numeral 82. The
次に、信号補正部64は、基準信号84に対して係数βを乗算した信号(符号84’)を生成する。この信号84’を生成した後、信号補正部64は、係数βが乗算された基準信号84’の周波数スペクトルと低減処理済みの音声信号83の周波数スペクトルとを周波数領域毎に比較する。すなわち、低減処理済みの音声信号83の各周波数帯域における音の強度と、係数βが乗算された基準信号84’の対応する周波数帯域における音の強度とを比較する。
Next, the
例えば低減処理済みの音声信号83におけるある周波数帯域の音の強度が、係数βが乗算された基準信号84’における対応する周波数帯域の音の強度の値未満となる場合には、低減処理済みの音声信号83におけるその周波数帯域の音の強度の値を、係数βが乗算された基準信号84’における対応する周波数帯域の音の強度の値に置換する。
For example, when the sound intensity of a certain frequency band in the
同様にして、低減処理済みの音声信号83におけるある周波数帯域の音の強度が、係数βが乗算された基準信号84’における対応する周波数帯域の音の強度の値を超過する場合には、低減処理済みの音声信号83におけるその周波数帯域の音の強度の値を、係数βが乗算された基準信号84’における対応する周波数帯域の音の強度の値に置換する。
Similarly, if the sound intensity in a certain frequency band in the
なお、図4は、低減処理済みの音声信号83の周波数スペクトル83eの値(音の強度)が、係数βが乗算された基準信号84’の周波数スペクトル84’eの値未満となる場合を示している。この場合、信号補正部64は、低減処理済みの音声信号83の周波数スペクトル83eの値を、係数βが乗算された基準信号84’における各周波数帯域の周波数スペクトル84’eの値に置換する。
FIG. 4 shows a case where the value (sound intensity) of the
これにより、補正処理が施された音声信号(補正済みの音声信号)83’が生成される。この補正済みの音声信号83’は、周波数逆変換部65による逆フーリエ変換等により、周波数関数で示される信号から時間関数で示される信号に変換される。なお、各フレームの周波数領域信号は、0.5フレーム分ずらしながらのフーリエ変換処理により生成されることから、周波数逆変換部65により逆フーリエ変換処理が施された時間関数で示される音声信号は、0.5フレームずらしながらつなぎ合わされる。
As a result, an audio signal (corrected audio signal) 83 ′ subjected to the correction process is generated. The corrected
このように、音声信号からカメラ内部の機構が駆動したときに発生する動作音の成分を減算することで、動作音の影響を低減した音声信号を生成した後、この動作音の影響を低減した音声信号を目的音のみの音声信号に基づいて補正している。このため、本来の動作音とは異なる特性の音からなる動作音をノイズ音として推定された場合に生じるミュージカルノイズの発生を防止することができる。このように本実施形態においては、取得された音声信号に含まれるノイズ音を適切に低減することができる。 In this way, by subtracting the component of the operation sound that occurs when the internal mechanism of the camera is driven from the sound signal, after generating the sound signal that reduces the effect of the operation sound, the effect of this operation sound is reduced. The sound signal is corrected based on the sound signal of only the target sound. For this reason, it is possible to prevent the occurrence of musical noise that occurs when an operation sound having a characteristic different from that of the original operation sound is estimated as a noise sound. Thus, in this embodiment, the noise sound contained in the acquired audio | voice signal can be reduced appropriately.
本実施形態では、ノイズ音としての動作音の発生の要件として、AF駆動信号が出力されるタイミングを挙げているが、この他に、ズームボタンなどの操作部が操作されたときに出力される操作信号など、デジタルカメラに設けられた操作部の操作信号が出力されるタイミングや、絞り値を変更する際に駆動する絞り駆動部の駆動信号や、手ブレ補正機能を備えたデジタルカメラの場合には手ブレ補正処理の開始信号が出力されるタイミングなどが挙げられる。 In the present embodiment, the timing for outputting the AF drive signal is given as a requirement for the generation of the operation sound as the noise sound, but in addition to this, it is output when an operation unit such as a zoom button is operated. In the case of a digital camera equipped with a camera shake correction function, the timing at which the operation signal of the operation unit provided in the digital camera is output, the drive signal of the aperture drive unit that is driven when changing the aperture value, etc. Includes a timing at which a start signal of camera shake correction processing is output.
本実施形態では、周波数帯域毎の周波数スペクトルの比較において、低減処理済みの音声信号83におけるある周波数帯域における周波数スペクトルの値(音の強度)が、係数βが乗算された基準信号84’の対応する周波数帯域における周波数スペクトルの値未満となる場合に、低減処理済みの音声信号におけるその周波数帯域の周波数スペクトルの値を、係数βが乗算された基準信号の対応する周波数帯域の周波数スペクトルの値に置換しているが、これに限定される必要はない。
In the present embodiment, in the comparison of the frequency spectrum for each frequency band, the value of the frequency spectrum (sound intensity) in a certain frequency band in the reduced
例えば、低減処理済みの音声信号におけるある周波数帯域における周波数スペクトルの値が、係数βが乗算された基準信号の対応する周波数帯域の周波数スペクトルの値未満となる場合には、低減処理済みの音声信号におけるその周波数帯域における周波数スペクトルの値を、係数βが乗算された基準信号の対応する周波数帯域の周波数スペクトルの値を上回る値に補正してもよい。この場合、予め隣り合う周波数帯域の周波数スペクトルの値の比を、低減処理済みの音声信号83と係数βが乗算された基準信号84’とのそれぞれで算出し、隣り合う周波数帯域の周波数スペクトルの値の比が一致するように、低減処理済みの音声信号83における周波数スペクトルの値を補正すればよい。
For example, when the value of the frequency spectrum in a certain frequency band in the reduced audio signal is less than the value of the frequency spectrum in the corresponding frequency band of the reference signal multiplied by the coefficient β, the reduced audio signal The frequency spectrum value in that frequency band may be corrected to a value that exceeds the value of the frequency spectrum in the corresponding frequency band of the reference signal multiplied by the coefficient β. In this case, the ratio of the frequency spectrum values of the adjacent frequency bands is calculated in advance for each of the reduced
また、低減処理済みの音声信号におけるある周波数帯域の周波数スペクトルの値が、係数βが乗算された基準信号の対応する周波数帯域の周波数スペクトルの値を超過している場合も同様であり、低減処理済みの音声信号におけるその周波数帯域の周波数スペクトルの値を、係数βが乗算された基準信号の対応する周波数帯域の周波数スペクトルの値に置換せずに、低減処理済みの音声信号におけるその周波数帯域の周波数スペクトルの値を、係数βが乗算された基準信号の対応する周波数帯域の周波数スペクトルの値を下回る値に補正してもよい。隣合う周波数帯域の周波数スペクトルの値の比が一致するように補正するのも同様に行えばよい。 The same applies to the case where the value of the frequency spectrum of a certain frequency band in the audio signal that has been subjected to reduction processing exceeds the value of the frequency spectrum of the corresponding frequency band of the reference signal multiplied by the coefficient β. Without replacing the value of the frequency spectrum of that frequency band in the already-processed audio signal with the value of the frequency spectrum of the corresponding frequency band of the reference signal multiplied by the coefficient β. The value of the frequency spectrum may be corrected to a value lower than the value of the frequency spectrum of the corresponding frequency band of the reference signal multiplied by the coefficient β. The correction may be performed in the same manner so that the ratios of the frequency spectrum values of the adjacent frequency bands match.
本実施形態では、基準信号の各周波数帯域の周波数スペクトルに対して係数βを乗算し、係数βが乗算された基準信号における周波数帯域毎の周波数スペクトルと、低減処理済みの音声信号における周波数帯域毎の周波数スペクトルを、周波数帯域毎に比較し、比較の結果、周波数スペクトルの値が異なる周波数帯域を補正対象の周波数帯域とし、低減処理済みの音声信号におけるその補正対象の周波数帯域の周波数スペクトルを補正する。そして、低減処理済みの音声信号における補正対象の周波数帯域の周波数スペクトルを補正する際に、係数βが乗算された基準信号における対応する周波数帯域(補正対象の周波数帯域)の周波数スペクトルに基づいて、補正を行っている。しかしながら、周波数スペクトルの補正のしかたは、これに限定されるものではなく、基準信号における周波数帯域のうち、補正対象の周波数帯域を含む複数の周波数帯域(例えば、補正対象の周波数帯域と隣り合う周波数帯域)の周波数スペクトルの値の単純平均値、加重平均値、最大値或いは最小値のいずれかを求め、この求めた値を制限値として、この制限値に基づいて低減処理済みの音声信号における周波数スペクトルのうち、補正対象の周波数帯域の周波数スペクトルの値の補正を行うことも可能である。以下、単純平均値を用いる場合について説明する。なお、単純平均値を求める際に用いる周波数スペクトルの数は適宜設定してよいものとする。 In the present embodiment, the frequency spectrum of each frequency band of the reference signal is multiplied by the coefficient β, the frequency spectrum for each frequency band in the reference signal multiplied by the coefficient β, and the frequency band in the reduced audio signal Are compared for each frequency band, and as a result of comparison, frequency bands with different frequency spectrum values are set as the frequency band to be corrected, and the frequency spectrum of the frequency band to be corrected in the reduced audio signal is corrected. To do. Then, when correcting the frequency spectrum of the frequency band to be corrected in the reduced audio signal, based on the frequency spectrum of the corresponding frequency band (frequency band to be corrected) in the reference signal multiplied by the coefficient β, Correction is being performed. However, the method of correcting the frequency spectrum is not limited to this, and among the frequency bands in the reference signal, a plurality of frequency bands including the frequency band to be corrected (for example, frequencies adjacent to the frequency band to be corrected). Frequency) of the frequency spectrum of the band) is calculated as a simple average value, a weighted average value, a maximum value or a minimum value, and the obtained value is used as a limit value, and the frequency in the audio signal subjected to reduction processing based on the limit value Of the spectrum, it is also possible to correct the value of the frequency spectrum of the frequency band to be corrected. Hereinafter, a case where a simple average value is used will be described. It should be noted that the number of frequency spectra used when obtaining the simple average value may be set as appropriate.
図5に示すように、例えば低減処理済みの音声信号83における各周波数帯域の周波数スペクトルのうち、周波数スペクトル83eにおける周波数帯域が補正対象の周波数帯域である場合について説明する。信号補正部64は、基準信号における各周波数帯域の周波数スペクトルのうち、周波数スペクトル83eにおける周波数帯域を含む複数の周波数帯域の周波数スペクトル(例えば周波数スペクトル86d、86e、86f)の値を読み出し、これら周波数スペクトルの単純平均値を算出する。そして、信号補正部64は算出した単純平均値に、係数σを乗算することで制限値を算出する。次に、信号補正部64は、算出した制限値と、対象の周波数帯域の周波数スペクトルの値とを比較する。
As illustrated in FIG. 5, for example, a case will be described in which the frequency band in the
上述した比較において、例えば周波数スペクトル83eの値が、算出した制限値未満となる場合や、算出した制限値を超過する場合には、信号補正部64は、周波数スペクトル83eの値を制限値に置換する。
In the comparison described above, for example, when the value of the
本実施形態では、基準信号の各周波数帯域の周波数スペクトルに対して係数βを乗算した値を各周波数帯域の制限値とし、この制限値を上限にした補正や、この制限値を下限にした補正行っている。しかしながら、基準信号の各周波数帯域の周波数スペクトルに対して係数βを乗算した値を制限値ではなく目標値として設定した上で、低減処理済みの音声信号の周波数スペクトルのうち、補正対象とする周波数スペクトルの値を目標値に近づけるように補正することも可能である。 In the present embodiment, a value obtained by multiplying the frequency spectrum of each frequency band of the reference signal by a coefficient β is a limit value of each frequency band, and a correction with this limit value as the upper limit, or a correction with this limit value as the lower limit. Is going. However, after setting the value obtained by multiplying the frequency spectrum of each frequency band of the reference signal by the coefficient β as the target value instead of the limit value, the frequency to be corrected out of the frequency spectrum of the reduced audio signal It is also possible to correct the spectrum value so as to approach the target value.
本実施形態では、動画像撮影の際に取得される音声信号を例に挙げて説明しているが、これに限定される必要はなく、例えば音声信号のみを取得する場合にも適応できる。つまり、録音機能を有する電子機器であれば、本発明を適用することが可能である。また、動画撮影を行う装置としてデジタルカメラを例に挙げて説明しているが、この他に、携帯電話機や、PDAなどの携帯型端末機であってもよい。さらに、図2で示す信号処理装置の各機能をコンピュータにて実行させることが可能なプログラムであってもよい。この場合、該プログラムは、メモリカード、光学ディスク、磁気ディスクなどのコンピュータで読み取り可能な記憶媒体に記憶されていることが好ましい。 In the present embodiment, the audio signal acquired at the time of moving image shooting is described as an example. However, the present invention is not limited to this, and can be applied to the case of acquiring only an audio signal, for example. That is, the present invention can be applied to any electronic device having a recording function. In addition, although a digital camera has been described as an example of a device that performs moving image shooting, a mobile terminal such as a mobile phone or a PDA may be used. Furthermore, the program may be a program that allows a computer to execute the functions of the signal processing device shown in FIG. In this case, the program is preferably stored in a computer-readable storage medium such as a memory card, an optical disk, or a magnetic disk.
10…デジタルカメラ、15…撮像光学系、16…撮像素子、18…レンズ駆動部、19…絞り、20…絞り駆動部、21…シャッタ、22…シャッタ駆動部、36…記憶媒体、43…収音部、44…音声メモリ、45…信号処理装置、61…周波数変換部、62…信号算出部、63…記録部、64…信号補正部、65…信号逆変換部
DESCRIPTION OF SYMBOLS 10 ... Digital camera, 15 ... Imaging optical system, 16 ... Imaging device, 18 ... Lens drive part, 19 ... Aperture, 20 ... Aperture drive part, 21 ... Shutter, 22 ... Shutter drive part, 36 ... Storage medium, 43 ...
Claims (8)
前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、
複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値と異なる場合に、前記第3の音声信号における周波数スペクトルの値を、前記対応する周波数スペクトルの値に置換する補正手段と、
前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、
を備えたことを特徴とする信号処理装置。 A plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width are second audio signals represented by a frequency function. Signal converting means for converting to
Calculating means for obtaining a third sound signal in which the influence of the operation sound is reduced from the second sound signal and the sound signal indicating the operation sound;
The frequency corresponding to the reference signal multiplied by the value of the frequency spectrum in each frequency band of the third audio signal and the coefficient , with the audio signal indicating the target sound of the plurality of second audio signals as a reference signal Comparing the value of the frequency spectrum in the band with the value of the frequency spectrum in the third audio signal different from the value of the corresponding frequency spectrum in the reference signal multiplied by the coefficient. Correction means for replacing the value of the frequency spectrum in the signal with the value of the corresponding frequency spectrum ;
Signal inverse conversion means for inversely converting the sound signal subjected to the correction processing by the correction means from the sound signal indicated by the frequency function to the sound signal indicated by the time function;
A signal processing apparatus comprising:
前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、
複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値未満となる場合に、前記第3の音声信号における周波数スペクトルの値を、前記対応する周波数スペクトルの値を下回らないように補正する補正手段と、
前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、
を備えたことを特徴とする信号処理装置。 A plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width are second audio signals represented by a frequency function. Signal converting means for converting to
Calculating means for obtaining a third sound signal in which the influence of the operation sound is reduced from the second sound signal and the sound signal indicating the operation sound;
The frequency corresponding to the reference signal multiplied by the value of the frequency spectrum in each frequency band of the third audio signal and the coefficient, with the audio signal indicating the target sound of the plurality of second audio signals as a reference signal A frequency spectrum value in a band is compared, and if the frequency spectrum value in the third audio signal is less than the corresponding frequency spectrum value in the reference signal multiplied by the coefficient, Correction means for correcting the value of the frequency spectrum in the audio signal so as not to fall below the value of the corresponding frequency spectrum;
Signal inverse conversion means for inversely converting the sound signal subjected to the correction processing by the correction means from the sound signal indicated by the frequency function to the sound signal indicated by the time function;
Signal processing apparatus characterized by comprising a.
前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、
複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルを超過する場合に、前記第3の音声信号における周波数スペクトルの値を、前記対応する周波数スペクトルの値を上回らないように補正する補正手段と、
前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、
を備えたことを特徴とする信号処理装置。 A plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width are second audio signals represented by a frequency function. Signal converting means for converting to
Calculating means for obtaining a third sound signal in which the influence of the operation sound is reduced from the second sound signal and the sound signal indicating the operation sound;
The frequency corresponding to the reference signal multiplied by the value of the frequency spectrum in each frequency band of the third audio signal and the coefficient, with the audio signal indicating the target sound of the plurality of second audio signals as a reference signal Comparing the value of the frequency spectrum in the band and if the value of the frequency spectrum in the third audio signal exceeds the corresponding frequency spectrum in the reference signal multiplied by the coefficient, the third audio signal Correction means for correcting the value of the frequency spectrum in so as not to exceed the value of the corresponding frequency spectrum;
Signal inverse conversion means for inversely converting the sound signal subjected to the correction processing by the correction means from the sound signal indicated by the frequency function to the sound signal indicated by the time function;
Signal processing apparatus characterized by comprising a.
前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、
複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値と異なる場合に、前記第3の音声信号における周波数スペクトルの値を、前記係数が乗算された前記基準信号の周波数スペクトルのうち、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値を用いて算出される補正値に置換する補正手段と、
前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、
を備えたことを特徴とする信号処理装置。 A plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width are second audio signals represented by a frequency function. Signal converting means for converting to
Calculating means for obtaining a third sound signal in which the influence of the operation sound is reduced from the second sound signal and the sound signal indicating the operation sound;
The frequency corresponding to the reference signal multiplied by the value of the frequency spectrum in each frequency band of the third audio signal and the coefficient, with the audio signal indicating the target sound of the plurality of second audio signals as a reference signal Comparing the value of the frequency spectrum in the band with the value of the frequency spectrum in the third audio signal different from the value of the corresponding frequency spectrum in the reference signal multiplied by the coefficient. The value of the frequency spectrum in the signal is changed to a correction value calculated using the value of the corresponding frequency spectrum and the frequency spectrum of the frequency band in the vicinity of the frequency spectrum of the reference signal multiplied by the coefficient. Correction means to replace;
Signal inverse conversion means for inversely converting the sound signal subjected to the correction processing by the correction means from the sound signal indicated by the frequency function to the sound signal indicated by the time function;
Signal processing apparatus characterized by comprising a.
前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、
複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値を超過する場合に、前記第3の音声信号における周波数スペクトルの値を、前記係数が乗算された前記基準信号の周波数スペクトルのうち、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値を用いて算出される補正値を上回らないように補正する補正手段と、
前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、
を備えたことを特徴とする信号処理装置。 A plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width are second audio signals represented by a frequency function. Signal converting means for converting to
Calculating means for obtaining a third sound signal in which the influence of the operation sound is reduced from the second sound signal and the sound signal indicating the operation sound;
The frequency corresponding to the reference signal multiplied by the value of the frequency spectrum in each frequency band of the third audio signal and the coefficient, with the audio signal indicating the target sound of the plurality of second audio signals as a reference signal A frequency spectrum value in the band is compared, and if the frequency spectrum value in the third audio signal exceeds the corresponding frequency spectrum value in the reference signal multiplied by the coefficient, A correction value calculated from the frequency spectrum value of the audio signal using the corresponding frequency spectrum value and the frequency spectrum value of the frequency band in the vicinity of the frequency spectrum of the reference signal multiplied by the coefficient. Correction means for correcting so as not to exceed
Signal inverse conversion means for inversely converting the sound signal subjected to the correction processing by the correction means from the sound signal indicated by the frequency function to the sound signal indicated by the time function;
Signal processing apparatus characterized by comprising a.
前記第2の音声信号と、前記動作音を示す音声信号とから、前記動作音の影響を低減した第3の音声信号を求める算出手段と、
複数の前記第2の音声信号の前記目的音を示す音声信号を基準信号として、前記第3の音声信号の各周波数帯域における周波数スペクトルの値と、係数が乗算された前記基準信号の対応する周波数帯域における周波数スペクトルの値とを比較し、前記第3の音声信号における周波数スペクトルの値が、前記係数が乗算された前記基準信号における対応する周波数スペクトルの値未満となる場合に、前記第3の音声信号における周波数スペクトルの値を、前記係数が乗算された前記基準信号の周波数スペクトルのうち、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値を用いて算出される補正値を下回らないように補正する補正手段と、
前記補正手段により補正処理が施された音声信号を、前記周波数関数で示される音声信号から、前記時間関数で示される音声信号に逆変換する信号逆変換手段と、
を備えたことを特徴とする信号処理装置。 A plurality of first audio signals for each predetermined time obtained by dividing an audio signal represented by a time function in which a target sound and an operation sound are mixed by a predetermined time width are second audio signals represented by a frequency function. Signal converting means for converting to
Calculating means for obtaining a third sound signal in which the influence of the operation sound is reduced from the second sound signal and the sound signal indicating the operation sound;
The frequency corresponding to the reference signal multiplied by the value of the frequency spectrum in each frequency band of the third audio signal and the coefficient, with the audio signal indicating the target sound of the plurality of second audio signals as a reference signal A frequency spectrum value in a band is compared, and if the frequency spectrum value in the third audio signal is less than the corresponding frequency spectrum value in the reference signal multiplied by the coefficient, A correction value calculated from the frequency spectrum value of the audio signal using the corresponding frequency spectrum value and the frequency spectrum value of the frequency band in the vicinity of the frequency spectrum of the reference signal multiplied by the coefficient. Correction means for correcting so as not to fall below
Signal inverse conversion means for inversely converting the sound signal subjected to the correction processing by the correction means from the sound signal indicated by the frequency function to the sound signal indicated by the time function;
Signal processing apparatus characterized by comprising a.
前記補正値は、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値の平均、前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値のうちの最大値、或いは前記対応する周波数スペクトルの値及びその近傍の周波数帯域の周波数スペクトルの値のうちの最小値のいずれかからなることを特徴とする信号処理回路。 The signal processing device according to any one of claims 4 to 6 ,
The correction value is an average of the corresponding frequency spectrum value and the frequency spectrum value of the neighboring frequency band, the maximum value of the corresponding frequency spectrum value and the frequency spectrum value of the neighboring frequency band, Alternatively , the signal processing circuit comprises any one of the minimum value of the corresponding frequency spectrum value and the frequency spectrum value of the frequency band in the vicinity thereof .
前記撮像手段による前記画像信号の取得に同期して、音声信号を取得する収音手段と、 Sound collection means for acquiring an audio signal in synchronization with acquisition of the image signal by the imaging means;
請求項1〜請求項7のいずれか1項に記載の信号処理装置と、 The signal processing device according to any one of claims 1 to 7,
前記撮像手段により取得された画像信号と、前記信号処理装置により信号処理が施された音声信号とを記憶する記憶手段と、 Storage means for storing the image signal acquired by the imaging means and the audio signal subjected to signal processing by the signal processing device;
を備えたことを特徴とする撮像装置。 An imaging apparatus comprising:
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009248953A JP5018860B2 (en) | 2009-10-29 | 2009-10-29 | Signal processing apparatus and imaging apparatus |
US12/913,903 US8600070B2 (en) | 2009-10-29 | 2010-10-28 | Signal processing apparatus and imaging apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009248953A JP5018860B2 (en) | 2009-10-29 | 2009-10-29 | Signal processing apparatus and imaging apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011097335A JP2011097335A (en) | 2011-05-12 |
JP5018860B2 true JP5018860B2 (en) | 2012-09-05 |
Family
ID=44113788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009248953A Expired - Fee Related JP5018860B2 (en) | 2009-10-29 | 2009-10-29 | Signal processing apparatus and imaging apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5018860B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5278477B2 (en) | 2011-03-30 | 2013-09-04 | 株式会社ニコン | Signal processing apparatus, imaging apparatus, and signal processing program |
JP2012249109A (en) * | 2011-05-27 | 2012-12-13 | Nikon Corp | Noise information recording apparatus, imaging apparatus, interchangeable lens, noise reduction processing apparatus, and program |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005037650A (en) * | 2003-07-14 | 2005-02-10 | Asahi Kasei Corp | Noise reducing apparatus |
JP2006270591A (en) * | 2005-03-24 | 2006-10-05 | Nikon Corp | Electronic camera, data reproducing device and program |
JP2006279185A (en) * | 2005-03-28 | 2006-10-12 | Casio Comput Co Ltd | Imaging apparatus, and sound recording method and program |
US8433074B2 (en) * | 2005-10-26 | 2013-04-30 | Nec Corporation | Echo suppressing method and apparatus |
JP4816334B2 (en) * | 2006-08-29 | 2011-11-16 | カシオ計算機株式会社 | Noise reduction device, imaging device, noise reduction method, and program |
JP4900062B2 (en) * | 2007-06-06 | 2012-03-21 | ヤマハ株式会社 | Audio signal processing apparatus, audio reproduction apparatus, and audio signal processing method |
-
2009
- 2009-10-29 JP JP2009248953A patent/JP5018860B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011097335A (en) | 2011-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5529635B2 (en) | Audio signal processing apparatus and audio signal processing method | |
JP4824586B2 (en) | Imaging device | |
US9215356B2 (en) | Image processing apparatus, image processing method, and program to combine a composite image of noise suppressed images generated from images each including a direct current component and at least one noise suppresed image processed from at least one image not including the direct current component | |
JP2010063088A (en) | Imaging apparatus | |
JP2014052487A (en) | Image capturing device, method of controlling the same, program, and recording medium | |
JP2008263498A (en) | Wind noise reducing device, sound signal recorder and imaging apparatus | |
KR20120023901A (en) | Digital image processing apparatus, method for digital image signal processing, medium for recording the method | |
JP6610725B2 (en) | Sound processing apparatus and sound processing program | |
US20150271439A1 (en) | Signal processing device, imaging device, and program | |
KR20120071967A (en) | Moving image photographing method and moving image photographing apparatus | |
KR20120071972A (en) | Digital image signal processing apparatus and method for controlling the same | |
JP5018860B2 (en) | Signal processing apparatus and imaging apparatus | |
US8600070B2 (en) | Signal processing apparatus and imaging apparatus | |
JP5063489B2 (en) | Judgment device, electronic apparatus including the same, and judgment method | |
KR20100044073A (en) | An image pickup apparatus | |
US8654212B2 (en) | Audio signal processing apparatus | |
US8498494B2 (en) | Method and apparatus for processing a digital image signal, and a recording medium having recorded thereon a program for executing the method | |
JP5213604B2 (en) | Imaging device | |
JP6017641B1 (en) | Imaging apparatus, signal processing method, signal processing program | |
US8368782B2 (en) | Multiple exposure image pickup apparatus, multiple exposure image pickup method, program, and recording medium | |
JP5246134B2 (en) | Signal processing apparatus and imaging apparatus | |
JP2011205527A (en) | Imaging apparatus, method and program | |
JP5721552B2 (en) | Imaging apparatus and image composition method | |
KR102089981B1 (en) | Image processing apparatus, image processing method and program thereof | |
JP5747638B2 (en) | Imaging apparatus, imaging method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110811 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120515 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120528 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |