JP2013161041A - Signal processor, camera and signal processing program - Google Patents

Signal processor, camera and signal processing program Download PDF

Info

Publication number
JP2013161041A
JP2013161041A JP2012025095A JP2012025095A JP2013161041A JP 2013161041 A JP2013161041 A JP 2013161041A JP 2012025095 A JP2012025095 A JP 2012025095A JP 2012025095 A JP2012025095 A JP 2012025095A JP 2013161041 A JP2013161041 A JP 2013161041A
Authority
JP
Japan
Prior art keywords
signal
spectrum
signal processing
environmental sound
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012025095A
Other languages
Japanese (ja)
Inventor
Kosuke Okano
康介 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2012025095A priority Critical patent/JP2013161041A/en
Publication of JP2013161041A publication Critical patent/JP2013161041A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a signal processor that properly performs noise reduction.SOLUTION: A signal processor 1 includes transformation means 16 that transforms an acoustic signal to a spectrum signal for each prescribed frame, spectrum suppression means 16 that makes substantially zero a signal of frequency component to be a noise reduction object from the spectrum signal transformed by the transformation means 16, and inverse transformation means 16 that inversely transforms the spectrum signal after spectrum suppression to an acoustic signal.

Description

本発明は、信号処理装置、カメラおよび信号処理プログラムに関する。   The present invention relates to a signal processing device, a camera, and a signal processing program.

撮影中に取得した音響信号を撮影画像とともに記録する場合に、雑音となる撮影動作時の機構音をあらかじめスペクトル化した信号として記憶しておき、上記機構音が発生するタイミングに基づいて、上記スペクトル化信号に所定係数を乗じた信号を取得した音響信号から減算することにより、音響信号に混入する機構音を抑制する技術が知られている(特許文献1参照)。   When recording an acoustic signal acquired during photographing together with a photographed image, the mechanical sound at the time of the photographing operation that becomes noise is stored in advance as a spectrum signal, and the spectrum is determined based on the timing at which the mechanical sound is generated. There is known a technique for suppressing a mechanical sound mixed in an acoustic signal by subtracting a signal obtained by multiplying a signal by a predetermined coefficient from the acquired acoustic signal (see Patent Document 1).

特開2006−279185号公報JP 2006-279185 A

一般に、AF(オートフォーカス)作動時の機構音は時間とともに変動する非定常な音である。このため、大きな機構音が生じた場合には、過小減算になって雑音が残ってしまうおそれがあった。一方、小さな機構音が生じた場合には、過大減算となって音質劣化につながってしまう。   In general, the mechanism sound at the time of AF (autofocus) operation is an unsteady sound that varies with time. For this reason, when a large mechanical sound is generated, there is a possibility that noise may remain due to undersubtraction. On the other hand, when a small mechanical sound is generated, excessive subtraction results in deterioration of sound quality.

本発明による信号処理装置は、音響信号を所定フレームごとにスペクトル信号に変換する変換手段と、変換手段によって変換されたスペクトル信号から、雑音低減対象とする周波数成分の信号を略0にするスペクトル抑圧手段と、スペクトル抑圧後のスペクトル信号を音響信号に逆変換する逆変換手段と、を備えることを特徴とする。   The signal processing apparatus according to the present invention includes a conversion unit that converts an acoustic signal into a spectrum signal for each predetermined frame, and a spectrum suppression that makes the frequency component signal to be reduced noise substantially zero from the spectrum signal converted by the conversion unit. Means, and inverse conversion means for inversely converting the spectrum signal after spectrum suppression into an acoustic signal.

本発明によれば、適切に雑音低減を行うことができる。   According to the present invention, it is possible to appropriately reduce noise.

本発明の一実施の形態による雑音低減用の信号処理装置を搭載する電子カメラの構成を例示するブロック図である。It is a block diagram which illustrates the composition of the electronic camera carrying the signal processing device for noise reduction by one embodiment of the present invention. CPUが実行する雑音低減処理の流れを説明するフローチャートである。It is a flowchart explaining the flow of the noise reduction process which CPU performs. コンピュータ装置を例示する図である。It is a figure which illustrates a computer apparatus.

以下、図面を参照して本発明を実施するための形態について説明する。図1は、本発明の一実施の形態による雑音低減用の信号処理装置を搭載する電子カメラ1の構成を例示するブロック図である。図1において、電子カメラ1は、撮影光学系11と、撮像素子12と、画像処理部13と、RAM14と、LCDモニタ15と、CPU16と、不揮発性メモリ17と、カードインターフェース(I/F)18と、通信インターフェース(I/F)19と、操作部材20と、マイク21と、音響処理回路22とを備える。   Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings. FIG. 1 is a block diagram illustrating the configuration of an electronic camera 1 equipped with a signal processing device for noise reduction according to an embodiment of the present invention. In FIG. 1, an electronic camera 1 includes a photographing optical system 11, an image sensor 12, an image processing unit 13, a RAM 14, an LCD monitor 15, a CPU 16, a nonvolatile memory 17, and a card interface (I / F). 18, a communication interface (I / F) 19, an operation member 20, a microphone 21, and an acoustic processing circuit 22.

CPU16、不揮発性メモリ17、カードインターフェース18、通信インターフェース19、音響処理回路22、画像処理部13、RAM14およびLCDモニタ15は、それぞれがバス25を介して接続されている。   The CPU 16, the nonvolatile memory 17, the card interface 18, the communication interface 19, the sound processing circuit 22, the image processing unit 13, the RAM 14, and the LCD monitor 15 are connected via a bus 25.

撮影光学系11は、ズームレンズやフォーカシングレンズを含む複数のレンズ群で構成され、被写体像を撮像素子12の受光面に結像させる。なお、図1を簡単にするため、撮影光学系11を単レンズとして図示している。   The photographing optical system 11 includes a plurality of lens groups including a zoom lens and a focusing lens, and forms a subject image on the light receiving surface of the image sensor 12. In order to simplify FIG. 1, the photographing optical system 11 is shown as a single lens.

撮像素子12は、受光素子が受光面に二次元配列されたCMOSイメージセンサなどによって構成される。撮像素子12は、撮影光学系11を通過した光束による像を光電変換し、デジタル画像信号を生成する。デジタル画像信号は、画像処理部13に入力される。画像処理部13は、デジタル画像データに対して各種の画像処理(色補間処理、階調変換処理、輪郭強調処理、ホワイトバランス調整処理など)を施す。   The imaging element 12 is configured by a CMOS image sensor or the like in which light receiving elements are two-dimensionally arranged on the light receiving surface. The image sensor 12 photoelectrically converts an image of the light beam that has passed through the photographing optical system 11 to generate a digital image signal. The digital image signal is input to the image processing unit 13. The image processing unit 13 performs various types of image processing (color interpolation processing, gradation conversion processing, contour enhancement processing, white balance adjustment processing, etc.) on the digital image data.

LCDモニタ15は液晶パネルなどによって構成される。LCDモニタ15は、CPU16からの指示に応じて画像や操作アイコン、メニュー画面などを表示する。RAM14は、画像処理部13による画像処理の前工程や後工程でのデジタル画像データを一時的に記憶する他、後述する雑音低減処理の前工程や後工程でのデジタル音響データを一時的に記憶したり、CPU16によるプログラム実行時の作業用メモリとして用いられる。不揮発性メモリ17は、フラッシュメモリなどによって構成される。不揮発性メモリ17は電源オフ時にも記憶内容を保持するので、CPU16が実行するプログラムなどを記憶させる。   The LCD monitor 15 is composed of a liquid crystal panel or the like. The LCD monitor 15 displays an image, an operation icon, a menu screen, and the like according to an instruction from the CPU 16. The RAM 14 temporarily stores digital image data in a pre-process and post-process of image processing by the image processing unit 13 and temporarily stores digital acoustic data in a pre-process and post-process of noise reduction processing described later. Or used as a working memory when the CPU 16 executes the program. The nonvolatile memory 17 is configured by a flash memory or the like. Since the nonvolatile memory 17 retains the stored contents even when the power is turned off, the nonvolatile memory 17 stores a program executed by the CPU 16 and the like.

CPU16は、不揮発性メモリ17が記憶するプログラムを実行することにより、電子カメラ1が行う動作を制御する。CPU16は、AF(オートフォーカス)動作制御や、自動露出(AE)演算も行う。AF動作は、たとえば、ライブビュー画像のコントラスト情報に基づいてフォーカシングレンズ(不図示)の合焦位置を求める。ライブビュー画像は、レリーズ操作前に撮像素子12によって所定の時間間隔(たとえば30コマ/毎秒)で繰り返し取得されるモニタ用画像のことをいう。   The CPU 16 controls the operation performed by the electronic camera 1 by executing a program stored in the nonvolatile memory 17. The CPU 16 also performs AF (autofocus) operation control and automatic exposure (AE) calculation. In the AF operation, for example, an in-focus position of a focusing lens (not shown) is obtained based on the contrast information of the live view image. The live view image refers to a monitor image that is repeatedly acquired by the image sensor 12 at a predetermined time interval (for example, 30 frames / second) before the release operation.

カードインターフェース18はコネクタ(不図示)を有し、該コネクタにメモリカードなどの記憶媒体30が接続される。カードインターフェース18は、接続された記憶媒体30に対するデータの書き込みや、記憶媒体30からのデータの読み込みを行う。記憶媒体30は、半導体メモリを内蔵したメモリカード、またはハードディスクドライブなどで構成される。   The card interface 18 has a connector (not shown), and a storage medium 30 such as a memory card is connected to the connector. The card interface 18 writes data to the connected storage medium 30 and reads data from the storage medium 30. The storage medium 30 is configured by a memory card incorporating a semiconductor memory, a hard disk drive, or the like.

通信インターフェース19は、たとえば、不図示のコネクタに接続された外部機器との間でTCP/IPプロトコルを用いた通信を行う。この通信により、外部機器からのコマンドやデータを受信したり、記憶媒体30が記憶している画像データや音響データなどを外部機器へ送信したりする。操作部材20は、電源スイッチをはじめ、レリーズボタンや録画ボタン、十字キースイッチなどの各操作部材を含む。操作部材20は、静止画撮影指示、録画(および録音)指示、モード切替え指示や各種選択指示など、各指示に応じた操作信号をCPU16へ送出する。   For example, the communication interface 19 performs communication using an TCP / IP protocol with an external device connected to a connector (not shown). Through this communication, commands and data from an external device are received, and image data, acoustic data, and the like stored in the storage medium 30 are transmitted to the external device. The operation member 20 includes a power switch, and other operation members such as a release button, a recording button, and a cross key switch. The operation member 20 sends an operation signal corresponding to each instruction such as a still image shooting instruction, a recording (and recording) instruction, a mode switching instruction, and various selection instructions to the CPU 16.

音響処理回路22は、マイク22で集音された音響信号を増幅し、増幅後の信号をA/D変換回路(不図示)によってデジタル音響データに変換する。レンズ駆動機構23は、CPU16からの指示に応じてフォーカシングレンズ(不図示)を光軸方向に進退移動させる。   The acoustic processing circuit 22 amplifies the acoustic signal collected by the microphone 22 and converts the amplified signal into digital acoustic data by an A / D conversion circuit (not shown). The lens driving mechanism 23 moves a focusing lens (not shown) forward and backward in the optical axis direction in response to an instruction from the CPU 16.

電子カメラ1は、レリーズボタンの押下操作に応じて静止画像を撮影する機能と、録画ボタンの押下操作に応じて動画像の録画および録音を行う機能とを有する。録画時のCPU16は、録画ボタンが押下されると動画像の取得および録音を開始する。たとえばライブビュー画像と同じ30コマ/毎秒のフレームレートで撮像を開始させるとともに、音響データの取得を開始させる。録画ボタンが再度押下されると画像取得および音響取得を終了し、取得したフレーム画像群によって構成される動画像を格納するファイル、および取得した音響データを格納するファイルを生成する。   The electronic camera 1 has a function of capturing a still image in response to a release button pressing operation and a function of recording and recording a moving image in response to a recording button pressing operation. When recording, the CPU 16 starts recording and recording a moving image when the recording button is pressed. For example, imaging is started at the same frame rate of 30 frames / second as that of the live view image, and acquisition of acoustic data is started. When the recording button is pressed again, image acquisition and sound acquisition are terminated, and a file for storing a moving image constituted by the acquired frame image group and a file for storing the acquired sound data are generated.

なお、本実施形態のCPU16が生成した音響データファイルには、音響データと同じ時間軸で表されたレンズ駆動機構23の駆動情報が含まれる。駆動情報は、録音時にレンズ駆動機構23がフォーカシングレンズを駆動中であったか否かを示すデータである。たとえば、駆動開始時刻と駆動終了時刻とを示すタイムデータでもよいし、駆動中を「1」で表し、非駆動中を「0」で表す2値データでもよい。   Note that the acoustic data file generated by the CPU 16 of the present embodiment includes driving information of the lens driving mechanism 23 represented on the same time axis as the acoustic data. The drive information is data indicating whether or not the lens driving mechanism 23 is driving the focusing lens during recording. For example, time data indicating a driving start time and a driving end time may be used, or binary data indicating “1” during driving and “0” during non-driving may be used.

本実施形態は、上述した録画時に取得した音響データを対象にする雑音低減処理に特徴を有するので、以降の説明は雑音低減のためにCPU16が実行する処理を中心に行う。   Since the present embodiment has a feature in the noise reduction processing for the acoustic data acquired at the time of recording described above, the following description will be focused on the processing executed by the CPU 16 for noise reduction.

図2は、CPU16が実行する雑音低減処理の流れを説明するフローチャートである。CPU16は、たとえば、音響データを一時的にRAM14へ記憶しておき、雑音低減処理プログラムを実行後の音響データを記憶媒体30に記録する。CPU16は、音響データを構成する1フレームごとに雑音低減を行う処理を繰り返す。   FIG. 2 is a flowchart for explaining the flow of noise reduction processing executed by the CPU 16. For example, the CPU 16 temporarily stores the acoustic data in the RAM 14 and records the acoustic data after executing the noise reduction processing program in the storage medium 30. CPU16 repeats the process which performs noise reduction for every frame which comprises acoustic data.

図2のステップS10において、CPU16は、RAM14から1フレーム分の音響データおよびレンズ駆動機構23の駆動情報を読み出してステップS20へ進む。ステップS20において、CPU16は、対象フレームの音響データに対して短時間フーリエ変換を施してステップS30へ進む。これにより、音響信号の周波数成分ごとの振幅(周波数特徴スペクトルと呼ぶ)が得られる。たとえば、サンプリング周波数が44.1kHzで約2000の周波数成分に分割する場合には、1周波数成分当たりのスペクトル幅は約20Hzである。   In step S10 of FIG. 2, the CPU 16 reads out acoustic data for one frame and driving information of the lens driving mechanism 23 from the RAM 14, and proceeds to step S20. In step S20, the CPU 16 performs a short-time Fourier transform on the sound data of the target frame and proceeds to step S30. Thereby, the amplitude (referred to as a frequency feature spectrum) for each frequency component of the acoustic signal is obtained. For example, when the sampling frequency is 44.1 kHz and divided into about 2000 frequency components, the spectral width per frequency component is about 20 Hz.

ステップS30において、CPU16は、音響データに音声が含まれているか否かを判定する。一般に、人の声は周波数2kHz以下において所定の周波数間隔で複数の「山」波形を有する。CPU16は、周波数特徴スペクトルにおいて2kHz以下の周波数帯に上記周波数間隔で複数の「山」波形が並び、かつ「山」波形のピーク値が第1所定値以上である場合には、ステップS30を肯定判定してステップS40へ進む。ステップS30を肯定判定する場合は、対象フレームの音響データに会話やナレーションなどが含まれる可能性が高いので、当該フレームの音響データを雑音低減対象とせず、当該フレームの音響データを環境音閾値の決定にも用いない。環境音閾値は、後述する雑音低減を行うか否かの判定に用いる判定閾値である。一方、CPU16は、2kHz以下の周波数帯において上記ピーク値が第1所定値以上となる「山」波形が上記周波数間隔で並んでいない場合には、ステップS30を否定判定してステップS60へ進む。   In step S30, the CPU 16 determines whether sound is included in the acoustic data. Generally, a human voice has a plurality of “mountain” waveforms at a predetermined frequency interval at a frequency of 2 kHz or less. When the plurality of “mountain” waveforms are arranged at the frequency interval in the frequency band of 2 kHz or less in the frequency characteristic spectrum, and the peak value of the “mountain” waveform is equal to or greater than the first predetermined value, the CPU 16 affirms step S30. Determine and proceed to step S40. If the determination in step S30 is affirmative, there is a high possibility that the sound data of the target frame includes conversation, narration, and the like. Therefore, the sound data of the frame is not targeted for noise reduction, and the sound data of the frame is set to the environmental sound threshold value. Not used for decision. The environmental sound threshold is a determination threshold used for determining whether or not to perform noise reduction described later. On the other hand, if the “mountain” waveform in which the peak value is not less than the first predetermined value in the frequency band of 2 kHz or less is not arranged at the frequency interval, the CPU 16 makes a negative determination in step S30 and proceeds to step S60.

ステップS40において、CPU16は、対象フレームの周波数特徴スペクトルに対して短時間逆フーリエ変換を施してステップS50へ進む。ステップS50において、CPU16は、上記処理後の音響データをRAM14へ記録して図2による処理を終了する。なお、本実施形態では、後述するステップS110へ進む場合を除き、対象フレームの音響データを雑音低減の対象にしない。つまり、ステップS110へ進まない場合は対象フレームの音響データをそのまま保存対象とし、ステップS110へ進む場合には、該S110による処理後の音響データを保存対象とする。   In step S40, the CPU 16 performs short-time inverse Fourier transform on the frequency feature spectrum of the target frame, and proceeds to step S50. In step S50, the CPU 16 records the acoustic data after the above processing in the RAM 14, and ends the processing shown in FIG. In the present embodiment, the acoustic data of the target frame is not targeted for noise reduction unless the process proceeds to step S110 described later. That is, if the process does not proceed to step S110, the sound data of the target frame is directly stored, and if the process proceeds to step S110, the sound data processed by S110 is stored.

上述したステップS30を否定判定して進むステップS60において、CPU16は、対象フレームにおける周波数特徴スペクトルの総和(すなわち、上記約2000の周波数成分ごとの振幅値の総和)が第2所定値以上か否かを判定する。CPU16は、上記総和が第2所定値以上の場合にステップS60を肯定判定してステップS40へ進む。ステップS60を肯定判定する場合は、対象フレームの音響データに突発的な音が含まれる可能性が高いので、当該フレームの音響データを雑音低減対象とせず、当該フレームの音響データを環境音閾値の決定にも用いない。一方、CPU16は、上記総和が第2所定値未満の場合にはステップS60を否定判定し、ステップS70へ進む。   In step S60, which proceeds after making a negative determination in step S30 described above, the CPU 16 determines whether or not the sum of the frequency feature spectra in the target frame (that is, the sum of the amplitude values for each of the approximately 2000 frequency components) is greater than or equal to the second predetermined value. Determine. If the sum is equal to or greater than the second predetermined value, the CPU 16 makes a positive determination in step S60 and proceeds to step S40. If the determination in step S60 is affirmative, there is a high possibility that sudden sound is included in the sound data of the target frame. Therefore, the sound data of the frame is not targeted for noise reduction, and the sound data of the frame is set to the environmental sound threshold value. Not used for decision. On the other hand, if the sum is less than the second predetermined value, the CPU 16 makes a negative determination in step S60 and proceeds to step S70.

ステップS70において、CPU16は、対象フレームにおける音響データが可動部駆動中に取得されたデータか否かを判定する。CPU16は、たとえば、当該フレームがフォーカシングレンズの駆動中に該当することが上述したレンズ駆動機構23の駆動情報によって示される場合は、ステップS70を肯定判定してステップS90へ進む。ステップS70を肯定判定する場合は、対象フレームの音響データに可動部駆動音が含まれている可能性が高いので、当該フレームの音響データを環境音閾値の決定に用いない。CPU16は、当該フレームがフォーカシングレンズの駆動中に該当しないことが上述したレンズ駆動機構23の駆動情報によって示される場合は、ステップS70を否定判定してステップS80へ進む。   In step S <b> 70, the CPU 16 determines whether the acoustic data in the target frame is data acquired while the movable unit is being driven. For example, when the driving information of the lens driving mechanism 23 described above indicates that the frame corresponds to the driving of the focusing lens, the CPU 16 makes a positive determination in step S70 and proceeds to step S90. When the determination in step S70 is affirmative, there is a high possibility that the moving part drive sound is included in the sound data of the target frame, and therefore the sound data of the frame is not used for determining the environmental sound threshold. If the above-described driving information of the lens driving mechanism 23 indicates that the frame does not correspond to driving of the focusing lens, the CPU 16 makes a negative determination in step S70 and proceeds to step S80.

ステップS80において、CPU16は、対象フレームの周波数特徴スペクトルを用いて環境音閾値を決定、更新してステップS40へ進む。CPU16は、たとえば、音響データを構成する第1フレームから対象フレームまでの各フレームの周波数特徴スペクトルから、上記約2000の周波数成分ごとに最大値を抽出し、抽出した約2000の周波数成分からなる周波数特徴スペクトルを環境音閾値スペクトルとする。CPU16は、当該フレームの周波数特徴スペクトルのいずれかの周波数成分の値が最大値に該当する場合は、環境音閾値スペクトルの対応する周波数成分の値を上記最大値と置換することによって環境音閾値スペクトルを更新する。これにより、可動部駆動音が含まれていない直近のフレームの音響データを環境音閾値スペクトルに反映させることができる。   In step S80, the CPU 16 determines and updates the environmental sound threshold using the frequency feature spectrum of the target frame, and proceeds to step S40. For example, the CPU 16 extracts a maximum value for each of the above approximately 2000 frequency components from the frequency feature spectrum of each frame from the first frame to the target frame constituting the acoustic data, and a frequency composed of the extracted approximately 2000 frequency components. The feature spectrum is an environmental sound threshold spectrum. When the value of any frequency component of the frequency characteristic spectrum of the frame corresponds to the maximum value, the CPU 16 replaces the value of the corresponding frequency component of the environmental sound threshold spectrum with the maximum value to replace the environmental sound threshold spectrum. Update. Thereby, the sound data of the most recent frame that does not include the movable part drive sound can be reflected in the environmental sound threshold spectrum.

ステップS90において、CPU16は、対象フレームにおける周波数特徴スペクトルが第3所定値以上変動したか否かを判定する。CPU16は、当該フレームにおける周波数特徴スペクトル(すなわち、上記約2000の周波数成分)のうち、少なくとも1つの周波数成分で前フレームに比べて第3所定値より大きく増減した場合にステップS90を肯定判定してステップS100へ進む。CPU16は、当該フレームにおける周波数特徴スペクトルの中で前フレームに比べて第3所定値より大きく増減した周波数成分が存在しない場合には、ステップS90を否定判定してステップS40へ進む。ステップS90を肯定判定する場合は、対象フレームの音響データが突発的に変化した可能性が高いので、当該フレームの音響データを雑音低減対象とせず、当該フレームの音響データを環境音閾値の決定にも用いない。   In step S90, the CPU 16 determines whether or not the frequency feature spectrum in the target frame has fluctuated by a third predetermined value or more. The CPU 16 makes an affirmative determination in step S90 when at least one frequency component of the frequency characteristic spectrum in the frame (that is, the frequency component of about 2000) increases or decreases more than a third predetermined value compared to the previous frame. Proceed to step S100. If the frequency feature spectrum in the frame does not include a frequency component that is larger or smaller than the third predetermined value compared to the previous frame, the CPU 16 makes a negative determination in step S90 and proceeds to step S40. If the determination in step S90 is affirmative, there is a high possibility that the acoustic data of the target frame has suddenly changed. Therefore, the acoustic data of the frame is not targeted for noise reduction, and the acoustic data of the frame is used to determine the environmental sound threshold. Also do not use.

ステップS100において、CPU16は、対象フレームにおける周波数特徴スペクトル(すなわち、上記約2000の周波数成分)のうち、環境音閾値スペクトルの対応する周波数成分の値より大きい値を有する周波数成分があるか否かを判定する。CPU16は、当該フレームにおける周波数特徴スペクトルのうち、少なくとも1つの周波数成分で環境音閾値スペクトルの対応する周波数成分より大きな値を有する場合に、ステップS100を肯定判定してステップS110へ進む。CPU16は、当該フレームにおける周波数特徴スペクトルが環境音閾値スペクトルの対応する周波数成分の値より大きい値を有していない場合には、ステップS100を否定判定してステップS40へ進む。ステップS100を否定判定する場合は、当該フレームの音響データに含まれる可動部駆動音が許容範囲内と判断し、当該フレームの音響データを雑音低減対象としない。しかしながら、当該フレームの音響データは可動部駆動音を含むので、当該フレームの音響データを環境音閾値の決定には用いない。   In step S100, the CPU 16 determines whether or not there is a frequency component having a value larger than the value of the corresponding frequency component of the environmental sound threshold spectrum among the frequency feature spectrum in the target frame (that is, the frequency component of about 2000). judge. The CPU 16 makes a positive determination in step S100 and proceeds to step S110 when at least one frequency component of the frequency characteristic spectrum in the frame has a value larger than the corresponding frequency component of the environmental sound threshold spectrum. If the frequency feature spectrum in the frame does not have a value greater than the value of the corresponding frequency component of the environmental sound threshold spectrum, the CPU 16 makes a negative determination in step S100 and proceeds to step S40. When a negative determination is made in step S100, it is determined that the moving part drive sound included in the sound data of the frame is within the allowable range, and the sound data of the frame is not targeted for noise reduction. However, since the sound data of the frame includes the moving part driving sound, the sound data of the frame is not used for determining the environmental sound threshold.

ステップS110において、CPU16は、対象フレームにおける周波数特徴スペクトル(すなわち、上記約2000の周波数成分)のうち、環境音閾値スペクトルの対応する周波数成分の値より大きい値を有する周波数成分の値を0に置換してステップS40へ進む。0に抑圧することで、0に抑圧する前の値が非定常な音であっても過小減算や過大減算をすることがないので、雑音が残ったり(過小減算の場合)、音質劣化になったり(過大減算の場合)するおそれがない。   In step S110, the CPU 16 replaces the value of the frequency component having a value larger than the value of the corresponding frequency component of the environmental sound threshold spectrum with 0 in the frequency feature spectrum (that is, the frequency component of about 2000) in the target frame. Then, the process proceeds to step S40. By suppressing to 0, even if the value before suppressing to 0 is an unsteady sound, there is no under-subtraction or over-subtraction, so noise remains (in the case of under-subtraction) and sound quality deteriorates. (In the case of excessive subtraction).

以上説明した実施形態によれば、以下の作用効果が得られる。
(1)雑音低減を行う信号処理装置を搭載する電子カメラ1は、音響信号を所定フレームごとに周波数特徴スペクトルにフーリエ変換するCPU16と、CPU16によって変換された周波数特徴スペクトルから、雑音低減対象とする周波数成分の信号を略0にするCPU16と、0に抑圧後の周波数特徴スペクトルを音響信号に逆フーリエ変換するCPU16とを備えるようにしたので、適切に雑音低減を行うことができる。すなわち、抑圧すべき雑音が非定常な音であっても対象とする周波数成分を確実に略0に抑えるため、スペクトル減算手法と異なり、雑音が残ったり(過小減算の場合)、音質劣化になったり(過大減算の場合)するおそれを排除できる。また、スペクトル減算をしないので、減算すべき雑音スペクトルの推定も不要である。
According to the embodiment described above, the following effects can be obtained.
(1) An electronic camera 1 equipped with a signal processing device that performs noise reduction is subject to noise reduction from a CPU 16 that Fourier transforms an acoustic signal into a frequency feature spectrum for each predetermined frame, and the frequency feature spectrum converted by the CPU 16. Since the CPU 16 that sets the frequency component signal to approximately 0 and the CPU 16 that performs inverse Fourier transform of the frequency feature spectrum after suppression to 0 to an acoustic signal are provided, noise reduction can be performed appropriately. That is, even if the noise to be suppressed is an unsteady sound, the frequency component of interest is surely suppressed to substantially zero, so that noise remains (in the case of under-subtraction) and the sound quality deteriorates unlike the spectral subtraction method. (In the case of excessive subtraction). Further, since no spectral subtraction is performed, it is not necessary to estimate a noise spectrum to be subtracted.

(2)上記(1)の電子カメラ1において、音響信号がフォーカシングレンズの駆動中に取得されたか否かを判定するCPU16をさらに備え、CPU16は、上記肯定判定された音響信号に対応する周波数特徴スペクトルを対象に抑圧処理を行うようにしたので、可動部駆動に起因する音響信号の雑音を適切に低減することができる。 (2) The electronic camera 1 of (1) further includes a CPU 16 that determines whether or not an acoustic signal has been acquired during driving of the focusing lens, and the CPU 16 has a frequency characteristic corresponding to the affirmatively determined acoustic signal. Since the suppression process is performed on the spectrum, it is possible to appropriately reduce the noise of the acoustic signal due to the driving of the movable part.

(3)上記(2)の電子カメラ1において、CPU16がフーリエ変換した周波数特徴スペクトルに基づいて、環境音に応じた環境音閾値スペクトルを生成するCPU16をさらに備える。この場合のCPU16は、フーリエ変換した周波数特徴スペクトルのうち、環境音に応じた環境音閾値スペクトルより大となる周波数成分の信号を雑音低減対象とするので、雑音が許容範囲の場合には抑圧処理を制限できる。このため、雑音低減対象とする周波数成分の信号を常に抑圧する場合に比べて音質劣化を抑えることができる。 (3) The electronic camera 1 of the above (2) further includes a CPU 16 that generates an environmental sound threshold spectrum corresponding to the environmental sound based on the frequency characteristic spectrum Fourier-transformed by the CPU 16. In this case, the CPU 16 sets a signal having a frequency component that is larger than the environmental sound threshold spectrum corresponding to the environmental sound, among the frequency characteristic spectrum obtained by Fourier transform, as a noise reduction target. Can be limited. For this reason, it is possible to suppress deterioration in sound quality as compared with the case where the signal of the frequency component targeted for noise reduction is always suppressed.

(4)上記(3)の電子カメラ1において、CPU16は、異なるフレームでそれぞれフーリエ変換された複数フレームの周波数特徴スペクトルの各周波数成分ごとに最大値を抽出し、抽出した各周波数成分の信号で構成される周波数特徴スペクトルを環境音に応じた環境音閾値スペクトルとしたので、雑音が許容範囲か否かの判断基準を適切に求めることができる。 (4) In the electronic camera 1 of the above (3), the CPU 16 extracts the maximum value for each frequency component of the frequency feature spectrum of a plurality of frames each Fourier-transformed in different frames, and uses the extracted signal of each frequency component. Since the configured frequency feature spectrum is the environmental sound threshold spectrum corresponding to the environmental sound, it is possible to appropriately determine a criterion for determining whether or not the noise is within the allowable range.

(5)上記電子カメラ1において、CPU16は、音響信号がフォーカシングレンズの駆動中に取得されたか否かの判定で否定判定された音響信号に対応する周波数特徴スペクトルに基づいて環境音に応じた環境音閾値スペクトルを生成したので、フォーカシングレンズを非駆動中の環境音に応じた環境音閾値スペクトルを生成する。このため、雑音が許容範囲か否かの判断基準を適切に求めることができる。 (5) In the electronic camera 1, the CPU 16 determines the environment according to the environmental sound based on the frequency characteristic spectrum corresponding to the acoustic signal that is negatively determined in the determination as to whether or not the acoustic signal has been acquired during driving of the focusing lens. Since the sound threshold spectrum is generated, an environmental sound threshold spectrum corresponding to the environmental sound when the focusing lens is not driven is generated. For this reason, it is possible to appropriately determine a criterion for determining whether or not the noise is within an allowable range.

(6)上記電子カメラ1において、CPU16がフーリエ変換した周波数特徴スペクトルのフレーム内の周波数成分の信号値の総和が第2所定値より大か否かを判定するCPU16をさらに備える。CPU16は、上記信号値の総和が第2所定値より小であることが判定された周波数特徴スペクトルに基づいて環境音に応じた環境音閾値スペクトルを生成する。このため、雑音が許容範囲か否かの判断基準を適切に求めることができる。 (6) The electronic camera 1 further includes a CPU 16 that determines whether the sum of the signal values of the frequency components in the frame of the frequency feature spectrum Fourier-transformed by the CPU 16 is greater than a second predetermined value. The CPU 16 generates an environmental sound threshold spectrum corresponding to the environmental sound based on the frequency feature spectrum determined that the sum of the signal values is smaller than the second predetermined value. For this reason, it is possible to appropriately determine a criterion for determining whether or not the noise is within an allowable range.

(7)上記電子カメラ1において、音響信号に音声が含まれるか否かを判定するCPU16をさらに備える。CPU16は、音声を含まないことが判定された音響信号に対応する周波数特徴スペクトルに基づいて環境音に応じた環境音閾値スペクトルを生成する。このため、雑音が許容範囲か否かの判断基準を適切に求めることができる。 (7) The electronic camera 1 further includes a CPU 16 that determines whether sound is included in the acoustic signal. CPU16 produces | generates the environmental sound threshold spectrum according to environmental sound based on the frequency feature spectrum corresponding to the acoustic signal determined not to contain an audio | voice. For this reason, it is possible to appropriately determine a criterion for determining whether or not the noise is within an allowable range.

(8)上記電子カメラ1において、CPU16は、音声を含まないことが判定された音響信号に対応する周波数特徴スペクトルを対象に抑圧処理を行うようにしたので、音声情報を抑圧しないように制御することができる。 (8) In the electronic camera 1, since the CPU 16 performs the suppression process on the frequency feature spectrum corresponding to the acoustic signal determined not to include sound, the CPU 16 performs control so as not to suppress the sound information. be able to.

(9)上記電子カメラ1において、CPU16がフーリエ変換した連続するフレーム間の周波数特徴スペクトルの変化が第3所定値より大か否かを判定するCPU16をさらに備える。CPU16は、連続するフレーム間の周波数特徴スペクトルの変化が第3所定値より小であることが判定された周波数特徴スペクトルを対象に抑圧処理を行うようにしたので、適切に雑音低減処理をすることができる。 (9) The electronic camera 1 further includes a CPU 16 that determines whether or not a change in frequency feature spectrum between successive frames subjected to Fourier transform by the CPU 16 is greater than a third predetermined value. Since the CPU 16 performs the suppression process on the frequency feature spectrum for which it is determined that the change in the frequency feature spectrum between successive frames is smaller than the third predetermined value, the noise reduction process is appropriately performed. Can do.

(変形例1)
音響データファイルを記憶媒体30に記録する直前に図2に例示する雑音低減処理プログラムを起動する例を説明したが、音響データの取得と雑音低減処理とをリアルタイムに行うように構成してもよい。この場合のCPU16は、1フレームごとに雑音低減処理を行い、該雑音低減処理後の音響データを逐次記録媒体30に記録させることができる。
(Modification 1)
Although the example in which the noise reduction processing program illustrated in FIG. 2 is started immediately before recording the acoustic data file in the storage medium 30 has been described, the acquisition of the acoustic data and the noise reduction processing may be performed in real time. . In this case, the CPU 16 can perform noise reduction processing for each frame and sequentially record the acoustic data after the noise reduction processing on the recording medium 30.

(変形例2)
対象フレームの周波数特徴スペクトルを用いて環境音閾値を決定、更新する(ステップS80)場合に、以下のように決定、更新してもよい。変形例2のCPU16は、たとえば、音響データを構成する第1フレームから対象フレームまでの各フレームの周波数特徴スペクトルの総和(すなわち、上記約2000の周波数成分ごとの振幅値の総和)が最小となるフレームを選ぶ。そして、当該フレームについての上記約2000の周波数成分からなる周波数特徴スペクトルに第4所定値を乗じた周波数特徴スペクトルを従前の環境音閾値スペクトルと置換することによって環境音閾値スペクトルを更新する。
(Modification 2)
When the environmental sound threshold is determined and updated using the frequency feature spectrum of the target frame (step S80), it may be determined and updated as follows. For example, the CPU 16 of Modification 2 minimizes the sum of the frequency feature spectra of each frame from the first frame constituting the acoustic data to the target frame (that is, the sum of the amplitude values for each of the approximately 2000 frequency components). Select a frame. Then, the environmental sound threshold spectrum is updated by substituting the frequency characteristic spectrum obtained by multiplying the frequency characteristic spectrum composed of about 2000 frequency components for the frame by the fourth predetermined value with the previous environmental sound threshold spectrum.

変形例2によれば、突発的な音を含まない可能性が高いフレームの音響データに基づいて環境音閾値スペクトルの決定、更新をするので、環境音閾値スペクトルが特定の周波数成分で大きな値を有することを避けられる。このため、特定の周波数成分において雑音低減が不十分となってしまうおそれを低減できる。   According to the modified example 2, since the environmental sound threshold spectrum is determined and updated based on the acoustic data of the frame that is highly likely not to include sudden sound, the environmental sound threshold spectrum has a large value at a specific frequency component. You can avoid having. For this reason, it is possible to reduce the possibility of noise reduction being insufficient for a specific frequency component.

(変形例3)
対象フレームの周波数特徴スペクトルを用いて環境音閾値を決定、更新する(ステップS80)場合に、以下のように決定、更新してもよい。変形例3のCPU16は、たとえば、音響データを構成する第1フレームから対象フレームまでの各フレームの周波数特徴スペクトルを用いて、上記約2000の周波数成分ごとに振幅値の平均値を算出する。そして、各周波数成分の平均値からなる周波数特徴スペクトルに第5所定値を乗じた周波数特徴スペクトルを従前の環境音閾値スペクトルと置換することによって環境音閾値スペクトルを更新する。
(Modification 3)
When the environmental sound threshold is determined and updated using the frequency feature spectrum of the target frame (step S80), it may be determined and updated as follows. CPU16 of the modification 3 calculates the average value of an amplitude value for every said about 2000 frequency component, for example using the frequency characteristic spectrum of each flame | frame from the 1st frame which comprises acoustic data to an object frame. Then, the environmental sound threshold spectrum is updated by replacing the frequency characteristic spectrum obtained by multiplying the frequency characteristic spectrum formed by the average value of each frequency component by the fifth predetermined value with the previous environmental sound threshold spectrum.

変形例3によれば、あるフレームに突発的に含まれる音の成分を平準化するように環境音閾値スペクトルの決定、更新をするので、環境音閾値スペクトルが特定の周波数成分で大きな値を有することを避けられる。このため、特定の周波数成分において雑音低減が不十分となってしまうおそれを低減できる。   According to the third modification, the environmental sound threshold spectrum is determined and updated so that the sound component suddenly included in a certain frame is leveled. Therefore, the environmental sound threshold spectrum has a large value at a specific frequency component. You can avoid that. For this reason, it is possible to reduce the possibility of noise reduction being insufficient for a specific frequency component.

(変形例4)
上述した音響データに音声が含まれているか否かの判定(ステップS30)において、音声信号の自己相関関数のピーク値を用いて検出してもよい。変形例4のCPU16は、音声信号の基本周波数(たとえば50Hz〜400Hz)の1周期に相当する時間遅れ領域(サンプリング周波数が44.1kHzの場合、約880Point〜約110Point)における自己相関関数のピーク値を求める。そして、CPU16は、ピーク値が所定の判定閾値より大きい場合に音声が含まれていると判定する。ピーク値が所定の判定閾値より小さい場合には、音声が含まれていないと判定する。
(Modification 4)
In the above-described determination of whether or not sound is included in the acoustic data (step S30), detection may be performed using the peak value of the autocorrelation function of the sound signal. The CPU 16 of the modification 4 uses the peak value of the autocorrelation function in a time delay region (about 880 points to about 110 points when the sampling frequency is 44.1 kHz) corresponding to one period of the fundamental frequency (for example, 50 Hz to 400 Hz) of the audio signal. Ask for. And CPU16 determines with the audio | voice being included when a peak value is larger than a predetermined determination threshold value. When the peak value is smaller than a predetermined determination threshold, it is determined that no sound is included.

(変形例5)
あるいは、音声スペクトル波形(横軸が信号周波数、縦軸が信号の振幅)の包絡線を用いて検出してもよい。変形例5のCPU16は、線形予測分析等によって音声スペクトル波形の包絡線を求める。そして、CPU16は、包絡線の時間変化量が所定の判定閾値より大きい場合に音声が含まれていると判定する。包絡線の時間変化量が所定の判定閾値より小さい場合には、音声が含まれていないと判定する。
(Modification 5)
Or you may detect using the envelope of a speech spectrum waveform (a horizontal axis is a signal frequency and a vertical axis | shaft is an amplitude of a signal). The CPU 16 of the modified example 5 obtains the envelope of the speech spectrum waveform by linear prediction analysis or the like. And CPU16 determines with the audio | voice being included, when the amount of time change of an envelope is larger than a predetermined determination threshold value. When the amount of time variation of the envelope is smaller than a predetermined determination threshold, it is determined that no sound is included.

(変形例6)
上述した実施形態では、電子カメラ1に雑音低減用の信号処理装置を搭載する例を説明したが、信号処理装置をパーソナルコンピュータによって構成するようにしてもよい。図2に例示したフローチャートに基づく処理を行うプログラムを図3に示すコンピュータ装置100に実行させることにより、信号処理装置を構成する。プログラムをパーソナルコンピュータ100に取込んで使用する場合には、パーソナルコンピュータ100のデータストレージ装置にプログラムをローディングした上で、当該プログラムを実行させることによって信号処理装置として使用する。
(Modification 6)
In the embodiment described above, an example in which a signal processing device for noise reduction is mounted on the electronic camera 1 has been described. However, the signal processing device may be configured by a personal computer. A signal processing apparatus is configured by causing the computer apparatus 100 illustrated in FIG. 3 to execute a program that performs processing based on the flowchart illustrated in FIG. When the program is used by being loaded into the personal computer 100, the program is loaded into the data storage device of the personal computer 100 and then used as a signal processing device by executing the program.

パーソナルコンピュータ100に対するプログラムのローディングは、プログラムを格納したCD−ROMなどの記憶媒体104をパーソナルコンピュータ100にセットして行ってもよいし、ネットワークなどの通信回線101を経由する方法でパーソナルコンピュータ100へローディングしてもよい。通信回線101を経由する場合は、通信回線101に接続されたサーバー(コンピュータ)102のハードディスク装置103などにプログラムを格納しておく。プログラムは、記憶媒体104や通信回線101を介する提供など、種々の形態のコンピュータプログラム製品として供給することができる。   The loading of the program to the personal computer 100 may be performed by setting a storage medium 104 such as a CD-ROM storing the program in the personal computer 100, or to the personal computer 100 by a method via the communication line 101 such as a network. You may load. When passing through the communication line 101, the program is stored in the hard disk device 103 of the server (computer) 102 connected to the communication line 101. The program can be supplied as various forms of computer program products such as provision via the storage medium 104 or the communication line 101.

以上説明した変形例6によれば、上記実施形態と同様の作用効果が得られる。なお、パーソナルコンピュータによって構成する他にも、再生機能を備えるデジタルフォトフレームやプロジェクタ等にも上述した雑音低減処理をさせるように構成して構わない。   According to the modified example 6 described above, the same function and effect as the above embodiment can be obtained. In addition to the configuration using a personal computer, a digital photo frame or a projector having a playback function may be configured to perform the above-described noise reduction processing.

以上の説明はあくまで一例であり、上記の実施形態の構成に何ら限定されるものではない。   The above description is merely an example, and is not limited to the configuration of the above embodiment.

1…電子カメラ
14…RAM
15…LCDモニタ
16…CPU
18…カードインターフェース
20…操作部材
21…マイク
22…音響処理回路
23…レンズ駆動機構
30…記憶媒体
100…パーソナルコンピュータ
1 ... Electronic camera 14 ... RAM
15 ... LCD monitor 16 ... CPU
18 ... Card interface 20 ... Operation member 21 ... Microphone 22 ... Acoustic processing circuit 23 ... Lens drive mechanism 30 ... Storage medium 100 ... Personal computer

Claims (13)

音響信号を所定フレームごとにスペクトル信号に変換する変換手段と、
前記変換手段によって変換されたスペクトル信号から、雑音低減対象とする周波数成分の信号を略0にするスペクトル抑圧手段と、
前記スペクトル抑圧後のスペクトル信号を音響信号に逆変換する逆変換手段と、
を備えることを特徴とする信号処理装置。
Conversion means for converting an acoustic signal into a spectrum signal for each predetermined frame;
Spectrum suppression means for reducing the signal of the frequency component to be noise-reduced from the spectrum signal converted by the conversion means to substantially zero;
Inverse conversion means for inversely converting the spectrum signal after spectrum suppression into an acoustic signal;
A signal processing apparatus comprising:
請求項1に記載の信号処理装置において、
前記音響信号が雑音の発生タイミングで取得されたか否かを判定する取得タイミング判定手段をさらに備え、
前記スペクトル抑圧手段は、前記取得タイミング判定手段によって肯定判定された音響信号に対応するスペクトル信号を対象に前記スペクトル抑圧を行うことを特徴とする信号処理装置。
The signal processing device according to claim 1,
It further comprises an acquisition timing determination means for determining whether or not the acoustic signal is acquired at a noise generation timing,
The signal processing apparatus according to claim 1, wherein the spectrum suppression unit performs the spectrum suppression on a spectrum signal corresponding to the acoustic signal that has been affirmed by the acquisition timing determination unit.
請求項2に記載の信号処理装置において、
前記変換手段が変換したスペクトル信号に基づいて、環境音に応じたスペクトル信号を生成する環境音閾値生成手段をさらに備え、
前記スペクトル抑圧手段は、前記変換手段が変換したスペクトル信号のうち、前記環境音に応じたスペクトル信号より大となる周波数成分の信号を前記雑音低減対象とすることを特徴とする信号処理装置。
The signal processing device according to claim 2,
Based on the spectrum signal converted by the converting means, further comprising an environmental sound threshold value generating means for generating a spectral signal corresponding to the environmental sound,
The signal processing apparatus according to claim 1, wherein the spectrum suppression unit sets a signal having a frequency component that is larger than a spectrum signal corresponding to the environmental sound, among the spectrum signals converted by the conversion unit, as the noise reduction target.
請求項3に記載の信号処理装置において、
前記環境音閾値生成手段は、前記変換手段によって異なるフレームでそれぞれ変換された複数フレームのスペクトル信号の各周波数成分ごとに最大値を抽出し、抽出した各周波数成分の信号で構成されるスペクトル信号を前記環境音に応じたスペクトル信号とすることを特徴とする信号処理装置。
The signal processing device according to claim 3.
The environmental sound threshold generation unit extracts a maximum value for each frequency component of a plurality of frames of spectrum signals converted in different frames by the conversion unit, and extracts a spectrum signal composed of the extracted signals of each frequency component. A signal processing apparatus characterized in that it is a spectrum signal corresponding to the environmental sound.
請求項3に記載の信号処理装置において、
前記環境音閾値生成手段は、前記変換手段によって異なるフレームでそれぞれ変換された複数フレームのスペクトル信号のうち、フレーム内の周波数成分の信号値の総和が最小となるフレームのスペクトル信号に所定値を乗じて前記環境音に応じたスペクトル信号とすることを特徴とする信号処理装置。
The signal processing device according to claim 3.
The environmental sound threshold generation unit multiplies a predetermined value by a spectral signal of a frame in which the sum of signal values of frequency components in the frame is minimum among the spectral signals of a plurality of frames converted in different frames by the conversion unit. A signal processing apparatus characterized in that the spectrum signal corresponds to the environmental sound.
請求項3に記載の信号処理装置において、
前記環境音閾値生成手段は、前記変換手段によって異なるフレームでそれぞれ変換された複数フレームのスペクトル信号の各周波数成分ごとに平均値を算出し、各平均値に所定値を乗じた信号で構成されるスペクトル信号を前記環境音に応じたスペクトル信号とすることを特徴とする信号処理装置。
The signal processing device according to claim 3.
The environmental sound threshold generation unit is configured by a signal obtained by calculating an average value for each frequency component of a plurality of frames of spectrum signals converted in different frames by the conversion unit, and multiplying each average value by a predetermined value. A signal processing apparatus characterized in that a spectrum signal is a spectrum signal corresponding to the environmental sound.
請求項3〜6のいずれか一項に記載の信号処理装置において、
前記環境音閾値生成手段は、前記取得タイミング判定手段によって否定判定された音響信号に対応するスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
In the signal processing device according to any one of claims 3 to 6,
The environmental sound threshold generation unit generates a spectral signal corresponding to the environmental sound based on a spectral signal corresponding to the acoustic signal that is negatively determined by the acquisition timing determination unit.
請求項3〜7のいずれか一項に記載の信号処理装置において、
前記変換手段が変換したスペクトル信号のフレーム内の周波数成分の信号値の総和が第1の判定閾値より大か否かを判定する総和判定手段をさらに備え、
前記環境音閾値生成手段は、前記総和判定手段によって否定判定されたスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
In the signal processing device according to any one of claims 3 to 7,
A sum total determining means for determining whether or not a sum of signal values of frequency components in a frame of the spectrum signal converted by the converting means is larger than a first determination threshold;
The signal processing apparatus according to claim 1, wherein the environmental sound threshold generation unit generates a spectral signal corresponding to the environmental sound based on the spectral signal that is negatively determined by the sum total determination unit.
請求項3〜8のいずれか一項に記載の信号処理装置において、
前記音響信号に音声が含まれるか否かを判定する音声判定手段をさらに備え、
前記環境音閾値生成手段は、前記音声判定手段によって否定判定された音響信号に対応するスペクトル信号に基づいて前記環境音に応じたスペクトル信号を生成することを特徴とする信号処理装置。
In the signal processing device according to any one of claims 3 to 8,
Voice determination means for determining whether or not sound is included in the acoustic signal;
The environmental sound threshold generation unit generates a spectral signal corresponding to the environmental sound based on a spectral signal corresponding to the acoustic signal that is negatively determined by the voice determination unit.
請求項9に記載の信号処理装置において、
前記スペクトル抑圧手段は、前記音声判定手段によって否定判定された音響信号に対応するスペクトル信号を対象に前記スペクトル抑圧を行うことを特徴とする信号処理装置。
The signal processing device according to claim 9,
The signal processing apparatus, wherein the spectrum suppression unit performs the spectrum suppression on a spectrum signal corresponding to an acoustic signal that is negatively determined by the voice determination unit.
請求項10に記載の信号処理装置において、
前記変換手段が変換した連続するフレーム間のスペクトル信号の変化が第2の判定閾値より大か否かを判定する変化判定手段をさらに備え、
前記スペクトル抑圧手段は、前記変化判定手段によって否定判定されたスペクトル信号を対象に前記スペクトル抑圧を行うことを特徴とする信号処理装置。
The signal processing device according to claim 10,
A change determination means for determining whether or not a change in the spectrum signal between successive frames converted by the conversion means is greater than a second determination threshold;
The signal processing apparatus, wherein the spectrum suppression unit performs the spectrum suppression on a spectrum signal that is negatively determined by the change determination unit.
請求項1〜11のいずれか一項に記載の信号処理装置を搭載することを特徴とするカメラ。   A camera comprising the signal processing device according to claim 1. 音響信号を読み出す第1処理と、
前記音響信号を所定フレームごとにスペクトル信号に変換する第2処理と、
前記変換されたスペクトル信号から、雑音低減対象とする周波数成分の信号を略0にする第3処理と、
前記第3処理後のスペクトル信号を音響信号に逆変換する第4処理と、
をコンピュータに実行させることを特徴とする信号処理プログラム。
A first process for reading an acoustic signal;
A second process for converting the acoustic signal into a spectrum signal for each predetermined frame;
A third process for setting the frequency component signal to be reduced in noise from the converted spectrum signal to substantially zero;
A fourth process for inversely converting the spectral signal after the third process into an acoustic signal;
A signal processing program for causing a computer to execute.
JP2012025095A 2012-02-08 2012-02-08 Signal processor, camera and signal processing program Pending JP2013161041A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012025095A JP2013161041A (en) 2012-02-08 2012-02-08 Signal processor, camera and signal processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012025095A JP2013161041A (en) 2012-02-08 2012-02-08 Signal processor, camera and signal processing program

Publications (1)

Publication Number Publication Date
JP2013161041A true JP2013161041A (en) 2013-08-19

Family

ID=49173294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012025095A Pending JP2013161041A (en) 2012-02-08 2012-02-08 Signal processor, camera and signal processing program

Country Status (1)

Country Link
JP (1) JP2013161041A (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208393A (en) * 1993-01-12 1994-07-26 Clarion Co Ltd Voice recognizing device
JP2005107448A (en) * 2003-10-02 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> Noise reduction processing method, and device, program, and recording medium for implementing same method
JP2006279185A (en) * 2005-03-28 2006-10-12 Casio Comput Co Ltd Imaging apparatus, and sound recording method and program
JP2008216721A (en) * 2007-03-06 2008-09-18 Nec Corp Noise suppression method, device, and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208393A (en) * 1993-01-12 1994-07-26 Clarion Co Ltd Voice recognizing device
JP2005107448A (en) * 2003-10-02 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> Noise reduction processing method, and device, program, and recording medium for implementing same method
JP2006279185A (en) * 2005-03-28 2006-10-12 Casio Comput Co Ltd Imaging apparatus, and sound recording method and program
JP2008216721A (en) * 2007-03-06 2008-09-18 Nec Corp Noise suppression method, device, and program

Similar Documents

Publication Publication Date Title
JP2006270591A (en) Electronic camera, data reproducing device and program
US8698911B2 (en) Sound recording device, imaging device, photographing device, optical device, and program
US20150271439A1 (en) Signal processing device, imaging device, and program
JP5963430B2 (en) Imaging apparatus, audio processing apparatus, and control method thereof
KR101457392B1 (en) Imaging apparatus and audio processing apparatus
JP2011095567A (en) Imaging device
US9734840B2 (en) Signal processing device, imaging apparatus, and signal-processing program
JP2011114465A (en) Voice processing apparatus and electronic camera
JP2010154306A (en) Device, program and method for imaging control
JP5932399B2 (en) Imaging apparatus and sound processing apparatus
US8600070B2 (en) Signal processing apparatus and imaging apparatus
KR101399986B1 (en) Audi0 signal processing apparatus
JP2013178456A (en) Signal processor, camera and signal processing program
JP5158054B2 (en) Recording device, imaging device, and program
JP2013161041A (en) Signal processor, camera and signal processing program
JP2012185445A (en) Signal processor, imaging apparatus and program
US9294835B2 (en) Image capturing apparatus, signal processing apparatus and method
JP6902961B2 (en) Speech processing device and its control method
JP5018860B2 (en) Signal processing apparatus and imaging apparatus
JP5736839B2 (en) Signal processing apparatus, imaging apparatus, and program
JP5473786B2 (en) Audio signal processing apparatus and control method thereof
JP7166903B2 (en) IMAGE PROCESSING DEVICE, CONTROL METHOD THEREOF, AND PROGRAM
JP2012118316A (en) Signal processor, imaging apparatus, and signal processing program
JP5246134B2 (en) Signal processing apparatus and imaging apparatus
JP6521752B2 (en) Image processing apparatus and control method therefor, imaging apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160229

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161011