JP2017229086A - Sound processing device and sound processing program - Google Patents

Sound processing device and sound processing program Download PDF

Info

Publication number
JP2017229086A
JP2017229086A JP2017160246A JP2017160246A JP2017229086A JP 2017229086 A JP2017229086 A JP 2017229086A JP 2017160246 A JP2017160246 A JP 2017160246A JP 2017160246 A JP2017160246 A JP 2017160246A JP 2017229086 A JP2017229086 A JP 2017229086A
Authority
JP
Japan
Prior art keywords
sound
sound data
processing
ratio
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017160246A
Other languages
Japanese (ja)
Other versions
JP6369612B2 (en
Inventor
岡崎 光宏
Mitsuhiro Okazaki
光宏 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Publication of JP2017229086A publication Critical patent/JP2017229086A/en
Application granted granted Critical
Publication of JP6369612B2 publication Critical patent/JP6369612B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a sound processing device and a sound processing program capable of suppressing a displacement of a sound image due to noise reduction processing.SOLUTION: The sound processing device includes: a calculation unit for calculating a reference relation which is a relation between a first sound collected by a first sound collecting unit and a second sound collected by a second sound collecting unit of sounds collected by a plurality of sound collecting units; and a processing unit for processing the sound collected by the plurality of sound collecting units so that the relation between the first sound and the second sound is included in a predetermined range including the reference relation calculated by the calculation unit.SELECTED DRAWING: Figure 2

Description

本発明は、音処理装置および音処理プログラムに関するものである。   The present invention relates to a sound processing device and a sound processing program.

複数の集音装置を備えたステレオ録音が可能な撮像装置として、動画撮影時にオートフォーカス(以後、「AF」と略記する)等の駆動音の発生に合わせてノイズ低減処理を行うものがある。
ステレオ等の複数チャンネルの有する音信号の雑音を抑制する雑音抑制装置においては、ステレオ成分の雑音を抑制する技術が知られている(特許文献1等参照)。
2. Description of the Related Art As an imaging apparatus including a plurality of sound collectors capable of stereo recording, there is an apparatus that performs noise reduction processing in accordance with the generation of driving sound such as autofocus (hereinafter abbreviated as “AF”) during moving image shooting.
In a noise suppression apparatus that suppresses noise of sound signals of a plurality of channels such as stereo, a technique for suppressing noise of a stereo component is known (see Patent Document 1 and the like).

特開2008−283385号公報JP 2008-283385 A

ところで、ステレオ録音時において、駆動音の発生に合わせてノイズ低減処理を行うと、ノイズ低減処理に起因して音信号のバランスが変化してしまうことがあり、その結果、音像が変位し、再生時に違和感を生じさせるという問題がある。   By the way, during stereo recording, if noise reduction processing is performed in accordance with the generation of driving sound, the balance of the sound signal may change due to the noise reduction processing. As a result, the sound image is displaced and reproduced. There is a problem that it sometimes causes discomfort.

本発明の課題は、ノイズ低減処理に伴う音像の変位を抑制できる音処理装置および音処理プログラムを提供することである。   The subject of this invention is providing the sound processing apparatus and sound processing program which can suppress the displacement of the sound image accompanying a noise reduction process.

本発明の音処理装置は、第1音データを出力する第1集音部と第2音データを出力する第2集音部とを有する集音部と、前記第1音データと前記第2音データとの、複数の周波数領域における振幅の比を算出する算出部と、前記第1音データと前記第2音データとのうち少なくとも一方から、一部の音データを除去する除去部と、少なくとも一方から前記一部の音データが除去された前記第1音データと前記第2音データの前記周波数領域における振幅の比を、除去前の前記第1音データと前記第2音データとの前記複数の周波数領域における振幅の比に近づける処理部とを備える構成とした。
本発明のプログラムは、第1集音部による第1音データと、第2集音部による第2音データとを入力する処理と、前記第1音データと前記第2音データとの、複数の周波数領域における振幅の比を算出する処理と、前記第1音データと前記第2音データとのうち少なくとも一方から、一部の音データを除去する処理と、少なくとも一方から前記一部の音データが除去された前記第1音データと前記第2音データの前記周波数領域における振幅の比を、除去前の前記第1音データと前記第2音データとの前記複数の周波数領域における振幅の比に近づける処理とをコンピュータに実行させる構成とした。
The sound processing apparatus of the present invention includes a sound collecting unit having a first sound collecting unit that outputs first sound data and a second sound collecting unit that outputs second sound data, the first sound data, and the second sound data. A calculation unit that calculates a ratio of amplitudes in a plurality of frequency regions to sound data; and a removal unit that removes part of sound data from at least one of the first sound data and the second sound data; The ratio of the amplitude in the frequency domain of the first sound data and the second sound data from which the partial sound data has been removed from at least one of the first sound data and the second sound data before removal is determined. And a processing unit that approximates the amplitude ratio in the plurality of frequency regions.
The program of the present invention includes a plurality of processes of inputting the first sound data by the first sound collection unit and the second sound data by the second sound collection unit, and the first sound data and the second sound data. Calculating a ratio of amplitudes in the frequency domain, a process of removing part of sound data from at least one of the first sound data and the second sound data, and the part of sound from at least one of the first sound data and the second sound data The ratio of the amplitude in the frequency domain of the first sound data and the second sound data from which the data has been removed is the amplitude ratio in the frequency domain of the first sound data and the second sound data before the removal. The computer is configured to execute the process of approaching the ratio.

本発明によれば、ノイズ低減処理に伴う音像の変位を抑制できる音処理装置および音処理プログラムを提供できる。   ADVANTAGE OF THE INVENTION According to this invention, the sound processing apparatus and sound processing program which can suppress the displacement of the sound image accompanying a noise reduction process can be provided.

本発明における音処理装置の一実施形態であるカメラを示し、(a)はそのブロック構成図、(b)は概念正面図である。The camera which is one Embodiment of the sound processing apparatus in this invention is shown, (a) is the block block diagram, (b) is a conceptual front view. 音情報処理部におけるノイズ低減処理とその補正の説明図である。It is explanatory drawing of the noise reduction process in the sound information processing part, and its correction | amendment. 音情報処理部におけるノイズ低減処理と補正のフローチャートである。It is a flowchart of the noise reduction process and correction | amendment in a sound information processing part. 音像変位を説明する図である。It is a figure explaining a sound image displacement. 第2実施形態にかかる音情報処理部におけるノイズ低減処理と補正のフローチャートである。It is a flowchart of the noise reduction process and correction | amendment in the sound information processing part concerning 2nd Embodiment. ノイズ低減処理部分の前後の信号比変化と対応させた補正を説明する図である。It is a figure explaining the correction | amendment matched with the signal ratio change before and behind a noise reduction process part.

以下、図面等を参照して、本発明の実施形態について説明する。
(第1実施形態)
図1は、本発明における音処理装置の一実施形態であるカメラ1を示し、図1(a)はそのブロック構成図、図1(b)はカメラ1の概念正面図である。
図1(a)に示すように、カメラ1は、カメラ本体10と、レンズ鏡筒20とにより構成されている。カメラ1は、自動的に合焦するオートフォーカス(以下AFと略記する)機能を備えている。また、カメラ1は、静止画と動画の何れも撮影可能であって、動画撮影時には画像と同時に音をステレオで記録可能である。
Embodiments of the present invention will be described below with reference to the drawings.
(First embodiment)
FIG. 1 shows a camera 1 which is an embodiment of a sound processing apparatus according to the present invention. FIG. 1 (a) is a block diagram of the camera 1 and FIG. 1 (b) is a conceptual front view of the camera 1.
As shown in FIG. 1A, the camera 1 includes a camera body 10 and a lens barrel 20. The camera 1 has an autofocus (hereinafter abbreviated as AF) function for automatically focusing. In addition, the camera 1 can shoot both still images and moving images, and can record sound in stereo at the same time as images during moving image shooting.

カメラ本体10は、撮像素子11と、画像処理部12と、ステレオ集音装置13と、音情報処理部14と、記憶部15と、制御部16と、出力部18と、入力部19とを備えている。
撮像素子11は、CCD等の光電変換素子により構成され、レンズ鏡筒20の結像光学系によって結像された被写体像光を電気信号に変換する。
画像処理部12は、撮像素子11から出力されるアナログの画像情報をA/D変換すると共に画像処理して画像データを生成する。
The camera body 10 includes an image sensor 11, an image processing unit 12, a stereo sound collecting device 13, a sound information processing unit 14, a storage unit 15, a control unit 16, an output unit 18, and an input unit 19. I have.
The image sensor 11 is composed of a photoelectric conversion element such as a CCD, and converts the subject image light imaged by the imaging optical system of the lens barrel 20 into an electrical signal.
The image processing unit 12 A / D converts analog image information output from the image sensor 11 and performs image processing to generate image data.

ステレオ集音装置13は、図1(b)に示すように、左右一対のマイク(左マイク13L,右マイク13R)を備えている。左マイク13Lと右マイク13Rとは、カメラ1を横位置で構えた状態においてレンズ鏡筒20の中心を通る鉛直線を挟む略対称位置に配置されている。各マイク13L,13Rは、それぞれ外部の音を集音してアナログ信号として検出し、音情報処理部14に出力する。
音情報処理部14は、ステレオ集音装置13から入力される音信号をA/D変換してデジタル信号とすると共にノイズ低減処理を行う。音情報処理部14は、ノイズ低減処理係る機能部として、ノイズ低減処理部14Aと、補正部14Bと、を備えている。これらについては、後に詳述する。
As shown in FIG. 1B, the stereo sound collecting device 13 includes a pair of left and right microphones (a left microphone 13L and a right microphone 13R). The left microphone 13L and the right microphone 13R are disposed at substantially symmetrical positions with a vertical line passing through the center of the lens barrel 20 in a state where the camera 1 is held in the horizontal position. The microphones 13L and 13R collect external sounds, detect them as analog signals, and output them to the sound information processing unit 14.
The sound information processing unit 14 A / D converts the sound signal input from the stereo sound collecting device 13 into a digital signal and performs noise reduction processing. The sound information processing unit 14 includes a noise reduction processing unit 14A and a correction unit 14B as functional units related to noise reduction processing. These will be described in detail later.

記憶部15は、画像処理部12が出力する画像データおよび音情報処理部14が出力する音データを記憶する。記憶部15は、バッファーやカメラに内蔵されたメモリでもよいし、またSDカードやHDD等の外部の記憶媒体でもよい。   The storage unit 15 stores the image data output from the image processing unit 12 and the sound data output from the sound information processing unit 14. The storage unit 15 may be a buffer or a memory built in the camera, or may be an external storage medium such as an SD card or HDD.

出力部18は、記憶部15に記憶された画像データ及び音データを出力する。出力部18は、外部機器へ音情報(電気信号)を出力するためのインターフェース等である。外部機器とは、これに限定されないが、例えばPC、外部スピーカ、携帯電話等である。ただし、これに限定されず、出力部18は、カメラ1に設けられた背面液晶及びスピーカであってもよい。なお、出力部18がスピーカの場合、出力部18は音情報(電気信号)を音に変換する変換部も備える。   The output unit 18 outputs image data and sound data stored in the storage unit 15. The output unit 18 is an interface for outputting sound information (electric signal) to an external device. Examples of the external device include, but are not limited to, a PC, an external speaker, and a mobile phone. However, the present invention is not limited to this, and the output unit 18 may be a rear liquid crystal and a speaker provided in the camera 1. When the output unit 18 is a speaker, the output unit 18 also includes a conversion unit that converts sound information (electric signal) into sound.

入力部19は、外部機器からデータを入力するためのインターフェース等である。
外部機器とデータのやり取り(通信)をする際には、出力部18と入力部19は別体となっていなくてもよく、入力部19と出力部18が一体となっているような構成であってもよい。
なお、外部機器とは、これに限定されないが、例えばPC、外部マイク、携帯電話等である。
The input unit 19 is an interface for inputting data from an external device.
When exchanging (communication) data with an external device, the output unit 18 and the input unit 19 do not have to be separated, and the input unit 19 and the output unit 18 are integrated. There may be.
The external device is not limited to this, but is, for example, a PC, an external microphone, a mobile phone, or the like.

制御部16は、CPU等を備えて構成され、設定された撮像条件(例えば、絞り値、露出値等)に応じて、レンズ鏡筒20の後述する各構成要素を含めたカメラ1の各構成要素を統括制御する。たとえば、制御部16は、後述するレンズ鏡筒20におけるAF駆動用モータ22を駆動する駆動制御信号を生成し、レンズ制御部24に出力する。   The control unit 16 includes a CPU and the like, and each configuration of the camera 1 including each component to be described later of the lens barrel 20 according to the set imaging conditions (for example, an aperture value, an exposure value, etc.). Supervise and control elements. For example, the control unit 16 generates a drive control signal for driving an AF drive motor 22 in a lens barrel 20 described later, and outputs the drive control signal to the lens control unit 24.

レンズ鏡筒20は、フォーカシングレンズ、手振れ補正レンズ、ズーミングレンズ等を備える結像光学系(図示省略)と、AFエンコーダ21と、AF駆動用モータ22と、を備えている。
AFエンコーダ21は、フォーカシングレンズの位置を検出してレンズ制御部24および制御部16に出力する。レンズ制御部24は、検出されたフォーカシングレンズの位置情報を制御部16に出力する。
AF駆動用モータ22は、レンズ制御部24から入力されるAFレンズの位置を制御するための駆動制御信号に応じて、AFレンズを移動駆動する。
The lens barrel 20 includes an imaging optical system (not shown) including a focusing lens, a camera shake correction lens, a zooming lens, and the like, an AF encoder 21, and an AF drive motor 22.
The AF encoder 21 detects the position of the focusing lens and outputs it to the lens control unit 24 and the control unit 16. The lens control unit 24 outputs the detected position information of the focusing lens to the control unit 16.
The AF drive motor 22 moves and drives the AF lens according to a drive control signal for controlling the position of the AF lens input from the lens control unit 24.

そして、カメラ1は、使用者による図示しないシャッタボタンの押圧操作によって撮影が指令されると、制御部16によって制御されて撮影作用を行う。
すなわち、撮像素子11によって被写体像光を電気信号に変換し、画像処理部12によって処理した画像データを、記憶部15に記憶させる(撮影する)。制御部16は、撮影時において、レンズ制御部24、AF駆動用モータ22を介してAFレンズを移動駆動するAF制御を行う。
The camera 1 is controlled by the control unit 16 to perform a shooting operation when a shooting command is issued by a user pressing a shutter button (not shown).
That is, the subject image light is converted into an electrical signal by the image sensor 11 and the image data processed by the image processing unit 12 is stored (captured) in the storage unit 15. The control unit 16 performs AF control for moving and driving the AF lens via the lens control unit 24 and the AF driving motor 22 during photographing.

動画撮影時においては、撮像素子11は、被写体像光を電気信号に変換して順次取り込み、記憶部15を介して1秒間に所定のフレーム(コマ数)の画像を記憶する。また、前述したように、音情報処理部14が集音した音データを、画像データと共に記憶部15を介して記憶(録音)する。動画撮影時には、撮影期間を通してAF制御が行われる。   At the time of moving image shooting, the image pickup device 11 converts subject image light into an electrical signal and sequentially captures it, and stores an image of a predetermined frame (number of frames) per second via the storage unit 15. Further, as described above, the sound data collected by the sound information processing unit 14 is stored (recorded) through the storage unit 15 together with the image data. During moving image shooting, AF control is performed throughout the shooting period.

ここで、ステレオ集音装置13が集音した音情報は、音情報処理部14に入力される。音情報処理部14は、ステレオ集音装置13が集音した音に含まれるAF制御にかかる駆動ノイズ(AF駆動音)を低減処理する。そして、音情報処理部14は、駆動ノイズ(AF駆動音)が低減処理された音情報を記憶部15に出力する。   Here, the sound information collected by the stereo sound collecting device 13 is input to the sound information processing unit 14. The sound information processing unit 14 performs a reduction process on driving noise (AF driving sound) related to AF control included in the sound collected by the stereo sound collecting device 13. Then, the sound information processing unit 14 outputs the sound information on which the drive noise (AF drive sound) has been reduced to the storage unit 15.

ただし、上記の処理の流れに限定されない。例えば変形形態として、1)制御部16は、ステレオ集音装置13が集音した音を、一旦、記憶部15に記憶させる、2)制御部16は、その記憶された音データをノイズ低減処理部14Aへ出力する、3)低減処理部14Aは音データに対して低減処理を施す、4)次いで、制御部16は、低減処理された音データを、再度、記憶部15に記憶する、といった処理の流れでも良い。   However, it is not limited to the above processing flow. For example, as a modification, 1) the control unit 16 temporarily stores the sound collected by the stereo sound collecting device 13 in the storage unit 15. 2) The control unit 16 performs noise reduction processing on the stored sound data. 3) The reduction processing unit 14A performs a reduction process on the sound data. 4) Next, the control unit 16 stores the reduced sound data in the storage unit 15 again. Processing flow may be used.

本実施形態の処理の流れに戻り、前述した図1に加えて図2〜図4を参照し、音情報処理部14について詳細に説明する。図2は、音情報処理部14におけるノイズ低減処理とその補正の説明図である。図3は、音情報処理部14におけるノイズ低減処理と補正のフローチャートである。図4は、音像変位を説明する図である。   Returning to the processing flow of the present embodiment, the sound information processing unit 14 will be described in detail with reference to FIGS. 2 to 4 in addition to FIG. 1 described above. FIG. 2 is an explanatory diagram of noise reduction processing and correction in the sound information processing unit 14. FIG. 3 is a flowchart of noise reduction processing and correction in the sound information processing unit 14. FIG. 4 is a diagram for explaining the sound image displacement.

音情報処理部14は、前述したように、ノイズ低減処理部14Aと、補正部14Bとを備えている。
ノイズ低減処理部14Aは、ノイズ周波数スペクトルSNを用い、スペクトル減算法によってAF駆動音に対するノイズ低減処理を行う。ノイズ周波数スペクトルSNは、図2(b)に一例を示すような、予め記憶している動作ノイズ情報又は過去に集音した音情報から推定したものである。
As described above, the sound information processing unit 14 includes the noise reduction processing unit 14A and the correction unit 14B.
The noise reduction processing unit 14A uses the noise frequency spectrum SN and performs noise reduction processing on the AF driving sound by a spectral subtraction method. The noise frequency spectrum SN is estimated from previously stored operation noise information or sound information collected in the past, as shown in FIG. 2B as an example.

具体的に説明すると、ノイズ低減処理部14Aは、ステレオ集音装置13(左マイク13L,右マイク13R)から入力されてデジタル化された音信号を、所定の長さで区切ったフレーム単位でフーリエ変換等により周波数解析を行う。
そして、図2(a)に一例を示すような複数の周波数帯域(f1〜f8)に分割した周波数スペクトルSIL,SIRを得る。
その周波数スペクトルSIL,SIRから図2(b)に示すノイズ周波数スペクトルSNを減算してノイズ成分を除去する。
さらに、必要に応じて、信号の下限規制等のフロアリング処理を行って、図2(c)に示すノイズ低減処理後の周波数スペクトルSSL,SSRを補正部14Bに出力する。
More specifically, the noise reduction processing unit 14A performs Fourier transform in units of frames obtained by dividing a digitized sound signal input from the stereo sound collector 13 (the left microphone 13L and the right microphone 13R) by a predetermined length. Perform frequency analysis by conversion.
Then, frequency spectra SIL and SIR divided into a plurality of frequency bands (f1 to f8) as shown in FIG. 2A are obtained.
The noise component is removed by subtracting the noise frequency spectrum SN shown in FIG. 2B from the frequency spectra SIL and SIR.
Further, flooring processing such as signal lower limit regulation is performed as necessary, and the frequency spectra SSL and SSR after the noise reduction processing shown in FIG. 2C are output to the correction unit 14B.

このノイズ低減処理部14Aによるノイズ低減処理は、AF駆動音が含まれるフレームに対して、フレーム毎に行われる。
AF駆動音が含まれるフレームの検知は、たとえば、AFレンズの位置を検出するAFエンコーダ21の出力に基づいて(AFレンズが移動するとAFエンコーダ21の出力が変化する)行われる。
なお、図2(a)における周波数スペクトルSIL,SIRに対する網掛け部位は、AF駆動音が含まれない目的音のみの周波数スペクトルを参考的に示すものである。
The noise reduction processing by the noise reduction processing unit 14A is performed for each frame with respect to the frame including the AF driving sound.
The detection of the frame including the AF driving sound is performed, for example, based on the output of the AF encoder 21 that detects the position of the AF lens (the output of the AF encoder 21 changes when the AF lens moves).
Note that the shaded portions for the frequency spectra SIL and SIR in FIG. 2A refer to the frequency spectrum of only the target sound that does not include the AF driving sound.

ここで、ノイズ低減処理部14Aによるノイズ低減処理は、ステレオ集音装置13における左右のマイク(左マイク13L,右マイク13R)からの音信号に対して、それぞれ独立して行われる。
ただし、左マイク13Lおよび右マイク13Rはレンズ鏡筒20に対して略対称に配置されているため、入力されるAFノイズ(AF駆動音)は同一であるものとしてノイズ周波数スペクトルSNは同一のものを用いる。
なお、左マイク13Lおよび右マイク13Rはレンズ鏡筒20に対して略対称に配置される形態に限定されず、光軸に対した左右非対称であってもよい。
Here, the noise reduction processing by the noise reduction processing unit 14A is performed independently on the sound signals from the left and right microphones (the left microphone 13L and the right microphone 13R) in the stereo sound collecting device 13.
However, since the left microphone 13L and the right microphone 13R are arranged substantially symmetrically with respect to the lens barrel 20, the input AF noise (AF drive sound) is the same and the noise frequency spectrum SN is the same. Is used.
Note that the left microphone 13L and the right microphone 13R are not limited to a form in which the left microphone 13L and the right microphone 13R are arranged substantially symmetrically with respect to the lens barrel 20, and may be asymmetrical with respect to the optical axis.

補正部14Bは、
・ノイズ低減処理部14Aによるノイズ低減処理前の周波数スペクトル(処理前スペクトル)SIL,SIRの、各周波数帯域(f1〜f8)における左右の信号比(処理前比、基準比)と、
・ノイズ低減処理部14Aによるノイズ低減処理後の周波数スペクトル(処理後スペクトル)SSL,SSRの各周波数帯域(f1〜f8)における左右の信号比(処理後比、第1の関係)と、
を各々比較する。
The correction unit 14B
A left / right signal ratio (pre-processing ratio, reference ratio) of each frequency band (f1 to f8) of the frequency spectrum (pre-processing spectrum) SIL, SIR before the noise reduction processing by the noise reduction processing unit 14A;
The left / right signal ratio (post-processing ratio, first relationship) in each frequency band (f1 to f8) of the frequency spectrum (processed spectrum) SSL, SSR after the noise reduction processing by the noise reduction processing unit 14A,
Are compared.

補正部14Bは、その比較結果に基づいて、処理後比RSが処理前比RIと、各周波数帯域において、それぞれ略一致するように補正して補正後比RC(第2の関係)、補正後の周波数スペクトル(補正後スペクトル)SCL,SCRを求める。
そして、補正部14Bは、この補正後スペクトルSCL,SCRを記憶部15に出力する。
Based on the comparison result, the correction unit 14B corrects the post-processing ratio RS so that it substantially coincides with the pre-processing ratio RI in each frequency band, thereby correcting the post-correction ratio RC (second relationship). The frequency spectrum (corrected spectrum) SCL, SCR is obtained.
Then, the correction unit 14B outputs the corrected spectra SCL and SCR to the storage unit 15.

以下、この補正部14Bによる補正について、図2に即してより詳細に説明する。
(処理前スペクトル)
図2(a)に示すように、ノイズ低減処理部14Aによるノイズ低減処理前における左マイク13Lから入力した音(音信号L)の周波数スペクトル(処理前スペクトル(L))における各周波数帯域(f1〜f8)の振幅をSIL1〜SIL8とする。
右マイク13Rから入力した音(音信号R)の周波数スペクトル(処理前スペクトル(R))における各周波数帯域(f1〜f8)の振幅をSIR1〜SIR8とする。
処理前スペクトルの周波数帯域(f1〜f8)ごとの振幅の左/右信号比(以下、この左/右信号比を処理前比とする)は、RI1=SIL1/SIR1,・・・,RI8=SIL8/SIR8となる。
Hereinafter, the correction by the correction unit 14B will be described in more detail with reference to FIG.
(Spectrum before processing)
As shown in FIG. 2A, each frequency band (f1) in the frequency spectrum (pre-processing spectrum (L)) of the sound (sound signal L) input from the left microphone 13L before the noise reduction processing by the noise reduction processing unit 14A. ˜f8) is assumed to be SIL1 to SIL8.
The amplitudes of the frequency bands (f1 to f8) in the frequency spectrum (pre-processing spectrum (R)) of the sound (sound signal R) input from the right microphone 13R are SIR1 to SIR8.
The left / right signal ratio of the amplitude for each frequency band (f1 to f8) of the spectrum before processing (hereinafter, this left / right signal ratio is referred to as the ratio before processing) is RI1 = SIL1 / SIR1,..., RI8 = SIL8 / SIR8.

(処理後スペクトル)
また、図2(c)に示すように、ノイズ低減処理部14Aによるノイズ低減処理後の音信号Lの周波数スペクトル(処理後スペクトル(L))における各周波数帯域(f1〜f8)の振幅をSSL1〜SSL8とする。
ノイズ低減処理部14Aによるノイズ低減処理後の音信号Rの周波数スペクトル(処理後スペクトル(R))における各周波数帯域(f1〜f8)の振幅をSSR1〜SSR8とする。
処理後スペクトルの周波数帯域(f1〜f8)ごとの振幅の左/右信号比(以下、この左/右信号比を処理後比とする)は、RS1=SSL1/SSR1,・・・,RS8=SSL8/SSR8となる。
(Processed spectrum)
Further, as shown in FIG. 2C, the amplitude of each frequency band (f1 to f8) in the frequency spectrum (processed spectrum (L)) of the sound signal L after the noise reduction processing by the noise reduction processing unit 14A is expressed as SSL1. ˜SSL8.
The amplitudes of the frequency bands (f1 to f8) in the frequency spectrum (processed spectrum (R)) of the sound signal R after the noise reduction processing by the noise reduction processing unit 14A are defined as SSR1 to SSR8.
The left / right signal ratio of the amplitude for each frequency band (f1 to f8) of the processed spectrum (hereinafter, this left / right signal ratio is referred to as the processed ratio) is RS1 = SSL1 / SSR1,..., RS8 = SSL8 / SSR8.

(補正後スペクトル)
補正部14Bは、処理前比(RI1〜RI8)と、処理後比(RS1〜RS8)と、
を各周波数帯域(f1〜f8)において比較する。
そして、補正部14Bは、図2(d)に示すように、処理後比(RS1〜RS8)が処理前比(RI1〜RI8)と各々等しくなるように補正する。そして、補正後スペクトル(L)(SCL1〜SCL8)及び補正後スペクトル(R)(SCR1〜SCR8)を得る。
(Corrected spectrum)
The correction unit 14B includes a pre-processing ratio (RI1 to RI8), a post-processing ratio (RS1 to RS8),
Are compared in each frequency band (f1 to f8).
And the correction | amendment part 14B correct | amends so that post-process ratio (RS1-RS8) may become equal to pre-process ratio (RI1-RI8), respectively, as shown in FIG.2 (d). Then, a corrected spectrum (L) (SCL1 to SCL8) and a corrected spectrum (R) (SCR1 to SCR8) are obtained.

ここで、補正後スペクトルを得る方式には、増加補正と、減少補正と、平均補正と、がある。   Here, methods for obtaining a corrected spectrum include an increase correction, a decrease correction, and an average correction.

(増加補正)
増加補正は、処理後スペクトル(L)又は処理後スペクトル(R)の何れかの振幅を大きく補正して、処理後比RSを処理前比RIに一致させるものである。
1.処理後比RSnが処理前比RInより大きい場合
(1)補正後スペクトル(L)を求める(L固定)
処理後スペクトル(L)SSLnを補正後スペクトル(L)SCLnとする(SCLn=SSLn)
(2)補正後スペクトル(R)を求める
そして、(1)で求めた補正後スペクトル(L)SCLnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(R)SCRnを求める。
このとき、処理後比RSnは、処理前比RInより大きいので、処理後スペクトル(L)と同じ値の補正後スペクトル(L)SCLに対して処理前比を満たすように、処理後スペクトル(R)SSRを補正すると、補正後スペクトル(R)SCRnは、処理後スペクトル(R)SSRnより大きくなる(SCRn>SSRn)。
(Increase correction)
In the increase correction, the amplitude of either the post-processing spectrum (L) or the post-processing spectrum (R) is largely corrected to make the post-processing ratio RS coincide with the pre-processing ratio RI.
1. When the post-process ratio RSn is larger than the pre-process ratio RIn (1) Obtain the corrected spectrum (L) (fixed L)
The processed spectrum (L) SSLn is set as a corrected spectrum (L) SCLn (SCLn = SSLn).
(2) Obtaining the corrected spectrum (R) Then, the corrected spectrum (R) SCRn is obtained so that the ratio of the corrected spectrum (L) SCLn obtained in (1) is equal to the pre-processing ratio RIn.
At this time, since the post-processing ratio RSn is larger than the pre-processing ratio RIn, the post-processing spectrum (R) so as to satisfy the pre-processing ratio with respect to the corrected spectrum (L) SCL having the same value as the post-processing spectrum (L). ) When the SSR is corrected, the corrected spectrum (R) SCRn becomes larger than the processed spectrum (R) SSRn (SCRn> SSRn).

2.処理後比RSnが処理前比RInより小さい場合
(1)補正後スペクトル(R)を求める(R固定)
処理後スペクトル(R)SSRnを補正後スペクトル(R)SCRnとする(SCRn=SSRn)
(2)補正後スペクトル(L)を求める
そして、(1)で求めた補正後スペクトル(R)SCRnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(L)SCLnを求める。
このとき、SCLn>SSLnとなる。
なお、上記「n」には、各周波数帯域を示す数字(1〜8)が入る。
2. When the post-process ratio RSn is smaller than the pre-process ratio RIn (1) Obtain the corrected spectrum (R) (fixed R)
The post-processing spectrum (R) SSRn is used as the corrected spectrum (R) SCRn (SCRn = SSRn).
(2) Obtaining the corrected spectrum (L) Then, the corrected spectrum (L) SCLn is obtained so that the ratio to the corrected spectrum (R) SCRn obtained in (1) is equal to the pre-processing ratio RIn.
At this time, SCLn> SSLn.
Note that “n” is a number (1 to 8) indicating each frequency band.

上記の増加補正において、補正後スペクトルの振幅は、本実施形態においてノイズ低減処理前の振幅以下であるが、これに限定されない。例えば、ノイズ低減処理後のスペクトルを一旦増幅した後にスペクトルの振幅を補正した場合には、補正後のスペクトルの振幅はノイズ低減処理前の振幅よりも大きくなることがある。   In the above increase correction, the amplitude of the corrected spectrum is equal to or smaller than the amplitude before the noise reduction processing in the present embodiment, but is not limited thereto. For example, when the spectrum after the noise reduction process is once amplified and the amplitude of the spectrum is corrected, the amplitude of the spectrum after the correction may be larger than the amplitude before the noise reduction process.

3.具体例
具体例として、図2(a)〜(e)中に示すように、周波数スペクトルにおける周波数帯域f3に左右で差があり、周波数帯域f3における左右(L,R)の振幅値がノイズ低減処理前(6,3)で、ノイズ低減処理によって(4,1)に変化したとする。
この場合、処理前比RI3は6/3=2、処理後比RS3は4/1=4、と異なる。補正後における左右信号比(補正後比)RC3を処理前比RI3と等しくするため、ノイズ低減処理後の右(R)の振幅値を1から2に補正する。
その結果、補正後におけるL、Rの振幅値は(4,2)となり、処理前比2と等しくなる。
このような増加補正によれば、目的音の劣化を抑えることができ、人の音がある場合や目的音が大きくノイズがあまり気にならない場合等に適する。
3. Specific Example As a specific example, as shown in FIGS. 2A to 2E, there is a difference between the left and right frequency bands f3 in the frequency spectrum, and the left and right (L, R) amplitude values in the frequency band f3 are noise reduced. It is assumed that before the processing (6, 3), the noise reduction processing is changed to (4, 1).
In this case, the pre-processing ratio RI3 is different from 6/3 = 2 and the post-processing ratio RS3 is different from 4/1 = 4. In order to make the right / left signal ratio (corrected ratio) RC3 after correction equal to the pre-processing ratio RI3, the right (R) amplitude value after noise reduction processing is corrected from 1 to 2.
As a result, the amplitude values of L and R after correction are (4, 2), which is equal to the pre-processing ratio 2.
Such increase correction can suppress the deterioration of the target sound, and is suitable when there is a human sound or when the target sound is large and noise is not a concern.

(減少補正)
減少補正は、処理後スペクトル(L)又は処理後スペクトル(R)の何れかの振幅を小さく補正して、処理後比RSを処理前比RIに一致させるものである。
1.処理後比RSnが処理前比RInより大きい場合
(1)補正後スペクトル(R)を求める(R固定)
処理後スペクトル(R)SSRnを補正後スペクトル(R)SCRnとする(SCRn=SSRn)
(2)補正後スペクトル(L)を求める
そして、(1)で求めた補正後スペクトル(R)SCRnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(L)SCLnを求める。
このとき、SCLn<SSLnとなる。
(Decrease correction)
In the reduction correction, the amplitude of either the processed spectrum (L) or the processed spectrum (R) is corrected to be small so that the processed ratio RS matches the preprocessed ratio RI.
1. When the post-process ratio RSn is larger than the pre-process ratio RIn (1) Obtain the corrected spectrum (R) (fixed R)
The post-processing spectrum (R) SSRn is used as the corrected spectrum (R) SCRn (SCRn = SSRn).
(2) Obtaining the corrected spectrum (L) Then, the corrected spectrum (L) SCLn is obtained so that the ratio to the corrected spectrum (R) SCRn obtained in (1) is equal to the pre-processing ratio RIn.
At this time, SCLn <SSLn.

2.処理後比RSnが処理前比RInより小さい場合
(1)補正後スペクトル(L)を求める(L固定)
処理後スペクトル(L)SSLnを補正後スペクトル(L)SCLnとする(SCLn=SSLn)
(2)補正後スペクトル(R)を求める
そして、(1)で求めた補正後スペクトル(L)SCLnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(R)SCRnを求める。
このとき、SCRn<SSRnとなる。
このような減少補正は、ノイズ低減効果が高く、人声のない静かな場合等に適する。
2. When the post-processing ratio RSn is smaller than the pre-processing ratio RIn (1) Obtain the corrected spectrum (L) (fixed L)
The processed spectrum (L) SSLn is set as a corrected spectrum (L) SCLn (SCLn = SSLn).
(2) Obtaining the corrected spectrum (R) Then, the corrected spectrum (R) SCRn is obtained so that the ratio of the corrected spectrum (L) SCLn obtained in (1) is equal to the pre-processing ratio RIn.
At this time, SCRn <SSRn.
Such reduction correction is suitable for a case where the noise reduction effect is high and there is no human voice.

なお上記の減少補正において、補正後スペクトルの振幅は、本実施形態においてノイズ低減処理後の振幅以下であるが、これに限定されない。例えば、ノイズ低減処理後のスペクトルを一旦増幅した後にスペクトルの振幅を補正した場合には、補正後のスペクトルの振幅はノイズ低減処理後の振幅よりも大きくなることがある。また、増幅の度合いに応じては、ノイズ低減処理前の振幅よりも大きくなることもある。   In the above reduction correction, the amplitude of the corrected spectrum is equal to or smaller than the amplitude after the noise reduction processing in the present embodiment, but is not limited thereto. For example, when the spectrum amplitude after correction after the noise reduction processing is once amplified, the amplitude of the corrected spectrum may be larger than the amplitude after the noise reduction processing. Depending on the degree of amplification, the amplitude before the noise reduction process may be larger.

(平均補正)
平均補正は、前述した増加補正と減少補正とを折衷したものである。ノイズ低減処理後の左右の周波数スペクトルにおける振幅の和を、処理後比RSn=処理前比RInとなるように左右に振り分けて補正するものである。
(Average correction)
The average correction is a compromise between the above-described increase correction and decrease correction. The sum of the amplitudes in the left and right frequency spectra after the noise reduction processing is distributed and corrected so that the post-processing ratio RSn = the pre-processing ratio RIn.

上記各補正方式は、補正する対象や状況に応じて、補正方式を切り換えて適用するように構成してもよい。補正方式の切り換えは、公知の技術である音認識や撮像情報から顔認識や人物認識を利用して行うことができる。たとえば、人物が大きく撮影されている場合や人の音入力が認識された場合および入力が大きい場合には増加補正を適用し、人物が認識されないその他の場合には減少補正を適用するように構成すれば良い。   Each of the above correction methods may be configured to be applied by switching the correction method according to the object to be corrected and the situation. Switching of the correction method can be performed by using face recognition or person recognition from sound recognition or imaging information, which are publicly known techniques. For example, it is configured to apply an increase correction when a person is photographed large, when a person's sound input is recognized and when the input is large, and to apply a decrease correction in other cases where the person is not recognized Just do it.

なお、本実施形態では、処理後比RS(第1の関係)を処理前比RI(基準関係)に一致させる例について説明した。しかし、本実施形態はそれに限定されない。補正後比RCは必ずしもRC=処理前比RIでなくても良く、RCは処理前比RIを含む所定の範囲内であればよい。また、補正後比RCの所定の範囲とは、処理後比RSよりも処理前比RIに近い値となる範囲である。   In the present embodiment, the example in which the post-processing ratio RS (first relationship) matches the pre-processing ratio RI (reference relationship) has been described. However, the present embodiment is not limited to this. The corrected ratio RC does not necessarily have to be RC = pre-processing ratio RI, and RC may be within a predetermined range including the pre-processing ratio RI. The predetermined range of the post-correction ratio RC is a range that is closer to the pre-processing ratio RI than the post-processing ratio RS.

すなわち、仮に、処理後比RS(第1の関係)の音を聞くことができたとすると、補正後比RCの音の定位は、第1の関係(処理後比RS)の音の定位よりも、処理前比RIの音の定位に近い。
また、補正後比RCの所定の範囲とは、補正後比RCが処理前比RIのプラスマイナス5%以内に含まれるような範囲と定めてもよい。
That is, if the sound of the post-processing ratio RS (first relation) can be heard, the localization of the sound of the post-correction ratio RC is more than the localization of the sound of the first relation (post-processing ratio RS). It is close to the sound localization of the pre-processing ratio RI.
The predetermined range of the corrected ratio RC may be determined as a range in which the corrected ratio RC is included within plus or minus 5% of the pre-processing ratio RI.

また、補正後比RCの所定の範囲とは、ノイズ低減処理前の音像の位置に対して、補正後の音像の位置がプラスマイナス30°以内に含まれるような範囲であってもよい。このように、補正後比RCの所定の範囲を、補正後の音像の位置が所定の角度の範囲に含まれるような範囲として定めてもよい。また補正後比RCの所定の範囲とは、補正後の音像の位置がプラスマイナス30°よりも狭い、プラスマイナス15°以内に含まれる範囲であってもよい。   Further, the predetermined range of the corrected ratio RC may be a range in which the position of the corrected sound image is included within ± 30 ° with respect to the position of the sound image before the noise reduction processing. As described above, the predetermined range of the corrected ratio RC may be determined as a range in which the position of the corrected sound image is included in the range of the predetermined angle. Further, the predetermined range of the corrected ratio RC may be a range in which the position of the corrected sound image is narrower than plus / minus 30 ° and included within plus / minus 15 °.

つぎに、図3に示すフローチャートに沿って、ノイズ低減処理部14Aおよび補正部14Bによるノイズ低減処理と補正制御の流れを説明する。なお、図3中および以下の説明では、ステップを「S」とも略記する。
ノイズ低減処理部14Aによるノイズ低減処理と補正部14Bによる補正は、前述したようにAFエンコーダ21の出力等のAF駆動情報に基づいてスタートする。つまり、AF駆動時のみに機能する。
Next, the flow of noise reduction processing and correction control by the noise reduction processing unit 14A and the correction unit 14B will be described with reference to the flowchart shown in FIG. In FIG. 3 and the following description, step is also abbreviated as “S”.
The noise reduction processing by the noise reduction processing unit 14A and the correction by the correction unit 14B start based on AF drive information such as the output of the AF encoder 21 as described above. That is, it functions only during AF driving.

ノイズ低減処理と補正制御は、まず、補正部14Bがノイズ低減処理部14Aによるノイズ低減処理前におけるそのフレームの処理前比RIを演算し(S301)、ノイズ低減処理部14Aによってノイズ低減処理を行う(S302)。
ついで、補正部14Bが、ノイズ低減処理部14Aによるノイズ低減処理後の処理後比RSを演算し(S303)、その処理後比RSと処理前比RIとを比較する(S304)。
ステップ304において両者が等しくないと判断された場合(No)には、補正部14Bによってノイズ低減処理後の信号に補正を行う(S305)。一方、ステップ304において両者が等しいと判断された場合(Yes)には、補正することなく制御を終了する。
In the noise reduction processing and correction control, first, the correction unit 14B calculates a pre-processing ratio RI of the frame before the noise reduction processing by the noise reduction processing unit 14A (S301), and the noise reduction processing unit 14A performs the noise reduction processing. (S302).
Next, the correction unit 14B calculates the post-processing ratio RS after the noise reduction processing by the noise reduction processing unit 14A (S303), and compares the post-processing ratio RS with the pre-processing ratio RI (S304).
If it is determined in step 304 that they are not equal (No), the correction unit 14B corrects the signal after the noise reduction processing (S305). On the other hand, if it is determined in step 304 that both are equal (Yes), the control is terminated without correction.

上記のように、補正部14Bは、周波数スペクトルの各周波数帯域における処理後比を、処理前比と略一致するように補正する。
これにより、ステレオ信号をノイズ発生タイミングに合わせてノイズ低減処理を行った際に、そのノイズ低減処理に起因する目的音の音像変位を抑制することができる。
As described above, the correction unit 14B corrects the post-processing ratio in each frequency band of the frequency spectrum so as to substantially match the pre-processing ratio.
Thereby, when the noise reduction process is performed on the stereo signal in accordance with the noise generation timing, it is possible to suppress the sound image displacement of the target sound due to the noise reduction process.

すなわち、図4に概念図を示すように、人物Mから見た目的音の音像位置に対して、ノイズ低減処理のみで補正しない処理音の音像が大きく移動してしまう場合でも、補正によって音像の移動を小さく抑えることができる。その結果、ノイズ低減処理時(AF駆動時)において映像と音像とが突然乖離するといった違和感のある音像変位を防ぐことができるものである。
また、本実施形態において音処理は、全周波数帯域において行うものでなくてもよく、一部の周波数帯域に対して音処理を行ってもよい。一部の周波数帯域の例としては、ノイズが特に検出される周波数帯域や、可聴の周波数帯域、極端な高周波や低周波をカットした周波数帯域があげられる。
That is, as shown in the conceptual diagram of FIG. 4, even if the sound image of the processed sound that is not corrected only by the noise reduction process moves greatly relative to the sound image position of the target sound viewed from the person M, the sound image is moved by the correction. Can be kept small. As a result, it is possible to prevent an uncomfortable sound image displacement such that the image and the sound image suddenly deviate during noise reduction processing (AF driving).
In the present embodiment, the sound processing may not be performed in the entire frequency band, and the sound processing may be performed on a part of the frequency bands. Examples of some frequency bands include a frequency band in which noise is particularly detected, an audible frequency band, and a frequency band in which extreme high and low frequencies are cut.

(第2実施形態)
つぎに、本発明の第2実施形態について説明する。
図5は、第2実施形態にかかる音情報処理部14におけるノイズ低減処理と補正のフローチャートである。図2、図3と同様に、周波数スペクトルにおける周波数帯域f3について説明する。
本第2実施形態は、補正の基準とする左右信号比(処理前比)を、ノイズ(AF駆動音)発生の無い部分(フレーム)から取得するものである。なお、機構的な構成は、前述した第1実施形態と全く同様であり、説明は省略する。以下の説明中における構成要素の符号等は、図1参照のこと。
本第2実施形態では、補正の基準とする左右信号比を、ノイズ低減処理部分の直前または直後の部分から求める。なお、直前の信号比を利用する場合にはリアルタイムの処理(逐次処理)が可能であるが、直後の信号比を利用する場合には逐次処理が難しく後処理の場合にのみ適用可能である。
(Second Embodiment)
Next, a second embodiment of the present invention will be described.
FIG. 5 is a flowchart of noise reduction processing and correction in the sound information processing unit 14 according to the second embodiment. Similar to FIGS. 2 and 3, the frequency band f <b> 3 in the frequency spectrum will be described.
In the second embodiment, the left / right signal ratio (pre-processing ratio) as a reference for correction is acquired from a portion (frame) where no noise (AF drive sound) is generated. The mechanical configuration is exactly the same as that of the first embodiment described above, and a description thereof is omitted. Refer to FIG. 1 for the reference numerals of the constituent elements in the following description.
In the second embodiment, the left / right signal ratio as a reference for correction is obtained from a portion immediately before or after the noise reduction processing portion. Note that real-time processing (sequential processing) is possible when the immediately preceding signal ratio is used, but when the immediately following signal ratio is used, sequential processing is difficult and can be applied only to post-processing.

このように、ノイズ(AF駆動音)が混入していない部分から左右信号比を求めてこれを補正の基準とすることで、ノイズの影響を受けずに目的音の左右比を求めることができる。
ただし、目的音の時間変化が大きい場合は、ノイズ低減処理部分の直前と、ノイズ低減処理部分とで、目的音のスペクトル(左右信号比)が大きく変化することがあり、実際に発生している目的音の音像移動に追従できないことがある。このようなことを防ぐため、補正の基準とする左右信号比を、ノイズ低減処理部分の直前から求めた左右信号比と、前述した第1実施形態のようにノイズ低減処理部分の左右信号比と、の何れかを選択可能とすることが好ましい。
In this way, by obtaining the left / right signal ratio from the portion where noise (AF driving sound) is not mixed and using this as the reference for correction, the right / left ratio of the target sound can be obtained without being affected by noise. .
However, when the time variation of the target sound is large, the spectrum (right / left signal ratio) of the target sound may change greatly between the noise reduction processing part and the noise reduction processing part, which is actually occurring. It may not be possible to follow the movement of the target sound. In order to prevent this, the right / left signal ratio used as a reference for correction is determined as the right / left signal ratio obtained immediately before the noise reduction processing portion, and the left / right signal ratio of the noise reduction processing portion as in the first embodiment described above. It is preferable that any one of these can be selected.

この補正基準となる左右信号比を選択して適用する場合におけるノイズ低減処理および補正を、図5に示すフローチャートに沿って説明する。
まず、補正部14Bが、AFエンコーダ21の出力等のAF駆動情報に基づいてノイズ低減処理をスタートする直前のフレームの左右の信号比RIbを演算し(S501)、ノイズ低減処理に入った後にノイズ低減処理部14Aによるノイズ低減処理前における各フレームの左右の信号比RIaを演算する(S502)。
The noise reduction processing and correction in the case of selecting and applying the right / left signal ratio as the correction reference will be described with reference to the flowchart shown in FIG.
First, the correction unit 14B calculates the left / right signal ratio RIb of the frame immediately before starting the noise reduction process based on the AF drive information such as the output of the AF encoder 21 (S501), and after entering the noise reduction process, the noise The left / right signal ratio RIa of each frame before the noise reduction processing by the reduction processing unit 14A is calculated (S502).

そして、信号比RIbと信号比RIaとの差(絶対値)を、予め定められた閾値Aと比較判定する(S503)。
ステップ503において、信号比RIbと信号比RIaとの差が閾値A以下と判定された場合(Yes)には、信号比RIbを基準比RIとして設定する(S504)。一方、ステップ503において、信号比RIbと信号比RIaとの差が閾値Aを越えていると判定された場合(No)には、信号比RIaを基準比RIとして設定する(S505)。
Then, the difference (absolute value) between the signal ratio RIb and the signal ratio RIa is compared with a predetermined threshold A (S503).
If it is determined in step 503 that the difference between the signal ratio RIb and the signal ratio RIa is equal to or less than the threshold A (Yes), the signal ratio RIb is set as the reference ratio RI (S504). On the other hand, if it is determined in step 503 that the difference between the signal ratio RIb and the signal ratio RIa exceeds the threshold A (No), the signal ratio RIa is set as the reference ratio RI (S505).

その後、ノイズ低減処理部14Aによってノイズ低減処理を行い(S506)、ついで、補正部14Bが、ノイズ低減処理部14Aによるノイズ低減処理後の左右の信号比RSを演算し(S507)、そのノイズ低減処理後左右信号比RSとノイズ低減処理前左右信号比RIとを比較する(S508)。
ステップ508において両者が等しくないと判断された場合(No)には、補正部14Bによってノイズ低減処理後の信号に補正を行う(S509)。一方、ステップ508において両者が等しいと判断された場合(Yes)には、補正することなく制御を終了する。
Thereafter, noise reduction processing is performed by the noise reduction processing unit 14A (S506), and then the correction unit 14B calculates a left / right signal ratio RS after the noise reduction processing by the noise reduction processing unit 14A (S507), and the noise reduction is performed. The processed right / left signal ratio RS is compared with the left / right signal ratio RI before noise reduction processing (S508).
If it is determined in step 508 that the two are not equal (No), the correction unit 14B corrects the signal after the noise reduction processing (S509). On the other hand, if it is determined in step 508 that both are equal (Yes), the control is terminated without correction.

上記構成では、ノイズ低減処理部分の直前から求めた左右信号比RIbとノイズ低減処理部分の左右信号比RIaとを比較し、その差が小さい場合には、目的音の音像の移動が小さいと判断してノイズの影響を受けない信号比RIbを基準信号比RIとして採用し、差が所定量より大きい場合には、目的音の音像の移動が大きいと判断して信号比RIaを基準信号比RIとして採用するものである。
このような構成によれば、目的音の音像の移動が小さい場合には処理部分の直前と処理部分の音像の連続性を保つことができ、目的音の音像の移動が大きい場合には違和感のない円滑な音像移動を再現できる。
In the above configuration, the left / right signal ratio RIb obtained immediately before the noise reduction processing portion is compared with the left / right signal ratio RIa of the noise reduction processing portion, and if the difference is small, it is determined that the movement of the sound image of the target sound is small. When the signal ratio RIb that is not affected by noise is adopted as the reference signal ratio RI and the difference is larger than a predetermined amount, it is determined that the movement of the sound image of the target sound is large, and the signal ratio RIa is determined as the reference signal ratio RI. Is to be adopted.
According to such a configuration, when the movement of the target sound image is small, the continuity of the sound image immediately before the processing portion and the processing portion can be maintained, and when the movement of the target sound image is large, the sense of discomfort is maintained. Reproducible smooth sound image movement.

なお、事後処理(逐次処理でなく一旦記録した後に、読み出して行う処理)となるが、ノイズ低減処理部分の直前と直後の部分(フレーム)の左右信号比をそれぞれ求め、その変化率に対応させて左右の信号比率を変化させても良い。つまり、ノイズ低減処理部分の直前と直後において左右信号比が大きく異なる場合は、音源が左右に移動したと考えられるため、ノイズ低減処理部分の直前と直後の左右の信号比の変化と対応するように音像を移動させる処理を行うものである。   In addition, post processing (processing that is read after recording once instead of sequential processing) is performed, and the left and right signal ratios of the portion (frame) immediately before and after the noise reduction processing portion are respectively determined and corresponded to the rate of change. Thus, the left / right signal ratio may be changed. In other words, if the left / right signal ratio is significantly different between immediately before and after the noise reduction processing part, it is considered that the sound source has moved left and right, so that it corresponds to the change in the left / right signal ratio immediately before and after the noise reduction processing part. The process of moving the sound image is performed.

図6は、このような処理の説明図である。
図6(a)に示すように、フレーム4〜10がノイズ低減処理フレームである場合、フレーム3が直前部分、フレーム11が直後部分のフレームである。
図6(b)において、SFL3は直前(フレーム3)の左スペクトル、SFR3は直前(フレーム3)の右スペクトル、SFL11は直後(フレーム11)の左スペクトル、SFR11は直後(フレーム11)の右スペクトルである。
FIG. 6 is an explanatory diagram of such processing.
As shown in FIG. 6A, when the frames 4 to 10 are noise reduction processing frames, the frame 3 is the immediately preceding portion and the frame 11 is the immediately following portion.
In FIG. 6B, SFL3 is the left spectrum immediately before (frame 3), SFR3 is the right spectrum immediately before (frame 3), SFL11 is the left spectrum immediately after (frame 11), and SFR11 is the right spectrum immediately after (frame 11). It is.

ここで、たとえば、周波数帯域f3について見ると、
左側:SFL11のf3(振幅1.5)は、SFL3のf3(振幅3)より減少している。
右側:SFR11のf3(振幅3)は、SFR3のf3(振幅1)より増加している。
これは、ノイズ低減処理フレーム4〜10の間に音源が左側から右側に移動していることを示す。
Here, for example, when looking at the frequency band f3,
Left side: f3 (amplitude 1.5) of SFL11 is smaller than f3 (amplitude 3) of SFL3.
Right: f3 (amplitude 3) of SFR11 is greater than f3 (amplitude 1) of SFR3.
This indicates that the sound source is moving from the left side to the right side during the noise reduction processing frames 4 to 10.

そこで、ノイズ低減処理フレーム4〜10における左右の信号比(処理前比)については、図6(c)に示すように、直前(フレーム3)の左右の信号比(3/1=3)から、直後(フレーム11)の左右の信号比(1.5/3=0.5)へ、連続して変化するようにして補正の基準値となる信号比を求める。
具体的には、直前と直後の値(3と0.5)と直前と直後の間にあるフレーム(7つ)とに基づいて、各フレームでの左右の信号比の値を求める。具体的にはフレーム4〜10間で2.5/8の値ずつ左右比を減少させるような補正を行う。
f3以外の周波数帯域についても、各々同様の処理を行う。
その結果、処理直前から処理中、処理直後の左右の信号比が連続的に変化し、音像の移動が滑らかになり、違和感を軽減することができる。
Therefore, the left / right signal ratio (pre-processing ratio) in the noise reduction processing frames 4 to 10 is as shown in FIG. 6C from the right / left signal ratio (3/1 = 3) immediately before (frame 3). Then, the signal ratio that is the reference value for correction is obtained so as to continuously change to the right / left signal ratio (1.5 / 3 = 0.5) immediately after (frame 11).
Specifically, based on the immediately preceding and immediately following values (3 and 0.5) and the immediately preceding and immediately following frames (seven), the left and right signal ratio values in each frame are obtained. Specifically, correction is performed so as to decrease the left / right ratio by a value of 2.5 / 8 between frames 4-10.
The same processing is performed for frequency bands other than f3.
As a result, during the process from immediately before the process, the right / left signal ratio immediately after the process changes continuously, the movement of the sound image becomes smooth, and the uncomfortable feeling can be reduced.

以上、本実施形態によると、以下の効果を有する。
(1)カメラ1における補正部14Bは、ノイズ低減処理後における周波数スペクトルの各周波数帯域における左右の信号比を、ノイズ低減処理前における周波数スペクトルの各周波数帯域における左右の信号比と略一致するように補正する。これにより、ステレオ信号をノイズ発生タイミングに合わせてノイズ低減処理する際に、そのノイズ低減処理に起因して生ずる目的音の音像変位を抑制することができる。その結果、ノイズ低減処理時(AF駆動時)における音像変位による違和感を防ぐことができる。
As described above, this embodiment has the following effects.
(1) The correction unit 14B in the camera 1 substantially matches the left / right signal ratio in each frequency band of the frequency spectrum after the noise reduction processing with the left / right signal ratio in each frequency band of the frequency spectrum before the noise reduction processing. To correct. Thereby, when the noise reduction process is performed on the stereo signal in accordance with the noise generation timing, the sound image displacement of the target sound caused by the noise reduction process can be suppressed. As a result, it is possible to prevent a sense of incongruity due to sound image displacement during noise reduction processing (AF driving).

(変形形態)
以上、説明した実施形態に限定されることなく、以下に示すような種々の変形や変更が可能であり、それらも本発明の範囲内である。
(1)上記実施形態は、本発明を音処理装置としてのカメラに適用したものである。しかし、本発明はこれに限らず、コンピュータを上記各構成要素として機能させるプログラムとして提供されるものであっても良い。
(Deformation)
The present invention is not limited to the above-described embodiment, and various modifications and changes as described below are possible, and these are also within the scope of the present invention.
(1) In the above embodiment, the present invention is applied to a camera as a sound processing apparatus. However, the present invention is not limited to this, and may be provided as a program that causes a computer to function as each of the above components.

(2)上記実施形態は、本発明をカメラにおけるAF駆動音によるノイズを低減するように構成したものである。しかし、本発明はこれに限らず、ズーミングやブレ補正装置の作動ノイズの低減にも適用可能なものであり、さらに、カメラに限らず録音機能を備える光学機器に適用可能である。 (2) In the above embodiment, the present invention is configured to reduce noise caused by AF driving sound in a camera. However, the present invention is not limited to this, and can also be applied to the reduction of operating noise of zooming and blur correction devices. Furthermore, the present invention can be applied not only to cameras but also to optical equipment having a recording function.

(3)本実施形態では、カメラ本体10に音情報処理部14が含まれている例について説明したが、これに限定されず、カメラに備わるステレオマイクで録音した後、音処理装置のほうにデータを送信し、音処理装置で低減処理を行ってもよい。すなわち、音を集音する部分と、音の低減処理を施す部分とが分離していてもよい。
この場合、一例として以下のような流れで処理が行われる。
カメラ等に備わるステレオマイクで周囲の音が録音される。
そして、そのステレオマイクで録音した音が音データに変換され、記憶部に記憶される。
録音の際にAF等のカメラ備わる機能の動作が行われた場合は、周囲の音を録音した音データとカメラに備わる機能の動作(例えばAFの動作)を行ったタイミングとを関連づけて記憶させる。
次に、記憶部に記憶された音データと動作タイミングとが出力部を介して、別体の音処理装置、例えばPC等に出力される。
音処理装置は、制御部、記憶部、ノイズ低減処理部(以下、これらをSP制御部、SP記憶部、SPノイズ低減処理部という)を備える。
SP制御部は、カメラから入力部を介して入力されたその音データと動作タイミングと音データをSP記憶部に記憶させる。
SP制御部は、SP記憶部に記憶された音データをSP低減処理部へ出力し、SP低減処理部は音データに対してAF音などの雑音の低減を行う。
なお、音の低減処理は、音データと共に記憶されている機能の動作タイミングに基づいて行う。その後、SP制御部は、低減処理された音データをSP記憶部に記憶させる。このようにして、音データに対して低減処理を施してもよい。
(3) In the present embodiment, an example in which the sound information processing unit 14 is included in the camera body 10 has been described. However, the present invention is not limited to this, and after recording with a stereo microphone provided in the camera, Data may be transmitted and reduction processing may be performed by the sound processing device. That is, the part that collects the sound and the part that performs the sound reduction process may be separated.
In this case, as an example, processing is performed in the following flow.
Ambient sounds are recorded with a stereo microphone on the camera.
The sound recorded by the stereo microphone is converted into sound data and stored in the storage unit.
When an operation of a function such as AF is performed at the time of recording, sound data obtained by recording surrounding sounds and the timing at which the function operation (for example, AF operation) of the camera is performed are stored in association with each other. .
Next, the sound data and the operation timing stored in the storage unit are output to a separate sound processing device, such as a PC, via the output unit.
The sound processing apparatus includes a control unit, a storage unit, and a noise reduction processing unit (hereinafter referred to as an SP control unit, an SP storage unit, and an SP noise reduction processing unit).
The SP control unit stores the sound data, operation timing, and sound data input from the camera via the input unit in the SP storage unit.
The SP control unit outputs the sound data stored in the SP storage unit to the SP reduction processing unit, and the SP reduction processing unit reduces noise such as AF sound on the sound data.
Note that the sound reduction processing is performed based on the operation timing of the function stored together with the sound data. Thereafter, the SP control unit stores the reduced sound data in the SP storage unit. In this way, reduction processing may be performed on the sound data.

なお、実施形態及び変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。また、本発明は以上説明した実施形態によって限定されることはない。   In addition, although embodiment and a deformation | transformation form can also be used in combination as appropriate, detailed description is abbreviate | omitted. Further, the present invention is not limited to the embodiment described above.

1:カメラ、13:ステレオ集音装置、13L:左マイク、13R:右マイク、14:音情報処理部、14A:ノイズ低減処理部、14B:補正部、20:レンズ鏡筒、21:AFエンコーダ、22:AF駆動用モータ、SIL,SIR:ノイズ低減処理前の周波数スペクトル、RI:処理前比、SN:ノイズ周波数スペクトル、SSL,SSR:ノイズ低減処理後の周波数スペクトル、RS:処理後比、SCL,SCR:補正後の周波数スペクトル   1: Camera, 13: Stereo sound collector, 13L: Left microphone, 13R: Right microphone, 14: Sound information processing unit, 14A: Noise reduction processing unit, 14B: Correction unit, 20: Lens barrel, 21: AF encoder 22: AF driving motor, SIL, SIR: frequency spectrum before noise reduction processing, RI: pre-processing ratio, SN: noise frequency spectrum, SSL, SSR: frequency spectrum after noise reduction processing, RS: post-processing ratio, SCL, SCR: Frequency spectrum after correction

Claims (4)

第1音データを出力する第1集音部と第2音データを出力する第2集音部とを有する集音部と、
前記第1音データと前記第2音データとの、複数の周波数領域における振幅の比を算出する算出部と、
前記第1音データと前記第2音データとのうち少なくとも一方から、一部の音データを除去する除去部と、
少なくとも一方から前記一部の音データが除去された前記第1音データと前記第2音データの前記周波数領域における振幅の比を、除去前の前記第1音データと前記第2音データとの前記複数の周波数領域における振幅の比に近づける処理部
とを備える音処理装置。
A sound collection unit having a first sound collection unit that outputs first sound data and a second sound collection unit that outputs second sound data;
A calculation unit that calculates a ratio of amplitudes in a plurality of frequency regions between the first sound data and the second sound data;
A removing unit that removes part of the sound data from at least one of the first sound data and the second sound data;
The ratio of the amplitude in the frequency domain of the first sound data and the second sound data from which the partial sound data has been removed from at least one of the first sound data and the second sound data before removal is determined. A sound processing apparatus comprising: a processing unit that approximates an amplitude ratio in the plurality of frequency regions.
請求項1に記載の音処理装置であって
前記除去部で除去する音データは、カメラレンズの機構を駆動することにより発生する音データである音処理装置。
The sound processing device according to claim 1, wherein the sound data removed by the removing unit is sound data generated by driving a mechanism of a camera lens.
請求項2に記載の音処理装置であって、
前記カメラレンズの機構を駆動することにより発生する音データを検出する検出部を備え、
前記処理部は、前記検出部で検出した前記音データに基づいて、前記第1音データと前記第2音データの少なくとも一方から前記音データを除去する音処理装置。
The sound processing apparatus according to claim 2,
A detection unit that detects sound data generated by driving the mechanism of the camera lens;
The sound processing device, wherein the processing unit removes the sound data from at least one of the first sound data and the second sound data based on the sound data detected by the detection unit.
第1集音部による第1音データと、第2集音部による第2音データとを入力する処理と、
前記第1音データと前記第2音データとの、複数の周波数領域における振幅の比を算出する処理と、
前記第1音データと前記第2音データとのうち少なくとも一方から、一部の音データを除去する処理と、
少なくとも一方から前記一部の音データが除去された前記第1音データと前記第2音データの前記周波数領域における振幅の比を、除去前の前記第1音データと前記第2音データとの前記複数の周波数領域における振幅の比に近づける処理
とをコンピュータに実行させるプログラム。
A process of inputting the first sound data by the first sound collection unit and the second sound data by the second sound collection unit;
A process of calculating a ratio of amplitudes in a plurality of frequency regions between the first sound data and the second sound data;
A process of removing a part of sound data from at least one of the first sound data and the second sound data;
The ratio of the amplitude in the frequency domain of the first sound data and the second sound data from which the partial sound data has been removed from at least one of the first sound data and the second sound data before removal is determined. A program for causing a computer to execute a process of approaching an amplitude ratio in the plurality of frequency regions.
JP2017160246A 2012-02-01 2017-08-23 Sound processing apparatus and sound processing program Active JP6369612B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012019627 2012-02-01
JP2012019627 2012-02-01

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013017863A Division JP6197298B2 (en) 2012-02-01 2013-01-31 Sound processing apparatus and sound processing program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018131259A Division JP6610725B2 (en) 2012-02-01 2018-07-11 Sound processing apparatus and sound processing program

Publications (2)

Publication Number Publication Date
JP2017229086A true JP2017229086A (en) 2017-12-28
JP6369612B2 JP6369612B2 (en) 2018-08-08

Family

ID=49270816

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2013017863A Active JP6197298B2 (en) 2012-02-01 2013-01-31 Sound processing apparatus and sound processing program
JP2017160246A Active JP6369612B2 (en) 2012-02-01 2017-08-23 Sound processing apparatus and sound processing program
JP2018131259A Active JP6610725B2 (en) 2012-02-01 2018-07-11 Sound processing apparatus and sound processing program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013017863A Active JP6197298B2 (en) 2012-02-01 2013-01-31 Sound processing apparatus and sound processing program

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018131259A Active JP6610725B2 (en) 2012-02-01 2018-07-11 Sound processing apparatus and sound processing program

Country Status (1)

Country Link
JP (3) JP6197298B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6497877B2 (en) * 2014-09-04 2019-04-10 キヤノン株式会社 Electronic device and control method
JP6497879B2 (en) * 2014-09-04 2019-04-10 キヤノン株式会社 Electronic device and control method
JP6491440B2 (en) * 2014-09-04 2019-03-27 キヤノン株式会社 Electronic device and control method
JP6528438B2 (en) * 2015-02-12 2019-06-12 沖電気工業株式会社 Sound signal processing apparatus and sound signal processing program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000004494A (en) * 1998-06-16 2000-01-07 Matsushita Electric Ind Co Ltd Microphone system built in device
JP2008227595A (en) * 2007-03-08 2008-09-25 Sony Corp Signal processing apparatus, signal processing method and program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6384213A (en) * 1986-09-29 1988-04-14 Nippon Telegr & Teleph Corp <Ntt> Streo coding and decoding device
JP3670562B2 (en) * 2000-09-05 2005-07-13 日本電信電話株式会社 Stereo sound signal processing method and apparatus, and recording medium on which stereo sound signal processing program is recorded
JP2004129038A (en) * 2002-10-04 2004-04-22 Sony Corp Method and device for adjusting level of microphone and electronic equipment
JP2010193323A (en) * 2009-02-19 2010-09-02 Casio Hitachi Mobile Communications Co Ltd Sound recorder, reproduction device, sound recording method, reproduction method, and computer program
JP4811475B2 (en) * 2009-02-27 2011-11-09 ソニー株式会社 Recording apparatus, recording method, audio signal correction circuit, and program
JP5564873B2 (en) * 2009-09-25 2014-08-06 富士通株式会社 Sound collection processing device, sound collection processing method, and program
JP5024470B2 (en) * 2010-04-02 2012-09-12 株式会社ニコン Imaging apparatus, signal processing apparatus, and recording medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000004494A (en) * 1998-06-16 2000-01-07 Matsushita Electric Ind Co Ltd Microphone system built in device
JP2008227595A (en) * 2007-03-08 2008-09-25 Sony Corp Signal processing apparatus, signal processing method and program

Also Published As

Publication number Publication date
JP2013179585A (en) 2013-09-09
JP6369612B2 (en) 2018-08-08
JP6610725B2 (en) 2019-11-27
JP6197298B2 (en) 2017-09-20
JP2018182751A (en) 2018-11-15

Similar Documents

Publication Publication Date Title
JP6610725B2 (en) Sound processing apparatus and sound processing program
JP5748422B2 (en) Electronics
US9495950B2 (en) Audio signal processing device, imaging device, audio signal processing method, program, and recording medium
JP2008263498A (en) Wind noise reducing device, sound signal recorder and imaging apparatus
JP2010278725A (en) Image and sound processor and imaging apparatus
JP2008263483A (en) Wind noise reducing device, sound signal recorder, and imaging apparatus
US9232146B2 (en) Imaging device with processing to change sound data
JP2012151544A (en) Imaging apparatus and program
JP5063489B2 (en) Judgment device, electronic apparatus including the same, and judgment method
US9066010B2 (en) Photographing apparatus, photographing method and medium recording photographing control program
JP2010283706A (en) Video camera
US8600070B2 (en) Signal processing apparatus and imaging apparatus
JP2014122978A (en) Imaging device, voice recognition method, and program
JP2013223223A (en) Recording device
JP4969349B2 (en) Imaging apparatus and imaging method
JP5018860B2 (en) Signal processing apparatus and imaging apparatus
JP2014026002A (en) Sound recording device and program
JP6061476B2 (en) Audio processing device
WO2013115385A1 (en) Sound processing device and sound processing program
JP6793369B1 (en) Imaging device
JP5548529B2 (en) Audio signal processing apparatus and photographing apparatus
JP6912969B2 (en) Speech processing device and its control method
JP5246134B2 (en) Signal processing apparatus and imaging apparatus
JP2018066963A (en) Sound processing device
JP2011166407A (en) Acoustic setting device and method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180612

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180625

R150 Certificate of patent or registration of utility model

Ref document number: 6369612

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250