JP6965090B2 - Voice processing device and control method of voice processing device - Google Patents

Voice processing device and control method of voice processing device Download PDF

Info

Publication number
JP6965090B2
JP6965090B2 JP2017199545A JP2017199545A JP6965090B2 JP 6965090 B2 JP6965090 B2 JP 6965090B2 JP 2017199545 A JP2017199545 A JP 2017199545A JP 2017199545 A JP2017199545 A JP 2017199545A JP 6965090 B2 JP6965090 B2 JP 6965090B2
Authority
JP
Japan
Prior art keywords
gain
digital
unit
threshold value
detection unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017199545A
Other languages
Japanese (ja)
Other versions
JP2019075655A (en
Inventor
健一郎 笹井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017199545A priority Critical patent/JP6965090B2/en
Publication of JP2019075655A publication Critical patent/JP2019075655A/en
Application granted granted Critical
Publication of JP6965090B2 publication Critical patent/JP6965090B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声処理装置および音声処理装置の制御方法に関する。 The present invention relates to a voice processing device and a method for controlling the voice processing device.

近年、特定の位置にいる人にだけアナウンスが聞こえるように、指向性スピーカ(超音波スピーカ)が駅構内、動く歩道、博物館、待合室等に設置されてきている。その近辺で動画記録を行うと、指向性スピーカから出力される超音波帯域の搬送波の影響により、カメラ内部の音声回路が飽和状態となり、本来受信信号が有している主音声の成分が歪んで録音されてしまうという課題がある。その原因は、主に超音波帯域の搬送波の音圧が主音声の成分の音圧よりも非常に高い出力を用いているため、主音声は飽和しない状態であっても、搬送波によって飽和してしまうためである。 In recent years, directional speakers (ultrasonic speakers) have been installed in station premises, moving walkways, museums, waiting rooms, etc. so that only people in a specific position can hear the announcement. When video recording is performed in the vicinity, the audio circuit inside the camera becomes saturated due to the influence of the carrier wave in the ultrasonic band output from the directional speaker, and the main audio component originally possessed by the received signal is distorted. There is a problem that it will be recorded. The reason is that the sound pressure of the carrier wave in the ultrasonic band is mainly higher than the sound pressure of the main sound component, so even if the main sound is not saturated, it is saturated by the carrier wave. This is because it will be stored.

このような問題を解決するために、受信回路の信号飽和対策として、オートゲインコントロール(AGC)を用いて回路の飽和を防止する方法がある。また、特許文献1には、回路の飽和状態によって発生した高調波成分を抽出してそのレベルを調べることで回路の飽和状態を直接的に検出することが開示されている。また、特許文献2には、振動センサ(歪みゲージ)の出力を用いて「可聴帯域」の振動を直接検出し、出力元の超音波駆動回路の周波数設定へフィードバックすることにより、可聴帯域の振動音を抑制する方法が開示されている。 In order to solve such a problem, as a measure against signal saturation of the receiving circuit, there is a method of preventing circuit saturation by using an auto gain control (AGC). Further, Patent Document 1 discloses that the saturated state of a circuit is directly detected by extracting a harmonic component generated by the saturated state of the circuit and examining the level thereof. Further, in Patent Document 2, vibration in the audible band is directly detected by using the output of the vibration sensor (distortion gauge) and fed back to the frequency setting of the ultrasonic drive circuit of the output source. A method of suppressing sound is disclosed.

特開平11−56846号公報Japanese Unexamined Patent Publication No. 11-56846 特開2014−144443号公報Japanese Unexamined Patent Publication No. 2014-144443

しかし、上述のAGCを用いる方法では、受信回路の飽和防止には効果があるものの回路が飽和しないような場合にもゲインを下げてしまうため、ダイナミックレンジの有効活用という点では十分なものとは言えない。また、特許文献1の方法では、音声回路が飽和状態となってから検出および制御を開始するため、音声が歪んだ状態から記録を開始してしまう可能性がある。また、特許文献2の方法では、振動センサ(歪みゲージ)では空間を伝わる超音波帯域の音は検出できないという課題がある。 However, although the above-mentioned method using AGC is effective in preventing saturation of the receiving circuit, the gain is lowered even when the circuit is not saturated, so that it is sufficient in terms of effective utilization of the dynamic range. I can not say. Further, in the method of Patent Document 1, since the detection and control are started after the voice circuit is saturated, there is a possibility that the recording is started from the state where the voice is distorted. Further, the method of Patent Document 2 has a problem that the vibration sensor (strain gauge) cannot detect the sound in the ultrasonic band transmitted through the space.

そこで、本発明の目的は、超音波帯域の搬送波の影響による音声信号の歪みを低減することである。 Therefore, an object of the present invention is to reduce distortion of an audio signal due to the influence of a carrier wave in the ultrasonic band.

本発明の音声処理装置は、アナログ音声信号に対してアナログゲインでアナログゲイン制御を行うアナログゲイン部と、アナログ音声信号をデジタル音声信号に変換するアナログデジタル変換部と、デジタル音声信号に対してデジタルゲインでデジタルゲイン制御を行うデジタルゲイン部と、振動を検出する第1の振動検出部と、前記第1の振動検出部とは共振点が異なる振動を検出する第2の振動検出部と、前記第1の振動検出部の出力信号の絶対値が第1の閾値より小さい、または、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が第2の閾値より小さい場合には、前記アナログゲイン部に対して第1のアナログゲインを設定し、前記デジタルゲイン部に対して第1のデジタルゲインを設定し、前記第1の振動検出部の出力信号の絶対値が前記第1の閾値より大きく、且つ、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が前記第2の閾値より大きい場合には、前記アナログゲイン部に対して前記第1のアナログゲインより小さい第2のアナログゲインを設定し、前記デジタルゲイン部に対して前記第1のデジタルゲインより大きい第2のデジタルゲインを設定する制御部とを有する。 The audio processing device of the present invention has an analog gain unit that controls analog gain with analog gain for an analog audio signal, an analog digital conversion unit that converts an analog audio signal into a digital audio signal, and a digital for a digital audio signal. A digital gain unit that performs digital gain control by gain, a first vibration detection unit that detects vibration, a second vibration detection unit that detects vibration whose resonance point is different from that of the first vibration detection unit, and the above. The absolute value of the output signal of the first vibration detection unit is smaller than the first threshold value, or the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is the second. If it is smaller than the threshold value, the first analog gain is set for the analog gain unit, the first digital gain is set for the digital gain unit, and the output signal of the first vibration detection unit is set. When the absolute value is larger than the first threshold value and the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is larger than the second threshold value, the above A control unit that sets a second analog gain smaller than the first analog gain with respect to the analog gain unit and sets a second digital gain larger than the first digital gain with respect to the digital gain unit. Have.

本発明によれば、超音波帯域の搬送波の影響による音声信号の歪みを低減することができる。 According to the present invention, it is possible to reduce the distortion of the audio signal due to the influence of the carrier wave in the ultrasonic band.

撮像装置の構成例を説明するブロック図である。It is a block diagram explaining the configuration example of the image pickup apparatus. 振動ジャイロセンサの出力信号を表す図である。It is a figure which shows the output signal of a vibration gyro sensor. 第1の実施形態の音声の歪み防止制御を示すフローチャートである。It is a flowchart which shows the distortion prevention control of the voice of 1st Embodiment. 第2の実施形態の音声の歪み防止制御を示すフローチャートである。It is a flowchart which shows the distortion prevention control of the voice of 2nd Embodiment. 記録音声のFFT(高速フーリエ変換)を表す図である。It is a figure which shows FFT (Fast Fourier Transform) of the recorded voice.

(第1の実施形態)
図1は、本発明の第1の実施形態に係る撮像装置100の構成例を説明するためのブロック図である。撮像装置100は、音声処理装置であり、例えば、デジタルカメラ、ビデオカメラの他、スマートフォン、タブレット等である。以下、図1を参照して、撮像装置100の構成について説明する。
(First Embodiment)
FIG. 1 is a block diagram for explaining a configuration example of the image pickup apparatus 100 according to the first embodiment of the present invention. The image pickup device 100 is a sound processing device, and is, for example, a digital camera, a video camera, a smartphone, a tablet, or the like. Hereinafter, the configuration of the image pickup apparatus 100 will be described with reference to FIG.

撮像装置100は、撮像光学系を構成する撮影レンズ101およびシャッタ102と、撮像部103とを有する。撮影レンズ101は、ズームレンズおよびフォーカスレンズを含むレンズ群である。シャッタ102は、絞り機能を有し、撮像素子104に入射する光量を調節する。撮像部103は、光学像を電気信号(アナログ電気信号)に変換する撮像素子104を有する。撮像素子104は、電荷を蓄積することで画像を生成することが可能な、CCDまたはCMOSなどの固体撮像素子からなる電荷蓄積型の撮像手段である。撮像部103は、AFE(Analog Front End)133を有する。AFE133は、撮像素子104から出力されたアナログ電気信号(アナログ画像データ)に対してゲイン量の調節およびサンプリングなどを行う。なお、AFE133は、後述のシステム制御部109からの指示に応じて、取得された画像データに対するゲイン量の増幅や減少に関する調節を行う。さらに、撮像部103は、A/D変換部105を有する。A/D変換部105は、AFE133によりゲイン量が調節されたアナログ画像データをデジタル信号(デジタル画像データ)に変換する。 The image pickup apparatus 100 includes a photographing lens 101 and a shutter 102 constituting an image pickup optical system, and an image pickup unit 103. The photographing lens 101 is a lens group including a zoom lens and a focus lens. The shutter 102 has a diaphragm function and adjusts the amount of light incident on the image sensor 104. The image pickup unit 103 has an image pickup device 104 that converts an optical image into an electric signal (analog electric signal). The image pickup device 104 is a charge storage type image pickup means composed of a solid-state image pickup device such as a CCD or CMOS, which can generate an image by accumulating charges. The imaging unit 103 has an AFE (Analog Front End) 133. The AFE 133 adjusts the gain amount and samples the analog electric signal (analog image data) output from the image sensor 104. The AFE 133 adjusts the amplification or reduction of the gain amount with respect to the acquired image data in response to an instruction from the system control unit 109 described later. Further, the imaging unit 103 has an A / D conversion unit 105. The A / D conversion unit 105 converts the analog image data whose gain amount is adjusted by the AFE 133 into a digital signal (digital image data).

撮像装置100は、画像処理部106、メモリ制御部107、揮発性メモリ108、システム制御部109、表示部112、および不揮発性メモリ113を有する。撮像部103は、画像処理部106およびメモリ制御部107に対して、A/D変換処理部105により生成されたデジタル画像データを出力する。画像処理部106は、撮像部103から入力するデジタル画像データ、または、メモリ制御部107から入力するデジタル画像データに対して、所定の画素補間および縮小等のリサイズ処理、色変換処理等の処理を行う。また、画像処理部106は、システム制御部109からの指示に応じて、デジタル画像データに対するゲイン量の増幅または減少に関する調節を行う。すなわち、アナログ画像データおよびデジタル画像データの両方のゲイン量の調節は、システム制御部109によって設定されたゲイン量に基づいて行われる。 The image pickup apparatus 100 includes an image processing unit 106, a memory control unit 107, a volatile memory 108, a system control unit 109, a display unit 112, and a non-volatile memory 113. The image pickup unit 103 outputs the digital image data generated by the A / D conversion processing unit 105 to the image processing unit 106 and the memory control unit 107. The image processing unit 106 performs resize processing such as predetermined pixel interpolation and reduction, color conversion processing, and the like on the digital image data input from the imaging unit 103 or the digital image data input from the memory control unit 107. conduct. Further, the image processing unit 106 adjusts the amplification or reduction of the gain amount with respect to the digital image data in response to the instruction from the system control unit 109. That is, the adjustment of the gain amount of both the analog image data and the digital image data is performed based on the gain amount set by the system control unit 109.

画像処理部106は、各種の処理の後に、デジタル画像データをシステム制御部109に出力する。システム制御部109は、被写体の輝度値に応じて、露出制御およびフォーカス制御などを実行する。例えば、システム制御部109は、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、調光処理、およびAWB(オートホワイトバランス)処理等を行う。システム制御部109は、画像処理部106から入力するデジタル画像データを基に、被写体を撮像する際の露出量、および撮影レンズ101の位置などを算出する。そして、システム制御部109は、当該算出の結果に基づいた露出制御およびフォーカス制御を実行する。 The image processing unit 106 outputs digital image data to the system control unit 109 after various processes. The system control unit 109 executes exposure control, focus control, and the like according to the brightness value of the subject. For example, the system control unit 109 performs TTL (through-the-lens) AF (autofocus) processing, AE (autoexposure) processing, dimming processing, AWB (auto white balance) processing, and the like. The system control unit 109 calculates the amount of exposure when imaging a subject, the position of the photographing lens 101, and the like based on the digital image data input from the image processing unit 106. Then, the system control unit 109 executes exposure control and focus control based on the calculation result.

また、撮像部103から出力されるデジタル画像データは、画像処理部106とメモリ制御部107を介して、揮発性メモリ108に一時的に記録される。揮発性メモリ108は、一時的に記録され電源の供給がなくなると消去されるDRAMなどの記録素子からなる記録部である。揮発性メモリ108は、撮像部103によって取得されたデジタル画像データ、および表示部112に表示する表示用のアナログ画像データを記録することができる。また、揮発性メモリ108は、所定枚数の静止画、所定時間の動画、および音声データを記録することができる十分な記憶容量を有する。また、揮発性メモリ108は、画像表示用メモリを兼ねている。メモリ制御部107は、揮発性メモリ108に一時的に記録されたデジタル画像データを読み出す。 Further, the digital image data output from the image pickup unit 103 is temporarily recorded in the volatile memory 108 via the image processing unit 106 and the memory control unit 107. The volatile memory 108 is a recording unit including a recording element such as a DRAM that is temporarily recorded and erased when the power supply is cut off. The volatile memory 108 can record digital image data acquired by the imaging unit 103 and analog image data for display to be displayed on the display unit 112. Further, the volatile memory 108 has a sufficient storage capacity capable of recording a predetermined number of still images, a moving image for a predetermined time, and audio data. Further, the volatile memory 108 also serves as an image display memory. The memory control unit 107 reads out the digital image data temporarily recorded in the volatile memory 108.

不揮発性メモリ113は、電源が供給されていなくてもデータを保存可能なメモリであり、例えば、フラッシュメモリ等に代表されるEEPROM等である。不揮発性メモリ113は、種々のデータを格納している。例えば、不揮発性メモリ113は、撮像装置100において実行されるプログラム、動作用の定数、種々の露出条件、撮像装置100内の処理で使用する算出式などを格納している。なお、撮像装置100において実行されるプログラムは、図3および図4に示す処理を行うためのプログラムである。 The non-volatile memory 113 is a memory capable of storing data even when power is not supplied, and is, for example, an EEPROM represented by a flash memory or the like. The non-volatile memory 113 stores various data. For example, the non-volatile memory 113 stores a program executed in the image pickup apparatus 100, constants for operation, various exposure conditions, a calculation formula used in processing in the image pickup apparatus 100, and the like. The program executed by the image pickup apparatus 100 is a program for performing the processes shown in FIGS. 3 and 4.

システム制御部109は、例えばCPUであり、不揮発性メモリ113に記憶されている各種のプログラムに基づき、撮像装置100の全体的な動作を統括的に制御する。例えば、システム制御部109は、揮発性メモリ108、メモリ制御部107、および表示部112等を制御することにより、静止画および動画の表示制御を行う。また、システム制御部109は、画像処理部106、メモリ制御部107、および電源制御部115などに対して制御の指示を行う。 The system control unit 109 is, for example, a CPU, and comprehensively controls the overall operation of the image pickup apparatus 100 based on various programs stored in the non-volatile memory 113. For example, the system control unit 109 controls the display of still images and moving images by controlling the volatile memory 108, the memory control unit 107, the display unit 112, and the like. In addition, the system control unit 109 gives control instructions to the image processing unit 106, the memory control unit 107, the power supply control unit 115, and the like.

撮像装置100は、操作部116、シャッタボタン117およびモード切り替えスイッチ118を有する。操作部116は、表示部112に表示される種々の機能アイコンの選択等を行うための操作部材を有し、所定の機能アイコンが選択されることにより、場面毎に適宜機能が操作部材に割り当てられる。即ち、操作部116の操作部材は、各種の機能ボタンとして用いられる。 The image pickup apparatus 100 includes an operation unit 116, a shutter button 117, and a mode changeover switch 118. The operation unit 116 has an operation member for selecting various function icons displayed on the display unit 112, and when a predetermined function icon is selected, a function is appropriately assigned to the operation member for each scene. Be done. That is, the operation member of the operation unit 116 is used as various function buttons.

シャッタボタン117は、第1のスイッチSW1と、第2のスイッチSW2とを有する。第1のスイッチSW1は、シャッタボタン117の操作途中の半押し状態でオンとなり、撮影準備を指示する信号をシステム制御部109に出力する。システム制御部109は、第1のスイッチSW1がオンになった信号を入力すると、前述したAF処理、AE処理、調光処理、およびAWB処理等などの、露出制御およびフォーカス制御を開始する。 The shutter button 117 has a first switch SW1 and a second switch SW2. The first switch SW1 is turned on in a half-pressed state during the operation of the shutter button 117, and outputs a signal instructing the preparation for shooting to the system control unit 109. When the system control unit 109 inputs a signal in which the first switch SW1 is turned on, the system control unit 109 starts exposure control and focus control such as AF processing, AE processing, dimming processing, and AWB processing described above.

シャッタボタン117の第2のスイッチSW2は、全押し状態でオンとなり、被写体の撮像開始を指示する信号をシステム制御部109に出力する。システム制御部109は、シャッタボタン117の第2のスイッチSW2がオンになった信号を入力すると、撮像素子104において蓄積された電荷に応じたアナログ画像データを読み出す。A/D変換部105は、アナログ画像データをデジタル画像データに変換する。システム制御部109は、デジタル画像データを記録媒体111に書き込む。同時に、システム制御部109は、デジタル画像データを表示部112に表示させる。以上説明した一連の撮影動作が、シャッタボタン117の第2のスイッチSW2のオンに応じて行われる。モード切り替えスイッチ118は、撮像装置100の動作モード(静止画モード、動画モード、再生モード等)を切り替えるためのスイッチである。 The second switch SW2 of the shutter button 117 is turned on when fully pressed, and outputs a signal instructing the start of imaging of the subject to the system control unit 109. When the system control unit 109 inputs the signal that the second switch SW2 of the shutter button 117 is turned on, the system control unit 109 reads out the analog image data corresponding to the electric charge accumulated in the image sensor 104. The A / D conversion unit 105 converts analog image data into digital image data. The system control unit 109 writes the digital image data to the recording medium 111. At the same time, the system control unit 109 causes the display unit 112 to display the digital image data. The series of shooting operations described above is performed in response to the on of the second switch SW2 of the shutter button 117. The mode changeover switch 118 is a switch for switching the operation mode (still image mode, moving image mode, playback mode, etc.) of the image pickup apparatus 100.

撮像装置100は、電源部114および電源制御部115を有する。電源部114は、アルカリ電池またはリチウム電池等の一次電池、NiCd電池、NiMH電池、またはリチウムイオン電池等の二次電池、或いは、ACアダプタ等であり、電源制御部115へ電力を供給する。電源制御部115は、電池検出回路、DC−DCコンバータ、および通電ブロックを切り替えるスイッチ回路等を有する。電源制御部115は、電源部114における電池の装着の有無、電池の種類、電池残量等を検出し、その検出結果をシステム制御部109に出力する。そして、電源制御部115は、システム制御部109の指示に基づいて、DC−DCコンバータを制御し、必要な電圧を必要な期間各部へ供給する。 The image pickup apparatus 100 has a power supply unit 114 and a power supply control unit 115. The power supply unit 114 is a primary battery such as an alkaline battery or a lithium battery, a secondary battery such as a NiCd battery, a NiMH battery, or a lithium ion battery, an AC adapter, or the like, and supplies power to the power supply control unit 115. The power supply control unit 115 includes a battery detection circuit, a DC-DC converter, a switch circuit for switching an energization block, and the like. The power supply control unit 115 detects whether or not a battery is installed in the power supply unit 114, the type of battery, the remaining battery level, and the like, and outputs the detection result to the system control unit 109. Then, the power supply control unit 115 controls the DC-DC converter based on the instruction of the system control unit 109, and supplies a necessary voltage to each unit for a necessary period.

撮像装置100は、記録媒体111およびインターフェース(I/F)110を有する。インターフェース110は、記録媒体111が記録媒体スロット(不図示)に装着された際に、記録媒体111とシステム制御部109との間の通信を可能にするためのインターフェースである。 The image pickup apparatus 100 has a recording medium 111 and an interface (I / F) 110. The interface 110 is an interface for enabling communication between the recording medium 111 and the system control unit 109 when the recording medium 111 is installed in the recording medium slot (not shown).

撮像装置100は、音声入出力ブロック119を有する。音声入出力ブロック119は、マイク120から取り込んだ音声信号をA/D変換する音声入力ブロックと、記録された音声をD/A変換してヘッドフォン131から再生する音声出力ブロックとを有する。 The image pickup apparatus 100 has an audio input / output block 119. The audio input / output block 119 includes an audio input block that A / D-converts an audio signal captured from the microphone 120, and an audio output block that D / A-converts the recorded audio and reproduces the recorded audio from the headphone 131.

音声入出力ブロック119は、マイク120、マイクアンプ部121、ADC部122、デジタルフィルタ部123、デジタルゲイン部124、およびAGC125を有する。マイク120は、アナログ音声信号を取り込む。マイクアンプ部121は、アナログゲイン部であり、マイク120により取り込まれたアナログ音声信号に対して所定のアナログゲインで増幅することにより、アナログゲイン制御を行う。ADC部122は、アナログデジタル変換部であり、マイクアンプ部121が出力するアナログ音声信号をデジタル音声信号に変換する。デジタルフィルタ部123は、そのデジタル音声信号に対して、所定の周波数変更処理を行う。デジタルゲイン部124は、デジタルフィルタ部123が出力するデジタル音声信号に対して、所定のデジタルゲインでデジタルゲイン制御を行う。AGC125は、オートゲインコントロールブロックであり、デジタルゲイン部124が出力するデジタル音声信号に対して、所定のゲイン制御を行い、システム制御部109へ出力する。システム制御部109は、入力されたデジタル音声信号を任意のコーデックのフォーマットの音声データに変換し、変換した音声データを動画像記録データとともにインターフェース110を経由し、記録媒体111へ記録する。 The audio input / output block 119 includes a microphone 120, a microphone amplifier unit 121, an ADC unit 122, a digital filter unit 123, a digital gain unit 124, and an AGC 125. The microphone 120 captures an analog audio signal. The microphone amplifier unit 121 is an analog gain unit, and controls the analog gain by amplifying the analog audio signal captured by the microphone 120 with a predetermined analog gain. The ADC unit 122 is an analog-to-digital conversion unit, and converts an analog audio signal output by the microphone amplifier unit 121 into a digital audio signal. The digital filter unit 123 performs a predetermined frequency change process on the digital audio signal. The digital gain unit 124 performs digital gain control with a predetermined digital gain on the digital audio signal output by the digital filter unit 123. The AGC 125 is an auto gain control block, performs predetermined gain control on the digital audio signal output by the digital gain unit 124, and outputs the digital audio signal to the system control unit 109. The system control unit 109 converts the input digital audio signal into audio data in an arbitrary codec format, and records the converted audio data together with the moving image recording data on the recording medium 111 via the interface 110.

音声入出力ブロック119は、デジタルフィルタ部126、デジタルゲイン部127、AGC128、DAC部129、ヘッドフォンアンプ部130、およびヘッドフォン131を有する。システム制御部109は、記録媒体111へ記録された音声データを読み出し、デジタル音声信号をデジタルフィルタ部126に出力する。デジタルフィルタ部126は、そのデジタル音声信号に対して、所定の周波数変更処理を行う。デジタルゲイン部127は、デジタルフィルタ部126が出力するデジタル音声信号に対して、所定のデジタルゲイン制御を行う。AGC128は、オートゲインコントロールブロックであり、デジタルゲイン部127が出力するデジタル音声信号に対して、所定のゲイン制御を行う。DAC部129は、D/A変換部であり、AGC128が出力するデジタル音声信号をアナログ音声信号に変換する。ヘッドフォンアンプ部130は、そのアナログ音声信号に対して、所定のヘッドフォン再生ゲイン制御を行う。ヘッドフォン131は、ヘッドフォンアンプ部130が出力するアナログ音声信号を入力し、発音する。 The audio input / output block 119 includes a digital filter unit 126, a digital gain unit 127, an AGC 128, a DAC unit 129, a headphone amplifier unit 130, and a headphone 131. The system control unit 109 reads out the audio data recorded on the recording medium 111 and outputs the digital audio signal to the digital filter unit 126. The digital filter unit 126 performs a predetermined frequency change process on the digital audio signal. The digital gain unit 127 performs a predetermined digital gain control on the digital audio signal output by the digital filter unit 126. The AGC 128 is an auto gain control block, and performs predetermined gain control on a digital audio signal output by the digital gain unit 127. The DAC unit 129 is a D / A conversion unit, and converts a digital audio signal output by the AGC 128 into an analog audio signal. The headphone amplifier unit 130 controls a predetermined headphone reproduction gain with respect to the analog audio signal. The headphone 131 inputs and pronounces an analog audio signal output by the headphone amplifier unit 130.

撮像装置100は、振動ジャイロセンサ132を有する。振動ジャイロセンサ132は、X軸検出用振動ジャイロセンサ132x、Y軸検出用振動ジャイロセンサ132y、およびZ軸検出用振動ジャイロセンサ132zを有する。振動ジャイロセンサ132x、132yおよび132zは、それぞれ、振動検出部であり、相互に共振点(離調周波数)が異なる振動を検出する。振動ジャイロセンサ132は、使用者が手持ちで撮影(記録)動作を行う際に発生する低周波(例えば1〜10Hz程度)の振れ、いわゆる“手振れ”を低減するために使用される。具体的には、システム制御部109は、振動ジャイロセンサ132の出力信号(角速度信号)を増幅し、角速度信号を積分器により角度信号に変換し、角度信号を基に撮像部103を駆動し、振れを低減する。 The image pickup apparatus 100 has a vibration gyro sensor 132. The vibration gyro sensor 132 includes a vibration gyro sensor 132x for X-axis detection, a vibration gyro sensor 132y for Y-axis detection, and a vibration gyro sensor 132z for Z-axis detection. The vibration gyro sensors 132x, 132y and 132z are vibration detection units, respectively, and detect vibrations having different resonance points (detuning frequencies) from each other. The vibration gyro sensor 132 is used to reduce low-frequency (for example, about 1 to 10 Hz) vibration, so-called “camera shake”, which occurs when the user performs a shooting (recording) operation by hand. Specifically, the system control unit 109 amplifies the output signal (angular velocity signal) of the vibration gyro sensor 132, converts the angular velocity signal into an angular signal by an integrator, and drives the imaging unit 103 based on the angular signal. Reduce runout.

近年、振動ジャイロセンサ132を用いて振動検出を行う機能を備えた電子機器が多く存在する。振動ジャイロセンサ132は、デジタルカメラ、ビデオカメラ、スマートフォン等の画像・映像等を記録するための光学電子機器に多く使われている。振動ジャイロセンサ132は、水晶振動子を用いているため共振点(離調周波数)が存在し、その近辺では振動検出感度が通常域より高くなってしまう(感度がピークになってしまう)という特徴がある。 In recent years, there are many electronic devices having a function of detecting vibration using a vibration gyro sensor 132. The vibration gyro sensor 132 is widely used in optical electronic devices for recording images / videos such as digital cameras, video cameras, and smartphones. Since the vibration gyro sensor 132 uses a crystal oscillator, it has a resonance point (detuning frequency), and the vibration detection sensitivity becomes higher than the normal range (sensitivity peaks) in the vicinity thereof. There is.

振動ジャイロセンサ132は、“手振れ”検出等に用いる場合、数Hzの周波数の振動を検出すればよいため、通常は振動ジャイロセンサ132の共振点(離調周波数)近辺の振動は検出対象外である。しかし、指向性スピーカ(超音波スピーカ)に用いられている超音波帯域の搬送波は、振動ジャイロセンサ132の共振点(離調周波数)に近くなり、振動ジャイロセンサ132が高感度となることがある。振動ジャイロセンサ132x、132yおよび132zは、相互に共振点(離調周波数)が異なる。本実施形態は、この原理を利用し、指向性スピーカ(超音波スピーカ)の搬送波と共振点(離調周波数)が近い振動ジャイロセンサ132yだけの感度が上がるような場合に、指向性スピーカ(超音波スピーカ)が近くにあると判定する。 When the vibration gyro sensor 132 is used for "camera shake" detection or the like, it suffices to detect vibrations having a frequency of several Hz. be. However, the carrier wave in the ultrasonic band used for the directional speaker (ultrasonic speaker) is close to the resonance point (detuning frequency) of the vibration gyro sensor 132, and the vibration gyro sensor 132 may have high sensitivity. .. The vibration gyro sensors 132x, 132y and 132z have different resonance points (detuning frequencies) from each other. In this embodiment, this principle is used, and when the sensitivity of only the vibration gyro sensor 132y whose resonance point (detuning frequency) is close to the carrier of the directional speaker (ultrasonic speaker) is increased, the directional speaker (super) It is determined that the sound wave speaker) is nearby.

以下、システム制御部109が、振動ジャイロセンサ132の出力信号を用いて、指向性スピーカの近接状態を検知し、音声入力ブロックの飽和による音声の歪防止制御について、図2および図3を参照して説明する。 Hereinafter, the system control unit 109 detects the proximity state of the directional speaker using the output signal of the vibration gyro sensor 132, and refers to FIGS. 2 and 3 for control of preventing distortion of the voice due to saturation of the voice input block. I will explain.

図2(a)は、Y軸検出用振動ジャイロセンサ132yの出力信号(角速度信号)を表す図である。図2(b)は、X軸検出用振動ジャイロセンサ132xの出力信号(角速度信号)を表す図である。図2(c)は、Z軸検出用振動ジャイロセンサ132zの出力信号(角速度信号)を表す図である。振動ジャイロセンサ132x、132y及び132zは、それぞれ、角速度信号を出力する。 FIG. 2A is a diagram showing an output signal (angular velocity signal) of the vibration gyro sensor 132y for Y-axis detection. FIG. 2B is a diagram showing an output signal (angular velocity signal) of the vibration gyro sensor 132x for X-axis detection. FIG. 2C is a diagram showing an output signal (angular velocity signal) of the Z-axis detection vibration gyro sensor 132z. The vibration gyro sensors 132x, 132y and 132z each output an angular velocity signal.

図3は、第1の実施形態による撮像装置100の制御方法を示すフローチャートである。撮像装置100は、振動ジャイロセンサ132を用いた音声の歪み防止制御を行う。ステップS101では、システム制御部109は、ユーザの操作により操作部116内の電源スイッチのオンが指示されると、ステップS102に進む。 FIG. 3 is a flowchart showing a control method of the image pickup apparatus 100 according to the first embodiment. The image pickup apparatus 100 performs voice distortion prevention control using the vibration gyro sensor 132. In step S101, when the system control unit 109 is instructed to turn on the power switch in the operation unit 116 by the user's operation, the system control unit 109 proceeds to step S102.

ステップS102では、システム制御部109は、振動ジャイロセンサ132x、132yおよび132zの出力信号を受信する。次に、ステップS103では、システム制御部109は、Y軸検出用振動ジャイロセンサ132yの出力信号Youtの絶対値が閾値Yout_thより大きい継続時間Ytimeを検出する。そして、システム制御部109は、式(1)のように、Y軸検出用振動ジャイロセンサ132yの手振れ状態を判定するため、継続時間Ytimeが閾値Ytime_thより長いか否かを判定する。
Ytime > Ytime_th ・・・式(1)
In step S102, the system control unit 109 receives the output signals of the vibration gyro sensors 132x, 132y and 132z. Next, in step S103, the system control unit 109 detects a duration Ytime in which the absolute value of the output signal Yout of the Y-axis detection vibration gyro sensor 132y is larger than the threshold value Yout_th. Then, the system control unit 109 determines whether or not the duration Ytime is longer than the threshold value Ytime_th in order to determine the camera shake state of the Y-axis detection vibration gyro sensor 132y as in the equation (1).
Ytime> Ytime_th ・ ・ ・ Equation (1)

図2(a)の場合、Y軸検出用振動ジャイロセンサ132yの出力信号Youtの絶対値の閾値Yout_thは、0.4である。システム制御部109は、出力信号Youtの絶対値が閾値Yout_th(=0.4)より大きい継続時間Ytimeを検出する。また、継続時間Ytimeの閾値Ytime_thは、例えば1秒である。 In the case of FIG. 2A, the threshold value Yout_th of the absolute value of the output signal Yout of the vibration gyro sensor 132y for Y-axis detection is 0.4. The system control unit 109 detects a duration Ytime in which the absolute value of the output signal Youout is greater than the threshold value Yout_th (= 0.4). The threshold value Ytime_th of the duration Ytime is, for example, 1 second.

システム制御部109は、継続時間Ytimeが閾値Ytime_thより長い場合には、ステップS104に進み、継続時間Ytimeが閾値Ytime_thより長くない場合には、ステップS110に進む。 The system control unit 109 proceeds to step S104 when the duration Ytime is longer than the threshold value Ytime_th, and proceeds to step S110 when the duration Ytime is not longer than the threshold value Ytime_th.

ステップS104では、システム制御部109は、Y軸検出用振動ジャイロセンサ132yの出力信号Youtと、X軸検出用振動ジャイロセンサ132xの出力信号Xoutとの差分Yout−Xoutを演算する。そして、システム制御部109は、差分Yout−Xoutが閾値ΔYXout_thより大きい継続時間YXtimeを検出する。 In step S104, the system control unit 109 calculates the difference Yout-Xout between the output signal Yout of the Y-axis detection vibration gyro sensor 132y and the output signal Xout of the X-axis detection vibration gyro sensor 132x. Then, the system control unit 109 detects a duration YXtime in which the difference Yout-Xout is larger than the threshold value ΔYXout_th.

同様に、システム制御部109は、Y軸検出用振動ジャイロセンサ132yの出力信号Youtと、Z軸検出用振動ジャイロセンサ132zの出力信号Zoutとの差分Yout−Zoutを演算する。そして、システム制御部109は、差分Yout−Zoutが閾値ΔYZout_thより大きい継続時間YZtimeを検出する。 Similarly, the system control unit 109 calculates the difference Yout-Zout between the output signal Yout of the Y-axis detection vibration gyro sensor 132y and the output signal Zout of the Z-axis detection vibration gyro sensor 132z. Then, the system control unit 109 detects a duration YZtime in which the difference Yout−Zout is larger than the threshold value ΔYZout_th.

そして、システム制御部109は、式(2)のように、継続時間YXtimeが閾値YXtime_thより長く、且つ、継続時間YZtimeが閾値YZtime_thより長いか否かを判定する。これにより、システム制御部109は、出力信号Youtが出力信号XoutおよびZoutより大きいか否かを判定することができる。
YXtime > YXtime_th 且つ
YZtime > YZtime_th ・・・式(2)
Then, the system control unit 109 determines whether or not the duration YXtime is longer than the threshold value YXtime_th and the duration YZtime is longer than the threshold value YZtime_th, as in the equation (2). Thereby, the system control unit 109 can determine whether or not the output signal Youout is larger than the output signals Xout and Zout.
YXtime > YXtime_th and YZtime > YZtime_th ・ ・ ・ Equation (2)

システム制御部109は、継続時間YXtimeが閾値YXtime_thより長く、且つ、継続時間YZtimeが閾値YZtime_thより長い場合には、ステップS105に進む。また、システム制御部109は、継続時間YXtimeが閾値YXtime_thより長くない、または、継続時間YZtimeが閾値YZtime_thより長くない場合には、ステップS110に進む。 When the duration YXtime is longer than the threshold value YXtime_th and the duration YZtime is longer than the threshold value YZtime_th, the system control unit 109 proceeds to step S105. If the duration YXtime is not longer than the threshold YXtime_th, or the duration YZtime is not longer than the threshold YZtime_th, the system control unit 109 proceeds to step S110.

ステップS105では、システム制御部109は、音声入出力ブロック119内のマイクアンプ部121のアナログゲインと、デジタルゲイン部124のデジタルゲインとのを配分を、歪み防止用のゲイン設定の配分に決定する。 In step S105, the system control unit 109 determines the distribution of the analog gain of the microphone amplifier unit 121 in the audio input / output block 119 and the digital gain of the digital gain unit 124 as the distribution of the gain setting for distortion prevention. ..

システム制御部109は、通常、アナログゲインとデジタルゲインの総和の記録ゲインを決める場合には、アナログゲインを大きくし、デジタルゲインを小さくする。このゲイン配分により、ノイズ成分がデジタルゲイン部124のデジタルゲイン制御によって増幅されてしまうことを低減でき、S/Nの観点として有利となる。一方、指向性スピーカから搬送波として出力される超音波帯域の高い音圧成分の影響により、マイク120が取得した主音声は、飽和しない音圧レベルであっても、ADC部122で飽和してしまう不都合が生じることがある。 The system control unit 109 usually increases the analog gain and decreases the digital gain when determining the recording gain of the sum of the analog gain and the digital gain. By this gain distribution, it is possible to reduce that the noise component is amplified by the digital gain control of the digital gain unit 124, which is advantageous from the viewpoint of S / N. On the other hand, due to the influence of the high sound pressure component in the ultrasonic band output from the directional speaker as a carrier, the main sound acquired by the microphone 120 is saturated in the ADC section 122 even if the sound pressure level is not saturated. Inconvenience may occur.

よって、ステップS105では、システム制御部109は、ADC部122が飽和しないように、前段のマイクアンプ部121のアナログゲインを小さくし、その分、後段のデジタルゲイン部124のデジタルゲインを大きくするように設定の配分を決定する。これにより、歪み防止用のゲイン設定の配分を行うことができる。このゲイン配分設定により、S/Nの観点としては不利となるが、ADC部122で飽和することによる更に大きなノイズ成分(歪み)の発生を低減することができる。その後、システム制御部109は、ステップS106に進む。 Therefore, in step S105, the system control unit 109 reduces the analog gain of the microphone amplifier unit 121 in the front stage and increases the digital gain of the digital gain unit 124 in the rear stage by that amount so that the ADC unit 122 does not saturate. Determine the distribution of settings to. As a result, the gain setting for preventing distortion can be distributed. This gain distribution setting is disadvantageous from the viewpoint of S / N, but it is possible to reduce the generation of a larger noise component (distortion) due to saturation in the ADC section 122. After that, the system control unit 109 proceeds to step S106.

ステップS110では、システム制御部109は、マイクアンプ部121のアナログゲインと、デジタルゲイン部124のデジタルゲインとのを配分を、通常のゲイン設定の配分に決定する。具体的には、システム制御部109は、ステップS105の配分に比べ、マイクアンプ部121のアナログゲインを大きくし、その分、デジタルゲイン部124のデジタルゲインを小さくするように設定の配分を決定する。ステップS110で決定されるアナログゲインは、ステップS105で決定されるアナログゲインより大きい。ステップS110で決定されるデジタルゲインは、ステップS105で決定されるデジタルゲインより小さい。ステップS110で決定されるアナログゲインとデジタルゲインの総和は、ステップS105で決定されるアナログゲインとデジタルゲインの総和と同じである。これにより、通常のゲイン設定の配分を行うことができ、S/Nを向上させることができる。その後、システム制御部109は、ステップS106に進む。 In step S110, the system control unit 109 determines the distribution of the analog gain of the microphone amplifier unit 121 and the digital gain of the digital gain unit 124 as the distribution of the normal gain setting. Specifically, the system control unit 109 determines the distribution of settings so that the analog gain of the microphone amplifier unit 121 is increased and the digital gain of the digital gain unit 124 is decreased by that amount as compared with the distribution of step S105. .. The analog gain determined in step S110 is greater than the analog gain determined in step S105. The digital gain determined in step S110 is smaller than the digital gain determined in step S105. The sum of the analog gain and the digital gain determined in step S110 is the same as the sum of the analog gain and the digital gain determined in step S105. As a result, the normal gain setting can be distributed, and the S / N can be improved. After that, the system control unit 109 proceeds to step S106.

ステップS106では、システム制御部109は、ユーザの操作部116の操作により音声記録を伴う動画記録の開始を指示されたか否か、または、動画記録中であるか否かを判定する。システム制御部109は、音声記録を伴う動画記録の開始を指示された場合、または、動画記録中である場合には、ステップS107に進む。また、システム制御部109は、音声記録を伴う動画記録の開始を指示されておらず、且つ、動画記録中でない場合には、ステップS102に戻る。 In step S106, the system control unit 109 determines whether or not the operation of the user's operation unit 116 has instructed the start of the moving image recording accompanied by the voice recording, or whether or not the moving image recording is in progress. The system control unit 109 proceeds to step S107 when instructed to start video recording accompanied by voice recording or when video recording is in progress. Further, the system control unit 109 returns to step S102 when the start of the moving image recording accompanied by the voice recording is not instructed and the moving image recording is not in progress.

ステップS107では、システム制御部109は、ステップS105またはS110で決定された配分に基づき、マイクアンプ部121のアナログゲインを設定し、デジタルゲイン部124のデジタルゲインを設定する。マイク120は、音声をアナログ音声信号に変換する。マイクアンプ部121は、そのアナログ音声信号に対して、設定されたアナログゲインでアナログゲイン制御を行う。ADC部122は、アナログ音声信号をデジタル音声信号に変換する。デジタルフィルタ部123は、そのデジタル音声信号に対してフィルタ処理を行う。デジタルゲイン部124は、デジタル音声信号に対して、設定されたデジタルゲインでデジタルゲイン制御を行う。AGC部125は、デジタル音声信号に対してオートゲイン制御を行う。システム制御部109は、AGC部125の出力信号を基に、音声データおよび動画データを、インターフェース110を介して記録媒体111に記録する。その後、システム制御部109は、ステップS108に進む。 In step S107, the system control unit 109 sets the analog gain of the microphone amplifier unit 121 and sets the digital gain of the digital gain unit 124 based on the distribution determined in step S105 or S110. The microphone 120 converts the voice into an analog voice signal. The microphone amplifier unit 121 performs analog gain control on the analog audio signal with a set analog gain. The ADC unit 122 converts an analog audio signal into a digital audio signal. The digital filter unit 123 performs a filter process on the digital audio signal. The digital gain unit 124 performs digital gain control on the digital audio signal with the set digital gain. The AGC unit 125 performs auto gain control on the digital audio signal. The system control unit 109 records audio data and moving image data on the recording medium 111 via the interface 110 based on the output signal of the AGC unit 125. After that, the system control unit 109 proceeds to step S108.

ステップS108では、システム制御部109は、ユーザの操作部116の操作により音声記録を伴う動画記録の停止を指示されたか否かを判定する。システム制御部109は、音声記録を伴う動画記録の停止を指示された場合には、ステップS109に進み、音声記録を伴う動画記録の停止を指示されていない場合には、ステップS102に戻る。 In step S108, the system control unit 109 determines whether or not the user has been instructed to stop the moving image recording accompanied by the voice recording by the operation of the operation unit 116. The system control unit 109 proceeds to step S109 when instructed to stop the moving image recording accompanied by the voice recording, and returns to step S102 when not instructed to stop the moving image recording accompanied by the voice recording.

ステップS109では、システム制御部109は、ユーザの操作により操作部116内の電源スイッチのオフが指示されたか否かを判定する。システム制御部109は、電源スイッチのオフが指示された場合には、図3の処理を終了し、電源スイッチのオフが指示されていない場合には、ステップS102に戻る。 In step S109, the system control unit 109 determines whether or not the power switch in the operation unit 116 has been instructed to be turned off by the user's operation. The system control unit 109 ends the process of FIG. 3 when the power switch is instructed to be turned off, and returns to step S102 when the power switch is not instructed to be turned off.

上記の通り、ステップS104では、システム制御部109は、振動ジャイロセンサ132x、132yおよび132zの中で、指向性スピーカの搬送波の周波数に近い共振点(離調周波数)を持つ振動ジャイロセンサ132yだけの感度が高いかを判定する。システム制御部109は、振動ジャイロセンサ132yだけの感度が高い場合には、撮像装置100の近くに指向性スピーカが存在すると判定し、ステップS105に進む。ステップS105では、システム制御部109は、音声記録用ゲイン設定のため、マイクアンプ部121のアナログゲインを小さくし、デジタルゲイン部124のデジタルゲインを大きくする。これにより、ADC部122の飽和を低減し、ノイズ成分(歪み)の発生を低減することができる。 As described above, in step S104, the system control unit 109 has only the vibration gyro sensor 132y having a resonance point (detuning frequency) close to the frequency of the carrier wave of the directional speaker among the vibration gyro sensors 132x, 132y and 132z. Determine if the sensitivity is high. When the sensitivity of only the vibration gyro sensor 132y is high, the system control unit 109 determines that the directional speaker exists near the image pickup device 100, and proceeds to step S105. In step S105, the system control unit 109 reduces the analog gain of the microphone amplifier unit 121 and increases the digital gain of the digital gain unit 124 in order to set the gain for audio recording. As a result, the saturation of the ADC unit 122 can be reduced, and the generation of noise components (distortion) can be reduced.

(第2の実施形態)
図4は、本発明の第2の実施形態による撮像装置100の制御方法を示すフローチャートである。以下、本実施形態が第1の実施形態と異なる点を説明する。撮像装置100は、振動ジャイロセンサ132の出力信号と指向性スピーカの搬送波の折り返し雑音周波数の検知を用いて指向性スピーカの近接を検知し、音声のアナログゲインを下げてADC部122の飽和による音声の歪み防止制御を行う。
(Second Embodiment)
FIG. 4 is a flowchart showing a control method of the image pickup apparatus 100 according to the second embodiment of the present invention. Hereinafter, the points that the present embodiment differs from the first embodiment will be described. The image pickup apparatus 100 detects the proximity of the directional speaker by using the output signal of the vibration gyro sensor 132 and the detection of the aliasing noise frequency of the carrier of the directional speaker, lowers the analog gain of the voice, and reduces the voice due to the saturation of the ADC unit 122. Distortion prevention control is performed.

ステップS201では、システム制御部109は、ユーザの操作により操作部116内の電源スイッチのオンが指示されると、ステップS202に進む。ステップS202では、システム制御部109は、振動ジャイロセンサ132x、132yおよび132zの出力信号を受信する。次に、ステップS203では、システム制御部109は、式(1)のように、継続時間Ytimeが閾値Ytime_thより長いか否かを判定する。システム制御部109は、継続時間Ytimeが閾値Ytime_thより長い場合には、ステップS204に進み、継続時間Ytimeが閾値Ytime_thより長くない場合には、ステップS213に進む。 In step S201, the system control unit 109 proceeds to step S202 when the power switch in the operation unit 116 is instructed to be turned on by the user's operation. In step S202, the system control unit 109 receives the output signals of the vibration gyro sensors 132x, 132y and 132z. Next, in step S203, the system control unit 109 determines whether or not the duration Ytime is longer than the threshold value Ytime_th as in the equation (1). The system control unit 109 proceeds to step S204 when the duration Ytime is longer than the threshold value Ytime_th, and proceeds to step S213 when the duration Ytime is not longer than the threshold value Ytime_th.

ステップS204では、システム制御部109は、式(2)のように、継続時間YXtimeが閾値YXtime_thより長く、且つ、継続時間YZtimeが閾値YZtime_thより長いか否かを判定する。システム制御部109は、継続時間YXtimeが閾値YXtime_thより長く、且つ、継続時間YZtimeが閾値YZtime_thより長い場合には、ステップS205に進む。また、システム制御部109は、継続時間YXtimeが閾値YXtime_thより長くない、または、継続時間YZtimeが閾値YZtime_thより長くない場合には、ステップS213に進む。 In step S204, the system control unit 109 determines whether or not the duration YXtime is longer than the threshold value YXtime_th and the duration YZtime is longer than the threshold value YZtime_th, as in the equation (2). When the duration YXtime is longer than the threshold value YXtime_th and the duration YZtime is longer than the threshold value YZtime_th, the system control unit 109 proceeds to step S205. If the duration YXtime is not longer than the threshold YXtime_th, or the duration YZtime is not longer than the threshold YZtime_th, the system control unit 109 proceeds to step S213.

ステップS205では、システム制御部109は、音声入出力ブロック119内の音声回路を起動する。次に、ステップS206では、システム制御部109は、AGC部125が出力するデジタル音声信号を高速フーリエ変換(FFT)し、指向性スピーカの搬送波による折り返し雑音の周波数を検出する。 In step S205, the system control unit 109 activates the audio circuit in the audio input / output block 119. Next, in step S206, the system control unit 109 performs a fast Fourier transform (FFT) on the digital audio signal output by the AGC unit 125, and detects the frequency of aliasing noise due to the carrier wave of the directional speaker.

図5は、ステップS206の記録音声の高速フーリエ変換後の高速フーリエ変換データを表す図である。高速フーリエ変換データは、記録音圧の周波数分布を示す。指向性スピーカの搬送波は、40KHzである。ADC部122によるデジタル音声信号のサンプリング周波数は、48KHzである。折り返し雑音は、指向性スピーカの搬送波の周波数40KHzに対し、可聴帯域を想定したサンプリング周波数48KHzを使用した場合、その差分である8KHzに本来存在しないはずの雑音周波数として発生する雑音である。折り返し雑音の周波数8KHzは、デジタル音声信号のサンプリング周波数48KHzと超音波帯域の搬送波の周波数40KHzとの差分である。システム制御部109は、指向性スピーカの搬送波(信号)による折り返し雑音の周波数8KHzを検出する。その後、システム制御部109は、ステップS207へ進む。 FIG. 5 is a diagram showing the fast Fourier transform data after the fast Fourier transform of the recorded voice in step S206. The Fast Fourier Transform data shows the frequency distribution of the recorded sound pressure. The carrier wave of the directional speaker is 40 KHz. The sampling frequency of the digital audio signal by the ADC unit 122 is 48 KHz. Aliasing noise is noise that occurs as a noise frequency that should not originally exist in the difference of 8 KHz when a sampling frequency of 48 KHz assuming an audible band is used with respect to a carrier frequency of 40 KHz of a directional speaker. The frequency of aliasing noise of 8 KHz is the difference between the sampling frequency of the digital audio signal of 48 KHz and the frequency of the carrier wave in the ultrasonic band of 40 KHz. The system control unit 109 detects the frequency of aliasing noise of 8 KHz due to the carrier wave (signal) of the directional speaker. After that, the system control unit 109 proceeds to step S207.

ステップS207では、システム制御部109は、折り返し雑音の周波数におけるデジタル音声信号レベルAliasingを検出する。そして、システム制御部109は、式(3)のように、折り返し雑音の周波数におけるデジタル音声信号レベルAliasingが閾値Aliasing_thより大きいか否かを判定する。
Aliasing > Aliasing_th ・・・式(3)
In step S207, the system control unit 109 detects the digital audio signal level Aliasing at the frequency of aliasing noise. Then, the system control unit 109 determines whether or not the digital audio signal level Aliasing at the frequency of the aliasing noise is larger than the threshold value Aliasing_th as in the equation (3).
Aliasing> Aliasing_th ・ ・ ・ Equation (3)

システム制御部109は、デジタル音声信号レベルAliasingが閾値Aliasing_thより大きい場合には、ステップS208に進む。また、システム制御部109は、デジタル音声信号レベルAliasingが閾値Aliasing_thより大きくない場合には、ステップS213に進む。 When the digital audio signal level Aliasing is larger than the threshold value Aliasing_th, the system control unit 109 proceeds to step S208. Further, if the digital audio signal level Aliasing is not larger than the threshold value Aliasing_th, the system control unit 109 proceeds to step S213.

なお、ステップS207では、システム制御部109は、ステップS203およびS204と同様に、継続時間の判定を行ってもよい。その場合、システム制御部109は、折り返し雑音の周波数におけるデジタル音声信号レベルAliasingが閾値Aliasing_thより大きい継続時間が閾値Atime_thより長い場合には、ステップS208に進む。また、システム制御部109は、折り返し雑音の周波数におけるデジタル音声信号レベルAliasingが閾値Aliasing_thより大きい継続時間が閾値Atime_thより長くない場合には、ステップS213に進む。 In step S207, the system control unit 109 may determine the duration as in steps S203 and S204. In that case, the system control unit 109 proceeds to step S208 when the duration of the digital audio signal level Aliasing at the frequency of aliasing noise is larger than the threshold value Aliasing_th and longer than the threshold value Time_th. Further, the system control unit 109 proceeds to step S213 when the duration of the digital audio signal level Aliasing at the frequency of the aliasing noise is larger than the threshold value Aliasing_th and is not longer than the threshold value Time_th.

ステップS208では、システム制御部109は、マイクアンプ部121のアナログゲインと、デジタルゲイン部124のデジタルゲインとの配分を、歪み防止用のゲイン設定の配分に決定する。具体的には、システム制御部109は、ADC部122が飽和しないように、前段のマイクアンプ部121のアナログゲインを下げ、その分、後段のデジタルゲイン部124のデジタルゲインを上げるように設定の配分を決定する。これにより、ADC部122の飽和を低減し、ノイズ成分(歪み)の発生を低減することができる。その後、システム制御部109は、ステップS209に進む。 In step S208, the system control unit 109 determines the distribution of the analog gain of the microphone amplifier unit 121 and the digital gain of the digital gain unit 124 as the distribution of the gain setting for distortion prevention. Specifically, the system control unit 109 is set to lower the analog gain of the microphone amplifier unit 121 in the front stage and increase the digital gain of the digital gain unit 124 in the rear stage by that amount so that the ADC unit 122 is not saturated. Determine the allocation. As a result, the saturation of the ADC unit 122 can be reduced, and the generation of noise components (distortion) can be reduced. After that, the system control unit 109 proceeds to step S209.

ステップS213では、システム制御部109は、マイクアンプ部121のアナログゲインと、デジタルゲイン部124のデジタルゲインとのを配分を、通常のゲイン設定の配分に決定する。具体的には、システム制御部109は、ステップS208の配分に比べ、マイクアンプ部121のアナログゲインの設定値を上げ、その分、デジタルゲイン部124のデジタルゲインを下げるように設定の配分を決定する。これにより、通常のゲイン設定の配分を行うことができ、S/Nを向上させることができる。その後、システム制御部109は、ステップS209に進む。 In step S213, the system control unit 109 determines the distribution of the analog gain of the microphone amplifier unit 121 and the digital gain of the digital gain unit 124 as the distribution of the normal gain setting. Specifically, the system control unit 109 determines the distribution of the settings so as to increase the analog gain setting value of the microphone amplifier unit 121 and decrease the digital gain of the digital gain unit 124 by that amount, as compared with the distribution in step S208. do. As a result, the normal gain setting can be distributed, and the S / N can be improved. After that, the system control unit 109 proceeds to step S209.

ステップS209では、システム制御部109は、ユーザの操作部116の操作により音声記録を伴う動画記録の開始を指示されたか否か、または、動画記録中であるか否かを判定する。システム制御部109は、音声記録を伴う動画記録の開始を指示された場合、または、動画記録中である場合には、ステップS210に進む。また、システム制御部109は、音声記録を伴う動画記録の開始を指示されておらず、且つ、動画記録中でない場合には、ステップS202に戻る。 In step S209, the system control unit 109 determines whether or not the operation of the user's operation unit 116 has instructed the start of the moving image recording accompanied by the voice recording, or whether or not the moving image recording is in progress. The system control unit 109 proceeds to step S210 when instructed to start video recording accompanied by voice recording or when video recording is in progress. Further, the system control unit 109 returns to step S202 when the start of the moving image recording accompanied by the voice recording is not instructed and the moving image recording is not in progress.

ステップS210では、システム制御部109は、ステップS208またはS213で決定された配分に基づき、マイクアンプ部121のアナログゲインを設定し、デジタルゲイン部124のデジタルゲインを設定する。マイクアンプ部121は、アナログ音声信号に対して、設定されたアナログゲインでアナログゲイン制御を行う。デジタルゲイン部124は、デジタル音声信号に対して、設定されたデジタルゲインでデジタルゲイン制御を行う。システム制御部109は、AGC部125の出力信号を基に、音声データおよび動画データを、インターフェース110を介して記録媒体111に記録する。その後、システム制御部109は、ステップS211に進む。 In step S210, the system control unit 109 sets the analog gain of the microphone amplifier unit 121 and sets the digital gain of the digital gain unit 124 based on the distribution determined in step S208 or S213. The microphone amplifier unit 121 performs analog gain control on the analog audio signal with the set analog gain. The digital gain unit 124 performs digital gain control on the digital audio signal with the set digital gain. The system control unit 109 records audio data and moving image data on the recording medium 111 via the interface 110 based on the output signal of the AGC unit 125. After that, the system control unit 109 proceeds to step S211.

ステップS211では、システム制御部109は、ユーザの操作部116の操作により音声記録を伴う動画記録の停止を指示されたか否かを判定する。システム制御部109は、音声記録を伴う動画記録の停止を指示された場合には、ステップS212に進み、音声記録を伴う動画記録の停止を指示されていない場合には、ステップS202に戻る。 In step S211 the system control unit 109 determines whether or not the user has been instructed to stop the moving image recording accompanied by the voice recording by the operation of the operation unit 116. The system control unit 109 proceeds to step S212 when instructed to stop the moving image recording accompanied by the voice recording, and returns to step S202 when not instructed to stop the moving image recording accompanied by the voice recording.

ステップS212では、システム制御部109は、ユーザの操作により操作部116内の電源スイッチのオフが指示されたか否かを判定する。システム制御部109は、電源スイッチのオフが指示された場合には、図4の処理を終了し、電源スイッチのオフが指示されていない場合には、ステップS202に戻る。 In step S212, the system control unit 109 determines whether or not the power switch in the operation unit 116 has been instructed to be turned off by the user's operation. The system control unit 109 ends the process of FIG. 4 when the power switch is instructed to be turned off, and returns to step S202 when the power switch is not instructed to be turned off.

上記の通り、ステップS204では、システム制御部109は、振動ジャイロセンサ132x、132yおよび132zの中で、指向性スピーカの搬送波の周波数に近い共振点(離調周波数)を持つ振動ジャイロセンサ132yだけの感度が高いかを判定する。ステップS207では、システム制御部109は、指向性スピーカの折り返し雑音の周波数におけるデジタル音声信号レベルAliasingが閾値Aliasing_thより大きい場合には、撮像装置100の近くに指向性スピーカが存在すると判定する。ステップS208では、システム制御部109は、マイクアンプ部121のアナログゲインを下げ、デジタルゲイン部124のデジタルゲインを上げることで、ADC部122の飽和を低減し、ノイズ成分(歪み)の発生を低減することができる。 As described above, in step S204, the system control unit 109 has only the vibration gyro sensor 132y having a resonance point (detuning frequency) close to the frequency of the carrier wave of the directional speaker among the vibration gyro sensors 132x, 132y and 132z. Determine if the sensitivity is high. In step S207, the system control unit 109 determines that the directional speaker exists near the image pickup apparatus 100 when the digital audio signal level Aliasing at the frequency of the aliasing noise of the directional speaker is larger than the threshold Aliasing_th. In step S208, the system control unit 109 lowers the analog gain of the microphone amplifier unit 121 and raises the digital gain of the digital gain unit 124 to reduce the saturation of the ADC unit 122 and reduce the generation of noise components (distortion). can do.

第1および第2の実施形態によれば、システム制御部109は、超音波帯域の搬送波の影響により、ADC部122が飽和状態となる前に飽和状態を予測検出することができる。システム制御部109は、超音波帯域の搬送波が存在しない場合には、通常のゲイン設定の配分により、ダイナミックレンジを確保し、S/Nを向上させる。また、システム制御部109は、超音波帯域の搬送波が存在する場合には、歪み防止用のゲイン設定の配分により、ADC部122で飽和することによる大きなノイズ成分(歪み)の発生を低減することができる。 According to the first and second embodiments, the system control unit 109 can predict and detect the saturation state before the ADC unit 122 becomes saturated due to the influence of the carrier wave in the ultrasonic band. When the carrier wave in the ultrasonic band does not exist, the system control unit 109 secures the dynamic range and improves the S / N by allocating the normal gain setting. Further, when a carrier wave in the ultrasonic band is present, the system control unit 109 reduces the generation of a large noise component (distortion) due to saturation in the ADC unit 122 by allocating the gain setting for distortion prevention. Can be done.

以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。上述した実施形態では、システム制御部109は、振動ジャイロセンサ132の出力信号を用い、指向性スピーカが近くに存在する場合には、音声のアナログゲインとデジタルゲインの配分を固定値として変更した。この制御より、音声のADC部122の飽和を防止する例を示したが、この実施形態の動作に限定されない。 Although the preferred embodiments of the present invention have been described above, the present invention is not limited to these embodiments, and various modifications and modifications can be made within the scope of the gist thereof. In the above-described embodiment, the system control unit 109 uses the output signal of the vibration gyro sensor 132, and when the directional speaker is present nearby, the distribution of the analog gain and the digital gain of the voice is changed as a fixed value. Although an example of preventing saturation of the voice ADC unit 122 is shown by this control, the operation is not limited to the operation of this embodiment.

例えば、システム制御部109は、振動ジャイロセンサ132の出力信号のレベルに応じて、アナログゲインとデジタルゲインの配分を変更してもよい。Y軸検出用振動ジャイロセンサ132yに対する他の軸の振動ジャイロセンサ132xおよび132zの出力信号の差分が大きいほど、ADC部122の飽和状態が強くなる。そのため、システム制御部109は、出力信号の差分に応じてアナログゲインの下げ幅を大きく変更してもよい。 For example, the system control unit 109 may change the distribution of the analog gain and the digital gain according to the level of the output signal of the vibration gyro sensor 132. The larger the difference between the output signals of the vibration gyro sensors 132x and 132z of the other axes with respect to the vibration gyro sensor 132y for Y-axis detection, the stronger the saturation state of the ADC unit 122. Therefore, the system control unit 109 may greatly change the reduction range of the analog gain according to the difference between the output signals.

また、システム制御部109は、アナログゲインとデジタルゲインの配分を大きく変更した場合、切り替わり時にノイズ音(プツ音)が発生するため、アナログゲインとデジタルゲインを少しずつ変化させることでノイズ音(プツ音)を低減するようにしてもよい。ステップS107またはS210では、システム制御部109は、現在のアナログゲインおよびデジタルゲインからステップS105、S110、S208またはS213で決定されたアナログゲインおよびデジタルゲインに、複数ステップで変化させる。 Further, when the distribution of the analog gain and the digital gain is significantly changed, the system control unit 109 generates a noise sound (putting sound) at the time of switching. Therefore, the system control unit 109 changes the analog gain and the digital gain little by little to make a noise sound (putting sound). Sound) may be reduced. In step S107 or S210, the system control unit 109 changes the current analog gain and digital gain from the analog gain and digital gain determined in steps S105, S110, S208 or S213 in a plurality of steps.

また、システム制御部109は、ステップS103、S104、S203、S204およびS207では、閾値を用いて比較した。しかし、比較対象値が頻繁に閾値をまたぐことが繰り返されるような場合は、アナログゲインとデジタルゲインの配分が頻繁に変わってしまい、それに伴い、S/Nの変化および切り替わり時のノイズ音(プツ音)が目立ってしまう。そこで、システム制御部109は、ステップS103、S104、S203およびS204では、それぞれの閾値に対してヒステリシス特性を持つ比較を行ってもよい。 Further, the system control unit 109 compared using the threshold value in steps S103, S104, S203, S204 and S207. However, when the value to be compared frequently crosses the threshold value repeatedly, the distribution of analog gain and digital gain changes frequently, and accordingly, the S / N changes and the noise sound at the time of switching (puts). The sound) stands out. Therefore, in steps S103, S104, S203, and S204, the system control unit 109 may make a comparison having a hysteresis characteristic with respect to each threshold value.

109 システム制御部、119 音声入出力ブロック、121 マイクアンプ部、122 ADC部、124 デジタルゲイン部、132,132x,132y,132z 振動ジャイロセンサ 109 System control unit, 119 audio input / output block, 121 microphone amplifier unit, 122 ADC unit, 124 digital gain unit, 132, 132x, 132y, 132z vibration gyro sensor

Claims (14)

アナログ音声信号に対してアナログゲインでアナログゲイン制御を行うアナログゲイン部と、
アナログ音声信号をデジタル音声信号に変換するアナログデジタル変換部と、
デジタル音声信号に対してデジタルゲインでデジタルゲイン制御を行うデジタルゲイン部と、
振動を検出する第1の振動検出部と、
前記第1の振動検出部とは共振点が異なる振動を検出する第2の振動検出部と、
前記第1の振動検出部の出力信号の絶対値が第1の閾値より小さい、または、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が第2の閾値より小さい場合には、前記アナログゲイン部に対して第1のアナログゲインを設定し、前記デジタルゲイン部に対して第1のデジタルゲインを設定し、前記第1の振動検出部の出力信号の絶対値が前記第1の閾値より大きく、且つ、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が前記第2の閾値より大きい場合には、前記アナログゲイン部に対して前記第1のアナログゲインより小さい第2のアナログゲインを設定し、前記デジタルゲイン部に対して前記第1のデジタルゲインより大きい第2のデジタルゲインを設定する制御部と
を有することを特徴とする音声処理装置。
An analog gain section that controls analog gain with analog gain for analog audio signals,
An analog-to-digital converter that converts an analog audio signal into a digital audio signal,
A digital gain section that controls digital gain with digital gain for digital audio signals,
The first vibration detection unit that detects vibration and
A second vibration detection unit that detects vibrations having a resonance point different from that of the first vibration detection unit, and
The absolute value of the output signal of the first vibration detection unit is smaller than the first threshold value, or the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is the second. If it is smaller than the threshold value of, the first analog gain is set for the analog gain unit, the first digital gain is set for the digital gain unit, and the output signal of the first vibration detection unit is set. When the absolute value of is larger than the first threshold value and the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is larger than the second threshold value, A control unit that sets a second analog gain smaller than the first analog gain with respect to the analog gain unit, and sets a second digital gain larger than the first digital gain with respect to the digital gain unit. A voice processing device characterized by having.
前記第1の振動検出部および前記第2の振動検出部とは共振点が異なる振動を検出する第3の振動検出部をさらに有し、
前記制御部は、
前記第1の振動検出部の出力信号と前記第3の振動検出部の出力信号との差分が第3の閾値より小さい場合には、前記アナログゲイン部に対して前記第1のアナログゲインを設定し、前記デジタルゲイン部に対して前記第1のデジタルゲインを設定し、
前記第1の振動検出部の出力信号の絶対値が前記第1の閾値より大きく、且つ、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が前記第2の閾値より大きく、且つ、前記第1の振動検出部の出力信号と前記第3の振動検出部の出力信号との差分が前記第3の閾値より大きい場合には、前記アナログゲイン部に対して前記第2のアナログゲインを設定し、前記デジタルゲイン部に対して前記第2のデジタルゲインを設定することを特徴とする請求項1に記載の音声処理装置。
Further, it has a third vibration detecting unit that detects vibration having a resonance point different from that of the first vibration detecting unit and the second vibration detecting unit.
The control unit
When the difference between the output signal of the first vibration detection unit and the output signal of the third vibration detection unit is smaller than the third threshold value, the first analog gain is set for the analog gain unit. Then, the first digital gain is set for the digital gain unit, and the first digital gain is set.
The absolute value of the output signal of the first vibration detection unit is larger than the first threshold value, and the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is the difference. When it is larger than the second threshold value and the difference between the output signal of the first vibration detection unit and the output signal of the third vibration detection unit is larger than the third threshold value, the analog gain unit is used. The voice processing apparatus according to claim 1, wherein the second analog gain is set, and the second digital gain is set with respect to the digital gain unit.
前記制御部は、
前記第1の振動検出部の出力信号の絶対値が前記第1の閾値より大きい継続時間が第4の閾値より短い、または、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が前記第2の閾値より大きい継続時間が第5の閾値より短い場合には、前記アナログゲイン部に対して前記第1のアナログゲインを設定し、前記デジタルゲイン部に対して前記第1のデジタルゲインを設定し、
前記第1の振動検出部の出力信号の絶対値が前記第1の閾値より大きい継続時間が前記第4の閾値より長く、且つ、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が前記第2の閾値より大きい継続時間が前記第5の閾値より長い場合には、前記アナログゲイン部に対して前記第2のアナログゲインを設定し、前記デジタルゲイン部に対して前記第2のデジタルゲインを設定することを特徴とする請求項1または2に記載の音声処理装置。
The control unit
The absolute value of the output signal of the first vibration detection unit is longer than the first threshold value and the duration is shorter than the fourth threshold value, or the output signal of the first vibration detection unit and the second vibration detection When the difference from the output signal of the unit is longer than the second threshold value and the duration is shorter than the fifth threshold value, the first analog gain is set for the analog gain unit, and the digital gain unit is set. On the other hand, the first digital gain is set, and the first digital gain is set.
The duration of the absolute value of the output signal of the first vibration detection unit is longer than the first threshold value, and the duration is longer than the fourth threshold value, and the output signal of the first vibration detection unit and the second vibration. When the difference from the output signal of the detection unit is longer than the second threshold value and the duration is longer than the fifth threshold value, the second analog gain is set for the analog gain unit, and the digital gain is set. The voice processing apparatus according to claim 1 or 2, wherein the second digital gain is set for the unit.
前記制御部は、
超音波帯域の信号による折り返し雑音の周波数におけるデジタル音声信号のレベルが第6の閾値より小さい場合には、前記アナログゲイン部に対して前記第1のアナログゲインを設定し、前記デジタルゲイン部に対して前記第1のデジタルゲインを設定し、
前記第1の振動検出部の出力信号の絶対値が前記第1の閾値より大きく、且つ、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が前記第2の閾値より大きく、且つ、超音波帯域の信号による折り返し雑音の周波数におけるデジタル音声信号のレベルが前記第6の閾値より大きい場合には、前記アナログゲイン部に対して前記第2のアナログゲインを設定し、前記デジタルゲイン部に対して前記第2のデジタルゲインを設定することを特徴とする請求項1〜3のいずれか1項に記載の音声処理装置。
The control unit
When the level of the digital audio signal at the frequency of the folding noise due to the signal in the ultrasonic band is smaller than the sixth threshold value, the first analog gain is set for the analog gain section, and the digital gain section is set. To set the first digital gain,
The absolute value of the output signal of the first vibration detection unit is larger than the first threshold value, and the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is the difference. When the level of the digital audio signal at the frequency of the loopback noise due to the signal in the ultrasonic band is larger than the second threshold value and is larger than the sixth threshold value, the second analog gain is obtained with respect to the analog gain portion. The voice processing apparatus according to any one of claims 1 to 3, wherein the second digital gain is set with respect to the digital gain unit.
前記制御部は、
前記折り返し雑音の周波数におけるデジタル音声信号のレベルが第6の閾値より大きい継続時間が第7の閾値より短い場合には、前記アナログゲイン部に対して前記第1のアナログゲインを設定し、前記デジタルゲイン部に対して前記第1のデジタルゲインを設定し、
前記第1の振動検出部の出力信号の絶対値が前記第1の閾値より大きく、且つ、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が前記第2の閾値より大きく、且つ、超音波帯域の信号による折り返し雑音の周波数におけるデジタル音声信号のレベルが前記第6の閾値より大きい継続時間が前記第7の閾値より長い場合には、前記アナログゲイン部に対して前記第2のアナログゲインを設定し、前記デジタルゲイン部に対して前記第2のデジタルゲインを設定することを特徴とする請求項4に記載の音声処理装置。
The control unit
When the level of the digital audio signal at the frequency of the aliasing noise is greater than the sixth threshold value and the duration is shorter than the seventh threshold value, the first analog gain is set for the analog gain unit, and the digital The first digital gain is set with respect to the gain unit, and the first digital gain is set.
The absolute value of the output signal of the first vibration detection unit is larger than the first threshold value, and the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is the difference. When the level of the digital audio signal at the frequency of the loopback noise due to the signal in the ultrasonic band is larger than the second threshold value and the duration is longer than the sixth threshold value, the analog gain is longer than the seventh threshold value. The voice processing apparatus according to claim 4, wherein the second analog gain is set for the unit, and the second digital gain is set for the digital gain unit.
前記折り返し雑音の周波数は、前記デジタル音声信号のサンプリング周波数と前記超音波帯域の信号の周波数との差分であることを特徴とする請求項4または5に記載の音声処理装置。 The voice processing apparatus according to claim 4 or 5, wherein the frequency of the aliasing noise is a difference between the sampling frequency of the digital voice signal and the frequency of the signal in the ultrasonic band. 前記制御部は、デジタル音声信号を高速フーリエ変換することにより、前記折り返し雑音の周波数におけるデジタル音声信号のレベルを検出する請求項4〜6のいずれか1項に記載の音声処理装置。 The voice processing device according to any one of claims 4 to 6, wherein the control unit detects the level of the digital voice signal at the frequency of the aliasing noise by performing a fast Fourier transform on the digital voice signal. 前記第2のアナログゲインと前記第2のデジタルゲインの総和は、前記第1のアナログゲインと前記第1のデジタルゲインの総和と同じであることを特徴とする請求項1〜7のいずれか1項に記載の音声処理装置。 Any one of claims 1 to 7, wherein the sum of the second analog gain and the second digital gain is the same as the sum of the first analog gain and the first digital gain. The audio processing device described in the section. 前記制御部は、デジタル音声信号に基づく音声データを記録することを特徴とする請求項1〜8のいずれか1項に記載の音声処理装置。 The voice processing device according to any one of claims 1 to 8, wherein the control unit records voice data based on a digital voice signal. 前記第1の振動検出部および前記第2の振動検出部は、それぞれ、角速度信号を出力する第1の振動ジャイロセンサおよび第2の振動ジャイロセンサであることを特徴とする請求項1〜9のいずれか1項に記載の音声処理装置。 The first vibration detection unit and the second vibration detection unit are a first vibration gyro sensor and a second vibration gyro sensor that output an angular velocity signal, respectively, according to claims 1 to 9. The voice processing device according to any one of the items. 前記制御部は、現在のアナログゲインから前記第1のアナログゲインまたは前記第2のアナログゲインに、および現在のデジタルゲインから前記第1のデジタルゲインまたは前記第2のデジタルゲインに、複数ステップで変化させることを特徴とする請求項1〜10のいずれか1項に記載の音声処理装置。 The control unit changes from the current analog gain to the first analog gain or the second analog gain, and from the current digital gain to the first digital gain or the second digital gain in a plurality of steps. The voice processing apparatus according to any one of claims 1 to 10, wherein the voice processing apparatus is used. 前記制御部は、前記第1の閾値および前記第2の閾値に対してヒステリシス特性を持つ比較を行うことを特徴とする請求項1〜11のいずれか1項に記載の音声処理装置。 The voice processing device according to any one of claims 1 to 11, wherein the control unit makes a comparison having a hysteresis characteristic with respect to the first threshold value and the second threshold value. 前記制御部は、前記第6の閾値に対してヒステリシス特性を持つ比較を行うことを特徴とする請求項4〜6のいずれか1項に記載の音声処理装置。 The voice processing device according to any one of claims 4 to 6, wherein the control unit makes a comparison having a hysteresis characteristic with respect to the sixth threshold value. アナログ音声信号に対してアナログゲインでアナログゲイン制御を行うアナログゲイン部と、
アナログ音声信号をデジタル音声信号に変換するアナログデジタル変換部と、
デジタル音声信号に対してデジタルゲインでデジタルゲイン制御を行うデジタルゲイン部と、
振動を検出する第1の振動検出部と、
前記第1の振動検出部とは共振点が異なる振動を検出する第2の振動検出部とを有する音声処理装置の制御方法であって、
前記第1の振動検出部の出力信号の絶対値が第1の閾値より小さい、または、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が第2の閾値より小さい場合には、前記アナログゲイン部に対して第1のアナログゲインを設定し、前記デジタルゲイン部に対して第1のデジタルゲインを設定するステップと、
前記第1の振動検出部の出力信号の絶対値が前記第1の閾値より大きく、且つ、前記第1の振動検出部の出力信号と前記第2の振動検出部の出力信号との差分が前記第2の閾値より大きい場合には、前記アナログゲイン部に対して前記第1のアナログゲインより小さい第2のアナログゲインを設定し、前記デジタルゲイン部に対して前記第1のデジタルゲインより大きい第2のデジタルゲインを設定するステップと
を有することを特徴とする音声処理装置の制御方法。
An analog gain section that controls analog gain with analog gain for analog audio signals,
An analog-to-digital converter that converts an analog audio signal into a digital audio signal,
A digital gain section that controls digital gain with digital gain for digital audio signals,
The first vibration detection unit that detects vibration and
A control method for a voice processing device having a second vibration detection unit that detects vibrations having different resonance points from the first vibration detection unit.
The absolute value of the output signal of the first vibration detection unit is smaller than the first threshold value, or the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is the second. If it is smaller than the threshold value of, the step of setting the first analog gain for the analog gain section and setting the first digital gain for the digital gain section,
The absolute value of the output signal of the first vibration detection unit is larger than the first threshold value, and the difference between the output signal of the first vibration detection unit and the output signal of the second vibration detection unit is the difference. When it is larger than the second threshold value, a second analog gain smaller than the first analog gain is set for the analog gain unit, and a second analog gain larger than the first digital gain for the digital gain unit is set. A method for controlling a sound processing device, which comprises a step of setting a digital gain of 2.
JP2017199545A 2017-10-13 2017-10-13 Voice processing device and control method of voice processing device Active JP6965090B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017199545A JP6965090B2 (en) 2017-10-13 2017-10-13 Voice processing device and control method of voice processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017199545A JP6965090B2 (en) 2017-10-13 2017-10-13 Voice processing device and control method of voice processing device

Publications (2)

Publication Number Publication Date
JP2019075655A JP2019075655A (en) 2019-05-16
JP6965090B2 true JP6965090B2 (en) 2021-11-10

Family

ID=66543348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017199545A Active JP6965090B2 (en) 2017-10-13 2017-10-13 Voice processing device and control method of voice processing device

Country Status (1)

Country Link
JP (1) JP6965090B2 (en)

Also Published As

Publication number Publication date
JP2019075655A (en) 2019-05-16

Similar Documents

Publication Publication Date Title
JP4824586B2 (en) Imaging device
JP5838852B2 (en) Imaging system, imaging apparatus, imaging method, and program
US8514300B2 (en) Imaging apparatus for reducing driving noise
KR102517503B1 (en) Electronic apparatus, control method thereof, and storage medium
JP6965090B2 (en) Voice processing device and control method of voice processing device
US9064487B2 (en) Imaging device superimposing wideband noise on output sound signal
JP5688547B2 (en) Audio processing device, sound collection device, and imaging device
JP2015104091A (en) Voice processing device with wind noise reduction device, and imaging apparatus with the same
JP2016187093A (en) Image processing apparatus, image processing method and program
JP2000354190A (en) Video recorder
JP2018074220A (en) Voice processing device
JP7378936B2 (en) Electronic devices, their control methods, and their programs
JP7103358B2 (en) Communication control device, control method and program of communication control device
JP2014122978A (en) Imaging device, voice recognition method, and program
US20100118155A1 (en) Digital image processing apparatus
US20180175815A1 (en) Sound signal processing apparatus and imaging device using same
JP5645373B2 (en) Audio processing apparatus and audio processing method
JP2021057764A (en) Imaging apparatus, audio processing method, and program
JP2006217111A (en) Moving image photographing apparatus and method
JP2010154013A (en) Camera, object capturing method, and program
JP5340127B2 (en) Audio signal processing apparatus and control method of audio signal processing apparatus
JP2012129854A (en) Imaging apparatus and program
JP2021100183A (en) Imaging apparatus, control method thereof, and program thereof
JP2009239930A (en) Animation imaging apparatus and program
JP7153839B2 (en) Imaging device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211020

R151 Written notification of patent or utility model registration

Ref document number: 6965090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151