JPWO2017047000A1 - 音声信号処理装置及びそれを用いた撮像装置 - Google Patents

音声信号処理装置及びそれを用いた撮像装置 Download PDF

Info

Publication number
JPWO2017047000A1
JPWO2017047000A1 JP2017540467A JP2017540467A JPWO2017047000A1 JP WO2017047000 A1 JPWO2017047000 A1 JP WO2017047000A1 JP 2017540467 A JP2017540467 A JP 2017540467A JP 2017540467 A JP2017540467 A JP 2017540467A JP WO2017047000 A1 JPWO2017047000 A1 JP WO2017047000A1
Authority
JP
Japan
Prior art keywords
level
audio signal
gain
amplifier
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017540467A
Other languages
English (en)
Other versions
JP6518957B2 (ja
Inventor
泰雄 大塚
泰雄 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Publication of JPWO2017047000A1 publication Critical patent/JPWO2017047000A1/ja
Application granted granted Critical
Publication of JP6518957B2 publication Critical patent/JP6518957B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/001Digital control of analog signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G11/00Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
    • H03G11/04Limiting level dependent on strength of signal; Limiting level dependent on strength of carrier on which signal is modulated
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/02Manually-operated control
    • H03G3/04Manually-operated control in untuned amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/802Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving processing of the sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Abstract

音声信号処理装置は、入力した音声信号を入力レベルに応じて増幅する第1の増幅器(11)と、第1の増幅器(11)で増幅した音声信号を所定のゲインで増幅する第2の増幅器(13)と、を備える。第2の増幅器(13)は、入力した音声信号のレベルが上限閾値よりも大きいときは、ゲインを自動で低下させ、入力した音声信号のレベルが上限閾値よりも小さく、かつゲインが所定値よりも低いときに、ゲインを自動で上昇させる。ゲインを上昇させる場合に、第2の増幅器(13)は、ユーザにより入力レベルが低下する操作が行われていた場合は、ゲインを第1の速度で変化させ、ユーザにより入力レベルが低下する操作が行われていない場合は、ゲインを第1の速度よりも遅い第2の速度で変化させる。

Description

本開示は、音声信号レベルを自動制御する音声信号処理装置、及びそれを用いた撮像装置に関する。
従来、入力した音声の大きさを適正なレベルに制御する自動レベル制御(ALC:Auto Level Control)機能を有する音声処理装置が知られている(例えば特許文献1参照)。
特許文献1の音声処理装置は、入力された音声信号の振幅レベルが所定範囲内に収まるように振幅レベルを調整する。その音声処理装置は、第1のレベル制御手段と、第2のレベル制御手段とを有する。第1のレベル制御手段は、入力された音声信号の振幅レベルが所定範囲の上限値を超えた場合は振幅レベルのゲインを低下させるリミット動作を行い、音声信号の振幅レベルが所定範囲の下限値より小さい場合はゲインを増加させるリカバリ動作を行う。第2のレベル制御手段は、第1のレベル制御手段により振幅レベルが調整された音声信号に対して再度、リミット動作又はリカバリ動作を行う。第1のレベル制御手段でのリカバリ動作時のゲインの増加の時定数を、第2のレベル制御手段でのリカバリ動作時のゲインの増加の時定数より大きくする。この構成により、アタック音が短い周期で連続して入力された場合でも歪みが生じない良好な自動レベル制御を実現することを可能としている。
特開2014−126854号公報
本開示は、自動レベル制御機能の実行中において、ユーザによる音声信号の入力レベルの変更の操作がなされた場合の入力レベル変更の応答性を向上した音声信号処理装置を提供する。
本開示の音声信号処理装置は、入力した音声信号を入力レベルに応じて増幅する第1の増幅器と、第1の増幅器で増幅した音声信号を所定のゲインで増幅する第2の増幅器と、を備える。第2の増幅器は、入力した音声信号のレベルが上限閾値よりも大きいときは、ゲインを自動で低下させ、入力した音声信号のレベルが上限閾値よりも小さく、かつゲインが所定値よりも低いときに、ゲインを自動で上昇させる。ゲインを上昇させる場合に、第2の増幅器は、ユーザにより入力レベルを低下させる操作が行われていた場合は、ゲインを第1の速度で変化させ、ユーザにより入力レベルを低下させる操作が行われていない場合は、ゲインを第1の速度よりも遅い第2の速度で変化させる。
図1は、本開示の音声信号処理装置を備えた撮像装置の構成を示す図である。 図2は、アナログ音声処理部における自動レベル制御(ALC)に関する構成を示した図である。 図3は、自動レベル制御を示すフローチャートである。 図4Aは、自動レベル制御によるリカバリ速度を説明するための図である。 図4Bは、自動レベル制御によるリカバリ速度を説明するための図である。 図5は、リカバリ速度の設定処理を示すフローチャートである。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
(第1の実施の形態)
以下、図面を用いて、第1の実施の形態を説明する。
[1−1.構成]
[1−1−1.全体構成]
図1は、第1の実施の形態のアナログ音声処理部(音声信号処理装置の一例)を備えたデジタルカメラ(撮像装置の一例)の構成を示す図である。デジタルカメラは、被写体を撮像して画像データ(静止画、動画)を生成して記録媒体に記録する。デジタルカメラ100は、カメラボディ102と、カメラボディに装着される交換レンズ301とで構成される。デジタルカメラ100は、画像を入力する画像入力系140と、アナログ音声を入力する音声入力系110とを有する。デジタルカメラ100は、音声入力系110を介して入力した音声信号を、画像入力系140を介して入力した画像とともに記録媒体に記録することができる。
画像入力系140は、交換レンズ301、CCD(charge−coupled device)イメージセンサ143およびAFE(アナログ・フロント・エンド)144を含む。CCDイメージセンサ143およびAFE144は、カメラボディ102側に設けられている。
交換レンズ301は、フォーカスレンズ310、OIS(optical image stabilizer)レンズ318およびズームレンズ312を含む光学系を含む。交換レンズ301はさらに、レンズコントローラ320、レンズマウント330、フォーカスレンズ駆動部311、ズームレンズ駆動部313、絞り316、絞り駆動部317、操作リング315、OIS(optical image stabilizer)制御部319、DRAM(dynamic random access memory)321、フラッシュメモリ322等を備えている。
レンズコントローラ320は、交換レンズ301全体の動作を制御する。レンズコントローラ320は、操作リング315のユーザによる操作を受け付けて、ズームレンズ312を駆動させるよう、ズームレンズ駆動部313を制御することができる。レンズコントローラ320は、フォーカスレンズ310、OISレンズ318及び絞り316を駆動させるように、フォーカスレンズ駆動部311、OIS制御部319、及び絞り駆動部317をそれぞれ制御することができる。
レンズコントローラ320は、DRAM321やフラッシュメモリ322に接続されており、必要に応じてそれらのメモリに情報を書き込んだり、読み出したりすることができる。また、レンズコントローラ320は、レンズマウント330を介して、コントローラ130と通信することができる。尚、コントローラ130は、ハードワイヤードな電子回路で構成してもよいし、プログラムを用いたマイクロコンピュータなどで構成してもよい。
レンズマウント330は、カメラボディ102のボディマウント340と接続し、交換レンズ301およびカメラボディ102を機械的および電気的に接続する。交換レンズ301とカメラボディ102とが接続されると、レンズコントローラ320と、コントローラ130とは通信可能な状態となる。ボディマウント340は、レンズマウント330を介してレンズコントローラ320から受信した信号をカメラボディ102のコントローラ130に送信することができる。
CCDイメージセンサ143は、交換レンズ301を通して形成された被写体像を撮像して画像情報を生成する。
AFE144は、CCDイメージセンサ143から読み出した画像情報に対して相関二重サンプリングによる雑音抑圧、アナログゲインコントローラによるA/D変換器(ADC:analogue−to−digital converter)の入力レンジ幅への増幅、A/D変換器によるA/D変換(analogue−to−digital conversion)を実施する。
音声入力系110は、マイクロホン部111およびアナログ音声処理部115を備える。マイクロホン部111は、左右それぞれの方向からの音声を別々に収音するために2つのマイクロホンを備えている。マイクロホンは、音響信号を電気信号(アナログ音声信号)に変換する。マイクロホンからのアナログ音声信号はアナログ音声処理部115に入力される。
アナログ音声処理部115は、アナログ音声信号に所定の信号処理を施す。アナログ音声処理部115は、処理したアナログ音声信号をA/D変換器によりデジタル音声信号に変換し、デジタル音声信号をデジタル画像・音声処理部120に出力する。アナログ音声処理部115は音声信号処理装置の一例である。アナログ音声処理部115は、アナログ回路を含む電子回路で構成され、1つまたは複数の半導体集積回路で構成される。
デジタル画像・音声処理部120は、AFE144から出力された画像情報およびアナログ音声処理部115から出力された音声信号に対して各種の処理を施す。例えば、デジタル画像・音声処理部120は、コントローラ130からの指示に従って、画像情報に対してガンマ補正やホワイトバランス補正、傷補正、符号化処理等を行う。また、デジタル画像・音声処理部120は、コントローラ130からの指示に従って、音声信号に対する各種処理を行う。デジタル画像・音声処理部120は、ハードワイヤードな電子回路で実現してもよいし、プログラムを実行するマイクロコンピュータなどで実現してもよい。デジタル画像・音声処理部120は、コントローラ130などと一体的に1つの半導体チップとして実現してもよい。
デジタル画像・音声処理部120は、マイクロホン部111の出力である音声信号を演算処理してフィルタ処理や指向性合成処理を行う。デジタル画像・音声処理部120を実現する回路は1つまたは複数の半導体集積回路に集積されてもよい。
表示部190は、デジタルカメラ100の背面に配置される。本実施の形態では、表示部190は、液晶ディスプレイである。表示部190は、デジタル画像・音声処理部120にて処理された画像情報に基づく画像を表示する。
コントローラ130は、デジタルカメラ100全体の動作を統括制御する。コントローラ130は、ハードワイヤードな電子回路で実現してもよいし、プログラムを実行するマイクロコンピュータなどで実現してもよい。また、コントローラ130は、デジタル画像・音声処理部120などと一体的に1つの半導体チップとして実現してもよい。また、ROM(read−only memory)170は、コントローラ130の外部に(コントローラ130とは別体として)存在している必要はなく、コントローラ130の内部に組み込まれていてもよい。
ROM170は、コントローラ130が実行するための、オートフォーカス制御(AF制御)や自動露出制御(AE制御)、ストロボの発光制御などに関するプログラムの他、デジタルカメラ100全体の動作を統括制御するためのプログラムを格納している。ROM170は、デジタルカメラ100に関する各種条件および設定を記憶する。なお、本実施の形態では、ROM170は、フラッシュROMである。
RAM(random−access memory)150は、デジタル画像・音声処理部120およびコントローラ130のワークメモリとして機能する。RAM150は、SDRAM(synchronous dynamic random access memory)やフラッシュメモリなどで実現できる。RAM150は、画像情報および音声信号などを記録するための内部メモリとしても機能する。
外部記憶媒体160は、内部にフラッシュメモリ等の不揮発性の記録部を備えた外部メモリである。外部記憶媒体160は、デジタル画像・音声処理部120で処理される画像情報および音声信号などのデータを記録可能である。
操作部180は、デジタルカメラ100の外装に配置される操作釦や操作ダイヤルなどの操作インターフェースの総称である。操作部180は、ユーザによる操作を受け付ける。例えば、操作部180は、デジタルカメラ100の上面に設けられたレリーズ釦、電源スイッチ、モードダイヤルや、デジタルカメラ100の背面に設けられた中央釦および十字釦などを含む。操作部180は、ユーザによる操作を受け付けると、コントローラ130に種々の動作を指示する信号を通知する。
レリーズ釦は、ユーザが画像撮影の指示やオートフォーカスの指示を行うための操作部材である。レリーズ釦は、ユーザにより半押しされると、コントローラ130は、AF(Auto Focus)制御およびAE(Auto Exposure)制御などの少なくとも一方を実行し、撮影条件を決定する。続いて、レリーズ釦が全押しされると、コントローラ130は、全押しのタイミングに撮像された画像情報を外部記憶媒体160などに記録する。
電源スイッチは、デジタルカメラ100の各部への電力供給をオン(ON)/オフ(OFF)するためのスイッチである。
モードダイヤルは、回転式のダイヤルである。モードダイヤルがユーザにより回転されると、コントローラ130は、デジタルカメラ100の動作モードを、モードダイヤルの現在の回転位置に対応する動作モードに切り替える。動作モードとは、例えば、オート撮影モード、マニュアル撮影モード、シーン選択モードなどである。
さらに、操作部180は、上記の操作部材に加えて、表示部190にメニュー画面を表示するためのボタンや、メニュー画面上に表示される各種条件の設定項目の値を選択するためのボタンを含んでも良い。また、操作部180は、表示部190に重ねて配置され、ユーザの指のタッチ操作を検出するタッチパネルを含んでも良い。
[1−1−2.アナログ音声処理部]
アナログ音声処理部115は、自動レベル制御(ALC)機能を有する。自動レベル制御機能は、入力したアナログ音声信号のレベルによらず、出力するデジタル音声信号のレベルが予め定められた上限閾値を超えないようにゲインを自動的に調整する機能である。自動レベル制御について種々の公知の方法が知られている。図2は、アナログ音声処理部115における自動レベル制御(ALC)の機能を実現するための主要な構成を示した図である。
アナログ音声処理部115は、マイクアンプ11と、アナログアンプ13と、A/D変換器(ADC:analogue−to−digital converter)15と、制御回路19とを備える。なお、図2では、説明の便宜上、左右にある2つのマイクロホンのうちの一つのマイクロホンからの音声信号に対する自動レベル制御に関する構成を示している。
マイクアンプ11は、マイクロホン10から入力する音声信号の録音レベル(入力レベル)を調整する回路である。マイクアンプ11は音声信号の増幅回路を含む。録音レベルは、ユーザにより操作部180(ユーザインタフェース)を介して設定される。ユーザによる録音レベル(入力レベル)の設定値はコントローラ130から制御回路19に通知される。制御回路19は、通知された録音レベルの設定値にしたがいマイクアンプ11の録音レベルを設定する。
アナログアンプ13は、マイクアンプ11からの音声信号を記録ゲインに応じて増幅する。アナログアンプ13は音声信号の増幅回路を含む。記録ゲインは、入力するアナログ音声信号の信号レベルに応じて変更される。すなわち、アナログアンプ13は、入力するアナログ音声信号の信号レベルが上限閾値を超えたときに記録ゲインを低下させ、その後、入力するアナログ音声信号の信号レベルが低くなると、記録ゲインを徐々に上昇させ、元の初期値(Gint)に戻そうとする。このように記録ゲインの値を元の初期値に戻そうとする処理を「リカバリ」という。
制御回路19は、アナログ音声処理部115の動作を制御する回路である。例えば、制御回路19は、マイクアンプ11の録音レベルや、アナログアンプ13のリカバリ速度および記録ゲインGを制御する。
以上の構成を有するアナログ音声処理部115において、マイクロホン10により収音された音声は音声信号Aに変換され、マイクアンプ11に入力される。マイクアンプ11は、ユーザの設定にしたがいマイクロホン10からの音声信号の録音レベル(入力レベル)を調整する。アナログアンプ13は、マイクアンプ11からの音声信号A'を記録ゲインGで増幅し、A/D変換器15に出力する。A/D変換器15に入力する音声信号A'Gのレベルが所定の上限値を超えた場合、A/D変換器15からクリップされた音声出力(すなわち、歪みのある音声)が出力される。このため、アナログアンプ13は、音声信号A'のレベルが非常に高く、A/D変換器15においてクリップされる可能性がある場合、記録ゲインGを低下させ、A/D変換器15に入力される音声信号A'Gのレベルを低下させる。その後、入力する音声信号Aのレベルが低くなると、アナログアンプ13は、記録ゲインGを徐々に上昇させてあらかじめ設定された初期値Gintに戻そうとするリカバリ処理を行う。A/D変換器15は、アナログアンプ13から入力した音声信号A'Gをデジタル信号Dに変換して出力する。制御回路19は、A/D変換器15の音声出力Dをモニタしている。
[1−2.動作]
[1−2−1.自動レベル制御(ALC)]
本実施形態のデジタルカメラ100は、入力する音声信号のレベルが高くても記録される音声信号が歪まないように記録ゲインを自動で制御する自動レベル制御(ALC:automatic level control)の機能を有する。この自動レベル制御はアナログ音声処理部115で実現される。
図3は、アナログ音声処理部115における自動レベル制御を示すフローチャートである。図3のフローチャートを参照して自動レベル制御を説明する。
制御回路19は、A/D変換器15の音声出力Dを上限閾値と比較する(S11)。ここで、上限閾値は、A/D変換器15の音声出力がクリップされたときに出力される音声出力Dの値よりも低い値にあらかじめ設定される。後述するが、このように上限閾値を設定することで、制御回路19は、A/D変換器15の音声出力Dが実際にクリップされる前に、A/D変換器15に入力されるアナログ音声信号A'Gのレベルが低減するようにアナログアンプ13の記録ゲインを低下させ、A/D変換器15からクリップされた音声出力が出力されることを防止している。
音声出力Dのレベルが上限閾値よりも大きい場合(S11でYES)、制御回路19はアナログアンプ13の記録ゲインGを低下させる(S16)。具体的には、音声出力Dが上限閾値を超えないように記録ゲインGを設定する。例えば、新たな記録ゲインGを、G=A'−(D−Dth)(Dth:上限閾値)で算出してもよい。これにより、A/D変換器15に入力されるアナログ音声信号A'Gのレベルが低減されるため、A/D変換器15においてクリップされた音声出力が出力されることを防止できる。
一方、音声出力Dのレベルが上限閾値以下の場合(S11でNO)、制御回路19は、アナログアンプ13の記録ゲインGの値を、あらかじめ設定された値(初期値Gint)と比較する(S12)。記録ゲインGの値が初期値Gintよりも低い場合(S12でYES)、制御回路19はアナログアンプ13の記録ゲインGを上昇させる(S13)(リカバリ処理)。
このとき、制御回路19は、設定されたリカバリ速度で、アナログアンプ13の記録ゲインGを上昇させる。リカバリ速度の設定の詳細については後述する。
制御回路19は、ステップS13で記録ゲインGを上昇させたあと、再度、A/D変換器15の音声出力Dを上限閾値と比較する(S14)。A/D変換器15の音声出力Dが上限閾値を超えていない場合(S14でNO)、制御回路19は、再度、アナログアンプ13の記録ゲインGの値を、あらかじめ設定された初期値Gintと比較する(S12)。
A/D変換器15の音声出力Dが上限閾値を超えた場合(S14でYES)、制御回路19は、アナログアンプ13の記録ゲインGの上昇を停止し(S15)、処理を終了する。
ステップS12でNOの場合、すなわち記録ゲインGの値が初期値Gint以上の場合は、制御回路19は、アナログアンプ13の記録ゲインGの上昇を停止し(S15)、処理を終了する。
以上のように、本実施形態のアナログ音声処理部115は、音声出力Dのレベルに応じて記録ゲインGを変更することで、マイクアンプ11が出力する音声信号A'のレベルが高くても記録される音声信号が歪まないように記録ゲインを自動で制御する自動レベル制御(ALC)を実現する。
[1−2−2.リカバリ速度]
上述のように、アナログアンプ13の記録ゲインGは、A/D変換器15の出力Dのモニタリングにより、音声信号AやA'が過大になると、低下させられる。その後、入力する音声信号AやA'のレベルが低くなると、記録ゲインGを、初期値に戻そうとするリカバリ動作が行われる。このリカバリ動作において、記録ゲインGを上昇させる速度であるリカバリ速度は、制御回路19により設定される。以下、リカバリ速度の設定について図4Aおよび図4Bを用いて説明する。図4Aおよび図4Bの横軸は時間を示し、縦軸はレベル(振幅)を示す。図4Aおよび図4B中のグレーの領域はアナログアンプ13の出力A'Gのレベル(振幅)を示す。
図4Aは、自動レベル制御により記録ゲインGが低下された後の通常のリカバリ動作を説明した図である。図4Bは、自動レベル制御により記録ゲインGが低下された後のリカバリ動作であって、直前にユーザによるマイクアンプ11の録音レベルの低下操作がなされたときのリカバリ動作を説明した図である。
図4Aに示すように、アナログアンプ13に対して大きな音声が入力された場合、自動レベル制御により、A/D変換器15に入力する音声信号のレベル(振幅)が所定の範囲(Lth(+)〜Lth(-))内に収まるように記録ゲインGが低下される。ここで、所定の範囲(Lth(+)〜Lth(-))とは、A/D変換器15の出力Dが上限閾値内に収まることになる範囲である。
図4Aについて説明する。図4Aは、時刻t1以前では音声信号Aのレベルが高く、時刻t1より後で音声信号Aのレベルが低くなった時の、アナログアンプ13の出力A'Gのレベル(振幅)の時間変化を示す図である。時刻t1以前では、記録ゲインGの低下により、音声出力のレベルA'Gが低下して、所定の範囲(Lth(+)〜Lth(-))内に収まっている。時刻t1より後で、音声信号Aのレベルが低くなったので、記録ゲインGを初期値に戻そうとするリカバリ処理が行われる。その際、記録ゲインの値は急激に上昇させずに、比較的長い時間Tr1(例えば10秒)をかけて初期値に戻される。これは、記録ゲインGの値を急激に上昇させると、ノイズフロアの急激な上昇等により、聴感上不自然な音声となるからである。このため、アナログアンプ13は、通常のリカバリ動作においては、比較的遅いリカバリ速度で記録ゲインを上昇させる。比較的長い時間Tr1のあと、記録ゲインGは最終的な値に安定する。
ところで、ユーザが音声の記録中に意図的にマイクアンプ11の録音レベルを低下させる操作を行った場合は、記録ゲインGを最終的な値に早く安定させるためにアナログアンプ13の記録ゲインGを上昇させる必要がある。この場合、ユーザは意図的に録音レベルを変化させていることから、記録ゲインの急激な上昇による聴感上の不自然さは問題とならず、むしろ応答性が要求される。しかし、上述のように、リカバリ速度が遅いと、記録ゲインGの変化のレスポンスが遅くなり、変更後の音の定常レベルが直ぐに認識できないという問題が生じる。
そこで、本実施形態のアナログ音声処理部115は、ユーザによる録音レベルの低下操作がなされた場合は、リカバリ動作において、通常のリカバリ速度よりも速いリカバリ速度(第1の速度)で記録ゲインGを上昇させるように構成されている。すなわち、図4Bに示すように、ユーザによるマイクアンプ11の録音レベルの低下操作がなされた場合、比較的短い時間Tr2(例えば、0.5秒)でリカバリ処理を行う。すなわち、図4Aに示した例のリカバリ速度(第2の速度)よりも速いリカバリ速度(第1の速度)でリカバリ処理を行う。これにより、図4Bに示すように、図4Aで示す通常の場合と比べてより迅速に記録ゲインの値を最終的な値に早く安定できる。リカバリ速度を速くして応答性を良くすることで、録音レベルの変更後の定常レベル(入力音声のレベル)を迅速に認識することが可能となる。
図5は、アナログ音声処理部115におけるアナログアンプ13に対するリカバリ速度の設定処理を示すフローチャートである。図5のフローチャートを用いて、アナログアンプ13に対するリカバリ速度の設定処理を説明する。
ユーザは操作部180を介して録音レベルの操作を行うことができる。ユーザによる録音レベルの低下の操作があると、その旨を示す情報がコントローラ130からアナログ音声処理部115における制御回路19に送信される。制御回路19は、コントローラ130から、ユーザによる録音レベルの低下の操作があった旨を示す情報を受信すると(S31でYES)、アナログアンプ13に対して、リカバリ速度を速い速度(第1の速度)に設定するための制御信号を送信する(S32)。アナログアンプ13は、この制御信号を受けると、リカバリ速度を速い速度(第1の速度)に設定する。
例えば、アナログアンプ13は、リカバリ速度を設定する回路の時定数を変更することで、リカバリ速度の設定を変更することができる。具体的には、アナログアンプ13に含まれるRC回路の抵抗(R)及びキャパシタ(C)の少なくとも一方の値を変更するように回路構成を変更することで、リカバリ速度を切り替えることができる。
なお、アナログアンプ13において、リカバリ速度が速い速度(第1の速度)に設定されている場合、速い速度でリカバリが行われた後、記録ゲインGの上昇を停止したときに(図3のステップS15)、リカバリ速度は通常の速度(第2の速度)にリセットされる。
以上のように、本実施形態では、ユーザによる録音レベルの低下の操作があったときには、記録ゲインのリカバリを通常の場合よりも速い速度で行う。これによって、記録ゲインを元の値に迅速に戻すことができるため、録音レベルの変更後、直ぐに、定常レベルを把握することができる。
[1−3.効果、等]
本実施形態のアナログ音声処理部115(音声信号処理装置の一例)は、入力した音声信号Aを録音レベルに応じて増幅するマイクアンプ11(第1の増幅器の一例)と、マイクアンプ11からの音声信号A'を記録ゲインGで増幅するアナログアンプ13(第2の増幅器)と、を備える。アナログアンプ13は、音声出力Dのレベルが上限閾値よりも大きいときは、アナログアンプ13の記録ゲインGを低下させ、音声出力Dのレベルが上限閾値よりも小さく且つ記録ゲインGの値が初期値Gintより低いときに、記録ゲインGを第1の速度で上昇させる。記録ゲインGを上昇させる場合に、制御回路19は、ユーザにより録音レベル(入力レベルの一例)を低下させる操作が直前に行われていた場合は、アナログアンプ13の記録ゲインGを第1の速度で変化させる。一方、ユーザにより録音レベルを低下させる操作が行われていない場合、制御回路19は、アナログアンプ13の記録ゲインGを第1の速度よりも遅い第2の速度で変化させる。
このように記録ゲインGのリカバリ速度を制御することで、ユーザによる録音レベルの低下の操作があったときには、記録ゲインGを迅速に変更することができるため、録音レベルの変更後、直ぐに、定常レベルを把握することが可能となる。
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、第1の実施の形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記第1の実施の形態で説明した構成要素と他の構成要素とを組み合わせて、新たな実施の形態とすることも可能である。
上記の実施の形態では、アナログ音声処理部115において、入力する音声信号のレベルに応じてアナログアンプ13の記録ゲインを変更している。その際、入力する音声信号のレベルを、A/D変換器15の出力Dに基づいて判断している。しかし、入力する音声信号のレベルは他の信号に基づいて判断してもよい。例えば、入力する音声信号の信号レベルを、A/D変換器15の入力に基づき判断してもよいし、アナログアンプ13の入力信号に基づき判断してもよい。すなわち、入力する音声信号に応じてレベルが変化する信号であれば、任意の信号を使用することができる。
上記の実施の形態において、ステップS11で、音声出力Dのレベルが上限閾値よりも大きいか、上限閾値以下かに応じて上記で説明した処理を行うことに代えて、音声出力Dのレベルが上限閾値以上か、上限閾値より小さいかに応じて上記で説明した処理を行うようにしてもよい。また、ステップS12で、記録ゲインGの値が初期値Gintよりも低いか、初期値Gint以上かに応じて上記で説明した処理を行うことに代えて、記録ゲインGの値が初期値Gint以下か、初期値Gintより大きいかに応じて上記で説明した処理を行うようにしてもよい。また、ステップS14で、音声出力Dが上限閾値を超えたか、上限閾値以下かに応じて上記で説明した処理を行うことに代えて、音声出力Dが上限閾値以上か、上限閾値より小さいかに応じて上記で説明した処理を行うようにしてもよい。
上記の実施の形態では、本開示の音声信号処理装置(アナログ音声処理部)をデジタルカメラに適用した例を説明したが、本開示の音声信号処理装置の構成は、音声信号を入力し、記録等の所定の処理(音声の記録、出力、編集等)を施す電子機器であれば、種々の電子機器に適用することができる。例えば、本開示の音声信号処理装置の構成は、ビデオカメラや、スマートフォン、携帯電話、ICレコーダ、スピーカ等に適用することができる。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示の音声信号処理装置は、入力した音声信号の出力レベルを自動で調整可能な自動レベル制御装置に適用できる。
10 マイクロホン
11 マイクアンプ(第1の増幅器)
13 アナログアンプ(第2の増幅器)
15 A/D変換器
19 制御回路
100 デジタルカメラ(撮像装置)
102 カメラボディ
110 音声入力系
111 マイクロホン部
115 アナログ音声処理部(音声信号処理装置)
120 デジタル画像・音声処理部
130 コントローラ
140 画像入力系
143 CCDイメージセンサ
160 外部記憶媒体
180 操作部
301 交換レンズ
本開示は、音声信号レベルを自動制御する音声信号処理装置、及びそれを用いた撮像装置に関する。
従来、入力した音声の大きさを適正なレベルに制御する自動レベル制御(ALC:Auto Level Control)機能を有する音声処理装置が知られている(例えば特許文献1参照)。
特許文献1の音声処理装置は、入力された音声信号の振幅レベルが所定範囲内に収まるように振幅レベルを調整する。その音声処理装置は、第1のレベル制御手段と、第2のレベル制御手段とを有する。第1のレベル制御手段は、入力された音声信号の振幅レベルが所定範囲の上限値を超えた場合は振幅レベルのゲインを低下させるリミット動作を行い、音声信号の振幅レベルが所定範囲の下限値より小さい場合はゲインを増加させるリカバリ動作を行う。第2のレベル制御手段は、第1のレベル制御手段により振幅レベルが調整された音声信号に対して再度、リミット動作又はリカバリ動作を行う。第1のレベル制御手段でのリカバリ動作時のゲインの増加の時定数を、第2のレベル制御手段でのリカバリ動作時のゲインの増加の時定数より大きくする。この構成により、アタック音が短い周期で連続して入力された場合でも歪みが生じない良好な自動レベル制御を実現することを可能としている。
特開2014−126854号公報
本開示は、自動レベル制御機能の実行中において、ユーザによる音声信号の入力レベルの変更の操作がなされた場合の入力レベル変更の応答性を向上した音声信号処理装置を提供する。
本開示の音声信号処理装置は、入力した音声信号を入力レベルに応じて増幅する第1の増幅器と、第1の増幅器で増幅した音声信号を所定のゲインで増幅する第2の増幅器と、を備える。第2の増幅器は、入力した音声信号のレベルが上限閾値よりも大きいときは、ゲインを自動で低下させ、入力した音声信号のレベルが上限閾値よりも小さく、かつゲインが所定値よりも低いときに、ゲインを自動で上昇させる。ゲインを上昇させる場合に、第2の増幅器は、ユーザにより入力レベルを低下させる操作が行われていた場合は、ゲインを第1の速度で変化させ、ユーザにより入力レベルを低下させる操作が行われていない場合は、ゲインを第1の速度よりも遅い第2の速度で変化させる。
図1は、本開示の音声信号処理装置を備えた撮像装置の構成を示す図である。 図2は、アナログ音声処理部における自動レベル制御(ALC)に関する構成を示した図である。 図3は、自動レベル制御を示すフローチャートである。 図4Aは、自動レベル制御によるリカバリ速度を説明するための図である。 図4Bは、自動レベル制御によるリカバリ速度を説明するための図である。 図5は、リカバリ速度の設定処理を示すフローチャートである。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって特許請求の範囲に記載の主題を限定することを意図するものではない。
(第1の実施の形態)
以下、図面を用いて、第1の実施の形態を説明する。
[1−1.構成]
[1−1−1.全体構成]
図1は、第1の実施の形態のアナログ音声処理部(音声信号処理装置の一例)を備えたデジタルカメラ(撮像装置の一例)の構成を示す図である。デジタルカメラは、被写体を撮像して画像データ(静止画、動画)を生成して記録媒体に記録する。デジタルカメラ100は、カメラボディ102と、カメラボディに装着される交換レンズ301とで構成される。デジタルカメラ100は、画像を入力する画像入力系140と、アナログ音声を入力する音声入力系110とを有する。デジタルカメラ100は、音声入力系110を介して入力した音声信号を、画像入力系140を介して入力した画像とともに記録媒体に記録することができる。
画像入力系140は、交換レンズ301、CCD(charge−coupled device)イメージセンサ143およびAFE(アナログ・フロント・エンド)144を含む。CCDイメージセンサ143およびAFE144は、カメラボディ102側に設けられている。
交換レンズ301は、フォーカスレンズ310、OIS(optical image stabilizer)レンズ318およびズームレンズ312を含む光学系を含む。交換レンズ301はさらに、レンズコントローラ320、レンズマウント330、フォーカスレンズ駆動部311、ズームレンズ駆動部313、絞り316、絞り駆動部317、操作リング315、OIS(optical image stabilizer)制御部319、DRAM(dynamic random access memory)321、フラッシュメモリ322等を備えている。
レンズコントローラ320は、交換レンズ301全体の動作を制御する。レンズコントローラ320は、操作リング315のユーザによる操作を受け付けて、ズームレンズ312を駆動させるよう、ズームレンズ駆動部313を制御することができる。レンズコントローラ320は、フォーカスレンズ310、OISレンズ318及び絞り316を駆動させるように、フォーカスレンズ駆動部311、OIS制御部319、及び絞り駆動部317をそれぞれ制御することができる。
レンズコントローラ320は、DRAM321やフラッシュメモリ322に接続されており、必要に応じてそれらのメモリに情報を書き込んだり、読み出したりすることができる。また、レンズコントローラ320は、レンズマウント330を介して、コントローラ130と通信することができる。尚、コントローラ130は、ハードワイヤードな電子回路で構成してもよいし、プログラムを用いたマイクロコンピュータなどで構成してもよい。
レンズマウント330は、カメラボディ102のボディマウント340と接続し、交換レンズ301およびカメラボディ102を機械的および電気的に接続する。交換レンズ301とカメラボディ102とが接続されると、レンズコントローラ320と、コントローラ130とは通信可能な状態となる。ボディマウント340は、レンズマウント330を介してレンズコントローラ320から受信した信号をカメラボディ102のコントローラ130に送信することができる。
CCDイメージセンサ143は、交換レンズ301を通して形成された被写体像を撮像して画像情報を生成する。
AFE144は、CCDイメージセンサ143から読み出した画像情報に対して相関二重サンプリングによる雑音抑圧、アナログゲインコントローラによるA/D変換器(ADC:analogue−to−digital converter)の入力レンジ幅への増幅、A/D変換器によるA/D変換(analogue−to−digital conversion)を実施する。
音声入力系110は、マイクロホン部111およびアナログ音声処理部115を備える。マイクロホン部111は、左右それぞれの方向からの音声を別々に収音するために2つのマイクロホンを備えている。マイクロホンは、音響信号を電気信号(アナログ音声信号)に変換する。マイクロホンからのアナログ音声信号はアナログ音声処理部115に入力される。
アナログ音声処理部115は、アナログ音声信号に所定の信号処理を施す。アナログ音声処理部115は、処理したアナログ音声信号をA/D変換器によりデジタル音声信号に変換し、デジタル音声信号をデジタル画像・音声処理部120に出力する。アナログ音声処理部115は音声信号処理装置の一例である。アナログ音声処理部115は、アナログ回路を含む電子回路で構成され、1つまたは複数の半導体集積回路で構成される。
デジタル画像・音声処理部120は、AFE144から出力された画像情報およびアナログ音声処理部115から出力された音声信号に対して各種の処理を施す。例えば、デジタル画像・音声処理部120は、コントローラ130からの指示に従って、画像情報に対してガンマ補正やホワイトバランス補正、傷補正、符号化処理等を行う。また、デジタル画像・音声処理部120は、コントローラ130からの指示に従って、音声信号に対する各種処理を行う。デジタル画像・音声処理部120は、ハードワイヤードな電子回路で実現してもよいし、プログラムを実行するマイクロコンピュータなどで実現してもよい。デジタル画像・音声処理部120は、コントローラ130などと一体的に1つの半導体チップとして実現してもよい。
デジタル画像・音声処理部120は、マイクロホン部111の出力である音声信号を演算処理してフィルタ処理や指向性合成処理を行う。デジタル画像・音声処理部120を実現する回路は1つまたは複数の半導体集積回路に集積されてもよい。
表示部190は、デジタルカメラ100の背面に配置される。本実施の形態では、表示部190は、液晶ディスプレイである。表示部190は、デジタル画像・音声処理部120にて処理された画像情報に基づく画像を表示する。
コントローラ130は、デジタルカメラ100全体の動作を統括制御する。コントローラ130は、ハードワイヤードな電子回路で実現してもよいし、プログラムを実行するマイクロコンピュータなどで実現してもよい。また、コントローラ130は、デジタル画像・音声処理部120などと一体的に1つの半導体チップとして実現してもよい。また、ROM(read−only memory)170は、コントローラ130の外部に(コントローラ130とは別体として)存在している必要はなく、コントローラ130の内部に組み込まれていてもよい。
ROM170は、コントローラ130が実行するための、オートフォーカス制御(AF制御)や自動露出制御(AE制御)、ストロボの発光制御などに関するプログラムの他、デジタルカメラ100全体の動作を統括制御するためのプログラムを格納している。ROM170は、デジタルカメラ100に関する各種条件および設定を記憶する。なお、本実施の形態では、ROM170は、フラッシュROMである。
RAM(random−access memory)150は、デジタル画像・音声処理部120およびコントローラ130のワークメモリとして機能する。RAM150は、SDRAM(synchronous dynamic random access memory)やフラッシュメモリなどで実現できる。RAM150は、画像情報および音声信号などを記録するための内部メモリとしても機能する。
外部記憶媒体160は、内部にフラッシュメモリ等の不揮発性の記録部を備えた外部メモリである。外部記憶媒体160は、デジタル画像・音声処理部120で処理される画像情報および音声信号などのデータを記録可能である。
操作部180は、デジタルカメラ100の外装に配置される操作釦や操作ダイヤルなどの操作インターフェースの総称である。操作部180は、ユーザによる操作を受け付ける。例えば、操作部180は、デジタルカメラ100の上面に設けられたレリーズ釦、電源スイッチ、モードダイヤルや、デジタルカメラ100の背面に設けられた中央釦および十字釦などを含む。操作部180は、ユーザによる操作を受け付けると、コントローラ130に種々の動作を指示する信号を通知する。
レリーズ釦は、ユーザが画像撮影の指示やオートフォーカスの指示を行うための操作部材である。レリーズ釦は、ユーザにより半押しされると、コントローラ130は、AF(Auto Focus)制御およびAE(Auto Exposure)制御などの少なくとも一方を実行し、撮影条件を決定する。続いて、レリーズ釦が全押しされると、コントローラ130は、全押しのタイミングに撮像された画像情報を外部記憶媒体160などに記録する。
電源スイッチは、デジタルカメラ100の各部への電力供給をオン(ON)/オフ(OFF)するためのスイッチである。
モードダイヤルは、回転式のダイヤルである。モードダイヤルがユーザにより回転されると、コントローラ130は、デジタルカメラ100の動作モードを、モードダイヤルの現在の回転位置に対応する動作モードに切り替える。動作モードとは、例えば、オート撮影モード、マニュアル撮影モード、シーン選択モードなどである。
さらに、操作部180は、上記の操作部材に加えて、表示部190にメニュー画面を表示するためのボタンや、メニュー画面上に表示される各種条件の設定項目の値を選択するためのボタンを含んでも良い。また、操作部180は、表示部190に重ねて配置され、ユーザの指のタッチ操作を検出するタッチパネルを含んでも良い。
[1−1−2.アナログ音声処理部]
アナログ音声処理部115は、自動レベル制御(ALC)機能を有する。自動レベル制御機能は、入力したアナログ音声信号のレベルによらず、出力するデジタル音声信号のレベルが予め定められた上限閾値を超えないようにゲインを自動的に調整する機能である。自動レベル制御について種々の公知の方法が知られている。図2は、アナログ音声処理部115における自動レベル制御(ALC)の機能を実現するための主要な構成を示した図である。
アナログ音声処理部115は、マイクアンプ11と、アナログアンプ13と、A/D変換器(ADC:analogue−to−digital converter)15と、制御回路19とを備える。なお、図2では、説明の便宜上、左右にある2つのマイクロホンのうちの一つのマイクロホンからの音声信号に対する自動レベル制御に関する構成を示している。
マイクアンプ11は、マイクロホン10から入力する音声信号の録音レベル(入力レベル)を調整する回路である。マイクアンプ11は音声信号の増幅回路を含む。録音レベルは、ユーザにより操作部180(ユーザインタフェース)を介して設定される。ユーザによる録音レベル(入力レベル)の設定値はコントローラ130から制御回路19に通知される。制御回路19は、通知された録音レベルの設定値にしたがいマイクアンプ11の録音レベルを設定する。
アナログアンプ13は、マイクアンプ11からの音声信号を記録ゲインに応じて増幅する。アナログアンプ13は音声信号の増幅回路を含む。記録ゲインは、入力するアナログ音声信号の信号レベルに応じて変更される。すなわち、アナログアンプ13は、入力するアナログ音声信号の信号レベルが上限閾値を超えたときに記録ゲインを低下させ、その後、入力するアナログ音声信号の信号レベルが低くなると、記録ゲインを徐々に上昇させ、元の初期値(Gint)に戻そうとする。このように記録ゲインの値を元の初期値に戻そうとする処理を「リカバリ」という。
制御回路19は、アナログ音声処理部115の動作を制御する回路である。例えば、制御回路19は、マイクアンプ11の録音レベルや、アナログアンプ13のリカバリ速度および記録ゲインGを制御する。
以上の構成を有するアナログ音声処理部115において、マイクロホン10により収音された音声は音声信号Aに変換され、マイクアンプ11に入力される。マイクアンプ11は、ユーザの設定にしたがいマイクロホン10からの音声信号の録音レベル(入力レベル)を調整する。アナログアンプ13は、マイクアンプ11からの音声信号A’を記録ゲインGで増幅し、A/D変換器15に出力する。A/D変換器15に入力する音声信号A’Gのレベルが所定の上限値を超えた場合、A/D変換器15からクリップされた音声出力(すなわち、歪みのある音声)が出力される。このため、アナログアンプ13は、音声信号A’のレベルが非常に高く、A/D変換器15においてクリップされる可能性がある場合、記録ゲインGを低下させ、A/D変換器15に入力される音声信号A’Gのレベルを低下させる。その後、入力する音声信号Aのレベルが低くなると、アナログアンプ13は、記録ゲインGを徐々に上昇させてあらかじめ設定された初期値Gintに戻そうとするリカバリ処理を行う。A/D変換器15は、アナログアンプ13から入力した音声信号A’Gをデジタル信号Dに変換して出力する。制御回路19は、A/D変換器15の音声出力Dをモニタしている。
[1−2.動作]
[1−2−1.自動レベル制御(ALC)]
本実施形態のデジタルカメラ100は、入力する音声信号のレベルが高くても記録される音声信号が歪まないように記録ゲインを自動で制御する自動レベル制御(ALC:automatic level control)の機能を有する。この自動レベル制御はアナログ音声処理部115で実現される。
図3は、アナログ音声処理部115における自動レベル制御を示すフローチャートである。図3のフローチャートを参照して自動レベル制御を説明する。
制御回路19は、A/D変換器15の音声出力Dを上限閾値と比較する(S11)。ここで、上限閾値は、A/D変換器15の音声出力がクリップされたときに出力される音声出力Dの値よりも低い値にあらかじめ設定される。後述するが、このように上限閾値を設定することで、制御回路19は、A/D変換器15の音声出力Dが実際にクリップされる前に、A/D変換器15に入力されるアナログ音声信号A’Gのレベルが低減するようにアナログアンプ13の記録ゲインを低下させ、A/D変換器15からクリップされた音声出力が出力されることを防止している。
音声出力Dのレベルが上限閾値よりも大きい場合(S11でYES)、制御回路19はアナログアンプ13の記録ゲインGを低下させる(S16)。具体的には、音声出力Dが上限閾値を超えないように記録ゲインGを設定する。例えば、新たな記録ゲインGを、G=A’−(D−Dth)(Dth:上限閾値)で算出してもよい。これにより、A/D変換器15に入力されるアナログ音声信号A’Gのレベルが低減されるため、A/D変換器15においてクリップされた音声出力が出力されることを防止できる。
一方、音声出力Dのレベルが上限閾値以下の場合(S11でNO)、制御回路19は、アナログアンプ13の記録ゲインGの値を、あらかじめ設定された値(初期値Gint)と比較する(S12)。記録ゲインGの値が初期値Gintよりも低い場合(S12でYES)、制御回路19はアナログアンプ13の記録ゲインGを上昇させる(S13)(リカバリ処理)。
このとき、制御回路19は、設定されたリカバリ速度で、アナログアンプ13の記録ゲインGを上昇させる。リカバリ速度の設定の詳細については後述する。
制御回路19は、ステップS13で記録ゲインGを上昇させたあと、再度、A/D変換器15の音声出力Dを上限閾値と比較する(S14)。A/D変換器15の音声出力Dが上限閾値を超えていない場合(S14でNO)、制御回路19は、再度、アナログアンプ13の記録ゲインGの値を、あらかじめ設定された初期値Gintと比較する(S12)。
A/D変換器15の音声出力Dが上限閾値を超えた場合(S14でYES)、制御回路19は、アナログアンプ13の記録ゲインGの上昇を停止し(S15)、処理を終了する。
ステップS12でNOの場合、すなわち記録ゲインGの値が初期値Gint以上の場合は、制御回路19は、アナログアンプ13の記録ゲインGの上昇を停止し(S15)、処理を終了する。
以上のように、本実施形態のアナログ音声処理部115は、音声出力Dのレベルに応じて記録ゲインGを変更することで、マイクアンプ11が出力する音声信号A’のレベルが高くても記録される音声信号が歪まないように記録ゲインを自動で制御する自動レベル制御(ALC)を実現する。
[1−2−2.リカバリ速度]
上述のように、アナログアンプ13の記録ゲインGは、A/D変換器15の出力Dのモニタリングにより、音声信号AやA’が過大になると、低下させられる。その後、入力する音声信号AやA’のレベルが低くなると、記録ゲインGを、初期値に戻そうとするリカバリ動作が行われる。このリカバリ動作において、記録ゲインGを上昇させる速度であるリカバリ速度は、制御回路19により設定される。以下、リカバリ速度の設定について図4Aおよび図4Bを用いて説明する。図4Aおよび図4Bの横軸は時間を示し、縦軸はレベル(振幅)を示す。図4Aおよび図4B中のグレーの領域はアナログアンプ13の出力A’Gのレベル(振幅)を示す。
図4Aは、自動レベル制御により記録ゲインGが低下された後の通常のリカバリ動作を説明した図である。図4Bは、自動レベル制御により記録ゲインGが低下された後のリカバリ動作であって、直前にユーザによるマイクアンプ11の録音レベルの低下操作がなされたときのリカバリ動作を説明した図である。
図4Aに示すように、アナログアンプ13に対して大きな音声が入力された場合、自動レベル制御により、A/D変換器15に入力する音声信号のレベル(振幅)が所定の範囲(Lth(+)〜Lth(−))内に収まるように記録ゲインGが低下される。ここで、所定の範囲(Lth(+)〜Lth(−))とは、A/D変換器15の出力Dが上限閾値内に収まることになる範囲である。
図4Aについて説明する。図4Aは、時刻t1以前では音声信号Aのレベルが高く、時刻t1より後で音声信号Aのレベルが低くなった時の、アナログアンプ13の出力A’Gのレベル(振幅)の時間変化を示す図である。時刻t1以前では、記録ゲインGの低下により、音声出力のレベルA’Gが低下して、所定の範囲(Lth(+)〜Lth(−))内に収まっている。時刻t1より後で、音声信号Aのレベルが低くなったので、記録ゲインGを初期値に戻そうとするリカバリ処理が行われる。その際、記録ゲインの値は急激に上昇させずに、比較的長い時間Tr1(例えば10秒)をかけて初期値に戻される。これは、記録ゲインGの値を急激に上昇させると、ノイズフロアの急激な上昇等により、聴感上不自然な音声となるからである。このため、アナログアンプ13は、通常のリカバリ動作においては、比較的遅いリカバリ速度で記録ゲインを上昇させる。比較的長い時間Tr1のあと、記録ゲインGは最終的な値に安定する。
ところで、ユーザが音声の記録中に意図的にマイクアンプ11の録音レベルを低下させる操作を行った場合は、記録ゲインGを最終的な値に早く安定させるためにアナログアンプ13の記録ゲインGを上昇させる必要がある。この場合、ユーザは意図的に録音レベルを変化させていることから、記録ゲインの急激な上昇による聴感上の不自然さは問題とならず、むしろ応答性が要求される。しかし、上述のように、リカバリ速度が遅いと、記録ゲインGの変化のレスポンスが遅くなり、変更後の音の定常レベルが直ぐに認識できないという問題が生じる。
そこで、本実施形態のアナログ音声処理部115は、ユーザによる録音レベルの低下操作がなされた場合は、リカバリ動作において、通常のリカバリ速度よりも速いリカバリ速度(第1の速度)で記録ゲインGを上昇させるように構成されている。すなわち、図4Bに示すように、ユーザによるマイクアンプ11の録音レベルの低下操作がなされた場合、比較的短い時間Tr2(例えば、0.5秒)でリカバリ処理を行う。すなわち、図4Aに示した例のリカバリ速度(第2の速度)よりも速いリカバリ速度(第1の速度)でリカバリ処理を行う。これにより、図4Bに示すように、図4Aで示す通常の場合と比べてより迅速に記録ゲインの値を最終的な値に早く安定できる。リカバリ速度を速くして応答性を良くすることで、録音レベルの変更後の定常レベル(入力音声のレベル)を迅速に認識することが可能となる。
図5は、アナログ音声処理部115におけるアナログアンプ13に対するリカバリ速度の設定処理を示すフローチャートである。図5のフローチャートを用いて、アナログアンプ13に対するリカバリ速度の設定処理を説明する。
ユーザは操作部180を介して録音レベルの操作を行うことができる。ユーザによる録音レベルの低下の操作があると、その旨を示す情報がコントローラ130からアナログ音声処理部115における制御回路19に送信される。制御回路19は、コントローラ130から、ユーザによる録音レベルの低下の操作があった旨を示す情報を受信すると(S31でYES)、アナログアンプ13に対して、リカバリ速度を速い速度(第1の速度)に設定するための制御信号を送信する(S32)。アナログアンプ13は、この制御信号を受けると、リカバリ速度を速い速度(第1の速度)に設定する。
例えば、アナログアンプ13は、リカバリ速度を設定する回路の時定数を変更することで、リカバリ速度の設定を変更することができる。具体的には、アナログアンプ13に含まれるRC回路の抵抗(R)及びキャパシタ(C)の少なくとも一方の値を変更するように回路構成を変更することで、リカバリ速度を切り替えることができる。
なお、アナログアンプ13において、リカバリ速度が速い速度(第1の速度)に設定されている場合、速い速度でリカバリが行われた後、記録ゲインGの上昇を停止したときに(図3のステップS15)、リカバリ速度は通常の速度(第2の速度)にリセットされる。
以上のように、本実施形態では、ユーザによる録音レベルの低下の操作があったときには、記録ゲインのリカバリを通常の場合よりも速い速度で行う。これによって、記録ゲインを元の値に迅速に戻すことができるため、録音レベルの変更後、直ぐに、定常レベルを把握することができる。
[1−3.効果、等]
本実施形態のアナログ音声処理部115(音声信号処理装置の一例)は、入力した音声信号Aを録音レベルに応じて増幅するマイクアンプ11(第1の増幅器の一例)と、マイクアンプ11からの音声信号A’を記録ゲインGで増幅するアナログアンプ13(第2の増幅器)と、を備える。アナログアンプ13は、音声出力Dのレベルが上限閾値よりも大きいときは、アナログアンプ13の記録ゲインGを低下させ、音声出力Dのレベルが上限閾値よりも小さく且つ記録ゲインGの値が初期値Gintより低いときに、記録ゲインGを第1の速度で上昇させる。記録ゲインGを上昇させる場合に、制御回路19は、ユーザにより録音レベル(入力レベルの一例)を低下させる操作が直前に行われていた場合は、アナログアンプ13の記録ゲインGを第1の速度で変化させる。一方、ユーザにより録音レベルを低下させる操作が行われていない場合、制御回路19は、アナログアンプ13の記録ゲインGを第1の速度よりも遅い第2の速度で変化させる。
このように記録ゲインGのリカバリ速度を制御することで、ユーザによる録音レベルの低下の操作があったときには、記録ゲインGを迅速に変更することができるため、録音レベルの変更後、直ぐに、定常レベルを把握することが可能となる。
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、第1の実施の形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記第1の実施の形態で説明した構成要素と他の構成要素とを組み合わせて、新たな実施の形態とすることも可能である。
上記の実施の形態では、アナログ音声処理部115において、入力する音声信号のレベルに応じてアナログアンプ13の記録ゲインを変更している。その際、入力する音声信号のレベルを、A/D変換器15の出力Dに基づいて判断している。しかし、入力する音声信号のレベルは他の信号に基づいて判断してもよい。例えば、入力する音声信号の信号レベルを、A/D変換器15の入力に基づき判断してもよいし、アナログアンプ13の入力信号に基づき判断してもよい。すなわち、入力する音声信号に応じてレベルが変化する信号であれば、任意の信号を使用することができる。
上記の実施の形態において、ステップS11で、音声出力Dのレベルが上限閾値よりも大きいか、上限閾値以下かに応じて上記で説明した処理を行うことに代えて、音声出力Dのレベルが上限閾値以上か、上限閾値より小さいかに応じて上記で説明した処理を行うようにしてもよい。また、ステップS12で、記録ゲインGの値が初期値Gintよりも低いか、初期値Gint以上かに応じて上記で説明した処理を行うことに代えて、記録ゲインGの値が初期値Gint以下か、初期値Gintより大きいかに応じて上記で説明した処理を行うようにしてもよい。また、ステップS14で、音声出力Dが上限閾値を超えたか、上限閾値以下かに応じて上記で説明した処理を行うことに代えて、音声出力Dが上限閾値以上か、上限閾値より小さいかに応じて上記で説明した処理を行うようにしてもよい。
上記の実施の形態では、本開示の音声信号処理装置(アナログ音声処理部)をデジタルカメラに適用した例を説明したが、本開示の音声信号処理装置の構成は、音声信号を入力し、記録等の所定の処理(音声の記録、出力、編集等)を施す電子機器であれば、種々の電子機器に適用することができる。例えば、本開示の音声信号処理装置の構成は、ビデオカメラや、スマートフォン、携帯電話、ICレコーダ、スピーカ等に適用することができる。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示の音声信号処理装置は、入力した音声信号の出力レベルを自動で調整可能な自動レベル制御装置に適用できる。
10 マイクロホン
11 マイクアンプ(第1の増幅器)
13 アナログアンプ(第2の増幅器)
15 A/D変換器
19 制御回路
100 デジタルカメラ(撮像装置)
102 カメラボディ
110 音声入力系
111 マイクロホン部
115 アナログ音声処理部(音声信号処理装置)
120 デジタル画像・音声処理部
130 コントローラ
140 画像入力系
143 CCDイメージセンサ
160 外部記憶媒体
180 操作部
301 交換レンズ

Claims (4)

  1. 入力した音声信号を入力レベルに応じて増幅する第1の増幅器と、
    前記第1の増幅器で増幅した前記音声信号を所定のゲインで増幅する第2の増幅器と、を備え、
    前記第2の増幅器は、
    前記入力した音声信号のレベルが上限閾値よりも大きいときは、前記ゲインを自動で低下させ、
    前記入力した音声信号のレベルが上限閾値よりも小さく、かつ前記ゲインが所定値よりも低いときに、前記ゲインを自動で上昇させ、
    前記ゲインを上昇させる場合に、前記第2の増幅器は、
    ユーザにより前記入力レベルを低下させる操作が行われていた場合は、前記ゲインを第1の速度で変化させ、
    ユーザにより前記入力レベルを低下させる操作が行われていない場合は、前記ゲインを前記第1の速度よりも遅い第2の速度で変化させる、
    音声信号処理装置。
  2. さらに、前記第2の増幅器から出力されたアナログ信号をデジタル信号に変換するA/D変換器を備え、
    前記第2の増幅器は、前記音声信号のレベルが前記上限閾値よりも大きいときは、前記A/D変換器に入力するアナログ信号のレベルが所定値を超えないように前記ゲインを低下させる、
    請求項1記載の音声信号処理装置。
  3. 前記第2の増幅器は、前記音声信号のレベルを、前記A/D変換器の入力信号または出力信号に基づき判断する、
    請求項2記載の音声信号処理装置。
  4. 被写体を撮像して画像データを生成する撮像装置であって、
    音声を入力し前記音声信号を生成するマイクと、
    前記マイクにより生成された前記音声信号を処理する請求項1から3までのいずれかに記載の音声信号処理装置と、を備えた、
    撮像装置。
JP2017540467A 2015-09-14 2016-08-09 音声信号処理装置及びそれを用いた撮像装置 Active JP6518957B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015181091 2015-09-14
JP2015181091 2015-09-14
PCT/JP2016/003662 WO2017047000A1 (ja) 2015-09-14 2016-08-09 音声信号処理装置及びそれを用いた撮像装置

Publications (2)

Publication Number Publication Date
JPWO2017047000A1 true JPWO2017047000A1 (ja) 2018-07-26
JP6518957B2 JP6518957B2 (ja) 2019-05-29

Family

ID=58288456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017540467A Active JP6518957B2 (ja) 2015-09-14 2016-08-09 音声信号処理装置及びそれを用いた撮像装置

Country Status (3)

Country Link
US (1) US10411667B2 (ja)
JP (1) JP6518957B2 (ja)
WO (1) WO2017047000A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110870201B (zh) 2017-08-18 2023-10-24 Oppo广东移动通信有限公司 音频信号调节方法、装置、存储介质及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005210180A (ja) * 2004-01-20 2005-08-04 Sony Corp 入力信号処理装置、録音装置、録音方法
JP2006041733A (ja) * 2004-07-23 2006-02-09 Sanyo Electric Co Ltd 自動レベル調整回路
JP2006173918A (ja) * 2004-12-14 2006-06-29 Sharp Corp 音声処理装置及び撮像装置
JP2011124850A (ja) * 2009-12-11 2011-06-23 Canon Inc 撮像装置並びにその制御方法及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3921733B2 (ja) * 1997-05-07 2007-05-30 ソニー株式会社 入力信号制御装置
JP4204828B2 (ja) * 2002-09-12 2009-01-07 旭化成エレクトロニクス株式会社 自動利得制御装置、自動利得制御方法および自動利得制御プログラム
JP4016206B2 (ja) * 2003-11-28 2007-12-05 ソニー株式会社 音声信号処理装置及び音声信号処理方法
JP4640948B2 (ja) * 2004-06-17 2011-03-02 ローム株式会社 Alc付き増幅装置およびそれを用いた電子機器
US7088177B2 (en) * 2004-11-06 2006-08-08 Texas Instruments Incorporated Amplifier apparatus
JP5394905B2 (ja) * 2009-01-14 2014-01-22 ローム株式会社 自動レベル制御回路およびそれを用いたオーディオ用デジタル信号プロセッサならびに可変利得増幅器の利得制御方法
JP5120288B2 (ja) * 2009-02-16 2013-01-16 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
JP5555092B2 (ja) * 2009-09-10 2014-07-23 ローム株式会社 レベル調節回路およびそれを用いたオーディオシステム
JP2011130341A (ja) * 2009-12-21 2011-06-30 Oki Semiconductor Co Ltd 信号処理装置及び信号処理方法
JP6105929B2 (ja) * 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005210180A (ja) * 2004-01-20 2005-08-04 Sony Corp 入力信号処理装置、録音装置、録音方法
JP2006041733A (ja) * 2004-07-23 2006-02-09 Sanyo Electric Co Ltd 自動レベル調整回路
JP2006173918A (ja) * 2004-12-14 2006-06-29 Sharp Corp 音声処理装置及び撮像装置
JP2011124850A (ja) * 2009-12-11 2011-06-23 Canon Inc 撮像装置並びにその制御方法及びプログラム

Also Published As

Publication number Publication date
US10411667B2 (en) 2019-09-10
US20180175815A1 (en) 2018-06-21
JP6518957B2 (ja) 2019-05-29
WO2017047000A1 (ja) 2017-03-23

Similar Documents

Publication Publication Date Title
US8253823B2 (en) Camera body, interchangeable lens, and imaging apparatus
JP5123137B2 (ja) 撮像装置および撮像方法
JP2012118522A (ja) カメラボディ、交換レンズ及び中間レンズ
JP2006174412A (ja) 撮像装置
US8514300B2 (en) Imaging apparatus for reducing driving noise
WO2019044021A1 (ja) 撮像装置
JP4715200B2 (ja) 電子カメラ
JP6518957B2 (ja) 音声信号処理装置及びそれを用いた撮像装置
JP6569263B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9064487B2 (en) Imaging device superimposing wideband noise on output sound signal
US8897462B2 (en) Audio processing apparatus, sound pickup apparatus and imaging apparatus
US10104291B2 (en) Imaging device
JP2005223588A (ja) デジタルカメラ及びデジタルカメラの制御方法
US9379684B2 (en) Recorder
US9648220B2 (en) Imaging apparatus, imaging apparatus body and image sound output method
JP7153839B2 (ja) 撮像装置
JP2006217111A (ja) 動画撮影装置、及び動画撮影方法
JP2016092799A (ja) 撮像装置
JP5506471B2 (ja) 撮像装置
JP2021033145A (ja) 撮像装置、撮像装置の制御方法及びそのプログラム
JP2009239930A (ja) 動画撮影装置、及び、プログラム
JP2017195558A (ja) 撮像装置
JP2011151522A (ja) 撮影装置
JP2006221135A (ja) 撮像装置および撮像システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180228

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20190123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190325

R151 Written notification of patent or utility model registration

Ref document number: 6518957

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151