JP2019062514A - 音声処理装置及びその制御方法 - Google Patents

音声処理装置及びその制御方法 Download PDF

Info

Publication number
JP2019062514A
JP2019062514A JP2017241123A JP2017241123A JP2019062514A JP 2019062514 A JP2019062514 A JP 2019062514A JP 2017241123 A JP2017241123 A JP 2017241123A JP 2017241123 A JP2017241123 A JP 2017241123A JP 2019062514 A JP2019062514 A JP 2019062514A
Authority
JP
Japan
Prior art keywords
gain
level
audio signal
sound
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017241123A
Other languages
English (en)
Inventor
貴俊 佐伯
Takatoshi Saeki
貴俊 佐伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2019062514A publication Critical patent/JP2019062514A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F3/00Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
    • H03F3/181Low-frequency amplifiers, e.g. audio preamplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/02Manually-operated control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1008Earpieces of the supra-aural or circum-aural type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/007Protection circuits for transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Power Engineering (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】モニタ用の音声が記録用の音声に則した変化をする音声処理装置を提供する。【解決手段】記録用ALC回路102は、入力音声信号101のレベルに応じて自動的にゲイン制御を行う。記録用ALC回路102は、遅延部103、レベル検出部104、ゲイン設定部105、ゲイン制御部106を有する。記録用ALC回路102の後段には、モニタ用ALC回路107が接続される。モニタ用ALC回路107は、記録用ALC回路102から出力された記録用音声信号112に対してゲイン制御を行う。モニタ用ALC回路107は、遅延部108、レベル検出部109、ゲイン設定部110、ゲイン制御部111を有する。記録用ALC回路102から出力された記録用の音声信号112は、音声符号化部(不図示)を経て記録部に出力される。また、モニタ用ALC回路107から出力されたモニタ用の音声信号113は音声出力部に出力される。【選択図】図1

Description

本発明は音声処理装置及びその制御方法に関するものである。
ビデオカメラには、映像だけでなく音声を取得するための音声処理装置が搭載されている。そして、かかる音声処理装置では、記録される音声のレベルを適正な範囲に保つために、ALC(自動レベル制御)という制御を使用することが知られている。ALCでは、入力音声のレベルが過大な場合はゲインを下げて抑圧し、入力音声のレベルが過小の場合はゲインを上げて音声を増幅させる処理を行っている(例えば、特許文献1参照)。
特開2004-104692号公報
しかしながら、上記従来例ではALCを単独で使用したときの対策であった。ため、ユーザの耳の保護などを目的として、記録音に対して更にALC処理を行った音をユーザがモニタをする場合に、記録音とモニタ音の間にレベル差が発生し、変化が異なってしまい、聴感に違和感が生じることがある。
この問題を解決するため、例えば本発明の音声処理装置は以下の構成を備える。すなわち、
音声入力部から入力された音声信号に第1のゲインを適用することにより前記入力された音声信号のレベルを制御する手段であって、前記入力された音声信号に前記第1のゲインを適用して得られる第1音のレベルが第1のレベル範囲の下限より小さい場合に前記第1のゲインを上げ、前記第1音のレベルが前記第1のレベル範囲の上限より大きい場合に前記第1のゲインを下げる処理を行い、第1の出力音声信号を生成する第1の信号処理手段と、
前記第1の信号処理手段により生成された前記第1の出力音声信号に第2のゲインを適用することにより前記第1の出力音声信号のレベルを制御する手段であって、前記第1の出力音声信号に前記第2のゲインを適用して得られる第2音のレベルが第2のレベル範囲の下限よりも小さい場合に前記第2のゲインを上げ、前記第2音のレベルが前記第2のレベル範囲の上限よりも大きい場合に前記第2のゲインを下げる処理を行い、第2の出力音声信号を生成する第2の信号処理手段とを有し、
前記第2の信号処理手段は、
前記第2音のレベルが前記第2のレベル範囲の下限よりも小さい場合、前記第1のゲインが予め設定された設定値に達したことに応じて、前記第2のゲインを上げる処理を行うことを特徴とする。
本発明によれば、モニタ用の音声が記録用の音声に則した変化をするために聴感上の違和感を無くすことができる。
実施形態における音声処理部のブロック図。 音声処理部のゲイン制御に係るフローチャート。 音声信号のレベルを示す図。 音声信号のレベルを示す図。 第2の実施形態の音声処理部のゲイン制御を示すフローチャート。 音声信号のレベルを示す図。 音声信号のレベルを示す図。 撮像装置のブロック図。 第3の実施形態における音声処理部のブロック図。 第3の実施形態の音声処理部のゲイン制御を示すフローチャート。 音声信号のレベルを示す図。 音声信号のレベルを示す図。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。
<第1の実施形態>
実施形態では、ビデオカメラ等の撮像装置に適用される音声処理装置について説明する。
図8は撮像装置800の主に記録に係るブロック構成図を示している。撮像装置800における撮像部801は、レンズなどの光学系や撮像素子、AD変換器などを有し、撮像素子上に結像した画像に対応する信号を画像データとして出力することを繰り返す。実施形態における撮像部801は、例えば30フレーム/秒の動画像として出力する。画像処理部802は、撮像部801からの動画信号に対して、表示のための必要な処理を行い、その処理結果を表示部803に出力し、表示させる。また、画像処理部802は、MPEGなどの公知の符号化方式により動画信号を圧縮して記録部807に出力する。
音声入力部804はマイクロフォンやAD変換器などを有し、サンプリングして得た装置外からの音響(被写体の音声)を音声信号として音声処理部805に出力する。なお、音声入力部804は、右チャンネルと左チャンネルを含むステレオ音声信号を出力する。音声処理部805は、音声入力部805からの音声信号に対して、ゲイン制御などの必要な処理を施して音声出力部806と記録部807に出力する。なお、音声処理部805は、音声信号を圧縮して記録する場合には、ゲイン制御の処理が施された記録用の音声信号に対して圧縮処理を施した上で、記録部807に出力する。音声出力部806は、撮像装置800の外部にヘッドフォン811等の音声モニタ用の装置が接続された場合、音声処理部805からのモニタ用音声信号をD/A変換し、ヘッドフォン811に出力する。
記録部807は、画像処理部802からの記録用の動画信号(画像符号化データ)と、音声処理部805からの記録用の音声信号(符号化音声データ)とを、記録媒体808に、例えば1つのMPEGファイルとして記録する。記録媒体808はメモリカードなどのランダムアクセスの記録媒体である。また、記録媒体808は、撮像装置800に対して脱着可能な形態とするが、撮像装置800に内蔵される構成であっても構わない。
制御部809はCPUやメモリを備え、操作部810からのユーザの指示に応じて撮像装置800の各部を制御する。
ここで、実施形態における撮像装置800の動作を説明する。操作部810が操作され、撮像装置800の電源が投入されると、制御部809は各部を制御し、撮像装置800を記録待機状態に移行させる。また、記録待機状態においては、音声出力部806からの音声信号の出力を停止させる。つまり、ユーザがヘッドフォン811を接続し、装着していたとしても、音声入力部804が取得した音声を視聴できない。
記録待機状態において、撮像部801は動画信号を画像処理部802に出力する。画像処理部802は、撮像部801からの動画信号を表示部803に出力し、表示部803は撮像部801からの動画を表示する。この状態で操作部810をユーザが操作して、記録開始の指示があると、制御部809は各部を制御して記録処理を開始する(記録状態に移行する)。
即ち、制御部809は、画像処理部802を制御して撮像部801からの動画信号の記録用の処理を開始させる。画像処理部802は、撮像部802からの動画信号に記録用の処理(符号化を含む)を施して記録部807に出力する。また、制御部809は、音声処理部805に対して音声信号の処理を指示する。音声処理部805は、音声入力部804からの音声信号に対して後述の処理を施し、記録用の音声信号を記録部807に出力する。
記録部807は、制御部809からの記録開始の指示に応じて、画像処理部802からの動画信号と音声処理部805からの音声信号とを記録媒体808に記録する。また、音声処理部805は、記録開始の指示に応じて、モニタ用の音声信号を音声出力部806に出力する。音声出力部806は、ヘッドフォン811などの外部のモニタ装置に対してモニタ用の音声信号を出力する。
記録開始後、操作部810が操作され、ユーザによる記録停止の指示があると、制御部809は各部を制御して記録媒体808に対する動画信号と音声信号の記録を停止し、記録待機状態に移行させる。
次に、音声処理部805によるゲイン制御の処理について説明する。図1は音声処理部805におけるLチャネルのゲイン制御に関する部分のブロック構成図である。ステレオのもう一方のRチャネルは同様の構成を有するので、説明は省略する。以下は、Lチャネルの音声信号に対する説明であると理解されたい。
図1に示すように、音声処理部805は、記録用自動レベル制御(ALC)回路102、モニタ用ALC回路107の2つの音声信号処理回路を含む。
詳細は後述する説明から明らかになるが、実施形態における記録用ALC回路102、モニタ用ALC回路107は以下のように動作する。
記録用ALC回路102は、音声入力部801から入力した音声信号のレベルを検出し、記録音のレベルを算出して、予め設定された第1のレベル範囲(実施形態ではth_low1〜th_high1の範囲)の下限を下回ったらゲインを上げ、第1のレベル範囲の上限を上回ったらゲインを下げ、第1のレベル範囲内にある場合にはゲインを非調整とすることで、記録用の音声信号を生成する。即ち、記録用ALC回路102は、入力した音声信号にゲインを与えることにより入力された音声信号のレベルを制御する。このとき、算出した記録音のレベルが第1のレベル範囲の下限より小さい場合にゲインを上げ、第1のレベル範囲の上限より大きい場合にゲインを下げる処理を行う。
ただし、第1のレベル範囲の下限より小さい記録音であるときは、下限に達するまで制限なくゲインを上げてしまうと、静かな環境音などでも大きく聞こえてしまい、本来記録したい音声が聞き取りにくくなる。このため、入力信号に加えるゲインの最大レベルを決めておき、この値以上にリカバリするゲインを大きくしない。
また、モニタ用ALC回路107は、記録用ALC回路102で得た音声信号のレベルを検出し、モニタ音のレベルを算出して、第2のレベル範囲(実施形態ではth_low2〜th_high2の範囲)の下限を下回ったらゲインを上げ、第2のレベル範囲の上限を上回ったらゲインを下げ、第2のレベル範囲内にある場合にはゲインを非調整とすることで、モニタ用の音声信号を生成する。即ち、モニタ用ALC回路107は、入力した音声信号にゲインを与えることにより入力された音声信号のレベルを制御する。このとき、算出したモニタ音のレベルが第2のレベル範囲の下限より小さい場合にゲインを上げ、第2のレベル範囲の上限より大きい場合にゲインを下げる処理を行う。
ただし、第2のレベル範囲の下限より小さいモニタ音であるときは、下限に達するまで制限なくゲインを上げてしまうと、静かな環境音などでも大きく聞こえてしまい、本来記録したい音声が聞き取りにくくなる。このため、入力信号に加えるゲインの最大レベルを決めておき、この値以上にリカバリするゲインを大きくしない。
また、モニタ用ALC回路107は、モニタ音のレベルが第2のレベル範囲の下限を下回った場合であっても、記録用ALC回路102で用いたゲインが予め設定された設定値に到達するまでは、ゲインを上げる処理を行わず、非調整とする。
以下、図1に従って、詳しく説明する。音声入力部804からの音声信号101は記録用ALC回路102に出力される。記録用ALC回路102は、入力音声信号のレベルに応じて自動的にゲイン制御を行う。
記録用ALC回路102は、入力音声信号101を遅らせる遅延部103、入力音声信号101のレベルを検出するレベル検出部104、レベル検出部104の出力に応じてゲインを設定するゲイン設定部105を有する。また、記録用ALC回路102は、ゲイン設定部105により設定されたゲインに基づいて入力音声信号101をゲイン制御するゲイン制御部106を有する。
記録用ALC回路102の後段には、モニタ用ALC回路107が接続される。モニタ用ALC回路107は、記録用ALC回路102から出力された記録用音声信号112に対してゲイン制御を行う。
モニタ用ALC回路107は、記録用の音声信号112を遅らせる遅延部108、記録用の音声信号112のレベルを検出するレベル検出部109を有する。モニタ用ALC回路107は、レベル検出部109からの出力、及び、記録用ALC回路102のゲイン設定部105において設定されたゲインに応じて、ゲインを設定するゲイン設定部110を有する。また、モニタ用ALC回路107は、ゲイン設定部110により設定されたゲインに基づいて、遅延部108からの記録用の音声信号をゲイン制御するゲイン制御部111を有する。
記録用ALC回路102から出力された記録用の音声信号112は、音声符号化部(不図示)を経て記録部807に出力される。また、モニタ用ALC回路107から出力されたモニタ用の音声信号113は音声出力部806に出力されることになる。
図2(A)(B)は、実施形態における音声処理部805における自動ゲイン制御に係る処理を示すフローチャートである。図2(A)は、記録用ALC回路102の自動ゲイン制御に係る処理を示すフローチャートである。図2(B)は、モニタ用ALC回路107の自動ゲイン制御に係る処理を示すフローチャートである。図2(A)(B)の処理は、音声信号の記録中において、S212で定められたゲイン設定待ち処理の一定時間間隔で繰り返し実行される。
本実施形態では、記録用ALC回路102は、記録音である音声信号のレベル(エンベロープ検出された値)に対するゲイン制御を、下限値th_low1と上限値th_high1とに基づいて行う。遅延器103は、レベル検出部104がエンベロープ検出のために要する期間だけ、入力された音声信号の各サンプルを遅延させる。また、前記モニタ用ALC回路107は、モニタ音である音声信号のレベルに対するゲイン制御を、下限値th_low2と上限値th_high2とに基づいて行う。なお、各上限値、下限値の関係は以下の通りである。
本実施形態では、モニタ用の音声を聞くユーザの耳の保護を目的としているため、下記の通り上限値、下限値を設定する。
th_high1(-2 dBFs) > th_high2(-20 dBFs)
th_low1(-6 dBFs) > th_low2(-26 dBFs)
なお、各数値は一例であり、th_high1(-2 dBFs) > th_high2、th_low1(-6 dBFs) >th_low2の関係が保持されるのであれば、適宜変更可能である。
記録音はSN比をよくするために、音が割れない程度に大きいレベルで記録することが好ましい。ただし、このレベルの音は人が聞くには大きく、耳に悪影響を与える可能性が高い。そのため、モニタ用ALCの上限値、下限値は、記録用ALCにおける上限値、下限値よりそれぞれ小さく設定する。具体的な処理手順は以下の通りである。
レベル検出部104は、入力音声信号101のレベルを検出し、検出したレベルをゲイン設定部105に出力する。ゲイン設定部105は、S201にて、レベル検出部104により検出された入力信号にゲインGain1を適用して算出した記録音(Signal_calcR)のレベルが上限値th_high1より大きいか否かを判定する。
Signal_calcR = signal_input + Gain 1
算出した記録音のレベルが上限値th_high1より大きい場合、ゲインを下げる必要がある。このため、ゲイン設定部105は、記録用ALC回路102のゲイン制御部106に対して直前まで設定していたゲインGain1の値を以下のように更新する(S202)。
Gain1 = Gain1 + Limit_Gain1
ここで、Limit_Gain1とは記録用ALC回路102のゲインGain1を下げるために加算するゲインであり、Limit_Gain1の値は負になる。ゲインを下げる必要があるときは信号のレベルが大きくなり歪む可能性が高いため、できるだけ早い時定数でゲインを下げたほうがよい。具体的には、例えば、ゲインを変更させる際の時定数を早くする場合は、1回に変更するゲインLimit_Gain1の量を大きく設定する。反対に、時定数を遅くする場合は、1回に変更するゲインLimit_Gain1の量を小さくする。これ以外にも、例えば、ゲインを変更させる際の時定数を早くする場合は、Limit_Gain1を変更する間隔を短くする。例えば、入力される音声信号の2サンプル毎にLimit_Gain1を変更する。その際、1回に変更するLimit_Gain1の量は一定とする。また、時定数を遅くする場合には、Limit_Gain1を変更する間隔を長くする。例えば、入力される音声信号の8サンプル毎にLimit_Gain1を変更する。時定数を早くする、或いは、遅くする必要がない場合には、例えば、入力される音声信号の4サンプル毎にLimit_Gain1を変更する。
S202でゲインを変更した後は、S212を介してS201に戻り、記録音のレベルがth_high1より小さくなるまで繰り返す。
一方、S201にて、算出した記録音のレベルが上限値th_high1よりも大きくないと判定した場合には、ゲイン設定部105は、処理をS203に進め、算出した記録音のレベルが下限値th_low1より小さいか判定する。算出した記録音のレベルが下限値th_low1より小さいときはゲインを上げる必要があるため、処理S204に処理を進める。一方、S203で算出した記録音のレベルが下限値th_low1よりも小さくないと判定した場合には、適正なレベルに収まっているため、ゲイン設定部105は、ゲイン制御部106のゲインの値を変更しない。
その後S204で、記録用ALCのリカバリゲイン(Gain1)のレベルが記録用ALCの設定値(Gain1_max)に達しているか否かが判定される。
リカバリゲインとは、入力された音声信号に対してレベルを上げるためのゲインである。リカバリゲインの値を大きくしすぎると、静かな環境音などでも大きく聞こえてしまい、本来記録したい音声が聞き取りにくくなるため、設定値として各ALCでのリカバリゲインの最大値を定め、設定値(Gain1_max, Gain2_max)以上にリカバリゲインの値を変更しない。
S204の判定が、リカバリゲイン(Gain1)のレベルが設定値(Gain1_max)に達していないことを示しているときは、ゲイン設定部105は、記録用ALC回路102のゲイン制御部106に設定するゲインGain1の値を以下のように更新する(S205)。S205でゲインを変更した後は、S212を介してS201に戻る。
Gain1 = Gain1 + Recovery_Gain1
ここで、Recovery_Gain1とは記録用ALC回路102のゲインGain1を上げるために加算するゲインであるため、Recovery_Gain1の値は正である。ゲインを上げる必要があるときはレベルの変化が知覚されないように(目立たないように)、できるだけ遅い時定数でゲインを上げたほうがよい。具体的に、Recovery_Gain1を変更するための時定数の変え方は、Limit_Gain1を変更する際と同様である。そのため、Limit_Gain1とRecovery_Gain1を変更する際の時定数を独立に設定できる。
また、S202及びS205において、ゲイン設定部105は、設定したゲイン(更新したゲインGain1)の値をモニタ用ALC回路107のゲイン設定部110に出力する。
レベル検出部109は、ゲイン制御部106から出力された、記録用の音声信号のレベルを検出し、検出したレベルをゲイン設定部110に出力する。ゲイン設定部110は、S206にて、記録用ALC回路102によるゲイン調整済みの音声信号にゲインGain2を適用して算出したモニタ音(Signal_calcM)のレベルが上限値th_high2より大きいか否かを判定する。
Signal_calcM = signal_input + Gain2
算出したモニタ音のレベルが、上限値th_high2より大きい場合、ゲインを下げる必要がある。このため、ゲイン設定部110は、モニタ用ALC回路107のゲイン制御部111に対して直前まで設定していたゲインGain2の値を以下のように更新する(S207)。
Gain2 = Gain2 + Limit_Gain2
ここで、Limit_Gain2とはモニタALC回路107のゲインGain2を下げるために加算するゲインであり、Limit_Gain2の値は負である。ゲインを下げる必要があるときは、信号のレベルが大きく歪む可能性が高いため、できるだけ早い時定数でゲインを下げたほうがよい。具体的に、Limit_Gain2を変更するための時定数の変え方は、Limit_Gain1を変更する際と同様である。
一方、算出したモニタ音のレベルが上限値th_high2よりも大きくない場合、ゲイン設定部110は、S208に処理を進め、算出したモニタ音のレベルが下限値th_low2より小さいか否かを判定する。算出したモニタ音のレベルが下限値th_low2より小さくないと判定した場合、算出したモニタ音のレベルが上限値th_high2と下限値th_low2との間にあり、適正なレベルである。そのため、ゲイン設定部110は、ゲイン制御部111のゲインの値を変更しない。
また、S208にて、算出したモニタ音のレベルが下限値th_low2より小さいと判定された場合、ゲイン設定部110は、S209で、モニタ用ALCのリカバリゲイン(Gain2)のレベルがモニタ用ALCの設定値(Gain2_max)に達しているか確認し、モニタ用ALCの設定値(Gain2_max)に達していたときは、ゲインの値を変更しない。その後、S210にて、ゲイン設定部105から出力された記録用ALC回路102のリカバリゲイン(Gain1)のレベルが記録用ALCの設定値(Gain1_max)に達しているか否かを判定される。リカバリゲイン(Gain1)のレベルが記録用ALCの設定値(Gain1_max)に達していない場合は、ゲイン制御部111のゲインの値を変更しない。記録用ALC回路のリカバリゲイン(Gain1)が設定値(Gain1_max)に達している場合は、ゲイン設定部110は、S211に処理を進め、ゲインGain2を以下のように更新する。
Gain2 = Gain2 + Recovery_Gain2
ここで、Recovery_Gain2とはモニタ用ALC回路107のゲインGain2を上げるために加算するゲインであるため、Recovery_Gain2の値は正の数になる。
S211でのゲイン制御は記録音には影響せずモニタ音のみの変化であるため、モニタ用ALC回路107のゲインGain2を上げるときは、聴感上変化が分からないように変化するのが好ましい。よって、ゲインGain2を上げるときは、記録用ALCゲインGain1より遅い時定数でゲインを上げたほうがよい。即ち、Recovery_Gain2の値を、Recovery_Gain1の値よりも小さくする。具体的に、Recovery_Gain2を変更するための時定数の変え方は、Limit_Gain1を変更する際と同様である。そのため、Recovery_Gain2とRecovery_Gain1を変更する際の時定数を独立に設定できる。
このときの記録音、モニタ音のレベル変動は図4のようになる。図4は図1の構成における入力音声信号101、記録音112、モニタ音113のレベルを示した図である。また、図3は、モニタ用ALC回路のゲインを、モニタ用ALC回路に入力される記録用の音声信号のレベルだけに基づいて制御した場合のレベル変動を示した図(比較例を示す図)である。
図3では、タイミングt0からt2の期間で記録用の音声信号のレベルが上がっているのに対し、タイミングt0からt1という記録音よりも短い期間でモニタ用の音声信号のレベルが上がっている。このため、聴感上違和感が生じてしまう。一方、実施形態によれば、モニタ用ALC回路107のゲインを上げるのは、記録用ALC回路102のゲインが設定値に到達した以降である。従って、図4に示すように、タイミングt0からt2の期間ではモニタ用ALC回路107のゲインGain2を変更しない。そのため、モニタ用音声のレベルは記録音に則して変化することになり、モニタ用音声の聴感上の違和感が少なくできる。
<第2の実施形態>
モニタ用ALC回路107のゲインは遅い時定数で上げることが好ましい。しかし、モニタ用ALC回路107のみでゲイン制御を行うときは、記録音のレベルが記録用ALC回路102の上限値th_higi1よりも大きく、Gain1が小さく設定されている状態から、記録音のレベルが急に小さくなった場合、モニタ音のレベルがなかなか大きくならず、記録音の確認が難しくなってしまうことがある。その解決策として、本第2の実施形態は記録用ALC回路102がゲインを上げる処理を行っていたか否かにより、モニタ用ALC回路107のゲイン制御の時定数を変更する。これにより、聴感上の違和感が少なく且つ記録音の確認がしやすいレベルにすぐに調整される収音装置について説明する。なお、本第2の実施形態でも、Lチャネルの音声信号に対する構成と処理を説明するが、Rチャネルも同様の構成及び処理が行われる点ものと理解されたい。
図5(A)(B)は、第2の実施形態における音声処理部805のゲイン制御に係る処理を示すフローチャートである。図5(A)は、記録用ALC回路102の自動ゲイン制御に係る処理を示すフローチャートである。図5(B)は、モニタ用ALC回路107の自動ゲイン制御に係る処理を示すフローチャートである。図5(A)において、S501乃至S505は、第1の実施形態の図2(A)のS201〜S205と同じであるため、その説明は省略する。なお、以下の説明において、フラグaは、音声処理部805に予め確報されたレジスタもしくはメモリに確保されているものとする。また、図5(A)(B)の処理は、音声信号の記録中において、S518で定められたゲイン設定待ち処理の一定時間間隔で繰り返し実行される。
S506にて、ゲイン設定部110は、記録用ALC回路102からの入力音声信号にゲインGain2を適用して算出したモニタ音(Signal_calcM)のレベルが上限値th_high2より大きいか否かを判定する。算出したモニタ音のレベルが上限値th_high2より大きい場合、ゲイン設定部110はS507にて、記録用ALC回路102のゲインの制御状態を確認する。ここで、記録用ALC回路102にて、ゲインを下げる処理を行った場合、音声処理部805は、処理をS508に進めフラグaに1を代入する。一方、下げる制御をしていない場合は、音声処理部805は、S509にてフラグaに0を代入する処理を行う。
S510〜S513はS207〜S210と同様の処理であるので、その説明は省略する。
S513にて、ゲイン設定部110は、ゲイン設定部105から出力された記録用ALC回路102のゲイン(Gain1)が、予め決められた設定値に達しているか否かを判定する。記録用ALC回路102のゲインが設定値(Gain1_max)に達している場合、ゲイン設定部110は、処理をS514に進め、フラグaの値を確認する。フラグaの値が1であると判定された場合、聴感上の違和感が生じないようにモニタ用ALCゲインGain2を遅い時定数で上げる方がよい。よって、音声処理部805は、ゲイン制御部111に設定するゲインGain2の値を第1の増加量:Recovery_Gain2_sを用いて更新する(S515)。
Gain2 = Gain2 + Recovery_Gain2_s
また、S514において、フラグaの値が0なら、記録用ALC回路102でゲイン処理が行われていなかったことになり、モニタ用の音声信号のレベルはなかなか大きくならない。このため、モニタ用ALC回路107のゲインGain2を早い時定数で上げる方が良いので、ゲイン設定部110は、ゲイン制御部111に設定するゲインGain2を第2の増加量:Recovery_Gain2_fを用いて更新する(S516)。
Gain2 = Gain2 + Recovery_Gain2_f
ここで、Recovery_Gain2_fとRecovery_Gain2_sはゲインを更新するために加算するゲインであり、以下の関係を有する。
Recovery_Gain2_f > Recovery_Gain2_s
なお、S511、S513のどちらかがNo、またはS512がYesだった場合は、音声処理部805は、S517にて、フラグaの値を0に設定する。
このときの記録用の音声信号、モニタ用の音声信号のレベル変動は図7のようになる。図7は図5の処理による入力音声信号101、記録用の音声信号112、モニタ用の音声信号113のレベルを示した図である。図6は、モニタ用ALC回路のゲインを、モニタ音のレベルだけに基づいて制御した場合のレベル変動を示した図である。
図6では、タイミングt20からt22の期間で記録用の音声信号のレベルを上げているが、レベルが小さいため、モニタ用の音声信号により、記録されている音声信号のレベルを確認することは難しい。一方、実施形態で提案する構成では、タイミングt20からt21の期間で充分にモニタ音のレベルを上げることができている。なお、この構成で記録用ALCでゲイン制御が行われたとしても、前記図5のようにレベル変化をするため聴感上の違和感が少なくすることができる。
<第3の実施形態>
第1の実施形態および第2の実施形態では、記録用ALCとモニタ用ALCを直列に配置する構成を説明したが、第3の実施形態では、図9のように、記録用ALCとモニタ用ALCを並列に配置する構成について説明する。なお、本第3の実施形態でも、Lチャネルのみに着目して説明するが、Rチャネルについての同様の構成を有するものと理解されたい。
以下、図9に従って、詳しく説明する。音声信号901は記録用ALC回路902とモニタ用ALC回路907に出力される。記録用ALC回路902とモニタ用ALC回路907は、入力音声信号のレベルに応じて自動的にゲイン制御を行う。
記録用ALC回路902は、入力音声信号901を遅らせる遅延部903、入力音声信号901のレベルを検出するレベル検出部904、算出した記録音のレベルに応じてゲイン(Gain1)を設定するゲイン設定部905を有する。また、記録用ALC回路902は、ゲイン設定部905により設定されたゲイン(Gain1)に基づいて遅延部903からの入力音声信号をゲイン制御するゲイン制御部906を有する。
モニタ用ALC回路907は、入力音声信号901を遅らせる遅延部908を有する。この構成では、記録用ALC回路でのレベル検出結果とモニタ用ALC回路でのレベル検出結果が同じになるため、記録用ALC回路のレベル検出部904からの検出結果を取得できれば、モニタ用ALC回路907でレベル検出部を持つ必要はない。モニタ用ALC回路907は、記録用ALC回路902のレベル検出部904からの出力、及び、記録用ALC回路902のゲイン設定部905において設定されたゲイン(Gain1)に応じて、ゲイン(Gain2)を設定するゲイン設定部909を有する。また、モニタ用ALC回路907は、ゲイン設定部909により設定されたゲイン(Gain2)に基づいて遅延部908からの記録用の音声信号をゲイン制御するゲイン制御部910を有する。
図10(A)(B)は、実施形態における音声処理部805における自動ゲイン制御に係る処理を示すフローチャートである。図10(A)は、記録用ALC回路902の自動ゲイン制御に係る処理を示すフローチャートである。図10(B)は、モニタ用ALC回路907の自動ゲイン制御に係る処理を示すフローチャートである。また、図10(A)(B)の処理は、音声信号の記録中において、S1014で定められたゲイン設定待ち処理の一定時間間隔で繰り返し実行される。
記録用ALC回路902の上限値th_high1、下限値 th_low1の考え方は第1の実施形態と同じため割愛する。
レベル検出部904は、入力音声信号901のレベルを検出し、検出したレベルをゲイン設定部905に出力する。ゲイン設定部905は、S1001にて、レベル検出部904により検出された入力信号にゲインGain1を適用して算出した記録音(Signal_calcR)のレベルが上限値th_high1より大きいか否かを判定する。算出した記録音のレベルが上限値th_high1より大きい場合、ゲインを下げる必要がある。このため、ゲイン設定部905は、記録用ALC回路902のゲイン制御部906に対して直前まで設定していたゲインGain1の値を以下のように更新する(S1002)。
Gain1 = Gain1 + Limit_Gain1
このとき、記録音のゲイン変化をモニタ音でも確認できるように、モニタ用ALCも記録用ALCのゲイン変化量と同じゲイン量で操作する(S1003)。
Gain2 = Gain2 + Limit_Gain1
ここで、Limit_Gain1とは記録用ALC回路902のゲインGain1と、モニタ用ALC回路907のゲインGain2を下げるために加算するゲインであり、Limit_Gain1の値は負である。ゲインを下げる必要があるときは信号のレベルが大きくなり歪む可能性が高いため、できるだけ早い時定数でゲインを下げたほうがよい。
S1002、S1003でゲインを変更した後は、S1014を介してS1001に戻り、算出した記録音のレベルがth_high1より小さくなるまで繰り返す。
S1001にて、算出した記録音のレベルが上限値th_high1よりも大きくないと判定した場合の処理S1004〜S1006は、第1の実施形態のS203〜S205の処理と同じため割愛する。
また、S1002及びS1006において、ゲイン設定部905は、設定したゲイン(更新したゲインGain1)の値をモニタ用ALC回路907のゲイン設定部909に出力する。
レベル検出部904は、入力音声信号のレベルを検出し、検出したレベルをゲイン設定部909に出力する。ゲイン設定部909は、S1007にて、入力音声信号にゲインGain2を適用して算出したモニタ音(Signal_calcM)のレベルが上限値th_high2より大きいか否かを判定する。算出したモニタ音のレベルが、上限値th_high2より大きい場合、耳の保護の観点ではまだゲインが高いため、S1003で一度ゲインを下げているが、更にゲインを下げる必要がある。このため、ゲイン設定部909は、モニタ用ALC回路907のゲイン制御部910に対して直前まで設定していたゲインGain2の値を以下のように更新する(S1008)。
Gain2 = Gain2 + Limit_Gain2
ここで、Limit_Gain2とはモニタALC回路907のゲインGain2を下げるために加算するゲインであり、Limit_Gain2の値は負である。ゲインを下げる必要があるときは信号のレベルが大きくなり歪む可能性が高いため、できるだけ早い時定数でゲインを下げたほうがよい。具体的に、Limit_Gain2を変更するための時定数の変え方は、Limit_Gain1を変更する際と同様である。
一方、算出したモニタ音のレベルが上限値th_high2よりも大きくない場合、ゲイン設定部909は、S1009に処理を進め、算出したモニタ音のレベルが下限値th_low2より小さいか否かを判定する。算出したモニタ音のレベルが下限値th_low2より小さくないと判定した場合、モニタ用ALC回路907に入力されている音声信号のレベルは適正なレベルである。そのため、ゲイン設定部909は、ゲイン制御部910のゲインの値を変更しない。
また、S1009にて、算出したモニタ音のレベルが下限値th_low2より小さいと判定された場合、ゲイン設定部909は、S1010で、モニタ用ALCのリカバリゲイン(Gain2)のレベルがモニタ用ALCの設定値(Gain2_max)に達しているか確認し、モニタ用ALCの設定値(Gain2_max)に達していたときは、ゲインの値を変更しない。その後、S1011にて、ゲイン設定部905から出力された記録用ALC回路のリカバリゲイン(Gain1)のレベルが記録用ALCの設定値(Gain1_max)に達しているか否かを判定し、記録用ALCの設定値(Gain1_max)に達していない場合は、ゲイン制御部910は記録用ゲイン制御部906と同じゲインでモニタ用ALC回路907のゲインGain2を変化させる(S1013)。
Gain2 = Gain2 + Recovery_Gain1
記録用ALC回路902のゲインGain1が設定値(Gain1_max)に達している場合は、S1012に処理を進め、ゲインGain2を以下のように更新する。
Gain2 = Gain2 + Recovery_Gain2
ここで、Recovery_Gain2とはモニタ用ALC回路907のゲインGain2を上げるために加算するゲインであるため、Recovery_Gain2の値は正である。
S1013でのゲイン制御は記録音を確認するためのものであるため、モニタ用ALC回路907のゲインGain2を上げるときは、S1006と同じゲイン量(Recovery_Gain1)だけ変化させる。
一方、S1012でのゲイン制御は記録音には影響せずモニタ音のみの変化であるため、モニタ用ALC回路907のゲインGain2を上げるときは、聴感上変化が分からないように変化するのが好ましい。即ち、Recovery_Gain2の値を、Recovery_Gain1の値よりも小さくする。
このときの記録音、モニタ音のレベル変動は図12のようになる。図12は図9の構成における入力音声信号901、記録音911、モニタ音912のレベルを示した図である。また、図11は、モニタ用ALC回路のゲインを、モニタ音のレベルだけに基づいて制御した場合のレベル変動を示した図である。
図11では、タイミングt30からt32の期間でモニタ音のレベルが一定に上がっているが、実際に記録音でゲイン変化が行われているのはt30からt31と短い期間であるため、聴感上違和感が生じてしまう。一方、実施形態によれば、記録用ALC回路902のゲインが設定値に到達した以降(t31以降)は緩やかにゲインを上げるため、記録用音声のゲイン変化が分かりやすく、モニタ用音声の聴感上の違和感を少なくできる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
102…記録用ALC回路、103、108…遅延部、104、109…レベル検出部、105、110…ゲイン設定部、106、111…ゲイン制御部、107…モニタ用ALC回路

Claims (18)

  1. 音声入力部から入力された音声信号に第1のゲインを適用することにより前記入力された音声信号のレベルを制御する手段であって、前記入力された音声信号に前記第1のゲインを適用して得られる第1音のレベルが第1のレベル範囲の下限より小さい場合に前記第1のゲインを上げ、前記第1音のレベルが前記第1のレベル範囲の上限より大きい場合に前記第1のゲインを下げる処理を行い、第1の出力音声信号を生成する第1の信号処理手段と、
    前記第1の信号処理手段により生成された前記第1の出力音声信号に第2のゲインを適用することにより前記第1の出力音声信号のレベルを制御する手段であって、前記第1の出力音声信号に前記第2のゲインを適用して得られる第2音のレベルが第2のレベル範囲の下限よりも小さい場合に前記第2のゲインを上げ、前記第2音のレベルが前記第2のレベル範囲の上限よりも大きい場合に前記第2のゲインを下げる処理を行い、第2の出力音声信号を生成する第2の信号処理手段とを有し、
    前記第2の信号処理手段は、
    前記第2音のレベルが前記第2のレベル範囲の下限よりも小さい場合、前記第1のゲインが予め設定された設定値に達したことに応じて、前記第2のゲインを上げる処理を行う
    ことを特徴とする音声処理装置。
  2. 前記第2の信号処理手段は、前記第1のゲインが前記設定値に達した後に、前記第2のゲインを上げるときは、前記第1のゲインを上げる場合より遅い時定数で前記第2のゲインを上げることを特徴とする請求項1に記載の音声処理装置。
  3. 前記第2の信号処理手段は、
    前記第2音のレベルが前記第2のレベル範囲の上限よりも大きい場合、前記第1の出力音声信号が前記第1の信号処理手段によって前記第1のゲインを下げる処理をして得た信号であるか否かを判定する判定手段と、
    前記第2音のレベルが前記第2のレベル範囲の下限よりも小さく、且つ、前記第1のゲインが前記設定値に達した場合において、
    前記判定手段の判定の結果が前記第1のゲインを下げたことを示している場合には、第1の増加量に従って前記第2のゲインを上げ、
    前記判定手段の判定の結果が前記第1のゲインを下げたことを示していない場合には、前記第1の増加量よりも小さい第2の増加量に従って前記第2のゲインを上げるゲイン調整手段と
    を有することを特徴とする請求項1又は2に記載の音声処理装置。
  4. 前記設定値は、前記第1のゲインの取り得る範囲の最大値であることを特徴とする請求項1乃至3のいずれか1項に記載の音声処理装置。
  5. 前記第1のレベル範囲の上限値よりも、前記第2のレベル範囲の上限値の方が小さく、前記第2のレベル範囲の下限値よりも、前記第2のレベル範囲の下限値の方が小さい、ことを特徴とする請求項1乃至4のいずれか1項に記載の音声処理装置。
  6. 前記第1の信号処理手段により生成された前記第1の出力音声信号を記録媒体に記録する記録手段と、
    前記第2の信号処理手段から出力された第2の出力音声信号を外部のモニタ用の装置に出力する出力手段とを有することを特徴とする請求項1乃至5のいずれか1項に記載の音声処理装置。
  7. 前記第2の信号処理手段は、
    前記第2音のレベルが前記第2のレベル範囲の下限よりも小さい場合、前記第1のゲインが予め設定された設定値に達するまで、前記第2のゲインを上げる処理を行わないことを特徴とする請求項1に記載の音声処理装置。
  8. 撮像手段を有し、
    前記記録手段は、前記撮像手段により撮像して得られた画像信号を記録媒体に記録することを特徴とする請求項6に記載の音声処理装置。
  9. 音声入力部から入力された音声信号に第1のゲインを適用することにより前記入力された音声信号のレベルを制御する工程であって、前記入力された音声信号に前記第1のゲインを適用して得られる第1音のレベルが第1のレベル範囲の下限より小さい場合に前記第1のゲインを上げ、前記第1音のレベルが前記第1のレベル範囲の上限より大きい場合に前記第1のゲインを下げる処理を行い、第1の出力音声信号を生成する第1の信号処理工程と、
    前記第1の信号処理工程により生成された前記第1の出力音声信号に第2のゲインを適用することにより前記第1の出力音声信号のレベルを制御する工程であって、前記第1の出力音声信号に前記第2のゲインを適用して得られる第2音のレベルが第2のレベル範囲の下限よりも小さい場合に前記第2のゲインを上げ、前記第2音のレベルが前記第2のレベル範囲の上限よりも大きい場合に前記第2のゲインを下げる処理を行い、第2の出力音声信号を生成する第2の信号処理工程とを有し、
    前記第2の信号処理工程では、
    前記第2音のレベルが前記第2のレベル範囲の下限よりも小さい場合、前記第1のゲインが予め設定された設定値に達したことに応じて、前記第2のゲインを上げる処理を行う
    ことを特徴とする音声処理装置の制御方法。
  10. 音声入力部から入力された音声信号に第1のゲインを適用することにより前記入力された音声信号のレベルを制御する手段であって、前記入力された音声信号に前記第1のゲインを適用して得られる第1音のレベルが第1のレベル範囲の下限より小さい場合に前記第1のゲインを上げ、前記第1音のレベルが前記第1のレベル範囲の上限より大きい場合に前記第1のゲインを下げる処理を行い、第1の出力音声信号を生成する第1の信号処理手段と、
    前記音声入力部から入力された前記第1の出力音声信号に第2のゲインを適用することにより前記第1の出力音声信号のレベルを制御する手段であって、前記第1の出力音声信号に前記第2のゲインを適用して得られる第2音のレベルが第2のレベル範囲の下限よりも小さい場合に前記第2のゲインを上げ、前記第2音のレベルが前記第2のレベル範囲の上限よりも大きい場合に前記第2のゲインを下げる処理を行い、第2の出力音声信号を生成する第2の信号処理手段とを有し、
    前記第2の信号処理手段は、
    前記第2音のレベルが前記第2のレベル範囲の下限よりも小さい場合、前記第1のゲインが予め設定された設定値に達する前と後で、前記第2のゲインの時定数を異ならせる
    ことを特徴とする音声処理装置。
  11. 前記第2の信号処理手段は、前記第2音のレベルが前記第2のレベル範囲の下限よりも小さい場合、前記第1のゲインが予め設定された設定値に達するまで、前記第2ゲインの時定数を前記第1のゲインの時定数と同じにする
    ことを特徴とする請求項10に記載の音声処理装置。
  12. 前記第2の信号処理手段は、前記第2音のレベルが前記第2のレベル範囲の下限よりも小さい場合、前記第1のゲインが予め設定された設定値に達した後は、前記第1のゲインが予め設定された設定値に達する前に比べて、前記第2のゲインの時定数を遅くする
    ことを特徴とする請求項11に記載の音声処理装置。
  13. 前記設定値は、前記第1のゲインの取り得る範囲の最大値であることを特徴とする請求項10に記載の音声処理装置。
  14. 前記第1のレベル範囲の上限値よりも、前記第2のレベル範囲の上限値の方が小さく、前記第2のレベル範囲の下限値よりも、前記第2のレベル範囲の下限値の方が小さい、ことを特徴とする請求項10に記載の音声処理装置。
  15. 前記第1の信号処理手段により生成された前記第1の出力音声信号を記録媒体に記録する記録手段と、
    前記第2の信号処理手段から出力された第2の出力音声信号を外部のモニタ用の装置に出力する出力手段とを有することを特徴とする請求項10に記載の音声処理装置。
  16. 撮像手段を有し、
    前記記録手段は、前記撮像手段により撮像して得られた画像信号を記録媒体に記録することを特徴とする請求項15に記載の音声処理装置。
  17. 音声入力部から入力された音声信号に第1のゲインを適用することにより前記入力された音声信号のレベルを制御する工程であって、前記入力された音声信号に前記第1のゲインを適用して得られる第1音のレベルが第1のレベル範囲の下限より小さい場合に前記第1のゲインを上げ、前記第1音のレベルが前記第1のレベル範囲の上限より大きい場合に前記第1のゲインを下げる処理を行い、第1の出力音声信号を生成する第1の信号処理工程と、
    前記音声入力部から入力された前記第1の出力音声信号に第2のゲインを適用することにより前記第1の出力音声信号のレベルを制御する工程であって、前記第1の出力音声信号に前記第2のゲインを適用して得られる第2音のレベルが第2のレベル範囲の下限よりも小さい場合に前記第2のゲインを上げ、前記第2音のレベルが前記第2のレベル範囲の上限よりも大きい場合に前記第2のゲインを下げる処理を行い、第2の出力音声信号を生成する第2の信号処理工程とを有し、
    前記第2の信号処理工程では、
    前記第2音のレベルが前記第2のレベル範囲の下限よりも小さい場合、前記第1のゲインが予め設定された設定値に達する前と後で、前記第2のゲインの時定数を異ならせる
    ことを特徴とする音声処理装置の制御方法。
  18. 音声入力部から入力された音声信号に第1のゲインを適用することにより前記入力された音声信号のレベルを制御する手段であって、前記入力された音声信号に前記第1のゲインを適用して得られる第1音のレベルが第1のレベル範囲の下限より小さい場合に前記第1のゲインを上げ、前記第1音のレベルが前記第1のレベル範囲の上限より大きい場合に前記第1のゲインを下げる処理を行い、第1の出力音声信号を生成する第1の信号処理手段と、
    前記第1の信号処理手段により生成された前記第1の出力音声信号に第2のゲインを適用することにより前記第1の出力音声信号のレベルを制御する手段であって、前記第1の出力音声信号に前記第2のゲインを適用して得られる第2音のレベルが第2のレベル範囲の下限よりも小さい場合に前記第2のゲインを上げ、前記第2音のレベルが前記第2のレベル範囲の上限よりも大きい場合に前記第2のゲインを下げる処理を行い、第2の出力音声信号を生成する第2の信号処理手段と、
    前記第1の信号処理手段により生成された前記第1の出力音声信号を記録媒体に記録する記録手段と、
    前記第2の信号処理手段から出力された第2の出力音声信号を外部のモニタ用の装置に出力する出力手段と
    を有することを特徴とする音声処理装置。
JP2017241123A 2016-12-26 2017-12-15 音声処理装置及びその制御方法 Pending JP2019062514A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2016251921 2016-12-26
JP2016251921 2016-12-26
JP2017196399 2017-10-06
JP2017196399 2017-10-06

Publications (1)

Publication Number Publication Date
JP2019062514A true JP2019062514A (ja) 2019-04-18

Family

ID=61008753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017241123A Pending JP2019062514A (ja) 2016-12-26 2017-12-15 音声処理装置及びその制御方法

Country Status (4)

Country Link
US (1) US10218328B2 (ja)
JP (1) JP2019062514A (ja)
DE (1) DE102017130733A1 (ja)
GB (1) GB2559858B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109828738B (zh) * 2018-12-26 2022-05-03 努比亚技术有限公司 一种音量调节控制方法、耳机及计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1217491A (en) * 1966-12-28 1970-12-31 Plessey Co Ltd Improvements in or relating to automatic gain control circuits
JP3074231B2 (ja) * 1993-05-27 2000-08-07 アルプス電気株式会社 オーディオ機器のagc回路
US5577148A (en) * 1995-02-07 1996-11-19 Kamatani; Yasuo Laser scanning apparatus with interactive optical signal transmitting unit
JP4204828B2 (ja) 2002-09-12 2009-01-07 旭化成エレクトロニクス株式会社 自動利得制御装置、自動利得制御方法および自動利得制御プログラム
US7408407B2 (en) * 2004-12-30 2008-08-05 Broadcom Corporation Low noise variable gain amplifier
US20070223870A1 (en) * 2006-03-23 2007-09-27 Seagate Technology Llc Single board digital video system
JP4367484B2 (ja) * 2006-12-25 2009-11-18 ソニー株式会社 音声信号処理装置、音声信号処理方法及び撮像装置
JP5424853B2 (ja) * 2009-12-21 2014-02-26 ラピスセミコンダクタ株式会社 信号処理装置及び信号処理方法
US20130201272A1 (en) * 2012-02-07 2013-08-08 Niklas Enbom Two mode agc for single and multiple speakers
JP6105929B2 (ja) * 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法
US20160171987A1 (en) * 2014-12-16 2016-06-16 Psyx Research, Inc. System and method for compressed audio enhancement

Also Published As

Publication number Publication date
GB2559858A (en) 2018-08-22
GB201721199D0 (en) 2018-01-31
GB2559858B (en) 2020-06-03
US10218328B2 (en) 2019-02-26
DE102017130733A1 (de) 2018-06-28
US20180183399A1 (en) 2018-06-28

Similar Documents

Publication Publication Date Title
JP5704470B2 (ja) オーディオ明瞭度増大方法および装置とコンピュータ装置
CN104918181B (zh) 电平调整装置和方法
JP2005260470A (ja) 音声信号処理装置、音声信号処理方法
JP4538494B2 (ja) 音響効果回路及び処理方法
WO2011055489A1 (ja) 補聴器
CN109814833B (zh) 一种实时控制频响输出装置及其应用方法
JP2019062514A (ja) 音声処理装置及びその制御方法
JP6887315B2 (ja) 音声処理装置およびその制御方法、プログラム並びに記憶媒体
JP6518957B2 (ja) 音声信号処理装置及びそれを用いた撮像装置
JPWO2017042875A1 (ja) 電子聴診装置、制御方法、コンピュータプログラム及び記録媒体
JP2018074220A (ja) 音声処理装置
KR20080068397A (ko) 음성명료도 향상장치 및 방법
US10425731B2 (en) Audio processing apparatus, audio processing method, and program
US20200076392A1 (en) Low complexity loudness equalization
JP2000134051A (ja) コンプレッサ
JP2019161333A (ja) 音声処理装置
JP2019161334A (ja) 音声処理装置
KR20060119026A (ko) 보청 기능이 구비된 휴대용 단말기에서의 문자 표시장치 및방법
JP2019091988A (ja) 音声処理装置および音声処理方法
JP2011124850A (ja) 撮像装置並びにその制御方法及びプログラム
JP5340127B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法
JP2016177070A (ja) 音声処理装置
JP2016010086A (ja) 音声処理装置
JP2019205084A (ja) 音声処理装置およびその制御方法
TWI566240B (zh) 音訊處理方法