JP6887315B2 - 音声処理装置およびその制御方法、プログラム並びに記憶媒体 - Google Patents

音声処理装置およびその制御方法、プログラム並びに記憶媒体 Download PDF

Info

Publication number
JP6887315B2
JP6887315B2 JP2017111168A JP2017111168A JP6887315B2 JP 6887315 B2 JP6887315 B2 JP 6887315B2 JP 2017111168 A JP2017111168 A JP 2017111168A JP 2017111168 A JP2017111168 A JP 2017111168A JP 6887315 B2 JP6887315 B2 JP 6887315B2
Authority
JP
Japan
Prior art keywords
threshold value
value
limit threshold
upper limit
amplitude level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017111168A
Other languages
English (en)
Other versions
JP2018207318A (ja
Inventor
和広 並木
和広 並木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017111168A priority Critical patent/JP6887315B2/ja
Publication of JP2018207318A publication Critical patent/JP2018207318A/ja
Application granted granted Critical
Publication of JP6887315B2 publication Critical patent/JP6887315B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Description

本発明は、音声の自動レベル制御に関する。
従来、入力された音声信号の振幅の大きさを適正なレベルに制御するために自動レベル制御(ALC:Automatic Level Control)機能を有する音声処理装置が知られている。ALCは、所定の閾値よりも過大なレベルの音声が入力されると、レベルを抑圧(リミット動作)し、過小なレベルの音声が入力されると、レベルを増幅(リカバリ動作)するような制御を行う。ALCでは、突発的な大きい音(過大レベル音)の直後に、小さい音(過小レベル音)が入力された場合のリカバリ動作を適切に制御する必要がある。特許文献1には、入力された音声信号のレベルと閾値との比較に基づいて、リカバリ動作における音声信号のレベルのゲインを制御する技術が記載されている。
特開2004−104692号公報
上記特許文献1において、突発的な過大レベル音(以下、短発音)が連続して入力される場合、短発音の直後に過小レベル音が入力されると、音声信号のレベルのゲインを急激に増加するようにリカバリ動作が行われる。これにより、短発音以外の音声信号のレベルが短い周期で変動してしまうため、聞き取り難くなってしまう場合がある。また、例えば、風による雑音のように音声信号のレベルが激しく変動する場合に適応的に音声信号のレベル制御を行うことが困難であった。
本発明は、上記課題に鑑みてなされ、その目的は、短発音の後に過小レベル音が入力された場合でも聴感が悪化しないような音声信号の自動レベル制御を実現することである。
上記課題を解決し、目的を達成するために、本発明の音声処理装置は、入力された音声信号の振幅レベルが上限の閾値と下限の閾値による所定の範囲内に収まるように、設定されたゲイン値を用いて前記音声信号を処理する信号処理手段と、前記信号処理手段から出力された音声信号の振幅レベルを検出するレベル検出手段と、前記レベル検出手段により検出された振幅レベルに基づいて前記信号処理手段に設定するゲイン値を制御する手段であって、前記レベル検出手段により検出された振幅レベルが前記上限の閾値よりも低い状態から前記上限の閾値以上となった場合に前記設定するゲイン値を小さくする処理を行い、前記振幅レベルが前記下限の閾値よりも低くない状態から前記下限の閾値以下となった場合に前記設定するゲイン値を大きくする処理を行う制御手段と、前記信号処理手段に設定されているゲイン値を保持する保持手段と、を備え、前記制御手段は、前記レベル検出手段により検出された振幅レベルが前記上限の閾値以上ではない状態から前記上限の閾値以上となった場合に、前記上限の閾値以上となる前に設定されたゲイン値を保持するように前記保持手段を制御し、前記レベル検出手段により検出された振幅レベルが前記上限の閾値以上となった後、前記上限の閾値以上となっている状態が所定の時間以上継続せずに、前記振幅レベルが前記下限の閾値以下となった場合に、前記保持手段により保持されたゲイン値に基づく、前記保持されたゲイン値以下の所定の補正ゲイン値を上限として、前記設定するゲイン値を大きくする処理を行う。
本発明によれば、短発音の後に過小レベル音が入力された場合でも聴感が悪化しないような音声信号の自動レベル制御を実現することができる。
実施形態1の音声処理装置の構成を示す図。 実施形態1の動作を示すフローチャート。 短発音が連続して入力された場合の従来と本実施形態のリカバリ動作を比較して示す図。 実施形態2の音声処理装置の構成を示す図。 実施形態2の動作を示すフローチャート。 風量と補正係数の関係を示す図。 音声処理装置の基本構成を示す図。 振幅レベルが大きい音声信号が短い時間に入力された場合と長い時間に入力された場合のリカバリ動作を比較して示す図。 ALCの処理により設定されるゲイン値と音声信号の振幅レベルの関係を示す図。
以下に、本発明の実施形態について詳細に説明する。尚、以下に説明する実施の形態は、本発明を実現するための一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施の形態に限定されるものではない。また、後述する各実施形態の一部を適宜組み合わせて構成してもよい。
以下、本実施形態の音声処理装置として、静止画や動画などの画像データを撮影し音声データと共に記録可能なデジタルビデオカメラなどの撮像装置に適用した例を説明する。
[自動レベル制御におけるリカバリ動作]
本実施形態の音声処理装置は、マイクなどの音声入力部から入力された音声信号の振幅の大きさを表す振幅レベルが適正レベルである所定の範囲内に収まるように音声信号の振幅レベルを自動で調整する自動レベル制御(ALC)機能を有する。ALCにより、スピーカなどの音声出力部の過負荷を低減して劣化を防止し、かつダイナミックレンジを最適化して音質を改善することができる。
ALCでは、入力された音声信号の振幅レベルが適正レベルである所定の範囲内に収まるように音声信号にゲイン値を掛ける信号処理を行い、音声信号の振幅レベルを自動で制御する。
まず、本実施形態の音声処理装置の構成および機能を説明する前に、図7を参照して、音声処理装置の基本構成と、短発音に対するALCによるリカバリ動作について説明する。
図7において、音声処理装置100は、入力された音声信号の振幅レベルが所定の適正範囲の上限閾値Xより大きい場合は音声信号に掛けるゲイン値を減少させるリミット動作を行う。また、音声処理装置100は、入力された音声信号の振幅レベルが所定の適正範囲の下限閾値Yより小さい場合はゲイン値を増加させるリカバリ動作を行う。
制御部102は、後述するレベル検出部103、タイマー部104およびゲイン設定部105の動作を制御する。レベル検出部103は、信号処理部101から出力された音声信号の振幅レベルを検出し、検出結果を制御部102に出力する。制御部102は、レベル検出部103により検出された振幅レベルに応じたゲイン値を決定するようにゲイン設定部105を制御する。ゲイン設定部105は、制御部102から指示された振幅レベルに応じてゲイン値を設定し、設定したゲイン値を信号処理部101に出力する。信号処理部101は、入力された音声信号に、ゲイン設定部105で設定されたゲイン値を掛けて振幅レベルを増幅または減衰させる。
タイマー部104は、レベル検出部103により検出される音声信号の振幅レベルが急激に大きくなり(上限閾値X以上となり)、再度レベルが小さくなるまでの時間(上限閾値X以上の状態が継続している時間)を計測し、計測結果を制御部102に出力する。制御部102は、タイマー部104により計測された時間に応じて、入力音が短発音か否かを判定する。
ゲイン設定部105は、レベル検出部103により検出された信号処理部101で増幅された音声信号の振幅レベルが上限閾値Xよりも大きい場合にはゲイン値を減少させる。上限閾値Xより大きなレベルの場合には複数の閾値A、B、C(但し、A、B、C>X)を設定できるようにしてもよく、より大きな振幅レベルでは各閾値に対してゲイン値をさらに減少させる。また、信号処理部101により処理された後の音声信号の振幅レベルが下限閾値Yよりも小さい場合は、ゲイン値を増加させる。下限閾値Yよりも小さなレベルの場合には複数の閾値D、E、F(但し、D、E、F>Y)を設定できるようにしてもよく、より大きな振幅レベルの音声信号が入力されると各閾値に応じてゲイン値を増加させる(但し、X>Yとする)。
図8は短発音が入力された場合(a)と過大レベル音が長い時間入力された場合(b)のリカバリ動作を比較して示している。
図8(a)の場合は、制御部102は、レベル検出部103で検出された振幅レベルが上限閾値Xより大きいと判定され、タイマー部104で計測した大きな振幅レベルの時間が閾値より短いため、短発音が入力されたと判定する。その際、タイマー部104はカウンタ値を「ATT_CNT」(ATT_CNTは数値、ATT_CNT>0)に設定し(T1)、例えば定期的に減少させていく(T2)。ATT_CNTが0になるまでに入力される音声信号の振幅レベルが小さくなり、制御部102がリカバリ動作を行うと判定した場合には、リカバリ動作のゲイン値の上昇を大きくして素早く適正レベルになるように振幅レベルを増幅する。これを「ファーストリカバリ」と呼ぶ。また、ATT_CNTが0になった後は、リカバリ動作のゲイン値の上昇を小さくする(T3〜T4)。これを「スローリカバリ」と呼ぶ。
図8(b)の場合は、制御部102は、タイマー部104で計測した大きな振幅レベルの時間が長いため、短発音以外の音が入力されたと判定する。制御部102は、タイマー部104において振幅レベルが小さなレベルから大きなレベルに変化した場合にATT_CNTを設定するが(T1)、大きなレベルの音が入力されている期間はリカバリ動作を行わない。その間に、ATT_CNTは、大きなレベルの音が入力されている時間(T1〜T3)で0になる。その後、入力される音声信号の振幅レベルが小さくなると、ATT_CNTが0であるためリカバリ動作はスローリカバリになる(T4)。
このようにリカバリ動作を行うことにより、入力された音声信号は信号処理部101で適正なレベルに制御される。
[実施形態1]次に、図1を参照して、実施形態1の自動レベル制御について説明する。
図1は、実施形態1の音声処理装置100の構成を示している。以下では、上述した図7と同様の構成の説明は省略し、相違点を中心に説明を行う。
図1において、ゲイン保持部106には、ゲイン設定部105で設定されるゲイン値が常に入力されている。ゲイン保持部106は、後述するように、制御部102からの指示に応じて、その時点で入力されているゲイン値を保持する。制御部102は、入力音が短発音であると判定した場合は、短発音と判定する直前に保持したゲイン値を上限としてゲイン設定部105で設定するように制御する。よって、ゲイン補正部107は、ゲイン保持部106で保持したゲイン値以下となるようにゲイン設定部105で設定されるゲイン値を補正する。ゲイン補正部107でゲイン値を補正する際に、ゲイン保持部106に保持したゲイン値に乗算する補正係数kは、1以下(k≦1)とする。ゲイン補正部107で算出された所定の補正ゲイン値を、ゲイン設定部105に設定された値として置き換え、信号処理部101で音声信号にゲイン値を掛けて出力する。
<自動レベル制御フロー>次に、図2を参照して、本実施形態の音声処理装置100の動作を説明する。なお、図2の処理は、制御部102が不図示のメモリに格納された制御プログラムを読み出して実行し、音声処理装置100の各部を制御することにより実現される。後述する図5でも同様である。
以下では、音声処理装置100は、ゲイン値を用いて入力される音声信号のレベルを制御する処理を行い、音声信号を出力しているものとする。
S201では、制御部102は、ゲイン設定部105により設定されたゲイン値に基づく信号処理部101による処理後の音声信号の振幅レベルをレベル検出部103で検出する。
S202では、制御部102は、S201で検出した信号処理部101による処理後の音声信号の振幅レベルが所定の適正範囲内の上限閾値以上であるか否かを判定する。制御部102は、音声信号の振幅レベルが上限閾値以上であると判定した場合はS203へ進み、上限閾値未満であると判定した場合は処理を終了する。
S203では、制御部102は、ゲイン設定部105で設定したゲイン値を保持するようにゲイン保持部106に指示する。また、制御部102は、短発音が入力された場合は短発音の直前のゲイン値を保持するようにゲイン保持部106を制御する。保持時間は次に短発音が入力されるまでとする。
S204では、制御部102は、音声信号の振幅レベルが閾値以上となってから当該閾値以上となっている状態が継続している時間をタイマー部104で計測する。
S205では、制御部102は、タイマー部104で計測された時間に基づいて、入力音が短発音か否かを判定する。制御部102は、音声信号の振幅レベルが閾値以上となっている状態が継続している時間が所定の時間未満であった場合には、短発音であると判定してS206に進み、所定の時間以上継続している場合には短発音ではないと判定してS207に進む。
S206では、制御部102は、ゲイン補正部107において、S203で保持したゲイン値に補正係数k(k≦1)を乗算してゲイン値を補正する。
S207では、制御部102は、S205で短発音が入力されたと判定した場合は、S206でゲイン補正部107により補正したゲイン値を、リカバリ動作時におけるゲインの上限値とするようにゲイン設定部105に設定する。また、制御部102は、S205で短発音ではない判定した場合は、ゲイン設定部105において、図9で後述するように、補正したゲイン値をリカバリ動作時の上限値として設定せずにゲイン値の設定を行う。
ここで、図9を参照して、補正ゲイン値をリカバリ動作時のゲインの上限値として設定しない場合のALCのゲイン値の設定の処理を説明する。図9は、ゲイン設定部105で設定されるゲイン値とレベル検出部103で検出された音声信号の振幅レベルの関係を示している。
ゲイン設定部105では、レベル検出部103により検出された音声信号の振幅レベルが、上限閾値Xよりも大きい場合には、ゲイン値を減少させ、音声信号の振幅レベルが大きいほどゲイン値を減少させる。具体的には、通常値Gnと、その値より小さいGlimの間の値とする(Gn>Glim)。また、音声信号の振幅レベルが、下限閾値Yよりも小さい場合には、ゲイン値を増加させ、音声信号の振幅レベルが小さいほどゲイン値を増加させる(但し、X>Y)。具体的には、ゲイン値を通常値Gnと、その値よりも大きいGrecの間の値とする(Grec>Gn)。但し、ゲイン値はGrecを上限値とし、Glimを下限値とする。音声信号の振幅レベルが、それ以外の場合には、ゲイン値を通常値Gnに固定する。
図2に戻り、S208では、制御部102は、ゲイン設定部105で設定したゲイン値を用いてリカバリ動作を行う。
リカバリ動作は、信号処理部101が、ゲイン設定部105で設定されたゲイン値に基づいて音声信号の振幅レベルを増幅する処理である。制御部102は、例えば、音声信号の振幅レベルが図9の下限閾値Yよりも小さい場合には、ゲイン設定部105でゲイン値を増加して、信号処理部101で振幅レベルを増幅させる。
図3は、短発音が連続して入力された場合の従来と本実施形態のリカバリ動作を比較して示している。図3(a)は入力音の波形変化、図3(b)は従来のリカバリ動作による出力音の波形変化、図3(c)は従来のリカバリ動作におけるゲイン値の変化をそれぞれ示している。図3(a)の入力音は連続する短発音の間の音の振幅レベルの大きさが小さい場合と大きい場合が交互、あるいはランダムに入力された状態を想定している。
図3(a)のような短発音が入力されると、レベル検出部103により、信号処理部101からの音声信号の振幅レベルが上限閾値よりも大きいと判定するため、音声信号の振幅レベルを上限閾値以下となるようにゲインを制御するリミット動作を行う。制御部102は、レベル検出部103により、信号処理部101からの音声信号の振幅レベルが上限閾値よりも大きいと判定された場合、ゲイン設定部105に対して、ゲイン値を下げるように指示を出す。そして、信号処理部101からの音声信号の振幅レベルが上限閾値よりも低くなると、ゲイン設定部105に対し、ゲインを保持するよう制御する。
また、信号処理部101からの音声信号の振幅レベルが下限閾値よりも小さくなった場合、制御部102は、ゲインを徐々に上げていくようにゲイン設定部105を制御する。例えば、図9に示すようにゲイン値Grecよりも大きくならないゲイン値に設定する。リミット動作後の音声信号の振幅レベルが小さいほどゲイン値の上昇を急激にし、リミット動作後の音声信号の振幅レベルが大きいほどゲインの上昇を緩やかにする。但し、リカバリ動作時の音声信号の振幅レベルは上限閾値を超えないものとする。
図3(a)のように短発音の直後に過小レベル音が入力されると、入力音の振幅レベルを速やかに適正レベルにするためリカバリ動作を行い、図3(c)に示すように、ゲイン値を大きくする必要がある。また、短発音の直後に振幅レベルの大きい音(振幅レベルが短発音より小さく、所定の適正範囲内のレベルと同等な音)が入力されると、ゲイン値を小さくする。リカバリ動作において、短発音の直後に過小レベル音が入力された場合にゲイン値を急激に増加させると、急激に大きくなった音が聞き取れたり、音が不安定に聞こえる場合があるため、聞き取りが困難であったり、違和感があるなど、聴感が悪化する傾向がある。
図3(d)は、図3(a)の短発音の直後に過小レベル音が入力された場合のリカバリ動作による出力音の波形変化、図3(e)は本実施形態のリカバリ動作におけるゲイン値の変化をそれぞれ示している。図3(e)のように、本実施形態の音声処理装置100は、短発音が入力される前のゲイン値をゲイン保持部106において保持する。そして、短発音の直後に過小レベル音が入力された場合のリカバリ動作において、ゲイン保持部106が保持したゲイン値を上限として、ゲイン設定部105により設定されるゲイン値を制御する。
例えば、短発音の場合、図8のATT_CNTが0になる前に音声信号の振幅レベルが大きくなる。そのため、ファーストリカバリ動作が行われるが、このとき、制御部102は、ゲイン保持部106に保持されたゲイン値をゲイン補正部107により補正した補正ゲイン値を、リカバリ動作時におけるゲインの上限値としてゲイン設定部105に設定する。そして、ファーストリカバリ動作中は、ゲイン設定部105によりゲインを徐々に大きくして、ゲインがゲイン補正部107により補正された上限値に達すると、それ以降、ゲイン値を上げないようにする。従って、リカバリ動作時には、ゲイン保持部106に保持されたゲイン値を上限として、ゲイン設定部105にゲイン値が設定される。
このように、リカバリ動作のためのゲイン値に上限を設けることで、短発音の後に過小レベル音が入力された場合に、それ以前のゲイン値を保持しておき、リカバリ動作では保持したゲイン値を上度としてリカバリ動作が行われるように制御される。これにより、出力音の聴感が良くなることが期待できる。
[実施形態2]次に、図4および図5を参照して、実施形態2の自動レベル制御について説明する。
実施形態1では、入力音に短発音が入力され、短発音の後に過小レベル音が入力される場合であったが、実施形態2では短発音の後に風による雑音(以下、風雑音)が入力された場合について説明する。
図4は、実施形態2の音声処理装置100の構成を示している。図5は、実施形態2の音声処理装置100の動作を示すフローチャートである。以下では、上述した図1と同様の構成および図2と同様の処理については同じ符号を付して説明は省略し、相違点を中心に説明を行う。
入力音声に対してALCによるレベル制御を行う場合、風雑音が入力されるとそれと共に入力された音声や音楽に対しても影響がある。風雑音が大きい場合は、ALCのリミット動作でゲイン値を減少させているが、風雑音と共に入力された音声や音楽もリミット動作を受けるため、小さな音になってしまう。また、急に風が止んだ場合は音声や音楽だけになるので、閾値よりも音声や音楽の振幅レベルが小さい場合は、ファーストリカバリ動作になり、音声や音楽に対してゲイン値を増加させ、振幅レベルを大きくする。このように、風雑音が入力されたり、されなかったりして入力音の振幅レベルが大きく変動する場合、音声や音楽の振幅レベルが一定にならず、不安定な音として聞こえてしまい、聞き取りが困難であったり、違和感があるなど、聴感が悪化することがある。
そこで、本実施形態では、音声処理装置100に風量検出部401と補正値調整部402を設け、短発音の後に風雑音が入力された場合を考慮してゲイン値を補正するように構成している。
図4において、風量検出部401は、入力音に含まれる風雑音のレベルをフィルタ回路などで検出する。例えば、音声処理装置100に対し、ステレオマイクからの左右の2チャンネルの音声信号が入力される場合、右チャンネルと左チャンネルの音声信号の差を用いて風量を検出する。詳しくは、風量検出部401は、左右チャンネルの差信号の絶対値が所定の閾値より大きい場合は風量が多い(風雑音が多い、大きい)ことを示す信号を風量情報として出力する。また、風量検出部401は、差信号の絶対値が所定の閾値より小さい場合は風量が少ない(風雑音が少ない、小さい)ことを示す信号を風量情報として出力する。このように、風雑音があると、低域周波数成分(例えば100Hz以下)において2つの音声信号の位相差が大きくなる特性を利用して、風雑音の量を検出している。
補正値調整部402は、ゲイン補正部107の補正係数kの値(補正値)を風量検出部401で検出された風量情報に応じて適応的に変化させる。図6は風量とゲイン値の補正係数kの関係を示している。風量検出部401で風量が多く入力されたことが検出されると、ゲイン値の補正係数kを小さな値に、風量が少なく入力された場合は補正係数kを大きな値になるように調整する。
次に、図5を参照して、本実施形態の音声処理装置100の動作を説明する。
S501では、制御部102は、風量検出部401で風雑音が検出されたか判定し、風雑音が検出された場合はS502へ進み、風雑音が検出されなかった場合はS503へ進む。
S502では、風雑音が検出された場合、制御部102は、補正値調整部402でゲイン補正部107の補正係数kの値を検出された風雑音の量に応じて適応的に変更する。
その後、S503〜S510では、図2のS201〜S208と同様の処理を行う。
本実施形態によれば、図6に示すように風量が多いほどゲイン値の最大値を低下させることができるので、風雑音によって処理後の主音声(声や音楽)の振幅レベルが不安定になることを抑制することができる。
なお、本実施形態では、2つの音声信号の差信号に基づいて風量を検出していたが、これに限らず、単に2つの音声信号の低域周波数のレベルを所定の風量の閾値と比較して求めてもよい。また、別途風圧センサ、風速計、レーザとカメラを用いる装置など空気変位を検出できる装置を用いて風量を検出してもよい。
また、図6に示した値や風量に応じたゲイン補正係数の変化の様子は、これらに限定されるものではなく、ALCを行うシーンでチューニングでき、適正な値に設定することができるものとする。
また、各実施形態の音声処理装置をデジタルビデオカメラなどの撮像装置に適用することも可能であるが、これに限定されない。各実施形態の音声処理装置は、外部の音声を記録、または入力して出力するような装置であればどのような装置であっても適用することができる。例えば、携帯電話やその一種であるスマートフォン(眼鏡型端末や腕時計型端末を含む)、タブレット端末、ボイスレコーダ、メディアプレーヤなどであってもよい。
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100…音声処理装置、101…信号処理部、102…制御部、103…レベル検出部、104…タイマー部、105…ゲイン設定部、106…ゲイン保持部、107…ゲイン補正部、401…風量検出部、402…補正値調整部

Claims (9)

  1. 入力された音声信号の振幅レベルが上限の閾値と下限の閾値による所定の範囲内に収まるように、設定されたゲイン値を用いて前記音声信号を処理する信号処理手段と、
    前記信号処理手段から出力された音声信号の振幅レベルを検出するレベル検出手段と、
    前記レベル検出手段により検出された振幅レベルに基づいて前記信号処理手段に設定するゲイン値を制御する手段であって、前記レベル検出手段により検出された振幅レベルが前記上限の閾値よりも低い状態から前記上限の閾値以上となった場合に前記設定するゲイン値を小さくする処理を行い、前記振幅レベルが前記下限の閾値よりも低くない状態から前記下限の閾値以下となった場合に前記設定するゲイン値を大きくする処理を行う制御手段と、
    前記信号処理手段に設定されているゲイン値を保持する保持手段と、を備え、
    前記制御手段は、前記レベル検出手段により検出された振幅レベルが前記上限の閾値以上ではない状態から前記上限の閾値以上となった場合に、前記上限の閾値以上となる前に設定されたゲイン値を保持するように前記保持手段を制御し、
    前記レベル検出手段により検出された振幅レベルが前記上限の閾値以上となった後、前記上限の閾値以上となっている状態が所定の時間以上継続せずに、前記振幅レベルが前記下限の閾値以下となった場合に、前記保持手段により保持されたゲイン値に基づく、前記保持されたゲイン値以下の所定の補正ゲイン値を上限として、前記設定するゲイン値を大きくする処理を行うことを特徴とする音声処理装置。
  2. 前記制御手段は、前記レベル検出手段により検出された振幅レベルが前記上限の閾値以上となった後、前記上限の閾値以上となっている状態が所定の時間以上継続した後で、前記振幅レベルが前記下限の閾値以下となった場合、前記補正ゲイン値を上限とすることなく、前記設定するゲイン値を大きくする処理を行うことを特徴とする請求項1に記載の音声処理装置。
  3. タイマー手段をさらに有し、
    前記制御手段は、前記タイマー手段により、前記レベル検出手段で検出された振幅レベルが前記上限の閾値以上となっている時間を計測することを特徴とする請求項1に記載の音声処理装置。
  4. 前記制御手段は、前記保持手段に保持されたゲイン値に、1以下の所定の補正値を乗算することにより前記補正ゲイン値を決定することを特徴とする請求項1に記載の音声処理装置。
  5. 前記入力された音声信号に含まれる風雑音の量を検出する風量検出手段をさらに備え、
    前記制御手段はさらに、前記風量検出手段により検出された風雑音の量に基づいて、前記補正ゲイン値を決定することを特徴とする請求項1に記載の音声処理装置。
  6. 前記制御手段は、前記保持手段に保持されたゲイン値に、1以下の所定の補正値を乗算することにより前記補正ゲイン値を決定し、前記風量検出手段により検出された風雑音の量が多いほど前記所定の補正値を小さい値とすることを特徴とする請求項5に記載の音声処理装置。
  7. 入力された音声信号の振幅レベルが上限の閾値と下限の閾値による所定の範囲内に収まるように、設定されたゲイン値を用いて前記音声信号を処理する信号処理手段と、
    前記信号処理手段から出力された音声信号の振幅レベルを検出するレベル検出手段と、
    前記レベル検出手段により検出された振幅レベルに基づいて前記信号処理手段に設定するゲイン値を制御する制御手段と、
    前記信号処理手段に設定されているゲイン値を保持する保持手段と、を備える音声処理装置の制御方法であって、
    前記レベル検出手段により検出された振幅レベルが前記上限の閾値よりも低い状態から前記上限の閾値以上となった場合に前記設定するゲイン値を小さくする処理を行い、前記振幅レベルが前記下限の閾値よりも低くない状態から前記下限の閾値以下となった場合に前記設定するゲイン値を大きくする処理を行う制御ステップを有し、
    前記制御ステップでは、前記レベル検出手段により検出された振幅レベルが前記上限の閾値以上ではない状態から前記上限の閾値以上となった場合に、前記上限の閾値以上となる前に設定されたゲイン値を保持するように前記保持手段を制御し、
    前記レベル検出手段により検出された振幅レベルが前記上限の閾値以上となった後、前記上限の閾値以上となっている状態が所定の時間以上継続せずに、前記振幅レベルが前記下限の閾値以下となった場合に、前記保持手段により保持されたゲイン値に基づく、前記保持されたゲイン値以下の所定の補正ゲイン値を上限として、前記設定するゲイン値を大きくする処理を行うことを特徴とする音声処理装置の制御方法。
  8. 請求項7に記載の制御方法をコンピュータに実行させるためのプログラム。
  9. 請求項7に記載の制御方法をコンピュータに実行させるためのプログラムを記憶したコンピュータによる読み取りが可能な記憶媒体。
JP2017111168A 2017-06-05 2017-06-05 音声処理装置およびその制御方法、プログラム並びに記憶媒体 Active JP6887315B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017111168A JP6887315B2 (ja) 2017-06-05 2017-06-05 音声処理装置およびその制御方法、プログラム並びに記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017111168A JP6887315B2 (ja) 2017-06-05 2017-06-05 音声処理装置およびその制御方法、プログラム並びに記憶媒体

Publications (2)

Publication Number Publication Date
JP2018207318A JP2018207318A (ja) 2018-12-27
JP6887315B2 true JP6887315B2 (ja) 2021-06-16

Family

ID=64958343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017111168A Active JP6887315B2 (ja) 2017-06-05 2017-06-05 音声処理装置およびその制御方法、プログラム並びに記憶媒体

Country Status (1)

Country Link
JP (1) JP6887315B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7427531B2 (ja) 2020-06-04 2024-02-05 フォルシアクラリオン・エレクトロニクス株式会社 音響信号処理装置及び音響信号処理プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07235848A (ja) * 1994-02-22 1995-09-05 Kokusai Denshin Denwa Co Ltd <Kdd> 自動利得制御増幅器
JPH10163775A (ja) * 1996-12-02 1998-06-19 Eiden Kk リミッティングアンプ
JP2007181136A (ja) * 2005-12-28 2007-07-12 Kenwood Corp Agc回路、agc方法、プログラム及び記録媒体
JP6105929B2 (ja) * 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法
JP5863928B1 (ja) * 2014-10-29 2016-02-17 シャープ株式会社 音声調整装置

Also Published As

Publication number Publication date
JP2018207318A (ja) 2018-12-27

Similar Documents

Publication Publication Date Title
JP5704470B2 (ja) オーディオ明瞭度増大方法および装置とコンピュータ装置
EP2645740B1 (en) Control method and apparatus for a speaker system and mobile apparatus
US9319015B2 (en) Audio processing apparatus and method
US9571055B2 (en) Level adjustment device and method
US8600078B2 (en) Audio signal amplitude adjusting device and method
JP6887315B2 (ja) 音声処理装置およびその制御方法、プログラム並びに記憶媒体
JPWO2006093256A1 (ja) 音声再生装置及び方法、並びに、コンピュータプログラム
JP6518957B2 (ja) 音声信号処理装置及びそれを用いた撮像装置
US10218328B2 (en) Audio processing apparatus for generating audio signals for monitoring from audio signals for recording and method of controlling same
JP5762797B2 (ja) 信号処理装置及び信号処理方法
JP4803193B2 (ja) オーディオ信号の利得制御装置および利得制御方法
JP5585432B2 (ja) 音響信号処理装置および方法、並びに、プログラム
JP5836616B2 (ja) 音声信号処理装置
JP5645373B2 (ja) 音声処理装置、音声処理方法
WO2020174776A1 (ja) 音声信号処理装置
JP2019091988A (ja) 音声処理装置および音声処理方法
JP2019161334A (ja) 音声処理装置
JP2019161333A (ja) 音声処理装置
JP5340127B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法
JP2019016851A (ja) 音声処理装置、音声処理方法、及びプログラム
JP2011124850A (ja) 撮像装置並びにその制御方法及びプログラム
WO2021215025A1 (ja) 制御装置、制御方法及びプログラム
JP4390653B2 (ja) 自動レベル調整回路
JP2016010086A (ja) 音声処理装置
JP2019070688A (ja) 撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200522

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210518

R151 Written notification of patent or utility model registration

Ref document number: 6887315

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151