JPWO2010044439A1 - 音声信号調整装置及び音声信号調整方法 - Google Patents

音声信号調整装置及び音声信号調整方法 Download PDF

Info

Publication number
JPWO2010044439A1
JPWO2010044439A1 JP2010533920A JP2010533920A JPWO2010044439A1 JP WO2010044439 A1 JPWO2010044439 A1 JP WO2010044439A1 JP 2010533920 A JP2010533920 A JP 2010533920A JP 2010533920 A JP2010533920 A JP 2010533920A JP WO2010044439 A1 JPWO2010044439 A1 JP WO2010044439A1
Authority
JP
Japan
Prior art keywords
gain
level
input signal
short
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010533920A
Other languages
English (en)
Other versions
JP5236006B2 (ja
Inventor
成文 後田
成文 後田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2010533920A priority Critical patent/JP5236006B2/ja
Publication of JPWO2010044439A1 publication Critical patent/JPWO2010044439A1/ja
Application granted granted Critical
Publication of JP5236006B2 publication Critical patent/JP5236006B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

人間の実聴感レベルに即した音量制御を行い制御精度を向上させる。図1に示すように、音声ゲイン調整装置10は、調整する音声信号を取得する音声信号入力部12と、取得した音声信号に対して長期ゲインの調整を反映させる長期ゲイン反映部14と、長期ゲイン反映部14からの音声信号を3つの周波数帯域に分割する周波数分離部20と、分割された周波数帯域毎に短期ゲインの調整を反映させる短期ゲイン反映部30と、短期ゲイン反映部30から出力される音声信号を合成する合成部40と、合成された音声信号を出力する音声信号出力部42とを備える。

Description

本発明は、音声信号調整装置及び音声信号調整方法に関し、特に、自動利得調整により音声信号を調整する音声信号調整装置及び音声信号調整方法に関する。
近年、デジタル放送・VOD(Video On Demand)放送・DVD(Digital Versatile Disk)・Blu−ray(登録商標)ディスク等、世の中には様々なメディアソースがあり、ユーザはそれらのソースを自由に切り換えて楽しむことができる。しかしながら、ソース毎に製作者や放送業者が異なるため、音声の収録レベルやダイナミックレンジが異なってしまうことが多く、番組の切り替わり時やソースの切換時に意図しない大きな音が出力されたり、あるいは小さい音になり聴き取り辛くなったりすることがある。これによりユーザはボリュームをその都度操作して聞き易い音量に揃えなくてはならないという不便さがあった。
上述のようなメディアソース間の音量やダイナミックレンジの違いを調整する技術がいくつか提案されている。例えば、帯域分割された音声信号ごとに利得調整を行い、再び加算して信号を出力することにより、信号レベルを平均化するという技術がある(特許文献1参照)。この技術を用いることで、高周波成分が欠落して音声が不明瞭にならないようにしている。
特開2003−299181号公報
ところで、特許文献1に開示の技術では、入力信号の電圧値に対して利得を変化させるため、人間の実聴感レベルに即した制御になっておらず制御精度の点で改善が必要であった。また、全体的にレベルが高い(低い)場合には入力信号の変化に対して利得の変化量が大きくなるため、出力信号のふらつきが大きくなってしまうという課題があった。
本発明の目的は、人間の実聴感レベルに即した音量制御を行い制御精度を向上させる技術を提供することにある。
本発明に係る装置は、音声信号調整装置に関する。この装置は、入力信号の振幅を相対的に長期的に制御する長期ゲイン調整手段と、前記入力信号の前記振幅を相対的に短期的に制御する短期ゲイン調整手段と、を備える。
また、前記長期ゲイン調整手段は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させてもよい。
また、前記短期ゲイン調整手段は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させてもよい。
また、前記長期ゲイン調整手段は、当該音声信号調整装置の信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御してもよい。
また、前記短期ゲイン調整手段は、当該音声信号調整装置の信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御してもよい。
また、前記長期ゲイン調整手段及び前記短期ゲイン調整手段は、一定時間バッファされた前記入力信号をもとに振幅の制御を行ってもよい。
また、前記一定時間バッファされた前記入力信号は、先読みされた信号であってもよい。
また、前記長期ゲイン調整手段は、前回の長期ゲインの制御後の入力信号を反映させてフィードバック制御してもよい。
また、前記短期ゲイン調整手段は、前記長期ゲイン調整手段の長期ゲインの制御後の信号を反映させて制御してもよい。
また、前記短期ゲイン調整手段は、前記入力信号を音声帯域と前記音声帯域以外の帯域とに分けて前記入力信号の振幅を制御してもよい。
また、前記短期ゲイン調整手段は、短期ゲインの振幅の制御においてアタック時間を入力信号の立ち上がり度合いに応じて変更してもよい。
また、前記短期ゲイン調整手段は、前記入力信号の前記立ち上がり度合いを、前記入力信号のラウドネスレベルと、前記ラウドネスレベルの標準偏差及び平均値とをもとに算出してもよい。
また、前記短期ゲイン調整手段は、短期ゲインの振幅の制御において、前記短期ゲインの増幅量を前記入力信号のラウドネスレベルの立ち上がり度合いに応じて変更してもよい。
また、前記短期ゲイン調整手段は、前記入力信号のターゲットゲインを算出するたびに、短期ゲインの変化幅を算出してもよい。
また、前記長期ゲイン調整手段は、前記短期ゲイン調整手段における短期ゲインの制御変化に応じて長期ゲインを調整してもよい。
また、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、前記比較手段で算出された差分レベルに応じて、前記入力信号に施す利得調整処理の利得の調整量を算出する利得調整量算出手段と、入力された前記入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、を備えてもよい。
また、前記入力信号のソースまたは前記入力信号が含まれるコンテンツのジャンルを特定するソース・コンテンツ特定手段を備え、前記利得調整量算出手段は、前記ソース・コンテンツ特定手段において特定された前記ソース又は前記ジャンルに応じて、前記利得の調整量の算出手順を設定可能であってもよい。
本発明のある別の態様は、音声信号調整方法に関する。この方法は、入力信号の振幅を相対的に長期的に制御する長期ゲイン調整工程と、前記入力信号の前記振幅を相対的に短期的に制御する短期ゲイン調整工程と、を備える。
また、前記長期ゲイン調整工程は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させてもよい。
また、前記短期ゲイン調整工程は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させてもよい。
また、前記長期ゲイン調整工程は、当該音声信号調整方法により制御された信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御してもよい。
また、前記短期ゲイン調整工程は、当該音声信号調整方法により制御された信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御してもよい。
また、前記長期ゲイン調整工程及び前記短期ゲイン調整工程は、一定時間バッファされた前記入力信号をもとに振幅の制御を行ってもよい。
また、前記一定時間バッファされた前記入力信号は、先読みされた信号であってもよい。
また、前記長期ゲイン調整工程は、前回の長期ゲインの制御後の入力信号を反映させてフィードバック制御してもよい。
また、前記短期ゲイン調整工程は、前記長期ゲイン調整工程の長期ゲインの制御後の信号を反映させて制御してもよい。
また、前記短期ゲイン調整工程は、前記入力信号を音声帯域と前記音声帯域以外の帯域とに分けて前記入力信号の振幅を制御してもよい。
また、前記短期ゲイン調整工程は、短期ゲインの振幅の制御においてアタック時間を入力信号の立ち上がり度合いに応じて変更してもよい。
また、前記短期ゲイン調整工程は、前記入力信号の前記立ち上がり度合いを、前記入力信号のラウドネスレベルと、前記ラウドネスレベルの標準偏差及び平均値とをもとに算出してもよい。
また、前記短期ゲイン調整工程は、短期ゲインの振幅の制御において、前記短期ゲインの増幅量を前記入力信号のラウドネスレベルの立ち上がり度合いに応じて変更してもよい。
また、前記短期ゲイン調整工程は、前記入力信号のターゲットゲインを算出するたびに、短期ゲインの変化幅を算出してもよい。
また、前記長期ゲイン調整工程は、前記短期ゲイン調整手段における短期ゲインの制御変化に応じて長期ゲインを調整してもよい。
本発明の別の態様は音声信号調整装置に関する。この音声信号調整装置は、入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から圧縮率を算出し、算出された圧縮率に従って、利得の調整量を算出する利得調整量算出手段と、入力された前記入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、を備える。
本発明の別の態様は音声信号調整装置に関する。この音声信号調整装置は、入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から利得の調整量算出用の閾値を算出し、算出された閾値に従って、利得の調整量を算出する利得調整量算出手段と、前記入力された入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、を備える。
本発明の別の態様は音声信号調整装置に関する。この音声信号調整装置は、入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から利得の調整量算出用の閾値と圧縮率を算出し、算出された閾値及び圧縮率に従って、利得の調整量を算出する利得調整量算出手段と、前記入力された入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、を備える。
本発明によれば、人間の実聴感レベルに即した音量制御を行い制御精度を向上させることができる。
第1の実施形態に係る、音声ゲイン調整装置の機能ブロック図である。 第1の実施形態に係る、長期ゲイン算出部の機能ブロック図である。 第1の実施形態に係る、音声ゲイン調整装置の短期ゲイン調整処理の概略工程を示すフローチャートである。 第1の実施形態に係る、短期ゲイン算出部の機能ブロック図である。 第1の実施形態に係る、短期ゲイン算出部の抑圧部における処理を示したフローチャートである。 第1の実施形態に係る、短期ゲイン算出部の増幅部における処理を示したフローチャートである。 第1の実施形態に係る、音声ゲイン調整装置による自動利得調整処理の実験結果を示したグラフである。 第1の実施形態の変形例に係る、音声ゲイン調整装置の長期ゲイン算出部の機能ブロック図である。 第1の実施形態の変形例に係る、音声ゲイン調整装置の短期ゲイン算出部の機能ブロック図である。 第3の実施形態に係る、音声ゲイン調整装置の概略構成を示す機能ブロック図である。 第3の実施形態に係る、算出手順1の(a)におけるレベル変化度と圧縮率の関係を示す図である。 第3の実施形態に係る、算出手順1の(b)におけるレベル変化度と圧縮率の関係を示す図である。 第3の実施形態に係る、算出手順1の(c)におけるレベル変化度と圧縮率の関係を示す図である。 第3の実施形態に係る、算出手順2の(a)におけるレベル変化度と閾値の関係を示す図である。 第3の実施形態に係る、算出手順2の(b)におけるレベル変化度と閾値の関係を示す図である。 第3の実施形態に係る、算出手順2の(c)におけるレベル変化度と閾値の関係を示す図である。 第3の実施形態に係る、算出手順3における入力レベルと出力レベルの関係の一例を示す図である。 第3の実施形態に係る、算出手順3における入力レベルと出力レベルの関係の一例を示す図である。 第3の実施形態に係る、算出手順3における入力レベルと出力レベルの関係の一例を示す図である。 第4の実施形態に係る、音声ゲイン調整装置の概略構成を示す機能ブロック図である。 第4の実施形態の変形例に係る、音声ゲイン調整装置の抑圧ターゲットゲイン算出部の構成を示す機能ブロック図である。
つぎに、本発明を実施するための形態(以下、単に「実施形態」という)を、図面を参照して具体的に説明する。
<第1の実施形態>
まず概要について説明する。以下に説明する音声ゲイン調整装置10は、入力信号に対して、長期的なゲイン調整を行い、その出力信号を帯域分割フィルタにより帯域分割し、分割された帯域毎に出力信号に対して短期的なゲイン調整を行い、最後に各出力信号を合成して最終出力とする。
長期ゲインは、長期ゲイン処理後の一定区間の信号を人間の聴感上のレベル(以下、「ラウドネスレベル」という)に変換し、設定されている閾値(抑圧閾値や増幅閾値)と比較することにより算出する。このラウドネスレベルは、例えばITU−R(International Telecommunication Union Radiocommunications Sector)標準規格に規定されているラウドネス曲線を反映させたレベルを用いることができる。より具体的には、ラウドネス曲線で示される特性を反転させてラウドネスレベルが算出される。抑圧閾値とは、信号抑圧処理がなされるときに参照する閾値である。また、増幅閾値とは、信号増幅処理がなされるときに参照される閾値である。また、上記二つの閾値の他に、背景ノイズ等を増幅することを防ぐために、下限閾値が設定される。
そして短期ゲインは、バンドパスフィルタ(BPF)を通過した一定区間の信号をラウドネスレベルに変換し、長期ゲイン通過後のラウドネスレベルとあわせて、それぞれ設定されている閾値と比較し、短期ゲインのターゲット値を算出する。また、同時にターゲット値に変化させるアタック時間及びリリース時間を算出する。算出されたターゲット値、アタック時間及びリリース時間をもとに、短期ゲインを変化させる。この様な機能によって、ユーザが聞きやすい音に調整することができ、その結果、ユーザのボリューム操作負担を軽減することができる。なお、本実施形態において用いる「長期」及び「短期」とは、相対的な期間を意味しており、「長期」は、「短期」の30倍以上の期間でかつ適応的に更新される期間を想定している。このような処理によって、コンテンツ(ソース)の製作者が意図するダイナミックレンジを確保することができる。
図1は、本実施形態に係る音声ゲイン調整装置10の概略構成を示す機能ブロック図であり、テレビやオーディオ機器に搭載される。本実施形態の構成要素は、例えば、DSP(Digital Signal Processor)等のLSI(大規模集積回路)やメモリ、任意のプログラムにより実現される。図示のように、音声ゲイン調整装置10は、調整する音声信号を取得する音声信号入力部12と、取得した音声信号に対して長期ゲインの調整を反映させる長期ゲイン反映部14と、長期ゲイン反映部14からの音声信号を3つの周波数帯域に分割する周波数分離部20と、分割された周波数帯域毎に短期ゲインの調整を反映させる短期ゲイン反映部30と、短期ゲイン反映部30から出力される音声信号を合成する合成部40と、合成された音声信号を出力する音声信号出力部42とを備える。
さらに、音声ゲイン調整装置10は、長期ゲイン反映部14で反映させる長期ゲインを算出する長期ゲイン算出部50と、短期ゲイン反映部30で調整する短期ゲインを算出する短期ゲイン算出部60とを備える。本実施形態では、長期ゲイン算出部50における算出結果は、長期ゲイン反映部14とともに短期ゲイン算出部60における短期ゲインの算出にも利用される。
周波数分離部20は、LPF22と、HPF24と、BPF26とを備えている。また、短期ゲイン反映部30は、低周波反映部32と、高周波反映部34と、中周波反映部36とを備えている。
本実施形態では、LPF22は、100Hz未満の周波数帯域の信号を低周波反映部32へ出力する。HPF24は、8000Hzより大きい周波数帯域の信号を高周波反映部34に出力する。BPF26は100Hz〜8000Hzの周波数帯域の信号を中周波反映部36へ出力するとともに、後述する短期ゲイン算出部60の増幅部70へ出力する。そして、低周波反映部32、高周波反映部34及び中周波反映部36は、短期ゲイン更新部90で算出された短期ゲインの変化量をそれぞれLPF22、HPF24及びBPF26から取得した信号に反映させ、合成部40に出力する。
なお、詳細は後述するが、中周波反映部36は短期ゲインの変化量を短期ゲイン更新部90の第1の更新部92から取得し、低周波反映部32及び高周波反映部34は、短期ゲイン更新部90の第2の更新部94から短期ゲインの変化量を取得する。また、音声信号入力部12に入力される信号のラウドネスレベルを「ラウドネスレベル1」、長期ゲイン反映部14で長期ゲインの調整がなされた信号のラウドネスレベルを「ラウドネスレベル2」、さらに、中周波反映部36でフィルタリングされた後の信号のラウドネスレベルを「ラウドネスレベル3」とする。
図2は、本実施形態に係る長期ゲイン算出部50の機能ブロック図である。図示のように、長期ゲイン算出部50は、音声信号記憶部52と、ラウドネスレベル変換部54と、レベル比較カウント部56と、長期ゲイン更新部58とを備えている。
音声信号記憶部52は、長期ゲイン反映部14の出力を取得して、所定時間だけ1フレームとしてバッファに記憶する。ここでは、所定時間として、例えば、10msを想定している。
ラウドネスレベル変換部54は、音声信号記憶部52から1フレーム毎の音声信号を取得してラウドネスレベル2を算出する。ラウドネスレベル変換部54で算出したラウドネスレベル2は、レベル比較カウント部56へ出力されるとともに、後述する抑圧部80の短期ゲイン算出部60に出力される。
レベル比較カウント部56は、上述したように抑圧閾値と増幅閾値に対して入力レベルが長期的にどのあたりに位置するかを判断する。具体的には、レベル比較カウント部56は、長期ゲイン制御用のカウンタ機能を備えており、カウンタ値の初期値を「0」、長期ゲインの所期値を「0dB」としている。そして、以下の(1)〜(4)の処理がフレーム単位で実行される。
(1) 長期ゲイン反映後のラウドネスレベル2が抑圧閾値を越えたらカウンタ値を「1」だけ増やす。
(2) 長期ゲイン反映後のラウドネスレベル2が増幅閾値を下回ったらカウンタ値を「1」だけ減らす。
(3) 上記(1)(2)のいずれでも無い場合、長期ゲインを初期値に戻す方向にカウンタ値を「1」だけ増減させる。
(4) 上記(1)〜(3)による処理の結果、カウンタ値が予め定められた数値に達すると、長期ゲインは1ステップ大きく又は小さく更新され、カウンタ値は初期値「0」にリセットされる。ここでは、カウンタ値が「所定の上限閾値」を越えると、長期ゲインが「0.2dB」減少される。また、カウンタ値が「所定の下限閾値」を下回ると長期ゲインが「0.2dB」増加される。なお、長期ゲインは、±4.0の範囲に限定し、調整幅が過度にならないように制御されている。そして、長期ゲイン更新部58は、長期ゲインの値を長期ゲイン反映部14へ通知する。
つぎに短期ゲインの調整処理について説明する。図3は、短期ゲイン調整処理の概略工程を示すフローチャートである。短期ゲインの調整処理では、ラウドネスレベル2及びラウドネスレベル3を用いて制御量を決定する。なお、図3及び後述の図5、図6の表記において、信号、閾値及びゲイン等を以下のように表記している。
ラウドネスレベル1〜3: L1〜L3
抑圧閾値: Th_cmp
増幅閾値: Th_amp
ゲイン: G
ターゲットゲイン: Gt
仮ターゲットゲイン: Gd
まず、ラウドネスレベル2が抑圧閾値と比較され(S10)、ラウドネスレベル2が抑圧閾値を上回るときに(S10のY)、抑圧処理がなされる(S20)。また、ラウドネスレベル2が抑圧閾値を上回らなかったときには(S10のN)、ラウドネスレベル3が増幅閾値と比較される(S30)。ラウドネスレベル3が増幅閾値以下である場合(S30のN)、増幅処理がなされる(S40)。またラウドネスレベル3が増幅閾値より大きい場合(S30のY)、収束処理がなされる(S50)。収束処理とはゲインが「1」に近づくように行う処理である。
詳細な処理については図5及び図6で説明するが、このようなフローの処理を実行することで、入力レベルに対して短期的に制御する機能によって、コンテンツや番組の切り替わり時や、シーンの切り替わり時、シーンの中の爆発音があった時等に、急に大音量に変化した場合に音量の変化を抑制する。また、音声帯域(BPF26でろ波されて出力される周波数帯域)のレベルが小さい場合には、その帯域を持ち上げることで会話を聞き取りやすくする。短期ゲインは、長期ゲインと比較して素早いゲイン調整が必要であるので、聴感の自然性に大きな影響を及ぼす制御がなされる。聴取者がふらつきを感じやすいパターンとして、音声信号が定常状態にあるときにゲインが変化してしまう状況が挙げられる。本実施形態では、音声信号の定常状態を分析することで、定常状態では、急激にゲインを変化させないように制御される。
図4は、短期ゲイン算出部60を詳細に示した機能ブロック図である。短期ゲイン算出部60は、主に人の会話を聞き取りやすくゲインを調整するために調整量を決定する増幅部70と、全体の信号レベルを抑圧して急激に大音量になるような場合にゲインを調整するために調整量を決定する抑圧部80と、決定された調整量を信号に反映させる短期ゲイン更新部90とを備えている。短期ゲイン更新部90は、増幅部70と抑圧部80の処理結果を中周波反映部36に反映させる第1の更新部92と、抑圧部80の処理結果を低周波反映部32と高周波反映部34に反映させる第2の更新部94とを備える。
抑圧部80は、長期ゲイン調整部81と、レベル・閾値比較部82と、抑圧ターゲットゲイン算出部83と、抑圧ゲイン変化幅算出部84と、ラウドネスレベル記憶部85と、平均レベル算出部86と、レベル標準偏差算出部87と、レベル立ち上がり検出部88とを備えている。
図5は、主に抑圧部80における処理を示したフローチャートである。抑圧部80による抑圧処理をこのフローチャートで説明し、つづいて、各工程に対応する構成要素について説明する。
この抑圧処理では、ゲインが所定値、ここでは「0dB」を上回っているか否かを判断する(S201)。ゲインが「0dB」以下の場合(S201のY)、増幅中でないと判断し、通常処理として、予め設定されているアタック時間やリリース時間に基づき現在のゲインと抑圧ターゲットゲインとから1サンプル毎のゲインの変化幅が算出される(S202)。
ゲインが「0dB」を上回っている場合(S201のN)、ゲインが「所定の閾値Th_g」を上回るか否かが判断される(S203)。現在のゲインが「所定の閾値Th_g」を上回る場合には(S203のY)、過剰増幅がなされていると見なされ、増幅ゲイン上限値が現在のゲインに更新される。ただし、増幅中に素早くゲインを下げると不自然な聴感になってしまう虞があるため、以下の条件(S204)を満たす場合にのみ素早い抑制処理がなされる。具体的には、以下の(1)〜(3)の条件(条件A)を同時に満たす場合、または(4)の条件(条件B)を満たす場合に(S204のY)、上述のS202で示した通常処理により、素早い抑圧処理がなされる。ここでは例えばアタック時間が1.0msに設定される。
条件A:
(1) 抑圧閾値を10dB以上オーバーしている。
(2) 現在のラウドネスレベル2が、その直前のラウドネスレベル2のピーク値よりも第1所定値(例えば数dB程度)以上大きい。
(3) 平均値と現在のラウドネスレベル2の差が、標準偏差σの所定倍数(m×σ)よりも第2所定値(例えば数dB程度)以上越えている。
条件B:
(4) 平均値と現在のラウドネスレベル2の差が、標準偏差σの所定倍数(m×σ)よりも、第2所定値よりも大きな第3所定値以上越えている。
なお、条件Aまたは条件Bを満たしている場合において、さらに、ラウドネスレベル1が抑圧閾値を越えているか否かのレベル・閾値比較処理がなされ、越えていると判断されると、増幅閾値と現在のラウドネスレベルの差分から抑圧ターゲットゲインが再算出される。
S203のステップでゲインが「所定の閾値Th_g」以下である場合(S203のN)またはS204のステップで条件Aまたは条件Bを満たさない場合(S204のN)、通常処理よりも緩やかな速さの抑制処理が設定される(S205)。ここでは例えばアタック時間が100msに設定される。
つぎに、上記の抑圧処理を実行するための抑圧部80の構成について説明する。
まず、ラウドネスレベル記憶部85は、ラウドネスレベル変換部54から取得したラウドネスレベル2を一定数記憶する。ここでは、例えば40個(500ms)のラウドネスレベル2が記憶される。
そして、平均レベル算出部86は、ラウドネスレベル記憶部85に記憶されているラウドネスレベル2の平均値を算出する。
つづいて、レベル標準偏差算出部87が、ラウドネスレベル記憶部85に記憶されているラウドネスレベル2と、平均レベル算出部86で算出されたラウドネスの平均値から標準偏差σを算出する。
レベル立ち上がり検出部88は、ラウドネスレベル2の立ち上がり度合いを分析する。具体的には、レベル立ち上がり検出部88は、上述の条件Aや条件Bを満たすか否かを判断する。
長期ゲイン調整部81は、上述した長期ゲイン算出部50の長期ゲイン更新部58から長期ゲインの値を取得し、その逆特性をラウドネスレベル変換部54から取得したラウドネスレベルに対して反映させ、オリジナルの信号のラウドネスレベル1を算出し、レベル・閾値比較部82に出力する。
レベル・閾値比較部82は、ラウドネスレベル変換部54から取得したラウドネスレベル2と長期ゲイン調整部81から取得したラウドネスレベル1とを比較する上述のレベル・閾値比較処理を実行する。
そして抑圧ターゲットゲイン算出部83は、上述したように、レベル・閾値比較部82のレベル・閾値比較処理の結果を受けて必要に応じて、抑圧閾値と現在のラウドネスレベルの差分から抑圧ターゲットゲインを再算出する。
抑圧ゲイン変化幅算出部84は、抑圧ターゲットゲイン算出部83やレベル立ち上がり検出部88の処理の結果に基づいて、現在のゲインと抑圧ターゲットゲインとの差分から1サンプル毎のゲイン変化量を算出し、短期ゲイン更新部90に通知する。
つぎにS40の増幅処理及び増幅部70に関して説明する。増幅部70は、音声信号記憶部71と、ラウドネスレベル変換部72と、レベル・閾値比較部73と、レベル立ち上がり検出部74と、増幅ターゲットゲイン算出部75と、増幅ゲイン変化幅算出部76とを備えている。
図6は、主に増幅部70における処理を示したフローチャートである。このフローチャートと図4に示す増幅部70の構成要素と増幅部70とを対応付けて増幅処理について説明する。
音声信号記憶部71は、BPF26の出力を取得して、所定時間だけ1フレームとしてバッファに記憶する。ここでは、長期ゲイン算出部50の音声信号記憶部52と同様に、所定時間として、例えば、12.5msを想定している。
ラウドネスレベル変換部72は、フレーム毎にラウドネスレベルを算出する。
レベル・閾値比較部73は、フレーム毎に算出されたラウドネスレベルが増幅閾値と下限閾値の間にあるか否かを判断する。つまり、レベル・閾値比較部73は、ラウドネスレベルが増幅値を下回っており、かつ、下限閾値を上回っているかを判断する。ここで下限閾値は、ノイズを無視して処理するために設定されている。
レベル立ち上がり検出部74は、ラウドネスレベルの立ち上がり度合いを分析する(S401)。レベル立ち上がり検出部74は、BPF26から取得した信号、つまり、人の音声の周波数帯域の信号のラウドネスレベルを分析して、下記の(1)〜(4)の条件Cに全て当てはまる場合に(S401のY)、増幅ターゲットゲインを設定する(S402、S403)。
条件C:
(1) 現在のゲインが0.9以上である。
(2) ラウドネスレベル3が2連続で上昇している。
(3) 上記(2)の連続上昇の値が所定値以上である。
(4) 上記(2)連続上昇の開始値が下限閾値以上である。
増幅ターゲットゲイン算出部75は、立ち上がり度合いを算出し(S402)、増幅閾値との差分を算出し(S403)、それらの値と増幅ゲイン上限値から増幅ターゲットゲインを決定する(S404)。
その後、増幅ターゲットゲイン算出部75は、現在のゲインと増幅ターゲットゲインから、1サンプル毎のゲイン変化量を算出し短期ゲイン更新部90に通知する(S405)。
S401のステップにおいて条件Cを満たさない場合(S401のN)、増幅ターゲットゲイン算出部75は、単純に増幅閾値とラウドネスレベル3の差分から、仮ターゲットゲインを算出し(S406)、その仮ターゲットゲインと現在のターゲットゲインとを比較する(S407)。
現在のターゲットゲインより仮ターゲットゲインが小さい場合(S407のN)、増幅ターゲットゲイン算出部75は、ターゲットゲインとして算出した仮ターゲットゲインを設定する(S408)。仮ターゲットゲインが現在のターゲットゲイン以上の場合(S407のY)、増幅ターゲットゲイン算出部75は、ターゲットゲインを変更せずにそのままとする(S409)。
そして、短期ゲイン更新部90の第1の更新部92は、抑圧ターゲットゲイン又は増幅ターゲットゲインになる方向にゲインが変化するように、サンプル毎にゲインを算出する。第1の更新部92は算出したゲインを中周波反映部36に対して通知し、中周波反映部36はその通知されたゲインとなるように信号のゲインを調整する。同様に、第2の更新部94は、抑圧ターゲットゲインになる方向にゲインが変化するようにサンプル毎にゲインを算出する。第2の更新部94は算出したゲインを低周波反映部32及び高周波反映部34に対して通知し、ゲインを低周波反映部32及び高周波反映部34はその通知されたゲインとなるように信号のゲインを調整する。
ここで、短期ゲインの算出処理について概要を説明する。ゲインの算出も、ラウドネスレベル2及びラウドネスレベル3をもとに算出される。ターゲットゲインが算出された時点で、そのときの短期ゲインが旧ゲインとして置き換えられ、さらに現ゲインが「1」倍にされる。そして現ゲインが変化されていく。したがって、短期ゲインは旧ゲインと現ゲインとの積として表される。
S20の抑圧処理がなされた場合、つまり、ラウドネスレベル2が抑圧閾値を上回っている場合の短期ゲインの算出手順について説明する。
(1)旧ゲインと現ゲインの積が、抑圧ゲインターゲットより大きい場合は、ゲインが減少される。
(2)旧ゲインと現ゲインの積が抑圧ゲインターゲット以下である場合は、さらに、旧ゲインと現ゲインの差分とゲインの変化幅とを比較する。比較の結果、差分がゲインの変化幅以下である場合、旧ゲインと現ゲインの積を抑圧ゲインターゲットに置き換える。差分がゲインの変化幅より大きい場合、現ゲインを上記変化幅だけ増加させる。
S40の増幅処理がなされた場合、つまり、ラウドネスレベル3が増幅閾値を上回っている場合の短期ゲインの算出手順について説明する。
(1)旧ゲインと現ゲインの積が増幅ターゲットゲイン以下の場合は、現ゲインを算出された変化幅だけ増加させる。
(2)旧ゲインと現ゲインの積が増幅ターゲットゲインより大きい場合、さらに旧ゲインと現ゲインの差分を比較する。その差分がS405の処理で算出されたゲインの変化幅以下の場合、旧ゲインと現ゲインとの積を抑圧ターゲットゲインに置き換えられる。また、前記の差分が、前記の変化幅より大きい場合、現ゲインが前記変化幅だけ減少される。
S50の収束処理がなされるとき、旧ゲインと現ゲインとの積が「1」に近づくように現ゲインが変化される。旧ゲインと現ゲインの積が「1」より大きい場合は、現ゲインが減少される。さらに減少した後、旧ゲインと減少させた後の現ゲインとの積が「1」未満になった場合は、「1」になるように調整される。旧ゲインと現ゲインの積が「1」以下の場合は、現ゲインが増加される。増加後、旧ゲインと増加後の現ゲインの積が「1」を越えた場合には、「1」になるように調整される。
図7に上記構成及びフローによる自動利得調整処理の結果を、適用しない条件(図7(a))と適用した条件(図7(b))について示している。図から分かるように音量レベル変化が小さくなっている。
以上、本実施形態の自動利得調整処理によると、コンテンツの製作者が意図するダイナミックレンジをある程度確保しながら、ユーザが聞きやすい音に調整することができる。その結果、ユーザのボリューム操作負担を軽減することができる。
以上、本発明を実施形態をもとに説明した。この実施形態は例示であり、それらの各構成要素及びその組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
例えば、短期ゲイン反映部30において、人間の声の周波数帯域の信号のみが制御されるように中周波反映部36のみの構成としてもよい。低周波反映部32や高周波反映部34がある構成と比較すると、効果は低下するものの処理負荷が低減される。
さらに、短期ゲイン算出部60の処理の結果が長期ゲイン算出部の処理に反映されてもよい。具体的には、例えば、長期ゲインが上昇方向になっているときに急にシーンが変わって、全体的なレベルが大きくなった場合には短期ゲインが大きく減少方向になるが、このとき短期ゲインの変化量がふらつきやすくなる。そこで、長期ゲインが上昇中であると判断されたときに、短期ゲインが大きく減少したら長期ゲインの減少スピードを一時的に速めてもよい。これによって、そのふらつきを少なくすることができる。また、BPF26及び中周波反映部36をそれぞれさらに複数に分割してもよい。
図8及び図9に変形例に係る音声ゲイン調整装置10の長期ゲイン算出部50a及び短期ゲイン算出部60aの機能ブロック図を示す。上述の実施形態では、人間の聴感を反映させたラウドネス特性をもとに、自動利得調整がなされたが、本変形例では、さらに、スピーカ等の出力手段の特性が反映される。ここでは、上述の実施形態の音声ゲイン調整装置10の構成と類似の構成で実現できるので、異なる部分についてのみ図示して説明する。
この変形例の長期ゲイン算出部50aは、音声信号記憶部52とラウドネスレベル変換部54の間に、スピーカ等の特性を反映させるための出力音圧特性適用部53を備えている。同様に、短期ゲイン算出部60aの増幅部70aが、音声信号記憶部71とラウドネスレベル変換部72の間に、スピーカ等の特性を反映させるための出力音圧特性適用部77を備えている。このように、スピーカ等の出力特性によって生じる不要な音量制御(自動利得調整処理)がなくなり、制御精度が向上する。
<第2の実施形態>
本実施形態では、第1の実施形態における処理を一部変更している。
まず異なる点の一つにレベル比較カウント部56の処理にある。具体的には、まず第1の実施形態と同様に、レベル比較カウント部56は、長期ゲイン制御用のカウンタ機能を備えており、カウンタ値の初期値を「0」、長期ゲインの所期値を「0dB」としている。そして、第1の実施形態と異なり以下の(1)〜(4)の処理が実行される。なお異なる処理は(3)の処理にある。
(1) 長期ゲイン反映後のラウドネスレベル2が抑圧閾値を越えたらカウンタ値を「1」だけ増やす。
(2) 長期ゲイン反映後のラウドネスレベル2が増幅閾値を下回ったらカウンタ値を「1」だけ減らす。
(3) 長期ゲイン反映後のラウドネスレベル2が下限閾値を下回ったら、長期ゲインを初期値に戻す方向にカウントする。
(4) 上記(1)〜(3)による処理の結果、カウンタ値が予め定められた数値に達すると、長期ゲインが1ステップ大きく又は小さく更新され、カウンタ値は初期値「0」にリセットされる。そして第1の実施形態と同様に、カウンタ値が「所定の上限閾値」を越えると、長期ゲインが「0.2dB」減少される。また、カウンタ値が「所定の下限閾値」を下回ると長期ゲインが「0.2dB」増加される。なお、長期ゲインは、±4.0の範囲に限定し、調整幅が過度にならないように制御されている。そして、長期ゲイン更新部58は、長期ゲインの値を長期ゲイン反映部14へ通知する。
つぎに異なる点は、短期ゲインの調整処理にある。具体的には、図3の抑圧処理(S20)の処理、つまり、図5の処理における各種条件及び処理の内容が異なる。
この抑圧処理では、ゲインが所定値、ここでは「0dB」を上回っているか否かを判断する(S201)。ゲインが「0dB」以下の場合(S201のY)、増幅中でないと判断し、通常処理として、予め設定されているアタック時間やリリース時間に基づき現在のゲインと抑圧ターゲットゲインとから1サンプル毎のゲインの変化幅が算出される(S202)。
ゲインが「0dB」を上回っている場合(S201のN)、以下の条件(S204)を満たす場合にのみ素早い抑制処理がなされる。ここでは、第1の実施形態のS203の処理を省いている。増幅中に素早くゲインを下げると不自然な聴感になってしまう虞がある。そこで、このことを回避する為の抑圧処理を行う条件を異なるものとしている。具体的には、以下の(1)及び(2)の条件(条件A1;図5の条件Aに対応)を同時に満たす場合、または(3)の条件(条件B1;図5の条件Bに対応)を満たす場合に(S204のY)、上述のS202で示した通常処理により、素早い抑圧処理がなされる。ここでは例えばアタック時間が1.0msに設定される。第1の実施形態と異なる点は、第1の実施形態における条件Aの(3)が省かれていることにある。
条件A1:
(1) 抑圧閾値を10dB以上オーバーしている。
(2) 平均値と現在のラウドネスレベル2の差が、標準偏差σの所定倍数(m×σ)よりも第2所定値(例えば数dB程度)以上越えている。
条件B1:
(3) 平均値と現在のラウドネスレベル2の差が、標準偏差σの所定倍数(m×σ)よりも、第2所定値よりも大きな第3所定値以上越えている。
なお、条件A1または条件B1を満たしている場合において、さらに、ラウドネスレベル1が抑圧閾値を越えているか否かのレベル・閾値比較処理がなされ、越えていると判断されると、抑圧閾値と現在のラウドネスレベルの差分から抑圧ターゲットゲインが再算出される。
S204のステップで条件A1または条件B1を満たさない場合(S204のN)、通常処理よりも緩やかな速さの抑制処理が設定される(S205)。ここでは例えばアタック時間が100msに設定される。
なお、上記の抑圧処理を実行するための抑圧部80の構成については第1の実施形態と同様である。
つぎに異なる点は、図3の増幅処理(S40)の内容、つまり、図6の処理における各種条件及び処理の内容が異なる。
レベル立ち上がり検出部74は、ラウドネスレベルの立ち上がり度合いを分析する(S401)。レベル立ち上がり検出部74は、BPF26から取得した信号、つまり、人の音声の周波数帯域の信号のラウドネスレベルを分析して、下記の(1)〜(4)の条件C1(図6の条件Cに対応)に全て当てはまる場合に(S401のY)、増幅ターゲットゲインを設定する(S403)。
条件C1:
(1) 現在のゲインが0.99以上である。
(2) ラウドネスレベル3が2連続で上昇している。
(3) 上記(2)の連続上昇の値が所定値以上である。
(4) 上記(2)連続上昇の開始値が下限閾値以上である。
増幅ターゲットゲイン算出部75は、増幅閾値との差分を算出し(S403)、その値と増幅ゲイン上限値から増幅ターゲットゲインを決定する(S404)。つまり、第1の実施形態のS402の処理が省かれている。例えば、「上記差分×長期ゲイン」が、所定の最大増幅値未満なら、その差分が増幅ターゲットゲインとされる。それ以外の時には、「最大増幅値/長期ゲイン」が増幅ターゲットゲインとされる。また、条件C1の(1)が異なり、「0.9以上」が「0.99以上」となっている。
その後、増幅ターゲットゲイン算出部75は、現在のゲインと増幅ターゲットゲインから、1サンプル毎のゲイン変化量を算出し短期ゲイン更新部90に通知する(S405)。
S401のステップにおいて条件C1を満たさない場合(S401のN)、増幅ターゲットゲイン算出部75は、単純に増幅閾値とラウドネスレベル3の差分から、仮ターゲットゲインを算出し(S406)、その仮ターゲットゲインと現在のターゲットゲインとを比較する(S407)。
現在のターゲットゲインより仮ターゲットゲインが小さい場合(S407のN)、増幅ターゲットゲイン算出部75は、ターゲットゲインとして算出した仮ターゲットゲインを設定する(S408)。仮ターゲットゲインが現在のターゲットゲイン以上の場合(S407のY)、増幅ターゲットゲイン算出部75は、ターゲットゲインを変更せずにそのままとする(S409)。このとき、増幅ターゲットゲイン算出部75は、増幅リリースタイムを1フレームの長さとし、リリースの変化幅、つまり1ステップ毎のゲイン上昇幅を再度算出する。
そして、短期ゲイン更新部90の第1の更新部92は、抑圧ターゲットゲイン又は増幅ターゲットゲインになる方向にゲインが変化するように、サンプル毎にゲインを算出する。第1の更新部92は算出したゲインを中周波反映部36に対して通知し、中周波反映部36はその通知されたゲインとなるように信号のゲインを調整する。同様に、第2の更新部94は、抑圧ターゲットゲインになる方向にゲインが変化するようにサンプル毎にゲインを算出する。第2の更新部94は算出したゲインを低周波反映部32及び高周波反映部34に対して通知し、ゲインを低周波反映部32及び高周波反映部34はその通知されたゲインとなるように信号のゲインを調整する。
ここで、短期ゲインの算出処理について概要を説明する。ゲインの算出も、ラウドネスレベル2及びラウドネスレベル3をもとに算出される。なお、第1の実施形態では旧ゲインと現ゲインの積を用いたが、本実施形態では、短期ゲインを用いる。
本実施形態のS20の抑圧処理がなされた場合、つまり、ラウドネスレベル2が抑圧閾値を上回っている場合の短期ゲインの算出手順について説明する。
(1)短期ゲインが抑圧ゲインターゲットより大きい場合は、短期ゲインが減少される。
(2)短期ゲインが抑圧ゲインターゲット以下である場合は、さらに、短期ゲインとゲインの変化幅とを比較する。比較の結果、それらの差分がゲインの変化幅以下である場合、短期ゲインを抑圧ゲインターゲットに置き換える。また、上記差分がゲインの変化幅より大きい場合、短期ゲインを上記変化幅だけ増加させる。
S40の増幅処理がなされた場合、つまり、ラウドネスレベル3が増幅閾値を上回っている場合の短期ゲインの算出手順について説明する。
(1)短期ゲインが増幅ターゲットゲイン以下の場合は、算出された変化幅だけ短期ゲインを増加させる。
(2)短期ゲインが増幅ターゲットゲインより大きい場合、さらに短期ゲインと増幅ターゲットゲインとの差分を比較する。その差分がS405の処理で算出されたゲインの変化幅以下の場合、短期ゲインを増幅ターゲットゲインに置き換えられる。また、前記の差分が、前記の変化幅より大きい場合、短期ゲインが前記変化幅だけ減少される。
S50の収束処理がなされるとき、短期ゲインが「1」に近づくように現ゲインが変化される。短期ゲインが「1」より大きい場合は、現ゲインが減少される。減少した後、短期ゲインが「1」未満になった場合は、「1」になるように調整される。短期ゲインが「1」以下の場合は、現ゲインが増加される。増加後、短期ゲインが「1」を越えた場合には、「1」になるように調整される。
以上、本実施形態によると第1の実施形態と同様の効果が得られる。
<第3の実施形態>
本実施形態では、入力ソースの切換時やソース内でのシーン切替り時における音量調整について説明する。テレビやオーディオ機器等において、入力ソースの切換時やソース内でのシーン切替り時、音量レベルが急に大きく変化する場合がある。そのような場合、視聴者はその都度不快に感じたり驚いたりして頻繁に音量操作をしなければならないという課題があった。このような課題を解決する手法として、ALC(オートレベルコントロール)やDRC(ダイナミックレンジコンプレッション)といった自動的に利得を調整する技術が用いられてきた。これらの技術は単純に入力ソースの音量レベルが設定した閾値レベルを超えた量に対して一定の比率で信号を減衰させる。
ところで、人間は、耳に入ってきた音の音圧レベルだけではなく、周波数特性やその音圧レベルに至るまでの変化の仕方等、様々な影響を受けて音の大きさを感じている。例えば、同じ音圧レベルであっても無音状態から再生されたときは音をより大きく感じやすい。そのため、閾値レベルを超えた音響信号(音声信号)に対して常に同じ比率で減衰させる技術では十分に効果を発揮できないことがある。
そこで、本実施形態では、瞬間の音量レベルだけでなく、直前まで視聴していた音声信号の音量レベルの状態に応じて利得の調整方法を変化させる。それによって、視聴者が感じる不快感を軽減する。そのため、入力信号(音響信号又は音声信号ともいう)において、その音量レベルが予め定められた閾値レベルを超えた場合に、その時点までの過去の音声信号の音量レベルの状態によって、利得の調整量を変化させる。以下、詳細に説明する。
図10は、本実施形態に係る音声ゲイン調整装置110の概略構成を示す機能ブロック図であり、音声ゲイン調整装置110はテレビやオーディオ機器に搭載される。図示のように、音声ゲイン調整装置110は、音声信号入力部112と、利得調整部120と、利得制御部130と、音声信号出力部142とを備えている。
音声信号入力部112は、第1の実施形態の音声信号入力部12と同様の機能を有し、調整する音声信号を取得する。利得調整部120は、利得制御部130の算出結果に応じて音声信号に対して利得調整を施す。音声信号出力部142は、第1の実施形態の音声信号出力部42と同様の機能を有し、利得調整がなされた音声信号を出力する。
利得制御部130は、閾値・レベル比較部132と、レベル変化度算出部134と、利得調整量算出部136と、ソース特定部138とを有する。
閾値・レベル比較部132は、音声信号入力部112より入力された音声信号のレベル値と予め設定された閾値レベルとを比較し、差分レベルを算出する。
レベル変化度算出部134は、過去一定期間(例えば1秒間)に入力された音声信号のレベルと現在入力された音声信号のレベルとを比較し、レベルの変化度を算出し、利得調整量算出部136へ通知する。なお、上記過去一定期間を含む所定期間の音声信号のレベルは、レベル変化度算出部134に記憶される。
利得調整量算出部136は、閾値・レベル比較部132で算出された差分レベルが正、つまり音声信号のレベル値が予め設定された閾値を超えている場合には、レベル変化度算出部134で算出されたレベル変化度に応じて音声信号の圧縮率を算出し、算出された圧縮率に従って、利得の調整量を算出する。具体的には、利得調整量算出部136は、以下の(1)〜(3)のいずれかの手順に従って利得調整量を算出する。
(1)算出手順1:レベル変化度算出部134で算出されたレベル変化度に応じて音声信号の圧縮率を算出し、算出された圧縮率に従って、利得の調整量を算出する。
(2)算出手順2:レベル変化度算出部134で算出されたレベル変化度に応じて利得調整用の閾値を算出し、算出された閾値に従って、利得の調整量を算出する。
(3)算出手順3:レベル変化度算出部134で算出されたレベル変化度に応じて利得調整用の閾値と圧縮率を算出し、算出された閾値と圧縮率に従って、利得の調整量を算出する。
上記いずれの算出手順が用いられるかは、あらかじめユーザが設定したり、選択されているソースや再生されているコンテンツに応じて設定される。それら設定は、ソース特定部138による特定にもとづいて定まる。
ソース特定部138は、現在再生されている音声信号のコンテンツを特定する。ここで、音声ゲイン調整装置110がデジタル放送用テレビに搭載されている場合を想定する。デジタル放送では、放送されるデータに、コンテンツのジャンル等の番組情報が含まれ、電子番組表等に利用されている。ソース特定部138は、そのような番組情報をもとに現在のコンテンツがどのようなジャンルであるか特定し、いずれの算出手順を用いて利得調整をするかを決定することができる。
また、ソース特定部138は、チャンネルが切り替わったときや、入力ソースが切り替わったときに、いずれの算出手順を用いるかを決定することができる。そしてどのような条件のときにいずれの算出手順を用いるかは、予め設定されているとともに、ユーザが選択可能となっていてもよい。例えば、映画のコンテンツでは、本来は効果音等のために信号のレベルが急激に変化する場合がある。そのような場合に、利得を圧縮する方向の処理がなされると、本来の効果が小さくなってしまうことがある。そこで、コンテンツが映画であることが判明している場合に、利得を圧縮する処理を行わないようにすることで、好ましくない処理を回避できる。また、ニュースの放送中であれば、大きく音量が変化することは想定されないので、比較的圧縮率を高く設定するようにし、CMへ変わったときなどにうるさいと感じないようにできる。また、テレビ等を操作するリモコン装置に上記圧縮する処理を一時的に停止するボタンが設けられてもよい。
利得調整部120は、音声信号入力部112より入力された音声信号に対して、利得調整量算出部136で算出された利得の調整量を反映させ音声信号出力部に出力する。
つぎに、レベル変化度算出部134における利得の調整量の算出手順1〜3について説明する。
(1)算出手順1について、以下の(a)〜(c)の3種類の手法を用いる。図11〜14に、レベル変化度と圧縮率の関係を示す。なお、図11〜14において、圧縮率を便宜的に無限大(∞)で表記しているが、当然に適宜設定可能である。
(a)図11に示すように、レベル変化度が予め定めた値を超えている場合にのみ圧縮をかける。いわゆるリミッタと同じ処理である。この手法を用いると、無音状態から急に大きな音声信号が再生される時に効果を奏する。具体的には放送等において番組からCM(commercial message)に切り替わる際、1秒の無音から急にCMの音声が流れるような場合にのみ最大の圧縮率になり、視聴者が大きな音声信号に対してうるさいと感じることが低減できる。
(b)図12に示すように、レベル変化度に比例して、圧縮率を変化させる。つまり、レベル変化度が大きくなるほど圧縮率を大きくする。番組からCMに切り替わる時だけでなく、番組や映画内で静かなシーンから急に大きな音が出るシーンに切り替わった際にも、その強さに応じて圧縮率が大きくなる。その結果、視聴者はより快適に視聴することができる。
(c)図13に示すように、レベル変化度に応じて指数関数的に圧縮率を変化させる。通常は圧縮率を低くしているが、ある程度急に大きな音声が再生されるようになってくる場合には、指数関数的に強い圧縮をかけることができる。このため、通常時は自然な聴感を保ったまま、視聴者がうるさいと感じてしまう音声信号のみを抑え込むことができる。
(2)算出手順2について、以下の(a)〜(c)の3種類の手法を用いる。図14〜図16にレベル変化度と閾値の関係を示す。
(a)図14に示すように、レベル変化度が予め定めた値を超えている場合に閾値を下げる。無音状態から急に大きな音声信号が再生されるときに効果を奏する。具体的には放送等において番組からCMに切り替わる際、1秒の無音から急にCMの音声が流れるような場合にのみ閾値が下がる。その結果、視聴者が大きな音声信号に対してうるさいと感じることが低減できる。
(b)図15に示すように、レベル変化度に比例して、閾値を変化させる。つまり、レベル変化度が大きくなるほど閾値を小さくする。番組からCMに切り替わる時だけでなく、番組や映画内で静かなシーンから急に大きな音が出るシーンに切り替わった際にもその強さに応じて閾値が小さく。その結果、視聴者はより快適に視聴することができる。
(c)図16に示すように、レベル変化度に応じて指数関数的に閾値を変化させる。
通常は閾値を大きくしているが、ある程度急に大きな音声が再生されるようになってくる場合には指数関数的に閾値を下げることができる。その結果、通常時は自然な聴感を保ったまま、視聴者がうるさいと感じてしまう音声信号のみを抑え込むことができる。
(2)算出手順3については、上記の算出手順1及び2をあわせた処理である。
閾値と圧縮率を同時に変化させて制御する。閾値を下げたときには圧縮率を小さくし、最大入力に対する出力レベルを一定にする。その結果、視聴者がうるさいと感じてしまう音声信号のみを抑え込むことができる。入力レベルと出力レベルは、図17や図18に示すように、入力レベルが所定値以上となると、対応する出力レベルが従来より小さくなる。また、図19に示すように、入力レベルが所定値以上となると、出力レベルは一定値にリミットされる。
以上、本実施形態によると、様々な種類のコンテンツにおいて、人間が実際に感じる音量感により即した利得調整が可能となる。したがって、視聴者はより快適にコンテンツを視聴することができる。なお、上記技術を圧縮とは逆の方向に反映させてもよい。つまり、アクション系の映画のコンテンツなどでは、爆発シーンなどが多く含まれ、静寂から急激に大音量にするシーンによって、シーンをより効果的に表現することがある。そのような場合、圧縮ではなく増幅するように音声信号に対して処理を施してもよい。
<第4の実施形態>
本実施形態は、第1の実施形態又は第2の実施形態に第3の実施形態を追加したものである。つまり、第1の実施形態又は第2の実施形態と同様に、ラウドネスレベルを用いて長期ゲイン及び短期ゲインを調整することでコンテンツの製作者が意図するダイナミックレンジをある程度確保しながら、ユーザが聞きやすい音に調整する。さらに、第3の実施形態と同様に、入力ソースの切換時やソース内でのシーン切替り時、音量レベルが急に大きく変化する場合に、直前まで視聴していた音声信号の音量レベルの状態に応じて利得の調整方法を変化させる。
図20は、本実施形態に係る音声ゲイン調整装置210の概略構成を示す機能ブロック図であり、第1の実施形態又は第2の実施形態に第3の実施形態を単純に直列的に接続する態様について示している。この音声ゲイン調整装置210は、第1の実施形態の図1の音声ゲイン調整装置10において、音声信号入力部12と長期ゲイン反映部14の間に、第3の実施形態の利得調整部120と利得制御部130とを設けた構成となっている。なお、同一符号を有する各構成要素の機能は上述の構成と同一であるのでここでは説明を省略する。
なお、利得調整部120及び利得制御部130は、合成部40と音声信号出力部42の間に設けられても同様の作用・効果を奏する。
なお、図20に示したように、第1の実施形態又は第2の実施形態に第3の実施形態を単純に直列的に接続する態様でもよいが、第3の実施形態を第1または2の実施形態の抑圧ターゲットゲインを算出する機能部分に取り込んだ態様とすることによって、処理量の低減とともに、効果的に抑圧ターゲットゲインを求めることも出来る。
図21は、本実施形態の変形例であって、第1の実施形態で示した抑圧部80の抑圧ターゲットゲイン算出部83に、利得調整部120及び利得制御部130を備える構成を示している。利得調整部120及び利得制御部130の機能は第3の実施形態とほぼ同様であるが、ここでは音声信号ではなくラウドネスレベルをもとに利得調整を行う。第2の実施形態で示した抑圧部80の抑圧ターゲットゲイン算出部83に、利得調整部120及び利得制御部130を備えてもよい。
利得制御部130は、閾値・レベル比較部132と、利得調整量算出部136と、ソース特定部138とを有する。なおここでは、上記のレベル変化度算出部134が省かれており、レベル変化度算出部134が算出したレベル変化度には、レベル立ち上がり検出部88で算出する立ち上がり度が用いられる。
閾値・レベル比較部132は、レベル・閾値比較部82から取得したラウドネスレベル値と予め設定された閾値レベルとを比較し、差分レベルを算出し、利得調整量算出部136へ通知する。
利得調整量算出部136は、閾値・レベル比較部132で算出された差分レベルが正、つまりラウドネスレベル値が予め設定された閾値を超えている場合には、レベル立ち上がり検出部88で算出されたレベル変化度に応じて、抑圧ターゲットゲインを算出するための抑圧率(レシオ)を算出し、利得調整部120に出力する。利得調整部120は、利得調整量算出部136からの出力がない場合、つまり、閾値・レベル比較部132で算出された差分レベルが負またはゼロの場合、上述の実施形態同様に、レベル・閾値比較部82のレベル・閾値比較処理の結果を受けて必要に応じて、抑圧閾値と現在のラウドネスレベルの差分から抑圧ターゲットゲインを再算出する。一方、利得調整量算出部136からの出力がある場合、利得調整部120は、レベル・閾値比較部82より入力されたラウドネスレベルに対して、利得調整量算出部136で算出された抑圧率に切り換えて抑圧ターゲットゲインを算出し抑圧ゲイン変化幅算出部84に出力する。また、ソース特定部138は、上述と同様に、コンテンツを特定する。特定されたコンテンツの情報が上記の利得調整量算出部136における抑圧率算出の処理に反映される。このような構成及び処理によって、瞬間の音量レベルだけでなく、直前まで視聴していた音声信号の音量レベルの状態に応じて利得の調整方法を変化させる場合に、より人間の聴感に近いラウドネスレベルを用いて処理を実行できる。そして、その場合に、コンテンツの特性を反映させることができる。
なお、利得調整部120及び利得制御部130の機能は、抑圧ターゲットゲイン算出部83に含まれる構成に限る主ではなく、例えば、レベル・閾値比較部82や抑圧ゲイン変化幅算出部84に含まれてもよい。
10、110、210 音声ゲイン調整装置
12 音声信号入力部
14 長期ゲイン反映部
20 周波数分離部
22 LPF
24 HPF
26 BPF
30 短期ゲイン反映部
32 低周波反映部
34 高周波反映部
36 中周波反映部
40 合成部
42 音声信号出力部
50、50a 長期ゲイン算出部
52 音声信号記憶部
53 出力音圧特性適用部
54 ラウドネスレベル変換部
56 レベル比較カウント部
58 長期ゲイン更新部
60、60a 短期ゲイン算出部
70、70a 増幅部
71 音声信号記憶部
72 ラウドネスレベル変換部
73 レベル・閾値比較部
74 レベル立ち上がり検出部
75 増幅ターゲットゲイン算出部
76 増幅ゲイン変化幅算出部
77 出力音圧特性適用部
80 抑圧部
81 長期ゲイン調整部
82 レベル・閾値比較部
83 抑圧ターゲットゲイン算出部
84 抑圧ゲイン変化幅算出部
85 ラウドネスレベル記憶部
86 平均レベル算出部
87 レベル標準偏差算出部
88 レベル立ち上がり検出部
90 短期ゲイン更新部
130 利得制御部
132 閾値・レベル比較部
134 レベル変化度算出部
136 利得調整量算出部
138 ソース特定部
140 長期ゲイン反映部

Claims (35)

  1. 入力信号の振幅を相対的に長期的に制御する長期ゲイン調整手段と、
    前記入力信号の前記振幅を相対的に短期的に制御する短期ゲイン調整手段と、
    を備えることを特徴とする音声信号調整装置。
  2. 前記長期ゲイン調整手段は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させることを特徴とする請求項1に記載の音声信号調整装置。
  3. 前記短期ゲイン調整手段は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させることを特徴とする請求項1または2に記載の音声信号調整装置。
  4. 前記長期ゲイン調整手段は、当該音声信号調整装置の信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御することを特徴とする請求項1から3までのいずれかに記載の音声信号調整装置。
  5. 前記短期ゲイン調整手段は、当該音声信号調整装置の信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御することを特徴とする請求項1から4までのいずれかに記載の音声信号調整装置。
  6. 前記長期ゲイン調整手段及び前記短期ゲイン調整手段は、一定時間バッファされた前記入力信号をもとに振幅の制御を行うことを特徴とする請求項1から5までのいずれかに記載の音声信号調整装置。
  7. 前記一定時間バッファされた前記入力信号は、先読みされた信号であることを特徴とする請求項6に記載の音声信号調整装置。
  8. 前記長期ゲイン調整手段は、前回の長期ゲインの制御後の入力信号を反映させてフィードバック制御することを特徴とする請求項1から7までのいずれかに記載の音声信号調整装置。
  9. 前記短期ゲイン調整手段は、前記長期ゲイン調整手段の長期ゲインの制御後の信号を反映させて制御することを特徴とする請求項1から8までのいずれかに記載の音声信号調整装置。
  10. 前記短期ゲイン調整手段は、前記入力信号を音声帯域と前記音声帯域以外の帯域とに分けて前記入力信号の振幅を制御することを特徴とする請求項1から9までのいずれかに記載の音声信号調整装置。
  11. 前記短期ゲイン調整手段は、短期ゲインの振幅の制御においてアタック時間を入力信号の立ち上がり度合いに応じて変更することを特徴とする請求項1から10までのいずれかに記載の音声信号調整装置。
  12. 前記短期ゲイン調整手段は、前記入力信号の前記立ち上がり度合いを、前記入力信号のラウドネスレベルと、前記ラウドネスレベルの標準偏差及び平均値とをもとに算出することを特徴とする請求項11に記載の音声信号調整装置。
  13. 前記短期ゲイン調整手段は、短期ゲインの振幅の制御において、前記短期ゲインの増幅量を前記入力信号のラウドネスレベルの立ち上がり度合いに応じて変更することを特徴とする請求項1から12のいずれかに記載の音声信号調整装置。
  14. 前記短期ゲイン調整手段は、前記入力信号のターゲットゲインを算出するたびに、短期ゲインの変化幅を算出することを特徴とする請求項1から13のいずれかに記載の音声信号調整装置。
  15. 前記長期ゲイン調整手段は、前記短期ゲイン調整手段における短期ゲインの制御変化に応じて長期ゲインを調整することを特徴とする請求項1から14のいずれかに記載の音声信号調整装置。
  16. 入力信号の振幅を相対的に長期的に制御する長期ゲイン調整工程と、
    前記入力信号の前記振幅を相対的に短期的に制御する短期ゲイン調整工程と、
    を備えることを特徴とする音声信号調整方法。
  17. 前記長期ゲイン調整工程は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させることを特徴とする請求項16に記載の音声信号調整方法。
  18. 前記短期ゲイン調整工程は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させることを特徴とする請求項16または17に記載の音声信号調整方法。
  19. 前記長期ゲイン調整工程は、当該音声信号調整方法により制御された信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御することを特徴とする請求項16から18までのいずれかに記載の音声信号調整方法。
  20. 前記短期ゲイン調整工程は、当該音声信号調整方法により制御された信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御することを特徴とする請求項16から19までのいずれかに記載の音声信号調整方法。
  21. 前記長期ゲイン調整工程及び前記短期ゲイン調整工程は、一定時間バッファされた前記入力信号をもとに振幅の制御を行うことを特徴とする請求項16から20までのいずれかに記載の音声信号調整方法。
  22. 前記一定時間バッファされた前記入力信号は、先読みされた信号であることを特徴とする請求項21に記載の音声信号調整方法。
  23. 前記長期ゲイン調整工程は、前回の長期ゲインの制御後の入力信号を反映させてフィードバック制御することを特徴とする請求項16から22までのいずれかに記載の音声信号調整方法。
  24. 前記短期ゲイン調整工程は、前記長期ゲイン調整工程の長期ゲインの制御後の信号を反映させて制御することを特徴とする請求項16から23までのいずれかに記載の音声信号調整方法。
  25. 前記短期ゲイン調整工程は、前記入力信号を音声帯域と前記音声帯域以外の帯域とに分けて前記入力信号の振幅を制御することを特徴とする請求項16から24までのいずれかに記載の音声信号調整方法。
  26. 前記短期ゲイン調整工程は、短期ゲインの振幅の制御においてアタック時間を入力信号の立ち上がり度合いに応じて変更することを特徴とする請求項16から25までのいずれかに記載の音声信号調整方法。
  27. 前記短期ゲイン調整工程は、前記入力信号の前記立ち上がり度合いを、前記入力信号のラウドネスレベルと、前記ラウドネスレベルの標準偏差及び平均値とをもとに算出することを特徴とする請求項26に記載の音声信号調整方法。
  28. 前記短期ゲイン調整工程は、短期ゲインの振幅の制御において、前記短期ゲインの増幅量を前記入力信号のラウドネスレベルの立ち上がり度合いに応じて変更することを特徴とする請求項16から27のいずれかに記載の音声信号調整方法。
  29. 前記短期ゲイン調整工程は、前記入力信号のターゲットゲインを算出するたびに、短期ゲインの変化幅を算出することを特徴とする請求項16から28のいずれかに記載の音声信号調整方法。
  30. 前記長期ゲイン調整工程は、前記短期ゲイン調整手段における短期ゲインの制御変化に応じて長期ゲインを調整することを特徴とする請求項16から29のいずれかに記載の音声信号調整方法。
  31. 前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、
    過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、
    前記比較手段で算出された差分レベルに応じて、前記入力信号に施す利得調整処理の利得の調整量を算出する利得調整量算出手段と、
    入力された前記入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、
    を備えることを特徴とする請求項1から15のいずれかに記載の音声信号調整装置。
  32. 前記入力信号のソースまたは前記入力信号が含まれるコンテンツのジャンルを特定するソース・コンテンツ特定手段を備え、
    前記利得調整量算出手段は、前記ソース・コンテンツ特定手段において特定された前記ソース又は前記ジャンルに応じて、前記利得の調整量の算出手順を設定可能であることを特徴とする請求項31に記載の音声信号調整装置。
  33. 入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、
    過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、
    前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から圧縮率を算出し、算出された圧縮率に従って、利得の調整量を算出する利得調整量算出手段と、
    入力された前記入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、
    を備えることを特徴とする音声信号調整装置。
  34. 入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、
    過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、
    前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から利得の調整量算出用の閾値を算出し、算出された閾値に従って、利得の調整量を算出する利得調整量算出手段と、
    前記入力された入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、
    を備えることを特徴とする音声信号調整装置。
  35. 入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、
    過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、
    前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から利得の調整量算出用の閾値と圧縮率を算出し、算出された閾値及び圧縮率に従って、利得の調整量を算出する利得調整量算出手段と、
    前記入力された入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、
    を備えることを特徴とする音声信号調整装置。
JP2010533920A 2008-10-17 2009-10-15 音声信号調整装置及び音声信号調整方法 Active JP5236006B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010533920A JP5236006B2 (ja) 2008-10-17 2009-10-15 音声信号調整装置及び音声信号調整方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008268742 2008-10-17
JP2008268742 2008-10-17
JP2010533920A JP5236006B2 (ja) 2008-10-17 2009-10-15 音声信号調整装置及び音声信号調整方法
PCT/JP2009/067834 WO2010044439A1 (ja) 2008-10-17 2009-10-15 音声信号調整装置及び音声信号調整方法

Publications (2)

Publication Number Publication Date
JPWO2010044439A1 true JPWO2010044439A1 (ja) 2012-03-15
JP5236006B2 JP5236006B2 (ja) 2013-07-17

Family

ID=42106603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010533920A Active JP5236006B2 (ja) 2008-10-17 2009-10-15 音声信号調整装置及び音声信号調整方法

Country Status (5)

Country Link
US (1) US8787595B2 (ja)
EP (1) EP2352225A1 (ja)
JP (1) JP5236006B2 (ja)
CN (1) CN102257728B (ja)
WO (1) WO2010044439A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5434372B2 (ja) * 2009-08-26 2014-03-05 ヤマハ株式会社 音量調整装置
JP2012075039A (ja) * 2010-09-29 2012-04-12 Sony Corp 制御装置、および制御方法
JP5531988B2 (ja) * 2011-03-03 2014-06-25 株式会社Jvcケンウッド 音量制御装置、音量制御方法、および音量制御プログラム
JP5569436B2 (ja) * 2011-03-04 2014-08-13 株式会社Jvcケンウッド 音声信号補正装置、音声信号補正方法及びプログラム
US8954322B2 (en) 2011-07-25 2015-02-10 Via Telecom Co., Ltd. Acoustic shock protection device and method thereof
TWI489773B (zh) * 2011-09-08 2015-06-21 Wistron Corp Dynamic audio amplifier circuit and method thereof
US20130136282A1 (en) 2011-11-30 2013-05-30 David McClain System and Method for Spectral Personalization of Sound
EP2624449B1 (en) * 2012-02-01 2016-12-07 Harman Becker Automotive Systems GmbH Peak detection when adapting a signal gain based on signal loudness
EP2837094B1 (en) 2012-04-12 2016-03-30 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
JP5527827B2 (ja) * 2012-04-17 2014-06-25 Necエンジニアリング株式会社 ラウドネス調整装置、ラウドネス調整方法、及びプログラム
KR101945816B1 (ko) * 2012-06-08 2019-02-11 삼성전자주식회사 단말기의 볼륨조절 장치 및 방법
DK2864983T3 (en) * 2012-06-20 2018-03-26 Widex As PROCEDURE FOR SOUND HEARING IN A HEARING AND HEARING
EP2693637A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
JP6079119B2 (ja) 2012-10-10 2017-02-15 ティアック株式会社 録音装置
GB2510323B (en) 2012-11-13 2020-02-26 Snell Advanced Media Ltd Management of broadcast audio loudness
US10027303B2 (en) 2012-11-13 2018-07-17 Snell Advanced Media Limited Management of broadcast audio loudness
US9413322B2 (en) * 2012-11-19 2016-08-09 Harman International Industries, Incorporated Audio loudness control system
JP2016520854A (ja) * 2013-03-21 2016-07-14 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
US20160049162A1 (en) * 2013-03-21 2016-02-18 Intellectual Discovery Co., Ltd. Audio signal size control method and device
EP2992605B1 (en) 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
JP6244652B2 (ja) * 2013-05-02 2017-12-13 ヤマハ株式会社 音声処理装置及びプログラム
BR112016017756A2 (pt) * 2014-01-30 2018-05-15 Huawei Tech Co Ltd um sistema de compressão de áudio para comprimir um sinal de áudio
JP6323089B2 (ja) 2014-03-14 2018-05-16 ヤマハ株式会社 レベル調整方法およびレベル調整装置
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
FR3031852B1 (fr) * 2015-01-19 2018-05-11 Devialet Amplificateur a reglage de niveau sonore automatique
ES2771200T3 (es) * 2016-02-17 2020-07-06 Fraunhofer Ges Forschung Postprocesador, preprocesador, codificador de audio, decodificador de audio y métodos relacionados para mejorar el procesamiento de transitorios
EP3232688A1 (en) * 2016-04-12 2017-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for providing individual sound zones
US10149053B2 (en) * 2016-08-05 2018-12-04 Onkyo Corporation Signal processing device, signal processing method, and speaker device
EP3389183A1 (en) * 2017-04-13 2018-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for processing an input audio signal and corresponding method
US10074358B1 (en) * 2017-09-07 2018-09-11 GM Global Technology Operations LLC Audio control systems and methods for vehicles with variable compression ratio engines
US11775250B2 (en) 2018-09-07 2023-10-03 Gracenote, Inc. Methods and apparatus for dynamic volume adjustment via audio classification
KR20230144650A (ko) * 2018-09-07 2023-10-16 그레이스노트, 인코포레이티드 오디오 분류를 통한 동적 볼륨 조절을 위한 방법 및 장치
CN109151667B (zh) * 2018-09-21 2024-03-01 上海艾为电子技术股份有限公司 一种信号处理方法、装置及扬声器
CN111048108B (zh) * 2018-10-12 2022-06-24 北京微播视界科技有限公司 音频处理方法和装置
CN109817189B (zh) * 2018-12-29 2023-09-08 珠海市蔚科科技开发有限公司 音频信号的调节方法、音效调节设备及系统
JP7427531B2 (ja) * 2020-06-04 2024-02-05 フォルシアクラリオン・エレクトロニクス株式会社 音響信号処理装置及び音響信号処理プログラム
CN112083807B (zh) * 2020-09-20 2021-10-29 吉林大学 一种基于音触转换的足部地形触觉再现方法及装置
CN114915275A (zh) 2021-02-08 2022-08-16 祖玛视频通讯公司 两级数字自动增益控制
CN116386650A (zh) * 2023-03-29 2023-07-04 广州市迪士普音响科技有限公司 一种基于应用程序的音频增益方法及装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4922535A (en) * 1986-03-03 1990-05-01 Dolby Ray Milton Transient control aspects of circuit arrangements for altering the dynamic range of audio signals
US5666424A (en) * 1990-06-08 1997-09-09 Harman International Industries, Inc. Six-axis surround sound processor with automatic balancing and calibration
JPH0590857A (ja) 1991-09-28 1993-04-09 Victor Co Of Japan Ltd 音響効果装置
JPH05243881A (ja) 1992-02-27 1993-09-21 Matsushita Electric Ind Co Ltd 音場再生装置
DE69319456T2 (de) 1992-01-30 1999-03-25 Matsushita Electric Ind Co Ltd Schallfeldsteuerungssystem
JPH06169229A (ja) 1992-11-30 1994-06-14 Matsushita Electric Ind Co Ltd 自動利得制御装置
JPH07122953A (ja) 1993-10-22 1995-05-12 Matsushita Electric Ind Co Ltd 信号レベル圧縮装置
JP2004507141A (ja) * 2000-08-14 2004-03-04 クリアー オーディオ リミテッド 音声強調システム
JP2003299181A (ja) 2002-04-03 2003-10-17 Sony Corp オーディオ信号処理装置及びオーディオ信号処理方法
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
JP4349123B2 (ja) 2003-12-25 2009-10-21 ヤマハ株式会社 音声出力装置
JP4013906B2 (ja) 2004-02-16 2007-11-28 ヤマハ株式会社 音量制御装置
BRPI0518278B1 (pt) 2004-10-26 2018-04-24 Dolby Laboratories Licensing Corporation Método e aparelho para controlar uma característica de sonoridade particular de um sinal de áudio
KR101200615B1 (ko) * 2006-04-27 2012-11-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 청각 이벤트 검출에 기반한 비-라우드니스를 이용한 자동 이득 제어
WO2008078232A1 (en) * 2006-12-21 2008-07-03 Koninklijke Philips Electronics N.V. A system for processing audio data
US8275153B2 (en) * 2007-04-16 2012-09-25 Evertz Microsystems Ltd. System and method for generating an audio gain control signal
US20090074209A1 (en) * 2007-08-16 2009-03-19 Jeffrey Thompson Audio Processing for Compressed Digital Television

Also Published As

Publication number Publication date
WO2010044439A1 (ja) 2010-04-22
EP2352225A1 (en) 2011-08-03
CN102257728A (zh) 2011-11-23
CN102257728B (zh) 2014-11-26
JP5236006B2 (ja) 2013-07-17
US20110255712A1 (en) 2011-10-20
US8787595B2 (en) 2014-07-22

Similar Documents

Publication Publication Date Title
JP5236006B2 (ja) 音声信号調整装置及び音声信号調整方法
US8615094B2 (en) Automatic level control circuit
US9093968B2 (en) Sound reproducing apparatus, sound reproducing method, and recording medium
EP1680781B1 (en) System and method for audio signal processing
US20160210983A1 (en) Method and electronic device
JP2012509038A (ja) 動的音量制御及び複数空間処理防止
EP1709734A1 (en) System for audio signal processing
JP2006524968A (ja) 映画館における音量及び圧縮の制御
JP2008504783A (ja) 音声信号のラウドネスを自動的に調整する方法及びシステム
WO2010013944A2 (en) A method and an apparatus for processing an audio signal
CN112534717B (zh) 响应于反馈的多声道音频增强、解码及渲染
US20090016547A1 (en) Sound volume controller
CN110600062B (zh) 混音方法、装置和终端设备
KR102505773B1 (ko) 다중 대역 제한기 모드 및 잡음 보상 방법
JP2020510328A (ja) 進化したサラウンド処理を有する設定可能なマルチバンドコンプレッサーアーキテクチャー
US20160381468A1 (en) Method for compressing the dynamics in an audio signal
JP2009296297A (ja) 音声信号処理装置および方法
JP4811475B2 (ja) 録音装置、録音方法、音声信号補正回路及びプログラム
JP3627189B2 (ja) 音響電子回路の音量調節方法
JP2000134051A (ja) コンプレッサ
US11902747B1 (en) Hearing loss amplification that amplifies speech and noise subsignals differently
JP2012070024A (ja) 音声ダイナミックレンジコントロール装置
US11343635B2 (en) Stereo audio
JPH05145991A (ja) 低音域特性補正回路
WO2020255601A1 (ja) 出力音制御装置、および出力音制御方法、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130326

R150 Certificate of patent or registration of utility model

Ref document number: 5236006

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3