JP5585432B2 - 音響信号処理装置および方法、並びに、プログラム - Google Patents

音響信号処理装置および方法、並びに、プログラム Download PDF

Info

Publication number
JP5585432B2
JP5585432B2 JP2010280164A JP2010280164A JP5585432B2 JP 5585432 B2 JP5585432 B2 JP 5585432B2 JP 2010280164 A JP2010280164 A JP 2010280164A JP 2010280164 A JP2010280164 A JP 2010280164A JP 5585432 B2 JP5585432 B2 JP 5585432B2
Authority
JP
Japan
Prior art keywords
signal
acoustic signal
level
dynamic range
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010280164A
Other languages
English (en)
Other versions
JP2012129839A5 (ja
JP2012129839A (ja
Inventor
雅義 野口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010280164A priority Critical patent/JP5585432B2/ja
Priority to EP11187298.2A priority patent/EP2466917B1/en
Priority to US13/288,466 priority patent/US20120155656A1/en
Priority to CN2011104084750A priority patent/CN102571015A/zh
Publication of JP2012129839A publication Critical patent/JP2012129839A/ja
Publication of JP2012129839A5 publication Critical patent/JP2012129839A5/ja
Application granted granted Critical
Publication of JP5585432B2 publication Critical patent/JP5585432B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • H03G7/004Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers using continuously variable impedance devices
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Circuits Of Receivers In General (AREA)

Description

本発明は、音響信号処理装置および方法、並びに、プログラムに関し、特に、音響信号のダイナミックレンジの拡張を行う場合に用いて好適な音響信号処理装置および方法、並びに、プログラムに関する。
インターネットなどのネットワークを介して音響信号を伝送する場合、伝送路の能力や規格等により、伝送可能な音響信号のピーク値(以下、最大伝送レベルと称する)が制限される。そして、ピーク値が最大伝送レベル以下になるように音響信号を減衰した場合、ダイナミックレンジが広い音響信号ほど信号レベルの平均値(以下、平均レベルと称する)が低くなり、音量感が損なわれる。
そこで、音量感を増すために、音響信号を増幅し、いったん平均レベルを引き上げた後、最大伝送レベルを超える成分をリミッタ回路等でカットまたは減衰してから、音響信号を伝送する場合がある。この処理の具体例について、図1を参照して説明する。
図1の各グラフは、音響信号の波形を模式的に示しており、横軸が時間を示し、縦軸が信号レベルを示している。また、図1A乃至図1Cの点線は、最大伝送レベルを示している。
図1Aは、オリジナルの音響信号の波形の例を示している。また、図1Bは、音量感を増すために図1Aの音響信号を増幅し、平均レベルを引き上げた後の音響信号の波形の例を示している。さらに、図1Cは、図1Bの音響信号に対してリミッタ処理を行い、最大伝送レベルを超える部分をカットした音響信号の波形の例を示している。そして、図1Cの音響信号が、ネットワークを介して伝送される。
図1Cの音響信号は、図1Aの音響信号と比較して、平均レベルが高くなっているが、信号レベルの変動が小さくなっている。従って、オリジナルの音響信号と比べて音量感が増す一方、オリジナルの音響信号が有していたダイナミックレンジが失われ、平坦でメリハリのない音になってしまう。
一方、従来、音響信号のダイナミックレンジを拡張する技術として、エキスパンダが広く知られている(例えば、特許文献1参照)。エキスパンダは、音響信号のレベルに応じて、増幅用のゲインを変えることにより、音響信号のダイナミックレンジを拡張するものである。また、拡張特性をユーザが調整できるようにしたエキスパンダも存在する。
特開2001−230647号公報
図2は、従来のエキスパンダの入出力特性の一例を示し、入力信号のレベル(横軸)に対する出力信号のレベル(縦軸)の比率を示している。
この入出力特性を有するエキスパンダを用いると、小さな音をより小さく、大きな音をより大きくすることができる。その結果、ダイナミックレンジが拡張され、メリハリのある音を得ることができる。
ここで、図3を参照して、図2の入出力特性を有するエキスパンダにより、図1Cの音響信号のダイナミックレンジを拡張する場合について考える。なお、図3の各グラフは、図1と同様に、音響信号の波形を模式的に示している。
通常、ダイナミックレンジを拡張することにより音響信号のピーク値が高くなりすぎないように、エキスパンダに入力する前に、音響信号の平均レベルが所定の値まで下げられる。例えば、図1Cの音響信号は、平均レベルが高いため、エキスパンダに入力する前に、図3Aに示されるように、平均レベルが所定の値まで下げられる。
図3Bは、図3Aの音響信号に対して、図2の入出力特性を有するエキスパンダによりダイナミックレンジの拡張を行った後の音響信号の波形の例を示している。このように、いったんダイナミックレンジが失われた音響信号に対しては、エキスパンダによりダイナミックレンジの拡張を行っても、本来のダイナミックレンジを回復することができない。
本発明は、このような状況を鑑みてなされたものであり、音響信号のダイナミックレンジを適切に回復できるようにするものである。
本発明の一側面の音響信号処理装置は、音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出するセンター定位度検出手段と、前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出する拡張区間検出手段と、前記拡張区間において前記音響信号のダイナミックレンジを拡張する拡張手段とを備える。
前記拡張区間検出手段には、前記音響信号の定位分布のセンターへの遷移度を示すセンター遷移度が所定の閾値以上となる区間を前記拡張区間として検出させることができる。
前記センター遷移度は、前記センター定位度の微分値とすることができる。
前記拡張区間検出手段には、前記センター定位度が所定の閾値以上となる区間を前記拡張区間として検出させることができる。
前記音響信号のレベルを示す入力信号レベルを検出する入力信号レベル検出手段と、前記音響信号のダイナミックレンジを拡張するレベルを示し、前記拡張区間とは異なる区間において所定の最小値となり、前記拡張区間において所定の最大値以下の範囲内で推移する拡張信号レベルを設定する拡張信号レベル設定手段とをさらに設け、前記拡張手段には、前記拡張信号レベルが前記入力信号レベルを超える区間において、前記音響信号のダイナミックレンジを拡張させることができる。
前記入力信号レベルと前記拡張信号レベルとを比較し、いずれか大きい方を出力する比較手段と、前記比較手段の出力値および前記入力信号レベルに基づいて拡張ゲインを算出する拡張ゲイン算出手段とをさらに設け、前記拡張手段には、前記拡張ゲインに基づいて前記音響信号を増幅することにより、前記音響信号のダイナミックレンジを拡張させることができる。
前記音響信号のレベルを一定にする補正を行う補正手段をさらに設け、前記センター定位度検出手段には、補正された前記音響信号のセンター定位度を検出させ、前記拡張手段には、補正された前記音響信号のダイナミックレンジを拡張させることができる。
本発明の一側面の音響信号処理方法は、音響信号のダイナミックレンジを拡張する音響信号処理装置が、音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出し、前記拡張区間において前記音響信号のダイナミックレンジを拡張するステップを含む。
本発明の一側面のプログラムは、音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出し、前記拡張区間において前記音響信号のダイナミックレンジを拡張するステップを含む処理をコンピュータに実行させる。
本発明の一側面においては、音響信号の定位分布のセンターへの集中度を示すセンター定位度が検出され、前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間が検出され、前記拡張区間において前記音響信号のダイナミックレンジが拡張される。
本発明の一側面によれば、音響信号のダイナミックレンジを適切に回復させることができる。
伝送前に音響信号に対して行う処理の例を説明するための図である。 エキスパンダの入出力特性の一例を示すグラフである。 エキスパンダにより音響信号のダイナミックレンジを拡張する処理を説明するための図である。 本発明を適用した音響信号処理装置の第1の実施の形態を示すブロック図である。 拡張区間検出装置の機能の構成例を示すブロック図である。 ダイナミックレンジ拡張処理の第1の実施の形態を説明するためのフローチャートである。 ダイナミックレンジ拡張処理の第1の実施の形態を説明するための信号波形図である。 拡張区間検出処理の詳細を説明するためのフローチャートである。 拡張区間検出処理の詳細を説明するための信号波形図である。 音響信号処理装置の第1の実施の形態によるダイナミックレンジ拡大処理の結果の一例を示す信号波形図である。 本発明を適用した音響信号処理装置の第2の実施の形態を示すブロック図である。 ダイナミックレンジ拡張処理の第2の実施の形態を説明するためのフローチャートである。 ダイナミックレンジ拡張処理の第2の実施の形態を説明するための信号波形図である。 ダイナミックレンジ拡張処理の第2の実施の形態を説明するための信号波形図である。 コンピュータの構成例を示すブロック図である。
以下、本発明を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(基本的な実施の形態)
2.第2の実施の形態(ダイナミックレンジの過剰な拡張を抑制するようにした例)
3.変形例
<1.第1の実施の形態>
[音響信号処理装置の構成例]
は、本発明を適用した音響信号処理装置の第1の実施の形態を示すブロック図である。
の音響信号処理装置101は、例えば、左右2チャンネル(Lch、Rch)のス
テレオの音響信号が入力され、入力された音響信号(以下、入力信号と称する)のダイナ
ミックレンジを拡張して、出力する装置である。音響信号処理装置101は、AGC(Au
to Gain Control)111、拡張区間検出装置112、拡張信号レベル設定器113、拡
張ゲイン算出器114、および、ダイナミックレンジ拡張器115を含むように構成され
る。
AGC111は、入力信号のレベルが一定になるようにレベル補正を行う。AGC111は、レベル補正した入力信号(以下、補正入力信号と称する)を拡張区間検出装置112およびダイナミックレンジ拡張器115に供給する。
拡張区間検出装置112は、補正入力信号に基づいて、入力信号のダイナミックレンジを拡張する拡張区間を検出する。拡張区間検出装置112は、検出した拡張区間を示す拡張区間検出信号を拡張信号レベル設定器113に供給する。
拡張信号レベル設定器113は、拡張区間検出信号に基づいて、入力信号のダイナミックレンジを拡張するレベルを示す拡張信号レベルを設定する。拡張信号レベル設定器113は、設定した拡張信号レベルを示す拡張信号レベル信号を拡張ゲイン算出器114に供給する。
拡張ゲイン算出器114は、拡張信号レベル信号に基づいて、入力信号のダイナミックレンジを拡張するための拡張ゲインを算出する。拡張ゲイン算出器114は、算出した拡張ゲインを示す拡張ゲイン信号をダイナミックレンジ拡張器115に供給する。
ダイナミックレンジ拡張器115は、拡張ゲイン信号に基づいて、補正入力信号を増幅することにより、補正入力信号のダイナミックレンジを拡張する。ダイナミックレンジ拡張器115は、その結果得られた音響信号(以下、出力信号と称する)を後段に出力する。
[拡張区間検出装置の構成例]
図5は、図4の拡張区間検出装置112の構成例を示すブロック図である。拡張区間検出装置112は、センター定位度検出器131、センター遷移度検出器132、および、スレッショルド判定器133を含むように構成される。
センター定位度検出器131は、AGC111から供給される補正入力信号の定位分布のセンターへの集中度を示すセンター定位度を検出する。センター定位度検出器131は、検出したセンター定位度を示すセンター定位度検出信号をセンター遷移度検出器132に供給する。
センター遷移度検出器132は、センター定位度検出信号に基づいて、補正入力信号の定位分布のセンターへの遷移度を検出する。センター遷移度検出器132は、検出したセンター遷移度を示すセンター遷移度検出信号をスレッショルド判定器133に供給する。
スレッショルド判定器133は、センター遷移度検出信号を所定の閾値と比較することにより、拡張区間を検出する。スレッショルド判定器133は、検出した拡張区間を示す拡張区間検出信号を拡張信号レベル設定器113に供給する。
[ダイナミックレンジ拡張処理]
次に、図6のフローチャートおよび図7の信号波形図を参照して、音響信号処理装置101により実行されるダイナミックレンジ拡張処理について説明する。なお、この処理は、例えば、入力信号が音響信号処理装置101に入力されたとき開始される。
なお、図7の各グラフは、ダイナミックレンジ拡張処理で処理される各種の信号の波形を模式的に示しており、横軸は時間を示し、縦軸は信号レベルを示している。また、図7A乃至図7Cおよび図7Eの点線は、許容される音響信号のピーク値(以下、最大許容ピークレベルと称する)を示している。
また、以下、図7Aに示される入力信号が音響信号処理装置101に入力された場合の処理を、具体例として説明する。なお、図7Aの入力信号は、図1Cの音響信号と同じ信号である。
ステップS1において、AGC111は、レベル補正を行う。具体的には、AGC111は、入力信号の各チャンネルの平均レベルが所定の基準レベルになるように、入力信号のレベルを補正する。これにより、例えば、図7Aの入力信号が、図7Bに示されるように補正される。AGC111は、レベル補正した入力信号(補正入力信号)を、拡張区間検出装置112のセンター定位度検出器131およびダイナミックレンジ拡張器115に供給する。
なお、AGC111がレベル補正する手法は、特定の手法に限定されるものではなく、任意の手法を採用することができる。
ステップS2において、拡張区間検出装置112は、拡張区間検出処理を実行する。ここで、図8のフローチャートおよび図9の信号波形図を参照して、拡張区間検出処理の詳細について説明する。
なお、図9の各グラフは、拡張区間検出処理で処理される各種の信号の波形を模式的に示しており、横軸は時間を示し、縦軸は信号レベルを示している。
ステップS21において、センター定位度検出器131は、センター定位度を検出する。具体的には、センター定位度検出器131は、左右の両チャンネルの補正入力信号に基づいて、補正入力信号の定位分布を算出する。さらに、センター定位度検出器131は、算出した定位分布に基づいて、補正入力信号の定位分布がどの程度センターに集中しているかを示すセンター定位度を検出する。そして、センター定位度検出器131は、検出したセンター定位度を示すセンター定位度検出信号をセンター遷移度検出器132に供給する。
図9Aは、センター定位度検出信号の波形の例を示している。
なお、音響信号の定位分布およびセンター定位度の検出には、例えば、特開2008−28693号公報に開示されている手法等、任意の手法を採用することができる。
ステップS22において、センター遷移度検出器132は、センター遷移度を検出する。具体的には、センター遷移度検出器132は、センター定位度検出信号を微分することにより、補正入力信号の定位分布がどの程度センターに遷移しているかを示すセンター遷移度検出信号を生成する。そして、センター遷移度検出器132は、生成したセンター遷移度検出信号をスレッショルド判定器133に供給する。
図9Bは、図9Aのセンター定位度検出信号を微分することにより得られるセンター遷移度検出信号の波形の例を示している。
ステップS23において、スレッショルド判定器133は、拡張区間を検出する。具体的には、スレッショルド判定器133は、センター遷移度検出信号を所定の閾値と比較する。そして、スレッショルド判定器133は、センター遷移度検出信号が閾値以上となる区間をHレベル(ハイレベル)とし、閾値未満となる区間をLレベル(ローレベル)とする拡張区間検出信号を生成する。このセンター遷移度検出信号が閾値以上となり、拡張区間検出信号がHレベルとなる区間が、拡張区間とされる。そして、スレッショルド判定器133は、生成した拡張区間検出信号を拡張信号レベル設定器113に供給する。
図9Cは、図9Bのセンター遷移度検出信号を点線の水平線で示される閾値と比較した結果得られる拡張区間検出信号の波形の例を示している。
一般的に、音楽等のステレオの音響信号の再生音は、空間内で左右に広がり、そのうちリズム楽器やボーカル等が、センター付近に集中し、定位する。従って、音響信号の定位分布は、通常左右に広がっているが、ボーカルのフレーズの先頭や、リズム楽器のアタック音など、強いアタックが現れる瞬間に急速にセンターに集中する。
また、音響信号の定位分布は、リミッタ処理などにより音響信号の振幅を補正しても、その影響をあまり受けずに、ほぼ変わらずに保持される。すなわち、音響信号の定位分布は、音響信号の振幅の補正を行う前と後で、ほとんど変化しない。
従って、センター遷移度が閾値以上となる区間を検出することにより、音響信号の定位分布がセンターに急速に遷移する区間、すなわち、強いアタックが出現する瞬間を含む区間を拡張区間として検出することができる。
その後、拡張区間検出処理は終了する。
図6に戻り、ステップS3において、拡張信号レベル設定器113は、拡張信号レベルを設定する。具体的には、拡張信号レベル設定器113は、拡張区間検出信号がHレベルとなる拡張区間で、所定の最大値(以下、拡張信号ピークレベルと称する)以下の範囲内で上昇し、Lレベルとなる区間で、所定の最小値(以下、拡張信号最小レベルと称する)となる拡張信号レベル信号を生成する。例えば、拡張信号ピークレベルは最大許容ピークレベルに設定され、拡張信号最小レベルは0に設定される。
図7Cは、図7Bの補正入力信号および図9Cの拡張区間検出信号に基づいて生成される拡張信号レベル信号の波形の例を示している。図7Cの拡張信号レベル信号では、信号レベルが上昇する傾きと下降する傾きの絶対値が等しく、かつ、両方の傾きがそれぞれ全ての拡張区間において等しくなるように設定されている。従って、図7Cの拡張信号レベル信号は、各拡張区間において、拡張信号ピークレベルを頂点とする左右対称の山形の波形になっているが、拡張区間がさらに長くなると、拡張信号ピークレベルを維持する期間が長くなり、等脚台形の波形となる。一方、拡張区間がさらに短くなると、ピーク値が拡張信号ピークレベルに達しなくなる。
そして、拡張信号レベル設定器113は、生成した拡張信号レベル信号を拡張ゲイン算出器114に供給する。
ステップS4において、拡張ゲイン算出器114は、拡張ゲインを算出する。具体的には、拡張ゲイン算出器114は、拡張信号ピークレベルが所定の最大値(例えば、2.0)になり、拡張信号最小レベルが1.0になるように、拡張信号レベル信号の値を変換する。これにより、拡張ゲイン信号が生成される。
図7Dは、図7Cの拡張信号レベル信号に基づいて生成される拡張ゲイン信号の波形の例を示している。このように、拡張ゲイン信号の値(拡張ゲイン)は、拡張区間において1.0を超え、拡張区間と異なる区間において1.0となる。
そして、拡張ゲイン算出器114は、生成した拡張ゲイン信号をダイナミックレンジ拡張器115に供給する。
ステップS5において、ダイナミックレンジ拡張器115は、ダイナミックレンジを拡張する。具体的には、ダイナミックレンジ拡張器115は、拡張ゲイン信号により示される拡張ゲインを用いて補正入力信号を増幅することにより、ダイナミックレンジを拡張する。
これにより、拡張ゲインが1.0を超える拡張区間において、補正入力信号のダイナミックレンジが拡張される。そして、上述したように、拡張区間は、強いアタックが出現する瞬間を含むため、オリジナルの音響信号において、強いアタックが出現し、信号レベルが高くなる瞬間のダイナミックレンジを拡張することができる。従って、例えば、図1Aのオリジナル音響信号を増幅し、リミッタ処理することにより、図7Aの入力信号において失われていたダイナミックレンジを、図7Eに示されるように適切に回復することができる。その結果、本来のメリハリのある音を再現することができる。
そして、ダイナミックレンジ拡張器115は、ダイナミックレンジを拡張した音響信号(出力信号)を後段に出力する。
その後、ダイナミックレンジ拡張処理は終了する。
<2.第2の実施の形態>
ところで、音響信号処理装置101では、センター遷移度が閾値以上となる拡張区間において無条件に音響信号が増幅されるため、ダイナミックレンジが広い入力信号に対して、ダイナミックレンジの拡張が過剰に行われる場合がある。この件の具体例について、図10を参照して説明する。
なお、図10の各グラフの横軸は時間を示し、縦軸は信号レベルを示し、点線は最大許容ピークレベルを示している。また、図10Aは、音響信号処理装置101に入力される入力信号の波形の例を示し、図1Aの音響信号と同じ信号である。図10Bは、音響信号処理装置101により図10Aの入力信号のダイナミックレンジを拡張した結果得られる出力信号の波形の例を示している。このように、入力信号のダイナミックレンジが広く、ピーク値が最大許容ピークレベルに近い場合、ダイナミックレンジ拡張後の出力信号のピーク値が、最大許容ピークレベルを超えてしまうおそれがある。
本発明の第2の実施の形態は、このようにダイナミックレンジの過剰な拡張を抑制できるようにするものである。
[音響信号処理装置の構成例]
図11は、本発明を適用した音響信号処理装置の第2の実施の形態を示すブロック図である。なお、図中、図4と共通する部分には同じ符号を付してあり、処理が同じ部分について、その説明は繰り返しになるので適宜省略する。
図11の音響信号処理装置201は、図4の音響信号処理装置101と比較して、信号レベル検出器211および比較器212が追加され、拡張ゲイン算出器114の代わりに拡張ゲイン算出器213が設けられている点で異なる。また、音響信号処理装置201は、音響信号処理装置101と比較して、AGC111、拡張区間検出装置112、拡張信号レベル設定器113、および、ダイナミックレンジ拡張器115が設けられている点で共通する。
信号レベル検出器211は、AGC111から供給される補正入力信号のレベルを検出し、検出結果を示す入力信号レベル信号を比較器212および拡張ゲイン算出器213に供給する。
比較器212は、入力信号レベル信号と、拡張信号レベル設定器113から供給される拡張信号レベル信号とを比較し、比較結果を示す比較器出力信号を拡張ゲイン算出器213に供給する。
拡張ゲイン算出器213は、入力信号レベル信号および比較器出力信号に基づいて、拡張ゲインを算出する。拡張ゲイン算出器213は、算出した拡張ゲインを示す拡張ゲイン信号をダイナミックレンジ拡張器115に供給する。
[ダイナミックレンジ拡張処理]
次に、図12のフローチャート、並びに、図13および図14の信号波形図を参照して、音響信号処理装置201により実行されるダイナミックレンジ拡張処理について説明する。なお、この処理は、例えは、入力信号が音響信号処理装置201に入力されたとき開始される。
なお、図13および図14の各グラフは、ダイナミックレンジ拡張処理で処理される各種の信号の波形を模式的に示しており、横軸は時間を示し、縦軸は信号レベルを示している。また、図13A乃至図13E、図13G、図14A乃至図14E、および、図14Gの点線は、最大許容ピークレベルを示している。
また、以下、音響信号処理装置201に図13Aの入力信号が入力された場合の処理と、図14Aの入力信号が入力された場合の処理を適宜比較しながら説明する。なお、図13Aの入力信号は、図1Cの音響信号と同じ信号であり、リミッタ処理等によりダイナミックレンジが失われた音響信号である。一方、図14Aの入力信号は、図1Aの音響信号と同じ信号であり、ダイナミックレンジが失われていない音響信号である。
ステップS51において、図5のステップS1と同様の処理により、入力信号のレベル補正が行われる。
図13Bは、図13Aの入力信号に対してレベル補正を行った補正入力信号の波形を示しており、図7Bの補正入力信号と同じ信号である。
一方、図14Bは、図14Aの入力信号に対してレベル補正を行った補正入力信号の波形の例を示している。なお、この例では、説明を分かりやすくするために、図14Aの入力信号の平均レベルが基準レベルと等しく、図14Aの入力信号と図14Bの補正入力信号が等しくなる例を示している。
ステップS52において、信号レベル検出器211は、入力信号レベルを検出する。例えば、信号レベル検出器211は、補正入力信号の左右のチャンネルの加算平均レベルを入力信号レベルとして検出する。入力信号レベル検出器211は、検出した入力信号レベルを示す入力信号レベル信号を比較器212および拡張ゲイン算出器213に供給する。
図13Cは、図13Bの補正入力信号に対する入力信号レベル信号の波形の例を示している。この入力信号レベル信号は、図13Bの補正入力信号と同様に、ダイナミックレンジが狭い波形となる。
一方、図14Cは、図14Bの補正入力信号に対する入力信号レベル信号の波形の例を示している。この入力信号レベル信号は、図14Bの補正入力信号と同様に、ダイナミックレンジが広い波形となる。
ステップS53において、図6のステップS2の処理と同様に、拡張区間検出処理が実行される。そして、その結果得られた拡張区間検出信号が、拡張区間検出装置112から拡張信号レベル設定器113に供給される。
上述したように、音響信号の定位分布は、リミッタ処理等によりほとんど変化しない。従って、図13Bおよび図14Bの補正入力信号に対して、ほぼ同じ区間が拡張区間として検出され、ほぼ同じ波形の拡張区間検出信号が生成される。なお、以下、図13Bおよび図14Bの両方の補正入力信号に対して、上述した図9Cの信号と同じ拡張区間検出信号が生成されたものとする。
ステップS54において、図6のステップS3の処理と同様に、拡張信号レベルが設定され、その結果得られた拡張信号レベル信号が、拡張信号レベル設定器113から比較器212に供給される。
図13Dは、図13Bの補正入力信号に対する拡張信号レベル信号の例を示し、図14Dは、図14Bの補正入力信号に対する拡張信号レベル信号の波形の例を示している。なお、図13Dおよび図14Dの拡張信号レベル信号は、図7Cの拡張信号レベル信号と同じ信号である。
ステップS55において、比較器212は、入力信号レベルと拡張信号レベルを比較する。具体的には、比較器212は、入力信号レベル信号により示される入力信号レベルと、拡張信号レベル信号により示される拡張信号レベルを比較し、いずれか大きい方を選択して出力する。これにより、各時点において入力信号レベルと拡張信号レベルのうち大きい方を示す比較器出力信号が生成され、比較器212から拡張ゲイン算出器213に供給される。
図13Eは、図13Cの入力信号レベル信号と図13Dの拡張信号レベル信号とを比較した結果得られる比較器出力信号の波形の例を示している。この場合、図13Aの入力信号のダイナミックレンジが失われた区間とほぼ一致する各拡張区間の中央付近において、拡張信号レベルが入力信号レベルを超えるため、拡張信号レベルが選択される。一方、その他の区間では、拡張信号レベルが入力信号レベルを超えないため、入力信号レベルが選択される。
一方、図14Eは、図14Cの入力信号レベル信号と図14Dの拡張信号レベル信号とを比較した結果得られる比較器出力信号の波形の例を示している。この場合、拡張区間においても、拡張信号レベルが入力信号レベル信号を超えないため、入力信号レベルが選択される。また、その他の区間でも、拡張信号レベルが入力信号レベルを超えないため、入力信号レベルが選択される。従って、図14Eの比較器出力信号は、図14Cの入力信号レベル信号と同じ信号となる。
ステップS56において、拡張ゲイン算出器213は、拡張ゲインを算出する。具体的には、拡張ゲイン算出器213は、比較器出力信号の値÷入力信号レベル信号の値(入力信号レベル)を拡張ゲインとして算出する。そして、拡張ゲイン算出器213は、算出した拡張ゲインを示す拡張ゲイン信号を生成し、ダイナミックレンジ拡張器115に供給する。
図13Fは、図13Cの入力信号レベル信号と図13Eの比較器出力信号から得られる拡張ゲイン信号の波形の例を示している。この場合、拡張ゲインは、図13Eの拡張信号レベル信号が図13Cの入力信号レベル信号を超える区間で1.0より大きくなり、それ以外の区間で1.0になる。
一方、図14Fは、図14Cの入力信号レベル信号と図14Eの比較器出力信号から得られる拡張ゲイン信号の波形の例を示している。この場合、拡張ゲインは、図14Eの拡張信号レベル信号が図14Cの入力信号レベル信号を超える区間がないため、常に1.0になる。
ステップS57において、図6のステップS5と同様の処理により、拡張ゲイン信号により示される拡張ゲインに基づいて補正入力信号が増幅され、ダイナミックレンジが拡張される。そして、ダイナミックレンジを拡張した音響信号(出力信号)がダイナミックレンジ拡張器115から後段に出力される。
図13Gは、図13Bの補正入力信号を、図13Fの拡張ゲイン信号に基づいて増幅し、ダイナミックレンジを拡張した音響信号(出力信号)の波形の例を示している。この場合、拡張ゲイン信号の値が1.0を超える区間において、補正入力信号のダイナミックレンジが拡張される。このように、ダイナミックレンジが狭い入力信号に対しては、ダイナミックレンジが失われた区間の信号を増幅し、オリジナルの音響信号が有していたダイナミックレンジを適切に回復させることができる。
一方、図14Gは、図14Bの補正入力信号を、図14Fの拡張ゲイン信号に基づいて増幅し、ダイナミックレンジを拡張した音響信号(出力信号)の波形の例を示している。この場合、拡張ゲイン信号の値が1.0で一定であるため、図14Bの補正入力信号がそのまま出力される。このように、ダイナミックレンジが広い音響信号に対しては、ダイナミックレンジの過剰な拡張が抑制され、音響信号の歪みの発生等を防止することができる。
その後、ダイナミックレンジ拡張処理は終了する。
<2.変形例>
以下、本発明の実施の形態の変形例について説明する。
[変形例1]
以上の説明では、レベル補正した後の補正入力信号に基づいて拡張区間の検出を行ったが、上述したように音響信号の定位分布は、レベル補正の影響をほとんど受けないため、レベル補正する前の入力信号に基づいて拡張区間の検出を行うようにしてもよい。
[変形例2]
また、以上の説明では、センター遷移度に基づいて、拡張区間を検出するようにしたが、センター定位度に基づいて、拡張区間を検出するようにしてもよい。例えば、センター定位度が所定の閾値以上となる区間を拡張区間として検出するようにしてもよい。これにより、入力信号の定位分布がセンターに集中している区間、例えば、ボーカルやリズム楽器の音量が大きい区間のダイナミックレンジを拡張することができる。また、センター定位度とセンター遷移度の両方を用いて拡張区間を検出するようにしてもよい。
[変形例3]
また、拡張信号レベル信号のピーク値や、拡張信号レベル信号が増加または減少するときの傾きを、例えば、拡張区間の長さや、補正入力信号のレベル等に基づいて可変とするようにしてもよい。また、図7Cでは、拡張信号レベル信号の上昇時と下降時の傾きが左右対称(すなわち、傾きの絶対値が等しく、正負の符号が逆)となる例を示しているが、必ずしも左右対称にする必要はない。例えば、拡張信号レベルの立ち上がりを早くし、その後、徐々に減衰するようにしてもよい。
[変形例4]
さらに、入力前に平均レベルが揃えられてから入力信号が入力される場合、AGC111を削除し、レベル補正処理を省略することが可能である。
[変形例5]
また、マルチチャンネルの入力信号に対してダイナミックレンジ拡張処理を行う場合、例えば、左、右、中央のフロント側の3チャンネルの音響信号に対してダウンミックスを行い、生成された音響信号に基づいて拡張区間の検出を行うようにすればよい。そして、検出された拡張区間に基づいて、フロント側の3チャンネルの音響信号についてのみダイナミックレンジの拡張を行うようにすればよい。
なお、本発明は、例えば、音響信号の再生または録音を行う装置や、音響信号の補正を行う装置に適用できる。
また、本明細書において、音響信号とは、人の声や動物の鳴き声等の音声のみからなる音声信号を含むものである。
[コンピュータの構成例]
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図15は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)301,ROM(Read Only Memory)302,RAM(Random Access Memory)303は、バス304により相互に接続されている。
バス304には、さらに、入出力インタフェース305が接続されている。入出力インタフェース305には、入力部306、出力部307、記憶部308、通信部309、及びドライブ310が接続されている。
入力部306は、キーボード、マウス、マイクロフォンなどよりなる。出力部307は、ディスプレイ、スピーカなどよりなる。記憶部308は、ハードディスクや不揮発性のメモリなどよりなる。通信部309は、ネットワークインタフェースなどよりなる。ドライブ310は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア311を駆動する。
以上のように構成されるコンピュータでは、CPU301が、例えば、記憶部308に記憶されているプログラムを、入出力インタフェース305及びバス304を介して、RAM303にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU301)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア311に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア311をドライブ310に装着することにより、入出力インタフェース305を介して、記憶部308にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部309で受信し、記憶部308にインストールすることができる。その他、プログラムは、ROM302や記憶部308に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
101 音響信号処理装置, 111 AGC, 112 拡張区間検出装置, 113 拡張信号レベル設定器, 114 拡張ゲイン算出器, 115 ダイナミックレンジ拡張器, 131 センター定位度検出器, 132 センター遷移度検出器, 133 スレッショルド判定器, 201 音響信号処理装置, 211 信号レベル検出器, 212 比較器, 213 拡張ゲイン算出器

Claims (9)

  1. 音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出するセンター定位度検出手段と、
    前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出する拡張区間検出手段と、
    前記拡張区間において前記音響信号のダイナミックレンジを拡張する拡張手段と
    を備える音響信号処理装置。
  2. 前記拡張区間検出手段は、前記音響信号の定位分布のセンターへの遷移度を示すセンター遷移度が所定の閾値以上となる区間を前記拡張区間として検出する
    請求項1に記載の音響信号処理装置。
  3. 前記センター遷移度は、前記センター定位度の微分値である
    請求項2に記載の音響信号処理装置。
  4. 前記拡張区間検出手段は、前記センター定位度が所定の閾値以上となる区間を前記拡張区間として検出する
    請求項1に記載の音響信号処理装置。
  5. 前記音響信号のレベルを示す入力信号レベルを検出する入力信号レベル検出手段と、
    前記音響信号のダイナミックレンジを拡張するレベルを示し、前記拡張区間とは異なる区間において所定の最小値となり、前記拡張区間において所定の最大値以下の範囲内で推移する拡張信号レベルを設定する拡張信号レベル設定手段と
    をさらに備え、
    前記拡張手段は、前記拡張信号レベルが前記入力信号レベルを超える区間において、前記音響信号のダイナミックレンジを拡張する
    請求項1に記載の音響信号処理装置。
  6. 前記入力信号レベルと前記拡張信号レベルとを比較し、いずれか大きい方を出力する比較手段と、
    前記比較手段の出力値および前記入力信号レベルに基づいて拡張ゲインを算出する拡張ゲイン算出手段と
    をさらに備え、
    前記拡張手段は、前記拡張ゲインに基づいて前記音響信号を増幅することにより、前記音響信号のダイナミックレンジを拡張する
    請求項5に記載の音響信号処理装置。
  7. 前記音響信号のレベルを一定にする補正を行う補正手段を
    さらに備え、
    前記センター定位度検出手段は、補正された前記音響信号のセンター定位度を検出し、
    前記拡張手段は、補正された前記音響信号のダイナミックレンジを拡張する
    請求項1に記載の音響信号処理装置。
  8. 音響信号のダイナミックレンジを拡張する音響信号処理装置が、
    前記音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、
    前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出し、
    前記拡張区間において前記音響信号のダイナミックレンジを拡張する
    ステップを含む音響信号処理方法。
  9. 音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、
    前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出し、
    前記拡張区間において前記音響信号のダイナミックレンジを拡張する
    ステップを含む処理をコンピュータに実行させるためのプログラム。
JP2010280164A 2010-12-16 2010-12-16 音響信号処理装置および方法、並びに、プログラム Expired - Fee Related JP5585432B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010280164A JP5585432B2 (ja) 2010-12-16 2010-12-16 音響信号処理装置および方法、並びに、プログラム
EP11187298.2A EP2466917B1 (en) 2010-12-16 2011-10-31 Audio-signal processing apparatus and method, and program
US13/288,466 US20120155656A1 (en) 2010-12-16 2011-11-03 Audio-Signal Processing Apparatus and Method, and Program
CN2011104084750A CN102571015A (zh) 2010-12-16 2011-12-09 音频信号处理设备和方法、以及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010280164A JP5585432B2 (ja) 2010-12-16 2010-12-16 音響信号処理装置および方法、並びに、プログラム

Publications (3)

Publication Number Publication Date
JP2012129839A JP2012129839A (ja) 2012-07-05
JP2012129839A5 JP2012129839A5 (ja) 2014-01-09
JP5585432B2 true JP5585432B2 (ja) 2014-09-10

Family

ID=44862824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010280164A Expired - Fee Related JP5585432B2 (ja) 2010-12-16 2010-12-16 音響信号処理装置および方法、並びに、プログラム

Country Status (4)

Country Link
US (1) US20120155656A1 (ja)
EP (1) EP2466917B1 (ja)
JP (1) JP5585432B2 (ja)
CN (1) CN102571015A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA142030S (en) 2011-08-31 2014-07-04 Knog Pty Ltd Portable light
FR3031638A1 (fr) * 2015-01-14 2016-07-15 Univ Bordeaux Procede de decompression et dispositif correspondant

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62221212A (ja) * 1986-03-24 1987-09-29 Sony Corp デイジタル信号処理装置
JPH02312411A (ja) * 1989-05-29 1990-12-27 Sausu & Uesuto:Kk Fmチューナーにおけるダイナミックレンジ拡大方法
JPH08191499A (ja) * 1995-01-10 1996-07-23 Toshiba Corp バランスコントロール回路
JP2001230647A (ja) 2000-02-17 2001-08-24 Oki Electric Ind Co Ltd エキスパンダ回路
JP4415775B2 (ja) * 2004-07-06 2010-02-17 ソニー株式会社 音声信号処理装置およびその方法、音声信号記録再生装置ならびにプログラム
MX2007005027A (es) * 2004-10-26 2007-06-19 Dolby Lab Licensing Corp Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio.
EP1729410A1 (en) * 2005-06-02 2006-12-06 Sony Ericsson Mobile Communications AB Device and method for audio signal gain control
JP4835298B2 (ja) 2006-07-21 2011-12-14 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
JP2009159020A (ja) * 2007-12-25 2009-07-16 Sony Corp 信号処理装置、信号処理方法、プログラム
JP2010280164A (ja) 2009-06-05 2010-12-16 Ihi Corp オフセット印刷装置

Also Published As

Publication number Publication date
US20120155656A1 (en) 2012-06-21
EP2466917B1 (en) 2014-12-03
CN102571015A (zh) 2012-07-11
EP2466917A3 (en) 2013-11-27
EP2466917A2 (en) 2012-06-20
JP2012129839A (ja) 2012-07-05

Similar Documents

Publication Publication Date Title
CN109640223B (zh) 一种啸叫抑制方法、装置、音响及扩音系统
WO2010131470A1 (ja) ゲイン制御装置及びゲイン制御方法、音声出力装置
JP6323089B2 (ja) レベル調整方法およびレベル調整装置
CN109217834B (zh) 增益调整方法、音频设备及可读存储介质
JP2016131404A (ja) 音響装置、音量制御方法、音量制御プログラム及び記録媒体
JP4983694B2 (ja) 音声再生装置
JP6067391B2 (ja) 信号音量に基いた信号利得の適合時のピーク検出
JP5585432B2 (ja) 音響信号処理装置および方法、並びに、プログラム
US8615075B2 (en) Method and apparatus for removing noise signal from input signal
JP5958378B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法およびプログラム
JP4803193B2 (ja) オーディオ信号の利得制御装置および利得制御方法
JP6887315B2 (ja) 音声処理装置およびその制御方法、プログラム並びに記憶媒体
JP2004032387A (ja) ハウリング制御装置及び補聴器
JP2012129839A5 (ja)
JP5145733B2 (ja) 音声信号処理装置および音声信号処理方法ならびにプログラム
JP2008227681A (ja) 音響特性補正システム
US20230395093A1 (en) Sound processing device and sound processing method
JP2002299975A (ja) デジタルagc装置
CN115835092B (zh) 一种音频扩音反馈抑制方法、系统、计算机及存储介质
JP7450196B2 (ja) 制御装置、制御方法及びプログラム
JP5515538B2 (ja) ハウリング防止装置
JP2014175847A (ja) 音声信号処理装置、音響装置、音声信号処理装置の制御方法、プログラム
JP2014187625A (ja) 音声信号処理装置、音響装置、音声信号処理装置の制御方法、およびプログラム
KR20120022650A (ko) 출력음향신호에 따라 필터의 계수를 적응적으로 조정하는 음향 신호 재생 방법 및 장치
JP4666320B2 (ja) リミッタ・コンプレッサ装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140707

LAPS Cancellation because of no payment of annual fees