JP2020034885A - オーバーシュート抑圧を用いたマルチバンドオーディオ信号ダイナミックレンジ圧縮 - Google Patents

オーバーシュート抑圧を用いたマルチバンドオーディオ信号ダイナミックレンジ圧縮 Download PDF

Info

Publication number
JP2020034885A
JP2020034885A JP2019002731A JP2019002731A JP2020034885A JP 2020034885 A JP2020034885 A JP 2020034885A JP 2019002731 A JP2019002731 A JP 2019002731A JP 2019002731 A JP2019002731 A JP 2019002731A JP 2020034885 A JP2020034885 A JP 2020034885A
Authority
JP
Japan
Prior art keywords
input
overshoot
signal
output
compressor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019002731A
Other languages
English (en)
Other versions
JP6779323B2 (ja
Inventor
ユリ ヨウ,
Yu-Li You
ユリ ヨウ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoguang Electric Co Ltd
Original Assignee
Guoguang Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoguang Electric Co Ltd filed Critical Guoguang Electric Co Ltd
Publication of JP2020034885A publication Critical patent/JP2020034885A/ja
Application granted granted Critical
Publication of JP6779323B2 publication Critical patent/JP6779323B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

【課題】オーバーシュートを抑圧できるマルチバンドオーディオ信号ダイナミックレンジ圧縮システムを提供する。【解決手段】ダイナミックレンジ圧縮システムの入力ラインは、入力信号を受信する。入力ラインに結合されたフィルタセットは、入力信号を第1周波数帯域と第2周波数帯域とを含む周波数帯域のセットに分割する。コンプレッサは、第1周波数帯域を受信する第1入力と、第2入力と、出力とを有する。加算器は、コンプレッサの出力に結合された第1入力と、第2周波数帯域に結合された第2入力と、出力とを有する。オーバーシュート推定モジュールは、加算器の出力に結合された入力と、コンプレッサの第2入力に結合された出力とを有する。オーバーシュート推定モジュールの出力は、オーバーシュート推定モジュールの前記入力における信号と所定スレッショルドとの比較の結果を示すオーバーシュート信号を提供する。【選択図】図6

Description

本発明は、とりわけ、関連するオーバーシュートの抑圧を伴う、オーディオ信号ダイナミックレンジ圧縮のためのマルチバンド処理のようなオーディオ信号処理のシステム、方法および技術に関する。
単一のダイナミックレンジコンプレッサ(DRC)がオーディオ信号の全帯域に適用される場合には、得られるゲイン低減は全信号に(すなわち、その全スペクトルにわたって)適用されることになる。その効果は音量コントロールを低減するのに似ているが、しかしこれは、例えば再生歪みや機器の損傷を避けるため、あるいは単に他人を邪魔する過度の音量を避けるために、自動的に、かつ、信号レベルの増加に応答して行われる。残念ながら、レンジ圧縮に対するこの単純化されたアプローチから生じる1つの問題は、例えばキックドラムなどの単一の楽器から発生する個別の大音量イベントによって、オーディオの他のコンポーネントの音量を下げる必要がないあるいは望ましくない場合にもかかわらず、所望の効果を得るためにオーディオ信号全体のゲインを低減してしまうことにある。例えば、そのような全ての信号の処理の結果として、ゲイン低減が適用されている期間中にオーディオ信号内のボーカルが許容できないほど低いレベルまで下げられてしまう可能性がある。
この問題は、従来、異なる周波数帯域ごとに異なるコンプレッサを適用するマルチバンドダイナミックレンジコンプレッサを使用することによって軽減されてきた。このアプローチによれば、1つの周波数帯域で大音量イベントが発生してもその帯域でのみゲインが低減され、他の帯域ではその影響を大きく受けることはない。たとえば、キックドラムからの大音量イベントは、対応する信号エネルギーのバーストが発生している特定の低周波数帯域のみをカバーするコンプレッサによって単独で圧縮され、他(例えば中周波数帯域および高周波数帯域)で発生するサウンドは残される。
図1に示すように、従来のマルチバンドコンプレッサ10は、オーディオ信号を2つ以上の周波数帯域(この例では3つ)に分割するフィルタセット12(個々のフィルタ12A〜Cを含む)を備える。各周波数帯域はそれ自身の別々のコンプレッサによって処理される(それぞれフィルタ12A〜Cの出力はコンプレッサ14A〜Cのうちの1つに結合されている)。これらのコンプレッサ14A〜Cからの出力は加算器15で再結合されて出力信号18が形成される。
残念なことに、コンプレッサ10のようなマルチバンドコンプレッサに関する1つの重大な問題は、圧縮信号18がしばしば目標コンプッションスレッショルドを超えてオーバーシュートすることである。この状況は主に、周波数帯域のクロスオーバー領域またはオーバーラップ領域内の入力オーディオ信号エネルギーの結果として発生する。これに関して、フィルタ12A〜Cのそれぞれは、図2に示すように、隣接する周波数帯域がオーバーラップするように(例えば、帯域22Aと帯域22Bとの間のオーバーラップ領域24Aと帯域22Bと帯域22Cとの間のオーバーラップ領域24B)、対応する周波数帯域22A〜Cを出力する。
コンプレッサがパスバンドに適用されストップバンドは圧縮されないままにされる2バンドダイナミックレンジコンプレッサについての図3に、前の段落で述べたオーバーシュート効果が示される。本明細書では、説明を容易にするために、さらに詳述することなく使用されるかぎり、「非圧縮(uncompressed)」という用語は、対象信号(通常、特定の帯域制限信号、より正確には、周波数帯域)がレンジ圧縮されていないことを意味するものとする。この例では、パスバンドのクロスオーバー周波数は1キロヘルツ(kHz)および10kHzに設定されている。そのコンプレッサは20デシベル(dB)の最大ゲインと0dBの所望の制限スレッショルドを持つ。入力レベルが低い場合(すなわち、図3に示される曲線30以下のような低い曲線)、20dBのゲインがはっきりと見てとれる。入力レベルが増加すると(曲線31以上のようなより高い曲線で表される)、出力レベルを理想的には最大0dB(この例では所望の制限スレッショルド28)に制限するためにリミッタが作動し始める。しかし、この制限28は、典型的には中心周波数32(この例では3.162kHz)の周りで、クロスオーバー周波数34から遠く離れた周波数に対してのみ課されている。図3に見られるように、クロスオーバー周波数34内およびその周辺では、入力信号エネルギーはバンドストップフィルタによって完全には抑圧されず、出力信号はこの所望の制限28をオーバーシュートしてほぼ6dBもの高いレベルに達する。
この問題を軽減するための従来のアプローチとしては、次のものがある。
(1)E. Lindemann, "The continuous frequency dynamic range compressor," Proceedings of 1997 Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, NY, USA, 1997, DOI:10.1109/ASPAA.1997.625580, ISBN: 0-7803-3908-8。これは、帯域の数を増やし帯域間のオーバーラップ領域を広げることによってこの問題を解決している。
(2)E.Vickers, "The Non-Flat and Continually Changing Frequency Response of Multiband Compressors", 2010, Audio Engineering Society (AES) Convention 129。これは、クロスオーバー領域付近の入力信号を調べ、ピークが完全に単一の帯域内に収まるように帯域境界を再計算する周波数領域アプローチを採用している(これによりクロスオーバー領域で発生する信号エネルギー量が制限される)。
(3)D. Traore, J. Atkins, "Compensation of Crossover Region Overshoot in Multiband Compression", 2014 AES Convention 136。ここでは、(クロスオーバー領域内の入力信号エネルギーの量を決定することによってオーバーシュートの推定値を提供しようと試みる)周波数分解モジュール、および(予想されるオーバーシュートの影響を制限しようとする)ゲイン補償フィルタが、各コンプレッサのゲイン経路の最初に設けられる。
しかし、オーバーシュートを軽減するための従来のアプローチ(例えば、上述のもの)に関する典型的な問題は、それらは高度なフィルタバンクおよび/または周波数領域処理を用いており、多くの場合、低コストのマイクロコントローラユニット(マイクロコントローラまたはMCU)またはデジタルシグナルプロセッサ(DSP)が使用されるリアルタイムアプリケーションには適さないことを、本発明者は見出した。この問題に対処するために、本発明はとりわけ、コンプレッサの好適に遅延した出力を同じコンプレッサのゲイン経路の入力にフィードバックして後続のサンプルにおけるオーバーシュートを抑圧するという比較的簡単なアプローチを提供する。
したがって、本発明の一実施形態は、入力ラインが入力信号を受け取るオーディオ信号ダイナミックレンジ圧縮システムに関する。前記入力ラインに結合されたフィルタセットは、前記入力信号を第1周波数帯域と第2周波数帯域とを含む周波数帯域のセットに分割する。コンプレッサは、前記第1周波数帯域を受信する第1入力と、第2入力と、出力とを有する。加算器は、前記コンプレッサの前記出力に結合された第1入力と、前記第2周波数帯域に結合された第2入力と、出力とを有する。オーバーシュート推定モジュールは、前記加算器の前記出力に結合された入力と、前記コンプレッサの前記第2入力に結合された出力とを有する。前記オーバーシュート推定モジュールの前記出力は、前記オーバーシュート推定モジュールの前記入力における信号と所定スレッショルドとの比較の結果を示すオーバーシュート信号を提供する。
前述の概要は、単に本発明の特定の態様の簡単な説明を提供することを意図したものである。本発明の完全な理解は、添付の図面と関連して特許請求の範囲および以下の好ましい実施形態の詳細な説明を参照することによって得ることができる。
以下の開示において、本発明は添付の図面を参照して説明される。ただし、図面は単に本発明の特定の代表的なおよび/または例示的な実施形態および特徴を描いたものであり、本発明の範囲を限定することを意図するものではないことを理解されたい。以下は、添付の各図面の簡単な説明である。
従来の3バンドダイナミックレンジコンプレッサのブロック図。 図1のレンジコンプレッサによって処理された3つの帯域を概念的に示す図。 −50dB(一番下の曲線)から0dB(一番上の曲線)までの範囲の入力パワーレベルで、オーバーシュートを緩和することなく、5dB刻みで従来のレンジコンプレッサが提供する出力パワを示す図。 入力信号の単一の帯域を処理するための、従来のダイナミックイコライザを示すブロック図。 図4に示すダイナミックイコライザのフィルタによって生成されるパスバンドとストップバンドを概念的に示す図。 フィードバックオーバーシュート信号に基づいてコンプレッサのサイドチェーンに入力される信号を変更することによってオーバーシュート抑圧を提供するダイナミックコンプレッサのブロック図。 オーバーシュート推定モジュールのブロック図。 アタックの検出に基づくスムージング動作をリセットする処理を示すフローチャート。 フィードバックオーバーシュート信号を用いてコンプレッサのコンプレッションスレッショルドを引き下げることによってオーバーシュート抑圧を提供するダイナミックコンプレッサのブロック図。 フレームベースのオーバーシュート推定モジュールのブロック図。 マルチバンドダイナミックレンジ圧縮システムにおけるオーバーシュート信号フィードバックの使用を示すブロック図。 1つだけの次の隣接周波数帯域および前の全ての帯域からのオーバーシュート信号フィードバックを使用するマルチバンドダイナミックレンジ圧縮システムを示すブロック図。
最も簡単な形態のマルチバンドダイナミックレンジ圧縮システムの1つに使用されている従来のダイナミックイコライザ(DEQ)50が図1に示されている。2つのフィルタ52および53を使用して入力信号51が2つの対応する部分に分割される。バンドパスフィルタ52は、(図5に示す)パスバンド62を選択し、バンドストップフィルタ53は、(これも図5に示す)ストップバンド63と呼ばれる残りのスペクトルを選択する。パスバンド62とストップバンド63との間には幾らかのオーバーラップ65を有する。コンプレッサ55はパスバンド62にのみ適用される。最後に、加算器56において、パスバンド信号62の圧縮されたバージョン57は、非圧縮のストップバンド信号63と合成されて、出力信号58が提供される。このようなダイナミックイコライザ50を複数、カスケード接続することにより、フレキシブルな周波数帯域のセットを有するマルチバンドコンプレッサを提供することができる。
本例ではバンドパスフィルタおよびバンドストップフィルタが使用されているが、別の実施形態では、代わりにローパスフィルタまたはハイパスフィルタがパスバンド62を生成するために使用され、対応するストップバンドフィルタ53は好ましくはそれぞれ相補ハイパスフィルタまたはローパスフィルタである。これに関して、特定の場合に関して反対のことが述べられていない限り、本明細書における「周波数帯域(frequency band)」のような用語の使用は、高域カットオフ周波数および非ゼロ低域カットオフ周波数を有する有限帯域、高域カットオフ周波数のみを有する帯域、低域カットオフ周波数のみを有する帯域のいずれかを意味することを意図している。
本発明によるオーバーシュート抑圧を含む代替のDEQシステム100を図6に示す。上述のシステム50と同様に、システム100は、バンドパスフィルタ52(パスバンド信号62(x(n)ともいう。)を提供する)と、バンドストップフィルタ53(ストップバンド信号63を提供する)と、コンプレッサ155(コンプレッサ55と類似しうる)とを含む。また、システム100は、システム50とは異なり、圧縮出力信号157とストップバンド信号63との合成(加算器158によって提供される)におけるオーバーシュートの量を推定するオーバーシュート推定モジュール160を含む。加算器158は、圧縮出力信号157に結合された入力と、ストップバンド信号63に結合された入力と、合成信号159(y(n)ともいう。)を提供する出力とを有する。本実施形態は、単一の帯域の圧縮に焦点を合わせている。複数の異なる周波数帯域が圧縮される本発明の好ましい実施形態では、そのような各帯域の合成信号(例えば、信号159)は、(1)その帯域の信号の圧縮バージョンと、(2)隣接する帯域(オーバーラップする周波数がいくつかある)の信号の、いくつかのバージョンを含む。
いずれの場合も、合成信号159は、対応するオーバーシュート信号161(o(n)ともいう。)を出力するオーバーシュート推定モジュール160に結合される。以下で詳細に説明するように、o(n)は、その後、パスバンド信号62の後続のサンプルにおけるオーバーシュートを抑圧するためにその情報を使用するコンプレッサ155の別の入力に結合される。本実施形態においてそのような抑圧がどのように達成されるかをより良く説明するために、コンプレッサ155の一般的な内部構造が、図6に示されている。
図6にはコンプレッサ155の特定の実装例が示されているが、その代わりに異なる種類のコンプレッサを使用してもよいことは理解されるべきである。本発明で使用可能なダイナミックレンジコンプレッサおよびそれらの構成要素の議論については、2018年6月29日に出願された本発明者/出願人による米国特許出願第16/022,819号('819出願)を参照されたい。この出願の内容は、この引用により本明細書に完全に記載されているかのように本明細書に組み込まれる。このようなコンプレッサは通常、コンプレッサの入力信号にゲインが適用されるメイン信号経路と、ゲインが動的に計算されるサイドチェーンとを含む。例えば、D. Giannoulis, M. Massberg, J. Reiss. 2012, "Digital Dynamic Range Compressor Design - A Tutorial and Analysis," Journal of Audio Engineering Society 60: pp. 399-408 (以下、「Giannoulis 2012」という。)も参照されたい。
図6では、本実施形態における推定オーバーシュート信号161の挿入点を示すために、レベル検出器155Aが、他のサイドチェーン処理155Bから分離しているように示されている。(メイン信号経路内の)乗算器155Dにおいて、サイドチェーンで生成されたゲイン信号155Eは、(本実施形態では信号62が要素155Cにおいて遅延された後に)パスバンド信号62であるx(n)に印加される。
オーバーシュート推定モジュール160の例示的な実装例を、図7に示す。図示のように、合成信号y(n)159は遅延素子171の入力に結合され、遅延素子171の出力はレベル検出器172に結合され、レベル検出器172はレベル信号173(p(n)という。)を提供する。
現在の合成信号y(n)を用いて現在のy(n)自体のコンプレッサゲインが修正されることを回避するために、y(n)の新しい値を生成するように遅延(遅延要素171によって提供される)させることが好ましい。1サンプルの遅延は、現在のコンプレッサ出力サンプルy(n)が次のサンプルに対するコンプレッサゲインy(n−1)を修正するために使用されることを意味する。より大きな遅延を使用してもよいが、1サンプルの最小遅延が好ましい。
レベル検出器172は、好ましくは、その入力信号のレベルまたはパワの推定値を提供する。好ましくは、レベル検出器172は、入力信号の絶対値または二乗を計算する。例えば、Giannoulis 2012を参照されたい。
レベル検出器172によって出力されたレベル信号p(n)173(またはオーバーシュート推定モジュール160に入力される信号のレベルを示す任意の他の信号)が、好ましくはコンプレッサ155のコンプレッションスレッショルドに関連する所定スレッショルドT 175を上回る場合に、オーバーシュートが生じると考えられる。例えば、オーバーシュート抑圧を微調整するために、ユーザがスレッショルド175を(リアルタイムで、または事前に設計パラメータとして)コンプレッサのコンプレッションスレッショルドよりやや高くまたは少し低く設定することがある。
本実施形態では、モジュール176によって実行されるランプ機能は、以下のように瞬時オーバーシュート信号177を生成する。
Figure 2020034885
ただし、Kは、オーバーシュート信号がコンプレッサ155にどれだけ強くフィードバックされるかを制御するために調整されうるスケールファクタである。この目的のために、(比較機能、ここではレベル信号p(n)173とスレッショルドT 175との間の差、の実施を明確に示すために図7に示されているように)加算器178は、別個の構成要素として実装されるか、あるいは、モジュール176に組み込まれうる。なお、(本実施形態において)モジュール176によって実行されるランプ関数は、代わりに、入力信号レベルとスレッショルドとの比較(例えば、差)に基づいて出力信号を提供する様々な他の演算のうちの任意のものと置き換えることができる。例えば、他の実施形態では、動作は依然として入力信号レベルと所定スレッショルドとの差に依存するが、上述した区分的線形ランプ関数は、連続的におよび/または滑らかに変化する勾配を有する関数で置き換えられる。また、特定の実施形態では、上記の例とは反対に、モジュール176によって提供されるオーバーシュート信号は、所定スレッショルドより低い少なくともいくつかの値に対しては非ゼロである(例えば、小さい)。したがって、モジュール176は、より一般的にはオーバーシュート信号発生器176または瞬時オーバーシュート信号発生器176と呼ぶことができる。
本実施形態では、瞬時オーバーシュート信号177は、サンプルごとに大きく変化する可能性があり、そのため、より安定したオーバーシュート信号o(n)161を生成するために、オプションとして(例えば、モジュール180において)平滑化される。メディアンフィルタおよび最大値フィルタなどの順序統計フィルタ、あるいは一般に利用可能な有限インパルス応答(FIR)ローパスフィルタまたは無限インパルス応答(IIR)ローパスフィルタのいずれかをスムージングモジュール180内で使用することができる。順序統計フィルタとそれに続くFIRフィルタおよび/またはIIRフィルタとを連結して使用してもよい。一般的なFIRフィルタまたはIIRフィルタは、その全ての入力が非負でも負の値を出力することがあるので、そのような負の値はスムージングモジュール180内でゼロに設定されることが好ましい。
オプションとして、モジュール180によって実行されるスムージング演算は、図8に示される処理200も実行する。この目的のために、処理200への入力(およびスムージングモジュール180への追加入力)は、アタック検出器182(図7および図8に示す)の出力である。アタック検出器182は、パスバンド信号54に結合された入力と、前述したような検出出力(これは図7に示すようにスムージングモジュール180に結合されている)とを有する。再び図8を参照すると、ステップ201において、アタック検出器182の出力に基づいて、アタックが発生したかどうかの判定が行われる。例えば、アタック検出モジュール182の出力が所定スレッショルドを超えると、アタックが発生したと判定される。その場合、処理はステップ202に進み、スムージングモジュール180によって実行されるスムージング演算が、例えばその出力および/またはその遅延要素の少なくともいくつか(たとえばそれら全て)をゼロに設定することによって、リセットされる。それまでは、リセット動作は行われない(すなわち、ステップ203)。D. Giannoulis, M. Massberg, J. Reiss, 2013, "Parameter Automation in a Dynamic Range Compressor." Journal of the Audio Engineering Society, 716-726(以下、「Giannoulis 2013」)に記載されたクレストファクタ、あるいは、'819出願で特定される他のアタック検出アルゴリズムなど、任意の種類のアタック検出アルゴリズムがモジュール182によって実行されうる。また、図6では、オーバーシュート推定モジュール180(さらに言えばアタック検出器182)への入力54は、バンドパスフィルタ52の出力62に結合されるように示されているが、代わりに、入力54がシステム入力51に結合されてもよい。
例えば、オーバーシュートが実際に存在する場合、コンプレッサに小さい利得を生成させるために、オーバーシュート信号o(n)(モジュール180のオプションのスムージングを伴うまたは伴わない)がコンプレッサ155のサイドチェーンに印加され、これにより例えば出力信号y(n)の後続の値におけるオーバーシュートを抑圧する。この目標を達成するためのさまざまな方法がある。1つの直接的なアプローチが図6に示されており、そこではオーバーシュート信号o(n)がコンプレッサのサイドチェーン内のレベル信号q(n)(すなわち、この例ではレベル検出器155Aの出力)に加えられる。オーバーシュート信号o(n)は、常に非負であることが好ましいので、オーバーシュートが発生すると、サイドチェーン処理コンポーネントの下流157で現れるレベル信号が大きくなり、これにより、コンプレッサ155には小さなゲインを生成させる。
図9に示す代替のシステム250は、オーバーシュート信号o(n)261(オーバーシュート推定モジュール160からの出力)を使用して、例えば次式のようにコンプレッサ255によって使用されるスレッショルドを引き下げる。
Figure 2020034885
ただし、Tは、元のまたは公称のコンプレッションスレッショルド(例えば、信号のダイナミックレンジを圧縮するために従来使用されているスレッショルド)であり、T(n)は、コンプレッサ255のサイドチェーン256に提供される調整されたスレッショルド262である。o(n)は常に非負であることが好ましいので、上式は、オーバーシュートが発生したときに実際のコンプレッションスレッショルドT(n)が元のコンプレッションスレッショルドよりも低いことを保証する。したがって、コンプレッサ255は(サイドチェーン256において)より小さなゲインを生成し(乗算器257において)それを適用する。
上記のシステムおよび処理はまた、例えば、フレームベースのオーバーシュート推定モジュール300に関して図10に示されるように、フレームベース処理に適合させることができる。Nをフレーム内のサンプル数とすると、サンプルインデックスnは次式で表される。
Figure 2020034885
ただし、kはフレームインデックス、mはフレーム内のサンプルインデックスである。フレームベースの処理においては、最小遅延(例えば、遅延要素301によって実行される遅延)は、好ましくは1フレーム、すなわちNサンプルである。より大きな遅延が使用されてもよいが、1フレーム遅延が好適である。レベル検出器172と同様に、レベル検出器302は好ましくはその入力信号のレベルまたはパワも推定する。実際、例えばフレーム境界とは無関係に機能するレベル検出器302によって実行される動作を用いて、レベル検出器172に適用されるのと同じ考察が一般的にはレベル検出器302に適用される。
好ましくは、各フレームkについて、フレームノルムモジュール303は、フレーム内の全ての値(例えば、そのフレーム内のレベル検出器302の全ての出力)に基づいて、そのフレームを表す単一のノルム値を計算する。フレームノルムモジュール303によって、ユークリッドノルム(Lノルム)、Lノルム、メジアンノルム、最大値ノルムなど、様々な種類のノルムのいずれかが生成されうる。例えば最大値ノルムを使うと、次式がk番目のフレーム全体の全てのサンプルを表すために使用されうる。
Figure 2020034885
すなわち、オーバーシュート推定モジュール300は、単一の値を用いてフレーム内全てのy(n)サンプルのレベルを表すことが好ましい。
例えば次式により、(例えば、ランプモジュール306において)所与のフレームについて単一のオーバーシュート値が計算されうる。
Figure 2020034885
サンプル値ではなくフレーム値を操作すること以外は、ランプモジュール176および加算器178に関連して上述したものと同じ説明および考察が、それぞれランプモジュール306および加算器308にも当てはまる。この実施形態では、(スムージングモジュール310において)オプションのスムージングが行われると仮定すると、好ましくはスムージング演算がV値にわたって行われて、k番目のフレーム全体における全てのサンプルを表すスムージングされたオーバーシュート信号Oが生成される。その他の点については、スムージングモジュール180に関連して上述したものと同じ説明および考察がスムージングモジュール310にも当てはまる。
オプションで、各フレームにアタックがあるかどうかを判断するために、アタック検出モジュール312においてフレームベースのアタック検出が使用される。その他の点については、アタック検出モジュール182に関連して上述したものと同じ説明および考察がアタック検出モジュール312にも当てはまる。アタックが検出された場合には、スムージングフィルタ310は、(例えば、図8に示されるように、その出力および遅延ラインをゼロに設定することによって)リセットモードにされることが好ましい。
オプションでスムージングされたオーバーシュート信号Oはフレーム全体における全てのサンプルに対するものであるので、デュプリケータ314は、例えば次式に従い、フレーム内の全てのサンプルについてこの値を複製することが好ましい。
Figure 2020034885
これは次に、(例えば、コンプレッサのサイドチェーンにおいて)使用されて、図6および図9に示されかつ上で議論された構造/手法のいずれかのような、様々な異なる方法のいずれかでオーバーシュートが抑圧されうる。
上述の遅延オーバーシュートフィードバック手法は、全ての(または少なくとも複数の)周波数帯域が圧縮されるシステムに再帰的に適用されうる。一例はシステム350であり、これは図11に示されている。
上述のシステム100および250は、入力信号の全周波数スペクトルをすべて包含する2つの帯域を含み、一方は圧縮され他方は圧縮されないものであった。本実施形態では、2つ以上の周波数帯域が入力信号の全周波数スペクトルを包含し、それぞれ(または少なくともそのような帯域のサブセットのそれぞれ)でダイナミックレンジ圧縮が行われ、その隣接帯域からのフィードバックを使用して現在の周波数帯域のためにコンプレッサにフィードバックされるオーバーシュート信号を生成する。
システム350(図11に示す)は、入力信号352の周波数スペクトルが4つの対応する4つのフィルタ360〜363によって入力信号352の全周波数スペクトルをすべて包含する4つの帯域に分割される実施形態に対するこの概念を例示する。それらの帯域のそれぞれは、その処理ブランチにおいて(以下により詳細に説明するように、その隣接する処理ブランチからの入力を用いて)圧縮される。図11において、フィルタ360〜363のうち隣接するフィルタは、それらの間にある程度のオーバーラップ(例えば、図2に示されるようにオーバーラップ領域24AおよびB)を伴って、互いに隣接する周波数帯域を出力する。
フィルタ360によって出力された周波数帯域(フィルタが順序付けられている方法に応じて、最低周波数帯域または最高周波数帯域でありうる)を処理する場合、フィルタ361によって出力された帯域のみが隣接する。したがって、オーバーシュート推定モジュール390に入力される信号を生成するために、フィルタ361によって出力された信号(本実施形態では非圧縮)のみが(加算器370において)フィルタ360によって出力された信号と合成される。
フィルタ361によって出力された周波数帯域(これはフィルタ360とフィルタ362によって出力された帯域の間の周波数帯域である)を処理する場合、本実施形態では、フィルタ362によって出力された隣接帯域(非圧縮)のみが、フィルタ361によって出力された信号(コンプレッサ381における圧縮後に)と(加算器371において)合成されて、オーバーシュート推定モジュール391に入力される信号が生成される。
フィルタ363によって出力された周波数帯域(この例では最終周波数帯域)を処理する場合は、コンプレッサ383の出力と合成される、(前のブランチで行われたもののような)「次の」周波数帯域はない。したがって、本実施形態では、システム全体の出力はオーバーシュート推定モジュール393の入力に結合され、オーバーシュート推定モジュール393は、オーバーシュート推定信号を生成してコンプレッサ383に差し戻す。関連する実施形態では、オーバーシュート推定モジュール393は完全に省略され、オーバーシュート推定信号はコンプレッサ383に提供されない。
なお、オーバーシュート推定モジュール390〜393のそれぞれは、例えば、図7のオーバーシュート推定モジュール160または図10のオーバーシュート推定モジュール300として実現されうる。また、図解を簡単にするために、各ブランチに関して、対応する帯域のオーバーシュート推定モジュール390〜393への信号x(n)の提供、すなわち好ましい実施形態におけるオーバーシュート推定モジュール390〜393のアタック検出モジュールへの入力は、図11から省略されている。
本構造/手法の1つの特徴は、(最終帯域以外の)各帯域について、次の帯域の非圧縮出力が現在の帯域の圧縮出力に戻って加算されてオーバーシュートモジュール390〜392への入力が生成されることである。一例としてフィルタ361による帯域出力を処理するブランチを考えると、フィルタ362の非圧縮出力がフィルタ361の圧縮出力に戻って加算されてオーバーシュート推定モジュール391への入力が生成される。(フィルタ363によって出力された)最後の帯域については、後続の帯域がないので、対応するブランチにオーバーシュート推定モジュールは提供されていない。その結果、上述のように、そのブランチに対しては異なる手法が使用されるか、または、その最終帯域に対してはオーバーシュート抑圧が完全に省略される。
前述の実施形態について、いくつか説明がなされうる。第1に、各周波数帯域(最後の周波数帯域を除く)の処理は、1つだけの隣接帯域、より具体的には本実施形態における次の帯域(最終帯域には存在しない)を考慮に入れる。そのような構造/手法によって良い結果が得られる。しかし、(1)その他の隣接帯域(本例における前の帯域)があるとしてもその結果として発生しうるいかなるオーバーシュートにも対処しない。(2)バンドパスフィルタ360〜363のロールオフは、一般に、そのような他の隣接帯域にまで及ぶ可能性があり、これは、この実施形態におけるオーバーシュート抑圧がわかりにくくなる可能性があることを意味する。
そこで、この問題を軽減することができるシステム400を図12に示す。(図11に示した)システム350との主な違いは、システム400では、(システム400のオーバーシュート推定モジュール390〜393のうちの対応する1つの)オーバーシュート信号を計算する際に(後続の帯域からの非圧縮信号と共に)前の帯域からの圧縮信号の合計も使用されることである。この、前の帯域からの圧縮信号の合計は、前の帯域からの、バンドパスフィルタの遅いロールオフ効果および不完全に抑圧されたオーバーシュートの多くを伝えるので、対応するオーバーシュート推定モジュール391〜393の入力にそれを加えることは、それらの影響を抑制するのに役立つ。システム400によって処理される最終帯域(すなわち、フィルタ363による帯域出力)については、「次の帯域」がないため、(加算器373によって生成された)トータルの出力が、対応するオーバーシュート推定モジュール393に提供される。上述のように、対処されるべきオーバーシュートの大部分は、処理されている現在の帯域とそれに直接隣接する帯域との間のオーバーラップから生じる。
システム400では、複数の周波数帯域はやや逐次的に(そしてやや並行して)処理されるので、例えば、コンプレッサ380および381の出力は、オーバーシュート推定モジュール392に提供され得る(そして実際には提供される)が、コンプレッサ383の出力はそうではなく、その代わりにフィルタ363の非圧縮出力がオーバーシュート推定モジュール392に供給される。より一般的には、システム400では、現在の周波数帯域を処理する場合、前に処理された帯域があれば、それが、圧縮された形式で現在の帯域のオーバーシュート推定モジュールに提供され、後続の処理帯域がある場合には、それが、非圧縮の形式で現在の帯域のオーバーシュート推定モジュールに提供される。他のタイミング制約を受ける可能性がある代替の実施形態においては、所望の圧縮信号が利用可能であることを確実にするために、適切な遅延要素を使用して、そのような帯域のいずれかまたは全てを圧縮の形式でまたは非圧縮の形式で提供することができる。ただし、理論的に可能であっても、多くの場合、得られる可能性のある追加的な性能上の利点は、導入される追加的な遅延を正当化するものではない。
図12に示すように、加算器のカスケードシーケンスを介して現在の周波数帯域を処理するために(例えば、加算器370,371,372を介してオーバーシュート推定モジュール392への入力が生成される)、前に処理された周波数帯域の圧縮されたバージョンがオーバーシュート推定モジュール(モジュール390〜393のうちの対応する1つ)に提供される。なお、本実施形態では、加算器371および372は、複合加算器として構成されており、それぞれ3入力2出力(すなわち最終出力および中間出力)をまとめて供給する2入力加算器を有する。
また、他の実施形態においては、以前に処理された全ての帯域を現在のオーバーシュート推定モジュール(すなわち、モジュール390〜393のうちの1つ)に入力するのではなく、直前の帯域だけが入力される。例えば、この代替の実施形態におけるフィルタ362によって出力された周波数帯域を処理する場合、(フィルタ361および363によって出力された)2つの隣接帯域のみがオーバーシュート推定モジュール392に入力される。
最後に、(例えば、図11、図12、および対応するシステム350の可能な変形例400を参照して)4バンドオーディオ信号ダイナミックレンジ圧縮システム350を用いて本発明を例示したが、任意の数の帯域の処理に、同一のまたは類似の処理および構造を適用することができる。
システム環境
一般的に言えば、ここに記載されたシステム、方法、モジュール、コンポーネント、機能および技術のすべては、1つまたは複数のプログラマブル汎用コンピューティングデバイスを使用して実施することができる。このようなデバイス(例えば、本明細書で言及される電子デバイスのいずれかを含む)は、例えば、共通バスを介して、例えば、互いに結合された以下のコンポーネントの少なくともいくつかを含む。(1)1つ以上の中央処理装置(CPU)、(2)読み出し専用メモリ(ROM)、(3)ランダムアクセスメモリ(RAM)、(4)その他の統合または装着された記憶装置、(5)(例えば、シリアルポート、パラレルポート、USB接続またはFireWire接続などの有線接続を使用するか、または、RFID(radio-frequency identification)、任意の他の近距離通信(NFC)プロトコル、ブルートゥース(登録商標)、または802.11プロトコルなどの無線プロトコルを使用して)他のデバイスとのインタフェースとなる入力/出力ソフトウェアおよび回路、(6)イーサネット(登録商標)カードなどの有線接続を用いて、または、コード分割多重アクセス(CDMA)、GSM(登録商標)、ブルートゥース、802.11プロトコル、その他セルラーベースもしくは非セルラーベースのシステムを用いて、本発明の多くの実施形態において、インターネットまたは他のネットワークに接続する、1つまたは複数のネットワークに接続するためのソフトウェアおよび回路、(7)ディスプレイ(例えば、CRTディスプレイ、液晶ディスプレイ、有機発光ディスプレイ、ポリマー発光ディスプレイまたは他の薄膜ディスプレイ)、(8)他の出力装置(1つまたは複数のスピーカー、ヘッドホンセット、レーザーまたは他の光プロジェクターおよび/またはプリンターなど)、(9)1つ以上の入力装置(マウス、1つ以上の物理的スイッチまたは可変コントロール、タッチパッド、タブレット、タッチセンシティブディスプレイまたは他のポインティングデバイス、キーボード、キーパッド、マイクロホンおよび/またはカメラまたはスキャナ)、(10)大容量記憶装置(ハードディスクドライブまたはソリッドステートドライブなど)、(11)実時間クロック、(12)フラッシュメモリ、半導体メモリ、磁気ディスク、磁気テープ、光磁気ディスク、光ディスクなどを利用する他の任意の携帯型ドライブなどのリムーバブルストレージ読み取り/書き込みデバイス、および/または、(13)(例えば、ファクシミリを送信するため、または、インターネットその他のコンピュータネットワークに接続するための)モデム。動作中、このような汎用コンピュータによって実行される程度まで、上記の方法および機能性を実現するための処理ステップは、通常、最初に大容量記憶装置(例えば、ハードディスクまたはソリッドステートドライブ)に格納され、RAMにロードされ、RAMからCPUによって実行される。ただし、処理ステップが最初からRAMまたはROMに記憶されている、および/または、大容量記憶装置から直接実行される態様もありうる。
本発明を実施するために、使用に適した汎用プログラマブルデバイスは、様々なベンダーから入手することができる。様々な実施形態では、タスクのサイズおよび演算量に応じて異なるタイプのデバイスが使用される。このようなデバイスは、例えば、メインフレームコンピュータ、マルチプロセッサコンピュータ、1つ以上のサーバボックス、ワークステーション、パーソナル(例えばデスクトップ、ラップトップ、タブレットまたはスレート)コンピュータ、および/または、パーソナルデジタルアシスタント(PDA)、無線電話(例えばスマートホン)、その他のプログラマブル装置またはプログラマブルデバイスのような小さなコンピュータであってもよく、これらは、スタンドアローンであってもよいし、ネットワークに有線で接続されていてもよいし、ネットワークに無線で接続されていてもよい。
さらに、汎用プログラマブルデバイスが上記で説明されたが、代替の実施形態では、1つまたは複数の専用プロセッサまたはコンピュータが代わりに(または加えて)使用される。一般に、特に明記されている場合を除いて、上述した機能のいずれかは、ソフトウェアおよび/またはファームウェアを実行する汎用プロセッサ、専用(例えば、論理ベース)ハードウェア、または任意のこれらのアプローチの組み合わせであり、特定の実装は既知のエンジニアリング上のトレードオフに基づいて選択される。より具体的には、上記の任意の処理および/または機能性が、固定された、所定のおよび/または論理的な態様で実施される場合、プログラミング(例えば、ソフトウェアまたはファームウェア)を実行するプロセッサ、論理コンポーネント(ハードウェア)の適切な配置、またはこれら2つの任意の組み合わせによって実現されうることを、当業者は容易に理解するであろう。言い換えれば、論理演算および/または算術演算を、プロセッサ内でそのような演算を実行するための命令および/またはそのような演算を実行するための論理ゲート構成に変換する方法はよく理解されている。コンパイラは通常、両方の種類の変換に使用される。
本発明はまた、方法および機能を実行するための、および/または、本発明のモジュールおよび構成要素を実現するための、ソフトウェアまたはファームウェアプログラム命令(すなわち、コンピュータ実行可能なプロセス命令)が記憶された機械読み取り可能な有形(または非一時的)媒体にも関連することを理解すべきである。そのような媒体には、例として、磁気ディスク、磁気テープ、CDおよびDVDなどの光学的に読み取り可能な媒体、または様々なタイプのメモリカード、USBフラッシュメモリデバイス、ソリッドステートドライブなどの半導体メモリが含まれる。いずれの場合も、媒体は、小型ディスクドライブまたは小型ディスク、ディスケット、カセット、カートリッジ、カード、スティックなどの可搬型アイテムの形態をとってもよく、または、ハードディスクドライブ、コンピュータまたは他の装置に設けられたROMまたはRAMなどの、比較的大きなまたはより移動性のないアイテムとして実現することができる。本明細書中で使用される場合、特に明記しない限り、コンピュータ読み取り可能な媒体または機械読み取り可能な媒体上に格納されたコンピュータで実行可能な処理ステップへの言及は、そのような処理ステップが単一媒体上に記憶される状況だけでなく複数の媒体に別れて記憶されている状況にも適用できることを意図している。
前述の説明は、主に電子コンピュータおよび電子装置を強調している。しかし、基本的な論理および/または算術演算を実行することができる電子的、光学的、生物学的および化学的処理の任意の組み合わせを利用するデバイスのような、他の任意のコンピューティングまたは他のタイプのデバイスを代わりに使用できることを理解されたい。
さらに、本開示が、プロセッサ、コンピュータ、サーバ、サーバ装置、コンピュータ読み取り可能な媒体または他の記憶装置、クライアント装置、または任意の他の種類の装置または装置を指す場合、そのような参照は、コンピュータ装置、サーバ、サーバ装置、コンピュータ読み取り可能な媒体または他の記憶装置、クライアント装置、または任意の他のそのような装置または装置を含むが、これらに限定されない。例えば、サーバは、一般に、適切な負荷分散を用いて、単一デバイスまたはサーバデバイスのクラスタ(ローカルまたは地理的に分散された)を使用して実装することができる(および、しばしば実施する)。同様に、サーバ装置およびクライアント装置は、例えば、そのような装置のそれぞれが、そのような処理ステップの一部およびそれ自身のプロセッサを格納する独自の記憶装置を有し、完全な方法の処理ステップを実行する際に協働し、これらの処理ステップを実行する。
その他の検討事項
本明細書で使用される場合、用語「結合された(coupled)」または任意の他の形態の単語は、例えば前処理の目的で、直接に接続、または、1つまたは複数の他の要素または処理ブロックを介して接続されることを意味することを意図している。個々のステップ、モジュールまたは処理ブロックが互いに直接接続されているように示され、かつ/または説明されている図面および/またはそれらの説明において、そのような接続は、追加のステップ、モジュール、要素および/または処理ブロックを含むことができる。本明細書中の信号への言及は、本明細書中の信号の処理されたバージョンまたは未処理のバージョンを意味する。すなわち、本明細書で議論および/または特許請求の範囲に記載される特定の処理ステップは、排他的であることを意図するものではなく、むしろ、本明細書で明示的に議論され又は特許請求の範囲に記載される任意の2つの処理ステップ間で中間の処理が実行されてもよい。
本明細書において特定の値が言及される場合、そのような参照は、その値またはその値とは実質的に異ならない値を含むことを意味するものである。すなわち、その特定された状況において実質的な影響を及ぼさない偏差を許容することを意味する。例えば、連続可変信号レベルがゼロ(0)に設定されると述べた場合、それは、正確な0の値のみならず、0の値と実質的に同じ効果を生み出す小さい値をも含みうるものである。
前述の説明では、用語「オペレータ(operators)」、「オペレーション(operations)」、「ファンクション(functions)」および類似の用語は、特定の実現例/実施形態に応じた、処理ステップまたはハードウェアコンポーネントを指す。
一方で、本明細書に明示的に記載された開示と他方では参照により本明細書に組み込まれる資料との間に矛盾または矛盾が生じた場合には、本開示が優先される。本書に引用されている出願または特許の開示間に矛盾または矛盾が生じた場合は、直近で追加または変更された開示が優先されるものとする。
明確に指示されていない限り、上記の議論において、「最適」、「最適化」、「最大化」、「最小化」、「最善」、ならびに同様の単語および比較を示す他の単語および接尾辞などの単語は、それらの絶対的な意味では使用されていない。むしろ、そのような用語は、通常、ユーザ指定の制約および目的、ならびにコストおよび処理または製造上の制約など、他の潜在的な制約を考慮して理解されるべきものである。
上記の説明では、特定の方法は、特定の順序で列挙されたステップに分解して説明した。同様に、ある順序で並べられたモジュールを表示して記述することによって、ある処理が行われた。しかし、そのようなそれぞれの場合において、逆のことが明確に示されているか、又は実際の考慮事項(例えば、あるステップの結果が別のステップを実行するために必要である場合など)によって義務づけられている場合を除いて、説明したステップおよび/またはモジュールを並べ替えおよび/または2つ以上のそのようなステップ(またはそのようなモジュールの2つ以上の中の処理)を並行して実行できることを理解されたい。
ここでは、処理ステップ、他の動作、処理ステップまたは動作の主題をトリガし、制限し、フィルタリングし、または他の方法で影響を及ぼすことを意図した「基準(creterion)」、「複数の基準(multiple creteria)」、「条件(condition, conditions)」については、単数形または複数形が使用されているかどうかにかかわらず、「1つ以上」を意味するものとする。例えば、任意の基準または条件は、動作、イベントおよび/または発生(すなわち、複数部分の基準または条件)の任意の組み合わせ(例えば、ブールの組み合わせ)を含むことができる。
同様に、上記の説明では、機能は、特定のモジュールまたはコンポーネントに起因することがある。しかし、機能は、一般に、任意の異なるモジュールまたはコンポーネントの間で所望のように再分配されてもよく、特定のコンポーネントまたはモジュールの必要性が全くない、および/または、新たなコンポーネントまたはモジュールの追加が必要な場合もありうる。機能性の正確な配分は、好ましくは、当業者に理解されるように、本発明の特定の実施形態を参照して、公知の工学的なトレードオフに従って行われる。
上記の議論において、「含む(include, includes, including)」および他のすべての形態の単語は限定として理解されるべきではなく、そのような単語に続く特定の事項は単なる例示であると理解されるべきである。
本発明のいくつかの異なる実施形態は、上記および/または本明細書に引用により組み込まれる任意の文献に記載されており、そのような各実施形態は特定の特徴を含むものとして記載される。しかし、任意の単一の実施形態の説明に関連して説明された特徴は、その実施形態に限定されず、他の実施形態のいずれかにおいて様々な組み合わせで含まれ、および/または、配置されてもよいことが意図されていることは、当業者には明らかである。
したがって、本発明は、その例示的な実施形態および添付の図面に関して詳細に説明されているが、当業者には、本発明の様々な適応化や変更が、本発明の意図および範囲から逸脱することなく達成され得ることは明らかである。したがって、本発明は、図面に示されかつ上に記載された厳密な実施形態に限定されるものない。むしろ、本発明の意図から逸脱しないあらゆる変形が添付の特許請求の範囲によってのみ限定された範囲内に含まれるとみなされるべきである。

Claims (20)

  1. (a)入力信号を受信するための入力ラインと、
    (b)前記入力ラインに結合され、前記入力信号を第1周波数帯域と第2周波数帯域とを含む周波数帯域のセットに分割するフィルタセットと、
    (c)前記第1周波数帯域を受信する第1入力と、第2入力と、出力とを有するコンプレッサと、
    (d)前記コンプレッサの前記出力に結合された第1入力と、前記第2周波数帯域に結合された第2入力と、出力とを有する加算器と、
    (e)前記加算器の前記出力に結合された入力と、前記コンプレッサの前記第2入力に結合された出力とを有するオーバーシュート推定モジュールと、を有し、
    前記オーバーシュート推定モジュールの前記出力は、前記オーバーシュート推定モジュールの前記入力における信号と所定スレッショルドとの比較の結果を示すオーバーシュート信号を提供する
    ことを特徴とするオーディオ信号ダイナミックレンジ圧縮システム。
  2. 前記オーバーシュート推定モジュールは、前記コンプレッサによって前記コンプレッサの前記第1入力に適用される後続のサンプルに適用されるゲインを修正するために前記コンプレッサの前記出力で提供された前記信号の現在のサンプルのオーバーシュートの量が使用されるように遅延を導入する、ことを特徴とする請求項1に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  3. 前記オーバーシュート推定モジュールは、レベル検出器を含み、前記レベル検出器は、(a)前記オーバーシュート推定モジュールの前記入力に結合された入力と、(b)前記レベル検出器の前記入力における複数のサンプルにわたってスムージングされた信号レベルを提供する出力と、を有し、前記スムージングされた信号レベルは、前記オーバーシュート信号を生成するために使用される、ことを特徴とする請求項1または2に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  4. 前記オーバーシュート推定モジュールは、オーバーシュート信号発生器を含み、前記オーバーシュート信号発生器は、(a)前記オーバーシュート推定モジュールの前記入力に結合された入力と、(b)前記オーバーシュート信号発生器の前記入力で受信された信号と前記所定スレッショルドとの差の関数であるオーバーシュート信号を提供する出力と、を有することを特徴とする請求項1乃至3のいずれか1項に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  5. 前記オーバーシュート推定モジュールは、オーバーシュート信号発生器を含み、前記オーバーシュート信号発生器は、(a)前記オーバーシュート推定モジュールの前記入力に結合された入力と、(b)前記オーバーシュート信号発生器の前記入力で受信された信号と前記所定スレッショルドとの比較の関数であるオーバーシュート信号を提供する出力と、を有することを特徴とする請求項1乃至4のいずれか1項に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  6. 前記オーバーシュート推定モジュールは、スムージングモジュールを更に含み、前記スムージングモジュールは、(a)前記オーバーシュート信号発生器の前記出力に結合された入力と、(b)前記オーバーシュート推定モジュールの前記出力に結合され、前記スムージングモジュールの前記入力で受信された信号のローパスフィルタリングされたバージョンを提供する出力と、を有することを特徴とする請求項5に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  7. 前記オーバーシュート推定モジュールは、(a)前記第1周波数帯域を受信する第2入力と、(b)アタック検出モジュールと、を更に含み、前記アタック検出モジュールは、前記オーバーシュート推定モジュールの前記第2入力に結合された入力と、前記第1周波数帯域においてアタックが発生しているか否かを示す信号を提供する出力とを有することを特徴とする請求項6に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  8. 前記スムージングモジュールは、(a)前記アタック検出モジュールの前記出力に結合された第2入力を更に有し、(b)前記スムージングモジュールの前記第2入力が前記第1周波数帯域においてアタックが発生していることを示す信号を受信した場合に前記スムージングモジュールによって行われるスムージング演算をリセットする、ことを特徴とする請求項7に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  9. 前記第1周波数帯域においてアタックが発生していることを示す前記信号に応答して、前記スムージングモジュールの前記出力および前記スムージングモジュールにおける全ての遅延要素をゼロに設定することにより、前記スムージングモジュールによる前記スムージング演算がリセットされることを特徴とする請求項8に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  10. 前記コンプレッサは、(a)前記コンプレッサの前記第1入力における信号にゲインが適用されるメイン信号経路と、(b)前記ゲインが決定される、前記メイン信号経路と並列なサイドチェーン経路とを含み、前記オーバーシュート信号は、前記第1周波数帯域の現在の強度を示す前記サイドチェーン経路における信号を修正するために使用される、ことを特徴とする請求項1乃至9のいずれか1項に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  11. 前記コンプレッサは、(a)前記コンプレッサの前記第1入力における信号にゲインが適用されるメイン信号経路と、(b)前記ゲインが決定される、前記メイン信号経路と並列なサイドチェーン経路とを含み、前記オーバーシュート信号は、前記サイドチェーン経路によって使用されるコンプレッションスレッショルドを修正するために使用される、ことを特徴とする請求項1乃至9のいずれか1項に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  12. 前記入力信号はフレームベースであり、前記オーバーシュート推定モジュールは、サンプルの各フレームについて前記オーバーシュート推定モジュールの前記出力が当該フレームにおける全てのサンプルで同じになるようなモードで動作する、ことを特徴とする請求項1乃至11のいずれか1項に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  13. (f)前記第2周波数帯域を受信する第1入力と、第2入力と、出力とを有する第2コンプレッサと、
    (g)前記第2コンプレッサの前記出力に結合された第1入力と、前記第1周波数帯域に結合された第2入力と、出力とを有する第2加算器と、
    (h)前記第2加算器の前記出力に結合された入力と、前記第2コンプレッサの前記第2入力に結合された出力とを有する第2オーバーシュート推定モジュールと、を更に有し、
    前記第2オーバーシュート推定モジュールの前記出力は、前記第2オーバーシュート推定モジュールの前記入力における信号と第2所定スレッショルドとの比較の結果を示す第2オーバーシュート信号を提供する、ことを特徴とする請求項1乃至12のいずれか1項に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  14. 前記第1周波数帯域は、前記コンプレッサを介して前記第2加算器の前記第2入力に結合されることを特徴とする請求項13に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  15. 前記周波数帯域のセットは第3周波数帯域を更に含み、前記第2加算器は、前記第3周波数帯域に結合された入力を有することを特徴とする請求項13または14に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  16. 前記第3周波数帯域は、非圧縮の形式で前記第2加算器の前記入力に結合されることを特徴とする請求項15に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  17. (i)前記第3周波数帯域を受信する第1入力と、第2入力と、出力とを有する第3コンプレッサと、
    (j)前記第3コンプレッサの前記出力に結合された第1入力と、前記第2周波数帯域に結合された第2入力と、出力とを有する第3加算器と、
    (k)前記第3加算器の前記出力に結合された入力と、前記第3コンプレッサの前記第2入力に結合された出力とを有する第3オーバーシュート推定モジュールと、を更に有し、
    前記第3オーバーシュート推定モジュールの前記出力は、前記第3オーバーシュート推定モジュールの前記入力における信号と第3所定スレッショルドとの比較の結果を示す第3オーバーシュート信号を提供する、ことを特徴とする請求項15または16に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  18. 前記第2周波数帯域は、前記第2コンプレッサを介して前記第3加算器の前記第2入力に結合されることを特徴とする請求項17に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  19. 前記第1周波数帯域は、前記コンプレッサを介して前記第3加算器の入力に結合されることを特徴とする請求項18に記載のオーディオ信号ダイナミックレンジ圧縮システム。
  20. 前記周波数帯域のセットは第4周波数帯域を更に含み、前記第3加算器は、前記第4周波数帯域に結合された入力を有することを特徴とする請求項17乃至19のいずれか1項に記載のオーディオ信号ダイナミックレンジ圧縮システム。
JP2019002731A 2018-08-29 2019-01-10 オーバーシュート抑圧を用いたマルチバンドオーディオ信号ダイナミックレンジ圧縮 Active JP6779323B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/115,840 US10755722B2 (en) 2018-08-29 2018-08-29 Multiband audio signal dynamic range compression with overshoot suppression
US16/115,840 2018-08-29

Publications (2)

Publication Number Publication Date
JP2020034885A true JP2020034885A (ja) 2020-03-05
JP6779323B2 JP6779323B2 (ja) 2020-11-04

Family

ID=67070710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019002731A Active JP6779323B2 (ja) 2018-08-29 2019-01-10 オーバーシュート抑圧を用いたマルチバンドオーディオ信号ダイナミックレンジ圧縮

Country Status (4)

Country Link
US (1) US10755722B2 (ja)
EP (1) EP3618274B1 (ja)
JP (1) JP6779323B2 (ja)
CN (1) CN110875055B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021000167A1 (de) 2020-03-02 2021-09-02 Ngk Insulators, Ltd. Wabenfilter
KR20210114864A (ko) * 2020-03-10 2021-09-24 누보톤 테크놀로지 코포레이션 라우드 스피커의 주파수 응답 및 동적 범위 교정을 조합한 오디오 처리 장치 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11317203B2 (en) 2020-08-04 2022-04-26 Nuvoton Technology Corporation System for preventing distortion of original input signal

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4460871A (en) * 1979-08-06 1984-07-17 Orban Associates, Inc. Multiband cross-coupled compressor with overshoot protection circuit
JP2009159433A (ja) * 2007-12-27 2009-07-16 Yamaha Corp 音響信号増幅装置
WO2010140358A1 (ja) * 2009-06-02 2010-12-09 パナソニック株式会社 補聴器、補聴システム、歩行検出方法および補聴方法
JP2015177290A (ja) * 2014-03-14 2015-10-05 ヤマハ株式会社 レベル調整方法およびレベル調整装置
US20150381133A1 (en) * 2008-12-17 2015-12-31 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Audio system including multiband audio dynamics processor
JP2016009935A (ja) * 2014-06-23 2016-01-18 ローム株式会社 レベル調節回路、デジタルサウンドプロセッサ、オーディオアンプ集積回路、電子機器、オーディオ信号の自動レベル調節方法
JP2018049287A (ja) * 2013-02-21 2018-03-29 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4249042A (en) * 1979-08-06 1981-02-03 Orban Associates, Inc. Multiband cross-coupled compressor with overshoot protection circuit
US4493091A (en) * 1982-05-05 1985-01-08 Dolby Laboratories Licensing Corporation Analog and digital signal apparatus
US4701722A (en) * 1985-06-17 1987-10-20 Dolby Ray Milton Circuit arrangements for modifying dynamic range using series and parallel circuit techniques
US4922535A (en) * 1986-03-03 1990-05-01 Dolby Ray Milton Transient control aspects of circuit arrangements for altering the dynamic range of audio signals
US4887299A (en) * 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US5185806A (en) * 1989-04-03 1993-02-09 Dolby Ray Milton Audio compressor, expander, and noise reduction circuits for consumer and semi-professional use
US6205225B1 (en) * 1997-12-03 2001-03-20 Orban, Inc. Lower sideband modulation distortion cancellation
CA2354755A1 (en) * 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US7065257B2 (en) * 2001-09-03 2006-06-20 Kabushiki Kaisha Toyota Chuo Kenkyusho Image processing method and apparatus
US7110044B2 (en) * 2003-03-27 2006-09-19 Samsung Electronics Co., Ltd. Image detail enhancement system
EP1869948B1 (en) * 2005-03-29 2016-02-17 GN Resound A/S Hearing aid with adaptive compressor time constants
US7873172B2 (en) * 2005-06-06 2011-01-18 Ntt Docomo, Inc. Modified volterra-wiener-hammerstein (MVWH) method for loudspeaker modeling and equalization
US10069471B2 (en) * 2006-02-07 2018-09-04 Bongiovi Acoustics Llc System and method for digital signal processing
EP2009786B1 (en) * 2007-06-25 2015-02-25 Harman Becker Automotive Systems GmbH Feedback limiter with adaptive control of time constants
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
CN103501165B (zh) * 2010-01-07 2018-01-05 塔特公司 利用eq进行基于压缩器的动态低音增强
JP2011255032A (ja) * 2010-06-10 2011-12-22 Shimadzu Corp 画像処理方法およびそれを用いた放射線撮影装置
US8634578B2 (en) * 2010-06-23 2014-01-21 Stmicroelectronics, Inc. Multiband dynamics compressor with spectral balance compensation
EP2632173B1 (en) * 2012-02-22 2015-06-03 Harman Becker Automotive Systems GmbH Loudspeaker overload protection
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9559650B1 (en) * 2012-07-13 2017-01-31 MUSIC Group IP Ltd. Loudness limiter
JP6351538B2 (ja) * 2014-05-01 2018-07-04 ジーエヌ ヒアリング エー/エスGN Hearing A/S ディジタル音響信号用の多帯域信号プロセッサ
US9749741B1 (en) * 2016-04-15 2017-08-29 Amazon Technologies, Inc. Systems and methods for reducing intermodulation distortion
JP7076824B2 (ja) * 2017-01-04 2022-05-30 ザット コーポレイション 複数のオーディオ強調モードに構成可能なシステム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4460871A (en) * 1979-08-06 1984-07-17 Orban Associates, Inc. Multiband cross-coupled compressor with overshoot protection circuit
JP2009159433A (ja) * 2007-12-27 2009-07-16 Yamaha Corp 音響信号増幅装置
US20150381133A1 (en) * 2008-12-17 2015-12-31 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Audio system including multiband audio dynamics processor
WO2010140358A1 (ja) * 2009-06-02 2010-12-09 パナソニック株式会社 補聴器、補聴システム、歩行検出方法および補聴方法
JP2018049287A (ja) * 2013-02-21 2018-03-29 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
JP2015177290A (ja) * 2014-03-14 2015-10-05 ヤマハ株式会社 レベル調整方法およびレベル調整装置
JP2016009935A (ja) * 2014-06-23 2016-01-18 ローム株式会社 レベル調節回路、デジタルサウンドプロセッサ、オーディオアンプ集積回路、電子機器、オーディオ信号の自動レベル調節方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021000167A1 (de) 2020-03-02 2021-09-02 Ngk Insulators, Ltd. Wabenfilter
KR20210114864A (ko) * 2020-03-10 2021-09-24 누보톤 테크놀로지 코포레이션 라우드 스피커의 주파수 응답 및 동적 범위 교정을 조합한 오디오 처리 장치 및 방법
JP2021145330A (ja) * 2020-03-10 2021-09-24 新唐科技股▲ふん▼有限公司 スピーカー用の周波数応答とダイナミックレンジ補正を結合したオーディオ処理デバイスとその方法
JP7101275B2 (ja) 2020-03-10 2022-07-14 新唐科技股▲ふん▼有限公司 スピーカー用の周波数応答とダイナミックレンジ補正を結合したオーディオ処理デバイスとその方法
KR102491210B1 (ko) 2020-03-10 2023-01-26 누보톤 테크놀로지 코포레이션 라우드 스피커의 주파수 응답 및 동적 범위 교정을 조합한 오디오 처리 장치 및 방법

Also Published As

Publication number Publication date
JP6779323B2 (ja) 2020-11-04
EP3618274A3 (en) 2020-07-22
US10755722B2 (en) 2020-08-25
CN110875055A (zh) 2020-03-10
EP3618274B1 (en) 2023-01-18
US20200075031A1 (en) 2020-03-05
EP3618274A2 (en) 2020-03-04
CN110875055B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN110326308B (zh) 失真感测、防失真、以及失真察觉低音增强
CN107439018B (zh) 扬声器保护
JP6779323B2 (ja) オーバーシュート抑圧を用いたマルチバンドオーディオ信号ダイナミックレンジ圧縮
KR101597375B1 (ko) 오디오 신호의 인지된 음량을 조절하기 위한 시스템
CN110728985B (zh) 音频信号动态范围压缩
KR101855969B1 (ko) 오디오 신호를 압축하는 디지털 압축기
US11888450B2 (en) Power limiter configuration for audio signals
WO2011027215A1 (en) Method and apparatus for processing audio signals
WO2012177572A2 (en) Optimization method for audio playback systems
JPWO2010087147A1 (ja) ハウリング抑圧装置、ハウリング抑圧方法、プログラム、及び集積回路
JP2006526328A (ja) 適応的フィルタリング
JP2017085329A (ja) マルチバンドリミッタ、録音装置及びプログラム
JP6641882B2 (ja) マルチバンドリミッタ、録音装置及びプログラム
KR20210067871A (ko) 클리핑 일그러짐을 방지하거나 액티브 스피커의 최대 사운드 레벨을 높이기 위한 제한기 시스템 및 방법
Lin et al. Design and implementation of 18-band Quasi-ANSI S1. 11 1/3-octave filter bank for digital hearing aids
Rao et al. Audio equalizer with fractional order Butterworth filter
US20140219476A1 (en) System and method of filtering an audio signal prior to conversion to an mu-law format
KR102721794B1 (ko) 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
WO2020197780A1 (en) Audio system with limited array signals
CN117935821A (zh) 由电子设备执行的方法、电子设备以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200925

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201013

R150 Certificate of patent or registration of utility model

Ref document number: 6779323

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250