JP7335282B2 - 圧縮フィードバックに応答するオーディオ増強 - Google Patents

圧縮フィードバックに応答するオーディオ増強 Download PDF

Info

Publication number
JP7335282B2
JP7335282B2 JP2020571502A JP2020571502A JP7335282B2 JP 7335282 B2 JP7335282 B2 JP 7335282B2 JP 2020571502 A JP2020571502 A JP 2020571502A JP 2020571502 A JP2020571502 A JP 2020571502A JP 7335282 B2 JP7335282 B2 JP 7335282B2
Authority
JP
Japan
Prior art keywords
enhancement
audio signal
bass
compression
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020571502A
Other languages
English (en)
Other versions
JP2021528909A (ja
Inventor
アラン ポート,ティモシー
トーマス ローリー,ウィリアム
チー ワイ ン,ウィンストン
ピー. ビー. ホルザプフェル,セバスティアン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2021528909A publication Critical patent/JP2021528909A/ja
Application granted granted Critical
Publication of JP7335282B2 publication Critical patent/JP7335282B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F3/00Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
    • H03F3/20Power amplifiers, e.g. Class B amplifiers, Class C amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/06Volume compression or expansion in amplifiers having semiconductor devices
    • H03G7/08Volume compression or expansion in amplifiers having semiconductor devices incorporating negative feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/09Applications of special connectors, e.g. USB, XLR, in loudspeakers, microphones or headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

[関連出願]
本願は、参照によりここに全体が組み込まれる米国仮特許出願番号第62/688,625号、2018年6月22日出願、の優先権の利益を請求する。
[技術分野]
本発明は、増強オーディオ信号の少なくとも2つの周波数バンドの各々に適用される圧縮量を示すフィードバックに応答して、オーディオ信号に増強(例えば、低音増強)及び圧縮を実行して増強オーディオ信号を生成する方法及びシステムに関する。幾つかの実施形態では、増強は、低音増強オーディオ信号の個々の周波数バンドに適用された圧縮量を示すフィードバックにオツ応して実行される、心理音響低音増強(例えば、調波移調)及び均等化型低音増強のうちの少なくとも1つを含む。
増強オーディオ信号の再生中に知覚される低周波数(低音、bass)コンテンツを増強するためにオーディオ信号を変更する(それにより増強オーディオ信号を生成する)幾つかの知られている方法がある。これらは以下のように分類できる。「均等化型低音増強(equalization-type bass enhancement)」技術。これは、均等化方針により、低周波数コンテンツをブーストすることにより、再生のために利用されるスピーカの現実の(物理的)低音応答を増強する。
「心理音響低音増強(psychoacoustic bass enhancement)」技術。これは、オーディオ信号の低音周波数を物理的に再生できない少なくとも1つのラウドスピーカによる再生中にオーディオ信号の低音コンテンツの知覚レベルを増大するよう設計される心理音響低音方針(例えば、「仮想低音」合成または生成方法)により、再生のために利用されるスピーカ(例えば、小型のラウドスピーカ)の知覚される低音応答を増強する。
均等化方針は、実装がより簡単であり、通常、心理音響方針よりも良好な視聴経験を提供すると考えられている。従って、(オーディオ信号の再生のために利用されるべき)スピーカが現実の/物理的低周波数コンテンツを再生する能力のある場合、心理音響低音増強ではなく、均等化型低音増強が標準的に信号に適用される。幾つかの場合には(例えば、再生のために利用されるべきスピーカが現実の/物理的な低周波数コンテンツを再生する能力がないとき)、均等化型低音増強を置き換える又はそれを補うために、心理音響低音増強が利用される。しかしながら、低音増強の両方の種類がオーディオ信号への適用に利用可能なときでも(例えば、オーディオ信号処理システム全体のうちの低音増強サブシステムにおいて)、結果として生じる低音増強信号(例えば、低音増強サブシステムの出力)の個々の周波数バンドに適用されている圧縮量により制御される方法で、両方の種類の低音増強を適用する(例えば、それらの一方又は他方又は両方を選択的に適用する)ことは、本発明まで知られていなかった。
スピーカの最大動作レベルよりも有意に低い(増強及び再生の行われている入力オーディオ信号の)音量レベルでは、均等化型低音増強方針が標準的に良好に動作する。しかしながら、より高い音量レベルでは、均等化型低音増強により現実の/物理的低周波数コンテンツをブーストすることは、スピーカに、これらの低周波数において歪み(distort)を生じることがある。
マルチバンド圧縮部を用いてスピーカ歪みを防ぐことが知られている(例えば、Dolby Audio APIのAudio Regulator)。これは、個々のバンドのエネルギの再生システムの現実世界の歪み特性に基づき構成され得るバンドエネルギ閾値に従い、オーディオ信号の個々の周波数バンドを減衰させる。マルチバンド圧縮部(ここでは「レギュレータ(regulator)」と呼ばれることがある)は、それが作用するオーディオ信号の任意の周波数バンド内で、信号レベルを制限し又は減衰し得るが、ブーストはしない。
しかしながら、低周波数コンテンツをブーストする均等化型低音増強は、(特に、高音量での再生が意図されるとき、)時には低音増強の完全な取り消し点にまでスピーカ歪みを低減するために(レギュレータにより実施される)マルチバンド圧縮により妨害され得る。レギュレータも(例えば、歪みを防ぐために少なくとも1つのバンドを減衰するだけでなく、同様の量だけ近隣のバンドを減衰しようと試みることにより)音質(timbre)を保存しようと試みるので、このような低音増強及び圧縮の両方の適用は、再生音量全体を低減する意図しない結果さえ有し得る。
低音増強のための心理音響方針(例えば、Dolby Audio APIの「Virtual Bass」処理により実装されるもの)は、(スピーカの再生できない)より低い周波数バンドからのエネルギを、スピーカの再生可能なより高い周波数バンドにおけるエネルギにより補う。標準的に、この種類の低音増強処理は、スピーカが、スピーカの基本的な物理的制限により任意の音量レベルで低周波数コンテンツを再生できないとき、使用される。しかしながら、それは、(本発明の幾つかの実施形態におけるように)可能であるが関連する低周波数コンテンツを再生することスピーカにとって望ましくないときにも使用され得る。
ある従来の種類の心理音響低音増強は、低音合成である。これは、増強信号の再生中に知覚される低音を増強するために、オーディオ信号の低周波数範囲に、成分(components)に追加する技術の分類の総称である。幾つかのこのような技術(時にはサブ低音合成方法と呼ばれる)は、最も低い周波数範囲を拡張し及び向上するために、信号の既存の周波数成分より低い低周波数成分を生成する。この分類の中の他の技術は、「仮想ピッチ(virtual pitch)」アルゴリズムとして知られており、非可聴低音範囲(例えば、信号が小型ラウドスピーカによりレンダリングされるとき聞こえない低音範囲)から可聴調波を生成する。その結果、生成された調波は知覚される低音応答を向上する。仮想ピッチは、標準的に、よく知られている「ミッシングファンダメンタル(missing fundamental)」現象を利用する。ここで、基本周波数及びより低い調波(例えば、各基本周波数の第1調波)それら自体が失われているとき、低ピッチ(1つ以上の低周波数の基本周波数、及び各基本周波数のより低い調波)が、低周波数の基本周波数の上側調波から人間の聴覚システムにより推測できることがある。
幾つかの仮想ピッチ方法は、オーディオ信号の低音周波数を物理的に再生できない1つ以上のラウドスピーカによる信号の再生中にオーディオ信号の低音コンテンツの知覚レベルを増大するよう設計される。このような方法は、標準的に、入力オーディオの中に存在する低音周波数を分析するステップと、増強オーディオの再生(例えば、失われている低周波数を物理的に再生できない小型ラウドスピーカによる再生)中に失われているより低い周波数の知覚を支援する可聴調波を生成することにより(及び増強オーディオを含めることにより)、入力オーディオを増強するステップと、を含む。このような方法は、入力オーディオの再生中に非可聴であると期待される(つまり、期待されるスピーカでの再生中に、低すぎて聞こえない周波数を有する)入力オーディオの周波数成分の調波移調(transposition)を実行して、可聴のより高い周波数成分(つまり、期待されるスピーカでの再生中に、十分に高くて聞こえる周波数を有する)を生成する。例えば、オーディオ信号は、非可聴範囲の周波数成分、及び非可聴範囲より高い可聴範囲の周波数成分を有してよい。非可聴範囲の周波数成分の調波移調は、可聴範囲の一部の中に移調された周波数成分を生成できる。これは、再生中のオーディオ信号の低音コンテンツの知覚レベルを向上できる。このような調波移調は、成分の複数の調波を生成するために、入力オーディオの各関連周波数成分への複数の移調係数の適用を含んでよい。
第1の分類の実施形態では、本発明は、増強オーディオ信号の少なくとも2つの周波数バンドの各々に適用される圧縮量を示すフィードバックに応答して、オーディオ信号に増強を実行して増強オーディオ信号を生成する方法である。この分類の標準的な実施形態では、増強は低音増強であり又は含む。他の実施形態で実行される他の種類の増強の例は、会話増強、アップミキシング、周波数シフト、調波注入又は移調、分数調波注入、仮想化、及び均等化を含む(しかし限定されない)。
第1の分類の幾つかの実施形態は、(増強段又はサブシステムにおいて)オーディオ信号を増強して、増強オーディオ信号を生成するステップと、(例えば、増強段又はサブシステムの出力に接続されたレギュレータにおいて)(再生による歪みを防ぐために)増強オーディオ信号に対してマルチバンド圧縮を実行するステップと、を含み、増強は、増強オーディオ信号の少なくとも2つの周波数バンドの各々に適用された圧縮量を示す圧縮フィードバックに応答して実行される。幾つかのこのような実施形態では、増強は、心理音響低音増強(例えば、調波移調)及び均等化型低音増強のうちの一方又は両方であり又はそれを含み、入力オーディオ信号に応答して低音増強オーディオ信号を生成し、低音増強は、フィードバックにより制御される方法で、低音増強オーディオ信号の少なくとも2つの周波数バンドの各々に適用された圧縮量を示すフィードバックに応答して実行される(例えば、入力オーディオ信号に2種類の低音増強のうちの一方又は他方又は両方を選択的に適用する)。
幾つかの実施形態では、本発明の方法及びシステムは、増強信号を生成するために、均等化型及び心理音響型低音増強の両方(又はそれらのうちの選択された一方)の使用のための動的ハイブリッドアプローチを実施し、その後に、再生時の歪みを防ぐためにマルチバンド圧縮(時にレギュレーションと呼ばれる)を適用する。(例えば、入力信号の低音量レベルにおいて)増強が、周波数バンド(標準的に、低周波数バンド)内の入力オーディオ信号のレベルをブーストし、結果として、増強は、再生時の(又はそれらのバンド内でレギュレータにより制限することにより)歪みを生じないとき、均等化型低音増強(例えば、心理音響低音増強よりも相対的に多くの均等化型低音増強)が、バンド内のレベル(エネルギ)を増大し、低音応答全体を向上するために使用される。(例えば、入力信号の高音量レベルにおいて)増強が、低周波数バンド内の入力信号のレベルをブーストし、その結果、増強が再生時の(又はそれらのバンド内でレギュレータにより制限することにより)歪みを生じるとき、より高いバンドへとレベルを増大して(エネルギを追加して)、歪み/制限の際に任意の低いバンドのエネルギを増大することなく、知覚低音応答全体を向上するために、心理音響低音増強(例えば、均等化型低音増強よりも相対的に多くの心理音響低音増強)が利用される。標準的な実施形態えは、心理音響低音増強よりも均等化型低音増強が好ましいときを決定することは、増強信号の各バンドに適用される圧縮量を示すフィードバックを生成することにより、及びフィードバックが増強信号の生成を制御するために利用されるフィードバックループを実装することにより、ブロック毎に自動化される。
本発明の別の態様は、入力オーディオ信号に対して本発明の方法の任意の実施形態を実行するよう構成されるシステム(例えば、物理的に制限された又はその他の方法で制限された低音再生能力を有する装置、例えばノートブック、タブレット、携帯電話機、又は小型スピーカを備える他の装置)である。
実施形態のある分類では、本発明は、オーディオ再生システム(例えば、ノートブック、タブレット、携帯電話機、又は小型スピーカを備える他の装置、又は限られた(例えば、物理的に制限された)低音再生能力を有する再生システム)であり、増強オーディオを生成し及び増強オーディオを再生するために、(本発明の方法の任意の実施形態に従い)圧縮フィードバックに応答してオーディオにオーディオ増強(例えば、低音増強)を実行するよう構成される。
幾つかの実施形態では、本発明のシステムは、ソフトウェア(若しくはファームウェア)によりプログラムされた及び/又はその他の場合には本発明の方法の実施形態を実行するよう構成された汎用若しくは専用プロセッサであり又はそれを含む。幾つかの実施形態では、本発明のシステムは、入力オーディオデータを受信するよう接続され、本発明の方法の実施形態を実行することにより出力オーディオデータを生成するよう(適切なソフトウェアにより)プログラムされた汎用プロセッサである。幾つかの実施形態では、本発明のシステムは、入力オーディオデータを受信するよう接続され、本発明の方法の実施形態を実行することにより入力オーディオ信号に応答して出力オーディオデータを生成するよう構成された(例えばプログラムされた)デジタル信号プロセッサである。
本発明の態様は、本発明の方法の任意の実施形態を実行するよう構成された(例えば、プログラムされた)システム、及び本発明の方法の任意の実施形態を実施するためのコードを格納したコンピュータ可読媒体(例えば、ディスク)を含む。
本発明の実施形態によるオーディオ増強(例えば、低音増強)を実行するよう構成されるシステムのブロック図である。 図1のシステムの増強サブシステムの実施形態のブロック図である。
<注釈及び用語>
特許請求の範囲を含む本開示を通じて、表現「バンド」及び「周波数バンド」は同義語として交換可能に使用される。
特許請求の範囲を含む本開示を通じて、オーディオ信号の又はそれに対する(例えば、増強オーディオ信号又は他のオーディオ信号を示す周波数ドメインデータに対する、又はマルチチャネルオーディオ信号の1つ以上のチャネルに対する)表現「マルチバンド圧縮」は、任意の周波数バンドの中の信号のレベルを増大しないバンド毎の(少なくとも2つの異なる周波数バンドの中の)限られた圧縮を示す。各バンドの中で、マルチバンド圧縮は、信号のレベルを減少する(又は変えない、又は実質的若しくは有意な量だけ変化しない)。マルチバンド圧縮は、本願明細書で時に「調整、レギュレーション(regulation)」と呼ばれ、及びマルチバンド圧縮を実行する若しくは実行するよう構成される圧縮部は、本願明細書で時に「レギュレータ(regulator)」と呼ばれる。
特許請求の範囲を含む本開示を通じて、音声信号の又はそれに対する(例えば、オーディオ信号を示す周波数ドメインデータ又はマルチチャネルオーディオ信号の1つ以上のチャネルに対する)表現「増強(enhancement)」(又は「オーディオ増強」)は、信号に対して実行される任意の増強動作を示す。例えば、増強は、信号に対してバンド毎に(信号の少なくとも2つの異なる周波数バンドの中で)実行される増強動作であってよい。オーディオ増強の例は、限定ではないが、低音増強(例えば、均等化型低音増強又は心理音響低音増強)、会話増強、アップミキシング、周波数シフト、調波注入又は移調、分数調波注入、仮想化、及び均等化を含む。
特許請求の範囲を含む本開示を通じて、信号又はデータに「対して」動作を実行する(例えば、信号又はデータをフィルタリング、スケーリング、変換、又は利得を適用する)という表現は、信号又はデータに、又は信号又はデータの処理済みのバージョンに(例えば、当該動作の実行の前に予備的なフィルタリング又は後処理の行われた信号のバージョン)、直接動作を実行することを示すために広義に使用される。
特許請求の範囲を含む本開示を通じて、表現「システム」は、装置、システム、又はサブシステムを示すために広義に使用される。例えば、デコーダを実装するサブシステムは、デコーダシステムと呼ばれてよく、このようなサブシステムを含むシステムは(例えば、複数の入力に応答してX個の出力信号を生成するシステムであり、そのうちサブシステムがM個の入力を生成し、他のX-M個の入力は外部ソースから受信される)、デコーダシステムとも呼ばれてよい。
特許請求の範囲を含む本開示を通じて、用語「プロセッサ」は、データ(例えば、オーディオ又はビデオ又は他の画像データ)に対して動作を実行するよう(ソフトウェア又はファームウェアにより)プログラム可能な又はその他の場合構成可能なシステム又は装置を示すために広義に使用される。プロセッサの例は、フィールドプログラマブルゲートアレイ(又は他の構成可能な集積回路又はチップセット)、オーディオ又は他の音声データに対してパイプライン処理を実行するようプログラムされた及び/又はその他の場合に構成されたデジタル信号プロセッサ、プログラム可能な汎用プロセッサ若しくはコンピュータ、及びプログラム可能なマイクロプロセッサチップ又はチップセットを含む。
特許請求の範囲を含む本開示を通じて、用語「接続する」又は「接続される」は、直接又は間接的接続を意味するために使用される。従って、第1装置が第2装置に接続する場合、該接続は、直接接続を通じて、又は他の装置及び接続を介する間接接続を通じてよい。
本発明の多くの実施形態が技術的に可能である。本開示からそれらをどのように実装するかが、当業者に明らかである。本発明のシステム、方法、及び媒体の実施形態は、図1及び2を参照して説明される。
図1は、本発明の実施形態によるオーディオ増強を実行するよう構成されるシステム(9)のブロック図である。図1のシステムでは、増強サブシステム1は、入力オーディオ信号に対してオーディオ増強を実行するよう接続され及び構成され、それにより増強オーディオ信号を生成する。レギュレータ3(時にマルチバンド圧縮サブシステム3と呼ばれる)は、増強サブシステム1に接続され、増強オーディオ信号に対してマルチバンド圧縮を実行するよう構成される。それにより、圧縮された増強オーディオ信号である出力オーディオ信号を生成する。動作中、サブシステム3は、サブシステム3から出力される圧縮された増強されたオーディオ信号の再生時の歪みを防ぐことを意図して方法で、バンド毎に増強オーディオ信号に対して圧縮を適用する(つまり、一連の時間のうちの各時間において、増強オーディオ信号の各周波数バンドのレベルを減少し又は不変のままにする)。サブシステム3は、増強オーディオ信号の少なくとも1つの周波数バンドの各々に(例えば、少なくとも2つの個別周波数バンドの各々に、又は個別周波数バンドの各々又はセット全体に)サブシステム3により適用された圧縮の量(減衰量)を示す圧縮信号を生成するよう更に構成される。圧縮信号は、従って、増強オーディオ信号の少なくとも1つの周波数バンド(又は少なくとも2つの周波数バンドの各々)にレギュレータサブシステム3により適用される圧縮の量を示すフィードバック信号である。
増強サブシステム1は、増強されたオーディオ信号の少なくとも1つの周波数バンド(又は少なくとも2つの個別周波数バンドの各々)に適用された圧縮信号(圧縮の量を示すフィードバック信号)に応答して、オーディオ増強を実行するよう構成される。
図1のシステムは、レンダリングサブシステム5(レギュレータ3に接続される)と、スピーカ7(レンダリングサブシステム5に接続される)と、を更に有する。動作中、レギュレータ3から出力される圧縮された増強オーディオ信号は、レンダリングサブシステム5に提供され、サブシステム5は(スピーカ7と共に)、圧縮された増強オーディオ信号のオーディオコンテンツの再生を実行する。サブシステム5は、圧縮された増強オーディオ信号に応答して、スピーカフィード(speaker feed)を生成するよう構成される。スピーカフィードは、スピーカ7に供給され、スピーカ7は、スピーカフィードに応答して音声を発するよう構成される。標準的に、レギュレータ3により実行される圧縮波、音声が歪むのを防ぐ。
従って、サブシステム5は、コンテンツを圧縮された増強オーディオ信号のスピーカフィードに変換することにより、(圧縮された増強オーディオ信号により示される)オーディオコンテンツをレンダリングするよう構成される。サブシステム5は(スピーカ7と共に)、コンテンツをスピーカフィードに変換し及びスピーカフィードを音声に変換することにより、このようなオーディオコンテンツをレンダリングするよう構成される。
図1のシステム9は、本発明の増強方法の実施形態を実行するようプログラムされた(又はその他の場合に構成された)プロセッサであってよく、その中で、図1の要素1及び3(及び任意的に要素5及び7も)は、プロセッサのサブシステム(例えば、ステージ)として実装される。別の例では、図1のシステム9は、本発明の増強方法の実施形態を実行するよう構成された再生装置であり、その中で、図1の要素1、3、5及び7は、再生装置のサブシステム(例えば、ステージ)として実装される。
幾つかの実施形態では、本発明のシステム(例えば、図1の増強サブシステム1)は、心理音響低音増強(例えば、調波移調)及び均等化型低音増強のうちの一方又は両方を実行し、入力オーディオ信号に応答して低音増強オーディオ信号を生成するよう構成される。低音増強は、フィードバックにより制御される方法で、低音増強オーディオ信号の少なくとも2つの周波数バンドの各々にレギュレータ(例えば、レギュレータ3)により適用された圧縮量を示すフィードバックに応答して実行される(例えば、入力オーディオ信号に2種類の低音増強のうちの一方又は他方又は両方を選択的に適用する)。図2は、図1のシステムの増強サブシステムのこのような実施形態の一例のブロック図である。
図2で、変換要素6は、入力オーディオ信号に対して時間ドメイン-周波数ドメイン変換(例えば、FFT)を実行して、入力オーディオ信号のオーディオコンテンツを示すバンド(banded)入力オーディオを生成する。その結果、バンド入力オーディオは、周波数バンドのセットのうちの異なる周波数バンド毎に周波数成分のシーケンスを含む。従って、図2の実施形態では(本発明の幾つかの他の実施形態におけるように)、増強されるべき入力データは、入力オーディオ信号のオーディオコンテンツを示すバンド周波数ドメインオーディオデータである。心理音響低音増強(Psychoacoustic bass enhancement、“PBE”)サブシステム8は、(標準的に、最低周波数バンド以外の周波数バンドの中のコンテンツをブーストする(コンテンツのレベルを増大する)ことを含み)バンド入力オーディオに対して心理音響低音増強を実行するよう接続され構成される。均等化型低音増強サブシステム(「イコライザ(equalizer)」)10は、バンド入力オーディオに対して均等化型低音増強を実行するよう(標準的に、低周波数バンドの中のコンテンツをブーストするよう)接続され構成される。結合サブシステム12は、サブシステム8及び10の各々のオーディオ出力と、図1のレギュレータ3により生成された圧縮フィードバック信号(「圧縮フィードバック」)を受信するよう接続され、それに応答して、バンド増強オーディオを生成するよう構成される。バンド増強オーディオは、増強サブシステム1の図2の実施形態の出力であり、図1のレギュレータ3に供給される。圧縮フィードバックは、バンド増強オーディオの少なくとも2つの周波数バンドにレギュレータ3により適用される圧縮の量を示す。標準的に、(結合サブシステム12から出力される)バンド増強オーディオの周波数バンドは、レギュレータ3が圧縮を適用するものと同じである(並びに、変換サブシステム6から出力されるバンドオーディオのものと同じである)。圧縮フィードバックは、これらのバンドの各々に対してレギュレータ3により適用される圧縮の量を示す。
結合サブシステム12は、サブシステム8及び10の出力を時分割多重又は結合して、(任意の時間に)該時間にサブシステム8及び10のうちの一方又は他方の出力がある、又は該時間にサブシステム8及び10から出力される周波数成分の結合(例えば、線形結合)がある、ようバンド増強オーディオを生成するよう構成される。
結合サブシステム12は、標準的に、バンド増強オーディオを、バンド増強オーディオ値のシーケンスとして生成するよう構成される。各時間(又は時間間隔)に対応する該バンド増強オーディオ値は、多数の異なる周波数バンドの各々の値で構成され、その結果、1つの時間(又は時間間隔)及び1つのバンドの各々は、(例えば、対応する時間又は間隔の間に圧縮フィードバックの幾つかの値に応答して)該時間(又は時間間隔)のサブシステム8及び10から出力された周波数成分とバンドとの、又は(例えば、対応する時間又は間隔の間に圧縮フィードバックの幾つかの他の値に応答して)該時間(又は時間間隔)のサブシステム8及び10の一方又は他方から出力された周波数成分とバンドとの結合(例えば、線形結合)である。
例えば、圧縮フィードバックが、レギュレータ3は任意のバンドにおいて圧縮を適用していないと示すとき、各バンドの(対応する時間又は時間間隔における)サブシステム12の出力は、サブシステム10から出力された周波数成分であってよい。(後の時間又は時間間隔に対応する)圧縮フィードバックが、レギュレータ3は(歪みを防ぐために)各バンドにおいて圧縮を適用していると示すとき、各バンドの(対応する時間又は間隔における)サブシステム12の出力は、サブシステム8から出力された周波数成分であってよい。
別の例では、圧縮フィードバックが、レギュレータ3はバンドにおいて圧縮を適用していない(又は小さな減衰量しか適用していない)と示すとき、バンドの(対応する時間又は時間間隔における)サブシステム12の出力は、サブシステム8から出力された周波数成分とサブシステム10から出力された周波数成分との第1線形結合であってよい(例えば、aX+bY、ここで、a及びbは係数であり、Xはサブシステム8から出力される周波数成分であり、Yはサブシステム10から出力される周波数成分である)。(後の時間又は時間間隔に対応する)圧縮フィードバックが、レギュレータ3はバンドにおいて圧縮を適用している(又はより大きな減衰量を適用している)と示すとき、バンドの(対応する時間又は間隔における)サブシステム12の出力は、サブシステム8から出力された周波数成分とサブシステム10から出力された周波数成分との(第1線形結合と異なる)第2線形結合であってよい(例えば、cX+dY、ここで、cはaと異なる係数であり、dはbと異なる係数であり、Xはサブシステム8から出力される周波数成分であり、Yはサブシステム10から出力される周波数成分である)。
代替として(又は追加で)、圧縮フィードバックは、(図2の破線により示されるように)サブシステム8及び/又はサブシステム10に提供され、サブシステム8及び/又はサブシステム10が低音増強を実行する方法を制御する。例えば、サブシステム8及び10の一方又は両方の動作は、圧縮フィードバックに応答して(時間間隔の間)有効にされ又は無効にされてよい。及び/又は、サブシステム8及び10がバンド入力オーディオに対して増強を実行する方法が、圧縮フィードバックにより制御されてよい。
例えば、PBEサブシステム8は、圧縮フィードバックの幾つかの値に応答して偶数調波を用いて、及び/又は圧縮フィードバックの幾つかの他の値に応答して奇数調波を用いて、調波移調を実行してよい。図2のシステムの標準的な動作では、サブシステム8及び/又はサブシステム10による低音増強は、(圧縮フィードバックにより)制御され、低音増強が(再生時に)特定のバンドの中で歪みを生じるのを防ぎ(圧縮量が該バンドにおいてレギュレータ3により適用される場合)、及び/又はレギュレータ3が1つ以上の特定のバンドにおいて圧縮を適用するのを防ぐ。サブシステム8(又はサブシステム10)によるバンドにおける少ない(又は異なるタイプの)処理は、レギュレータ3が該バンドにおいて多くの減衰を適用している場合に、歪みを防ぐために望ましいことがある。
例えば、バンド内で(サブシステム10により適用される)ブーストは、フィードバックがレギュレータ3は該バンド内で多くの減衰(例えば、所定の閾量を超える減衰)を適用していると示す場合に、例えば、(サブシステム10による)ブーストが多すぎて、(レギュレータ3による)高い圧縮が歪みをもたらす場合、減少されてよい。幾つかの実施形態では、サブシステム8又は10の一方による処理の量又は程度は、(圧縮フィードバックにより決定される)サブシステム8又は10の他方による処理の量又は程度に応答して決定され、例えば、サブシステム8及び10の両方による処理の全体の量又は程度を一定に又は所望の量に保つ。
PBEサブシステム8が、レギュレータ3により適用される圧縮を示す圧縮フィードバックに応答して動作しない限り、知覚可能な低音増強は当然に非線形であるので、レギュレータ3は、標準的に、信頼できるスピーカ歪み保護を提供できない。
図1のシステム9の標準的な実装では、(バンドのセット全体のうちの各バンドにおけるレギュレータ3により適用される圧縮を示す)全帯域幅圧縮フィードバック信号は、増強サブシステム1(時に、増強レイヤと呼ばれる)に供給される。これに応答して、増強サブシステム1は、増強オーディオ信号を生成する。増強オーディオ信号はレギュレータ3に供給され、レギュレータ3及びレンダリングサブシステム5は、歪みのないスピーカフィードを生成するよう動作する。圧縮フィードバック信号は、レギュレータ3から出力される信号の望ましくないポンピングがないことを保証するために、何らかの制御(gating)を有してよい。
(少なくとも1つのバンド内で)レギュレータ3により適用される制限(減衰)の量の変化の標準的な理由は、ユーザ制御による再生音量の変化、又は本発明のシステムにより提供され又は生成されるオーディオ信号のレベルの変化を含む。基本的に重要なことに、レギュレータは、(レギュレータが増強レイヤの出力に対して動作するという意味で)増強レイヤの後に直列に配置され、スピーカが自身に歪みを生じさせ得る信号を供給されないことを保証する。
本発明の標準的な実施形態は、低音増強のための均等化方針が、高いシステムボリュームにおいて、スピーカ歪み及びマルチバンド圧縮のような関連する保護メカニズムにより崩壊する、従来の均等化型低音増強及び心理音響低音増強アルゴリズムの構成が、低音増強信号に適用される圧縮を示すフィードバックに依存しない、
心理音響低音増強が、均等化型低音増強の利用されるシステムにおいて時に全く利用されないが、均等化型低音増強を補強するために心理音響低音増強を条件付きで(例えば、低音増強オーディオ信号の低周波数バンドにおける高エネルギ/圧縮レベルの条件下で)利用することがしばしば望ましい、という発明者らの認識に部分的に基づく。
幾つかの実施形態では、本発明のシステム(例えば、図1の増強サブシステム1)は、圧縮フィードバックを用いて(入力オーディオ信号に応答して)増強オーディオ信号を生成するために、(低音増強以外の又はそれに追加して)増強を実行するよう構成される。次に、本発明の幾つかの実施形態において圧縮フィードバックを用いて制御可能な(例えば、増強サブシステム1の実施形態により実行される)このような増強の幾つかのタイプの例を説明する。例は以下を含む。
1.会話増強
(例えば、増強サブシステム1の実施形態を作動させることにより)会話増強を実行するとき、(例えば、増強サブシステム1の実施形態により生成された)会話増強信号のレベルは、レギュレータ(例えば、レギュレータ3)からの圧縮フィードバックに応答して減少されて、レギュレータにアサートされる(asserted)会話増強オーディオ信号の最大レベルを(1つ以上の特定のバンド内で)制限し、このような最大レベルが十分に低くなるようにして、レギュレータがこのようなバンド内のオーディオを圧縮する(制限する)のを防いでよい。レギュレータが(少なくとも1つのバンド内で)会話増強オーディオ信号を制限しているとき、会話増強信号のレベルがあまり減少されない場合、会話増強は、会話を明瞭にするのではなく、(レギュレータから出力される圧縮会話増強オーディオ信号により示される)会話を理解し難くしてしまう場合が多い。
幾つかの代替の実施形態では、(会話増強を実行するために利用される)会話増強曲線の形状は、圧縮フィードバックに応答して変化されて、(標準的な会話周波数範囲、つまり300~3000Hzの外側にあり、圧縮フィードバックにより示されたようにレギュレータにより圧縮されている)各バンド内の会話増強オーディオ信号の利得を減少して、レギュレータ(例えば、レギュレータ3)が会話増強オーディオ信号のこのような各バンド内で圧縮を適用し続けるのを防いでよい。例えば、増強サブシステム1が会話増強を実行するよう構成されるとき、会話周波数範囲の中の各バンド内のサブシステム1の出力の利得は、標準的に、圧縮フィードバックに応答して減少されない(しかし、会話周波数範囲の外側の各バンド内のサブシステム1の出力の利得は、幾つかの場合に減少される)。これは、レギュレータ(例えば、レギュレータ3)の音質保護モードが、静か過ぎる会話を有する(レギュレータから出力される)圧縮された会話増強オーディオ信号を生じないことを保証し、及びユーザにより制御された音量の増大が増大した会話音量を生じることを依然として保証するために行うことができる。
2.アップミキシング
(例えば、増強サブシステム1の実施形態を作動させることにより)アップミキシングを実行するとき、(例えば、増強サブシステム1の実施形態により生成される)拡散コンテンツの量は、レギュレータ(例えば、レギュレータ3)からの圧縮フィードバックに応答して、圧縮フィードバックが、レギュレータはアップミキシングされたオーディオ信号の関連バンド(つまり、マルチチャネルアップミキシングオーディオの少なくとも1つのチャネルの関連するバンド)を制限していると示すとき、減少され(一方で、直接コンテンツはそのままである)、レギュレータに供給されるアップミキシングオーディオ信号のエネルギ量を減少させてよい。代替として、アップミキシングは、圧縮フィードバックに応答して、圧縮フィードバックがアップミキシングがそうすべきであると示す特定の時間間隔の間、無効にされてよい(その結果、アップミキシングは全く実行されない)。
3.音量調整、モデル化、又は自動利得制御(例えば、Dolby Volumeにより実施される)(例えば、増強サブシステム1の実施形態を作動させることにより)音量モデル化を実行するとき、音量モデル化部は、入来するオーディオを分析し、同様の周波数を重大(critical)バンドにグループ化し、音量モデル化部の出力を圧縮するレギュレータ(例えば、レギュレータ3)からの圧縮フィードバックにより制御される方法で、適切な量の利得を各バンドに適用してよい。圧縮フィードバックに応答して、音量モデル化部は、(標準的に訳85デシベルである、想定される基準レベルに対して)異なる再生レベルに対する周波数応答を調整して、異なる再生レベルでの再生中に人がオーディオを知覚する方法を補償してよい。従って、音量モデル化は、高い又は低い再生レベルに拘わらず、ユーザが常に正しいトーンバランスを聞くことを保証し得る。
(例えば、増強サブシステム1の実施形態を作動させることにより)音量調整を実行するとき、音量調整部は、音量調整部の出力を圧縮するレギュレータ(例えば、レギュレータ3)からの圧縮フィードバックにより制御される方法で、動作してよい。音量調整部は、入力オーディオの再生レベルを制御して、ソース選択及びコンテンツに拘わらず、一定の再生レベルを維持してよい。
増強サブシステム1の実装の幾つかの例では、増強サブシステムは、圧縮フィードバックに応答して、以下の方法で制御されてよい。つまり、音量調整部の目標基準レベル又は(サブシステム1により実施される)音量モデル化部の基準レベルは、圧縮フィードバックに応答して調整されて、サブシステム1が、レギュレータに1以上の特定のバンド内でオーディオを圧縮させるためにレギュレータ3を駆動(例えば連続的に駆動)しないことを保証してよい。或いは、
サブシステム1により実施される自動利得制御(automatic gain control (AGC))の利得幅(gain swing)は、圧縮フィードバックに応答して調整されて、(1つ以上の特定のバンド内の)サブシステム1の出力の最大レベルが十分に低くなるようを制限して、レギュレータ3がこのようなバンド内でオーディオを圧縮するのを防いでよい。
4.周波数シフトブロック
(例えば、会議呼の間にキャプチャされたオーディオの)会話の明瞭さを向上するために、増強サブシステム1は、周波数シフトブロックとして実装されてよい。このような増強サブシステム1の実施形態を作動させるとき、周波数シフトブロックは、周波数シフトブロックの出力を圧縮するレギュレータ(例えば、レギュレータ3)からの圧縮フィードバックにより制御される方法で、動作してよい。標準的に、ユーザが音量を増大し、レギュレータが標準的な会話の範囲内の周波数バンドを制限するとき、周波数シフトブロックは、再生装置の能力(及び任意的に、周囲環境の雑音レベル)を考慮して知覚される音量を増大し得る方向に、全部の周波数をシフトする。
5.調波注入
バンドがレギュレータにより制限されている場合、レギュレータからの圧縮フィードバックは、増強サブシステム1の実施形態に提供され得る。増強サブシステムは、圧縮フィードバックに応答して動作し、調波心理音響周波数をオーディオ入力信号に注入するよう(例えば、仮想低音を提供するよう)動作でき、それによりレギュレータの入力にアサートされる増強信号を生成する。留意すべきことに、この文脈における調波注入は、伝統的な低音周波数に対するものに限定されない。それは、全部の周波数において実行できる(最大12kHzまでの基本周波数を有し、その後、第2調波は人間の可聴閾より高い)。
6.分数調波注入
より高い周波数ビンにおいてレギュレータにより信号が制限されている場合、レギュレータからの圧縮フィードバックは、増強サブシステム1の実施形態に提供され得る。増強サブシステムは、圧縮フィードバックに応答して、(基本周波数/nに等しい周波数を有する、ここでnは整数である)分数調波を生成し、分数調波をオーディオ入力信号に挿入し、それにより、レギュレータの入力にアサートされる増強信号を生成するよう動作できる。これは、最大24kHzまで全て動作するという利点を有する。これは、ユーザが音量制御を増大するとき、知覚される音量を増大させることを可能にする。
7.仮想化
(例えば、増強サブシステム1の実施形態を作動させることにより)仮想化を実行するとき、仮想化部は、仮想化部の出力を圧縮するレギュレータ(例えば、レギュレータ3)からの圧縮フィードバックにより制御される方法で、動作してよい。仮想化部は、通常、レギュレータに特定のビンを制限させ得る音量変化を生じる。幾つかの例では、これは、(本発明の実施形態により)仮想化部が圧縮フィードバックにより制御されない限り、空間オーディオに崩壊を生じる。
このような仮想化の一例では、仮想化部は、レギュレータに、単にオーディオをリスナプレーンへとレンダリングさせる代わりに、(圧縮フィードバックにより示されるように)バンドを制限させている場合に、高さフィルタを仮想化しない。このような仮想化の別の例では、レギュレータが(圧縮フィードバックにより示されるように)関連するビンを制限しているとき、仮想化部は、信号の中の残響(reverb)(「ウェット(wet)」成分)の量を減少し、無響フィード(「ドライ(dry)」成分)を保つ。
8.均等化
(例えば、増強サブシステム1の実施形態を作動させることにより)均等化を実行するとき、イコライザは、イコライザの出力を圧縮するレギュレータ(例えば、レギュレータ3)からの圧縮フィードバックにより制御される方法で、動作してよい。プリセットされたイコライザは、レギュレータに特定のビンを制限することを開始させてよい。イコライザは、(圧縮フィードバックにより示されるような)レギュレータコンポーネントにより生じる制限を回避するために、(圧縮フィードバックに応答して)別のプリセットに変更するよう決定してよい。
幾つかの実施形態では、本発明のシステム(例えば、図1の増強サブシステム1)は、圧縮が1つのバンド内でのみ適用されていることを示す圧縮フィードバックに応答して(例えば、圧縮フィードバックは、無圧縮(圧縮の量がゼロである)が各々の他のバンド内で適用されていることを示す)、増強を実行するよう構成される。例えば、レギュレータ3がバンド1~1000Hz及び1000~20000Hzを有するマルチバンドリミッタである場合、及びコンテンツが500Hz正弦波で構成され、スピーカに歪みを生じる場合、レギュレータは上側バンド(1000~20000Hz)に圧縮を適用せず、圧縮フィードバックがこれを示す。
幾つかの実施形態では、本発明のシステム(例えば、図1の増強サブシステム)は、(圧縮フィードバックに応答して)時間ドメインにおいて増強を実行するよう構成される。例えば、増強は、(時間ドメインバイカッドフィルタとして実装されてよい)パラメータフィルタを適用してよい。これらのパラメータフィルタは、均等化型低音増強を実施するために使用されてよい。別の例では、増強は、圧縮フィードバックに基づきニーポイント(knee point)を調整するパラメータ低域通過フィルタを適用してよい。
本発明の列挙される例示的な実施形態(Enumerated example embodiments (EEEs))は以下を含む。
EEE1。オーディオ信号の圧縮及び増強のための方法であって、
入力オーディオ信号に増強を実行して増強オーディオ信号を生成するステップと、
前記増強オーディオ信号にマルチバンド圧縮を実行して、圧縮増強オーディオ信号を生成するステップと、
を含み、前記増強は、前記増強オーディオ信号の少なくとも2つの周波数バンドの各々に適用される圧縮量を示す圧縮フィードバックに応答して実行される、方法。
EEE2。前記増強は、低音増強であり、前記低音増強は、心理音響低音増強又は均等化型低音増強のうちの少なくとも1つであり又は含み、前記増強オーディオ信号は低音増強オーディオ信号である、EEE1に記載の方法。
EEE3。前記低音増強は、前記圧縮フィードバックにより制御される方法で、前記心理音響低音増強又は前記均等化型低音増強のうちの一方又は他方、又は両方を前記入力オーディオ信号に選択的に適用することを含む前記圧縮フィードバックに応答して実行される、EEE2に記載の方法。
EEE4。前記増強は、会話増強、アップミキシング、周波数シフト、調波注入、調波移調、分数調波注入、仮想化、均等化、音量モデル化、音量調整、又は自動利得制御、のうちの少なくとも1つであり又は含む、EEE1に記載の方法。
EEE5。前記マルチバンド圧縮は、前記圧縮増強オーディオ信号が再生されると、歪みを防ぐことを意図した方法で、前記増強オーディオ信号に対して実行される、EEE1に記載の方法。
EEE6。前記入力オーディオ信号は、オーディオコンテンツであり又は示し、前記方法は、
前記入力オーディオ信号に応答して、前記オーディオコンテンツを示すバンド周波数ドメインオーディオデータを生成するステップであって、前記バンド周波数ドメインオーディオデータは、周波数バンドのセットのうちの異なる周波数バンド毎に周波数成分のシーケンスを含み、前記増強は前記バンド周波数ドメインオーディオデータに対して実行される、ステップ、を含むEEE1に記載の方法。
EEE7。前記増強は、自動利得制御であり又は含むEEE1に記載の方法。
EEE8。システムであって、
入力オーディオ信号に対して増強を実行して、増強オーディオ信号を生成するよう接続され及び構成される増強サブシステムと、
前記増強オーディオ信号に対してマルチバンド圧縮を実行し、それにより圧縮増強オーディオ信号を生成し、前記増強サブシステムに圧縮フィードバックを提供するよう接続され及び構成されるマルチバンド圧縮部であって、前記圧縮フィードバックは、前記マルチバンド圧縮部により前記増強オーディオ信号の少なくとも2つの周波数バンドの各々に適用される圧縮量を示す、マルチバンド圧縮部と、
を含み、前記増強サブシステムは、前記圧縮フィードバックに応答して前記増強を実行するよう構成される、システム。
EEE9。前記増強は、低音増強であり、前記低音増強は、心理音響低音増強又は均等化型低音増強のうちの少なくとも1つであり又は含み、前記増強オーディオ信号は低音増強オーディオ信号である、EEE8に記載のシステム。
EEE10。前記増強サブシステムは、前記圧縮フィードバックにより制御される方法で、前記心理音響低音増強又は前記均等化型低音増強のうちの一方又は他方、又は両方を前記入力オーディオ信号に選択的に適用することによるものを含む前記圧縮フィードバックに応答して、前記低音増強を実行するよう構成される、EEE9に記載のシステム。
EEE11。前記増強は、会話増強、アップミキシング、周波数シフト、調波注入、調波移調、分数調波注入、仮想化、均等化、音量モデル化、音量調整、又は自動利得制御、のうちの少なくとも1つであり又は含む、EEE8に記載のシステム。
EEE12。前記増強は、自動利得制御であり又は含むEEE8に記載のシステム。
EEE13。前記システムは、オーディオ再生システムである、EEE8に記載のシステム。
EEE14。前記システムは、前記増強サブシステム及び前記マルチバンド圧縮部を実装するようプログラムされたプロセッサである、EEE8に記載のシステム。
EEE15。前記システムは、前記増強サブシステム及び前記マルチバンド圧縮部を実装するよう構成されたデジタル信号プロセッサである、EEE14に記載のシステム。
幾つかの実施形態では、本発明は、入力オーディオ信号に対して本発明の方法の任意の実施形態を実行するよう構成されるシステム又は装置(例えば、物理的に制限された又はその他の方法で制限された低音再生能力を有する再生装置又は他の装置、例えばノートブック、タブレット、携帯電話機、又は少なくとも1つの小型スピーカを備える他の装置)である。例えば、図1のシステム9は、図1の要素1、3、5、及び7の全部を含む再生装置(従って、該装置はこれらの要素の全部を実装する)、又は図1の要素1、3、及び5の全部を含む(実装するという意味で)オーディオプロセッサであってよい。
実施形態のある分類では、本発明は、オーディオ再生システム(例えば、ノートブック、タブレット、携帯電話機、又は小型スピーカを備える他の装置として実装されるシステム9、又は限られた(例えば、物理的に制限された)低音再生能力を有する再生システム)であり、増強オーディオを生成し及び増強オーディオを再生するために、(本発明の方法の任意の実施形態に従い)圧縮フィードバックに応答してオーディオにオーディオ増強(例えば、低音増強)を実行するよう構成される。
標準的な実施形態では、本発明のシステムは、ソフトウェア(若しくはファームウェア)によりプログラムされた及び/又はその他の場合には本発明の方法の実施形態を実行するよう構成された汎用若しくは専用プロセッサ(例えば、図1のシステム9の要素1、3、5の実装、又は図1又は図2の要素1の実装)であり又はそれを含む。幾つかの実施形態では、本発明のシステムは、入力オーディオデータを受信するよう接続され、本発明の方法の実施形態を実行することにより入力オーディオ信号に応答して出力オーディオデータを生成するよう(適切なソフトウェアにより)プログラムされた汎用プロセッサである。幾つかの実施形態では、本発明のシステムは、入力オーディオデータを受信するよう接続され、本発明の方法の実施形態を実行することにより入力オーディオ信号に応答して出力オーディオデータを生成するよう構成された(例えばプログラムされた)デジタル信号プロセッサ(例えば、図1のシステム9の要素1、3、5の実装、又は図1又は図2の要素1の実装)である。
本発明の特定の実施形態及び本発明の適用が本願明細書に記載されたが、当業者に明らかなことに、本願明細書に記載され及び請求される本発明の範囲から逸脱することなく、本願明細書に記載された実施形態及び適用に対する多くの変形が、可能である。理解されるべきことに、本発明の特定の形式が示され記載されたが、本発明は、記載され及び示された特定の実施形態又は記載された特定の方法に限定されない。

Claims (15)

  1. オーディオ信号の圧縮及び増強のための方法であって、
    入力オーディオ信号に増強を実行して増強オーディオ信号を生成するステップと、
    前記増強オーディオ信号にマルチバンド圧縮を実行して、圧縮増強オーディオ信号を生成するステップと、
    を含み、前記増強は、前記増強オーディオ信号の少なくとも2つの周波数バンドの各々に適用される圧縮量を示す圧縮フィードバックに応答して実行される、方法。
  2. 前記増強は、低音増強であり、前記低音増強は、心理音響低音増強又は均等化型低音増強のうちの少なくとも1つであり又は含み、前記増強オーディオ信号は低音増強オーディオ信号である、請求項1に記載の方法。
  3. 前記低音増強は、前記圧縮フィードバックにより制御される方法で、前記心理音響低音増強又は前記均等化型低音増強のうちの一方又は他方、又は両方を前記入力オーディオ信号に選択的に適用することによるものを含む前記圧縮フィードバックに応答して実行される、請求項2に記載の方法。
  4. 前記増強は、会話増強、アップミキシング、周波数シフト、調波注入、調波移調、分数調波注入、仮想化、均等化、音量モデル化、音量調整、又は自動利得制御、のうちの少なくとも1つであり又は含む、請求項1に記載の方法。
  5. 前記増強は、自動利得制御であり又は含む請求項1に記載の方法。
  6. 前記マルチバンド圧縮は、前記圧縮増強オーディオ信号が再生されると、歪みを防ぐことを意図した方法で、前記増強オーディオ信号に対して実行される、請求項1~5のいずれか一項に記載の方法。
  7. 前記入力オーディオ信号は、オーディオコンテンツであり又は示し、前記方法は、
    前記入力オーディオ信号に応答して、前記オーディオコンテンツを示すバンド周波数ドメインオーディオデータを生成するステップであって、前記バンド周波数ドメインオーディオデータは、周波数バンドのセットのうちの異なる周波数バンド毎に周波数成分のシーケンスを含み、前記増強は前記バンド周波数ドメインオーディオデータに対して実行される、ステップ、を含む請求項1~6のいずれか一項に記載の方法。
  8. システムであって、
    入力オーディオ信号に対して増強を実行して、増強オーディオ信号を生成するよう接続され及び構成される増強サブシステムと、
    前記増強オーディオ信号に対してマルチバンド圧縮を実行し、それにより圧縮増強オーディオ信号を生成し、前記増強サブシステムに圧縮フィードバックを提供するよう接続され及び構成されるマルチバンド圧縮部であって、前記圧縮フィードバックは、前記マルチバンド圧縮部により前記増強オーディオ信号の少なくとも2つの周波数バンドの各々に適用される圧縮量を示す、マルチバンド圧縮部と、
    を含み、前記増強サブシステムは、前記圧縮フィードバックに応答して前記増強を実行するよう構成される、システム。
  9. 前記増強は、低音増強であり、前記低音増強は、心理音響低音増強又は均等化型低音増強のうちの少なくとも1つであり又は含み、前記増強オーディオ信号は低音増強オーディオ信号である、請求項8に記載のシステム。
  10. 前記増強サブシステムは、前記圧縮フィードバックにより制御される方法で、前記心理音響低音増強又は前記均等化型低音増強のうちの一方又は他方、又は両方を前記入力オーディオ信号に選択的に適用することによるものを含む前記圧縮フィードバックに応答して、前記低音増強を実行するよう構成される、請求項9に記載のシステム。
  11. 前記増強は、会話増強、アップミキシング、周波数シフト、調波注入、調波移調、分数調波注入、仮想化、又は均等化、音量モデル化、音量調整、又は自動利得制御、のうちの少なくとも1つであり又は含む、請求項8に記載のシステム。
  12. 前記増強は、自動利得制御であり又は含む請求項8に記載のシステム。
  13. 前記システムは、オーディオ再生システムである、請求項8~12のいずれか一項に記載のシステム。
  14. 前記システムは、前記増強サブシステム及び前記マルチバンド圧縮部を実装するようプログラムされたプロセッサである、請求項8~12のいずれか一項に記載のシステム。
  15. 前記システムは、前記増強サブシステム及び前記マルチバンド圧縮部を実装するよう構成されたデジタル信号プロセッサである、請求項8~12のいずれか一項に記載のシステム。
JP2020571502A 2018-06-22 2019-06-20 圧縮フィードバックに応答するオーディオ増強 Active JP7335282B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862688625P 2018-06-22 2018-06-22
US62/688,625 2018-06-22
PCT/US2019/038322 WO2019246449A1 (en) 2018-06-22 2019-06-20 Audio enhancement in response to compression feedback

Publications (2)

Publication Number Publication Date
JP2021528909A JP2021528909A (ja) 2021-10-21
JP7335282B2 true JP7335282B2 (ja) 2023-08-29

Family

ID=67139837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020571502A Active JP7335282B2 (ja) 2018-06-22 2019-06-20 圧縮フィードバックに応答するオーディオ増強

Country Status (5)

Country Link
US (1) US11736081B2 (ja)
EP (1) EP3811514B1 (ja)
JP (1) JP7335282B2 (ja)
CN (1) CN112585868B (ja)
WO (1) WO2019246449A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019246457A1 (en) 2018-06-22 2019-12-26 Dolby Laboratories Licensing Corporation Multichannel audio enhancement, decoding, and rendering in response to feedback
US11817114B2 (en) 2019-12-09 2023-11-14 Dolby Laboratories Licensing Corporation Content and environmentally aware environmental noise compensation

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100086148A1 (en) 2008-10-03 2010-04-08 Realtek Semiconductor Corp. Apparatus and method for processing audio signal
JP2011125004A (ja) 2009-12-09 2011-06-23 Samsung Electronics Co Ltd サウンドエンハンスメント装置及び方法
JP5145993B2 (ja) 2008-02-12 2013-02-20 富士通株式会社 コネクタ
JP2013537779A (ja) 2010-08-18 2013-10-03 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号の臨界周波数帯域における歪みを制御する方法とシステム
US20150010168A1 (en) 2012-03-27 2015-01-08 Htc Corporation Sound producing system and audio amplifying method thereof
US20150092973A1 (en) 2011-11-22 2015-04-02 Actiwave Ab System and method for bass enhancement
JP2018160885A (ja) 2017-03-23 2018-10-11 ヤマハ株式会社 音響装置、スピーカー装置、および音響信号処理方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4412100A (en) * 1981-09-21 1983-10-25 Orban Associates, Inc. Multiband signal processor
US4641361A (en) * 1985-04-10 1987-02-03 Harris Corporation Multi-band automatic gain control apparatus
JPH05145993A (ja) * 1991-11-25 1993-06-11 Matsushita Electric Ind Co Ltd 低音域増強回路
US5737434A (en) * 1996-08-26 1998-04-07 Orban, Inc. Multi-band audio compressor with look-ahead clipper
US7277767B2 (en) 1999-12-10 2007-10-02 Srs Labs, Inc. System and method for enhanced streaming audio
US20030015082A1 (en) * 2001-07-18 2003-01-23 Michael Brennan Method and article for creating musical instruments via plastic molding technique
AU2005299410B2 (en) * 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
JP5018339B2 (ja) * 2007-08-23 2012-09-05 ソニー株式会社 信号処理装置、信号処理方法、プログラム
US9319789B1 (en) 2008-02-26 2016-04-19 Tc Group A/S Bass enhancement
US9373339B2 (en) * 2008-05-12 2016-06-21 Broadcom Corporation Speech intelligibility enhancement system and method
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US8204258B2 (en) * 2008-12-17 2012-06-19 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Multiband audio dynamics processor
US8625813B2 (en) * 2008-12-23 2014-01-07 Stmicroelectronics, Inc. Asymmetric polynomial psychoacoustic bass enhancement
WO2010138311A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
KR101068227B1 (ko) * 2009-06-23 2011-09-28 주식회사 더바인코퍼레이션 명료도 향상장치와 이를 이용한 음성출력장치
BR112012016797B1 (pt) * 2010-01-07 2020-12-01 That Corporation sistema e método para intensificação de resposta em baixa frequência de alto-falante para sinais de áudio
WO2011115944A1 (en) * 2010-03-18 2011-09-22 Dolby Laboratories Licensing Corporation Techniques for distortion reducing multi-band compressor with timbre preservation
WO2012177572A2 (en) 2011-06-24 2012-12-27 Beats Electronics, Llc Optimization method for audio playback systems
US20150281853A1 (en) * 2011-07-11 2015-10-01 SoundFest, Inc. Systems and methods for enhancing targeted audibility
JP6177798B2 (ja) * 2011-12-27 2017-08-09 ディーティーエス・エルエルシーDts Llc バスエンハンスメントシステム
US9900690B2 (en) 2012-09-24 2018-02-20 Cirrus Logic International Semiconductor Ltd. Control and protection of loudspeakers
KR102371004B1 (ko) * 2015-08-12 2022-03-07 삼성전자 주식회사 오디오 신호 처리 방법 및 이를 지원하는 전자 장치
KR101651828B1 (ko) * 2015-09-18 2016-08-30 오승훈 디지털 음원 음질 개선 시스템, 및 방법
US10405094B2 (en) 2015-10-30 2019-09-03 Guoguang Electric Company Limited Addition of virtual bass
CN108781330B (zh) * 2016-05-25 2020-04-28 华为技术有限公司 音频信号处理阶段、音频信号处理装置和音频信号处理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5145993B2 (ja) 2008-02-12 2013-02-20 富士通株式会社 コネクタ
US20100086148A1 (en) 2008-10-03 2010-04-08 Realtek Semiconductor Corp. Apparatus and method for processing audio signal
JP2011125004A (ja) 2009-12-09 2011-06-23 Samsung Electronics Co Ltd サウンドエンハンスメント装置及び方法
JP2013537779A (ja) 2010-08-18 2013-10-03 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号の臨界周波数帯域における歪みを制御する方法とシステム
US20150092973A1 (en) 2011-11-22 2015-04-02 Actiwave Ab System and method for bass enhancement
US20150010168A1 (en) 2012-03-27 2015-01-08 Htc Corporation Sound producing system and audio amplifying method thereof
JP2018160885A (ja) 2017-03-23 2018-10-11 ヤマハ株式会社 音響装置、スピーカー装置、および音響信号処理方法

Also Published As

Publication number Publication date
US11736081B2 (en) 2023-08-22
CN112585868B (zh) 2023-12-05
WO2019246449A1 (en) 2019-12-26
US20210273623A1 (en) 2021-09-02
EP3811514B1 (en) 2023-06-07
JP2021528909A (ja) 2021-10-21
CN112585868A (zh) 2021-03-30
EP3811514A1 (en) 2021-04-28

Similar Documents

Publication Publication Date Title
US10299040B2 (en) System for increasing perceived loudness of speakers
US11418881B2 (en) System and method for digital signal processing
EP2465200B1 (en) System for increasing perceived loudness of speakers
AU2014340178B2 (en) System and method for digital signal processing
JP2021097418A (ja) 多様な再生環境のためのダイナミックレンジ制御
US11616482B2 (en) Multichannel audio enhancement, decoding, and rendering in response to feedback
CN106796799B (zh) 高效drc配置文件传输
CN108781330B (zh) 音频信号处理阶段、音频信号处理装置和音频信号处理方法
AU2014340178A1 (en) System and method for digital signal processing
US11109155B2 (en) Bass enhancement
JP2015507412A (ja) バスエンハンスメントシステム
JP7335282B2 (ja) 圧縮フィードバックに応答するオーディオ増強
CN115346544A (zh) 音频信号处理方法、装置、存储介质和程序产品
US11343635B2 (en) Stereo audio

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230817

R150 Certificate of patent or registration of utility model

Ref document number: 7335282

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150