JP2013546021A - ダウンミックス制限 - Google Patents

ダウンミックス制限 Download PDF

Info

Publication number
JP2013546021A
JP2013546021A JP2013538876A JP2013538876A JP2013546021A JP 2013546021 A JP2013546021 A JP 2013546021A JP 2013538876 A JP2013538876 A JP 2013538876A JP 2013538876 A JP2013538876 A JP 2013538876A JP 2013546021 A JP2013546021 A JP 2013546021A
Authority
JP
Japan
Prior art keywords
downmix
subgroup
limiting factor
signal
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013538876A
Other languages
English (en)
Other versions
JP5684917B2 (ja
Inventor
ウィルソン,ロンダ
ワード,ミカエル
ヴェネズイア,スティーヴン
ドレスラー,ロジャー
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2013546021A publication Critical patent/JP2013546021A/ja
Application granted granted Critical
Publication of JP5684917B2 publication Critical patent/JP5684917B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Amplifiers (AREA)

Abstract

本発明は、ダウンミキシング技法に関しており、それにより、出力オーディオ信号が、サブグループに分割された入力オーディオ信号から得られる。可変共通利得制限因子が、サブグループの入力信号からの寄与を支配する全てのダウンミックス係数に適用される。サブグループ内の信号値間の割合を保持しながら、本発明は、比較的より知覚可能な信号が比較的少なく制限されうるように、異なる入力信号サブグループの利得を異なる程度で制限することを可能にする。すると、利得制限がある信号部分と利得制限がない信号部分との間でより知覚可能でない方式で遷移しながら、一貫性があるダイアログレベルを達成することが可能になる。本発明の実施形態は、方法、ミキシングシステム、およびコンピュータプログラム製品を含む。

Description

本出願は、参照によりその全体が組込まれる、2010年11月12日に出願された米国特許仮出願第61/413,237号に対して優先権を主張する。
本明細書で開示される発明は、一般に、アナログまたはデジタルオーディオ信号処理技法に関する。より詳細には、本発明は、少数のオーディオ信号への多数のオーディオ信号のダウンミキシングに関する。
本明細書で使用されるように、ダウンミキシングは、M個の入力オーディオ信号(またはチャネル)によってエンコードされた情報からN個の出力オーディオ信号(またはチャネル)を導出するオペレーションを指す(1≦N<M)。高品質ダウンミキシングに関する一般的な期待は、低い情報損失、適合性があるダイアログレベル、および入力信号と出力信号との間の心理音響的高忠実度を含む。
ダウンミキシングは、しばしば、1つの信号になるように2つの信号を結合することを含み、それを、波形加算、変換係数加算、加重平均、または同様なものによって行う。ステレオ−モノダウンミキシングは、簡単な関係
Figure 2013546021
によって表現できるが、一般的なM−Nダウンミキシングは、
Figure 2013546021
として行列形態で書くことができる。ここで、ダウンミックス係数ak1、…、akMによって表現される、所与の出力チャネルyに寄与する入力チャネル間の相対重み分布は、芸術的検討から得られてもよく、または、再生用オーディオ源の空間的レイアウトに関連していてもよい。ダウンミックス係数の相対比を固定した後、ダウンミキシングの利得は、1つの入力チャネルがいくつかの出力チャネルに寄与する場合、他の関心事、特にエネルギー保存によって決定されてもよい。他の状況では、優先事項は、一貫性があるダイアログレベルを維持することとすることができる。この要件は、異なるタイプのミキシングまたはエンコーディングによって得られているにもかかわらずオーディオセクションをシームレスに共に結合することを可能にする。
利得がエネルギー保存によって選択されていようが、ダイアログレベル要件に応答して選択されていようが、ダウンミキシングにおいてしばしば遭遇される困難さは、出力信号がその許容範囲を超えることである。出力信号をクリップすること、または、再生用オーディオ機器を損傷することを回避するために、当技術分野における一般的な慣行は、局所的に―範囲外の値が普通なら生成されることになる時点でまたはその時点のまわりで―、または、大域的に利得を減少させることである。出力信号yが範囲外である場合、総合利得は、
Figure 2013546021
によって制限されることができる。ここで、0<γ<1は制限因子である。同様に、
Figure 2013546021
によって、yに寄与する信号の利得だけを減少させることもできる。制限因子がどのように適用されるかによらず、ダイアログレベルを満たすという要件と心理音響的に目立たない方法で制限を実施するという要件が両立しないことは明らかである。利得をより局所的に制限することは、ダイアログレベルの一貫性に有利であるが、より急激でかつより知覚可能な利得変化をもたらす。同様に、長い期間にわたって制限を実施することは、一方の問題を改善するが、他方の問題を悪化させる。したがって、改良型ダウンミキシング技法についての必要性が存在する。
従来技術に伴う問題の1つまたは複数を克服する、軽減する、または少なくとも緩和するために、心理音響的により目立たない方式でオーディオストリームをダウンミックスするための技法を提供することが本発明の目的である。本発明の特定の目的は、出力信号(複数可)をクリップすることを回避しながら、一貫性があるダイアログレベルを可能にするダウンミキシング技法を提供することである。本発明の別の特定の目的は、これらの一般的な特性を有し、オーディオの動的、時間的、および/または空間的特性を保持するのに適したダウンミキシング技法を提供することである。
本発明は、独立請求項による、方法、ミキシングシステム、およびコンピュータプログラム製品を提供することによってこれらの目的の少なくとも1つを達成する。従属請求項は、本発明の有利な実施形態を規定する。
第1の態様では、本発明は、入力データを搬送する複数の入力オーディオ信号を少なくとも1つの出力オーディオ信号にダウンミックスする方法を提供する。方法のミキシング特性は、最大ダウンミックス係数、出力オーディオ信号(複数可)に関する少なくとも1つの範囲内条件、および、サブグループへの入力信号の分割に依存する。本方法は、範囲内条件(複数可)を満たすために、同じサブグループに属する全ての最大ダウンミックス係数を共通制限因子によってダウンスケールすることによって最大ダウンミックス係数からダウンミックス係数を導出することを含む。こうして導出されるダウンミックス係数は、入力信号をダウンミックスするのに適する。
第2の態様では、本発明は、第1の態様の方法を実施するために適応されたミキシングシステムを提供する。第3の態様では、本発明は、プログラマブルなコンピュータに、第1の態様の方法を実行させるためのコンピュータプログラム製品を提供する。
本発明は、少なくとも2つのサブグループのうちのあるサブグループの入力信号の寄与を制御する全てのダウンミックス係数に、共通制限因子が適用されることを教示する。異なる入力信号を異なる程度に制限するこの自由裁量によって、比較的より知覚可能な信号が比較的少なく制限されうる。これは、一貫性があるダイアログレベルを、利得制限がある信号部分と利得制限がない信号部分との間の目立たない遷移と組合せることをより容易にする。
添付特許請求の範囲を参照して、信号はそれぞれ、アナログ(連続値)またはデジタル(離散値)とすることができることが留意される。「サブグループ(subgroup)」は、1つの入力信号またはいくつかの入力信号を含むことができる。信号に関する「範囲内条件(in-range condition)」は、信号に関する上限、信号に関する下限、または、信号が、下限および上限を有する区間内に留まるという要件を指すことができる。範囲内条件は、特定の時間セグメント、時間セグメントのセットに適用することができる、または、大域的であり、制限なしで信号全体に適用することができる。用語「範囲内条件」と「非クリップ条件(non-clip condition)」は本開示において交換可能に使用されることができることが理解される。用語「制限因子(limiting factor)」と「利得制限因子(gain limiting factor)」も同様である。したがって、各サブグループについての制限因子は、入力信号に割当てられた最大ダウンミックス係数そのものに基づくだけでなく、入力信号によって搬送される入力データにも基づいて決定される。最後に、ダウンミキシングオペレーション自体、すなわち、出力信号を得るために入力信号の線形結合を形成することは、それ自体は当技術分野で知られている技法によって実行されることができることが留意される。
局所的でない範囲内条件、局所的でない平滑化プロセス(以下を参照)、または適用される同様な処置を例外として、本発明は、リアルタイム実施形態と、オフライン実施形態、たとえばファイル−ファイルベースの〔ファイルごとの〕処理の両方を含む。
一実施形態では、少なくとも1つのサブグループは2つ以上の入力信号を含む。これらの全ての入力信号についてダウンミキシング係数をダウンスケールするために、共通制限因子が使用されるため、いくつかの入力信号の間の有意の関係が、ダウンミキシング下で保持されることができる。したがって、入力信号によって全体として伝達される、動的、時間的、音色的、および/または空間的な知覚印象は、本実施形態によるダウンミキシングによって制限された程度に影響を受けるだけである。
上記実施形態のさらなる発展において、入力信号は、レフトおよびライトチャネル;レフト、センター、およびライトチャネル;レフトおよびライトワイドチャネル;レフトおよびライトセンターチャネル;ならびにレフト、センター、およびライトサラウンドチャネルのような空間的に関連するオーディオチャネルに対応する。
一実施形態では、ダウンミックス係数は、できる限り大きく維持される。これは、一貫性があるダイアログレベルに有利である。たとえば、範囲内条件が、広義の不等号である場合、制限因子は、その上方の値(または「シャープな(sharp)」値または「タイトな(tight)」値または「イグザクトな(exact)」値)、すなわち、範囲内条件において等号をもたらす値に等しくまたはそれに近く設定されることができる。好ましくは、ダウンミックス係数は、上限によって決定された値から20%を超えて、より好ましくは10%を超えて、最も好ましくは5%を超えて異なるべきではない。ダウンミックス係数の平滑化をさらに含む実施形態(以下を参照)では、平滑化する前にダウンミックス係数が有する値に上記条件のうちの1つを課すことが好ましい。
一実施形態では、出力信号は、時間セグメントに分割される。時間セグメントは、同一の長さまたは不同の長さを有することができ、時間セグメントは、アナログデータのサンプリング、信号の変換ベース処理の結果であってもよいし、または、何らかの同様のプロセスに起因するのでもよい。時間セグメントは、多数のサンプルからなるとすることができる。あるいは、時間セグメントは、それぞれが多数のサンプルを含む多数のブロックからなるとすることができる。入力信号は、同様のまたは異なる時間セグメントに分割されてもよいし、または、分割されなくてもよい。本実施形態による方法は、範囲内条件を、各時間セグメントにおいて、この時間セグメントに関連する入力データに鑑みて、別々に満たすように試みてもよい。本方法は、範囲内条件を、全ての時間セグメントにおいてまたは一部の時間セグメントにおいて満たすように構成されてもよい。入力信号がゆっくり変動する場合、全ての時間セグメントが考慮される必要がないため、後者のオプションが、制限された品質低下で計算負荷を低減することができる。
いくつかの出力信号にするダウンミキシングを提供するのに適した変形において、本方法は、範囲内条件を、別個の時間セグメントにおいて、しかし連携して全ての出力信号について満たすように構成されてもよい。これは、出力信号の知覚される空間的均衡を保持することができる。
時間セグメントに分割された出力信号を提供する実施形態は、有利には、平滑化(または正則化)と組合されることができる。一例として、種々の時間セグメントについて得られた特定のダウンミックス係数の値は、(時間)シーケンスとして扱われることができ、平滑化オペレーションを受けてもよい。平滑化済みダウンミックス係数は、未平滑化ダウンミックス係数の代わりにダウンミキシングオペレーションで使用されることができる。1つまたはいくつかの選択されたダウンミックス係数あるいは全てのダウンミックス係数が平滑化を受けることができ、これらのプロセスは、互いに並列に働くことができる。特定のサブグループについての制限因子を平滑化することは、このサブグループの入力信号に作用するダウンミックス係数を平滑化することと同じ結果をもたらすことになることを当業者は認識するであろう。したがって、これらの両方の手法が本発明の範囲内に入るが、本開示は、両方を詳細に述べる必要はない。
平滑化は、それ自体としては当技術分野で知られている任意の適したプロセスによって実行されることができる。好ましくは、平滑化は、変化レートの上限によって支配される。こうして平滑化した後、セグメントごとの値のシーケンス内の孤立した値は、急激な変化を回避するように、穏やかに変化する値の下方ランプおよび上方ランプによって囲まれることになる。これらのランプは、線形スケールまたはdBスケールなどの対数スケール上でコンスタントな増加または減少を特徴とすることができる。したがって、(絶対値の)増加または減少が大きくなり過ぎない平滑化済みダウンミックス係数が得られるようダウンミックス係数値を調整することによって、ダウンミックスされる信号の利得制限部分と利得非制限部分との間の徐々の、したがってより知覚可能でない遷移を得ることができる。別の好ましいオプションは、元の値を減少させるかまたは維持することによりダウンミックス係数を調整することによって平滑化を実行することである。元のダウンミックス係数を増加させることは、範囲内条件が、その後もはや満たされない場合があるため、回避されるべきである。
一実施形態では、入力信号の少なくとも1つのサブグループは、そのサブグループの入力信号に作用するダウンミックス係数を決定するために使用される制限因子に関する下限に関連付けられる。かかる限界は、本発明のこの実施形態が、かかる下限を超える解だけを探すことによって出力信号に関する範囲内条件を満たそうと試みるという意味で先験的限界である。これは、関係しているサブグループからの寄与が、任意に小さくならないことを保証する。
上記の実施形態のさらなる発展において、1次(primary)および2次(secondary)のサブグループは、それらの各制限因子に関して異なる下限(または先験的限界)に関連付けられる。1次サブグループに関連付けられる下限は、2次サブグループに関連付けられる下限以上である。これは、サブグループ間の相対的均衡を規定するために使用されることができる。たとえば、1次サブグループは、2次サブグループに比べて、相対的により大きな心理音響的重要性を与えられることができる。
別の実施形態では、範囲内条件を満たすための制限因子の値の探索は、1次グループを有利にするように構成されることができる。特に、この実施形態による方法は、1次サブグループ制限因子が1次サブグループについての制限因子に関する上限に等しいまたはその上限に近い、範囲内条件を満たす制限因子の値を探索するように構成されることができる。
上記の実施形態に対する変形において、1次サブグループおよび2次サブグループのための各制限因子について上限および下限が規定されることができる。この実施形態による方法は、その上限に等しい1次サブグループ制限因子を含む解を最初に探すように構成される。2次サブグループ制限因子は、その上限と下限との間で変動する。その後、範囲内条件に対する解が見出されない場合、本方法は、その下限に等しい2次サブグループ制限因子を含む解を探す。1次サブグループ制限因子は、その上限と下限との間で変えられる。言い換えると、本方法は、最初に、両方の制限因子をその最大値(一貫性があるダイアログレベルを最もよく保持することになる値)に等しく設定し、次に、制限因子を選択的な方式で減少させ、ついには、それによって範囲内条件が満たされる一対の制限因子が見出される。選択的な減少は、最初に2次サブグループ制限因子をその下限まで減少させ、次いで必要であれば、1次サブグループ制限因子も減少させることを含む。有利には、これは、知覚的により重要であるチャネルとして規定されることができる1次チャネルが、利得制限によってできる限り少なく影響されることを保証する。
1次および2次のサブグループが識別される上記実施形態を参照して、1次サブグループは、心理音響的観点からより重要であるチャネルに対応する信号を含むとすることができる。これらは、リスナーの前のハーフスペース〔半空間〕内に位置するオーディオ源による再生のために意図されたチャネルを含み、2次グループは、その後、残りのチャネル、特にリスナーの背後または側面での再生のために意図されたチャネルを集めることができる。別のモデルによれば、1次チャネルは、リスナー(またはリスナーの耳)と実質的に同じ高さに位置するかつ/または実質的に水平に伝播するオーディオ源による再生のために意図されたチャネルとすることができ、その際、2次グループは、他の高さのおよび/または非水平に伝播する再生のための残りのチャネルを含むことができる。さらに別のオプションとして、1次サブグループは、フロントハーフスペース〔前方半空間〕内でかつリスナーと実質的に同じ高さで再生されるチャネルからなるとすることができる。
一実施形態では、サブグループのうち少なくとも1つのサブグループは、そのサブグループについての制限因子に関する上限に関連付けられる。いくつかのサブグループが、それらの制限因子に関する上限を割当てられ、本方法が、可能な最大の制限因子を解として探索するように構成される実施形態では、それらの上限に等しい両方の制限因子の組合せが、許容できる解である。この状況では、異なるサブグループからの入力信号間の、予め規定された最大ダウンミックス係数によって表現される割合〔プロポーション〕がダウンミキシング下で保持されるように、上限を等しく設定することが好ましい。
一実施形態は、空間的に関連するチャネルに対応する少なくとも2つのオーディオ信号を提供するように構成される。こうした空間的に関連するチャネルは、以下のチャネルグループまたはそれらの組合せの1つに属することができる。以下のチャネルグループとは、フロント、サラウンド、リアサラウンド、ダイレクトサラウンド、ワイド、センター、サイド、ハイ、バーチカルハイである。本発明は、全ての出力チャネルについて範囲内条件を連携して満たすために、各サブグループについて1つの制限因子を導出することを教示する。これは、入力信号の知覚される空間的均衡を、出力信号の対応する均衡に移し、したがって、オーディオ源の知覚される位置の望ましくないドリフトおよび同様な問題を回避することができる。1つの特定の実施形態では、共通制限因子の決定は、2つのサブステップで起こる場合がある。第1に、ダウンミックス係数は、最大ダウンミックス係数と予備的制限因子との積として決定され、予備的制限因子は、関係しているサブグループの入力信号から導出される(空間的に関連する)出力信号のそれぞれに関して範囲内条件を満たす。第2に、このサブグループに適用される制限因子は、第1のサブステップの前記出力信号について導出された全ての予備的制限因子の最小を抽出することによって得られる。
一実施形態では、エンコーディングシステムは、複数のオーディオ信号を受信し、本発明に従ってこれらの信号を少なくとも1つのダウンミックス信号にダウンミックスし、ダウンミックス信号(複数可)をビットストリームとしてエンコードするように適応される。
一実施形態では、デコーディングシステムは、オーディオ信号をエンコードするビットストリームおよび本発明に従って生成されるダウンミックス仕様を受信するように適応される。ダウンミックス仕様は、ダウンミックス係数および/またはサブグループへの信号の分割を含むことができる。デコーダは、ダウンミックス仕様に従って、たとえばダウンミックス係数を適用することによって、オーディオ信号を少なくとも1つのダウンミックス信号にダウンミックスするようにさらに適応される。
一実施形態では、デコーディングシステムは、入力ポート、デコーダ、およびミキサーを含むことができる。デコーディングシステムは、本発明に従って生成される仕様に従って信号をデコードしダウンミックスするように適応される。上記において見られるように、本発明は、信号の各サブグループ内で共通である乗算的制限因子によって範囲内条件を満たすためにダウンミックス係数がダウンスケールされることを教示する。これは、1つのサブグループの信号に適用される係数の比が一定であり、一方、異なるサブグループの信号に適用される係数の比が可変であることを示唆することになる。ここで、用語「一定の(constant)」および「可変の(variable)」は、ダウンミックス係数の異なるセット間の考えられる変動についていう。たとえば、各時間セグメントについてダウンミックス係数の1つのセットが計算されることができる。しかし、本発明が教示するように、ダウンミキシングシステムは、こうしたセット内のダウンミックス係数間の一定の比を保持することになる。比の一部が可変であるため、デコーディングシステムは、(たとえば、1次サブグループ内の)比較的より知覚可能な信号を比較的少なく制限するように適応されていてもよい。これは、一貫性があるダイアログレベルを、利得制限がある信号部分と利得制限がない信号部分との間の目立たない組合せることをより容易にする。サブグループが2つ以上の信号を含む場合、デコーディングシステムは、これらの信号間の有意の関係を、その組合されたデコーディングとダウンミキシングの下で保持することができるため、入力信号によって全体として伝達される、動的、時間的、音色的、および/または空間的な知覚印象はわずかな程度に影響を受けるだけである。
本発明は、特許請求の範囲で挙げた特徴の可能な全ての組合せに関することが留意される。
本発明は、ここで、添付図面を参照してより詳細に述べられるであろう。
ある実施形態によるミキシングシステムの一部分の一般化されたブロック図である。 ある実施形態による、1次および2次のサブグループについてのミキシング因子の選択を示すグラフである。 ある実施形態による、最大ダウンミックス係数に基づく制限因子についての許容できる区間の選択を示す2つのグラフである。 ある実施形態によるミキシングシステムの一般化されたブロック図である。 ある実施形態の一部を形成する平滑化プロセスを示す図である。
図1は、本発明のある実施形態によるミキシングシステム100の一部分を示す。システム100は、k番目の出力信号に関する以下の範囲内条件を満たすように適応される。
Figure 2013546021
第1の乗算器101および加算器103は、
Figure 2013546021
により、1番目、2番目、および4番目の入力信号に基づいてk番目の出力信号を計算する。ここで、ak1、ak2、ak4は、制限がない場合に入力信号の相対的重みを決定する予め規定された最大ダウンミックス係数である。予め規定された分割によって、1番目および4番目の入力信号は第1のサブグループに属し、一方、2番目および3番目の入力信号は第2のサブグループに属する。サブグループへのこの分割に鑑みて、コントローラ104は、
Figure 2013546021
において制限因子α、α>0の値を選択することによって範囲内条件(5)を満たすように試みることになる。図1を参照して、第2の乗算器102は、制限因子α、αを入力信号に適用する。コントローラ104は、出力信号yの値に応答して制限因子α、αの値を選択する。
ここで先に論じた全体のミキシングシステム100を参照して、ダウンミキシング時に入力信号を制限するアクションは、次の通りに行列表記で表現されることができる。制限なしのダウンミキシングは、関係Y=AXに従う。ここで、X、Yは、入力および出力の信号ベクトルであり、
Figure 2013546021
である。制限ありのダウンミキシングは、式
Figure 2013546021
に従い、
Figure 2013546021
および
Figure 2013546021
である。明らかに、範囲内条件
Figure 2013546021
Figure 2013546021
および
Figure 2013546021
(ここで、
Figure 2013546021
は定ベクトルである)の1つが課される場合、制限因子α、αは、全ての出力信号に関する範囲内条件が連携して満たされるように十分に小さく選択されることになる。
本発明による利得制限は、上記サブグループを異なるように処理することによって、より少なく知覚可能にされることができる。第1のサブグループ{y,y}は、1次サブグループとして処理されることができ、一方、第2のサブグループ{y,y}は、2次サブグループとして処理されることができる。たとえば、1次サブグループ内の信号は、主要な心理音響的重要性があるフロントレフトおよびフロントライト信号に対応するとすることができる。2次サブグループ内の信号は、フロントでないオーディオ源による再生のために意図され、したがって、より低い重要性を保持するサラウンドレフトおよびサラウンドライトに対応するとすることができる。
2つのサブグループの不等の重要性を反映するために、本実施形態によるミキシングシステム100は、1次制限因子を区間L≦α≦Uから選択し、2次制限因子を区間L≦α≦Uから選択することができる。適切には、L,L>0である。
これについて、これから、例によって示す。その例では、上限が等しく(そのことが、可能な場合には最大ダウンミキシング係数によって表現されるミキシング割合〔プロポーション〕を保持する)かつ1である、すなわちU=U=1であると仮定される。さらに、
Figure 2013546021
であると仮定される。
明らかに、式(6)にてak1+ak4=0.5でありかつak2=0.4である状況では、利得制限は全く必要とされないため、制限因子は、(α,α)=(1,1)に設定され、それでも範囲内条件を満たすことができる、すなわち、最大ダウンミキシング係数がダウンミキシング係数として適用される。
さて、式(6)にてak1+ak4=0.8でありかつak2=0.4である場合、範囲内条件|y|≦1は、図2に示す
Figure 2013546021
および
Figure 2013546021
の角を有する五角形エリア内の制限因子対(α,α)によって満たされる。既に述べた理由で、利得は、好ましくは必要以上に制限されず、相応して、システム100は、好ましくは、
Figure 2013546021

Figure 2013546021
との間のエッジセグメントから制限因子を選択することによって、上方の(または、「シャープな」)解y=1を見出そうと試みる。さらに、1次入力チャネルではなく2次入力チャネルを制限することが有利であり、これは、このセグメント上で右端(最も大きいα)の制限因子の対を選択することに相当する。これは、解
Figure 2013546021
をもたらし、k番目の出力信号は、
Figure 2013546021
で与えられることになる。しかし、
Figure 2013546021
である場合、1次制限因子αは、必ず、その上限U=1より小さいであろう。2次サブグループに比べて1次サブグループを最大限有利にするために、制限因子の好ましい選択は、
Figure 2013546021
である。
この実施形態に対する変形では、システム100が先の節の例で述べた方法と異なる方法で制限因子を探索するように構成され、1次サブグループは、2次サブグループより大きい下限に関連付けられる、すなわち、L>Lであることによって有利されることができる。
一実施形態では、ミキシングシステム100は、最大ダウンミックス係数に基づいて制限因子に関する適した上限および下限を決定することができる。範囲内条件が−1≦Y≦1である場合、数W≦1が与えられ、限界が、
Figure 2013546021
の形態で書かれ、次に、この実施形態は、
Figure 2013546021
を使用する。ここで、Pは、1次サブグループの信号に適用されるダウンミックス係数の絶対値の和であり、Sは、2次サブグループの信号に適用されるダウンミックス係数の絶対値の和である。定数0<Q<1の値を変動させることによって、1次信号よりむしろ2次信号を制限するというシステム100の傾向が、いくぶん顕著にされうる。先に論じた例では、P=|ak1|+|ak4|でありかつS=|ak2|である。
図3Aおよび図3Bでは、網点を付した領域は、2重不等式
−1≦W(mP+mS)≦1
を満たす制限因子の選択(α,α)を示し、この2重不等式は、全ての入力信号が1の大きさを有しかつダウンミックス係数と同じ符号を持つ、すなわち、あるkについて、全てのlについてakl=|akl|である、または、全てのlについてakl=−|akl|である最悪ケースの状況において、上記の範囲内条件が帰するものである。斜線の部分領域は、1次信号が2次信号より小さくなる制限因子の選択を示す。公式(7)、(8)の下限は、範囲内条件が、最悪ケースにおいて、ちょうど満たされる(すなわち、「シャープに」満たされる)制限値の選択を示す。例証のために、定数Qは、1/2に設定された。この実施形態は、制限因子が、これらの値より小さく選択される必要が決してないという認識に基づく。この例示的な実施形態を理解すれば、当業者は、−1≦Y≦1以外の範囲内条件に一般化できるであろう。
図4は、8個のオーディオチャネルを2個のチャネルにダウンミックスするためのミキシングシステム400を示す。システム400が、構成部420とコントローラ(利得制限部)440とミキシング部460とを備える3層構造を有すると言うことができる。構成部420は、システム400の特性を構成設定するパラメータに基づいて、制限因子用についての適した区間を決定するように適応される。制限コントローラ440は、構成部420によって供給される区間に基づいて、またさらに、ミキシング部460によって供給される一定の入力データに基づいて、ミキシング部460によって適用されるダウンミックス係数の値を決定するように適応される。ミキシング部460は、入力オーディオ信号のベクトルX=[L C LFE Ls Rs Lrs Rrs]を受信し、ミキサー462によりまたダウンミックス係数を使用してこれらのベクトルを出力オーディオ信号のベクトルY=[L R]にダウンミックスするように適応される。
ミキシングシステム400は、時間セグメントに分割された信号を扱うように適応される。例として、信号は、参照により組込まれる、論文、J.R.Stuart等「MLP無損失圧縮(MLP lossless compression)」Meridian Audio Ltd.,Huntington,Englandに記載されるデジタル配信フォーマットに適合するとすることができる。この配信フォーマットでは、ブロック(またはアクセスユニット)が、40ないし160個のサンプルから形成され、(リスタート区間に対応する)パケットが、固定数のブロックから形成される。128ブロックからなり、リスタートヘッダを含んでいてもよいパケットを、この例のための時間セグメントと見なす。
構成部420は、最大ダウンミックス係数の行列
Figure 2013546021
を受信し、また、マスキング行列
Figure 2013546021
を受信するためのユニット421を含む。マスキング行列は、入力信号の、1次サブグループ(リスナーのフロントでかつほぼ耳のレベルでの再生のために意図されるL、R、C)および2次サブグループ(Ls Rs Lrs Rrs)への分割を規定する。低周波数効果(LFE)チャネルだけを含む第3のサブグループは、このミキシングシステム400ではどの出力信号にも寄与しない。受信ユニット421は、上記で参照された数値P、Sを計算し、マスク済みミキシング行列
primary8→2=mask・dm8→2
secondary8→2=mask・dm8→2
を形成する。ここで、・は、要素ごとの(またはハダマード(Hadamard))行列乗算を示す。最大ダウンミックス係数が対称であるため、数値は、
P=1+10−3/20およびS=1+1=2
である。
構成部420は、1次および2次のサブグループについて各制限因子に関する上限および下限を計算するためのユニット423、424、434をさらに備える。第1のユニット423は、適用される範囲内条件を決定するパラメータmaxaudioの値、受信ユニット421から得られるP、Sの値に基づいて、またさらに1次および2次の制限因子に関する共通上限Wに基づいて中間値
Figure 2013546021
を決定する。上限Wの値は、システム400への構成パラメータとして第1のユニット423に直接供給されることができる。上限Wの値はまた、図4に示すように、ダイアログノルム値に基づいて上限Wを計算するための変換器422によって供給されることもできる。例証的な例として、上限は、関係
Figure 2013546021
によって与えられることができる。ここで、dialnorm8chは、オーディオの8チャネル入力表現に関するダイアログノルムを示し、dialnorm2chは、2チャネル出力表現での所望のダイアログノルムである。上限および下限の計算に戻って、第2のユニット424は、式(8)によって与えられた変数m、mを、αに基づいて評価するように適応される。最後に、第3および第4のユニット425、426は、m、Wおよびm、Wをそれぞれ受信し、式(7)を使用して、制限因子に関する1次および2次の上限および下限を導出するように適応される。
ここでコントローラ440を考えると、出力チャネルLは、パラメータmaxaudioによって規定される範囲内条件を満たすために、1次および2次の制限因子αPL、αSLがどんな値を持つことを必要とされるかを判定するための関連するリミター442を有する。リミター442は、一時に1つの時間セグメントについての値を決定し、また、先に述べた方法でこれを実行し、2次入力信号に比べて1次入力信号を有利にするように構成されることができる。所与の時間セグメントについて、リミター442は、その決定を、範囲内パラメータmaxaudioと、制限因子α,αを選択することをリミター442が許容される区間[L,U]、[L,U]と、またさらにその時間セグメントについての入力信号データとに基づかせる。この実施形態では、入力データは、
Figure 2013546021
および
Figure 2013546021
によって与えられる信号L2P、L2Sの形態で、予備的ミキサー441からリミター442に供給される。予備的ミキサー441は、入力信号Xまたは、可能性としては、L2P、L2S、R2P、R2Sを計算するのに十分なサブセット(たとえば、LFEを含まないサブセット)を得るために入力ポート461に通信可能に接続される。他の出力チャネルR用のリミター443は、L2P、L2Sの代わりに信号R2P、R2Sを受信し、αPR、αSRを出力することを除いて、Lリミター442と同様な方法で構成される。
その後、出力チャネルに進む入力チャネル間の均衡を回復するために、レフトおよびライトの1次制限因子αPL、αPRが、α=min{αPL,αPR}を返すように適応された最小抽出器444に送給される。同様に、レフトおよびライトの2次制限因子αSL、αSRが、α=min{αSL,αSR}を出力するように適応されたさらなる最小抽出器445に供給される。
この実施形態では、1次および2次の制限因子の時間シーケンスα(n)、α(n)(nは時間セグメント指数である)の平滑化が、レギュラライザ446、447によって実施され、レギュラライザ446、447は、制限因子の平滑化されたシーケンス
Figure 2013546021
を返す。レギュラライザ446、447の機能は、以下でより詳細に述べられる。この実施形態では、レギュラライザ446、447は、制限因子の目下の値より多くの値にレギュラライザ446、447が作用することを可能にする各バッファ448、449によって支援される。バッファ448、449は、シフトレジスタとして実現されることができる。
コントローラ440によって実行される最終ステップとして、乗算器450、451および加算器452は、平滑化済み制限因子およびマスク済みミキシング行列を使用して、n番目の時間セグメントにおいて適用される以下のダウンミックス行列
Figure 2013546021
を計算する。
既に述べたように、ミキシング部460は、入力信号Xを受信し、これらの信号を予備的ミキサー441に供給するための入力ポート461を備える。入力ポート461は、入力信号Xをミキサー461にさらに提供し、ミキサー461は、ダウンミックス行列を受信し、式
Figure 2013546021
を評価するように適応される。
図5は、レギュラライザ446、447の一方または両方によって提供される平滑化の例を示す。平滑化前の制限因子(上の曲線)と平滑化後の制限因子(下の曲線)が片対数図にプロットされている。最大(絶対)変化レート条件が満たされることを保証するために、高い入力信号値によって引起される場合がある未平滑化値におけるシャープな下方ピークは、平滑化済みの値における幅広化されたピークに対応する。この例では、幅広化は両側性である。さらに、ピークの位置と振幅が共に保持される。ルックアヘッドフィルタによってこれを達成することが可能である。許容可能な変化レートR[信号ユニット/時間セグメント]および信号の大きさの最大期待変化A[信号ユニット]について、適したタップ数は、
Figure 2013546021
であり、ルックアヘッド期間は、ほぼタップの数にセグメント長を乗算した値であることになる。平滑化時に、既に述べたように、ダウンミックス係数の個々のセグメントごとの値を、増加させることによって調整することは賢明でない。その理由は、このことが、平滑化によって影響を受けた時間セグメントにおいて範囲内条件に違反する場合があるからである。
アナログ実装態様では、レギュラライザ446、447は、参照により組込まれる米国特許第3,252,105号によって例示される種類のレート制限フィルタによって実現されることができる。こうしたフィルタは、好ましくは、適切な遅延線と共に適用されて、制限因子とダウンミックスされる入力信号の十分な同期を保証する。図4に示す実施形態では、入力ポート461とミキサー462との間に遅延線が配置され、バッファ448、449のサイズに対応することができる。
本発明のさらなる実施形態は、上記の説明を検討した後に当業者に明らかになるであろう。本説明および図面は実施形態および例を開示しているが、本発明は、これらの特定の例に制限されない。多数の変更および変形が、添付特許請求の範囲によって規定される本発明の範囲から逸脱することなく行われうる。
上記で開示したシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェア、またはその組合せとして実装されることができる。ハードウェア実装では、上記の説明において言及される機能ユニット間のタスクの分割は、必ずしも物理的なユニットへの分割に対応しない。逆に、1つの物理コンポーネントは、複数の機能を有することができ、1つのタスクは、いくつかの物理コンポーネントによって共同で実行されることができる。いくつかのコンポーネントまたは全てのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよいし、または、ハードウェアまたは特定用途向け集積回路として実装されてもよい。こうしたソフトウェアは、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含むことができるコンピュータ可読媒体上に分散されることができる。当業者によく知られているように、コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶するための任意の方法または技術で実装される揮発性と不揮発性の両方の、取外し可能なおよび取外し不能な媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたは他の磁気記憶デバイス、あるいは、所望の情報を記憶するために使用されることができ、かつ、コンピュータによってアクセスされることができる任意の他の媒体を含むが、それに限定されない。さらに、通信媒体は、通常、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを、搬送波などの変調データ信号または他の輸送メカニズムにおいて具現化し、任意の情報送達媒体を含むことが当業者によく知られている。

Claims (51)

  1. 入力データを含む複数の入力オーディオ信号を少なくとも1つの出力オーディオ信号にダウンミックスする方法であって、
    最大ダウンミックス係数が予め規定され、前記少なくとも1つの出力信号に関する少なくとも1つの範囲内条件が予め規定され、前記入力信号は、予め規定されたサブグループに分割されており、当該方法は、
    前記入力データに鑑みて前記少なくとも1つの出力信号に関する範囲内条件を満たすよう、ダウンミックス係数を、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定すること、および、
    前記ダウンミックス係数を適用して前記入力信号をダウンミックスすることを含む方法。
  2. 入力信号の前記サブグループの少なくとも1つのサブグループは、2つ以上の入力信号を含む請求項1に記載の方法。
  3. サブグループ内の入力信号は、空間的に関連するオーディオチャネルに対応する請求項1に記載の方法。
  4. あるサブグループが、レフトおよびライトチャネルを含む請求項3に記載の方法。
  5. あるサブグループが、レフト、ライト、およびセンターチャネルを含む請求項4に記載の方法。
  6. 前記ダウンミックス係数は、前記範囲内条件が、高々20%のマージンで、好ましくは高々10%のマージンで、最も好ましくは高々5%のマージンで満たされるように決定される請求項1に記載の方法。
  7. 前記出力信号は、時間セグメントに分割され、ダウンミックス係数のセグメントごとのセットが、複数の時間セグメントのそれぞれについて、その時間セグメント内の入力データに鑑みて独立に出力信号上限を満たすよう、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定される請求項1に記載の方法。
  8. 前記複数のオーディオ信号は、空間的に関連するチャネルに対応する少なくとも2つの出力オーディオ信号にダウンミックスされ、
    ダウンミックス係数のセグメントごとのセットが、複数の時間セグメントのそれぞれについて、その時間セグメント内の入力データに鑑みて独立に、前記少なくとも2つの空間的に関連する出力信号のそれぞれに関する範囲内条件を連携して満たすよう、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定される請求項7に記載の方法。
  9. ダウンミックス係数の前記セグメントごとのセットからダウンミックス係数のセグメントごとの値のシーケンスを定義すること、
    前記ダウンミックス係数のセグメントごとの値の前記シーケンスを平滑化すること、および、
    前記平滑化されたセグメントごとの値を適用して前記入力信号をダウンミックスすることをさらに含む請求項8に記載の方法。
  10. セグメントごとの値の前記シーケンスは、変化レート上限を適用することによって平滑化される請求項9に記載の方法。
  11. セグメントごとの値の前記シーケンスは、前記変化レート上限を満たすために、前記セグメントごとの値を維持するまたは減少させることによって平滑化される請求項10に記載の方法。
  12. 少なくとも1つのサブグループが、そのサブグループについての前記制限因子に関する下限に関連付けられる請求項1に記載の方法。
  13. 1次および2次のサブグループが予め規定され、前記1次サブグループに関連付けられる前記制限因子に関する下限は、前記2次サブグループに関連付けられる前記制限因子に関する下限より大きい請求項12に記載の方法。
  14. 1次および2次のサブグループが予め規定され、前記1次サブグループは、前記制限因子に関する上限に関連付けられ、
    ダウンミックス係数を前記決定することは、前記1次サブグループについての前記制限因子の値として、前記1次サブグループについての前記制限因子に関する前記上限を有利にすることを含む請求項1に記載の方法。
  15. 1次および2次のサブグループが予め規定され、それぞれは、前記制限因子に関する各下限および各上限に関連付けられ(L≦α≦U,L≦α≦U)、
    ダウンミックス係数を前記決定することは、
    前記1次サブグループ制限因子がその上限に等しくなるように、制限因子のサブスペース内で(α=U,L≦α≦U)前記少なくとも1つの出力信号に関して前記範囲内条件を満たすように最初に試みるサブステップと、
    さらに、前記最初の試みが失敗する場合、前記2次サブグループ制限因子がその下限に等しくなるように、制限因子のサブスペース内で(L≦α≦U,α=L)前記少なくとも1つの出力信号に関して前記範囲内条件を満たすように試みるサブステップとを含む請求項14に記載の方法。
  16. 前記1次サブグループは、以下のグループ、すなわち、
    (i)リスナーに対してフロントハーフスペース内に位置するオーディオ源による再生用のチャネル、
    (ii)リスナーと実質的に同じ高さに位置するオーディオ源による再生用のチャネル
    のうちの1つのグループからのチャネルに対応し、
    前記2次サブグループは、(i)または(ii)以外のチャネルに対応する請求項13から15のいずれか1項に記載の方法。
  17. 前記1次サブグループは、以下のグループ、すなわち、
    (iii)フロントチャネル、
    (iv)センターチャネル、
    (v)ワイドチャネル
    のうちの1つのグループからのチャネルに対応し、
    前記2次サブグループは、(iii)、(iv)、または(v)以外のチャネルに対応する請求項16に記載の方法。
  18. 少なくとも1つのサブグループは、前記制限因子に関する上限に関連付けられる請求項1に記載の方法。
  19. 2つ以上のサブグループは、前記制限因子に関する共通の上限に関連付けられる請求項18に記載の方法。
  20. 前記複数の入力オーディオ信号は、空間的に関連するチャネルに対応する少なくとも2つの出力オーディオ信号にダウンミックスされ、
    ダウンミックス係数は、前記少なくとも2つの空間的に関連する出力信号のそれぞれに関する前記範囲内条件を連携して満たすよう、前記最大ダウンミックス係数と各サブグループおよび全ての出力信号内で共通である制限因子との積として決定される請求項1に記載の方法。
  21. ダウンミックス係数を前記決定することは、
    サブグループ内の入力信号が寄与する出力信号のそれぞれについて、ダウンミックス係数を前記最大ダウンミックス係数と予備的制限因子との積として決定するサブステップと、
    前記予備的制限因子の最小を選択することによって前記サブグループ内で共通の制限因子を決定するサブステップとを含む請求項20に記載の方法。
  22. 前記出力信号が対応する前記空間的に関連するチャネルは、以下のチャネルグループ、すなわち、
    フロント、サラウンド、リアサラウンド、ダイレクトサラウンド、ワイド、センター、サイド、ハイ、バーチカルハイ
    のうちの1つに属する請求項20に記載の方法。
  23. 複数のオーディオ信号をビットストリームとしてエンコードする方法であって、
    前記複数のオーディオ信号を受信すること、
    請求項1から22のいずれか1項に記載のダウンミックス方法に従って、前記オーディオ信号をダウンミックス信号にダウンミックスすること、および、
    前記ダウンミックス信号をビットストリームとしてエンコードすることを含む方法。
  24. 複数のエンコード済みオーディオ信号および少なくとも1つのダウンミックス仕様を含むビットストリームをデコードする方法であって、前記ダウンミックス仕様は請求項1から22のいずれか1項に記載のダウンミックス方法に従って生成されたものであり、当該方法は、
    前記ビットストリームを受信するステップ、および、
    前記ビットストリームをデコードするステップを含み、
    デコードするステップは、前記ダウンミックス仕様に従って前記オーディオ信号をダウンミックス信号にダウンミックスすることを含む方法。
  25. 予め規定されたサブグループに分割された複数のエンコード済みオーディオ信号および少なくとも1つのダウンミックス仕様を含むビットストリームをデコードする方法であって、
    前記ダウンミックス仕様は、ダウンミックス係数の複数のセットを含み、各サブグループ内でオーディオ信号に適用されるダウンミックス係数間の比は一定であり、一方、異なるサブグループ内でオーディオ信号に適用されるダウンミックス係数間の比は可変であり、当該デコードする方法は、
    前記ビットストリームを受信するステップ、および、
    前記ビットストリームをデコードするステップを含み、
    デコードするステップは、前記ダウンミックス仕様に従って前記オーディオ信号をダウンミックス信号にダウンミックスすることを含む方法。
  26. 請求項1から25のいずれか1項に記載の方法を実施するためのコンピュータ実行可能命令を記憶するデータキャリア。
  27. ミキシングシステム(400)であって、
    入力データを含む複数の入力オーディオ信号を受信するための入力ポート(461)と、
    構成部(420)であって、
    最大ダウンミックス係数、
    前記少なくとも1つの出力信号に関する範囲内条件、および、
    前記入力信号のサブグループへの分割
    を受信するための、構成部(420)と、
    前記入力データに鑑みて、前記少なくとも1つの出力信号に関する範囲内条件を満たすよう、ダウンミックス係数を、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定するコントローラ(440)と、
    前記複数の入力オーディオ信号を少なくとも1つの出力オーディオ信号にダウンミックスするために、前記コントローラによって決定された前記ダウンミックス係数を適用するためのミキサー(462)とを備えるシステム。
  28. 入力信号の前記サブグループの少なくとも1つのサブグループは、2つ以上の入力信号を含む請求項27に記載のシステム。
  29. サブグループ内の入力信号は、空間的に関連するオーディオチャネルに対応する請求項27に記載のシステム。
  30. サブグループは、レフトおよびライトチャネルを含む請求項29に記載のシステム。
  31. サブグループは、レフト、ライト、およびセンターチャネルを含む請求項30に記載のシステム。
  32. 前記コントローラ(440)は、前記範囲内条件が、高々20%のマージンで、好ましくは高々10%のマージンで、最も好ましくは高々5%のマージンで満たされるように前記ダウンミックス係数を決定するように適応される請求項27に記載のシステム。
  33. 前記出力信号は、時間セグメントに分割され、
    前記コントローラ(400)は、複数の時間セグメントのそれぞれについて、その時間セグメント内の入力データに鑑みて独立に出力信号上限を満たすよう、ダウンミックス係数のセグメントごとのセットを、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定するようにさらに適応される請求項27に記載のシステム。
  34. 前記ミキサー(462)は、前記複数のオーディオ信号を、空間的に関連するチャネルに対応する少なくとも2つの出力オーディオ信号にダウンミックスするように適応され、
    前記コントローラ(440)は、複数の時間セグメントのそれぞれについて、その時間セグメント内の入力データに鑑みて独立に、前記少なくとも2つの空間的に関連する出力信号のそれぞれに関する範囲内条件を連携して満たすよう、ダウンミックス係数のセグメントごとのセットを、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定するように適応される請求項33に記載のシステム。
  35. 前記コントローラ(440)は、
    前記ダウンミックス係数のうちの1つの係数のセグメントごとの値のシーケンスをバッファリングするためのメモリ(448,449)と、
    セグメントごとの値の前記シーケンスに基づいて、前記ミキサー(462)によって適用される前記ダウンミックス係数のセグメントごとの値の平滑化されたシーケンスを提供するためのレギュラライザ(446,447)とを備える請求項34に記載のシステム。
  36. 前記レギュラライザ(446,447)は、変化レート上限を満たす前記ダウンミックス係数のセグメントごとの値の平滑化されたシーケンスを提供するように適応される請求項35に記載のシステム。
  37. 前記レギュラライザ(446,447)は、前記変化レート上限を満たすために、前記シーケンス内の各値を維持するまたは減少させることによって前記平滑化されたシーケンスを計算するように適応される請求項36に記載のシステム。
  38. 前記コントローラ(440)は、少なくとも1つのサブグループについて、そのサブグループについての前記制限因子に関する下限を満たすように適応される請求項27に記載のシステム。
  39. 前記コントローラ(440)は、1次サブグループ内の入力信号と2次のサブグループ内の入力信号を、前記2次サブグループについての前記制限因子に関する下限より大きい前記1次サブグループについての前記制限因子に関する下限を満たすことによって、区別するように適応される請求項38に記載のシステム。
  40. 前記コントローラ(440)は、1次サブグループ内の入力信号と2次のサブグループ内の入力信号を、
    前記1次サブグループについての前記制限因子に関する上限を満たすこと、および、
    前記1次サブグループについての前記制限因子の値として、前記1次サブグループについての前記制限因子に関する前記上限を優先すること
    によって区別するように適応される請求項27に記載のシステム。
  41. 前記コントローラ(440)は、1次サブグループ内の入力信号と2次のサブグループ内の入力信号を、
    前記制限因子に関する各下限および各上限を満たす(L≦α≦U,L≦α≦U)こと、
    前記1次サブグループ制限因子がその上限に等しくなるように、制限因子のサブスペース内で(α=U,L≦α≦U)前記少なくとも1つの出力信号に関して前記範囲内条件を満たすように最初に試みること、および、
    さらに、前記最初の試みが失敗する場合、前記2次サブグループ制限因子がその下限に等しくなるように、制限因子のサブスペース内で(L≦α≦U,α=L)前記少なくとも1つの出力信号に関して前記範囲内条件を満たすように試みること
    によって区別するように適応される請求項40に記載のシステム。
  42. 前記1次サブグループは、以下のグループ、すなわち、
    (i)リスナーに対してフロントハーフスペース内に位置するオーディオ源による再生用のチャネル、
    (ii)リスナーと実質的に同じ高さに位置するオーディオ源による再生用のチャネル
    のうちの1つのグループからのチャネルに対応し、
    前記2次サブグループは、(i)または(ii)以外のチャネルに対応する請求項39から41のいずれか1項に記載のシステム。
  43. 前記1次サブグループは、以下のグループ、すなわち、
    (iii)フロントチャネル、
    (iv)センターチャネル、
    (v)ワイドチャネル
    のうちの1つのグループからのチャネルに対応し、
    前記2次サブグループは、(iii)、(iv)、または(v)以外のチャネルに対応する請求項42に記載のシステム。
  44. 前記コントローラ(440)は、少なくとも1つのサブグループについて、そのサブグループについての前記制限因子に関する上限を満たすように適応される請求項27に記載のシステム。
  45. 前記コントローラ(440)は、2つ以上のサブグループについて、それらのサブグループについての前記制限因子に関する共通の上限を満たすように適応される請求項44に記載のシステム。
  46. 当該システム(400)は、前記複数の入力オーディオ信号を、少なくとも2つの空間的に関連する出力オーディオ信号にダウンミックスするために、前記コントローラ(440)によって決定される前記ダウンミックス係数を適用するように適応され、
    前記コントローラ(440)は、前記出力信号のそれぞれに関して前記範囲内条件を連携して満たすよう、ダウンミックス係数を、前記最大ダウンミックス係数と各サブグループおよび全ての前記出力信号内で共通である制限因子との積として決定するように適応される請求項27に記載のシステム。
  47. 前記コントローラ(440)は、
    サブグループ内の入力信号が寄与する出力信号のそれぞれについて、ダウンミックス係数を前記最大ダウンミックス係数と予備的制限因子との積として決定する手段(442,443)と、
    前記予備的制限因子の最小を決定する最小抽出器(444,445)とを備える請求項46に記載のシステム。
  48. 前記出力信号が対応する前記空間的に関連するチャネルは、以下のチャネルグループ、すなわち、
    フロント、サラウンド、リアサラウンド、ダイレクトサラウンド、ワイド、センター、サイド、ハイ、バーチカルハイ
    のうちの1つに属する請求項46に記載のシステム。
  49. 複数のオーディオ信号をビットストリームとしてエンコードするためのエンコーディングシステムであって、
    前記複数のオーディオ信号を受信するように適応された請求項27から48のいずれか1項に記載のミキシングシステムと、
    前記ミキシングシステムから得られる出力信号をビットストリームとしてエンコードするためのエンコーダとを備えるエンコーディングシステム。
  50. 複数のエンコード済みオーディオ信号および少なくとも1つのダウンミックス仕様を含むビットストリームをデコードするためのデコーディングシステムであって、前記ダウンミックス仕様は請求項27から48のいずれか1項に記載の入力ポート、構成部、およびコントローラによって生成されたものであり、当該デコードするシステムは、
    前記ビットストリームをデコードされたオーディオ信号としてデコードするデコーダと、
    前記複数のオーディオ信号をダウンミックス信号にダウンミックスする請求項27から48のいずれか1項に記載のミキサーとを備えるデコーディングシステム。
  51. ビットストリームをデコードするデコーディングシステムであって、
    予め規定されたサブグループに分割された複数のエンコード済みオーディオ信号、および、少なくとも1つのダウンミックス仕様を含むビットストリームを受信するための入力ポートであって、前記ダウンミックス仕様は、ダウンミックス係数の複数のセットを含み、各サブグループ内でオーディオ信号に適用されるダウンミックス係数間の比は一定であり、一方、異なるサブグループ内でオーディオ信号に適用されるダウンミックス係数間の比は可変である、入力ポートと、
    前記ビットストリームをデコードされたオーディオ信号としてデコードするためのデコーダと、
    前記複数のオーディオ信号をダウンミックス信号にダウンミックスするために前記ダウンミックス係数を適用するためのミキサーとを備えるデコーディングシステム。
JP2013538876A 2010-11-12 2011-11-10 ダウンミックス制限 Active JP5684917B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41323710P 2010-11-12 2010-11-12
US61/413,237 2010-11-12
PCT/US2011/060128 WO2012064929A1 (en) 2010-11-12 2011-11-10 Downmix limiting

Publications (2)

Publication Number Publication Date
JP2013546021A true JP2013546021A (ja) 2013-12-26
JP5684917B2 JP5684917B2 (ja) 2015-03-18

Family

ID=45094240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013538876A Active JP5684917B2 (ja) 2010-11-12 2011-11-10 ダウンミックス制限

Country Status (18)

Country Link
US (1) US9224400B2 (ja)
EP (1) EP2638543B1 (ja)
JP (1) JP5684917B2 (ja)
KR (1) KR101496754B1 (ja)
CN (1) CN103201792B (ja)
AR (1) AR083783A1 (ja)
AU (1) AU2011326473B2 (ja)
BR (1) BR112013011471B1 (ja)
CA (1) CA2815190C (ja)
HK (1) HK1187442A1 (ja)
IL (1) IL225858A (ja)
MX (1) MX2013004922A (ja)
MY (1) MY164714A (ja)
RU (1) RU2565015C2 (ja)
SG (1) SG190050A1 (ja)
TW (1) TWI462087B (ja)
UA (1) UA105336C2 (ja)
WO (1) WO2012064929A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015186535A1 (ja) * 2014-06-06 2015-12-10 ソニー株式会社 オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2704266C2 (ru) * 2014-10-31 2019-10-25 Долби Интернешнл Аб Параметрическое кодирование и декодирование многоканальных аудиосигналов
JP2018101452A (ja) * 2016-12-20 2018-06-28 カシオ計算機株式会社 出力制御装置、コンテンツ記憶装置、出力制御方法、コンテンツ記憶方法、プログラム及びデータ構造

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500656A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3252105A (en) 1962-06-07 1966-05-17 Honeywell Inc Rate limiting apparatus including active elements
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7792670B2 (en) * 2003-12-19 2010-09-07 Motorola, Inc. Method and apparatus for speech coding
KR101120911B1 (ko) 2004-07-02 2012-02-27 파나소닉 주식회사 음성신호 복호화 장치 및 음성신호 부호화 장치
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
KR101236259B1 (ko) 2004-11-30 2013-02-22 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩하는 방법 및 장치
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US20060262936A1 (en) * 2005-05-13 2006-11-23 Pioneer Corporation Virtual surround decoder apparatus
KR20070003594A (ko) * 2005-06-30 2007-01-05 엘지전자 주식회사 멀티채널 오디오 신호에서 클리핑된 신호의 복원방법
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
WO2008044901A1 (en) * 2006-10-12 2008-04-17 Lg Electronics Inc., Apparatus for processing a mix signal and method thereof
WO2011073201A2 (en) 2009-12-16 2011-06-23 Dolby International Ab Sbr bitstream parameter downmix

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500656A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015186535A1 (ja) * 2014-06-06 2015-12-10 ソニー株式会社 オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
CN106465028A (zh) * 2014-06-06 2017-02-22 索尼公司 音频信号处理装置和方法、编码装置和方法以及程序
JPWO2015186535A1 (ja) * 2014-06-06 2017-04-20 ソニー株式会社 オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
CN106465028B (zh) * 2014-06-06 2019-02-15 索尼公司 音频信号处理装置和方法、编码装置和方法以及程序
US10621994B2 (en) 2014-06-06 2020-04-14 Sony Corporaiton Audio signal processing device and method, encoding device and method, and program

Also Published As

Publication number Publication date
AU2011326473B2 (en) 2015-12-24
CA2815190C (en) 2017-06-20
AU2011326473A1 (en) 2013-05-23
EP2638543B1 (en) 2016-01-27
CA2815190A1 (en) 2012-05-18
RU2013126726A (ru) 2014-12-20
IL225858A (en) 2016-09-29
AR083783A1 (es) 2013-03-20
JP5684917B2 (ja) 2015-03-18
US20130230177A1 (en) 2013-09-05
US9224400B2 (en) 2015-12-29
WO2012064929A1 (en) 2012-05-18
HK1187442A1 (zh) 2014-04-04
CN103201792A (zh) 2013-07-10
EP2638543A1 (en) 2013-09-18
KR20130080852A (ko) 2013-07-15
RU2565015C2 (ru) 2015-10-10
CN103201792B (zh) 2015-09-09
TWI462087B (zh) 2014-11-21
BR112013011471B1 (pt) 2021-04-27
TW201237847A (en) 2012-09-16
MY164714A (en) 2018-01-30
MX2013004922A (es) 2013-06-28
KR101496754B1 (ko) 2015-02-27
UA105336C2 (ru) 2014-04-25
IL225858A0 (en) 2013-06-27
SG190050A1 (en) 2013-06-28
BR112013011471A2 (pt) 2020-11-24

Similar Documents

Publication Publication Date Title
KR100933548B1 (ko) 비상관 신호의 시간적 엔벨로프 정형화
JP7009437B2 (ja) マルチチャネル・オーディオ信号のパラメトリック・エンコードおよびデコード
JP2021101242A (ja) 相関分離フィルタの適応制御のための方法および装置
KR102426965B1 (ko) 대화 향상을 위한 디코딩 방법 및 디코더
JP2017535153A (ja) オーディオ・エンコーダおよびデコーダ
JP5684917B2 (ja) ダウンミックス制限
JP2023530409A (ja) マルチチャンネル入力信号内の空間バックグラウンドノイズを符号化および/または復号するための方法およびデバイス
JP2022530338A (ja) オーディオコーデックにおける会話拡張
KR20230035089A (ko) 패킷 손실 은닉
RU2798759C2 (ru) Параметрическое кодирование и декодирование многоканальных аудиосигналов

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150115

R150 Certificate of patent or registration of utility model

Ref document number: 5684917

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250