JP2014206747A - ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム - Google Patents

ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム Download PDF

Info

Publication number
JP2014206747A
JP2014206747A JP2014111756A JP2014111756A JP2014206747A JP 2014206747 A JP2014206747 A JP 2014206747A JP 2014111756 A JP2014111756 A JP 2014111756A JP 2014111756 A JP2014111756 A JP 2014111756A JP 2014206747 A JP2014206747 A JP 2014206747A
Authority
JP
Japan
Prior art keywords
signal
downmix
rendering
audio
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014111756A
Other languages
English (en)
Inventor
ユールゲン ヘレ
Herre Jurgen
ユールゲン ヘレ
アンドレーアス ヘルツァー
Hoelzer Andreas
アンドレーアス ヘルツァー
レオニード テレンチエフ
Terentiev Leonid
レオニード テレンチエフ
トルステン カストナー
Kastner Thorsten
トルステン カストナー
コルネリア ファルヒ
Cornelia Falch
コルネリア ファルヒ
ハイコ プルンハーゲン
Heiko Purnhagen
ハイコ プルンハーゲン
ヨナス エングデガルド
Engdegard Jonas
ヨナス エングデガルド
ファルコ リッダーブッシュ
Falko Ridderbusch
ファルコ リッダーブッシュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Friedrich Alexander Univeritaet Erlangen Nuernberg FAU
Dolby International AB
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Friedrich Alexander Univeritaet Erlangen Nuernberg FAU
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Friedrich Alexander Univeritaet Erlangen Nuernberg FAU, Dolby International AB filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of JP2014206747A publication Critical patent/JP2014206747A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Abstract

【課題】ダウンミックス信号表現およびオブジェクト関連のパラメトリック情報に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給する。
【解決手段】アップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置は、パラメータ調整器を含む。パラメータ調整器は、一つ以上の入力パラメータを受け、それに基づいて、一つ以上の調整されたパラメータを供給するように構成される。パラメータ調整器は、非最適パラメータの使用により生じたアップミックス信号表現の歪みが、少なくとも、所定の偏差以上に最適パラメータから外れている入力パラメータのために低減されるように、一つ以上の入力パラメータおよびオブジェクト関連のパラメトリック情報に依存して、一つ以上の調整されたパラメータを供給するように構成される。
【選択図】図1

Description

本発明による実施形態は、ダウンミックス信号表現およびオブジェクト関連のパラメトリック情報に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置に関する。
本発明による他の実施形態は、オーディオ信号デコーダに関する。
本発明による他の実施形態は、オーディオ信号トランスコーダに関する。
本発明による更なる他の実施形態は、一つ以上の調整されたパラメータを供給する方法に関する。
更なる他の実施形態は、ダウンミックス信号表現、オブジェクト関連のパラメトリック情報および所望のレンダリング情報に基づいた複数のアップミックスオーディオチャンネルを、アップミックス信号表現として、供給するための方法に関する。
さらに、他の実施形態は、ダウンミックス信号表現、オブジェクト関連のパラメトリック情報および所望のレンダリング情報に基づいて、ダウンミックス信号表現およびチャンネル関連のパラメトリック情報を、アップミックス信号表現として、供給するための方法に関する。
本発明による更なる他の実施形態は、オーディオ信号エンコーダ、エンコードされたオーディオ信号表現およびオーディオビットストリームを供給するための方法に関する。
さらに他の実施形態は、対応するコンピュータ・プログラムに関する。
本発明によるさらに他の実施形態は、歪み回避するオーディオ信号処理のための方法、装置およびコンピュータ・プログラムに関する。
オーディオ処理、オーディオ伝送およびオーディオ記憶装置の当該技術において、ヒアリング印象を改善するためにマルチチャンネル・コンテンツを処理する要望が増加している。マルチチャンネル・オーディオ・コンテンツの使用は、ユーザーに著しい改善をもたらす。例えば、娯楽アプリケーションにおいて改善されたユーザー満足をもたらす、三次元ヒアリング印象は得られうる。しかしながら、マルチチャンネル・オーディオ・コンテンツはまた、スピーカ明瞭度が、マルチチャンネルオーディオ再生を使用することにより改善されうるので、専門的な環境において、例えば、電話会議アプリケーションにおいて、役立つ。
しかし、マルチチャンネル・アプリケーションによって生じた過剰なリソース負荷を回避するために、オーディオ品質とビットレート要求仕様との間のより良いトレードオフを有することもまた望まれる。
近年では、ビットレート効率のよい伝送のためのパラメトリック手法および/または複数のオーディオオブジェクトを含んでいるオーディオシーンの記憶装置は、例えば、バイノーラルキュー符号化(I型)(Binaural Cue Coding)(例えば、参考資料[BCC]を参照)、ジョイントソース符号化(Joint Source Coding)(例えば、参考資料[JSC]を参照)、および、MPEG空間オーディオオブジェクト符号化(Spatial Audio Object Coding)(SAOC)(例えば、参考資料[SAOC1]、[SAOC2]を参照)が提案されている。
これらの技術は、波形整合によってよりは、むしろ知覚的に所望の出力オーディオシーンを再構築することを目的とする。
図8は、この種のシステムのシステム概要(ここでは、MPEG SAOC)を示す。図8に示されたMPEG SAOCシステム800は、SAOCエンコーダ810とSAOCデコーダ820を含む。SAOCエンコーダ810は、複数のオブジェクト信号x1〜xNを受け、それらは、例えば、時間領域信号として、または、時間―周波数領域信号として、(例えば、フーリエ型変換の一組の変換係数の形で、または、QMFサブバンド信号の形で、)示されうる。SAOCエンコーダ810は一般的にまた、ダウンミックス係数d1〜dNを受け、そして、それらは、オブジェクト信号x1〜xNと関連している。ダウンミックス係数の別々の組は、ダウンミックス信号のチャンネルごとに利用可能でありうる。SAOCエンコーダ810は、一般的に、関連したダウンミックス係数d1〜dNによって、オブジェクト信号x1〜xNを結合することによって、ダウンミックス信号のチャンネルを得るように構成される。一般的に、オブジェクト信号x1〜xNよりもダウンミックスチャンネルは少ない。SAOCデコーダ820の側で、オブジェクト信号の(少なくともおおよそ)分離(又は分離処理)を可能にするために、SAOCエンコーダ810は、(ダウンミックスチャンネルとして示された)一つ以上のダウンミックス信号812と補助情報814の両方を供給する。デコーダ側のオブジェクト特有の処理を可能にするために、補助情報814は、オブジェクト信号x1〜xNの特性を示す。
SAOCデコーダ820は、一つ以上のダウンミックス信号812および補助情報814を受けるように構成される。また、SAOCデコーダ820は、一般的に、ユーザー対話情報および/またはユーザー制御情報822を受けるように構成される。そして、それは所望のレンダリング・セットアップを示す。例えば、ユーザー対話情報/ユーザー制御情報822は、スピーカ・セットアップおよびオブジェクト信号x1〜xNを供給するオブジェクトの所望の空間配置を示しうる。

Figure 2014206747

Figure 2014206747
ここで、図9a、図9bおよび図9cを参照して、ダウンミックス信号表現およびオブジェクト関連の補助情報に基づいてアップミックス信号表現を得るための異なる装置が、示される。図9aは、SAOCデコーダ920を含んでいるMPEG SAOCシステム900のブロック略図を示す。SAOCデコーダ920は、分離機能ブロックとして、オブジェクトデコーダ922およびミキサー/レンダラー926を含む。オブジェクトデコーダ922は、例えば、時間領域において、または、時間―周波数領域において示された一つ以上のダウンミックス信号の形におけるダウンミックス信号表現、および、例えば、オブジェクト・メタデータの形で、オブジェクト関連の補助情報に依存して、複数の再構築されたオブジェクト信号924を供給する。ミキサー/レンダラー924は、複数のN個のオブジェクトと関連した再構築されたオブジェクト信号924を受けて、それに基づいて、一つ以上のアップミックスチャンネル信号928を供給する。SAOCデコーダ920において、オブジェクト信号924の抽出は、ミキシング/レンダリング機能からオブジェクト・デコーディング機能の分離を可能にするミキシング/レンダリングと切り離して実行されるが、比較的高い計算煩雑性をもたらす。
ここで図9bを参照して、SAOCデコーダ950を含む他のMPEG SAOCシステム930は、簡単に述べられる。SAOCデコーダ950は、(例えば、一つ以上のダウンミックス信号の形での)ダウンミックス信号表現、および、(例えば、オブジェクト・メタデータの形での)オブジェクト関連の補助情報に依存して、複数のアップミックスチャンネル信号958を供給する。SAOCデコーダ950は、オブジェクト・デコーディングおよびミキシング/レンダリングの分離のないジョイントミキシング処理においてアップミックスチャンネル信号958を得るように構成される連結されたオブジェクトデコーダおよびミキサー/レンダラーを含む。ここで、前記ジョイントアップミックス処理のためのパラメータは、オブジェクト関連の補助情報およびレンダリング情報の両方に依存している。ジョイントアップミックス処理はまた、オブジェクト関連の補助情報の一部であるとみなされるダウンミックス情報にも依存する。
上記をまとめると、アップミックスチャンネル信号928、958の供給は、1つのステップ処理または2つのステップ処理で実行されうる。
ここで図9cを参照して、MPEG SAOCシステム960は、説明される。SAOCシステム960は、(SAOCデコーダではなく、)SAOCtoMPEGサラウンドトランスコーダ980を含む。
SAOCtoMPEGサラウンドトランスコーダは、(例えば、オブジェクト・メタデータの形で)オブジェクト関連の補助情報および、任意選択で、一つ以上のダウンミックス信号およびレンダリング情報に関する情報を受けるように構成される、補助情報トランスコーダ982を含む。補助情報トランスコーダは、受信データに基づいて、(例えば、MPEGサラウンドビットストリームの形で)MPEGサラウンド補助情報を供給するようにも構成される。したがって、補助情報トランスコーダ982は、レンダリング情報、および、任意選択で一つ以上のダウンミックスの内容に関する情報を考慮に入れて、(オブジェクトエンコーダから取り除かれる)オブジェクト関連の(パラメトリック)補助情報をチャンネル関連の(パラメトリック)補助情報に変換するように構成される。
任意選択で、SAOCtoMPEGサラウンドトランスコーダ980は、操作されたダウンミックス信号表現988を得るために、例えば、ダウンミックス信号表現によって示された一つ以上のダウンミックス信号を操作するように構成されうる。しかし、ダウンミックス信号マニピュレータ986は、省略されうる。そうすると、SAOCtoMPEGサラウンドトランスコーダ980の出力ダウンミックス信号表現988は、SAOCtoMPEGサラウンドトランスコーダの入力ダウンミックス信号表現と同一である。ダウンミックス信号マニピュレータ986は、チャンネル関連のMPEGサラウンド補助情報984が、SAOCtoMPEGサラウンドトランスコーダ980の入力ダウンミックス信号表現に基づいて所望のヒアリング印象を供給することを可能としない場合、使用されうる。それは、いくつかのレンダリングの集まりにおける場合でありうる。
したがって、SAOCtoMPEGサラウンドトランスコーダ980は、SAOCtoMPEGサラウンドトランスコーダ980に入力されたレンダリング情報によってオーディオオブジェクトを示す複数のアップミックスチャンネル信号が、MPEGサラウンドビットストリーム984およびダウンミックス信号表現988を受けるMPEGサラウンドデコーダを使用して生成されうるように、ダウンミックス信号表現988およびMPEGサラウンドビットストリーム984を供給する。
上記をまとめると、SAOCエンコードされたオーディオ信号をデコードするための種々の構想が使用されうる。場合によっては、SAOCデコーダは使用される。ダウンミックス信号表現およびオブジェクト関連のパラメトリック補助情報に依存して、アップミックスチャンネル信号(例えば、アップミックスチャンネル信号928、958)を供給する。この構想のための例は、図9aおよび9bに見ることができる。あるいは、SAOCエンコードされたオーディオ情報は、所望のアップミックスチャンネル信号を供給するためにMPEGサラウンドデコーダにより使用されうる、ダウンミックス信号表現(例えばダウンミックス信号表現988)およびチャンネル関連の補助情報(例えばチャンネル関連のMPEGサラウンドビットストリーム984)を得るためにトランスコードされうる。

Figure 2014206747
伝送ビットレート(N個の離散したオブジェクトオーディオ信号または離散システムの代わりにいくつかの補助情報を追加した2、3のダウンミックスチャンネルを送信することが必要なだけである)および計算の煩雑性(その処理煩雑性は、オーディオオブジェクトの数よりむしろ出力チャンネル数に主に関係する)の両方に関して、この種のスキームがはなはだ効率的であることが分かっている。受ける側であるユーザーにとっての更なる利益は、自分の選択(モノラル、ステレオ、サラウンド、バーチャル化されたヘッドホン再生など)のレンダリング・セットアップを選択することの自由を含み、そして、ユーザー対話の機能レンダリングマトリクス、そして出力シーンは、意志、個人選択または他の基準に従ってユーザーによって対話形式で設定され、変更されうる。例えば、他の残りのトーカーとの区別を最大にするために、1つの空間領域において共に1つのグループからトーカーを位置付けすることは、可能である。この相互作用は、デコーダユーザー・インターフェースを供給することによって達成される。
送信された音オブジェクトごとに、その相対レベルおよび(非モノフォニックのレンダリングのために)レンダリングの空間位置は、調整されうる。これは、ユーザーが関連したグラフィカル・ユーザー・インターフェイス(GUI)スライダの位置を変える(例えば:オブジェクトレベル=+5dB、オブジェクト位置=−30度)ように、リアルタイムで起こりうる。

Figure 2014206747

Figure 2014206747
C.ファーラー、F.バウムガルテ、「バイノーラルキュー符号化 −パート2:方式及び応用例」、音声及びオーディオ、IEEE通信 11巻、No.6、2003年11月(C.Faller and F.Baumgarte,"Binaural Cue Coding −PartII:Schemes and applications,"IEEE Trans. on Speech and Audio Proc.,vol.11, no.6, Nov.2003) C.ファーラー、「オーディオソースのパラメトリック・ジョイント符号化」、AES第120回コンベンション、予稿集6752、パリ、2006年(C.Faller,"Parametric Joint−Coding of Audio Sources",120th AES Convention,Paris,2006,Preprint 6752) J.ヘルレ、S.デッシュ、J.ヒルペアト、O.ヘルムース,「SACからSAOCまで ― 空間オーディオのパラメトリック符号化における最近の動向」、AES第22回UKコンベンション、ケンブリッジ、UK、2007年4月(J.Herre,S.Disch,J.Hilpert,O.Hellmuth:"From SAC To SAOC − Recent Developments in Parametric Coding of Spatial Audio",22nd Regional UK AES Conference,Cambridge,UK,April 2007) J.エングデガルド,B.ラーシュ,C.ファルヒ,O.ヘルムース,J.ヒルペアト,A.ヘルツァー,L.テレンチエフ,J.ブレーバールト,J.コッペン,E.スフエイエルス、W.オーメン:「空間オーディオオブジェクト符号化(SAOC) ― パラメトリックオブジェクトベースのオーディオ符号化に関する今後のMPEGスタンダード」、AES第124回コンベンション、予稿集7377、アムステルダム、2008(J.Engdegaard,B.Resch,C.Falch,O.Hellmuth,J.Hilpert,A.Hoelzer,L.Terentiev,J.Breebaart,J.Koppens,E.Schuijers and W.Oomen:"Spatial Audio Object Coding (SAOC) ? The Upcoming MPEG Standard on Parametric Object Based Audio Coding", 124th AES Convention,Amsterdam 2008,Preprint 7377)
この課題は、請求項1に記載のダウンミックス信号表現およびオブジェクト関連のパラメトリック情報に基づいてアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、請求項24に記載のオーディオ信号デコーダ、請求項25に記載のオーディオ信号トランスコーダ、請求項26、請求項27および請求項28に記載の方法、請求項29に記載のオーディオ信号エンコーダ、請求項31に記載の方法、請求項32に記載のオーディオビットストリームおよび請求項34に記載のコンピュータ・プログラムによって解決される。
本発明による実施形態は、ダウンミックス信号表現およびオブジェクト関連のパラメトリック情報に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給する装置を創作する。本装置は、一つ以上の入力パラメータ(例えばレンダリング係数または所望のレンダリングマトリクスの記述)を受け、それに基づいて、一つ以上の調整されたパラメータを供給するように構成されたパラメータ調整器(例えばレンダリング係数調整器)を含む。パラメータ調整器は、非最適パラメータの使用により生じるアップミックス信号表現の歪みが、少なくとも、所定の偏差以上に最適パラメータから外れている入力パラメータについては低減されるように、一つ以上の入力パラメータおよびオブジェクト関連のパラメトリック情報に依存して(例えば、一つ以上のダウンミックス係数、および/または、一つ以上のオブジェクトレベル差値、および/または、一つ以上のオブジェクト間相関値に依存して、)一つ以上の調整されたパラメータを供給するように構成される。
本発明によるこの実施形態は、不適当に選ばれた入力パラメータによって生じるオーディオ信号歪みがアップミックス信号表現の供給のための調整されたパラメータを供給することによって低減されうるという、そして、調整されたパラメータの供給がオブジェクト関連のパラメトリック情報を考慮に入れることによってより良い精度で実行されうるという考えに基づく。オブジェクト関連のパラメトリック情報の使用により、可聴歪みを所定の範囲内に保つことに適している、または、入力パラメータと比較したときに可聴歪みを低減することに適している、調整されたパラメータを供給することを同時に可能にする、入力パラメータの使用によって生じる可聴歪みの評価尺度を得ることを可能にすることが分かっている。オブジェクト関連情報は、例えば、オーディオオブジェクトの特性を示す、および/または、オブジェクトのエンコーダ側での処理に関する情報を伝える。
したがって、不適当なパラメータ(例えば不適当なレンダリング係数)の使用によって生じる望ましくなく、しばしば悩ますオーディオ信号歪みは、一つ以上の調整されたパラメータを供給することにより、低減されうる、又は、回避さえされうる。ここで、パラメータの調整のためのオブジェクト関連のパラメトリック情報の考慮は、可聴歪みの比較的信頼性が高い推定を可能にすることによってオーディオ信号歪みの有効な減少および/または制限を確実にすることに役立つ。
好ましい実施形態において、本装置は、入力パラメータとして、アップミックス信号表現によって示された一つ以上のチャンネルの複数のオーディオオブジェクト信号の所望の強度スケーリングを示している所望のレンダリングパラメータを受けるように構成される。この場合、パラメータ調整器は、一つ以上の所望のレンダリングパラメータに依存して、一つ以上の実際のレンダリングパラメータを供給するように構成される。不適当なレンダリングパラメータの選択がアップミックス信号表現の有意な(そして、しばしば可聴な)劣化をもたらすことが分かっている。そして、それはこの種の不適当に選ばれたレンダリングパラメータを使用して得られる。また、オブジェクト関連のパラメトリック情報が、(入力パラメータによって定義されうる)レンダリングパラメータの与えられた選択により導入される歪みの推定を可能にするので、レンダリングパラメータがオブジェクト関連のパラメトリック情報に依存して、効率的に調整されうることが分かっている。
好ましい実施形態において、パラメータ調整器は、歪み基準値が、レンダリングパラメータ限界値により定められた限界に従っているレンダリングパラメータ値のための所定の範囲内にあるように、オブジェクト関連のパラメトリック情報およびオーディオオブジェクト信号の寄与量を示しているダウンミックス情報に依存して、一つ以上のレンダリングパラメータ限界値を得るように構成される。この場合、パラメータ調整器は、実際のレンダリングパラメータが、レンダリングパラメータ限界値により定められた限界に従うように、所望のレンダリングパラメータおよび一つ以上のレンダリングパラメータ限界値に応じて、実際のレンダリングパラメータを得るように構成される。レンダリングパラメータ限界値を計算することは、可聴歪みが歪み基準値に従う許容範囲内にあることを確実にするための計算的に単純で信頼性が高いメカニズムから成る。
好ましい実施形態において、パラメータ調整器は、一つ以上のレンダリングパラメータ限界値に従うレンダリングパラメータを使用してレンダリングされた、複数のオブジェクト信号のレンダリングされた重ね合わせにおけるオブジェクト信号の相対的な寄与量が、ダウンミックス信号のオブジェクト信号の相対的な寄与量とほんの所定の差しか異ならないように、一つ以上のレンダリングパラメータ限界値を得るように構成される。前記相対的な寄与量の大きな差は、一般的に可聴歪みをもたらすが、オブジェクト信号のレンダリングされた重ね合わせのオブジェクト信号の寄与量が、ダウンミックス信号のオブジェクト信号の寄与量と同じようである場合、歪みが一般的に十分に小さいことが分かっている。これは、ダウンミックス信号表現のオブジェクト信号の(相対的な)レベルと比較したときのオブジェクト信号の(相対的な)レベルの強い変化が、しばしば、アーチファクトをもたらすためである。なぜなら、理想的な方法で異なるオーディオオブジェクトのオブジェクト信号を分離することは、しばしば不可能であるからである。したがって、オブジェクト信号の相対的な寄与量がレンダリングパラメータの選択によってほどほどにしか変わらないようにレンダリングパラメータを調整することは、より良い結果をもたらすことが分かっている。
他の実施形態において、パラメータ調整器は、ダウンミックス信号表現で示されたダウンミックス信号とレンダリングされた信号との間のコヒーレンスを示している歪み尺度が、一つ以上のレンダリングパラメータ限界値に従うレンダリングパラメータを使用してレンダリングされ、所定の範囲にあるように、一つ以上のレンダリングパラメータ限界値を得るように構成される。パラメータ調整器の入力パラメータを形成する所望のレンダリングパラメータの選択は、ダウンミックス信号表現で示されたダウンミックス信号とレンダリングされた信号との間で充分な「類似性」を維持するようになされる必要があることが分かっている。なぜなら、そうでなければ、アップミックス処理において聞こえるアーチファクトを得るリスクがかなり高いからである。
さらに他の好ましい実施形態において、パラメータ調整器は、(調整されたパラメータとして本装置により出力されうる)実際のレンダリングパラメータを得るように、(パラメータ調整器の入力パラメータを形成しうる)所望のレンダリングパラメータの二乗と(例えば、歪み基準値を最小化しているレンダリングパラメータとして定義されうる)最適レンダリングパラメータの二乗との間で1次結合を計算するように構成される。この場合、パラメータ調整器は、所定の閾値パラメータTおよび歪み基準値における1次結合への、所望のレンダリングパラメータの、および、最適レンダリングパラメータの寄与量を決定するように構成される。ここで、歪み基準値は、ダウンミックス信号表現に基づいてアップミックス信号表現を得るために、最適レンダリングパラメータではなく、一つ以上の所望のレンダリングパラメータを使用することによって生じる歪みを示す。この構想は、所望のレンダリングパラメータの充分な影響をまだ維持すると共に、許容できる尺度に歪みを低減することを可能にする。この構想によって、所望の程度に可聴歪みを制限することを考慮しながら、最適レンダリングパラメータと所望のレンダリングパラメータとの間の合理的に良い妥協点が見つかる。
好ましい実施形態において、パラメータ調整器は、知覚的な劣化の計算尺度に依存して、一つ以上の調整されたパラメータを供給するように構成される。そうすると、非最適パラメータの使用により生じ、知覚的な劣化の計算尺度によって示されるアップミックス信号表現の知覚的に評価された歪みは制限される。このようにして、パラメータがヒアリング印象に従って調整されることが成し遂げられうる。それによって、まだユーザーの要求によってパラメータを調整する際の充分な柔軟性を供給すると共に、許容できないほど悪いヒアリング印象を回避する。
好ましい実施形態において、パラメータ調整器は、ダウンミックス信号表現によって示されたダウンミックス信号のための基準を形成する一つ以上の元のオブジェクト信号の特性を示しているオブジェクト特性情報を受けるように構成される。この場合、パラメータ調整器は、アップミックス信号表現に含まれるオブジェクト信号の特性に関するアップミックス信号表現の歪みが、少なくとも、所定の偏差以上に最適パラメータから外れている入力パラメータについては低減されるように、調整されたパラメータを供給するためのオブジェクト特性情報とみなすように構成される。本発明によるこの実施形態は、一つ以上の元のオブジェクト信号の特性が、入力パラメータが適当であるか、又は、調整されなければならないかを評価するために使用されうるという発見に基づく。なぜなら、アップミックス信号の特性が、一つ以上の元のオブジェクト信号の特性に関連があるように、アップミックス信号を供給することが望ましいからである。その理由は、そうでなければ、知覚的な印象は多くの場合著しく劣化するからである。
好ましい実施形態において、パラメータ調整器は、一つ以上の調整されたパラメータを供給するために、オブジェクト特性として、オブジェクト信号調性情報を受ける及びみなすように構成される。オブジェクト信号の調性が、知覚的な印象に重要な影響を及ぼす量であること、および、調性印象を有意に変えるパラメータの選択は、より良いヒアリング印象を有するために回避される必要があることが分かっている。
好ましい実施形態において、パラメータ調整器は、オブジェクト信号調性情報および受け取ったオブジェクト電力情報に依存して、理想的にレンダリングされたアップミックス信号の調性を推定するように構成される。この場合、パラメータ調整器は、推定された調性と入力パラメータを使用して得られるアップミックス信号の調性との間の違いを比較するときに、推定された調性と一つ以上の調整されたパラメータを使用して得られるアップミックス信号の調性との差を低減するために、一つ以上の調整されたパラメータを供給するように、又は、推定された調性と所定の範囲内の一つ以上の調整されたパラメータを使用して得られるアップミックス信号の調性との間の差を維持するように、構成される。この構想を使用して、ヒアリング印象の劣化のための尺度は、レンダリングパラメータの適切な調整を可能にする高い計算効率によって得られうる。
好ましい実施形態において、パラメータ調整器は、入力パラメータの時間及び周波数変化の調整を実行するように構成される。したがって、調整されたパラメータを得るための入力パラメータの調整は、その調整が実際にヒアリング印象の改善をもたらす、又は、ヒアリング印象の有意な劣化を回避する時間又は周波数領域のためだけに実行されうる。
さらに他の好ましい実施形態において、パラメータ調整器はまた、一つ以上の調整されたパラメータを供給するために、ダウンミックス信号表現を考慮するように構成される。ダウンミックス信号表現を考慮に入れることによって、ヒアリング印象のあり得る歪みのより正確な推定を得ることができる。
好ましい実施形態において、パラメータ調整器は、全体の歪み尺度、すなわち複数の種類のアーチファクトを示している歪み尺度の組み合わせを得るように構成される。この場合、パラメータ調整器は、全体の歪み尺度が、ダウンミックス信号表現に基づいてアップミックス信号表現を得るために、最適レンダリングパラメータよりむしろ一つ以上の入力レンダリングパラメータを使用することにより生じる歪みの尺度であるように、全体の歪み尺度を得るように構成される。複数の種類のアーチファクトを示している複数の歪み尺度を組み合わせることによって、ヒアリング印象を調整するためのうまく制御されるメカニズムがつくられる。
本発明による他の実施形態は、アップミックス信号表現として、ダウンミックス信号表現、オブジェクト関連のパラメトリック情報および所望のレンダリング情報に基づいた複数のアップミックスされたオーディオチャンネルを供給するためのオーディオ信号デコーダを創作する。オーディオ信号デコーダは、ダウンミックス信号表現に基づいて、そして、オブジェクト関連のパラメトリック情報、および、アップミックスされたチャンネルへのオブジェクト関連のパラメトリック情報により示されたオーディオオブジェクトの複数のオブジェクト信号の配分を示している実際のレンダリング情報に依存して、アップミックスされたオーディオチャンネルを得るように構成されたアップミキサーを含む。前に述べたように、オーディオ信号デコーダはまた、一つ以上の調整されたパラメータを供給するための装置を含む。一つ以上の調整されたパラメータを供給するための装置は、一つ以上の入力パラメータとして所望のレンダリング情報を受けるように、および、一つ以上の調整されたパラメータを実際のレンダリング情報として供給するように構成される。一つ以上の調整されたパラメータを供給するための装置はまた、最適レンダリングパラメータから外れている実際のレンダリングパラメータの使用により生じたアップミックスされたオーディオチャンネルの歪みが、少なくとも、所定の偏差以上に最適レンダリングパラメータから外れている所望のレンダリングパラメータについては低減されるように、一つ以上の調整されたパラメータを供給するように構成される。
オーディオ信号デコーダにおいて一つ以上の調整されたパラメータを供給するための装置の使用は、不適当に選択された所望のレンダリング情報を用いてオーディオデコーディングを実行することにより生じるだろう強い可聴歪みの生成を回避することを可能にする。
本発明による実施形態は、ダウンミックス信号表現、オブジェクト関連のパラメトリック情報および所望のレンダリング情報に基づいて、アップミックス信号表現として、チャンネル関連のパラメータ情報を供給するためのオーディオ信号トランスコーダを創作する。オーディオ信号トランスコーダは、ダウンミックス信号表現に基づいて、そして、オブジェクト関連のパラメトリック情報、および、アップミックスされたチャンネルへのオブジェクト関連のパラメトリック情報により示されたオーディオオブジェクトの複数のオブジェクト信号の配分を示している実際のレンダリング情報に依存して、チャンネル関連のパラメトリック情報を得るように構成された補助情報トランスコーダを含む。上記のように、オーディオ信号デコーダはまた、一つ以上の調整されたパラメータを供給するための装置を含む。一つ以上の調整されたパラメータを供給するための装置は、一つ以上の入力パラメータとして、所望のレンダリング情報を受け、そして、実際のレンダリング情報として、一つ以上の調整されたパラメータを供給するように構成される。また、一つ以上の調整されたパラメータを供給するための装置は、最適なレンダリングパラメータから外れている、(ダウンミックス信号情報と組み合わせて、)実際のレンダリングパラメータの使用により生じている、チャンネル関連のパラメトリック情報により示されたアップミックスされたオーディオチャンネルの歪みが、少なくとも、所定の偏差以上に最適レンダリングパラメータから外れている所望のレンダリングパラメータについては、低減されるように、一つ以上の調整されたパラメータを供給するように構成される。調整されたパラメータを供給する構想がオーディオ信号トランスコーダと組み合わせた使用にも適していることが分かっている。
本発明による更なる実施形態は、一つ以上の調整されたパラメータを供給するための方法、オーディオ信号をデコードするための方法およびオーディオ信号をトランスコードするための方法を創作する。前記方法は、上で述べられた装置と同じ主要な考えに基づく。
本発明による他の実施形態は、複数のオブジェクト信号に基づいて、ダウンミックス信号表現およびオブジェクト関連のパラメトリック情報を供給するためのオーディオ信号エンコーダを創作する。オーディオエンコーダは、一つ以上のダウンミックス信号が複数のオブジェクト信号の重ね合わせを含むように、オブジェクト信号と関連したダウンミックス係数に依存して、一つ以上のダウンミックス信号を供給するように構成されたダウンミキサーを含む。オーディオエンコーダはまた、オブジェクト信号のレベル差および相関特性を示しているオブジェクト間関係補助情報および一つ以上の個々のオブジェクト信号の個々の特性を示している個々のオブジェクト補助情報を供給するように構成された補助情報供給器を含む。オーディオ信号エンコーダによるオブジェクト間関係補助情報および個々のオブジェクト補助情報の供給が、マルチチャンネルオーディオ信号デコーダ側で可聴歪みを効率よく低減する又は回避さえすることを可能にすることが分かっている。オブジェクト間関係補助情報が、デコーダ側でオブジェクト信号を分離するために使用される一方で、個々のオブジェクト補助情報は、その歪みが許容できる許容差内にあることを示す、オブジェクト信号の個々の特性がデコーダ側で保持されるかを決定するのに使用される。
好ましい実施形態において、個々の補助情報供給器は、個々のオブジェクト補助情報が個々のオブジェクトの調性を示すように個々のオブジェクト補助情報を供給するように構成される。個々のオブジェクトの調性が、歪みのデコーダ側の制限を可能にする心理音響的に重要な量であることが分かっている。
本発明による他の実施形態は、オーディオ信号をエンコードするための方法を創作する。
本発明による他の実施形態は、エンコードされた形で、複数の(オーディオ)オブジェクト信号を示しているオーディオビットストリームを創作する。オーディオビットストリームは、一つ以上のダウンミックス信号を示しているダウンミックス信号表現を含む。ここで、ダウンミックス信号のうちの少なくとも1つは、複数の(オーディオ)オブジェクト信号の重ね合わせを含む。オーディオビットストリームはまた、オブジェクト信号のレベル差および相関特性を示しているオブジェクト間関係補助情報、および、個々のオブジェクト信号の一つ以上の個々の特性を示している個々のオブジェクト補助情報を含む。上記のように、この種のオーディオビットストリームは、マルチチャンネルオーディオ信号の再構築を可能にする。ここで、レンダリングパラメータの不適当な設定によって生じる可聴歪みは、認識され、そして、低減される、又は、除去されさえする。
本発明による更なる実施形態は、上記の述べられた方法を実施するためのコンピュータ・プログラムを創作する。
本発明による実施形態は、同封の図を参照して、以下に説明される。
図1は、ダウンミックス信号表現およびオブジェクト関連のパラメトリック情報に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置のブロック略図を示す。 図2は、本発明の一実施形態による、MPEG SAOCシステムのブロック略図を示す。 図3は、本発明の他の実施形態による、MPEG SAOCシステムのブロック略図を示す。 図4は、ダウンミックス信号への、および、ミックスされた信号へのオブジェクト信号の寄与量の略図を示す。 図5aは、本発明の一実施形態による、モノラルダウンミックスベースのSAOCtoMPEGサラウンドトランスコーダのブロック略図を示す。 図5bは、本発明の一実施形態による、ステレオダウンミックスベースのSAOCtoMPEGサラウンドトランスコーダのブロック略図を示す。 図6は、本発明の実施形態による、オーディオ信号エンコーダのブロック略図を示す。 図7は、本発明の実施形態による、オーディオビットストリームの略図を示す。 図8は、参照MPEG SAOCシステムのブロック略図を示す。 図9aは、分離したデコーダ及びミキサーを用いた参照SAOCシステムのブロック略図を示す。 図9bは、統合されたデコーダ及びミキサーを用いた参照SAOCシステムのブロック略図を示す。 図9cは、SAOCtoMPEGトランスコーダを用いた参照SAOCシステムのブロック略図を示す。
1.図1による、一つ以上の調整されたパラメータを供給するための装置
以下に、ダウンミックス信号表現およびオブジェクト関連パラメトリック情報に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置100は、図1を参照にして説明される。図1は、一つ以上の入力パラメータ110を受けるように構成されるこの種の装置100のブロック略図を示す。入力パラメータ110は、例えば、所望のレンダリングパラメータでありえる。装置100はまた、それに基づいて、一つ以上の調整されたパラメータ120を供給するように構成されもする。調整されたパラメータは、例えば、調整されたレンダリングパラメータでありえる。装置100は、オブジェクト関連のパラメトリック情報130を受けるように更に構成される。オブジェクト関連のパラメトリック情報130は、例えば、複数のオブジェクトを示しているオブジェクトレベル差情報および/またはオブジェクト間相関情報でありえる。装置100は、一つ以上の入力パラメータ110を受け、そして、それに基づいて、一つ以上の調整されたパラメータ120を供給するように構成されるパラメータ調整器140を含む。パラメータ調整器140は、一つ以上の入力パラメータ110およびオブジェクト関連のパラメトリック情報130に依存して、非最適パラメータ(例えば一つ以上の入力パラメータ110)の使用により生じるアップミックス信号表現の歪みが、少なくとも、所定の偏差以上に最適パラメータから外れている入力パラメータについては低減されるように、一つ以上の調整されたパラメータ120を供給するように構成される。
したがって、装置100は、一つ以上の入力パラメータ110を受け、それに基づいて、一つ以上の調整されたパラメータ120を供給する。一つ以上の調整されたパラメータ120を供給する際、装置100は、一つ以上の入力パラメータ110が、ダウンミックス信号表現およびオブジェクト関連のパラメトリック情報130に基づいたアップミックス信号表現の供給を制御するために使用される場合、一つ以上の入力パラメータ110の不変の使用が、許容できないほど高い歪みを生じさせるかどうかを、明示的に又は黙示的に、決定する。このように、少なくとも、一つ以上の入力パラメータ110が不都合な方法で選択される場合、調整されたパラメータ120は、一般的に、一つ以上の入力パラメータ110よりもアップミックス信号表現の供給のためのこの種の装置を調整するためによりよく適している。
したがって、装置100は、一般的に、一つ以上の調整されたパラメータ120に依存してアップミックス信号表現供給器によって供給されるアップミックス信号表現の知覚的な印象を改善する。一つ以上の調整されたパラメータを得るために、一つ以上の入力パラメータの調整のためのオブジェクト関連のパラメトリック情報を使用することは、より良い結果をもたらすことが分かっている。その理由は、一つ以上の調整されたパラメータ120がオブジェクト関連のパラメトリック情報130に対応する場合、アップミックス信号表現の品質は一般的に良いが、その一方、オブジェクト関連のパラメトリック情報130との所望の関係を妨害するパラメータは、一般的に、結果として可聴歪みをもたらすからである。オブジェクト関連のパラメトリック情報は、例えば、一つ以上のダウンミックス信号への(複数のオーディオオブジェクトからの)オブジェクト信号の寄与量を示すダウンミックスパラメータを含みうる。オブジェクト関連のパラメトリック情報はまた、代わりに、または、加えて、オブジェクト信号の特性を示す、オブジェクトレベル差パラメータおよび/またはオブジェクト間相関パラメータを含みうる。オブジェクト信号のエンコーダ側の処理を示しているパラメータおよびオーディオオブジェクト自体の特性を示しているパラメータが、パラメータ調整器120による使用に有益な情報として考慮されうることが分かっている。しかしながら、他のオブジェクト関連のパラメトリック情報130は、代わりに、または、加えて、装置100により使用されうる。
しかし、パラメータ調整器140が、一つ以上の入力パラメータ110に基づいて、一つ以上の調整されたパラメータ120を供給するために付加情報を使用しうる点に留意する必要がある。例えば、パラメータ調整器140は、一つ以上の調整されたパラメータ120の供給を改善するためにさえ、ダウンミックス係数、一つ以上のダウンミックス信号、または、付加情報も任意選択で評価しうる。
2.図2によるシステム
以下に、図2のMPEG SAOCシステム200は、詳細に説明される。
MPEG SAOCシステム200についてのより良い理解を与えるために、所望のシステム仕様書および設計の検討についての概要は、与えられる。その後、システムの構造概要は、与えられる。さらに、複数のSAOC歪み基準値は、述べられる、そして、歪みの制限のためのこれらのSAOC歪み基準値のアプリケーションが説明される。加えて、システム200の更なる拡張が述べられる。
2.1 システム設計考慮
上記のように、伝送ビットレートおよび計算煩雑性に関して、複数のオーディオオブジェクトを含んでいるオーディオシーンのビットレート効率の良い伝送/記憶装置のためのパラメトリック手法は、一般的に効率的である。受け側でこの種のシステムのユーザーのための更なる利益は、自分の選択(モノラル、ステレオ、サラウンド、バーチャル化されたヘッドホン再生など)のレンダリング・セットアップおよびユーザー対話性の機能を選択することの自由を含む。レンダリングマトリクス、ひいては出力シーンは、意志、個人の好み又は他の基準によって対話形式で、設定され、変更されうる。例えば、他の残りのトーカーとの区別を最大化するために、1つの空間領域に共に1つのグループからトーカーを位置付けすることは、可能である。この相互作用は、デコーダユーザー・インターフェースを供給することによって達成される。
伝送された音オブジェクトごとに、レンダリングのその相対レベルおよび(非モノフォニックのレンダリングのために)空間位置は、調整されうる。これは、ユーザーが関連するグラフィカル・ユーザーインターフェイス(GUI)のスライダの位置を変えるときに、リアルタイムで起こりうる(例えば:オブジェクトレベル=+5dB、オブジェクト位置=−30度)。しかし、ダウンミックスの分離/ミックスベースのパラメトリック・アプローチのため、レンダリングされたオーディオ出力の主観的品質がレンダリングパラメータ設定に依存することが分かった。相対的なオブジェクトレベルの変化が空間レンダリング位置の変化(「再パニング」)以上に、最終的なオーディオ品質に影響を及ぼすことが判明した。相対的なパラメータの極端な設定(例えば+20dB)が許容できない出力品質につながることさえありうることも分かっている。これが、単純に、このスキームに基礎をなしている知覚的推定のいくつかを妨害することの結果であるが、商品がユーザー・インターフェースの設定に応じて悪い音響およびアーチファクトを生じることは、やはり許容できない。したがって、例えばシステム200のように、本発明の実施形態は、(ユーザー・インターフェースの設定が「入力パラメータ」とみなされる)ユーザー・インターフェースの設定に関係なく、許容できない劣化を回避することについてのこの課題に対処する。
以下に、SAOC歪みを回避するためのアプローチに関するいくつかの詳細が述べられる。ここで示されるSAOC歪み制限のためのアプローチは、以下の構想に基づく。
●顕著なSAOC歪みは、(入力パラメータとしてみなされうる)レンダリング係数の不適当な選択のために現れる。この選択は、通常、対話型の方法で、(例えば、対話型アプリケーションのためのリアルタイム・グラフィカルユーザーインターフェイス(GUI)を介して)ユーザーによりなされる。従って、ユーザーによって供給されたレンダリング係数を修正する(例えば、特定の計算に基づいてそれらを制限する)、および、SAOCレンダリングエンジンのためにこれらの修正された係数を使用する付加的な処理段階は、導入される。例えば、ユーザーにより供給されたレンダリング係数は、入力パラメータとしてみなされうる。そして、SAOCレンダリングエンジンのための修正された係数は、修正されたパラメータとしてみなされうる。
●生成されたSAOCオーディオ出力の過剰な劣化を制御するために、(歪み尺度DMとしても示された)知覚的な劣化の計算尺度を発現させることは望ましい。この歪み尺度が特定の基準を満たす必要があることが分かっている。
○歪み尺度は、SAOCデコーディングエンジンの内部パラメータから、容易に計算可能でなければならない。例えば、余分なフィルタバンク計算が、歪み尺度を得るために、必要とされないことが望まれる。
○歪み尺度は、主観的に知覚される音質(知覚的な劣化)と相関させる、すなわち、心理音響の基礎を用いてインラインされる必要がある。この目的で、知覚オーディオ符号化及び処理から普通に知られるように、歪み尺度の計算は、周波数選択的な方法で好ましくなされうる。
複数のSAOC歪み尺度が、定められうる、又は、算出されうることが分かっている。しかしながら、SAOC歪み尺度がレンダリングされたSAOC品質の正しい評価に至り、こうして、(必ずではないが)しばしば特定の共通性を有するために、特定の基礎的要素を好ましくは考慮しなければならないことが分かっている。
●それらは、ダウンミックス係数を考慮する。これらは、一つ以上のダウンミックス信号内の各オーディオオブジェクトの相対的な混合比を決定する。基礎的な情報として、生じているSAOC歪みがダウンミックスおよびレンダリング係数の関係に依存することが分かっている点に留意する必要がある。レンダリング係数により定められた相対的なオブジェクト寄与量が、ダウンミックス内の相対的なオブジェクト寄与量とは実質的に異なる場合、修正されたパラメータを使用するSAOCデコーディングエンジンは、それをレンダリングされた出力に変換するために、ダウンミックス信号の考慮すべき調整を実行しなければならない。これは、SAOC歪みをもたらすことが分かっている。
●それらは、レンダリング係数を考慮する。これらは、出力信号にされる一つ以上の各々に、各オーディオオブジェクトの相対的な出力強度を決定する。基礎的な情報として、生じているSAOC歪みも互いに対するオブジェクト電力の関係に依存することが分かっている点に留意する必要がある。ある時点でのオブジェクトが他のオブジェクトよりはるかに高い電力を有する場合、(そして、このオブジェクトのダウンミックス係数がそれほど小さくない場合、)このオブジェクトはダウンミックスを支配して、レンダリングされた出力信号において非常によく再生される。これに反して、弱いオブジェクトは、ダウンミックスにおいて非常に弱く示されるだけであり、このように有意な歪みのない高い出力レベルに達し得ない。
●それらは、その他に関して各オブジェクトの(相対的な)オブジェクト電力/レベルを考慮する。この情報は、例えば、SAOCオブジェクトレベル差(OLD)として示される。基礎的な情報として、生じているSAOC歪みがさらに、個々のオブジェクト信号の特性に依存することが分かっている点に留意する必要がある。例えば、(他のオブジェクトがよりノイズ状である性質でありうるのに対して)レンダリングされた出力の音の性質のオブジェクトをより大きなレベルに増大することは、結果として相当な知覚される歪みをもたらす。
●これに加えて、元のオブジェクト信号の特性に関する他の情報は、考慮されうる。これらは、それからSAOC補助情報の一部としてSAOCエンコーダによって送信されうる。例えば、各オブジェクト項目の調性又はノイジネスについての情報は、SAOC補助情報の一部として送信されえ、歪み制限のために使用されうる。
2.2 システム概要
上記の考慮に基づいて、MPEG SAOCシステム200についての概要は、ここでは、本発明のより良い理解のために与えられる。図2によるSAOCシステム200が、図8によるMPEG SAOCシステム800の拡張したバージョンである点に留意する必要がある。そうすると、上記説明もあてはまる。さらに、MPEG SAOCシステム200が図9a、図9b及び図9cに示される実施態様変形例900、930、960に基づいて修正されうる点に留意する必要がある。ここで、オブジェクトエンコーダは、SAOCエンコーダに対応し、ユーザー対話情報/ユーザー制御情報822は、レンダリング制御情報/レンダリング係数に対応する。
さらにまた、MPEG SAOCシステム100のSAOCデコーダは、分離されたオブジェクトデコーダおよびミキサー/レンダラー装置920と、統合されたオブジェクトデコーダおよびミキサー/レンダラー装置930またはSAOCtoMPEGサラウンドトランスコーダ980と交換されうる。
ここで、図2を参照して、MPEG SAOCシステム200が、1からNまで番号をつけた複数のオブジェクトと関連した、複数のオブジェクト信号x1〜xNを受けるように構成されるSAOCエンコーダ210を含むことが分かる。SAOCエンコーダ210はまた、ダウンミックス係数d1〜dNを受ける(そうでなければ、得る)ように構成される。例えば、SAOCエンコーダ210は、SAOCエンコーダ210によって供給されるダウンミックス信号212のチャンネルごとに、1組のダウンミックス係数d1〜dNを得うる。SAOCエンコーダ210は、例えば、ダウンミックス信号を得るために、オブジェクト信号x1〜xNの重み付けした組み合わせを得るように構成されうる。ここで、オブジェクト信号x1〜xNの各々は、その関連したダウンミックス係数d1〜dNにより重み付けされる。SAOCエンコーダ210はまた、異なるオブジェクト信号の関係を示すオブジェクト間関係情報を得るように構成される。例えば、オブジェクト間関係情報は、例えば、IOCパラメータの形で、例えば、OLDパラメータおよびオブジェクト間相関情報の形で、オブジェクトレベル差情報を含みうる。したがって、SAOCエンコーダ200は、各ダウンミックス信号(またはマルチチャンネル・ダウンミックス信号212のチャンネル)に関連した一組のダウンミックスパラメータに基づいて重み付けされる一つ以上のオブジェクト信号の重み付けされた組み合わせを各々が含む一つ以上のダウンミックス信号212を供給するように構成される。SAOCエンコーダ210は、補助情報214を供給するようにも構成される。ここで、補助情報214は、(例えば、オブジェクトレベル差パラメータおよびオブジェクト間相関パラメータの形で)オブジェクト間関係情報を含む。補助情報214はまた、例えば、ダウンミックス利得パラメータおよびダウンミックスチャンネルレベル差パラメータの形で、ダウンミックスパラメータ情報を含む。補助情報214は、個々のオブジェクト特性を示しうる任意のオブジェクト特性補助情報を更に含みうる。任意のオブジェクト特性補助情報に関する詳細は、後述する。

Figure 2014206747
MPEG SAOCシステム200はまた、一つ以上の入力パラメータ、すなわちレンダリング制御情報又はレンダリング係数242を示している入力パラメータに依存して、一つ以上の修正された(または調整された、または「実際の」)パラメータ、すなわち修正されたレンダリング係数222を供給するための装置240を含む。装置240は、補助情報214の少なくとも一部を受けるようにも構成される。例えば、装置240は、オブジェクト電力(例えばオブジェクト信号x1〜xNの電力)を示しているパラメータ214aを受けるように構成される。例えば、パラメータ214aは、(OLDとして示されもする)オブジェクトレベル差パラメータを含みうる。装置240はまた、好ましくは、ダウンミックス係数を示している補助情報214のパラメータ214bを受ける。例えば、パラメータ214bは、ダウンミックス係数d1〜dNを示す。任意選択で、装置240は、個々のオブジェクト特性補助情報を構成する付加パラメータ214cを更に受けうる。

Figure 2014206747
一つ以上の調整されたパラメータ242を供給するための装置240は、例えば、入力レンダリング係数242を受け、それに基づいて、修正されたレンダリング係数222を供給するレンダリング係数調整器250を含みうる。この目的のために、レンダリング係数調整器250は、入力レンダリング係数242の使用によって生じる歪みを示す歪み尺度252を受けうる。歪み尺度252は、例えば、パラメータ214a、214bおよび入力レンダリング係数242に依存して、歪み計算器260によって供給されうる。
しかし、レンダリング係数調整器250の、および、歪み計算器260の機能はまた、修正されたレンダリング係数222が歪み尺度252の明示的な計算なしで供給されるように、1つの演算器に統合されうる。むしろ、歪み尺度を低減する又は制限する黙示のメカニズムは、適用されうる。

Figure 2014206747
以下に、本発明概念の機能は、簡単に要約される。歪み尺度(DM)を与えられて、オーディオ出力の過剰な歪みは、歪み尺度値が特定の閾値を上回らないように、与えられた信号のための歪み尺度値を計算すること、および、(実際に使用されたレンダリング係数212を制限する)SAOCデコーディングアルゴリズムを修正することによって、回避されうる。この構想によるシステム200は、図2に示され、上記のいくつかの詳細において説明された。
システム200に関して、以下の見解がなされる。
●所望のレンダリング係数242は、ユーザーまたは他のインターフェースによって入力される。
●SAOCデコーディングエンジン220で適用される前に、レンダリング係数242は、歪み計算器260から出力される、一つ以上の計算された歪み尺度252を利用する、レンダリング係数調整器250によって修正される。
●歪み計算器260は、補助情報214(例えば、相対的なオブジェクト電力/OLDs、ダウンミックス係数、および、(任意選択で)オブジェクト信号特性情報)から、情報(例えば、パラメータ214a、214b)を評価する。加えて、それは、所望のレンダリング係数入力242に基づく。
好ましい実施形態において、装置240は、歪み尺度に基づいて、レンダリング係数を修正するように構成される。好ましくは、レンダリング係数は、例えば、周波数選択的な重みを用いた周波数選択的な方法で調整される。
レンダリング係数の修正は、このフレーム(例えば、現在のフレーム)に基づきうる、または、レンダリング係数は、ちょうどフレームごとの基準で時間に関して調整されうるだけでなく、時間に関して処理/制御されうる(例えば時間に関して滑らかにされうる)。ここで、おそらく異なる立ち上がり/減衰定数は、ダイナミックレンジ圧縮器/制限器のためのように適用されうる。
いくつかの実施形態では、歪み尺度は、周波数選択的でありえる。
いくつかの実施形態では、歪み尺度は、以下の特性の一つ以上を考慮しうる。
●各オブジェクトの電力/エネルギー/レベル
●ダウンミックス係数
●レンダリング係数
●適用できる場合、付加的なオブジェクト特性補助情報。
いくつかの実施形態では、歪み尺度は、オブジェクトごとに計算され、全体の歪みに達するように組み合わされうる。
いくつかの実施形態において、付加的なオブジェクト特性補助情報214cは、任意選択で評価されうる。付加的なオブジェクト特性補助情報214cは、拡張されたSAOCエンコーダにおいて、例えば、SAOCエンコーダ210において、抽出されうる。付加的なオブジェクト特性補助情報は、例えば、図7を参照して説明される拡張されたSAOCビットストリームに埋込まれうる。また、付加的なオブジェクト特性補助情報は、拡張されたSAOCデコーダによって歪み制限をすることのために使用されうる。
特殊な場合において、ノイジネス/調性は、付加的なオブジェクト特性補助情報によって示されるオブジェクト特性として使用されうる。この場合、ノイジネス/調性は、補助情報に保存するために他のオブジェクトパラメータ(例えばOLD)よりも非常に粗い周波数分解能によって送信されうる。極端な場合において、ノイジネス/調性オブジェクト特性補助情報は、(例えば、広帯域性として)オブジェクトごとにちょうど1つの情報を有して送信されうる。
2.3 SAOC歪み基準値
以下に、例えば、歪み計算器260を使用して得られうる複数の異なる歪み尺度は説明される。レンダリング係数の制限のためのこれらの歪み尺度のアプリケーションに関する詳細は、セクション2.4で後述する。
換言すれば、このセクションは、いくつかの歪み尺度を概説する。これらは、個々に使用されうる、または、例えば、個々の歪み基準値の重み付け和によって、合成の、より複雑な歪みを形成するように組み合わされうる。用語「歪み尺度(measure)」および「歪み基準値(metric)」が同様の量を示し、ほとんどの場合、区別されることを必要としない点にここでは留意されたい。
以下に、歪み計算器260によって評価されうる、および、入力レンダリング係数242に基づいて、修正されたレンダリング係数222を得るために、レンダリング係数調整器250により使用されうる、複数の歪み基準値は説明される。
2.3.1 歪み尺度#1
以下に、(歪み尺度#.1とも示される)第1の歪み尺度は、説明される。
概念的簡潔さのために、N―1―1 SAOCシステム(例えばモノフォニックのダウンミックス信号(212)および単一のアップミックスチャンネル(信号))は、考慮される。N個の入力オーディオオブジェクトは、モノフォニックの信号にダウンミックスされて、モノラル出力にレンダリングされる。図8において与えられるように、ダウンミックス係数がd1…dNで示されて、そしてレンダリング係数は、r1…rNで示される。以下の式において、時間インデックスは、説明を簡単にするため省略された。同様に、周波数インデックスを無視し、式がサブバンド信号に関係がある点に留意した。下記の方程式のいくつかにおいて、小文字は係数または信号を示し、大文字は対応する電力を意味する。そして、それは式の意味合いから理解できる。また、時間領域においてではなく、信号は、時々対応する時間―周波数領域係数によって示される点に留意する必要がある。

Figure 2014206747
ここで、第1項は、出力信号への影響のあるオブジェクトの所望の寄与量であり、一方、第2項は、すべての他のオブジェクトからの寄与量(「干渉」)を示す。

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747
実際上、これは、歪み基準値が、ダウンミックス(入力)信号に対する理想的なレンダリングされた(出力)信号の相対的なオブジェクト電力寄与量の比率であることを意味する。これは、大きな因数で相対的なオブジェクト電力を変える必要がないときに、SAOCスキームが最も良く機能するという発見と関係がある。
dm1の値を増加させることは、音響オブジェクト#mに関して音質を減少させることを示す。すべてのレンダリング係数が共通の因数によってスケールされる場合、または、すべてのダウンミックス係数が同様にスケールされる場合、dm1の値は一定のままであることが分かっている。また、オブジェクト#mのためのレンダリング係数を増加させること(その相対レベルを増加させること)は、歪みの増加につながることが分かっている。dm1の値は、以下のように解釈されうる。
●1は、オブジェクト#mに関して理想的な品質を示す。
●1より上にdm1値を増加させることは、品質を減少させることを示す。
●1より下のdm1の値は、オブジェクト#mに関して品質を更に改善しない。

Figure 2014206747

Figure 2014206747

Figure 2014206747
この方程式において、msrは、その調性に依存する全体のオーディオ信号のマスク対信号比(Mask―To―Signal―Ratio)である。dm2の値を増加させることは、音響オブジェクト#mに関してより高い歪みを示す。さらにまた、すべてのレンダリング係数が共通の因子によってスケールされる場合、または、すべてのダウンミックス係数が同様にスケールされる場合、dm2の値は一定のままである。dm2の値の範囲は、以下のように解釈されうる。
●0の値は、オブジェクト#mに関して理想的な品質を示す。
●1より上にdm2値を増加させることは、漸進的な可聴劣化を示す。
●1より下のdm2の値は、オブジェクト#mに関して見分けがつかない品質を示す。

Figure 2014206747

Figure 2014206747

Figure 2014206747
2.3.3 歪み尺度#3
ダウンミックス信号とレンダリングされた信号との間のコヒーレンスを示している第3の歪み尺度は、示される。より高いコヒーレンスは、結果としてより良い主観的な音質をもたらす。加えて、IOCデータがSAOCデコーダに存在する場合、入力されたオーディオオブジェクトの相関は考慮されうる。

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747
DM3の値は、以下のように解釈されうる。
●値は、範囲[0…1]にあり、そして、ダウンミックスとレンダリングされた信号との間のコヒーレンスを示す。
●0の値は、理想的な品質を示す。
●DM3値を増加させることは、品質を減少させることを示す。
2.3.4 歪み尺度#4
2.3.4.1 概要
このアプローチは、ターゲットレンダリングエネルギー(UPMIX)と(与えられたダウンミックスDMXから計算される)最適ダウンミックスエネルギーとの間の平均化された加重比率を、歪み尺度として使用することを提案する。
詳細のため、ダウンミックス(DMX)、最適ダウンミックスエネルギー(DMX_opt)およびターゲットレンダリングエネルギー(UPMIX)の図示を示す、図4も参照される。

Figure 2014206747

Figure 2014206747

Figure 2014206747
2.3.4.4 歪み制御
歪み制御は、歪み制御DM4に依存して、一つ以上のレンダリング係数を制限することによって達成される。
(i)尺度がステレオ・ダウンミックスの場合にだけ関連すること、および、(ii)それが#dx=1と#ch=1のためのDM1に減少されうることは、留意されうる。
2.3.4.5 特性
以下に、歪み尺度ナンバー4を計算するための構想の特性が、簡単にまとめられる。その構想は、
●理想的なトランスコーディングとみなす。
●ステレオ・ダウンミックスを処理できる。
●複数のチャンネルレンダリングへの一般化を可能にする。

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747
dm2およびdm2’の同様の拡張は、tおよびTに関して可能性がある。
2.3.6 歪み尺度#6
以下に、第6の歪み尺度は、説明される。

Figure 2014206747
あるいは、また、ヒルベルト包絡線の差信号の電力/分散は、ヒルベルト包絡線自体の分散の代わりに使用されうる。いずれにせよ、その尺度は、時間に関する包絡線の変動の強さを示す。

Figure 2014206747
2.3.7 参照シーンおよびSAOCレンダリングされたシーンのためのソース信号イメージのエネルギーの計算
参照のソース信号イメージのオブジェクトエネルギーおよび歪み尺度のために使用されたSAOCレンダリングされたシーンのために、「歪み尺度5」においてなされるように、SAOCレンダリングされたシーンのためのトランスコーディングマトリクスTを考慮に入れる必要があるが、更に、参照シーンおよびレンダリングされたシーンの両方のために、ソース信号の相関も考慮に入れる必要がある。
注釈:大文字の信号の記号は、ここで、信号のマトリクス記号を示し、前の章においてのような信号エネルギーを示さない。

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747
2.3.8 オブジェクト信号特性
以下に、例えば、歪み尺度を得るために、装置250又はアーチファクト減少320によって使用されうるオブジェクト信号特性の例が、説明される。

Figure 2014206747
2.4 歪み制限スキーム
2.4.1 歪み制限スキームの概要
以下に、複数の歪み制限スキームの簡潔な概要が、与えられる。上記のように、レンダリング係数調整器250は、入力レンダリング係数242を受けて、それに基づいて、SAOCデコーダ220用に修正されたレンダリング係数222を供給する。
修正されたレンダリング係数の供給のための異なる構想は区別されうる。ここで、その構想は、いくつかの実施形態において、組み合わされうる。第1の構想によって、一つ以上のレンダリングパラメータ限界値は、補助情報214の一つ以上のパラメータに依存して(すなわち、オブジェクト関連のパラメトリック情報214に対して依存して)、第1のステップにおいて得られる。その後、実際の「(修正された又は調整された)」レンダリング係数222は、実際のレンダリングパラメータが、レンダリングパラメータ限界値により定められた限界に従うように、所望のレンダリングパラメータ242および一つ以上のレンダリングパラメータ限界値に依存して得られる。したがって、レンダリングパラメータ限界値を上回る、この種のレンダリングパラメータは、レンダリングパラメータ限界値に従うように調整される(修正される)。この第1の構想は、実施するのは容易であるが、時々わずかにユーザー満足度の低下をもたらしうる。その理由は、ユーザーが定めた所望のレンダリングパラメータ242がレンダリングパラメータ限界値を上回る場合、所望のレンダリングパラメータ242のユーザーの選択は考慮に入れなくされるからである。
第2の構想によって、パラメータ調整器は、所望のレンダリングパラメータの二乗と最適レンダリングパラメータの二乗との間の1次結合を計算し、実際のレンダリングパラメータを得る。この場合、パラメータ調整器は、上記のように、所定の閾値パラメータ及び歪み基準値に依存して、その1次結合への所望のレンダリングパラメータの、および、最適レンダリングパラメータの寄与量を決定するように構成される。
加えて、歪み尺度(歪み基準値)がオブジェクト間関係特性および/または個々のオブジェクト特性を使用して計算されるかどうかが、識別されうる。いくつかの実施形態において、(単一のオブジェクトだけに関連がある)個々のオブジェクト特性を考慮に入れないが、オブジェクト間関係特性だけが評価される。いくつかの他の実施形態において、オブジェクト間関係特性を考慮に入れないが、個々のオブジェクト特性だけは考慮される。しかし、いくつかの実施形態において、オブジェクト間関係特性と個々のオブジェクト特性の両方の組み合わせが評価される。
先の考慮に基づいて、そして同じく、異なる歪み尺度の上記説明に基づいて、以下のサブセクションで概説されるように、歪みを制限するための多くのスキームが定められる。歪みを制限するためのこれらのスキームは、入力レンダリング係数242に依存して、修正されたレンダリング係数を得るために、レンダリング係数調整器250によって適用されうる。

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747
制限するプロセスが各特定のフレームの個々のオブジェクトエネルギーに依存することに留意されたい。アプローチは、単純で、以下の軽微な欠点を有する。
●それは、相対的なオブジェクト・ラウドネスも知覚的なマスキングも考慮しない。
●それは、特定のオブジェクトを増大させる効果をとらえるだけでなく、オブジェクト利得を減衰させることによる効果もとらえる。これは、dm値の下限を命令することによってもまた、対処されうる。
2.4.3 制限スキーム#2
2.4.3.1 制限スキーム概要
このセクションは、以下の態様を考慮する制限関数を説明する。
●歪み尺度は、制限閾値によって抑止される。
●制限されたレンダリングマトリクスの導出は、制限関数に、および、元のレンダリングマトリクスまでのその距離に基づく。
この制限関数(または制限スキーム)は、例えば、歪み計算器260と結合したレンダリング係数調整器250によって実行されうる。
歪み尺度は、レンダリングマトリクスの関数であり、その結果、
●(例えば、入力レンダリング係数242によって示された)元のレンダリングマトリクスは、元の歪み尺度を生ずる
●最適歪み尺度は、最適レンダリングマトリクスを生ずるが元のレンダリングマトリクスまでのこの最適レンダリングマトリクスの距離は、最適ではなくてもよい
●歪み尺度は、元のレンダリングマトリクスまでのレンダリングマトリクスの距離に、反比例である
●特定の閾値のために、(例えば、調整された又は修正されたレンダリング係数222によって示された)制限されたレンダリングマトリクスは、元のおよび最適な動作点間の補間(例えば直線補間)で導き出される。

Figure 2014206747
制限スキーム#2は、以下に説明されるように、異なる歪み尺度と組み合わせて使用されうる。

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747

Figure 2014206747
2.4.5 更なる任意の改良
個々に、または、装置240と組み合わせて実行されるレンダリング係数222を制限するための上記の構想は、更に改良されうる。例えば、M―チャンネルレンダリングへの一般化は、実行されうる。この目的のために、レンダリング係数の二乗和/電力は、単一のレンダリング係数の代わりに使用されうる。
また、ステレオ・ダウンミックスへの一般化は、実行されうる。この目的のために、ダウンミックス係数の二乗和/電力は、単一のダウンミックス係数の代わりに使用されうる。
いくつかの実施形態において、歪み尺度は、周波数全体にわたって結合されて、劣化制御のために使用される単一のものとなりうるあるいは、周波数バンドごとにそれぞれに歪み制御をすることが、場合によってはより良い(及びより単純である)こともある。
異なる構想は、実際に歪み制御をするために適用されうる。例えば、一つ以上のレンダリング係数は、制限されうる。代わりに、または、加えて、(例えばMPEGサラウンドデコーディングの)m2マトリクス係数は、制限されうる。代わりに、または、加えて、相対的なオブジェクト利得は、制限されうる。
3.図3による実施形態
以下に、SAOCデコーダの他の実施形態は、図3を参照して説明される。理解を容易にするため、基礎をなす考慮に関する短い議論がまず与えられる。(ISO/IEC 23003―2としての標準化の下でのシステムのような)「空間オーディオオブジェクト符号化」(SAOC)システムの出力は、オーディオオブジェクトの特性およびレンダリングマトリクスとダウンミックスマトリクスの関係に依存するアーチファクトを呈することができる。この問題について述べるために、ダウンミックスおよびレンダリングマトリックスが同じ次元を有する場合は、一般性の喪失なしでここでは考慮される。ダウンミックスおよびレンダリングされたシーンのチャンネル数が異なる場合、対応する考慮は、適用する。
一般に、レンダリングマトリクスがダウンミックスマトリクスとは有意に異なることになるようになるとき、アーチファクトのリスクが増加することが分かっている。異なる種類のアーチファクトは、区別されうる:
1.レンダリングの不完全状態、すなわち、「有効な」レンダリングマトリクスが、SAOCデコーダに入力される所望のレンダリングマトリクスとは異なること(オブジェクトの効果的に得られる減衰又は利得が、レンダリングマトリクスにおいて特定されるものと異なること)。これは、一般的に、特定のパラメータ・バンドのオブジェクトのオーバラップの結果である。
2.オブジェクトの音色の不必要な及びおそらく時間的でさえある変化。このアーチファクトは、1.に述べた「リーク」が単一のパラメータ・バンドのために局所的に生じるだけであるときに、特に厄介である。
3.SAOCデコーダにおいて、時間的及び周波数的信号処理によって引き起こされた変調されたオブジェクト信号、楽音または変調されたノイズのようなアーチファクト。
あらゆる種類のアーチファクトを最小化することが望ましいことが分かった。
この問題に対処するための、および、アーチファクトを最小化するための一般化されたアプローチは、それがSAOCデコーダに送信される前に、所望のレンダリングマトリクスの時間的―周波数的―後処理を行使することである。このアプローチは、図3に示される。
図3は、SAOCデコーダ装置300のブロック略図を示す。SAOCデコーダ300は、オーディオ信号デコーダとして、簡単に示されもしうる。オーディオ信号デコーダ300は、ダウンミックス信号表現312およびSAOCビットストリーム314を受けるように、および、それに基づいて、例えば、複数のアップミックスオーディオチャンネルの表現の形で、レンダリングされたシーンの表示316を供給するように構成されるSAOCデコーダコア310を含む。
オーディオ信号デコーダ300はまた、例えば、一つ以上の入力パラメータに依存して一つ以上の調整されたパラメータを供給するための装置の形で、供給されうる、アーチファクト減少320を含む。アーチファクト減少320は、所望のレンダリングマトリクスに関する情報322を受けるように構成される。情報322は、例えば、アーチファクト減少の入力パラメータを形成しうる、複数の所望のレンダリングパラメータという形をとりうる。アーチファクト減少320は、ダウンミックス信号表現312およびSAOCビットストリーム314を受けるように更に構成される。ここで、SAOCビットストリーム314は、オブジェクト関連のパラメトリック情報を運びうる。アーチファクト減少320は、所望のレンダリングマトリクスに関する情報322に依存して、(例えば、複数の調整されたレンダリングパラメータの形で、)修正されたレンダリングマトリクス324を供給するように更に構成される。
従って、SAOCデコーダコア310は、ダウンミックス信号表現312、SAOCビットストリーム314および修正されたレンダリングマトリクス324に依存して、レンダリングされたシーンの表現316を供給するように構成されうる。
以下に、オーディオ信号デコーダの機能に関するいくつかの詳細が、供給される。与えられた所望のレンダリングマトリクスのためのSAOCシステムの潜在的に制限された分離機能によって、アーチファクトのリスクを評価するために、(ダウンミックス信号表現312により示された)ダウンミックス信号およびSAOCビットストリーム314の両方を考慮に入れることが望ましいことが分かっている。目下のこの情報によって、例えば、レンダリングマトリクスの修正によって、これらのアーチファクトを軽減しようとすることは、可能である。これは、アーチファクト減少320によって実行される。軽減のための高度なストラテジーは、知覚の効果と同様に、SAOCシステムの時間及び周波数選択の制限(オーバーラップ)を考慮に入れる。すなわち、それらは、可能な限り小さい可聴のアーチファクトを有する一方で、所望の出力信号と同様にレンダリングされた信号音響を作ろうとする必要がある。
図3に示されるオーディオ信号デコーダ300において使用されるアーチファクト減少のための好ましいアプローチは、上記リストされた異なる種類のアーチファクトを評価する歪み尺度の重み付けされた組み合わせである全体の歪み尺度に基づく。これらの重み付けは、上記リストされた異なる種類のアーチファクトの間で適切なトレードオフを決定する。これらの異なる種類のアーチファクトのための重み付けが、SAOCシステムが使用されるアプリケーションに依存しうる点に留意する必要がある。
換言すれば、アーチファクト減少320は、複数の種類のアーチファクトのための歪み尺度を得るように構成されうる。例えば、アーチファクト減少320は、上述したいくつかの歪み尺度dm1〜dm6を適用しうる。あるいは、または、加えて、このセクション内で述べられたように、アーチファクト減少320は、他の種類のアーチファクトを示している更なる歪み尺度を使用しうる。また、アーチファクト減少は、(例えば、セクション2.4.2、2.4.3および2.4.4の下で)上述された一つ以上の歪み制限スキーム、または、相当するアーチファクト制限スキームを用いた所望のレンダリングマトリクス322に基づいて、修正されたレンダリングマトリクス324を得るように構成されうる。
4. 図5aおよび図5bによるオーディオ信号トランスコーダ
4.1 図5aによるオーディオ信号トランスコーダ
上記の構想がオーディオ信号デコーダおよびオーディオ信号トランスコーダにおいて適用されうる点に留意する必要がある。図2および図3を参照して、その構想は、オーディオ信号デコーダと組み合わせて示された。以下に、本発明概念の使用は、オーディオ信号トランスコーダと組み合わせて簡単に述べられる。
この問題に関して、図9a、図9bおよび図9cに関してされた説明が本発明概念に適用できるように、オーディオ信号デコーダおよびオーディオ信号トランスコーダの類似点が、図9a、図9bおよび図9cに関してすでに述べられた点に留意する必要がある。
図5aは、MPEGサラウンドデコーダ510と組み合わせて、オーディオ信号トランスコーダ500のブロック略図を示す。図に示すように、SAOCtoMPEGサラウンドトランスコーダでありうるオーディオ信号トランスコーダ500は、SAOCビットストリーム520を受けて、それに基づいて、ダウンミックス信号表現524に影響を及ぼす(または修正する)ことなしで、MPEGサラウンドビットストリーム522を供給するように構成される。オーディオ信号トランスコーダ500は、SAOCビットストリーム520を受け、所望のSAOCパラメータをSAOCビットストリーム530から抽出するように構成されるSAOCパーシング530を含む。オーディオ信号トランスコーダ500はまた、SAOCパーシング530およびレンダリングマトリクス情報542により供給されたSAOCパラメータを受けるように構成される、実際のレンダリング(マトリクス)情報としてみなされうる、および、例えば、複数の調整された(又は修正された)レンダリングパラメータの形で示されうるシーンレンダリングエンジン540を含む。シーンレンダリングエンジン540は、前記SAOCパラメータおよびレンダリングマトリクス542に依存して、MPEGサラウンドビットストリーム522を供給するように構成される。この目的のために、シーンレンダリングエンジン540は、(パラメトリック情報として示されもする)チャンネル関連のパラメータであるMPEGサラウンドビットストリーム・パラメータ522を計算するように構成される。このように、シーンレンダリングエンジン540は、オブジェクト関連のパラメトリック情報を構成するSAOCビットストリーム520のパラメータを、実際のレンダリングマトリクス542に対して依存して、チャンネル関連のパラメトリック情報を構成するMPEGサラウンドビットストリームのパラメータに変える(または「トランスコーダ」である)ように構成される。
オーディオ信号トランスコーダ500はまた、例えば、再生構成に関する情報552およびオブジェクト位置に関する情報554の形で、所望のレンダリングマトリクスに関する情報を受けるように構成される、レンダリングマトリクス生成550を含む。あるいは、レンダリングマトリクス生成550は、所望のレンダリングパラメータ(例えばレンダリングマトリクスエントリ)に関する情報を受けうる。レンダリングマトリクス生成は、SAOCビットストリーム520(または少なくとも、SAOCビットストリーム520によって示されるオブジェクト関連のパラメトリック情報のサブセット)を受けるようにも構成される。レンダリングマトリクス生成550は、受けた情報に基づいて実際の(調整された又は修正された)レンダリングマトリクス542を供給するようにも構成される。その範囲において、レンダリングマトリクス生成550は、装置100の、または、装置240の機能を引き継ぎうる。
MPEGサラウンドデコーダ510は、一般的に、ダウンミックス信号情報524およびシーンレンダリングエンジン540によって供給されるMPEGサラウンドビットストリーム522に基づいて複数のアップミックスチャンネル信号を得るように構成される。
要約すると、MPEGサラウンドビットストリーム522が、ダウンミックス信号表現524に基づいたアップミックス信号表現の供給を可能にするように、オーディオ信号トランスコーダ500は、MPEGサラウンドビットストリーム522を供給するように構成される。ここで、アップミックス信号表現は、MPEGサラウンドデコーダ510によって実際に供給される。MPEGサラウンドデコーダ510によって生成されるアップミックス信号表現が受け入れがたい可聴歪みを含まないように、レンダリングマトリクス生成550は、シーンレンダリングエンジン540により用いられるレンダリングマトリクス542を調整する。
4.2 図5bによるオーディオ信号トランスコーダ
図5bは、オーディオ信号トランスコーダ560およびMPEGサラウンドデコーダ510の他の配置を示す。同一の手段および信号が同じ参照番号によって示されるように、図5bの配置が図5aの配置に非常に類似する点に留意する必要がある。オーディオ信号トランスコーダ560が、入力ダウンミックス表現524を受けて、MPEGサラウンドデコーダ510に供給される修正されたダウンミックス表現574を供給するように構成されるダウンミックストランスコーダ570を含むという点で、オーディオ信号トランスコーダ560は、オーディオ信号トランスコーダ500と異なる。ダウンミックス信号表現の修正は、所望のオーディオ結果の定義のより多くの柔軟性を得るためになされる。これは、MPEGサラウンドビットストリーム522がMPEGサラウンドデコーダ510によって出力されたアップミックスチャンネル信号上へのMPEGサラウンドデコーダ510の入力信号のいくつかのマッピングを示すことができないという事実に起因する。したがって、ダウンミックストランスコーダ570を用いたダウンミックス信号表現の修正は、増加した柔軟性をもたらしうる。
さらにまた、レンダリングマトリクス生成550は、装置100または装置240の機能を引き継ぎうる。それによって、MPEGサラウンドデコーダ510により供給されるアップミックス信号表現の可聴歪みが十分に小さく保たれることを確実にする。
5. 図6によるオーディオ信号エンコーダ
以下に、オーディオ信号エンコーダ600は、この種のオーディオ信号エンコーダのブロック略図を示す図6の参照をして説明される。オーディオ信号エンコーダ600は、(x1〜xNと示されもする)複数のオブジェクト信号612a、612Nを受け、そして、それに基づいて、ダウンミックス信号表現614およびオブジェクト関連のパラメトリック情報616を供給するように構成される。オーディオ信号エンコーダ600は、一つ以上のダウンミックス信号が複数のオブジェクト信号の重ね合わせを含むように、オブジェクト信号と関連したダウンミックス係数d1〜dNに依存して、(ダウンミックス信号表現614を構成する)一つ以上のダウンミックス信号を供給するように構成されるダウンミキサー620を含む。オーディオ信号エンコーダ600はまた、補助情報供給器630を含む。2個以上のオブジェクト信号612a〜612Nのレベル差および相関特性を示しているオブジェクト間関係補助情報を供給するように構成される。補助情報供給器630はまた、個々のオブジェクト信号の一つ以上の特性を示している個々のオブジェクトの補助情報を供給するようにも構成される。
オブジェクト関連のパラメトリック情報がオブジェクト間関係補助情報および個々のオブジェクト補助情報を含むように、オーディオ信号エンコーダ600は、このようにオブジェクト関連のパラメトリック情報616を供給する。
上記のように、オブジェクト信号間の関係および一つのオブジェクト信号の個々の特性の両方を示すこの種のオブジェクト関連のパラメトリック情報は、オーディオ信号デコーダのマルチチャンネルオーディオ信号の供給を可能にすることが分かっている。オブジェクト間関係補助情報は、少なくともおよそ、個々のオブジェクト信号をダウンミックス信号表現から抽出するために、オブジェクト関連のパラメトリック情報616を受けるオーディオ信号デコーダによって実施されうる。オブジェクト関連のパラメトリック情報614にも含まれる個々のオブジェクト補助情報は、アップミックス処理があまりに強い信号歪みをもたらすかどうかを確かめるために、オーディオ信号デコーダにより使用されうる。その結果、アップミックスパラメータ(例えば、レンダリングパラメータ)は、調整されることを必要とする。
好ましくは、個々のオブジェクト補助情報が個々のオブジェクト信号の調性を示すように、補助情報供給器630は、個々のオブジェクト補助情報を供給するように構成される。調性情報が、アップミックス処理が有意な歪みをもたらすかどうかを評価するための信頼性が高い評価基準として使用されうることが分かっている。
オーディオ信号エンコーダ600が、オーディオ信号エンコーダに関して本願明細書において述べられる特徴および機能のいくつかによって補充されうること、および、ダウンミックス信号表現614およびオブジェクト関連のパラメトリック情報616が、それらが本発明のオーディオ信号デコーダに関して述べられた特性を含むように、オーディオ信号エンコーダ600により供給されうることもまた留意すべきである。
6. 図7によるオーディオビットストリーム
本発明による実施形態は、オーディオビットストリーム700を創作する。そして、それの略図は図7に示される。オーディオビットストリームは、エンコードされた形で複数のオブジェクト信号を示す。
オーディオビットストリーム700は、一つ以上のダウンミックス信号を示しているダウンミックス信号表現710を含む。ここで、ダウンミックス信号のうちの少なくとも1つは、複数のオブジェクト信号の重ね合わせを含む。オーディオビットストリーム700はまた、オブジェクト信号のレベル差および相関特性を示しているオブジェクト間関係補助情報720を含む。オーディオビットストリームはまた、(ダウンミックス信号表現710のための基礎を形成する)個々のオブジェクト信号の一つ以上の個々の特性を示している個々のオブジェクト補助情報730を含む。
オブジェクト間関係補助情報および個々のオブジェクト情報は、それらの全部において、オブジェクト関連のパラメトリック補助情報としてみなされうる。
好ましい実施形態において、個々のオブジェクト補助情報は、個々のオブジェクト信号の調性を示す。
当然、本願明細書において述べられたように、オーディオビットストリーム700は、一般的に、オーディオ信号エンコーダによって供給され、本願明細書において述べられたように、オーディオ信号デコーダによって評価される。オーディオビットストリームは、オーディオ信号エンコーダおよびオーディオ信号デコーダに関して述べられるような特性を含みうる。したがって、オーディオビットストリーム700は、本願明細書において述べられたように、オーディオ信号デコーダを用いたマルチチャンネルオーディオ信号の供給により適しうる。
7. 結論
本発明による実施形態は、一つの、元のオブジェクト信号が、少ない送信されたダウンミックス信号から完全に再構築されえないという事実から生じる、上記説明された歪み問題を低減する又は回避するための解決策を供給する。この問題に対するより単純な解決策があり、このように適用される。
●単純なアプローチは、相対的なオブジェクト利得の範囲を、例えば+/−12dBに制限することだろう。大きなオブジェクト利得設定は、可聴劣化につながりうる(例:他のオブジェクトレベルを0dBにしたままにする一方で、20dBで1つのオブジェクトを増大する)ことは真実であるが、これは必要でない。例えば、同じ因子ですべての相対的なオブジェクトレベルを増大することは、損なわれてないシステム出力を生ずる。
●より精巧な見解は、相対的なオブジェクトレベルの差に注目することである。2つのオーディオオブジェクトのレンダリングのために、両方の相対的なオブジェクトレベルの差は、レンダリングされた出力のあり得る劣化のためのフックを実際に供給する。しかし、この考えがどのように2つ以上のレンダリングされたオーディオオブジェクトに一般化するかは、明らかでない。
この状況からみて、本発明による実施形態は、この問題に対処して、不満足なユーザー体験を防止するための手段を供給する。本発明による、いくつかの実施形態は、前のセクションで述べられたものよりも精巧な解決策さえもたらしうる。
したがって、たとえ不適当なレンダリングパラメータがユーザーによって供給される場合であっても、より良いヒアリング印象は本発明を使用することにより得られうる。
一般的に言って、本発明による実施形態は、オーディオ信号をエンコーディングするための、または、エンコードされたオーディオ信号をデコードするための装置、方法またはコンピュータ・プログラムに、または、上記のように、(例えば、オーディオビットストリームの形で、)エンコードされたオーディオ信号に関する。
8. 実施態様変形例
いくつかの態様が、装置に関連して説明されたが、これらの態様はまた、対応する方法の説明を示すことは明らかである。ここで、ブロックまたはデバイスは方法ステップまたは方法ステップの機能に対応する。類似して、方法ステップに関連して説明された態様もまた、対応するブロックまたは項目または対応する装置の機能の説明を示す。方法ステップのいくつか又は全ては、例えば、マイクロプロセッサ、プログラミング可能なコンピュータまたは電子回路のようなハードウェア装置によって実行されうる(又はそれを使用しうる)。いくつかの実施形態において、一つ以上の最も重要な方法ステップのいくつかは、この種の装置によって実行されうる。
本発明のエンコードされたオーディオ信号またはオーディオビットストリームは、デジタル記憶媒体に格納されうる、又は、例えばインターネットなどの無線伝送媒体または有線伝送媒体などの伝送媒体で送信されうる。
特定の実現要求に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて実行されうる。実施態様は、各方法が実行されるように、それはプログラミング可能な計算機システムで協動する(または協動することができる)、そこに格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMまたはFLASHメモリを使用して実行されうる。従って、デジタル記憶媒体は、コンピュータ可読でありうる。
本発明によるいくつかの実施形態は、本願明細書において説明される方法のうちの1つが実行されるように、(プログラミング可能な計算機システムと協動することができる)電子的に読み込み可能な制御信号を有するデータキャリアを含む。
通常、本発明の実施形態は、プログラムコードを有するコンピュータ・プログラム製品として実施されうる。そして、そのコンピュータ・プログラム製品がコンピュータ上で動作するときに、そのプログラムコードがその方法のうちの1つを実行する働きをする。プログラムコードは、例えば機械可読なキャリアに格納されうる。
他の実施形態は、機械可読なキャリアに格納された、本願明細書において説明された方法のうちの1つを実行するためのコンピュータ・プログラムを含む。
換言すれば、発明の方法の実施形態は、従って、コンピュータ・プログラムはコンピュータ上で動作するときに、本願明細書において説明された方法のうちの1つを実行するためのプログラムコードを有するコンピュータ・プログラムである。
本発明の方法の更なる実施形態は、従って、その上に記録された、本願明細書において説明された方法のうちの1つを実行するためのコンピュータ・プログラムを含んでいるデータキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)である。
本発明の方法の更なる実施形態は、従って、本願明細書において説明された方法のうちの1つを実行するためのコンピュータ・プログラムを示しているデータ・ストリームまたは信号のシーケンスである。データ・ストリームまたは信号のシーケンスは、例えば、データ通信接続を介して、例えばインターネットを介して送られるように構成されうる。
更なる実施形態は、本願明細書において説明された方法のうちの1つを実行するように構成された又は適用された処理手段、例えばコンピュータまたはプログラム可能な論理回路を含む。
更なる実施形態は、本願明細書において説明された方法のうちの1つを実行するためのコンピュータ・プログラムをそれにインストールしたコンピュータを含む。
いくつかの実施形態は、プログラム可能な論理回路(例えばフィールド・プログラマブル・ゲートアレイ)は、本願明細書において説明された方法の機能のいくつか又は全てを実行するために使用されうる。いくつかの実施形態は、フィールド・プログラマブル・ゲートアレイは、本願明細書において説明された方法のうちの1つを実行するために、マイクロプロセッサと協動しうる。通常、その方法は、任意のハードウェア装置によって好ましくは実行される。
上記の実施形態は、本発明の原理のために、単に図示しているだけである。本装置および本願明細書において説明された詳細の修正変更が他の当業者にとって明らかであるものと理解される。従って、それは、間近に迫った特許請求の範囲だけによって、制限され、本願明細書における実施形態の記載および説明として示される具体的な詳細だけによって制限されないという意図である。
「参考資料」
[BCC]C.ファーラー、F.バウムガルテ、「バイノーラルキュー符号化 −パート2:方式及び応用例」、音声及びオーディオ、IEEE通信 11巻、No.6、2003年11月
[JSC]C.ファーラー、「オーディオソースのパラメトリック・ジョイント符号化」、AES第120回コンベンション、予稿集6752、パリ、2006年
[SAOC1]J.ヘルレ、S.デッシュ、J.ヒルペアト、O.ヘルムース,「SACからSAOCまで ― 空間オーディオのパラメトリック符号化における最近の動向」、AES第22回UKコンベンション、ケンブリッジ、UK、2007年4月
[SAOC2]J.エングデガルド,B.ラーシュ,C.ファルヒ,O.ヘルムース,J.ヒルペアト,A.ヘルツァー,L.テレンチエフ,J.ブレーバールト,J.コッペン,E.スフエイエルス、W.オーメン:「空間オーディオオブジェクト符号化(SAOC) ― パラメトリックオブジェクトベースのオーディオ符号化に関する今後のMPEGスタンダード」、AES第124回コンベンション、予稿集7377、アムステルダム、2008

Claims (6)

  1. 複数のオブジェクト信号(x1〜xN)に基づいてダウンミックス信号表現(614)およびオブジェクト関連のパラメトリック情報(616)を供給するためのオーディオ信号エンコーダ(600)であって、前記オーディオエンコーダは、
    一つ以上のダウンミックス信号が、複数のオブジェクト信号の重ね合わせを含むように、前記オブジェクト信号(x1〜xN)と関連したダウンミックス係数(d1〜dN)に依存して、前記一つ以上のダウンミックス信号を供給するように構成されたダウンミキサー(620)、
    オブジェクト信号(x1〜xN)のレベル差及び相関特性を示しているオブジェクト間関係補助情報(OLD,IOC)および前記個々のオブジェクト信号(x1〜xN)の一つ以上の個々の特性を示している個々のオブジェクト補助情報を供給するように構成された補助情報供給器(630)を含むこと、を特徴とする、前記オーディオエンコーダ。
  2. 前記補助情報供給器(630)は、前記個々のオブジェクト補助情報が、前記個々のオブジェクト信号(x1〜xN)の調性を示すように、前記個々のオブジェクト補助情報を供給するように構成されること、を特徴とする、請求項1に記載の装置。
  3. 複数のオブジェクト信号に基づいて、ダウンミックス信号表現およびオブジェクト関連のパラメトリック情報を供給するための方法であって、前記方法は、
    一つ以上のダウンミックス信号が、複数のオブジェクト信号の重ね合わせを含むように、前記オブジェクト信号と関連したダウンミックス係数に依存して、前記一つ以上のダウンミックス信号を供給するステップ、および、
    オブジェクト信号のレベル差および相関特性を示しているオブジェクト間関係補助情報を供給するステップ、および、
    前記個々のオブジェクト信号の一つ以上の個々の特性を示している個々のオブジェクト補助情報を供給するステップ、を含むこと、を特徴とする、方法。
  4. エンコードされた形で、複数のオブジェクト信号(x1〜xN)を示しているオーディオビットストリーム(700)であって、前記オーディオビットストリームは、
    一つ以上のダウンミックス信号を示しているダウンミックス信号(710)表現であって、前記ダウンミックス信号のうちの少なくとも1つは、複数のオブジェクト信号の重ね合わせを含むことを特徴とする、前記ダウンミックス信号表現、および、
    オブジェクト信号のレベル差および相関特性を示しているオブジェクト間関係補助情報(720)、および、
    前記個々のオブジェクト信号の一つ以上の個々の特性を示している個々のオブジェクト補助情報(730)を含むこと、を特徴とする、前記オーディオビットストリーム。
  5. 前記個々のオブジェクト補助情報は、前記個々のオブジェクト信号の調性を示すこと、を特徴とする、請求項4に記載のオーディオビットストリーム。
  6. 請求項3に記載の方法のうちの1つを実行するためのコンピュータ・プログラム。
JP2014111756A 2009-04-28 2014-05-29 ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム Pending JP2014206747A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17345609P 2009-04-28 2009-04-28
US61/173,456 2009-04-28

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012507733A Division JP5554830B2 (ja) 2009-04-28 2010-04-28 ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム

Publications (1)

Publication Number Publication Date
JP2014206747A true JP2014206747A (ja) 2014-10-30

Family

ID=42272162

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012507733A Active JP5554830B2 (ja) 2009-04-28 2010-04-28 ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム
JP2014111756A Pending JP2014206747A (ja) 2009-04-28 2014-05-29 ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2012507733A Active JP5554830B2 (ja) 2009-04-28 2010-04-28 ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム

Country Status (19)

Country Link
US (2) US8731950B2 (ja)
EP (2) EP2816555B1 (ja)
JP (2) JP5554830B2 (ja)
KR (1) KR101431889B1 (ja)
CN (1) CN102576532B (ja)
AR (1) AR076434A1 (ja)
AU (1) AU2010243635B2 (ja)
BR (1) BRPI1007777A2 (ja)
CA (2) CA2760515C (ja)
ES (2) ES2572083T3 (ja)
HK (2) HK1173551A1 (ja)
MX (1) MX2011011399A (ja)
MY (1) MY157169A (ja)
PL (2) PL2816555T3 (ja)
RU (1) RU2573738C2 (ja)
SG (1) SG175392A1 (ja)
TW (2) TWI529704B (ja)
WO (1) WO2010125104A1 (ja)
ZA (1) ZA201107895B (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
CN102792378B (zh) 2010-01-06 2015-04-29 Lg电子株式会社 处理音频信号的设备及其方法
KR101490725B1 (ko) 2010-03-23 2015-02-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 비디오 디스플레이 장치, 오디오-비디오 시스템, 음향 재생을 위한 방법 및 로컬라이즈된 지각적 오디오를 위한 음향 재생 시스템
US10158958B2 (en) 2010-03-23 2018-12-18 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
ITTO20120067A1 (it) * 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
JP6174129B2 (ja) 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
CN110223701B (zh) 2012-08-03 2024-04-09 弗劳恩霍夫应用研究促进协会 用于从缩混信号产生音频输出信号的解码器和方法
KR102033985B1 (ko) * 2012-08-10 2019-10-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법
US20150243289A1 (en) * 2012-09-14 2015-08-27 Dolby Laboratories Licensing Corporation Multi-Channel Audio Content Analysis Based Upmix Detection
RU2676870C1 (ru) 2013-01-29 2019-01-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
EP2804176A1 (en) 2013-05-13 2014-11-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio object separation from mixture signal using object-specific time/frequency resolutions
CN110085239B (zh) 2013-05-24 2023-08-04 杜比国际公司 对音频场景进行解码的方法、解码器及计算机可读介质
CN109712630B (zh) * 2013-05-24 2023-05-30 杜比国际公司 包括音频对象的音频场景的高效编码
CN110223702B (zh) * 2013-05-24 2023-04-11 杜比国际公司 音频解码系统和重构方法
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
RU2630754C2 (ru) * 2013-05-24 2017-09-12 Долби Интернешнл Аб Эффективное кодирование звуковых сцен, содержащих звуковые объекты
GB2515089A (en) * 2013-06-14 2014-12-17 Nokia Corp Audio Processing
US9883311B2 (en) 2013-06-28 2018-01-30 Dolby Laboratories Licensing Corporation Rendering of audio objects using discontinuous rendering-matrix updates
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
US9521501B2 (en) 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
WO2015105748A1 (en) 2014-01-09 2015-07-16 Dolby Laboratories Licensing Corporation Spatial error metrics of audio content
TWI833562B (zh) 2014-03-24 2024-02-21 瑞典商杜比國際公司 應用動態範圍壓縮至高階保真立體音響信號之方法和裝置
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
MX370034B (es) 2015-02-02 2019-11-28 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio codificada.
CN105989845B (zh) 2015-02-25 2020-12-08 杜比实验室特许公司 视频内容协助的音频对象提取
KR101968456B1 (ko) * 2016-01-26 2019-04-11 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 양자화
US10210874B2 (en) * 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding
CN110447243B (zh) * 2017-03-06 2021-06-01 杜比国际公司 基于音频数据流渲染音频输出的方法、解码器系统和介质
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007515677A (ja) * 2003-12-10 2007-06-14 フランス テレコム 最適化された複合的符号化方法
WO2007128523A1 (en) * 2006-05-04 2007-11-15 Lg Electronics Inc. Enhancing audio with remixing capability
WO2008039039A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050228648A1 (en) * 2002-04-22 2005-10-13 Ari Heikkinen Method and device for obtaining parameters for parametric speech coding of frames
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
JP4944029B2 (ja) * 2005-07-15 2012-05-30 パナソニック株式会社 オーディオデコーダおよびオーディオ信号の復号方法
US20080255859A1 (en) * 2005-10-20 2008-10-16 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US8208641B2 (en) * 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
BRPI0716854B1 (pt) * 2006-09-18 2020-09-15 Koninklijke Philips N.V. Codificador para codificar objetos de áudio, decodificador para decodificar objetos de áudio, centro distribuidor de teleconferência, e método para decodificar sinais de áudio
BRPI0715312B1 (pt) * 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. Aparelhagem e método para transformação de parâmetros multicanais
EP2109861B1 (en) * 2007-01-10 2019-03-13 Koninklijke Philips N.V. Audio decoder
JP2010518460A (ja) * 2007-02-13 2010-05-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
EP2115739A4 (en) * 2007-02-14 2010-01-20 Lg Electronics Inc METHODS AND APPARATUSES FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS
BRPI0816557B1 (pt) * 2007-10-17 2020-02-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Codificação de áudio usando upmix
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
KR101137361B1 (ko) * 2009-01-28 2012-04-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
MX2012004621A (es) * 2009-10-20 2012-05-08 Fraunhofer Ges Forschung Aparato para proporcionar una representacion de una señal de conversion ascendente sobre la base de una representacion de una señal de conversion descendente, aparato para proporcionar una corriente de bits que representa una señal de audio de canales multiples, metodos, programa de computacion y corriente de bits que utiliza una señalizacion de control de distorsion.
CA2781310C (en) * 2009-11-20 2015-12-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007515677A (ja) * 2003-12-10 2007-06-14 フランス テレコム 最適化された複合的符号化方法
WO2007128523A1 (en) * 2006-05-04 2007-11-15 Lg Electronics Inc. Enhancing audio with remixing capability
WO2008039039A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals

Also Published As

Publication number Publication date
US20120143613A1 (en) 2012-06-07
CA2852503A1 (en) 2010-11-04
MY157169A (en) 2016-05-13
TW201443885A (zh) 2014-11-16
CN102576532B (zh) 2015-11-25
AU2010243635B2 (en) 2014-03-27
MX2011011399A (es) 2012-06-27
CA2852503C (en) 2017-10-03
EP2816555A1 (en) 2014-12-24
TWI560706B (en) 2016-12-01
PL2816555T3 (pl) 2016-10-31
BRPI1007777A2 (pt) 2017-02-14
EP2425427B1 (en) 2014-09-10
US20140229187A1 (en) 2014-08-14
TW201104674A (en) 2011-02-01
HK1173551A1 (zh) 2013-05-16
RU2011145866A (ru) 2013-05-27
AU2010243635A1 (en) 2011-12-22
JP5554830B2 (ja) 2014-07-23
JP2012525600A (ja) 2012-10-22
RU2573738C2 (ru) 2016-01-27
CA2760515C (en) 2015-06-02
US9786285B2 (en) 2017-10-10
KR101431889B1 (ko) 2014-08-27
CN102576532A (zh) 2012-07-11
WO2010125104A1 (en) 2010-11-04
US8731950B2 (en) 2014-05-20
EP2425427A1 (en) 2012-03-07
SG175392A1 (en) 2011-12-29
CA2760515A1 (en) 2010-11-04
KR20120018778A (ko) 2012-03-05
HK1205340A1 (zh) 2015-12-11
ES2572083T3 (es) 2016-05-30
AR076434A1 (es) 2011-06-08
ZA201107895B (en) 2012-08-29
PL2425427T3 (pl) 2015-02-27
EP2816555B1 (en) 2016-03-23
TWI529704B (zh) 2016-04-11
ES2521715T3 (es) 2014-11-13

Similar Documents

Publication Publication Date Title
JP5554830B2 (ja) ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム
JP5719372B2 (ja) アップミックス信号表現を生成する装置及び方法、ビットストリームを生成する装置及び方法、並びにコンピュータプログラム
JP5645951B2 (ja) ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム
KR101426625B1 (ko) 평균값을 이용하여 다운믹스 신호 표현 및 이 다운믹스 신호 표현과 관련된 파라메트릭 보조 정보에 기초한 업믹스 신호 표현을 제공하기 위해 하나 이상의 조정된 파라미터를 제공하는 장치, 방법 및 컴퓨터 프로그램
JP5426680B2 (ja) 信号処理方法及び装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150825

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160128