JP2011501544A - ダウンミックスを用いたオーディオコーディング - Google Patents
ダウンミックスを用いたオーディオコーディング Download PDFInfo
- Publication number
- JP2011501544A JP2011501544A JP2010529292A JP2010529292A JP2011501544A JP 2011501544 A JP2011501544 A JP 2011501544A JP 2010529292 A JP2010529292 A JP 2010529292A JP 2010529292 A JP2010529292 A JP 2010529292A JP 2011501544 A JP2011501544 A JP 2011501544A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio signal
- audio
- downmix
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 158
- 239000011159 matrix material Substances 0.000 claims description 40
- 230000003595 spectral effect Effects 0.000 claims description 27
- 238000000034 method Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000009466 transformation Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 5
- 238000011524 similarity measure Methods 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000004091 panning Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000008054 signal transmission Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【選択図】図3
Description
ここで、合計および指標nとkは、それぞれ、すべてのフィルタバンクタイムスロット34と、特定の時間/周波数タイル42に属するすべてのフィルタバンクサブバンド30とを通過する。これにより、オーディオ信号またはオブジェクトiのすべてのサブバンド値xiのエネルギーは合計され、すべてのオブジェクトまたはオーディオ信号の中のそのタイルの最高エネルギーに正規化される。
ここで、再び、指標nとkは、特定の時間/周波数タイル42に属するすべてのサブバンド値を通り、iとjは、オーディオオブジェクト141〜14Nの特定のペアを表す。
ここで、マトリクスEは、パラメータOLDとIOCの関数である。
となり、カラオケタイプの出力信号を生成する。
ここで、「1」は、チャンネル数dに従属するスカラーまたは単位行列を表し、D-1は、それに従って第1タイプのオーディオ信号と第2のタイプのオーディオ信号がダウンミックス信号にダウンミックスされる、副情報にも備えられるダウンミックス処方によって一意に決定されるマトリックスであり、Hは、dから独立しているが残余信号に従属する項である。
●モノラル、ステレオ、またはサラウンドバックグラウンドシーン(以下においてバック グラウンドオブジェクトBGOと呼ばれる)は、一組の特定のSAOCオブジェクトか ら導かれ、それは変更なく再生される。すなわち、あらゆる入力チャンネル信号が変更 のないレベルで同じ出力チャンネルで再生される。
●関心のある特定のオブジェクト(以下においてフォアグラウンドオブジェクトFGOと 呼ばれる)(典型的にはリードボーカル)は、変更(FGOは、典型的にサウンドステ ージの中央に配置され、ミュートすることができる、すなわち、伴って歌うことを可能 とするため強く減衰される)して再生される。
●MBOは、標準の5―2―5MPEGサラウンドツリー102を用いてエンコードされ る。これは、ステレオMBOダウンミックス信号104とMBO‐MPS副情報ストリ ーム106に結果としてなる。
●MBOダウンミックスは、次に、引き続くSAOCエンコーダ108によって、ステレ オオブジェクト(すなわち、2つのオブジェクトレベル差、プラス相互相関)として、 その(またはいくつかの)FGO110と一緒にエンコードされる。これは、一般的な ダウンミックス信号112とSAOC副情報ストリーム114に結果としてなる。
●「左右の」TTT出力L,RをMPSダウンミックス120に単純に供給する(そして 、ストリーム118において、送信されたMBO‐MPSビットストリーム106を順 送りする)ことによって、MBOのみが最終的なMPSデコーダによって再生される。 これは、カラオケモードに対応する。
●「中心の」TTT出力Cを左右のMPSダウンミックス120に単純に供給する(そし て、FGO110を所望の位置とレベルに再現する些細なMPSビットストリーム11 8を生成する)ことによって、FGO110のみが最終的なMPSデコーダ122によ って再生される。これは、ソロモードに対応する。
●フレームワークは、バックグラウンド(MBO)100とFGO信号110のクリーン な構成上の分離を提供する。
●TTT要素126の構成は、波形ベースで、3つの信号L,R,Cの最高の復元を試み る。このように、最終的なMPS出力信号130は、ダウンミックス信号のエネルギー 重み付け(および無相関化)によって形成されるだけでなく、TTT処理のため波形に 関しても近い。
●MPEGサラウンドTTTボックス126とともに、残余コーディングを用いることに よって復元精度を強化する可能性がある。このように、復元品質における有意な強化は 、TTT-1124により出力され、アップミックスのためのTTTボックスによって用 いられる残余信号132の残余バンド幅と残余ビットレートが増加するにつれて、達成 することができる。理想的には(すなわち、残余コーディングとダウンミックス信号の コーディングにおける無限に微細な量子化に対して)、バックグラウンド(MBO)と FGO信号の間の干渉はキャンセルされる。
●カラオケ/ソロモードの二重性 : 図6のアプローチは、同じ技術手段を用いてカラ オケとソロの両方の機能を提供する。すなわち、例えば、SAOCパラメータは再利用 される。
●洗練化可能性 : カラオケ/ソロ信号の品質は、TTTボックスにおいて用いられる 残余コーディング情報の量を制御することによって、必要に応じて洗練させることがで きる。例えば、パラメータbsResidualSamplingFrequencyIndex、bsResidualBands、お よびbsResidualFramesPerSAOCFrameを用いることができる。
●ダウンミックスにおけるFGOの位置決め : MPEGサラウンド仕様において指定 されるTTTボックスを用いるとき、FGOは、左右のダウンミックスチャンネルの間 の中心位置に常に混合される。位置決めにおいてより柔軟性を可能とするため、「中心 」の入力/出力に関連する信号の非対称位置決めを可能としながら同じ原理に従う一般 化されたTTTエンコーダボックスが使用される。
●多重FGO : 記載された構成において、1つのFGOのみの使用が記載されていた (これは、最も重要なアプリケーションのケースに対応するかも知れない)。しかしな がら、提案されたコンセプトは、以下の尺度の1つまたは組み合わせを用いて、いくつ かのFGOに適応することも可能である。
◆グループ化されたFGO : 図6に示されたように、TTTボックスの中心の入力 /出力に接続された信号は、実際に、単一のもののみよりもむしろ、いくつかのF GO信号の合計とすることができる。これらのFGOは、マルチチャンネル出力信 号130において、独立に位置決め/制御することができる(しかしながら、それ らが同様にスケールされ配置されたときに、最良の品質効果が達成される)。それ らは、ステレオダウンミックス信号112において一般的な位置を共有し、1つの 残余信号132のみがある。いずれにせよ、バックグラウンド(MBO)と制御可 能なオブジェクトの間の干渉は(制御可能なオブジェクト間ではされないが)キャ ンセルされる。
◆カスケード接続されたFGO : ダウンミックス112における一般的なFGO位 置に関する制限は、図6のアプローチを拡張することによって克服することができ る。多重FGOは、記載されたTTT構成のいくつかのステージをカスケード接続 し、各ステージが1つのFGOに対応し、残余コーディングストリームを生成する ことによって、適応することができる。このように、干渉は、理想的には、各FG O間においてもキャンセルされる。もちろん、このオプションは、グループ化され たFGOアプローチを用いるよりも高いビットレートを必要とする。実施形態は後 述する。
●SAOC副情報 : MPEGサラウンドにおいて、TTTボックスに関連する副情報 は、一対のチャンネル予測係数(CPC)である。対照的に、SAOCパラメータ表示 とMBO/カラオケシナリオは、各オブジェクト信号のオブジェクトエネルギーと、M BOダウンミックスの2つのチャンネル間の信号間相関(すなわち、「ステレオオブジ ェクト」のパラメータ表示)を送信する。強化されたカラオケ/ソロモードのないケー スに関係するパラメータ表示、およびビットストリームフォーマットにおける変化の数 を最小化するために、CPCは、ダウンミックスされた信号(MBOダウンミックスと FGO)のエネルギーとMBOダウンミックスステレオオブジェクトの信号間相関とか ら算出することができる。それ故、送信されたパラメータ表示を変更または増大する必 要がなく、CPCは、SAOCトランスコーダ116において送信されたSAOCパラ メータ表示から算出することができる。このように、強化されたカラオケ/ソロモード を用いたビットストリームは、残余データを無視するとき、標準モードのデコーダ(残 余コーディングのない)によってデコードすることもできる。
●通常モードにおいて、各オブジェクト信号は、ダウンミックスマトリクスにおけるその エントリーによって(左右のダウンミックスチャンネルのそれぞれに対する寄与に対し て)重み付けされる。次に、左右のダウンミックスチャンネルに対するすべての重み付 けられた分担は、左右のダウンミックスチャンネルを形成するために合計される。
●強化されたカラオケ/ソロ演奏のために、すなわち強化モードにおいて、すべてのオブ ジェクト分担は、フォアグラウンドオブジェクト分担(FGO)と残りのオブジェクト 分担(BGO)を形成する一組のオブジェクト分担に分割される。FGO分担は、モノ ラルのダウンミックス信号に合計され、残りのバックグラウンド分担は、ステレオダウ ンミックスに合計され、両方とも、一般的なSAOCステレオダウンミックスを形成す るために、一般化されたTTTエンコーダ要素を用いて合計される。
●RM0
●強化モード(res 0)(残余コーディングを有しない)
●強化モード(res 6)(最も低い6つのハイブリッドQMFバンドに残余コーディング を有する)
●強化モード(res 12)(最も低い12のハイブリッドQMFバンドに残余コーディング を有する)
●強化モード(res 24)(最も低い24のハイブリッドQMFバンドに残余コーディング を有する)
●隠れた基準
●下側アンカー(3.5kHzバンド制限されたバージョンの基準)
・残余信号の利用による、より良好な信号分離(RM0と比較して)
・その混合仕様を一般化することによる、TTT-1ボックスの中心入力(すなわちFGO )として表される信号の柔軟な位置決め
ここで、OLDFLとOLDFRは、それぞれ左右のFGO信号のOLDを表す。
ここで、マトリクスの最初の2行は、送信されるステレオダウンミックスを表す。一方、用語TTN(2からN)は、トランスコーダ側でアップミックスする処理に関する。
●Dは、2×Nダウンミックスマトリクス
●Aは、2×N再現マトリクス
●Eは、入力オブジェクトSのN×N共分散モデル
●GMod(図12のGに対応する)は、予測の2×2アップミックスマトリクス
GModは、D、AおよびEの関数であることに注意されたい。
一般的なシナリオにおいて、Aは知られていないが、カラオケシナリオの特殊ケース(例えば、1つのステレオバックグラウンドと1つのステレオフォアグラウンドオブジェクト(N=4)を有する)では、次のように仮定される。
これは、BGOのみが再生されることを意味する。
ここで、D-1は、再びパラメータDMGとDCLDの関数である。
Claims (23)
- 第1タイプのオーディオ信号とエンコードされた第2タイプのオーディオ信号とを有するマルチ‐オーディオ‐オブジェクト信号をデコードするオーディオデコーダであって、
前記マルチ‐オーディオ‐オブジェクト信号は、ダウンミックス信号(56)と副情報(58)とから成り、前記副情報は、第1の所定の時間/周波数分解能(42)における前記第1タイプのオーディオ信号と前記第2タイプのオーディオ信号のレベル情報(60)と、第2の所定の時間/周波数分解能における残余レベル値を特定する残余信号(62)とを備えるものであって、
前記レベル情報(60)に基づいて予測係数(64)を演算する手段(52)と、
前記第1タイプのオーディオ信号を近似する第1のアップミックスオーディオ信号、および/または、前記第2タイプのオーディオ信号を近似する第2のアップミックスオーディオ信号を取得するために、前記予測係数(64)と前記残余信号(62)に基づいて前記ダウンミックス信号(56)をアップミックスする手段とを備える、
オーディオデコーダ。 - 前記副情報(58)は、それに従って前記第1タイプのオーディオ信号と前記第2タイプのオーディオ信号が前記ダウンミックス信号(56)にダウンミックスされるダウンミックス処方を更に備え、前記アップミックスする手段は、前記ダウンミックス処方に更に基づいて、前記アップミックスを実行するように構成された、請求項1に記載のオーディオデコーダ。
- 前記ダウンミックス処方は、前記副情報内で時間変化する、請求項2に記載のオーディオデコーダ。
- 前記ダウンミックス処方は、前記副情報内でフレームサイズよりも粗い分解能で時間変化する、請求項2または3に記載のオーディオデコーダ。
- 前記ダウンミックス処方は、それによって前記ダウンミックス信号が第1タイプのオーディオ信号と前記第2タイプのオーディオ信号に基づいて混合される重み付けを示す、請求項2〜4のいずれかに記載のオーディオデコーダ。
- 前記第1タイプのオーディオ信号は、第1と第2入力チャンネルを有するステレオオーディオ信号、または、第1入力チャンネルのみを有するモノラルオーディオ信号であり、前記ダウンミックス信号は、第1と第2出力チャンネルを有するステレオオーディオ信号、または、第1出力チャンネルのみを有するモノラルオーディオ信号であり、前記レベル情報は、前記第1入力チャンネル、前記第2入力チャンネルおよび前記第2タイプのオーディオ信号のそれぞれの間の、前記第1の所定の時間/周波数分解能でのレベル差を記述し、前記副情報は、前記第1と第2入力チャンネル間の、第3の所定の時間/周波数分解能におけるレベル類似性を定義する相互相関情報を更に備え、前記演算する手段は、前記相互相関情報に更に基づいて前記演算を実行するように構成された、請求項1〜5のいずれかに記載のオーディオデコーダ。
- 前記第1と第3の時間/周波数分解能は、前記副情報内で一般的な文法要素によって決定される、請求項6に記載のオーディオデコーダ。
- 前記演算する手段と前記アップミックスする手段は、前記アップミックスが、前記ダウンミックス信号と前記残余信号から成るベクトルのアプライアンスによって一連の第1と第2のマトリクスに表現することができ、前記第1のマトリクス(C)は、前記予測係数から成り、前記第2のマトリクス(D)は、それにより前記第1タイプのオーディオ信号と前記第2タイプのオーディオ信号が前記ダウンミックス信号にダウンミックスされるダウンミックス処方によって定義され、これも前記副情報に備えられるように構成された、請求項6または7に記載のオーディオデコーダ。
- 前記演算する手段と前記アップミックスする手段は、前記第1のマトリクスが、前記ベクトルを、前記第1タイプのオーディオ信号のための第1の成分および/または前記第2タイプのオーディオ信号のための第2の成分を有する中間ベクトルにマップするように構成され、前記ダウンミックス信号が、前記第1の成分上に1対1でマップされるように定義され、前記残余信号と前記ダウンミックス信号の線形結合が、前記第2の成分上にマップされるように構成された、請求項8に記載のオーディオデコーダ。
- 前記マルチ‐オーディオ‐オブジェクト信号は、複数の前記第2タイプのオーディオ信号を備え、前記副情報は、前記第2タイプのオーディオ信号当り1つの残余信号を備える、請求項1から9のいずれかに記載のオーディオデコーダ。
- 前記第2の所定の時間/周波数分解能は、前記副情報に含まれる残余分解能パラメータによって前記第1の所定の時間/周波数分解能と関係し、前記オーディオデコーダは、前記副情報から前記残余分解能パラメータを導き出す手段を備えた、請求項1から10のいずれかに記載のオーディオデコーダ。
- 前記残余分解能パラメータは、前記副情報内で前記残余信号が送信されるスペクトル範囲を定義する、請求項11に記載のオーディオデコーダ。
- 前記残余分解能パラメータは、前記スペクトル範囲の下側と上側の制限を定める、請求項12に記載のオーディオデコーダ。
- ここで、
ここで、‐前記第1タイプのオーディオ信号がステレオの場合は‐、OLDLは、前記それぞれの時間/周波数タイルにおける前記第1タイプのオーディオ信号の第1入力チャンネルの正規化されたスペクトルエネルギーを示し、OLDRは、前記それぞれの時間/周波数タイルにおける前記第1タイプのオーディオ信号の第2入力チャンネルの正規化されたスペクトルエネルギーを示し、IOCLRは、前記それぞれの時間/周波数タイル内の前記第1と第2入力チャンネルの間のスペクトルエネルギーの類似性を定義する相互相関情報を示し、または、‐前記第1タイプのオーディオ信号がモノラルの場合は‐、OLDLは、前記それぞれの時間/周波数タイルにおける前記第1タイプのオーディオ信号の正規化されたスペクトルエネルギーを示し、OLDRおよびIOCLRは零となり、
また、OLDjは、前記それぞれの時間/周波数タイルにおける前記第2タイプのオーディオ信号のチャンネルjの正規化されたスペクトルエネルギーを示し、IOCijは、前記それぞれの時間/周波数タイル内での前記第2タイプのオーディオ信号のチャンネルiとjの間のスペクトルエネルギーの類似性を定義する相互相関情報を示し、
ここで、
ここで、DCLDとDMGは、ダウンミックス処方であり、
前記アップミックスする手段は、第2のアップミックス信号S2,i当りの前記ダウンミックス信号dと前記残余信号resiから、前記第1のアップミックス信号S1および/または前記第2のアップミックス信号S2,iを、次式によって産出するように構成され、
ここで、上左角の「1」は、‐dn,kのチャンネル数に依存する‐ スカラーまたは単位行列であることを示し、下右側角の「1」は、サイズNの単位行列であり、「0」は、零ベクトルまたは‐dn,kのチャンネル数に依存する‐ マトリクスを示し、D‐1は、それに従って前記第1タイプのオーディオ信号と前記第2タイプのオーディオ信号が前記ダウンミックス信号にダウンミックスされるダウンミックス処方によって一意に決定されるマトリックスであり、これも前記副情報に備えられ、dn,kとresi n,kは、それぞれ、時間/周波数タイル(n,k)での前記ダウンミックス信号と前記残余信号であり、前記副情報に備えられないresi n,kは、零に設定される、
請求項1から13のいずれかに記載のオーディオデコーダ。 - 前記マルチ‐オーディオ‐オブジェクト信号は、前記第1タイプのオーディオ信号を所定のスピーカ構成上に空間的に再現する空間再現情報を備える、請求項1から15のいずれかに記載のオーディオデコーダ。
- 前記アップミックする手段は、前記第2のアップミックスオーディオ信号から分離された前記第1のアップミックスオーディオ信号を空間的に再現し、前記第1のアップミックスオーディオ信号から分離された前記第2のアップミックスオーディオ信号を空間的に再現し、または前記第1のアップミックスオーディオ信号と前記第2のアップミックスオーディオ信号を混合し、それによる混合バージョンを所定のスピーカ構成上に空間的に再現するように構成された、請求項1から16のいずれかに記載のオーディオデコーダ。
- 第1の所定の時間/周波数分解能で、第1タイプのオーディオ信号と第2タイプのオーディオ信号のレベル情報を演算する手段と、
前記レベル情報に基づいて、予測係数を演算する手段と、
ダウンミックス信号を取得するために、前記第1タイプのオーディオ信号と前記第2タイプのオーディオ信号をダウンミックスする手段と、
第2の所定の時間/周波数分解能で、残余レベル値を特定する残余信号を設定する手段であって、前記予測係数と前記残余信号の両方に基づいて前記ダウンミックス信号をアップミックスすることが、前記第1タイプのオーディオ信号を近似する第1のアップミックスオーディオ信号と、前記第2タイプのオーディオ信号を近似する第2のアップミックスオーディオ信号とに結果としてなるようにし、前記近似が前記残余信号がない場合に比較して改善される、残余信号を設定する手段と、
を備え、
前記レベル情報と前記残余信号は、前記ダウンミックス信号とともに、マルチ‐オーディオ‐オブジェクト信号を形成する副情報に備えられている、
オーディオオブジェクトエンコーダ。 - 第1タイプのオーディオ信号と第2タイプのオーディオ信号をスペクトルで分解する手段を更に備えた、請求項18に記載のオーディオオブジェクトエンコーダ。
- 第1タイプのオーディオ信号とエンコードされた第2タイプのオーディオ信号とを有するマルチ‐オーディオ‐オブジェクト信号をデコードする方法であって、
前記マルチ‐オーディオ‐オブジェクト信号は、ダウンミックス信号(56)と副情報(58)とから成り、前記副情報は、第1の所定の時間/周波数分解能(42)における前記第1タイプのオーディオ信号と前記第2タイプのオーディオ信号のレベル情報(60)と、第2の所定の時間/周波数分解能における残余レベル値を特定する残余信号(62)とを含むものであって、
前記レベル情報(60)に基づいて予測係数(64)を演算するステップと、
前記第1タイプのオーディオ信号を近似する第1のアップミックスオーディオ信号、および/または、前記第2タイプのオーディオ信号を近似する第2のアップミックスオーディオ信号を取得するために、前記予測係数(64)と前記残余信号(62)に基づいて前記ダウンミックス信号(56)をアップミックスするステップとを備える、
マルチ‐オーディオ‐オブジェクト信号をデコードする方法。 - 第1の所定の時間/周波数分解能で、第1タイプのオーディオ信号と第2タイプのオーディオ信号のレベル情報を演算するステップと、
前記レベル情報に基づいて、予測係数を演算するステップと、
ダウンミックス信号を取得するために、前記第1タイプのオーディオ信号と前記第2タイプのオーディオ信号をダウンミックスするステップと、
第2の所定の時間/周波数分解能で、残余レベル値を特定する残余信号を設定するステップであって、前記予測係数と前記残余信号に基づいて前記ダウンミックス信号をアップミックスすることが、前記第1タイプのオーディオ信号を近似する第1のアップミックスオーディオ信号と、前記第2タイプのオーディオ信号を近似する第2のアップミックスオーディオ信号とに結果としてなるようにし、前記近似が前記残余信号のない場合に比較して改善される、残余信号を設定するステップと、
を備え、
前記レベル情報と前記残余信号は、前記ダウンミックス信号とともに、マルチ‐オーディオ‐オブジェクト信号を形成する副情報に備えられている、
マルチ‐オーディオ‐オブジェクトをエンコードする方法。 - 処理装置上で動作するときに、請求項20または21に記載された方法を実行するプログラムコードを有する、コンピュータプログラム。
- 第1タイプのオーディオ信号とエンコードされた第2のタイプのオーディオ信号とを有するマルチ‐オーディオ‐オブジェクト信号であって、
ダウンミックス信号と副情報とから成り、前記副情報は、第1の所定の時間/周波数分解能における前記第1タイプのオーディオ信号と前記第2タイプのオーディオ信号のレベル情報と、第2の所定の時間/周波数分解能における残余レベル値を特定する残余信号とを含み、
前記レベル情報に基づいて予測係数を演算し、前記予測係数に基づいて前記ダウンミックス信号をアップミックスし、前記残余信号が、前記第1タイプのオーディオ信号を近似する第1のアップミックスオーディオ信号と、前記第2タイプのオーディオ信号を近似する第2のアップミックスオーディオ信号とに結果としてなるように、前記残余信号が設定される、
マルチ‐オーディオ‐オブジェクト信号。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US98057107P | 2007-10-17 | 2007-10-17 | |
US60/980,571 | 2007-10-17 | ||
US99133507P | 2007-11-30 | 2007-11-30 | |
US60/991,335 | 2007-11-30 | ||
PCT/EP2008/008799 WO2009049895A1 (en) | 2007-10-17 | 2008-10-17 | Audio coding using downmix |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011501544A true JP2011501544A (ja) | 2011-01-06 |
JP5260665B2 JP5260665B2 (ja) | 2013-08-14 |
Family
ID=40149576
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010529293A Active JP5883561B2 (ja) | 2007-10-17 | 2008-10-17 | アップミックスを使用した音声符号器 |
JP2010529292A Active JP5260665B2 (ja) | 2007-10-17 | 2008-10-17 | ダウンミックスを用いたオーディオコーディング |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010529293A Active JP5883561B2 (ja) | 2007-10-17 | 2008-10-17 | アップミックスを使用した音声符号器 |
Country Status (12)
Country | Link |
---|---|
US (4) | US8280744B2 (ja) |
EP (2) | EP2076900A1 (ja) |
JP (2) | JP5883561B2 (ja) |
KR (4) | KR101303441B1 (ja) |
CN (2) | CN101849257B (ja) |
AU (2) | AU2008314029B2 (ja) |
BR (2) | BRPI0816556A2 (ja) |
CA (2) | CA2702986C (ja) |
MX (2) | MX2010004220A (ja) |
RU (2) | RU2452043C2 (ja) |
TW (2) | TWI395204B (ja) |
WO (2) | WO2009049895A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013017022A (ja) * | 2011-07-04 | 2013-01-24 | Nippon Hoso Kyokai <Nhk> | オーディオ信号ミキシング装置およびそのプログラム、ならびに、オーディオ信号復元装置およびそのプログラム |
JP2014026007A (ja) * | 2012-07-24 | 2014-02-06 | Fujitsu Ltd | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム |
JP2015532723A (ja) * | 2012-08-07 | 2015-11-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ゲームオーディオコンテンツを示すオブジェクトベースオーディオの符号化及びレンダリング |
JP2016524721A (ja) * | 2013-05-13 | 2016-08-18 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オブジェクト特有時間/周波数分解能を使用する混合信号からのオーディオオブジェクト分離 |
US9489954B2 (en) | 2012-08-07 | 2016-11-08 | Dolby Laboratories Licensing Corporation | Encoding and rendering of object based audio indicative of game audio content |
JP2020034920A (ja) * | 2015-03-09 | 2020-03-05 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化又は復号化するための装置と方法 |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
KR100878816B1 (ko) * | 2006-02-07 | 2009-01-14 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
US8571875B2 (en) | 2006-10-18 | 2013-10-29 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus encoding and/or decoding multichannel audio signals |
JP5394931B2 (ja) * | 2006-11-24 | 2014-01-22 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の復号化方法及びその装置 |
JP5254983B2 (ja) * | 2007-02-14 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 |
KR101100213B1 (ko) * | 2007-03-16 | 2011-12-28 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
JP5220840B2 (ja) * | 2007-03-30 | 2013-06-26 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法 |
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
CN102968994B (zh) * | 2007-10-22 | 2015-07-15 | 韩国电子通信研究院 | 多对象音频解码方法和设备 |
KR101461685B1 (ko) * | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
KR101614160B1 (ko) | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
WO2010042024A1 (en) * | 2008-10-10 | 2010-04-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Energy conservative multi-channel audio coding |
MX2011011399A (es) * | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
EP2194526A1 (en) * | 2008-12-05 | 2010-06-09 | Lg Electronics Inc. | A method and apparatus for processing an audio signal |
US8620008B2 (en) | 2009-01-20 | 2013-12-31 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US8255821B2 (en) * | 2009-01-28 | 2012-08-28 | Lg Electronics Inc. | Method and an apparatus for decoding an audio signal |
JP5163545B2 (ja) * | 2009-03-05 | 2013-03-13 | 富士通株式会社 | オーディオ復号装置及びオーディオ復号方法 |
KR101387902B1 (ko) | 2009-06-10 | 2014-04-22 | 한국전자통신연구원 | 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더 |
CN101930738B (zh) * | 2009-06-18 | 2012-05-23 | 晨星软件研发(深圳)有限公司 | 多声道音频信号译码方法与装置 |
KR101283783B1 (ko) * | 2009-06-23 | 2013-07-08 | 한국전자통신연구원 | 고품질 다채널 오디오 부호화 및 복호화 장치 |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
ES2524428T3 (es) | 2009-06-24 | 2014-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio |
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
RU2576476C2 (ru) | 2009-09-29 | 2016-03-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., | Декодер аудиосигнала, кодер аудиосигнала, способ формирования представления сигнала повышающего микширования, способ формирования представления сигнала понижающего микширования, компьютерная программа и бистрим, использующий значение общего параметра межобъектной корреляции |
KR101710113B1 (ko) | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
KR20110049068A (ko) * | 2009-11-04 | 2011-05-12 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법 |
AU2010321013B2 (en) * | 2009-11-20 | 2014-05-29 | Dolby International Ab | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter |
WO2011073201A2 (en) | 2009-12-16 | 2011-06-23 | Dolby International Ab | Sbr bitstream parameter downmix |
US9536529B2 (en) * | 2010-01-06 | 2017-01-03 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
EP2372704A1 (en) * | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor and method for processing a signal |
MX2012011532A (es) | 2010-04-09 | 2012-11-16 | Dolby Int Ab | Codificacion a estereo para prediccion de complejos basados en mdct. |
US8948403B2 (en) * | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system |
KR101756838B1 (ko) * | 2010-10-13 | 2017-07-11 | 삼성전자주식회사 | 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 |
US20120095729A1 (en) * | 2010-10-14 | 2012-04-19 | Electronics And Telecommunications Research Institute | Known information compression apparatus and method for separating sound source |
EP2975611B1 (en) * | 2011-03-10 | 2018-01-10 | Telefonaktiebolaget LM Ericsson (publ) | Filling of non-coded sub-vectors in transform coded audio signals |
EP2686654A4 (en) * | 2011-03-16 | 2015-03-11 | Dts Inc | CODING AND PLAYING THREE-DIMENSIONAL AUDIOSPURES |
KR102053900B1 (ko) | 2011-05-13 | 2019-12-09 | 삼성전자주식회사 | 노이즈 필링방법, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기 |
EP2523472A1 (en) | 2011-05-13 | 2012-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method and computer program for generating a stereo output signal for providing additional output channels |
US9311923B2 (en) * | 2011-05-19 | 2016-04-12 | Dolby Laboratories Licensing Corporation | Adaptive audio processing based on forensic detection of media processing history |
EP2560161A1 (en) | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
CN103050124B (zh) | 2011-10-13 | 2016-03-30 | 华为终端有限公司 | 混音方法、装置及系统 |
RU2618383C2 (ru) | 2011-11-01 | 2017-05-03 | Конинклейке Филипс Н.В. | Кодирование и декодирование аудиообъектов |
SG194706A1 (en) * | 2012-01-20 | 2013-12-30 | Fraunhofer Ges Forschung | Apparatus and method for audio encoding and decoding employing sinusoidalsubstitution |
CA2843223A1 (en) * | 2012-07-02 | 2014-01-09 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
MX342150B (es) * | 2012-07-09 | 2016-09-15 | Koninklijke Philips Nv | Codificacion y decodificacion de señales de audio. |
US9190065B2 (en) | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
US9516446B2 (en) | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
CN104541524B (zh) | 2012-07-31 | 2017-03-08 | 英迪股份有限公司 | 一种用于处理音频信号的方法和设备 |
AR090703A1 (es) * | 2012-08-10 | 2014-12-03 | Fraunhofer Ges Forschung | Codificador, decodificador, sistema y metodo que emplean un concepto residual para codificar objetos de audio parametricos |
KR20140027831A (ko) * | 2012-08-27 | 2014-03-07 | 삼성전자주식회사 | 오디오 신호 전송 장치 및 그의 오디오 신호 전송 방법, 그리고 오디오 신호 수신 장치 및 그의 오디오 소스 추출 방법 |
EP2717261A1 (en) * | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding |
KR20140046980A (ko) | 2012-10-11 | 2014-04-21 | 한국전자통신연구원 | 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법 |
US9805725B2 (en) | 2012-12-21 | 2017-10-31 | Dolby Laboratories Licensing Corporation | Object clustering for rendering object-based audio content based on perceptual criteria |
CA3076775C (en) | 2013-01-08 | 2020-10-27 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
EP2757559A1 (en) * | 2013-01-22 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation |
US9786286B2 (en) | 2013-03-29 | 2017-10-10 | Dolby Laboratories Licensing Corporation | Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals |
CA3211308A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
ES2640815T3 (es) | 2013-05-24 | 2017-11-06 | Dolby International Ab | Codificación eficiente de escenas de audio que comprenden objetos de audio |
US9818412B2 (en) | 2013-05-24 | 2017-11-14 | Dolby International Ab | Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder |
KR102033304B1 (ko) * | 2013-05-24 | 2019-10-17 | 돌비 인터네셔널 에이비 | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 |
EP3270375B1 (en) | 2013-05-24 | 2020-01-15 | Dolby International AB | Reconstruction of audio scenes from a downmix |
ES2653975T3 (es) | 2013-07-22 | 2018-02-09 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de audio multicanal, codificador de audio multicanal, procedimientos, programa informático y representación de audio codificada mediante el uso de una decorrelación de señales de audio renderizadas |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830051A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP2830334A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals |
EP2830049A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2830048A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
US9812150B2 (en) | 2013-08-28 | 2017-11-07 | Accusonus, Inc. | Methods and systems for improved signal decomposition |
WO2015036352A1 (en) | 2013-09-12 | 2015-03-19 | Dolby International Ab | Coding of multichannel audio content |
TWI634547B (zh) | 2013-09-12 | 2018-09-01 | 瑞典商杜比國際公司 | 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品 |
JP6212645B2 (ja) * | 2013-09-12 | 2017-10-11 | ドルビー・インターナショナル・アーベー | オーディオ・デコード・システムおよびオーディオ・エンコード・システム |
EP2854133A1 (en) | 2013-09-27 | 2015-04-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Generation of a downmix signal |
KR20160072130A (ko) * | 2013-10-02 | 2016-06-22 | 슈트로밍스위스 게엠베하 | 2개 이상의 기본 신호로부터 다채널 신호의 유도 |
KR102268836B1 (ko) * | 2013-10-09 | 2021-06-25 | 소니그룹주식회사 | 부호화 장치 및 방법, 복호 장치 및 방법, 그리고 프로그램 |
KR102244379B1 (ko) * | 2013-10-21 | 2021-04-26 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
US10492014B2 (en) | 2014-01-09 | 2019-11-26 | Dolby Laboratories Licensing Corporation | Spatial error metrics of audio content |
US20150264505A1 (en) | 2014-03-13 | 2015-09-17 | Accusonus S.A. | Wireless exchange of data between devices in live events |
US10468036B2 (en) | 2014-04-30 | 2019-11-05 | Accusonus, Inc. | Methods and systems for processing and mixing signals using signal decomposition |
US9756448B2 (en) | 2014-04-01 | 2017-09-05 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
CN106471575B (zh) * | 2014-07-01 | 2019-12-10 | 韩国电子通信研究院 | 多信道音频信号处理方法及装置 |
WO2016004225A1 (en) * | 2014-07-03 | 2016-01-07 | Dolby Laboratories Licensing Corporation | Auxiliary augmentation of soundfields |
US9774974B2 (en) * | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
AU2015326856B2 (en) * | 2014-10-02 | 2021-04-08 | Dolby International Ab | Decoding method and decoder for dialog enhancement |
EP3540732B1 (en) * | 2014-10-31 | 2023-07-26 | Dolby International AB | Parametric decoding of multichannel audio signals |
TWI587286B (zh) * | 2014-10-31 | 2017-06-11 | 杜比國際公司 | 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 |
CN105989851B (zh) | 2015-02-15 | 2021-05-07 | 杜比实验室特许公司 | 音频源分离 |
US10176813B2 (en) | 2015-04-17 | 2019-01-08 | Dolby Laboratories Licensing Corporation | Audio encoding and rendering with discontinuity compensation |
ES2809677T3 (es) * | 2015-09-25 | 2021-03-05 | Voiceage Corp | Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario |
PT3539127T (pt) * | 2016-11-08 | 2020-12-04 | Fraunhofer Ges Forschung | Dispositivo de downmix e método para executar o downmix de pelo menos dois canais e codificador multicanal e descodificador multicanal |
EP3324406A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
EP3324407A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
US11595774B2 (en) * | 2017-05-12 | 2023-02-28 | Microsoft Technology Licensing, Llc | Spatializing audio data based on analysis of incoming audio data |
KR102550424B1 (ko) | 2018-04-05 | 2023-07-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 채널 간 시간 차를 추정하기 위한 장치, 방법 또는 컴퓨터 프로그램 |
CN109451194B (zh) * | 2018-09-28 | 2020-11-24 | 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) | 一种会议混音方法及装置 |
EP3874491B1 (en) | 2018-11-02 | 2024-05-01 | Dolby International AB | Audio encoder and audio decoder |
JP7092047B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 符号化復号方法、復号方法、これらの装置及びプログラム |
US10779105B1 (en) | 2019-05-31 | 2020-09-15 | Apple Inc. | Sending notification and multi-channel audio over channel limited link for independent gain control |
BR112021025265A2 (pt) | 2019-06-14 | 2022-03-15 | Fraunhofer Ges Forschung | Sintetizador de áudio, codificador de áudio, sistema, método e unidade de armazenamento não transitória |
GB2587614A (en) * | 2019-09-26 | 2021-04-07 | Nokia Technologies Oy | Audio encoding and audio decoding |
CN110739000B (zh) * | 2019-10-14 | 2022-02-01 | 武汉大学 | 一种适应于个性化交互系统的音频对象编码方法 |
WO2021232376A1 (zh) * | 2020-05-21 | 2021-11-25 | 华为技术有限公司 | 一种音频数据传输方法及相关装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006103581A1 (en) * | 2005-03-30 | 2006-10-05 | Koninklijke Philips Electronics N.V. | Scalable multi-channel audio coding |
WO2006108573A1 (en) * | 2005-04-15 | 2006-10-19 | Coding Technologies Ab | Adaptive residual audio coding |
JP2010507927A (ja) * | 2006-05-04 | 2010-03-11 | エルジー エレクトロニクス インコーポレイティド | リミキシング性能を持つ改善したオーディオ |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19537338C2 (de) | 1995-10-06 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren von Audiosignalen |
US5912976A (en) * | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
US6356639B1 (en) | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
US6016473A (en) * | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
DK1173925T3 (da) | 1999-04-07 | 2004-03-29 | Dolby Lab Licensing Corp | Matriksforbedringer til tabsfri kodning og dekodning |
WO2002079335A1 (fr) * | 2001-03-28 | 2002-10-10 | Mitsubishi Chemical Corporation | Procede de revetement avec une composition de resine durcissable par rayonnement et lamines |
DE10163827A1 (de) * | 2001-12-22 | 2003-07-03 | Degussa | Strahlen härtbare Pulverlackzusammensetzungen und deren Verwendung |
EP1500084B1 (en) * | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
US7395210B2 (en) * | 2002-11-21 | 2008-07-01 | Microsoft Corporation | Progressive to lossless embedded audio coder (PLEAC) with multiple factorization reversible transform |
EP1576602A4 (en) | 2002-12-28 | 2008-05-28 | Samsung Electronics Co Ltd | METHOD AND DEVICE FOR MIXING AUDIO SEQUENCE AND INFORMATION RECORDING MEDIUM |
DE10328777A1 (de) * | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
US20050058307A1 (en) * | 2003-07-12 | 2005-03-17 | Samsung Electronics Co., Ltd. | Method and apparatus for constructing audio stream for mixing, and information storage medium |
CA2992097C (en) | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
JP2005352396A (ja) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | 音響信号符号化装置および音響信号復号装置 |
US7317601B2 (en) * | 2004-07-29 | 2008-01-08 | United Microelectronics Corp. | Electrostatic discharge protection device and circuit thereof |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
SE0402651D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
JP2006197391A (ja) * | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
JP4988717B2 (ja) * | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
KR20080010980A (ko) * | 2006-07-28 | 2008-01-31 | 엘지전자 주식회사 | 부호화/복호화 방법 및 장치. |
US9426596B2 (en) | 2006-02-03 | 2016-08-23 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
WO2008039043A1 (en) * | 2006-09-29 | 2008-04-03 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
SG175632A1 (en) * | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP5337941B2 (ja) * | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
-
2008
- 2008-10-17 WO PCT/EP2008/008799 patent/WO2009049895A1/en active Application Filing
- 2008-10-17 CA CA2702986A patent/CA2702986C/en active Active
- 2008-10-17 KR KR1020117028843A patent/KR101303441B1/ko active IP Right Grant
- 2008-10-17 RU RU2010114875/08A patent/RU2452043C2/ru active
- 2008-10-17 MX MX2010004220A patent/MX2010004220A/es active IP Right Grant
- 2008-10-17 TW TW097140089A patent/TWI395204B/zh active
- 2008-10-17 US US12/253,515 patent/US8280744B2/en active Active
- 2008-10-17 MX MX2010004138A patent/MX2010004138A/es active IP Right Grant
- 2008-10-17 BR BRPI0816556A patent/BRPI0816556A2/pt not_active Application Discontinuation
- 2008-10-17 AU AU2008314029A patent/AU2008314029B2/en active Active
- 2008-10-17 BR BRPI0816557-2A patent/BRPI0816557B1/pt active IP Right Grant
- 2008-10-17 KR KR1020107008133A patent/KR101244515B1/ko active IP Right Grant
- 2008-10-17 CN CN200880111872.8A patent/CN101849257B/zh active Active
- 2008-10-17 EP EP08839058A patent/EP2076900A1/en not_active Ceased
- 2008-10-17 KR KR1020117028846A patent/KR101290394B1/ko active IP Right Grant
- 2008-10-17 CA CA2701457A patent/CA2701457C/en active Active
- 2008-10-17 CN CN2008801113955A patent/CN101821799B/zh active Active
- 2008-10-17 JP JP2010529293A patent/JP5883561B2/ja active Active
- 2008-10-17 EP EP08840635A patent/EP2082396A1/en not_active Ceased
- 2008-10-17 AU AU2008314030A patent/AU2008314030B2/en active Active
- 2008-10-17 JP JP2010529292A patent/JP5260665B2/ja active Active
- 2008-10-17 RU RU2010112889/08A patent/RU2474887C2/ru active
- 2008-10-17 KR KR1020107008183A patent/KR101244545B1/ko active IP Right Grant
- 2008-10-17 TW TW097140088A patent/TWI406267B/zh active
- 2008-10-17 US US12/253,442 patent/US8155971B2/en active Active
- 2008-10-17 WO PCT/EP2008/008800 patent/WO2009049896A1/en active Application Filing
-
2012
- 2012-04-20 US US13/451,649 patent/US8407060B2/en active Active
-
2013
- 2013-01-23 US US13/747,502 patent/US8538766B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006103581A1 (en) * | 2005-03-30 | 2006-10-05 | Koninklijke Philips Electronics N.V. | Scalable multi-channel audio coding |
JP2008535014A (ja) * | 2005-03-30 | 2008-08-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | スケーラブルマルチチャネル音声符号化方法 |
WO2006108573A1 (en) * | 2005-04-15 | 2006-10-19 | Coding Technologies Ab | Adaptive residual audio coding |
JP2008536184A (ja) * | 2005-04-15 | 2008-09-04 | コーディング テクノロジーズ アクチボラゲット | 適応残差オーディオ符号化 |
JP2010507927A (ja) * | 2006-05-04 | 2010-03-11 | エルジー エレクトロニクス インコーポレイティド | リミキシング性能を持つ改善したオーディオ |
Non-Patent Citations (1)
Title |
---|
JPN6012045621; Jurgen Herre, et al: 'New Concepts in Parametric Coding of Spatial Audio: From SAC to SAOC' Multimedia and EXPO, 2007 IEEE International Conference , 20070701, pages 1894-1897, IEEE * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013017022A (ja) * | 2011-07-04 | 2013-01-24 | Nippon Hoso Kyokai <Nhk> | オーディオ信号ミキシング装置およびそのプログラム、ならびに、オーディオ信号復元装置およびそのプログラム |
JP2014026007A (ja) * | 2012-07-24 | 2014-02-06 | Fujitsu Ltd | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム |
JP2015532723A (ja) * | 2012-08-07 | 2015-11-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ゲームオーディオコンテンツを示すオブジェクトベースオーディオの符号化及びレンダリング |
US9489954B2 (en) | 2012-08-07 | 2016-11-08 | Dolby Laboratories Licensing Corporation | Encoding and rendering of object based audio indicative of game audio content |
JP2016524721A (ja) * | 2013-05-13 | 2016-08-18 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オブジェクト特有時間/周波数分解能を使用する混合信号からのオーディオオブジェクト分離 |
US10089990B2 (en) | 2013-05-13 | 2018-10-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
JP2020034920A (ja) * | 2015-03-09 | 2020-03-05 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化又は復号化するための装置と方法 |
CN112233684A (zh) * | 2015-03-09 | 2021-01-15 | 弗劳恩霍夫应用研究促进协会 | 用于对多声道信号进行编码或解码的装置与方法 |
US11508384B2 (en) | 2015-03-09 | 2022-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding a multi-channel signal |
JP7208126B2 (ja) | 2015-03-09 | 2023-01-18 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化又は復号化するための装置と方法 |
CN112233684B (zh) * | 2015-03-09 | 2024-03-19 | 弗劳恩霍夫应用研究促进协会 | 用于对多声道信号进行编码或解码的装置与方法 |
US11955131B2 (en) | 2015-03-09 | 2024-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding a multi-channel signal |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5260665B2 (ja) | ダウンミックスを用いたオーディオコーディング | |
JP4685925B2 (ja) | 適応残差オーディオ符号化 | |
US7916873B2 (en) | Stereo compatible multi-channel audio coding | |
AU2007312597B2 (en) | Apparatus and method for multi -channel parameter transformation | |
TWI431610B (zh) | 用以將以物件為主之音訊信號編碼與解碼之方法與裝置 | |
JP4601669B2 (ja) | マルチチャネル信号またはパラメータデータセットを生成する装置および方法 | |
JP2011059711A (ja) | オーディオエンコード及びデコード |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120207 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120502 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121203 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121210 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121227 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130425 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5260665 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |