JP2012530952A - カスケード化されたオーディオオブジェクト処理ステージを用いたオーディオ信号デコーダ、オーディオ信号を復号化する方法、およびコンピュータプログラム - Google Patents
カスケード化されたオーディオオブジェクト処理ステージを用いたオーディオ信号デコーダ、オーディオ信号を復号化する方法、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2012530952A JP2012530952A JP2012516716A JP2012516716A JP2012530952A JP 2012530952 A JP2012530952 A JP 2012530952A JP 2012516716 A JP2012516716 A JP 2012516716A JP 2012516716 A JP2012516716 A JP 2012516716A JP 2012530952 A JP2012530952 A JP 2012530952A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- information
- signal
- downmix
- saoc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 152
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000012545 processing Methods 0.000 title claims description 106
- 238000004590 computer program Methods 0.000 title claims description 14
- 230000008569 process Effects 0.000 claims abstract description 34
- 238000009877 rendering Methods 0.000 claims description 80
- 239000011159 matrix material Substances 0.000 claims description 31
- 238000000926 separation method Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012546 transfer Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 26
- 238000012360 testing method Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 19
- 239000002131 composite material Substances 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000004091 panning Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000012925 reference material Substances 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 101100426956 Caenorhabditis elegans ttn-1 gene Proteins 0.000 description 1
- 208000037271 Cystoid macular dystrophy Diseases 0.000 description 1
- 241000610375 Sparisoma viride Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 201000010206 cystoid macular edema Diseases 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229940050561 matrix product Drugs 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/155—Musical effects
- G10H2210/265—Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
- G10H2210/295—Spatial effects, musical uses of multiple audio channels, e.g. stereo
- G10H2210/301—Soundscape or sound field simulation, reproduction or control for musical purposes, e.g. surround or 3D sound; Granular synthesis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【選択図】図1
Description
・N個の入力オーディオオブジェクト信号x1〜xNは、SAOCエンコーダ処理の一部としてダウンミックスされる。モノラルダウンミックスに対しては、ダウンミックス係数は、d1〜dNで示される。加えて、SAOCエンコーダ810は、入力オーディオオブジェクトの特性を記述するサイド情報814を抽出する。MPEG‐SAOCに対しては、お互いに関するオブジェクトパワーの関係は、このようなサイド情報の最も基本的な形である。
・ダウンミックス信号812とサイド情報814は、送信および/または記憶される。
このために、ダウンミックスオーディオ信号は、MPEG‐1レイヤーIIまたはIII(「.mp3」としても知られる)のような周知の知覚的オーディオコーダ、MPEGアドバーンストオーディオ符号化(AAC)、または他のいかなるオーディオコーダを用いても圧縮することができる。
・実際上、オブジェクト信号の分離は、分離ステップ(オブジェクトセパレータ820aによって示される)と混合ステップ(ミキサー820cによって示される)の両方は、単一の変換符号化ステップに複合化されるので、めったに実行されず(または決して実行されず)、結果としてしばしば計算量の莫大な減少になる。
また、定型のオーディオオブジェクト(非拡張オーディオオブジェクト)は、1つまたは2つの共通のオブジェクトレベル差値OLDL、OLDRを有する単一の1チャンネルまたは2チャンネルのオーディオオブジェクトとして取り扱われる。
SAOCタイプの処理ステージI 520aは、また、オブジェクトの第2のセットを記述する1つ以上の信号564aを提供する。
全ての被検者は、経験豊かなリスナーと考えられることができる。MUSHRA法に従って、リスナーは、レファレンスに対する全ての試験条件を比較するように指示された。試験条件は、各試験項目に対して、かつ各リスナーに対して、自動的にランダム化された。
主観的な反応は、コンピュータベースのMUSHRAプログラムによって0から100の範囲のスケールで記録された。試験中の項目間の瞬間的なスイッチングは可能にされた。MUSHRA試験は、考慮されるSAOCモードの知覚的パフォーマンスと、リスニング試験計画書を提供する図6aの表に記載された提案システムを評価するために行われた。
・図6dは、現在のEKSモードに対する、カラオケ-タイプのアプリケーションのための複合EKS−SAOCシステムとの比較を表す。全ての試験された項目に対して、これらの2つのシステム間のパフォーマンスにおける有意の差(統計的センスにおいて)はない。この観測から、複合EKS−SAOCシステムは、が能率的に、EKSモードのパフォーマンスに達する残余情報を効率的に利用することが可能であると結論づけることができる。定型のSAOCシステム(残余なし)のパフォーマンスは、他のシステムの両方より下回ることにも注目することができる。
・図6eは、現在の定型のSAOCの、クラシックのレンダリングシナリオに対する複合EKS‐SAOCシステムとの比較を表す。全ての試験された項目に対して、これらの2つのシステムのパフォーマンスは統計学的に同じである。これは、クラシックのレンダリングシナリオに対する複合EKS‐SAOCシステムの固有の機能を示す。
・1つの単一のクリアなSAOC復号化/変換符号化構造である
・EKSと定型のSAOCモードの両方に対する1つのビットストリームである
・SOAC符号化ステージの前にバックグラウンドオブジェクトを生成する必要がないように、バックグラウンドオブジェクト(BGO)を備える入力オブジェクトの数への制限がない
・カラオケ/ソロ再生状況の要求において拡張された知覚的品質を与えるフォアグラウンドオブジェクトに対する残余符号化をサポートする
Claims (34)
- ダウンミックス信号表現(112;210;510;510a)とオブジェクト関連パラメータ情報(110;212;512;512a))に基づいてアップミックス信号表現を提供するオーディオ信号デコーダ(100;200;500;590)であって、
前記ダウンミックス信号表現を分解し、前記ダウンミックス信号表現に基づいて、第1のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトの第1のセットを記述する第1のオーディオ情報(132;262;562;562a)と、第2のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトの第2のセットを記述する第2のオーディオ情報(134;264;564;564a)を提供するように構成された、オブジェクトセパレータ(130;260;520;520a)と、
前記第2のオーディオ情報(134;264;564;564a)を受信し、前記オブジェクト関連パラメータ情報に基づいて前記第2のオーディオ情報を処理し、前記第2のオーディオ情報の処理されたバージョン(142;272;572;572a)を取得するように構成された、オーディオ信号プロセッサと、
前記第1のオーディオ情報を前記第2のオーディオ情報の処理されたバージョンと結合し、前記アップミックス信号表現を取得するように構成された、オーディオ信号コンバイナ(150;280;580;580a)とを備えた、
オーディオ信号デコーダ。 - 前記ダウンミックス信号表現によって表されたオーディオオブジェクトのサブセットに関する残余情報に基づいて前記アップミックス信号表現を提供するように構成され、
前記オブジェクトセパレータは、前記ダウンミックス信号表現を分解し、前記ダウンミックス信号表現に基づき、前記残余情報を用いて、残余情報が関連する第1のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトの第1のセットを記述する前記第1のオーディオ情報と、残余情報が関連しない第2のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトの第2のセットを記述する前記第2のオーディオ情報を提供するように構成された、
請求項1に記載のオーディオ信号デコーダ。 - 前記オブジェクトセパレータは、前記第1のオーディオ情報において、前記第1のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトが、前記第2のオーディオオブジェクトタイプのオーディオオブジェクトを超えて強調されるように、前記第1のオーディオ情報を提供するように構成され、
前記オブジェクトセパレータは、前記第2のオーディオ情報において、前記第2のオーディオオブジェクトタイプのオーディオオブジェクトが、前記第1のオーディオオブジェクトタイプのオーディオオブジェクトを超えて強調されるように、前記第2のオーディオ情報を提供するように構成された、
請求項1または2に記載のオーディオ信号デコーダ。 - 前記オーディオ信号プロセッサ(140;270;570;570a)における前記第2のオーディオ情報の処理が、前記第1のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトの第1のセットを記述する前記第1のオーディオ情報と前記第2のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトの第2のセットを記述する前記第2のオーディオ情報の分離の後に実行されるように、2ステップ処理を実行するように構成された、請求項1〜3のいずれかに記載のオーディオ信号デコーダ。
- 前記オーディオ信号プロセッサは、前記第2のオーディオオブジェクトタイプのオーディオオブジェクトに関する前記オブジェクト関連パラメータ情報(110;212;512;512a)に基づき、前記第1のオーディオオブジェクトタイプのオーディオオブジェクトに関する前記オブジェクト関連パラメータ情報(110;212;512;512a)から独立して、前記第2のオーディオ情報(134;264;564;564a)を処理するように構成された、請求項1〜4のいずれかに記載のオーディオ信号デコーダ。
- 前記オブジェクトセパレータは、前記第1のオーディオ情報(132;262;562;562a)にレンダリングマトリックスを適用し、前記第1のオーディオ情報のオブジェクト信号を前記アップミックスオーディオ信号表現(120;220、222;562;562a)のオーディオチャンネルにマッピングするように構成された、請求項1〜13のいずれかに記載のオーディオ信号デコーダ。
- 前記オーディオ信号プロセッサ(140;270;570;570a)は、前記ステレオ処理を実行し、レンダリング情報と共分散情報に基づいて、前記第2のオーディオ情報(134;264;564;564a)の推定されたオーディオオブジェクト貢献度(ED*JX)を、前記アップミックスオーディオ信号表現の複数のチャンネルにマッピングするように構成された、請求項15に記載のオーディオ信号デコーダ。
- 前記オーディオ信号プロセッサは、前記第2のオーディオ情報のモノラルからバイノーラルへの処理を実行し、頭部に関する伝達関数を考慮に入れて、前記第2のオーディオ情報の単一のチャンネルを前記アップミックス信号表現の2つのチャンネルにマッピングするように構成された、請求項18に記載のオーディオ信号デコーダ。
- 前記オーディオ信号プロセッサは、前記第2のオーディオ情報のモノラルからステレオへの処理を実行し、前記第2のオーディオ情報の単一のチャンネルを前記アップミックス信号表現の2つのチャンネルにマッピングするように構成された、請求項18に記載のオーディオ信号デコーダ。
- 前記オーディオ信号プロセッサは、前記第2のオーディオ情報のステレオからバイノーラルへの処理を実行し、頭部に関する伝達関数を考慮に入れて、前記第2のオーディオ情報の2つのチャンネルを前記アップミックス信号表現の2つのチャンネルにマッピングするように構成された、請求項18に記載のオーディオ信号デコーダ。
- 前記オーディオ信号プロセッサは、前記第2のオーディオ情報のステレオからステレオへの処理を実行し、前記第2のオーディオ情報の2つのチャンネルを前記アップミックス信号表現の2つのチャンネルにマッピングするように構成された、請求項18に記載のオーディオ信号デコーダ。
- 前記オブジェクトセパレータは、残余情報が関連しない前記第2のオーディオオブジェクトタイプのオーディオオブジェクトを、単一のオーディオオブジェクトとして取り扱うように構成され、
前記オーディオ信号プロセッサは、前記第2のオーディオオブジェクトタイプのオーディオオブジェクトに関するオブジェクトに特有のレンダリングパラメータを考慮し、前記第2のオーディオオブジェクトタイプのオーディオオブジェクトの貢献度を前記アップミックス信号表現に合わせるように構成された、請求項1〜22のいずれかに記載のオーディオ信号デコーダ。 - 前記オブジェクトセパレータは、前記第2のオーディオオブジェクトタイプの複数のオーディオオブジェクトに対して、1つまたは2つの共通のオブジェクトレベル差値(OLDL、OLDR)を取得するように構成され、
前記オブジェクトセパレータは、チャンネル予測係数(CPC)の演算に対して、前記共通のオブジェクトレベル差値を用いるように構成され、
前記オブジェクトセパレータは、前記チャンネル予測係数を用い、前記第2のオーディオ情報を表す1つまたは2つのオーディオチャンネルを取得するように構成された、請求項1〜23のいずれかに記載のオーディオ信号デコーダ。 - 前記オーディオ信号プロセッサは、前記オブジェクト関連パラメータ情報に基づいて前記第2のオーディオ情報をレンダリングし、前記第2のオーディオ情報の処理されたバージョンとして、前記第2のオーディオオブジェクトタイプのオーディオオブジェクトのレンダリングされた表現を取得するように構成された、請求項1〜26のいずれかに記載のオーディオ信号デコーダ。
- 前記オブジェクトセパレータは、前記第2のオーディオ情報が第2のオーディオオブジェクトタイプの2つを超えるオーディオオブジェクトを記述するように、前記第2のオーディオ情報を提供するように構成された、請求項1〜27のいずれかに記載のオーディオ信号デコーダ。
- 前記オブジェクトセパレータは、前記第2のオーディオ情報として、前記第2のオーディオオブジェクトタイプの2つを超えるオーディオオブジェクトを表す1チャンネルのオーディオ信号表現または2チャンネルのオーディオ信号表現を取得するように構成された、請求項28に記載のオーディオ信号デコーダ。
- 前記オーディオ信号プロセッサは、前記第2のオーディオ情報を受信し、前記第2のオーディオオブジェクトタイプの2つを超えるオーディオオブジェクトに関するオブジェクト関連パラメータ情報を考慮に入れて、前記オブジェクト関連パラメータ情報に基づいて前記第2のオーディオ情報を処理するように構成された、請求項1〜29のいずれかに記載のオーディオ信号デコーダ。
- 前記オブジェクト関連パラメータ情報の構成情報(SAOCSpecificConfig)から、トータルのオブジェクト数情報(bsNumObjects)とフォアグラウンドのオブジェクト数情報(bsNumGroupsFGO)を抽出し、前記トータルのオブジェクト数情報と前記フォアグラウンドのオブジェクト数情報の差を形成することによって、前記第2のオーディオオブジェクトタイプのオーディオオブジェクトの数を決定するように構成された、請求項1〜30のいずれかに記載のオーディオ信号デコーダ。
- ダウンミックス信号表現とオブジェクト関連パラメータ情報に基づいてアップミックス信号表現を提供する方法であって、
前記ダウンミックス信号表現を分解し、前記ダウンミックス信号表現に基づき、前記オブジェクト関連パラメータ情報の少なくとも一部を用いて、第1のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトの第1のセットを記述する第1のオーディ情報と、第2のオーディオオブジェクトタイプの1つ以上のオーディオオブジェクトの第2のセットを記述する第2のオーディオ情報を取得するステップと、
前記オブジェクト関連パラメータ情報に基づいて前記第2のオーディオ情報を処理し、前記第2のオーディオ情報の処理されたバージョンを取得するステップと、
前記第1のオーディオ情報を前記第2のオーディオ情報の処理されたバージョンと結合するステップとを備えた、
アップミックス信号表現を提供する方法。 - コンピュータプログラムがコンピュータ上で動作するときに、請求項33に記載された方法を実行する、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US22004209P | 2009-06-24 | 2009-06-24 | |
US61/220,042 | 2009-06-24 | ||
PCT/EP2010/058906 WO2010149700A1 (en) | 2009-06-24 | 2010-06-23 | Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012530952A true JP2012530952A (ja) | 2012-12-06 |
JP5678048B2 JP5678048B2 (ja) | 2015-02-25 |
Family
ID=42665723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012516716A Active JP5678048B2 (ja) | 2009-06-24 | 2010-06-23 | カスケード化されたオーディオオブジェクト処理ステージを用いたオーディオ信号デコーダ、オーディオ信号を復号化する方法、およびコンピュータプログラム |
Country Status (20)
Country | Link |
---|---|
US (1) | US8958566B2 (ja) |
EP (2) | EP2446435B1 (ja) |
JP (1) | JP5678048B2 (ja) |
KR (1) | KR101388901B1 (ja) |
CN (3) | CN103474077B (ja) |
AR (1) | AR077226A1 (ja) |
AU (1) | AU2010264736B2 (ja) |
BR (1) | BRPI1009648B1 (ja) |
CA (2) | CA2766727C (ja) |
CO (1) | CO6480949A2 (ja) |
ES (2) | ES2524428T3 (ja) |
HK (2) | HK1180100A1 (ja) |
MX (1) | MX2011013829A (ja) |
MY (1) | MY154078A (ja) |
PL (2) | PL2446435T3 (ja) |
RU (1) | RU2558612C2 (ja) |
SG (1) | SG177277A1 (ja) |
TW (1) | TWI441164B (ja) |
WO (1) | WO2010149700A1 (ja) |
ZA (1) | ZA201109112B (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016522445A (ja) * | 2013-05-24 | 2016-07-28 | ドルビー・インターナショナル・アーベー | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
JP2016527806A (ja) * | 2013-07-22 | 2016-09-08 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 入力チャネル設定の複数の入力チャネルを出力チャネル設定の出力チャネルにマッピングするための方法及び信号処理装置 |
JP2016534667A (ja) * | 2013-09-11 | 2016-11-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 複数の拡声器信号を非相関にする装置及び方法 |
JP2019032541A (ja) * | 2013-07-22 | 2019-02-28 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・オーディオ・デコーダ、マルチチャネル・オーディオ・エンコーダ、レンダリングされたオーディオ信号を使用する方法、コンピュータ・プログラムおよび符号化オーディオ表現 |
US11115770B2 (en) | 2013-07-22 | 2021-09-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel decorrelator, multi-channel audio decoder, multi channel audio encoder, methods and computer program using a premix of decorrelator input signals |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2576476C2 (ru) | 2009-09-29 | 2016-03-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., | Декодер аудиосигнала, кодер аудиосигнала, способ формирования представления сигнала повышающего микширования, способ формирования представления сигнала понижающего микширования, компьютерная программа и бистрим, использующий значение общего параметра межобъектной корреляции |
KR20120071072A (ko) * | 2010-12-22 | 2012-07-02 | 한국전자통신연구원 | 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 |
TWI450266B (zh) * | 2011-04-19 | 2014-08-21 | Hon Hai Prec Ind Co Ltd | 電子裝置及音頻資料的解碼方法 |
WO2013186344A2 (en) | 2012-06-14 | 2013-12-19 | Dolby International Ab | Smooth configuration switching for multichannel audio rendering based on a variable number of received channels |
MX342150B (es) * | 2012-07-09 | 2016-09-15 | Koninklijke Philips Nv | Codificacion y decodificacion de señales de audio. |
EP2690621A1 (en) * | 2012-07-26 | 2014-01-29 | Thomson Licensing | Method and Apparatus for downmixing MPEG SAOC-like encoded audio signals at receiver side in a manner different from the manner of downmixing at encoder side |
AR090703A1 (es) * | 2012-08-10 | 2014-12-03 | Fraunhofer Ges Forschung | Codificador, decodificador, sistema y metodo que emplean un concepto residual para codificar objetos de audio parametricos |
ES2595220T3 (es) * | 2012-08-10 | 2016-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y métodos para adaptar información de audio a codificación de objeto de audio espacial |
EP2717262A1 (en) | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
EP2717261A1 (en) * | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding |
CN108806706B (zh) * | 2013-01-15 | 2022-11-15 | 韩国电子通信研究院 | 处理信道信号的编码/解码装置及方法 |
EP2757559A1 (en) * | 2013-01-22 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
EP2956935B1 (en) | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
US9685163B2 (en) * | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
WO2014171706A1 (ko) * | 2013-04-15 | 2014-10-23 | 인텔렉추얼디스커버리 주식회사 | 가상 객체 생성을 이용한 오디오 신호 처리 방법 |
EP2804176A1 (en) * | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
CA3211308A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
EP3270375B1 (en) | 2013-05-24 | 2020-01-15 | Dolby International AB | Reconstruction of audio scenes from a downmix |
KR102033304B1 (ko) * | 2013-05-24 | 2019-10-17 | 돌비 인터네셔널 에이비 | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 |
US10499176B2 (en) * | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
CN104240711B (zh) * | 2013-06-18 | 2019-10-11 | 杜比实验室特许公司 | 用于生成自适应音频内容的方法、系统和装置 |
EP3014901B1 (en) * | 2013-06-28 | 2017-08-23 | Dolby Laboratories Licensing Corporation | Improved rendering of audio objects using discontinuous rendering-matrix updates |
EP2830049A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2840811A1 (en) | 2013-07-22 | 2015-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder |
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP3503095A1 (en) | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
TWI634547B (zh) | 2013-09-12 | 2018-09-01 | 瑞典商杜比國際公司 | 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品 |
KR102244379B1 (ko) * | 2013-10-21 | 2021-04-26 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
CN105637581B (zh) * | 2013-10-21 | 2019-09-20 | 杜比国际公司 | 用于音频信号的参数重建的去相关器结构 |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
CN106471575B (zh) * | 2014-07-01 | 2019-12-10 | 韩国电子通信研究院 | 多信道音频信号处理方法及装置 |
US9774974B2 (en) | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
MX370034B (es) | 2015-02-02 | 2019-11-28 | Fraunhofer Ges Forschung | Aparato y método para procesar una señal de audio codificada. |
CN111556426B (zh) | 2015-02-06 | 2022-03-25 | 杜比实验室特许公司 | 用于自适应音频的混合型基于优先度的渲染系统和方法 |
CN106303897A (zh) | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
EP3324407A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
EP3324406A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
US10659906B2 (en) | 2017-01-13 | 2020-05-19 | Qualcomm Incorporated | Audio parallax for virtual reality, augmented reality, and mixed reality |
US10304468B2 (en) | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
US10469968B2 (en) | 2017-10-12 | 2019-11-05 | Qualcomm Incorporated | Rendering for computer-mediated reality systems |
FR3075443A1 (fr) * | 2017-12-19 | 2019-06-21 | Orange | Traitement d'un signal monophonique dans un decodeur audio 3d restituant un contenu binaural |
CN111630593B (zh) * | 2018-01-18 | 2021-12-28 | 杜比实验室特许公司 | 用于译码声场表示信号的方法和装置 |
CN110890930B (zh) * | 2018-09-10 | 2021-06-01 | 华为技术有限公司 | 一种信道预测方法、相关设备及存储介质 |
EP3874491B1 (en) | 2018-11-02 | 2024-05-01 | Dolby International AB | Audio encoder and audio decoder |
ES2969138T3 (es) | 2018-12-07 | 2024-05-16 | Fraunhofer Ges Forschung | Aparato, método y programa informático para codificación, decodificación, procesamiento de escenas y otros procedimientos relacionados con codificación de audio espacial basada en dirac que utiliza compensación directa de componentes |
CN114631142A (zh) * | 2019-11-05 | 2022-06-14 | 索尼集团公司 | 电子设备、方法和计算机程序 |
US11368456B2 (en) | 2020-09-11 | 2022-06-21 | Bank Of America Corporation | User security profile for multi-media identity verification |
US11356266B2 (en) | 2020-09-11 | 2022-06-07 | Bank Of America Corporation | User authentication using diverse media inputs and hash-based ledgers |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
WO1999048214A2 (en) * | 1998-03-19 | 1999-09-23 | Koninklijke Philips Electronics N.V. | Transmitting device for transmitting a digital information signal alternately in encoded form and non-encoded form |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
EP1308931A1 (de) * | 2001-10-23 | 2003-05-07 | Deutsche Thomson-Brandt Gmbh | Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist |
US6742293B2 (en) | 2002-02-11 | 2004-06-01 | Cyber World Group | Advertising system |
EP1500084B1 (en) * | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
KR100524065B1 (ko) * | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
JP2005202262A (ja) * | 2004-01-19 | 2005-07-28 | Matsushita Electric Ind Co Ltd | 音声信号符号化方法、音声信号復号化方法、送信機、受信機、及びワイヤレスマイクシステム |
KR100658222B1 (ko) * | 2004-08-09 | 2006-12-15 | 한국전자통신연구원 | 3차원 디지털 멀티미디어 방송 시스템 |
EP1999997B1 (en) * | 2006-03-28 | 2011-04-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enhanced method for signal shaping in multi-channel audio reconstruction |
EP3447916B1 (en) | 2006-07-04 | 2020-07-15 | Dolby International AB | Filter system comprising a filter converter and a filter compressor and method for operating the filter system |
EP2092516A4 (en) | 2006-11-15 | 2010-01-13 | Lg Electronics Inc | METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING |
KR20080073926A (ko) * | 2007-02-07 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호를 복호화하는 장치에서 이퀄라이저를 구현하는방법 및 이를 위한 장치 |
JP5133401B2 (ja) | 2007-04-26 | 2013-01-30 | ドルビー・インターナショナル・アクチボラゲット | 出力信号の合成装置及び合成方法 |
US20090051637A1 (en) | 2007-08-20 | 2009-02-26 | Himax Technologies Limited | Display devices |
-
2010
- 2010-06-23 ES ES12183562.3T patent/ES2524428T3/es active Active
- 2010-06-23 JP JP2012516716A patent/JP5678048B2/ja active Active
- 2010-06-23 EP EP10727721.2A patent/EP2446435B1/en active Active
- 2010-06-23 CN CN201310404595.2A patent/CN103474077B/zh active Active
- 2010-06-23 MY MYPI2011006118A patent/MY154078A/en unknown
- 2010-06-23 RU RU2012101652/08A patent/RU2558612C2/ru active
- 2010-06-23 CN CN201310404591.4A patent/CN103489449B/zh active Active
- 2010-06-23 PL PL10727721T patent/PL2446435T3/pl unknown
- 2010-06-23 PL PL12183562T patent/PL2535892T3/pl unknown
- 2010-06-23 TW TW099120419A patent/TWI441164B/zh active
- 2010-06-23 KR KR1020117030866A patent/KR101388901B1/ko active IP Right Grant
- 2010-06-23 CA CA2766727A patent/CA2766727C/en active Active
- 2010-06-23 BR BRPI1009648-5A patent/BRPI1009648B1/pt active IP Right Grant
- 2010-06-23 CA CA2855479A patent/CA2855479C/en active Active
- 2010-06-23 MX MX2011013829A patent/MX2011013829A/es active IP Right Grant
- 2010-06-23 SG SG2011093796A patent/SG177277A1/en unknown
- 2010-06-23 EP EP12183562.3A patent/EP2535892B1/en active Active
- 2010-06-23 WO PCT/EP2010/058906 patent/WO2010149700A1/en active Application Filing
- 2010-06-23 AU AU2010264736A patent/AU2010264736B2/en active Active
- 2010-06-23 CN CN201080028673.8A patent/CN102460573B/zh active Active
- 2010-06-23 ES ES10727721T patent/ES2426677T3/es active Active
- 2010-06-24 AR ARP100102243A patent/AR077226A1/es active IP Right Grant
-
2011
- 2011-12-12 ZA ZA2011/09112A patent/ZA201109112B/en unknown
- 2011-12-22 US US13/335,047 patent/US8958566B2/en active Active
- 2011-12-23 CO CO11177816A patent/CO6480949A2/es active IP Right Grant
-
2012
- 2012-11-01 HK HK13107119.6A patent/HK1180100A1/xx unknown
- 2012-11-01 HK HK12111010.9A patent/HK1170329A1/xx unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016522445A (ja) * | 2013-05-24 | 2016-07-28 | ドルビー・インターナショナル・アーベー | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
US9818412B2 (en) | 2013-05-24 | 2017-11-14 | Dolby International Ab | Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder |
JP2016527806A (ja) * | 2013-07-22 | 2016-09-08 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 入力チャネル設定の複数の入力チャネルを出力チャネル設定の出力チャネルにマッピングするための方法及び信号処理装置 |
JP2019032541A (ja) * | 2013-07-22 | 2019-02-28 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・オーディオ・デコーダ、マルチチャネル・オーディオ・エンコーダ、レンダリングされたオーディオ信号を使用する方法、コンピュータ・プログラムおよび符号化オーディオ表現 |
US11115770B2 (en) | 2013-07-22 | 2021-09-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel decorrelator, multi-channel audio decoder, multi channel audio encoder, methods and computer program using a premix of decorrelator input signals |
US11240619B2 (en) | 2013-07-22 | 2022-02-01 | Fraunhofer-Gesellschaft zur Foerderang der angewandten Forschung e.V. | Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals |
US11252523B2 (en) | 2013-07-22 | 2022-02-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals |
US11381925B2 (en) | 2013-07-22 | 2022-07-05 | Fraunhofer-Gesellschaft zur Foerderang der angewandten Forschung e.V. | Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals |
JP2016534667A (ja) * | 2013-09-11 | 2016-11-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 複数の拡声器信号を非相関にする装置及び方法 |
US9807534B2 (en) | 2013-09-11 | 2017-10-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Device and method for decorrelating loudspeaker signals |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5678048B2 (ja) | カスケード化されたオーディオオブジェクト処理ステージを用いたオーディオ信号デコーダ、オーディオ信号を復号化する方法、およびコンピュータプログラム | |
KR102230727B1 (ko) | 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법 | |
TWI550598B (zh) | 使用聯合編碼殘餘信號之音訊編碼器、音訊解碼器、方法及電腦程式 | |
TWI508578B (zh) | 音訊編碼及解碼 | |
JP5291227B2 (ja) | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 | |
KR101120909B1 (ko) | 멀티 채널 파라미터 변환 장치, 방법 및 컴퓨터로 판독가능한 매체 | |
JP5209637B2 (ja) | オーディオ処理方法及び装置 | |
EP2483887B1 (en) | Mpeg-saoc audio signal decoder, method for providing an upmix signal representation using mpeg-saoc decoding and computer program using a time/frequency-dependent common inter-object-correlation parameter value | |
EP4057281A1 (en) | Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis | |
GB2485979A (en) | Spatial audio coding | |
AU2014201655B2 (en) | Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130115 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130411 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131209 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5678048 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |