JP6279569B2 - マルチチャンネルオーディオ信号のレンダリングを改善する方法及び装置 - Google Patents
マルチチャンネルオーディオ信号のレンダリングを改善する方法及び装置 Download PDFInfo
- Publication number
- JP6279569B2 JP6279569B2 JP2015522115A JP2015522115A JP6279569B2 JP 6279569 B2 JP6279569 B2 JP 6279569B2 JP 2015522115 A JP2015522115 A JP 2015522115A JP 2015522115 A JP2015522115 A JP 2015522115A JP 6279569 B2 JP6279569 B2 JP 6279569B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- audio
- hoa
- dsht
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000009877 rendering Methods 0.000 title description 21
- 230000005236 sound signal Effects 0.000 title description 12
- 238000002156 mixing Methods 0.000 claims description 40
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 14
- 238000004091 panning Methods 0.000 claims description 12
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 230000002441 reversible effect Effects 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 1
- 210000002784 stomach Anatomy 0.000 claims 1
- 230000006835 compression Effects 0.000 description 24
- 238000007906 compression Methods 0.000 description 24
- 238000007781 pre-processing Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000000354 decomposition reaction Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Description
一実施形態では、マルチチャンネルオーディオ圧縮及び/またはレンダリングシステムは、マルチチャンネルオーディオ信号ストリーム(例えば、PCMストリーム)と、チャンネルまたは対応スピーカの関連する空間的位置と、マルチチャンネルオーディオ信号ストリームに適用されたミキシングのタイプを示すメタデータとを含むインタフェースを有する。ミキシングタイプは、例えば、HOAまたはVBAPパンニング(panning)の(以前の)利用または構成及び/または任意の詳細、具体的な録音手法、または同等の情報を示す。インタフェースは信号送信チェーンへの入力インタフェースであり得る。HOAコンテンツの場合、スピーカの空間的位置は、仮想的スピーカの位置であってもよい。
−オリジナルコンテンツがHOAコンテンツから求められたことのインジケーション、及び少なくとも次のものの一つ:
・HOA表現の次数(order);
・2D、3Dまたは半球形表現のインジケーション;及び
・空間サンプリングポイントの位置(適応的または固定)
−オリジナルコンテンツがVBAPを用いて合成的にミックスされた(mixed synthetically)とのインジケーション(indication)及びスピーカのVBAPタプル(ペア)または3個の組の割り当て;及び
−オリジナルコンテンツが固定された離散的なマイクロホンで録音されたことのインジケーション、及び少なくとも次のものの一つ:
・録音セット上の一以上のマイクロホンの一以上の位置及び方向;及び
・例えば、カージオイド(cardoid)、無指向性、スーパーカージオイド(super−cardoid)などの、一以上の種類のマイクロホン。
[外1]
を新しいJ個の信号
[外2]
にマトリクス化(matrixing)する。マトリクス化との用語は、復号された信号
[外3]
を重み付けして付加またはミキシングすることを意味する。すべての信号
[外4]
及びすべての新しい信号
[外5]
を、
[外7]
から数学的に得られることによる。ここで、Aはミキシング加重により構成されたミキシングマトリクスを示す。「ミキシング」及び「マトリクス化」との用語は、ここでは同義語的に用いられる。ミキシング/マトリクス化は、任意のスピーカセットアップに対するオーディオ信号のレンダリングを目的として用いられる。マトリクスが依存し、それゆえレンダリング時のマトリクス化に用いられるマトリクスが依存する個々のスピーカセットアップは、通常、知覚的符号化段階においては知られていない。
[外10]
であり、
[外11]
はLsdマルチチャンネル信号の単一の時間サンプルを表し、行列
[外12]
であり、ベクトル
[外13]
である。球面サンプル位置を非常に均一(regular)に選択すると、
[外14]
は、ΣWsd(マトリクスの行インデックスがlであり列インデックスがjである)の要素の絶対値であり、
[外15]
は、ΣWsdの対角要素である。可視化すると、これは図5に示したDSHTの球面サンプリンググリッドに対応する。
本発明は、チャンネルベースの3次元オーディオ表現を送信及び/または記憶し、処理する方法に関する。該方法は、前記チャンネルベースのオーディオ情報とともにサイド情報を送信/記憶するステップを有する。前記サイド情報は、チャンネルベースオーディオ情報のミキシングタイプと意図されたスピーカ位置を示し、前記ミキシングタイプは前の処理段階において(ミキシングスタジオなどにおいて)オーディオコンテンツミックスされたアルゴリズムを示し、前記スピーカ位置は前の処理段階におけるスピーカの位置(ミキシングスタジオなどにおける理想的位置)または仮想的位置を示す。前記データ構造とチャンネルベースオーディオ情報を受け取った後のさらに別の処理ステップにおいて、ミキシング及びスピーカ位置情報を利用する。
T. D. Abhayapala著「Generalized framework for spherical microphone arrays: Spatial and frequency decomposition」(In Proc. IEEE International Conference on Acoustics, Speech, 25 and Signal Processing (ICASSP), (accepted) Vol. X, pp., April 2008, Las Vegas, USA. James R. Driscoll及びDennis M. Healy Jr.著「Computing Fourier transforms and convolutions on the 2-sphere」(Advances in Applied Mathematics, 15:202-250, 1994)
Claims (15)
- オーディオデータをエンコードする方法であって、
オーディオデータについて、少なくとも3つの異なるタイプのうちのタイプを検出するステップであって、前記少なくとも3つの異なるタイプは、第1のHigher−Order Ambisonics(HOA)フォーマットと、複数のマイクロホンの一セットアップを用いたマイクロホン録音と、パンニングによりミックスされたマルチチャンネルオーディオストリームとを含む、ステップと、
前記オーディオデータが第1のHOAフォーマットを有するとの判定に基づいて、逆Discrete Spherical Harmonics Transform(iDSHT)に基づいて、第1のHOAフォーマットのオーディオデータの係数を、第2のHOAフォーマットの係数に変換するステップと、
前記第2のHOAフォーマットの前記係数と、少なくとも仮想的または実際のスピーカ位置に関するメタデータを示す補助データと、前記オーディオデータに関する情報とをエンコードするステップであって、前記情報は第1のHOAフォーマットの詳細、複数のマイクロホンのセットアップ、及び前記パンニングの詳細のうち少なくとも一つの詳細を含む、ステップとを有する、
方法。 - 前記オーディオデータと前記補助データの少なくとも一部とは、前記オーディオデータのオーディオプロダクション段階から得られ、得られた前記補助データの少なくとも一部は修正情報、編集情報及び合成情報のうち少なくとも一つを含む、請求項1に記載の方法。
- 前記オーディオプロダクション段階は録音、ミキシング、及びサウンド合成のうち少なくとも一つを実行するように構成されている、請求項2に記載の方法。
- 前記補助データは、オーディオコンテンツが、HOAコンテンツと、HOAコンテンツ表現のオーダー、2次元、3次元、または半球表現、及び空間的サンプリングポイントの位置のうち少なくとも一つとから得られたことを示す、
請求項1ないし3いずれか一項に記載の方法。 - 前記補助データは、オーディオコンテンツが、ベクトルベースの振幅パンニング(VBAP)と、ラウドスピーカのVBAPタプルまたはトリプレットの割り当てとを用いて、合成的にミックスされたことを示す、
請求項1ないし4いずれか一項に記載の方法。 - 前記補助データは、オーディオコンテンツが、固定された離散的マイクロホンで録音されたことと、録音セットの一以上のマイクロホンの一以上の位置と方向及び一以上のマイクロホンの種類のうち少なくとも一方とを示す、
請求項1ないし5いずれか一項に記載の方法。 - エンコードされたオーディオデータをデコードする方法であって、
エンコードされたオーディオデータを受け取るステップと、
前記オーディオデータをデコードするステップであって、少なくとも仮想的または実際のラウドスピーカ位置に関するメタデータを決定するステップと、前記オーディオデータに関する情報と、複数のマイクロホンのセットアップに関する詳細を含むミキシング情報と、パンニングの詳細とをミキシングするステップとを含み、前記オーディオデータの係数は、前記オーディオデータが第1のHOAフォーマットを有するとのインディケータに基づき、Discrete Spherical Harmonics Transform(DSHT)に基づき、第2のHOAフォーマットから第1のHOAフォーマットに変換される、ステップとを有する、
方法。 - 前記メタデータは、HOAコンテンツ表現のオーダーと、2次元、3次元、または半球表現と、空間サンプリングポイントの位置とのうちの少なくとも一つに関する、請求項7に記載の方法。
- 前記メタデータは、オーディオコンテンツがVBAPと、スピーカのVBAPタプルまたはトリプレットの割り当てとに基づいてミックスされたことを示す、
請求項7に記載の方法。 - 前記メタデータは、オーディオコンテンツが固定された離散的マイクロホンで録音されたことと、一以上のマイクロホンの一以上の少なくとも位置と方向、及びマイクロホンのタイプのうち少なくとも1つとを示す、
請求項7に記載の方法。 - メタデータは任意的である、
請求項1に記載の方法。 - オーディオデータをエンコードする装置であって、
オーディオデータは少なくとも3つの異なるタイプのうちのタイプを有し、前記少なくとも3つの異なるタイプは、第1のHigher−Order Ambisonics(HOA)フォーマットと、複数のマイクロホンの一セットアップを用いたマイクロホン録音と、パンニングによりミックスされたマルチチャンネルオーディオストリームとを含み、
前記装置は、
オーディオデータが第1のHOAフォーマットを有するとの判定に基づき、前記オーディオデータの係数を、第1のHOAフォーマットから共通のHOAフォーマットの係数に変換する逆Discrete Spherical Harmonics Transform(iDSHT)ブロックと、
前記オーディオデータが第1のHOAフォーマットを有するとき、前記共通のHOAフォーマットの前記係数をエンコードし、少なくとも仮想的または実際のスピーカ位置に関するメタデータと、オーディオデータに関するミキシング情報とを示す補助データをエンコードするエンコーダであって、前記ミキシング情報は第1のHOAフォーマットの詳細、複数のマイクロホンのセットアップ、及び前記パンニングの詳細のうち少なくとも一つの詳細を含む、エンコーダとを有する、
装置。 - エンコーダは、DSHTブロックと、MDCTブロックと、逆DSHTを実行する第2の逆DSHTブロックと、音源方向検出ブロックと、パラメータ計算ブロックとを有し、
DSHTブロックは、前記逆DSHTブロックにより実行されるiDSHTの逆であるDSHTを決定するように構成され、MDCTブロックと、音源方向検出ブロックと、パラメータ計算ブロックとに出力を提供し、
MDCTブロックは、オーディオフレームセグメントの時間的オーバーラップを補償するように構成され、第2の逆DSHTブロックに出力を提供し、
音源方向検出ブロックは、DSHTブロックの出力中の一以上の最強音源方向を検出するように構成され、パラメータ計算ブロックに出力を提供し、
パラメータ計算ブロックは、回転パラメータを計算し、第2の逆DSHTブロックに回転パラメータを提供するように構成され、回転パラメータは、第2の逆DSHTブロックの逆DSHTのサンプリンググリッドの空間的サンプル位置を、検出された一以上の最強音源方向の一つにマッピングする回転を確定し、
第2の逆DSHTブロックは、パラメータ計算ブロックから受け取った回転パラメータから適応的回転マトリクスを決定し、適応的逆DSHTを決定するように構成され、適応的逆DSHTは適応的回転マトリクスによる回転と逆DSHTとを含む、
請求項12に記載の装置。 - エンコードされたオーディオデータをデコードする装置であって、
エンコードされたオーディオデータがエンコード前に前処理されていると判断するアナライザと、
前記オーディオデータをデコードする第1のデコーダであって、少なくとも仮想的または実際のラウドスピーカ位置に関するメタデータを決定し、前記オーディオデータに関する情報と、複数のマイクロホンのセットアップに関する詳細を含むミキシング情報と、パンニングの詳細とをミキシングし、前記オーディオデータの係数は、前記オーディオデータが第1のHOAフォーマットを有するとのインディケータに基づき、Discrete Spherical Harmonics Transform(DSHT)に基づき、第2のHOAフォーマットから第1のHOAフォーマットに変換される、第1のデコーダとを有する、
装置。 - プロセッサに請求項1ないし11いずれか一項に記載の方法を実行させるコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12290239 | 2012-07-19 | ||
EP12290239.8 | 2012-07-19 | ||
PCT/EP2013/065343 WO2014013070A1 (en) | 2012-07-19 | 2013-07-19 | Method and device for improving the rendering of multi-channel audio signals |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015527610A JP2015527610A (ja) | 2015-09-17 |
JP2015527610A5 JP2015527610A5 (ja) | 2016-08-18 |
JP6279569B2 true JP6279569B2 (ja) | 2018-02-14 |
Family
ID=48874273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015522115A Active JP6279569B2 (ja) | 2012-07-19 | 2013-07-19 | マルチチャンネルオーディオ信号のレンダリングを改善する方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (7) | US9589571B2 (ja) |
EP (1) | EP2875511B1 (ja) |
JP (1) | JP6279569B2 (ja) |
KR (5) | KR20230137492A (ja) |
CN (1) | CN104471641B (ja) |
TW (1) | TWI590234B (ja) |
WO (1) | WO2014013070A1 (ja) |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9473870B2 (en) * | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
KR20230137492A (ko) | 2012-07-19 | 2023-10-04 | 돌비 인터네셔널 에이비 | 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스 |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US20140358565A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
US20150127354A1 (en) * | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
EP3591649B8 (en) | 2014-03-21 | 2022-06-08 | Dolby International AB | Method and apparatus for decompressing a compressed hoa signal |
US10412522B2 (en) | 2014-03-21 | 2019-09-10 | Qualcomm Incorporated | Inserting audio channels into descriptions of soundfields |
CN117198304A (zh) | 2014-03-21 | 2023-12-08 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN109036441B (zh) * | 2014-03-24 | 2023-06-06 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
CN106463124B (zh) * | 2014-03-24 | 2021-03-30 | 三星电子株式会社 | 用于渲染声信号的方法和设备,以及计算机可读记录介质 |
US10674299B2 (en) | 2014-04-11 | 2020-06-02 | Samsung Electronics Co., Ltd. | Method and apparatus for rendering sound signal, and computer-readable recording medium |
US9847087B2 (en) * | 2014-05-16 | 2017-12-19 | Qualcomm Incorporated | Higher order ambisonics signal compression |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
EP3162087B1 (en) * | 2014-06-27 | 2021-03-17 | Dolby International AB | Coded hoa data frame representation that includes non-differential gain values associated with channel signals of specific ones of the data frames of an hoa data frame representation |
WO2016018787A1 (en) | 2014-07-31 | 2016-02-04 | Dolby Laboratories Licensing Corporation | Audio processing systems and methods |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
KR102105395B1 (ko) * | 2015-01-19 | 2020-04-28 | 삼성전기주식회사 | 칩 전자부품 및 칩 전자부품의 실장 기판 |
US20160294484A1 (en) * | 2015-03-31 | 2016-10-06 | Qualcomm Technologies International, Ltd. | Embedding codes in an audio signal |
WO2017017262A1 (en) * | 2015-07-30 | 2017-02-02 | Dolby International Ab | Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation |
EA034936B1 (ru) * | 2015-08-25 | 2020-04-08 | Долби Интернешнл Аб | Кодирование и декодирование звука с использованием параметров преобразования представления |
US9961475B2 (en) * | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
US9961467B2 (en) * | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from channel-based audio to HOA |
CA3000905C (en) | 2015-10-08 | 2024-01-09 | Dolby International Ab | Layered coding for compressed sound or sound field representations |
US10249312B2 (en) | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
US10070094B2 (en) * | 2015-10-14 | 2018-09-04 | Qualcomm Incorporated | Screen related adaptation of higher order ambisonic (HOA) content |
EP3378065B1 (en) | 2015-11-17 | 2019-10-16 | Dolby International AB | Method and apparatus for converting a channel-based 3d audio signal to an hoa audio signal |
EP3174316B1 (en) * | 2015-11-27 | 2020-02-26 | Nokia Technologies Oy | Intelligent audio rendering |
US9881628B2 (en) * | 2016-01-05 | 2018-01-30 | Qualcomm Incorporated | Mixed domain coding of audio |
CN106973073A (zh) * | 2016-01-13 | 2017-07-21 | 杭州海康威视系统技术有限公司 | 多媒体数据的传输方法及设备 |
WO2017126895A1 (ko) * | 2016-01-19 | 2017-07-27 | 지오디오랩 인코포레이티드 | 오디오 신호 처리 장치 및 처리 방법 |
KR102640940B1 (ko) | 2016-01-27 | 2024-02-26 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 음향 환경 시뮬레이션 |
WO2018001500A1 (en) * | 2016-06-30 | 2018-01-04 | Huawei Technologies Duesseldorf Gmbh | Apparatuses and methods for encoding and decoding a multichannel audio signal |
US10332530B2 (en) | 2017-01-27 | 2019-06-25 | Google Llc | Coding of a soundfield representation |
CN113242508B (zh) | 2017-03-06 | 2022-12-06 | 杜比国际公司 | 基于音频数据流渲染音频输出的方法、解码器系统和介质 |
US10354667B2 (en) | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
JP7224302B2 (ja) | 2017-05-09 | 2023-02-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャネル空間的オーディオ・フォーマット入力信号の処理 |
US20180338212A1 (en) * | 2017-05-18 | 2018-11-22 | Qualcomm Incorporated | Layered intermediate compression for higher order ambisonic audio data |
GB2563635A (en) * | 2017-06-21 | 2018-12-26 | Nokia Technologies Oy | Recording and rendering audio signals |
GB2566992A (en) | 2017-09-29 | 2019-04-03 | Nokia Technologies Oy | Recording and rendering spatial audio signals |
CN111316353B (zh) * | 2017-11-10 | 2023-11-17 | 诺基亚技术有限公司 | 确定空间音频参数编码和相关联的解码 |
WO2019129350A1 (en) * | 2017-12-28 | 2019-07-04 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
EP4336497A3 (en) * | 2018-07-04 | 2024-03-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multisignal encoder, multisignal decoder, and related methods using signal whitening or signal post processing |
WO2020115311A1 (en) * | 2018-12-07 | 2020-06-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using low-order, mid-order and high-order components generators |
CN113490980A (zh) * | 2019-01-21 | 2021-10-08 | 弗劳恩霍夫应用研究促进协会 | 用于编码空间音频表示的装置和方法以及用于使用传输元数据来解码经编码的音频信号的装置和方法,以及相关的计算机程序 |
TWI719429B (zh) * | 2019-03-19 | 2021-02-21 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊處理系統 |
GB2582748A (en) * | 2019-03-27 | 2020-10-07 | Nokia Technologies Oy | Sound field related rendering |
US20200402521A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Performing psychoacoustic audio coding based on operating conditions |
CN110751956B (zh) * | 2019-09-17 | 2022-04-26 | 北京时代拓灵科技有限公司 | 一种沉浸式音频渲染方法及系统 |
KR102300177B1 (ko) * | 2019-09-17 | 2021-09-08 | 난징 트월링 테크놀로지 컴퍼니 리미티드 | 몰입형 오디오 렌더링 방법 및 시스템 |
US11430451B2 (en) * | 2019-09-26 | 2022-08-30 | Apple Inc. | Layered coding of audio with discrete objects |
WO2022096376A2 (en) * | 2020-11-03 | 2022-05-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio signal transformation |
US11659330B2 (en) * | 2021-04-13 | 2023-05-23 | Spatialx Inc. | Adaptive structured rendering of audio channels |
EP4310839A4 (en) * | 2021-05-21 | 2024-07-17 | Samsung Electronics Co Ltd | DEVICE AND METHOD FOR PROCESSING A MULTI-CHANNEL AUDIO SIGNAL |
CN116830193A (zh) * | 2023-04-11 | 2023-09-29 | 北京小米移动软件有限公司 | 音频码流信号处理方法、装置、电子设备和存储介质 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5131060Y2 (ja) | 1971-10-27 | 1976-08-04 | ||
JPS5131246B2 (ja) | 1971-11-15 | 1976-09-06 | ||
KR20010009258A (ko) | 1999-07-08 | 2001-02-05 | 허진호 | 가상 멀티 채널 레코딩 시스템 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
FR2844894B1 (fr) * | 2002-09-23 | 2004-12-17 | Remy Henri Denis Bruno | Procede et systeme de traitement d'une representation d'un champ acoustique |
GB0306820D0 (en) | 2003-03-25 | 2003-04-30 | Ici Plc | Polymerisation of ethylenically unsaturated monomers |
MXPA06011396A (es) * | 2004-04-05 | 2006-12-20 | Koninkl Philips Electronics Nv | Metodos de codificacion y decodificacion de senales estereofonicas y aparatos que utilizan los mismos. |
US7624021B2 (en) * | 2004-07-02 | 2009-11-24 | Apple Inc. | Universal container for audio data |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
WO2007027051A1 (en) | 2005-08-30 | 2007-03-08 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8577483B2 (en) | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
US7788107B2 (en) | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
DE102006047197B3 (de) | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
ES2401487T3 (es) | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
ES2425814T3 (es) * | 2008-08-13 | 2013-10-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato para determinar una señal de audio espacial convertida |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
GB2478834B (en) * | 2009-02-04 | 2012-03-07 | Richard Furse | Sound system |
US9351070B2 (en) | 2009-06-30 | 2016-05-24 | Nokia Technologies Oy | Positional disambiguation in spatial audio |
EP2346028A1 (en) * | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
US9271081B2 (en) * | 2010-08-27 | 2016-02-23 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
US8908874B2 (en) * | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
FR2969804A1 (fr) | 2010-12-23 | 2012-06-29 | France Telecom | Filtrage perfectionne dans le domaine transforme. |
WO2012125855A1 (en) * | 2011-03-16 | 2012-09-20 | Dts, Inc. | Encoding and reproduction of three dimensional audio soundtracks |
TWI543642B (zh) * | 2011-07-01 | 2016-07-21 | 杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
EP2848009B1 (en) * | 2012-05-07 | 2020-12-02 | Dolby International AB | Method and apparatus for layout and format independent 3d audio reproduction |
US9288603B2 (en) * | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9190065B2 (en) * | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
EP2688066A1 (en) | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
US9473870B2 (en) * | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
KR20230137492A (ko) | 2012-07-19 | 2023-10-04 | 돌비 인터네셔널 에이비 | 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스 |
-
2013
- 2013-07-19 KR KR1020237032036A patent/KR20230137492A/ko active IP Right Grant
- 2013-07-19 KR KR1020217000358A patent/KR102429953B1/ko active IP Right Grant
- 2013-07-19 KR KR1020207019184A patent/KR102201713B1/ko active IP Right Grant
- 2013-07-19 US US14/415,714 patent/US9589571B2/en active Active
- 2013-07-19 EP EP13740256.6A patent/EP2875511B1/en active Active
- 2013-07-19 CN CN201380038438.2A patent/CN104471641B/zh active Active
- 2013-07-19 KR KR1020227026774A patent/KR102581878B1/ko active IP Right Grant
- 2013-07-19 TW TW102125847A patent/TWI590234B/zh active
- 2013-07-19 WO PCT/EP2013/065343 patent/WO2014013070A1/en active Application Filing
- 2013-07-19 JP JP2015522115A patent/JP6279569B2/ja active Active
- 2013-07-19 KR KR1020157001446A patent/KR102131810B1/ko active IP Right Grant
-
2017
- 2017-01-27 US US15/417,565 patent/US9984694B2/en active Active
-
2018
- 2018-04-30 US US15/967,363 patent/US10381013B2/en active Active
-
2019
- 2019-05-03 US US16/403,224 patent/US10460737B2/en active Active
- 2019-09-24 US US16/580,738 patent/US11081117B2/en active Active
-
2021
- 2021-08-02 US US17/392,210 patent/US11798568B2/en active Active
-
2023
- 2023-10-18 US US18/489,606 patent/US20240127831A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN104471641B (zh) | 2017-09-12 |
KR102131810B1 (ko) | 2020-07-08 |
KR20220113842A (ko) | 2022-08-16 |
KR20230137492A (ko) | 2023-10-04 |
US20240127831A1 (en) | 2024-04-18 |
JP2015527610A (ja) | 2015-09-17 |
KR20200084918A (ko) | 2020-07-13 |
US20220020382A1 (en) | 2022-01-20 |
US11798568B2 (en) | 2023-10-24 |
KR20150032718A (ko) | 2015-03-27 |
KR20210006011A (ko) | 2021-01-15 |
US9984694B2 (en) | 2018-05-29 |
KR102429953B1 (ko) | 2022-08-08 |
CN104471641A (zh) | 2015-03-25 |
US11081117B2 (en) | 2021-08-03 |
KR102581878B1 (ko) | 2023-09-25 |
TWI590234B (zh) | 2017-07-01 |
US9589571B2 (en) | 2017-03-07 |
US10460737B2 (en) | 2019-10-29 |
US20180247656A1 (en) | 2018-08-30 |
TW201411604A (zh) | 2014-03-16 |
WO2014013070A1 (en) | 2014-01-23 |
US20200020344A1 (en) | 2020-01-16 |
US20170140764A1 (en) | 2017-05-18 |
EP2875511B1 (en) | 2018-02-21 |
US20150154965A1 (en) | 2015-06-04 |
KR102201713B1 (ko) | 2021-01-12 |
US20190259396A1 (en) | 2019-08-22 |
EP2875511A1 (en) | 2015-05-27 |
US10381013B2 (en) | 2019-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6279569B2 (ja) | マルチチャンネルオーディオ信号のレンダリングを改善する方法及び装置 | |
US9516446B2 (en) | Scalable downmix design for object-based surround codec with cluster analysis by synthesis | |
EP1989920B1 (en) | Audio encoding and decoding | |
US8817991B2 (en) | Advanced encoding of multi-channel digital audio signals | |
JP2022509440A (ja) | 空間オーディオパラメータの符号化及び対応する復号の決定 | |
WO2019029724A1 (zh) | 时域立体声编解码方法和相关产品 | |
JP7453997B2 (ja) | DirACベースの空間オーディオ符号化のためのパケット損失隠蔽 | |
TW202230334A (zh) | 使用參數轉換處理編碼音頻場景的裝置、方法或電腦程式 | |
RU2807473C2 (ru) | Маскировка потерь пакетов для пространственного кодирования аудиоданных на основе dirac | |
WO2024132968A1 (en) | Method and decoder for stereo decoding with a neural network model | |
TW202219942A (zh) | 使用頻寬擴展處理編碼音頻場景的裝置、方法或電腦程式 | |
TW202230335A (zh) | 使用參數平滑處理編碼音頻場景的裝置、方法或電腦程式 | |
CN116508098A (zh) | 量化空间音频参数 | |
CN113678199A (zh) | 空间音频参数的重要性的确定及相关联的编码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160629 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160629 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20160826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6279569 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |