JP2021530724A - 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置 - Google Patents
没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置 Download PDFInfo
- Publication number
- JP2021530724A JP2021530724A JP2020547116A JP2020547116A JP2021530724A JP 2021530724 A JP2021530724 A JP 2021530724A JP 2020547116 A JP2020547116 A JP 2020547116A JP 2020547116 A JP2020547116 A JP 2020547116A JP 2021530724 A JP2021530724 A JP 2021530724A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- reconstructed
- signals
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 230000005236 sound signal Effects 0.000 title description 14
- 230000009466 transformation Effects 0.000 claims description 55
- 238000000513 principal component analysis Methods 0.000 claims description 19
- 238000000844 transformation Methods 0.000 claims description 17
- 238000000354 decomposition reaction Methods 0.000 claims description 16
- 238000009877 rendering Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005056 compaction Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 description 8
- 230000009471 action Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002087 whitening effect Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本願は、2018年7月2日に出願された米国仮特許出願第62/693,246号への優先権の利益を主張する。同出願の内容はここに参照によって組み込まれる。
本稿は、音場表現信号、特にアンビソニックス信号を含みうる没入的オーディオ信号に関する。特に、本稿は、没入的オーディオ信号がビットレート効率のよい仕方でおよび/または高い知覚的品質で伝送および/または格納できるようにするエンコーダおよび対応するデコーダを提供することに関する。
Claims (36)
- マルチチャネル入力信号(201)をエンコードする方法(700)であって、当該方法(700)は、
・前記マルチチャネル入力信号(201)からの複数のダウンミックス・チャネル信号(203)を決定する段階(701)と;
・前記複数のダウンミックス・チャネル信号(203)のエネルギー・コンパクト化を実行して、複数のコンパクト化されたチャネル信号(404)を提供する段階(702)と;
・合同符号化メタデータ(205)を、前記複数のコンパクト化されたチャネル信号(404)に基づいて、かつ、前記マルチチャネル入力信号(201)に基づいて決定する段階(703)であって、前記合同符号化メタデータ(205)は、前記複数のコンパクト化されたチャネル信号(404)を、前記マルチチャネル入力信号(201)の近似にアップミックスすることを許容するようなものである、段階と;
・前記複数のコンパクト化されたチャネル信号(404)および前記合同符号化メタデータ(205)をエンコードする段階(704)とを含む、
方法。 - エネルギー・コンパクト化が、コンパクト化されたチャネル信号(404)のエネルギーが、対応するダウンミックス・チャネル信号(203)のエネルギーよりも低いように実行される、請求項1に記載の方法。
- エネルギー・コンパクト化を実行することが:
・第2のダウンミックス・チャネル信号(203)から第1のダウンミックス・チャネル信号(203)を予測して、第1の予測されたチャネル信号を提供し;
・前記第1のダウンミックス・チャネル信号(203)から前記第1の予測されたチャネル信号を減算して、第1のコンパクト化されたチャネル信号(404)を提供することを含む、
請求項1または2に記載の方法。 - ・第2のダウンミックス・チャネル信号(203)から第1のダウンミックス・チャネル信号(203)を予測することが、前記第2のダウンミックス・チャネル信号(203)をスケーリングするためのスケーリング因子を決定することを含み;
・前記第1の予測されたチャネル信号は、前記スケーリング因子に従ってスケーリングされた前記第2のダウンミックス・チャネル信号(203)に対応する、
請求項3に記載の方法。 - 前記スケーリング因子が、
・前記第1のコンパクト化されたチャネル信号(404)のエネルギーが、前記第1のダウンミックス・チャネル信号(203)のエネルギーと比較して低減される;および/または
・前記第1のコンパクト化されたチャネル信号(404)のエネルギーが最小化される、
ように決定される、請求項4に記載の方法。 - エネルギー・コンパクト化を実行することが、
・前記第2のダウンミックス・チャネル信号(203)からの予測に基づいて、いくつかのコンパクト化されたチャネル信号(404)を決定し;
・前記いくつかのコンパクト化されたチャネル信号(404)に対して、カルーネン・レーベ変換、主成分分析変換および/または特異値分解変換を適用することを含む、
請求項3ないし5のうちいずれか一項に記載の方法。 - ・前記複数のダウンミックス・チャネル信号(203)が、特にBフォーマットまたはAフォーマットの、一次アンビソニックス信号である;および/または
・前記複数のコンパクト化されたチャネル信号(404)が、特にBフォーマットまたはAフォーマットの、一次アンビソニックス信号のフォーマットで表現される。
請求項1ないし6のうちいずれか一項に記載の方法。 - エネルギー・コンパクト化を実行することが、
・前記複数のダウンミックス・チャネル信号(203)のWチャネル信号からXチャネル信号、Yチャネル信号、およびZチャネル信号を予測して、予測されたXチャネル信号、予測されたYチャネル信号、および予測されたZチャネル信号を提供し;
・前記Xチャネル信号から前記予測されたXチャネル信号を減算してX'チャネル信号を決定し;
・前記Yチャネル信号から前記予測されたYチャネル信号を減算してY'チャネル信号を決定し;
・前記Zチャネル信号から前記予測されたZチャネル信号を減算してZ'チャネル信号を決定し;
・前記Wチャネル信号、前記X'チャネル信号、前記Y'チャネル信号、および前記Z'チャネル信号に基づいて前記複数のコンパクト化されたチャネル信号(404)を決定することを含む、
請求項7に記載の方法。 - エネルギー・コンパクト化を実行することが、
・前記X'チャネル信号、前記Y'チャネル信号、および前記Z'チャネル信号に対してカルーネン・レーベ変換、主成分分析変換および/または特異値分解変換を適用して、X"チャネル信号、Y"チャネル信号、および、Z""チャネル信号を提供し;
・前記Wチャネル信号、前記X"チャネル信号、前記Y"チャネル信号、および前記Z"チャネル信号に基づいて前記複数のコンパクト化されたチャネル信号(404)を決定することを含む、
請求項8に記載の方法。 - エネルギー・コンパクト化を実行することが、前記複数のダウンミックス・チャネル信号(203)のうちの少なくとも一部に対して、カルーネン・レーベ変換、主成分分析変換および/または特異値分解変換を適用することを含む、請求項1ないし9のうちいずれか一項に記載の方法。
- 前記合同符号化メタデータ(205)が、
・前記複数のコンパクト化されたチャネル信号(404)の、前記マルチチャネル入力信号(201)と同じ数のチャネルを含む前記マルチチャネル入力信号(201)の近似へのアップミックスを可能にするアップミックス・データ、特にアップミックス行列;および/または
・前記マルチチャネル入力信号(201)の共分散の再構成を可能にする脱相関データ
を含む、請求項1ないし10のうちいずれか一項に記載の方法。 - 前記合同符号化メタデータ(205)が、前記マルチチャネル入力信号(201)の複数の異なるサブバンドについて決定される、請求項1ないし11のうちいずれか一項に記載の方法。
- 前記複数のコンパクト化されたチャネル信号(404)をエンコードすること(704)が、前記複数のコンパクト化されたチャネル信号(404)のそれぞれの波形符号化を、特に、各コンパクト化されたチャネル信号(404)のためのモノ・エンコーダを用いて実行することを含む、請求項1ないし12のうちいずれか一項に記載の方法。
- 前記合同符号化メタデータ(205)が、エントロピー・エンコーダを用いてエンコードされる、請求項1ないし13のうちいずれか一項に記載の方法。
- ・前記マルチチャネル入力信号(201)は、一つまたは複数のオーディオ・オブジェクト(303)の一つまたは複数のオブジェクト信号を含み;
・当該方法(700)は、特にエントロピー・エンコーダを用いて、前記一つまたは複数のオーディオ・オブジェクト(303)についてのオブジェクト・メタデータ(202)をエンコードすることを含む、
請求項1ないし14のうちいずれか一項に記載の方法。 - ・前記マルチチャネル入力信号(201)は、SRと呼ばれる音場表現信号、特に、L≧1としてL次アンビソニックス信号と、一つまたは複数のオーディオ・オブジェクト(303)の一つまたは複数のオブジェクト信号とを含み;
・前記複数のダウンミックス・チャネル信号(203)は、前記マルチチャネル入力信号(201)をSR信号、特にL≧KとしてK次アンビソニックス信号にダウンミックスすることによって決定される、
請求項1ないし15のうちいずれか一項に記載の方法。 - ・前記複数のダウンミックス・チャネル信号(203)を決定すること(701)が、一つまたは複数のオーディオ・オブジェクト(303)の前記一つまたは複数のオブジェクト信号を、前記一つまたは複数のオーディオ・オブジェクト(303)のオブジェクト・メタデータ(202)に依存して、前記マルチチャネル入力信号(201)の前記SR信号に混合することを含み;
・オーディオ・オブジェクト(303)の前記オブジェクト・メタデータ(202)が、前記オーディオ・オブジェクト(303)の空間位置を示す、
請求項16に記載の方法。 - ・当該方法(700)が、前記マルチチャネル入力信号(201)が第2のモードを使用してエンコードされるべきであることを決定することを含み;
・第2のモードでは、前記合同符号化メタデータ(205)は、前記複数のコンパクト化されたチャネル信号(404)に基づいて、かつ前記複数のダウンミックス・チャネル信号(203)に基づいて決定され、前記合同符号化メタデータ(205)は、前記複数のコンパクト化されたチャネル信号(404)から前記複数のダウンミックス・チャネル信号(203)を再構成することを許容するようなものである、
請求項16に記載の方法。 - ・前記複数のコンパクト化されたチャネル信号(404)に基づいて、かつ前記マルチチャネル入力信号(201)に基づいて前記合同符号化メタデータ(205)を決定することは、第1のモードに対応し;
・前記マルチチャネル入力信号(201)は、フレームのシーケンスを含み;
・当該方法(700)は、フレームのシーケンスの各フレームについて、第1のモードを使うか第2のモードを使うかを決定することを含む、
請求項18に記載の方法。 - ・前記複数のコンパクト化されたチャネル信号(404)をエンコード(704)することによって導出された符号化されたオーディオ・データ(206)に基づいて、かつ前記合同符号化メタデータ(205)をエンコード(704)することによって導出された符号化されたメタデータ(207)に基づいて、ビットストリーム(101)を生成し;
・前記ビットストリーム(101)に、前記第2のモードが使用されたかどうかを示す指示を挿入することを含む、
請求項17ないし19のうちいずれか一項に記載の方法。 - 複数の再構成されたチャネル信号(314)を示す符号化されたオーディオ・データ(206)および合同符号化メタデータ(205)を示す符号化されたメタデータ(207)から、再構成されたマルチチャネル信号(311)を決定する方法(800)であって、当該方法(800)は、
・前記符号化されたオーディオ・データ(206)をデコード(801)して、前記複数の再構成されたチャネル信号(314)を提供し、前記符号化されたメタデータ(207)をデコードして前記合同符号化メタデータ(205)を提供し;
・前記合同符号化メタデータ(205)を用いて、前記複数の再構成されたチャネル信号(314)から前記再構成されたマルチチャネル信号(311)を決定する(802)ことを含む、
方法。 - 前記複数の再構成されたチャネル信号(314)が、特にBフォーマットまたはAフォーマットの、一次アンビソニックス信号である、請求項21に記載の方法。
- 前記合同符号化メタデータ(205)が、
・前記複数の再構成されたチャネル信号(404)の、前記再構成されたマルチチャネル信号(311)へのアップミックスを可能にするアップミックス・データ、特にアップミックス行列;および/または
・あらかじめ決定された共分散を有する再構成されたマルチチャネル信号(311)を生成することを可能にする脱相関データ
を含む、請求項21または22に記載の方法。 - 前記合同符号化メタデータ(205)が、前記再構成されたマルチチャネル信号(311)の異なるサブバンドについて異なるメタデータを含む、請求項21ないし23のうちいずれか一項に記載の方法。
- 前記符号化されたオーディオ・データ(206)のデコード(801)は、前記複数の再構成されたチャネル信号(314)のそれぞれの波形復号を、特に各再構成されたチャネル信号(314)のためのモノ・デコーダを使用して、実行することを含む、請求項21ないし24のうちいずれか一項に記載の方法。
- 前記符号化されたメタデータ(207)がエントロピー・デコーダを用いてデコードされる、請求項21ないし25のうちいずれか一項に記載の方法。
- ・前記再構成されたマルチチャネル信号(311)は、一つまたは複数のオーディオ・オブジェクト(303)の一つまたは複数の再構成されたオブジェクト信号を含み;
・当該方法(800)は、符号化されたメタデータ(207)から、前記一つまたは複数のオーディオ・オブジェクト(303)についてのオブジェクト・メタデータ(202)を、特にエントロピー・デコーダを用いてデコードすることを含む、
請求項21ないし26のうちいずれか一項に記載の方法。 - ・前記複数の再構成されたチャネル信号(314)は、SRと称される音場表現信号、特にK≧1としてK次アンビソニックス信号を形成し;
・前記再構成されたマルチチャネル信号(311)は、前記合同符号化メタデータ(205)を用いて前記複数の再構成されたチャネル信号(314)をアップミックスすることによって決定され、
・前記再構成されたマルチチャネル信号(311)は、前記再構成されたSR信号、特にL≧KとしてL次アンビソニックス信号と、一つまたは複数のオーディオ・オブジェクト(303)の一つまたは複数の再構成されたオブジェクト信号とを含む、
請求項21ないし27のうちいずれか一項に記載の方法。 - ・前記合同符号化メタデータ(205)は、前記複数の再構成されたチャネル信号(314)に対して逆エネルギー・コンパクト化動作を実行するように構成される;および/または
・前記合同符号化メタデータ(205)は、前記複数の再構成されたチャネル信号(314)の少なくとも一部に対して逆予測動作を実行するように構成される;および/または
・前記合同符号化メタデータ(205)は、前記複数の再構成されたチャネル信号(314)の少なくとも一部に対して、カルーネン・レーベ変換、主成分分析変換および/または特異値分解変換の逆を実行するように構成される、
請求項21ないし28のうちいずれか一項に記載の方法。 - ・当該方法(800)が、前記再構成されたマルチチャネル信号(311)が第2のモードを用いて決定されるべきであることを判別することを含み;
・第2のモードでは、前記合同符号化メタデータ(205)は、異なる再構成されたチャネル信号(314)の間でエネルギーを再配分するように構成された予測データおよび/または変換データを含み:
・第2のモードでは、前記再構成されたマルチチャネル信号(311)を決定する(802)ことは、前記予測データおよび/または前記変換データを使用して、異なる再構成されたチャネル信号(314)の間でエネルギーを再配分することを含み;
・第2のモードでは、前記再構成されたマルチチャネル信号(311)は、前記複数の再構成されたチャネル信号(314)と同じ数のチャネルを含む、
請求項21ないし29のうちいずれか一項に記載の方法。 - 前記変換データは、前記再構成されたマルチチャネル信号(311)を決定するために前記複数の再構成されたチャネル信号(314)のうちの少なくとも一部に適用されるべき、カルーネン・レーベ変換、主成分分析変換および/または特異値分解変換の逆を示す、請求項30に記載の方法。
- ・前記再構成されたマルチチャネル入力信号(311)は、フレームのシーケンスを含み;
・当該方法(800)は、第2のモードが使用されるべきか否かを、フレームのシーケンスの各フレームについて決定することを含む、
請求項30または31に記載の方法。 - ・ビットストリーム(101)から前記符号化されたオーディオ・データ(206)および前記符号化されたメタデータ(207)を抽出し;
・前記ビットストリーム(101)から、第2のモードが使用されるべきであるかどうか示す指示を抽出することを含む、
請求項30ないし32のうちいずれか一項に記載の方法。 - 当該方法(800)が、前記再構成されたマルチチャネル信号(311)をレンダリングすることを含む、請求項30ないし33のうちいずれか一項に記載の方法。
- マルチチャネル入力信号(201)をエンコードするためのエンコード・ユニット(200)であって、当該エンコード・ユニット(200)は、
・前記マルチチャネル入力信号(201)から複数のダウンミックス・チャネル信号(203)を決定する段階と;
・前記複数のダウンミックス・チャネル信号(203)のエネルギー・コンパクト化を実行して、複数のコンパクト化されたチャネル信号(404)を提供する段階と;
・前記複数のコンパクト化されたチャネル信号(404)に基づいて、かつ前記マルチチャネル入力信号(201)に基づいて、合同符号化メタデータ(205)を決定する段階であって、前記合同符号化メタデータ(205)は、前記複数のコンパクト化されたチャネル信号(404)を、前記マルチチャネル入力信号(201)の近似にアップミックスすることを許容するようなものである、段階と;
・前記複数のコンパクト化されたチャネル信号(404)および前記合同符号化メタデータ(205)をエンコードする段階とを実行するように構成されている、
エンコード・ユニット。 - 複数の再構成されたチャネル信号(314)を示す符号化されたオーディオ・データ(206)および合同符号化メタデータ(205)を示す符号化されたメタデータ(207)から、再構成されたマルチチャネル信号(311)を決定するためのデコード・ユニット(350)であって、当該デコード・ユニット(350)は、
・前記符号化されたオーディオ・データ(206)をデコードして、前記複数の再構成されたチャネル信号(314)を提供し;
・前記符号化されたメタデータ(207)をデコードして、前記合同符号化メタデータ(205)を提供し;
・前記合同符号化メタデータ(205)を用いて、前記複数の再構成されたチャネル信号(314)から、前記再構成されたマルチチャネル信号(311)を決定するよう構成されている、
デコード・ユニット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862693246P | 2018-07-02 | 2018-07-02 | |
US62/693,246 | 2018-07-02 | ||
PCT/US2019/040282 WO2020010072A1 (en) | 2018-07-02 | 2019-07-02 | Methods and devices for encoding and/or decoding immersive audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021530724A true JP2021530724A (ja) | 2021-11-11 |
JPWO2020010072A5 JPWO2020010072A5 (ja) | 2022-07-05 |
Family
ID=67439427
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020547116A Pending JP2021530724A (ja) | 2018-07-02 | 2019-07-02 | 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置 |
JP2020547044A Pending JP2021530723A (ja) | 2018-07-02 | 2019-07-02 | 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020547044A Pending JP2021530723A (ja) | 2018-07-02 | 2019-07-02 | 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置 |
Country Status (14)
Country | Link |
---|---|
US (2) | US11699451B2 (ja) |
EP (3) | EP4312212A3 (ja) |
JP (2) | JP2021530724A (ja) |
KR (2) | KR20210027238A (ja) |
CN (2) | CN111837182A (ja) |
AU (2) | AU2019298232B2 (ja) |
BR (2) | BR112020017338A2 (ja) |
CA (2) | CA3091150A1 (ja) |
DE (1) | DE112019003358T5 (ja) |
ES (1) | ES2968801T3 (ja) |
IL (4) | IL276618B1 (ja) |
MX (2) | MX2020009578A (ja) |
SG (2) | SG11202007629UA (ja) |
WO (2) | WO2020010072A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116324979A (zh) * | 2020-09-28 | 2023-06-23 | 三星电子株式会社 | 音频编码装置和方法,以及音频解码装置和方法 |
US11930348B2 (en) | 2020-11-24 | 2024-03-12 | Naver Corporation | Computer system for realizing customized being-there in association with audio and method thereof |
KR102505249B1 (ko) | 2020-11-24 | 2023-03-03 | 네이버 주식회사 | 사용자 맞춤형 현장감 실현을 위한 오디오 콘텐츠를 전송하는 컴퓨터 시스템 및 그의 방법 |
JP2022083445A (ja) | 2020-11-24 | 2022-06-03 | ネイバー コーポレーション | ユーザカスタム型臨場感を実現するためのオーディオコンテンツを製作するコンピュータシステムおよびその方法 |
CN114582356A (zh) * | 2020-11-30 | 2022-06-03 | 华为技术有限公司 | 一种音频编解码方法和装置 |
WO2023141034A1 (en) * | 2022-01-20 | 2023-07-27 | Dolby Laboratories Licensing Corporation | Spatial coding of higher order ambisonics for a low latency immersive audio codec |
GB2615607A (en) * | 2022-02-15 | 2023-08-16 | Nokia Technologies Oy | Parametric spatial audio rendering |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005081229A1 (ja) * | 2004-02-25 | 2005-09-01 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ及びオーディオデコーダ |
JP2013507664A (ja) * | 2009-10-16 | 2013-03-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ダウンミックス信号表現と、ダウンミックス信号表現に関係するパラメトリックサイド情報に基づくアップミックス信号表現の提供に対して、平均値を用いて、1つ以上の調整されたパラメータを提供する装置、方法およびコンピュータプログラム |
JP2013528822A (ja) * | 2010-04-09 | 2013-07-11 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法 |
JP2017501438A (ja) * | 2013-11-27 | 2017-01-12 | ディーティーエス・インコーポレイテッドDTS,Inc. | 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003094369A2 (en) | 2002-05-03 | 2003-11-13 | Harman International Industries, Incorporated | Multi-channel downmixing device |
CN101010724B (zh) * | 2004-08-27 | 2011-05-25 | 松下电器产业株式会社 | 音频编码器 |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
AU2009267518B2 (en) | 2008-07-11 | 2012-08-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
ES2425814T3 (es) * | 2008-08-13 | 2013-10-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato para determinar una señal de audio espacial convertida |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
KR101283783B1 (ko) * | 2009-06-23 | 2013-07-08 | 한국전자통신연구원 | 고품질 다채널 오디오 부호화 및 복호화 장치 |
CN102687199B (zh) * | 2010-01-08 | 2015-11-25 | 日本电信电话株式会社 | 编码方法、解码方法、编码装置、解码装置 |
DE102010030534A1 (de) * | 2010-06-25 | 2011-12-29 | Iosono Gmbh | Vorrichtung zum Veränderung einer Audio-Szene und Vorrichtung zum Erzeugen einer Richtungsfunktion |
US20150348558A1 (en) * | 2010-12-03 | 2015-12-03 | Dolby Laboratories Licensing Corporation | Audio Bitstreams with Supplementary Data and Encoding and Decoding of Such Bitstreams |
TWI480860B (zh) * | 2011-03-18 | 2015-04-11 | Fraunhofer Ges Forschung | 音訊編碼中之訊框元件長度傳輸技術 |
TW202339510A (zh) | 2011-07-01 | 2023-10-01 | 美商杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
TWI505262B (zh) * | 2012-05-15 | 2015-10-21 | Dolby Int Ab | 具多重子流之多通道音頻信號的有效編碼與解碼 |
US9460729B2 (en) * | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US10178489B2 (en) | 2013-02-08 | 2019-01-08 | Qualcomm Incorporated | Signaling audio rendering information in a bitstream |
US9609452B2 (en) | 2013-02-08 | 2017-03-28 | Qualcomm Incorporated | Obtaining sparseness information for higher order ambisonic audio renderers |
KR101829822B1 (ko) * | 2013-07-22 | 2018-03-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다채널 오디오 디코더, 다채널 오디오 인코더, 방법, 컴퓨터 프로그램 및 렌더링된 오디오 신호들의 역상관을 사용하는 인코딩된 오디오 표현 |
EP2830045A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
CN117037811A (zh) * | 2013-09-12 | 2023-11-10 | 杜比国际公司 | 多声道音频内容的编码 |
WO2015038522A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
EP3149972B1 (en) | 2014-05-30 | 2018-08-15 | Qualcomm Incorporated | Obtaining symmetry information for higher order ambisonic audio renderers |
US9847088B2 (en) * | 2014-08-29 | 2017-12-19 | Qualcomm Incorporated | Intermediate compression for higher order ambisonic audio data |
ES2922373T3 (es) * | 2015-03-03 | 2022-09-14 | Dolby Laboratories Licensing Corp | Realce de señales de audio espacial por decorrelación modulada |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
TWI607655B (zh) * | 2015-06-19 | 2017-12-01 | Sony Corp | Coding apparatus and method, decoding apparatus and method, and program |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
CA3134343A1 (en) | 2017-10-04 | 2019-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding |
WO2019143867A1 (en) | 2018-01-18 | 2019-07-25 | Dolby Laboratories Licensing Corporation | Methods and devices for coding soundfield representation signals |
-
2019
- 2019-07-02 WO PCT/US2019/040282 patent/WO2020010072A1/en active Application Filing
- 2019-07-02 JP JP2020547116A patent/JP2021530724A/ja active Pending
- 2019-07-02 DE DE112019003358.1T patent/DE112019003358T5/de active Pending
- 2019-07-02 KR KR1020207026492A patent/KR20210027238A/ko unknown
- 2019-07-02 EP EP23215970.7A patent/EP4312212A3/en active Pending
- 2019-07-02 ES ES19745016T patent/ES2968801T3/es active Active
- 2019-07-02 AU AU2019298232A patent/AU2019298232B2/en active Active
- 2019-07-02 IL IL276618A patent/IL276618B1/en unknown
- 2019-07-02 IL IL312390A patent/IL312390A/en unknown
- 2019-07-02 US US17/251,913 patent/US11699451B2/en active Active
- 2019-07-02 KR KR1020207025684A patent/KR20210027236A/ko unknown
- 2019-07-02 CA CA3091150A patent/CA3091150A1/en active Pending
- 2019-07-02 SG SG11202007629UA patent/SG11202007629UA/en unknown
- 2019-07-02 EP EP19745016.6A patent/EP3818524B1/en active Active
- 2019-07-02 MX MX2020009578A patent/MX2020009578A/es unknown
- 2019-07-02 MX MX2020009581A patent/MX2020009581A/es unknown
- 2019-07-02 IL IL307898A patent/IL307898A/en unknown
- 2019-07-02 JP JP2020547044A patent/JP2021530723A/ja active Pending
- 2019-07-02 AU AU2019298240A patent/AU2019298240A1/en active Pending
- 2019-07-02 CN CN201980017996.8A patent/CN111837182A/zh active Pending
- 2019-07-02 IL IL276619A patent/IL276619B2/en unknown
- 2019-07-02 EP EP19745400.2A patent/EP3818521A1/en active Pending
- 2019-07-02 BR BR112020017338-0A patent/BR112020017338A2/pt unknown
- 2019-07-02 CN CN201980017282.7A patent/CN111819627A/zh active Pending
- 2019-07-02 SG SG11202007628PA patent/SG11202007628PA/en unknown
- 2019-07-02 CA CA3091241A patent/CA3091241A1/en active Pending
- 2019-07-02 BR BR112020016948-0A patent/BR112020016948A2/pt unknown
- 2019-07-02 WO PCT/US2019/040271 patent/WO2020010064A1/en active Application Filing
-
2023
- 2023-07-10 US US18/349,427 patent/US20240005933A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005081229A1 (ja) * | 2004-02-25 | 2005-09-01 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ及びオーディオデコーダ |
JP2013507664A (ja) * | 2009-10-16 | 2013-03-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ダウンミックス信号表現と、ダウンミックス信号表現に関係するパラメトリックサイド情報に基づくアップミックス信号表現の提供に対して、平均値を用いて、1つ以上の調整されたパラメータを提供する装置、方法およびコンピュータプログラム |
JP2013528822A (ja) * | 2010-04-09 | 2013-07-11 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法 |
JP2017501438A (ja) * | 2013-11-27 | 2017-01-12 | ディーティーエス・インコーポレイテッドDTS,Inc. | 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11984131B2 (en) | Concept for audio encoding and decoding for audio channels and audio objects | |
JP2021530724A (ja) | 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置 | |
US11743668B2 (en) | Renderer controlled spatial upmix | |
AU2014295216B2 (en) | Apparatus and method for enhanced spatial audio object coding | |
US9966080B2 (en) | Audio object encoding and decoding | |
EP3022734B1 (en) | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension | |
WO2008120933A1 (en) | Apparatus and method for coding and decoding multi object audio signal with multi channel | |
KR20160021892A (ko) | 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱 | |
JP6732739B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
JP6888172B2 (ja) | 音場表現信号を符号化する方法及びデバイス | |
WO2015145782A1 (en) | Apparatus and method for surround audio signal processing | |
RU2802803C2 (ru) | Способы и устройства для кодирования и/или декодирования аудиосигналов погружения |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220627 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220627 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240401 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240604 |