JPWO2020010064A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020010064A5
JPWO2020010064A5 JP2020547044A JP2020547044A JPWO2020010064A5 JP WO2020010064 A5 JPWO2020010064 A5 JP WO2020010064A5 JP 2020547044 A JP2020547044 A JP 2020547044A JP 2020547044 A JP2020547044 A JP 2020547044A JP WO2020010064 A5 JPWO2020010064 A5 JP WO2020010064A5
Authority
JP
Japan
Prior art keywords
superframe
field
metadata
signal
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020547044A
Other languages
English (en)
Other versions
JP2021530723A (ja
Publication date
Application filed filed Critical
Priority claimed from PCT/US2019/040271 external-priority patent/WO2020010064A1/en
Publication of JP2021530723A publication Critical patent/JP2021530723A/ja
Publication of JPWO2020010064A5 publication Critical patent/JPWO2020010064A5/ja
Pending legal-status Critical Current

Links

Description

明細書および図面は、提案される方法および装置の原理を説明するに過ぎないことを注意しておくべきである。よって、当業者は、本明細書に明示的に記載または図示されていないが、本発明の原理を具現し、その精神および範囲内に含まれるさまざまな構成を考案することができることが理解されるであろう。さらに、本明細書に記載されたすべての例は、主として、提案される方法および装置の原理、ならびに当該技術を促進するために発明者によって寄与された概念を理解する際に読者を助けるという教育目的のみをはっきりと目的とするものであり、そのように具体的に記載された例および条件に限定することなく、解釈される。さらに、本発明の原理、側面、および実施形態、ならびにそれらの特定の例を記載する本明細書のすべての陳述は、それらの均等物を包含することが意図されている。
いくつかの態様を記載しておく。
〔態様1〕
ビットストリーム(101)を生成する方法(500)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(500)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階(501)と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階(502)とを実行することを含む、
方法。
〔態様2〕
・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを示す、
態様1に記載の方法。
〔態様3〕
・前記メタデータ・フィールド(403)は可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)は調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
態様2に記載の方法。
〔態様4〕
前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)についてのサイズ・インジケータを含み;
前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
態様2または3に記載の方法。
〔態様5〕
・前記没入的オーディオ信号(111)の前記一つまたは複数のフレームを再構成するための前記メタデータ(202,205)は、該メタデータ(202,205)のサイズの統計的サイズ分布を示し;
・前記サイズ・インジケータの分解能は、前記メタデータ(202,205)のサイズ分布に依存する、
態様4に記載の方法。
〔態様6〕
・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを示し;
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)の存在を示す、
態様1ないし5のうちいずれか一項に記載の方法。
〔態様7〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記スーパーフレーム(400)のデータ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を示す、
態様1ないし6のうちいずれか一項に記載の方法。
〔態様8〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記メタデータ・フィールド(403)の可能な最大サイズを示す、
態様1ないし7のうちいずれか一項に記載の方法。
〔態様9〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を示す、
態様1ないし8のうちいずれか一項に記載の方法。
〔態様10〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを示す、
態様1ないし9のうちいずれか一項に記載の方法。
〔態様11〕
・当該方法(500)は、ヘッダ・フィールド(401)を前記スーパーフレーム(400)に挿入することを含み;
・ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを示す、
態様1ないし10のうちいずれか一項に記載の方法。
〔態様12〕
スーパーフレーム(400)が、前記一つまたは複数のダウンミックス・チャネル信号(203)の2つ以上のフレームを含む、態様1ないし3のうちいずれか一項に記載の方法。
〔態様13〕
・ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)は、マルチモードおよび/またはマルチレート発話またはオーディオ・コーデックを使用して生成される;および/または
・前記メタデータ(202,205)は、マルチモードおよび/またはマルチレートの没入的メタデータ符号化方式を使用して生成される、
態様1ないし12のうちいずれか一項に記載の方法。
〔態様14〕
ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)が、向上音声サービス・エンコーダを使用してエンコードされる、態様1ないし13のうちいずれか一項に記載の方法。
〔態様15〕
前記スーパーフレーム(400)が、伝送プロトコル、特にDASH、RTSPまたはRTPを用いて伝送される、または記憶フォーマット、特にISOBMFFに従ってファイルに格納される、データ要素の少なくとも一部を構成する、態様1ないし14のうちいずれか一項に記載の方法。
〔態様16〕
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)が存在しないことを示し;
・当該方法(500)は、前記スーパーフレーム(400)のシーケンスの以前のスーパーフレーム(400)において、またはアウトオブバンド信号伝達方式を使って、構成情報を伝達することを含む、
態様1ないし15のうちいずれか一項に記載の方法。
〔態様17〕
当該方法が、
・前記没入的オーディオ信号(111)から導出された第1のダウンミックス・チャネル信号(203)および第2のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、前記スーパーフレーム(400)の一つまたは複数の第1データ・フィールド(411、421)および一つまたは複数の第2データ・フィールド(412、422)に、それぞれ挿入する段階であって、前記第1のダウンミックス・チャネル信号(203)は第1のエンコーダを用いてエンコードされ、前記第2のダウンミックス・チャネル信号(203)は第2のエンコーダを用いてエンコードされる、段階と;
・前記第1のエンコーダおよび前記第2のエンコーダに関する構成情報を、前記スーパーフレーム(400)内で、前記スーパーフレーム(400)のシーケンスのうち以前のスーパーフレーム(400)内で、またはアウトオブバンド信号伝達方式を使って、提供する段階とを含む、
態様1ないし16のうちいずれか一項に記載の方法。
〔態様18〕
当該方法が、
・IA信号と呼ばれる、前記没入的オーディオ信号(111)から一つまたは複数のオーディオ・オブジェクトを抽出する段階であって、オーディオ・オブジェクトは、オブジェクト信号と、前記オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)とを含む、段階と;
・前記IA信号(111)に基づき、かつ前記一つまたは複数のオーディオ・オブジェクトに基づいて、残留信号(201)を決定する、段階と;
・前記IA信号(111)に基づいてダウンミックス信号を提供し、特に、前記ダウンミックス信号のダウンミックス・チャネル信号(203)の数が前記IA信号(111)のチャネル信号の数よりも少ないようにする、段階と;
・前記ダウンミックス信号を、前記一つまたは複数のオーディオ・オブジェクトに対応する一つまたは複数の再構成されたオーディオ・オブジェクト信号および/または前記残留信号(201)に対応する再構成された残留信号(311)にアップミックスすることを可能にするための合同符号化メタデータ(205)を決定する段階と;
・前記ダウンミックス信号の波形符号化を実行して、前記一つまたは複数のダウンミックス・チャネル信号(203)のフレームのシーケンスについて、符号化されたオーディオ・データ(206)を提供する段階と;
・前記合同符号化メタデータ(205)および前記一つまたは複数のオーディオ・オブジェクトの前記オブジェクト・メタデータ(202)のエントロピー符号化を実行して、前記スーパーフレーム(400)のシーケンスの前記メタデータ・フィールド(403)に挿入される前記メタデータ(202,205)を提供する段階とを含む、
態様1ないし17のうちいずれか一項に記載の方法。
〔態様19〕
ビットストリーム(101)のスーパーフレーム(400)であって、当該ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、前記スーパーフレーム(400)は、
・前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)のデータ・フィールド(411、421、412、422)と;
・前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するように適応されたメタデータ(202,205)のための単一のメタデータ・フィールド(403)とを含む、
スーパーフレーム。
〔態様20〕
ビットストリーム(101)から没入的オーディオ信号(111)に関するデータを導出するための方法(600)であって、前記ビットストリーム(101)は、前記没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(600)は、スーパーフレーム(400)の前記シーケンスについて繰り返し、
・スーパーフレーム(400)のデータ・フィールド(411、421、412、422)から、前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を抽出する段階(601)と;
・前記スーパーフレーム(400)のメタデータ・フィールド(403)から、前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を抽出する段階(602)とを実行することを含む、
方法。
〔態様21〕
・前記符号化されたオーディオ・データ(206)および前記メタデータ(202,205)から一つまたは複数の再構成されたオーディオ・オブジェクトを導出する段階であって、オーディオ・オブジェクトは、オブジェクト信号および該オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)を含む、段階と;
・前記符号化されたオーディオ・データ(206)および前記メタデータ(202,205)から、再構成された残留信号(311)を導出する段階であって、前記一つまたは複数の再構成されたオーディオ・オブジェクトおよび前記再構成された残留信号(311)は、前記没入的オーディオ信号(111)を記述する、
態様20に記載の方法。
〔態様22〕
当該方法は、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)から前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを導出する段階とを含む、
態様20または21に記載の方法。
〔態様23〕
・前記メタデータ・フィールド(403)が可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)が調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
態様22に記載の方法。
〔態様24〕
・前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)のサイズについてのサイズ・インジケータを含み;
・前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
態様22または23に記載の方法。
〔態様25〕
当該方法が、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)に基づき、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを判定する段階と;
・前記ヘッダ・フィールド(401)に基づいて、構成情報フィールド(402)が前記スーパーフレーム(400)内に存在するかどうかを判定する段階とを含む、
態様20ないし24のうちいずれか一項に記載の方法。
〔態様26〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記スーパーフレーム(400)の前記データ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を決定する段階とを含む、
態様20ないし25のうちいずれか一項に記載の方法。
〔態様27〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記メタデータ・フィールド(403)の可能な最大サイズを決定する段階とを含む、
態様20ないし26のうちいずれか一項に記載の方法。
〔態様28〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を決定する段階とを含む、
態様20ないし27のうちいずれか一項に記載の方法。
〔態様29〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを決定する段階とを含む、
態様20ないし28のうちいずれか一項に記載の方法。
〔態様30〕
当該方法が、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)に基づいて、前記スーパーフレーム(400)が、前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを判定する段階とを含む、
態様20ないし29のうちいずれか一項に記載の方法。
〔態様31〕
ビットストリーム(101)を生成するよう構成されたエンコード装置(110)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該エンコード装置(110)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階とを実行するように構成されている、
エンコード装置。
〔態様32〕
ビットストリーム(101)から没入的オーディオ信号(111)に関するデータを導出するよう構成されたデコード装置(120)であって、前記ビットストリーム(101)は、前記没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該デコード装置(120)は、スーパーフレーム(400)の前記シーケンスについて繰り返し、
・スーパーフレーム(400)のデータ・フィールド(411、421、412、422)から、前記没入的オーディオ信号から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を抽出する段階と;
・前記スーパーフレーム(400)のメタデータ・フィールド(403)から、前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を抽出する段階とを実行するよう構成されている、
デコード装置。

Claims (17)

  1. ビットストリーム(101)を生成する方法(500)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(500)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
    前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階(501)と;
    前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階(502)とを実行することを含む、
    方法。
  2. ・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
    ・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを示す、
    請求項1に記載の方法。
  3. ・前記メタデータ・フィールド(403)は可能な最大サイズを示し;
    ・前記ヘッダ・フィールド(401)は調整値を示し;
    ・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
    請求項2に記載の方法。
  4. 前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)についてのサイズ・インジケータを含み;
    前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
    請求項2または3に記載の方法。
  5. ・前記没入的オーディオ信号(111)の前記一つまたは複数のフレームを再構成するための前記メタデータ(202,205)は、該メタデータ(202,205)のサイズの統計的サイズ分布を示し;
    ・前記サイズ・インジケータの分解能は、前記メタデータ(202,205)のサイズ分布に依存する、
    請求項4に記載の方法。
  6. ・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
    ・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを示し;
    ・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)の存在を示す、
    請求項1ないし5のうちいずれか一項に記載の方法。
  7. ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
    ・前記構成情報フィールド(402)は、前記スーパーフレーム(400)のデータ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を示す、
    請求項1ないし6のうちいずれか一項に記載の方法。
  8. ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
    ・前記構成情報フィールド(402)は、前記メタデータ・フィールド(403)の可能な最大サイズを示す、
    請求項1ないし7のうちいずれか一項に記載の方法。
  9. ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
    ・前記構成情報フィールド(402)は、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を示す、
    請求項1ないし8のうちいずれか一項に記載の方法。
  10. ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
    ・前記構成情報フィールド(402)は、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを示す、
    請求項1ないし9のうちいずれか一項に記載の方法。
  11. ・当該方法(500)は、ヘッダ・フィールド(401)を前記スーパーフレーム(400)に挿入することを含み;
    ・ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを示す、
    請求項1ないし10のうちいずれか一項に記載の方法。
  12. スーパーフレーム(400)が、前記一つまたは複数のダウンミックス・チャネル信号(203)の2つ以上のフレームを含む、請求項1ないし3のうちいずれか一項に記載の方法。
  13. ・ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)は、マルチモードおよび/またはマルチレート発話またはオーディオ・コーデックを使用して生成される;および/または
    ・前記メタデータ(202,205)は、マルチモードおよび/またはマルチレートの没入的メタデータ符号化方式を使用して生成される、
    請求項1ないし12のうちいずれか一項に記載の方法。
  14. ・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)が存在しないことを示し;
    ・当該方法(500)は、前記スーパーフレーム(400)のシーケンスの以前のスーパーフレーム(400)において、またはアウトオブバンド信号伝達方式を使って、構成情報を伝達することを含む、
    請求項1ないし13のうちいずれか一項に記載の方法。
  15. 当該方法が、
    ・前記没入的オーディオ信号(111)から導出された第1のダウンミックス・チャネル信号(203)および第2のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、前記スーパーフレーム(400)の一つまたは複数の第1データ・フィールド(411、421)および一つまたは複数の第2データ・フィールド(412、422)に、それぞれ挿入する段階であって、前記第1のダウンミックス・チャネル信号(203)は第1のエンコーダを用いてエンコードされ、前記第2のダウンミックス・チャネル信号(203)は第2のエンコーダを用いてエンコードされる、段階と;
    ・前記第1のエンコーダおよび前記第2のエンコーダに関する構成情報を、前記スーパーフレーム(400)内で、前記スーパーフレーム(400)のシーケンスのうち以前のスーパーフレーム(400)内で、またはアウトオブバンド信号伝達方式を使って、提供する段階とを含む、
    請求項1ないし14のうちいずれか一項に記載の方法。
  16. 当該方法が、
    ・IA信号と呼ばれる、前記没入的オーディオ信号(111)から一つまたは複数のオーディオ・オブジェクトを抽出する段階であって、オーディオ・オブジェクトは、オブジェクト信号と、前記オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)とを含む、段階と;
    ・前記IA信号(111)に基づき、かつ前記一つまたは複数のオーディオ・オブジェクトに基づいて、残留信号(201)を決定する、段階と;
    ・前記IA信号(111)に基づいてダウンミックス信号を提供し、特に、前記ダウンミックス信号のダウンミックス・チャネル信号(203)の数が前記IA信号(111)のチャネル信号の数よりも少ないようにする、段階と;
    ・前記ダウンミックス信号を、前記一つまたは複数のオーディオ・オブジェクトに対応する一つまたは複数の再構成されたオーディオ・オブジェクト信号および/または前記残留信号(201)に対応する再構成された残留信号(311)にアップミックスすることを可能にするための合同符号化メタデータ(205)を決定する段階と;
    ・前記ダウンミックス信号の波形符号化を実行して、前記一つまたは複数のダウンミックス・チャネル信号(203)のフレームのシーケンスについて、符号化されたオーディオ・データ(206)を提供する段階と;
    ・前記合同符号化メタデータ(205)および前記一つまたは複数のオーディオ・オブジェクトの前記オブジェクト・メタデータ(202)のエントロピー符号化を実行して、前記スーパーフレーム(400)のシーケンスの前記メタデータ・フィールド(403)に挿入される前記メタデータ(202,205)を提供する段階とを含む、
    請求項1ないし15のうちいずれか一項に記載の方法。
  17. ビットストリーム(101)を生成するよう構成されたエンコード装置(110)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該エンコード装置(110)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
    前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階と;
    前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階とを実行するように構成されている、
    エンコード装置。
JP2020547044A 2018-07-02 2019-07-02 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置 Pending JP2021530723A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862693246P 2018-07-02 2018-07-02
US62/693,246 2018-07-02
PCT/US2019/040271 WO2020010064A1 (en) 2018-07-02 2019-07-02 Methods and devices for generating or decoding a bitstream comprising immersive audio signals

Publications (2)

Publication Number Publication Date
JP2021530723A JP2021530723A (ja) 2021-11-11
JPWO2020010064A5 true JPWO2020010064A5 (ja) 2022-07-05

Family

ID=67439427

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020547116A Active JP7516251B2 (ja) 2018-07-02 2019-07-02 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置
JP2020547044A Pending JP2021530723A (ja) 2018-07-02 2019-07-02 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020547116A Active JP7516251B2 (ja) 2018-07-02 2019-07-02 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置

Country Status (15)

Country Link
US (3) US11699451B2 (ja)
EP (3) EP4312212A3 (ja)
JP (2) JP7516251B2 (ja)
KR (2) KR20210027236A (ja)
CN (3) CN111837182B (ja)
AU (3) AU2019298240B2 (ja)
BR (2) BR112020016948A2 (ja)
CA (2) CA3091150A1 (ja)
DE (1) DE112019003358T5 (ja)
ES (1) ES2968801T3 (ja)
IL (4) IL312390A (ja)
MX (4) MX2020009581A (ja)
SG (2) SG11202007629UA (ja)
UA (1) UA128634C2 (ja)
WO (2) WO2020010072A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11315581B1 (en) 2020-08-17 2022-04-26 Amazon Technologies, Inc. Encoding audio metadata in an audio frame
CN116324979A (zh) * 2020-09-28 2023-06-23 三星电子株式会社 音频编码装置和方法,以及音频解码装置和方法
KR102508815B1 (ko) * 2020-11-24 2023-03-14 네이버 주식회사 오디오와 관련하여 사용자 맞춤형 현장감 실현을 위한 컴퓨터 시스템 및 그의 방법
JP7536733B2 (ja) 2020-11-24 2024-08-20 ネイバー コーポレーション オーディオと関連してユーザカスタム型臨場感を実現するためのコンピュータシステムおよびその方法
US11930349B2 (en) 2020-11-24 2024-03-12 Naver Corporation Computer system for producing audio content for realizing customized being-there and method thereof
CN114582356A (zh) * 2020-11-30 2022-06-03 华为技术有限公司 一种音频编解码方法和装置
WO2023141034A1 (en) * 2022-01-20 2023-07-27 Dolby Laboratories Licensing Corporation Spatial coding of higher order ambisonics for a low latency immersive audio codec
GB2615607A (en) * 2022-02-15 2023-08-16 Nokia Technologies Oy Parametric spatial audio rendering
AU2023231617A1 (en) * 2022-03-10 2024-09-19 Dolby International Ab Methods, apparatus and systems for directional audio coding-spatial reconstruction audio processing
WO2024175587A1 (en) * 2023-02-23 2024-08-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal representation decoding unit and audio signal representation encoding unit

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1650528B (zh) 2002-05-03 2013-05-22 哈曼国际工业有限公司 多信道下混频设备
CN1906664A (zh) * 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
CN101010724B (zh) 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
KR101024924B1 (ko) 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
PL2346029T3 (pl) * 2008-07-11 2013-11-29 Fraunhofer Ges Forschung Koder sygnału audio, sposób kodowania sygnału audio i odpowiadający mu program komputerowy
CA2730355C (en) 2008-07-11 2016-03-22 Guillaume Fuchs Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
EP2154677B1 (en) * 2008-08-13 2013-07-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a converted spatial audio signal
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
KR101283783B1 (ko) 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
TWI478149B (zh) * 2009-10-16 2015-03-21 Fraunhofer Ges Forschung 用以利用平均值而基於下混信號表示型態和與下混信號表示型態相關聯之參數側邊資訊來提供用於提供上混信號表示型態之一或多個經調整參數的裝置、方法與電腦程式
US9812141B2 (en) 2010-01-08 2017-11-07 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
DE102010030534A1 (de) * 2010-06-25 2011-12-29 Iosono Gmbh Vorrichtung zum Veränderung einer Audio-Szene und Vorrichtung zum Erzeugen einer Richtungsfunktion
US20150348558A1 (en) * 2010-12-03 2015-12-03 Dolby Laboratories Licensing Corporation Audio Bitstreams with Supplementary Data and Encoding and Decoding of Such Bitstreams
RU2589399C2 (ru) * 2011-03-18 2016-07-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Расположение элемента кадра в кадрах потока битов, представляющего аудио содержимое
KR101845226B1 (ko) 2011-07-01 2018-05-18 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
WO2014046916A1 (en) * 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9609452B2 (en) 2013-02-08 2017-03-28 Qualcomm Incorporated Obtaining sparseness information for higher order ambisonic audio renderers
US10178489B2 (en) * 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
US9959875B2 (en) * 2013-03-01 2018-05-01 Qualcomm Incorporated Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams
EP2830045A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP3022949B1 (en) 2013-07-22 2017-10-18 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
CN110634494B (zh) 2013-09-12 2023-09-01 杜比国际公司 多声道音频内容的编码
WO2015038522A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
ES2772851T3 (es) 2013-11-27 2020-07-08 Dts Inc Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales
EP2928216A1 (en) * 2014-03-26 2015-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for screen related audio object remapping
KR101941764B1 (ko) 2014-05-30 2019-01-23 퀄컴 인코포레이티드 고차 앰비소닉 오디오 렌더러들에 대한 대칭성 정보의 획득
US9847088B2 (en) * 2014-08-29 2017-12-19 Qualcomm Incorporated Intermediate compression for higher order ambisonic audio data
EP4123643B1 (en) * 2015-03-03 2024-06-19 Dolby Laboratories Licensing Corporation Enhancement of spatial audio signals by modulated decorrelation
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN107787509B (zh) 2015-06-17 2022-02-08 三星电子株式会社 处理低复杂度格式转换的内部声道的方法和设备
TWI607655B (zh) 2015-06-19 2017-12-01 Sony Corp Coding apparatus and method, decoding apparatus and method, and program
WO2017132082A1 (en) 2016-01-27 2017-08-03 Dolby Laboratories Licensing Corporation Acoustic environment simulation
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
CA3134343A1 (en) 2017-10-04 2019-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding
US11322164B2 (en) 2018-01-18 2022-05-03 Dolby Laboratories Licensing Corporation Methods and devices for coding soundfield representation signals

Similar Documents

Publication Publication Date Title
IL312390A (en) Methods and devices for producing or decoding a bit sequence comprising embedded audio signals
JP5461835B2 (ja) オーディオ信号の符号化/復号化方法及び符号化/復号化装置
RU2368074C2 (ru) Адаптивная группировка параметров для улучшенной эффективности кодирования
ES2923661T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
RU2658535C1 (ru) Декодирование битовых потоков аудио с метаданными расширенного копирования спектральной полосы в по меньшей мере одном заполняющем элементе
US20100211400A1 (en) Method and an apparatus for processing a signal
JP6214765B2 (ja) 音声デコーダ、符号化音声出力データを生成するための装置、及びデコーダの初期化を可能にする方法
US9570082B2 (en) Method, medium, and apparatus encoding and/or decoding multichannel audio signals
JP6728154B2 (ja) オーディオ信号のエンコードおよびデコード
JP7311940B2 (ja) 変換長切替えをサポートする周波数ドメインオーディオ符号化
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
KR20240038819A (ko) 오디오 인코더 및 디코더
TWI631554B (zh) Encoding device and method, decoding device and method, and program
JPWO2020010064A5 (ja)
KR20060122694A (ko) 두 채널 이상의 다운믹스 오디오 신호에 공간 정보비트스트림을 삽입하는 방법
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
RU2023121109A (ru) Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы
RU2802677C2 (ru) Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы
TH2001005154A (th) วิธีการและอุปกรณ์สำหรับให้กำเนิดหรือถอดรหัสกระแสบิตซึ่งประกอบรวมด้วยสัญญาณเสียงผ่านโสตแบบซึมซาบ