JP2021036342A - 圧縮された音または音場表現のための層構成の符号化 - Google Patents
圧縮された音または音場表現のための層構成の符号化 Download PDFInfo
- Publication number
- JP2021036342A JP2021036342A JP2020190601A JP2020190601A JP2021036342A JP 2021036342 A JP2021036342 A JP 2021036342A JP 2020190601 A JP2020190601 A JP 2020190601A JP 2020190601 A JP2020190601 A JP 2020190601A JP 2021036342 A JP2021036342 A JP 2021036342A
- Authority
- JP
- Japan
- Prior art keywords
- layer
- side information
- basic
- layers
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本願は2015年10月15日に出願された欧州特許出願第15306590.9号および米国特許出願第62/361,809号の優先権を主張するものである。これらの出願の内容はここに参照によってその全体において組み込まれる。
本稿は層構成のオーディオ符号化(layered audio coding)のための方法および装置に関する。特に、本稿は圧縮された音(または音場)表現、たとえば高次アンビソニックス(HOA: Higher-Order Ambisonics)音(または音場)表現の層構成にされたオーディオ符号化のための方法および装置に関する。
・基本的な圧縮された音表現のそれぞれの個別の(相補的な)成分についての従属基本サイド情報は、基本的な圧縮された音表現に他のある種の(相補的な)成分が含まれない場合に、最大範囲を達成する。
・基本的な圧縮された音表現に追加的なある種の(相補的な)成分が追加される場合には、考えている個別の(相補的な)成分についての従属基本サイド情報はもとの従属基本サイド情報の部分集合になり、それによりそのサイズを減らしうる。
・各BSRCjパケット、j=1,…,Jを個別のペイロード( ̄付きのBPjで記される)に割り当てる(たとえば割り振る)。
・m番目の向上サイド情報データ・パケットESImおよびm番目の従属サイド情報データ・パケットBSID,mを一つの向上ペイロード( ̄付きのEPmで記される、m=1,…,M)に割り当てる(たとえば割り振る)。
・独立基本サイド情報BSIIを別個のサイド情報ペイロード( ̄付きのBSIPで記される)に割り当てる。
NE(k)=NB(k) (9)
によって置き換えられる。
〔態様1〕
音または音場の圧縮された高次アンビソニックス(HOA)表現をデコードする方法であって、当該方法は:
基本層および一つまたは複数の階層式の向上層を含む複数の階層式の層に対応する前記圧縮されたHOA表現を含むビットストリームを受領する段階であって、前記複数の層には、前記音または音場の基本的な圧縮された音表現の成分が割り当てられており、それらの成分は、それぞれの成分グループにおいてそれぞれの層に割り当てられている、段階と;
基本層に関連付けられている基本サイド情報に基づき、かつ前記一つまたは複数の階層式の向上層に関連付けられている向上サイド情報に基づいて、前記圧縮されたHOA表現をデコードする段階とを含み、
前記一つまたは複数の階層式の向上層のそれぞれは、それぞれの層および該それぞれの層より低い任意の諸層に含まれるデータから得られる基本的な再構成された音表現を改善するためのパラメータを含む前記向上サイド情報の部分を含む、
方法。
〔態様2〕
前記基本的な圧縮された音表現の成分はモノラル信号に対応し;
前記モノラル信号は、優勢音信号またはHOA表現の係数シーケンスのいずれかを表わす、
態様1記載の方法。
〔態様3〕
前記ビットストリームは、前記一つまたは複数の階層式の層にそれぞれ対応するデータ・ペイロードを含む、態様1または2記載の方法。
〔態様4〕
前記向上サイド情報は、空間的予測、サブバンド方向性信号合成およびパラメトリック周囲音複製のうちの少なくとも一つに関係したパラメータを含む、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記向上サイド情報は、方向性信号からの音または音場の欠けている部分の予測を許容する情報を含む、態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
各層について、該それぞれの層が有効に受領されたかどうかを判定し;
有効に受領されていない最低の層のすぐ下の層の層インデックスを判別することをさらに含む、
態様1ないし5のうちいずれか一項記載の方法。
〔態様7〕
前記第一の層インデックスに等しいまたはデコードの際の向上サイド情報の省略を示す第二の層インデックスを決定することをさらに含む、態様1ないし6のうちいずれか一項記載の方法。
〔態様8〕
前記基本的な圧縮された音表現をデコードして前記音または音場の基本的な再構成された音表現にするために使われる、前記複数の層のうちの最高の使用可能な層を示す第一の層インデックスを決定し;
前記最高の使用可能な層および前記最高の使用可能な層より低い任意の諸層に割り当てられた成分から、前記第一のサイド情報を使って前記基本的な再構成された音表現を得ることをさらに含む、
態様1ないし7のうちいずれか一項記載の方法。
〔態様9〕
前記基本層が、追加的な基本サイド情報の、それぞれの層に対応する少なくとも一つの部分であって、該それぞれの層および該それぞれの層より低い任意の諸層に割り当てられた他の成分に依存して該それぞれの層に割り当てられた成分のうちの一つまたは複数の成分のデコードを指定する情報を含む部分を含み、当該方法は、追加的な基本サイド情報のそれぞれの部分について:
追加的な基本サイド情報の前記部分を、そのそれぞれの層および該それぞれの層より低い任意の諸層に割り当てられた成分を参照することによってデコードし;
追加的な基本サイド情報の前記部分を、前記最高の使用可能な層および前記最高の使用可能な層と該それぞれの層の間の任意の諸層に割り当てられた成分を参照することによって補正することを含み、
前記基本的な再構成された音表現は、前記最高の使用可能な層および前記最高の使用可能な層より低い任意の諸層に割り当てられた成分を参照から、前記基本サイド情報と、前記最高の使用可能な層までの諸層に対応する追加的な基本サイド情報の諸部分から得られる、追加的な基本サイド情報の補正された諸部分とを使って、得られる、
態様1ないし8のうちいずれか一項記載の方法。
〔態様10〕
音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードするための装置であって、当該装置は:
基本層および一つまたは複数の階層式の向上層を含む複数の階層式の層に対応する前記圧縮されたHOA表現を含むビットストリームを受領する受領器であって、前記複数の層には、前記音または音場の基本的な圧縮された音表現の成分が割り当てられており、それらの成分は、それぞれの成分グループにおいてそれぞれの層に割り当てられている、受領器と;
基本層に関連付けられている基本サイド情報に基づき、かつ前記一つまたは複数の階層式の向上層に関連付けられている向上サイド情報に基づいて、前記圧縮されたHOA表現をデコードするよう構成されたデコーダとを有し、
前記一つまたは複数の階層式の向上層のそれぞれは、それぞれの層および該それぞれの層より低い任意の諸層に含まれるデータから得られる基本的な再構成された音表現を改善するためのパラメータを含む前記向上サイド情報の部分を含む、
装置。
〔態様11〕
前記基本的な圧縮された音表現の成分はモノラル信号に対応し;
前記モノラル信号は、優勢音信号またはHOA表現の係数シーケンスのいずれかを表わす、
態様10記載の装置。
〔態様12〕
前記ビットストリームは、前記一つまたは複数の階層式の層にそれぞれ対応するデータ・ペイロードを含む、態様10または11記載の装置。
〔態様13〕
前記向上サイド情報は、空間的予測、サブバンド方向性信号合成およびパラメトリック周囲音複製のうちの少なくとも一つに関係したパラメータを含む、態様10ないし12のうちいずれか一項記載の装置。
〔態様14〕
前記向上サイド情報は、方向性信号からの音または音場の欠けている部分の予測を許容する情報を含む、態様10ないし13のうちいずれか一項記載の装置。
〔態様15〕
各層について、該それぞれの層が有効に受領されたかどうかを判定し;
有効に受領されていない最低の層のすぐ下の層の層インデックスを判別することをさらに含む、
態様10ないし14のうちいずれか一項記載の装置。
〔態様16〕
前記第一の層インデックスに等しいまたはデコードの際の向上サイド情報の省略を示す第二の層インデックスを決定することをさらに含む、態様10ないし15のうちいずれか一項記載の装置。
〔態様17〕
前記基本的な圧縮された音表現をデコードして前記音または音場の基本的な再構成された音表現にするために使われる、前記複数の層のうちの最高の使用可能な層を示す第一の層インデックスを決定し;
前記最高の使用可能な層および前記最高の使用可能な層より低い任意の諸層に割り当てられた成分から、前記第一のサイド情報を使って前記基本的な再構成された音表現を得ることをさらに含む、
態様10ないし16のうちいずれか一項記載の装置。
〔態様18〕
前記基本層が、追加的な基本サイド情報の、それぞれの層に対応する少なくとも一つの部分であって、該それぞれの層および該それぞれの層より低い任意の諸層に割り当てられた他の成分に依存して該それぞれの層に割り当てられた成分のうちの一つまたは複数の成分のデコードを指定する情報を含む部分を含み、当該方法は、追加的な基本サイド情報のそれぞれの部分について:
追加的な基本サイド情報の前記部分を、そのそれぞれの層および該それぞれの層より低い任意の諸層に割り当てられた成分を参照することによってデコードし;
追加的な基本サイド情報の前記部分を、前記最高の使用可能な層および前記最高の使用可能な層と該それぞれの層の間の任意の諸層に割り当てられた成分を参照することによって補正することを含み、
前記基本的な再構成された音表現は、前記最高の使用可能な層および前記最高の使用可能な層より低い任意の諸層に割り当てられた成分を参照から、前記基本サイド情報と、前記最高の使用可能な層までの諸層に対応する追加的な基本サイド情報の諸部分から得られる、追加的な基本サイド情報の補正された諸部分とを使って、得られる、
態様10ないし17のうちいずれか一項記載の装置。
Claims (13)
- 音または音場の圧縮された高次アンビソニックス(HOA)表現をデコードする方法であって、当該方法は:
基本層および二つ以上の階層式の向上層を含む複数の階層式の層に対応する前記圧縮されたHOA表現を含み、かつ、基本層に関連付けられている基本サイド情報および前記二つ以上の階層式の向上層に関連付けられている向上サイド情報を含むビットストリームを受領する段階を含み、
複数の層に、前記音または音場の基本的な圧縮された音表現の成分が割り当てられており、それらの成分は、それぞれの成分グループにおいてそれぞれの層に割り当てられており、前記基本的な圧縮された音表現の成分はモノラル信号に対応し、前記モノラル信号は、優勢音信号またはHOA表現の係数シーケンスのいずれかを表わし、
前記二つ以上の階層式の向上層は最高の使用可能な階層式の向上層を含み、
前記二つ以上の階層式の向上層のそれぞれは、それぞれの層および該それぞれの層より低い任意の諸層に含まれるデータから得られる基本的な再構成された音表現を改善するためのパラメータを含む前記向上サイド情報の部分を含み、
当該方法がさらに、基本層に関連付けられている前記基本サイド情報に基づき、かつ前記最高の使用可能な階層式の向上層に関連付けられている前記向上サイド情報の前記部分に基づき、前記圧縮されたHOA表現をデコードする段階を含む、
方法。 - 前記向上サイド情報は、空間的予測、サブバンド方向性信号合成およびパラメトリック周囲音複製のうちの少なくとも一つに関係したパラメータを含む、請求項1記載の方法。
- 前記向上サイド情報は、方向性信号からの音または音場の欠けている部分の予測を許容する情報を含む、
請求項1記載の方法。 - 各層について、該それぞれの層が有効に受領されたかどうかを判定し;
有効に受領されていない最低の層のすぐ下の層の層インデックスを判別することをさらに含む、
請求項1記載の方法。 - 前記層インデックスに等しいまたはデコードの際の向上サイド情報の省略を示すさらなる層インデックスを決定することをさらに含む、請求項4記載の方法。
- 前記基本層が、追加的な基本サイド情報の、前記それぞれの層に対応する少なくとも一つの部分であって、該それぞれの層および該それぞれの層より低い任意の諸層に割り当てられた他の成分に依存して該それぞれの層に割り当てられた成分のうちの一つまたは複数の成分のデコードを指定する情報を含む部分を含み、当該方法はさらに、追加的な基本サイド情報のそれぞれの部分について:
追加的な基本サイド情報の前記部分を、そのそれぞれの層および該それぞれの層より低い任意の諸層に割り当てられた成分を参照することによってデコードし;
追加的な基本サイド情報の前記部分を、前記最高の使用可能な階層式の向上層および前記最高の使用可能な階層式の向上層と該それぞれの層の間の任意の諸層に割り当てられた成分を参照することによって補正することを含み、
前記基本的な再構成された音表現は、前記最高の使用可能な階層式の向上層および前記最高の使用可能な階層式の向上層より低い任意の諸層に割り当てられた成分を参照から、前記基本サイド情報と、前記最高の使用可能な階層式の向上層までの諸層に対応する追加的な基本サイド情報の諸部分から得られる、追加的な基本サイド情報の補正された諸部分とを使って、得られる、
請求項1記載の方法。 - プロセッサによって実行されたときに請求項1記載の方法を実行する命令を含む非一時的なコンピュータ可読媒体。
- 音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードするための装置であって、当該装置は:
基本層および二つ以上の階層式の向上層を含む複数の階層式の層に対応する前記圧縮されたHOA表現を含み、かつ、基本層に関連付けられている基本サイド情報および前記二つ以上の階層式の向上層に関連付けられている向上サイド情報を含むビットストリームを受領する受領器を含む、
複数の層に、前記音または音場の基本的な圧縮された音表現の成分が割り当てられており、それらの成分は、それぞれの成分グループにおいてそれぞれの層に割り当てられており、
前記基本的な圧縮された音表現の成分はモノラル信号に対応し、前記モノラル信号は、優勢音信号またはHOA表現の係数シーケンスのいずれかを表わし、
前記二つ以上の階層式の向上層は最高の使用可能な階層式の向上層を含み、
前記二つ以上の階層式の向上層のそれぞれは、それぞれの層および該それぞれの層より低い任意の諸層に含まれるデータから得られる基本的な再構成された音表現を改善するためのパラメータを含む前記向上サイド情報の部分を含み、
当該装置がさらに、基本層に関連付けられている前記基本サイド情報に基づき、かつ前記最高の使用可能な階層式の向上層に関連付けられている前記向上サイド情報の前記部分に基づき、前記圧縮されたHOA表現をデコードするデコーダを有する、
装置。 - 前記向上サイド情報は、空間的予測、サブバンド方向性信号合成およびパラメトリック周囲音複製のうちの少なくとも一つに関係したパラメータを含む、請求項8記載の装置。
- 前記向上サイド情報は、方向性信号からの音または音場の欠けている部分の予測を許容する情報を含む、請求項8記載の装置。
- 各層について、該それぞれの層が有効に受領されたかどうかを判定し;
有効に受領されていない最低の層のすぐ下の層の層インデックスを判別するよう構成されている、
請求項8記載の装置。 - 前記層インデックスに等しいまたはデコードの際の向上サイド情報の省略を示すさらなる層インデックスを決定するようさらに構成されている、請求項11記載の装置。
- 前記基本層が、追加的な基本サイド情報の、前記それぞれの層に対応する少なくとも一つの部分であって、該それぞれの層および該それぞれの層より低い任意の諸層に割り当てられた他の成分に依存して該それぞれの層に割り当てられた成分のうちの一つまたは複数の成分のデコードを指定する情報を含む部分を含み、
追加的な基本サイド情報のそれぞれの部分について、当該装置は:
追加的な基本サイド情報の前記部分を、そのそれぞれの層および該それぞれの層より低い任意の諸層に割り当てられた成分を参照することによってデコードし;
追加的な基本サイド情報の前記部分を、前記最高の使用可能な階層式の向上層および前記最高の使用可能な階層式の向上層と該それぞれの層の間の任意の諸層に割り当てられた成分を参照することによって補正するよう構成されており、
前記基本的な再構成された音表現は、前記最高の使用可能な階層式の向上層および前記最高の使用可能な階層式の向上層より低い任意の諸層に割り当てられた成分を参照から、前記基本サイド情報と、前記最高の使用可能な階層式の向上層までの諸層に対応する追加的な基本サイド情報の諸部分から得られる、追加的な基本サイド情報の補正された諸部分とを使って、得られる、
請求項8記載の装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022115600A JP7346676B2 (ja) | 2015-10-08 | 2022-07-20 | 圧縮された音または音場表現のための層構成の符号化 |
JP2023144104A JP2023171740A (ja) | 2015-10-08 | 2023-09-06 | 圧縮された音または音場表現のための層構成の符号化 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15306590 | 2015-10-08 | ||
EP15306590.9 | 2015-10-08 | ||
US201662361809P | 2016-07-13 | 2016-07-13 | |
US62/361,809 | 2016-07-13 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018517514A Division JP6797197B2 (ja) | 2015-10-08 | 2016-10-07 | 圧縮された音または音場表現のための層構成の符号化 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022115600A Division JP7346676B2 (ja) | 2015-10-08 | 2022-07-20 | 圧縮された音または音場表現のための層構成の符号化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021036342A true JP2021036342A (ja) | 2021-03-04 |
JP7110304B2 JP7110304B2 (ja) | 2022-08-01 |
Family
ID=74551499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020190601A Active JP7110304B2 (ja) | 2015-10-08 | 2020-11-17 | 圧縮された音または音場表現のための層構成の符号化 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP7110304B2 (ja) |
CO (1) | CO2018004867A2 (ja) |
ME (1) | ME03762B (ja) |
UA (1) | UA123055C2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006072026A (ja) * | 2004-09-02 | 2006-03-16 | Matsushita Electric Ind Co Ltd | 音声符号化装置、音声復号化装置及びこれらの方法 |
WO2010103854A2 (ja) * | 2009-03-13 | 2010-09-16 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
JP2013535023A (ja) * | 2010-06-11 | 2013-09-09 | トムソン ライセンシング | 基本層および少なくとも一つの向上層を含む層構造の階層的ビットストリームを探索し、再生する方法および装置 |
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
-
2016
- 2016-10-07 ME MEP-2020-63A patent/ME03762B/me unknown
- 2016-10-07 UA UAA201804929A patent/UA123055C2/uk unknown
-
2018
- 2018-05-08 CO CONC2018/0004867A patent/CO2018004867A2/es unknown
-
2020
- 2020-11-17 JP JP2020190601A patent/JP7110304B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006072026A (ja) * | 2004-09-02 | 2006-03-16 | Matsushita Electric Ind Co Ltd | 音声符号化装置、音声復号化装置及びこれらの方法 |
WO2010103854A2 (ja) * | 2009-03-13 | 2010-09-16 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
JP2013535023A (ja) * | 2010-06-11 | 2013-09-09 | トムソン ライセンシング | 基本層および少なくとも一つの向上層を含む層構造の階層的ビットストリームを探索し、再生する方法および装置 |
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
Also Published As
Publication number | Publication date |
---|---|
UA123055C2 (uk) | 2021-02-10 |
JP7110304B2 (ja) | 2022-08-01 |
ME03762B (me) | 2021-04-20 |
CO2018004867A2 (es) | 2018-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7346676B2 (ja) | 圧縮された音または音場表現のための層構成の符号化 | |
US11232801B2 (en) | Layered coding for compressed sound or sound field representations | |
JP2021036342A (ja) | 圧縮された音または音場表現のための層構成の符号化 | |
JP7122359B2 (ja) | 圧縮された音または音場表現のための層構成の符号化 | |
US12020714B2 (en) | Layered coding for compressed sound or sound field represententations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220628 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220720 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7110304 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |