JP2019133200A - 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置 - Google Patents

音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置 Download PDF

Info

Publication number
JP2019133200A
JP2019133200A JP2019092768A JP2019092768A JP2019133200A JP 2019133200 A JP2019133200 A JP 2019133200A JP 2019092768 A JP2019092768 A JP 2019092768A JP 2019092768 A JP2019092768 A JP 2019092768A JP 2019133200 A JP2019133200 A JP 2019133200A
Authority
JP
Japan
Prior art keywords
prediction
array
side information
index
hoa
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019092768A
Other languages
English (en)
Other versions
JP6848004B2 (ja
Inventor
クルーガー,アレクサンダー
krueger Alexander
コールドン,スヴェン
Kordon Sven
ヴューボボルト,オリヴァー
Wuebbolt Oliver
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2019133200A publication Critical patent/JP2019133200A/ja
Application granted granted Critical
Publication of JP6848004B2 publication Critical patent/JP6848004B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する。【解決手段】高次アンビソニックスは特定のスピーカー・セットアップとは独立な三次元の音を表わす。しかしながら、HOA表現の伝送は非常に高いビットレートにつながる。したがって、方向性および周囲信号成分が異なる仕方で処理される、固定数のチャネルを用いた圧縮が使用される。符号化については、もとのHOA表現の諸部分が方向性信号成分から予測される。この予測は、対応する復号のために必要とされるサイド情報を与える。いくつかの追加的な特定目的のビットを使うことにより、そのサイド情報を符号化するための必要とされるビット数が平均で低減されるという点で、既知のサイド情報符号化処理が改善される。【選択図】図1

Description

本発明は、音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善するための方法および装置に関する。
高次アンビソニックス(HOA: Higher Order Ambisonics)は、波面合成(WFS: wave field synthesis)または2.2マルチチャネル・オーディオ・フォーマットのようなチャネル・ベースのアプローチのような他の技法もあるうちでの、三次元音を表現するための一つの可能性を提供する。チャネル・ベースの方法とは対照的に、HOA表現は特定のスピーカー・セットアップとは独立であるという利点をもたらす。しかしながら、この柔軟性は、特定のスピーカー・セットアップでのHOA表現の再生のために必要とされるデコード・プロセスの代償を伴う。必要とされるスピーカーの数が通例非常に多いWFSアプローチに比べ、HOA信号は少数のスピーカーのみからなるセットアップにレンダリングされてもよい。HOAのさらなる利点は、同じ表現を、修正なしでヘッドフォンへのバイノーラル・レンダリングのために用いることもできるということである。
HOAは、複素調和平面波振幅の空間密度の、打ち切りされた球面調和関数(SH)展開による表現に基づく。各展開係数は角周波数の関数であり、これは時間領域関数によって等価に表現できる。よって、一般性を失うことなく、完全なHOA音場表現は、実際に、O個の時間領域関数からなると想定されることができる。ここで、Oは展開係数の数を表わす。これらの時間領域関数は、以下では、等価だが、HOA係数シーケンスまたはHOAチャネルと称される。
HOA表現の空間分解能は、展開の最大次数Nの増大とともに改善する。残念ながら、展開係数の数Oは次数Nとともに二次で、特にO=(N+1)2の形で増大する。たとえば、次数N=4を使う典型的なHOA表現はO=25個のHOA(展開)係数を必要とする。以前になされた考察によれば、HOA表現の伝送のための全ビットレートは、所望される単一チャネル・サンプリング・レートfSおよびサンプル当たりのビット数Nbを与えられて、O・fS・Nbによって決定される。結果として、次数N=4のHOA表現をfS=48kHzのサンプリング・レートで、サンプル当たりNb=16ビットを用いて伝送することは、19.2MBits/sのビットレートにつながる。これは、たとえばストリーミングのような多くの実際的な用途にとって非常に高い。このように、HOA表現の圧縮がきわめて望ましい。
HOA音場表現の圧縮はWO2013/171083A1、EP13305558.2およびPCT/EP2013/075559において提案されている。これらの処理は、音場解析を実行し、与えられたHOA表現を方向性成分(directional component)と残差周囲成分(residual ambient component)に分解することで共通している。一方では、最終的な圧縮された表現は、いくつかの量子化された信号からなることが想定され、該量子化された信号は、方向性信号と周囲HOA成分(ambient HOA component)の関連する係数シーケンスとの知覚的符号化から帰結する。他方では、最終的な圧縮された表現は、量子化された信号に関係する追加的なサイド情報を含むと想定される。このサイド情報は、HOA表現の、その圧縮されたバージョンからの再構成のために必要である。
サイド情報の重要な部分は、方向性信号からのもとのHOA表現の諸部分の予測の記述である。この予測のためには、もとのHOA表現は、空間的に一様に分布した諸方向から入射するいくつかの空間的に分散した一般平面波によって等価に表現されると想定されるので、この予測は以下では空間的予測(spatial prediction)と称される。
空間的予測に関係したそのようなサイド情報の符号化は、非特許文献1において記述されている。しかしながら、サイド情報のこの現状技術の符号化はかなり非効率的である。
ISO/IEC JTC1/SC29/WG11, N14061, "Working Draft Text of MPEG-H 3D Audio HOA RM0", November 2013, Geneva, Switzerland
本発明によって解決されるべき課題は、かかる空間的予測に関係したサイド情報を符号化する、より効率的な方法を提供することである。
この課題は、請求項1および6に開示される方法によって解決される。これらの方法を利用する装置は請求項2および7に開示される。
符号化されたサイド情報表現データζCODの前にビットが付加される。このビットは、何らかの予測が実行されるべきか否かを伝える。この特徴は、ζCODデータの伝送のための平均ビットレートを時間とともに低下させる。さらに、個別的な状況では、予測が実行されるか否かを各方向について示すビット・アレイを使う代わりに、アクティブな予測の数およびそれぞれのインデックスを伝送または転送するほうが効率的である。予測が実行されるべきはずの方向のインデックスがどの仕方で符号化されるかを示すために、単一のビットが使用されることができる。平均では、この動作は時間とともに、ζCODデータの伝送のためのビットレートをさらに低下させる。
原理的には、本発明の方法は、HOA係数シーケンスの入力時間フレームをもつ、音場の高次アンビソニックス表現(HOA)を符号化するために必要とされるサイド情報の符号化を改善するために好適である。ここで、優勢な方向性信号および残差周囲HOA成分が決定され、前記優勢な方向性信号について予測が使われ、それにより、HOA係数の符号化されたフレームについて、前記予測を記述するサイド情報データを提供し、前記サイド情報データは:
・ある方向について予測が実行されるか否かを示すビット配列;
・各ビットが、予測が実行されるべき方向について予測の種類を示す、ビット配列;
・実行されるべき予測について、使われるべき方向性信号のインデックスを表わす要素をもつデータ配列;
・量子化されたスケーリング因子を表わす要素をもつデータ配列、を含むことができ、
当該方法は:
・前記予測が実行されるべきか否かを示すビット値を提供し;
・実行されるべき予測がない場合、前記サイド情報データにおいて前記ビット配列および前記データ配列を省略し;
・前記予測が実行されるべきである場合、ある方向について予測が実行されるか否かを示す前記ビット配列の代わりに、アクティブな予測の数と、予測が実行されるべき方向のインデックスを含むデータ配列とが前記サイド情報データに含められるか否かを示すビット値を提供するステップを含む。
原理的には、本発明の装置は、HOA係数シーケンスの入力時間フレームをもつ、音場の高次アンビソニックス表現(HOA)を符号化するために必要とされるサイド情報の符号化を改善するために好適である。ここで、優勢な方向性信号および残差周囲HOA成分が決定され、前記優勢な方向性信号について予測が使われ、それにより、HOA係数の符号化されたフレームについて、前記予測を記述するサイド情報データを提供し、前記サイド情報データは:
・ある方向について予測が実行されるか否かを示すビット配列;
・各ビットが、予測が実行されるべき方向について予測の種類を示す、ビット配列;
・実行されるべき予測について、使われるべき方向性信号のインデックスを表わす要素をもつデータ配列;
・量子化されたスケーリング因子を表わす要素をもつデータ配列、を含むことができ、
当該装置は:
・前記予測が実行されるべきか否かを示すビット値を提供し;
・実行されるべき予測がない場合、前記サイド情報データにおいて前記ビット配列および前記データ配列を省略し;
・前記予測が実行されるべきである場合、ある方向について予測が実行されるか否かを示す前記ビット配列を提供する代わりに、アクティブな予測の数と、予測が実行されるべき方向のインデックスを含むデータ配列とが前記サイド情報データに含められるか否かを示すビット値を提供する、手段を含む。
本発明の有利な追加的実施形態は、それぞれの従属請求項において開示される。
本発明の例示的実施形態は、付属の図面を参照して記述される。
EP13305558.2に記載されるHOA圧縮処理における空間的予測に関係したサイド情報の例示的な符号化を示す図である。 特許出願EP13305558.2に記載されるHOA圧縮解除処理における空間的予測に関係したサイド情報の例示的な復号を示す図である。 特許出願PCT/EP2013/075559に記載されるHOA分解を示す図である。 残差信号を表わす一般平面波の方向(×として描かれる)および優勢な音源の方向(○として描かれる)を示す図である。方向は、単位球面上のサンプリング位置として三次元座標系において呈示される。 空間的予測のサイド情報の現状技術の符号化を示す図である。 空間的予測のサイド情報の本発明の符号化を示す図である。 符号化された空間的予測の本発明の復号を示す図である。 図7の続き。
以下では、空間的予測に関係するサイド情報の本発明の符号化が使用されるコンテキストを与えるために、特許出願EP13305558.2に記載されるHOA圧縮および圧縮解除処理を要約しておく。
〈HOA圧縮〉
図1には、特許出願EP13305558.2に記載されるHOA圧縮処理にどのように空間的予測に関係するサイド情報の符号化を埋め込むことができるかが示されている。HOA表現圧縮については、長さLのHOA係数シーケンスの重なりのない入力フレームC(k)を用いたフレームごとの処理が想定される。ここで、kはフレーム・インデックスを表わす。図1における最初の段階または段11/12は任意的であり、HOA係数シーケンスC(k)の重なりのないk番目および(k−1)番目のフレームを長フレーム
Figure 2019133200
に連結することからなる。この長フレームは隣接する長フレームと50%重なっており、この長フレームは優勢な音源方向の推定のために相続いて使われる。チルダ付きのC(k)についてのこの記法と同様に、チルダ記号は以下では、それぞれの量が重なりのある長フレームについてのものであることを示すために使われる。段階/段11/12が存在しなければ、チルダ記号は特に意味をもたない。ボールドのパラメータは値の集合、たとえば行列またはベクトルを意味する。
長フレーム〔チルダ付きのC(k)〕は、EP13305558.2に記載されるように優勢な音源方向の推定のために段階または段13において相続いて使われる。この推定は、検出された関係する方向性信号のインデックスのデータ集合
Figure 2019133200
と、それらの方向性信号の対応する方向推定値のデータ集合
Figure 2019133200
とを与える。Dは、HOA圧縮を開始する前に設定される必要があり、後続の既知の処理において扱われることのできる方向性信号の最大数を表わす。
段階または段14では、HOA係数シーケンスの現在の(長)フレーム〔チルダ付きのC(k)〕が(EP13305156.5において提案されるように)集合
Figure 2019133200
に含まれる方向に属するいくつかの方向性信号XDIR(k−2)と、残差周囲HOA成分CAMB(k−2)とに分解される。なめらかな信号をえるための重複加算(overlap-add)処理の結果として2フレームぶんの遅延が導入される。XDIR(k−2)は合計D個のチャネルを含んでいるが、このうちアクティブな方向性信号に対応するもののみが0でないと想定される。これらのチャネルを指定するインデックスは、データ集合
Figure 2019133200
において出力されると想定される。加えて、段階/段14における分解は、方向性信号からもとのHOA表現の諸部分を予測するために圧縮解除側で使用できるいくつかのパラメータζ(k−2)を提供する(さらなる詳細についてはEP13305156.5参照)。空間的予測パラメータζ(k−2)の意味を説明するために、下記のセクション〈HOA分解〉において、HOA分解についてより詳細に述べる。
段階または段15において、周囲HOA成分CAMB(k−2)の係数の数は、たったORED+D−NDIR,ACT(k−2)個の0でないHOA係数シーケンスを含むよう低減される。ここで、
Figure 2019133200
はデータ集合
Figure 2019133200
の濃度、すなわちフレームk−2におけるアクティブな方向性信号の数を示す。周囲HOA成分は常に最小数OREDのHOA係数シーケンスによって表現されると想定されるので、この問題は、実際には、可能なO−ORED個からの残りのD−NDIR,ACT(k−2)個のHOA係数シーケンスの選択に帰着できる。なめらかな低減された周囲HOA表現を得るために、この選択は、直前のフレームk−3において行なわれた選択に比べて、できるだけ少数の変更が生じるように達成される。
低減された(reduced)数ORED+NDIR,ACT(k−2)個の0でない係数シーケンスをもつ最終的な周囲HOA表現はCAMB,RED(k−2)によって表わされる。選ばれた周囲HOA係数シーケンスのインデックスはデータ集合
Figure 2019133200
において出力される。段階/段16では、XDIR(k−2)に含まれるアクティブな方向性信号およびCAMB,RED(k−2)に含まれるHOA係数シーケンスは、EP13305558.2に記載されるように、個々の知覚的エンコードのためのI個のチャネルのフレームY(k−2)に割り当てられる。知覚的符号化段階/段17は、フレームY(k−2)のI個のチャネルをエンコードし、エンコードされたフレーム
Figure 2019133200
を出力する。
本発明によれば、段階/段14におけるもとのHOA表現の分解後、HOA表現の分解から帰結する空間的予測パラメータまたはサイド情報データζ(k−2)が段階または段19において、符号化された(coded)データ表現ζCOD(k−2)を提供するために、インデックス集合
Figure 2019133200
を遅延18において2フレームだけ遅延させたものを使って、無損失で符号化される。
〈HOA圧縮解除〉
図2では、空間的予測に関係する受領されたエンコードされたサイド情報データζCOD(k−2)のデコードを、段階または段25において、特許出願EP13305558.2の図3に記載されるHOA圧縮解除処理にどのように埋め込むかが例示的に示されている。エンコードされたサイド情報データζCOD(k−2)のデコードは、そのデコードされたバージョンζ(k−2)を段階または段23におけるHOA表現の合成に入力する前に、受領されたインデックス集合
Figure 2019133200
を遅延24において2フレームだけ遅延させたものを使って、実行される。
段階または段21では、
Figure 2019133200
に含まれるI個の信号の知覚的デコードが、
Figure 2019133200
におけるI個のデコードされた信号を得るために、実行される。
信号再分配段階または段22では、
Figure 2019133200
における知覚的にデコードされた信号は、方向性信号のフレーム
Figure 2019133200
および周囲HOA成分のフレーム
Figure 2019133200
を再生成するために再分配される。それらの信号をどのように再分配するかについての情報は、インデックス・データ集合
Figure 2019133200
を使って、HOA圧縮のために実行された割り当て動作を再現することによって得られる。
合成段階または段23において、所望される全HOA表現の現在フレーム
Figure 2019133200
が(PCT/EP2013/075559の図2bおよび図4との関連で記載されている処理に従って)再合成される。これには、方向性信号のフレーム
Figure 2019133200
と、アクティブな方向性信号のインデックスの集合
Figure 2019133200
および対応する方向の集合
Figure 2019133200
と、方向性信号からHOA表現の諸部分を予測するためのパラメータζ(k−2)と、低減された周囲HOA成分のHOA係数シーケンスのフレーム
Figure 2019133200
とを使う。
数22は、PCT/EP2013/075559における成分
Figure 2019133200
に対応し、数21および数20はPCT/EP2013/075559における
Figure 2019133200
に対応する。ここで、アクティブな方向性信号のインデックスは、有効な要素を含んでいる数24の行のインデックスを取ることによって得られる。すなわち、一様に分布した方向に関する方向性信号は、方向性信号
Figure 2019133200
から、予測のための受領されたパラメータζ(k−2)を使って、予測され、その後、現在の圧縮解除されたフレーム
Figure 2019133200
が、方向性信号のフレーム
Figure 2019133200
と、
Figure 2019133200
と、前記の予測された諸部分および低減された周囲HOA成分
Figure 2019133200
とから再合成される。
〈HOA分解〉
図3との関連で、HOA分解処理について、そこでの空間的予測の意味を説明するために詳細に述べる。処理は、特許出願PCT/EP2013/075559の図3との関連で記載されている処理から導かれる。
第一に、平滑化された方向性信号XDIR(k−1)およびそのHOA表現CDIR(k−1)が段階または段31において、入力HOA表現の長フレーム
Figure 2019133200
と、方向の集合
Figure 2019133200
と、方向性信号の対応するインデックスの集合
Figure 2019133200
とを使って計算される。XDIR(k−1)は合計D個のチャネルを含んでいるが、このうちアクティブな方向性信号に対応するもののみが0でないと想定される。これらのチャネルを指定するインデックスは、集合
Figure 2019133200
において出力されると想定される。
段階/段33では、もとのHOA表現〔チルダ付きのC(k−1)〕と優勢な方向性信号のHOA表現CDIR(k−1)との間の残差(residual)が、O個の方向性信号
Figure 2019133200
によって表現される。これらの信号は、一様グリッドと称される一様に分布した方向からの一般平面波と考えることができる。
段階または段34では、これらの方向性信号が優勢な方向性信号XDIR(k−1)から予測される。予測される信号
Figure 2019133200
を、それぞれの予測パラメータζ(k−1)とともに提供するためである。この予測のためには、集合
Figure 2019133200
に含まれるインデックスdをもつ優勢な方向性信号xDIR,d(k−1)のみが考慮される。予測は、下記の〈空間的予測〉の節でより詳細に述べる。
段階または第35では、予測された方向性信号
Figure 2019133200
の平滑化されたHOA表現
Figure 2019133200
が計算される。
段階または段37では、もとのHOA表現〔チルダ付きのC(k−2)〕と、優勢な方向性信号のHOA表現CDIR(k−2)に一様に分布した方向からの予測された方向性信号のHOA表現
Figure 2019133200
を合わせたものとの間の残差CAMB(k−2)が計算され、出力される。
図3の処理における要求される信号遅延は、対応する遅延381および387によって実行される。
〈空間的予測〉
空間的予測の目標は、O個の残差信号
Figure 2019133200
を、平滑化された方向性信号の拡張されたフレーム
Figure 2019133200
から予測することである(上記の節〈HOA分解〉および特許出願PCT/EP2013/075559における記述を参照)。
それぞれの残差信号
Figure 2019133200
は、方向Ωqから入射する空間的に分散された一般平面波を表わす。ここで、すべての方向Ωq、q=1,…,Oは単位球面上にほぼ一様に分布していることが想定される。全方向の総合が「グリッド」と称される。
それぞれの方向性信号
Figure 2019133200
は、方向ΩACT,d(k−3)、ΩACT,d(k−2)、ΩACT,d(k−1)およびΩACT,d(k)の間で補間された軌跡から入射する一般平面波を表わす。ここで、d番目の方向性信号はそれぞれのフレームについてアクティブであると想定する。
空間的予測の意味を一例によって例解するために、次数N=3のHOA表現の分解を考える。ここでは、抽出すべき方向の最大数はD=4に等しい。簡単のため、さらに、インデックス1および4をもつ方向性信号のみがアクティブであり、他方、インデックス2および3をもつ方向性信号は非アクティブであると想定する。さらに、簡単のため、優勢な音源の方向が、考慮される諸フレームについて一定である、すなわち、d=1,4について、
ΩACT,d(k−3)=ΩACT,d(k−2)=ΩACT,d(k−1)=ΩACT,d(k)=ΩACT,d (5)
あると想定される。次数N=3である結果として、空間的に分散した一般平面波
Figure 2019133200
のO=16個の方向Ωqがある。図4は、これらの方向を、アクティブな優勢な音源の方向ΩACT,1およびΩACT,4とともに示している。
〈空間的予測を記述するための現状技術のパラメータ〉
空間的予測を記述する一つの方法が、上述したISO/IECの非特許文献1において呈示されている。非特許文献1では、信号
Figure 2019133200
は、あらかじめ定義された最大数DPREDの方向性信号の重み付けされた和によって、あるいは該重み付けされた和の低域通過フィルタリングされたバージョンによって、予測されると想定される。空間的予測に関係するサイド情報は、パラメータ集合ζ(k−1)={pTYPE(k−1),PIND(k−1),PQ,F(k−1)}によって記述される。このパラメータ集合は次の三つの成分からなる。
・要素pTYPE,q(k−1)、q=1,…,OからなるベクトルpTYPE(k−1)は、q番目の方向Ωqについて、予測が実行されるか否かを示し、もしそうであれば、どの種類の予測かも示す。上記要素の意味は次のとおり:
pTYPE,q(k−1)=0 方向Ωqについて予測なしの場合
=1 方向Ωqについてフル帯域予測の場合 (6)
=2 方向Ωqについて低域予測の場合。
・要素pIND,d,q(k−1)、d=1,…,DPRED、q=1,…,Oからなる行列PIND(k−1)は、対応する方向性信号から方向Ωqについての予測が実行されなければならないインデックスを表わす。方向Ωqについて実行されるべき予測がなければ、行列PIND(k−1)の対応する列は0からなる。さらに、方向Ωqについての予測のために使われる方向性信号がDPRED個未満であれば、PIND(k−1)のq番目の列の必要とされない要素も0である。
・対応する量子化された予測因子pQ,F,d,q(k−1)、d=1,…,DPRED、q=1,…,Oを含む行列PQ,F(k−1)。
次の二つのパラメータは、これらのパラメータの適切な解釈を可能にするためにデコード側で知られている必要がある:
・一般平面波信号
Figure 2019133200
が予測されることが許容されるもとになる方向性信号の最大数DPRED
・予測因子pQ,F,d,q(k−1)、d=1,…,DPRED、q=1,…,Oを量子化するために使われるビット数BSC。量子化解除規則は式(10)で与えられる。
これら二つのパラメータは、エンコーダおよびデコーダに既知の固定値に設定されるか、あるいは追加的に、ただしフレームレートより著しく低頻度で、伝送される必要がある。後者のオプションは、二つのパラメータを圧縮されるべきHOA表現に適合させるために使われてもよい。パラメータ集合についての例は、O=16、DPRED=2、BSC=8として、次のような感じであってもよい。
Figure 2019133200
そのようなパラメータは、方向Ω1からの一般平面波信号
Figure 2019133200
が方向ΩACT,1からの方向性信号
Figure 2019133200
から、値40を量子化解除することから帰結する因子との純粋な乗算(すなわち、フル帯域)によって予測されることを意味する。さらに、方向Ω7からの一般平面波信号
Figure 2019133200
は、方向性信号
Figure 2019133200
から、低域通過フィルタリングおよび値15および−13を量子化解除することから帰結する因子との乗算によって予測される。
このサイド情報を与えられて、予測は次のように実行されると想定される。
第一に、量子化された予測因子pQ,F,d,q(k−1)、d=1,…,DPRED、q=1,…,Oが量子化解除されて、実際の予測因子を与える。
Figure 2019133200
すでに述べたように、BSCは、予測因子の量子化のために使われるべきあらかじめ定義されたビット数を表わす。さらに、pIND,d,q(k−1)が0に等しければpF,d,q(k−1)は0に設定されると想定される。
先述した例について、BSC=8とすると、量子化解除された予測因子ベクトルの結果、次が得られる。
Figure 2019133200
さらに、低域通過予測を実行するために、長さLh=31のあらかじめ定義された低域通過FIRフィルタ
hLP:=[hLP(0) hLP(1) … hLP(Lh−1)] (12)
が使われる。フィルタ遅延はDh=15サンプルによって与えられる。
信号として予測された信号
Figure 2019133200
および方向性信号
Figure 2019133200

Figure 2019133200
によってそのサンプルから構成されていると想定すると、予測される信号のサンプル値は
Figure 2019133200
によって与えられる。
すでに述べており、今や式(17)からも見て取れるように、信号
Figure 2019133200
は、あらかじめ定義された最大数DPRED個の方向性信号の重み付けされた和によって、あるいは該重み付けされた和の低域通過フィルタリングされたバージョンによって、予測されると想定される。
〈空間的予測に関係したサイド情報の現状技術の符号化〉
上述したISO/IECの非特許文献1において、空間的予測のサイド情報の符号化が扱われている。それは、図5に描かれるアルゴリズム1にまとめられており、以下で説明する。呈示をより明確にするため、フレーム・インデックスk−1はすべての式において無視する。
第一に、O個のビットからなるビット配列ActivePredが生成される。ここで、ビットActivePred[q]は方向Ωqについて予測が実行されるか否かを示す。この配列における「1」の数はNumActivePredによって表わされる。
次に、長さNumActivePredのビット配列PredTypeが生成される。ここで、各ビットは、予測が実行されるべき方向について、予測の種類を、すなわちフル帯域か低域通過かを示す。同時に、長さNumActivePred・DPREDの符号なし整数配列PredDirSigIdsが生成される。その要素は、各アクティブな予測について、使用されるべき方向性信号のDPRED個のインデックスを表わす。DREPD個より少ない方向性信号が予測のために使われる場合には、インデックスは0に設定されると想定される。配列PredDirSigIdsの各要素は、
Figure 2019133200
ビットによって表現されると想定される。配列PredDirSigIdsにおける0でない要素の数はNumNonZeroIdsによって表わされる。
最後に、長さNumNonZeroIdsの整数配列QuantPredGainsが生成される。その要素は式(17)において使用されるべき量子化されたスケーリング因子pQ,F,d,q(k−1)を表わすと想定される。対応する量子化解除されたスケーリング因子pF,d,q(k−1)を得るための量子化解除は式(10)において与えられている。配列QuantPredGainsの各要素は、BSCビットによって表現されると想定される。
結局、サイド情報の符号化された表現ζCODは、
ζCOD=[ActivePred PredType PredDirSigIds QuantPredGains] (19)
に従って上記の四つの配列からなる。
この符号化を例によって説明するために、式(7)ないし(9)の符号化された表現が使われる:
Figure 2019133200
必要とされるビット数は16+2+3・4+8・3=54に等しい。
〈本発明による空間的予測に関係したサイド情報の符号化〉
空間的予測に関係したサイド情報の符号化の効率を高めるために、現状技術の処理が有利に修正される。
A)典型的なサウンド・シーンのHOA表現を符号化するとき、本発明者らは、HOA圧縮処理において空間的予測を全く実行しないという決定がなされるフレームがしばしばあることを観察した。しかしながら、そのようなフレームにおいて、ビット配列ActivePredは0のみからなり、0の数はOに等しい。そのようなフレーム内容はきわめて頻繁に生起するため、本発明の処理は、符号化された表現ζCODの前に単一のビットPSPredictionActiveを付加する。これは、何らかの予測が実行されるべきか否かを示す。ビットPSPredictionActiveの値が0(または代替例では「1」)であれば、配列ActivePredおよび予測に関係するさらなるデータは、符号化されたサイド情報ζCODに含められない。実際上、この処理は、ζCODの伝送のための平均ビットレートを時間とともに低下させる。
B)典型的なサウンド・シーンのHOA表現を符号化する際になされたさらなる観察は、アクティブな予測の数NumActivePredがしばしば非常に少ないということである。そのような状況では、各方向Ωqについて予測が実行されるか否かを示すためにビット配列ActivePredを使う代わりに、アクティブな予測の数およびそれぞれのインデックスを伝送または転送するほうが効率的であることがある。特に、アクティブなものを符号化するこの変種は、NumActivePred≦MMである場合に、より効率的である。ここで、MMは次式を満たす最大の整数である。
Figure 2019133200
MMの値は、上述したように、HOA次数N:O=(N+1)2の知識があってはじめて計算できる。
式(25)において、
Figure 2019133200
はアクティブな予測の実際の数NumActivePredを符号化するために必要とされるビット数を表わし、
Figure 2019133200
はそれぞれの方向インデックスを符号化するために必要とされるビット数である。式(25)の右辺は配列ActivePredのビット数に対応し、これは既知の方法で同じ情報を符号化するために必要とされるものである。
上述した説明により、予測が実行されることになっている方向のインデックスがどのような仕方で符号化されるかを示すために、単一のビットKindOfCodedPredIdsが使用されることができる。ビットKindOfCodedPredIdsが値「1」(または代替例では「0」)をもつ場合には、数NumActivePredと、予測が実行されることになっている方向のインデックスを含む配列PredIdsとが、符号化されたサイド情報ζCODに加えられる。そうではなく、ビットKindOfCodedPredIdsが値「0」(または代替例では「1」)をもつ場合には、同じ情報を符号化するために配列ActivePredが使われる。平均的には、この動作は、ζCODの伝送のためのビットレートを時間とともに低下させる。
C)サイド情報符号化効率をさらに高めるために、予測のために使われるアクティブな方向性信号の実際に利用可能な数はしばしばDより少ないという事実が活用される。これは、インデックス配列PredDirSigIdsの各要素の符号化のために、
Figure 2019133200
個未満のビットが必要とされることを意味する。特に、予測のために使われるアクティブな方向性信号の実際に利用可能な数は、それらアクティブな方向性信号のインデックス
Figure 2019133200
を含むデータ集合
Figure 2019133200
の要素の数
Figure 2019133200
によって与えられる。よって、
Figure 2019133200
ビットが、インデックス配列PredDirSigIdsの各要素、どの種類の符号化がより効率的かを符号化するために使用できる。デコーダでは、データ集合
Figure 2019133200
は既知であると想定される。よって、デコーダは、方向性信号のインデックスをデコードするために何ビット読む必要があるかを知っている。計算されるべきζCODのフレーム・インデックスおよび使用されるインデックス・データ集合
Figure 2019133200
は同一である必要があることを注意しておく。
既知のサイド情報符号化処理についての上記の修正A)ないしC)の結果、図6に描かれる例示的な符号化処理が得られる。
結果的に、符号化されたサイド情報は以下の成分からなる:
Figure 2019133200
注:上述したISO/IECの非特許文献1、たとえば6.1.3節では、QuantPredGainsはPredGainsと呼ばれているが、これは量子化された値を含む。
式(7)ないし(9)の例についての符号化された表現は次のようになる。
Figure 2019133200
必要とされるビット数は1+1+2+2・4+2+2・4+8・3=46である。
有利なことに、式(20)ないし(23)における現状技術の符号化された表現に比べ、本発明に従って符号化されたこの表現が必要とするのは8ビット少ない。
エンコーダ側でビット配列PredTypeを提供しないことも可能である。
〈空間的予測に関係した修正されたサイド情報符号化のデコード〉
空間的予測に関係した修正されたサイド情報のデコードが図7および図8に描かれる例示的なデコード処理にまとめられており(図8に描かれている処理は図7に描かれている処理の続きである)、以下で説明する。
最初に、ベクトルpTYPEならびに行列PINDおよびPQ,Fのすべての要素が0によって初期化される。次いで、ビットPSPredictionActiveが読まれる。これはそもそも空間的予測が実行されるかどうかを示す。空間的予測の場合(すなわち、PSPredictionActive=1)、ビットKindOfCodedPredIdsが読まれる。これは、予測が実行されるべき方向のインデックスの符号化の種類を示す。
KindOfCodedPredIds=0の場合、長さOのビット配列ActivePredが読まれる。この配列のq番目の要素は方向Ωqについて予測が実行されるか否かを示す。次の段階では、配列ActivePredから、予測の数NumActivePredが計算され、長さNumActivePredのビット配列PredTypeが読まれる。この配列の要素は、関連する各方向について実行されるべき予測の種類を示す。ActivePredおよびPredTypeに含まれる情報を用いて、ベクトルpTYPEの要素が計算される。
ビット配列PredTypeをエンコーダ側で提供せず、ビット配列ActivePredからベクトルpTYPEの要素を計算することも可能である。
KindOfCodedPredIds=1の場合、
Figure 2019133200
ビットを用いて符号化されると想定される、アクティブな予測の数NumActivePredが読まれる。ここで、MMは式(25)を満たす最大の整数である。次いで、NumActivePred個の要素からなるデータ配列PredIdsが読まれる。ここで、各要素は
Figure 2019133200
ビットによって符号化されると想定される。この配列の要素は、予測が実行される必要のある方向のインデックスである。相続いて、長さNumActivePredのビット配列PredTypeが読まれる。その要素は関連する各方向について実行されるべき予測の種類を示す。NumActivePred、PredIdsおよびPredTypeの知識を用いて、ベクトルpTYPEの要素が計算される。
ビット配列PredTypeをエンコーダ側で提供せず、数NumActivePredおよびデータ配列PredIdsからベクトルpTYPEの要素を計算することも可能である。
いずれの場合にも(すなわち、KindOfCodedPredIds=0およびKindOfCodedPredIds=1)、次の段階で、NumActivePred・DPRED個の要素からなる配列PredDirSigIdsが読まれる。各要素は
Figure 2019133200
ビットによって符号化されると想定される。
Figure 2019133200
に含まれる情報を使って、行列PINDの要素が設定され、PINDにおける0でない要素の数NumNonZeroIdsが計算される。
最後に、それぞれBSCビットによって符号化されるNumNonZeroIds個の要素からなる配列QuantPredGainsが読まれる。PINDおよびQuantPredGainsに含まれる情報を使って、行列PQ,Fの要素が設定される。
本発明の処理は、単一のプロセッサまたは電子回路によって、あるいは並列に動作するおよび/または本発明の処理の異なる部分に対して作用するいくつかのプロセッサまたは電子回路によって実行されることができる。
いくつかの態様を記載しておく。
〔態様1〕
HOA係数シーケンスの入力時間フレームをもつ、音場の高次アンビソニックス表現(HOA)を符号化するために必要とされるサイド情報の符号化を改善する方法であって、優勢な方向性信号および残差周囲HOA成分が決定され、前記優勢な方向性信号について予測が使われ、それにより、HOA係数の符号化されたフレームについて、前記予測を記述するサイド情報データ(ζ(k−2))を提供し、前記サイド情報データ(ζ(k−2))は:
・ある方向について予測が実行されるか否かを示すビット配列(ActivePred);
・実行されるべき予測について、使われるべき方向性信号のインデックスを表わす要素をもつデータ配列(PredDirSigIds);
・量子化されたスケーリング因子を表わす要素をもつデータ配列(QuantPredGains)、を含むことができ、
当該方法は:
・前記予測が実行されるべきか否かを示すビット値(PSPredictionActive)を提供し(19;34,384);
・実行されるべき予測がない場合、前記サイド情報データ(ζ(k−2))において前記ビット配列および前記データ配列を省略し;
・前記予測が実行されるべきである場合、ある方向について予測が実行されるか否かを示す前記ビット配列(ActivePred)の代わりに、アクティブな予測の数(NumActivePred)と、予測が実行されるべき方向のインデックスを含むデータ配列(PredIds)とが前記サイド情報データ(ζ(k−2))に含められるか否かを示すビット値(KindOfCodedPredIds)を提供する
ステップを含む、方法。
〔態様2〕
HOA係数シーケンスの入力時間フレームをもつ、音場の高次アンビソニックス表現(HOA)を符号化するために必要とされるサイド情報の符号化を改善する装置であって、優勢な方向性信号および残差周囲HOA成分が決定され、前記優勢な方向性信号について予測が使われ、それにより、HOA係数の符号化されたフレームについて、前記予測を記述するサイド情報データ(ζ(k−2))を提供し、前記サイド情報データ(ζ(k−2))は:
・ある方向について予測が実行されるか否かを示すビット配列(ActivePred);
・実行されるべき予測について、使われるべき方向性信号のインデックスを表わす要素をもつデータ配列(PredDirSigIds);
・量子化されたスケーリング因子を表わす要素をもつデータ配列(QuantPredGains)、を含むことができ、
当該装置は:
・前記予測が実行されるべきか否かを示すビット値(PSPredictionActive)を提供し;
・実行されるべき予測がない場合、前記サイド情報データ(ζ(k−2))において前記ビット配列および前記データ配列を省略し;
・前記予測が実行されるべきである場合、ある方向について予測が実行されるか否かを示す前記ビット配列(ActivePred)の代わりに、アクティブな予測の数(NumActivePred)と、予測が実行されるべき方向のインデックスを含むデータ配列(PredIds)とが前記サイド情報データ(ζ(k−2))に含められるか否かを示すビット値(KindOfCodedPredIds)を提供する
手段(19;34,384)を含む、装置。
〔態様3〕
前記HOA表現の前記符号化において、優勢な音源方向の推定(13)が実行され、検出された方向性信号のインデックスのデータ集合
Figure 2019133200
を提供する、態様1記載の方法または態様2記載の装置。
〔態様4〕
Dは前記HOA係数シーケンスの前記符号化において使用できる方向性信号の事前設定された最大数であり、実行されるべき予測について、使われるべき方向性信号のインデックスを表わす前記データ配列(PredDirSigIds)の各要素は
Figure 2019133200
ビットではなく
Figure 2019133200
ビットを使って符号化され、
Figure 2019133200
は検出された方向性信号のインデックスの前記データ集合の要素の数である、
態様3記載の方法または態様3記載の装置。
〔態様5〕
アクティブな予測の数NumActivePredと、予測が実行されるべき方向のインデックスを含む配列(PredIds)とが前記サイド情報データ(ζ(k−2))に含められることを示す前記ビット値(KindOfCodedPredIds)が、NumActivePred≦MMの場合にのみ提供され、ここで、MMは
Figure 2019133200
を満たす最大の整数であり、Nは前記HOA表現の次数である、態様1、3または4のうちいずれか一項記載の方法または態様2ないし4のうちいずれか一項記載の装置。
〔態様6〕
態様3記載の方法に従って符号化されたサイド情報データ(ζ(k−2))をデコードする方法であって、当該方法は:
・前記予測が実行されるか否かを示す前記ビット値(PSPredictionActive)を評価する段階(25)と;
・前記予測が実行されるべきである場合、
a)ある方向について予測が実行されるべきか否かを示す前記ビット配列(ActivePred)、または
b)アクティブな予測の前記数(NumActivePred)および予測が実行されるべき方向のインデックスを含む前記配列(PredIds)
のどちらが前記サイド情報データ(ζ(k−2))のデコードにおいて使用されるかを示す前記ビット値(KindOfCodedPredIds)を評価し(25)、a)の場合:
ある方向について予測が実行されるべきか否かを示す前記ビット配列(ActivePred)を評価し、その要素が対応する方向について予測が実行されるかどうかを示し;
前記ビット配列(ActivePred)からベクトル(pTYPE)の要素を計算し;
b)の場合:
アクティブな予測の前記数(NumActivePred)を評価し;
予測が実行されるべき方向のインデックスを含む前記データ配列(PredIds)を評価し;
前記数(NumActivePred)および前記データ配列(PredIds)からベクトル(pTYPE)の要素を計算する、段階と;
a)およびb)の場合における:
・実行されるべき予測について、使用されるべき方向性信号のインデックスを表わす要素をもつ前記データ配列(PredDirSigIds)を評価する段階と;
・前記ベクトル(pTYPE)、方向性信号のインデックスの前記データ集合
Figure 2019133200
および前記データ配列(PredDirSigIds)から、対応する方向性信号からある方向についての前記予測が実行されるインデックスを表わす行列(PIND)の要素および該行列における0でない要素の数を計算する段階と;
・前記予測において使用される量子化されたスケーリング因子を表わす要素をもつ前記データ配列(QuantPredGains)を評価する段階とを含む、
方法。
〔態様7〕
態様3記載の装置に従って符号化されたサイド情報データ(ζ(k−2))をデコードする装置であって、当該装置は:
・前記予測が実行されるか否かを示す前記ビット値(PSPredictionActive)を評価する段階(25)と;
・前記予測が実行されるべきである場合、
a)ある方向について予測が実行されるべきか否かを示す前記ビット配列(ActivePred)、または
b)アクティブな予測の前記数(NumActivePred)および予測が実行されるべき方向のインデックスを含む前記配列(PredIds)
のどちらが前記サイド情報データ(ζ(k−2))のデコードにおいて使用されるかを示す前記ビット値(KindOfCodedPredIds)を評価し(25)、a)の場合:
ある方向について予測が実行されるべきか否かを示す前記ビット配列(ActivePred)を評価し、その要素が対応する方向について予測が実行されるかどうかを示し;
前記ビット配列(ActivePred)からベクトル(pTYPE)の要素を計算し;
b)の場合:
アクティブな予測の前記数(NumActivePred)を評価し;
予測が実行されるべき方向のインデックスを含む前記データ配列(PredIds)を評価し;
前記数(NumActivePred)および前記データ配列(PredIds)からベクトル(pTYPE)の要素を計算する、段階と;
a)およびb)の場合における:
・実行されるべき予測について、使用されるべき方向性信号のインデックスを表わす要素をもつ前記データ配列(PredDirSigIds)を評価する段階と;
・前記ベクトル(pTYPE)、方向性信号のインデックスの前記データ集合
Figure 2019133200
および前記データ配列(PredDirSigIds)から、対応する方向性信号からある方向についての前記予測が実行されるインデックスを表わす行列(PIND)の要素および該行列における0でない要素の数を計算する段階と;
・前記予測において使用される量子化されたスケーリング因子を表わす要素をもつ前記データ配列(QuantPredGains)を評価する段階とを含む実行するプロセッサを含む、
装置。
〔態様8〕
実行されるべき予測について、使われるべき方向性信号のインデックスを表わし、
Figure 2019133200
ビットを使って符号化された前記データ配列(PredDirSigIds)の各要素が対応してデコードされ、
Figure 2019133200
は方向性信号のインデックスの前記データ集合の要素の数である、
態様6記載の方法または態様7記載の装置。
〔態様9〕
態様1記載の方法に従って符号化されているデジタル・オーディオ信号。
〔態様10〕
コンピュータで実行されたときに態様1記載の方法を実行する命令を含むコンピュータ・プログラム・プロダクト。

Claims (4)

  1. エンコードされたHOA表現を含むビットストリームをデコードする方法であって、当該方法は:
    ビットKindOfCodedPredIdsの値を評価する段階と;
    前記ビットKindOfCodedPredIdsの値に基づいて、第一の配列ActivePredを評価する段階であって、前記第一の配列ActivePredの各要素は、対応する方向について予測が実行されるかどうかを示す、段階と;
    前記第一の配列ActivePredの評価に基づいて、ベクトルptypeの要素を決定する段階と;
    第二の配列PredDirSigIdsを評価する段階であって、前記第二の配列PredDirSigIdsの要素はアクティブな予測について使用されるべき方向性信号のインデックスを表わす、段階と;
    前記ベクトルptypeおよび前記第二の配列PredDirSigIdsの要素に基づいて、対応する方向性信号からある方向についての予測が実行されるインデックスを表わす行列PINDの要素を決定する段階とを含む、
    方法。
  2. 前記第二の配列PredDirSigIdsの各要素が、実行されるべき予測について、使われるべき方向性信号のインデックスを表わし、各要素は
    Figure 2019133200
    個のビットに基づいて符号化されたものであり、対応してデコードされ、
    Figure 2019133200
    は方向性信号のインデックスの前記データ集合の要素の数である、
    請求項1記載の方法。
  3. エンコードされたHOA表現を含むビットストリームをデコードするための装置デコーダであって、当該方法装置は:
    ビットKindOfCodedPredIdsの値を評価する段階と;
    前記ビットKindOfCodedPredIdsの値に基づいて、第一の配列ActivePredを評価する段階であって、前記第一の配列ActivePredの各要素は、対応する方向について予測が実行されるかどうかを示す、段階と;
    前記第一の配列ActivePredの評価に基づいて、ベクトルptypeの要素を決定する段階と;
    第二の配列PredDirSigIdsを評価する段階であって、前記第二の配列PredDirSigIdsの要素はアクティブな予測について使用されるべき方向性信号のインデックスを表わす、段階と;
    前記ベクトルptypeおよび前記第二の配列PredDirSigIdsの要素に基づいて、対応する方向性信号からある方向についての予測が実行されるインデックスを表わす行列PINDの要素を決定する段階とを実行するよう構成されたプロセッサを有する、
    装置。
  4. プロセッサによって実行されたときに、エンコードされたHOA表現を含むビットストリームをデコードする方法を実行する命令を含んでいる非一時的なコンピュータ可読記憶媒体であって、前記方法は:
    ビットKindOfCodedPredIdsの値を評価する段階と;
    前記ビットKindOfCodedPredIdsの値に基づいて、第一の配列ActivePredを評価する段階であって、前記第一の配列ActivePredの各要素は、対応する方向について予測が実行されるかどうかを示す、段階と;
    前記第一の配列ActivePredの評価に基づいて、ベクトルptypeの要素を決定する段階と;
    第二の配列PredDirSigIdsを評価する段階であって、前記第二の配列PredDirSigIdsの要素はアクティブな予測について使用されるべき方向性信号のインデックスを表わす、段階と;
    前記ベクトルptypeおよび前記第二の配列PredDirSigIdsの要素に基づいて、対応する方向性信号からある方向についての予測が実行されるインデックスを表わす行列PINDの要素を決定する段階とを含む、
    記憶媒体。
JP2019092768A 2014-01-08 2019-05-16 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置 Active JP6848004B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP14305022.7 2014-01-08
EP14305022 2014-01-08
EP14305061 2014-01-16
EP14305061.5 2014-01-16

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016544628A Division JP6530412B2 (ja) 2014-01-08 2014-12-19 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021033172A Division JP7258063B2 (ja) 2014-01-08 2021-03-03 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置

Publications (2)

Publication Number Publication Date
JP2019133200A true JP2019133200A (ja) 2019-08-08
JP6848004B2 JP6848004B2 (ja) 2021-03-24

Family

ID=52134201

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2016544628A Active JP6530412B2 (ja) 2014-01-08 2014-12-19 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
JP2019092768A Active JP6848004B2 (ja) 2014-01-08 2019-05-16 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
JP2021033172A Active JP7258063B2 (ja) 2014-01-08 2021-03-03 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
JP2023061042A Pending JP2023076610A (ja) 2014-01-08 2023-04-04 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016544628A Active JP6530412B2 (ja) 2014-01-08 2014-12-19 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2021033172A Active JP7258063B2 (ja) 2014-01-08 2021-03-03 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
JP2023061042A Pending JP2023076610A (ja) 2014-01-08 2023-04-04 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置

Country Status (6)

Country Link
US (9) US9990934B2 (ja)
EP (3) EP3092641B1 (ja)
JP (4) JP6530412B2 (ja)
KR (3) KR20220085848A (ja)
CN (6) CN105981100B (ja)
WO (1) WO2015104166A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021075994A1 (en) 2019-10-16 2021-04-22 Saudi Arabian Oil Company Determination of elastic properties of a geological formation using machine learning applied to data acquired while drilling
US11796714B2 (en) 2020-12-10 2023-10-24 Saudi Arabian Oil Company Determination of mechanical properties of a geological formation using deep learning applied to data acquired while drilling

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015537256A (ja) * 2012-12-12 2015-12-24 トムソン ライセンシングThomson Licensing 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7680123B2 (en) * 2006-01-17 2010-03-16 Qualcomm Incorporated Mobile terminated packet data call setup without dormancy
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
EP2223230B1 (en) * 2007-11-16 2019-02-20 Sonic IP, Inc. Chunk header incorporating binary flags and correlated variable-length fields
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
KR101890229B1 (ko) * 2010-03-26 2018-08-21 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2451196A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP2637427A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2738762A1 (en) * 2012-11-30 2014-06-04 Aalto-Korkeakoulusäätiö Method for spatial filtering of at least one first sound signal, computer readable storage medium and spatial filtering system based on cross-pattern coherence

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015537256A (ja) * 2012-12-12 2015-12-24 トムソン ライセンシングThomson Licensing 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JOHANNES BOEHM, 外8名: "RM0-HOA Working Draft Text", ISO/IEC JTC1/SC29/WG11 MPEG2012/M31408, JPN5017000805, October 2013 (2013-10-01), pages 12, ISSN: 0004294865 *

Also Published As

Publication number Publication date
US9990934B2 (en) 2018-06-05
US20200126579A1 (en) 2020-04-23
CN118016077A (zh) 2024-05-10
JP2023076610A (ja) 2023-06-01
EP4089675A1 (en) 2022-11-16
US20240185872A1 (en) 2024-06-06
KR20210153751A (ko) 2021-12-17
US11869523B2 (en) 2024-01-09
KR102409796B1 (ko) 2022-06-22
US10147437B2 (en) 2018-12-04
US20190362731A1 (en) 2019-11-28
CN111028849A (zh) 2020-04-17
CN105981100B (zh) 2020-02-28
US20210027795A1 (en) 2021-01-28
US10714112B2 (en) 2020-07-14
US20190214033A1 (en) 2019-07-11
US20220115027A1 (en) 2022-04-14
CN111179951A (zh) 2020-05-19
US20180240469A1 (en) 2018-08-23
CN111028849B (zh) 2024-03-01
KR20160106692A (ko) 2016-09-12
CN111179955A (zh) 2020-05-19
US20160336021A1 (en) 2016-11-17
EP3648102B1 (en) 2022-06-01
US10424312B2 (en) 2019-09-24
EP3092641B1 (en) 2019-11-13
JP6530412B2 (ja) 2019-06-12
JP6848004B2 (ja) 2021-03-24
US20230108008A1 (en) 2023-04-06
US10553233B2 (en) 2020-02-04
JP7258063B2 (ja) 2023-04-14
CN111182443B (zh) 2021-10-22
CN105981100A (zh) 2016-09-28
US11211078B2 (en) 2021-12-28
WO2015104166A1 (en) 2015-07-16
CN111179955B (zh) 2024-04-09
CN111179951B (zh) 2024-03-01
JP2017508174A (ja) 2017-03-23
US11488614B2 (en) 2022-11-01
EP3092641A1 (en) 2016-11-16
CN111182443A (zh) 2020-05-19
JP2021081753A (ja) 2021-05-27
EP3648102A1 (en) 2020-05-06
KR20220085848A (ko) 2022-06-22
KR102338374B1 (ko) 2021-12-13

Similar Documents

Publication Publication Date Title
KR102672762B1 (ko) 고차 앰비소닉스 표현을 압축 및 압축해제하기 위한 방법 및 장치
JP2023076610A (ja) 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
JP6567571B2 (ja) 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する方法および装置
JP2021105741A (ja) 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置
CN118248156A (en) Decoding method and apparatus comprising a bitstream encoding an HOA representation, and medium
KR20240096662A (ko) 고차 앰비소닉스 표현을 압축 및 압축해제하기 위한 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190516

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200630

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210303

R150 Certificate of patent or registration of utility model

Ref document number: 6848004

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250