JP6205416B2 - ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置 - Google Patents

ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置 Download PDF

Info

Publication number
JP6205416B2
JP6205416B2 JP2015522077A JP2015522077A JP6205416B2 JP 6205416 B2 JP6205416 B2 JP 6205416B2 JP 2015522077 A JP2015522077 A JP 2015522077A JP 2015522077 A JP2015522077 A JP 2015522077A JP 6205416 B2 JP6205416 B2 JP 6205416B2
Authority
JP
Japan
Prior art keywords
dsht
channel
rotation
spatial
axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015522077A
Other languages
English (en)
Other versions
JP2015526759A5 (ja
JP2015526759A (ja
Inventor
ベーム,ヨーハネス
コルドン,スヴェン
クルーガー,アレクサンダー
ジャックス,ピーター
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2015526759A publication Critical patent/JP2015526759A/ja
Publication of JP2015526759A5 publication Critical patent/JP2015526759A5/ja
Application granted granted Critical
Publication of JP6205416B2 publication Critical patent/JP6205416B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、ノイズ削減のための多チャネル高次アンビソニックス・オーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネル高次アンビソニックス・オーディオ信号をデコードする方法および装置に関する。
高次アンビソニックス(HOA: Higher Order Ambisonics)は多チャネル音場表現であり(非特許文献4)、HOA信号は多チャネル・オーディオ信号である。ある種の多チャネル・オーディオ信号表現、特にHOA表現の特定のラウドスピーカー・セットアップでの再生は、特殊なレンダリングを要求する。かかるレンダリングは通例、マトリクス処理(matrixing)動作からなる。デコード後、アンビソニックス信号は「マトリクス処理される」、すなわち、たとえばラウドスピーカーの実際の空間位置に対応する新たなオーディオ信号にマッピングされる。通例、それら単独チャネル間には高い相互相関がある。
問題は、マトリクス処理動作後に符号化ノイズが増大することが経験されるということである。従来技術においてはその理由は知られていないようである。この効果は、知覚的符号化器による圧縮に先立ってたとえば離散球面調和関数変換(DSHT: Discrete Spherical Harmonics Transform)によってHOA信号が空間領域に変換されるときにも現われる。
高次アンビソニックス・オーディオ信号表現の圧縮のための通例の方法は、個々のアンビソニックス係数チャネルに独立した知覚的符号化器を適用するというものである(非特許文献7)。特に、知覚的符号化器は、個々の各単独チャネル信号内に現われる符号化ノイズ・マスキング効果を考慮するのみである。しかしながら、そのような効果は典型的には非線形である。そのような単独チャネルをマトリクス処理して新しい信号にする場合、ノイズのマスキング解除が起こる可能性が高い。この効果は、知覚的符号化器による圧縮に先立って離散球面調和関数変換によって高次アンビソニックス信号が空間領域に変換されるときにも現われる。
そのような多チャネル・オーディオ信号表現の伝送または記憶は通例、適切な多チャネル圧縮技法を要求する。通例、I個のデコードされた信号
Figure 0006205416
をマトリクス処理して最終的にJ個の新しい信号
Figure 0006205416
にする前に、チャネル独立な知覚的デコードが実行される。マトリクス処理という用語は、デコードされた信号
Figure 0006205416
を重み付けされた仕方で加算または混合することを意味する。すべての信号
Figure 0006205416
およびすべての新しい信号
Figure 0006205416
Figure 0006205416
のようにベクトルに配置すると、用語「マトリクス処理」は、新しい信号が数学的にはもとの信号から行列〔マトリクス〕演算
Figure 0006205416
を通じて得られるという事実に由来している。ここで、Aは混合重みから構成される混合行列を表わす。用語「混合」および「マトリクス処理」は本稿では同義に使われる。混合/マトリクス処理は、何らかの特定のラウドスピーカー・セットアップのためにオーディオ信号をレンダリングする目的のために使われる。マトリクスが依存する特定の個別的なラウドスピーカー・セットアップ、よってレンダリングの際にマトリクス処理のために使われる行列は、通例、知覚的符号化の段階では知られていない。
Peter Jax, Jan-Mark Batke, Johannes Boehm, and Sven Kordon. Perceptual coding of HOA signals in spatial domain. 欧州特許出願EP2469741A1 (PD100051)
T.D. Abhayapala. Generalized framework for spherical microphone arrays: Spatial and frequency decomposition. In Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), (受理) Vol.X, pp. , April 2008, Las Vegas, USA James R. Driscoll and Dennis M. Healy Jr. Computing fourier transforms and convolutions on the 2-sphere. Advances in Applied Mathematics, 15:202- 250, 1994 J¨org Fliege. Integration nodes for the sphere, http://www.personal.soton.ac.uk/jf1w07/nodes/nodes.html J¨org Fliege and Ulrike Maier. A two-stage approach for computing cubature formulae for the sphere. Technical Report, Fachbereich Mathematik, Universit¨at Dortmund, 1999 R. H. Hardin and N. J. A. Sloane. Webpage: Spherical designs, spherical t-designs, http://www2.research.att.com/~njas/sphdesigns R. H. Hardin and N. J. A. Sloane. Mclaren's improved snub cube and other new spherical designs in three dimensions. Discrete and Computational Geometry, 15:429-441 , 1996 Erik Hellerud, Ian Burnett, Audun Solvang, and U. Peter Svensson. Encoding higher order Ambisonics with AAC. In 124th AES Convention, Amsterdam, May 2008 Boaz Rafaely. Plane-wave decomposition of the sound field on a sphere by spherical convolution. J. Acoust. Soc. Am., 4(116):2149-2157, October 2004 Earl G. Williams. Fourier Acoustics, volume 93 of Applied Mathematical Sciences. Academic Press, 1999
本発明は、ノイズ削減を得るよう多チャネル高次アンビソニックス・オーディオ信号のエンコードおよび/またはデコードへの改善を提供する。特に、本発明は、3Dオーディオ・レート圧縮について符号化ノイズのマスキング解除を抑制するすべを提供する。
本発明は、(望まれない)ノイズ・マスキング解除効果を最小限にする適応的な離散球面調和関数変換(aDSHT: adaptive Discrete Spherical Harmonics Transform)のための技術を記述する。さらに、aDSHTが圧縮符号化器アーキテクチャ内にどのように統合できるかが記述される。記述される技術は、少なくともHOA信号について特に有利である。本発明の一つの利点は、伝送されるべきサイド情報の量が減らされるということである。原理的には、回転軸および回転角が伝送されるだけでよい。DSHTサンプリング格子は、伝送されるチャネル数によって間接的に伝達される。このサイド情報量は、相関行列の半分超が伝送される必要のあるカルーネン・レーベ変換(KLT)のような他のアプローチに比べて非常に少ない。
本発明のある実施形態によれば、ノイズ削減のための多チャネルHOAオーディオ信号のエンコード方法は、逆適応的DSHTを使ってそれらのチャネルを脱相関させる段階であって、前記逆適応的DSHTは回転演算および逆DSHT(iDSHT)を含み、前記回転演算は前記iDSHTの空間的サンプリング格子を回転させる、段階と、脱相関されたチャネルのそれぞれを知覚的にエンコードする段階と、回転情報をエンコードする段階であって、前記回転情報は前記回転演算を定義するパラメータを含む、段階と、知覚的にエンコードされたオーディオ・チャネルおよびエンコードされた回転情報を送信または記憶する段階とを含む。逆適応的DSHTを使ってチャネルを脱相関させる段階は、原理的には、空間的エンコード段階である。
本発明のある実施形態によれば、削減されたノイズをもつ符号化された多チャネルHOAオーディオ信号をデコードする方法は、エンコードされた多チャネルHOAオーディオ信号およびチャネル回転情報を受領する段階と、受領されたデータを圧縮解除する段階であって、知覚的デコードが使われる段階と、適応的DSHT(aDSHT)を使って各チャネルを空間的にデコードする段階と、知覚的および空間的にデコードされたチャネルを相関させる段階であって、前記回転情報に基づく前記aDSHTの空間的サンプリング格子の回転が実行される段階と、相関された、知覚的および空間的にデコードされたチャネルをマトリクス処理する段階とを含み、ラウドスピーカー位置にマッピングされる再生可能なオーディオ信号が得られる。
多チャネルHOAオーディオ信号をエンコードする装置が請求項11に開示される。多チャネルHOAオーディオ信号をデコードする装置が請求項12に開示される。
ある側面では、コンピュータ可読媒体が、コンピュータに、上記で開示した段階を含むエンコード方法を実行させるまたは上記で開示した段階を含むデコード方法を実行させる実行可能命令を有する。本発明の有利な実施形態は従属請求項、以下の記述および図面において開示される。
本発明の例示的な実施形態が付属の図面を参照して記述される。
M個の係数のブロックをレート圧縮する既知のエンコーダおよびデコーダを示す図である。 通常のDSHT(離散的球面調和関数変換)および通常の逆DSHTを使ってHOA信号を空間領域に変換する既知のエンコーダおよびデコーダを示す図である。 適応的DSHTおよび適応的逆DSHTを使ってHOA信号を空間領域に変換するエンコーダおよびデコーダを示す図である。 試験信号を示す図である。 エンコーダおよびデコーダの構成ブロックにおいて使われるコードブックのための球面サンプリング位置の例を示す図である。 信号適応的DSHT構成ブロック(pEおよびpD)を示す図である。 本発明の第一の実施形態を示す図である。 エンコード・プロセスおよびデコード・プロセスのフローチャートである。 本発明の第二の実施形態を示す図である。
図2は、逆DSHTを使ってHOA信号が空間領域に変換される既知のシステムを示している。信号はiDSHT 21を使った変換、レート圧縮E1/圧縮解除D1にかけられ、DSHT 24を使って係数領域に再変換される(S24)。それとは異なり、図3は本発明のある実施形態に基づくシステムを示している。既知の解決策のDSHT処理ブロックは、それぞれ逆適応的DSHTおよび適応的DSHTを制御する処理ブロック31、34によって置き換えられる。サイド情報SIがビットストリームbs内で伝送される。システムは、多チャネルHOAオーディオ信号をエンコードする装置および多チャネルHOAオーディオ信号をデコードする装置の要素を有する。
ある実施形態では、ノイズ削減のための多チャネルHOAオーディオ信号をエンコードする装置ENCは、逆適応的DSHT(iaDSHT)を使ってチャネルBを脱相関させる脱相関器31を含み、逆適応的DSHTは回転演算ユニット311および逆DSHT(iDSHT)310を含む。回転演算ユニットはiDSHTの空間的サンプリング格子を回転させる。脱相関器31は脱相関された(decorrelated)チャネルWsdと、回転情報を含むサイド情報SIとを与える。さらに、この装置は、脱相関されたチャネルWsdのそれぞれを知覚的にエンコードする知覚的エンコーダ32と、回転情報をエンコードするサイド情報エンコーダ321を含む。回転情報は、前記回転演算を定義するパラメータを含む。知覚的エンコーダ32は、知覚的にエンコードされたオーディオ・チャネルおよびエンコードされた回転情報を与え、こうしてデータ・レートを低下させる。最後に、このエンコード装置は、知覚的にエンコードされたオーディオ・チャネルおよびエンコードされた回転情報からビットストリームbsを生成し、該ビットストリームbsを送信または記憶するインターフェース手段320を有する。
削減されたノイズをもつ多チャネルHOAオーディオ信号をデコードする装置DECは、エンコードされた多チャネルHOAオーディオ信号およびチャネル回転情報を受領するインターフェース手段330と、受領されたデータを圧縮解除する圧縮解除モジュール33とを含む。圧縮解除モジュール33は各チャネルを知覚的にデコードするための知覚的デコーダを含む。圧縮解除モジュール33は復元された知覚的にデコードされたチャネルW'sdおよび復元されたサイド情報SI'を与える。さらに、このデコード装置は、適応的DSHT(aDSHT)を使って知覚的にデコードされたチャネルW'sdを相関させる相関器34であって、DSHTおよび前記回転情報に基づくDSHTの空間的サンプリング格子の回転が実行される相関器と、相関された知覚的にデコードされたチャネルをマトリクス処理する混合器MXであって、ラウドスピーカー位置にマッピングされた再生可能なオーディオ信号が得られる混合器とを含む。少なくとも前記aDSHTは相関器34内のDSHTユニット340において実行されることができる。ある実施形態では、空間的サンプリング格子の回転は格子回転ユニット341においてなされ、これは原理的にはもとのDSHTサンプリング点を再計算する。別の実施形態では、回転はDSHTユニット340内で実行される。
以下では、マスキング解除(unmasking)を定義し、記述する数学的モデルが与えられる。I個のチャネルからなる所与の離散時間多チャネル信号xi(m), i=1,…,Iを想定する。mは時間サンプル・インデックスを表わす。個々の信号は実数値でも複素数値でもよい。時間サンプル・インデックスmSTART+1に始まるM個のサンプルのフレームを考える。ここで、個々の信号は定常的であると想定される。対応するサンプルは、行列X∈CI×M内に
Figure 0006205416
に従って配置される。(・)Tは転置を表わす。対応する経験的相関行列は
ΣX:=XXH (3)
によって与えられる。(・)Hは合同的な複素共役および転置を表わす。
ここで、上記多チャネル信号フレームが符号化され、それにより再構成時に符号化誤差ノイズを導入するとする。こうして、^付きのXで表わされる再構成されるフレーム・サンプルの行列は、真のサンプル行列Xおよび符号化ノイズ成分Eから
Figure 0006205416
のように構成される。
各チャネルは独立に符号化されていると想定されるので、符号化ノイズ信号ei(m)はi=1,…,Iについて互いに独立であると想定できる。この性質およびノイズ信号の平均が0であるという想定を利用すると、ノイズ信号の経験的な相関行列は
Figure 0006205416
として対角行列によって与えられる。この右辺は、対角線上に経験的なノイズ信号パワー
Figure 0006205416
をもつ対角行列を表わす。さらなる本質的な想定は、符号化が、各チャネルについてあらかじめ定義された信号対雑音比(SNR)が満たされるように実行されるということである。一般性を失うことなく、該あらかじめ定義されたSNRは各チャネルについて等しい、すなわち
Figure 0006205416
と想定する。
これから、再構成された信号をJ個の新しい信号yj(m), j=1,…,Jにするマトリクス処理を考える。いかなる符号化誤差の導入もなければ、マトリクス処理された信号のサンプル行列は
Y=AX (11)
によって表現されてもよい。ここで、A∈CJ×Iは混合行列を表わし、
Figure 0006205416
である。しかしながら、符号化ノイズのため、マトリクス処理された信号のサンプル行列は
Figure 0006205416
によって与えられる。ここで、Nはマトリクス処理されたノイズ信号のサンプルを含む行列である。それは次のように表現できる。
Figure 0006205416
ここで、
Figure 0006205416
は時間サンプル・インデックスmにおけるすべてのマトリクス処理されたノイズ信号のベクトルである。
式(11)を利用すると、マトリクス処理されたノイズのない信号の経験的相関行列は次のように定式化できる。
Figure 0006205416
よって、ΣYの対角線上のj番目の要素である、j番目のマトリクス処理されたノイズのない信号の経験的パワーは次のように書ける。
Figure 0006205416
ここで、aj
Figure 0006205416
のようなAHのj番目の列である。
同様に、式(15)により、マトリクス処理されたノイズ信号の経験的相関行列は次のように書ける。
Figure 0006205416
ΣNの対角線上のj番目の要素である、j番目のマトリクス処理されたノイズ信号の経験的パワーは次式によって与えられる。
Figure 0006205416
従って、
Figure 0006205416
によって定義されるマトリクス処理された信号の経験的SNRは、式(19)および(22)を使って、次のように定式化し直すことができる。
Figure 0006205416
ΣX
Figure 0006205416
のように対角成分と非対角成分に分解し、想定(7)および(9)から得られる性質
Figure 0006205416
を利用することによって、すべてのチャネルにわたって一定のSNR(SNRx)に関し、最終的に、マトリクス処理された信号の経験的SNRについての所望される表現が得られる。
Figure 0006205416
この式から、このSNRが、あらかじめ定義されたSNRであるSNRxから、信号相関行列ΣXの対角および非対角成分に依存する項の乗算によって得られることが見て取れる。特に、マトリクス処理された信号の経験的SNRは、信号xi(m)が互いに相関しておらずΣX,NGが零行列になる場合には、あらかじめ定義されたSNRに等しくなる。すなわち、
Figure 0006205416
ここで、0I×IはI行I列の零行列を表わす。すなわち、xi(m)が相関している場合には、マトリクス処理された信号の経験的SNRはあらかじめ定義されたSNRから逸脱することがある。最悪の場合には、SNRyjはSNRxよりずっと低くなることがある。この現象は、本稿では、マトリクス処理におけるノイズ・マスキング解除(noise unmasking)と呼ばれる。
以下のセクションは、高次アンビソニックス(HOA)の簡単な紹介を与え、処理(データ・レート圧縮)されるべき信号を定義する。
高次アンビソニックス(HOA)は、音源がないと想定されるコンパクトな関心領域内の音場の記述に基づく。その場合、時刻tおよび関心領域内の(球面座標での)位置x=[r,θ,φ]Tにおける音圧p(t,x)の空間時間的振る舞いは、斉次波動方程式(homogeneous wave equation)によって物理的には完全に決定される。ωが角周波数を表わすとして、時間に関する音圧のフーリエ変換、すなわち
Figure 0006205416
は、
Figure 0006205416
のように球面調和関数(SH)の級数に展開されうる(非特許文献9)。
式(32)において、csは音速を表わし、k=ω/csは角波数を表わす。さらに、jn(・)は第一種のn次球面ベッセル関数を示し、Yn m(・)は次数(order)nおよび陪数(degree)mの球面調和関数(SH)を表わす。
音場についての完全な情報は、実際には音場係数An m(k)内に含まれる。
SHは一般には複素数値の関数であることを注意しておくべきである。しかしながら、その近似的な線形結合により、実数値の関数を得て、上記展開をこれらの関数に関して実行することが可能である。
式(32)における圧力音場(sound field)記述に関係して、源場(source field)が次のように定義できる。
Figure 0006205416
ここで、源場または振幅密度(非特許文献8)D(kcs,Ω)は角波数および角方向Ω=[θ,φ]Tに依存する。源場は遠距離場/近距離場、離散/連続源からなることができる(非特許文献1)。源場係数Bn mは音場係数An mと次式によって関係付けられる(非特許文献1)。
Figure 0006205416
((exp[−ikr]に関係する)はいってくる波について正の周波数および第二種の球面ハンケル関数hn (2)を使う。)ここで、hn (2)は第二種の球面ハンケル関数であり、rsは原点からの源の距離である。
HOA領域の信号は、周波数領域または時間領域において、音場または源場の逆フーリエ変換として表現できる。以下の記述では、有限数の源場係数の時間領域表現
Figure 0006205416
の使用を想定する。(33)における無限級数はn=Nにおいて打ち切られる。打ち切りは、空間的な帯域幅制限に対応する。係数(またはHOAチャネル)の数は
3Dについては O3D=(N+1)2 (36)
によって、2Dのみの記述についてはO2D=2N+1によって与えられる。係数bn mはラウドスピーカーによるのちの再生のためにある時間サンプルmのオーディオ情報を含む。これらは記憶または送信されることができ、よってデータ・レート圧縮の対象である。
単独の時間サンプルmの係数はO3D個の要素をもつベクトルb(m)
Figure 0006205416
によって表現でき、M個の時間サンプルのブロックは行列B
Figure 0006205416
によって表現できる。
音場の二次元表現は、円調和関数を用いた展開によって導出できる。これは、上記で呈示した一般的な記述において、固定した傾斜角θ=π/2、係数の異なる重みおよびO2D個の係数に縮小された集合(m=±n)を使った特殊な場合と見ることができる。よって、以下の考察はみな2D表現にも当てはまる。その場合、球という用語は円という用語によって置き換える必要がある。
以下では、HOA係数領域から空間的なチャネル・ベースの領域へのまたその逆の変換を記述する。式(33)は、単位球上のl離散的な空間サンプル位置Ωl=[θll]Tについて、時間領域HOA係数を使って書き換えることができる。
Figure 0006205416
Lsd=(N+1)2個の球面サンプル位置Ωlを想定すると、これはHOAデータ・ブロックBについてのベクトル記法で書き換えることができる。
Figure 0006205416
ここで、
Figure 0006205416
はLsd多チャネル信号の単一の時間サンプルを表わし、行列
Figure 0006205416
はベクトル
Figure 0006205416
をもつ。球面サンプル位置が非常に規則的に選択される場合には、
Figure 0006205416
となる行列Ψiが存在する。ここでIはO3D×O3Dの恒等行列である。すると、式(36)に対応する変換は、
Figure 0006205416
によって定義できる。
式(38)はLsd個の球面信号を係数領域に変換し、前方変換
B=DSHT{W} (39)
として書き換えられる。ここで、DSHT{ }は離散球面調和関数変換を表わす。対応する逆変換はO3D個の係数信号を空間領域に変換してLsd個のチャネル・ベースの信号を形成し、式(36)は
W=iDSHT{B} (40)
となる。
離散球面調和関数変換のこの定義は、本稿でのHOAデータのデータ・レート圧縮に関する考察のためには十分である。与えられた係数Bから出発して、B=DSHT{iDSHT{B}}となる場合のみに関心があるからである。離散球面調和関数変換のより厳密な定義は非特許文献2で与えられている。DSHTのための好適な球面サンプル位置およびそのような位置を導出するための手続きは、非特許文献3、4、6、5において概観できる。サンプリング格子の例は図5に示されている。
具体的には、図5は、エンコーダおよびデコーダ構成ブロックpE、pDにおいて使われるコードブックのための球面サンプリング位置の例を示している。すなわち、図5のa)はLsd=4についてであり、図5のb)はLsd=9についてであり、図5のc)はLsd=16についてであり、図5のd)はLsd=25についてである。
以下では、高次アンビソニックス係数データのレート圧縮およびノイズ・マスキング解除が記述される。まず、いくつかの性質をハイライトするために、以下で使われる試験信号が定義される。
方向Ωs1に位置する単一の遠距離場源は、M個の離散的な時間サンプルのベクトルg=[g(m),…,g(M)]Tによって表現され、式(38)と類似の行列Bgおよび方向Ωs1=[θs1s1]Tにおいて評価される共役複素球面調和関数(実数値のSHが使われるならば共役は何の影響もない)からなるエンコード・ベクトル
Figure 0006205416
を用いたエンコード
Figure 0006205416
によってHOA係数のブロックによって表現できる。試験信号Bgは、HOA信号の最も単純な場合と見ることができる。より複雑な信号は、そのような信号の多数の重ね合わせからなる。
HOAチャネルの直接的な圧縮に関し、以下では、HOA係数チャネルが圧縮されるときになぜノイズ・マスキング解除が生じるかを示す。HOAデータの実際のブロックBのO3D個の係数チャネルの直接的な圧縮および圧縮解除は、式(4)と類似の符号化ノイズEを導入する。
Figure 0006205416
式(9)のような一定のSNRBgを想定する。スピーカーでこの信号を再生するには、信号がレンダリングされる必要がある。このプロセスは
Figure 0006205416
によって記述される。ここで
Figure 0006205416
はデコード行列(AH=[a1,…,aL])であり、行列
Figure 0006205416
はL個のスピーカー信号のM個の時間サンプルを保持する。これは(14)と類似である。上記のすべての考察を適用すると、スピーカー・チャネルlのSNRは(式(29)と類似の)
Figure 0006205416
によって記述できる。ここで、σ2 Bo
Figure 0006205416
のo番目の対角要素であり、ΣB,NGはその非対角要素を保持する。
任意のスピーカー・レイアウトをデコードできるべきであるからデコード行列Aは影響されるべきではないので、行列ΣBは対角になってSNRwl=SNRBgとなる必要がある。式(45)および(49)を用い(B=Bg)、一定のスカラー値c=gTgを用いて、ΣB=ygHgyH=cyyHは非対角になる。SNRBgに比べると、スピーカー・チャネルにおける信号対雑音比SNRwlは低下する。しかし、源信号gもスピーカー・レイアウトも通例、エンコード段では知られていないので、係数チャネルの直接的な不可逆圧縮は、特に低データ・レートについては、制御できないマスキング解除効果につながることがある。
以下は、HOA係数がDSHTを使ったあとに空間領域において圧縮されるときになぜノイズ・マスキング解除が生じるかを記述する。
HOA係数データBの現在ブロックは、式(36)に与えられるような球面調和関数変換を使って圧縮の前に空間領域に変換される:
Figure 0006205416
ここで、逆変換行列ΨiはLSd≧O3D個の空間的サンプル位置および空間的信号行列WSH∈CLSd×Mに関係している。これが圧縮および圧縮解除にかけられ、式(5)のような符号化ノイズ成分Eを用いて量子化ノイズが加えられる(式(4)と同様):
Figure 0006205416
ここでもまた、すべての空間チャネルについて一定であるSNR、SNRSdを想定する。信号は、ΨfΨi=Iという性質(41)をもつ変換行列Ψfを使って係数領域に変換される(式(42))。係数の新しいブロックは次のようになる:
Figure 0006205416
これらの信号は、デコード行列ADを適用することによって、L個のスピーカー信号^W∈CL×Mにレンダリングされる:
Figure 0006205416
これは(52)およびA=ADΨfを使って、次のように書き直せる。
Figure 0006205416
ここで、AはA∈CL×LSdの混合行列である。式(53)は式(14)と類似であることが見て取れるはずである。ここでもまた、上記のすべての考察を適用すると、スピーカー・チャネルlのSNRは(式(29)と類似の)
Figure 0006205416
によって記述できる。ここで、σ2 Sdlはl番目の対角要素であり、ΣWSd,NG
Figure 0006205416
の非対角要素をを保持する。
(任意のスピーカー・レイアウトにレンダリングできるべきであるから)ADに影響するすべはなく、よってAに対していかなる影響をもつすべもないので、所望されるSNRを保つためにΣWSdは対角になる必要がある。式(45)からの簡単な試験信号を使うと(B=Bg)、一定のc=gTgを用いて、
Figure 0006205416
となる。固定した球面調和関数変換(Ψi、Ψf固定)を使うと、ΣWSdが対角になれるのは非常にまれな場合のみであり、さらに悪いことに、上記のように、項
Figure 0006205416
は係数信号の空間的性質に依存する。こうして、球面領域におけるHOA係数の低レートの不可逆圧縮は、SNRの低下および制御できないマスキング解除効果につながることがある。
本発明の基本的発想は、適応的DSHT(aDSHT)を使うことによってノイズ・マスキング解除効果を最小化するということである。適応的DSHTは、HOA入力信号の空間的性質に関係したDSHTの空間的サンプリング格子の回転およびDSHT自身からなる。
HOA係数の数O3Dに一致する球位置の数LSdをもつ信号適応的なDSHT(aDSHT)について下記で述べる。まず、通常の非適応的DSHTにおけるようなデフォルトの球状サンプル格子が選択される。M個の時間サンプルのブロックについて、球状サンプル格子は、項
Figure 0006205416
の対数が最小化されるよう回転される。ここで、|ΣWSdl,j|は、ΣWSdの(行列の行インデックスlおよび列インデックスjをもつ)要素の絶対値であり、σ2 SdlはΣWSdの対角要素である。これは、式(54)の項
Figure 0006205416
を最小化することに等しい。
視覚化すると、このプロセスは、図4に示されるような、ある単一の空間的サンプル位置が最も強い源方向に一致するようにする、DSHTの球状サンプリング格子の回転に対応する。式(45)からの簡単な試験信号を使うと(B=Bg)、式(55)の項WSdが、一つを除いてすべての要素が0に近い、ベクトル∈CLSd×1となることが示せる。よって、ΣWSdはほぼ対角になり、所望されるSNR、SNRSdが保てる。
図4は、空間領域に変換された試験信号Bgを示している。図4のa)では、デフォルトのサンプリング格子が使われており、図4のb)では、aDSHTの回転された格子が使われている。空間的チャネルの関係するΣWSd値(dB単位)は、対応するサンプル位置のまわりのボロノイ・セルの色/グレー変動によって示される。この空間的構造の各セルはサンプリング点を表わし、セルの明るさ/暗さは信号強さを表わす。図4のb)において見て取れるように、最も強い源方向がみつかっており、サンプリング格子は、面の一つ(すなわち、単一の空間的サンプル位置)が最も強い源方向に一致するよう回転されている。この面は白で描かれている(強い源方向に対応)。一方、他の面は暗くなっている(低い源方向に対応)。図4のa)、すなわち回転前には、どの面も最も強い源方向に一致しておらず、いくつかの面が多少なりとも灰色になっている。これは、かなりの(だが最大でない)強度のオーディオ信号がそれぞれのサンプリング点において受領されることを意味する。
以下は、圧縮エンコーダおよびデコーダ内で使用されるaDSHTの主要な構成ブロックを記述する。
エンコーダおよびデコーダ処理構成ブロックpEおよびpDの詳細が図6に示されている。両方のブロックは、DSHTのための基礎である球状サンプリング点格子の同じコードブックを所有する。初期には、係数の数O3Dは、共通のコードブックに従って、LSd=O3D個の位置をもつ、モジュールpE内の基礎格子を選択する。LSdは、図3において示されるのと同じ基礎サンプリング位置格子を選択する初期化のために、ブロックpDに送信される必要がある。基礎サンプリング格子は、行列
Figure 0006205416
によって記述される。ここで、Ωl=[θll]Tは単位球上の位置を定義する。上記のように、図5は基礎格子の例を示す。
回転発見ブロック(構成ブロック「最良回転を発見」)320への入力は係数行列Bである。構成ブロックは、式(57)の値が最小化されるよう、基礎サンプリング格子を回転させることを受け持つ。回転は、「軸‐角」表現によって表現され、この回転に関係した圧縮された軸ψrotおよび回転角φrotがこの構成ブロックにサイド情報SIとして出力される。回転軸ψrotは原点から単位球上のある位置への単位ベクトルによって記述できる。球座標では、これは二つの角ψrot=[θaxisaxis]Tによって明示できる。暗黙的な関係する半径1は送信される必要はない。三つの角度θaxisaxisrotは量子化され、エントロピー符号化される。特別なエスケープ・パターンが、サイド情報SIを生成するための前に使用された値の再使用を合図する。
構成ブロック「Ψiを構築」330は回転軸および角を
Figure 0006205416
にデコードし、この回転を基礎サンプリング格子DDSHTに適用して回転された格子
Figure 0006205416
を導出する。これは、iDSHT行列
Figure 0006205416
を出力する。これはベクトル
Figure 0006205416
から導出される。
構成ブロック「iDSHT」310では、HOA係数データの実際のブロックBが、WSd=ΨiBによって、空間領域に変換される。
デコード処理ブロックpDの構成ブロック「Ψfを構築」350は回転軸および角を受領し、
Figure 0006205416
にデコードし、この回転を基礎サンプリング格子DDSHTに適用して回転された格子
Figure 0006205416
を導出する。iDSHT行列
Figure 0006205416
はベクトル
Figure 0006205416
を用いて導出され、DSHT行列Ψf=Ψi -1がデコード側で計算される。
デコーダ処理ブロック34内の構成ブロック「DSHT」340では、空間領域データの実際のブロック
Figure 0006205416
が再び係数領域データのブロック
Figure 0006205416
に変換される。
以下では、圧縮コーデックの全体的なアーキテクチャを含むさまざまな有利な実施形態が記述される。第一の実施形態は、単一のaDSHTを利用する。第二の実施形態は、諸スペクトル帯域において複数のaDSHTを利用する。
第一の(「基本的」)実施形態は図7に示されている。O3D個の係数チャネルの、インデックスmをもつHOA時間サンプルb(m)〔ベクトル〕はまずバッファ71に記憶されて、M個のサンプルおよび時間インデックスμのブロックをなす。B(μ)は、上記のように、構成ブロックpE 72において、適応的iDSHTを使って空間領域に変換される。空間信号ブロックWSd(μ)は、AACまたはmp3エンコーダのようなLSd個のオーディオ圧縮モノ・エンコーダ73または単一のAAC多チャネル・エンコーダ(LSd個のチャネル)に入力される。ビットストリームS73は、複数のエンコーダ・ビットストリーム・フレームの統合されたサイド情報SIとの多重化されたフレームまたはサイド情報SIが好ましくは補助データとして統合されている単一の多チャネル・ビットストリームからなる。
それぞれの圧縮デコーダ構成ブロックは、ある実施形態では、ビットストリームS73をLSd個のビットストリームおよびサイド情報SIに多重分離してそれらのビットストリームをLSd個のモノ・デコーダに供給し、それらのビットストリームをLSd個の空間的オーディオ・チャネルにデコードしてM個のサンプルでブロック
Figure 0006205416
を形成し、該^WSd(μ)およびSIをpDに供給するデマルチプレクサD1を有している。ビットストリームが多重化されない別の実施形態では、圧縮デコーダ構成ブロックはビットストリームを受領し、それをLSd多チャネル信号
Figure 0006205416
にデコードし、SIをパッキング解除し、該^WSd(μ)およびSIをpDに供給する受領器74を有する。
^WSd(μ)はデコーダ処理ブロックpD 75においてSIとともに適応的DSHTを使って係数領域に変換されて、HOA信号のブロックB(μ)を形成する。これらの信号はバッファ76に記憶され、のちにフレーム解除されて係数の時間信号b(m)を形成する。
上記の第一の実施形態は、ある種の条件のもとで、二つの欠点をもつことがある。第一に、空間的な信号分布の変化のため、前のブロックからの(すなわち、ブロックμからμ+1への)ブロッキング・アーチファクトがあることがある。第二に、同時に二つ以上の強い信号があることがあり、aDSHTの脱相関効果が非常に小さくなる。
いずれの欠点も、周波数領域で動作する第二の実施形態において対処される。aDSHTは、複数の周波数帯域データを組み合わせるスケール因子帯域データに適用される。ブロッキング・アーチファクトは、重複加算(OLA: Overlay Add)をもつ時間から周波数への変換(TFT: Time to Frequency Transform)処理の重なり合うブロックによって回避される。J個のスペクトル帯域内で本発明を使うことによって、SIjを送信するためのデータ・レートにおけるオーバーヘッド増大を代償として、改善された信号脱相関が達成できる。
図9に示されるようなこの第二の実施形態のいくつかのさらなる詳細について以下で述べる。信号の各係数チャネルb(m)が時間から周波数への変換(TFT)912にかけられる。広く使われるTFTの例は修正コサイン変換(MDCT)である。TFTフレーム化ユニット911では、50%重複するデータ・ブロック(ブロック・インデックスμ)が構築される。TFTブロック変換ユニット912はブロック変換を実行する。スペクトル帯域化(Spectral Banding)ユニット913では、TFT周波数帯域が組み合わされてJ個の新しいスペクトル帯域および関係した信号
Figure 0006205416
を形成する。ここで、KJは帯域jにおける周波数係数の数を表わす。これらのスペクトル帯域は複数の処理ブロック914において処理される。これらのスペクトル帯域のそれぞれについて、信号
Figure 0006205416
およびサイド情報SIjを生成する一つの処理ブロックpEjがある。これらのスペクトル帯域は、不可逆オーディオ圧縮法のスペクトル帯域(AAC/mp3スケール因子帯域のような)に一致してもよいし、あるいはより粗い粒度を有していてもよい。後者の場合、「TFTなしのチャネル独立な不可逆オーディオ圧縮」915が帯域化を再配置する必要がある。処理ブロック914は、各オーディオ・チャネルに一定のビット・レートを割り当てる、周波数領域におけるLSd多チャネル・オーディオ・エンコーダのように振る舞う。ビットストリームは、ビットストリーム・パッキング・ブロック916においてフォーマットされる。
デコーダは、上記ビットストリーム(少なくともその一部)を受領または記憶し、それをパッキング解除し(921)、オーディオ・データを多チャネル・オーディオ・デコーダ922に「TFTなしのチャネル独立なオーディオ・デコード」のために、サイド情報SIjを複数のデコード処理ブロックpDj 923に供給する。「TFTなしのチャネル独立なオーディオ・デコード」のためのオーディオ・デコーダ922はオーディオ情報をデコードし、J個のスペクトル帯域信号
Figure 0006205416
をデコード処理ブロックpDj 923への入力としてフォーマットする。デコード処理ブロック923において、これらの信号はHOA係数領域に変換されて
Figure 0006205416
を形成する。スペクトル帯域化解除(debanding)ブロック924では、J個のスペクトル帯域はTFTの帯域化に一致するよう再グループ化され、ブロックが重なり合う重複加算(OLA)処理を使うiTFT&OLAブロック925において時間領域に変換される。最後に、iTFT&OLAブロック925の出力はTFTフレーム解除ブロック926においてフレーム解除され、信号
Figure 0006205416
を生成する。
本発明は、チャネル間の相互相関からSNRの増大が帰結するという知見に基づく。知覚的符号化器は、個々の各単独チャネル信号内に生じる符号化ノイズ・マスキング効果を考えるだけである。しかしながら、そのような効果は典型的には非線形である。そこで、そのような複数の単独チャネルをマトリクス処理して新しい信号にするときに、ノイズ・マスキング解除が起こる可能性が高い。これが、マトリクス処理動作後に通常、符号化ノイズが増大する理由である。
本発明は、望まれないノイズ・マスキング解除効果を最小にする適応的な離散球面調和関数変換によるチャネルの脱相関を提案する。aDSHTは、圧縮符号化器および復号器アーキテクチャ内に統合される。これは、DSHTの空間的サンプリング格子を、HOA入力信号の空間的性質に合わせて調整する回転動作を含むので、適応的である。aDSHTは、適応的な回転および実際の、通常のDSHTを含む。実際のDSHTは、従来技術において記載されるように構築できる行列である。適応的な回転はその行列に適用され、それがチャネル間相関の最小化に、よってマトリクス処理後のSNR増大の最小化につながる。回転軸および角は、解析的にではなく、自動化された探索動作によって見出される。デコード後、逆適応的DSHT(iaDSHT)が使われるマトリクス処理をする前に再相関を可能にするために、回転軸および角は、エンコードされ、伝送される。
ある実施形態では、時間から周波数への変換(TFT)およびスペクトル帯域化が実行され、aDSHT/iaDSHTは各スペクトル帯域に独立して適用される。
図8のa)は、本発明のある実施形態における、ノイズ削減のための多チャネルHOAオーディオ信号をエンコードする方法のフローチャートを示している。図8のb)は、本発明のある実施形態における、ノイズ削減のための多チャネルHOAオーディオ信号をデコードする方法のフローチャートを示している。
図8のa)に示した実施形態では、ノイズ削減のための多チャネルHOAオーディオ信号をエンコードする方法は、逆適応的DSHTを使ってそれらのチャネルを脱相関81させる段階であって、前記逆適応的DSHTは回転演算および逆DSHT812を含み、前記回転演算は前記iDSHTの空間的サンプリング格子を回転811させる、段階と、脱相関されたチャネルのそれぞれを知覚的にエンコード82する段階と、回転情報を(サイド情報SIとして)エンコード83する段階であって、前記回転情報は前記回転演算を定義するパラメータを含む、段階と、知覚的にエンコードされたオーディオ・チャネルおよびエンコードされた回転情報を送信または記憶する84段階とを含む。
ある実施形態では、逆適応的DSHTは、初期のデフォルト球状サンプル格子を選択する段階と、最も強い源方向を決定する段階と、M個の時間サンプルのブロックについて、ある単一の空間的サンプル位置が前記最も強い源方向に一致するよう前記球状サンプル格子を回転させる段階とを含む。
ある実施形態では、前記球状サンプル格子は、項
Figure 0006205416
の対数が最小化されるよう回転され、ここで、|ΣWSdl,j|は、ΣWSdの(行列の行インデックスlおよび列インデックスjをもつ)要素の絶対値であり、σ2 SdlはΣWSdの対角要素であり、
Figure 0006205416
であり、WSdはオーディオ・チャネル数かけるブロック処理サンプル数の行列であり、WSdは前記aDSHTの結果である。
図8のb)に示される実施形態では、削減されたノイズをもつ符号化された多チャネルHOAオーディオ信号をデコードする方法は、エンコードされた多チャネルHOAオーディオ信号および(サイド情報SI内の)チャネル回転情報を受領85する段階と、受領されたデータを圧縮解除86する段階であって、知覚的デコードが使われる段階と、適応的DSHTを使って各チャネルを空間的にデコード87する段階であって、DSHT 872と、前記回転情報に基づく前記DSHTの空間的サンプリング格子の回転871とが実行され、知覚的デコードされたチャネルが再相関される、段階と、再相関された、知覚的デコードされたチャネルをマトリクス処理88する段階であって、ラウドスピーカー位置にマッピングされる再生可能なオーディオ信号が得られる段階とを含む。
ある実施形態では、適応的DSHTは、該適応的DSHTのための初期のデフォルト球状サンプル格子を選択する段階と、M個の時間サンプルのブロックについて、前記回転情報に従って前記球状サンプル格子を回転させる段階とを含む。
ある実施形態では、前記回転情報は三つの成分をもつ空間的ベクトル
Figure 0006205416
である。回転軸ψrotは単位ベクトルによって記述できることを注意しておく。
ある実施形態では、前記回転情報は三つの角度θaxisaxisrotから構成されるベクトルである。ここで、θaxis、φaxisは、球座標における、暗黙的な半径を1として回転軸についての情報を定義し、φrotはこの軸のまわりの回転角を定義する。
ある実施形態では、これらの角度は量子化され、エントロピー符号化され、あるエスケープ・パターン(すなわち専用のビット・パターン)が、サイド情報(SI)を生成するための前の値の再使用を合図する(すなわち、示す)。
ある実施形態では、ノイズ削減のための多チャネルHOAオーディオ信号をエンコードする装置は、逆適応的DSHTを使ってそれらのチャネルを脱相関させる脱相関器であって、前記逆適応的DSHTは回転演算および逆DSHT(iDSHT)を含み、前記回転演算は前記iDSHTの空間的サンプリング格子を回転させる、脱相関器と;脱相関されたチャネルのそれぞれを知覚的にエンコードする知覚的エンコーダと、回転情報をエンコードするサイド情報エンコーダであって、前記回転情報は前記回転演算を定義するパラメータを含む、サイド情報エンコーダと;知覚的にエンコードされたオーディオ・チャネルおよびエンコードされた回転情報を送信または記憶するインターフェースとを有する。
ある実施形態では、削減されたノイズをもつ多チャネルHOAオーディオ信号をデコードする装置は、エンコードされた多チャネルHOAオーディオ信号およびチャネル回転情報を受領するインターフェース手段330と、各チャネルを知覚的にデコードする知覚的デコーダを使うことによって、受領されたデータを圧縮解除する圧縮解除モジュール33と、知覚的にデコードされたチャネルを再相関させる相関器34であって、DSHTと、前記回転情報に基づく前記DSHTの空間的サンプリング格子の回転とが実行される、相関器と、相関された、知覚的デコードされたチャネルをマトリクス処理する混合器であって、ラウドスピーカー位置にマッピングされる再生可能なオーディオ信号が得られる混合器とを有する。原理的には、相関器34は空間的デコーダとしてはたらく。
ある実施形態では、削減されたノイズをもつ多チャネルHOAオーディオ信号をデコードする装置は、エンコードされた多チャネルHOAオーディオ信号およびチャネル回転情報を受領するインターフェース手段330と;各チャネルを知覚的にデコードする知覚的デコーダを用いて受領されたデータを圧縮解除する圧縮解除モジュール33と;知覚的にデコードされたチャネルをaDSHTを使って相関させる相関器34であって、DSHTと、前記回転情報に基づく前記DSHTの空間的サンプリング格子の回転とが実行される、相関器と;相関された、知覚的デコードされたチャネルをマトリクス処理する混合器MXであって、ラウドスピーカー位置にマッピングされる再生可能なオーディオ信号が得られる混合器とを有する。
ある実施形態では、前記デコードする装置における前記適応的DSHTは、該適応的DSHTのための初期のデフォルト球状サンプル格子を選択する手段と;M個の時間サンプルのブロックについて、前記回転情報に従って前記デフォルトの球状サンプル格子を回転させる回転処理手段と;回転された球状サンプル格子に対して前記DSHTを実行する変換処理手段とを有する。
ある実施形態では、前記デコードする装置における前記相関器34は、適応的DSHTを使って各チャネルを同時に空間的にデコードする複数の空間的デコード・ユニット922を有し、さらに、スペクトル帯域化解除を実行するためのスペクトル帯域化解除ユニット924と、重複加算(OLA)をもつ時間から周波数への変換(TFT)の逆処理を実行するiTFT&OLAユニット925とを有する。前記スペクトル帯域化解除ユニットはその出力をiTFT&OLAユニットに与える。
すべての実施形態において、削減されたノイズは、少なくとも、符号化ノイズ・マスキング解除の回避に関する。
オーディオ信号の知覚的符号化は、人間の聴覚知覚に適応された符号化を意味する。オーディオ信号を知覚的符号化するとき、通例、量子化は高帯域オーディオ信号サンプルに対してではなく、人間の知覚に関係する個々の周波数帯域において実行されることを注意しておくべきである。よって、信号パワーと量子化ノイズとの比は個々の周波数帯域の間で変わりうる。よって、知覚的符号化は、通例、冗長性および/または非関連情報の削減を含み、一方、空間的符号化は通例、チャネル間の空間的な関係に関する。
上記に記載した技術は、カルーネン・レーベ変換(KLT)を使う脱相関に対する代替と見ることができる。本発明の一つの利点は、サイド情報の量の強い削減であり、サイド情報はたった三つの角度を含む。KLTはサイド情報としてブロック相関行列の係数を、よってかなりより多くのデータを必要とする。さらに、本稿に開示した技術は、次の処理ブロックに進むときに遷移アーチファクトを軽減するために回転を微調整(またはファインチューニング)することを許容する。これは、その後の知覚的符号化の圧縮品質のために有益である。
表1は、aDSHTとKLTとの間の直接的な比較を与える。いくつかの類似点は存在するものの、aDSHTはKLTに対して著しい利点を提供する。
Figure 0006205416
表1:aDSHTとKLTの比較。
本発明の根本的な新規な特徴がその好ましい実施形態に適用されるものとして示され、記述され、指摘されてきたが、本発明の精神から外れることなく、記載される装置および方法における、開示されるデバイスの形および詳細におけるおよびその動作におけるさまざまな省略および置換および変更が当業者によってなされてもよいことは理解されるであろう。実質的に同じように実質的に同じ機能を実行して同じ結果を達成する要素のあらゆる組み合わせが本発明の範囲内であることが明確に意図されている。ある記載される実施形態から別の記載される実施形態への要素の置換も完全に意図されており、考慮されている。
本発明は純粋に例として記載されてきたのであって、本発明の範囲から外れることなく詳細の修正がなしうることは理解されるであろう。
本記述および(該当する場合には)請求項および図面に開示される各特徴は、独立にまたは任意の適切な組み合わせにおいて提供されてもよい。適切な場合には、特徴はハードウェア、ソフトウェアまたは両者の組み合わせにおいて実装されうる。該当する場合には、接続は無線接続または有線の、必ずしも直接的または専用のものではない接続として実装されうる。
請求項に現われる参照符号は単に例解のためであって、請求項の範囲に対して限定する効果はもたない。

Claims (15)

  1. ノイズ削減のための多チャネル高次アンビソニックス(HOA)オーディオ信号をエンコードする方法であって、
    ・逆適応的離散球面調和関数変換(DSHT)を使ってそれらのチャネルを脱相関させる段階であって、前記逆適応的DSHTは回転演算および逆DSHTを含み、前記回転演算は前記iDSHTの空間的サンプリング格子を回転させ、前記空間的サンプリング格子は、項
    Figure 0006205416
    の対数が最小化されるよう回転され、ここで、|ΣWSdl,j|は、ΣWSdの行インデックスlおよび列インデックスjをもつ要素の絶対値であり、σ2 SdlはΣWSdの対角要素であり、
    Figure 0006205416
    であり、WSdはオーディオ・チャネル数かけるブロック処理サンプル数のサイズをもつ行列であり、WSdは前記逆適応的DSHTの結果である、段階と;
    ・脱相関されたチャネルのそれぞれを知覚的にエンコードする段階と;
    ・回転情報をエンコードする段階であって、前記回転情報は前記回転演算を定義する三つの成分をもつ空間的ベクトル
    Figure 0006205416
    である、段階と;
    ・知覚的にエンコードされたオーディオ・チャネルおよびエンコードされた回転情報を送信または記憶する段階とを含む、
    方法。
  2. 前記逆適応的DSHTは、
    ・初期のデフォルト空間的サンプリング格子を選択する段階と;
    ・最も強い源方向を決定する段階と;
    ・M個の時間サンプルのブロックについて、ある単一の空間的サンプル位置が前記最も強い源方向に一致するよう前記空間的サンプリング格子を回転させる段階とを含む、
    請求項1記載の方法。
  3. 前記空間的ベクトルの三つの成分は角度θaxisaxisrotであり、θaxis、φaxisは、球座標における回転軸についての情報を定義し、暗黙的な半径が1であり、φrotは前記回転軸のまわりの回転角を定義し、前記角度は量子化され、エントロピー符号化され、あるエスケープ・パターンが、サイド情報(SI)を生成するために前に使われた値の再使用を指示する、請求項1または2記載の方法。
  4. ・TFTフレーム化ユニットにおいて重なり合うデータ・ブロックを構築する段階と、
    ・各チャネルの係数に対して時間から周波数への変換を実行する段階と、
    ・スペクトル帯域化ユニットにおいて、時間から周波数への変換をされた周波数帯域を組み合わせてJ個の新しいスペクトル帯域を形成する段階と、
    ・複数の処理ブロックにおいて同時に前記スペクトル帯域の複数を処理する段階であって、各処理ブロックは逆適応的DSHTを実行し、前記逆適応的DSHTは回転演算および逆DSHTを含み、前記回転演算は前記iDSHTの空間的サンプリング格子を回転させる、段階と、
    ・時間から周波数への変換なしのチャネル独立な不可逆オーディオ圧縮を実行する段階とをさらに含む、
    請求項1ないし3のうちいずれか一項記載の方法。
  5. 削減されたノイズをもつ符号化された多チャネル高次アンビソニックス(HOA)オーディオ信号をデコードする方法であって、
    ・エンコードされた多チャネルHOAオーディオ信号およびチャネル回転情報を受領する段階であって、前記チャネル回転情報は回転演算を定義する三つの成分をもつ空間的ベクトル
    Figure 0006205416
    を含む、段階と;
    ・受領されたデータを圧縮解除する段階であって、知覚的デコードが使われ、知覚的にデコードされたチャネルが得られる段階と;
    ・適応的離散球面調和関数変換(DSHT)を使って各知覚的にデコードされたチャネルを空間的にデコードする段階であって、離散球面調和関数変換(DSHT)と、前記回転情報に基づく前記DSHTの空間的サンプリング格子の回転とが実行される、段階と;
    ・知覚的および空間的にデコードされたチャネルをマトリクス処理する段階であって、ラウドスピーカー位置にマッピングされる再生可能なオーディオ信号が得られる段階とを含む、
    方法。
  6. 前記適応的DSHTは、
    ・該適応的DSHTのための初期のデフォルト空間的サンプリング格子を選択する段階と、
    ・M個の時間サンプルのブロックについて、前記回転情報に従って前記デフォルト空間的サンプリング格子を回転させる段階と、
    ・回転された空間的サンプリング格子上で前記DSHTを実行する段階とを含む、
    請求項5記載の方法。
  7. 適応的DSHTを使って各チャネルを空間的にデコードする前記段階が、複数の空間的デコード・ユニットにおいて同時にすべてのチャネルについて行なわれ、当該方法がさらに、スペクトル帯域化解除する段階と、重複加算をもつ時間から周波数への変換の逆処理を実行する段階とを含む、請求項5または6記載の方法。
  8. 前記チャネル回転情報は三つの角度θaxisaxisrotから構成され、θaxis、φaxisは、球座標における回転軸についての情報を定義し、暗黙的な半径が1であり、φrotは前記回転軸のまわりの回転角を定義する、請求項5ないし7のうちいずれか一項記載の方法。
  9. 前記空間的ベクトルの三つの成分は量子化され、エントロピー符号化され、あるエスケープ・パターンが、サイド情報(SI)を生成するために前に使われた値の再使用を指示する、請求項5ないし8のうちいずれか一項記載の方法。
  10. ノイズ削減のための多チャネル高次アンビソニックス(HOA)オーディオ信号をエンコードする装置であって、
    ・逆適応的離散球面調和関数変換(DSHT)を使ってそれらのチャネルを脱相関させる脱相関器であって、前記逆適応的DSHTは回転演算ユニットおよび逆DSHT(iDSHT)を含み、回転演算は前記iDSHTの空間的サンプリング格子を回転させ、前記空間的サンプリング格子は、項
    Figure 0006205416
    の対数が最小化されるよう回転され、ここで、|ΣWSdl,j|は、ΣWSdの行インデックスlおよび列インデックスjをもつ要素の絶対値であり、σ2 SdlはΣWSdの対角要素であり、
    Figure 0006205416
    であり、WSdはオーディオ・チャネル数かけるブロック処理サンプル数のサイズをもつ行列であり、WSdは前記逆適応的DSHTの結果である、脱相関器と;
    ・脱相関されたチャネルのそれぞれを知覚的にエンコードする知覚的エンコーダと;
    ・回転情報をエンコードするサイド情報エンコーダであって、前記回転情報は前記回転演算を定義する三つの成分をもつ空間的ベクトル
    Figure 0006205416
    を含む、サイド情報エンコーダと;
    ・知覚的にエンコードされたオーディオ・チャネルおよびエンコードされた回転情報を送信または記憶するインターフェースとを有する、
    装置。
  11. 前記空間的ベクトルの三つの成分は角度θaxisaxisrotであり、θaxis、φaxisは、球座標における前記回転軸についての情報を定義し、暗黙的な半径が1であり、φrotは前記回転軸のまわりの回転角を定義し、前記角度は量子化され、エントロピー符号化され、あるエスケープ・パターンが、サイド情報(SI)を生成するために前に使われた値の再使用を指示する、請求項10記載の装置。
  12. 削減されたノイズをもつ多チャネル高次アンビソニックス(HOA)オーディオ信号をデコードする装置であって、
    ・エンコードされた多チャネルHOAオーディオ信号およびチャネル回転情報を受領するインターフェース手段であって、前記チャネル回転情報は回転演算を定義する三つの成分をもつ空間的ベクトル
    Figure 0006205416
    を含む、インターフェース手段と;
    ・各チャネルを知覚的にデコードする知覚的デコーダを用いて、受領されたデータを圧縮解除する圧縮解除モジュールと;
    ・適応的離散球面調和関数変換(aDSHT)を使って知覚的にデコードされたチャネルを相関させる相関器であって、離散球面調和関数変換(DSHT)と、前記回転情報に基づく前記DSHTの空間的サンプリング格子の回転とが実行される、相関器と;
    ・相関された、知覚的にデコードされたチャネルをマトリクス処理する混合器(MX)であって、ラウドスピーカー位置にマッピングされる再生可能なオーディオ信号が得られる混合器とを有する、
    装置。
  13. 前記適応的DSHTは、
    ・該適応的DSHTのための初期のデフォルト空間的サンプリング格子を選択する手段と;
    ・M個の時間サンプルのブロックについて、前記回転情報に従って前記デフォルト空間的サンプリング格子を回転させる回転処理手段と;
    ・回転された空間的サンプリング格子に対して前記DSHTを実行する変換処理手段とを有する、
    請求項12記載の装置。
  14. 前記相関器が、適応的DSHTを使って各チャネルを同時に空間的にデコードする複数の空間的デコード・ユニットを有し、当該装置がさらに、スペクトル帯域化解除を実行するためのスペクトル帯域化解除ユニットと、重複加算をもつ時間から周波数への変換の逆処理を実行するiTFT&OLAユニットとを有し、前記スペクトル帯域化解除ユニットはその出力を前記iTFT&OLAユニットに与える、請求項12または13記載の装置。
  15. 前記空間的ベクトルの三つの成分が量子化され、エントロピー符号化され、あるエスケープ・パターンが、サイド情報(SI)を生成するために前に使われた値の再使用を指示する、請求項12ないし14のうちいずれか一項記載の装置。
JP2015522077A 2012-07-16 2013-07-16 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置 Active JP6205416B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP12305861.2A EP2688066A1 (en) 2012-07-16 2012-07-16 Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
EP12305861.2 2012-07-16
PCT/EP2013/065032 WO2014012944A1 (en) 2012-07-16 2013-07-16 Method and apparatus for encoding multi-channel hoa audio signals for noise reduction, and method and apparatus for decoding multi-channel hoa audio signals for noise reduction

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017169358A Division JP6453961B2 (ja) 2012-07-16 2017-09-04 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置

Publications (3)

Publication Number Publication Date
JP2015526759A JP2015526759A (ja) 2015-09-10
JP2015526759A5 JP2015526759A5 (ja) 2016-08-18
JP6205416B2 true JP6205416B2 (ja) 2017-09-27

Family

ID=48874263

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2015522077A Active JP6205416B2 (ja) 2012-07-16 2013-07-16 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置
JP2017169358A Active JP6453961B2 (ja) 2012-07-16 2017-09-04 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置
JP2018233042A Active JP6676138B2 (ja) 2012-07-16 2018-12-13 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置
JP2020041510A Active JP6866519B2 (ja) 2012-07-16 2020-03-11 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2017169358A Active JP6453961B2 (ja) 2012-07-16 2017-09-04 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置
JP2018233042A Active JP6676138B2 (ja) 2012-07-16 2018-12-13 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置
JP2020041510A Active JP6866519B2 (ja) 2012-07-16 2020-03-11 ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置

Country Status (7)

Country Link
US (4) US9460728B2 (ja)
EP (4) EP2688066A1 (ja)
JP (4) JP6205416B2 (ja)
KR (5) KR102187936B1 (ja)
CN (6) CN107403625B (ja)
TW (4) TWI674009B (ja)
WO (1) WO2014012944A1 (ja)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
KR102201713B1 (ko) 2012-07-19 2021-01-12 돌비 인터네셔널 에이비 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9980074B2 (en) 2013-05-29 2018-05-22 Qualcomm Incorporated Quantization step sizes for compression of spatial components of a sound field
US20150127354A1 (en) * 2013-10-03 2015-05-07 Qualcomm Incorporated Near field compensation for decomposed representations of a sound field
EP2879408A1 (en) 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) * 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
CN106104681B (zh) 2014-03-21 2020-02-11 杜比国际公司 对压缩的高阶高保真立体声(hoa)表示进行解码的方法及装置
KR102428794B1 (ko) * 2014-03-21 2022-08-04 돌비 인터네셔널 에이비 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치
EP2934025A1 (en) * 2014-04-15 2015-10-21 Thomson Licensing Method and device for applying dynamic range compression to a higher order ambisonics signal
CN109036441B (zh) * 2014-03-24 2023-06-06 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN103888889B (zh) * 2014-04-07 2016-01-13 北京工业大学 一种基于球谐展开的多声道转换方法
US10770087B2 (en) * 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
CN113793618A (zh) * 2014-06-27 2021-12-14 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法
EP3860154B1 (en) 2014-06-27 2024-02-21 Dolby International AB Method for decoding a compressed hoa dataframe representation of a sound field.
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
KR20230162157A (ko) * 2014-06-27 2023-11-28 돌비 인터네셔널 에이비 Hoa 데이터 프레임 표현의 데이터 프레임들 중 특정 데이터 프레임들의 채널 신호들과 연관된 비차분 이득 값들을 포함하는 코딩된 hoa 데이터 프레임 표현
US9838819B2 (en) * 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
EP2980789A1 (en) 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US9736606B2 (en) * 2014-08-01 2017-08-15 Qualcomm Incorporated Editing of higher-order ambisonic audio data
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
EP3007167A1 (en) * 2014-10-10 2016-04-13 Thomson Licensing Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field
US9984693B2 (en) * 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
WO2016162165A1 (en) * 2015-04-10 2016-10-13 Thomson Licensing Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation
WO2017085140A1 (en) * 2015-11-17 2017-05-26 Dolby International Ab Method and apparatus for converting a channel-based 3d audio signal to an hoa audio signal
HK1221372A2 (zh) * 2016-03-29 2017-05-26 萬維數碼有限公司 種獲得空間音頻定向向量的方法、裝置及設備
WO2018001493A1 (en) * 2016-06-30 2018-01-04 Huawei Technologies Duesseldorf Gmbh Apparatuses and methods for encoding and decoding a multichannel audio signal
GB2554446A (en) * 2016-09-28 2018-04-04 Nokia Technologies Oy Spatial audio signal format generation from a microphone array using adaptive capture
WO2018201113A1 (en) 2017-04-28 2018-11-01 Dts, Inc. Audio coder window and transform implementations
WO2019009085A1 (ja) * 2017-07-05 2019-01-10 ソニー株式会社 信号処理装置および方法、並びにプログラム
US10944568B2 (en) * 2017-10-06 2021-03-09 The Boeing Company Methods for constructing secure hash functions from bit-mixers
US10714098B2 (en) 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
CN111210831B (zh) * 2018-11-22 2024-06-04 广州广晟数码技术有限公司 基于频谱拉伸的带宽扩展音频编解码方法及装置
WO2020152154A1 (en) * 2019-01-21 2020-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding a spatial audio representation or apparatus and method for decoding an encoded audio signal using transport metadata and related computer programs
US11729406B2 (en) * 2019-03-21 2023-08-15 Qualcomm Incorporated Video compression using deep generative models
US11388416B2 (en) * 2019-03-21 2022-07-12 Qualcomm Incorporated Video compression using deep generative models
CN116978387A (zh) 2019-07-02 2023-10-31 杜比国际公司 用于离散指向性数据的表示、编码和解码的方法、设备和系统
CN110544484B (zh) * 2019-09-23 2021-12-21 中科超影(北京)传媒科技有限公司 高阶Ambisonic音频编解码方法及装置
CN110970048B (zh) * 2019-12-03 2023-01-17 腾讯科技(深圳)有限公司 音频数据的处理方法及装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001275197A (ja) * 2000-03-23 2001-10-05 Seiko Epson Corp 音源選択方法および音源選択装置並びに音源選択制御プログラムを記録した記録媒体
GB2379147B (en) * 2001-04-18 2003-10-22 Univ York Sound processing
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US8238561B2 (en) * 2005-10-26 2012-08-07 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
KR101339854B1 (ko) * 2006-03-15 2014-02-06 오렌지 주 성분 분석에 의해 다중채널 오디오 신호를 인코딩하기 위한 장치 및 방법
EP2070390B1 (en) * 2006-09-25 2011-01-12 Dolby Laboratories Licensing Corporation Improved spatial resolution of the sound field for multi-channel audio playback systems by deriving signals with high order angular terms
US20080232601A1 (en) * 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
FR2916078A1 (fr) * 2007-05-10 2008-11-14 France Telecom Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes
FR2916079A1 (fr) * 2007-05-10 2008-11-14 France Telecom Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes
US20110188043A1 (en) * 2007-12-26 2011-08-04 Yissum, Research Development Company of The Hebrew University of Jerusalem, Ltd. Method and apparatus for monitoring processes in living cells
EP2094032A1 (en) * 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
WO2010003545A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. An apparatus and a method for decoding an encoded audio signal
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
GB2467534B (en) * 2009-02-04 2014-12-24 Richard Furse Sound system
FR2943867A1 (fr) * 2009-03-31 2010-10-01 France Telecom Traitement d'egalisation de composantes spatiales d'un signal audio 3d
US9020152B2 (en) * 2010-03-05 2015-04-28 Stmicroelectronics Asia Pacific Pte. Ltd. Enabling 3D sound reproduction using a 2D speaker arrangement
KR101795015B1 (ko) * 2010-03-26 2017-11-07 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
NZ587483A (en) * 2010-08-20 2012-12-21 Ind Res Ltd Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions
US9271081B2 (en) * 2010-08-27 2016-02-23 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
CN103165136A (zh) * 2011-12-15 2013-06-19 杜比实验室特许公司 音频处理方法及音频处理设备
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction

Also Published As

Publication number Publication date
CN107403626B (zh) 2021-01-08
JP6866519B2 (ja) 2021-04-28
EP3327721A1 (en) 2018-05-30
EP2873071B1 (en) 2017-12-13
EP3813063A1 (en) 2021-04-28
KR102187936B1 (ko) 2020-12-07
US20170061974A1 (en) 2017-03-02
TWI674009B (zh) 2019-10-01
US20170352355A1 (en) 2017-12-07
CN107403625B (zh) 2021-06-04
CN107591160A (zh) 2018-01-16
CN104428833A (zh) 2015-03-18
US9837087B2 (en) 2017-12-05
TW201412145A (zh) 2014-03-16
CN107591160B (zh) 2021-03-19
CN107591159A (zh) 2018-01-16
CN107403626A (zh) 2017-11-28
CN107591159B (zh) 2020-12-01
TW202013993A (zh) 2020-04-01
EP2688066A1 (en) 2014-01-22
KR20200138440A (ko) 2020-12-09
CN107403625A (zh) 2017-11-28
KR20240091351A (ko) 2024-06-21
TWI602444B (zh) 2017-10-11
JP2019040218A (ja) 2019-03-14
JP2017207789A (ja) 2017-11-24
CN107424618A (zh) 2017-12-01
US20150154971A1 (en) 2015-06-04
EP2873071A1 (en) 2015-05-20
KR102126449B1 (ko) 2020-06-24
KR20200077601A (ko) 2020-06-30
US20190318751A1 (en) 2019-10-17
JP2020091500A (ja) 2020-06-11
KR20150032704A (ko) 2015-03-27
TW202103503A (zh) 2021-01-16
US10614821B2 (en) 2020-04-07
TWI691214B (zh) 2020-04-11
TWI723805B (zh) 2021-04-01
JP2015526759A (ja) 2015-09-10
US9460728B2 (en) 2016-10-04
KR102340930B1 (ko) 2021-12-20
JP6453961B2 (ja) 2019-01-16
CN104428833B (zh) 2017-09-15
EP3327721B1 (en) 2020-11-25
KR20210156311A (ko) 2021-12-24
WO2014012944A1 (en) 2014-01-23
TW201739272A (zh) 2017-11-01
CN107424618B (zh) 2021-01-08
JP6676138B2 (ja) 2020-04-08
US10304469B2 (en) 2019-05-28

Similar Documents

Publication Publication Date Title
JP6453961B2 (ja) ノイズ削減のための多チャネルhoaオーディオ信号をエンコードする方法および装置ならびにノイズ削減のための多チャネルhoaオーディオ信号をデコードする方法および装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160628

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160628

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170904

R150 Certificate of patent or registration of utility model

Ref document number: 6205416

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250