JP5335015B2 - オーディオ信号のエンコードまたはデコード - Google Patents

オーディオ信号のエンコードまたはデコード Download PDF

Info

Publication number
JP5335015B2
JP5335015B2 JP2011036288A JP2011036288A JP5335015B2 JP 5335015 B2 JP5335015 B2 JP 5335015B2 JP 2011036288 A JP2011036288 A JP 2011036288A JP 2011036288 A JP2011036288 A JP 2011036288A JP 5335015 B2 JP5335015 B2 JP 5335015B2
Authority
JP
Japan
Prior art keywords
subband
subband signals
audio
signal
downsampled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011036288A
Other languages
English (en)
Other versions
JP2011128649A (ja
Inventor
エフ ビレモエス,ラルス
エクストランド,ペル
プルンハーゲン,ヘイコ
ヘー ペー スハイエルス,エリク
ボント,フランシスキュス エム イェー デ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34530779&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5335015(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2011128649A publication Critical patent/JP2011128649A/ja
Application granted granted Critical
Publication of JP5335015B2 publication Critical patent/JP5335015B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereophonic System (AREA)
  • Insulated Conductors (AREA)

Description

本発明は、オーディオ信号のエンコードまたはエンコードされたオーディオ信号のデコードに関する。
エリック・スハイエルス(Erik Schuijers)、ウェルナー・オーメン(Werner Oomen)、ベルト・デン・ブリンカー(Bert den Brinker)およびイェルーン・ブレーバールト(Jeroen Breebaart)の“Advances in Parametric Coding for High-Quality Audio”, Preprint 5852, 114th AES Convention, Amsterdam, The Netherlands, 220-25 March 2003はステレオ音像のための効率的なパラメトリック表現を使ったパラメトリック符号化方式を開示している。二つの入力信号は一つのモノ・オーディオ信号にマージされる。知覚的に意味のある空間的手がかりは図1に示したように明示的にモデル化される。マージされた信号はモノ・パラメトリック・エンコーダを使ってエンコードされる。ステレオ・パラメータのチャネル間強度差(IID: Interchannel Intensity Difference)、チャネル間時間差(ITD: Interchannel Time Difference)およびチャネル間相互相関(ICC: Interchannel Cross Correlation)は量子化され、エンコードされ、前記の量子化されてエンコードされたモノ・オーディオ信号と一緒にビットストリームに多重化される。デコーダ側では、ビットストリームは多重化解除されてエンコードされたモノ信号とステレオ・パラメータになる。エンコードされたモノ・オーディオ信号はデコードされ、デコードされたモノ・オーディオ信号m′が得られる(図2参照)。このモノ時間領域信号から、知覚的な脱相関を与えるフィルタDを使って脱相関された信号が計算される。モノ時間領域信号m′および脱相関信号dはいずれも周波数領域に変換される。次いでその周波数領域ステレオ信号はパラメータ処理ユニットにおいてIDD、ITD、ICCを用いてそれぞれスケール変換、位相修正および混合によって処理され、デコードされたステレオ対l′およびr′が得られる。結果として得られる周波数領域表現は時間領域に逆変換されている。
本発明の目的の一つは、空間的パラメータを使って有利なオーディオ・エンコードまたはデコードを提供することである。この目的のため、本発明は、エンコード方法、オーディオ・エンコーダ、送信もしくは保存のための装置、デコード方法、オーディオ・デコーダ、再生装置およびコンピュータプログラムプロダクトを独立請求項において定義されるように提供する。有利な実施形態は従属請求項において定義される。
本発明の第一の側面によれば、第一のオーディオ・チャネルと第二のオーディオ・チャネルとを含むオーディオ信号がエンコードされる。該エンコードは、前記第一のオーディオ・チャネルと前記第二のオーディオ・チャネルとのそれぞれを複素変調フィルタバンクにおいてサブバンドフィルタ処理して前記第一のオーディオ・チャネルについての第一の複数のサブバンド信号と、前記第二のオーディオ・チャネルについての第二の複数のサブバンド信号とを提供し、該サブバンド信号のそれぞれをダウンサンプリングして第一の複数のダウンサンプリングされたサブバンド信号と、第二の複数のダウンサンプリングされたサブバンド信号を提供し、前記ダウンサンプリングされたサブバンド信号のうちの少なくとも一つをさらなるフィルタバンクにおいてさらにサブバンドフィルタ処理して複数のサブ・サブバンド信号を提供し、前記サブ・サブバンド信号から、およびさらなるサブバンドフィルタ処理をされていないダウンサンプリングされたサブバンド信号から空間的パラメータを導出し、前記第一の複数のダウンサンプリングされたサブバンド信号と前記第二の複数のダウンサンプリングされたサブバンド信号とから導かれる誘導サブバンド信号を有する単一チャネル・オーディオ信号を導出する、ことを有する。サブバンドにおいてさらなるサブバンドフィルタ処理を設けることによって、前記サブバンドの周波数解像度が増す。そのような増加した周波数解像度には、より高いオーディオ品質を(単一サブバンド信号のバンド幅は典型的には人間の聴覚系の臨界帯域よりもずっと高い)効率的な実装によって(変換される必要があるのは少数のバンドだけであるため)実現することが可能になるという利点がある。パラメトリック空間的符号化器は両耳的手がかりをモデル化しようとする。両耳的手がかりは、等価矩形帯域(ERB: Equivalent Rectangular Bands)に似た非一様な周波数スケール上で知覚される。前記単一チャネル・オーディオ信号は、前記第一の複数のダウンサンプリングされたサブバンド信号および前記第二の複数のダウンサンプリングされたサブバンド信号から直接導出することができる。しかし、前記単一チャネル・オーディオ信号の導出は有利には、さらなるサブバンドフィルタ処理を受けたダウンサンプリングされたサブバンドについてのサブ・サブバンド信号から(この場合、各サブバンドの前記サブ・サブバンド信号は足し合わされて新しいサブバンド信号を形成し、前記単一チャネル・オーディオ信号はこれらの新しいサブバンド信号から導出される)、ならびに、前記第一および第二の複数のサブバンドのうちさらなるフィルタ処理をされていないサブバンドからである。
本発明のもう一つの主たる側面によれば、エンコードされた単一チャネル・オーディオ信号と空間的パラメータの組とを有するエンコードされたオーディオ信号のオーディオ・デコードが提供される。該オーディオ・デコードは、前記エンコードされた単一チャネル・オーディオ信号をデコードして複数のダウンサンプリングされたサブバンド信号を得、前記ダウンサンプリングされたサブバンド信号の少なくとも一つをさらなるフィルタバンクにおいてさらにサブバンドフィルタ処理して複数のサブ・サブバンド信号を提供し、前記空間的パラメータと、前記サブ・サブバンド信号と、さらなるサブバンドフィルタ処理をされていないサブバンドについての前記ダウンサンプリングされたサブバンド信号とから二つのオーディオ・チャネルを導出することを有する。サブバンドにおけるさらなるサブバンドフィルタ処理を設けることによって、前記サブバンドの周波数解像度は増加し、その結果、より高品質のオーディオ・デコードが達成できる。
本発明のこれらの側面の主たる効果の一つは、パラメトリック空間的符号化はスペクトル帯域複製(SBR: Spectral Band Replication)技法と容易に組み合わせることができるということである。SBRそのものはMartin Dietz、Lars Liljeryd、Kristofer Kj¨orling and Oliver Kunz, “Spectral Band Replication, a novel approach in audio coding”, Preprint 5553, 112th AES Convention, Munich, Germany, 10-13 May 2002から、そしてPer Ekstrand, “Bandwidth extension of audio signals by spectral band replication”, Prc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), pp. 53-58, Leuven, Belgium, November 15, 2002から知られている。さらに、MPEG-4規格ISO/IEC14496-3: 2001/FDAM1, JTC1/SC29/WG11, Coding of Moving Pictures and Audio, Bandwidth Extensionが参照される。これはSBRを使ったオーディオ・コーデックを記載している。
SBRは、オーディオ信号における低周波と高周波との間には典型的には大きな相関があるという知見に基づいている。そのため、SBRプロセスはスペクトルの低域部分を高域部分にコピーし、その後スペクトルの高域部分について当該ビットストリーム中にエンコードされた小さな情報を使ってスペクトル包絡線が調整される。そのようなSBR拡張されたデコーダの簡略化したブロック図が図3に示されている。ビットストリームは多重化解除され、デコードされてコアデータ(たとえばMPEG-2/4の高度オーディオ符号化(AAC: Advanced Audio Coding))とSBRデータとになる。コアデータを使って信号は完全バンド幅信号のサンプリング周波数の半分でデコードされる。コア・デコーダの出力は、32バンドの複素(擬似)直交ミラーフィルタ(QMF: Quadrature Mirror Filter)バンクによって分解される。これらの32のバンドは次いで、低域の一部をコピーすることによって高周波(HF: High Frequency)内容が生成される形で完全バンド幅、すなわち64バンドに拡張される。HF内容が生成された帯域の包絡線はSBRデータに従って調整される。最後に、64バンドの複素QMF合成バンクによって、PCM出力信号が再構成される。
図3に示されるSBRデコーダはいわゆるデュアルレートデコーダである。これは、コア・デコーダはサンプリング周波数の半分で走り、したがって32バンド分解QMFバンクしか使われないということを意味する。コア・デコーダが完全なサンプリング周波数で走り、分解QMFバンクが64のバンドからなるシングルレートデコーダも可能である。実際上は、再構成は(擬似)複素QMFバンクによってなされる。複素QMFフィルタバンクは臨界サンプリングされないので、エイリアシングを考慮に入れるために追加的な対策を講じる必要はない。Ekstrandによって開示されているようなSBRデコーダにおいては、分解QMFバンクは32バンドしか有さない一方、合成QMFバンクは64バンドからなり、コア・デコーダは全オーディオ・デコーダに比べてサンプリング周波数の半分で走ることを注意しておく。しかし、対応するエンコーダでは、64バンドの分解QMFバンクが使われて全周波数領域がカバーされる。
本発明はステレオ・オーディオ符号化のために特に有益であるが、本発明は二つよりも多くのオーディオ・チャネルをもつ信号の符号化にも有益である。
これらのことを含む本発明のさまざまな側面は、以下に記載する実施形態から明らかであり、これを参照することによって明快になるであろう。
図面は本発明を理解するために必要な要素のみを示す。
パラメトリック・ステレオ(PS: Parametric Stereo)エンコーダにおいて使われるステレオ・パラメータ抽出のためのユニットのブロック図である。 PSデコーダにおいて使われるステレオ信号の再構成のためのユニットのブロック図である。 スペクトル帯域複製(SBR)デコーダのブロック図である。 本発明のある実施形態に基づく、複合PSおよびSBR拡張されたエンコーダのブロック図である。 本発明のある実施形態に基づく、複合PSおよびSBR拡張されたデコーダのブロック図である。 Mバンドでダウンサンプリングされた複素QMFの分解バンク(左)および合成バンク(右)を示す図である。 プロトタイプフィルタの絶対値応答をdBで示す図である。 64のダウンサンプリングしていない複素変調分解フィルタのうちの最初の4つの絶対値応答をdBで示す図である。 自明な合成をもつQバンドのフィルタバンクのブロック図である。 第一のダウンサンプリングされていない変調QMFフィルタおよび8バンドの複素変調フィルタバンクの合成絶対値応答をdBで示す図である。 本発明のある実施形態に基づく、4バンドの偶積層のフィルタバンク(上)と奇積層のフィルタバンク(下)の定型化された絶対値応答を示す図である。 本発明のある実施形態に基づく、64バンドの複素分解QMFに基づく、77バンドの非一様ハイブリッド分解フィルタバンクを示す図である。 オーディオ・デコーダでの使用のための、64バンドの複素分解QMFに基づく、71バンドの非一様ハイブリッド分解フィルタバンクを示す図である。 複素変調分解フィルタバンクの効率的な実装のブロック図である。
SBRとPS(Parametric Stereo)との組み合わせはきわめて強力なコーデックを与える可能性を秘めている。SBRとPSとはいずれも、何らかの形の時間‐周波数変換、処理および最終的な周波数‐時間変換というかなり似通った構造からなるデコーダにおける後処理アルゴリズムである。両アルゴリズムを複合する場合は、両アルゴリズムがたとえばDSPアプリケーションの上で同時的に走れることが要求される。よって、一方のコーデックの計算された中間結果のうちできるだけ多くを他方のために再利用することが有益である。PSとSBRとの複合の場合には、これは複素(擬似)QMFサブバンド信号をPS処理のために再利用することにつながる。複合エンコーダ(図4参照)では、ステレオ入力信号は二つの64バンドの分解フィルタバンクによって分解される。複素サブバンド領域表現を使って、PS計算ユニットはステレオ・パラメータを推定し、モノ(サブバンド)ダウンミックスが生成される。このモノ・ダウンミックスは次いでSBRパラメータ推定ユニットに与えられる。最終的に、モノ・ダウンミックスは32バンドの合成フィルタバンクによって時間領域に逆変換され、コア・デコーダによって符号化されうるようになる(コア・デコーダは帯域幅の半分しか必要としない)。
図5に示したような複合デコーダでは、デュアルレートシステムまたはシングルレートシステムが使われているか否かに関わりなく、包絡線調整後の完全バンド幅(64バンド)のサブバンド領域信号は、ステレオ・パラメータに従ってサブバンド領域信号の複数のステレオ組に変換される。サブバンド信号のこれら二つの組は最終的に64バンドの合成QMFバンクによって時間領域に変換される。単にPSをSBRと組み合わせるだけの場合、QMFフィルタの低域周波数の諸バンドの帯域幅は高品質ステレオ表現のために必要とされるよりも大きい。よって、ステレオ音像の高品質表現を与えることができるために、本発明の有利な諸実施形態によれば、低域サブバンド信号のさらなる細分が実行される。
本発明の諸側面のよりよい理解のために、まず複素QMFサブバンドフィルタの背後の理論を説明する。
QMFサブバンドフィルタ
QMF分解サブバンドフィルタは次のように説明できる。実数値の線形位相プロトタイプフィルタp(v)が与えられているとき、Mバンドの複素変調分解フィルタバンクは、k=0,1,...,M−1についての分解フィルタ
Figure 0005335015
によって定義することができる。位相パラメータθは以下の分析には重要ではないが、典型的な選択はプロトタイプフィルタの次数をNとして(N+M)/2である。実数値の離散的な時間信号x(v)を与えられたとき、サブバンド信号vk(n)はx(v)をhk(v)でフィルタ処理(畳み込み)し、次いでその結果をM分の1にダウンサンプリングすることによって得られる(図6の左側参照)。
合成処理は、まずQMFサブバンド信号をM倍にアップサンプリングし、次いで(1)の型の複素変調フィルタを用いてフィルタ処理し、結果を足し合わせ、最終的に実部の2倍をとる(図6の右側参照)。すると、実数値の線形位相プロトタイプフィルタp(v)を好適に設計することによって完璧に近い実数値信号の再構成が得られる。64バンドの場合のMPEG-4規格(上述)のSBRシステムにおいて使われるプロトタイプフィルタの絶対値応答が図7に示されている。64の複素変調分解フィルタの絶対値応答は、プロトタイプフィルタp(v)の絶対値応答を(π/M)(k+1/2)だけシフトさせることによって得られる。これらの応答の一部が図8に示されている。フィルタ処理されるのはk=0とk=M−1の場合を除けば正の周波数だけであることを注意しておく。結果として、ダウンサンプリング前のサブバンド信号は解析的に近く、実数値の正弦曲線の簡単な振幅および位相修正を容易にする。位相修正は、最初と最後のバンドについても、これらのバンド内にある正弦曲線の周波数がそれぞれπ/2Mより大きいかπ−π/2Mより小さければ、可能である。この領域の外側にある周波数については、位相修正のパフォーマンスは、負の周波数の干渉のために急速に悪化する。
上記したQMF分解フィルタから出発して、本発明の諸実施形態では、ダウンサンプリングされた各サブバンド信号vk(n)をQk個のサブバンドにさらにフィルタ処理することによってより細かな周波数解像度が得られる。以下においてこのさらなるサブバンドフィルタ処理の性質を導く。
複素QMFサブバンド領域における信号修正
以下では、Z(ω)=Σz(n)exp(−inω)〔和はn=−∞から∞まで〕を離散時間信号z(n)の離散時間フーリエ変換であるとする。上述したような完璧に近い再構成属性を想定し、また前記したプロトタイプフィルタp(v)の場合のようにP(ω)すなわちp(v)のフーリエ変換が特に周波数区間[−π/M,π/M]の外側では実質的に0になるという設計を想定すると、ここでの次のステップは、サブバンド信号vk(n)が合成前に修正されるシステムを考えることである。ここで、各サブバンドkがフィルタBk(ω)を用いたフィルタ処理によって修正されるとする。アステリスクで複素共役を表すことにし、
k<0についてはBk(ω)=B-1-k(−ω)* (2)
という拡張定義を用いると、(全体としての遅延を無視し、実数値の入力およびシングルレートシステムを想定して)フィルタバンク合成を含む結果として得られるシステムはフィルタ
Figure 0005335015
を用いたフィルタ処理に対応することを示すことができる。
P(ω)の属性に関する仮定によれば、式(3)ですべてのkについてBk(ω)=1を代入すればB (ω)=1となり、シフトされたプロトタイプフィルタ応答についての平方和が1であることが得られる。実数値の定数Bk(ω)=bk≧0を選ぶことによって、当該システムは周波数π(k+1/2)/Mにおいて利得値bkを補間する等化器としてはたらく。魅力的な特徴は、全体としてのシステムが時間不変である、すなわち、ダウンサンプリングおよびアップサンプリングの使用にもかかわらずエイリアシングがないということである。このことが成り立つのはもちろん、前述されたプロトタイプフィルタ仮定に対する逸脱の量次第である。
モノ・オーディオ信号を導出するためには、前記複素サブバンド信号の追加的なサブフィルタ処理はこれらの属性を保存すべきであるのみならず、これらの属性をフィルタ処理されたサブバンド信号の操作にも拡張するべきである。これらの属性を保存するサブフィルタ処理は、いわゆる第Mバンドフィルタ(Mth band filter)の修正版を使って実行することができる。これ自身はP.P. Vaidyanathan, “Multirate systems and filter banks”, Prentice Hall Signal Processing Series, 1993, sections 4.6.1.-6.6.2から知られている。
自明な合成をもつ変調フィルタバンク
離散時間信号v(n)は、インパルス応答がgq(n) (q=0, 1, ..., Q−1)であるフィルタのバンクによってQ個の異なる信号に分割することができる。このことは図9で図解されている。対応する分解出力をyq(n)とし、自明な合成演算
Figure 0005335015
を考える。このとき、フィルタを
Figure 0005335015
となるように選ぶことによって完璧な再構成y(n)=v(n)が得られる。ここで、n=0ならδ(n)=1、n≠0ならδ(n)=0である。因果的フィルタについては、式(5)の右辺はdを正の遅延としてδ(n−d)で置き換える必要があるが、このストレートな修正は呈示の明確さのため省略する。
フィルタgq(n)は、プロトタイプフィルタg(n)の
Figure 0005335015
を通じた複素変調として選ぶことができる。本発明のこの好ましい実施形態では、フィルタは奇積層(oddly stacked)である(因子q+1/2)。この好ましい実施形態の利点はのちに述べることになる。完璧な再構成(5)が得られるのは、
g(Qn)=δ(n)/Q (7)
であるとき、かつそのときに限られる。この一つの変形が、
Figure 0005335015
という実数値の余弦変調で、実数値のプロトタイプフィルタg(m)が
g(2Qn)=δ(n)/Q (9)
を満たすものである。(これは式(6)においてgq(n)+gQ-1-q(n)を考えることにより容易に得られる。)
複素指数関数変調されたフィルタバンクのサブフィルタ処理
上記したQMF分解フィルタから出発して、ダウンサンプリングされた各サブバンド信号vk(n)をQk個のサブ・サブバンドに、上記の変調構造(6)または(8)の一つを使ってさらにフィルタ処理することによってより細かな周波数解像度が得られる。結果として得られる出力信号をyq k(n)と書き、gq k(n)がサブバンドk内で適用されるフィルタバンクを記述するものとする。Qk=1であれば、フィルタ処理はなく、g0 k(n)=δ(n)である。典型的な適用例は、M=64で、Q0=8、k=1, 2についてQk=4、k>2についてQk=1というものである。
x(v)からyq k(n)への二つのフィルタバンクの組み合わされた効果は、フィルタFq k(ω)を用いたフィルタ処理とそれに続く因子Mによるダウンサンプリングとして記述できる。ここで、
Fq k(ω)=Hk (ω) Gq k(Mω) (10)
である。もしプロトタイプフィルタ応答P(ω)がSBR分解フィルタの場合のように(図7参照)区間[−π/M,π/M]の外で本質的に0であれば、フィルタFq k(ω)は、
ωk,q=2π(q+Qks+1/2)/(MQk) (11)
によって定義される複素変調された場合において定義される単一の名目的な中心周波数をもつ。ここでsはQk(k−1/2)≦2(q+Qks)+1≦Qk(k+3/2)となるように選ばれる整数である。たとえば、図10において図示されるように、k=0でQ0=8であれば、ω0,0, ω0,1,... ,ω0,7の値は
(π/8M)×(1, 3, 5, 7, 9, 11, −3, −1)
である。
非一様な周波数解像度を用いた信号修正
上記したサブバンドフィルタバンクの挿入はさらなるダウンサンプリングを導入しはしないので、上に複素QMFだけの場合について示された、エイリアスのない信号修正パフォーマンスが保存される。Mサブバンド分解と、サブバンドk内でQk個のサブ・サブバンドを使ったさらなるサブバンドフィルタ処理と、各サブ・サブバンド信号yq k(n)のフィルタAk,q (ω)によるフィルタ処理と、各サブバンドk内での総和による合成と、Mバンドの合成バンクを通じた最終的な合成との一般的な組み合わされた動作を考える。そのような系の全体としての伝達関数は式(3)でk≧0について
Figure 0005335015
としたもので与えられる。ω>π/(2M)については、これは、
Figure 0005335015
となり、よって、サブバンド(k,q)の通しての応答は、
Figure 0005335015
となる。|ω|≦π/(2M)については、(2)のため若干注意を払う必要がある。この周波数範囲では、
Figure 0005335015
が成り立ち、実数のサブ・サブバンド・プロトタイプフィルタ係数を想定すると、
Figure 0005335015
が成り立ち、よって修正フィルタを
Figure 0005335015
となるように選べば、B0(−Mω)*=B0(Mω)であり、(3)との関連で言及した平方和が1であることにより、|ω|≦π/(2M)について
Figure 0005335015
となる。これはサブ・サブバンド(0,q)についての通しての応答Gq 0(Mω)に対応する。
式(15)から(17)までは正と負の周波数を区別することが望ましいことを示している。偶積層の(複素)フィルタではなく奇積層の(複素)フィルタが使用される(図11参照)のはこの理由による。偶積層のフィルタについては、正と負の周波数の区別をしようがないので、中心フィルタ、すなわち中心周波数が0であるフィルタの中にある正弦波の位相修正を適用することは可能ではない。Qを帯域の数とし、 [−2π/Q,2π/Q]に帯域限定された応答G(ω)をもつプロトタイプフィルタを想定すると、偶積層の場合、位相修正が近似的に適用できる下限は2π/Qであるのに対し、奇積層の場合、位相修正が近似的に適用できる下限はπ/Qである。
導入部で述べたように、PS合成にとって、上記したことの重要な特別な場合が等化と位相修正である。等化については、Ak,q (ω)=ak,q≧0であり、条件(16)は
Figure 0005335015
に帰着する。位相修正の場合はAk,q (ω)=exp(iαk,q)に対応し、この場合、条件(16)は
Figure 0005335015
であれば満足される。
ステレオ・パラメータ推定
非一様な複素フィルタバンク、すなわち上記したようなQMFバンクとそれに続くさらなるサブバンドフィルタ処理は、以下に示すようにステレオ・パラメータのチャネル間強度差(IID)、チャネル間位相差(IPD: Inter-channel Phase Differences)およびチャネル間相互相関(ICC)を推定するために適用できる。この実際的な実施形態においては、Schuijers et al.の論文で使われているITDに対する実際上等価な代替としてIPDが用いられていることを注意しておく。複合PSエンコーダ(図4参照)では、最初の3つの複素QMFチャネルはサブフィルタ処理されて合計で77の複素数値の信号が得られる(図12参照)。
以後、この77個の複素数値の時間整列した左および右のサブ・サブバンド信号はyq k(n)の添え字割り当てに従ってそれぞれlq k(n)およびrq k (n)と書くことにする。
あるサブバンドのサンプル位置n′におけるステレオ・パラメータを推定するために、左、右および規格化していない相互チャネル励起は、すべてのステレオ・ビンbについて、次式によって計算される。
Figure 0005335015
h(n)は長さLをもつサブバンド領域窓、εは0による除算を防ぐためのごく小さな値(たとえばε=10-10)で、lq k(n)およびrq k (n)は左および右のサブ・サブバンド領域信号である。20個のステレオ・ビンの場合、kl以上kh以下のkおよびql以上qh以下のqにわたっての総和は表に示したように進行する。「負の」周波数(たとえばq=4...7の場合のk=0)は式(20)のパラメータ推定には含められないことを注意しておく。

表1:kおよびqについての総和の開始および終了添え字
Figure 0005335015
el(b)、er(b)、eR(b)を計算するための総和は、これらの信号の総和における中点がパラメータ位置と一致するよう整列されている。−(L/2)+1のシフトはそのためである。表1から明らかなように、中心周波数が正のサブ・サブバンド信号およびサブバンド信号のみがステレオ・パラメータの推定に使われている。
各ステレオ・ビンbについて、IIDをI(b)と書き、ICCをC(b)と書き、IPDをP(b)と書くと、これらは次のように計算される。
Figure 0005335015
式中の角P(b)=∠eR(b)は、−πとπの間の値を与える4象限逆正接関数を使って計算される。目標ビットレートと用途に依存して、これらのパラメータまたはこれらのパラメータの部分集合は量子化され、ビットストリームのPS部分に符号化される。
ステレオ信号合成
デコーダにおける計算コスト(メモリ使用量の意味での)をできるだけ低く保つため、同様の分解構造が使われる。しかし、第一の帯域は部分的に複素であるだけである(図13参照)。これは、中程の帯域の対G2 0(ω)とG5 0(ω)、G3 0(ω)とG4 0(ω)の和によって得られる。さらに、第二の帯域と第三の帯域は二帯域実数値フィルタバンクであり、G0 k(ω)とG3 k(ω)の出力の和ならびにG1 k(ω)とG2 k(ω)の出力の和によって得られる(変調フィルタバンクについての上記のセクションにおける議論も参照)。デコーダフィルタバンク構造のこの単純化を使っても、正と負の周波数を区別する特性は前記第一のサブバンドフィルタの細分によって維持される。デコーダ分解フィルタバンクが図13に示されている。第一のQMFフィルタ処理された(サブ・)サブバンド信号の添え字割り当てが周波数に従って分別されていることを注意しておく。
単一フレームのステレオ(サブ・)サブバンド信号は次のように構築される。
Figure 0005335015
ここでsk(n)はモノ(サブ・)サブバンド信号、dk(n)はICCパラメータの合成を考慮に入れるために前記モノ(サブ・)サブバンド信号sk(n)から導出されるモノ脱相関(サブ・)サブバンド信号、k=0,...,K−1はサブバンドの添え字(Kがサブバンドの総数、すなわちK=71)、n=0,...,N−1はQMFサブバンド標本値の添え字でNはフレームのサブバンド標本値の数、Λ11, Λ12, Λ13, Λ14はスケール因子操作行列、Prtは位相回転操作行列である。前記操作行列は時間と周波数の関数として定義され、MPEG-4規格ISO/IEC14496-3:2001/FDAM1, JTC1/SC29/WG11, Coding of Moving Pictures and Audio, Extension 2において記載されている操作ベクトルからストレートに導出できる。
sk(n)は図12に従って図13を導くよう次のように定義される。
Figure 0005335015
ステレオ・パラメータの合成は表2の添え字割り当てに従って行われる。

表2:パラメータ添え字割り当て表
Figure 0005335015
よって合成の式は次のような具合になる。
Figure 0005335015
表中でアステリスクが出てきたら上式でPrtの符号が変化することを注意しておく。これは式(19)に従っている。すなわち、負の周波数については逆の位相回転を適用しなければならないのである。
自明な合成をもつ変調フィルタバンクの効率的な実装
長さLのプロトタイプフィルタを用いた変調フィルタバンクが与えられたとき、直接的な形の実装は入力標本値あたりQL回の演算を要求するものであろうが、(6)における変調が周期Qに関して反周期的であるという事実を使うと、フィルタ処理を、各入力標本値についてL回の演算の多相窓処理(windowing)とそれに続くサイズQの変換とに分割できる。そのような多相表現はP.P. Vaidyanathan, “Multirate systems and filterbanks”, Prentice Hall Signal Processing Series, 1993, section 4.3から知られていることを注意されたい。以下は、本発明の好ましい実施形態に基づくそのような多相表現の有利な適用を提供する。
変換はDFTに位相のひねりを続けたものである。これはQが2の冪であるときQlog2Qのオーダーである。よって、Lがlog2Qよりずっと大きい典型的な場合においては大幅な節約が得られる。実数で変調された場合(8)では、周期2Qの反周期性とn=0およびn=Qのまわりの偶/奇対称性とを組み合わせて利用して、やはり多相窓処理ができ、変換核はIII型のDCTとなる。複素変調の場合についての詳細な説明を以下に与える。
FFTコア処理を使ったサブ・サブフィルタ処理の効率的な実装は、プロトタイプフィルタの多相分解とそれに続く変調とを使って実現しうる。次数Nのプロトタイプフィルタg(n)を想定し、N=mQとし、mは正の整数とする。この条件は制限的ではない。任意の次数のプロトタイプフィルタに0をパディングして制約条件を満たすことができるからである。複素変調系(6)において使うために設計されたプロトタイプフィルタのZ変換は
Figure 0005335015
である。これは多相記法では
Figure 0005335015
と表しうる。ここで、
Figure 0005335015
である。フィルタバンクのすべてのフィルタはプロトタイプフィルタを周波数変調したバージョンである。フィルタgq(n)のZ変換は
Figure 0005335015
によって与えられる。ここで、
Figure 0005335015
である。一つのフィルタからの出力の表式は次のようになる。
Figure 0005335015
最後の和の成分を識別することによって、多相成分プロセスが処理するのは入力信号の遅延バージョンであり、それはその後複素数の指数関数を乗じられることが見て取れる。最後にすべての出力信号Yq(z) (q=0,...,Q−1)は逆FFT(スケーリング因子なし)を適用することによって見出される。図14は、この分解フィルタバンクの構成を示している。式(29)の多相フィルタは非因果的であるため、適正な量の遅延がすべての多相成分に加えられる必要がある。
上述した実施形態が本発明を解説するものであって限定するものではないこと、そして当業者には付属の特許請求の範囲から外れることなく数多くの代替的な実施形態を考案することができるであろうことを注意しておく。請求項においては、括弧内に置かれた参照符号があったとしても、それが請求項を限定するものと解釈してはならない。「有する」の語は請求項において挙げられている以外の要素またはステップの存在を排除しない。本発明はいくつかの異なる要素を有するハードウェアによって、および好適にプログラムされたコンピュータによって実装することができる。いくつかの手段を列挙している装置請求項においては、これらの手段のいくつかは同一のハードウェア項目によって具現されることができる。ある施策が互いに異なる従属請求項において述べられているというだけの事実がこれらの施策の組み合わせが有利に用いられないということを示すことはない。
考えられる態様をいくつか示しておく。
〔態様1〕
複合型のパラメトリック・ステレオおよびスペクトル帯域複製拡張されたオーディオ・エンコーダであって:
時間領域ステレオ入力信号をサブバンド領域に変換する分解フィルタバンクと、
サブバンド領域のステレオ入力信号についてパラメトリック・ステレオ・パラメータを計算してパラメトリック・ステレオ・ビットストリームを得て、サブバンド領域におけるモノ・ダウンミックスを生成するパラメトリック・ステレオ計算ユニットと、
サブバンド領域における前記モノ・ダウンミックスのスペクトル帯域複製パラメータを推定してスペクトル帯域複製ビットストリームを得るスペクトル帯域複製パラメータ推定ユニットと、
前記モノ・ダウンミックスをサブバンド領域から時間領域に変換する周波数‐時間変換器と、
時間領域のモノ・ダウンミックスをエンコードしてコア・ビットストリームを得るコア・エンコーダとを有する、
エンコーダ。
〔態様2〕
複合型のパラメトリック・ステレオおよびスペクトル帯域複製拡張オーディオ・エンコードの方法であって:
時間領域ステレオ入力信号をサブバンド領域に変換する段階と、
サブバンド領域のステレオ入力信号についてパラメトリック・ステレオ・パラメータを計算してパラメトリック・ステレオ・ビットストリームを得る段階と、
サブバンド領域におけるモノ・ダウンミックスを生成する段階と、
サブバンド領域における前記モノ・ダウンミックスのスペクトル帯域複製パラメータを推定してスペクトル帯域複製ビットストリームを得る段階と、
前記モノ・ダウンミックスをサブバンド領域から時間領域に変換する段階と、
時間領域のモノ・ダウンミックスをコア・エンコードしてコア・ビットストリームを得る段階とを有する、
方法。
〔態様3〕
複合型のパラメトリック・ステレオおよびスペクトル帯域複製拡張エンコードされたオーディオ信号であって:
ステレオ信号から導出されたパラメトリック・ステレオ・パラメータを含むパラメトリック・ステレオ・ビットストリームと、
前記ステレオ信号から導出されたモノ・ダウンミックスのスペクトル帯域複製パラメータを含むスペクトル帯域複製ビットストリームと、
コア・エンコードされたモノ・ダウンミックスを表すコア・ビットストリームとを含む、
信号。
〔態様4〕
コア・エンコードされたオーディオ信号、スペクトル帯域複製パラメータおよびパラメトリック・ステレオ・パラメータを含むエンコードされた入力信号をデコードする、複合型のパラメトリック・ステレオおよびスペクトル帯域複製拡張されたオーディオ・デコーダであって:
エンコードされたオーディオ信号をデコードしてデコードされたオーディオ信号を得るコア・デコーダと、
前記のデコードされたオーディオ信号をサブバンド領域に時間‐周波数変換する分解フィルタバンクと、
サブバンド領域において前記スペクトル帯域複製パラメータを使って完全バンド幅オーディオ信号を生成するための高周波発生器および包絡線調整器と、
前記パラメトリック・ステレオ・パラメータを使って前記完全バンド幅オーディオ信号をサブバンド領域のステレオ・オーディオ信号に変換するパラメトリック・ステレオ合成ユニットと、
前記完全バンド幅オーディオ信号をサブバンド領域から時間領域に変換する合成フィルタバンクとを有する、
デコーダ。
〔態様5〕
コア・エンコードされたオーディオ信号、スペクトル帯域複製パラメータおよびパラメトリック・ステレオ・パラメータを含むエンコードされた入力信号をデコードする、複合型のパラメトリック・ステレオおよびスペクトル帯域複製拡張オーディオ・デコードの方法であって:
エンコードされたオーディオ信号をコア・デコードしてデコードされたオーディオ信号を得る段階と、
前記のデコードされたオーディオ信号をサブバンド領域に時間‐周波数変換する段階と、
サブバンド領域において前記スペクトル帯域複製パラメータを使って完全バンド幅オーディオ信号を生成する段階と、
前記パラメトリック・ステレオ・パラメータを使って前記完全バンド幅オーディオ信号をサブバンド領域のステレオ・オーディオ信号に変換する段階と、
前記完全バンド幅オーディオ信号をサブバンド領域から時間領域に変換する段階とを有する、
方法。
〔態様6〕
複合型のパラメトリック・ステレオおよびスペクトル帯域複製拡張オーディオ・エンコードの方法を実行するようコンピュータに命令するコードを含むコンピュータ・プログラムであって、前記方法は:時間領域ステレオ入力信号をサブバンド領域に変換する段階と;サブバンド領域のステレオ入力信号についてパラメトリック・ステレオ・パラメータを計算してパラメトリック・ステレオ・ビットストリームを得る段階と;サブバンド領域におけるモノ・ダウンミックスを生成する段階と;サブバンド領域における前記モノ・ダウンミックスのスペクトル帯域複製パラメータを推定してスペクトル帯域複製ビットストリームを得る段階と;前記モノ・ダウンミックスをサブバンド領域から時間領域に変換する段階と;時間領域のモノ・ダウンミックスをコア・エンコードしてコア・ビットストリームを得る段階とを有するものである、
コンピュータ・プログラム。
〔態様7〕
コア・エンコードされたオーディオ信号、スペクトル帯域複製パラメータおよびパラメトリック・ステレオ・パラメータを含むエンコードされた入力信号をデコードする、複合型のパラメトリック・ステレオおよびスペクトル帯域複製拡張オーディオ・デコードの方法を実行するようコンピュータに命令するコードを含むコンピュータ・プログラムであって、前記方法は:エンコードされたオーディオ信号をコア・デコードしてデコードされたオーディオ信号を得る段階と;前記のデコードされたオーディオ信号をサブバンド領域に時間‐周波数変換する段階と;サブバンド領域において前記スペクトル帯域複製パラメータを使って完全バンド幅オーディオ信号を生成する段階と;前記パラメトリック・ステレオ・パラメータを使って前記完全バンド幅オーディオ信号をサブバンド領域のステレオ・オーディオ信号に変換する段階と;前記完全バンド幅オーディオ信号をサブバンド領域から時間領域に変換する段階とを有するものである、
コンピュータ・プログラム。

Claims (3)

  1. エンコードされた単一チャネル・オーディオ信号と空間的パラメータの組とを有するエンコードされたオーディオ信号をデコードする方法であって:
    前記エンコードされた単一チャネル・オーディオチャネルをデコードして複数のダウンサンプリングされたサブバンド信号を得、
    前記ダウンサンプリングされたサブバンド信号の少なくとも一つをさらなるフィルタバンクにおいてさらにサブバンドフィルタ処理して複数のサブ・サブバンド信号を提供する、
    ことを有しており、
    前記エンコードされたオーディオ信号はスペクトル帯域複製パラメータを含んでおり、前記複数のダウンサンプリングされたサブバンド信号および前記スペクトル帯域複製パラメータから高周波成分が導出され、前記二つのオーディオ・チャネルは前記空間的パラメータと、前記サブバンド信号と、さらなるサブバンドフィルタ処理をされていないダウンサンプリングされたサブバンド信号と、前記高周波成分とから導出される、
    方法。
  2. エンコードされた単一チャネル・オーディオ信号と空間的パラメータの組とを有するエンコードされたオーディオ信号をデコードするためのオーディオ・デコーダであって:
    前記エンコードされた単一チャネル・オーディオチャネルをデコードして複数のダウンサンプリングされたサブバンド信号を得るためのデコーダと、
    前記ダウンサンプリングされたサブバンド信号の少なくとも一つをさらなるフィルタバンクにおいてさらにサブバンドフィルタ処理して複数のサブ・サブバンド信号を提供するためのさらなるフィルタバンクと、
    前記エンコードされたオーディオ信号はスペクトル帯域複製パラメータを含んでおり、前記複数のダウンサンプリングされたサブバンド信号および前記スペクトル帯域複製パラメータから高周波成分が導出され、前記二つのオーディオ・チャネルは前記空間的パラメータと、前記サブバンド信号と、さらなるサブバンドフィルタ処理をされていないダウンサンプリングされたサブバンド信号と、前記高周波成分とから導出される、
    オーディオ・デコーダ。
  3. 請求項記載の方法を実行するようコンピュータに命令するためのコードを含むコンピュータ・プログラム。
JP2011036288A 2003-10-30 2011-02-22 オーディオ信号のエンコードまたはデコード Active JP5335015B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03104034 2003-10-30
EP03104034.8 2003-10-30

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009059145A Division JP5192424B2 (ja) 2003-10-30 2009-03-12 オーディオ信号のエンコードまたはデコード

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013096490A Division JP5889828B2 (ja) 2003-10-30 2013-05-01 オーディオ信号のエンコードまたはデコード

Publications (2)

Publication Number Publication Date
JP2011128649A JP2011128649A (ja) 2011-06-30
JP5335015B2 true JP5335015B2 (ja) 2013-11-06

Family

ID=34530779

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2006537530A Active JP4966013B2 (ja) 2003-10-30 2004-10-28 オーディオ信号のエンコードまたはデコード
JP2009059145A Active JP5192424B2 (ja) 2003-10-30 2009-03-12 オーディオ信号のエンコードまたはデコード
JP2011036288A Active JP5335015B2 (ja) 2003-10-30 2011-02-22 オーディオ信号のエンコードまたはデコード
JP2013096490A Active JP5889828B2 (ja) 2003-10-30 2013-05-01 オーディオ信号のエンコードまたはデコード

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2006537530A Active JP4966013B2 (ja) 2003-10-30 2004-10-28 オーディオ信号のエンコードまたはデコード
JP2009059145A Active JP5192424B2 (ja) 2003-10-30 2009-03-12 オーディオ信号のエンコードまたはデコード

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013096490A Active JP5889828B2 (ja) 2003-10-30 2013-05-01 オーディオ信号のエンコードまたはデコード

Country Status (12)

Country Link
US (3) US7519538B2 (ja)
EP (1) EP1683133B1 (ja)
JP (4) JP4966013B2 (ja)
KR (2) KR101106026B1 (ja)
CN (2) CN1875402B (ja)
AT (1) ATE354160T1 (ja)
BR (2) BR122018007834B1 (ja)
DE (1) DE602004004818T2 (ja)
ES (1) ES2282899T3 (ja)
PL (1) PL1683133T3 (ja)
RU (1) RU2374703C2 (ja)
WO (1) WO2005043511A1 (ja)

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
ES2791001T3 (es) * 2004-11-02 2020-10-30 Koninklijke Philips Nv Codificación y decodificación de señales de audio mediante el uso de bancos de filtros de valor complejo
BRPI0516658A (pt) * 2004-11-30 2008-09-16 Matsushita Electric Ind Co Ltd aparelho de codificação de estéreo, aparelho de decodificação de estéreo e seus métodos
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
JP2008542816A (ja) * 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP2009500656A (ja) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
PL1905006T3 (pl) * 2005-07-19 2014-02-28 Koninl Philips Electronics Nv Generowanie wielokanałowych sygnałów audio
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
KR101169280B1 (ko) * 2005-08-30 2012-08-02 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100857121B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
EP1946062A4 (en) * 2005-10-05 2009-09-09 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US20070092086A1 (en) * 2005-10-24 2007-04-26 Pang Hee S Removing time delays in signal paths
EP1974347B1 (en) 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
KR101366291B1 (ko) * 2006-01-19 2014-02-21 엘지전자 주식회사 신호 디코딩 방법 및 장치
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
KR101015037B1 (ko) 2006-03-29 2011-02-16 돌비 스웨덴 에이비 오디오 디코딩
US7612275B2 (en) * 2006-04-18 2009-11-03 Nokia Corporation Method, apparatus and computer program product for providing rhythm information from an audio signal
US7818079B2 (en) * 2006-06-09 2010-10-19 Nokia Corporation Equalization based on digital signal processing in downsampled domains
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
AR061807A1 (es) 2006-07-04 2008-09-24 Coding Tech Ab Compresor de filtro y metodo para fabricar respuestas al impulso de filtro de subbanda comprimida
US7876904B2 (en) 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US7783478B2 (en) * 2007-01-03 2010-08-24 Alexander Goldin Two stage frequency subband decomposition
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8655663B2 (en) * 2007-10-26 2014-02-18 D&M Holdings, Inc. Audio signal interpolation device and audio signal interpolation method
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
AU2008339211B2 (en) 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2260487B1 (en) * 2008-03-04 2019-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
KR101428487B1 (ko) 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
TWI559680B (zh) * 2009-02-18 2016-11-21 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
AU2016262695B2 (en) * 2009-02-18 2017-11-09 Dolby International Ab Low Delay Modulated Filter Bank
AU2012204068B2 (en) * 2009-04-03 2013-12-19 Ntt Docomo, Inc. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
JP5365363B2 (ja) * 2009-06-23 2013-12-11 ソニー株式会社 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
EP3723090B1 (en) 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
CN103854651B (zh) 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
RU2683175C2 (ru) 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
EP2581905B1 (en) 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US9117459B2 (en) * 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
BR122021003887B1 (pt) 2010-08-12 2021-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
CA3220202A1 (en) 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
KR20120038311A (ko) 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
MY160265A (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
PL2676268T3 (pl) * 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
KR101424372B1 (ko) 2011-02-14 2014-08-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 랩핑 변환을 이용한 정보 신호 표현
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
CN103918029B (zh) * 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
US9064503B2 (en) 2012-03-23 2015-06-23 Dolby Laboratories Licensing Corporation Hierarchical active voice detection
WO2013186343A2 (en) * 2012-06-14 2013-12-19 Dolby International Ab Smooth configuration switching for multichannel audio
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
ES2688134T3 (es) 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
WO2015189533A1 (en) * 2014-06-10 2015-12-17 Meridian Audio Limited Digital encapsulation of audio signals
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
JP6360253B2 (ja) * 2014-09-12 2018-07-18 ドルビー ラボラトリーズ ライセンシング コーポレイション サラウンドおよび/または高さスピーカーを含む再生環境におけるオーディオ・オブジェクトのレンダリング
US9837065B2 (en) 2014-12-08 2017-12-05 Ford Global Technologies, Llc Variable bandwidth delayless subband algorithm for broadband active noise control system
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
JP6797187B2 (ja) * 2015-08-25 2020-12-09 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ・デコーダおよびデコード方法
WO2017124007A1 (en) * 2016-01-15 2017-07-20 Dolby Laboratories Licensing Corporation Audio signal processing with low latency
EP3203472A1 (en) * 2016-02-08 2017-08-09 Oticon A/s A monaural speech intelligibility predictor unit
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
WO2019091575A1 (en) * 2017-11-10 2019-05-16 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
CN107918710B (zh) * 2017-11-22 2020-11-06 桂林电子科技大学 基于凸优化的非下采样图滤波器组的设计方法
CN108806705A (zh) * 2018-06-19 2018-11-13 合肥凌极西雅电子科技有限公司 音频处理方法和处理系统
US11195543B2 (en) 2019-03-22 2021-12-07 Clear Peaks LLC Systems, devices, and methods for synchronizing audio
CN113314132B (zh) * 2021-05-17 2022-05-17 武汉大学 交互式音频系统中的音频对象编码方法、解码方法及装置
CN117292694B (zh) * 2023-11-22 2024-02-27 中国科学院自动化研究所 基于时不变编码的少令牌神经语音编解码方法和系统

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3211752C2 (de) * 1982-03-30 1985-09-26 Siemens AG, 1000 Berlin und 8000 München Verfahren zum selektiven Abscheiden von aus Siliziden hochschmelzender Metalle bestehenden Schichtstrukturen auf im wesentlichen aus Silizium bestehenden Substraten und deren Verwendung
JPS621228A (ja) 1985-06-26 1987-01-07 Fujitsu Ltd タングステンシリサイドの選択成長方法
US4692343A (en) * 1985-08-05 1987-09-08 Spectrum Cvd, Inc. Plasma enhanced CVD
US4737474A (en) * 1986-11-17 1988-04-12 Spectrum Cvd, Inc. Silicide to silicon bonding process
US4902645A (en) * 1987-08-24 1990-02-20 Fujitsu Limited Method of selectively forming a silicon-containing metal layer
EP0446037B1 (en) * 1990-03-09 1997-10-08 AT&T Corp. Hybrid perceptual audio coding
JPH0410429A (ja) 1990-04-26 1992-01-14 Matsushita Electron Corp 半導体装置
JP2892451B2 (ja) 1990-07-13 1999-05-17 住友重機械工業株式会社 電気―空気サーボアクチュエータ
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5392037A (en) * 1991-05-21 1995-02-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for encoding and decoding
JP2778324B2 (ja) * 1992-01-24 1998-07-23 日本電気株式会社 サブバンド分割方式
JPH05235701A (ja) * 1992-02-25 1993-09-10 Nippon Steel Corp 環状畳み込みによるディジタルフィルタバンク処理方法及び装置
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5926791A (en) * 1995-10-26 1999-07-20 Sony Corporation Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
KR100354531B1 (ko) * 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6996198B2 (en) * 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩

Also Published As

Publication number Publication date
EP1683133B1 (en) 2007-02-14
US20090216544A1 (en) 2009-08-27
JP2013167908A (ja) 2013-08-29
JP2011128649A (ja) 2011-06-30
US7519538B2 (en) 2009-04-14
US20070067162A1 (en) 2007-03-22
JP2007514962A (ja) 2007-06-07
ATE354160T1 (de) 2007-03-15
CN1875402A (zh) 2006-12-06
DE602004004818D1 (de) 2007-03-29
BR122018007834B1 (pt) 2019-03-19
BRPI0415951A (pt) 2007-01-02
US8073685B2 (en) 2011-12-06
CN101540171A (zh) 2009-09-23
KR101106026B1 (ko) 2012-01-17
JP5192424B2 (ja) 2013-05-08
DE602004004818T2 (de) 2007-12-06
ES2282899T3 (es) 2007-10-16
JP4966013B2 (ja) 2012-07-04
CN1875402B (zh) 2012-03-21
US20110178810A1 (en) 2011-07-21
PL1683133T3 (pl) 2007-07-31
RU2006118682A (ru) 2007-12-10
US8260607B2 (en) 2012-09-04
JP2009163257A (ja) 2009-07-23
WO2005043511A1 (en) 2005-05-12
KR101217649B1 (ko) 2013-01-02
BRPI0415951A8 (pt) 2018-05-02
KR20110113765A (ko) 2011-10-18
EP1683133A1 (en) 2006-07-26
BRPI0415951B1 (pt) 2018-08-28
KR20060131745A (ko) 2006-12-20
CN101540171B (zh) 2013-11-06
JP5889828B2 (ja) 2016-03-22
RU2374703C2 (ru) 2009-11-27

Similar Documents

Publication Publication Date Title
JP5335015B2 (ja) オーディオ信号のエンコードまたはデコード
RU2705007C1 (ru) Устройство и способ для кодирования или декодирования многоканального сигнала с использованием сихронизации управления кадрами
EP1810281B1 (en) Encoding and decoding of audio signals using complex-valued filter banks
Schuijers et al. Low complexity parametric stereo coding
EP1789954B1 (en) Partially complex modulated filter bank
TWI523005B (zh) 交叉乘積加強之諧波移調
US8315859B2 (en) Efficient filtering with a complex modulated filterbank
US20070038439A1 (en) Audio signal generation
TW201044379A (en) Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension
JP2006523859A (ja) オーディオ信号合成
Chen et al. Spatial parameters for audio coding: MDCT domain analysis and synthesis
US20100179814A1 (en) Partially complex modulated filter bank

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130730

R150 Certificate of patent or registration of utility model

Ref document number: 5335015

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250