JP2011203732A - オーディオ信号の符号化及び復号化のマスキング・レベルが求められる励起パターンを符号化し、復号化する方法及び装置 - Google Patents

オーディオ信号の符号化及び復号化のマスキング・レベルが求められる励起パターンを符号化し、復号化する方法及び装置 Download PDF

Info

Publication number
JP2011203732A
JP2011203732A JP2011063490A JP2011063490A JP2011203732A JP 2011203732 A JP2011203732 A JP 2011203732A JP 2011063490 A JP2011063490 A JP 2011063490A JP 2011063490 A JP2011063490 A JP 2011063490A JP 2011203732 A JP2011203732 A JP 2011203732A
Authority
JP
Japan
Prior art keywords
matrix
audio signal
excitation pattern
encoding
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011063490A
Other languages
English (en)
Other versions
JP5802412B2 (ja
JP2011203732A5 (ja
Inventor
Florian Keiler
ケイラー フロリアン
Oliver Wuebbolt
ウーボルト オリヴァー
Johannes Boehm
ベーム ヨーハネス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2011203732A publication Critical patent/JP2011203732A/ja
Publication of JP2011203732A5 publication Critical patent/JP2011203732A5/ja
Application granted granted Critical
Publication of JP5802412B2 publication Critical patent/JP5802412B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/155User input interfaces for electrophonic musical instruments
    • G10H2220/265Key design details; Special characteristics of individual keys of a keyboard; Key-like musical input devices, e.g. finger sensors, pedals, potentiometers, selectors
    • G10H2220/311Key design details; Special characteristics of individual keys of a keyboard; Key-like musical input devices, e.g. finger sensors, pedals, potentiometers, selectors with controlled tactile or haptic feedback effect; output interfaces therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】オーディオ変換符号化器におけるスペクトル・データの量子化のために、心理音響学的情報(すなわち、真のマスキング閾値の近似)が必要である。
【解決手段】本発明によれば、オーディオ信号符号化において量子化する対象のスペクトル毎に、長いウィンドウ/変換長及び短いウィンドウ/変換長について、励起パターンが計算され、符号化される。励起パターンは可変サイズのマトリクスにおいて互いにグループ化される。固定数の値のみの所定のソート順序が励起パターン・データ・マトリクス値に施され、その再配列により、二次マトリクスが形成され、上記二次マトリクスのビット平面に対してSPECK符号化が施される。
【選択図】図1

Description

本発明は、オーディオ信号変換コデックのマスキング・レベルが求められる励起パターンを符号化し、復号化する方法及び装置に関する。
オーディオ変換符号化器におけるスペクトル・データの量子化のために、心理音響学的情報(すなわち、真のマスキング閾値の近似)が必要である。対応するオーディオ変換復号化器では、量子化データを再構成するために、同じ近似が使用される。符号化器側では、ソース信号の重なる部分がウィンドウ関数を使用してウィンドウイングされる。復号化器側では、重なり+加算(overlap+add)が、復号化された信号ウィンドウについて行われる。
送信する対象のサイド情報データの量を制限するために、mp3及びAACのような既知の変換コデックは、(「スケール係数帯」としても表す)クリティカルな帯のマスキング情報スケール係数として使用されている。これは、近傍周波数ビン又は係数の群について、量子化処理に先行して、同じスケール係数が使用される(K.Brandenburg、 M.Bosiによる「ISO/IEC MPEG−2 Advanced Audio Coding: Overview and Applications, 103rd AES Convention, 26−29 September 1997, New York, preprint No. 4641」を参照されたい)。
しかし、スケール係数は、マスキング閾値の粗い(ステップ単位の)近似のみを表す。(わずかに)異なる振幅周波数ビンの群は同じスケール係数を取得するため、マスキング閾値の前述の表現の精度は非常に制限され、よって、適用されたマスキング閾値は、相当数の周波数ビンについて最適でない、
符号化/復号化品質を向上させるために、マスキング・レベルを、
S. van de Par、 A.Kohlrausch、 G.Charestan、 R.Heusdensによる「A new psychoacoustical masking model for audio coding applications, Proceedings ICASSP ’02, IEEE International Conference on Acoustics, Speech and Signal Processing, 2002, Orlando, vol.2, pp. 1805−1808」、
S. van de Par, A.Kohlrausch, G.Charestan, R.Heusdens, J.Jensen, S.H.Jen−senによる「A Perceptual Model for Sinusoidal Audio Coding Based on Spectral Integration」
に示すように計算することが可能であり、
ここで、マスキング閾値は、符号化する対象のオーディオ信号の電力スペクトルから導き出される「励起パターン」から導き出される。
マスキングの目的で前述の励起パターンを施すオーディオ・コデックは、O.Niemeyer、 B.Edlerによる「Efficient Coding of Excitation Patterns Combined with a Transform Audio Coder、118th AES Convention、 28−31 May 2005、 Barcelona、Paper 6466」に開示されている。符号化する対象のスペクトル・オーディオ・データ・ブロック毎に励起パターンが計算され、ここで、励起パターンは、人間の耳の周波数依存性心理音響学特性を表す。
スケール係数ベースのマスキングと比較して、結果として生じるデータ・レートのかなりの増加を避けるために、それぞれの場合、連続する16個の励起パターンが、前述の励起パターンを効率的に符号化するために合成される。励起パターン・マトリクス値は、W.A.Pearlman、 A.Islam、 N.Nagaraj、 A.Saidによる「Efficient, Low−Complexity Image Coding With a Set−Partitioning Embedded Block Coder, IEEE Transactions on Circuits and Systems for Video Technology、 Nov. 2004, vol. 14, no. 11, pp. 1219−1235」において、画像符号化アプリケーションについて記載されたように符号化されたSPECK(集合分割埋め込みブロック)である。
対数スケール・マトリクス値の2次元DCT変換、並びに、周波数及び時間にわたる2次元行列の、励起パターン値による構築に続いて、実際の励起パターン符号化が行われる。最上位ビットから始めて、ビット平面において、結果として生じる変換係数が量子化され、エントロピ符号化され、これにより、SPECK符号化された位置及び係数の符号がビット・ストリーム・サイド情報としてオーディオ復号化器に転送される。
符号化器及び復号化器側では、符号化された励起パターンは相応に、オーディオ信号符号化及び復号化において施される対象のマスキング閾値を算出するために復号化されるので、算出されたマスキング閾値は符号化器及び復号化器において同一である。オーディオ信号量子化は、結果として生じる改良されたマスキング閾値によって制御される。
別々のウィンドウ/変換の長さがオーディオ信号符号化のために使用され、固定長が励起パターンのために使用される。
前述の励起パターン・オーディオ符号化処理の欠点は、符号化器におけるいくつかのブロックの励起パターンを併せて符号化することによってもたらされる処理遅延であるが、スペクトル・データの符号化のマスキング閾値の更に正確な表現を実現することが可能であり、それにより、向上した符号化/復号化品質を実現することが可能である一方、複数ブロックの合成した励起パターン符号化は、サイド情報データのわずかな増加のみをもたらす。
上述のNiemeyer/Edler処理では、励起パターンから導き出されるマスキング閾値は、オーディオ信号符号化において選択されるウィンドウ及び変換長と無関係である。その代わりに、励起パターンはオーディオ信号の固定長部分から導き出される。しかし、短いウィンドウ及び変換長は、より高い時間分解能を表し、最適な符号化/復号化品質のために、関連したマスキング閾値のレベルは相応に適合させるべきである。
本発明によって解決される課題は、サイド情報データ・レートの増加をもたらすことなく、マスキング閾値の算出を向上させることにより、オーディオ信号の符号化/復号化の品質を更に増加させることである。前述の課題は、請求項1及び5に記載の方法によって解決される。前述の方法を利用する装置は請求項2及び6に記載されている。
本発明によれば、オーディオ信号の符号化において量子化される対象のスペクトル毎に、励起パターンが計算され、符号化され、すなわち、より短いウィンドウ/変換毎に、それ自身の励起パターンが算出され、それにより、励起パターンの時間分解能は可変である。長いウィンドウ/変換、及びより短いウィンドウ/変換の励起パターンは、対応するマトリクス又はブロックにおいてグループ化される。励起パターン・データの量は、長いウィンドウ/より短い変換長について(すなわち、非過渡ソース信号部分について、かつ、過渡ソース信号部分について)同じである。励起パターン・マトリクスはしたがって、各フレームにおける別の数の行を有し得る。
励起パターン符号化に関し、マトリクス値の任意の対数微積分に続いて、所定の走査又はソート順序が2次元の変換励起パターン・データ・マトリクス値に施され、その再配列により、そのマトリクス・ビット平面にSPECK符号化が直接施される二次マトリクスを形成することが可能である。走査経路のみの固定数の値が符号化される。
基本的には、対応する励起パターン復号化に続いてオーディオ信号符号化のマスキング・レベルが求められる励起パターンの符号化に適しており、オーディオ信号符号化のために、オーディオ信号が、別々のウィンドウ及びスペクトル変換長を使用して連続して処理され、最長変換長の特定の倍数を表すオーディオ信号の部分がフレームと表され、励起パターンが、オーディオ信号の連続する部分のスペクトル表現に関係付けられ、方法は、以下の工程を含む。
a)オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のケースそれぞれにおいて、励起パターン・マトリクスPを形成し、異なるスペクトル変換長毎に、対応する励起パターンがマトリクスPに含められ、各マトリクスPのエントリの対数をとる工程であって、結果として生じるマトリクス・サイズが以下の工程の変換に適していない場合、マトリクスのサイズは、マトリクス境界にある励起パターンの値を、必要な回数だけ複製することによって増加させられる工程と、
b)対数化されたマトリクスPの値に対して2次元変換を施し、それにより、マトリクスPがもたらされる工程と、
c)マトリクスPにおいて係数に、所定のソート順序を施し、所定のソート順序がマトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、最初の値から始めて、対応するソート経路の固定数の値のみを取得し、前述の値により、マトリクスPの二次バージョンPTqを形成する工程と、
d)マトリクスPTqのSPECKビット平面が処理されるマトリクスPTqのSPECK符号化を行い、ビット平面における対応する係数ビットの位置を位置特定し、符号化するために、連続する分割が使用される工程とを含む。
基本的には、本発明の符号化装置は、励起パターンが符号化されるオーディオ信号符号化器であり、それから、対応する励起パターン復号化に続いてオーディオ信号の符号化のマスキング・レベルが求められ、オーディオ信号を符号化するために、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され、最長の変換長の特定の倍数を表すオーディオ信号の部分がフレームと表され、励起パターンはオーディオ信号の連続する部分のスペクトル表現に関係付けられ、上記装置は、
オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のケースそれぞれにおいて、励起パターン・マトリクスPを形成し、異なるスペクトル変換長毎に、対応する励起パターンがマトリクスPに含められ、
各マトリクスPのエントリの対数をとるよう適合された手段であって、
結果として生じるマトリクス・サイズが以下の工程の変換に適していない場合、マトリクスのサイズは、マトリクス境界にある励起パターンの値を、必要な回数だけ複製することによって増加させられ、
対数化されたマトリクスPの値に対して2次元変換を施し、それにより、マトリクスPがもたらされ、
マトリクスPにおいて係数に、所定のソート順序を施し、所定のソート順序がマトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、
最初の値から始めて、対応するソート経路の固定数の値のみを取得し、前述の値により、マトリクスPの二次バージョンPTqが形成される手段と、
マトリクスPTqのSPECK符号化を行うよう適合された手段であって、そのSPECK符号化において、マトリクスPTqのビット平面が処理され、ビット平面における対応する係数ビットの位置を位置特定し、符号化するために、連続する分割が使用される手段と
を含む。
基本的には、本発明の復号化方法は、上記符号化方法によって符号化された励起パターンを復号化するのに適しており、その励起パターンから、符号化オーディオ信号復号化のマスキング・レベルが求められ、オーディオ信号復号化のために、異なるウィンドウ及びスペクトル逆変換長を使用してオーディオ信号が連続して処理され、最長の変換長の特定の倍数を表すオーディオ信号の部分がフレームと表され、励起パターンが、オーディオ信号の連続する部分のスペクトル表現に関係付けられ、方法は、
a)ビット・ストリームから受け取られた対応するデータに対して、二次マトリクスPTqの対応するSPECK復号化を行う工程と、
b)符号化において使用されるようにソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加える工程と、
(現在のマトリクスのソート・インデクスに応じて、符号化において使用されるような逆ソート順序を施すことにより、前述のデータを再構成マトリクスPに戻し、そのソート・インデクスは適切なマトリクス・サイズを確立するためにも使用される工程と、
c)再構成された励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及び逆対数をマトリクスPに施す工程
とを含む。
基本的には、本発明の復号化装置は、上記符号化方法によって符号化された励起パターンは、復号化され、符号化オーディオ信号の復号化のマスキング・レベルを求めるために使用され、オーディオ信号を復号化するために、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され、最長の変換長の特定の倍数を表すオーディオ信号の部分がフレームと表され、励起パターンはオーディオ信号の連続する部分のスペクトル表現に関係付けられ、装置は、
ビット・ストリームから受け取られた対応するデータに対して、二次マトリクスPTqの対応するSPECK復号化を行い、
符号化において使用されるソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加え、
現在のマトリクスのソート・インデクスに応じて、符号化において使用されるような逆ソート順序を施すことにより、前述のデータを再構成マトリクスPに戻し、そのソート・インデクスは適切なマトリクス・サイズを確立するためにも使用され、
再構成された励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及び逆対数をマトリクスPに対して施すよう適合された手段と、
マスキング閾値をマトリクスPの励起パターンから算出するよう適合される手段と、
マスキング閾値を使用して符号化オーディオ信号を復号化し、再量子化し、結果として生じる信号を逆変換し、重なり+加算処理を施すよう適合された手段と
を備える。
本発明の符号化器を示すブロック図である。 本発明の復号化器を示すブロック図である。 励起パターン符号化を示すフロー図である。 励起パターン復号化を示すフロー図である。
本発明の効果的な更なる実施例は、それぞれの従属請求項に記載している。
本発明の例示的な実施例は、添付図面を参照して説明する。
図1の本発明のオーディオ変換符号化器のブロック図では、オーディオ入力信号10は、周波数変換工程又は段12において入力信号10に対して施される対象の現在のウィンドウ・タイプWTを選択する過渡検出器工程又は段11にルックアヘッド遅延部121を通って進む。工程/段12では、現在のウィンドウ・タイプに対応するブロック長を有する変調されたラップ変換(MLT)(例えば、MDCT(修正された離散コサイン変換))が使用される。K個の入力信号サンプルの連続する部分が、工程/段12に入力され、Kは、例えば「128」又は「1024」の値を有する。50%のウィンドウの重なりにより、変換長はN=2Kになる。変換されたオーディオ信号は、対応する段/工程15において量子化され、エントロピ符号化される。工程/段14における励起パターン・ブロック処理のように、変換係数が、段/工程15においてブロック単位で処理されることを要しない。符号化された周波数ビンCFB、ウィンドウ・タイプのコードWT、励起データ・マトリクス符号EPM、及び、場合によっては、他のサイド情報データが、符号化されたビット・ストリーム17を出力するビット・ストリーム多重化器工程/段16において多重化される。
上述の通り、部分14における励起パターンの計算のために電力スペクトルが必要である。電力スペクトルを得るために、現在ウィンドウイングされた信号ブロックは更に、MDST(修正された離散サイン変換)を使用して工程/段12において変換される。MLT及びMDSTタイプの周波数表現は何れも、最大L個のブロックを記憶するバッファ13に供給され、ここで、Lは例えば、「8」や「16」である。現在のウィンドウ・タイプのコードは更に、一ブロック変換期間に対応する遅延部111を介してバッファ13に供給される。各変換の出力は、一信号ブロックのK個の周波数ビンを含む。過渡が工程/段11で検出される場合、長さN=2Kの単一の長いウィンドウの代わりに、整数数L個の短いウィンドウ(すなわち、ブロック)によってウィンドウイングされ、Lは例えば、「3」又は「8」であり、1つの長い信号ブロックの短いウィンドウ全ての合計周波数ビン数はKである。
L個の信号ブロックのいくつか、「フレーム」と表すデータ群を形成する。励起パターン符号化が、工程/段141において、フレームの励起パターンに施される。後に量子化される対象のスペクトル毎に、一励起パターンが計算される。この特徴は、上記刊行物(Brandenburg及びNiemeyer/Edler)に記載されたオーディオ符号化、及び
International Standard ISO/IEC 11172−3:「Information technology − Coding of moving pictures and associated audio for digital storage media at up to about 1.5Mbit/s − Part 3: Audio」、
International Standard ISO/IEC 11818−3::「Information technology − Generic coding of moving pictures and associated audio information − Part 3: Audio」
の標準における対応する特徴と異なり、励起パターンの固定時間分解能が使用される。
励起パターン・データの量は、長い変換長の場合も短い変換長の場合も同じである。その結果、短いウィンドウを含む信号ブロックの場合、長いウィンドウを含む信号ブロックよりも、多くの励起パターン・データを符号化しなければならない。
符号化する対象の励起パターンは好ましくは、非二次形状を有するマトリクスP内に構成される。マトリクスの各行は、量子化する対象の一スペクトルに対応する一励起パターンを含む。よって、行及び列のインデクスは、時間軸及び周波数軸それぞれに対応する。マトリクスPにおける行の数は少なくともLであるが、Niemeyer/Edler刊行物に記載された処理と対照的に、マトリクスPは、各フレームにおいて、異なる数の行を有し得る。その数は、対応するフレームにおける短いウィンドウの数に依存するからである。
あるいは、マトリクスPの行及び列を入れ替えることが可能である。
(例えば、縦続接続された2つの1次元DCTを使用することにより、)2次元変換を施すために、変換が扱うことが可能な行の数(例えば、偶数)を得るためにマトリクスの最終行(又は更に多くの行)を複製することが可能である。
表1は、11行をもたらす、短いウィンドウを使用した一ブロックを有するフレームの例を示す。2次元変換は「4」の倍数である入力サイズを処理することが可能であるため、最後の行は複製される。
Figure 2011203732
上述のNiemeyer/Edler刊行物におけるセクション3.2と同様に、励起パターン・マトリクスPの実際の符号化が以下のように行われる(図3も参照されたい)が、重要な差がいくつか存在している。
a)マトリクスPのエントリそれぞれの対数をとる
b)結果として生じるマトリクス値に対して、2次元変換を施す(すなわち、マトリクスPとして表すスペクトル励起パターン表現)が再び変換される
c)(例えば、通常、非常に小さい振幅を有する高周波コンテンツを表すマトリクスP列を除去することによって)符号化される対象の変換マトリクスP列の数を削減する
d)所定の走査順序(すなわち、所定のソート)を、変換されたマトリクスPの係数に施す。前置処理では、(すなわち、マトリクスP毎の短いウィンドウの励起パターンの数に応じて)マトリクス・サイズ毎の走査又はソート順序が、代表的な入力信号での訓練を行うことによって求められる。
コメント:理想的なケースでは、変換されたマトリクスPの係数の絶対値が次いで、走査経路に沿って降順に配置される。
e)更に、走査又はソート経路の固定数の値のみを使用することにより、符号化する対象のデータの数を更に削減する。すなわち、走査経路の最後における対応する値を除去し、走査経路からの値で、行単位又は列単位で二次マトリクスPTqを埋めることにより、マトリクス列の二次バージョンPTqを形成する。上記固定数は、先行する訓練処理においても求められている。
二次マトリクスPTqは、対応するベクトルにより、処理において表すことも可能である。
f)マトリクスPTq毎に、上記Pearlmanらの刊行物においてsection II及びIII, III.A−Dに記載されたSPECK処理を行い、二次マトリクスPTqのビット平面が処理され、継続した分割を使用して、ビット平面における対応する係数ビットの位置を位置特定し、符号化する。
二次マトリクスPTqの係数の符号を表すビットは、EPMコード・データに加えることが可能であるか、又は、多重化器16においてビット・ストリームに、直接(すなわち、特定の符号化なしで)、加えることが可能である。
Niemeyer/Edler刊行物と比較すれば、励起パターン符号化処理は上記工程c)、d)及びe)において異なる。工程c)は、本発明の処理において更に行われる。工程d)に関し、マトリクスP係数の再配列が行われ、この再配列は、異なるマトリクス・サイズについて異なる。
工程e)に関し、再配列又は走査は、Niemeyer/Edler処理に対して
結果として生じるマトリクスPTqは二次であり、よって、ビット平面に対するSPECK処理は直接施すことが可能である一方、Niemeyer/Edlerでは、元のSPECK処理を行うことが可能である前に、矩形マトリクスをいくつかの二次マトリクスに分割しなければならず、さもなければ、元のSPECK処理は、変更しなければならないということ、及び
施された走査経路内に、最後のマトリクス係数が、最小の振幅を有する可能性が高いので、固定数の係数のみが、わずかな振幅係数のみを省略する一方、Niemeyer/Edlerでは、「最も低い1つ又は複数のビット平面をスキップすること」により、「特定のビット・レート制約が満たされる」か、又は、「変換係数マトリクスの十分な近似が実現される」場合、符号化ループが停止する。すなわち、Niemeyer/Edlerでは、省略された係数は、一部の上位係数を含み得、かつ/又は、マトリクスの係数は全て、より粗い量子化を得ることが可能である。
工程d)では、考えられるマトリクスPサイズ毎のマトリクスPのソート又は走査順序を(例えば、対応する走査経路をオーディオ符号化器のメモリ及びオーディオ復号化器のメモリに記憶するソート・インデクスを求めることによって)与えなければならない。
オーディオ信号のタイプ全てについて一度行われる訓練段階では、マトリクス要素全ての統計が集められる。その目的で(例えば、各種オーディオ信号の複数のテスト・マトリクスについて)、マトリクス・エントリ毎の二乗値が、算出され、マトリクス内の値位置毎のテスト・マトリクスにわたって平均化される。次いで、振幅の順序がソートの順序を表す。この種の処理は、考えられるマトリクス・サイズ全てについて行われ、対応するソート・インデクスが、マトリクス・サイズ毎のソート配列に割り当てられる。前述のソート・インデクスは、励起パターンのマトリクス符号化及び復号化処理において走査又はソート順序を(自動的に)選択するために使用される。
上記工程e)に記載したように、符号化する対象の値の数は更に削減される。(訓練段階において求められた)統計から、符号化する対象の固定数の値が評価される。ソートに続いて、和が合計エネルギの特定の閾値(例えば、0.999)になる値の数のみが使用される。
オーディオ信号符号化器では、励起データ・マトリクス符号EPMはソート・インデクス情報を含み得る。データ・レート全体をセーブする代替策として、復号化器側で、フレーム毎の(ウィンドウ・タイプ・コードWTによってシグナナリングされるように)短いウィンドウの数によって自動的に求められる。工程/段141において符号化された励起パターンは、励起パターン復号化器工程又は段142において以下に説明するように復号化される。Lブロックの復号化された励起パターンから、対応するマスキング閾値がマスキング閾値/算出器工程/段143において算出され、その出力は、工程/段12及びバッファ13から受け取られる変換係数毎に現在のマスキング閾値を量子化及びエントロピ符号化段/工程15に供給するバッファ144に中間的に記憶される。量子化及びエントロピ符号化段/工程15は、符号化周波数ビンCFBをビット・ストリーム多重化器16に供給する。
図2に示す本発明の復号化器では、受け取られた符号化ビット・ストリーム27は、ビット・ストリーム逆多重化器工程/段26において、ウィンドウ・タイプ符号WT、符号化周波数ビンCFB、励起パターン・データ・マトリクス符号EPM、及び場合によっては他のサイド情報データに分割される。エントロピ符号化されたCFBデータは、ウィンドウ・タイプ符号WTを使用して、対応する段/工程25においてエントロピ復号化され、逆量子化され、マスキング閾値情報が、励起パターン・ブロック処理工程/段24において算出される。再構成された周波数ビンは、逆MLT変換され、重なり+加算処理される。これには、再構成されたオーディオ信号20を出力する逆変換/重なり+加算工程/段23における現在のウィンドウ・タイプ符号WTに対応するブロック長が用いられる。励起パターン・データ・マトリクス符号EPMは励起パターン復号化器242において復号化され、それにより、対応する逆SPECK処理はマトリクスPTqの複製を提供し、対応する逆走査は変換マトリクスPの複製を提供し、対応する逆変換は、現在のブロックの再構成マトリクスPを提供する。再構成されたマトリクスPの励起パターンは、バッファ244に中間的に記憶され、段/工程25に供給される、現在のブロックのマスキング閾値を再構成するためにマスキング閾値算出工程/段243において使用される。
A)対応するSPECK復号化処理を施す工程、
B)符号化器において使用されるように走査経路又はソート経路におけるデータの同じ(すなわち、元の)数を得るために再構成マトリクスPTqデータにゼロを加える工程、
C)符号化器に使用される逆ソート順序を施すことにより、前述のデータを、削減されたサイズの変換されたマトリクスに戻す工程であって、関連付けられたソート・インデクスが、適切なサイズのマトリクスに、復号化されたデータを戻すために使用される工程、
D)再構成されたマトリクスPを得るためにゼロで、前述の再構成されたマトリクスにおける欠落している列を埋める工程、
E)再構成されたマトリクスを得るよう2次元逆変換を施す工程、及び
F)再構成された励起パターン・マトリクスPを得るようマトリクス・エントリ全ての逆対数を得る工程
が、励起パターンを再構成するためにパターン復号化器242において行われる(図4も参照されたい)。
ステレオ/マルチチャネル信号の励起パターン符号化
ステレオ入力信号、又は、より一般には、マルチチャネル信号を処理する場合、チャネル間の相関を励起パターン符号化において使用することが可能である。例えば、同期化された過渡検出を使用することが可能であり、ここで、チャネル信号は同じウィンドウ・タイプによって処理される。すなわち、チャネルnch毎に、同じサイズの励起パターン・マトリクスP(nch)が得られる。個々のマトリクスを別々のマルチチャネル符号化モードk:
チャネル毎にインタリーブされた励起パターン:LRLRLR、
チャネル・データを有する合成マトリクス:LLLRRR、及び
チャネル毎の個別の1つのマトリクス
において符号化することが可能である(ここで、ステレオ・ケースでは、L及びRは左チャネル及び右チャネルに対応するデータを表す)。
符号化器では、3つの符号化モードkは全て、行うことが可能であり、励起パターンは、マトリクスP’(nch, k)をもたらす、候補の、又は一時的なビット・ストリームから復号化される。マルチチャネル符号化モードk毎に、施された符号化の歪みd(k)が計算される。
Figure 2011203732
前述の一時的なビット・ストリームから、所要データ量s(k)が符号化器において評価される。好ましくは、実際に使用される符号化モードは、積d(k)s(k)の最小値が実現される符号化モードである。この符号化モードの対応するビット・ストリーム・データは復号化器に送信される。更なるサイド情報として、マルチチャネル符号化モード・インデクスkも復号化器に送信される。

Claims (19)

  1. 対応する励起パターン復号化(142)に続いてオーディオ信号(10)の符号化(11、12、15)のマスキング・レベルが求められる励起パターンを符号化する方法(141)であって、前記オーディオ信号の符号化のために、前記オーディオ信号が、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され(12、15)、最長変換長の特定の倍数(L)を表すオーディオ信号の部分がフレームと表され、前記励起パターンが、前記オーディオ信号の連続する部分のスペクトル表現(12)に関係付けられ、前記方法は、
    a) 前記オーディオ信号(10)の現在のフレームについて、連続する励起パターンの対応する群のケースそれぞれにおいて、励起パターン・マトリクスPを形成し、異なるスペクトル変換長毎に、対応する励起パターンが前記マトリクスPにおいて得られ、各マトリクスPのエントリの対数(32)をとる工程であって、
    前記結果として生じるマトリクス・サイズが次の変換に適していない場合、マトリクスのサイズは、マトリクス境界にある励起パターンの値を、必要な回数だけ複製することによって増加させられる工程と、
    b) 対数化されたマトリクスPの値に対して2次元変換を施し(33)、それにより、マトリクスPがもたらされる工程と、
    c) 前記マトリクスPにおいて係数に、所定のソート順序を施し(35)、前記所定のソート順序が前記マトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、最初の値から始めて、対応するソート経路の固定数の値のみを取得し、前記値で、マトリクスPの二次バージョンPTqを形成する工程(35)と、
    d) マトリクスPTqのSPECK符号化を行う工程(36)であって、マトリクスPTqのSPECK符号化ビット平面が処理され、ビット平面における対応する係数ビットの位置を位置特定し、符号化するために使用される工程と
    を含む方法。
  2. 請求項1記載の方法によって符号化された励起パターンを復号化する方法(242)であって、前記励起パターンから、符号化されたオーディオ信号(27)の復号化(25、23)が求められ(243)、前記オーディオ信号復号化のために、前記オーディオ信号が異なるウィンドウ及びスペクトル逆変換長を使用して連続して処理され、最長の変換長の特定の倍数(L)を表す前記オーディオ信号の部分がフレームと表され、前記励起パターンは前記オーディオ信号の連続する部分のスペクトル表現(12)に関係し、前記方法は、
    a)ビット・ストリームから受け取られる(26)対応するデータ(EPM)に対して、二次マトリクスPTqの対応するSPECK復号化を行う工程(41)と、
    b)前記符号化において使用されるようにソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加える工程(42)と、現在のマトリクスのソート・インデクスに応じて、符号化において使用される逆ソート順序を施すことにより、前記データを前記再構成マトリクスPに戻し(43)、前記ソート・インデクスは適切なマトリクス・サイズを確立するためにも使用される工程と、
    c)前記再構成励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及びをマトリクスPTに対して施す工程(45、46)と
    を含む方法。
  3. 請求項1記載の方法であって、工程b)と工程c)との間で、マトリクスPのサイズは、最小の振幅を統計的に有する周波数を表す少なくとも1つのマトリクス境界の列又は行を除去することによって削減される方法。
  4. 請求項1又は3に記載の方法であって、現在のウィンドウ及びスペクトル変換長をシグナリングするためのウィンドウ・タイプ符号(WT)、及び、任意的に、現在のマトリクス・サイズをシグナリングするソート・インデクスは、前記符号化されたオーディオ信号ビット・ストリームに含まれる方法。
  5. 請求項2記載の方法であって、工程b)と工程c)との間で、最小の振幅を統計的に有する周波数を表しているマトリクス境界の列又は行の欠落している値には、前記再構成マトリクスPを再獲得するためにゼロで埋められる(44)方法。
  6. 請求項2又は5に記載の方法であって、前記マトリクス・サイズ、及びそれによるソート・インデクスは、フレーム毎の短いウィンドウの数から自動的に求められる方法。
  7. 請求項1乃至6のうちの1つに記載の方法であって、前記ウィンドウ及びスペクトル変換長は、長いタイプ及び短いタイプという2つのタイプを有し、前記短いウィンドウには、開始ウィンドウが先行し、停止ウィンドウが後に続く方法。
  8. 請求項1乃至7のうちの一項に記載の方法であって、前記マトリクスPTqの値の符号を表すビットは、前記符号化されたオーディオ信号ビット・ストリームにおける特殊な符号化なしで含まれる方法。
  9. 請求項1、及び3乃至8に記載の方法であって、オ―ディオ信号(10)がマルチチェネル・オーディオ信号の場合、チャネル全てにおける現在のフレームについて、同じマトリクス・サイズが前記励起パターン符号化(141)において使用され、前記個々のマトリクスが、
    チャネル毎にインタリーブされた励起パターン、
    チャネル・データを有する合成マトリクス、
    チャネル毎の個別の1つのマトリクス、
    のマルチチャネル符号化モードkのうちの少なくとも1つにおいて符号化され、前記符号化モードkを表す符号がビット・ストリームに含まれ、前記励起パターン復号化処理(142、242)において相応に使用される方法。
  10. 対応する励起パターン復号化(142)に続いてオーディオ信号(10)の符号化(11、12、15)のマスキング・レベルが求められる励起パターンが符号化される(141)オーディオ信号符号化器であって、前記オーディオ信号の符号化のために、前記オーディオ信号が、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され(12、15)、最長変換長の特定の倍数(L)を表すオーディオ信号の部分がフレームと表され、前記励起パターンが、前記オーディオ信号の連続する部分のスペクトル表現(12)に関係付けられ、装置は、
    前記オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のケースそれぞれにおいて、励起パターン・マトリクスPを形成し、前記異なるスペクトル変換長毎に、対応する励起パターンが前記マトリクスPに含められ、各マトリクスPのエントリの対数をとるよう適合された手段(12、13、141)であって、
    結果として生じるマトリクス・サイズが次の変換に適していない場合、マトリクスのサイズは、マトリクス境界にある励起パターンの値を、必要な回数だけ複製することによって増加させられ、
    対数化されたマトリクスPの値に対して2次元変換が施され、それにより、マトリクスPがもたらされ、
    前記マトリクスPにおいて係数に、所定のソート順序が施され、前記所定のソート順序がマトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、
    最初の値から始めて、対応するソート経路の固定数の値のみが取得され、前記値で、マトリクスPの二次バージョンPTqが形成される手段と、
    マトリクスPTqのSPECK符号化を行うよう適合された手段とを備え、前記SPECK符号化において、前記マトリクスPTqのビット平面が処理され、前記ビット平面における対応する係数ビットの位置を位置特定し、符号化するために、連続する分割が使用されるオーディオ信号符号化器。
  11. 請求項1記載の方法によって符号化された励起パターンが、符号化オーディオ信号(27)の復号化のためのマスキング・レベルを求めるために復号化され、使用され、前記オ―ディオ信号を復号化するために、別のウィンドウを使用して連続して処理され、最長の変換長の特定の倍数(L)を表すオーディオ信号の部分がフレームと表され、前記励起パターンはオーディオ信号の連続する部分のスペクトル表現に関係付けられるオーディオ信号復号化器であって、
    ビット・ストリームから受け取られた対応するデータ(EPM)に対して、二次マトリクスPTqの対応するSPECK復号化を行う(41)よう適合された手段(242)であって、
    符号化において使用されるようにソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加え(42)、
    現在のマトリクスのソート・インデクスに応じて、符号化において使用される逆ソート順序を施すことにより、前記データを再構成マトリクスPに戻し(43)、前記ソート・インデクスは適切なマトリクス・サイズを確立するためにも使用される工程と、
    再構成励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及び逆対数をマトリクスPに対して施す(45、46)手段と、
    マスキング閾値をマトリクスPの前記励起パターンから算出するよう適合される手段(243)と、
    前記マスキング閾値を使用して前記符号化オーディオ信号を復号化し、再量子化し、結果として生じる信号を逆変換し、重なり+加算処理を施すよう適合された手段(25、23)とを備えるオーディオ信号復号化器。
  12. 請求項10記載の装置であって、前記2次元変換と、所定のソート順序の適用との間で、マトリクスPのサイズは、最低の振幅を統計的に有する周波数を表す少なくとも1つのマトリクス境界列又は行を削除することによって削減される装置。
  13. 請求項10又は12に記載の装置であって、現在のウィンドウ及びスペクトル変換長をシグナリングするためのウィンドウ・タイプ符号(WT)、及び、任意的に、前記現在のマトリクス・サイズをシグナリングするソート・インデクスは、前記符号化されたオーディオ信号ビット・ストリームに含まれる装置。
  14. 請求項11記載の装置であって、最小の振幅を統計的に有する周波数を表しているマトリクス境界の列又は行の欠落している値の逆ソートに続き、再構成マトリクスPTを再獲得するためにゼロで埋められる(44)装置。
  15. 請求項11又は14に記載の装置であって、前記マトリクス・サイズ、及びそれによるソート・インデクスは、フレーム毎の短いウィンドウの数から自動的に求められる装置。
  16. 請求項10乃至15のうちの1つに記載の装置であって、前記ウィンドウ及びスペクトル変換長は、長いタイプ及び短いタイプという2つのタイプを有し、前記短いウィンドウには、開始ウィンドウが先行し、停止ウィンドウが後続する装置。
  17. 請求項10乃至16のうちの何れか一項に記載の装置であって、前記マトリクスPTqの値の符号を表すビットは、前記符号化されたオーディオ信号ビット・ストリームにおける特殊な符号化なしで含まれる装置。
  18. 請求項1、3、4、及び7乃至9のうちの何れか一項に記載の方法によって符号化されたディジタル・ディジタル・オーディオ信号。
  19. 請求項18記載のディジタル・オーディオ信号を含むか、格納するか、又は記録された記憶媒体。
JP2011063490A 2010-03-24 2011-03-23 符号化する方法、復号化する方法、オーディオ信号符号化器及び装置 Expired - Fee Related JP5802412B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP10305295A EP2372705A1 (en) 2010-03-24 2010-03-24 Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined
EP10305295.7 2010-03-24

Publications (3)

Publication Number Publication Date
JP2011203732A true JP2011203732A (ja) 2011-10-13
JP2011203732A5 JP2011203732A5 (ja) 2014-05-08
JP5802412B2 JP5802412B2 (ja) 2015-10-28

Family

ID=42320355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011063490A Expired - Fee Related JP5802412B2 (ja) 2010-03-24 2011-03-23 符号化する方法、復号化する方法、オーディオ信号符号化器及び装置

Country Status (5)

Country Link
US (1) US8515770B2 (ja)
EP (2) EP2372705A1 (ja)
JP (1) JP5802412B2 (ja)
KR (1) KR20110107295A (ja)
CN (1) CN102201238B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019109943A (ja) * 2013-09-06 2019-07-04 イマージョン コーポレーションImmersion Corporation 周波数シフトを用いたハプティック変換システム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075377A1 (en) 2008-12-24 2010-07-01 Dolby Laboratories Licensing Corporation Audio signal loudness determination and modification in the frequency domain
ES2816014T3 (es) * 2013-02-13 2021-03-31 Ericsson Telefon Ab L M Ocultación de error de trama
US10332527B2 (en) 2013-09-05 2019-06-25 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio signal
US10320413B2 (en) * 2013-11-07 2019-06-11 Telefonaktiebolaget Lm Ericsson (Publ) Methods and devices for vector segmentation for coding
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
CN107615694B (zh) * 2015-06-17 2021-02-05 苹果公司 用于确定预编码矩阵的方法和预编码模块
US10840944B2 (en) * 2017-07-25 2020-11-17 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, data structure of code string, encoding method, decoding method, encoding program and decoding program
US10726851B2 (en) * 2017-08-31 2020-07-28 Sony Interactive Entertainment Inc. Low latency audio stream acceleration by selectively dropping and blending audio blocks
US11811686B2 (en) 2020-12-08 2023-11-07 Mediatek Inc. Packet reordering method of sound bar
CN113853047A (zh) * 2021-09-29 2021-12-28 深圳市火乐科技发展有限公司 灯光控制方法、装置、存储介质和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187634A1 (en) * 2002-03-28 2003-10-02 Jin Li System and method for embedded audio coding with implicit auditory masking
WO2009029032A2 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity spectral analysis/synthesis using selectable time resolution

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671413B1 (en) * 2000-01-24 2003-12-30 William A. Pearlman Embedded and efficient low-complexity hierarchical image coder and corresponding methods therefor
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US8290782B2 (en) * 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187634A1 (en) * 2002-03-28 2003-10-02 Jin Li System and method for embedded audio coding with implicit auditory masking
WO2009029032A2 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity spectral analysis/synthesis using selectable time resolution

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7015000142; Oliver Niemeyer, Bernd Edler: 'Efficient Coding of Excitation Patterns Combined with a Transform Audio Coder' 118th AES Convention 6466, p.1-10, Audio Engineering Society *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019109943A (ja) * 2013-09-06 2019-07-04 イマージョン コーポレーションImmersion Corporation 周波数シフトを用いたハプティック変換システム

Also Published As

Publication number Publication date
US8515770B2 (en) 2013-08-20
KR20110107295A (ko) 2011-09-30
EP2372706A1 (en) 2011-10-05
US20110238424A1 (en) 2011-09-29
CN102201238A (zh) 2011-09-28
EP2372706B1 (en) 2014-11-19
EP2372705A1 (en) 2011-10-05
JP5802412B2 (ja) 2015-10-28
CN102201238B (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
JP5802412B2 (ja) 符号化する方法、復号化する方法、オーディオ信号符号化器及び装置
EP1891740B1 (en) Scalable audio encoding and decoding using a hierarchical filterbank
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
KR101330362B1 (ko) 오디오 인코딩 방법, 오디오 디코딩 방법 및 오디오 인코더 디바이스
KR101679083B1 (ko) 2개의 블록 변환으로의 중첩 변환의 분해
KR102469964B1 (ko) 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치
JP2006003580A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
CN107924683A (zh) 正弦编码和解码的方法和装置
JP2006211243A (ja) ディジタル信号符号化装置,ディジタル信号符号化方法
AU2011205144B2 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP4438655B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
AU2011221401B2 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140320

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140320

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150120

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150831

R150 Certificate of patent or registration of utility model

Ref document number: 5802412

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees