JP5802412B2 - 符号化する方法、復号化する方法、オーディオ信号符号化器及び装置 - Google Patents
符号化する方法、復号化する方法、オーディオ信号符号化器及び装置 Download PDFInfo
- Publication number
- JP5802412B2 JP5802412B2 JP2011063490A JP2011063490A JP5802412B2 JP 5802412 B2 JP5802412 B2 JP 5802412B2 JP 2011063490 A JP2011063490 A JP 2011063490A JP 2011063490 A JP2011063490 A JP 2011063490A JP 5802412 B2 JP5802412 B2 JP 5802412B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- audio signal
- excitation
- data
- excitation pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 69
- 238000000034 method Methods 0.000 title claims description 49
- 239000011159 matrix material Substances 0.000 claims description 201
- 230000005284 excitation Effects 0.000 claims description 128
- 230000000873 masking effect Effects 0.000 claims description 35
- 230000003595 spectral effect Effects 0.000 claims description 29
- 101100117236 Drosophila melanogaster speck gene Proteins 0.000 claims description 27
- 230000009466 transformation Effects 0.000 claims description 27
- 230000002441 reversible effect Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000003362 replicative effect Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000011664 signaling Effects 0.000 claims 4
- 238000000844 transformation Methods 0.000 claims 4
- 238000013139 quantization Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 5
- 230000008707 rearrangement Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000000050 ionisation spectroscopy Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/155—User input interfaces for electrophonic musical instruments
- G10H2220/265—Key design details; Special characteristics of individual keys of a keyboard; Key-like musical input devices, e.g. finger sensors, pedals, potentiometers, selectors
- G10H2220/311—Key design details; Special characteristics of individual keys of a keyboard; Key-like musical input devices, e.g. finger sensors, pedals, potentiometers, selectors with controlled tactile or haptic feedback effect; output interfaces therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
符号化/復号化品質を向上させるために、マスキング・レベルを、
S. van de Par、 A.Kohlrausch、 G.Charestan、 R.Heusdensによる「A new psychoacoustical masking model for audio coding applications, Proceedings ICASSP ’02, IEEE International Conference on Acoustics, Speech and Signal Processing, 2002, Orlando, vol.2, pp. 1805−1808」、
S. van de Par, A.Kohlrausch, G.Charestan, R.Heusdens, J.Jensen, S.H.Jen−senによる「A Perceptual Model for Sinusoidal Audio Coding Based on Spectral Integration」
に示すように計算することが可能であり、
ここで、マスキング閾値は、符号化する対象のオーディオ信号の電力スペクトルから導き出される「励起パターン」から導き出される。
b)対数化されたマトリクスPの値に対して2次元変換を施し、それにより、マトリクスPTがもたらされる工程と、
c)マトリクスPTにおいて係数に、所定のソート順序を施し、所定のソート順序がマトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、最初の値から始めて、対応するソート経路の固定数の値のみを取得し、前述の値により、マトリクスPTの二次バージョンPTqを形成する工程と、
d)マトリクスPTqのSPECKビット平面が処理されるマトリクスPTqのSPECK符号化を行い、ビット平面における対応する係数ビットの位置を位置特定し、符号化するために、連続する分割が使用される工程とを含む。
オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のケースそれぞれにおいて、励起パターン・マトリクスPを形成し、異なるスペクトル変換長毎に、対応する励起パターンがマトリクスPに含められ、
各マトリクスPのエントリの対数をとるよう適合された手段であって、
結果として生じるマトリクス・サイズが以下の工程の変換に適していない場合、マトリクスのサイズは、マトリクス境界にある励起パターンの値を、必要な回数だけ複製することによって増加させられ、
対数化されたマトリクスPの値に対して2次元変換を施し、それにより、マトリクスPTがもたらされ、
マトリクスPTにおいて係数に、所定のソート順序を施し、所定のソート順序がマトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、
最初の値から始めて、対応するソート経路の固定数の値のみを取得し、前述の値により、マトリクスPTの二次バージョンPTqが形成される手段と、
マトリクスPTqのSPECK符号化を行うよう適合された手段であって、そのSPECK符号化において、マトリクスPTqのビット平面が処理され、ビット平面における対応する係数ビットの位置を位置特定し、符号化するために、連続する分割が使用される手段と
を含む。
a)ビット・ストリームから受け取られた対応するデータに対して、二次マトリクスPTqの対応するSPECK復号化を行う工程と、
b)符号化において使用されるようにソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加える工程と、
(現在のマトリクスのソート・インデクスに応じて、符号化において使用されるような逆ソート順序を施すことにより、前述のデータを再構成マトリクスPTに戻し、そのソート・インデクスは適切なマトリクス・サイズを確立するためにも使用される工程と、
c)再構成された励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及び逆対数をマトリクスPTに施す工程
とを含む。
ビット・ストリームから受け取られた対応するデータに対して、二次マトリクスPTqの対応するSPECK復号化を行い、
符号化において使用されるソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加え、
現在のマトリクスのソート・インデクスに応じて、符号化において使用されるような逆ソート順序を施すことにより、前述のデータを再構成マトリクスPTに戻し、そのソート・インデクスは適切なマトリクス・サイズを確立するためにも使用され、
再構成された励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及び逆対数をマトリクスPTに対して施すよう適合された手段と、
マスキング閾値をマトリクスPの励起パターンから算出するよう適合される手段と、
マスキング閾値を使用して符号化オーディオ信号を復号化し、再量子化し、結果として生じる信号を逆変換し、重なり+加算処理を施すよう適合された手段と
を備える。
International Standard ISO/IEC 11172−3:「Information technology − Coding of moving pictures and associated audio for digital storage media at up to about 1.5Mbit/s − Part 3: Audio」、
International Standard ISO/IEC 11818−3::「Information technology − Generic coding of moving pictures and associated audio information − Part 3: Audio」
の標準における対応する特徴と異なり、励起パターンの固定時間分解能が使用される。
b)結果として生じるマトリクス値に対して、2次元変換を施す(すなわち、マトリクスPTとして表すスペクトル励起パターン表現)が再び変換される
c)(例えば、通常、非常に小さい振幅を有する高周波コンテンツを表すマトリクスPT列を除去することによって)符号化される対象の変換マトリクスPT列の数を削減する
d)所定の走査順序(すなわち、所定のソート)を、変換されたマトリクスPTの係数に施す。前置処理では、(すなわち、マトリクスP毎の短いウィンドウの励起パターンの数に応じて)マトリクス・サイズ毎の走査又はソート順序が、代表的な入力信号での訓練を行うことによって求められる。
結果として生じるマトリクスPTqは二次であり、よって、ビット平面に対するSPECK処理は直接施すことが可能である一方、Niemeyer/Edlerでは、元のSPECK処理を行うことが可能である前に、矩形マトリクスをいくつかの二次マトリクスに分割しなければならず、さもなければ、元のSPECK処理は、変更しなければならないということ、及び
施された走査経路内に、最後のマトリクス係数が、最小の振幅を有する可能性が高いので、固定数の係数のみが、わずかな振幅係数のみを省略する一方、Niemeyer/Edlerでは、「最も低い1つ又は複数のビット平面をスキップすること」により、「特定のビット・レート制約が満たされる」か、又は、「変換係数マトリクスの十分な近似が実現される」場合、符号化ループが停止する。すなわち、Niemeyer/Edlerでは、省略された係数は、一部の上位係数を含み得、かつ/又は、マトリクスの係数は全て、より粗い量子化を得ることが可能である。
B)符号化器において使用されるように走査経路又はソート経路におけるデータの同じ(すなわち、元の)数を得るために再構成マトリクスPTqデータにゼロを加える工程、
C)符号化器に使用される逆ソート順序を施すことにより、前述のデータを、削減されたサイズの変換されたマトリクスに戻す工程であって、関連付けられたソート・インデクスが、適切なサイズのマトリクスに、復号化されたデータを戻すために使用される工程、
D)再構成されたマトリクスPTを得るためにゼロで、前述の再構成されたマトリクスにおける欠落している列を埋める工程、
E)再構成されたマトリクスを得るよう2次元逆変換を施す工程、及び
F)再構成された励起パターン・マトリクスPを得るようマトリクス・エントリ全ての逆対数を得る工程
が、励起パターンを再構成するためにパターン復号化器242において行われる(図4も参照されたい)。
ステレオ入力信号、又は、より一般には、マルチチャネル信号を処理する場合、チャネル間の相関を励起パターン符号化において使用することが可能である。例えば、同期化された過渡検出を使用することが可能であり、ここで、チャネル信号は同じウィンドウ・タイプによって処理される。すなわち、チャネルnch毎に、同じサイズの励起パターン・マトリクスP(nch)が得られる。個々のマトリクスを別々のマルチチャネル符号化モードk:
チャネル毎にインタリーブされた励起パターン:LRLR…LR、
チャネル・データを有する合成マトリクス:LL…LRR…R、及び
チャネル毎の個別の1つのマトリクス
において符号化することが可能である(ここで、ステレオ・ケースでは、L及びRは左チャネル及び右チャネルに対応するデータを表す)。
Claims (12)
- 励起パターンを符号化する方法であって、該励起パターンから、対応する励起パターンの復号化に続くオーディオ信号の符号化のマスキングレベルが求められ、
前記オーディオ信号の符号化のために、前記オーディオ信号が、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され、最長の変換長の所定数倍を表すオーディオ信号の部分がフレームとして表現され、前記励起パターンが、前記オーディオ信号の連続する部分のスペクトル表現に関係付けられ、当該方法は、
a) 前記オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のそれぞれにおいて、励起パターンのマトリクスPを形成する工程であって、異なるスペクトル変換長の各々について、対応する励起パターンが前記マトリクスPに含められ、マトリクスPのエントリ各々の対数をとる工程であって、生成されたマトリクスのサイズが後続の変換に適していない場合、前記マトリクスのサイズは、マトリクス境界にある励起パターンの値を必要な回数だけ複製することによって増やされる、工程と、
b) 対数化されたマトリクスPの値に2次元変換を施すことで、マトリクスPTを得る工程と、
c) 前記マトリクスPTにおける係数に所定のソート順序を適用する工程であって、前記所定のソート順序は前記マトリクスのサイズに依存し、マトリクスのサイズは前記現在のフレームにおける最長ではない変換長の数に依存しかつ対応するソートインデクスによって表現され、最初の値から始めて、対応するソート経路における一定個数の値のみを取得し、該値とともにマトリクスPTの二次バージョンPTqを形成する、工程と、
d) マトリクスPTqについてSPECK符号化を行う工程であって、マトリクスPTqのSPECK符号化ビット平面が処理され、該SPECK符号化ビット平面における対応する係数ビットの位置を特定して符号化するために、一連の分割が使用される工程と
を含む方法。 - 工程b)及び工程c)の間において、統計的に最小の振幅を有する周波数を表す少なくとも1つのマトリクス境界の列又は行を除去することによって、マトリクスPTのサイズが削減される、請求項1に記載の方法。
- 現在のウィンドウ及びスペクトル変換長をシグナリングするためのウィンドウタイプ符号(WT)と、選択的に、現在のマトリクスサイズをシグナリングするソートインデクスとが、符号化されたオーディオ信号ビットストリームに含まれる、請求項1又は2に記載の方法。
- デコーダの側で励起パターンを復号化する方法であって、励起パターンはエンコーダの側において符号化されたものであり、該励起パターンから、対応する励起パターンの復号化に続くオーディオ信号の符号化のマスキングレベルがエンコーダの側で求められており、符号化されたオーディオ信号を表現する符号化された周波数ビンと符号化された励起パターンの励起データマトリクスコードとを含むビットストリームが提供されており、
前記オーディオ信号について、前記オーディオ信号の符号化は、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され、最長の変換長の所定数倍を表すオーディオ信号の部分がフレームとして表現され、前記励起パターンが、前記オーディオ信号の連続する部分のスペクトル表現に関係付けられ、前記励起パターンを符号化する場合に、
前記オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のそれぞれにおいて、励起パターンのマトリクスPが形成され、異なるスペクトル変換長の各々について、対応する励起パターンが前記マトリクスPに含められ、マトリクスPのエントリ各々の対数が取得され、生成されたマトリクスのサイズが後続の変換に適していない場合、前記マトリクスのサイズは、マトリクス境界にある励起パターンの値を必要な回数だけ複製することによって増やされ、
対数化されたマトリクスPの値に2次元変換を施すことで、マトリクスPTが得られ、
前記マトリクスPTにおける係数に対して所定のソート順序が適用され、前記所定のソート順序は前記マトリクスのサイズに依存し、マトリクスのサイズは前記現在のフレームにおける最長ではない変換長の数に依存し、最初の値から始めて対応するソート経路における一定個数の値のみを取得し、該値とともにマトリクスP T の二次バージョンP Tq が形成され、対応する所定のソート順序のデータと対応するソート経路における一定個数の値とが、励起データマトリクスコードに含められており、
マトリクスPTqについてSPECK符号化が行われ、マトリクスPTqのSPECK符号化ビット平面が処理され、該SPECK符号化ビット平面における対応する係数ビットの位置を特定して符号化するために、一連の分割が使用されており、
デコーダにおいて、前記励起データマトリクスコードが前記ビットストリームから分離され、前記励起データマトリクスコードから、前記符号化された周波数ビンのデコードのマスキングレベルが判定され、
前記励起データマトリクスコードを復号化する当該方法は、
a) 前記励起データマトリクスコードを利用して、二次マトリクスPTqについて対応するSPECK復号化を行う工程と、
b) 前記対応するソート経路における一定個数の数値に応じて、前記ソート経路におけるデータの元の数を獲得するために再構成マトリクスPTqのデータにゼロを加える工程と、現在のマトリクスの所定のソート順序のデータに応じた逆のソート順序を適用することにより、前記データを再構成マトリクスPTに戻す工程であって、前記所定のソート順序のデータは適切なマトリクスサイズを設定するためにも使用される、工程と、
c) 対応する2次元逆変換及び逆対数化をマトリクスPTに対して施し、再構成された励起パターンマトリクスPを獲得する工程と
を有する方法。 - 工程b)及び工程c)の間において、統計的に最小の振幅を有する周波数を表すマトリクス境界の列又は行の欠落している値にゼロを挿入して前記再構成マトリクスPTを獲得する、請求項4に記載の方法。
- 前記マトリクスサイズ及びソート順序のデータは、フレーム毎のショートウィンドウの数から自動的に決定される、請求項4又は5に記載の方法。
- 励起パターンが符号化される場合におけるオーディオ信号符号化器であって、該励起パターンから、対応する励起パターンの復号化に続くオーディオ信号の符号化のマスキングレベルが求められ、
前記オーディオ信号の符号化のために、前記オーディオ信号が、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され、最長の変換長の所定数倍を表すオーディオ信号の部分がフレームとして表現され、前記励起パターンが、前記オーディオ信号の連続する部分のスペクトル表現に関係付けられ、当該オーディオ信号符号化器は、
前記オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のそれぞれにおいて、励起パターンのマトリクスPを形成するように構成される手段であって、異なるスペクトル変換長の各々について、対応する励起パターンが前記マトリクスPに含められ、マトリクスPのエントリ各々の対数をとり、
生成されたマトリクスのサイズが後続の変換に適していない場合、前記マトリクスのサイズは、マトリクス境界にある励起パターンの値を必要な回数だけ複製することによって増やされ、
対数化されたマトリクスPの値に2次元変換を施すことで、マトリクスPTが得られ、 前記マトリクスPTにおける係数に所定のソート順序が適用され、前記所定のソート順序は前記マトリクスのサイズに依存し、マトリクスのサイズは前記現在のフレームにおける最長ではない変換長の数に依存しかつ対応するソートインデクスによって表現され、
最初の値から始めて、対応するソート経路における一定個数の値のみを取得し、該値とともにマトリクスPTの二次バージョンPTqを形成する、手段と、
マトリクスPTqについてSPECK符号化を行うように構成される手段であって、マトリクスPTqのSPECK符号化ビット平面が処理され、該SPECK符号化ビット平面における対応する係数ビットの位置を特定して符号化するために、一連の分割が使用される手段と
を含むオーディオ信号符号化器。 - 前記2次元変換と所定のソート順序の適用との間に、マトリクスPTのサイズが、統計的に最低の振幅を統計的に有する周波数を表す少なくとも1つのマトリクス境界の列又は行を削除することによって削減される、請求項7に記載のオーディオ信号符号化器。
- 現在のウィンドウ及びスペクトル変換長をシグナリングするためのウィンドウタイプ符号(WT)と、選択的に、前記現在のマトリクスサイズをシグナリングするソートインデクスとが、符号化されたオーディオ信号ビットストリームに含まれる、請求項7又は8に記載のオーディオ信号符号化器。
- デコーダの側において励起パターンを復号化するための装置であって、励起パターンはエンコーダの側において符号化されたものであり、該励起パターンから、対応する励起パターンの復号化に続くオーディオ信号の符号化のマスキングレベルがエンコーダの側において求められており、符号化されたオーディオ信号を表現する符号化された周波数ビンと符号化された励起パターンの励起データマトリクスコードとを含むビットストリームが提供されており、
前記オーディオ信号について、前記オーディオ信号の符号化は、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され、最長の変換長の所定数倍を表すオーディオ信号の部分がフレームとして表現され、前記励起パターンが、前記オーディオ信号の連続する部分のスペクトル表現に関係付けられ、前記励起パターンを符号化する場合に、
前記オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のそれぞれにおいて、励起パターンのマトリクスPが形成され、異なるスペクトル変換長の各々について、対応する励起パターンが前記マトリクスPに含められ、マトリクスPのエントリ各々の対数が取得され、生成されたマトリクスのサイズが後続の変換に適していない場合、前記マトリクスのサイズは、マトリクス境界にある励起パターンの値を必要な回数だけ複製することによって増やされ、
対数化されたマトリクスPの値に2次元変換を施すことで、マトリクスPTが得られ、
前記マトリクスPTにおける係数に対して所定のソート順序が適用され、前記所定のソート順序は前記マトリクスのサイズに依存し、マトリクスのサイズは前記現在のフレームにおける最長ではない変換長の数に依存し、最初の値から始めて対応するソート経路における一定個数の値のみを取得し、該値とともにマトリクスP T の二次バージョンP Tq が形成され、対応する所定のソート順序のデータと対応するソート経路における一定個数の値とが、励起データマトリクスコードに含められており、
マトリクスPTqについてSPECK符号化が行われ、マトリクスPTqのSPECK符号化ビット平面が処理され、該SPECK符号化ビット平面における対応する係数ビットの位置を特定して符号化するために、一連の分割が使用されており、
デコーダにおいて、前記励起データマトリクスコードが前記ビットストリームから分離され、前記励起データマトリクスコードから、前記符号化された周波数ビンのデコードのマスキングレベルが判定され、
前記励起データマトリクスコードを復号化する当該装置は、
前記励起データマトリクスコードを利用して、二次マトリクスPTqについて対応するSPECK復号化を行うように構成される手段であって、
前記対応するソート経路における一定個数の数値に応じて、前記ソート経路におけるデータの元の数を獲得するために再構成マトリクスPTqのデータにゼロを加え、現在のマトリクスの所定のソート順序のデータに応じた逆のソート順序を適用することにより、前記データを再構成マトリクスPTに戻す手段であって、前記所定のソート順序のデータは適切なマトリクスサイズを設定するためにも使用され、
対応する2次元逆変換及び逆対数化をマトリクスPTに対して施し、再構成された励起パターンマトリクスPを獲得する手段
を有する装置。 - 逆順のソーティングに続き、統計的に最小の振幅を有する周波数を表現するマトリクス境界の列又は行の欠落している値にゼロを挿入し、再構成マトリクスPTを獲得する請求項10に記載の装置。
- 前記マトリクスサイズ及びソート順序のデータは、フレーム毎のショートウィンドウの数から自動的に決定される、請求項10又は11に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10305295.7 | 2010-03-24 | ||
EP10305295A EP2372705A1 (en) | 2010-03-24 | 2010-03-24 | Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011203732A JP2011203732A (ja) | 2011-10-13 |
JP2011203732A5 JP2011203732A5 (ja) | 2014-05-08 |
JP5802412B2 true JP5802412B2 (ja) | 2015-10-28 |
Family
ID=42320355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011063490A Expired - Fee Related JP5802412B2 (ja) | 2010-03-24 | 2011-03-23 | 符号化する方法、復号化する方法、オーディオ信号符号化器及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8515770B2 (ja) |
EP (2) | EP2372705A1 (ja) |
JP (1) | JP5802412B2 (ja) |
KR (1) | KR20110107295A (ja) |
CN (1) | CN102201238B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE552651T1 (de) | 2008-12-24 | 2012-04-15 | Dolby Lab Licensing Corp | Audiosignallautheitbestimmung und modifikation im frequenzbereich |
WO2014126520A1 (en) * | 2013-02-13 | 2014-08-21 | Telefonaktiebolaget L M Ericsson (Publ) | Frame error concealment |
WO2015034115A1 (ko) * | 2013-09-05 | 2015-03-12 | 삼성전자 주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US10599218B2 (en) * | 2013-09-06 | 2020-03-24 | Immersion Corporation | Haptic conversion system using frequency shifting |
CN105684315B (zh) * | 2013-11-07 | 2020-03-24 | 瑞典爱立信有限公司 | 用于编码的矢量分段的方法和设备 |
EP2980791A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
WO2016201647A1 (en) * | 2015-06-17 | 2016-12-22 | Intel Corporation | Method for determining a precoding matrix and precoding module |
US10840944B2 (en) * | 2017-07-25 | 2020-11-17 | Nippon Telegraph And Telephone Corporation | Encoding apparatus, decoding apparatus, data structure of code string, encoding method, decoding method, encoding program and decoding program |
US10726851B2 (en) * | 2017-08-31 | 2020-07-28 | Sony Interactive Entertainment Inc. | Low latency audio stream acceleration by selectively dropping and blending audio blocks |
US11811686B2 (en) | 2020-12-08 | 2023-11-07 | Mediatek Inc. | Packet reordering method of sound bar |
CN113853047A (zh) * | 2021-09-29 | 2021-12-28 | 深圳市火乐科技发展有限公司 | 灯光控制方法、装置、存储介质和电子设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6671413B1 (en) * | 2000-01-24 | 2003-12-30 | William A. Pearlman | Embedded and efficient low-complexity hierarchical image coder and corresponding methods therefor |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
EP3288028B1 (en) * | 2007-08-27 | 2019-07-03 | Telefonaktiebolaget LM Ericsson (publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
US8290782B2 (en) * | 2008-07-24 | 2012-10-16 | Dts, Inc. | Compression of audio scale-factors by two-dimensional transformation |
-
2010
- 2010-03-24 EP EP10305295A patent/EP2372705A1/en not_active Withdrawn
-
2011
- 2011-03-09 US US12/932,894 patent/US8515770B2/en not_active Expired - Fee Related
- 2011-03-11 EP EP11157880.3A patent/EP2372706B1/en not_active Not-in-force
- 2011-03-23 KR KR1020110025961A patent/KR20110107295A/ko not_active Application Discontinuation
- 2011-03-23 JP JP2011063490A patent/JP5802412B2/ja not_active Expired - Fee Related
- 2011-03-24 CN CN201110071448.9A patent/CN102201238B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2372706B1 (en) | 2014-11-19 |
EP2372706A1 (en) | 2011-10-05 |
CN102201238B (zh) | 2015-06-03 |
US20110238424A1 (en) | 2011-09-29 |
CN102201238A (zh) | 2011-09-28 |
KR20110107295A (ko) | 2011-09-30 |
JP2011203732A (ja) | 2011-10-13 |
EP2372705A1 (en) | 2011-10-05 |
US8515770B2 (en) | 2013-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5802412B2 (ja) | 符号化する方法、復号化する方法、オーディオ信号符号化器及び装置 | |
EP1891740B1 (en) | Scalable audio encoding and decoding using a hierarchical filterbank | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
KR101679083B1 (ko) | 2개의 블록 변환으로의 중첩 변환의 분해 | |
KR20140075466A (ko) | 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치 | |
KR102469964B1 (ko) | 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치 | |
Hidayat et al. | A critical assessment of advanced coding standards for lossless audio compression | |
JP4438655B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
AU2011205144B2 (en) | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding | |
AU2011221401B2 (en) | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding | |
RU2020130053A (ru) | Способы и устройства для кодирования и/или декодирования аудиосигналов погружения |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140320 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150120 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150416 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150714 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5802412 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |