JP2011203732A - オーディオ信号の符号化及び復号化のマスキング・レベルが求められる励起パターンを符号化し、復号化する方法及び装置 - Google Patents
オーディオ信号の符号化及び復号化のマスキング・レベルが求められる励起パターンを符号化し、復号化する方法及び装置 Download PDFInfo
- Publication number
- JP2011203732A JP2011203732A JP2011063490A JP2011063490A JP2011203732A JP 2011203732 A JP2011203732 A JP 2011203732A JP 2011063490 A JP2011063490 A JP 2011063490A JP 2011063490 A JP2011063490 A JP 2011063490A JP 2011203732 A JP2011203732 A JP 2011203732A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- audio signal
- excitation pattern
- encoding
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005284 excitation Effects 0.000 title claims abstract description 110
- 230000005236 sound signal Effects 0.000 title claims abstract description 70
- 230000000873 masking effect Effects 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims description 60
- 239000011159 matrix material Substances 0.000 claims abstract description 172
- 230000003595 spectral effect Effects 0.000 claims abstract description 28
- 101100117236 Drosophila melanogaster speck gene Proteins 0.000 claims abstract description 20
- 238000001228 spectrum Methods 0.000 claims abstract description 8
- 230000009466 transformation Effects 0.000 claims description 25
- 230000002441 reversible effect Effects 0.000 claims description 6
- 230000003362 replicative effect Effects 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 2
- 230000011664 signaling Effects 0.000 claims 4
- 238000013139 quantization Methods 0.000 abstract description 7
- 230000001052 transient effect Effects 0.000 description 5
- 230000008707 rearrangement Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000000050 ionisation spectroscopy Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/155—User input interfaces for electrophonic musical instruments
- G10H2220/265—Key design details; Special characteristics of individual keys of a keyboard; Key-like musical input devices, e.g. finger sensors, pedals, potentiometers, selectors
- G10H2220/311—Key design details; Special characteristics of individual keys of a keyboard; Key-like musical input devices, e.g. finger sensors, pedals, potentiometers, selectors with controlled tactile or haptic feedback effect; output interfaces therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】本発明によれば、オーディオ信号符号化において量子化する対象のスペクトル毎に、長いウィンドウ/変換長及び短いウィンドウ/変換長について、励起パターンが計算され、符号化される。励起パターンは可変サイズのマトリクスにおいて互いにグループ化される。固定数の値のみの所定のソート順序が励起パターン・データ・マトリクス値に施され、その再配列により、二次マトリクスが形成され、上記二次マトリクスのビット平面に対してSPECK符号化が施される。
【選択図】図1
Description
符号化/復号化品質を向上させるために、マスキング・レベルを、
S. van de Par、 A.Kohlrausch、 G.Charestan、 R.Heusdensによる「A new psychoacoustical masking model for audio coding applications, Proceedings ICASSP ’02, IEEE International Conference on Acoustics, Speech and Signal Processing, 2002, Orlando, vol.2, pp. 1805−1808」、
S. van de Par, A.Kohlrausch, G.Charestan, R.Heusdens, J.Jensen, S.H.Jen−senによる「A Perceptual Model for Sinusoidal Audio Coding Based on Spectral Integration」
に示すように計算することが可能であり、
ここで、マスキング閾値は、符号化する対象のオーディオ信号の電力スペクトルから導き出される「励起パターン」から導き出される。
b)対数化されたマトリクスPの値に対して2次元変換を施し、それにより、マトリクスPTがもたらされる工程と、
c)マトリクスPTにおいて係数に、所定のソート順序を施し、所定のソート順序がマトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、最初の値から始めて、対応するソート経路の固定数の値のみを取得し、前述の値により、マトリクスPTの二次バージョンPTqを形成する工程と、
d)マトリクスPTqのSPECKビット平面が処理されるマトリクスPTqのSPECK符号化を行い、ビット平面における対応する係数ビットの位置を位置特定し、符号化するために、連続する分割が使用される工程とを含む。
オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のケースそれぞれにおいて、励起パターン・マトリクスPを形成し、異なるスペクトル変換長毎に、対応する励起パターンがマトリクスPに含められ、
各マトリクスPのエントリの対数をとるよう適合された手段であって、
結果として生じるマトリクス・サイズが以下の工程の変換に適していない場合、マトリクスのサイズは、マトリクス境界にある励起パターンの値を、必要な回数だけ複製することによって増加させられ、
対数化されたマトリクスPの値に対して2次元変換を施し、それにより、マトリクスPTがもたらされ、
マトリクスPTにおいて係数に、所定のソート順序を施し、所定のソート順序がマトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、
最初の値から始めて、対応するソート経路の固定数の値のみを取得し、前述の値により、マトリクスPTの二次バージョンPTqが形成される手段と、
マトリクスPTqのSPECK符号化を行うよう適合された手段であって、そのSPECK符号化において、マトリクスPTqのビット平面が処理され、ビット平面における対応する係数ビットの位置を位置特定し、符号化するために、連続する分割が使用される手段と
を含む。
a)ビット・ストリームから受け取られた対応するデータに対して、二次マトリクスPTqの対応するSPECK復号化を行う工程と、
b)符号化において使用されるようにソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加える工程と、
(現在のマトリクスのソート・インデクスに応じて、符号化において使用されるような逆ソート順序を施すことにより、前述のデータを再構成マトリクスPTに戻し、そのソート・インデクスは適切なマトリクス・サイズを確立するためにも使用される工程と、
c)再構成された励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及び逆対数をマトリクスPTに施す工程
とを含む。
ビット・ストリームから受け取られた対応するデータに対して、二次マトリクスPTqの対応するSPECK復号化を行い、
符号化において使用されるソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加え、
現在のマトリクスのソート・インデクスに応じて、符号化において使用されるような逆ソート順序を施すことにより、前述のデータを再構成マトリクスPTに戻し、そのソート・インデクスは適切なマトリクス・サイズを確立するためにも使用され、
再構成された励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及び逆対数をマトリクスPTに対して施すよう適合された手段と、
マスキング閾値をマトリクスPの励起パターンから算出するよう適合される手段と、
マスキング閾値を使用して符号化オーディオ信号を復号化し、再量子化し、結果として生じる信号を逆変換し、重なり+加算処理を施すよう適合された手段と
を備える。
International Standard ISO/IEC 11172−3:「Information technology − Coding of moving pictures and associated audio for digital storage media at up to about 1.5Mbit/s − Part 3: Audio」、
International Standard ISO/IEC 11818−3::「Information technology − Generic coding of moving pictures and associated audio information − Part 3: Audio」
の標準における対応する特徴と異なり、励起パターンの固定時間分解能が使用される。
b)結果として生じるマトリクス値に対して、2次元変換を施す(すなわち、マトリクスPTとして表すスペクトル励起パターン表現)が再び変換される
c)(例えば、通常、非常に小さい振幅を有する高周波コンテンツを表すマトリクスPT列を除去することによって)符号化される対象の変換マトリクスPT列の数を削減する
d)所定の走査順序(すなわち、所定のソート)を、変換されたマトリクスPTの係数に施す。前置処理では、(すなわち、マトリクスP毎の短いウィンドウの励起パターンの数に応じて)マトリクス・サイズ毎の走査又はソート順序が、代表的な入力信号での訓練を行うことによって求められる。
結果として生じるマトリクスPTqは二次であり、よって、ビット平面に対するSPECK処理は直接施すことが可能である一方、Niemeyer/Edlerでは、元のSPECK処理を行うことが可能である前に、矩形マトリクスをいくつかの二次マトリクスに分割しなければならず、さもなければ、元のSPECK処理は、変更しなければならないということ、及び
施された走査経路内に、最後のマトリクス係数が、最小の振幅を有する可能性が高いので、固定数の係数のみが、わずかな振幅係数のみを省略する一方、Niemeyer/Edlerでは、「最も低い1つ又は複数のビット平面をスキップすること」により、「特定のビット・レート制約が満たされる」か、又は、「変換係数マトリクスの十分な近似が実現される」場合、符号化ループが停止する。すなわち、Niemeyer/Edlerでは、省略された係数は、一部の上位係数を含み得、かつ/又は、マトリクスの係数は全て、より粗い量子化を得ることが可能である。
B)符号化器において使用されるように走査経路又はソート経路におけるデータの同じ(すなわち、元の)数を得るために再構成マトリクスPTqデータにゼロを加える工程、
C)符号化器に使用される逆ソート順序を施すことにより、前述のデータを、削減されたサイズの変換されたマトリクスに戻す工程であって、関連付けられたソート・インデクスが、適切なサイズのマトリクスに、復号化されたデータを戻すために使用される工程、
D)再構成されたマトリクスPTを得るためにゼロで、前述の再構成されたマトリクスにおける欠落している列を埋める工程、
E)再構成されたマトリクスを得るよう2次元逆変換を施す工程、及び
F)再構成された励起パターン・マトリクスPを得るようマトリクス・エントリ全ての逆対数を得る工程
が、励起パターンを再構成するためにパターン復号化器242において行われる(図4も参照されたい)。
ステレオ入力信号、又は、より一般には、マルチチャネル信号を処理する場合、チャネル間の相関を励起パターン符号化において使用することが可能である。例えば、同期化された過渡検出を使用することが可能であり、ここで、チャネル信号は同じウィンドウ・タイプによって処理される。すなわち、チャネルnch毎に、同じサイズの励起パターン・マトリクスP(nch)が得られる。個々のマトリクスを別々のマルチチャネル符号化モードk:
チャネル毎にインタリーブされた励起パターン:LRLR…LR、
チャネル・データを有する合成マトリクス:LL…LRR…R、及び
チャネル毎の個別の1つのマトリクス
において符号化することが可能である(ここで、ステレオ・ケースでは、L及びRは左チャネル及び右チャネルに対応するデータを表す)。
Claims (19)
- 対応する励起パターン復号化(142)に続いてオーディオ信号(10)の符号化(11、12、15)のマスキング・レベルが求められる励起パターンを符号化する方法(141)であって、前記オーディオ信号の符号化のために、前記オーディオ信号が、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され(12、15)、最長変換長の特定の倍数(L)を表すオーディオ信号の部分がフレームと表され、前記励起パターンが、前記オーディオ信号の連続する部分のスペクトル表現(12)に関係付けられ、前記方法は、
a) 前記オーディオ信号(10)の現在のフレームについて、連続する励起パターンの対応する群のケースそれぞれにおいて、励起パターン・マトリクスPを形成し、異なるスペクトル変換長毎に、対応する励起パターンが前記マトリクスPにおいて得られ、各マトリクスPのエントリの対数(32)をとる工程であって、
前記結果として生じるマトリクス・サイズが次の変換に適していない場合、マトリクスのサイズは、マトリクス境界にある励起パターンの値を、必要な回数だけ複製することによって増加させられる工程と、
b) 対数化されたマトリクスPの値に対して2次元変換を施し(33)、それにより、マトリクスPTがもたらされる工程と、
c) 前記マトリクスPTにおいて係数に、所定のソート順序を施し(35)、前記所定のソート順序が前記マトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、最初の値から始めて、対応するソート経路の固定数の値のみを取得し、前記値で、マトリクスPTの二次バージョンPTqを形成する工程(35)と、
d) マトリクスPTqのSPECK符号化を行う工程(36)であって、マトリクスPTqのSPECK符号化ビット平面が処理され、ビット平面における対応する係数ビットの位置を位置特定し、符号化するために使用される工程と
を含む方法。 - 請求項1記載の方法によって符号化された励起パターンを復号化する方法(242)であって、前記励起パターンから、符号化されたオーディオ信号(27)の復号化(25、23)が求められ(243)、前記オーディオ信号復号化のために、前記オーディオ信号が異なるウィンドウ及びスペクトル逆変換長を使用して連続して処理され、最長の変換長の特定の倍数(L)を表す前記オーディオ信号の部分がフレームと表され、前記励起パターンは前記オーディオ信号の連続する部分のスペクトル表現(12)に関係し、前記方法は、
a)ビット・ストリームから受け取られる(26)対応するデータ(EPM)に対して、二次マトリクスPTqの対応するSPECK復号化を行う工程(41)と、
b)前記符号化において使用されるようにソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加える工程(42)と、現在のマトリクスのソート・インデクスに応じて、符号化において使用される逆ソート順序を施すことにより、前記データを前記再構成マトリクスPTに戻し(43)、前記ソート・インデクスは適切なマトリクス・サイズを確立するためにも使用される工程と、
c)前記再構成励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及びをマトリクスPTに対して施す工程(45、46)と
を含む方法。 - 請求項1記載の方法であって、工程b)と工程c)との間で、マトリクスPTのサイズは、最小の振幅を統計的に有する周波数を表す少なくとも1つのマトリクス境界の列又は行を除去することによって削減される方法。
- 請求項1又は3に記載の方法であって、現在のウィンドウ及びスペクトル変換長をシグナリングするためのウィンドウ・タイプ符号(WT)、及び、任意的に、現在のマトリクス・サイズをシグナリングするソート・インデクスは、前記符号化されたオーディオ信号ビット・ストリームに含まれる方法。
- 請求項2記載の方法であって、工程b)と工程c)との間で、最小の振幅を統計的に有する周波数を表しているマトリクス境界の列又は行の欠落している値には、前記再構成マトリクスPTを再獲得するためにゼロで埋められる(44)方法。
- 請求項2又は5に記載の方法であって、前記マトリクス・サイズ、及びそれによるソート・インデクスは、フレーム毎の短いウィンドウの数から自動的に求められる方法。
- 請求項1乃至6のうちの1つに記載の方法であって、前記ウィンドウ及びスペクトル変換長は、長いタイプ及び短いタイプという2つのタイプを有し、前記短いウィンドウには、開始ウィンドウが先行し、停止ウィンドウが後に続く方法。
- 請求項1乃至7のうちの一項に記載の方法であって、前記マトリクスPTqの値の符号を表すビットは、前記符号化されたオーディオ信号ビット・ストリームにおける特殊な符号化なしで含まれる方法。
- 請求項1、及び3乃至8に記載の方法であって、オ―ディオ信号(10)がマルチチェネル・オーディオ信号の場合、チャネル全てにおける現在のフレームについて、同じマトリクス・サイズが前記励起パターン符号化(141)において使用され、前記個々のマトリクスが、
チャネル毎にインタリーブされた励起パターン、
チャネル・データを有する合成マトリクス、
チャネル毎の個別の1つのマトリクス、
のマルチチャネル符号化モードkのうちの少なくとも1つにおいて符号化され、前記符号化モードkを表す符号がビット・ストリームに含まれ、前記励起パターン復号化処理(142、242)において相応に使用される方法。 - 対応する励起パターン復号化(142)に続いてオーディオ信号(10)の符号化(11、12、15)のマスキング・レベルが求められる励起パターンが符号化される(141)オーディオ信号符号化器であって、前記オーディオ信号の符号化のために、前記オーディオ信号が、異なるウィンドウ及びスペクトル変換長を使用して連続して処理され(12、15)、最長変換長の特定の倍数(L)を表すオーディオ信号の部分がフレームと表され、前記励起パターンが、前記オーディオ信号の連続する部分のスペクトル表現(12)に関係付けられ、装置は、
前記オーディオ信号の現在のフレームについて、連続する励起パターンの対応する群のケースそれぞれにおいて、励起パターン・マトリクスPを形成し、前記異なるスペクトル変換長毎に、対応する励起パターンが前記マトリクスPに含められ、各マトリクスPのエントリの対数をとるよう適合された手段(12、13、141)であって、
結果として生じるマトリクス・サイズが次の変換に適していない場合、マトリクスのサイズは、マトリクス境界にある励起パターンの値を、必要な回数だけ複製することによって増加させられ、
対数化されたマトリクスPの値に対して2次元変換が施され、それにより、マトリクスPTがもたらされ、
前記マトリクスPTにおいて係数に、所定のソート順序が施され、前記所定のソート順序がマトリクス・サイズに依存し、そのマトリクス・サイズが、現在のフレームにおける最長でない変換長の数に依存し、対応するソート・インデクスによって表され、
最初の値から始めて、対応するソート経路の固定数の値のみが取得され、前記値で、マトリクスPTの二次バージョンPTqが形成される手段と、
マトリクスPTqのSPECK符号化を行うよう適合された手段とを備え、前記SPECK符号化において、前記マトリクスPTqのビット平面が処理され、前記ビット平面における対応する係数ビットの位置を位置特定し、符号化するために、連続する分割が使用されるオーディオ信号符号化器。 - 請求項1記載の方法によって符号化された励起パターンが、符号化オーディオ信号(27)の復号化のためのマスキング・レベルを求めるために復号化され、使用され、前記オ―ディオ信号を復号化するために、別のウィンドウを使用して連続して処理され、最長の変換長の特定の倍数(L)を表すオーディオ信号の部分がフレームと表され、前記励起パターンはオーディオ信号の連続する部分のスペクトル表現に関係付けられるオーディオ信号復号化器であって、
ビット・ストリームから受け取られた対応するデータ(EPM)に対して、二次マトリクスPTqの対応するSPECK復号化を行う(41)よう適合された手段(242)であって、
符号化において使用されるようにソート経路におけるデータの元の数を再獲得するために再構成マトリクスPTqデータにゼロを加え(42)、
現在のマトリクスのソート・インデクスに応じて、符号化において使用される逆ソート順序を施すことにより、前記データを再構成マトリクスPTに戻し(43)、前記ソート・インデクスは適切なマトリクス・サイズを確立するためにも使用される工程と、
再構成励起パターン・マトリクスPを再獲得するために、対応する2次元逆変換及び逆対数をマトリクスPTに対して施す(45、46)手段と、
マスキング閾値をマトリクスPの前記励起パターンから算出するよう適合される手段(243)と、
前記マスキング閾値を使用して前記符号化オーディオ信号を復号化し、再量子化し、結果として生じる信号を逆変換し、重なり+加算処理を施すよう適合された手段(25、23)とを備えるオーディオ信号復号化器。 - 請求項10記載の装置であって、前記2次元変換と、所定のソート順序の適用との間で、マトリクスPTのサイズは、最低の振幅を統計的に有する周波数を表す少なくとも1つのマトリクス境界列又は行を削除することによって削減される装置。
- 請求項10又は12に記載の装置であって、現在のウィンドウ及びスペクトル変換長をシグナリングするためのウィンドウ・タイプ符号(WT)、及び、任意的に、前記現在のマトリクス・サイズをシグナリングするソート・インデクスは、前記符号化されたオーディオ信号ビット・ストリームに含まれる装置。
- 請求項11記載の装置であって、最小の振幅を統計的に有する周波数を表しているマトリクス境界の列又は行の欠落している値の逆ソートに続き、再構成マトリクスPTを再獲得するためにゼロで埋められる(44)装置。
- 請求項11又は14に記載の装置であって、前記マトリクス・サイズ、及びそれによるソート・インデクスは、フレーム毎の短いウィンドウの数から自動的に求められる装置。
- 請求項10乃至15のうちの1つに記載の装置であって、前記ウィンドウ及びスペクトル変換長は、長いタイプ及び短いタイプという2つのタイプを有し、前記短いウィンドウには、開始ウィンドウが先行し、停止ウィンドウが後続する装置。
- 請求項10乃至16のうちの何れか一項に記載の装置であって、前記マトリクスPTqの値の符号を表すビットは、前記符号化されたオーディオ信号ビット・ストリームにおける特殊な符号化なしで含まれる装置。
- 請求項1、3、4、及び7乃至9のうちの何れか一項に記載の方法によって符号化されたディジタル・ディジタル・オーディオ信号。
- 請求項18記載のディジタル・オーディオ信号を含むか、格納するか、又は記録された記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10305295A EP2372705A1 (en) | 2010-03-24 | 2010-03-24 | Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined |
EP10305295.7 | 2010-03-24 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011203732A true JP2011203732A (ja) | 2011-10-13 |
JP2011203732A5 JP2011203732A5 (ja) | 2014-05-08 |
JP5802412B2 JP5802412B2 (ja) | 2015-10-28 |
Family
ID=42320355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011063490A Expired - Fee Related JP5802412B2 (ja) | 2010-03-24 | 2011-03-23 | 符号化する方法、復号化する方法、オーディオ信号符号化器及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8515770B2 (ja) |
EP (2) | EP2372705A1 (ja) |
JP (1) | JP5802412B2 (ja) |
KR (1) | KR20110107295A (ja) |
CN (1) | CN102201238B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019109943A (ja) * | 2013-09-06 | 2019-07-04 | イマージョン コーポレーションImmersion Corporation | 周波数シフトを用いたハプティック変換システム |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010075377A1 (en) | 2008-12-24 | 2010-07-01 | Dolby Laboratories Licensing Corporation | Audio signal loudness determination and modification in the frequency domain |
ES2816014T3 (es) * | 2013-02-13 | 2021-03-31 | Ericsson Telefon Ab L M | Ocultación de error de trama |
US10332527B2 (en) | 2013-09-05 | 2019-06-25 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio signal |
US10320413B2 (en) * | 2013-11-07 | 2019-06-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and devices for vector segmentation for coding |
EP2980791A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
CN107615694B (zh) * | 2015-06-17 | 2021-02-05 | 苹果公司 | 用于确定预编码矩阵的方法和预编码模块 |
US10840944B2 (en) * | 2017-07-25 | 2020-11-17 | Nippon Telegraph And Telephone Corporation | Encoding apparatus, decoding apparatus, data structure of code string, encoding method, decoding method, encoding program and decoding program |
US10726851B2 (en) * | 2017-08-31 | 2020-07-28 | Sony Interactive Entertainment Inc. | Low latency audio stream acceleration by selectively dropping and blending audio blocks |
US11811686B2 (en) | 2020-12-08 | 2023-11-07 | Mediatek Inc. | Packet reordering method of sound bar |
CN113853047A (zh) * | 2021-09-29 | 2021-12-28 | 深圳市火乐科技发展有限公司 | 灯光控制方法、装置、存储介质和电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030187634A1 (en) * | 2002-03-28 | 2003-10-02 | Jin Li | System and method for embedded audio coding with implicit auditory masking |
WO2009029032A2 (en) * | 2007-08-27 | 2009-03-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6671413B1 (en) * | 2000-01-24 | 2003-12-30 | William A. Pearlman | Embedded and efficient low-complexity hierarchical image coder and corresponding methods therefor |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US8290782B2 (en) * | 2008-07-24 | 2012-10-16 | Dts, Inc. | Compression of audio scale-factors by two-dimensional transformation |
-
2010
- 2010-03-24 EP EP10305295A patent/EP2372705A1/en not_active Withdrawn
-
2011
- 2011-03-09 US US12/932,894 patent/US8515770B2/en not_active Expired - Fee Related
- 2011-03-11 EP EP11157880.3A patent/EP2372706B1/en not_active Not-in-force
- 2011-03-23 KR KR1020110025961A patent/KR20110107295A/ko not_active Application Discontinuation
- 2011-03-23 JP JP2011063490A patent/JP5802412B2/ja not_active Expired - Fee Related
- 2011-03-24 CN CN201110071448.9A patent/CN102201238B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030187634A1 (en) * | 2002-03-28 | 2003-10-02 | Jin Li | System and method for embedded audio coding with implicit auditory masking |
WO2009029032A2 (en) * | 2007-08-27 | 2009-03-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
Non-Patent Citations (1)
Title |
---|
JPN7015000142; Oliver Niemeyer, Bernd Edler: 'Efficient Coding of Excitation Patterns Combined with a Transform Audio Coder' 118th AES Convention 6466, p.1-10, Audio Engineering Society * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019109943A (ja) * | 2013-09-06 | 2019-07-04 | イマージョン コーポレーションImmersion Corporation | 周波数シフトを用いたハプティック変換システム |
Also Published As
Publication number | Publication date |
---|---|
US8515770B2 (en) | 2013-08-20 |
KR20110107295A (ko) | 2011-09-30 |
EP2372706A1 (en) | 2011-10-05 |
US20110238424A1 (en) | 2011-09-29 |
CN102201238A (zh) | 2011-09-28 |
EP2372706B1 (en) | 2014-11-19 |
EP2372705A1 (en) | 2011-10-05 |
JP5802412B2 (ja) | 2015-10-28 |
CN102201238B (zh) | 2015-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5802412B2 (ja) | 符号化する方法、復号化する方法、オーディオ信号符号化器及び装置 | |
EP1891740B1 (en) | Scalable audio encoding and decoding using a hierarchical filterbank | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
KR101330362B1 (ko) | 오디오 인코딩 방법, 오디오 디코딩 방법 및 오디오 인코더 디바이스 | |
KR101679083B1 (ko) | 2개의 블록 변환으로의 중첩 변환의 분해 | |
KR102469964B1 (ko) | 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치 | |
JP2006003580A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
CN107924683A (zh) | 正弦编码和解码的方法和装置 | |
JP2006211243A (ja) | ディジタル信号符号化装置,ディジタル信号符号化方法 | |
AU2011205144B2 (en) | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding | |
JP4438655B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
AU2011221401B2 (en) | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140320 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150120 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150416 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150714 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5802412 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |