JP5603484B2 - 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 - Google Patents
符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP5603484B2 JP5603484B2 JP2013508811A JP2013508811A JP5603484B2 JP 5603484 B2 JP5603484 B2 JP 5603484B2 JP 2013508811 A JP2013508811 A JP 2013508811A JP 2013508811 A JP2013508811 A JP 2013508811A JP 5603484 B2 JP5603484 B2 JP 5603484B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- error
- encoding
- decoding
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
Description
最初に図1から図4を参照して符号化処理を説明する。
まず、周波数領域変換部11がフレーム単位で音声音響ディジタル信号を周波数領域のN点のMDCT係数列に変換する(ステップS11)。
線形予測分析部12は、フレーム単位で音声音響ディジタル信号を線形予測分析し、予め定めた次数までの線形予測係数を求めて出力する(ステップS12)。
線形予測係数量子化符号化部13は、線形予測分析部12が求めた線形予測係数に対応する符号と、量子化済み線形予測係数とを求めて出力する(ステップS13)。
その際、線形予測係数をLSP(Line Spectral Pairs)に変換し、LSPに対応する符号と量子化済みLSPとを求め、量子化済みLSPを量子化済み線形予測係数に変換する処理を行ってもよい。
パワースペクトル包絡算出部14は、線形予測係数量子化符号化部13が出力した量子化済み線形予測係数を周波数領域に変換してパワースペクトル包絡を求める(ステップS14)。求まったパワースペクトル包絡は、重み付け包絡正規化部15に送信される。また、必要に応じて、図1に破線で示すように誤差符号化部110に送信される。
重み付け包絡正規化部15は、パワースペクトル包絡算出部14が出力したパワースペクトル包絡によって、MDCT係数列の各係数を正規化する(ステップS15)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部15は、パワースペクトル包絡値の系列やその平方根の系列を周波数方向で平滑化した重み付けスペクトル包絡係数を用いてフレーム単位でMDCT係数列の各係数を正規化する。この結果、フレーム単位の重み付け正規化MDCT係数列の各係数x(1),・・・,x(N)が得られる。重み付け正規化MDCT係数列は、正規化利得計算部16、量子化部17及び誤差算出部18に送信される。重み付け正規化MDCT係数列は一般には低周波領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつものの、元のMDCT係数列ほどの大きな振幅傾きや振幅の凹凸を持たない。
次に、正規化利得計算部16が、フレームごとに、重み付け正規化MDCT係数列の各係数x(1),・・・,x(N)を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値の和を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数g(以下、利得という。)を求める(ステップS16)。この利得を表す情報である利得情報は、復号装置2に送信される符号の一部とされる。
次に、量子化部17が、フレームごとに、重み付け正規化MDCT係数列の各係数x(1),・・・,x(N)をステップS16の処理で決定された量子化ステップ幅で量子化する(ステップS17)。すなわち、重み付け正規化MDCT係数列の各係数x(n)[1≦n≦N]を利得gで割り算して得られるx(n)/gの値の小数点以下を四捨五入して得られる整数値u(n)を量子化MDCT係数とする。フレーム単位の量子化MDCT係数列は、誤差算出部18及び符号化部19に送信される。なお、x(n)/gの値の小数点以下を切り上げ又は切り下げして得られる値を、整数値u(n)としてもよい。このように、整数値u(n)はx(n)/gの値に対応する値としてもよい。
ステップS15の処理で得られた重み付け正規化MDCT系数列と、ステップS16の処理で得られた利得gと、ステップS17の処理で得られたフレーム単位の量子化MDCT係数列とが、誤差算出部18の入力となる。量子化による誤差はr(n)=x(n)/g-u(n) [1≦n≦N]で求められる。すなわち、重み付け正規化MDCT係数列の各係数x(n)を利得gで除算した値からその各係数x(n)に対応する量子化MDCT係数u(n)を減算した値をその各係数x(n)に対応する量子化誤差r(n)とする。
次に、符号化部19が、フレームごとに、量子化部17が出力した量子化MDCT係数列(量子化MDCT係数u(n)の列)を符号化し、得られた符号とその符号のビット数を出力する(ステップS19)。
(参考文献1)David Salomon, "Data Compression : The Complete Reference," 3rd edition, Springer-Verlag, ISBN-10: 0-387-40697-2, 2004.
整数値である量子化MDCT係数列の各係数u(1),・・・,u(N)の可変長符号化の結果、量子化MDCT係数列を表現するに必要なビット数がわかり、想定されたビット数から圧縮によって得られた余剰ビットがわかる。もし、フレームをまたがってビットをやりくりできるならば、余剰ビットは次のフレーム以降で有効利用できる。もし、フレーム内では固定のビット数が割り当てられる場合には別の符号化で有効利用する必要があり、そうでなければ可変長符号化による平均ビット数の削減の意味がなくなる。
量子化誤差の値を符号化する際に、複数のサンプルをまとめてベクトル量子化を行ってもよい。ただし、一般にテーブル(符号帳)中に符号系列を蓄積し、入力と符号系列の距離計算が必要で、メモリ量と演算量が多くなる。また任意のビット数に対応するために個別の符号帳が必要になるなど、構成が煩雑になる。
量子化誤差列に含まれる量子化誤差を1サンプルずつ符号化する場合には、量子化誤差列に含まれる量子化誤差サンプルについての優先順位をきめて、優先順位の高い量子化誤差サンプルから余剰ビット数で符号化可能なもののみを符号化する。例えば、量子化誤差の絶対値又はエネルギーが大きい量子化誤差サンプルから優先的に符号化する。
誤差符号化部110は、量子化誤差列のうちの対応する量子化MDCT係数u(n)の値が0でないT個の量子化誤差サンプルのうち、対応するパワースペクトル包絡値が大きいものからU個選択して、選択されたそれぞれの量子化誤差サンプルに対して、量子化誤差サンプルの正負を表わす情報である1ビットの符号を生成して、生成したUビットの符号を誤差符号として出力する。なお、対応するパワースペクトル包絡値が同一である場合は、例えば、より周波数軸上での位置の小さい量子化誤差サンプル(周波数が低い量子化誤差サンプル)を選択する等の予め定めた規則に従って選択する。
誤差符号化部110は、量子化誤差列のうちの対応する量子化MDCT係数u(n)の値が0でないT個の量子化誤差サンプルのそれぞれについて、量子化誤差サンプルの正負を表わす情報である1ビットの符号を生成する。
誤差符号化部110は、量子化誤差系列に含まれるすべての量子化誤差サンプルのそれぞれについて、量子化誤差サンプルの正負を表わす1ビットの1巡目符号を生成する。
続いて図5から図6を参照して復号処理を説明する。
まず、復号部21が、フレームごとに、入力された符号に含まれる可変長符号を復号して、復号量子化MDCT係数u(n)の列、すなわち符号化装置の量子化MDCT係数u(n)と同一のものと、可変長符号のビットの個数とを出力する(ステップS21)。当然であるが、符号列を得るために実行された可変長符号化方法に対応する可変長復号方法が実行される。復号部21による復号処理の詳細は符号化装置1の符号化部19による符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部21の行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。
パワースペクトル包絡算出部22は、符号化装置1から入力された線形予測係数符号を復号して量子化済み線形予測係数を得て、得られた量子化済み線形予測係数を周波数領域に変換してパワースペクトル包絡を求める(ステップS22)。量子化済み線形予測係数からパワースペクトル包絡を求める処理は符号化装置1のパワースペクトル包絡算出部14と同じである。
誤差復号部23は、まず、量子化MDCT係数列の符号量として予め設定されたビット数から復号部21が出力したビット数を減算した数を余剰ビット数として算出する。次に符号化装置1の誤差符号化部110が出力した誤差符号を、符号化装置1の誤差符号化部110に対応する復号方法で復号して復号量子化誤差q(n)を得る(ステップS23)。符号化装置1において量子化誤差列に与えられたビット数は、復号部21でわかる可変長符号化によるビット数に基づく余剰ビット数から求める。余剰ビット数ごとに符号、復号でサンプルや手順を符号化装置1と復号装置2とで対応するように決めておくので、一意に復号できる。
誤差復号部23内の符号帳記憶部に、余剰ビット数の取り得る値ごとの符号帳を予め格納しておく。各符号帳には、その各符号帳に対応する余剰ビット数で表現可能な個数の復号量子化誤差の系列と同じサンプル数のベクトルと、そのベクトルに対応する符号、とが対応付けて予め格納される。
余剰ビット数をU、復号部21が出力した復号量子化MDCT係数u(n)の値が0でないもののサンプル数をT、復号部21が出力した復号量子化MDCT係数u(n)の値が0であるサンプル数をSとするとき、次のような復号手順が好ましい。
誤差復号部23は、復号量子化MDCT係数u(n)の値が0でないT個サンプルのうち、対応するパワースペクトル包絡値が大きいものからU個選択して、選択されたそれぞれのサンプルに対して、入力された誤差符号に含まれる1ビットの符号を復号してサンプルの正負の情報を得て、得られた正負の情報を再構成値の絶対値0.25に与えて得られる再構成値+0.25又は-0.25を、その復号量子化MDCT係数u(n)に対応する復号量子化誤差q(n)として出力する。なお、対応するパワースペクトル包絡値が同一である場合は、例えば、より周波数軸上での位置の小さい量子化誤差サンプル(周波数が低い量子化誤差サンプル)を選択する等の予め定めた規則に従って選択する。例えば、符号化装置1の誤差符号化部110で用いた規則に対応する規則を誤差復号部23に予め保持しておく。
誤差復号部23は、復号量子化MDCT係数u(n)の値が0でないサンプルに対して、入力された誤差符号に含まれる1ビットの符号を復号して復号量子化誤差サンプルの正負の情報を得て、得られた正負の情報を再構成値の絶対値0.25に与えて得られる再構成値+0.25または-0.25を、その復号量子化MDCT係数u(n)に対応する復号量子化誤差q(n)として出力する。
誤差復号部23は、復号量子化MDCT係数u(n)の値が0でないサンプルについては、以下の処理を行う。
利得復号部24は、入力された利得情報を復号して利得gを得て出力する(ステップS24)。利得gは、加算部25に送信される。
加算部25は、フレームごとに、復号部21が出力した復号量子化MDCT係数列の各係数u(n)と、誤差復号部23が出力した復号量子化誤差系列の対応する各係数q(n)とを加算した加算値を計算する。そして、この加算値に、利得復号部24が出力した利得gを乗じた系列を生成し復号重み付け正規化MDCT係数系列とする(ステップS25)。復号重み付け正規化MDCT係数系列の各係数をx^(n)と表記する。x^(n)=(u(n)+q(n))*gである。
「重み付け包絡逆正規化部26」
次に、重み付け包絡逆正規化部26が、フレームごとに、復号重み付け正規化MDCT係数列の各係数x^(n)にパワースペクトル包絡値を除算することでMDCT係数列を得る(ステップS26)。
次に、時間領域変換部27が、フレームごとに、重み付け包絡逆正規化部26が出力したMDCT係数列を時間領域に変換してフレーム単位の音声音響ディジタル信号を得る(ステップS27)。
上述の実施形態に関わる符号化装置1、復号装置2は、キーボードなどが接続可能な入力部と、液晶ディスプレイなどが接続可能な出力部と、CPU(Central Processing Unit)、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置と、これらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスとを例えば備えている。また、必要に応じて、符号化装置1、復号装置2に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けてもよい。
符号化装置1の量子化部17では、x(n)/gではなく、x(n)/gの値を所定の関数Gで伸縮させた値G(x(n)/g)を用いてもよい。具体的には、量子化部17は、重み付け正規化MDCT係数列の各係数x(n)[1≦n≦N]を利得gで割り算して得られるx(n)/gを関数Gで伸縮させた値G(x(n)/g)に対応する整数値、例えばG(x(n)/g)の小数点以下を四捨五入又は切り上げ又は切り下げして得られる整数値u(n)を量子化MDCT係数とする。この量子化MDCT係数が符号化部19の符号化の対象となる。
Claims (23)
- 所定の時間区間の音響信号に由来する周波数領域のサンプル列を所定の個数のビットで符号化する符号化方法であって、
上記周波数領域のサンプル列の各サンプルの値に対応する整数値を可変長符号化により符号化して可変長符号を生成する符号化ステップと、
上記周波数領域のサンプル列の各サンプルの値からその各サンプルの値に対応する整数値を減算した誤差値の列を算出する誤差算出ステップと、
上記所定の個数から上記可変長符号のビットの個数を減算した個数のビットである余剰ビットを用いて、上記誤差値の列を符号化して誤差符号を生成する誤差符号化ステップと、
を含む符号化方法。 - 請求項1の符号化方法において、
上記誤差符号化ステップは、上記余剰ビットを用いて、上記誤差値の列を構成する誤差サンプルのうち対応する上記整数値が0でない誤差サンプルを優先的に符号化する、
符号化方法。 - 請求項1の符号化方法において、
上記誤差符号化ステップは、上記余剰ビットを用いて、上記誤差値の列を構成する誤差サンプルのうち対応するパワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値が大きい誤差サンプルを優先的に符号化する、
符号化方法。 - 請求項1から3の何れかの符号化方法において、
上記誤差符号化ステップは、上記誤差値の列を構成する誤差サンプルのうち符号化の対象となる各誤差サンプルの値の正負の情報を1ビットで符号化する、
符号化方法。 - 請求項4の符号化方法において、
整数値に応じて定まる値を再構成値の絶対値とし、上記再構成値の絶対値を誤差サンプルの値が正のときに対応する再構成値とし、0から上記再構成値の絶対値を減算した値を誤差サンプルの値が負のときに対応する再構成値として、
上記誤差符号化ステップは、上記余剰ビットの数が上記誤差値の列を構成する誤差サンプルの数よりも大きい場合には、上記各誤差サンプルに対応する再構成値を上記各誤差サンプルの値から減算した値の正負の情報を別の1ビットを用いて更に符号化する、
符号化方法。 - 請求項5の符号化方法において、
整数値が0でない場合の再構成値の絶対値は、整数値が0である場合の再構成値の絶対値よりも大きい、
符号化方法。 - 入力された所定の個数のビットで構成される符号を復号する復号方法であって、
上記符号に含まれる可変長符号を復号して整数値の列を生成する復号ステップと、
上記所定の個数から上記可変長符号のビットの個数を減算した個数のビットである余剰ビットで構成される、上記符号に含まれる誤差符号を復号して誤差値の列を生成する誤差復号ステップと、
上記整数値の列の各サンプルと上記誤差値の列の対応する誤差サンプルとを加算する加算ステップと、
を含む復号方法。 - 請求項7の復号方法において、
上記誤差復号ステップは、上記余剰ビットで表現された、上記誤差値の列を構成する誤差サンプルのうち対応する上記整数値が0でない誤差サンプルを復号する、
復号方法。 - 請求項7の復号方法において、
上記誤差復号ステップは、上記余剰ビットで表現された、上記誤差値の列を構成する誤差サンプルのうち対応するパワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値が大きい誤差サンプルを復号する、
復号方法。 - 請求項7から9の何れかの復号方法において、
整数値に応じて定まる値を再構成値の絶対値として、
上記誤差復号ステップは、上記誤差値の列の各誤差サンプルの値を、上記誤差符号を復号することにより得られた上記各誤差サンプルに対応する1ビットの情報で定まる正負を上記各誤差サンプルに対応する整数値に基づく再構成値の絶対値に対して反映させた値とする、
復号方法。 - 請求項10の復号方法において、
上記誤差復号ステップは、上記各誤差サンプルの値に対応する別の1ビットの情報がある場合には、上記各誤差サンプルの値を、上記反映させた値と、上記別の1ビットの情報で定まる正負を上記各誤差サンプルに対応する整数値に基づく再構成値の絶対値の1/2の値に対して反映させた値とを加算した値とする、
復号方法。 - 請求項10の復号方法において、
整数値が0でない場合の再構成値の絶対値は、整数値が0である場合の再構成値の絶対値よりも大きい、
復号方法。 - 請求項11の復号方法において、
整数値が0でない場合の再構成値の絶対値は、整数値が0である場合の再構成値の絶対値よりも大きい、
復号方法。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列を所定の個数のビットで符号化する符号化装置であって、
上記周波数領域のサンプル列の各サンプルの値に対応する整数値を可変長符号化により符号化して可変長符号を生成する符号化部と、
上記周波数領域のサンプル列の各サンプルの値からその各サンプルの値に対応する整数値を減算した誤差値の列を算出する誤差算出部と、
上記所定の個数から上記可変長符号のビットの個数を減算した個数のビットである余剰ビットを用いて、上記誤差値の列を符号化して誤差符号を生成する誤差符号化部と、
を含む符号化装置。 - 請求項14の符号化装置において、
上記誤差符号化部は、上記余剰ビットを用いて、上記誤差値の列を構成する誤差サンプルのうち対応する上記整数値が0でない誤差サンプルを優先的に符号化する、
符号化装置。 - 請求項14の符号化装置において、
上記誤差符号化部は、上記余剰ビットを用いて、上記誤差値の列を構成する誤差サンプルのうち対応するパワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値が大きい誤差サンプルを優先的に符号化する、
符号化装置。 - 入力された所定の個数のビットで構成される符号を復号する復号装置であって、
上記符号に含まれる可変長符号を復号して整数値の列を生成する復号部と、
上記所定の個数から上記可変長符号のビットの個数を減算した個数のビットである余剰ビットで構成される、上記符号に含まれる誤差符号を復号して誤差値の列を生成する誤差復号部と、
上記整数値の列の各サンプルと上記誤差値の列の対応する誤差サンプルとを加算する加算部と、
を含む復号装置。 - 請求項17の復号装置において、
上記誤差復号部は、上記余剰ビットで表現された、上記誤差値の列を構成する誤差サンプルのうち対応する上記整数値が0でない誤差サンプルを復号する、
復号装置。 - 請求項17の復号装置において、
上記誤差復号部は、上記余剰ビットで表現された、上記誤差値の列を構成する誤差サンプルのうち対応するパワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値が大きい誤差サンプルを復号する、
復号装置。 - 請求項1から6に記載された方法の各ステップをコンピュータに実現させるためのプログラム。
- 請求項7から13に記載された方法の各ステップをコンピュータに実現させるためのプログラム。
- 請求項1から6に記載された方法の各ステップをコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
- 請求項7から13に記載された方法の各ステップをコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013508811A JP5603484B2 (ja) | 2011-04-05 | 2012-03-26 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011083740 | 2011-04-05 | ||
JP2011083740 | 2011-04-05 | ||
PCT/JP2012/057685 WO2012137617A1 (ja) | 2011-04-05 | 2012-03-26 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
JP2013508811A JP5603484B2 (ja) | 2011-04-05 | 2012-03-26 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012137617A1 JPWO2012137617A1 (ja) | 2014-07-28 |
JP5603484B2 true JP5603484B2 (ja) | 2014-10-08 |
Family
ID=46969018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013508811A Active JP5603484B2 (ja) | 2011-04-05 | 2012-03-26 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Country Status (10)
Country | Link |
---|---|
US (3) | US10515643B2 (ja) |
EP (3) | EP2696343B1 (ja) |
JP (1) | JP5603484B2 (ja) |
KR (1) | KR101569060B1 (ja) |
CN (1) | CN103460287B (ja) |
ES (2) | ES2617958T3 (ja) |
PL (1) | PL3154057T3 (ja) |
RU (1) | RU2571561C2 (ja) |
TR (1) | TR201900411T4 (ja) |
WO (1) | WO2012137617A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
EP2757559A1 (en) * | 2013-01-22 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation |
CN107369454B (zh) * | 2014-03-21 | 2020-10-27 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
US9911427B2 (en) * | 2014-03-24 | 2018-03-06 | Nippon Telegraph And Telephone Corporation | Gain adjustment coding for audio encoder by periodicity-based and non-periodicity-based encoding methods |
EP3447766B1 (en) * | 2014-04-24 | 2020-04-08 | Nippon Telegraph and Telephone Corporation | Encoding method, encoding apparatus, corresponding program and recording medium |
KR101855945B1 (ko) * | 2014-05-01 | 2018-05-10 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체 |
PL3509063T3 (pl) * | 2014-05-01 | 2020-08-24 | Nippon Telegraph And Telephone Corporation | Koder, dekoder, sposób kodowania, sposób dekodowania, program kodujący, program dekodujący i nośnik rejestrujący |
CN106537500B (zh) * | 2014-05-01 | 2019-09-13 | 日本电信电话株式会社 | 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质 |
PL3594946T3 (pl) * | 2014-05-01 | 2021-03-08 | Nippon Telegraph And Telephone Corporation | Dekodowanie sygnału dźwiękowego |
KR20230066137A (ko) | 2014-07-28 | 2023-05-12 | 삼성전자주식회사 | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
EP3252758B1 (en) * | 2015-01-30 | 2020-03-18 | Nippon Telegraph and Telephone Corporation | Encoding apparatus, decoding apparatus, and methods, programs and recording media for encoding apparatus and decoding apparatus |
JP6499206B2 (ja) * | 2015-01-30 | 2019-04-10 | 日本電信電話株式会社 | パラメータ決定装置、方法、プログラム及び記録媒体 |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
WO2018052004A1 (ja) * | 2016-09-15 | 2018-03-22 | 日本電信電話株式会社 | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
CN110709927B (zh) * | 2017-06-07 | 2022-11-01 | 日本电信电话株式会社 | 编码装置、解码装置、平滑化装置、逆平滑化装置、其方法及记录介质 |
WO2018235418A1 (ja) * | 2017-06-22 | 2018-12-27 | 日本電信電話株式会社 | 符号化装置、復号装置、符号化方法、復号方法、およびプログラム |
US11621010B2 (en) * | 2018-03-02 | 2023-04-04 | Nippon Telegraph And Telephone Corporation | Coding apparatus, coding method, program, and recording medium |
CN112154502B (zh) | 2018-04-05 | 2024-03-01 | 瑞典爱立信有限公司 | 支持生成舒适噪声 |
WO2019198383A1 (ja) * | 2018-04-13 | 2019-10-17 | 日本電信電話株式会社 | 符号化装置、復号装置、符号化方法、復号方法、プログラム、および記録媒体 |
JP7322620B2 (ja) * | 2019-09-13 | 2023-08-08 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03191628A (ja) * | 1989-12-21 | 1991-08-21 | Toshiba Corp | 可変レート符号化方式 |
JPH0470800A (ja) * | 1990-07-11 | 1992-03-05 | Sharp Corp | 音声情報圧縮装置 |
JPH09214348A (ja) * | 1996-01-30 | 1997-08-15 | Sony Corp | 信号符号化方法 |
JP2006011170A (ja) * | 2004-06-28 | 2006-01-12 | Sony Corp | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6091460A (en) * | 1994-03-31 | 2000-07-18 | Mitsubishi Denki Kabushiki Kaisha | Video signal encoding method and system |
JP3170193B2 (ja) * | 1995-03-16 | 2001-05-28 | 松下電器産業株式会社 | 画像信号の符号化装置及び復号装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US20030039648A1 (en) * | 1998-09-16 | 2003-02-27 | Genentech, Inc. | Compositions and methods for the diagnosis and treatment of tumor |
US6677262B2 (en) * | 2000-07-05 | 2004-01-13 | Shin-Etsu Chemical Co., Ltd. | Rare earth oxide, basic rare earth carbonate, making method, phosphor, and ceramic |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US7599835B2 (en) * | 2002-03-08 | 2009-10-06 | Nippon Telegraph And Telephone Corporation | Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program |
US7275036B2 (en) * | 2002-04-18 | 2007-09-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data |
JP4296753B2 (ja) * | 2002-05-20 | 2009-07-15 | ソニー株式会社 | 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体 |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
KR100477699B1 (ko) | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
US8107535B2 (en) * | 2003-06-10 | 2012-01-31 | Rensselaer Polytechnic Institute (Rpi) | Method and apparatus for scalable motion vector coding |
DE10345996A1 (de) * | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
US7895034B2 (en) * | 2004-09-17 | 2011-02-22 | Digital Rise Technology Co., Ltd. | Audio encoding system |
WO2006062142A1 (ja) * | 2004-12-07 | 2006-06-15 | Nippon Telegraph And Telephone Corporation | 情報圧縮符号化装置、その復号化装置、これらの方法、およびこれらのプログラムとその記録媒体 |
CN101124740B (zh) * | 2005-02-23 | 2012-05-30 | 艾利森电话股份有限公司 | 多声道音频信号编码和解码的方法和装置和音频传送系统 |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
US7617436B2 (en) * | 2005-08-02 | 2009-11-10 | Nokia Corporation | Method, device, and system for forward channel error recovery in video sequence transmission over packet-based network |
KR20070046752A (ko) * | 2005-10-31 | 2007-05-03 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
TWI276047B (en) * | 2005-12-15 | 2007-03-11 | Ind Tech Res Inst | An apparatus and method for lossless entropy coding of audio signal |
JP4548348B2 (ja) | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
KR101471978B1 (ko) | 2007-02-02 | 2014-12-12 | 삼성전자주식회사 | 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 |
JP4871894B2 (ja) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
CN101308661B (zh) * | 2007-05-16 | 2011-07-13 | 中兴通讯股份有限公司 | 一种基于先进音频编码器的量化器码率失真控制方法 |
WO2009004727A1 (ja) * | 2007-07-04 | 2009-01-08 | Fujitsu Limited | 符号化装置、符号化方法および符号化プログラム |
US7937574B2 (en) * | 2007-07-17 | 2011-05-03 | Advanced Micro Devices, Inc. | Precise counter hardware for microcode loops |
EP2063417A1 (en) * | 2007-11-23 | 2009-05-27 | Deutsche Thomson OHG | Rounding noise shaping for integer transform based encoding and decoding |
CN101919164B (zh) * | 2007-12-11 | 2013-10-30 | 日本电信电话株式会社 | 编码方法、解码方法、使用了这些方法的装置、程序、记录介质 |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
US8386271B2 (en) * | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
WO2010084951A1 (ja) * | 2009-01-23 | 2010-07-29 | 日本電信電話株式会社 | パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体 |
US20100191534A1 (en) * | 2009-01-23 | 2010-07-29 | Qualcomm Incorporated | Method and apparatus for compression or decompression of digital signals |
JP2010225949A (ja) * | 2009-03-25 | 2010-10-07 | Kyocera Corp | 発熱体の放熱構造 |
IN2012DN05235A (ja) * | 2010-01-08 | 2015-10-23 | Nippon Telegraph & Telephone | |
JP5612698B2 (ja) | 2010-10-05 | 2014-10-22 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
-
2012
- 2012-03-26 ES ES12767213.7T patent/ES2617958T3/es active Active
- 2012-03-26 JP JP2013508811A patent/JP5603484B2/ja active Active
- 2012-03-26 EP EP12767213.7A patent/EP2696343B1/en active Active
- 2012-03-26 RU RU2013143624/08A patent/RU2571561C2/ru active
- 2012-03-26 CN CN201280015955.3A patent/CN103460287B/zh active Active
- 2012-03-26 PL PL16195433T patent/PL3154057T3/pl unknown
- 2012-03-26 EP EP18196322.4A patent/EP3441967A1/en active Pending
- 2012-03-26 KR KR1020137025380A patent/KR101569060B1/ko active IP Right Grant
- 2012-03-26 WO PCT/JP2012/057685 patent/WO2012137617A1/ja active Application Filing
- 2012-03-26 EP EP16195433.4A patent/EP3154057B1/en active Active
- 2012-03-26 TR TR2019/00411T patent/TR201900411T4/tr unknown
- 2012-03-26 ES ES16195433T patent/ES2704742T3/es active Active
- 2012-03-26 US US14/007,844 patent/US10515643B2/en active Active
-
2019
- 2019-11-18 US US16/687,144 patent/US11024319B2/en active Active
- 2019-11-18 US US16/687,176 patent/US11074919B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03191628A (ja) * | 1989-12-21 | 1991-08-21 | Toshiba Corp | 可変レート符号化方式 |
JPH0470800A (ja) * | 1990-07-11 | 1992-03-05 | Sharp Corp | 音声情報圧縮装置 |
JPH09214348A (ja) * | 1996-01-30 | 1997-08-15 | Sony Corp | 信号符号化方法 |
JP2006011170A (ja) * | 2004-06-28 | 2006-01-12 | Sony Corp | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
Also Published As
Publication number | Publication date |
---|---|
PL3154057T3 (pl) | 2019-04-30 |
CN103460287A (zh) | 2013-12-18 |
RU2571561C2 (ru) | 2015-12-20 |
EP2696343A1 (en) | 2014-02-12 |
EP2696343A4 (en) | 2014-11-12 |
TR201900411T4 (tr) | 2019-02-21 |
JPWO2012137617A1 (ja) | 2014-07-28 |
WO2012137617A1 (ja) | 2012-10-11 |
US10515643B2 (en) | 2019-12-24 |
CN103460287B (zh) | 2016-03-23 |
EP3441967A1 (en) | 2019-02-13 |
US20200090664A1 (en) | 2020-03-19 |
ES2704742T3 (es) | 2019-03-19 |
KR20130133854A (ko) | 2013-12-09 |
EP3154057B1 (en) | 2018-10-17 |
EP3154057A1 (en) | 2017-04-12 |
RU2013143624A (ru) | 2015-05-10 |
ES2617958T3 (es) | 2017-06-20 |
US11024319B2 (en) | 2021-06-01 |
US20200090665A1 (en) | 2020-03-19 |
US11074919B2 (en) | 2021-07-27 |
KR101569060B1 (ko) | 2015-11-13 |
US20140019145A1 (en) | 2014-01-16 |
EP2696343B1 (en) | 2016-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5603484B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
US10083703B2 (en) | Frequency domain pitch period based encoding and decoding in accordance with magnitude and amplitude criteria | |
RU2554554C2 (ru) | Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи | |
JP5612698B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP6867528B2 (ja) | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 | |
JP5694751B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP6595687B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
US20170272766A1 (en) | Encoding apparatus, decoding apparatus, and method and program for the same | |
JP5579932B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 | |
JP5714172B2 (ja) | 符号化装置、この方法、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140812 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140821 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5603484 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |