JP5603484B2 - 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 - Google Patents

符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 Download PDF

Info

Publication number
JP5603484B2
JP5603484B2 JP2013508811A JP2013508811A JP5603484B2 JP 5603484 B2 JP5603484 B2 JP 5603484B2 JP 2013508811 A JP2013508811 A JP 2013508811A JP 2013508811 A JP2013508811 A JP 2013508811A JP 5603484 B2 JP5603484 B2 JP 5603484B2
Authority
JP
Japan
Prior art keywords
value
error
encoding
decoding
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013508811A
Other languages
English (en)
Other versions
JPWO2012137617A1 (ja
Inventor
健弘 守谷
登 原田
優 鎌本
祐介 日和▲崎▼
勝宏 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013508811A priority Critical patent/JP5603484B2/ja
Publication of JPWO2012137617A1 publication Critical patent/JPWO2012137617A1/ja
Application granted granted Critical
Publication of JP5603484B2 publication Critical patent/JP5603484B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio

Description

本発明は、音響信号の符号化技術並びにこの符号化技術によって得られた符号列の復号技術に関する。より詳しくは、音響信号を周波数領域に変換して得られた周波数領域のサンプル列の符号化とその復号に関する。
低ビット(例えば10kbit/s〜20kbit/s程度)の音声信号や音響信号の符号化方法として、DFT(離散フーリエ変換)やMDCT(変形離散コサイン変換)などの直交変換係数に対する適応符号化が知られている。例えば標準規格技術であるAMR-WB+(Extended Adaptive Multi-Rate Wideband)は、TCX(transform coded excitation:変換符号化励振)符号化モードを持ち、この中ではDFT係数を8サンプルごとに正規化してベクトル量子化している(例えば、非特許文献1参照。)。
ETSI TS 126 290 V6.3.0 (2005-06)
AMR-WB+をはじめ、TCXに基づく符号化では周期性に基づく周波数領域の係数の振幅のばらつきは考慮されていないため、ばらつきの大きい振幅をまとめて符号化すると符号化効率は低下してしまう。TCXでの量子化や符号化には各種変形例があるが、係数を利得で割り算した信号の量子化により離散値となったMDCT係数を周波数の低いほうから並べた系列を算術符号などのエントロピー符号化によって圧縮を行う場合を例えば考える。この場合、複数のサンプルを1シンボル(符号化単位)とし、そのシンボルの直前のシンボルに依存して割り当て符号を適応的に制御する。一般に、振幅が小さければ短い符号が割り当てられ、振幅が大きい場合には長い符号が割り当てられる。この結果、フレームあたりのビット数は平均的に削減されるが、フレームあたりの割り当てビット数が固定の場合には、削減されたビットは有効利用できない可能性がある。
本発明は、このような技術的背景に鑑みて、離散信号、特に音声音響ディジタル信号の低ビットでの符号化による品質を低演算量で改善する符号化、復号技術を提供することを目的とする。
本発明の一態様による符号化方法は、所定の時間区間の音響信号に由来する周波数領域のサンプル列を所定の個数のビットで符号化する符号化方法であって、周波数領域のサンプル列の各サンプルの値に対応する整数値を可変長符号化により符号化して可変長符号を生成する符号化ステップと、周波数領域のサンプル列の各サンプルの値からその各サンプルの値に対応する整数値を減算した誤差値の列を算出する誤差算出ステップと、所定の個数から可変長符号のビットの個数を減算した個数のビットである余剰ビットを用いて、誤差値の列を符号化して誤差符号を生成する誤差符号化ステップと、を含む。
本発明の一態様による復号方法は、入力された所定の個数のビットで構成される符号を復号する復号方法であって、符号に含まれる可変長符号を復号して整数値の列を生成する復号ステップと、所定の個数から可変長符号のビットの個数を減算した個数のビットである余剰ビットで構成される、符号に含まれる誤差符号を復号して誤差値の列を生成する誤差復号ステップと、整数値の列の各サンプルと誤差値の列の対応する誤差サンプルとを加算する加算ステップと、を含む。
整数値に対する可変長符号により節約することができたビットである余剰ビットで、誤差値を符号化することにより、フレームあたりのビット数が固定である場合でも符号化効率の向上や量子化歪の軽減などが実現される。
実施形態の符号化装置の構成を説明するためのブロック図。 実施形態の符号化装置の処理を説明するためのフローチャート。 重み付け正規化MDCT係数とパワースペクトル包絡との関係を説明するための図。 余剰ビット数が多い場合の処理の例を説明するための図。 実施形態の復号装置の構成を説明するためのブロック図。 実施形態の復号装置の処理を説明するためのフローチャート。
図面を参照しながら本発明の実施形態を説明する。なお、重複する構成要素には同じ参照符号を当てて重複説明を省略する。
この実施形態は、所定の時間区間をフレームとし、フレーム内の音響信号に由来する周波数領域のサンプル列を量子化する枠組みの中で、周波数領域のサンプルの重み付平坦化後の系列の可変長符号化を行うことと、その可変長符号化によって節約できた余剰ビットを用いて優先度を決めて誤差信号を量子化することで符号化の歪を少なくするという符号化の改善を特徴の一つとする。特にフレームあたりの割り当てビット数が固定である場合にでも可変長符号化の利点が生かせる。
音響信号に由来する周波数領域のサンプル列、換言すれば音響信号に基づく周波数領域のサンプル列として、例えば、フレーム単位の音声音響ディジタル信号が時間領域から周波数領域に変換して得られるDFT係数列やMDCT係数列、このような係数列に対して正規化や重み付けや量子化などの処理が適用された係数列などを例示することができる。以下、MDCT係数列を例にとって実施形態を説明する。
[符号化の実施形態]
最初に図1から図4を参照して符号化処理を説明する。
図1に示すように、符号化装置1は、周波数領域変換部11、線形予測分析部12、線形予測係数量子化符号化部13、パワースペクトル包絡算出部14、重み付け包絡正規化部15、正規化利得計算部16、量子化部17、誤差算出部18、符号化部19、誤差符号化部110を例えば備える。符号化装置1は、図2に例示された符号化方法の各処理を行う。以下、符号化装置1の各処理を説明する。
「周波数領域変換部11」
まず、周波数領域変換部11がフレーム単位で音声音響ディジタル信号を周波数領域のN点のMDCT係数列に変換する(ステップS11)。
一般論として、符号化側ではMDCT係数列を量子化して、量子化されたMDCT係数列を符号化して、得られた符号列を復号側へ伝送し、復号側では当該符号列から量子化されたMDCT係数列を再構成し、さらに逆MDCT変換によって時間領域の音声音響ディジタル信号を再構成することができる。
ところで、MDCT係数の振幅は近似的に通常のDFTのパワースペクトルと同じ振幅包絡(パワースペクトル包絡)を持つ。このため、振幅包絡の対数値に比例する情報割り当てを行うことによって、全帯域のMDCT係数の量子化歪(量子化誤差)を均一に分散させることができ、全体の量子化歪を小さくすることができ、加えて情報圧縮も実現される。なお、パワースペクトル包絡は線形予測分析によって求められた線形予測係数を使って効率よく推定することができる。
このような量子化誤差を制御する方法としては、各MDCT係数の量子化ビットを適応的に割り当てる(振幅を平坦にした後で量子化のステップ幅を調整する)方法や、重み付けベクトル量子化により適応的に重みをつけて符号を決定する方法がある。ここでは、本発明の実施形態において実行される量子化方法の一例を説明するが、説明する量子化方法に限定されるものではないことに留意されたい。
「線形予測分析部12」
線形予測分析部12は、フレーム単位で音声音響ディジタル信号を線形予測分析し、予め定めた次数までの線形予測係数を求めて出力する(ステップS12)。
「線形予測係数量子化符号化部13」
線形予測係数量子化符号化部13は、線形予測分析部12が求めた線形予測係数に対応する符号と、量子化済み線形予測係数とを求めて出力する(ステップS13)。
その際、線形予測係数をLSP(Line Spectral Pairs)に変換し、LSPに対応する符号と量子化済みLSPとを求め、量子化済みLSPを量子化済み線形予測係数に変換する処理を行ってもよい。
線形予測係数に対応する符号である線形予測係数符号は、復号装置2に送信される符号の一部とされる。
「パワースペクトル包絡算出部14」
パワースペクトル包絡算出部14は、線形予測係数量子化符号化部13が出力した量子化済み線形予測係数を周波数領域に変換してパワースペクトル包絡を求める(ステップS14)。求まったパワースペクトル包絡は、重み付け包絡正規化部15に送信される。また、必要に応じて、図1に破線で示すように誤差符号化部110に送信される。
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、量子化済み線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により、時刻tの時間信号y(t)は、p時点まで遡った過去の自分自身の値y(t-1),・・・,y(t-p)と予測残差e(t)と量子化済み線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
Figure 0005603484
なお、上記の次数pは、線形予測係数量子化符号化部13が出力した量子化済み線形予測係数の次数と同一であってもよいし、線形予測係数量子化符号化部13が出力した量子化済み線形予測係数の次数未満であってもよい。
また、パワースペクトル包絡算出部14では、パワースペクトル包絡値の代わりにパワースペクトル包絡値の概算値やパワースペクトル包絡値の推定値を算出してもよい。パワースペクトル包絡値とは、パワースペクトル包絡係数列の各係数W(1),・・・,W(N)のことである。
例えば、パワースペクトル包絡値の概算値を算出する場合は、パワースペクトル包絡算出部14は、1≦n≦N/4について式(2)により各係数W(n)を求め、W'(4n-3)= W'(4n-2)=W'(4n-1)= W'(4n)=W(n) [1≦n≦N/4]として求めた、N個のW'(n)をパワースペクトル包絡値の概算値として出力する。
「重み付け包絡正規化部15」
重み付け包絡正規化部15は、パワースペクトル包絡算出部14が出力したパワースペクトル包絡によって、MDCT係数列の各係数を正規化する(ステップS15)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部15は、パワースペクトル包絡値の系列やその平方根の系列を周波数方向で平滑化した重み付けスペクトル包絡係数を用いてフレーム単位でMDCT係数列の各係数を正規化する。この結果、フレーム単位の重み付け正規化MDCT係数列の各係数x(1),・・・,x(N)が得られる。重み付け正規化MDCT係数列は、正規化利得計算部16、量子化部17及び誤差算出部18に送信される。重み付け正規化MDCT係数列は一般には低周波領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつものの、元のMDCT係数列ほどの大きな振幅傾きや振幅の凹凸を持たない。
「正規化利得計算部16」
次に、正規化利得計算部16が、フレームごとに、重み付け正規化MDCT係数列の各係数x(1),・・・,x(N)を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値の和を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数g(以下、利得という。)を求める(ステップS16)。この利得を表す情報である利得情報は、復号装置2に送信される符号の一部とされる。
「量子化部17」
次に、量子化部17が、フレームごとに、重み付け正規化MDCT係数列の各係数x(1),・・・,x(N)をステップS16の処理で決定された量子化ステップ幅で量子化する(ステップS17)。すなわち、重み付け正規化MDCT係数列の各係数x(n)[1≦n≦N]を利得gで割り算して得られるx(n)/gの値の小数点以下を四捨五入して得られる整数値u(n)を量子化MDCT係数とする。フレーム単位の量子化MDCT係数列は、誤差算出部18及び符号化部19に送信される。なお、x(n)/gの値の小数点以下を切り上げ又は切り下げして得られる値を、整数値u(n)としてもよい。このように、整数値u(n)はx(n)/gの値に対応する値としてもよい。
この実施形態では、x(n)/gの列が特許請求の範囲の周波数領域のサンプル列に対応する。x(n)/gの列は、周波数領域のサンプル列の一例である。また、整数値u(n)である量子化MDCT係数が、周波数領域のサンプル列の各サンプルの値に対応する整数値に対応する。
「誤差算出部18」
ステップS15の処理で得られた重み付け正規化MDCT系列と、ステップS16の処理で得られた利得gと、ステップS17の処理で得られたフレーム単位の量子化MDCT係数列とが、誤差算出部18の入力となる。量子化による誤差はr(n)=x(n)/g-u(n) [1≦n≦N]で求められる。すなわち、重み付け正規化MDCT係数列の各係数x(n)を利得gで除算した値からその各係数x(n)に対応する量子化MDCT係数u(n)を減算した値をその各係数x(n)に対応する量子化誤差r(n)とする。
量子化誤差r(n)の列が、特許請求の範囲の誤差値の列に対応する。
「符号化部19」
次に、符号化部19が、フレームごとに、量子化部17が出力した量子化MDCT係数列(量子化MDCT係数u(n)の列)を符号化し、得られた符号とその符号のビット数を出力する(ステップS19)。
符号化部19は、例えば量子化MDCT係数列の値の頻度に応じた長さの符号が割り当てる可変長符号化により、平均符号量を小さくできる。可変長符号としてはライス符号、ハフマン符号、算術符号、ランレングス符号などがある。
なお、ここで例示したライス符号化、ランレングス符号化はいずれも周知であるからその詳細な説明を省略する(例えば参考文献1参照)。
(参考文献1)David Salomon, "Data Compression : The Complete Reference," 3rd edition, Springer-Verlag, ISBN-10: 0-387-40697-2, 2004.
生成された可変長符号は、復号装置2に送信される符号の一部となる。どのような可変長符号化方法が実行されたかは選択情報によって特定される。この選択情報が、復号装置2に送信されるようにしてもよい。
「誤差符号化部110」
整数値である量子化MDCT係数列の各係数u(1),・・・,u(N)の可変長符号化の結果、量子化MDCT係数列を表現するに必要なビット数がわかり、想定されたビット数から圧縮によって得られた余剰ビットがわかる。もし、フレームをまたがってビットをやりくりできるならば、余剰ビットは次のフレーム以降で有効利用できる。もし、フレーム内では固定のビット数が割り当てられる場合には別の符号化で有効利用する必要があり、そうでなければ可変長符号化による平均ビット数の削減の意味がなくなる。
そこで、本実施形態では、誤差符号化部110が、余剰ビットの全部又は一部を使って、量子化誤差r(n)=x(n)/g-u(n)を符号化する。なお、余剰ビットの全部又は一部を用いることを、余剰ビットを用いると略記することにする。量子化誤差r(n)の符号化に使われなかった余剰ビットは、他の用途、例えば利得gの補正に用いられる。量子化誤差r(n)は、量子化による四捨五入での誤差であるので、-0.5から+0.5までにほぼ均等に分布する。任意のビット数ですべてのサンプル(例えば256点)を符号化するために、余剰ビットによって符号化方法、対象とするサンプルの位置の規則を決めておく。余剰ビットで再構成する系列をq(n)とし、フレーム全体の誤差E=Σn∈N(r(n)-q(n))2を最小化することが目的である。
誤差符号化部110は、まず、重み付け正規化MDCT係数列の符号量として予め設定されたビット数から符号化部19が出力した可変長符号のビット数を減算したものを余剰ビット数として算出する。次に、誤差算出部18で得られた量子化誤差列を余剰ビット数で符号化し、得られた誤差符号を出力する(ステップS110)。この誤差符号は、復号装置2に送信される符号の一部とされる。
<誤差符号化の具体例1>
量子化誤差の値を符号化する際に、複数のサンプルをまとめてベクトル量子化を行ってもよい。ただし、一般にテーブル(符号帳)中に符号系列を蓄積し、入力と符号系列の距離計算が必要で、メモリ量と演算量が多くなる。また任意のビット数に対応するために個別の符号帳が必要になるなど、構成が煩雑になる。
具体例1の動作は下記の通りである。
誤差符号化部110内の符号帳記憶部に、余剰ビット数の取り得る値ごとの符号帳を予め格納しておく。各符号帳には、その各符号帳に対応する余剰ビット数で表現可能な個数の量子化誤差の系列と同じサンプル数のベクトルと、そのベクトルに対応する符号とが対応付けて予め格納されている。
誤差符号化部110は、余剰ビット数を算出した後に、算出された余剰ビット数に対応する符号帳を符号帳記憶部に格納された符号帳から選択し、選択された符号帳を用いてベクトル量子化を行なう。符号帳を選択した後の符号化処理は一般的なベクトル量子化と同じである。すなわち、選択された符号帳の各ベクトルと入力された量子化誤差の系列との距離が最小となるか、それらの相関が最大となるベクトルに対応する符号を誤差符号として出力する。
なお、上記の説明では、符号帳に格納されるベクトルは、量子化誤差の系列と同じサンプル数としたが、符号帳に格納されるベクトルのサンプル数を量子化誤差の系列の整数分の1とし、量子化誤差の系列を複数の部分毎にベクトル量子化し、得られる複数の符号を誤差符号としても良い。
<誤差符号化部110の具体例2>
量子化誤差列に含まれる量子化誤差を1サンプルずつ符号化する場合には、量子化誤差列に含まれる量子化誤差サンプルについての優先順位をきめて、優先順位の高い量子化誤差サンプルから余剰ビット数で符号化可能なもののみを符号化する。例えば、量子化誤差の絶対値又はエネルギーが大きい量子化誤差サンプルから優先的に符号化する。
優先順位を決める際に例えばパワースペクトル包絡値を参考にすることができる。もちろん、パワースペクトル包絡値と同様に、パワースペクトル包絡値の概算値、パワースペクトル包絡値の推定値、これらの何れかの値を周波数方向で平滑化した値、これらの何れかの値の複数サンプルについての平均値、これらの値の少なくとも何れか1つと大小関係が同一となる値を参考にすることもできるが、以下ではパワースペクトル包絡値を用いる場合についてのみ説明する。図3の例のように、音声や楽音などの音響信号では、量子化対象の周波数領域のサンプル列の振幅傾向(図3の重み付け平坦化後のスペクトル包絡に対応)を音響信号のパワースペクトル包絡(図3の原音のスペクトル包絡に対応)と類似させることにより聴覚的歪を小さくできるので、結果としてパワースペクトル包絡値が大きい場合には、対応する重み付け正規化MDCT係数x(n)の値も大きい傾向にある。重み付け正規化MDCT係数x(n)が大きくても量子化誤差r(n)は-0.5から+0.5の範囲内である。
一方、重み付け正規化MDCT係数x(n)が非常に小さい値である場合、すなわちステップ幅の1/2より小さい値である場合には重み付け正規化MDCT係数x(n)を利得gで割り算した結果は0で、量子化誤差r(n)も0.5より大幅に小さい。すなわち、パワースペクトル包絡値がある程度小さい場合には、重み付け正規化MDCT係数x(n)の他に量子化誤差r(n)の符号化をしたところで聴覚品質への影響は小さいので、誤差符号化部110での符号化対象から除外してもよい。パワースペクトル包絡値がある程度大きい場合にはどのサンプルの量子化誤差が大きいかはわからないので、例えばもとのサンプルの周波数軸上での位置の小さい順(周波数が低い順)、又は、パワースペクトル包絡値の大きい順に余剰ビット分だけ、量子化誤差のサンプルr(n)の符号化を各1ビットで行う。また、パワースペクトル包絡値が一定以下の場合を除外するだけでもよい。
量子化誤差系列を符号化するにあたって、ある量子化誤差サンプルの値r(n)=xとして、その量子化による歪をE=∫0 0.5f(x)(x-μ)2dxとする。ここでf(x)は確率分布関数、μは復号装置での再構成値の絶対値である。量子化による歪Eを最小化するためには、dE/dμ=0とするようにμを決めればよい。すなわち、μは量子化誤差r(n)の確率分布の重心点とすればよい。
重み付け正規化MDCT係数x(n)を利得gで割り算して四捨五入した結果、すなわち対応する量子化MDCT係数u(n)の値が0でないなら、量子化誤差r(n)の分布はほぼ均一であり、μ=0.25とできる。
重み付け正規化MDCT係数x(n)を利得gで割り算して四捨五入した結果、すなわち対応する量子化MDCT係数u(n)の値が0なら、量子化誤差r(n)の分布は0に集中する傾向があるので、その分布の重心をμの値として使う必要がある。
この場合、対応する量子化MDCT係数u(n)の値が0となる複数の量子化誤差サンプルごとに、符号化の対象とする量子化誤差サンプルを選択して、その選択された量子化誤差サンプルの複数の量子化誤差サンプルにおける位置と、その選択された量子化誤差サンプルの値とを符号化して誤差符号として復号装置2に送信してもよい。例えば、対応する量子化MDCT係数u(n)の値が0となる4個の量子化誤差サンプルのうち、値の絶対値が最も大きい量子化誤差サンプルを選択し、その選択された量子化誤差サンプルの値を量子化(例えば+か−かを決定)してその情報を1ビットで送るとともに、その選択された量子化誤差サンプルの位置を2ビットで送る。選択されなかった量子化誤差サンプルは符号が復号装置2に送られないので、復号装置2における復号値は0とする。一般に、2q個のサンプルの何れの位置のサンプルを選択したかを復号装置に伝えるためにはqビット必要である。
この際のμは、複数サンプル単位で量子化誤差の値の絶対値が最も大きいサンプルだけの分布の重心の値を使えばよい。
余剰ビット数が多い場合には図4のように複数の系列の組み合わせでまばらなサンプルを表現できる。第1の系列は4個の位置のどれか1個のみ(指定に2ビット)に+か−のパルスをたて、他の位置は0とすることができる。すなわち、第1の系列の表現に3ビット必要になる。同様に第2の系列、第5の系列までで計15ビットで符号化できる。
余剰ビット数をU、量子化誤差列を構成する量子化誤差サンプルの個数のうち、対応する量子化MDCT係数u(n)の値が0でないものの量子化誤差サンプルの個数をT、対応する量子化MDCT係数u(n)の値が0である量子化誤差サンプルの個数をSとするとき、次のような手順で符号化を行うことができる。
(A)U≦Tの場合
誤差符号化部110は、量子化誤差列のうちの対応する量子化MDCT係数u(n)の値が0でないT個の量子化誤差サンプルのうち、対応するパワースペクトル包絡値が大きいものからU個選択して、選択されたそれぞれの量子化誤差サンプルに対して、量子化誤差サンプルの正負を表わす情報である1ビットの符号を生成して、生成したUビットの符号を誤差符号として出力する。なお、対応するパワースペクトル包絡値が同一である場合は、例えば、より周波数軸上での位置の小さい量子化誤差サンプル(周波数が低い量子化誤差サンプル)を選択する等の予め定めた規則に従って選択する。
(B)T<U≦T+Sの場合
誤差符号化部110は、量子化誤差列のうちの対応する量子化MDCT係数u(n)の値が0でないT個の量子化誤差サンプルのそれぞれについて、量子化誤差サンプルの正負を表わす情報である1ビットの符号を生成する。
誤差符号化部110はまた、U-Tビットで量子化誤差系列のうちの対応する量子化MDCT係数u(n)の値が0である量子化誤差サンプルを符号化する。対応する量子化MDCT係数u(n)の値が0である量子化誤差サンプルが複数ある場合には、対応するパワースペクトル包絡値が大きいものから優先して符号化する。具体的には、対応する量子化MDCT係数u(n)の値が0である量子化誤差サンプルのうち、対応するパワースペクトル包絡値が大きいものからU-T個のそれぞれについて、量子化誤差サンプルの正負を表わす1ビットの符号を生成する。または、対応する量子化MDCT係数u(n)の値が0である量子化誤差サンプルのうち、対応するパワースペクトル包絡値が大きいものから複数個を取り出し、複数個の量子化誤差サンプルごとにベクトル量子化して、U-Tビットの符号を生成する。なお、対応するパワースペクトル包絡値が同一である場合は、例えば、より周波数軸上での位置の小さい量子化誤差サンプル(周波数が低い量子化誤差サンプル)を選択する等の予め定めた規則に従って選択する。
誤差符号化部110はさらに、生成したUビットの符号とU-Tビットの符号とを合わせたものを誤差符号として出力する。
(C)T+S<Uの場合
誤差符号化部110は、量子化誤差系列に含まれるすべての量子化誤差サンプルのそれぞれについて、量子化誤差サンプルの正負を表わす1ビットの1巡目符号を生成する。
また、誤差符号化部110は、残りのU-(T+S)ビットを使って(A)や(B)の手順で量子化誤差サンプルを更に符号化する。すなわち、U-(T+S)を新たなUとして1巡目の符号化の誤差についてさらに2巡目の(A)を実行する。すなわち、結果的には、少なくとも一部の量子化誤差サンプルについて、量子化誤差サンプルあたり2ビットの量子化を行うことになる。1巡目の符号化では量子化誤差r(n)の値は-0.5から+0.5の範囲内で一様であったが、2巡目の符号化の対象となる1巡目の誤差の値は-0.25から+0.25の範囲内になる。
具体的には、誤差符号化部110は、量子化誤差系列を構成する量子化誤差サンプルのうち、対応する量子化MDCT係数u(n)の値が0でなく、かつ、量子化誤差r(n)の値が正である量子化誤差サンプルについては、量子化誤差サンプルの値から再構成値である0.25を減算して得られた値について、その正負を表わす1ビットの2巡目符号を生成する。
また、誤差符号化部110は、量子化誤差系列を構成する誤差サンプルのうち、対応する量子化MDCT係数u(n)の値が0でなく、かつ、量子化誤差r(n)の値が負である量子化誤差サンプルについては、量子化誤差サンプルの値から再構成値である-0.25を減算して得られた値について、その正負を表わす1ビットの2巡目符号を生成する。
また、誤差符号化部110は、量子化誤差系列を構成する誤差サンプルのうち、対応する量子化MDCT係数u(n)の値が0であり、かつ、量子化誤差r(n)の値が正である量子化誤差サンプルについては、量子化誤差サンプルの値から再構成値であるA(Aは、0.25より小さい予め定められた正の値)を減算して得られた値について、その正負を表わす1ビットの2巡目符号を生成する。
さらに、誤差符号化部110は、量子化誤差系列を構成する誤差サンプルのうち、対応する量子化MDCT係数u(n)の値が0であり、かつ、量子化誤差r(n)の値が負である量子化誤差サンプルについては、量子化誤差サンプルの値から再構成値である−A(Aは、0.25より小さい予め定められた正の値)を減算して得られた値について、その正負を表わす1ビットの2巡目符号を生成する。
さらに、誤差符号化部110は、生成した1巡目符号と2巡目符号とを合わせたものを誤差符号として出力する。
量子化誤差系列のうちのT+S個の量子化誤差サンプルのすべてを符号化しない場合や、対応する量子化MDCT係数u(n)の値が0である量子化誤差サンプルを複数まとめてサンプルあたり1ビット以下で符号化する場合は、Uビットより少ないUUビットで量子化誤差系列を符号化することになるので、(C)の条件はT+S<UUの場合とすればよい。
なお、上記の(A)及び(B)のパワースペクトル包絡値の代わりに、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値を用いてもよい。
また、上記の(A)及び(B)のパワースペクトル包絡値の代わりに、パワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値を周波数方向で平滑化して得られる値を用いてもよい。平滑化して得られる値として、重み付け包絡正規化部15で得られた重み付けスペクトル包絡係数を誤差符号化部110に入力して用いてもよいし、誤差符号化部110で算出してもよい。
また、上記の(A)及び(B)のパワースペクトル包絡値の代わりに、複数のパワースペクトル包絡値を平均した値を用いてもよい。例えば、W''(4n-3)= W''(4n-2)=W''(4n-1)= W''(4n)=(W(4n-3) + W(4n-2)+ W(4n-1) + W(4n))/4 [1≦n≦N/4]として求めた、N個のW''(n)を用いてもよい。また、パワースペクトル包絡値W(n) [1≦n≦N]の代わりに、パワースペクトル包絡値の概算値の平均値、パワースペクトル包絡値の推定値の平均値を用いてもよい。さらに、パワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値を周波数方向で平滑化して得られる値の平均値を用いてもよい。ここでの平均値は、対象となる値を複数サンプルについて平均した値、すなわち複数サンプルの対象となる値を平均した値である。
また、上記の(A)及び(B)のパワースペクトル包絡値の代わりに、パワースペクトル包絡値と、パワースペクトル包絡値の概算値と、パワースペクトル包絡値の推定値と、これらの何れかの値を平滑化して得られる値と、これらの何れかの値を複数のサンプルについて平均して得られる値との少なくとも何れか1つと大小関係が同一となる値を用いてもよい。この場合は、大小関係が同一となる値を誤差符号化部110で算出して用いる。大小関係が同一となる値とは、二乗値や平方根などである。例えば、パワースペクトル包絡値W(n)[1≦n≦N]と大小関係が同一となる値はパワースペクトル包絡値の二乗値である(W(n))2[1≦n≦N]やパワースペクトル包絡値の平方根である(W(n))1/2[1≦n≦N]である。
なお、パワースペクトル包絡値の平方根やその平滑化後の値が重み付け包絡正規化部15で得られている場合は、重み付け包絡正規化部15で得られたものを誤差符号化部110に入力して用いてもよい。
なお、図1に破線で例示するように、並び替え部111を設けて、量子化MDCT係数列を並び替えてもよい。この場合、符号化部19は、並び替え部111により並び替えられた量子化MDCT係数列を可変長符号化する。特に周期性に基づく量子化MDCT係数列の並び替えでは可変長符号化でビット数を大きく削減できる場合があるので、誤差の符号化による改善が期待できる。
並び替え部11は、フレームごとに、(1)量子化MDCT係数列の全てのサンプルを含み、かつ、(2)サンプルの大きさを反映する指標が同等か同程度のサンプルが集まるように量子化MDCT係数列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する(ステップS111)。ここで「サンプルの大きさを反映する指標」とは、例えばサンプルの振幅の絶対値やパワー(自乗値)であるが、これらに限定されない。並び替え部11の詳細は、特願2010−225949号(PCT/JP2011/072752)を参照のこと。
[復号の実施形態]
続いて図5から図6を参照して復号処理を説明する。
復号装置2では、符号化装置1による符号化処理と逆順の処理でMDCT係数が再構成される。この実施形態では、復号装置2に入力される符号は、可変長符号、誤差符号、利得情報、線形予測係数符号を含む。なお、符号化装置1から選択情報が出力された場合にはこの選択情報も復号装置2に入力される。
図5に示すように、復号装置2は、復号部21、パワースペクトル包絡算出部22、誤差復号部23、利得復号部24、加算部25、重み付け包絡逆正規化部26、時間領域変換部27を例えば備える。復号装置2は、図6に例示された復号方法の各処理を行う。以下、復号装置2の各処理を説明する。
「復号部21」
まず、復号部21が、フレームごとに、入力された符号に含まれる可変長符号を復号して、復号量子化MDCT係数u(n)の列、すなわち符号化装置の量子化MDCT係数u(n)と同一のものと、可変長符号のビットの個数とを出力する(ステップS21)。当然であるが、符号列を得るために実行された可変長符号化方法に対応する可変長復号方法が実行される。復号部21による復号処理の詳細は符号化装置1の符号化部19による符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部21の行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。
復号量子化MDCT係数u(n)の列が、特許請求の範囲の整数値の列に対応する。
なお、どのような可変長符号化方法が実行されたかは選択情報によって特定される。選択情報に、例えば、ライス符号化の適用領域とライスパラメータを特定する情報と、ランレングス符号化の適用領域を表す情報と、エントロピー符号化の種類を特定する情報が含まれている場合には、これらの符号化方法に応じた復号方法が入力された符号列の対応する領域に適用される。ライス符号化に対応する復号処理、エントロピー符号化に対応する復号処理、ランレングス符号化に対応する復号処理はいずれも周知であるから説明を省略する(例えば上記参考文献1参照)。
「パワースペクトル包絡算出部22」
パワースペクトル包絡算出部22は、符号化装置1から入力された線形予測係数符号を復号して量子化済み線形予測係数を得て、得られた量子化済み線形予測係数を周波数領域に変換してパワースペクトル包絡を求める(ステップS22)。量子化済み線形予測係数からパワースペクトル包絡を求める処理は符号化装置1のパワースペクトル包絡算出部14と同じである。
また、パワースペクトル包絡の代わりに、パワースペクトル包絡値の概算値やパワースペクトル包絡値の推定値を算出してもよいことも符号化装置1のパワースペクトル包絡算出部14と同じである。ただし、符号化装置1のパワースペクトル包絡算出部14と同一種類の値を求める必要がある。例えば、符号化装置1のパワースペクトル包絡算出部14でパワースペクトル包絡値の概算値を求めた場合には、復号装置2のパワースペクトル包絡算出部22でもパワースペクトル包絡値の概算値を求める。
復号装置2の別手段で線形予測係数符号に対応する量子化済み線形予測係数が求められている場合はその量子化済み線形予測係数を用いてパワースペクトル包絡を算出すれば良い。また、復号装置2の別手段でパワースペクトル包絡が算出されている場合は、復号装置2はパワースペクトル包絡算出部22を備えていなくてもよい。
「誤差復号部23」
誤差復号部23は、まず、量子化MDCT係数列の符号量として予め設定されたビット数から復号部21が出力したビット数を減算した数を余剰ビット数として算出する。次に符号化装置1の誤差符号化部110が出力した誤差符号を、符号化装置1の誤差符号化部110に対応する復号方法で復号して復号量子化誤差q(n)を得る(ステップS23)。符号化装置1において量子化誤差列に与えられたビット数は、復号部21でわかる可変長符号化によるビット数に基づく余剰ビット数から求める。余剰ビット数ごとに符号、復号でサンプルや手順を符号化装置1と復号装置2とで対応するように決めておくので、一意に復号できる。
復号量子化誤差の列が、特許請求の範囲の誤差値の列に対応する。
<誤差復号の具体例1>(符号化装置1の<誤差符号化の具体例1>に対応)
誤差復号部23内の符号帳記憶部に、余剰ビット数の取り得る値ごとの符号帳を予め格納しておく。各符号帳には、その各符号帳に対応する余剰ビット数で表現可能な個数の復号量子化誤差の系列と同じサンプル数のベクトルと、そのベクトルに対応する符号、とが対応付けて予め格納される。
誤差復号部23は、余剰ビット数を算出した後に、算出された余剰ビット数に対応する符号帳を符号帳記憶部に格納された符号帳から選択し、選択された符号帳を用いてベクトル逆量子化を行なう。符号帳を選択した後の復号処理は一般的なベクトル逆量子化と同じである。すなわち、選択された符号帳の各ベクトルのうち、入力された誤差符号に対応するベクトルを復号量子化誤差q(n)として出力する。
なお、上記の説明では、符号帳に格納されるベクトルは、復号量子化誤差の系列と同じサンプル数としたが、符号帳に格納されるベクトルのサンプル数を復号量子化誤差の系列の整数分の1とし、復号量子化誤差の系列を複数の部分毎に入力された誤差符号に含まれる複数の符号それぞれをベクトル逆量子化しても良い。
<誤差復号部23の具体例2>(符号化装置1の<誤差符号化の具体例2>に対応)
余剰ビット数をU、復号部21が出力した復号量子化MDCT係数u(n)の値が0でないもののサンプル数をT、復号部21が出力した復号量子化MDCT係数u(n)の値が0であるサンプル数をSとするとき、次のような復号手順が好ましい。
(A)U≦Tの場合
誤差復号部23は、復号量子化MDCT係数u(n)の値が0でないT個サンプルのうち、対応するパワースペクトル包絡値が大きいものからU個選択して、選択されたそれぞれのサンプルに対して、入力された誤差符号に含まれる1ビットの符号を復号してサンプルの正負の情報を得て、得られた正負の情報を再構成値の絶対値0.25に与えて得られる再構成値+0.25又は-0.25を、その復号量子化MDCT係数u(n)に対応する復号量子化誤差q(n)として出力する。なお、対応するパワースペクトル包絡値が同一である場合は、例えば、より周波数軸上での位置の小さい量子化誤差サンプル(周波数が低い量子化誤差サンプル)を選択する等の予め定めた規則に従って選択する。例えば、符号化装置1の誤差符号化部110で用いた規則に対応する規則を誤差復号部23に予め保持しておく。
(B)T<U≦T+Sの場合
誤差復号部23は、復号量子化MDCT係数u(n)の値が0でないサンプルに対して、入力された誤差符号に含まれる1ビットの符号を復号して復号量子化誤差サンプルの正負の情報を得て、得られた正負の情報を再構成値の絶対値0.25に与えて得られる再構成値+0.25または-0.25を、その復号量子化MDCT係数u(n)に対応する復号量子化誤差q(n)として出力する。
誤差復号部23はまた、復号量子化MDCT係数u(n)の値が0であるサンプルのうち、対応するパワースペクトル包絡値が大きいものからU-T個のそれぞれについて、入力された誤差符号に含まれる1ビットの符号を復号して復号量子化誤差サンプルの正負の情報を得て、得られた正負の情報を0.25より小さい予め定められた正の値である再構成値の絶対値Aに与えて得られる再構成値+A又は-Aを、その復号量子化MDCT係数u(n)に対応する復号量子化誤差q(n)として出力する。
または、復号量子化MDCT係数u(n)の値が0であるサンプルのうち、対応するパワースペクトル包絡値が大きいものから複数個に対して、誤差符号に含まれるU-Tビットの符号をベクトル逆量子化して、対応する復号量子化誤差サンプル値の列を得て、得られた各復号量子化誤差サンプル値を、その復号量子化MDCT係数u(n)に対応する復号量子化誤差q(n)として出力する。
このように、量子化MDCT係数u(n)の値及び復号量子化MDCT係数u(n)の値が0でない場合の再構成値の絶対値を例えば0.25とし、量子化MDCT係数u(n)の値及び復号量子化MDCT係数u(n)の値が0である場合の再構成値の絶対値をA(0<A<0.25)とする。これらの再構成値の絶対値は一例であり、量子化MDCT係数u(n)の値及び復号量子化MDCT係数u(n)の値が0でない場合の再構成値の絶対値は、量子化MDCT係数u(n)の値及び復号量子化MDCT係数u(n)の値が0である場合の再構成値の絶対値よりも大きければよい。なお、量子化MDCT係数u(n)の値及び復号量子化MDCT係数u(n)の値が、特許請求の範囲の整数値に対応する。
なお、対応するパワースペクトル包絡値が同一である場合は、例えば、より周波数軸上での位置の小さいサンプル(周波数が低いサンプル)を選択する等の予め定めた規則に従って選択する。
(C)T+S<Uの場合
誤差復号部23は、復号量子化MDCT係数u(n)の値が0でないサンプルについては、以下の処理を行う。
入力された誤差符号に含まれる1ビットの1巡目符号を復号して正負の情報を得て、得られた正負の情報を再構成値の絶対値0.25に与えて得られる再構成値+0.25又は-0.25をその復号量子化MDCT係数u(n)に対応する1巡目復号量子化誤差q(n)とする。さらに、入力された誤差符号に含まれる1ビットの2巡目符号を復号して正負の情報を得て、得られた正負の情報を再構成値の絶対値0.125に与えて得られる再構成値+0.125または-0.125を2巡目復号量子化誤差q2(n)とする。1巡目復号量子化誤差q(n)と2巡目復号量子化誤差q2(n)とを加算して復号量子化誤差q(n)とする。
また、誤差復号部23は、復号量子化MDCT係数u(n)の値が0であるサンプルについては、以下の処理を行う。
入力された誤差符号に含まれる1ビットの1巡目符号を復号して正負の情報を得て、得られた正負の情報を0.25より小さい正の値である再構成値の絶対値Aに与えて得られる再構成値+Aまたは-Aを、その復号量子化MDCT係数u(n)に対応する1巡目復号量子化誤差q(n)とする。さらに、入力された誤差符号に含まれる1ビットの2巡目符号を復号して正負の情報を得て、得られた正負の情報を再構成値の絶対値A/2に与えて得られる再構成値+A/2または-A/2を2巡目復号量子化誤差q2(n)とする。1巡目復号量子化誤差q(n)と2巡目復号量子化誤差q2(n)とを加算して復号量子化誤差q(n)とする。
このように、対応する量子化MDCT係数u(n)の値及び復号量子化MDCT係数u(n)の値が0である場合もそうでない場合も、2巡目符号に対応する再構成値の絶対値を1巡目符号に対応する再構成値の絶対値の1/2とする。
なお、上記の(A)及び(B)のパワースペクトル包絡値の代わりに、パワースペクトル包絡値の概算値、パワースペクトル包絡値の推定値、これらの何れかの値を平滑化して得られる値、これらの何れかの値を複数のサンプルについて平均して得られる値又はこれらの何れかの値と大小関係が同一となる値の何れかを用いてもよい。ただし、符号化装置1の誤差符号化部110と同一種類の値を用いる必要がある。
「利得復号部24」
利得復号部24は、入力された利得情報を復号して利得gを得て出力する(ステップS24)。利得gは、加算部25に送信される。
「加算部25」
加算部25は、フレームごとに、復号部21が出力した復号量子化MDCT係数列の各係数u(n)と、誤差復号部23が出力した復号量子化誤差系列の対応する各係数q(n)とを加算した加算値を計算する。そして、この加算値に、利得復号部24が出力した利得gを乗じた系列を生成し復号重み付け正規化MDCT係数系列とする(ステップS25)。復号重み付け正規化MDCT係数系列の各係数をx^(n)と表記する。x^(n)=(u(n)+q(n))*gである。
加算部25により生成されるこの加算値の列が、特許請求の範囲の周波数領域のサンプル列に対応する。
「重み付け包絡逆正規化部26」
次に、重み付け包絡逆正規化部26が、フレームごとに、復号重み付け正規化MDCT係数列の各係数x^(n)にパワースペクトル包絡値を除算することでMDCT係数列を得る(ステップS26)。
「時間領域変換部27」
次に、時間領域変換部27が、フレームごとに、重み付け包絡逆正規化部26が出力したMDCT係数列を時間領域に変換してフレーム単位の音声音響ディジタル信号を得る(ステップS27)。
ステップS26からS27の各処理は従来的処理であるから詳細な説明を省略した。
なお、符号化装置1において並び替え部111による並び替え処理が行われている場合には、復号部21が生成した復号量子化MDCT係数u(n)の列は、復号装置2の並び替え部により並び替えられて(ステップS28)、この並び替えられた復号量子化MDCT係数u(n)の列が、誤差復号部23及び加算部25に送信される。この場合、誤差復号部23及び加算部25は、復号部21が生成した復号量子化MDCT係数u(n)の列に代えて、並び替えられた復号量子化MDCT係数u(n)の列に対して上記と同様の処理を行う。
このように、可変長符号化による圧縮効果を利用することにより、フレーム内のビット数の総計が一定の場合にでも、量子化歪の軽減や符号量の削減が可能である。
[符号化装置、復号装置のハードウェア構成例]
上述の実施形態に関わる符号化装置1、復号装置2は、キーボードなどが接続可能な入力部と、液晶ディスプレイなどが接続可能な出力部と、CPU(Central Processing Unit)、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置と、これらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスとを例えば備えている。また、必要に応じて、符号化装置1、復号装置2に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けてもよい。
符号化装置1、復号装置2の外部記憶装置には、符号化、復号を実行するためのプログラム又はこのプログラムの処理において必要となるデータなどが記憶されている。外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくなどでもよい。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。以下、データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。
符号化装置1の記憶部には、音声音響信号に由来する周波数領域のサンプル列の符号化、誤差の符号化のためのプログラムなどが記憶されている。
復号装置2の記憶部には、入力された符号を復号するためのプログラムなどが記憶されている。
符号化装置1では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(例えば、誤差算出部18、誤差符号化部110、符号化部19)を実現することで符号化が実現される。
復号装置2では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(例えば、復号部21)を実現することで復号が実現される。
<変形例等>
符号化装置1の量子化部17では、x(n)/gではなく、x(n)/gの値を所定の関数Gで伸縮させた値G(x(n)/g)を用いてもよい。具体的には、量子化部17は、重み付け正規化MDCT係数列の各係数x(n)[1≦n≦N]を利得gで割り算して得られるx(n)/gを関数Gで伸縮させた値G(x(n)/g)に対応する整数値、例えばG(x(n)/g)の小数点以下を四捨五入又は切り上げ又は切り下げして得られる整数値u(n)を量子化MDCT係数とする。この量子化MDCT係数が符号化部19の符号化の対象となる。
関数Gは、例えばG(h)=sign(h)×|h|aである。sign(h)は、入力されたhの正負の符号を出力する極性符号関数である。sign(h)は、例えば、入力されたhが正の数であれば1を出力し、入力されたhが負の数であれば−1を出力する。|h|は、hの絶対値を表す。aは、所定の数であり、例えば0.75である。
この場合、x(n)/gの値を所定の関数Gで伸縮させた値G(x(n)/g)が、特許請求の範囲の周波数領域のサンプル列に対応することになる。また、誤差算出部18が得る量子化誤差r(n)は、G(x(n)/g)-u(n)である。この量子化誤差r(n)が誤差符号化部110で符号化の対象となる。
さらに、この場合、復号装置2の加算部25は、加算により得られたu(n)+q(n)に対して関数Gの逆関数であるG-1=sign(h)×|h|1/aの処理を行った値G-1(u(n)+q(n))に利得gを乗じることにより、復号重み付け正規化MDCT係数系列x^(n)を得る。すなわち、x^(n)=G-1(u(n)+q(n))*gとする。なお、a=0.75である場合には、G-1(h)=sign(h)×|h|1.33とする。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記実施形態において説明したハードウェアエンティティ(符号化装置1、復号装置2)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (23)

  1. 所定の時間区間の音響信号に由来する周波数領域のサンプル列を所定の個数のビットで符号化する符号化方法であって、
    上記周波数領域のサンプル列の各サンプルの値に対応する整数値を可変長符号化により符号化して可変長符号を生成する符号化ステップと、
    上記周波数領域のサンプル列の各サンプルの値からその各サンプルの値に対応する整数値を減算した誤差値の列を算出する誤差算出ステップと、
    上記所定の個数から上記可変長符号のビットの個数を減算した個数のビットである余剰ビットを用いて、上記誤差値の列を符号化して誤差符号を生成する誤差符号化ステップと、
    を含む符号化方法。
  2. 請求項1の符号化方法において、
    上記誤差符号化ステップは、上記余剰ビットを用いて、上記誤差値の列を構成する誤差サンプルのうち対応する上記整数値が0でない誤差サンプルを優先的に符号化する、
    符号化方法。
  3. 請求項1の符号化方法において、
    上記誤差符号化ステップは、上記余剰ビットを用いて、上記誤差値の列を構成する誤差サンプルのうち対応するパワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値が大きい誤差サンプルを優先的に符号化する、
    符号化方法。
  4. 請求項1から3の何れかの符号化方法において、
    上記誤差符号化ステップは、上記誤差値の列を構成する誤差サンプルのうち符号化の対象となる各誤差サンプルの値の正負の情報を1ビットで符号化する、
    符号化方法。
  5. 請求項4の符号化方法において、
    整数値に応じて定まる値を再構成値の絶対値とし、上記再構成値の絶対値を誤差サンプルの値が正のときに対応する再構成値とし、0から上記再構成値の絶対値を減算した値を誤差サンプルの値が負のときに対応する再構成値として、
    上記誤差符号化ステップは、上記余剰ビットの数が上記誤差値の列を構成する誤差サンプルの数よりも大きい場合には、上記各誤差サンプルに対応する再構成値を上記各誤差サンプルの値から減算した値の正負の情報を別の1ビットを用いて更に符号化する、
    符号化方法。
  6. 請求項5の符号化方法において、
    整数値が0でない場合の再構成値の絶対値は、整数値が0である場合の再構成値の絶対値よりも大きい、
    符号化方法。
  7. 入力された所定の個数のビットで構成される符号を復号する復号方法であって、
    上記符号に含まれる可変長符号を復号して整数値の列を生成する復号ステップと、
    上記所定の個数から上記可変長符号のビットの個数を減算した個数のビットである余剰ビットで構成される、上記符号に含まれる誤差符号を復号して誤差値の列を生成する誤差復号ステップと、
    上記整数値の列の各サンプルと上記誤差値の列の対応する誤差サンプルとを加算する加算ステップと、
    を含む復号方法。
  8. 請求項7の復号方法において、
    上記誤差復号ステップは、上記余剰ビットで表現された、上記誤差値の列を構成する誤差サンプルのうち対応する上記整数値が0でない誤差サンプルを復号する、
    復号方法。
  9. 請求項7の復号方法において、
    上記誤差復号ステップは、上記余剰ビットで表現された、上記誤差値の列を構成する誤差サンプルのうち対応するパワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値が大きい誤差サンプルを復号する、
    復号方法。
  10. 請求項7から9の何れかの復号方法において、
    整数値に応じて定まる値を再構成値の絶対値として、
    上記誤差復号ステップは、上記誤差値の列の各誤差サンプルの値を、上記誤差符号を復号することにより得られた上記各誤差サンプルに対応する1ビットの情報で定まる正負を上記各誤差サンプルに対応する整数値に基づく再構成値の絶対値に対して反映させた値とする、
    復号方法。
  11. 請求項10の復号方法において、
    上記誤差復号ステップは、上記各誤差サンプルの値に対応する別の1ビットの情報がある場合には、上記各誤差サンプルの値を、上記反映させた値と、上記別の1ビットの情報で定まる正負を上記各誤差サンプルに対応する整数値に基づく再構成値の絶対値の1/2の値に対して反映させた値とを加算した値とする、
    復号方法。
  12. 請求項10の復号方法において、
    整数値が0でない場合の再構成値の絶対値は、整数値が0である場合の再構成値の絶対値よりも大きい、
    復号方法。
  13. 請求項11の復号方法において、
    整数値が0でない場合の再構成値の絶対値は、整数値が0である場合の再構成値の絶対値よりも大きい、
    復号方法。
  14. 所定の時間区間の音響信号に由来する周波数領域のサンプル列を所定の個数のビットで符号化する符号化装置であって、
    上記周波数領域のサンプル列の各サンプルの値に対応する整数値を可変長符号化により符号化して可変長符号を生成する符号化部と、
    上記周波数領域のサンプル列の各サンプルの値からその各サンプルの値に対応する整数値を減算した誤差値の列を算出する誤差算出部と、
    上記所定の個数から上記可変長符号のビットの個数を減算した個数のビットである余剰ビットを用いて、上記誤差値の列を符号化して誤差符号を生成する誤差符号化部と、
    を含む符号化装置。
  15. 請求項14の符号化装置において、
    上記誤差符号化部は、上記余剰ビットを用いて、上記誤差の列を構成する誤差サンプルのうち対応する上記整数値が0でない誤差サンプルを優先的に符号化する、
    符号化装置。
  16. 請求項14の符号化装置において、
    上記誤差符号化部は、上記余剰ビットを用いて、上記誤差値の列を構成する誤差サンプルのうち対応するパワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値が大きい誤差サンプルを優先的に符号化する、
    符号化装置。
  17. 入力された所定の個数のビットで構成される符号を復号する復号装置であって、
    上記符号に含まれる可変長符号を復号して整数値の列を生成する復号部と、
    上記所定の個数から上記可変長符号のビットの個数を減算した個数のビットである余剰ビットで構成される、上記符号に含まれる誤差符号を復号して誤差値の列を生成する誤差復号部と、
    上記整数値の列の各サンプルと上記誤差値の列の対応する誤差サンプルとを加算する加算部と、
    を含む復号装置。
  18. 請求項17の復号装置において、
    上記誤差復号部は、上記余剰ビットで表現された、上記誤差の列を構成する誤差サンプルのうち対応する上記整数値が0でない誤差サンプルを復号する、
    復号装置。
  19. 請求項17の復号装置において、
    上記誤差復号部は、上記余剰ビットで表現された、上記誤差値の列を構成する誤差サンプルのうち対応するパワースペクトル包絡値、パワースペクトル包絡値の概算値又はパワースペクトル包絡値の推定値が大きい誤差サンプルを復号する、
    復号装置。
  20. 請求項1からに記載された方法の各ステップをコンピュータに実現させるためのプログラム。
  21. 請求項7から13に記載された方法の各ステップをコンピュータに実現させるためのプログラム。
  22. 請求項1からに記載された方法の各ステップをコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  23. 請求項7から13に記載された方法の各ステップをコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2013508811A 2011-04-05 2012-03-26 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 Active JP5603484B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013508811A JP5603484B2 (ja) 2011-04-05 2012-03-26 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011083740 2011-04-05
JP2011083740 2011-04-05
PCT/JP2012/057685 WO2012137617A1 (ja) 2011-04-05 2012-03-26 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP2013508811A JP5603484B2 (ja) 2011-04-05 2012-03-26 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体

Publications (2)

Publication Number Publication Date
JPWO2012137617A1 JPWO2012137617A1 (ja) 2014-07-28
JP5603484B2 true JP5603484B2 (ja) 2014-10-08

Family

ID=46969018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013508811A Active JP5603484B2 (ja) 2011-04-05 2012-03-26 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体

Country Status (10)

Country Link
US (3) US10515643B2 (ja)
EP (3) EP2696343B1 (ja)
JP (1) JP5603484B2 (ja)
KR (1) KR101569060B1 (ja)
CN (1) CN103460287B (ja)
ES (2) ES2617958T3 (ja)
PL (1) PL3154057T3 (ja)
RU (1) RU2571561C2 (ja)
TR (1) TR201900411T4 (ja)
WO (1) WO2012137617A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
CN107369454B (zh) * 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
US9911427B2 (en) * 2014-03-24 2018-03-06 Nippon Telegraph And Telephone Corporation Gain adjustment coding for audio encoder by periodicity-based and non-periodicity-based encoding methods
EP3447766B1 (en) * 2014-04-24 2020-04-08 Nippon Telegraph and Telephone Corporation Encoding method, encoding apparatus, corresponding program and recording medium
KR101855945B1 (ko) * 2014-05-01 2018-05-10 니폰 덴신 덴와 가부시끼가이샤 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
PL3509063T3 (pl) * 2014-05-01 2020-08-24 Nippon Telegraph And Telephone Corporation Koder, dekoder, sposób kodowania, sposób dekodowania, program kodujący, program dekodujący i nośnik rejestrujący
CN106537500B (zh) * 2014-05-01 2019-09-13 日本电信电话株式会社 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质
PL3594946T3 (pl) * 2014-05-01 2021-03-08 Nippon Telegraph And Telephone Corporation Dekodowanie sygnału dźwiękowego
KR20230066137A (ko) 2014-07-28 2023-05-12 삼성전자주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
EP3252758B1 (en) * 2015-01-30 2020-03-18 Nippon Telegraph and Telephone Corporation Encoding apparatus, decoding apparatus, and methods, programs and recording media for encoding apparatus and decoding apparatus
JP6499206B2 (ja) * 2015-01-30 2019-04-10 日本電信電話株式会社 パラメータ決定装置、方法、プログラム及び記録媒体
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2018052004A1 (ja) * 2016-09-15 2018-03-22 日本電信電話株式会社 サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム
CN110709927B (zh) * 2017-06-07 2022-11-01 日本电信电话株式会社 编码装置、解码装置、平滑化装置、逆平滑化装置、其方法及记录介质
WO2018235418A1 (ja) * 2017-06-22 2018-12-27 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
US11621010B2 (en) * 2018-03-02 2023-04-04 Nippon Telegraph And Telephone Corporation Coding apparatus, coding method, program, and recording medium
CN112154502B (zh) 2018-04-05 2024-03-01 瑞典爱立信有限公司 支持生成舒适噪声
WO2019198383A1 (ja) * 2018-04-13 2019-10-17 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、プログラム、および記録媒体
JP7322620B2 (ja) * 2019-09-13 2023-08-08 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03191628A (ja) * 1989-12-21 1991-08-21 Toshiba Corp 可変レート符号化方式
JPH0470800A (ja) * 1990-07-11 1992-03-05 Sharp Corp 音声情報圧縮装置
JPH09214348A (ja) * 1996-01-30 1997-08-15 Sony Corp 信号符号化方法
JP2006011170A (ja) * 2004-06-28 2006-01-12 Sony Corp 信号符号化装置及び方法、並びに信号復号装置及び方法

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6091460A (en) * 1994-03-31 2000-07-18 Mitsubishi Denki Kabushiki Kaisha Video signal encoding method and system
JP3170193B2 (ja) * 1995-03-16 2001-05-28 松下電器産業株式会社 画像信号の符号化装置及び復号装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US20030039648A1 (en) * 1998-09-16 2003-02-27 Genentech, Inc. Compositions and methods for the diagnosis and treatment of tumor
US6677262B2 (en) * 2000-07-05 2004-01-13 Shin-Etsu Chemical Co., Ltd. Rare earth oxide, basic rare earth carbonate, making method, phosphor, and ceramic
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
US7275036B2 (en) * 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
KR100477699B1 (ko) 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
US8107535B2 (en) * 2003-06-10 2012-01-31 Rensselaer Polytechnic Institute (Rpi) Method and apparatus for scalable motion vector coding
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7587254B2 (en) * 2004-04-23 2009-09-08 Nokia Corporation Dynamic range control and equalization of digital audio using warped processing
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
WO2006062142A1 (ja) * 2004-12-07 2006-06-15 Nippon Telegraph And Telephone Corporation 情報圧縮符号化装置、その復号化装置、これらの方法、およびこれらのプログラムとその記録媒体
CN101124740B (zh) * 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送系统
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US7617436B2 (en) * 2005-08-02 2009-11-10 Nokia Corporation Method, device, and system for forward channel error recovery in video sequence transmission over packet-based network
KR20070046752A (ko) * 2005-10-31 2007-05-03 엘지전자 주식회사 신호 처리 방법 및 장치
TWI276047B (en) * 2005-12-15 2007-03-11 Ind Tech Res Inst An apparatus and method for lossless entropy coding of audio signal
JP4548348B2 (ja) 2006-01-18 2010-09-22 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
KR101471978B1 (ko) 2007-02-02 2014-12-12 삼성전자주식회사 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
CN101308661B (zh) * 2007-05-16 2011-07-13 中兴通讯股份有限公司 一种基于先进音频编码器的量化器码率失真控制方法
WO2009004727A1 (ja) * 2007-07-04 2009-01-08 Fujitsu Limited 符号化装置、符号化方法および符号化プログラム
US7937574B2 (en) * 2007-07-17 2011-05-03 Advanced Micro Devices, Inc. Precise counter hardware for microcode loops
EP2063417A1 (en) * 2007-11-23 2009-05-27 Deutsche Thomson OHG Rounding noise shaping for integer transform based encoding and decoding
CN101919164B (zh) * 2007-12-11 2013-10-30 日本电信电话株式会社 编码方法、解码方法、使用了这些方法的装置、程序、记录介质
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8386271B2 (en) * 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
WO2010084951A1 (ja) * 2009-01-23 2010-07-29 日本電信電話株式会社 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
JP2010225949A (ja) * 2009-03-25 2010-10-07 Kyocera Corp 発熱体の放熱構造
IN2012DN05235A (ja) * 2010-01-08 2015-10-23 Nippon Telegraph & Telephone
JP5612698B2 (ja) 2010-10-05 2014-10-22 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03191628A (ja) * 1989-12-21 1991-08-21 Toshiba Corp 可変レート符号化方式
JPH0470800A (ja) * 1990-07-11 1992-03-05 Sharp Corp 音声情報圧縮装置
JPH09214348A (ja) * 1996-01-30 1997-08-15 Sony Corp 信号符号化方法
JP2006011170A (ja) * 2004-06-28 2006-01-12 Sony Corp 信号符号化装置及び方法、並びに信号復号装置及び方法

Also Published As

Publication number Publication date
PL3154057T3 (pl) 2019-04-30
CN103460287A (zh) 2013-12-18
RU2571561C2 (ru) 2015-12-20
EP2696343A1 (en) 2014-02-12
EP2696343A4 (en) 2014-11-12
TR201900411T4 (tr) 2019-02-21
JPWO2012137617A1 (ja) 2014-07-28
WO2012137617A1 (ja) 2012-10-11
US10515643B2 (en) 2019-12-24
CN103460287B (zh) 2016-03-23
EP3441967A1 (en) 2019-02-13
US20200090664A1 (en) 2020-03-19
ES2704742T3 (es) 2019-03-19
KR20130133854A (ko) 2013-12-09
EP3154057B1 (en) 2018-10-17
EP3154057A1 (en) 2017-04-12
RU2013143624A (ru) 2015-05-10
ES2617958T3 (es) 2017-06-20
US11024319B2 (en) 2021-06-01
US20200090665A1 (en) 2020-03-19
US11074919B2 (en) 2021-07-27
KR101569060B1 (ko) 2015-11-13
US20140019145A1 (en) 2014-01-16
EP2696343B1 (en) 2016-12-21

Similar Documents

Publication Publication Date Title
JP5603484B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
US10083703B2 (en) Frequency domain pitch period based encoding and decoding in accordance with magnitude and amplitude criteria
RU2554554C2 (ru) Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи
JP5612698B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP6867528B2 (ja) 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体
JP5694751B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP6595687B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
US20170272766A1 (en) Encoding apparatus, decoding apparatus, and method and program for the same
JP5579932B2 (ja) 符号化方法、装置、プログラム及び記録媒体
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140812

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140821

R150 Certificate of patent or registration of utility model

Ref document number: 5603484

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150