JP2012531086A - コンテクスト基盤の算術符号化装置及びその方法並びに算術復号化装置及びその方法 - Google Patents

コンテクスト基盤の算術符号化装置及びその方法並びに算術復号化装置及びその方法 Download PDF

Info

Publication number
JP2012531086A
JP2012531086A JP2012515996A JP2012515996A JP2012531086A JP 2012531086 A JP2012531086 A JP 2012531086A JP 2012515996 A JP2012515996 A JP 2012515996A JP 2012515996 A JP2012515996 A JP 2012515996A JP 2012531086 A JP2012531086 A JP 2012531086A
Authority
JP
Japan
Prior art keywords
context
tuple
bit
decoding
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012515996A
Other languages
English (en)
Other versions
JP2012531086A5 (ja
JP5635603B2 (ja
Inventor
チュー,ギ−ヒョン
キム,ジュン−フェ
オ,ウン−ミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2012531086A publication Critical patent/JP2012531086A/ja
Publication of JP2012531086A5 publication Critical patent/JP2012531086A5/ja
Application granted granted Critical
Publication of JP5635603B2 publication Critical patent/JP5635603B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • H03M7/4012Binary arithmetic codes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • H03M7/4012Binary arithmetic codes
    • H03M7/4018Context adapative binary arithmetic codes [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

コンテクスト基盤の算術符号化装置及びその方法並びに算術復号化装置及びその方法が開示され、該コンテクスト基盤の算術復号化装置は、復号化しようとする現在Nタプルのコンテクストを決定し、現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定し、Nタプル・コンテクスト及び上位ビット・コンテクストを利用し、確率モデルを決定し、決定された確率モデルに基づいて、上位ビットに対して復号化を行い、脱出コードに対する復号化過程で導き出された下位ビットのビット深度に基づいて、下位ビットを復号化する。

Description

本発明は、オーディオ(audio)信号の符号化(coding)方法及び復号化(decoding)方法に係り、特に、無損失(lossless)符号化方法及び復号化方法に関する。
オーディオ信号は、主に周波数ドメインで、符号化及び復号化を行う。代表的な例として、AAC(advanced audio coding)を挙げることができる。AACコーデックがその例であるが、AACコーデックは、周波数ドメインに変換するためのMDCT(modified discrete cosine transform)を行い、心理音響の観点から信号のマスキング程度を利用し、周波数スペクトル量子化を行う。遂行された量子化の結果をさらに圧縮するために、無損失圧縮方式を適用するが、AACでは、Huffman codingを使用する。無損失圧縮方式として、Huffman coding方式の代わりに、arithmetic codingを適用したBSAC(bit-sliced arithmetic coding)コーデックも使われる。
音声(speech)信号は、主に時間ドメインで、符号化及び復号化を行う。時間ドメインで圧縮する音声コーデックのほとんどは、CELP(code excitation linear prediction)系である。CELPは、音声符号化技術であり、現在主に使われているG.729、AMR−WB、iLBC(internet low bitrate codec)、EVRC(enhanced variable rate codec)などがCELP基盤の音声符号化器である。このようなコーディング技法は、音声信号が線形予測(linear prediction)を介して得ることができるという仮定下で開発されている。音声を符号化するにあたり、線形予測係数と励起信号(excitation signal)とが必要である。一般的に、線形予測係数は、LSP(line spectral pair)を利用して符号化され、励起信号は、いくつかのコードブック(codebook)を利用して符号化される。CELPを基に発展した符号化技法としては、ACELP(algebraic code excited linear prediction)、CS−CELP(conjugate structure code excited linear prediction)などがある。
伝送率に係わる制約と心理音響との観点から、低周波数帯域と高周波数帯域との敏感度の差によって、低周波数帯域は、音声/音楽の周波数上の微細構造に敏感であり、高周波数帯域は、微細構造について、低周波数帯域に比べてそれほど敏感ではないという事実に基づき、低周波数帯域は、多くのビットを割り当てて微細構造を詳細にコーディングし、高周波数帯域は、少ないビットを割り当ててコーディングする方式が適用されている。このような技術は、低周波数帯域は、AACのようなコーデックを使用し、微細構造を詳細にコーディングする方式を適用し、高周波数は、エネルギー情報及び調節情報で表現する方式が、SBR(spectral band replication)技術である。SBRは、QMF(quadrature mirror filter)ドメインで低周波数信号を複写し、高周波数信号を生成する方式である。
使用ビットを減らす方式については、ステレオ信号についても適用される。さらに詳細には、ステレオ信号をモノ信号に変換した後、ステレオ情報を表現するパラメータを抽出し、ステレオ・パラメータ及びモノ信号を圧縮したデータを伝送し、伝送されたパラメータを利用し、復号化器でステレオ信号を復号化することができる。かようなステレオ情報を圧縮する方式として、PS(parametric stereo)技術があり、ステレオだけではなく、マルチチャンネル信号のパラメータを抽出して伝送する方式として、MPEG(moving picture experts group)surround技術がある。
また、前述の無損失符号化の対象についてさらに具体的に述べれば、量子化されたスペクトルの量子化された値を1個のシンボルとして見て、無損失符号化を行ってもよい。そして、量子化されたスペクトルの値を、ビット平面上でマッピングさせてビットをまとめる方法で符号化する場合もある。
コンテクスト基盤無損失符号化を行う場合、以前フレームの情報を使用し、無損失符号化を行うことが可能である。
本発明の課題は、符号化効率を高めてメモリの必要空間を減らすところにある。
本発明の一実施形態による算術符号化装置は、符号化しようとする現在Nタプルのコンテクストを決定するNタプル・コンテクスト決定部、前記Nタプル・コンテクストに基づいて、脱出コードに対して符号化を行う脱出コード符号化部、前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定するMSBコンテクスト決定部、前記Nタプル・コンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する確率モデルマッピング部、前記決定された確率モデルに基づいて、上位ビットに対して符号化を行うMSB符号化部、及び前記脱出コードに対する符号化過程で導き出された下位ビットのビット深度に基づいて、下位ビットを符号化する下位ビット符号化部を含んでもよい。
本発明の一実施形態による算術符号化装置は、現在フレームがリセット・フレームである場合、コンテクスト・リセットを行うコンテクスト・リセット部、及び前記現在フレームがリセット・フレームではない場合、現在フレームの長さと以前フレームの長さとの間に周波数インデックスをマッピングするために、コンテクストをマッピングするコンテクスト・マッピング部をさらに含んでもよい。
本発明の一実施形態による算術符号化装置は、前記上位ビットを符号化するときに使用する複数個の上位ビット・コンテクストのうち1個のコンテクストモードを符号化するコンテクストモード符号化部をさらに含んでもよい。
本発明の一実施形態による算術復号化装置は、復号化しようとする現在Nタプルのコンテクストを決定するNタプル・コンテクスト決定部、前記Nタプル・コンテクストに基づいて、脱出コードに対して復号化を行う脱出コード復号化部、前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定するMSBコンテクスト決定部、前記Nタプル・コンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する確率モデルマッピング部、前記決定された確率モデルに基づいて、上位ビットに対して復号化を行うMSB復号化部、及び前記脱出コードに対する復号化過程で導き出された下位ビットのビット深度に基づいて、下位ビットを復号化する下位ビット復号化部を含んでもよい。
本発明の一実施形態による算術復号化装置は、現在フレームがリセット・フレームである場合、コンテクスト・リセットを行うコンテクスト・リセット部、及び前記現在フレームがリセット・フレームではない場合、現在フレームの長さと以前フレームの長さとの間に周波数インデックスをマッピングするために、コンテクストをマッピングするコンテクスト・マッピング部をさらに含んでもよい。
本発明の一実施形態による算術復号化装置は、前記上位ビットを復号化するときに使用する複数個の上位ビット・コンテクストのうち1個のコンテクストモードを復号化するコンテクストモード復号化部をさらに含んでもよい。
本発明の一実施形態によるコンテクスト基盤の算術復号化方法は、復号化しようとする現在Nタプルの周辺に位置した周辺Nタプルに基づいたNタプル・コンテクストを利用し、前記現在Nタプルの上位ビット(MSB)を復号化する段階と、前記上位ビットの符号情報に基づいた下位ビット・コンテクストを利用し、前記現在Nタプルの下位ビット(LSB)を復号化する段階と、を含んでもよい。
本発明の一実施形態によるコンテクスト基盤の算術復号化方法は、復号化しようとする現在Nタプルの周辺に位置した周辺Nタプルに基づいたNタプル・コンテクストを利用し、前記現在Nタプルの上位ビットを復号化する段階と、前記上位ビットの符号情報及び下位ビットのビット深度に基づいた下位ビット・コンテクストを利用し、前記現在Nタプルの下位ビットを復号化する段階と、を含んでもよい。
本発明の一実施形態によるコンテクスト基盤の算術復号化方法は、特定サブセット状態であるか否かを考慮して復号化しようとする現在Nタプルの周辺に位置した周辺Nタプルに基づいた(1)Nタプル・コンテクストを利用するか、あるいは(2)前記Nタプル・コンテクスト及び追加コンテクストを利用し、前記現在Nタプルの上位ビットを復号化する段階と、前記上位ビットの符号情報に基づいた下位ビット・コンテクストを利用し、前記現在Nタプルの下位ビット(LSB)を復号化する段階と、を含んでもよい。
本発明の一実施形態によるコンテクスト基盤の算術復号化方法は、特定状態であるか否かを考慮して復号化しようとする現在Nタプルの周辺に位置した周辺Nタプルに基づいた(1)Nタプルのコンテクストを利用するか、あるいは(2)前記Nタプルのコンテクスト及び追加コンテクストを利用し、前記現在Nタプルの上位ビットを復号化する段階と、前記上位ビットの符号情報及び下位ビットのビット深度に基づいた下位ビット・コンテクストを利用し、前記現在Nタプルの下位ビットを復号化する段階と、を含んでもよい。
本発明の一実施形態によるコンテクスト基盤の算術復号化方法は、復号化しようとする現在Nタプルのコンテクスト・テンプレートを復号化する段階と、前記現在Nタプルに係わるNタプル・コンテクストを決定する段階と、前記Nタプル・コンテクストに基づいて、脱出コードに対して復号化を行う段階と、前記復号化されたコンテクスト・テンプレートに基づいて、前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定する段階と、前記Nタプル・コンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する段階と、前記決定された確率モデルに基づいて、上位ビットを復号化する段階と、前記脱出コードに対する復号化過程で導き出された下位ビットのビット深度に基づいて、下位ビットを復号化する段階と、を含んでもよい。
本発明の一実施形態によるコンテクスト基盤の算術復号化方法は、復号化しようとする現在1タプルの周辺に位置した周辺1タプルに基づいた1タプル・コンテクストを利用し、前記現在1タプルの上位ビット(MSB)を復号化する段階と、前記上位ビット(MSB)を復号化するとき、前記現在1タプルのlev0推定を行うために使われる周辺1タプルの絶対値を使用してlev0推定を行う段階と、前記現在1タプルの下位ビット(LSB)を復号化する段階と、を含んでもよい。
本発明の一実施形態によるコンテクスト基盤の算術復号化方法は、復号化しようとする現在2タプルの周辺に位置した周辺2タプルに基づいた2タプル・コンテクストまたは追加コンテクストのうち少なくとも一つを利用し、前記現在2タプルの上位ビットを復号化する段階と、前記現在2タプルの上位ビットが復号化されれば、前記現在2タプルの下位ビットを復号化する段階と、を含んでもよい。
本発明の一実施形態によれば、一つ以上の実施形態の方法を実現するためのコンピュータで読み取り可能な命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体を提供することができる。
本発明の一実施形態によれば、符号化効率(coding efficiency)を高め、メモリの必要空間を減らすことができる。
USAC符号化器を図示した図である。 USAC復号化器を図示した図である。 算術符号化装置(第1例)の細部構成を図示した図である。 算術復号化装置(第1例)の細部構成を図示した図である。 Nタプル、MSB、LSBについて説明するための図である。 コンテクストと確率モデルとを図示した図である。 MSB復号化方式(第1例)を図示した図である。 LSB復号化方式(第1例)を図示した図である。 符号分離を利用したMSB復号化方式を図示した図である。 LSFを利用した符号化方式及び復号化方式を図示した図である。 算術符号化装置(第2例)の細部構成を図示した図である。 算術復号化装置(第2例)の細部構成を図示した図である。 コンテクストと確率モデルとを図示した図である。 MSB復号化方式(第2例)を図示した図である。 LSB復号化方式(第2例)を図示した図である。 コンテクストモードを図示した図である。 Nタプルに係わるコンテクスト基盤の算術復号化方法を図示したフローチャートである。 Nタプルに係わるコンテクスト基盤の算術符号化方法を図示したフローチャートである。 コンテクストモードを具現する一例を図示した図である。 算術符号化装置(第3例)の細部構成を図示した図である。 算術復号化装置(第3例)の細部構成を図示した図である。 1タプル、MSB、LSBを図示した図である。 コンテクスト・テンプレートの一例を図示した図である。 spectral noiseless codingの過程を図示した図である。 1タプルに係わるコンテクスト基盤の算術復号化方法を図示したフローチャートである。 2タプルに係わるコンテクスト・テンプレートを図示した図である。 算術符号化装置(第4例)の細部構成を図示した図である。 算術復号化装置(第4例)の細部構成を図示した図である。 2タプルに係わるコンテクスト基盤の算術復号化方法を図示したフローチャートである。 2タプルを算術符号化/復号化する過程について説明するための図である。
以下、添付された図面に記載された内容を参照しつつ、本発明による実施形態について詳細に説明する。ただし、本発明が実施形態によって制限されたり限定されるものではない。各図面に提示された同じ参照符号は、同じ部材を示す。
図1Aは、USAC(united speech & audio coding)符号化器を図示した図であり、図1Bは、USAC復号化器を図示した図である。
MPEG(moving picture experts group)−D USAC符号化器は、3種の動作モードに大別されて構成される。第一に、ステレオである場合、MPEG surroundを使用し、ステレオ信号をパラメータで表現する方式でもって適用し、高周波帯域は、eSBR(enhanced spectral band replication)を使用し、低周波帯域は、コア符号化方式でもって適用するモードである。第二に、ステレオである場合、高周波帯域は、2チャンネルに対してeSBRを適用する方式、そして2チャンネルの低周波帯域は、コア符号化を使用して符号化する方式である。第三に、モノ信号の場合、eSBRを使用して高周波帯域を符号化し、低周波信号の場合、コア符号化を使用して符号化する。
コア符号化は、まず2種のモードで構成される。周波数ドメイン(FD:frequency domain:FD)で、符号化器に適した信号は、MDCT(modified discrete cosine transformation)を使用し、周波数ドメインに変換して符号化を行い、他の信号は、wLPT(weighted LP transform coding)またはACELP(algebraic code excited linear prediction)を使用して符号化を行う。wLPTの場合、weighted LP信号を、MDCTを使用して周波数ドメインに変換して符号化を行う。MDCTに変換された2種モードの信号は、量子化を行って量子化されたスペクトルを抽出し、量子化されたスペクトルは、arithmetic codingを遂行して無損失符号化を行う。USAC復号化器は、USAC符号化器での符号化の逆過程を介して復号化することができる。
低周波帯域で、USAC符号化器及びUSAC復号化器は、周波数ドメインまたは線形予測ドメイン(LPD:linear prediction domain)の2種コーディングモードのうちいずれか一つを選択し、信号に対して符号化及び復号化をそれぞれ行ってもよい。
このとき、周波数ドメインに対して、USAC符号化器及びUSAC復号化器は、MDCTドメインで、スペクトルを量子化及びnoiselessコーディングを行ってもよい。そして、線形予測ドメインに対して、USAC符号化器及びUSAC復号化器は、ACELPまたはwLPTによって、選択的に符号化及び復号化を行ってもよい。
このとき、USAC符号化器及びUSAC復号化器は、LP、adaptive codebookまたはfixed-codebookを介して、ACELPによる符号化及び復号化を行ってもよい。そして、USAC符号化器及びUSAC復号化器は、weighted LP residual信号を、MDCTを介して周波数ドメインに変換し、変換された信号に対して量子化及びnoiselessコーディングを行い、wLPTによる符号化及び復号化を行ってもよい。
高周波帯域で、USAC符号化器は、eSBRを介して、高周波信号を、パラメータを利用して符号化できる。それにより、USAC復号化器は、符号化された情報を復号化し、復号化された情報を基にして、高周波信号を生成することができる。
USAC符号化器は、MPS(MPEG surround)を利用し、ステレオ情報をパラメータで表現して符号化を行い、USAC復号化器は、復号化された情報を基にして、ステレオ信号を生成することができる。
以下で説明する本発明は、USAC符号化器及びUSAC復号化器で、noiselessコーディングに係り、FDまたはwLPTを介して量子化されたスペクトルデータに対して無損失符号化及び復号化を行うことと関連する。USAC符号化器、算術符号化装置(arithm coding)100がコンテクスト基盤の算術符号化を行い、USAC復号化器で、算術復号化装置(arithm decod)101がコンテクスト基盤の算術復号化を行ってもよい。
図2は、算術符号化装置100(第1例)の細部構成を図示した図である。
算術符号化装置100は、コンテクスト・リセット部201、コンテクスト・マッピング部202、Nタプル(tuple)・コンテクスト決定部203、MSB(most significant bit)コンテクスト決定部204、脱出コード符号化部205、確率マッピング部206、MSB符号化部207、LSB(least significant bit)符号化部208及びコンテクスト・アップデート部209を含んでもよい。このとき、脱出コード符号化部205は、実施形態によって除外されてもよい。
ここで、コンテクスト・リセット部201、コンテクスト・マッピング部202は、フレーム単位で動作し、Nタプル・コンテクスト決定部203、MSBコンテクスト決定部204、脱出コード符号化部205、確率マッピング部206、MSB符号化部207、LSB符号化部208は、フレームで周波数単位で動作しうる。すなわち、算術符号化装置100は、同じフレームに対して、周波数インデックスを増加させて符号化することができる。
符号化しようとする現在フレームが、リセット・フレームである場合、コンテクスト・リセット部201は、以前フレームの周波数スペクトルを0に初期化することができる。そして、符号化しようとする現在フレームが、リセット・フレームではない場合、コンテクスト・マッピング部202は、現在フレームの周波数スペクトル長が、以前フレームの周波数スペクトル長と異なる場合、以前フレームの長さを、現在フレームの長さに整列させることができる。
Nタプル・コンテクスト決定部203は、符号化しようとする現在Nタプル210に対して、周辺に位置した周辺Nタプル(neighborhood N−tuples)211,212,213,214の量子化されたスペクトル値を利用し、前記現在Nタプル210に係わるコンテクストを決定することができる。現在Nタプル210は、すでに符号化された4個の周辺Nタプル211,212,213,214を介して符号化することができる。
ここで、Nタプルは、量子化された周波数スペクトルを、周波数が増加する順に連続したN個の周波数スペクトル単位にまとめた集合を意味する。Nは、特定数字に限定されるものではなく、システムの構成によって変更される。以下の実施形態のNタプルは、任意の個数N単位でまとめた集合を構成することができ、集合を構成する量子化された周波数スペクトルの個数であるNタプルとして表現することができる。ここでNは、正の整数であってもよい。一例として、Nタプルは、4個の周波数スペクトル単位でまとめた集合である4タプルとして使われもする。本発明の一実施形態では、Nが4である場合について説明しているが、Nは、特定数字に限定されるものではない。Nタプルについては、図4でさらに具体的に説明する。
Nタプル・コンテクスト決定部203は、現在Nタプル210に対して、周辺Nタプル212及び周辺Nタプル214の量子化されたスペクトル値が、いずれも−4〜3になるまで、スケーリングダウンを行ってもよい。それにより、Nタプル・コンテクスト決定部203は、スケーリングダウンした回数に基づいて、初期LSBビット深度であるlev0を推定することができる。levについては、図4で具体的に説明する。
また、Nタプル・コンテクスト決定部203は、lev0ほどスケーリングダウンして上位ビット(MSB:most significant bit)を抽出し、抽出されたMSBが、−4と3との間の値を有するまでスケーリングダウンを行ってもよい。
MSBコンテクスト決定部204は、符号化しようとするMSBに対して、現在Nタプル210の周辺Nタプル212及び周辺Nタプル214から、MSBコンテクストを決定することができる。具体的には、符号化しようとするMSBに対して、以前フレームの同一周波数のMSBと、現在フレームの以前周波数のMSBとを、MSBコンテクストとして決定することができる。
脱出コード符号化部205は、現在Nタプル210に係わるコンテクストに基づいた確率モデルを利用し、脱出コードを符号化することができる。
確率マッピング部206は、現在Nタプルに係わるコンテクストと、MSBコンテクストとを利用し、最終的な確率モデルをマッピングすることができる。
MSB符号化部207は、現在Nタプル210に係わるコンテクストと、MSBコンテクストとを利用し、現在Nタプル210のMSBを順次に算術符号化することができる。
LSB符号化部208は、levに該当するビット深度まで、下位ビット(LSB:least significant bit)をビット単位で算術符号化することができる。
コンテクスト・アップデート部209は、次のNタプルを符号化するために量子化されたサンプルを、アップデートすることができる。それにより、MSBコンテクスト決定部204は、次のNタプルについて、アップデートされた量子化されたサンプルを利用し、MSBコンテクストを決定することができる。
図3は、算術復号化装置101(第1例)の細部構成を図示した図である。
算術復号化装置101は、コンテクスト・リセット部301、コンテクスト・マッピング部302、Nタプル・コンテクスト決定部303、MSBコンテクスト決定部304、脱出コード復号化部305、確率マッピング部306、MSB復号化部307、LSB復号化部308、量子化されたサンプル生成部309及びコンテクスト・アップデート部310を含んでもよい。
ここで、コンテクスト・リセット部301、コンテクスト・マッピング部303は、フレーム単位で動作し、Nタプル・コンテクスト決定部303、MSBコンテクスト決定部304、脱出コード復号化部305、確率マッピング部306、MSB復号化部307、LSB復号化部308は、フレームで周波数単位で動作しうる。すなわち、算術復号化装置101は、同じフレームに対して、周波数インデックスを増加させて復号化することができる。
復号化しようとする現在フレームがリセット・フレームである場合、コンテクスト・リセット部301は、以前フレームの周波数スペクトルを0に初期化することができる。そして、復号化しようとする現在フレームがリセット・フレームではない場合、コンテクスト・マッピング部303は、現在フレームの周波数スペクトル長が、以前フレームの周波数スペクトル長と異なる場合、以前フレームの長さを現在フレームの長さに整列させることができる。
Nタプル・コンテクスト決定部203は、復号化しようとする現在Nタプル311に対して、周辺に位置した周辺Nタプル312,313,314,315の量子化されたスペクトル値を利用し、前記現在Nタプル311に係わるコンテクストを決定することができる。現在Nタプル311は、すでに復号化された4個の周辺Nタプル312,313,314,315を介して復号化することができる。Nタプルについては、図4で具体的に説明する。
Nタプル・コンテクスト決定部303は、現在Nタプル311に対して、周辺Nタプル313及び周辺Nタプル315の量子化されたスペクトル値がいずれも−4〜3になるまで、スケーリングダウンを行ってもよい。それにより、Nタプル・コンテクスト決定部303は、スケーリングダウンした回数に基づいて、初期LSBビット深度であるlev0を推定することができる。levについては、図4で具体的に説明する。
MSBコンテクスト決定部304は、復号化されたMSBを基に、コンテクストとして使用するMSBを決定することができる。
脱出コード復号化部305は、現在前記Nタプル・コンテクスト決定部303で決定されたコンテクストに基づいた確率モデルを利用し、脱出コードを復号化することができる。また、コアのコーディングモードのコンテクストに基づいた確率モデルを利用し、脱出コードを復号化することができる。
確率マッピング部306は、現在Nタプル311に係わるコンテクストと、MSBコンテクストとを利用し、最終的な確率モデルをマッピングすることができる。
MSB復号化部307は、現在Nタプル311に係わるコンテクストと、MSBコンテクストとを利用し、現在Nタプル311のMSBを順次に算術復号化することができる。
LSB復号化部308は、levに該当するビット深度まで下位ビット(LSB)を、ビット単位で算術復号化することができる。
量子化されたサンプル生成部309は、算術復号化されたMSBとLSBとを利用し、現在Nタプルに係わる量子化されたサンプルを生成することができる。MSB値をlevほどレフト・シフトアップさせ、LSBの値をビット深度に合わせて付加する過程で生成することができる。
コンテクスト・アップデート部310は、次のNタプルを復号化するために、量子化されたサンプルをアップデートすることができる。それにより、MSBコンテクスト決定部304は、次のNタプルについて、アップデートされた量子化されたサンプルを利用し、MSBコンテクストを決定することができる。
図4は、Nタプル、MSB、LSBについて説明するための図である。図4の上段に、時間(time)と周波数(frequency)とによるNタプルが図示されている。現在Nタプル401は、符号化したり復号化しようとするNタプルを意味する。4個の周辺Nタプル402,403,404,405は、すでに符号化及び復号化されたものであり、現在Nタプル401に係わるコンテクストを決定するときに利用される。このとき、周辺Nタプル403,404,405は、以前フレームに対応し、周辺Nタプル402は、現在Nタプル401と同じ現在フレームに対応しうる。
図4の下段に、周波数インデックス(frequency index)とビット深度(bit-depth)とによる上位ビット(MSB)と下位ビット(LSB)とが図示されている。このとき、MSBは、符号(sign)情報を含むビットを意味する。本発明の一実施形態で、MSBを、符号情報を含む有効な3ビットでもって定義することができる。MSBに係わる定義は、システムの構成によって変更されてもよい。
図4を参照すれば、LSBは、MSBよりビット深度がさらに大きいビットを意味する。このとき、LSBは、lev値を有することができる。Levは、コンテクストのMSB組み合わせによって決定される値であり、ビット深度が0であるということは、MSBのすぐ下に位置したLSBを意味する。Nタプルは、MSBに対応し、周波数インデックスによってシンボルとして区分される。一例として、図4では、Nタプルが4個のシンボルから構成されるということが分かる。今後、現在Nタプル401は、4個のシンボルを、周波数によって分離され、符号化されたり、あるいは復号化される。言い換えれば、MSBは、シンボル単位で復号化されたり、あるいは符号化される。このとき、タプルは、シンボルに対応するものであると定義することができる。図4では、Nタプルに含まれたシンボルを4個でもって表現したが、装置によって、シンボルの個数を変更してもよい。
図5は、コンテクストと確率モデルとを図示した図である。図5を参照すれば、4個のシンボルから構成された現在Nタプル501と、4個の周辺Nタプル502,503,504,505とが図示されている。図2及び図3で、Nタプル・コンテクスト決定部203,303は、現在Nタプル501について、4個の周辺Nタプル502,503,504,505の量子化されたスペクトル値を使用し、現在Nタプル501のコンテクストを決定することができる。
MSBコンテクスト決定部204,304は、現在Nタプル501を構成するシンボルA,B,C,Dそれぞれに対応するコンテクストを、周辺Nタプル502,503,504,505で決定することができる。前述の通り、シンボルは、MSBを意味する。一例として、MSBコンテクスト決定部204,304は、現在Nタプル501を構成するシンボルについて、以前フレームの同一周波数のシンボルと、現在フレームの以前周波数のシンボルとをコンテクストとして決定することができる。言い換えれば、MSBコンテクスト決定部204,304は、符号化または復号化しようとするMSBについて、以前フレームの同一周波数のMSBと、現在フレームの以前周波数のMSBとをそれぞれコンテクストとして決定することができる。
確率マッピング部206,306は、Nタプルのコンテクストと、MSBコンテクストとを利用し、最終的な確率モデルをマッピングすることができる。例えば、現在Nタプル501のシンボルA(MSB A)に係わる確率モデルをマッピングするために、確率マッピング部206,306は、現在Nタプル501のコンテクストである周辺Nタプル502,503,504,505と、MSB Aのコンテクストである周辺Nタプル504のMSB A0と、周辺Nタプル502のMSB D1とを確率モデルとしてマッピングすることができる。現在Nタプル501を構成するMSB A,B,C,Dそれぞれの確率モデルは、図5から確認することができる。
このとき、A,B,C,Dが有することができるMSBは、符号情報を含む上位3ビットである場合、総8種(−4,−3,−2,−1,0,1,2,3)であってもよい。それにより、確率マッピング部206,306は、総8種のMSBについて確率値を割り当てる。具体的には、確率マッピング部206,306は、以前フレームの同一周波数のMSB値(A0,B0,C0,D0)の8種である場合と、現在フレームの以前周波数のMSB値(D1,A,B,C)の8種である場合とを条件として、確率モデルをマッピングすることができる。それにより、確率テーブルは、prob[8][8][8]であってもよい。この確率テーブルは、prob[64][8]であってもよい。
例えば、以前フレームの同一周波数のMSB値が−4であり、現在フレームの以前周波数のMSB値が−3であるときの確率モデルは、prob[−4+4][−3+4]として選択されてもよい。選択された確率モデルp={p(−4),p(−3),p(−2),p(−1),p(0),p(1),p(2),p(3)}によって構成されてもよい。それにより、現在Nタプル501について、最終的な確率テーブルは、prob[32][64*8]によって構成される。このとき、確率マッピング部206,306は、FDまたはwLPT(TCX)のモード情報を考慮して、各モード情報に対応する確率テーブルを構成することができる。
また、確率マッピング部206,306は、確率モデルにおいて同じ値が重複する場合、メモリ使用の効率性を高めるために、確率モデル・マッピングテーブルを使用することができる。確率モデル・マッピングテーブルは、インデックスを別途に表現するものを意味する。例えば、確率モデル・マッピングテーブルは、unsigned short map[2048]、unsigned short prob[748][8]のように表現可能である。すなわち、確率モデル・マッピングテーブルの前記表現が発生しうる条件が2048種であり、総確率モデルが748種であることを意味する。結局、unsigned short[32][64*8]は、32*64*8*0.5=8192wordである一方、確率モデル・マッピングテーブルを使用すれば、2048*0.5+748*0.5=4016wordであるから、メモリが節減される。
図6は、MSB復号化方式(第1例)を図示した図である。
算術復号化装置101は、現在Nタプルに含まれた4個のMSBを介して、LSBのビット深度(bit depth)を決定することができる(S601)。LSBのビット深度は、LSBを復号化するときに使われる。そして、算術復号化装置101は、現在Nタプルに含まれた4個のMSBについて、確率モデル集合を選択することができる(S602)。その後、算術復号化装置101は、復号化されるMSBが脱出コードであるか否かに係わる確率モデルを選択し(S603)、MSBに対して算術復号化を行う。算術復号化装置101は、MSBが脱出コードであるか否かをari_pk_mod_esc[32][2]テーブルを利用してデコーディングすることができる(S605)。もし脱出コードである場合、段階(604)に戻り、脱出コードではない場合、段階(S606)が遂行される。
算術復号化装置101は、FDモードまたはTCX(wLPT)モードである場合、以前フレームの同一周波数のMSBと同一フレームの以前周波数のMSBを利用し、MSBシンボルの確率モデルをマッピングすることができる(S607)。確率モデルのマッピングされた結果を介して、算術復号化装置101は、現在Nタプルに含まれた4個のMSBに対して算術復号化を行うことができる(S606)。
図7は、LSB復号化方式(第1例)を図示した図である。
算術復号化装置101は、MSB復号化を介して導き出されたビット深度インデックス(bdi:bit depth index)をセッティングすることができる(S701)。このとき、算術復号化装置101は、ビット深度インデックスがLSBのlevであるNより小さいか否かを判断することができる(S702)。もしビット深度インデックスがNより小さい場合、算術復号化装置101は、ビット深度インデックス及びMSB符号による確率モデルを決定することができる(S703)。そして、ビット深度インデックスがNより大きい場合、算術復号化装置101は、MSB符号による確率モデルを決定することができる(S705)。それにより、算術復号化装置101は、LSBのビット単位で算術復号化を行い(S704)、MSBに該当するLSBのうち、ビット深度インデックスに該当するビット値(1または0)を出力することができる。このとき、算術復号化装置101は、以前に符号化または復号化されたMSB値が0,正数,負数である場合を分離し、算術符号化を行ってもよい。
一例として、算術復号化装置101は、ビット深度がN(5)より小さい場合、ビット深度情報をコンテクストとして使用し、それ以外の場合は、MSBが正数,0,負数の3種の場合だけ区分する。算術復号化装置101は、算術復号化を行った後、ビット深度インデックスを1増加させ、その後のビット深度に対応するLSBを算術復号化することができる。
図8は、符号分離を利用したMSB復号化方式を図示した図である。
符号(sign)分離は、MSBのシンボルに係わる表現方式だけ変わることを意味する。図8で、段階(S801)ないし段階(S805)は、前述の図6の段階(S601)ないし段階(S605)に対応する。
段階(S805)で、復号化しようというMSBが脱出コードである場合、算術復号化装置101は、magnitude算術復号化を行うことができる(S806)。このとき、算術符号化装置100は、MSBの符号復号化が必要であるか否かを判断することができる(S808)。もしMSBの符号復号化が必要である場合、算術符号化装置100は、MSBの符号に対して算術復号化を行い(S810)、MSBの符号復号化が必要ではない場合、符号をMSB値に変換することができる(S809)。例えば、−4、0は、符号が固定された値であるために、符号を復号化しない。変換されたMSB値は、MSBシンボルの確率モデルをマッピングするとき(S807)に使われる。図8によれば、同じ周波数インデックスのMSB magnitudeをまず復号化し、MSB magnitudeの符号を復号化した後、次の周波数インデックスの符号化を行ってもよい。
MSB復号化を行うとき、使われるコンテクストは、以前と同じ方式が使われたり、または変更されたシンボルが使われもする。すなわち、算術復号化装置101は、MSBを復号化するとき、以前フレームの同一周波数のMSBと、現在フレームの以前周波数のMSBとを使用することができる。このとき、確率モデルは、magnitudeが[32][8][8][5]であり、確率モデルの符号が[32][8][8][2]を示すことができる。そして、算術復号化装置101は、変更されたシンボルを使用することができ、変更されたシンボルの確率モデルは、magnitudeが[32][5][5][5]であり、符号が[32][5][5][2]を示すことができる。
図9は、LSFを利用した符号化方式及び復号化方式を図示した図である。
wLPTモードでは、さらにLPC(linear predictive coding)情報を利用し、コンテクストが決定されてもよい。このとき、LPC係数は、量子化するのに有利なLSFに変換される。LSF間の差は、スペクトル・ピークと関連性が高く、LSF間隔が狭ければ、スペクトル・ピークが発生しうる。そして、LSF間隔が狭ければ、LPフィルタリング以後にも、スペクトルenvelopが高く出てくる確率が高く、量子化されたサンプルのMSBが大きい可能性が高い。
図9で上段の図面は、MSB符号化方式を示し、下段の図面は、MSB復号化方式を示す。
算術符号化装置100は、LSF(line spectrum frequency)符号化を行う(S901)。算術符号化装置100は、LSF符号化を介して導き出された量子化されたLSFを利用し、Nタプルに該当するコンテクストを生成する(S902)。そして、算術符号化装置100は、量子化されたMDCTスペクトルと既存コンテクストとを利用し、確率モデルを決定し(S902)、MSBに対して算術符号化を行う(S904)。算術符号化されたMSBと量子化されたLSFとがビットストリームに含まれる。
そして、算術復号化装置101は、圧縮されたビットストリームからLSF符号化を行う(S905)。算術復号化装置101は、LSF符号化を介して導き出された量子化されたLSFを利用し、Nタプルに該当するコンテクストを生成する(S907)。
そして、算術復号化装置101は、量子化されたMDCTスペクトルと既存コンテクストとを利用し、確率モデルを決定し(S906)、MSBに対して算術復号化を行う(S904)。
LSFを利用してコンテクストを決定する場合、現在ビットストリーム構造が変更されることが必要である。すなわち、現在ビットストリーム構造がacelp_core_モード、lpd_モード、ACELP or TCX data、LPC dataの順序で構成された場合、修正されたビットストリーム構造は、acelp_core_モード、lpd_モード、LPC data、ACELP or TCX dataの順序で構成される。
図10は、算術符号化装置100(第2例)の細部構成を図示した図である。
算術符号化装置100は、コンテクスト・リセット部1001、コンテクスト・マッピング部1002、Nタプル・コンテクスト決定部1003、MSBコンテクスト決定部1004、脱出コード符号化部1005、確率マッピング部1006、MSB符号化部1007、LSB符号化部1008、コンテクストモード符号化部1009及びコンテクスト・アップデート部1010を含んでもよい。
図10の算術符号化装置100は、図2の算術符号化装置100に比べ、コンテクストモード符号化部1009をさらに含んでいる。
符号化しようとする現在フレームがリセット・フレームではない場合、コンテクスト・マッピング部1002は、現在フレームの周波数スペクトル長が、以前フレームの周波数スペクトル長と異なる場合、以前フレームの長さを現在フレームの長さに整列させることができる。
また、コンテクスト・マッピング部1002は、以前フレームの符号化されたMSB値に対して、さらにマッピングを行ってもよい。
Nタプル・コンテクスト決定部1003は、符号化しようとする現在Nタプル1011について、周辺に位置した周辺Nタプル1012,1013,1014,1015の量子化されたスペクトル値を利用し、前記現在Nタプル1011に係わるコンテクストを決定することができる。
現在Nタプル1011は、すでに符号化された4個の周辺Nタプル1012,1013,1014,1015を介して符号化することができる。
そして、Nタプル・コンテクスト決定部1003は、現在Nタプル1010について、周辺Nタプル1013及び周辺Nタプル1014の量子化されたスペクトル値がいずれも−4〜3になるまで、スケーリングダウンを行ってもよい。それにより、Nタプル・コンテクスト決定部1003は、スケーリングダウンした回数に基づいて、lev0を推定することができる。また、Nタプル・コンテクスト決定部1003は、lev0ほどスケーリングダウンし、上位ビット(MSB)を抽出し、抽出されたMSBが、−4と3との間の値を有するまで、スケーリングダウンを行ってもよい。さらなるスケーリングダウン回数は、脱出コードに対する符号化回数を決定することができる。
MSBコンテクスト決定部1004は、符号化しようとするMSBについて、現在Nタプル1011の周辺Nタプル1013及び周辺Nタプル1015から、MSBコンテクストを決定することができる。具体的には、MSBコンテクスト決定部1004は、符号化しようとするMSBについて、以前フレームの同一周波数のMSBと、現在フレームの以前周波数のMSBとを、MSBコンテクストとして決定することができる。
ここで、コンテクストモード符号化部1009は、MSBを符号化するときに使用する複数個のコンテクストのうち、最終伝送された1個のコンテクストモードに対して符号化を行ってもよい。複数個のコンテクストは、復号化するシンボル周辺のMSBを意味する。コンテクストモードは、ビット・パッキング(bit-packing)によって伝送される方法もあり、算術符号化を行って伝送される方法もある。コンテクストモード伝送は、フレーム別に1回伝送される。コンテクストモード符号化部1009は、候補個数をいずれも表現することができるビットを割り当て、ビット・パッキングを行ってもよい。コンテクストモード符号化部1009については、図16で具体的に説明する。
それにより、MSBコンテクスト決定部1004は、コンテクストモードによって適切なMSBコンテクストを選択することができる。
脱出コード符号化部1005は、現在Nタプル1010に係わるコンテクストに基づいた確率モデルを利用し、脱出コードを符号化することができる。すなわち、脱出コード符号化部1005は、復号化されるMSBが脱出コードであるか否かを算術復号化した後、脱出コードではない場合、MSB算術符号化が遂行される。脱出コード符号化時に使われるコンテクストは、Nタプルのコンテクスト及びコアのコーディングモード(FDまたはwLPD)が使われる。復号化されるMSBが脱出コードであるならば、1に、脱出コードではなければ、0に符号化され、脱出コードで符号化されればlev0値を+2ほど増加させ、LSBのビット深度levに対してアップデートすることができる。
確率マッピング部1006は、現在Nタプル1011に係わるコンテクストと、MSBコンテクストとを利用し、最終的な確率モデルをマッピングすることができる。確率マッピング部1006は、マッピング・テーブルと確率テーブルとを利用することができる。確率モデルをマッピングする過程は、MSBを復号化するときに適用する確率モデルを、確率テーブルから求める過程である。すなわち、確率モデルをあらゆる場合について全部有していれば、メモリの大きさに対する負担があるために、メモリを減らす目的で、確率マッピング部1006は、コンテクストによって確率モデルを求めるように、マッピング・テーブルを使用することができる。マッピング・テーブルは、各確率のコンテクストに該当する総配列に、確率テーブルのインデックスを割り当てて構成することができる。確率テーブルは、MSB復号化時に使われるあらゆる確率値で構成することができる。
MSB符号化部1007は、現在Nタプル1010に係わるコンテクストと、MSBコンテクストとを利用し、現在Nタプル1010のMSBを順次に算術符号化することができる。
LSB符号化部1008は、levに該当するビット深度まで、下位ビット(LSB)をビット単位で算術符号化することができる。LSB符号化は、ビット単位で処理され、LSB符号化部1008は、MSBからの距離を意味するビット深度情報と、MSBの符号情報(正数/負数/0)とをコンテクストとして利用し、LSBに対して算術符号化を行う。
コンテクスト・アップデート部1010は、次のNタプルを符号化するために量子化されたサンプルをアップデートすることができる。それにより、MSBコンテクスト決定部1004は、次のNタプルについて、アップデートされた量子化されたサンプルを利用し、MSBコンテクストを決定することができる。
図11は、算術復号化装置(第2例)の細部構成を図示した図である。
算術復号化装置101は、コンテクスト・リセット部1101、コンテクスト・マッピング部1102、コンテクストモード復号化部1103、Nタプル・コンテクスト決定部1104、MSBコンテクスト決定部1105、脱出コード復号化部1106、確率マッピング部1107、MSB復号化部1108、LSB復号化部1109、量子化されたサンプル生成部1110及びコンテクスト・アップデート部1111を含んでもよい。図11の算術復号化装置101は、図3の算術復号化装置101に比べ、コンテクストモード復号化部1103をさらに含んでいる。
図2あるいは図11の算術復号化装置101は、上位ビットと下位ビットとが分離して復号化することができる。すなわち、算術復号化装置101は、上位ビットのみ復号化したり、または上位ビット及び下位ビットを共に復号化することができる。
復号化しようとする現在フレームがリセット・フレームではない場合、コンテクスト・マッピング部1102は、現在フレームの周波数スペクトル長が、以前フレームの周波数スペクトル長と異なる場合、以前フレームの長さを、現在フレームの長さに整列させることができる。また、コンテクスト・マッピング部1102は、以前フレームの復号化されたMSB値に対して、さらにマッピングを行ってもよい。すなわち、コンテクスト・マッピング部1102は、MSBコンテクストのさまざまな組み合わせの候補を入力されて復号化を行い、復号化された結果のビット量が最も少ないコンテクストモードを選択して復号化することができる。
コンテクストモード復号化部1103は、MSBを復号化するときに使用する複数個のコンテクストのうち、最終伝送された1個のコンテクストモードに対して復号化を行ってもよい。複数個のコンテクストは、復号化するシンボル周辺のMSBを意味する。コンテクストモードはビット・パッキングによって伝送される方法もあり、算術復号化を行って伝送される方法もある。コンテクストモード伝送は、フレーム別に1回伝送される。コンテクストモード復号化部1103は、候補個数をいずれも表現することができるビットを割り当て、ビット・パッキングを行ってもよい。コンテクストモード復号化部1103については、図16で具体的に説明する。それにより、MSBコンテクスト決定部1104は、コンテクストモードによって適切なMSBコンテクストを選択することができる。
Nタプル・コンテクスト決定部1104は、復号化しようとする現在Nタプル1112について、周辺に位置した周辺Nタプル1113,1114,1115,1116の量子化されたスペクトル値を利用し、前記現在Nタプル1112に係わるコンテクストを決定することができる。現在Nタプル1111は、すでに復号化された4個の周辺Nタプル1113,1114,1115,1116を介して復号化することができる。
そして、Nタプル・コンテクスト決定部1104は、現在Nタプル1112について、周辺Nタプル1114及び周辺Nタプル1116の量子化されたスペクトル値がいずれも−4〜3になるまで、スケーリングダウンを行ってもよい。それにより、Nタプル・コンテクスト決定部1104は、スケーリングダウンした回数に基づいて、lev0を推定することができる。
MSBコンテクスト決定部1105は、復号化しようとするMSBについて、現在Nタプル1111の周辺Nタプル1114及び周辺Nタプル1116から、MSBコンテクストを決定することができる。具体的には、MSBコンテクスト決定部1105は、復号化しようとするMSBについて、以前フレームの同一周波数のMSBと、現在フレームの以前周波数のMSBとをMSBコンテクストとして決定することができる。
確率マッピング部1106は、現在Nタプル1111に係わるコンテクストと、MSBコンテクストとを利用し、最終的な確率モデルをマッピングすることができる。確率マッピング部1106は、マッピング・テーブルと確率テーブルとを利用することができる。確率モデルをマッピングする過程は、MSBを復号化するときに適用する確率モデルを確率テーブルから求める過程である。すなわち、確率モデルをあらゆる場合に対して全部有していれば、メモリの大きさに対する負担があるために、メモリを減らす目的で確率マッピング部1106は、コンテクストによって確率モデルを探すように、マッピング・テーブルを使用することができる。マッピング・テーブルは、各確率のコンテクストに該当する総配列に確率テーブルのインデックスを割り当てて構成することができる。確率テーブルは、MSB復号化時に使われるあらゆる確率値で構成される。
脱出コード復号化部1107は、現在Nタプル1111に係わるコンテクストに基づいた確率モデルを利用し、脱出コードを復号化することができる。すなわち、脱出コード復号化部1107は、復号化されるMSBが脱出コードであるか否かを算術復号化した後、脱出コードではない場合、MSB算術復号化が遂行されてもよい。脱出コード復号化時に使われるコンテクストは、Nタプルのコンテクスト及びコアのコーディングモード(FDまたはwLPD)が使われる。復号化されるMSBが脱出コードであるならば、1に、脱出コードではなければ、0に復号化され、脱出コードで復号化されれば、lev0値を+2ほど増加させ、LSBのビット深度levに対してアップデートすることができる。
MSB復号化部1108は、現在Nタプル1112に係わるコンテクストと、MSBコンテクストとを利用し、現在Nタプル1112のMSBを順次に算術復号化することができる。
本発明の一実施形態でNタプルは、複数個の量子化された周波数スペクトルで構成された集合を意味する。そして、算術復号化装置101は、複数個の量子化された周波数スペクトルで構成された集合を、符号ビットを含んだ上位ビットと下位ビットとに分離して復号化することができる。
それにより、Nタプル・コンテクスト決定部1104は、現在復号化する集合(現在Nタプル)の周辺に位置した集合(周辺Nタプル)の量子化された周波数スペクトル値を利用し、第1コンテクスト(Nタプル・コンテクスト)を決定することができる。
脱出コード復号化部1107は、現在復号化する集合(現在Nタプル)の周辺に位置した集合(周辺Nタプル)に基づいて、下位ビットのビット深度を推定することができる。そして、脱出コード復号化部1107は、周辺に位置した集合に係わるコアの復号化モードをコンテクストとして使用し、復号化されるMSBが脱出コードであるか否かを表現するシンボルを復号化することができる。それにより、脱出コード復号化部1107は、脱出コードが復号化される回数に基づいて、推定された下位ビットのビット深度をアップデートすることができる。
そして、MSBコンテクスト決定部1105は、現在復号化する上位ビットシンボル(現在NタプルのMSBシンボル)周辺の復号化された上位ビットシンボル(周辺NタプルのMSBシンボル)を利用し、第2コンテクスト(MSBコンテクスト)を決定することができる。このとき、コンテクストモード復号化部1103は、コンテクストとして使われる復号化された上位ビットシンボル(周辺NタプルのMSBシンボル)に対する現在復号化する上位ビットシンボル(現在NタプルのMSBシンボル)の相対的位置情報(コンテクストモード)を復号化することができる。それにより、MSBコンテクスト決定部1105は、相対的な位置情報を利用し、第2コンテクストを生成することができる。このとき、相対的な位置情報は、コア復号化モードをコンテクストとして使用し、算術復号化を介して復号化することができる。または、相対的な位置情報は、複数個の周波数帯域で、上位ビットシンボル(現在NタプルのMSBシンボル)の復号化時に使われる第2コンテクストに対応する値で表現することができる。
結局、MSB復号化部1108は、生成された第1コンテクスト及び第2コンテクストを利用し、上位ビットを復号化することができる。
LSB復号化部1109は、levに該当するビット深度まで、下位ビット(LSB)をビット単位で算術復号化することができる。LSB復号化は、ビット単位で処理され、LSB復号化部1109は、MSBからの距離を意味するビット深度情報と、MSBの復号化情報(正数/負数/0)とをコンテクストとして利用し、LSBに対して算術復号化を行う。
前述の通り、算術復号化装置101は、LSB復号化部1109とMSB復号化部1108とが分離して復号化することができる。このとき、LSB復号化部1109は、上位ビット(MSB)の符号情報を利用し、第3コンテクストを生成することができる。そして、LSB復号化部1109は、下位ビットのビット深度情報を利用し、第4コンテクストを生成することができる。それにより、LSB復号化部1109は、生成された第3コンテクストと第4コンテクストとを利用し、下位ビットをビット単位で復号化することができる。
一例として、第3コンテクストを利用する場合、LSB復号化部1109は、下位ビットと同じ周波数位置に対応する上位ビットシンボルの符号が正数であるか、負数であるか、0であるかに基づいて、下位ビットをビット単位で復号化することができる。そして、LSB復号化部1109は、第4コンテクストのみ利用し、下位ビットを復号化することも可能である。
量子化されたサンプル生成部1110は、算術復号化されたMSBとLSBとを利用し、現在Nタプル1111に係わる量子化されたサンプルを生成することができる。
コンテクスト・アップデート部1111は、次のNタプルを復号化するために、量子化されたサンプルをアップデートすることができる。また、復号化されたMSB値も、アップデートすることができる。
図12は、コンテクストと確率モデルとを図示した図である。図12を参照すれば、4個のシンボルから構成された現在Nタプル1201と、4個の周辺Nタプル1202,1203,1204,1205とが図示されている。
Nタプル・コンテクスト決定部1103,1204は、現在Nタプル1201について、4個の周辺Nタプル1202,1203,1204,1205の量子化されたスペクトル値を、現在Nタプル1201のコンテクストとして決定することができる。
そして、MSBコンテクスト決定部1103,1204は、コンテクストモード情報に基づいて、現在Nタプル1201を構成するシンボルA,B,C,Dそれぞれに対応するコンテクストを、周辺Nタプル1202,1203,1204,1205から決定することができる。
前述の通り、シンボルは、MSBを意味する。一例として、MSBコンテクスト決定部1103,1204は、現在Nタプル1201を構成するシンボルについて、以前フレームの同一周波数のシンボルと、現在フレームの以前周波数のシンボルとを、コンテクストとして決定することができる。言い換えれば、MSBコンテクスト決定部1103,1204は、符号化または復号化しようとするMSBについて、以前フレームの同一周波数のMSBと、現在フレームの以前周波数のMSBとを、それぞれコンテクストとして決定することができる。
確率マッピング部1106,1206は、コンテクストモードによって、Nタプルのコンテクストと、MSBコンテクストとを利用し、最終的な確率モデルをマッピングすることができる。例えば、現在Nタプル1201のシンボルA(MSB A)に係わる確率モデルをマッピングするために、確率マッピング部1106,1206は、コンテクストモード(モード0,1,2,3)によって、現在Nタプル1201のコンテクストである周辺Nタプル1202,1203,1204,1205と、MSB Aのコンテクストである周辺Nタプル1204のMSBと、周辺Nタプル1202のMSBとをコンテクストとして使用する確率モデルとしてマッピングすることができる。現在Nタプル1201を構成するMSB A,B,C,Dそれぞれの確率モデルは、図12で確認することができる。そして、現在Nタプル1201のMSB Bのコンテクストは、コンテクストモードによって、周辺Nタプル1204のMSBと、周辺Nタプル1202のMSBとを確率モデルとしてマッピングすることができる。図5との差異点は、現在MSBに係わるコンテクストがコンテクストモードによって異なるように決定されるのである。
図13は、MSB復号化方式(第2例)を図示した図である。
算術復号化装置101は、現在Nタプルに含まれた4個のMSB(量子化されたサンプル)を介して、LSBの初期ビット深度のlev0を決定する(S1301)。LSBのビット深度は、LSB復号化するときに使われる。そして、算術復号化装置101は、現在Nタプルに含まれた4個のMSBについて、確率モデル集合を選択する(S1302)。その後、算術復号化装置101は、FDまたはwLPDによって、復号化されるMSBが脱出コードであるか否かに係わる確率モデルを選択し(S1303)、MSBに対して算術復号化を行う(S1304)。算術復号化装置101は、復号化されるMSBが脱出コードであるか否かを、ari_pk_mod_esc[32][2]テーブルを利用し、デコーディングする(S1305)。もし脱出コードである場合、段階(1304)に戻り、脱出コードではない場合、段階(S1301)が遂行される。
算術復号化装置101は、現在Nタプルに含まれた4個のMSBについて、コンテクストモード情報によって、MSBシンボルの確率モデルをマッピングする(S1307)。
そして、算術復号化装置101は、MSB算術復号化を行う(S1306)。現在NタプルE4個のMSBが含まれているので、4番のloopが行われる。
図14は、LSB復号化方式(第2例)を図示した図である。
算術復号化装置101は、MSB復号化を介して導き出されたビット深度インデックス(bdi)をセッティングする(S1401)。このとき、算術復号化装置101は、ビット深度インデックスがLSBのlevであるNより小さいか否かを判断する(S1402)。もしビット深度インデックスがNより小さい場合、算術復号化装置101は、ビット深度インデックス及びMSB符号による確率モデルを決定する(S1403)。そして、ビット深度インデックスがNより大きい場合、算術復号化装置101は、MSB符号による確率モデルを決定する(S1405)。それにより、算術復号化装置101は、LSBのビット単位で算術復号化を行い(S1404)、MSBに該当するLSBのうち、ビット深度インデックスに該当するビット値(1または0)を出力することができる。このとき、算術復号化装置101は、以前に符号化または復号化されたMSB値が0、正数、負数である場合を分離して算術符号化を行ってもよい。
一例として、算術復号化装置101は、ビット深度がN(5)より小さい場合、ビット深度情報をコンテクストとして使用し、それ以外の場合は、MSBが正数、0、負数の3種の場合のみ区分する。算術復号化装置101は、算術復号化を行った後、ビット深度インデックスを1増加させ、その後のビット深度に対応するLSBを算術復号化することができる。
図15は、コンテクストモードを図示した図である。図15で、A,B,C,D,A0,B0,C0,D0,A1,B1,C1,D1,A2,B2,C2,D2,A3,B3,C3,D3は、すでに復号化されているか、あるいは復号化されるMSB値であり、符号ビットを含んで3ビットで表現され、−4〜3までの値のみを有することができる。
MSB復号化過程は、Nタプルに対して、シンボル単位で復号化が行われる。すなわち、周波数インデックスによって、A,B,C,Dに対して順に復号化を行ってもよい。A,B,C,DのMSB値を復号化するとき、現在Nタプルのコンテクストと、すでに復号化された周辺Nタプルのコンテクストとに対応するMSBのうち2個を、MSBコンテクストを利用し、算術復号化を行う。例えば、現在Nタプル1501の上位ビットAを復号化するときに、Nタプル・コンテクストを決定し、周辺Nタプル1504のMSB
A0値と、周辺Nタプル1502のMSB D1値とでMSBコンテクストを構成し、Aを復号化する確率モデルを構成して算術復号化を行う。このとき、MSBコンテクストは、A0,D1だけで構成されるのではなく、現在Nタプル1501の上位ビットA周辺のいくつかのMSB値2個を組み合わせして使用することが可能である。
このように、MSBコンテクストを構成した場合には、復号化するときに使用するコンテクストモードが決定されねばならないのである。コンテクストモードは、あらゆる可能な場合を、ビット・パッキングを介して表現することができる。また使用頻度数を考慮して算術復号化して復号化できるように表現することも可能である。
また、コンテクストモードは、フレーム別に1回だけ伝送し、全体フレームに同じMSBコンテクストを使用するように表現することもできる。そして、フレーム別に2回伝送し、低周波帯域と高周波帯域とに該当するMSBコンテクストの異なったものを使用するように表現することもできる。ここで、フレームは、FDモードである場合、1フレームに該当し、wLPTモードである場合は、wLPTを使用する単位を意味する。例えば、MSBコンテクストが4種に使われ、フレーム別に2回伝送するとしたとき、図15のように、総15種のコンテクストモードを構成することができる。また、コアの符号化モードが、FDモードまたはwLPTモードで符号化されたかにより、コンテクストモードをいくつかのセットに区分して表現することができ、周波数スペクトル個数により、コンテクストモードのセットを異なるように構成することもできる。
現在Nタプル1501の上位ビットシンボルAを復号化するNタプルのコンテクストと、MSBコンテクストとが決定されれば、MSB値を復号化する。確率モデルをあらゆる場合について使用すれば、確率モデルのあらゆる場合の数が多くなるために、メモリが増えるという問題点がある。これを防止するために、代表する確率モデルを使用することができるように、確率マッピング・テーブルと確率テーブルとを使用し、確率を表現することができる。例えば、N_pki値が32であり、MSBコンテクストの場合が4種であり、MSB値が−4〜3までの値を有するならば、総確率の場合の数が、32*8*8*4=4096種になり、最終復号化されるシンボルが8種になるので、総確率テーブルを併合しなければ、65536の確率テーブルを利用せざるを得ない。これを防止するために、確率モデルの併合を行って確率テーブルの場合の数を減らし、32*8*8*4のマッピング・テーブルを構成すれば、使用しなければならないメモリの量を減らすことができる。
図16は、Nタプルに係わるコンテクスト基盤の算術復号化方法を図示したフローチャートである。図16に図示された方法は、図3及び図12の算術復号化装置101の動作に対応しうる。
算術復号化装置101は、現在フレームがリセット・フレームであるか否かを判断する(S1601)。もしリセット・フレームである場合、算術復号化装置101は、コンテクスト・リセットを行う。そして、フレームリセットではない場合、算術復号化装置101は、コンテクストをマッピングすることができる。具体的には、算術復号化装置101は、現在フレームの長さが以前フレームと異なる場合、2フレーム間の周波数インデックスをマッピングさせるために、以前フレームの長さを現在フレームの長さに正規化し、コンテクストをマッピングすることができる。段階(S1601)ないし段階(S1603)は、フレーム単位によって遂行される。
算術復号化装置101は、MSBコンテクストを決定するために、コンテクストモードを復号化する(S1604)。その後、算術復号化装置101は、現在NタプルについてNタプル・コンテクストを決定する(S1605)。このとき、初期LSBビット深度であるlev0を推定することができる。
算術復号化装置101は、Nタプルのコンテクスト(pki)とFD/wLPTとに基づいて、脱出コードに対して復号化する(S1606)。脱出コードが復号化されるたびに、lev0がアップデートされ、脱出コードではないものが復号化されれば、MSB復号化を行う(S1609)。
そして、算術復号化装置101は、現在復号化するMSBに該当するMSBコンテクストを決定する(S1607)。その後、算術復号化装置101は、MSB復号化を行う確率モデルを決定するが、Nタプル・コンテクスト及びMSBコンテクストを基に、符合する確率モデルを決定する(S1608)。
算術復号化装置101は、確率モデルを基に、MSB復号化を行う(S1609)。
算術復号化装置101は、脱出コードを復号化する過程を介して導き出されたLSBのビット深度ほどのビットを復号化する(S1610)。算術復号化装置101は、MSBとLSBとを介して量子化されたサンプルを生成し(S1611)、次のNタプルを復号化するために、コンテクストをアップデートする(S1612)。それにより、算術復号化装置101は、周波数インデックスを増加させ(S1613)、次のNタプルに対して復号化を行う。
図17は、Nタプルに係わるコンテクスト基盤の算術符号化方法を図示したフローチャートである。図17に図示された方法は、図2及び図11の算術符号化装置100の動作に対応しうる。
算術符号化装置101は、現在フレームがリセット・フレームであるか否かを判断する(S1701)。もしリセット・フレームである場合、算術符号化装置101は、コンテクスト・リセットを行う。そして、フレームリセットではない場合、算術符号化装置101は、コンテクストをマッピングすることができる。具体的には、算術符号化装置101は、現在フレームの長さが以前フレームと異なる場合に、2フレーム間の周波数インデックスをマッピングさせるために、以前フレームの長さを現在フレームの長さに正規化し、コンテクストをマッピングすることができる。段階(S1601)ないし段階(S1603)は、フレーム単位によって遂行される。
段階(S1701)ないし段階(S1703)は、フレーム単位によって遂行される。
算術符号化装置101は、MSBコンテクストを決定するために、コンテクストモードを符号化する(S1704)。
その後、算術符号化装置101は、現在NタプルについてNタプル・コンテクストを決定する(S1705)。このとき、初期LSBビット深度であるlev0を推定することができる。
算術符号化装置101は、Nタプルのコンテクスト(pki)とFD/wLPTとに基づいて、脱出コードに対して符号化する(S1706)。脱出コードが符号化されるたびに、lev0がアップデートされ、脱出コードではないものが符号化されれば、MSB符号化を行う(S1709)。
そして、算術符号化装置101は、現在符号化するMSBに該当するMSBコンテクストを決定する(S1707)。その後、算術符号化装置101は、MSB符号化を行う確率モデルを決定するが、Nタプル・コンテクスト及びMSBコンテクストを基に、符合する確率モデルを決定する(S1708)。
算術符号化装置101は、確率モデルを基にMSB符号化を行う(S1709)。
算術符号化装置101は、脱出コードを符号化する過程を介して導き出されたLSBのビット深度ほどのビットを符号化する(S1710)。算術符号化装置101は、MSBとLSBとを介して量子化されたサンプルを生成し(S1711)、次のNタプルを符号化するために、コンテクストをアップデートする(S1712)。
それにより、算術符号化装置101は、周波数インデックスを増加させ(S1713)、次のNタプルに対して復号化を行う。
図18は、コンテクストモードを具現する一例を図示した図である。
コンテクストモードは、現在復号化するMSBシンボル周辺のMSB値を使用して復号化を行うときに使用するコンテクストのMSB値の相対的な位置情報を意味する。この相対的な位置情報は、MSBコンテクスト・テンプレート(MSB context template)で表現することができる。このとき、算術復号化装置101は、MSBを復号化するとき、使用する複数個の上位ビット・コンテクストのうち、1個のコンテクスト・テンプレート・インデックスを復号化することができる。それにより、算術復号化装置101は、コンテクスト・テンプレート・インデックスによってコンテクスト・テンプレートを決定し、上位ビット・コンテクストを決定することができる。
コンテクスト・テンプレート0〜3は、相対的な位置情報を意味し、「c」は、現在復号化するMSBシンボルであり、p0,p1,cp0,cp1,cp2は、すでに復号化されたMSBシンボルである。コンテクスト・テンプレート0の場合には、以前フレームの同じ周波数位置のMSBシンボルと、同一フレームの以前周波数位置のMSBシンボルとをMSBコンテクストとして使用する例である。
コンテクスト・テンプレートは、低い周波数帯域と高い周波数帯域とについて、異なる値を有することができる。一例として、コンテクスト・テンプレートを同時に表現するために、コンテクスト・テンプレート・インデックスが使われもする。このとき、コンテクスト・テンプレート・インデックスは、周波数帯域別に決定される。そして、コンテクスト・テンプレート・インデックスは、コアの復号化モードをコンテクストとして使用し、算術復号化することができる。
一例として、コンテクスト・テンプレート・インデックスは、下記式(1)のように表現することができる。
Figure 2012531086
前記式(1)のct−lとct_hは、それぞれ低周波帯域のコンテクスト・テンプレート値と、高周波帯域のコンテクスト・テンプレート値とを意味し、総4種の場合を有する例を表現している。ctidxは、コンテクスト・テンプレート・インデックスを意味する。LSB復号化部は、下記数2を介してLSBを復号化することができる。
Figure 2012531086
xは、現在復号化するLSB値と同じ周波数位置に該当するMSB値であり、lは、LSBのビット深度を意味する。また、a0,b0,c0,d0は、復号化されるMSBシンボルを意味する。
図19は、算術符号化装置(第3例)の細部構成を図示した図である。
算術符号化装置100は、コンテクスト・リセット部1901、コンテクスト・マッピング部1902、1タプル・コンテクスト決定部1903、MSBコンテクスト決定部1904、確率マッピング部1905、脱出コード符号化部1906、MSB符号化部1907、LSB符号化部1908、コンテクスト・テンプレート符号化部1909及びコンテクスト・アップデート部1910を含んでもよい。
図19の算術符号化装置100は、図10の算術符号化装置100と比較したとき、1タプル・コンテクスト決定部1903の差が存在する。すなわち、図10の算術符号化装置100は、Nタプル・コンテクストを利用する動作を行うが、図19の算術符号化装置100は、1タプル・コンテクストを利用する動作を行うことができる。
コンテクスト・リセット部1901とコンテクスト・マッピング部1902は、フレーム単位によって動作しうる。現在フレームがリセット・フレームである場合、コンテクスト・リセット部1901は、コンテクスト・リセットを行う。符号化しようとする現在フレームがリセット・フレームではない場合、コンテクスト・マッピング部1902は、現在フレームの周波数スペクトル長が、以前フレームの周波数スペクトル長と異なる場合、以前フレームの長さを、現在フレームの長さに整列させることができる。
また、コンテクスト・マッピング部1902は、以前フレームの符号化されたMSB値に対してさらにマッピングを行う。
1タプル・コンテクスト決定部1903は、符号化しようとする現在1タプル(1−tuple)1911について、周辺に位置した周辺1タプル(neighborhood 1−tuples)1912〜1918の量子化されたスペクトル値を利用し、現在1タプル1911に係わるコンテクストを決定することができる。
一例として、1タプル・コンテクスト決定部1903は、すでに符号化された7個の周辺1タプル1912〜1918を利用し、現在1タプル1911に係わるコンテクストを決定することができる。
そして、1タプル・コンテクスト決定部1903は、現在1タプル1911について、7個の量子化されたスペクトルである周辺1タプル1912〜1918を利用し、64個の状態(state)でマッピングを行う。また、1タプル・コンテクスト決定部1903は、7個の量子化されたスペクトルをさらに量子化することができる。具体的には、1タプル・コンテクスト決定部1903は、訓練(training)過程で(0→0)、(−1または1→1)、(2または−2→2)、(3以上または−4以下→3)にそれぞれマッピングさせ、量子化されたスペクトルの情報を減らすことができる。その後、1タプル・コンテクスト決定部1903は、マッピングされた量子化スペクトルが発生しうるあらゆる可能な場合の数を、上位ビットシンボルの発生確率が類似した場合同士まとめて1個のstateを構成することによって、複数個の状態(state)を生成することができる。
このように構成されたマッピング関係は、ハッシュテーブル(hash table)を介して遂行される。このとき、1タプル・コンテクスト決定部1903は、現在1タプル1911の周辺に位置した7個の量子化されたスペクトルである周辺1タプル1912〜1918を、訓練(training)過程で構成されたハッシュテーブルに入力して状態を決定することができる。
また、さらなる量子化されたサンプルをハッシュテーブルの入力として使用し、状態(state)を決定することができる。
また、現在1タプル1911のコンテクストを決定するために、コアの符号化モード情報がさらに考慮されてもよい。1タプル・コンテクスト決定部1903は、コアの符号化モード情報が、FDモードであるかwLPTモードであるかを判断し、訓練(training)過程に反映できる。1タプル・コンテクスト決定部1903は、すでに符号化された周辺1タプルとコア符号化モード情報ハッシュテーブルとに入力し、状態を決定することができる。
1タプル・コンテクスト決定部1903は、さらに現在量子化されたスペクトルである現在1タプル1911のスケーリングダウン回数を予測し、上位ビット情報及び下位ビット情報を抽出することができる。
スケーリングダウン回数は、周辺1タプルを使用した予測によって得られる。このとき、1タプル・コンテクスト決定部1903は、7個の周辺1タプル1912〜1918のうち少なくとも一つを使用し、現在1タプル1911のスケーリングダウン回数を予測することができる。
例えば、現在フレームの以前周波数に対応する周辺1タプル1917または1918を使用して予測を行う場合、1タプル・コンテクスト決定部1903は、周辺1タプル1917または1918の値が、現在1タプル1911の上位ビットを表現するビット数で表現可能な領域に達するまで、1/2スケーリングダウンを行い、表現可能な領域に達するときのスケーリングダウン回数を決定することができる。このとき、上位ビットを、符号情報を含んだ3ビットと定義した場合、1タプル・コンテクスト決定部1903は、周辺1タプル1917または1918の値が−4〜3までの値を有するまで、1/2スケーリングダウンを行い、現在1タプル1911に対するスケーリングダウン回数を予測することができる。予測したスケーリングダウン回数は、前述のlev0推定と同じ意味である。
そして、一実施形態で、1タプル・コンテクスト決定部1903は、現在1タプル1911について、現在フレームの以前周波数に対応する2個の周辺1タプル1917,1918を使用してlev0推定を行う。複数の周辺1タプルを使用する場合、lev0推定の正確度が向上しうる。
他の一実施形態で、1タプル・コンテクスト決定部1903は、現在1タプル1911について、現在フレームの以前周波数に対応する1個以上の周辺1タプル1917または1918を使用してlev0推定を行い、現在1タプル1911について、現在フレームの以前周波数に対応する1個以上の周辺1タプルの絶対値を比較することによって、スケーリングダウン回数を決定することができる。
具体的には、1タプル・コンテクスト決定部1903は、現在1タプル1911について、現在フレームの以前周波数に対応する1個以上の周辺1タプルの値を絶対値に変更し、変更された絶対値に対して1/2スケーリングダウンを遂行しつつ、スケーリングダウンされた値が特定臨界値に達する場合、スケーリングダウンを終え、最終的にスケーリングダウンされた値をlev0推定値に定めることができる。
例えば、上位ビット(MSB)を符号情報を含んだ3ビットと定義する場合、1タプル・コンテクスト決定部1903は、現在1タプル1911について、現在フレームの以前周波数に対応する2個の周辺1タプル1917,1918絶対値を算出した後、2個の絶対値に対して1/2スケーリングダウンを遂行しつつ、4以下の値に達する場合、スケーリングダウンを終え、最終的にスケーリングダウンされた値をlev0推定値として使用することができる。
また、一実施形態で、1タプル・コンテクスト決定部1903は、現在1タプル1911について、現在フレームの以前周波数に対応する1個の周辺1タプル1917または2個の周辺1タプル1917及び1918を選択的に使用し、lev0を推定することができる。
例えば、前述の方法は、コアのモードによってlev0を推定するものであり、1タプル・コンテクスト決定部1903は、FDモードである場合は、1個の周辺1タプルを使用し、wLPTモードである場合は、2個の周辺1タプルを使用し、lev0を推定することができる。wLPTモードは、FDモードに比較し、相対的に周波数スペクトルが平坦である可能性が高いために、wLPTモードであるときは、現在1タプル1911について、周辺に位置した1個の周辺1タプルを使用するより、いくつかの周辺1タプルを使用する方がlev0を効果的に推定することができる。
また、1タプル・コンテクスト決定部1903は、FDモードで符号化を行うときに使われるツールに基づいて、lev0推定に使われる周辺1タプルの個数を推定することができる。例えば、FDモードで符号化を行うとき使われるツールは、TNS(temporal noise shaping)、TW−MDCT(time warped MDCT)などがある。このとき、FDモードでTW−MDCTツールを使用して符号化が行われた場合、1タプル・コンテクスト決定部1903は、2個の周辺1タプル1917,1918を利用し、lev0を推定することができる。
また、1タプル・コンテクスト決定部1903は、フレーム別に伝送された情報を基にして、1個の周辺1タプル1917を使用したり、あるいは2個の周辺1タプル1917,1918を使用する方式を決定し、lev0を推定することができる。例えば、1タプル・コンテクスト決定部1903は、算術復号化方式を適用し、フレーム別に伝送された周辺1タプルの個数によって、lev0を推定することができる。具体的には、1タプル・コンテクスト決定部1903は、算術復号化時に、FDモードあるいはwLPTモードによって、周辺1タプルの使用個数に係わる頻度数に基づいて確率モデルを生成し、生成された確率モデルをコンテクストとして適用して算術復号化を行う。
MSBコンテクスト決定部1904は、1タプル・コンテクスト決定部1903でマッピングされた全体状態(state)のうちサブセットである特定状態の場合、追加コンテクストを生成することができる。このとき、生成された追加コンテクストは、MSB符号化部1907で、現在1タプル1911の上位ビットを符号化するときに、確率モデルを選択する過程で、全体状態(state)と結合されて使われもする。そして、全体状態(state)のうち特定状態を除外した残りの状態について、MSB符号化部1907は、全体状態(state)のみを利用し、確率モデルを選択することができる。
一例として、MSBコンテクスト決定部1904を介して生成されるMSBコンテクストは、次の通りである。コンテクスト・テンプレートについては、図22で具体的に説明する。
(1)現在フレームで、以前周波数に対応する量子化スペクトルである周辺1タプル1917または1918の上位ビット(MSB)値、または以前フレームで、現在周波数に対応する量子化スペクトルである周辺1タプル1914の上位ビット(MSB)値
(2)コンテクスト・テンプレートと結合された量子化されたスペクトルの上位ビット値
(3)現在フレームで、以前周波数に対応する量子化スペクトルである周辺1タプル1917または1918をさらに量子化して抽出された値、または以前フレームで、現在周波数に対応する量子化スペクトルである周辺1タプル1914をさらに量子化して抽出された値
(4)コンテクスト・テンプレートと結合された量子化されたスペクトルをさらに量子化して抽出された値
(5)以前フレームの量子化されたスペクトルである周辺1タプル1912〜1916をさらに量子化して抽出された値
(6)現在フレームで、以前周波数に対応する量子化スペクトルである周辺1タプル1917または1918を変更して抽出された値、または以前フレームで、現在周波数に対応する量子化スペクトルである周辺1タプル1914を変更して抽出された値
(7)コンテクスト・テンプレートと結合された量子化されたスペクトルを変更して抽出された値
MSBコンテクスト決定部1904において、量子化されたスペクトルをさらに量子化する方法は、次の通りである。第一に、MSBコンテクスト決定部1904は、量子化されたスペクトルをFDモード、wLPTモードによってさらに量子化することができる。
第二に、MSBコンテクスト決定部1904は、特定方式(−4〜3→−4〜3までの値を直接使用し、4以上である場合、3にマッピングし、−5以下である場合、−4にマッピングする)を、最初に量子化されたスペクトルのコンテクストとして決定するために、さらに量子化することができる。
MSB値を使用する場合、MSB符号化部1907は、現在フレームまたは以前フレームに対して無損失符号化された量子化されたスペクトルである周辺1タプル1912〜1918の上位ビット(MSB)値から選択し、現在1タプル1911を復号化することができる。
MSBコンテクスト決定部1904が量子化されたスペクトルを変更する方法は、次の通りである。
MSBコンテクスト決定部1904は、現在フレームに対して無損失符号化する現在周波数スペクトルである現在1タプル1911のlev0推定値を基準に、周辺1タプル1912ないし1918をlev0ほどスケーリングダウンして量子化された周波数スペクトル値を抽出することができる。
MSBコンテクスト決定部1904は、スケーリングダウン遂行後に抽出した量子化された周波数スペクトル値を使用するか、あるいは量子化された周波数スペクトル値が現在1タプル1911の上位ビットを表現するビット数で表現することができる領域を外れた場合、量子化された周波数スペクトル値を、最小値または最大値にセッティングして使用することができる。
脱出コード符号化部1905は、前記推定されたlev0回数ほど無損失符号化する現在1タプル1911に対して、1/2スケーリングダウンを遂行して変更された値が、現在Nタプル1911の上位ビットを定義するビット数で表現することができる値を超える場合、脱出コード符号化を行う。
脱出コードを符号化する方式は、(1)脱出コードであるか否かに係わる情報を符号化する方式と、(2)脱出コードを上位ビットシンボルに含めて符号化する方式と、を含む。具体的には、(1)脱出コードであるか否かに係わる情報を符号化する方式は、脱出コードに1を割り当て、脱出コードではない場合に0を割り当て、0または1を符号化することを意味する。もし脱出コードではない0が符号化されれば、MSB符号化部1907は、現在1タプル1911の上位ビットを符号化することができる。そして、(2)脱出コードを上位ビットシンボルに含めて符号化する方式は、上位ビットシンボルの個数が8種である場合、8種の上位ビットシンボルと脱出コードとを同一レベルのシンボルで表現し、総9個のうち1個を符号化する方式を意味する。例えば、脱出コード符号化部1905は、0〜7はMSBシンボル、9は脱出コードとして設定し、9個のシンボルを符号化することができる。
脱出コード符号化部1905は、予測された1/2スケーリングダウン回数ほど現在符号化する量子化されたスペクトルである現在1タプル1911をスケーリングダウンしたとき、現在1タプル1911の値が−4〜3間にあれば、脱出コードを符号化しない。
もし現在1タプル1911をスケーリングダウンしたとき、現在1タプル1911の値が−4〜3の範囲に属さない場合、脱出コード符号化部1905は、現在1タプル1911の値が−4〜3範囲に属するように、現在1タプル1911をさらにスケーリングダウンを行い、スケーリングダウン回数ほど脱出コードを符号化することができる。このとき、スケーリングダウン過程で損失されたデータは、下位ビットに含まれ、LSB符号化部1908で符号化される。
確率マッピング部1906は、現在1タプル1911に係わるコンテクストと、MSBコンテクストとを利用し、最終的な確率モデルをマッピングすることができる。確率マッピング部1906は、マッピング・テーブルと確率テーブルとを利用することができる。確率モデルをマッピングする過程は、MSBを復号化するときに適用する確率モデルを確率テーブルから求める過程である。すなわち、確率モデルをあらゆる場合について全部有していれば、メモリの大きさに対する負担があるために、メモリを減らす目的で、確率マッピング部1906は、コンテクストによって確率モデルを探すように、マッピング・テーブルを使用することができる。マッピング・テーブルは、各確率のコンテクストに該当する総配列に、確率テーブルのインデックスを割り当てて構成することができる。確率テーブルは、MSB復号化時に使われるあらゆる確率値で構成される。
MSB符号化部1907は、(i)1タプル・コンテクスト決定部1903で生成された全体状態(state)だけを利用し、現在1タプル1910のMSBを符号化したり、あるいは(ii)1タプル・コンテクスト決定部1903で生成された全体状態(state)において、特定状態のサブセットと、MSBコンテクスト決定部1904で決定された追加コンテクストとを利用し、確率モデルを選択することによって、現在1タプル1910の上位ビット(MSB)を算術符号化することができる。
LSB符号化部1908は、現在1タプル1911の下位ビット(LSB)のビット深度ほどの残余ビットを、コンテクストを利用して算術符号化することができる。このとき、コンテクストは、現在1タプル1911の現在周波数に対応する周辺1タプル1914の上位ビットの符号情報(負数、0、正数)を含んでもよい。また、周辺1タプル1914の上位ビットの符号情報は、0を除外した負数、正数で構成された符号情報を含んでもよい。それにより、LSB符号化部1908は、周辺1タプル1914の上位ビットの符号情報によって確率モデルを選択した後、下位ビット(LSB)を符号化することができる。
また、LSB符号化部1908は、周辺1タプル1914の上位ビットの符号情報及び下位ビットのビット深度によって決定されたコンテクストを利用し、下位ビットを符号化することができる。このとき、下位ビットのビット深度は、インデックス(レベル)情報で表現することができる。
コンテクスト・テンプレート符号化部1909は、現在1タプル1911の上位ビット(MSB)を符号化するときに使用する複数個のコンテクストのうち、最終伝送された1個のコンテクスト・テンプレートに対して符号化を行う。複数個のコンテクストは、MSBコンテクスト決定部1904で、MSBコンテクストを決定するために抽出される値を意味する。コンテクスト・テンプレートは、符号化する現在1タプル1911について、周辺1タプルの相対的な位置を表現するものであり、コンテクスト・テンプレートによって決定された位置で、MSBコンテクストとして使われる値が抽出される。コンテクスト・テンプレートは、ビット・パッキングによって伝送される方法もあり、算術符号化を行って伝送される方法もある。コンテクスト・テンプレート伝送は、フレーム別に1回伝送される。コンテクスト・テンプレート符号化部1909は、候補個数をいずれも表現することができるビットを割り当ててビット・パッキングを行う。それにより、MSBコンテクスト決定部1904は、コンテクスト・テンプレートによって、適切なMSBコンテクストを選択することができる。
コンテクスト・アップデート部1910は、次の1タプルを符号化するために量子化されたサンプルをアップデートすることができる。それにより、MSBコンテクスト決定部1904は、次の1タプルについてアップデートされた量子化されたサンプルを利用し、MSBコンテクストを決定することができる。
図20は、算術復号化装置101(第3例)の細部構成を図示した図である。図20の算術復号化装置101は、図19の算術符号化装置100と互いに対応し、それぞれの構成要素が遂行する動作方式も同一である。
算術復号化装置101は、コンテクスト・リセット部2001、コンテクスト・マッピング部2002、コンテクスト・テンプレート復号化部2003、1タプル・コンテクスト決定部2004、MSBコンテクスト決定部2005、確率マッピング部2006、脱出コード復号化部2007、MSB復号化部2008、LSB復号化部2009、量子化されたサンプル生成部2010及びコンテクスト・アップデート部2011を含んでもよい。
図20の算術復号化装置101は、図11の算術復号化装置101と比較したとき、1タプル・コンテクスト決定部2007の差が存在する。すなわち、図10の算術復号化装置101は、Nタプル・コンテクストを利用する動作を行うが、図20の算術復号化装置100は、1タプル・コンテクストを利用する動作を行うことができる。
コンテクスト・リセット部2001とコンテクスト・マッピング部2002は、フレーム単位によって動作しうる。現在フレームがリセット・フレームである場合、コンテクスト・リセット部2001は、コンテクスト・リセットを行う。復号化しようとする現在フレームがリセット・フレームではない場合、コンテクスト・マッピング部2002は、現在フレームの周波数スペクトル長が、以前フレームの周波数スペクトル長と異なる場合、以前フレームの長さを、現在フレームの長さに整列させることができる。また、コンテクスト・マッピング部2002は、以前フレームの復号化されたMSB値に対してさらにマッピングを行う。
コンテクスト・テンプレート復号化部2003は、現在1タプル2012の上位ビット(MSB)を復号化するときに使用する複数個のコンテクストのうち、最終伝送された1個のコンテクスト・テンプレートに対して復号化を行う。複数個のコンテクストは、MSBコンテクスト決定部2005で、MSBコンテクストを決定するために抽出される値を意味する。コンテクスト・テンプレートは、復号化する現在1タプル2012について、周辺1タプルの相対的な位置を表現するものであり、コンテクスト・テンプレートによって決定された位置で、MSBコンテクストとして使われる値が抽出される。コンテクスト・テンプレートは、ビット・パッキングによって伝送される方法もあり、算術復号化を行って伝送される方法もある。コンテクスト・テンプレート伝送は、フレーム別に1回伝送されてもよい。コンテクスト・テンプレート復号化部2003は、候補個数をいずれも表現することができるビットを割り当ててビット・パッキングを行う。それにより、MSBコンテクスト決定部2005は、コンテクスト・テンプレートによって、適切なMSBコンテクストを選択することができる。
1タプル・コンテクスト決定部2004は、復号化しようとする現在1タプル2012について、周辺に位置した周辺1タプル2013〜2019の量子化されたスペクトル値を利用し、現在1タプル2012に係わるコンテクストを決定することができる。一例として、1タプル・コンテクスト決定部2004は、すでに復号化された7個の周辺1タプル2013〜2019を利用し、現在1タプル2012に係わるコンテクストを決定することができる。
そして、1タプル・コンテクスト決定部2004は、現在1タプル2012について、7個の量子化されたスペクトルである周辺1タプル2013〜2019を利用し、64個の状態(state)でマッピングを行う。
また、1タプル・コンテクスト決定部2004は、7個の量子化されたスペクトルをさらに量子化することができる。具体的には、1タプル・コンテクスト決定部2004は、訓練(training)過程で、(0→0)、(−1または1→1)、(2または−2→2)、(3以上または−4以下→3)にそれぞれマッピングさせ、量子化されたスペクトルの情報を減らすことができる。その後、1タプル・コンテクスト決定部2004は、マッピングされた量子化スペクトルが発生可能なあらゆる場合の数を、上位ビットシンボルの発生確率が類似した場合同士まとめて1個のstateを構成することによって、複数個の状態(state)を生成することができる。
このように構成されたマッピング関係は、ハッシュテーブルを介して遂行される。このとき、1タプル・コンテクスト決定部2004は、現在1タプル2012の周辺に位置した7個の量子化されたスペクトルである周辺1タプル2013〜2019を、訓練(training)過程で構成されたハッシュテーブルに入力し、状態を決定することができる。また、さらなる量子化されたサンプルをハッシュテーブルの入力として使用し、状態(state)を決定することができる。
また、現在1タプル2012のコンテクストを決定するために、コアの復号化モード情報がさらに考慮されてもよい。1タプル・コンテクスト決定部2004は、コアの復号化モード情報が、FDモードであるかwLPTモードであるかを判断し、訓練(training)過程に反映することができる。1タプル・コンテクスト決定部2004は、すでに復号化された周辺1タプルとコア復号化モード情報とをハッシュテーブルに入力し、状態を決定することができる。
1タプル・コンテクスト決定部2004は、さらに現在量子化されたスペクトルである現在1タプル2012のスケーリングダウン回数を予測し、上位ビット情報及び下位ビット情報を抽出することができる。スケーリングダウン回数は、周辺1タプルを使用して予測を行う。このとき、1タプル・コンテクスト決定部2004は、7個の周辺1タプル2013〜2019のうち少なくとも一つを使用し、現在1タプル2012のスケーリングダウン回数を予測することができる。
例えば、現在フレームの以前周波数に対応する周辺1タプル2018または2019を使用して予測を行う場合、1タプル・コンテクスト決定部2004は、周辺1タプル2018または2019の値が、現在1タプル2012の上位ビットを表現するビット数で表現可能な領域に達するまで、1/2スケーリングダウンを行い、表現可能な領域に達するときのスケーリングダウン回数を決定することができる。このとき、上位ビットを、符号情報を含んだ3ビットと定義した場合、1タプル・コンテクスト決定部2004は、周辺1タプル2018または2019の値が−4〜3までの値を有するまで、1/2スケーリングダウンを遂行し、現在1タプル2012に係わるスケーリングダウン回数を予測することができる。予測したスケーリングダウン回数は、前述のlev0推定と同じ意味である。
そして、一実施形態で、1タプル・コンテクスト決定部2004は、現在1タプル2012について、現在フレームの以前周波数に対応する2個の周辺1タプル2018,2019を使用し、lev0推定を行う。複数の周辺1タプルを使用する場合、lev0推定の正確度が向上しうる。
他の一実施形態で、1タプル・コンテクスト決定部2004は、現在1タプル2012について、現在フレームの以前周波数に対応する1個以上の周辺1タプル2018または2019を使用し、lev0推定を行い、現在1タプル2012について、現在フレームの以前周波数に対応する1個以上の周辺1タプルの絶対値を比較することによって、スケーリングダウン回数を決定することができる。具体的には、1タプル・コンテクスト決定部2004は、現在1タプル2012について、現在フレームの以前周波数に対応する1個以上の周辺1タプルの値を絶対値に変更し、変更された絶対値に対して、1/2スケーリングダウンを遂行しつつ、スケーリングダウンされた値が特定臨界値に達する場合、スケーリングダウンを終え、最終的にスケーリングダウンされた値をlev0推定値に定めることができる。
例えば、上位ビット(MSB)を符号情報を含んだ3ビットと定義する場合、1タプル・コンテクスト決定部2004は、現在1タプル2012について、現在フレームの以前周波数に対応する2個の周辺1タプル2018,2019の絶対値を算出した後、2個の絶対値に対して、1/2スケーリングダウンを遂行しつつ、4以下の値に達する場合、スケーリングダウンを終え、最終的にスケーリングダウンされた値をlev0推定値として使用することができる。
また、一実施形態で、1タプル・コンテクスト決定部2004は、現在1タプル2012について、現在フレームの以前周波数に対応する1個の周辺1タプル2018または2個の周辺1タプル2018及び2019を選択的に使用し、lev0を推定することができる。
例えば、前述の方法は、コアのモードによってlev0を推定するものであり、1タプル・コンテクスト決定部2004は、FDモードである場合は、1個の周辺1タプルを使用し、wLPTモードである場合は、2個の周辺1タプルを使用し、lev0を推定することができる。
wLPTモードは、FDモードに比較し、相対的に周波数スペクトルが平坦である可能性が高いために、wLPTモードであるときは、現在1タプル2012について、周辺に位置した1個の周辺1タプルを使用するより、いくつかの周辺1タプルを使用する方がlev0を効果的に推定することができる。
また、1タプル・コンテクスト決定部2004は、FDモードで復号化を行うときに適用されるツールに基づいて、lev0推定に使われる周辺1タプルの個数を推定することができる。例えば、FDモードで復号化を行うときに適用されるツールは、TNS(temporal noise shaping)、TW−MDCT(time warped MDCT)などがある。このとき、FDモードでTW−MDCTツールを使用して復号化が行われた場合、1タプル・コンテクスト決定部2004は、2個の周辺1タプル2018,2019を利用し、lev0を推定することができる。
また、1タプル・コンテクスト決定部2004は、フレーム別に伝送された情報を基にして、1個の周辺1タプル2018を使用したり、あるいは2個の周辺1タプル2018,2019を使用する方式を決定し、lev0を推定することができる。例えば、1タプル・コンテクスト決定部2004は、算術復号化方式を適用し、フレーム別に伝送された周辺1タプルの個数によって、lev0を推定することができる。具体的には、1タプル・コンテクスト決定部2004は、算術復号化時に、FDモードあるいはwLPTモードによって、周辺1タプルの使用個数に係わる頻度数に基づいて確率モデルを生成し、生成された確率モデルをコンテクストとして適用して算術復号化を行う。
MSBコンテクスト決定部2005は、1タプル・コンテクスト決定部2004でマッピングされた全体状態(state)において、サブセットである特定状態である場合、追加コンテクストを生成することができる。このとき、生成された追加コンテクストは、MSB復号化部2008で、現在1タプル2012の上位ビットを復号化するときに、確率モデルを選択する過程で、全体状態(state)と結合されて使われる。そして、全体状態(state)において、特定状態を除外した残りの状態について、MSB復号化部2008は、全体状態(state)のみを利用し、確率モデルを選択することができる。
一例として、MSBコンテクスト決定部2005を介して生成されるMSBコンテクストは、次の通りである。コンテクスト・テンプレートについては、図22で具体的に説明する。
(1)現在フレームで、以前周波数に対応する量子化スペクトルである周辺1タプル2018または2019の上位ビット(MSB)値、または以前フレームで、現在周波数に対応する量子化スペクトルである周辺1タプル2015の上位ビット(MSB)値
(2)コンテクスト・テンプレートと結合された量子化されたスペクトルの上位ビット値
(3)現在フレームで、以前周波数に対応する量子化スペクトルである周辺1タプル2018または2019をさらに量子化して抽出された値、または以前フレームで、現在周波数に対応する量子化スペクトルである周辺1タプル2015をさらに量子化して抽出された値
(4)コンテクスト・テンプレートと結合された量子化されたスペクトルをさらに量子化して抽出された値
(5)以前フレームの量子化されたスペクトルである周辺1タプル2013〜2017をさらに量子化して抽出された値
(6)現在フレームで、以前周波数に対応する量子化スペクトルである周辺1タプル2018または2019を変更して抽出された値、または以前フレームで、現在周波数に対応する量子化スペクトルである周辺1タプル2015を変更して抽出された値
(7)コンテクスト・テンプレートと結合された量子化されたスペクトルを変更して抽出された値
MSBコンテクスト決定部2005は、量子化されたスペクトルをさらに量子化する方法は、次の通りである。
第一に、MSBコンテクスト決定部2005は、量子化されたスペクトルを、FDモード、wLPTモードによってさらに量子化することができる。
第二に、MSBコンテクスト決定部2005は、特定方式(−4〜3→−4〜3までの値を直接使用し、4以上である場合3にマッピングし、−5以下である場合−4にマッピングする)を、最初に量子化されたスペクトルのコンテクストとして決定するために、さらに量子化することができる。
MSB値を使用する場合、MSB復号化部2008は、現在フレームまたは以前フレームに対して無損失復号化された量子化されたスペクトルである周辺1タプル2013〜2019の上位ビット(MSB)値から選択し、現在1タプル2012を復号化することができる。
MSBコンテクスト決定部2005が量子化されたスペクトルを変更する方法は、次の通りである。
MSBコンテクスト決定部2005は、現在フレームに対して無損失復号化する現在周波数スペクトルである現在1タプル2012のlev0推定値を基準に、周辺1タプル2013〜2019をlev0ほどスケーリングダウンして量子化された周波数スペクトル値を抽出することができる。
MSBコンテクスト決定部2005は、スケーリングダウン遂行後に抽出した量子化された周波数スペクトル値を使用するか、あるいは量子化された周波数スペクトル値が現在1タプル2012の上位ビットを表現するビット数で表現することができる領域を外れた場合、量子化された周波数スペクトル値を最小値または最大値にセッティングして使用することができる。
脱出コード復号化部2007は、前記推定されたlev0回数ほど無損失復号化する現在1タプル2012に対して、1/2スケーリングダウンを遂行して変更された値が、現在Nタプル2012の上位ビットを定義するビット数で表現することができる値を超える場合、脱出コード復号化を行う。
脱出コードを復号化する方式は、(1)脱出コードであるか否かに係わる情報を復号化する方式と、(2)脱出コードを上位ビットシンボルに含めて復号化する方式と、を含む。具体的には、(1)脱出コードであるか否かに係わる情報を復号化する方式は、脱出コードに1を割り当て、脱出コードではない場合に0を割り当て、0または1を復号化することを意味する。もし脱出コードではない0が復号化されれば、MSB復号化部2008は、現在1タプル2012の上位ビットを復号化することができる。そして、(2)脱出コードを上位ビットシンボルに含めて復号化する方式は、上位ビットシンボルの個数が8種である場合、8種の上位ビットシンボルと脱出コードとを同一レベルのシンボルで表現し、総9個のうち1個を復号化する方式を意味する。例えば、脱出コード復号化部2007は、0〜7はMSBシンボル、9は脱出コードとして設定し、9個のシンボルを復号化することができる。
脱出コード復号化部2007は、予測された1/2スケーリングダウン回数ほど、現在復号化する量子化されたスペクトルである現在1タプル2012をスケーリングダウンしたとき、現在1タプル2012の値が−4〜3間にあれば、脱出コードを復号化しない。
もし現在1タプル2012をスケーリングダウンしたとき、現在1タプル2012の値が−4〜3の範囲に属さない場合、脱出コード復号化部2007は、現在1タプル2012の値が−4〜3範囲に属するように、現在1タプル2012に対してさらにスケーリングダウンを行い、スケーリングダウン回数ほど脱出コードを復号化することができる。このとき、スケーリングダウン過程で損失されたデータは、下位ビットに含まれ、LSB復号化部2009で復号化される。
確率マッピング部2006は、現在1タプル2012に係わるコンテクストと、MSBコンテクストとを利用し、最終的な確率モデルをマッピングすることができる。確率マッピング部2006は、マッピング・テーブルと確率テーブルとを利用することができる。確率モデルをマッピングする過程は、MSBを復号化するときに適用する確率モデルを確率テーブルから求める過程である。すなわち、確率モデルをあらゆる場合について全部有していれば、メモリの大きさに対する負担があるために、メモリを減らす目的で、確率マッピング部2006は、コンテクストによって確率モデルを探すように、マッピング・テーブルを使用することができる。マッピング・テーブルは、各確率のコンテクストに該当する総配列に、確率テーブルのインデックスを割り当てて構成することができる。確率テーブルは、MSB復号化時に使われるあらゆる確率値で構成される。
MSB復号化部2008は、(i)1タプル・コンテクスト決定部2004で生成された全体状態(state)だけを利用し、現在1タプル2012のMSBを復号化したり、あるいは(ii)1タプル・コンテクスト決定部2004で生成された全体状態(state)において、特定状態のサブセットと、MSBコンテクスト決定部2005で決定された追加コンテクストとを利用し、確率モデルを選択することによって、現在1タプル2012の上位ビット(MSB)を算術復号化することができる。
LSB復号化部2009は、現在1タプル2012の下位ビット(LSB)のビット深度ほどの残余ビットを、コンテクストを利用して算術復号化することができる。このとき、コンテクストは、現在1タプル2012の現在周波数に対応する周辺1タプル2015の上位ビットの復号情報(負数、0、正数)を含んでもよい。また、周辺1タプル2015の上位ビットの符号情報は、0を除外した負数、正数で構成された符号情報を含んでもよい。それにより、LSB復号化部2008は、周辺1タプル2015の上位ビットの復号情報によって確率モデルを選択した後、下位ビット(LSB)を復号化することができる。
また、LSB復号化部2009は、周辺1タプル(2014)の上位ビットの符号情報及び下位ビットのビット深度によって決定されたコンテクストを利用し、下位ビットを復号化することができる。このとき、下位ビットのビット深度は、インデックス(レベル)情報で表現することができる。
量子化されたサンプル生成部2010は、算術復号化されたMSBとLSBとを利用し、現在Nタプル2012に係わる量子化されたサンプルを生成することができる。
コンテクスト・アップデート部2011は、次の1タプルを復号化するために、量子化されたサンプルをアップデートすることができる。それにより、MSBコンテクスト決定部2005は、次の1タプルについてアップデートされた量子化されたサンプルを利用し、MSBコンテクストを決定することができる。
図21は、1タプル、MSB、LSBを図示した図である。図21の上段に、時間(time)と周波数(frequency)とによる1タプルが図示されている。ここで、1タプルは、量子化された周波数スペクトルを、周波数が増加する順に連続した1個の周波数スペクトル単位でまとめた集合を意味する。図4では、Nタプルを中心に説明したが、図21では、1タプルについて説明する。7個の周辺1タプル2102〜2108は、すでに符号化及び復号化されたものであり、現在1タプル2101に係わるコンテクストを決定するときに利用される。このとき、周辺1タプル2102〜2106は、以前フレームに対応し、周辺1タプル2107,2018は、現在1タプル2101と同じ現在フレームに対応しうる。
図21の下段に、周波数インデックス(frequency index)とビット深度とによる上位ビット(MSB)2109と下位ビット(LSB)2110とが図示されている。このとき、MSB 2109は、符号情報を含む上位ビットを意味する。本発明の一実施形態では、MSB 2109を、符号情報を含む有効な3ビットと定義した。MSBに係わる定義は、システムの構成によって変更されてもよい。
図21を参照すれば、LSB 2110は、MSB 2109よりビット深度がさらに大きいビットを意味する。このとき、LSB 2110は、lev値を有することができる。levは、コンテクストのMSB組み合わせによって決定される値であり、ビット深度が0であるというのは、MSB 2109のすぐ下に位置したLSB 2110を意味する。1タプルは、MSB 2109に対応し、周波数インデックスによって、シンボルとして区分される。一例として、図21では、1タプルが1個のシンボルから構成されるということが分かる。その後、現在1タプル2101は、1個のシンボルを周波数によって分離して符号化されたり、あるいは復号化される。言い換えれば、MSB 2109は、シンボル単位で復号化されたり、あるいは符号化される。このとき、タプルは、シンボルに対応すると定義することができる。図21では、1タプルに含まれたシンボルを1個で表現したが、装置によってシンボルの個数を変更することができる。
図22は、コンテクスト・テンプレートの一例を図示した図である。
図19で、MSBコンテクスト決定部1904は、コンテクスト・テンプレートを利用し、MSBコンテクストを決定する例について説明した。コンテクスト・テンプレートは、図22のように構成されてもよい。
現在1タプル2201,2205,2209は、現在符号化するタプルを意味する。そして、周辺1タプル2202,2207,2212は、コンテクスト・テンプレートによってMSBコンテクストとして使われるタプルを意味する。コンテクスト・テンプレートについての情報は、算術符号化を介して符号化端からフレームに1回ずつ伝送され、発生頻度に基づいて、確率モデルを決定する。また、コンテクスト・テンプレートは、低周波帯域と高周波帯域とによって異なるように決定されもする。
図23は、無損失符号化復号化の過程を図示した図である。
無損失符号化復号化は、量子化されたデータを損失なしに、符号化装置から復号化装置に伝達するためのコーディング方法を意味する。具体的には、無損失符号化復号化は、bit plane codingを使用して量子化されたデータを伝達することができる。このとき、bit plane codingは、量子化されたデータをバイナリで表現した後、ビット単位またはいくつのビットで表現された値を伝送する方式である。例えば、量子化されたスペクトルが(3,7,1,0)である場合、bit plane codingによれば、量子化されたスペクトルがバイナリで表現された(11,1001,1,0)のシーケンスが伝送される。復号化装置で、伝えられたシーケンスを介して本来の量子化されたデータを復元するためには、シーケンスを構成するそれぞれの値が、2ビット、4ビット、1ビット、1ビットで表現されたという表現情報がさらに要求される。
このような表現ビットがビット深度に該当する情報であり、この値をそのまま復号化装置に伝達する場合、情報量が増加する。このような情報量の増加を避けるために、符号化装置は、伝達しようとする量子化されたスペクトルの周辺に位置した値を基準に、量子化されたスペクトルのビット深度を予測し、予測したビット深度までの値を復号化装置に伝送する。もし予測したビット深度が、さらに多くのビット深度のデータで表現される場合、符号化装置は、残余ビットの個数と残余ビットとを復号化装置に伝送する。
図23から分かるように、(11,1001,1,0)をコーディングする場合、符号情報を含む3ビットを伝送し、ビット深度を予測した後、残余ビットを伝送する無損失符号化復号化を利用すると仮定する。
伝送時にあらゆるデータは、コンテクスト基盤によって、算術復号化方式で遂行される。このとき、4タプルである場合、4本のspectral line単位で構成され、1タプルである場合、1本のspectral lineで構成される。以下では、4タプルである場合について説明する。
残余ビット深度が1であると予測された場合、復号化装置は、ビット深度であるlevel情報を予測することができる。そして、復号化装置は、(1,2,0,0)の上位ビット(MSB:符号情報を含む3ビット)を復号化する(MSB復号化)。その後、復号化装置は、さらなる残余ビット(0ビット、1ビット、0ビット、0ビット)を復号化することができる。このようなさらなる残余ビットが、脱出コード回数に対応する。それにより、復号化装置は、復号化された残余ビット個数によって、下位ビット(LSB)の残余ビットを復号化する(LSB復号化)。
図24は、1タプルに係わるコンテクスト基盤の算術復号化方法を図示したフローチャートである。
算術復号化装置101は、現在フレームがリセット・フレームであるか否かを判断する(S2401)。もしリセット・フレームである場合、算術復号化装置101は、コンテクスト・リセットを行う(S2402)。そして、フレームリセットではない場合、算術復号化装置101は、コンテクストをマッピングする(S2403)。具体的には、算術復号化装置101は、現在フレームの長さが、以前フレームと異なる場合に、2フレーム間の周波数インデックスをマッピングさせるために、以前フレームの長さを現在フレームの長さに正規化し、コンテクストをマッピングすることができる。
段階(S2401)ないし段階(S2403)は、フレーム単位によって遂行される。
算術復号化装置101は、現在1タプルの上位ビット(MSB)を復号化するときに使用する複数個のコンテクストのうち、最終伝送された1個のコンテクスト・テンプレートに対して復号化を行う(S2404)。コンテクスト・テンプレートについては、図22の説明を参考にする。その後、算術復号化装置101は、現在1タプルに対して1タプル・コンテクストを決定し、現在1タプルに対してlev0を決定する(S2405)。このとき、算術復号化装置101は、初期LSBビット深度であるlev0を推定することができる。現在1タプルに対して1タプル・コンテクストを決定する動作と、lev0を推定する動作とについては、図20の説明を参考にする。
算術復号化装置101は、1タプルのコンテクスト(pki)とFD/wLPTとに基づいて、脱出コードに対して復号化する(S2406)。脱出コードが復号化されるたびに、lev0がアップデートされ、脱出コードではないものが復号化されれば、MSB復号化を行う(S2409)。
そして、算術復号化装置101は、現在復号化する現在1タプルの上位ビットに対応するMSBコンテクストを決定する(S2407)。その後、算術復号化装置101は、MSB復号化を行う確率モデルを決定するが、1タプル・コンテクスト及びMSBコンテクストを基に、符合する確率モデルを決定する(S2408)。
算術復号化装置101は、確率モデルを基に、MSB復号化を行う(S2409)。
算術復号化装置101は、脱出コードを復号化する過程を介して導き出されたLSBのビット深度ほどのビットを復号化する(S2410)。算術復号化装置101は、MSBとLSBとを介して量子化されたサンプルを生成し(S2411)、次の1タプルを復号化するために、コンテクストをアップデートする(S2412)。それにより、算術復号化装置101は、周波数インデックスを増加させ(S2413)、次の1タプルに対して復号化を行う。
このとき、2タプルは、Nタプルに係わる一例を示し、2タプル401,402,403,404,405は、2つの周波数スペクトルからなる2タプルを示す。現在2タプル404は、符号化したり符号化しようとする2タプルを意味する。そして、4個の周辺2タプル401,402,403,405は、すでに符号化及び符号化されたものであり、現在2タプル404に係わるコンテクストを決定するときに利用される。このとき、周辺2タプル401,403,405は、以前フレームに対応し、周辺2タプル402は、現在2タプル404と同じ現在フレームに対応しうる。
図25は、2タプルに係わるコンテクスト・テンプレートを図示した図である。
現在2タプル2501は、現在符号化するタプルを意味する。そして、周辺2タプル2502,2503は、コンテクスト・テンプレートによってMSBコンテクストとして使われるタプルを意味する。コンテクスト・テンプレートについての情報は、算術符号化を介して符号化端からフレームに1回ずつ伝送され、発生頻度に基づいて、確率モデルを決定する。また、コンテクスト・テンプレートは、低周波帯域と高周波帯域とによって異なるように決定される。
図26は、算術符号化装置100(第4例)の細部構成を図示した図である。
算術符号化装置100は、コンテクスト・リセット部2601、コンテクスト・マッピング部2602、2タプル・コンテクスト決定部2603、追加コンテクスト決定部2604、脱出コード符号化部2605、確率マッピング部2606、MSB符号化部2607、LSB符号化部2608、コンテクスト・テンプレート符号化部2609及びコンテクスト・アップデート部2610を含んでもよい。
コンテクスト・リセット部2601とコンテクスト・マッピング部2602は、それぞれコンテクスト・リセット部1901及びコンテクスト・マッピング部1902と同じ動作を行うので、具体的な説明は省略する。
2タプル・コンテクスト決定部2603は、符号化しようとする現在2タプル2611について、周辺に位置した周辺2タプル2612〜2615の量子化されたスペクトル値を利用し、現在2タプル2611に係わるコンテクストを決定することができる。一例として、2タプル・コンテクスト決定部2603は、すでに符号化された4個の周辺2タプル2612〜2615を利用し、現在2タプル2611に係わるコンテクストを決定することができる。
算術符号化装置100は、入力された信号に対して、上位ビットシンボル(MSB symbol)と下位残余ビットとに分離して符号化を行う。具体的には、算術符号化装置100は、量子化された周波数スペクトルに対応する現在2タプル2611を、絶対値と符号情報とに分離して符号化を行う。このとき、現在2タプル2611の絶対値は、上位ビットシンボルと下位残余ビットとに分離されて符号化が行われる。上位ビットシンボルは、絶対値が特定臨界値より小さい値になるまで、1/2スケーリングダウンを遂行する。それにより、脱出コード符号化部2605は、1/2スケーリングダウン回数ほど脱出コード符号化を行う。
下位残余ビットは、上位ビットシンボルの絶対値に対し、1/2スケーリングダウンが行われるたびに除去されるビットを意味する。現在2タプル2611の上位ビット(MSB)符号化が終了した後、下位残余ビットに対して符号化が行われる。現在フレームに対して、あらゆる量子化されたスペクトルに対応する2タプルの符号化が終了すれば、0ではない量子化されたスペクトルに対して、符号情報を符号化することができる。
前記上位ビットシンボルに対して、スケーリングダウンが行われるとき、特定臨界値は、4が設定される。特定臨界値が4である場合、上位ビットは、0,1,2,3の4種の場合となる。算術符号化装置100は、2タプルである2個の周波数スペクトルをまとめて処理するために、現在2タプル2611に対応する2個の量子化された周波数スペクトルの絶対値が、いずれも特定臨界値より小さくなるまで、スケーリングダウンを行う。
算術符号化装置100は、現在2タプル2611に対して、4個の周辺2タプル2612〜2615を使用してコンテクスト基盤の算術符号化を行う。具体的には、2タプル・コンテクスト決定部2603は、以前フレームに対応する3個の周辺2タプル2612〜2614に係わる量子化されたスペクトルをさらに量子化し、3個の周辺2タプル2612〜2614のうち2個の量子化されたスペクトルを2ビットで表現(2タプルが3*2*2=12ビット)することができる。そして、2タプル・コンテクスト決定部2603は、現在フレームの以前周波数に対応する1個の周辺2タプル2615に対応する2個の量子化された周波数スペクトルを利用し、コンテクストを生成することができる。このようなコンテクストは、ハッシュテーブルによって具現される。
脱出コード符号化部2605は、生成された2タプル・コンテクストを利用し、脱出コード符号化を行う。具体的には、脱出コード符号化部2605は、特定M個の確率モデルを訓練(training)を介して構成し、2タプル・コンテクストに基づいて、M個の確率モデルのうちいずれか1つの確率モデルを選択して算術符号化を行う。
脱出コード符号化が必要ない場合、脱出コードではないことを符号化した後、MSB符号化部2607は、現在2タプル2611の上位ビットシンボルに対して符号化を行う。
2タプル・コンテクストに基づいて、現在2タプルに対して符号化を行う。
一例として、MSB符号化部2607は、現在2タプル2611の上位ビットシンボルに対して、2タプル・コンテクスト決定部2603によって生成された2タプル・コンテクストに基づいて、符号化を行うことができる。このとき、MSB符号化部2607は、2タプル・コンテクストに基づいて、現在2タプル2611の2個の上位ビットシンボルをまとめて符号化することができる。例えば、MSB符号化部2607は、0〜3の値を有する上位ビットシンボル2個を、1個のシンボルとして表現して符号化することができる。この場合、総16種のシンボルを介して、1個の現在2タプル2611に対して1回の算術符号化を行う。
一部の場合、2タプル・コンテクストに基づいて、残りの一部の場合、2タプル・コンテクスト及び追加コンテクストに基づいて、現在2タプルに対して符号化を行う。
他の一例として、MSB符号化部2607は、一部の場合について、2タプル・コンテクストに基づいて、現在2タプル2611の上位ビットシンボルに対して算術符号化を行う。
そして、MSB符号化部2607は、残りの一部場合について、2タプル・コンテクスト及び追加コンテクストに基づいて、現在2タプル2611の上位ビットシンボルに対して算術符号化を行う。このとき、追加コンテクストは、現在2タプル2611について、現在フレームの以前周波数に対応する周辺2タプル2615の上位ビットシンボルを意味する。
この場合、MSB符号化部2607は、現在2タプル2611を2個の上位ビットシンボルで表現し、2回の算術符号化を行う。2回の算術符号化が行われる場合、追加コンテクストとして使われる上位ビットシンボルは、図26の周辺2タプル2602または2603であってもよい。すなわち、MSB符号化部2607は、現在2タプル2611を基準に、コンテクスト・テンプレート情報に基づいて、周辺2タプル2602または2603を追加コンテクストとして決定することができる。
あらゆる場合、2タプル・コンテクスト及び追加コンテクストに基づいて、現在2タプルに対して符号化を行う。
また他の実施形態で、MSB符号化部2607は、あらゆる場合について、2タプル・コンテクスト及び追加コンテクストに基づいて、現在2タプル2611の上位ビットシンボルに対して算術符号化を行う。2タプル・コンテクスト及び追加コンテクストについての説明はすでに行ったので、以下では省略する。
コンテクスト・テンプレート符号化部2609は、コンテクスト・テンプレートを符号化することができる。コンテクスト・テンプレート情報は、入力された信号を符号化するときに伝送されるものである。コンテクスト・テンプレートは、算術符号化を介して符号化されて伝送され、フレームごとに1回ずつ伝送されてもよい。このとき、フレームは、周波数ドメイン符号化モードの場合、1個のフレームを意味し、線形予測ドメイン(linear prediction domain)符号化モードの場合、スーパーフレーム内にTCXで符号化されたフレームを意味する。
コンテクスト・テンプレート情報は、低周波領域と高周波領域とに分離してそれぞれ伝送される。例えば、コンテクスト・テンプレート情報は、次の通り、周波数領域によって異なるように割り当てられる。コンテクスト・テンプレート情報は、2個のビットを介して低周波領域及び高周波領域で表現されもする。このとき、0,1,2,3の4種場合で表現されもする。コンテクスト・テンプレート情報が0である場合、低周波領域及び高周波領域いずれもコンテクスト・テンプレート0であり、コンテクスト・テンプレート情報が1である場合、低周波領域は、コンテクスト・テンプレート1であり、高周波領域は、コンテクスト・テンプレートが0である。また、コンテクスト・テンプレート情報が2である場合、低周波領域は、コンテクスト・テンプレートが0であり、高周波領域は、コンテクスト・テンプレートが1である。そして、コンテクスト・テンプレート情報が3である場合、低周波領域及び高周波領域いずれもコンテクスト・テンプレート1である。
他の一例として、現在2タプル2611後、スペクトルの絶対値が0または1である場合、MSB符号化部2607は、バイナリ算術符号化を行い、現在2タプル2611の上位ビットシンボルを符号化することができる。具体的には、現在2タプル2611後のあらゆる周波数の量子化されたスペクトルの絶対値が0または1である場合、MSB符号化部2607は、例外処理を行い、現在2タプル2611の上位ビットを符号化することができる。例えば、2タプルのシンボルがいずれも0である場合、脱出コードを符号化する可能性がないために、このような方式を適用して例外処理を行う。すなわち、MSB符号化部2607が現在符号化する現在2タプル2611を0に符号化する前に、脱出コード符号化部2605は、脱出コードを符号化することができる。
一例として、上位ビットシンボルに対して符号化が行われた後、LSB符号化部2608は、uniformな確率に基づいて、現在2タプル2611の下位残余ビットを符号化することができる。LSB符号化部2608は、脱出コードの符号化回数ほど、現在2タプル2611の下位残余ビットをビット深度単位で2ビットずつ抽出して符号化を行う。
総4種のシンボルが存在し、LSB符号化部2608は、これに対して算術符号化を行う。
他の一例として、LSB符号化部2608は、ビット深度を利用し、現在2タプル2611について、コンテクスト基盤の下位ビットを符号化することができる。具体的には、LSB符号化部2608は、現在2タプル2611の下位残余ビットを、周波数インデックスを基準に2個に分離し、ビット深度単位で、1ビットずつビット深度情報をコンテクストとして使用して算術符号化を行う。
他の一例として、LSB符号化部2608は、現在まで符号化された絶対値が0であるか、または0ではないかを考慮し、現在2タプル2611の下位残余ビットを符号化することができる。具体的には、LSB符号化部2608は、符号化する現在2タプル2611の下位残余ビットを、周波数インデックス基準に2個に分離し、それぞれの符号化中である絶対値が0であるか、または0ではないかについての情報に係わるコンテクストを利用し、算術符号化を行う。
例えば、絶対値3を符号化するとき、下位残余ビットを符号化する前に、上位ビットが0に符号化された状態で、下位残余ビットの11(バイナリ)を2回符号化しなければならない場合を仮定する。
最初の下位残余ビットである1を符号化するときに、現在まで符号化した絶対値が上位ビット符号化時に決定された0であるから、LSB符号化部2608は、0である場合の確率モデルを適用し、最初の下位残余ビットを符号化することができる。そして、2番目の下位残余ビットである1を符号化するとき、現在まで符号化した絶対値が最初の下位残余ビットを含んで1であるから、LSB符号化部2608は、0ではない場合の確率モデルを適用し、2番目のビットを符号化することができる。
他の一例として、LSB符号化部2608は、現在まで符号化された絶対値が0であるか、または0ではないかを考慮し、現在2タプル2611の下位残余ビットを符号化することができる。具体的には、LSB符号化部2608は、符号化する現在2タプル2611の下位残余ビットを、ビット深度単位で2ビットずつ抽出し、符号化中である絶対値が0であるか、または0ではないかについての情報に係わるコンテクストを利用し、算術符号化を行う。符号化する下位残余ビットシンボルは、00(2)、01(2)、10(2)、11(2)の4種になり、コンテクストとして使用する値は、0であるか否かの2種の場合を、現在2タプルの組み合わせについて見るために、2タプルの2個の絶対値がいずれも0である場合、低い周波数の値が0であり、高い周波数の値が0ではない場合、低い周波数の値が0であり、高い周波数の値が0ではない場合、いずれも0ではない場合の4種場合が存在する。ところで、いずれも0である場合には、残余ビットを符号化する必要がないために、この場合は除き、3種の場合をコンテクストとして使用して算術符号化を行う。
さらに他の一例として、LSB符号化部2608は、符号情報を符号化することができる。具体的には、LSB符号化部2608は、量子化されたスペクトルの絶対値の符号化がいずれも終わった後、絶対値が0ではない場合、ビットパックキング方式を適用し、それぞれの量子化されたスペクトルの符号情報を伝送することができる。
図26で説明されていない構成要素については、図10の説明を参考にする。
図27は、算術復号化装置(第4例)の細部構成を図示した図である。
算術復号化装置101は、コンテクスト・リセット部2701、コンテクスト・マッピング部2702、コンテクスト・テンプレート復号化部2703、2タプル・コンテクスト決定部2704、追加コンテクスト決定部2705、確率マッピング部2706、脱出コード復号化部2707、MSB復号化部2708、LSB復号化部2709、量子化されたサンプル生成部2710及びコンテクスト・アップデート部2711を含んでもよい。
コンテクスト・リセット部2701とコンテクスト・マッピング部2702は、それぞれコンテクスト・リセット部2001及びコンテクスト・マッピング部2002と同じ動作を行うので、具体的な説明は省略する。
2タプル・コンテクスト決定部2704は、復号化しようとする現在2タプル2712について、周辺に位置した周辺2タプル2713〜2716の量子化されたスペクトル値を利用し、現在2タプル2712に係わるコンテクストを決定することができる。一例として、2タプル・コンテクスト決定部2704は、すでに復号化された4個の周辺2タプル2713〜2716を利用し、現在2タプル2712に係わるコンテクストを決定することができる。
算術復号化装置101は、入力された信号に対して、上位ビットシンボル(MSB symbol)と下位残余ビットとに分離して復号化を行う。具体的には、算術復号化装置101は、量子化された周波数スペクトルに対応する現在2タプル2712を、絶対値と符号情報とに分離して復号化を行う。このとき、現在2タプル2712の絶対値は、上位ビットシンボルと下位残余ビットとに分離されて復号化が行われる。上位ビットシンボルは、絶対値が特定臨界値より小さい値になるまで、1/2スケーリングダウンを遂行される。それにより、脱出コード復号化部2707は、1/2スケーリングダウン回数ほど脱出コード復号化を行う。
下位残余ビットは、上位ビットシンボルの絶対値に対して、1/2スケーリングダウンが行われるたびに除去されるビットを意味する。現在2タプル2712の上位ビット(MSB)復号化が終了した後、下位残余ビットに対して復号化が行われる。現在フレームに対して、あらゆる量子化されたスペクトルに対応する2タプルの復号化が終了すれば、0ではない量子化されたスペクトルに対して符号情報が復号化される。
前記上位ビットシンボルに対してスケーリングダウンが行われるとき、特定臨界値は、4が設定されてもよい。特定臨界値が4である場合、上位ビットは、0,1,2,3の4種の場合になる。算術復号化装置101は、2タプルである2個の周波数スペクトルをまとめて処理するために、現在2タプル2712に対応する2個の量子化された周波数スペクトルの絶対値がいずれも特定臨界値より小さくなるまで、スケーリングダウンを行う。
算術復号化装置101は、現在2タプル2712に対して、4個の周辺2タプル2713〜2716を使用し、コンテクスト基盤の算術復号化を行う。具体的には、2タプル・コンテクスト決定部2704は、以前フレームに対応する3個の周辺2タプル2713〜2715に係わる量子化されたスペクトルをさらに量子化し、3個の周辺2タプル2713〜2715内の2個の量子化されたスペクトルを2ビットで表現(2タプル:3*2*2=12ビット)することができる。そして、2タプル・コンテクスト決定部2704は、現在フレームの以前周波数に対応する1個の周辺2タプル2716に対応する2個の量子化された周波数スペクトルを利用し、コンテクストを生成することができる。このようなコンテクストは、ハッシュテーブルによって具現されてもよい。
脱出コード復号化部2707は、生成された2タプル・コンテクストを利用し、脱出コード復号化を行う。具体的には、脱出コード復号化部2707は、特定M個の確率モデルを、訓練(training)を介して構成し、2タプル・コンテクストに基づいて、M個の確率モデルのうちいずれか1つの確率モデルを選択して算術復号化を行う。
脱出コードではない値が復号化されれば、MSB復号化部2708は、現在2タプル2712の上位ビットシンボルに対して復号化を行う。
2タプル・コンテクストに基づいて、現在2タプルに対して復号化を行う。
一例として、MSB復号化部2708は、現在2タプル2712の上位ビットシンボルに対して、2タプル・コンテクスト決定部2704によって生成された2タプル・コンテクストに基づいて、復号化することができる。このとき、MSB復号化部2708は、2タプル・コンテクストに基づいて、現在2タプル2712の2個の上位ビットシンボルをまとめて復号化することができる。例えば、MSB復号化部2708は、0〜3の値を有する上位ビットシンボル2個を1個のシンボルとして表現して復号化することができる。この場合、総16種のシンボルを介して、1個の現在2タプル2712に対して、1回の算術復号化を行う。
一部の場合、2タプル・コンテクストに基づいて、残り一部の場合、2タプル・コンテクスト及び追加コンテクストに基づいて、現在2タプルに対して復号化を行う。
他の一例として、MSB復号化部2708は、一部の場合について、2タプル・コンテクストに基づいて、現在2タプル2712の上位ビットシンボルに対して、算術復号化を行う。そして、MSB復号化部2708は、残り一部の場合について、2タプル・コンテクスト及び追加コンテクストに基づいて、現在2タプル2712の上位ビットシンボルに対して算術復号化を行う。このとき、追加コンテクストは、現在2タプル2712について、現在フレームの以前周波数に対応する周辺2タプル2716の上位ビットシンボルを意味する。
この場合、MSB復号化部2708は、現在2タプル2712を、2個の上位ビットシンボルで表現して2回の算術復号化を行う。2回の算術復号化が行われる場合、追加コンテクストとして使われる上位ビットシンボルは、図26の周辺2タプル(2602または2603)であってもよい。すなわち、MSB復号化部2708は、現在2タプル2712を基準に、コンテクスト・テンプレート情報に基づいて、周辺2タプル2602または2603を追加コンテクストとして決定することができる。
この場合IIは、次のような構文で表現される。「i」は現在復号化しようとする周波数インデックスを意味する。a0,b0は、以前周波数インデックスの2タプルの上位ビットシンボルに該当し、a,bは、現在復号化する上位ビットシンボルに該当する。
Figure 2012531086
III.あらゆる場合、2タプル・コンテクスト及び追加コンテクストに基づいて、現在2タプルに対して復号化を行う。
他の実施形態で、MSB復号化部2708は、あらゆる場合について、2タプル・コンテクスト及び追加コンテクストに基づいて、現在2タプル2712の上位ビットシンボルに対して算術復号化を行う。2タプル・コンテクスト及び追加コンテクストについての説明は、すでに行っているので、以下では省略する。
この場合IIIは、次のような構文で表現される。「i」は現在復号化しようとする周波数インデックスを意味する。a0,b0は、以前周波数インデックスの2タプルの上位ビットシンボルに該当し、a,bは、現在復号化する上位ビットシンボルに該当する。「pki」は、2タプル・コンテクストを意味し、「ctxt」は、現在復号化する上位ビットシンボルのコンテクスト・テンプレートを意味する。「pki」基盤で「esc」シンボルを復号化し、復号化されたシンボルが脱出コードではなければ、上位ビットシンボルの復号化を行う。このとき、「ctxt」情報を基に、追加コンテクストを使用してaとbとの復号化を行う。
Figure 2012531086
コンテクスト・テンプレート復号化部2703は、コンテクスト・テンプレートを復号化することができる。コンテクスト・テンプレート情報は、入力された信号を復号化するときに伝送されるものである。コンテクスト・テンプレートは、算術復号化を介して復号化されて伝送され、フレームごとに1回ずつ伝送される。このとき、フレームは、周波数ドメイン復号化モードである場合、1個のフレームを意味し、線形予測ドメイン復号化モードである場合、スーパーフレーム内にTCXで復号化されたフレームを意味する。
コンテクスト・テンプレート情報は、低周波領域と高周波領域とに分離してそれぞれ伝送される。例えば、コンテクスト・テンプレート情報は、次の通り周波数領域によって異なるように割り当てられる。コンテクスト・テンプレート情報は、2個のビットを介して、低周波領域及び高周波領域で表現される。このとき、0,1,2,3の4種の場合で表現される。コンテクスト・テンプレート情報が0である場合、低周波領域及び高周波領域いずれもコンテクスト・テンプレート0であり、コンテクスト・テンプレート情報が1である場合、低周波領域は、コンテクスト・テンプレート1であり、高周波領域は、コンテクスト・テンプレートが0である。また、コンテクスト・テンプレート情報が2である場合、低周波領域は、コンテクスト・テンプレートが0であり、高周波領域は、コンテクスト・テンプレートが1である。コンテクスト・テンプレート情報が3である場合、低周波領域及び高周波領域いずれもコンテクスト・テンプレート1である。
一例として、上位ビットシンボルに対して復号化が行われた後、LSB復号化部2709は、uniformな確率に基づいて、現在2タプル2712の下位残余ビットを復号化することができる。LSB復号化部2709は、脱出コードの復号化回数ほど、現在2タプル2712の下位残余ビットを、ビット深度単位で2ビットずつ抽出して復号化を行う。
総4種のシンボルが存在し、LSB復号化部2709は、これに対して算術復号化を行う。
他の一例として、LSB復号化部2709は、ビット深度を利用し、現在2タプル2712に対して、コンテクスト基盤の下位ビットを復号化することができる。具体的には、LSB復号化部2709は、現在2タプル2712の下位残余ビットを、周波数インデックスを基準に2個に分離し、ビット深度単位で1ビットずつビット深度情報を、コンテクストとして使用して算術復号化を行う。
他の一例として、LSB復号化部2709は、現在まで復号化された絶対値が0であるか、または0ではないかを考慮し、現在2タプル2712の下位残余ビットを復号化することができる。具体的には、LSB復号化部2709は、復号化する現在2タプル2712の下位残余ビットを、周波数インデックス基準に2個に分離し、それぞれの復号化中である絶対値が0であるか、または0ではないかについての情報に係わるコンテクストを利用し、算術復号化を行う。
例えば、絶対値3を復号化するとき、下位残余ビットを復号化する前に、上位ビットが0に復号化された状態であり、下位残余ビットである11(バイナリ)を2回復号化しなければならない場合を仮定する。
最初の下位残余ビットである1を復号化するとき、現在まで復号化した絶対値が上位ビット復号化時に決定された0であるから、LSB復号化部2708は、0である場合の確率モデルを適用し、最初の下位残余ビットを復号化することができる。そして、2番目の下位残余ビットである1を復号化するとき、現在まで復号化した絶対値が、最初の下位残余ビットを含んで1であるから、LSB復号化部2709は、0ではない場合の確率モデルを適用し、2番目のビットを復号化することができる。
他の一例として、LSB復号化部2709は、現在まで復号化された絶対値が0であるか、または0ではないかを考慮し、現在2タプル2712の下位残余ビットを復号化することができる。具体的には、LSB復号化部2709は、復号化中である現在2タプル2712の下位残余ビットを、ビット深度単位で2個のビットずつ復号化することができる。このとき、復号化中である絶対値が0であるか、または0ではないかについての情報に係わるコンテクストを利用し、算術復号化を行う。復号化する下位残余ビットシンボルは、00(2)、01(2)、10(2)、11(2)の4種になり、コンテクストとして使用する値は、0であるか否かの2種の場合を、現在2タプルの組み合わせについて見るために、2タプルの2個の絶対値がいずれも0である場合、低い周波数の値が0であり、高い周波数の値が0ではない場合、低い周波数の値が0であり、高い周波数の値が0ではない場合、いずれも0ではない場合の4種の場合が存在する。ところで、いずれも0である場合には、残余ビットを復号化する必要がないために、この場合は除き、3種の場合をコンテクストとして使用して算術復号化を行う。このように、ビット深度単位で復号化された2ビットは、それぞれ2タプルの低い周波数の下位ビット値1ビットと、高い周波数の下位ビット値1ビットとを意味する。
これは、次のような構文で遂行されてもよい。ここで、a,bは、現在まで復号化された2タプルの絶対値を意味し、rは、復号化する下位残余ビットを意味する。
Figure 2012531086
他の一例として、LSB復号化部2709は、符号情報を復号化することができる。具体的には、LSB復号化部2709は、量子化されたスペクトルの絶対値の復号化がいずれも終わった後、絶対値が0ではない場合、ビットパックキング方式を適用し、それぞれの量子化されたスペクトルの符号情報を伝送することができる。
図27で説明していない構成要素については、図11の説明を参考にする。
図28は、2タプルに係わるコンテクスト基盤の算術復号化方法を図示したフローチャートである。
算術復号化装置101は、現在フレームがリセット・フレームであるか否かを判断する(S2801)。もしリセット・フレームである場合、算術復号化装置101は、コンテクスト・リセットを行う(S2802)。そして、フレームリセットではない場合、算術復号化装置101は、コンテクストをマッピングする(S2803)。具体的には、算術復号化装置101は、現在フレームの長さが、以前フレームと異なる場合に、2フレーム間の周波数インデックスをマッピングさせるために、以前フレームの長さを現在フレームの長さに正規化し、コンテクストをマッピングすることができる。
段階(S2801)ないし段階(S2803)は、フレーム単位によって遂行される。
算術復号化装置101は、現在2タプルの上位ビット(MSB)を復号化するときに使用する複数個のコンテクストのうち、最終伝送された1個のコンテクスト・テンプレートに対して復号化を行う(S2804)。コンテクスト・テンプレートについては、図20の説明を参考にする。その後、算術復号化装置101は、現在2タプルに対して、2タプル・コンテクストを決定する(S2805)。現在2タプルに対して、2タプル・コンテクストを決定する動作については、図28の説明を参考にする。
算術復号化装置101は、脱出コードに対して復号化する(S2806)。脱出コードが復号化されるたびに、lev0がアップデートされ、脱出コードではないものが復号化されれば、MSB復号化を行う(S2809)。
そして、算術復号化装置101は、現在復号化する現在2タプルの上位ビットに対応するMSBコンテクストを決定する(S2807)。その後、算術復号化装置101は、MSB復号化を行う確率モデルを決定するが、2タプル・コンテクスト及び追加コンテクストを基に、符合する確率モデルを決定する(S2808)。
算術復号化装置101は、MSB復号化を行う確率モデルを決定するが、2タプル・コンテクスト及び追加コンテクストを基に、符合する確率モデルを決定する(S2808)。
算術復号化装置101は、2タプル・コンテクストに基づいて、MSB復号化を行う(S2909)。または場合によっては、算術復号化装置101は、2タプル・コンテクストのみ使用するか、あるいは残りの場合について、2タプル・コンテクスト及び追加コンテクストを共に使用することができる。そして、算術復号化装置101は、あらゆる場合について、2タプル・コンテクスト及び追加コンテクストを共に使用することができる。算術復号化装置101は、脱出コードを復号化する過程を介して導き出されたLSBのビット深度ほどのビットを復号化する(S2810)。その後、算術復号化装置101は、コンテクストをアップデートし(S2812)、周波数インデックスを増加してもよい(S2813)。MSBとLSBとの復号化がいずれも行われれば、算術復号化装置101は、符号情報を復号化することができる。
その後、算術復号化装置101は、量子化されたサンプルを生成する(S2815)。
また本発明の一実施形態によるコンテクスト基盤の算術符号化方法及び復号化方法は、多様なコンピュータで具現される動作を行うためのプログラム命令を含むコンピュータ判読可能媒体を含む。前記コンピュータ判読可能媒体は、プログラム命令、データファイル、データ構造などを単独で、または組み合わせて含んでもよい。前記媒体は、プログラム命令は、本発明のために特別に設計されて構成されたものであったり、コンピュータ・ソフトウェアの当業者に公知されて使用可能であるものである。コンピュータ判読可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media)、CD(compact disc)−ROM(read-only memory)、DVD(digital versatile disc)のような光記録媒体(optical media)、フロプチカル・ディスク(floptical disk)のような磁気−光媒体(magneto-optical media)、及びROM、RAM(random-access memory)、フラッシュメモリのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置が含まれる。前記媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でもある。プログラム命令の例としては、コンパイラによって作られるもののような機械語コードだけではなく、インタープリタなどを使用してコンピュータによって実行される高級言語コードを含む。
以上のように、本発明の一実施形態は、たとえ限定されている実施形態と図面とによって説明したとしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、それらは、本発明が属する分野で当業者であるならば、そのような記載から多様な修正及び変形が可能であろう。従って、本発明の一実施形態は、特許請求の範囲によってのみ把握され、それらの均等または等価的変形は、いずれも本発明思想の範疇に属するものである。

Claims (79)

  1. 符号化しようとする現在Nタプル(ここで、Nは正の整数である)のコンテクストを決定するNタプル・コンテクスト決定部と、
    前記Nタプル・コンテクストに基づいて、脱出コードに対して符号化を行う脱出コード符号化部と、
    前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定するMSBコンテクスト決定部と、
    前記Nタプル・コンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する確率モデルマッピング部と、
    前記決定された確率モデルに基づいて、上位ビットに対して符号化を行うMSB符号化部と、
    少なくとも1つのプロセッサを使用し、前記脱出コードに対する符号化過程で導き出された下位ビット(LMB)のビット深度に基づいて、下位ビットを符号化する下位ビット(LSB)符号化部と、を含むコンテクスト基盤の算術符号化装置。
  2. 前記MSBコンテクスト決定部は、
    前記現在Nタプルを構成する上位ビット(MSB)シンボルについて、同一フレームの以前周波数に対応する上位ビットと、以前フレームの同一周波数に対応する上位ビットとを上位ビット・コンテクストとして決定することを特徴とする請求項1に記載のコンテクスト基盤の算術符号化装置。
  3. 前記LSB符号化部は、
    前記上位ビットの符号による確率モデルを利用し、算術符号化を行うことを特徴とする請求項1に記載のコンテクスト基盤の算術符号化装置。
  4. 前記LSB符号化部は、
    前記下位ビットのビット深度による確率モデルを利用し、算術符号化を行うことを特徴とする請求項1に記載のコンテクスト基盤の算術符号化装置
  5. 前記LSB符号化部は、
    前記上位ビットの符号情報と前記下位ビットの深度情報とを利用し、前記下位ビットに対して、ビット単位によってビット深度まで符号化されることを特徴とする請求項1に記載のコンテクスト基盤の算術符号化装置。
  6. 前記上位ビットを符号化するときに使用する1個のコンテクストモードを符号化するコンテクストモード符号化部をさらに含み、
    前記MSBコンテクスト決定部は、
    前記コンテクストモードによって、上位ビット・コンテクストを決定することを特徴とする請求項1に記載のコンテクスト基盤の算術符号化装置。
  7. 前記コンテクストモードは、
    上位ビット・コンテクストについて発生可能な場合の数をビット・パッキングすることによって表現されるか、あるいは算術符号化して表現されることを特徴とする請求項6に記載のコンテクスト基盤の算術符号化装置。
  8. 符号化しようとする現在Nタプル(ここで、Nは正の整数である)のコンテクストを決定する段階と、
    前記Nタプル・コンテクストに基づいて、脱出コードに対して符号化を行う段階と、
    前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定する段階と、
    前記Nタプル・コンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する段階と、
    前記決定された確率モデルに基づいて、上位ビットを符号化する段階と、
    少なくとも1つのプロセッサを使用し、前記脱出コードに対する符号化過程で導き出された下位ビット(MSB)のビット深度に基づいて、下位ビットを符号化する段階と、を含むコンテクスト基盤の算術符号化方法。
  9. 前記上位ビット・コンテクストを決定する段階は、
    前記現在Nタプルを構成する上位ビット(MSB)シンボルについて、同一フレームの以前周波数に対応する上位ビットと、以前フレームの同一周波数に対応する上位ビットとを上位ビット・コンテクストとして決定することを特徴とする請求項8に記載のコンテクスト基盤の算術符号化方法。
  10. 前記下位ビットを符号化する段階は、
    前記上位ビットの符号による確率モデルを利用し、算術符号化を行うことを特徴とする請求項8に記載のコンテクスト基盤の算術符号化方法。
  11. 前記下位ビットを符号化する段階は、
    前記下位ビットのビット深度による確率モデルを利用し、算術符号化を行うことを特徴とする請求項8に記載のコンテクスト基盤の算術符号化方法。
  12. 前記下位ビットを符号化する段階は、
    前記上位ビットの符号情報と前記下位ビットの深度情報とを利用し、前記下位ビットに対して、ビット単位によってビット深度まで符号化されることを特徴とする請求項8に記載のコンテクスト基盤の算術符号化方法。
  13. 前記上位ビットを符号化するときに使用する1個のコンテクストモードを符号化する段階をさらに含み、
    前記上位ビット・コンテクストを決定する段階は、
    前記コンテクストモードによって、上位ビット・コンテクストを決定することを特徴とする請求項8に記載のコンテクスト基盤の算術符号化方法。
  14. 前記コンテクストモードは、
    上位ビット・コンテクストについて発生可能な場合の数をビット・パッキングすることによって表現されるか、あるいは算術符号化して表現されることを特徴とする請求項13に記載のコンテクスト基盤の算術符号化方法。
  15. 復号化しようとする現在Nタプル(ここで、Nは正の整数である)のコンテクストを決定するNタプル・コンテクスト決定部と、
    前記Nタプル・コンテクストに基づいて、脱出コードに対して復号化を行う脱出コード復号化部と、
    前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定するMSBコンテクスト決定部と、
    前記Nタプル・コンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する確率モデルマッピング部と、
    前記決定された確率モデルに基づいて、上位ビットに対して復号化を行うMSB復号化部と、
    前記脱出コードに対する復号化過程で導き出された下位ビット(LSB)のビット深度に基づいて、下位ビットを復号化するLSB復号化部と、を含むコンテクスト基盤の算術復号化装置。
  16. 前記MSBコンテクスト決定部は、
    前記現在Nタプルを構成する上位ビット(MSB)シンボルについて、同一フレームの以前周波数に対応する上位ビットと、以前フレームの同一周波数に対応する上位ビットとを上位ビット・コンテクストとして決定することを特徴とする請求項15に記載のコンテクスト基盤の算術復号化装置。
  17. 前記LSB復号化部は、
    前記上位ビットの符号による確率モデルを利用し、算術復号化を行うことを特徴とする請求項15に記載のコンテクスト基盤の算術復号化装置。
  18. 前記LSB復号化部は、
    前記下位ビットのビット深度による確率モデルを利用し、算術復号化を行うことを特徴とする請求項15に記載のコンテクスト基盤の算術復号化装置。
  19. 前記LSB復号化部は、
    前記上位ビットの符号情報と前記下位ビットの深度情報とを利用し、前記下位ビットに対して、ビット単位によってビット深度まで復号化されることを特徴とする請求項15に記載のコンテクスト基盤の算術復号化装置。
  20. 前記上位ビットを復号化するときに使用する1個のコンテクストモードを復号化するコンテクストモード復号化部をさらに含み、
    前記MSBコンテクスト決定部は、
    前記コンテクストモードによって、上位ビット・コンテクストを決定することを特徴とする請求項15に記載のコンテクスト基盤の算術復号化装置。
  21. 前記コンテクストモードは、
    上位ビット・コンテクストについて発生可能な場合の数をビット・パッキングすることによって表現されるか、あるいは算術復号化して表現されることを特徴とする請求項20に記載のコンテクスト基盤の算術復号化装置。
  22. 復号化しようとする現在Nタプル(ここで、Nは正の整数である)のコンテクストを決定する段階と、
    前記Nタプル・コンテクストに基づいて、脱出コードに対して復号化を行う段階と、
    前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定する段階と、
    前記Nタプル・コンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する段階と、
    前記決定された確率モデルに基づいて、上位ビットを復号化する段階と、
    少なくとも1つのプロセッサを使用し、前記脱出コードに対する復号化過程で導き出された下位ビット(LSB)のビット深度に基づいて、下位ビットを復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  23. 前記上位ビット・コンテクストを決定する段階は、
    前記現在Nタプルを構成する上位ビット(MSB)シンボルについて、同一フレームの以前周波数に対応する上位ビットと、以前フレームの同一周波数に対応する上位ビットとを上位ビット・コンテクストとして決定することを特徴とする請求項22に記載のコンテクスト基盤の算術復号化方法。
  24. 前記下位ビットを復号化する段階は、
    前記上位ビットの符号による確率モデルを利用し、算術復号化を行うことを特徴とする請求項22に記載のコンテクスト基盤の算術復号化方法。
  25. 前記下位ビットを復号化する段階は、
    前記下位ビットのビット深度による確率モデルを利用し、算術復号化を行うことを特徴とする請求項22に記載のコンテクスト基盤の算術復号化方法。
  26. 前記下位ビットを復号化する段階は、
    前記上位ビットの符号情報と前記下位ビットの深度情報とを利用し、前記下位ビットに対して、ビット単位によってビット深度まで復号化されることを特徴とする請求項22に記載のコンテクスト基盤の算術復号化方法。
  27. 前記上位ビットを復号化するときに使用する1個のコンテクストモードを復号化する段階をさらに含み、
    前記上位ビット・コンテクストを決定する段階は、
    前記コンテクストモードによって、上位ビット・コンテクストを決定することを特徴とする請求項22に記載のコンテクスト基盤の算術復号化方法。
  28. 前記コンテクストモードは、
    上位ビット・コンテクストについて発生可能な場合の数をビット・パッキングすることによって表現されるか、あるいは算術復号化して表現されることを特徴とする請求項27に記載のコンテクスト基盤の算術復号化方法。
  29. 1個のコンテクスト・テンプレート・インデックスを復号化する段階をさらに含み、
    前記上位ビット・コンテクストを決定する段階は、
    前記コンテクスト・テンプレート・インデックスによってコンテクスト・テンプレートを決定し、上位ビット・コンテクストを決定することを特徴とする請求項22に記載のコンテクスト基盤の算術復号化方法。
  30. 前記コンテクスト・テンプレート・インデックスは、
    周波数帯域別コンテクスト・テンプレートを決定するように構成されることを特徴とする請求項29に記載のコンテクスト基盤の算術復号化方法。
  31. 前記コンテクスト・テンプレート・インデックスは、
    コアの復号化モードをコンテクストとして使用し、算術復号化されることを特徴とする請求項29に記載のコンテクスト基盤の算術復号化方法。
  32. 複数個の量子化された周波数スペクトルで構成された集合を、上位ビット(MSB)と下位ビット(MSB)とに分離して復号化する方法において、
    現在復号化する集合の周辺に位置した集合の量子化された周波数スペクトル値を利用し、第1コンテクストを生成する段階と、
    現在復号化する上位ビット(MSB)シンボル周辺の復号化された上位ビット(MSB)シンボルを利用し、第2コンテクストを生成する段階と、
    少なくとも1つのプロセッサを使用し、前記生成された第1コンテクスト及び前記生成された第2コンテクストを利用し、前記上位ビットを復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  33. 複数個の量子化された周波数スペクトルで構成された集合を、上位ビット(MSB)と下位ビット(LSB)とに分離して復号化する方法において、
    前記上位ビットの符号情報を利用し、第3コンテクストを生成する段階と、
    前記下位ビットのビット深度情報を利用し、第4コンテクストを生成する段階と、
    少なくとも1つのプロセッサを使用し、前記生成された第3コンテクスト及び前記生成された第4コンテクストを利用し、下位ビットをビット単位で復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  34. 複数個の量子化された周波数スペクトルで構成された集合を、上位ビット(MSB)と下位ビット(LSB)とに分離して復号化する方法において、
    少なくとも1つのプロセッサを使用し、前記下位ビットのビット深度情報を基に、前記下位ビットをビット単位で復号化する段階を含むコンテクスト基盤の算術復号化方法。
  35. コンテクストとして使われる復号化された上位ビットシンボルに係わって、現在復号化する上位ビットシンボルの相対的な位置情報を復号化する段階をさらに含み、
    前記第2コンテクストを生成する段階は、
    前記相対的な位置情報を利用し、第2コンテクストを生成することを特徴とする請求項32に記載のコンテクスト基盤の算術復号化方法。
  36. 前記相対的な位置情報は、コア復号化モードをコンテクストとして使用し、算術復号化を介して復号化されることを特徴とする請求項35に記載のコンテクスト基盤の算術復号化方法。
  37. 前記相対的な位置情報は、
    複数個の周波数帯域で、上位ビットシンボル復号化時に使われるコンテクストに対応する値で表現されることを特徴とする請求項35に記載のコンテクスト基盤の算術復号化方法。
  38. 現在復号化する集合の周辺に位置した集合に基づいて、下位ビットのビット深度を推定する段階と、
    周辺に位置した集合に係わるコアの復号化モードをコンテクストとして使用し、脱出コードの存在いかんを示すシンボルを復号化する段階と、
    脱出コードが復号化される回数に基づいて、前記下位ビットの推定されたビット深度をアップデートする段階と、をさらに含むことを特徴とする請求項35に記載のコンテクスト基盤の算術復号化方法。
  39. 前記下位ビットを復号化する段階は、
    下位ビットと同じ周波数位置に対応する上位ビットシンボルの数が正数であるか、負数であるか、0であるかに基づいて、前記下位ビットをビット単位で復号化することを特徴とする請求項35に記載のコンテクスト基盤の算術復号化方法。
  40. 前記下位ビットを復号化する段階は、
    前記下位ビットをビット深度に基づいて、ビット単位で復号化することを特徴とする請求項35に記載のコンテクスト基盤の算術復号化方法。
  41. 復号化しようとする現在Nタプル(ここで、Nは正の整数である)の周辺に位置した周辺Nタプルに基づいたNタプル・コンテクストを利用し、前記現在Nタプルの上位ビット(MSB)を復号化する段階と、
    少なくとも1つのプロセッサを使用し、前記上位ビットの符号情報に基づいた下位ビット・コンテクストを利用し、前記現在Nタプルの下位ビット(LSB)を復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  42. 復号化しようとする現在Nタプル(ここで、Nは正の整数である)の周辺に位置した周辺Nタプルに基づいたNタプル・コンテクストを利用し、前記現在Nタプルの上位ビットを復号化する段階と、
    少なくとも1つのプロセッサを使用し、前記上位ビットの符号情報及び下位ビットのビット深度に基づいた下位ビット・コンテクストを利用し、前記現在Nタプルの下位ビットを復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  43. 前記Nタプルは、
    量子化されたスペクトルがN個の周波数スペクトル単位で構成されたことを特徴とする請求項41に記載のコンテクスト基盤の算術復号化方法、
  44. 前記現在Nタプルの上位ビットを復号化する段階は、
    復号化しようとする現在Nタプルのコンテクスト・テンプレートを復号化する段階と、
    前記現在Nタプルに係わるNタプル・コンテクストを決定する段階と、
    前記Nタプルのコンテクストに基づいて、脱出コードに対して復号化を行う段階と、
    前記復号化されたコンテクスト・テンプレートに基づいて、前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定する段階と、
    前記Nタプルのコンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する段階と、
    前記決定された確率モデルに基づいて、上位ビットを復号化する段階と、を含むことを特徴とする請求項41に記載のコンテクスト基盤の算術復号化方法。
  45. 特定サブセット状態であるか否かを考慮し、復号化しようとする現在Nタプルの周辺に位置した周辺Nタプルに基づいた(1)Nタプル・コンテクストを利用するか、あるいは(2)前記Nタプル・コンテクスト及び追加コンテクストを利用し、前記現在Nタプルの上位ビットを復号化する段階と、
    少なくとも1つのプロセッサを使用し、前記上位ビットの符号情報に基づいた下位ビット・コンテクストを利用し、前記現在Nタプルの下位ビット(LSB)を復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  46. 特定状態であるか否かを考慮し、復号化しようとする現在Nタプル(ここで、Nは正の整数である)の周辺に位置した周辺Nタプルに基づいた(1)Nタプルのコンテクストを利用するか、あるいは(2)前記Nタプルのコンテクスト及び追加コンテクストを利用し、前記現在Nタプルの上位ビットを復号化する段階と、
    少なくとも1つのプロセッサを使用し、前記上位ビットの符号情報及び下位ビットのビット深度に基づいた下位ビット・コンテクストを利用し、前記現在Nタプルの下位ビットを復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  47. 前記現在スペクトルの上位ビットを復号化する段階は、
    前記Nタプル・コンテクストを介して、特定状態であると判断された場合、前記Nタプル・コンテクストに係わる特定状態のサブセットと追加コンテクストとを利用し、前記現在スペクトルの上位ビットを復号化し、
    前記Nタプル・コンテクストを介して、特定状態ではない場合、前記Nタプル・コンテクストを利用し、前記現在Nタプルの上位ビットを復号化することを特徴とすることを特徴とする請求項45に記載のコンテクスト基盤の算術復号化方法。
  48. 前記Nタプルは、
    量子化されたスペクトルがN個の周波数スペクトル単位で構成されたことを特徴とする請求項45に記載のコンテクスト基盤の算術復号化方法。
  49. 前記現在Nタプルの上位ビットを復号化する段階は、
    復号化しようとする現在1タプルの周辺に位置した7個の周辺1タプルを第1コンテクストとして決定し、前記現在1タプルの上位ビットを復号化することを特徴とする請求項45に記載のコンテクスト基盤の算術復号化方法。
  50. 前記追加コンテクストは、前記Nタプル・コンテクストに基づいた追加上位ビット・コンテクストであることを特徴とする請求項45に記載のコンテクスト基盤の算術復号化方法。
  51. 前記追加コンテクストは、コンテクスト・テンプレートに基づいて抽出されることを特徴とする請求項50に記載のコンテクスト基盤の算術復号化方法。
  52. 前記追加コンテクストは、
    前記周辺Nタプルの上位ビット値、前記周辺Nタプルをさらに量子化した値、または前記現在Nタプルについて推定されたlev0ほどスケーリングダウンして抽出した値のうち、いずれか1つであることを特徴とする請求項50に記載のコンテクスト基盤の算術復号化方法。
  53. 復号化しようとする現在Nタプル(ここで、Nは正の整数である)のコンテクスト・テンプレートを復号化する段階と、
    前記現在Nタプルに係わるNタプル・コンテクストを決定する段階と、
    前記Nタプル・コンテクストに基づいて、脱出コードに対して復号化を行う段階と、
    前記復号化されたコンテクスト・テンプレートに基づいて、前記現在Nタプルを構成する上位ビット(MSB)シンボルに対応する上位ビット・コンテクストを決定する段階と、
    前記Nタプル・コンテクスト及び前記上位ビット・コンテクストを利用し、確率モデルを決定する段階と、
    前記決定された確率モデルに基づいて、上位ビットを復号化する段階と、
    少なくとも1つのプロセッサを使用し、前記脱出コードに対する復号化過程で導き出された下位ビットのビット深度に基づいて、下位ビットを復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  54. 復号化しようとする現在1タプルの周辺に位置した周辺1タプルに基づいた1タプル・コンテクストを利用し、前記現在1タプルの上位ビット(MSB)を復号化する段階と、
    前記上位ビット(MSB)を復号化するとき、前記現在1タプルのlev0推定を行うために使われる周辺1タプルの個数を選択的に利用し、lev0推定を行う段階と、
    少なくとも1つのプロセッサを使用し、前記現在1タプルの下位ビット(LSB)を復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  55. 前記lev0推定を行う段階は、
    コア符号化モードに基づいて、前記周辺1タプルの個数を選択的に適用することを特徴とする請求項54に記載のコンテクスト基盤の算術復号化方法。
  56. 前記lev0推定を行う段階は、
    現在復号化しようとする現在1タプルの周波数領域に基づいて、前記周辺1タプルの個数を選択的に適用することを特徴とする請求項54に記載のコンテクスト基盤の算術復号化方法。
  57. 復号化しようとする現在1タプルの周辺に位置した周辺1タプルに基づいた1タプル・コンテクストを利用し、前記現在1タプルの上位ビット(MSB)を復号化する段階と、
    前記上位ビット(MSB)を復号化するとき、前記現在1タプルのlev0推定を行うために使われる周辺1タプルの絶対値を使用し、lev0推定を行う段階と、
    少なくとも1つのプロセッサを使用し、前記現在1タプルの下位ビット(LSB)を復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  58. 復号化しようとする現在2タプルの周辺に位置した周辺2タプルに基づいた2タプル・コンテクストまたは追加コンテクストのうち少なくとも一つを利用し、前記現在2タプルの上位ビットを復号化する段階と、
    少なくとも1つのプロセッサを使用し、前記現在2タプルの上位ビットが復号化されれば、前記現在2タプルの下位ビットを復号化する段階と、を含むコンテクスト基盤の算術復号化方法。
  59. 前記追加コンテクストは、
    前記現在2タプルについて、現在フレームの以前周波数に対応する周辺2タプルの上位ビットシンボルであることを特徴とする請求項58に記載のコンテクスト基盤の算術復号化方法。
  60. 前記追加コンテクストは、
    前記現在2タプルに基づいたコンテクスト・テンプレート情報に基づいて、決定されることを特徴とする請求項58に記載のコンテクスト基盤の算術復号化方法。
  61. 前記コンテクスト・テンプレート情報は、
    低周波領域及び高周波領域に分離して復号化されることを特徴とする請求項58に記載のコンテクスト基盤の算術復号化方法。
  62. 前記現在2タプルの下位ビットを復号化する段階は、
    脱出コードの復号化回数ほど、前記現在2タプルの下位ビットを、ビット深度単位で抽出して復号化することを特徴とする請求項58に記載のコンテクスト基盤の算術復号化方法。
  63. 前記現在2タプルの下位ビットを復号化する段階は、
    前記現在2タプルの下位ビットを周波数インデックスを基にして、2個に分離し、ビット深度単位で1ビットずつビット深度情報をコンテクストとして設定し、前記下位ビットを復号化することを特徴とする請求項58に記載のコンテクスト基盤の算術復号化方法。
  64. 前記現在2タプルの下位ビットを復号化する段階は、
    前記現在2タプルの下位ビットを周波数インデックスを基にして、2個に分離し、それぞれについて、現在復号化時点まで復号化された絶対値が0であるか、または0ではないかをコンテクストとして設定し、前記下位ビットを復号化することを特徴とする請求項58に記載のコンテクスト基盤の算術復号化方法。
  65. 前記現在2タプルの下位ビットを復号化する段階は、
    前記現在2タプルの下位ビットを周波数インデックスを基にして、2個に分離し、前記分離された下位ビットそれぞれについて、現在復号化時点まで復号化された絶対値が0であるか、または0ではないかの組み合わせをコンテクストとして設定し、前記現在2タプルに対して、前記下位ビットを2ビットずつ復号化することを特徴とする請求項58に記載のコンテクスト基盤の算術復号化方法。
  66. 前記現在2タプルの下位ビットを復号化する段階は、
    現在復号化時点まで復号化された絶対値がいずれも0である場合は除外し、前記組み合わせをコンテクストとして設定することを特徴とする請求項65に記載のコンテクスト基盤の算術復号化方法。
  67. 請求項8に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  68. 請求項22に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  69. 請求項32に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  70. 請求項33に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  71. 請求項34に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  72. 請求項41に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  73. 請求項42に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  74. 請求項45に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  75. 請求項46に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  76. 請求項53に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  77. 請求項54に記載の法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  78. 請求項57に記載の方法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
  79. 請求項58に記載の法を実現するために、少なくとも1つのプロセッサを制御する命令語を保存する少なくとも1つのコンピュータで読み取り可能な記録媒体。
JP2012515996A 2009-06-19 2010-06-18 コンテクスト基盤の算術符号化装置及びその方法並びに算術復号化装置及びその方法 Active JP5635603B2 (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
KR20090055113 2009-06-19
KR10-2009-0055113 2009-06-19
KR10-2009-0056301 2009-06-24
KR20090056301 2009-06-24
KR1020090100457A KR20100136890A (ko) 2009-06-19 2009-10-21 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
KR10-2009-0100457 2009-10-21
KR1020090122733A KR20100136896A (ko) 2009-06-19 2009-12-10 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
KR10-2009-0122733 2009-12-10
KR1020100000281A KR20100136898A (ko) 2009-06-19 2010-01-04 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
KR10-2010-0000281 2010-01-04
KR1020100000643A KR101719735B1 (ko) 2009-06-19 2010-01-05 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
KR10-2010-0000643 2010-01-05
PCT/KR2010/003975 WO2010147436A2 (en) 2009-06-19 2010-06-18 Context-based arithmetic encoding apparatus and method and context-based arithmetic decoding apparatus and method

Publications (3)

Publication Number Publication Date
JP2012531086A true JP2012531086A (ja) 2012-12-06
JP2012531086A5 JP2012531086A5 (ja) 2013-08-01
JP5635603B2 JP5635603B2 (ja) 2014-12-03

Family

ID=43510806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012515996A Active JP5635603B2 (ja) 2009-06-19 2010-06-18 コンテクスト基盤の算術符号化装置及びその方法並びに算術復号化装置及びその方法

Country Status (10)

Country Link
US (3) US9171550B2 (ja)
EP (3) EP2443750A4 (ja)
JP (1) JP5635603B2 (ja)
KR (5) KR20100136890A (ja)
CN (3) CN105491378B (ja)
BR (2) BRPI1015554B1 (ja)
CA (2) CA2923285C (ja)
MX (1) MX2011013579A (ja)
RU (2) RU2493652C2 (ja)
WO (1) WO2010147436A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016529547A (ja) * 2013-07-22 2016-09-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ スペクトルエンベロープのサンプル値のコンテキストベースエントロピー符号化
JP2021502606A (ja) * 2017-11-10 2021-01-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 最下位ビットの符号化および復号に適合するオーディオ符号化器、オーディオ復号器、方法、およびコンピュータプログラム

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100136890A (ko) 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
MX2012004564A (es) * 2009-10-20 2012-06-08 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodo para codificar informacion de audio y programa de computacion que utiliza una reduccion de tamaño de intervalo interactiva.
SG182464A1 (en) 2010-01-12 2012-08-30 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for encoding and decoding an audio information, and computer program obtaining a context sub-region value on the basis of a norm of previously decoded spectral values
PL4120248T3 (pl) * 2010-07-08 2024-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder wykorzystujący kasowanie aliasingu w przód
PL3751564T3 (pl) * 2010-07-20 2023-03-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio, sposób dekodowania audio i program komputerowy
US8976861B2 (en) 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
US9042440B2 (en) 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US10397577B2 (en) 2011-03-08 2019-08-27 Velos Media, Llc Inverse scan order for significance map coding of transform coefficients in video coding
US9106913B2 (en) 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
US9491469B2 (en) 2011-06-28 2016-11-08 Qualcomm Incorporated Coding of last significant transform coefficient
WO2013058634A2 (ko) 2011-10-21 2013-04-25 삼성전자 주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치
GB2513111A (en) 2013-04-08 2014-10-22 Sony Corp Data encoding and decoding
US9176973B1 (en) 2013-06-14 2015-11-03 Timmes, Inc. Recursive-capable lossless compression mechanism
KR101940464B1 (ko) * 2013-10-18 2019-01-18 텔레폰악티에볼라겟엘엠에릭슨(펍) 스펙트럼의 피크 위치의 코딩 및 디코딩
EP3163877A4 (en) 2014-06-29 2018-03-07 LG Electronics Inc. Method and apparatus for performing arithmetic coding on basis of concatenated rom-ram table
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
US10304472B2 (en) * 2014-07-28 2019-05-28 Nippon Telegraph And Telephone Corporation Method, device and recording medium for coding based on a selected coding processing
US9252805B1 (en) * 2015-03-28 2016-02-02 International Business Machines Corporation Parallel huffman decoder
US20160360236A1 (en) * 2015-06-04 2016-12-08 Mediatek Inc. Method and Apparatus for Entropy Transcoding
JP6467561B1 (ja) * 2016-01-26 2019-02-13 ドルビー ラボラトリーズ ライセンシング コーポレイション 適応的な量子化
US10419781B2 (en) * 2016-09-20 2019-09-17 Qualcomm Incorporated Storing and retrieving high bit depth image data
US10194147B2 (en) * 2017-01-19 2019-01-29 Google Llc DC coefficient sign coding scheme
WO2019049543A1 (ja) * 2017-09-08 2019-03-14 ソニー株式会社 音声処理装置、音声処理方法及びプログラム
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
GB2574873A (en) * 2018-06-21 2019-12-25 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
CN109859743B (zh) * 2019-01-29 2023-12-08 腾讯科技(深圳)有限公司 音频识别方法、系统和机器设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001230935A (ja) * 2000-02-18 2001-08-24 Canon Inc 算術符号化/復号化方法ならびに算術符号化/復号化装置
US20050075888A1 (en) * 2003-09-29 2005-04-07 Jeongnam Young Fast codebook selection method in audio encoding
JP2005242363A (ja) * 2004-02-27 2005-09-08 Samsung Electronics Co Ltd 無損失オーディオ符号化/復号化方法および装置
JP2005260969A (ja) * 2004-03-10 2005-09-22 Samsung Electronics Co Ltd 無損失オーディオ符号化/復号化方法および装置
US20060235679A1 (en) * 2005-04-13 2006-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
JP2006293375A (ja) * 2005-04-14 2006-10-26 Samsung Electronics Co Ltd オーディオデータ符号化及び復号化装置、並びにオーディオデータ符号化及び復号化方法
JP2007028531A (ja) * 2005-07-21 2007-02-01 Fuji Xerox Co Ltd 画像符号化装置及び画像符号化方法
JP2008536410A (ja) * 2005-04-13 2008-09-04 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. コンパクトなコードブックを用いるエントロピー符号化
JP2009518934A (ja) * 2005-12-07 2009-05-07 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号の符号化及び復号化方法、オーディオ信号の符号化及び復号化装置
WO2010003479A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06133284A (ja) 1992-10-15 1994-05-13 Sony Corp エンコーダ及びデコーダ
US5740460A (en) * 1994-07-29 1998-04-14 Discovision Associates Arrangement for processing packetized data
GB9509831D0 (en) * 1995-05-15 1995-07-05 Gerzon Michael A Lossless coding method for waveform data
US5801649A (en) 1995-08-03 1998-09-01 Seagate Technology, Inc. Matched spectral null encoder/decoder
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100274213B1 (ko) * 1997-11-21 2000-12-15 윤종용 Rll(2,25)코드를 이용한 7/13 채널코딩 및 채널디코딩방법
FI104133B (fi) * 1997-11-28 1999-11-15 Nokia Mobile Phones Ltd Koodaus- ja modulointimenetelmä ja laite sen soveltamiseksi
US6289128B1 (en) 1998-09-30 2001-09-11 Ricoh Co., Ltd. Method and apparatus for sharing a least significant bit of encoded data between multiple numeric data values
US6400289B1 (en) * 2000-03-01 2002-06-04 Hughes Electronics Corporation System and method for performing lossless data compression and decompression
JP2003304160A (ja) * 2002-04-11 2003-10-24 Sony Corp Mq−coder方式の算術符号化/復号装置並びに方法
GB2388502A (en) 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
AU2003235868A1 (en) 2002-05-10 2003-11-11 Asahi Kasei Kabushiki Kaisha Speech recognition device
KR20040085545A (ko) 2003-03-31 2004-10-08 삼성전자주식회사 통신 시스템에서 오류 정정 부호의 복호 장치 및 방법
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
JP2005184232A (ja) * 2003-12-17 2005-07-07 Sony Corp 符号化装置、プログラム、およびデータ処理方法
SE526226C2 (sv) 2003-12-19 2005-08-02 Ericsson Telefon Ab L M Bildbehandling
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
MX2007000459A (es) * 2004-07-14 2007-07-25 Agency Science Tech & Res Codificacion y descodificacion de senales, basadas en contexto.
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
US7372378B2 (en) 2005-12-01 2008-05-13 Nvidia Corporation Efficient decoding of n-tuple variable bit length symbols
JP2007214814A (ja) 2006-02-08 2007-08-23 Sony Corp 復号化方法、復号化プログラムおよび復号化装置
JP4745865B2 (ja) 2006-02-28 2011-08-10 富士通セミコンダクター株式会社 符号化装置および方法
US7246462B1 (en) * 2006-03-06 2007-07-24 Grois Inventors Corp, Inc. Reusable device for release of caught fishing accessories
JP2008268384A (ja) * 2007-04-17 2008-11-06 Nec Lcd Technologies Ltd 液晶表示装置
KR100889750B1 (ko) * 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
WO2009027606A1 (fr) * 2007-08-24 2009-03-05 France Telecom Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites
US7623047B2 (en) 2007-10-30 2009-11-24 Hewlett-Packard Development Company, L.P. Data sequence compression
WO2010106631A1 (ja) * 2009-03-17 2010-09-23 キーパー=スミス エル・エル・ピー 画像表示システム、画像表示装置、画像提供装置およびその方法
KR20100136890A (ko) 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001230935A (ja) * 2000-02-18 2001-08-24 Canon Inc 算術符号化/復号化方法ならびに算術符号化/復号化装置
US20050075888A1 (en) * 2003-09-29 2005-04-07 Jeongnam Young Fast codebook selection method in audio encoding
JP2007510170A (ja) * 2003-09-29 2007-04-19 ソニー エレクトロニクス インク オーディオ符号化における高速コードブック選択方法
JP2005242363A (ja) * 2004-02-27 2005-09-08 Samsung Electronics Co Ltd 無損失オーディオ符号化/復号化方法および装置
JP2005260969A (ja) * 2004-03-10 2005-09-22 Samsung Electronics Co Ltd 無損失オーディオ符号化/復号化方法および装置
US20060235679A1 (en) * 2005-04-13 2006-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
JP2008536410A (ja) * 2005-04-13 2008-09-04 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. コンパクトなコードブックを用いるエントロピー符号化
JP2006293375A (ja) * 2005-04-14 2006-10-26 Samsung Electronics Co Ltd オーディオデータ符号化及び復号化装置、並びにオーディオデータ符号化及び復号化方法
JP2007028531A (ja) * 2005-07-21 2007-02-01 Fuji Xerox Co Ltd 画像符号化装置及び画像符号化方法
JP2009518934A (ja) * 2005-12-07 2009-05-07 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号の符号化及び復号化方法、オーディオ信号の符号化及び復号化装置
WO2010003479A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MAX NEUENDORF ET AL.: "A Novel Scheme for Low Bitrate Unified Speech and Audio Coding-MPEG RM0", AUDIO ENGINEERING SOCIETY CONVENTION PAPER 7713, JPN7014001388, May 2009 (2009-05-01), pages 1 - 13, XP007911153, ISSN: 0002807409 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016529547A (ja) * 2013-07-22 2016-09-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ スペクトルエンベロープのサンプル値のコンテキストベースエントロピー符号化
US9947330B2 (en) 2013-07-22 2018-04-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Context-based entropy coding of sample values of a spectral envelope
US10726854B2 (en) 2013-07-22 2020-07-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Context-based entropy coding of sample values of a spectral envelope
JP2020190747A (ja) * 2013-07-22 2020-11-26 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ スペクトルエンベロープのサンプル値のコンテキストベースエントロピー符号化
US11250866B2 (en) 2013-07-22 2022-02-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Context-based entropy coding of sample values of a spectral envelope
JP7260509B2 (ja) 2013-07-22 2023-04-18 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ スペクトルエンベロープのサンプル値のコンテキストベースエントロピー符号化
US11790927B2 (en) 2013-07-22 2023-10-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Context-based entropy coding of sample values of a spectral envelope
JP2021502606A (ja) * 2017-11-10 2021-01-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 最下位ビットの符号化および復号に適合するオーディオ符号化器、オーディオ復号器、方法、およびコンピュータプログラム
JP7104785B2 (ja) 2017-11-10 2022-07-21 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 最下位ビットの符号化および復号に適合するオーディオ符号化器、オーディオ復号器、方法、およびコンピュータプログラム

Also Published As

Publication number Publication date
MX2011013579A (es) 2012-02-21
KR20100136890A (ko) 2010-12-29
BRPI1015554A2 (pt) 2020-08-18
EP3843279A1 (en) 2021-06-30
CA2765863C (en) 2016-05-24
CA2923285C (en) 2018-05-29
EP3843278A1 (en) 2021-06-30
CN105427867B (zh) 2019-07-19
US20100324912A1 (en) 2010-12-23
RU2649288C2 (ru) 2018-03-30
KR101882948B1 (ko) 2018-07-30
RU2013129559A (ru) 2015-01-10
US9171550B2 (en) 2015-10-27
CN102460975A (zh) 2012-05-16
CN105491378A (zh) 2016-04-13
KR20100136899A (ko) 2010-12-29
BR122020024930B1 (pt) 2021-07-27
CN105427867A (zh) 2016-03-23
US8412533B2 (en) 2013-04-02
CA2923285A1 (en) 2010-12-23
BRPI1015554B1 (pt) 2021-08-10
WO2010147436A2 (en) 2010-12-23
KR20100136898A (ko) 2010-12-29
RU2493652C2 (ru) 2013-09-20
US20160049160A1 (en) 2016-02-18
CN105491378B (zh) 2019-03-15
US20120221325A1 (en) 2012-08-30
RU2011151607A (ru) 2013-06-27
KR20170035855A (ko) 2017-03-31
CN102460975B (zh) 2016-02-17
EP2443750A4 (en) 2015-04-29
WO2010147436A3 (en) 2011-03-03
CA2765863A1 (en) 2010-12-23
JP5635603B2 (ja) 2014-12-03
US9959879B2 (en) 2018-05-01
KR101719735B1 (ko) 2017-03-27
EP2443750A2 (en) 2012-04-25
KR20100136896A (ko) 2010-12-29

Similar Documents

Publication Publication Date Title
JP5635603B2 (ja) コンテクスト基盤の算術符号化装置及びその方法並びに算術復号化装置及びその方法
RU2437172C1 (ru) Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках
JP6219903B2 (ja) 復号化装置及び復号化方法
TWI466103B (zh) 音訊編碼器、音訊解碼器、用以將音訊資訊編碼的方法、用以將音訊資訊解碼的方法、及使用描述有效狀態值及區間邊界二者之散列表的電腦程式
EP2302624B1 (en) Apparatus for encoding and decoding of integrated speech and audio
KR101238239B1 (ko) 인코더
JP5613781B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
JP6146069B2 (ja) データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
JPH0990989A (ja) 変換符号化方法および変換復号化方法
RU2574848C2 (ru) Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая хэш-таблицу, которая описывает значимые значения состояния и границы интервала

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130617

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130617

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140916

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141016

R150 Certificate of patent or registration of utility model

Ref document number: 5635603

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250