JP2001518247A - 改良された量子化処理を用いたデジタル信号圧縮符号化方法 - Google Patents

改良された量子化処理を用いたデジタル信号圧縮符号化方法

Info

Publication number
JP2001518247A
JP2001518247A JP53742098A JP53742098A JP2001518247A JP 2001518247 A JP2001518247 A JP 2001518247A JP 53742098 A JP53742098 A JP 53742098A JP 53742098 A JP53742098 A JP 53742098A JP 2001518247 A JP2001518247 A JP 2001518247A
Authority
JP
Japan
Prior art keywords
quantizer
value
generation
equation
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP53742098A
Other languages
English (en)
Inventor
ハートウィッグ ワーナ,オリヴァー
ドミニク ウェルス,ニコラス
ジェームス ニー,マイケル
Original Assignee
ブリティッシュ ブロードキャスティング コーポレーション
スネル アンド ウィルコックス リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9703834.3A external-priority patent/GB9703834D0/en
Priority claimed from GB9703831A external-priority patent/GB2323493A/en
Application filed by ブリティッシュ ブロードキャスティング コーポレーション, スネル アンド ウィルコックス リミテッド filed Critical ブリティッシュ ブロードキャスティング コーポレーション
Publication of JP2001518247A publication Critical patent/JP2001518247A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)

Abstract

(57)【要約】 MPEG2などのデジタル信号の圧縮符号化において、変換係数は、パラメータλにより制御される各区間の低い方の境界を用いて量子化される。MPEG2基準符号化器において、たとえば、λ=0.75である。量子化された係数は可変長符号化されるので、関連する代表レベルに関して各区間の境界を動的に変化させるようにλを制御することにより、品質の改善とビットレートの低減が達成される。パラメータλは、係数振幅、周波数、量子化ステップサイズとともに変化し得る。変換符号化処理において、λは最初の符号化処理におけるパラメータにともなっても変化する。

Description

【発明の詳細な説明】 改良された量子化処理を用いたデジタル信号圧縮符号化方法 本発明は、映像、音声、その他のデジタル信号の圧縮に関する。 圧縮符号化は、一般に、多数の別々の技術を含んでいる。通常、これらには、 MPEG−2のブロックベース離散コサイン変換(DCT)などの変換と、オプ ションとしての予測ステップと、量子化ステップと、可変長符号化とが含まれる 。本発明は、特に、ここでいう量子化に関する。 量子化ステップでは、ある範囲の原振幅を同一の代表レベルにマッピングする 。したがって、量子化プロセスは非可逆性である。MPEG−2では、(MPE G−1、JPEG、CCITT/ITU−T Rec.H.261、ITU−T Rec.H.263などの他の圧縮標準と共通して)代表レベルを定義してい るが、原振幅を一組の代表レベルにマッピングする方法は未定義のままに残して いる。 一般に、量子化器は、連続性の、あるいはすでに量子化プロセスを受けた入力 値に対して、その入力値の直上および直下の量子化レベルから通常選択される符 号を割り当てる。入力値に最も近い量子化レベルを選択すれば、このような量子 化における誤差は概して最小化されることになる。圧縮システムにおいては、各 量子化レベルを符号化する際の効率を考慮することがさらに必要である。可変長 符号化において、もっとも頻繁に用いられる量子化レベルには最短の符号が割り 当てられる。 通常、ゼロレベルは最短の符号をもつ。したがって、低い方のレベル(特にゼ ロレベル)ではなく、最も近いとの理由で、高い方の量子化レベルを割り当てる という決定法は、符号化効率を低下させることになる。MPEG2において、圧 縮された信号の全体のビットレートは、より高いビットレートに向かう傾向に応 じて量子化レベルの分離を増加させることにより、所定の限界より下に維持され る。どれが最も近いかに基づいて量子化レベルを割り当てる決定を繰り返すこと は、符号化の非効率を招き、より粗な量子化プロセスを導く。 この点において、量子化器の挙動は、入力値に算術的に結合されたパラメータ λを介して特徴づけることができ、λのひとつの値(通常λ=1)は最も近い量 子化レベルの選択、すなわち「丸め」を表わす。対照的に、λの別の値(通常λ =0)は、2つの最も近い量子化レベルのうちの低い方の自動選択、すなわち、 「頭切り[truncation]」を表す。MPEG2基準符号化器[reference coder ]において、λの標準値をλ=0.75に設定することにより、丸めの属性であ る誤差の公称減少[nominal reduction in error]と、頭切りに結びつくビツト レート効率化とを妥協させる試みがなされている。 ここではMPEG2符号化に特に注意を向けてきたが、次のような、デジタル 信号のその他の圧縮符号化方法にも同様な考察があてはまる。すなわち、変換プ ロセスを実行して値を生成するステップと、この値の振幅範囲を一組の隣接する 区間に分割することによりこれらの値を量子化するステップとを含み、各区間を 可変長符号化される一組の代表レベルの各々にマッピングし、各区間の境界をパ ラメータλにより制御する方法である。変換プロセスは、MPEG2のDCTな どのブロックベースの変換やサブバンド符号化を含む多様な形態をとり得る。 本発明の一態様の目的は、所定のビットレートにおいてより高い品質を達成す ることを、あるいは、所定の品質に対してビットレートを低減することを可能と した、上記方法の改良を提供することである。 そこで、本発明は、一態様において、関連する代表レベルに対して各区間の境 界を動的に変化させるようにλを制御することを特徴としている。 好適には、各値はλに算術的に結び付けられる。 好ましくは、λは、 上記値によりあらわされる量の関数であり、 変換がDCTである場合には、水平および垂直周波数の関数であり、 量子化ステップサイズの関数であるか、もしくは、 上記値の振幅の関数である。 本発明の特別な形態において、符号化されるデジタル信号は前の符号化復号化 プロセスを受けており、λは上記前の符号化復号化プロセスにおけるパラメータ の関数として制御される。 さらなる態様において、本発明は、各周波数指数fkをあらわす一組の変換係 数xkに対して動作する(q,λ)量子化器であって、これらの値Xkおよびfk に基づいてλを動的に制御するようにした量子化器に存する。 好ましくは、λは、費用関数D+μHを最小化するように動的に制御され、こ こで、Dは、非圧縮領域における量子化により導入される歪の大きさであり、H は、圧縮されたビットレートの大きさである。 以下、本発明を添付図面を参照して説明する。図において、 図1は、代表レベルと、決定レベルと、λの値の間の関係を示す図である。 図2は、MPEG2基準符号化器における量子化プロセスを示すブロック図で ある。 図3は、簡略化され改良された量子化プロセスを示すブロック図である。 図4は、図3の要部を示すブロック図である。 図5は、本発明の一態様による量子化プロセスを示すブロック図である。 図6は、本発明のさらなる態様による量子化プロセスを示すブロック図である 。 具体的に挙げた圧縮標準において、原振幅xは離散コサイン変換(DCT)か ら得られ、したがって、水平周波数指数fhorおよび垂直周波数指数fverに関連 している。この方法は、何が起きるかにおける例示として取り上げたものであり 、本発明はこの点において限定されるものではない。 一般に、量子化器は、周波数fhorおよびfverの原振幅xから振幅y=Q(x )へのマッピングを記述する。量子化器により実行されるマッピングは、図1に 示すように、代表レベルの集合{rl}と、対応する決定レベル{dl}により完 全に決定される。dl<x<d(l+1)の範囲内のすべての原振幅は、同一の代表レ ベルy=Q(x)=rlにマッピングされる。図1からわかるように、連続する 決定レベルは量子化ステップサイズqにより関連づけられる。所定の代表レベル rlについて、対応する決定レベルは次式により算出される。 dl+1=dl+q (1) dl=rl−λ/2・q (2) 量子化器は、量子化ステップサイズqおよび代表レベルの所定の集合{rl} に対するパラメータλにより完全に特定される。したがって、式(1)および( 2)を満たす量子化器は、(q,λ)量子化器と呼ぶことができる。 現在提案されている量子化器は、H.261、H.263、MPEG−1およ びMPEG−2標準のための基準符号化器に記載されているように、すべて、λ の固定値を用いた特別な種類の(q,λ)量子化器を用いている。たとえばMP EG−2基準符号化器ではλ=0.75であり、イントラDCT係数の量子化の ためのMPEG−1基準符号化器ではλ=1.0である。 本発明の一態様によれば、λは一定ではなく、水平周波数指数fhorと、垂直 周波数指数fverと、量子化ステップサイズqと、振幅xに依存する関数である 。 λ=λ(fhor,fver,q,X) (3) 所定のビットレートにおける映像圧縮における画像品質を改善するため、ある いは、所定の画像品質における所要ビットレートを減少させるために、上記関数 を有用に導き出す方法の例を以下に説明する。 本発明は、第1世代振幅y1=Q1(x)を第2世代振幅y2=Q2(y1)にマ ッピングして、原振幅xにアクセスすることなくビットレートを第1世代から第 2世代にさらに低減させる際の変換符号化の場合にも及ぶ。この場合には、第1 世代量子化器Q1および第2世代量子化器Q2は、それぞれ、(q1,λ1)型量子 化器および(q2,λ2)型量子化器として記述される。第2世代のλ2値は下記 の関数として記述される。 λ2=λ2(fhor,fver,q1,λ1,q2,λ2,ref,y1) (4) 式(4)にあらわれるパラメータλ2,refは、(q2,λ2,ref)型基準量子化 器において用いられる。この基準量子化器は、第1世代をバイパスし、原振幅x を第2世代基準振幅y2,ref=Q2,ref(X)に直接マッピングする。 式(4)の関数関係を、誤差(y2−y2,ref)あるいは誤差(y2−x) を最小化するために用いることができる。第1の場合には、得られる第2世代量 子化器を、最大事後[maximum a-posterior](MAP)量子化器と呼ぶこともあ る。第2の場合には、得られる第2世代量子化器を、平均二乗誤差[mcan squar ed error(MSE)量子化器と呼ぶこともある。第2世代(q2,λ2,MAP) 型および(q2,λ2,MSE)型量子化器の例を以下に示す。理論的背景のさらに詳 細な説明としては、「MPEG−2イントラフレームの変換符号化」と題する論 文−Oliver Werner−IEEE Transactions on Image Processing 1998を参照する。これは、簡略化の ために以下単に「論文」と呼ぶ。この論文の写しは本発明の優先権主張の基礎と なるイギリス特許出願第9703831号に添付されている。 本発明は、MPEG2映像符号化における「イントラ」DCT係数の量子化に 具体的に言及しているが、非イントラ係数や他の映像圧縮法や映像以外の信号の 圧縮にも適用できる。MPEG2において、テストモデル5(TM5)として知 られるものにより、先行技術が与えられている。正のイントラ係数に対するTM 5の量子化法を図2に示す。 説明の簡略化のために、上記の図は図3に置き換えられる。この図は、qの小 さな値を除き実質的に同一の量子化器を示している。ここで、これは、論文に記 載されているように偏差を補正する。 この量子化器において、入力係数は、まず、係数周波数に依存するが画像全体 にわたって固定された値である量子化器重み付けマトリクス値Wにより、つぎに 、ひとつのマクロブロックから次のマクロブロックへと変化し得るがすべての係 数周波数に対して同一の値である量子化スケール値qにより、除算される。加算 器の前では、等価逆量子化器再構築レベルは、単に、整数0,1,2,...で ある。次にこの値に固定数λ/2を加算し、その結果を頭切りする。λは、ゼロ の値のとき量子化器(加算器に入力される値の)に単なる頭切りをさせることを 意味し、一方、1の値は丸め処理をさせることを意味する。TM5において、λ の値は0.75に固定されている。 以下、図4に示す「コア」量子化器の動作に注目する。 フレーム内符号化のためのMPEG−2互換量子化器のクラスにおいて、非負 の原DCT係数x(あるいは重み付けマトリクス値Wによる除算のあとの同じ係 数)は、つぎのように代表レベルにマッピングされる。 負の値は反転させる。 y=−Q(|x|) (6) 式(1)における量子化ステップサイズqの振幅範囲を標準化する。qは、各 MPEG−2ビットストリームにおいて付随情報として伝送しなければならない 。このことは式(1)におけるパラメータλにはあてはまらない。このパラメー タはビットストリームからdct係数を再構築するためには必要ではなく、した がって伝送されない。しかしながら、λ値は、代表レベルの所定の集合に対する 原dct係数Xのマッピングを制御する。 rl=l・q (7) 式(1)にしたがって、(正の)x軸が決定レベルにより区分される。 各x∈[dl,dl+1)は代表レベルy=rlにマッピングされる。特別の場合 として、区間[0,d1)はy=0にマッピングされる。 パラメータλは、各量子化ステップサイズqについて調整することができ、こ れにより歪レートを最適化した量子化が得られる。二乗平均誤差 D=E[(x−y)2] (9) は、係数yに課せられるビットレート制約のもとで最小化される。分析を簡単に するため、MPEG−2符号語テーブルの代わりに係数yの一次ソースエントロ ピー H=Σl−Pl・log2l (10) をとり、ビットレートを計算する。論文において、MPEG−2符号語テーブル から得られるビット数の確実な推定値を引き出すためにエントロピーHを用いる ことができることが検証されている。式(10)において、Plは係数y=rlの 出現の確率をあらわす。 上記の制約された最小化問題は、ラグランジェの乗数法を用いてラグランジェ の乗数μを導入することにより解くことができる。すると、量子化パラメータλ を計算するための基礎式が得られる。 ここで、式(11)から得られるλの解はμの値に依存する。μの値はビット レート制約 H≦H0 (12) により決定される。ここで、H0は係数yを符号化するための最大許容ビットレ ートをあらわす。概して、ラグランジェ乗数の振幅範囲は、0<μ<∞である。 H0→∞の特別の場合には、μ→0が得られる。反対にH0→0については、一般 に、μ→∞が得られる。 ラプラスの確率密度関数(pdf)は、原dct係数の振幅の統計的分布を記 述するための適切なモデルである。さて、このモデルを式(11)を分析的に評 価するために用いる。すると、λについて得られる値を式(5)に挿入すること により歪レートを最適化した量子化器特性が得られる。 式(5)および(6)における正および負の振幅についての対称的な量子化特 性により、絶対原振幅|x|の分布を説明するためにpdf pを導入する。係 数y=0の出現の確率P0は次式のとおりである。 同様に、係数|y|についての確率Plは次式であらわされる。 式(13)および(14)を用いて、式(10)のエントロピーHの偏導関数 は、直接計算ののち次のように書きあらわされる。 式(9)からまず次式が導かれる。 さらに式(16)から次式が導かれる。 式(17)から次のことがわかる。 このように、λが0から1に増加すると、得られる歪Dは、λ=1について最 小値に到達するまで単調に減少していく。後者は二乗平均誤差の無制約最小化に 対する解であるが、しかしながら、得られるエントロピーHは、一般に、式(1 2)のビットレート制約を満足しない。 がわかる。すなわち、つぎのような単調な挙動がみられる。λを0から1に増加 させると、得られる歪Dは単調に減少し、同時に、得られるエントロピーHは単 調に減少する。直ちに、このような単調な挙動から反復的アルゴリズムを導くこ とができる。パラメータλははじめλ=1に設定され、得られるエントロピーH が計算される。Hが目標ビットレートH0よりも大きいならば、λの値は、式( 1 2)のビットレート制約が満たされるまで、さらなる反復ステップにおいて低減 される。この反復手順が、Iフレームの変換符号化について提案された簡略化歪 レート法の基礎をなすものであるが、引き続き、λについての分析的解を求めよ う。 式(15)および(17)はラプラスモデル について評価することができる。式(19)のモデルpdfを式(15)および (17)に挿入すると、基礎式(11)がλについての分析的解 を導くことがわかる。ここでz=e- α・qであり、‘z'−エントロピーは h(z)=−z・log2z−(1−z)・log2(1−z) (21) である。 式(20)は、その右辺の確率P0が式(13)によればλに依存するため、 単にλについての陰解を提供するにすぎない。一般に、P0の値は、式(5)お よび(6)の量子化特性を適用し、事象y=0の相対頻度を計数することにより 、既知のλについてのみ決定することができる。しかしながら、式(20)はλ についての固定少数点数式であり、これは、右辺を次の関数により記述するなら ばより明らかになろう。 その結果、古典的固定小数点形式λ=g(λ)が得られる。このように、ステフ ァン・バナッシュの固定小数点定理から、λについての解は、 λj+1=g(λj) (23) を用いた反復手順により,(j+1)番目の反復ステップにおいて見つけること ができることになる。(23)の反復は、関数gが「自己縮小性」、すなわち、 1より小さいリップシッツ定数をもつリップシッツ連続性であるならば、任意の 初期値λ0についての解に向かって収束する。微分学についての平均値定理の応 用として、偏導関数の絶対値が1より小さいならば、gがつねに「自己縮小性」 であることを証明するのは難しいことではない。このことは収束条件 を与える。 さて、歪レート最適化量子化方法を、上記で得られた結果に基づいて導き出そ う。一例として、MPEG−2イントラフレームのAC係数を量子化するための 技術を概説する。この技術をMPEG−2インターフレーム、すなわちPフレー ムとBフレーム、のdct係数を量子化するために修正することは単純なことで ある。 最初に、8×8dctブロックの63個のAC係数は同一の分布を共有するも のではないことを考慮に入れねばならない。すなわち、パラメータαiをもつ式 (19)による個々のラプラスモデルpdfを各AC周波数指数iに割り当てる 。 その結果、パラメータλiをもつ式(5)および(6)による個々の量子化特性 が得られる。さらに、量子化ステップサイズqiは、視覚重み[visual weight] wiと周波数非依存qscaleパラメータに依存する。 所定のステップサイズqiについて、量子化により、同じ周波数指数iのAC 係数についての歪Di(λi)とビットレートHi(λi)が得られる。dctは直 交変換であり、歪は二乗平均誤差により計測されるため、空間(サンプル/ピク セル)領域において得られる歪Dは、次式のとおり書きあらわすことができる。 ここでcは、正の正規化定数である。あるいは、異なる空間周波数における人間 視覚応答における変動を補償するために、重み係数領域において歪を計測するこ ともできる。 同様に、全体のビットレートHは次の通り得られる。 歪レート最適化量子化のために、63個のパラメータλiを、費用関数 D+μ・H (28) が最小化されるように調節しなければならない。非負ラグランジェ乗数μは、ビ ットレート定数 により決定される。 あるいは、歪を、対数領域において次式のように表現する場合には D'=20LOG10D dB (28a) 最小化すべき費用関数は B=D+μ'H (28b) となる。ここで、μ'は歪をビットレートにリンクさせる先験的定数である。 ホワイトノイズの符号化に基づく理論上の独立変数は、係数あたりビットあた り6dBの法則を与える。実用において、実際の符号化結果の観察は、異なるビ ットレートにおいてビットあたりkdBの法則を与える。ここでkは全体のビッ トレートに応じて約5〜約8の値をとる。実用において、直観的な「6dB」法 則は観察によく対応している。 さらに、qscaleパラメータは、式(25)のビットレート制約に合致す るように変更することができる。原理的には、視覚重みwiはさらなる自由度を 提供するが、単純化のために、MPEG−2基準復号化器におけるような固定重 みづけマトリクスを想定する。これにより、「C」言語様形式において記述する ことができる歪レート最適化量子化技術がつぎのとおり得られる。 ステップ1〜ステップ3を実行するためのいくつかのオプションがある。 1.ステップ1を実行するためのオプション パラメータλ1,λ2,...,λ63は a)第3章の式(20)〜(23)を適用することにより分析的に、あるいは 、 b)D+μ・Hの動的プログラミングにより反復的に決定することができる。 ここで、次の項目において説明するオプションのいずれかをDおよびHを計算す るために用いることができる。 2.ステップ2を実行するためのオプション H=ΣHi(λi)は次のいずれかにより計算することができる。 (a)ラプラスモデルpdfを適用することにより。これにより が得られ、ここでh(P0,i)およびh(Zi)は、それぞれP0i(式(13)) およびZi=e−αi・qiについて式(21)において定められるエントロピー である。ここで、式(32)におけるP0,iは、各dct周波数指数iについて ゼロ振幅y=Qi(x)=0の相対周波数を計数することにより決定することが できる。興味深いことに、式(32)は、得られるビットレートHに対する量子 化パラメータλiの効果が、ゼロ振幅確率P0,iを制御することにのみあることを 示すものである。 b)原dct係数のヒストグラムから。これにより式(10)と(13)と( 14)を用いて次式が得られる。 c)MPEG−2符号語テーブルを適用することにより。 3.ステップ3を実行するためのオプション D=c・ΣDi(λi)の計算は a)式(19)のラプラスモデルpdfを適用し式(16)を評価することに より、あるいは、 b)原dct係数xのヒストグラムから直接、D=E[(x−y)2]を計算 することにより、 行なうことができる。 ステップ1〜ステップ3についてどのオプションを選択するかによって、提案 された方法は、ラプラスモデルpdfを選択するならば単一パス符号化法に、M PEG−2符号語テーブルを選択するならばマルチパス法になる。さらに、本方 法は、フレームベースや、マクロブロックベースや8×8ブロックベースで適用 することができ、これらのオプションは適宜選択される。後者は、目標ビットレ ートH0をマクロブロックベースで局所的にあるいはフレームベースで全体的に 設定するようないかなるレート制御法に対しても特に重要である。 さらに、提案された方法は、レート歪の観点において最適なオプションである のなら、自動的に高周波数dct係数をスキップする。このことは、最終量子化 パラメータλi,optが、低周波数指数iについて1に近い値をもち、高周波数指 数について小さい値たとえばゼロをもつ場合に示される。 以上、MPEG−2互換符号化のための歪レート最適化量子化方法を、実施の ためのいくつかのオプションとともに説明した。本発明は、直ちに、独立型(第 1世代)符号化に適用することができる。特に、得られる結果は、複雑なレート 制御法を設計する助けとなる。 式(5)および(6)の量子化特性は、非負の振幅xに対して次式のとおり一 般化することができる。 れる。 y=−Q(|x|) (35) 一般化は、式(34)における振幅依存値λ(x),q(x),r(x)によ り反映される。代表レベルの所定の集合...<rl-1<rl<rl+1<...お よび所定の振幅xについて,次式を満足するような連続する代表レベルの対が選 択される。 局所的代表レベルの値は、したがって、 r(x)=rl-1 (37) に設定される。局所的量子化ステップサイズの値は、次式から得られる。 q(x)=ql=rl−rl-1 (38) 上述したレート歪概念の直接的拡張は、局所的ラムダパラメータについて、式 (20)と非常に類似して、次式を与える。 式(13)(14)と同様に、式(39)における確率は、ラムダパラメータ に依存する。 および したがって、式(39)は、λパラメータλ1,...,λLを決定するための 非線形式の系をあらわす。一般に、この系は数値的にのみ解くことができる。 しかしながら、式(39)は、項log2(Pl-1/Pl)を最適符号語長の差 分として解釈するならば簡略化することができる。最適符号語長は Il=−log2ll-1=−log2l-1 (43) であり、代表レベルrl,rl-1に結びつけられている。 以下、上記の実用的実施形態を説明する。 パラメータであれ実際のものであれ、量子化されていない係数の確率分布がわ かると、費用関数Bを最小化する量子化器決定レベルの集合を選択することが可 能となる。これは、エントロピーHおよび歪Dが、所定の確率分布に対する決定 レベルの関数であるからである。この最小化は、オフラインで実施することがで き、決定レベルの計算集合が確率分布の集合のおのおのに対して格納される。 一般に、各決定レベルに対応するλの最適値は異なる係数振幅に対して異なる ことがわかるだろう。実用において、振幅にともなうλの最適値の最大変動は、 もっとも内側の量子化器レベル(再構築レベルが0であるもの)とその他すべて のレベルとの間に認められる。このことは、場合によっては、各係数指数および 確率分布パラメータの各値(適切に量子化された)に対して、λの2つの値、す なわち、最も内側の量子化器レベルについてのものおよびその他すべてに対する ものとを計算すればじゅうぶんであることを意味する。 上記説明にともなう実用的なアプローチを図5に示す。 DCT係数は線形量子化器52にとりこまれ、ヒストグラム構築ユニット54 への入力を与える。すなわち、ヒストグラムは、入力DCT係数の線形量子化形 に基づく。この線形量子化器52のレベル間隔は重要ではなく、おそらくqの平 均値と略同一であればよい。必要とされるヒストグラム関数の程度は、pdfの パラメータ表現の複雑度に依存する。ラプラスあるいはガウス分布の場合には、 係数の平均や分散を計算すればよく、一方、論文で用いられている「ゼロ除外」 ラプラス法においては、平均値とゼロ値の比率を計算すればよい。このヒストグ ラムは、画像区間かそれ以上にわたって構築され、ブロック56において、pd fパラメータの推定値の基礎として用いられ、ブロック58におけるλの計算に 対する入力のひとつを提供する。 λの計算のもうひとつの入力は、量子化すべき係数がどの範囲の値に入るかを 決定する、事実上粗量子化器である比較器60の集合からのものである。上述し たもっとも起こり得る場合において、この値をもっとも内側の非ゼロ再構築レベ ルと比較すればよい。λを計算するために必要な最後の入力は量子化器スケール である。 一般に、λについての分析的式を得ることはできない。代わりに、pdfパラ メータと、比較器出力と、量子化器スケール値のさまざまな組み合わせについて 、一組の値を数値的に計算することができ、そ結果がルックアップテーブルに格 納される。このテーブルは、非常に大きいものである必要はない(たとえば10 00個未満の値を含む)。これは、最適値が非常にシャープではないからである 。 計算されたλの値はつぎに2で除算され、ブロック64における最終的な頭切 り処理に先だって、加算器62において係数に加算される。 式(43)による現在確率に依存する可変符号語長を用いる代わりに、可変符 号語長C0,...,CLの固定テーブルを用いてプロセスを簡略化することが できる。C0,...,CLの値は、トレーニング信号とビットレートの集合に対 して、単一の可変長符号、すなわち、ハフマン符号を設計することにより前もっ て決定することができる。原理的には、これらは、MPEG−2可変長符号テー ブルから直接得ることもできる。唯一複雑なことは、MPEG2可変長符号化が 、非ゼロ係数により終端される連続するゼロ係数の組み合わせに基づくことであ る。 この問題に対するひとつの解法は、MPEG2のVLCテーブルから「等価符 号語長」を推定することである。このことは、DCT係数の確率分布が互いに独 立していると仮定すればまったく簡単に行なうことができる。別の可能性は、現 在のDCTブロック内の最近の過去の量子化履歴を考慮して、全符号化コストに 対する2つの可能な量子化レベルのおのおのについて起こりそうな効果を推定す ることである。 つぎに、式(39)は次式に変わる。 結果として得られる歪レート最適化量子化アルゴリズムは、先に詳述したもの と実質的に同一である。但し、ラムダパラメータは、水平および垂直周波数指数 の各対について式(39)または式(44)から計算される。 以下、λ(x)を計算する簡略化された方法について説明する。ここで、各係 数について局所的歪のみが考慮される。 ここで、MPEG2における所定の画像に対して用いられる可変長符号(VL C)テーブルは固定され既知であるという事実を利用する。このことは、ビット レートと歪とのトレードオフの計算を簡略化するとともにより正確にする。特に 、このような計算は係数ベースで行なうことができる。これは、ある係数を量子 化するためのオプションのビットレートに対する効果が直ちにわかるからである 。同じことが量子化歪に対する効果についても成り立つ(証明はややむずかしい が)。 上の段落に含まれる推定を受け入れるならば、費用関数Bへの局所的寄与を最 小化するための決定レベルの値を非常に簡単に計算することができる。これは、 実際には、より低い再構築レベル(より高いレベルではなく)への量子化により 得られるビット数の減少が、量子化歪における対応する増加によりちょうど相殺 されるレベルである。 考慮される2つの再構築レベルが指数iおよびi+1を有し、対応する符号語 が長さLiおよびLi+1を有し、量子化器スケールがqであるならば: (i)ビット数の減少はLi+1−Liである。 (ii)歪の局所的増加は 20log10q(1−λ/2)−20log10qλ/2 である。 歪をビットレートにリンクさせる法則を用いてこれらを組み合わせると、次式 が得られる。 6(Li+1−Li)=20log10(2/λ−1) (45) あるいは、より簡単に Li+1−Li=log2(2/λ−1) (46) となり、次式が導かれる。 λ=2/(1+2(Li+1-Li)) (47) このすっきりした結果は、λの値が、ここでは、高い量子化器再構築レベルと 低いレベル間のビット数の差にのみ依存することを示している。 λのレベルがもはや係数確率分布および量子化器スケールの両方から独立して いるという事実は、図6に示す、より簡略化された以下の実施形態を導く。 ここで、DCT係数は、側鎖の頭切り処理ブロック70に送られてから、符号 化費用ルックアップテーブル72においてアドレスとして用いられる。ラムダ/ 2の値は、ブロック74により加算器76に与えられ、その出力が頭切り処理ブ ロック78において頭切り処理される。 符号化器における量子化を改善するために本発明を用いる非常に多くのやり方 を説明してきたが、当業者にはさらに他の方法が明らかであろう。本発明は変換 符号化および切り換えにも適用可能であることはもちろんである。 以下、2段量子化器の問題について検討しよう。この問題はいわゆる最大事後 (MAP)量子化器および平均二乗誤差(MSE)量子化器の理論を記述した論 文において詳細に検討されている。さらなる例示として、以下に、8×8離散コ サイン変換(dct)から得られるMPEG2[MPEG2]イントラAC係数 の変換符号化のためのMAPおよびMSE量子化器の実施形態について説明する 。 これらの式により定められる第1世代量子化器y1=Q1(x)のクラスは、量 子化ステップサイズq1およびパラメータλ1によりスパンされる。このような量 子化器は(q1,λ1)型量子化器と呼ばれる。 変換符号化器において、第1世代係数y1は、第2世代係数y2=Q2(y1)に マッピングされ、ビットレートをさらに低減させる。第1世代の、たとえばMP EG2基準符号化器TM5における(q1,λ1)型量子化器という仮定のもとで 、論文に記載された結果から、MAP量子化器Q2,mapおよびMSE量子化器Q2 ,mse が、それぞれ(q2,λ2,map)型および(q2,λ2,mse)型量子化器として 実施できる。MAP量子化器およびMSE量子化器の両方について、第2世代ス テップサイズq2が第2世代パラメータw2およびqscale2から計算される 。しかしながら、λ2,mapおよびλ2,mseを計算するための異なる式がある。 論文の結果を用いて、λ2,mapは次式のように計算することができる。 そしてλ2,mseは次式のとおり計算される。 パラメータλ2,refは、ビットレートと得られる信号雑音比を調節するため 子化器とくらべて、MAP量子化器についてのさらなる自由度を与える。λ2,re f =0.9の値が特に好ましい。パラメータμmapおよびμmseが第1世代量子化 ステップサイズq1およびz値から計算される。t係数y1からあるいは原dct係数xから、論文に記載されているように、計 算することができる。後者の場合にはz値は追加の付随情報、たとえばユーザデ ータとして、第1世代ビットストリームとともに伝送され、したがって、変換符 号化器におけるzのさらなる計算は不要となる。あるいは、デフォルトz値を用 いてもよい。個々のz値は、水平および垂直周波数指数の各対に対して割り当て られる。これにより、8×8dctのAC係数に対する63個の異なるz値が得 られる。周波数依存z値の結果として、パラメータλ2,mapおよびλ2,mse はやはり周波数依存であり、それぞれ63個の(q2,λ2,map)型量子化器およ び63個の(q2,λ2,mse)型量子化器が生じる。さらに、ルミナンスおよびク ロミナンス成分に対する異なるパラメータ集合がある。ルミナンスおよびクロミ ナンス成分に対するデフォルトz値は表1および表2にそれぞれ示されている。 表1 ルミナンスに対して正規化されたz値、たとえば256xz(デフォルト) 表2 クロミナンスに対して正規化されたz値、たとえば256xz(デフォルト) 以降の符号化および復号化プロセスに利用可能にするための好ましい技術の説 明や、従来の符号化復号化プロセスに関する情報については、EP−A−076 5576、EP−A−0807356およびWO−A−9803017を参照さ れたい。 MPEG−2イントラフレームの変換符号化 1.はじめに 変換符号化は、すでに圧縮された画像信号のビットレートをさらに低減させる ための重要な技術である。独立型ソース符号化器と対称的に、変換符号化器は、 原ソース信号と比較したときに量子化ノイズをすでに含む圧縮済みの信号に対し てのみアクセスをもつ。すなわち、変換符号化のビットストリーム出力は、変換 符号器の前の第1段におけるいわゆる第1世代符号化器とのカスケード符号化の 結果である。第1図参照。 s=ソース信号、enc.−1=第1世代符号化器、 transc.=変換符号化器、b1,b2=第1、第2世代ビットストリーム 第1図:第1世代符号化と引き続く変換符号化の結果としてのカスケード符 号化 変換符号化器の入力を定める第1世代ビットストリームb1と、出力をあらわ す第2世代ビットストリームb2は、ともに、MPEG−2[MPEG−2]適 合であると、全体にわたって仮定する。したがって、b1およびb2は、MPEG −2復号化器に通過させることができる。MPEG−2において、動き補償予測 (mcp)は、ハイブリッド符号化アルゴリズム[TM5−93]において、離 散コサイン変換(dct)と組み合わせられる。一般に、mcpとdct符号 化の両方の要素は、効率的な変換符号化のために利用することができる。インタ ーフレームすなわちPフレームおよびBフレームと比較して、mcpはイントラ フレーム(Iフレーム)においてスイッチオフされる。したがって、dct符号 化のみを、Iフレームを変換符号化するために利用することができる。この論文 においては、IフレームのMPEG−2互換変換符号化に専念する。MPEG− 2のIフレーム復号化器の一般化されたブロック図は第2図に示されている。 vld=可変長復号化器、idct=逆離散コサイン変換 b1(2)=第1(2)世代ビットストリーム y1(2)=第1(2)世代の復号化されたdct係数 s1(2)=第1(2)世代の再構築された画像信号 第2図:一般化されたMPEG−2のIフレーム復号化器 対応する第1世代の符号化器および変換符号化器をそれぞれ第3図および第4図 に示す。 dct=離散コサイン変換、Q1=第1世代量子化器、 vle=可変長符号化器 s=原ソース信号、x=原dct係数、y1=第1世代のdct係数、 b1=第1世代のビットストリーム 第3図:一般化されたMPEG−2互換第1世代Iフレーム符号化器 vld=可変長復号化器、Q2=第2世代量子化器、vle=可変長符号化器 b1=第1世代ビットストリーム、y1=第1世代のdct係数 b2=第2世代ビットストリーム、y2=第2世代のdct係数 第4図:一般化されたMPEG−2互換Iフレーム変換符号化器 第4図からわかるように、ビットレートをさらに低減させるための変換符号化 器要素は、第2世代量子化器Q2である。したがって、変換符号化の根本的な問 題点は、Q2の設計である。著者の知るところでは、過去、わずかに数点の刊行 物のみがこの問題にとりくんでいる。 [BT−94]および[Sarnoff−96]には、Q2において、第3図 の第1世代符号化器におけるQ1に用いられるものと実質的に同じ量子化器特性 を実現することが示唆されている。この場合には、Q1とQ2は同じ形、たとえば 均一な量子化器特性を持ち、その粗さレベルにおいてのみ異なる。すなわち、Q2 の代表レベルはQ1の代表レベルと比較してより広い間隔をおいている。Q2を 特定するための別のアプローチが[Columbia−95]に記載されている 。第1世代のDCT係数y1のおのおのがチェックされ、それを保持するかスキ ップするかの決定がなされる。すなわち、y2=Q2(y1)であり、ここで、Q2 (y1)=y1あるいはQ2(y1)=0が成り立つ。保持するかスキップするかの 決定は、フレームベースでの反復最適化手順において決定される。[Colum bia−95]において与えられている実験結果は、かなりの程度、高周波dc t係数がスキップされ、低周波dct係数が保持されることを示している。した がって、この種の量子化結果は、dctベースの低域通過フィルタリングをもた らし、これは、一般に、可視ブロックアーティファクトを導入するというリスク を負う。このアプローチは、第1および第2世代間の小さいビットレート変化に ついての変換符号化に対して考えることもできるが、dct係数のスキッピ ングが一般に良好に機能するかどうかは疑問に思われる。残念なことに、[Co lumbia−95]における実験結果は、4および3Mbits/sのあいだ の変換符号化についてのみ与えられ、たとえば9および3Mbit/sの間につ いてではない。[Sarnoff−96]において、著者はその実験結果におい て、dct係数のスキッピングは、4および3Mbit/sのあいだの変換符号 化についてさえも、Q1とQ2が同じ形をもちその粗さレベルにおいてのみ異なる 上記の再量子化とくらべて劣ることを示している。しかしながら、[Sarno ff−96]および[Columbia−95]においては、dct係数のスキ ッピングのための異なるアルゴリズムが用いられていた。 本論文は、変換符号化問題の理論的な分析を提供する。第2世代量子化器Q2の 正式説明は、特別な事例として[BT−94][Columbit−95][S arnoff−96]の上述した示唆を含んでいる。分析の結果から、二乗平均 誤差(mse)費用関数およびいわゆる最大事後(map)費用関数の両方につ いて最適量子化特性Q2を理論的に導き出す。これら2つの費用関数の間の差違 を、どんな場合に各費用関数がより適しているかを指摘しながら説明する。変換 符号化器において最適mseおよびmap量子化器特性を効率的に適用するため には、原dct係数xの統計をモデル化することが必要である。第3図参照。本 論文は、パラメータモデルを提案する。このモデルは、まず、現実の画像データ を用いて実証され、その後、mseおよびmap量子化器特性を評価するための 実験に用いられる。参考として、これらの結果はMPEG−2テストモデルTM 5[TM5−93]の量子化器特性の性能と比較される。 論文の残りの部分はつぎのとおり構成される。第2章において、MPEG−2 互換量子化器の正式説明が導入される。第1世代符号化器の量子化器Q1に適し た2つの例が論じられ比較される。第3章では、変換符号化器に用いられる第2 世代量子化器Q2に焦点を合わせる。Q2を設計する問題が、基準量子化器Q2,re f との比較を行なうことにより分析される。基準量子化器は、第1世代段階をバ イパスし、原信号を第2世代の所望のビットレートに直接的に圧縮する独立型符 号化器において用いられる。第4章において、Q2を設計する2つの方法が提案 され、説明され、比較される。第1の方法はmse費用関数を最小化し、第 2の方法はmap関連コストを最小化する。第5章において、原dct係数の統 計を説明するためのパラメータモデルが導入され、現実の画像データを用いて検 証される。このパラメータモデルに基づき、mseおよびmap費用関数の両方 についての分析的評価が第6章において実施される。実験結果は第7章において 論じられる。最後に、将来の研究のための結論と示唆を第8章に述べる。 2.第1世代符号化器におけるMPEG−2互換量子化 MPEG−2のIフレームは、原信号sの8×8サンプルのブロックに分割さ れる。第3図に示すように、各ブロックに対してdctが行なわれ、64個のd ct係数xiが得られる。DC係数x0は別に量子化され符号化される。DC量 024のAC係数xi,i=1,2,...,63に専念する。一般性を失うこ となく、周波数指数iを以下の議論について固定することができる。そこで、明 確さのために、周波数指数iは省略する。原dct係数xは第1世代量子化器Q 1に送られる。MPEG−2標準[MPEG−2]は、その標準部[normative part]において、代表レベルy1=Q1(x)の集合を定めている。第2図を参照 して、MPEG−2復号化器において、代表レベルy1は次式のとおり再構築さ れる。 y1=l1・q1 (1) ここで量子化ステップサイズはつぎのように表される。 ることができ、第1世代ビットストリームb1における(8×8)ブロックデー タとして伝送される。b1は追加の付随情報として、量子化ステップサイズq1を 計算するのに必要なw1およびqscale1の値を含む。w1の値は各フレー ムについて設定することができ、周波数指数に依存し、そこで、人間の視覚の周 波数依存特性を考慮している。qscale1の値は周波数指数に依存せず、各 フレーム内でマクロブロックベースで変化させることができる。マクロブロック は、おのおの8×8サンプルの、4つのルミナンスブロックと2つの共有サイト クロミナンスブロックからなる。MPEG−2互換量子化器は、(1)および( 2)の再構築則にしたがう。さらに、y1は、整数に丸めなければならないが、 これは、表記の簡略化のため、我々の説明においては省略する。所定のステップ サイズq1に対して、一義的なMPEG−2互換量子化器y1=Q1(x)は存在 しない。これは、原サンプルxの集合を代表レベルの所定の集合にどのようにマ ッピングするかの自由度が残っているからである。 一例として、量子化器特性は、非負の値xについて次のとおり定めることがで きる。 の量子化器特性はxの負の値について反転することができる。 y1=−Q1(|x|) (4) 式(3)のパラメータλ1は、正のx軸がどのようにして半開[half-open]の区 間[d1l,d1(l+1))に区分されるかを決定する。各区間は、1=0に対し である2つの連続する決定レベルd1lにより定義される。(3)によれば、各 x∈[d1l,d1(l+1))は同じ代表レベルr1l上にマッピングされる。 r1l=l・q1 (6) 第5図参照。 第5図:式(3)における量子化器の決定および代表レベル λ1の値は、量子化器性能を計測するために用いられる費用関数に合わせるこ とができる。ここで、2種類の性能が考慮される。 (i)mse性能 二乗平均誤差(mse)は、量子化器性能を計測するためのよく知られた費用 関数である。この場合、λ1の値は、期待値 E[(x−y12] (7) を最小化することにより決定される。 (7)を最小化するために、各原dct係数xは、最も近い代表レベルy1= r1lにマッピングされる。このように、微分計算を用いることなく、つぎのよう に結論することができる。すなわち、(7)を最小化する対応する決定レベルd1l は、代表レベルr1lの所定の集合に対する算術平均値により定義される。式(8)における結果は、[Lloyd−57]および[M ax−60]に記載されている有名なロイド−マックス量子化器設計規則の前半 とみなすことができる。その後半では、各代表レベルr1lが、対応するbin[ d1l,d1(l+1)]の局部的セントロイドに一致することが必要とされている。し かしながら、後者は、一般に、式(6)の信号非依存代表レベルについては達成 することができない。これは、局部的セントロイドは原dct係数xの確率分布 に依存ししたがって信号依存性であるからである。式(6)および(8)を用い て、式(5)からmse費用関数に対しての解がλ1=1であることが導かれる 。 (ii)レート歪性能 レート歪の観点においては、第1世代ビットストリームb1に対して所定のビ ットレート制約を受ける式(7)のmse項を最小化することがより適切である 。この場合には、第1世代dct係数y1を符号化するのに必要なビットレート は、設定値Hを越えてはならない。H1(λ1)が、式(5)による決定レベルd1l の調節のための結果的なビットレートを表すとしよう。すると、ラグランジェ 乗数の方法[Heuser−82]から、λ1の最適値は、拡張費用関数 E[(x−y12]+μ・H1(λ1) (9) を最小化することにより見出だされる。 式(9)におけるラグランジェ乗数μは制約 により決定される。 2つの極端な場合がある。H→∞について、ラグランジェ乗数はゼロに近づく 、 すなわち、μ→0、そして式(9)は式(7)に一致する。すなわち、結果的な ビットレートには何の注意も払われず、mseのみが最小化される。H→0につ いてはdct係数y1は一切符号化できない。その結果、決定レベルd1lは、l =1についてすでに無限大にちかづき、すなわちd11→∞となり、すべての原係 数xがゼロに量子化される。d11→∞となる後者の場合が、特別のブロックまた 選択された範囲の周波数指数、たとえば、すべての高周波dct係数にのみ適用 されるならば、式(9)および(10)はdct係数のスキッピングをもたらす 。 式(3)および(4)において特定される量子化器のmseおよびレート歪性 能を評価するために、CCIR601テスト信号「mobile」の最初の25 フレームを符号化した。λ1の2つの値を用いた。すなわち、a)λ1=1および b)λ1=0.75である。MPEG−2テストモデルTM5[TM5−93] において提案された重みづけマトリクスは、周波数依存量子化について用いられ た。第6図は、qscale1の関数としての、結果的なピーク信号対雑音比{ PSNR}を示す。qscale1の意味については式(2)を参照。 第6図:テスト信号「mobile」に対する式(3)および(4)の量子化 器のPSNR/mse性能 理論的結果によれば、最大のPSNR値がλ1=1について達成される。PS NR値は、値がλ1=0.75に変化すると約0.4dBだけ降下する。しかし ながら、λ1=0.75は、第7図において明らかにされるように小さいビット レートおよび中間のビットレートに対するレート歪性能の点ではよりよい選択で ある。たとえばPSNR=30dBの所定の歪について、結果的なビット量は、 λ1=1の場合には約450000ビット/フレームであり、λ1=0.75の場 合には約410000ビット/フレームである。これは、後者の場合において約 9%のビット節約をもたらす。逆に、450000ビット/フレームの所定のビ ット量に対して、PSNR値は、λ1=1からλ1=0.75への変化に際して、 30dBから30.5dBに約0.5dBだけ増加する。上述したように、ビッ トレートが無限大であれば、やはりλ1=1のレート歪性能が最善である。した がって、ビットレートが増加する際には、第7図のレート歪曲線の間に交点が予 測できる。これは第8図に示されている。38dBより大きいPSNR値に対応 する約1メガビット/フレームより大きいビットレートについては、結果はλ1 =1の方が有利である。しかしながら、λ1=0.75の結果との差違はかなり 小さい。 第7図 式(3)および(4)の量子化器のための小さいビットレート及び中 間ビットレートの場合のレート歪性能、テスト信号「mobile」 第8図 式(3)および(4)の量子化器のための高ビットレートの場合のレ ート歪性能、テスト信号「mobile」 λ1=0.75の値は、MPEG−2テストモデルTM5の量子化器のために 「意図された」値である。整数丸め操作を含む式(3)および(4)の簡略化さ れた計算により、TM5において用いられるλ1の値は、qscale1の値に依 存する。さらなる詳細については[TM5−93]におけるTM5の説明を参照 されたい。λ1とTM5のqscale1との関数的関係は第9図に示されている 。 第9図 MPEG−2テストモデルTM5、λ1とqscale1との関数的関 係 qscale1=2について得られるラムダ値はλ1=1であり、これは、良好 である。なぜなら、小さいqscale1値は高いビットレートに対応するから であり、そこでλ1=1は最善の選択である。qscale1が増加すると、λ1 の値は「意図された」値0.75に近付く。qscale1が4の倍数である場 合、たとえば、qscale1=4,8,12,16,...であるならば、こ の値は、正確に一致する、すなわちλ1=0.75となる。 もちろん、実験結果は、λ1=0.75が式(9)および(10)のレート歪 の観点における最適値であるという証拠を与えるものではない。λ1の調整、あ るいはより普遍的には、第1世代量子化器のレート歪性能を改善するために代表 レベルの所定の集合について決定レベルを調整することは、別の問題であり、こ の論文の範囲を越えている。以下の章では、第2世代量子化器に集中し、決定レ ベルの調整における自由度を、効率的な変換符号化のためにどのよう用い得るか を調べる。 3.変換符号化器におけるMPEG−2互換量子化−変換符号化問題 原dct係数xに対するアクセスを有する第1世代量子化器Q1と対照的に、 変換符号化器に用いられる第2世代量子化器Q2は第1世代dct係数y1に対し てのみアクセスを有する。すなわち、Q2は、第1世代dct係数を第2世代に マッピングする。 y2=Q2(y1) (11) 第1世代量子化器についての y1=Q1(x) (12) を用いて、原dct係数と第2世代との関係は y2=Q2(Q1(x)) (13) となる。 理想的には、式(13)におけるカスケード量子化の結果は、原dct係数へ のアクセスを有する基準量子化器Q2,refの出力と同一でなければならない。 y2,ref=Q2,ref(x) (14) 基準量子化器は、第1世代段階をバイパスし、原信号を第2世代の所望のビッ トレートに直接圧縮する独立型符号化器において用いられる。y2=y2,refにつ いて、変換符号化による追加の損失はない。 そこで、どんな場合についてy2=y2,refが達成できるかについての調査を用 いて、変換符号化問題の分析をはじめよう。一例として、第10図は、第1世代 のおよび変換符号化の基準の量子化器特性を示す。この例において、2つの 変換符号化の基本的事例が生じる。 事例1:第1の事例において、x軸上の半開区間[d1l,d1(l+1))を考える 。各x∈[d1l,d1(l+1))が、代表レベルy1=Q1(X)=r1l上に、第1世 代量子化器によりマッピングされる。その結果、この代表レベルが変換符号化器 特性y2=Q2(y1=r1l)によりどの第2世代の値y2にマッピングされるかに 関係なく、結果として得られる式(13)の特性は、常に、区間[d1l,d1(l+ 1) )全体にわたって一定である。しかしながら、式(14)の基準量子化器は、 区間[d1l,d1(l+1))に対して代表レベルを変更する。各x∈[d1l,dL,re f )は、代表レベルy2,ref=Q2,ref(X)=r2(L-1)上にマッピングされ、各 X∈[dL,ref,d1(l+1))はr2L上にマッピングされる。変換符号化器のつい てのジレンマは、区間[d1l,d1(l+1))全体をr2(L-1)上またはr2L上にマッ ピングするしかないことである。明らかに、最終選択がどのようになされるかに 関係なく、y2=y2,refはすべてのx∈[d1l,d1(l+1))について達成可能で はない。 事例2:第2の事例において、x軸上の区間[d1(l+1),d1(l+2))を考える 。この事例において、基準量子化器は、区間[d1(l+1),d1(l+2))全体を代表 レベルr2L上にマッピングする。したがって、変換符号化器がマッピング r2L=y2=Q2(y1=r1(l+1)) (15) を用いるのであれば、y2=y2,refは、すべてのx∈[d1(l+1),d1(l+2))に ついて達成可能である。 第10図 第1世代および変換符号化のための基準の量子化器特性 事例1は、x軸全体に対してy2=y2,refを満足するためには避けねばならな い。これは、基準量子化器の決定レベルの集合{dLref}が、第1世代量子化 器の決定レベル集合の{d1l}の部分集合を形成する場合に達成される。 {dL,ref}⊆{d1l} (16) 式(5)における決定レベルのパラメータ的説明のために、条件(16)は、 それぞれ第1および第2世代の量子化ステップサイズq1およびq2を含む等価条 件に変換することができる。 式(17)はつぎのとおり読み取られる。それぞれ第1世代と基準量子化器の 所定のパラメータλ1およびλ2,refについて、(17)の中間項が、同時にステ ップサイズの比q2/q1に等しくなければならない別の正の整数kになるような 正の整数n0が存在するならば、y2=y2,refはx軸全体について達成可能であ る。 一例として、λ1=λ2,ref=1である第1世代および基準量子化器のためのm se費用関数の場合には、式(17)はq2/q1=(2・n0+1)=kとなる 。これは、比q2/q1が奇数値の整数たとえば3,5,7,...に等しくなけ ればならないことを意味する。 一般に、任意のq1およびq2に対して、条件(17)を満たすことはできない 。そしてその結果、変換符号化による追加の損失が生じる。この損失は事例1に より説明することができる。第10図から、y2およびy2,refの間の不整 合は、決定レベルdL,refが区間[d1l,d1(l+1))の中央に一致する場合に特 別大きい。λ1=λ2,ref=1の上記例について、これは、偶数比q2/q1=2, 4,6,...により示される。 しかしながら、事例1は、式(17)が満たされないのであれば、全体を通じ て生じることはない。第1世代量子化器の決定区間は、2つのクラス、すなわち 、事例1に属するものたとえば第10図の[d1l,d1(l+1))と、事例2に属す るものたとえば第10図の[d1(l+1),d1(l+2))に区分される。一般に、得ら れる2つのクラスは、割り当てられた区間を同数もってはいない。事例1に属す る区間の割合は、q1およびq2ならびにλ1およびλ2,refに依存する。第10図 と比較して、事例1区間の割合は、比q2/q1が無限大に向かうにつれて漸近的 にゼロに向かって減少していく。実際、q2/q1=∞はn0,k→∞についての 式(17)の特別な場合とみなすことができる。したがって事例2の区間は全体 にわたって保証される。q1>0についてこれはq2=∞をもたらし、このことは 、変換符号化器ならびに基準量子化器におけるdct係数のスキッピングとして 解釈することができる。しかしながら、dct係数のスキッピングは、複雑な基 準量子化器が良好なレート歪性能を達成するためのデフォルトではない場合もあ る。たとえば式(3)および(4)により定義される基準量子化器である。した がって、事例1の区間における変換符号化による追加の損失を最小化する技術が 要求される。この問題は次の章で検討する。 4.変換符号化器において用いられる第2世代量子化器Q2の設計 前章の結果から、式(15)のマッピングを事例2の区間について変換符号化 器に適用しなければならない。したがって、この章は事例1の区間に集中する。 事例1の説明に戻って、変換符号化器は、第10図の区間[d1l,d1(l+1))に 対する2値決定をとらねばならない。区間[d1l,d1(l+1))は変換符号化器に おいて第1世代レベルy1=Q1(x)=r1lにより表現されるため、決定は、y1 =y1lを第2世代代表レベルy2=r2(L-1)あるいはy2=y2Lにマッピングす ることである。この決定は、費用関数の最小化にもとづいてなされた。ここで2 つの費用関数について考察する。 4.1 MSE費用関数 第3章の式(7)と同様に、二乗平均誤差(mse)費用関数を用いることが でき、その結果、期待値 E[(x−y22] (18) が得られる。 このように、この費用関数の目的は、原dct係数xと、変換器特性y2=Q 2(y1)から導かれる第2世代係数y2の間のmseを最小化することである。 式(18)のmse費用関数について、対応する基準量子化器Q2,refは、パラ メータλ2,ref=1および第2世代ステップサイズq2を用いて式(3)および( 4)により定義される。そこで、第10図の決定レベルdL,refは式(8)によ り代表レベルと関連づけられる。すなわち、 変換符号化器は第1世代係数y1に対するアクセスを有しているため、この情報 は、式(18)の項を最小化するために用いることができる。したがって、ms e費用関数は、y1に依存する条件付き期待値を導入することにより拡張される 。 E[(x−y22]=E[E[(x−y22|y1]] (20) 式(20)を用いて、結果として得られる2値決定則は、第10図の事例1区 間[d1l,d1(l+1))について下記のとおり書きあらわすことができる。 E[(x−r2(L-1)2|y1]<E[(x−r2L2|y1] E[(x−r2(L-1)2|y1]>E[(x−r2L2|y1] ならば 式(21)の条件付き期待値は、原dct係数xの確率密度関数(pdf)p (x)に依存する。pdfは、ひとつの値xが区間[d1l,d1(l+1))に入る確 率P1lを決定し、第1世代レベルy1=Q1(X)=r1lにマッピングされる。 局部的セントロイドの定義および式(19)の決定レベルを用いて、式(21)の決定則は、直接的計算の のち、つぎのとおり再記述することができる。 c1l<dL,ref 1l>dL,ref ならば 式(24)におけるc1l=dL,refの場合には、r2(L-1)およびr2Lの間で任 意決定をなすことができる。しかしながら、この場合には、決定は低いレベルす なわちr2(L-1)の方が有利である。これは、一般に、より低い振幅レベルがより 短いMPEG−2符号語に対応するからである。 4.1.1 mse費用関数の実施形態 変換符号化器において(24)を実施するにはいくつかの方法がある。ここで 、量子化特性y2=Q2(y1)としてのmse費用関数の直接的実施を概説する 。第1世代係数y1=r1lが与えられると、変換符号化器は、x軸上の対応する 区間[d1l,d1(l+1))を計算することができる。たとえば式(3)および(4 )の第1世代量子化器について次式が得られる。 そして d1(l+1)=d1l+q1 (26) ちなみに、式(25)および(26)において要求される第1世代量子化器ス テップサイズq1は、MPEG−2ビットストリームのどれかにおける付随情報 として伝送しなければならない。しカルながら、パラメータλ1はMPEG−2 においては指定できないので、たとえば、第1世代ビットストリームにおけるユ ーザデータとして、付加的に信号を送らねばならない。ユーザデータの定義につ いては[MPEG−2]を参照されたい。 区間[d1l,d1(l+1))を計算し終わると、対応する第2世代代表レベルを、 やはり第10図参照の基準量子化器Q2,refを用い、mse費用関数に対してλ2 ,ref =1を用いて、決定することができる。 および 式(27)および(28)を用いて、対応する決定レベルdL,refが式(19) から計算できる。 pdf p(x)は、式(22)および(23)により局部的セントロイドc1l を計算するのに必要である。追加の付随情報の量を節約するため、変換符号化 器は、いくつかのパラメータのみを含む、p(x)についてのモデル記述を利用 することができる。原dct係数xの統計を説明するのに適したパラメータモデ ルを次の第5章において詳述し検証する。 さて、式(24)の決定則を適用するための、すべてのパラメータすなわちr2(L-1) ,r2L,dL,refおよびc1lが利用可能となった。量子化器特性の観点に おいて(24)のよりコンパクトな形態は、つぎのように記述される。式(29)は、局部的セントロイドc1lの関数として第2世代係数y2を定める 。しかしながら、我々はむしろ変換符号化器の量子化特性y2=Q2(y1)に興 味をもっているため、局部的セントロイドは第1世代係数y1に関連づけねばな らない。式(25)におけるように、局部的セントロイドc1lは、セントロイド を決定レベルd1lに関連付けるパラメータμ1lにより特定することができる。 明らかに、μ1l=1について、局部的セントロイドは長さq1の決定区間[d1 l ,d1(l+1))の中心に一致する。式(25)および(30)から次式が導かれ る。 (31)を(29)に挿入した後、 を定義することにより、所望の結果 を得る。 このように、式(33)の変換符号化器の量子化器特性は、式(3)の第1世 代のものと実質的に同一である。しかしながら、(32)からわかるように、パ ラメータλ2は一般に定数ではなく、変動するy1とともに変化し得るμ1lの実際 の値に依存する。すなわち、第1世代パラメータλ1とは対照的に、第2世代パ ラメータλ2は、一般に、変換符号化器の量子化器の実際の入力値y1に依存する 。 にもかかわらず、pdf p(x)に依存する特別な場合において、パラメー タλ2は、定数となり得る。たとえば均一なpdfすなわちp(x)=定数に対 して、式(22)、(23)、(30)から、全体を通じてμ1l=1であり、式 (32)の結果として、λ2もまた定数となる。一定のパラメータλ2をもつ別の 特別な場合は、式(32)においてμ1l=λ1が成立するならば生じる。この場 合には、各第1世代係数y1は対応する局部的セントロイドc1lに一致する。式 (31)参照。これにより第2世代に対してλ2=1となる。 4.2 mseからmap費用関数へ 式(33)に加えて、mse決定則の別の直観的解釈がある。したがって、式 (30)によるパラメータμ1lで局部的セントロイドc1lを置換することにより 式(24)を再記述しなければならない。再配列の後、次式が得られる。 ならば 第10図を用いて、式(34)の項(dL,ref−d1l)/q1は、長さq1の区 間[d1l,d1(l+1))について均一なpdf p(x)=constの場合に第 1世代係数y1=r1lが与えられたとき、原dct係数xが区間[d1l,dL,ref )に入る事後確率Puniとして解釈することができる。すなわち、これは興味深い結果である。一般にpdf p(x)は不均一であるが、式(3 4)はPuniを計算してこの値をしきい値μ1l/2と比較することを示唆してい る。 一般に、事後確率Pmapはつぎのとおりpdfに依存する。 ここで、分母P1lは式(22)におけると同様に定義される。相補的事後確率は 次式によって与えられる。 p(x)=constである特別な場合について、式(36)の事後確率Pma p は式(35)のPuniと同一になる。また、局部的セントロイドに関連付けられ るパラメータは、全体を通じてμ1l=1となる。そこで、この特別な場合につい て、式(34)の決定則は式(36)および(37)を用いて次のとおり再記述 することができる。 ならば一般に非均一pdfすなわちp(x)≠constについて、式(38)の決定 則は式(34)のmse決定則とは一致しない。(38)の決定は、Pmapある て、式(38)はmap決定則と呼ばれる。 式(34)のmse決定則と式(38)のmap決定則とのもうひとつの重要 な相違は、基準量子化器Q2,refがmseの場合には固定されているがmapの 場合には任意で有り得ることである。ここで、Q2,refは式(36)および(3 7)における第2世代決定レベルdL,refを決定し、したがって、事後確率にた いして重要な影響をもつ。一例として、map決定則は、パラメータλ2,refに よりスパンされる、式(3)および(4)の基準量子化器Q2,ref=1のクラス に適用することができる。λ2,ref=1の特別な場合において、mse費用関数 の基準量子化器が得られる。しかしながら、すでに述べたように、map決定則 は、さらに、pdfが一定であれば、mse決定則とのみ一致する。 map決定則について基準量子化器を選択する自由度は、Q2,ref特性を特定 することにより利用することができ、これは複雑なレート歪性能をもたらす。こ のように、map決定則は、mseのみならず結果のビット量を考慮にいれるこ とができ、これは、レート歪の観点においてmse決定則と比較してより適切で ある。 式(34)のmse決定則が式(18)の費用関数を最小化するため、こんど はどんな費用関数が式(38)のmap決定則により最小化されるかについて考 えることができる。map決定則が次式の費用関数 E[(y2,ref−y22] (39) を最小化することを検証するのは難しいことではない。ここで、y2およびy2,r ef はそれぞれ式(13)および(14)に定義されている。興味深いことに、や はり最後にくるものは二乗平均誤差である。しかしながら、式(39)のmse は、レート歪の観点で、式(18)のmseよりもより適切である。 この章の最後に、注目すべきは、mseとmapの費用関数の両方ともにBa yesian費用関数「Melsa−Cohn]のグループに属することである 。 5.dct係数の統計を記述するためのパラメータモデル mseおよびmap費用関数の両方を適用するには、変換符号化器は、原dc t係数xのpdf p(x)を知る必要がある。基本的に、2つの可能なアプロ ーチがある。第1の場合には、p(x)は、第1世代ビットストリームとともに 、追加の付随情報として伝送される。第2には、追加の付随情報は一切伝送され ず、p(x)は第1世代dct係数y1から推定される。第1の場合には追加の 付随情報の量を制限する数個のパラメータのみを含むパラメータモデルが必要と される。さらに第2の場合にも、数個のパラメータのみをもつパラメータモデル が必要である。これは、再構築された係数y1は十分な振幅範囲をカバーしない ことがあり及び/またはそれらの数が、多数のパラメータについて確実な推定値 を達成するのに十分ではないことがあるからである。この問題は、「文脈希釈[ context dilution]」として知られている[Rissanen et al−9 6]。以下のステップにおいて、両方の場合に適した共通パラメータモデルが導 き出される。 第1のステップにおいて、p(x)を、ラプラス様pdfとして、次式のよう にモデル化することを提案する。 これは、ひとつの正のパラメータαにより記述することができる。先験的に、8 ×8ブロックのAC係数が同じ分布を共有すると想定することはできない。した がって、個々のα値が各AC周波数指数に対して特定され、全部で63個のパラ メータが得られる。 dct係数の離散的性質により、代表レベルy1=r1l=l・q1に遭遇する確 率P1lは式(22)により与えられる。q1=1の特別な場合について、P1lは 原dct係数xの確率とみなすことができる。(40)のパラメータモデルが原 dct係数xに対して適切であるかどうかをチェックするために、CCIR60 1テスト信号「mobile」の連続する10個のフレームについてのヒス トグラムが計算される。式(40)における正及び負の振幅についての対称性推 定により、絶対振幅レベル|x|=lの相対周波数nl/Nが計測される。ここ る。結果は63個のAC周波数すべてについて同様であり、選択された水平およ び垂直周波数指数の3つの例を第11図に示す。各曲線は|x|=l=1におい てその最大値をもち、lの増加にともなって急速に低下する。|x|=l=1に おける最大値は、より高い周波数についてより大きく鋭く突出し、このことは、 周波数が増加すると偏差が減少することを示す。同様な結果が他のテスト信号に ついて得られた。質的に、第11図に示す種類の曲線は、パラメータαを適宜調 節することにより式(40)を用いて生成することができる。 最善のパラメータ適合を得るために、第1世代量子化器により非ゼロ代表レベ ルy1≠0上にマッピングされるx値についてのみpdf p(x)を変換符号 化器が知る必要があるという事実を利用することができる。これは、第1世代係 数y1=0はつねに第2世代係数y2=0上にマッピングされるからである。し 11は最小の正の第1世代決定レベルである。 第11図 異なる水平および垂直周波数指数についての原dct係数の絶対振 幅レベルのヒストグラム、テスト信号「mobile」 式(5)のパラメータ記述について、d11=(1−λ1/2)・q1を得る。第 1世代量子化ステップサイズq1に非依存となるためには、d11の値は、d11= (1−λ1/2)・qminに設定することができ、ここでqminは、式(2)を満 たす可能な限り最小のステップサイズである。 したがって、pdfは次式のようにモデル化される。 式(41)におけるパラメータβは、|x|>d11の範囲についてのみ計算した 場合に、積分∫p(x)dxが1より小さいことを考慮したものである。βの値 は、次の条件に合わせるために用いることができる。 式(42)の右側は、第1世代量子化器によりy1=0に共通にマッピングされ る絶対値|x|=lの計測相対周波数nl/Nにより決定される。後者は、決定 レベルd11に依存する指数l0により式(42)において示されている。すなわ ち、(42)の右側にあらわれる合計 を計算するかわりに、事象y1=0の相対周波数f0を計測することもできる。 重要なこととして、mseおよびmap費用関数の両方に式(41)のパラメ ータモデルを適用するには、βは必要でないことに注目する。式(22)および (23)を用いた局部的セントロイドの計算中に、βの値は、式(23)の最上 部と最下行にあらわれるために相殺される。相殺は、式(36)および(37) の事後確率の計算中に、map費用関数についても発生する。そこで、αの値だ けが変換符号化器において必要である。その結果として、式(41)は、式(4 0)よりも、第11図に示す曲線に対するより良好な適合を提供し、その結果、 付随情報を増加させることなくパラメータαのより正確な推定値が得られる。 確率P1lは、式(22)に式(41)のパラメータモデルを挿入することによ り、式(5)の決定レベルのパラメータ記述について評価することができる。条 件(42)をも考慮した直接的な計算の後、次式が得られる。 式(43)は、第1世代係数y1=r1l=l・q1が観察される確率を示すこと に注意しよう。第1世代量子化器パラメータλ1は式(43)において必要では なくステップサイズq1だけでよいことに注目することが重要である。パラメー タモデル(41)の対称性推定により、(43)の結果としてP1l=P1(-l)を 得る。l=0について、確率はP10=f0に設定される。(43)における最大 指数すなわちLは、AC係数についての可能な最大値L=1024に設定するこ とができる。あるいは、より正確に、変換符号化器において実際に遭遇する最大 値に、設定してもよい。式(43)は第1世代係数y1からパラメータαを推定 するための基礎を構成するものの、原係数xからαを推定するための対応する数 式を必要とする。すでに述べたとおり、原dct係数は、ステップサイズq1= 1の特別な場合として生ずる。すなわちx=y1=r1l=l・1である。条件( 42)と組み合わせるとき、式(43)は次のとおり修正しなければならない。 先の場合におけるように、式(44)により定義されない|I|<l0の範囲 の指数についての確率は、原dct係数xの対応する相対周波数の値に設定する ことができる。 まず、式(43)によりパラメータαを推定することに集中する。理想的には 、式(43)のモデル確率Pllは、変換符号化器において計測できる第1世代係 数y1=r1l=l・q1の相対周波数f1と一致しなければならない。しかしなが ら、モデル内にはただひとつの自由パラメータ、すなわちα、のみがある。した がって、P1l=flは、一般に、各指数lについて達成可能ではない。符号化独 立変数は、αを調整するためのガイドラインとして用いることができる。(43 )のパラメータモデルを第1世代係数y1を符号化するのに用いたとしたら、最 小平均符号語長cwlは、次式のとおり得られるはずである。 cwlは、式(45)において対数を2を底としてとるならば、「係数あたりビ ット」単位で与えられる。(45)の右側は、全体に、P1l=flが成立する場 合にのみ到達可能なcwlの下限である(一次)ソースエントロピーをあらわす 。目標は、いまや、結果として得られるcwlが最小化されソースエントロピー entにできるかぎり近くなるような確率P1lのパラメータαを調整することで ある。さらに、興味深いこととしてcwlが次式のように書きあらわされること に注目する。 ここで、P(y11,y12,...,y1N)は、ある操作順序y11,y12,... ,y1Nに配列されたすべての第1世代係数y1についてパラメータモデル(43 )から得られる結合確率をあらわす。(46)の結果として、αを調節すること によるcwlの最小化は、観察された係数y11,y12,...,y1Nについての P(y11,y12,...,y1N)の最大化に一致する。このように、パラメータ αは最大尤度(ML)推定により決定されることがわかる。 αについてのML推定値は、(∂/∂α)cwl=0を用いて計算することがで きる。この計算を簡略化するため、式(43)における最大指数Lが無限大に向 かうときに生じるP1lのパラメータモデルを挿入することにより、式(46)を 評価する。これは、実際には、Lが非常に大きい、たとえばL=1024である という事実により正当化される。L→∞について、微分および再配列ののちに次 式が得られる。 式(47)において、αの値は、間接的にz=e−(α・q1)により与えらの測定された平均値をあらわす。式(47)から、αに対するML推定値 を得る。 代係数から測定して(49)のML推定値を決定すればよい。 パラメータαが第1世代係数y1からではなく、原dct係数xから推定され る場合には、対応する結果が得られる。この場合には、ML推定値を導き出すた めに式(43)の代わりに式(44)が用いられる。 により与えられる。 さきに触れたように、式(51)におけるn1/Nは、絶対値|x|=lの相 対周波数をあらわす。やはり第11図参照。式(50)および(51)のML推 定は、q1=l0=1の特別な場合における式(48)および(49)のML推定 と一致する。一般に、パラメータαについて異なる推定値が得られる。原dct 係数によりより多くの情報が提供されるため、(50)および(51)を用いた ML推定はより正確である。しかしながら、そのときには、パラメータαは、追 加の付随情報として信号伝送しなければならない。この場合には、αよりもz= e- αを信号伝送することがより好都合である。これは、z値は正規化された ractional binary number]に丸めることができるからである。(50)および (51)と対照的に、(48)および(49)を用いたML推定は、変換符号化 器に送らなければならない追加の付随情報を必要としない。 一例として、パラメータαを、式(50)および(51)を用いることにより 原dct係数xから第11図の各曲線について推定した。l0の値を決定するた めに、決定レベルd11にしたがって設定され、その結果 が得られた。 る。得られたz=e- αのML推定値は、qscalemin=2以上のすべてのq scale値に対して用いることができる。式(53)によれば、l0の値は、 AC係数の水平および垂直周波数指数とともに変化する視覚重みw1にのみ依存 する。MPEG−2テストモデルTM5の重みづけマトリクスが用いられた。さ らに、推定されたz値は、8ビット長の2進分数に丸められた。第12a〜12 c図は、第11図の測定されたヒストグラムと比較した、式(44)の得られた モデル確率を示す。ここで第12a〜12c図において、絶対振幅レベルに対す れている。 第12a図:式(44)によるモデル確率(実線)と原dct係数の絶対振幅レ ベルについてのヒストグラム(破線)、テスト信号「mobile 」第12b図:式(44)によるモデル確率(実線)と原dct係数の絶対振幅レ ベルについてのヒストグラム(破線)、テスト信号「mobile 」 第12c図:式(44)によるモデル確率(実線)と原dct係数の絶対振幅レ ベルについてのヒストグラム(破線)、テスト信号「mobile」 6.パラメータモデルについてのmseおよびmap費用関数の評価 本章においては、式(41)のpdf p(x)のパラメータモデルについて 、mseおよびmap費用関数の両方を評価する。モデルパラメータαは、前章 において説明したように推定することができる。mseおよびmap費用関数の 比較を容易にするために、式(34)および(38)の得られる決定則をそれぞ れ考察する。 最初に、式(34)のmse決定則を評価する。pdf p(x)は、式(3 0)による局部的セントロイドc1lに関するパラメータμ1lを決定する。局部的 セントロイドc1lは、式(22)および(23)に式(41)のパラメータモデ ルを挿入することにより、式(25)および式(25)および(26)の決 1を考えることができ、結果は、対応する負の指数−lについて反転することが できる。計算により次式が得られる。 式(30)から、c1l=d1l+μ1l/2・q1が得られ、式(54)との比較 により、 式(55)から、局部的セントロイドパラメータμ1lは、実際の第1世代係数 y1=r1l=l・q1により変換符号化器において選択される指数1に依存するの ではなく、推定パラメータαおよび第1世代ビットストリームから復号化される ステップサイズq1にのみ依存することが導かれる。そこで、式(41)のパラ メータモデルにより定義されるラプラス様pdfは、4.1.1章の最終段落で すでに考察した特別な場合からはなれた、一定のパラメータμ1lを生じる別の場 合である。したがって、式(41)のパラメータモデルは、やはり、変換符号化 器におけるmse決定則を実施するための複雑度を低減させる。 第2に、パラメータモデルを、式(38)のmap決定則について評価する。 式(25)(26)の決定レベルならびに式(41)のモデルpdfについて式 (36)および(37)の事後確率を計算した後、式(38)のmap決定則は 、式(34)のmse決定則と同様の形に書き直すことができる。 ならば 式(56)におけるmap閾値は次式で与えられる。 ここで、ln(a)は、独立変数aの自然対数、すなわち、底eに対する対数で ある。 このように、map決定則は、式(41)のパラメータモデルについてのms e決定則と実質的に同様に実現することができることがわかる。主な相違は、m se閾値が式(55)により、map閾値が式(57)により定義されること、 ならびに、決定レベルdL,refがmseの場合には固定されているが、4.2章 ですでに説明したようにmapの場合には基準量子化器Q2,refに依存して変化 することである。 同じ推定パラメータαをmseおよびmap費用関数の両方に用いることがで きる。したがって、変換符号化器は、追加の付随情報をさらに増加させることな く、局部的にたとえば8×8ブロックベースで、mseおよびmap費用関数を 切り換えるオプションを有する。 7.実験結果 先の各章において導き出された理論的結果を検証するために、第3図および第 4図の変換符号化セットアップを、CCIR−601[CCIR−601]フォ ーマットのテスト信号「mobile」の10個の連続するフレームについてシ ミュレートした。MPEG−2テストモデルTM5[TM5−93]は、MPE G−2独立型符号化器のための広く認知された基準であるため、第1世代量子化 器Q1を、実験全体を通じてTM5量子化器特性に固定した。 変換符号化器の量子化器特性Q2を、第1の実験においてTM5に固定した。 一例として、対応するqscale値をqscale2=32に固定した。この 値は、PおよびBフレームを含む3Mbit/sシミュレーションについて用い られるIフレーム調整に概ね対応する。MPEG−2の線形qscaleテーブ ルにしたがって、第1世代符号化器において用いられるTM5量子化器のqsc ale値を、qscale1=2,4,6,8,...,32の範囲において変 化させた。このように、変換符号化は、異なる第1世代ビットレートと第2世代 のための固定目標ビットレートについてシミュレートされた。第2世代ビットス トリームb2から再構築された画像信号s2について結果として得られたPSNR 値は、第13a図において、qscale1の関数として示されている。参考と して、実線は、第1世代をバイパスしqscale値32を用いて原信号を直接 符号化する独立型TM5符号化器の結果として得られたPSNR値を示す。信号 対雑音比のピーク値は、PSNR=10・log10[2552/mse]として 、原信号と第2世代信号のあいだの平均二乗誤差に関連づけられている。さらに 、第13b図は、MPEG−2イントラvlcテーブルを用いて第2世代AC係 数を符号化するために必要なビット量を示している。第13a図:固定されたqscale2=32についてのqscale1の関数と しての第2世代信号のPSNR、TM5、テスト信号「mobile」 第13b図:固定されたqscale2=32についてのqscale1の関数と しての第2世代信号のACビット量、TM5、テスト信号「mobile」 基準値と比べた場合、PSNR値は、16〜20の範囲におけるqscale1 の中間値について、1dBを越えるほど、急激に低下する。同時に、結果的な ビット量はかなり変動する。この場合には、結果として得られる比qscale2 /qscale1=q2/q1は2前後である。これは、3章における式(17) の考察において説明したように、変換符号化については好ましくない。一例とし て、qscale1=20について、PSNR値は基準ラインよりも約1.5d B低く、一方、結果として得られるビット量は、基準値および変換符号化信号に ついてほぼ(3%以内)同一である。第13a、13b図参照。qscale1 が22に増加すると、PSNR値が復帰し基準ラインのわずか0.1dB下にな る。しかしながら、このときビット量は基準ラインを約29%も上まわって急激 に超過する。連続するqscale1値のあいだのこのようなかなりの変動は、 変換符号化器に用いられるいかなるレート制御法に対しても最も好ましくない影 響をもち、その結果第2世代の画像品質が悪くなる。PSNR値は、qscal e1値がqscale2に近づくと回復するが、得られるビット量はかなり大き い。qscale1=qscale2=32について、トランスペアレンシーが達 成される。すなわち、第1および第2世代ビットストリームが等しくなる。TM 5量子化器は、2〜8の範囲における小さなqscale値について最善の結果 を提供する。明らかに、第1世代dct係数は、qscale1が小さいとき、 より少ない量子化ノイズを含み、その結果、第2世代および基準信号の間の相違 も小さくなる。同様の結果が他のテスト信号についても得られた。[OW−BB C−1] TM5量子化器特性に加え、変換符号化器は、mseとmap費用関数のいず れかを用いるというオプションを有している。いずれを選択するかの決定は、レ ート歪性能に基づいて行なうことができる。得られるPSNR/mse値は、p df p(x)についての式(41)のパラメータモデルを用いることにより変 換符号化器において推定し比較することができるが、各8×8ブロックのMPE G−2互換2次元(ランレングス、振幅)事象を形成し、イントラvlcテーブ ルから各符号語長を探すことにより、得られるビット量を各費用関数について計 算しなければならないとしたらかなり複雑になるだろう。式(45)におけるよ うに、変換符号化器が一次ソースエントロピーを計算することはそれほど複雑で はない。これは、その場合には、第2世代係数についてのヒストグラム計数のみ が必要だからである。第14a図は、63個のAC係数すべてについて合計した ソースエントロピーとの比較において、8×8ブロックについて縮小した第13 b図のMPEG−2イントラvlcについてのビット量を示す。第14a図に示 す2つの曲線は実質的に同じ形状を有することがわかる。このことは、各qsc ale1値についてそれらの比を計算すれば確認される。第14b図参照。この 比はほぼ一定、すなわち0.84である。このように、ビットレートの点でのm seおよびmap費用関数とTM5性能の比較は、やはり、MPEG−2イント ラvlcを用いることよりもソースエントロピーベースで実施することができる 。第14b図に示すもうひとつの興味深い結果は、MPEG2次元(ランレング ス、振幅)モデルのかわりにACエントロピーソースモデルを用いることにより 、約16%ものビットレートを節約できることである。しかしながら、この結果 はMPEG−2互換ビットストリームについて利用することはできない。 第14a図:第2世代AC係数のビット量:MPEG−2イントラVLC対一次 ソースエントロピー、テスト信号「mobile」第14b図:ビット量比:MPEG−2イントラVLC(実線)に対する一次ソ ースエントロピー、比=0.84(破線)、テスト信号「mobile」 第15a図:固定qscale2=32についてのqscale1の関数としての 第2世代信号のPSNR;mse(上側の線)、map/λ2,ref=0.90( 真中の線)、TM5(破線)、テスト信号「mobile」第15b図:固定qscale2=32についてのqscale1の関数としての 第2世代信号のACエントロピー;mse(上側の線)、map/λ2,ref=0 .90(真中の線)、TM5(破線)、テスト信号「mobile」 次の実験において、mseおよびmap費用関数をシミュレートした。map 費用関数の基準量子化器Q2,refは、式(3)および(4)に従うものである。 一例として、決定レベルパラメータをλ2,ref=0.90に設定した。原dct 係数に関して、第12a〜12c図参照の5章に挙げた例に説明したように、各 AC周波数指数についてpdfパラメータαを推定した。その結果、63×8= 504ビットの追加の付随情報が得られた。ここで、これらのα値は、式(52 )および(53)により推定されるので、実際のqscale1値には依存しな い。したがって、504ビットの追加の付随情報は、すべての第1世代ビットス トリームについて同一である。実際のqscale1値をqSCalemin=2の かわりに式(52)に挿入すれば、αのより正確な推定が可能である。しかしな がら、追加の付随情報は、その場合には、第1世代符号化プロセスに依存するこ とになる。 TMS量子化器、mseあるいはmap費用関数のいずれかを変換符号化器に おいて用いた場合の比較を第15a図および第15b図に示す。mse費用関数 は、最大のPSNR値を達成する。第15a図参照。たとえば、qscale1 =20の場合において、PSNR値は、TM5量子化器についての約25.6d Bからmse費用関数についての26.7dBまで約1.1dBだけ増加させる ことができる。しかしながら、AC係数のエントロピーがかなり増加するので、 mse費用関数は高いものにつく。第15b図参照。mse費用関数は、したが って、全体を通じて利用可能なのではない。しかしながら、mse費用関数を、 重要な画像内容を備えたブロックを変換符号化するために局部的に用いることが できる。さらなるオプションとして、mse費用関数を、低い周波数指数をもつ AC係数にのみ適用することができる。これは、人間の視覚系は一般に、低周波 数に付加される量子化ノイズに対して、より敏感であるからである。 map費用関数は、レート歪みの観点において、mse費用関数にくらべて、 より好適である。qscale1=20の臨界的な場合について、TM5と比較 して、ACエントロピーは約4.7%小さく、同時に、PSNR値は約0.4d B大きい。第15a図および第15b図は、map費用関数についてのほんの一 例を示すにすぎない。map費用関数はパラメータλ2,refにより支配される ため、レート歪特性の集合は、λ2,refを変化させることにより生成することが でき、PSNRならびに対応するビットレートの点において、TM5量子化器性 能とmse費用関数とのあいだのスムーズな移行が可能となる。第16a図およ び第16b図におけるλ2,refの異なる値についての結果は、単調な挙動を示す 。すなわち、λ2,refが増加すると、PSNR値とACエントロピーもまた増加 する。 第16a図:固定qscale2=32についてのqscale1の関数としての 第2世代信号のPSNR;異なる値のλ2,refについてのmap費用関数、テス ト信号「mobile」 λ2,ref=0.95(上側の線),0.90,0.85,0.80,0.75( 下側の線) 第16b図:固定qscale2=32についてのqscale1の関数としての 第2世代信号のACエントロピー;異なる値のλ2,refについてのmap費用関 数、テスト信号「mobile」 λ2,ref=0.95(上側の線),0.90,0.85,0.80,0.75( 下側の線) 最後の実験において、原dct係数からではなく第1世代係数からのpdfパ ラメータαを推定することの影響を調べる。αが第1世代係数から推定されるの であれば、追加の付随情報は不要である。2つの方法の比較は第17a図および 第17b図に、mse費用関数について示されている。第17a図のPSNR/ mse性能は、追加の付随情報があってもなくてもほとんど同一であるが、第1 7b図からは、付随情報がないと、得られるビット量は時としてかなり高くなる ことがわかる。すなわち、それほど驚くことではないが、これらの結果は追加の 付随情報を伝送する方をよしとしている。この結論は、map費用関数について は、第18a図および第18b図におけるλ2,ref=0.90の例について示し たように、必ずしも真実ではない。mse費用関数と同様に、ACエントロピ ーは、付随情報が伝送されない場合には(第18b図)、いくつかのqscal e1値についてはかなり高くなる。しかしながら、得られるPSNR値も、追加 の付随情報の場合についての対応するPSNR値を越える。このように、追加の 付随情報が変換符号化器に伝送されなくても良好な性能を達成することができる 。 第17a図:固定qscale2=32についてのqscale1の関数としての 第2世代信号のPSNR;付随情報のある場合とない場合のmse費用関数、テ スト信号「mobile」第17b図:固定qscale2=32についてのqscale1の関数としての 第2世代信号のACエントロピー;付随情報のある場合とない場合のmse費用 関数、テスト信号「mobile」 第18a図:固定qscale2=32についてのqscale1の関数としての 第2世代信号のPSNR;付随情報のある場合とない場合のmap費用関数、λ2,ref =0.90、テスト信号「mobile」第18b図:固定qscale2=32についてのqscale1の関数としての 第2世代信号のACエントロピー;付随情報のある場合とない場合のmap費用 関数、λ2,ref=0.90、テスト信号「mobile」 8.結論と将来の研究 本論文は、MPEG−2イントラフレームの変換符号化を論じている。変換符 号化問題の理論的な分析が、変換符号化器の量子化器特性の設計に重きをおいて 実行される。独立型符号化器の基準量子化器との比較により、特別な条件のもと で、変換符号化により、等価的な全量子化器特性のみをもたらすことが示される 。このことは、第1および第2世代量子化ステップサイズの比により示される。 いくつかの比についてのみ、原dct係数の第2世代係数へのマッピングは、基 準量子化器と変換符号化から得られる全量子化特性について同じである。一般に 、任意の比について、独立型基準量子化器特性は、変換符号化の間には達成でき ない。したがって、平均二乗誤差(mse)あるいはレート歪性能を考えたとき 、変換符号化による損失がある。この損失を最小限に押さえるため、MPEG− 2互換量子化器についての決定レベルの選択における自由度を利用することがで きる。 変換符号化器における決定レベルの調節のための2つの方法が提案され、説明 され、比較される。まず、mse費用関数の最小化を、決定レベルを調節するた めのガイドラインとしてとりあげる。mse費用関数の目的は、原係数と第2世 代係数の間の最小のmse値を与えることである。得られるmse決定則は、第 1世代量子化特性と実質的に同じやり方で、変換符号化器において実施すること ができる。しかしながら、mse費用関数は、第2世代係数を符号化するために 必要なビットレートに注意を全く払わないので、高いものにつく。したがって、 さらに、最大事後(map)費用関数を導入する。map費用関数は、レート歪 の観点において、mse費用関数よりも好適である。独立型基準量子化器はms e費用関数に対して固定されているが、map費用関数は、独立型基準量子化器 を選択する付加的な自由度を有している。このように、基準量子化器を変更する ことにより、レート歪特性の集合を、map費用関数を用いて生成できる。興味 深いことに、map費用関数はやはり平均二乗誤差(mse)により与えられる 。しかしながら、mse費用関数と対照的に、独立型基準量子化器の出力と第2 世代係数の間のmseは最小化される。 変換符号化器においてmseおよびmap費用関数の両方を用いるために、原 dct係数の統計的分布が必要である。ラプラス確率密度関数(pdf)に基づ くパラメータモデルが提案される。各周波数成分についてのひとつのパラメータ により、実際の信号統計への適合が可能とする。このパラメータは、変換符号化 器において第1世代係数からあるいは原dct係数から推定することができる。 一般に、後者の方がより正確な推定が得られる。しかしながら、この場合には、 パラメータを追加の付随情報として、第1世代ビットストリームとともに伝送し なければならない。両方の場合において、最大尤度推定則が導き出される。パラ メータモデルは、現実の画像データを用いて検証される。実験結果により、モデ ルpdfが、dct係数の分布を説明するのに適していることが確認される。 mseおよびmap費用関数は、パラメータモデルについて評価される。提案 されたモデルpdfは実施を簡単にすること、ならびに、その場合に、得られる mseおよびmap決定則が非常に簡単な形式で記述できることが示される。 実験結果は、mseおよびmap費用関数の有効性を確認する。参考として、 MPEG−2基準符号化器TM5[TM5−93]の量子化器特性を、変換符号 化器においても用いた。その結果は、第2および第1世代量子化ステップサイズ の比が2前後の場合について、第2世代係数のPSNR値とビットレートにおい て、大きな変動を示す。PSNR値は約1.5dB低下し、ビットレートは一定 に保たれる。あるいは、逆に、PSNR値が一定に保たれ、ビットレートは約3 0%増加する。このことは、変換符号化器に用いられるレート制御器にとっての 問題を引き起こす。mse費用関数は、最大PSNR値を達成し、TM5と比べ て1.1dBの利得をもたらす。しかしながら、mse費用関数は、最大ビット レートをも導き、したがって、重要な画像内容をもつブロックに対してのみ部分 的に適用される。さらなるオプションとして、mse費用関数は、低い周波数指 数をもつAC係数に対してのみ適用することができる。これは、人間の視覚系は 、一般に、低周波数に付加される量子化ノイズに、より敏感であるからである。 実験結果は、TM5とくらべて、map費用関数が、臨界的な場合において、 より低いビットレート(4.7%)と同時により高いPSNR値(0.4dB) を導き、よりすぐれたレート歪性能をもたらすことを示している。map費用関 数の基準量子化器を変更することにより、レート歪特性の集合が生成され、ms e費用関数とTM5のレート歪性能のスムーズな移行を可能とする。実験におい て、基準量子化器のクラスは、ひとつのパラメータによりスパンされる。その結 果は、基準量子化器パラメータの増加はより大きなPSNR値ならびにより大き なビットレートを導くという単調な挙動を示す。 実験結果は、mse費用関数について、原dct係数からのpdfモデルパラ メータの推定は、第1世代係数からのモデルパラメータの推定よりも、より良好 なレート歪性能を導くことを確認する。これは、map費用関数については、一 例において明らかなように、かならずしも該当しない。このように、第1世代ビ ットストリームとともに追加の付随情報を伝送しない場合にも、良好な変換器特 性が達成される。 さらに、第2世代係数の一次ソースエントロピーを用いて、MPEG−2イン トラvlc符号語テーブルから得られるビットレートの推定値を導き出すことが できることが示される。これにより、変換器が、最善のレート歪性能に基づいて TM5、mseあるいはmap費用関数のどれかに決めなければならない場合、 ビットレートの計算が簡略化されるはずである。得られるPSNR値は、ラプラ スモデルpdfに基づいて変換符号化器において比較される。このことは、レー ト歪性能の単調な挙動によりmap費用関数について簡略化することができる。 たとえば、フレームあるいはブロックベースで目標ビットレートを設定したあと で、基準符号化器のパラメータを、一次ソースエントロピーが目標ビットレート を越えるまで増加させればよい。上述のレート歪考察に基づく「実施しやすい」 アルゴリズムの探求は、将来の研究の、約束されたゴールである。さらに、提示 された結果は、動き補償予測を含むMPEG−2インターフレームすなわちPお よびBフレームの変換符号化に適合させることができる。しかしながら、符号化 器と復号化器の予測器の間のドリフト[OW−94][OW−96]の問題をさ らに考慮する必要がある。
【手続補正書】特許法第184条の8第1項 【提出日】平成11年4月16日(1999.4.16) 【補正内容】 請求の範囲(補正) 1.前の符号化処理を受けたデジタル信号の圧縮符号化により変換符号化を行 なう方法であって、両方の圧縮符号化処理は、変換プロセスを実行して値を生成 するステップと、各値の振幅範囲を一組の隣接区間に分割することにより上記値 を量子化するステップとを含み、各区間が、可変長符号化される一組の代表レべ ルの各々にマッピングされ、各区間の境界がパラメータλにより制御される方法 において、変換符号化において、λは、上記前の符号化処理におけるパラメータ の関数として、関連する代表レベルに関して各区間の境界を動的に変化させるよ うに制御されることを特徴とする方法。 2.各値は算術的にλに結びつけられることを特徴とする請求項1の方法。 3.λは、上記値によりあらわされる量の関数であることを特徴とする請求項 1または2の方法。 4.上記変換はDCTであり、λは水平および垂直周波数の関数であることを 特徴とする請求項3の方法。 5.λは量子化ステップサイズの関数であることを特徴とする上記請求項のい ずれかの方法。 6.λは上記値の振幅の関数であることを特徴とする上記請求項のいずれかの 方法。 7.量子化ステップサイズq=q2とλ=λ2の値を有し、量子化すべき上記値 は、先に、量子化ステップサイズq=q1およびλ=λ1の値を用いて量子化され たものであり、λはq1およびλ1の関数であることを特徴とする上記請求項のい ずれかの方法。 8.λはλrefの関数であり、λrefは、量子化ステップサイズq=q1を用い た量子化に先だって、上記値に対して量子化ステップサイズq=q2を用いて請 求項1の方法が動作する際に選択されたはずのλの値であることを特徴とする請 求項7の方法。 9.上記量子化ステップサイズqは、ゼロ量子化レベルに対するもの以外で、 入力値に非依存であることを特徴とする上記請求項のいずれかの方法。 10.各周波数指標fkをあらわす変換係数xkの集合に対して動作し、λはxk およびfkの値に応じて動的に制御される(q,λ)量子化器からなる、デジタ ル信号のための圧縮符号化器。 11.上記パラメータfkは周波数指数であることを特徴とする請求項10の 量子化器。 12.Dを、非圧縮領域における量子化により導入される歪、Hを、圧縮され たビットレートの大きさ、μを、上記ビットレート制約により決定される定数と するとき、λが費用関数D+μHを最小化するように動的に制御されることを特 徴とする請求項10あるいは11の量子化器。 13.μが反復処理において計算されることを特徴とする請求項12の符号化 器。 14.第1の(q1,λ1)型量子化器において量子化された圧縮信号に対して 動作する第2の(q2,λ2)型量子化器における第2世代λ2値が、関数 λ2=λ2(fhor,fver,q1,λ1,q2,λ2,ref,y1) として制御されることを特徴とする、圧縮デジタル信号のビットレートを変更す るための圧縮変換符号化器。 15.上記パラメータλ2,refが、第1世代符号化をバイパスし、原振幅を第 2世代基準振幅に直接的にマッピングする概念的基準(q2,λ2,ref)型量子化 器をあらわすことを特徴とする請求項14の圧縮変換符号化器。 16.上記パラメータλ2,refは経験的に選択されることを特徴とする請求項 14の圧縮変換符号化器。 17.上記パラメータλ2,refは各周波数について固定されていることを特徴 とする請求項16の圧縮変換符号化器。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),AU,CA,JP,U S (72)発明者 ワーナ,オリヴァー ハートウィッグ イギリス国,サリー シーアール2 7イ ーエイ,サウス クロイドン,バードハー スト ロード 14 シー,フラット 1 (72)発明者 ウェルス,ニコラス ドミニク イギリス国,イースト サセックス ビー エヌ2 2エイビー,ブライトン,ウェリ ングトン ロード 17 (72)発明者 ニー,マイケル ジェームス イギリス国,ハムプシャー ジーユー32 2イーイー,ピーターズフィールド,ウッ ドバリー アヴェニュー 6

Claims (1)

  1. 【特許請求の範囲】 1.変換プロセスを実行して値を生成するステップと、各値の振幅範囲を一組 の隣接区間に分割することにより上記値を量子化するステップとを含み、各区間 が、可変長符号化される一組の代表レベルの各々にマッピングされ、各区間の境 界がパラメータλにより制御される、デジタル信号を圧縮符号化する方法におい て、λは、関連する代表レベルに関して各区間の境界を動的に変化させるように 制御されることを特徴とする方法。 2.各値は算術的にλに結びつけられることを特徴とする請求項1の方法。 3.λは、上記値によりあらわされる量の関数であることを特徴とする請求項 1または2の方法。 4.上記変換はDCTであり、λは水平および垂直周波数の関数であることを 特徴とする請求項3の方法。 5.λは量子化ステップサイズの関数であることを特徴とする上記請求項のい ずれかの方法。 6.λは上記値の振幅の関数であることを特徴とする上記請求項のいずれかの 方法。 7.符号化される上記デジタル信号は、前の符号化復号化プロセスを受けたも のであり、λは、上記前の符号化複合化プロセスにおけるパラメータの関数とし て制御されることを特徴とする上記請求項のいずれかの方法。 8.量子化ステップサイズq=q2とλ=λ2の値を有し、量子化すべき上記値 は、先に、量子化ステップサイズq=q1およびλ=λ1の値を用いて量子化され たものであり、λはq1およびλ1の関数であることを特徴とする請求項7の方法 。 9.λはλrefの関数であり、λrefは、量子化ステップサイズq=q1を用い た量子化に先だって、上記値に対して量子化ステップサイズq=q2を用いて請 求項1の方法が動作する際に選択されたはずのλの値であることを特徴とする請 求項7または8の方法。 10.上記量子化ステップサイズqは、ゼロ量子化レベルに対するもの以外で 、入力値に非依存であることを特徴とする上記請求項のいずれかの方法。 11.各周波数指標fkをあらわす変換係数xkの集合に対して動作し、λはxk およびfkの値に応じて動的に制御される(q,λ)量子化器。 12.上記パラメータfkは周波数指数であることを特徴とする請求項11の 量子化器。 13.Dを、非圧縮領域における量子化により導入される歪、Hを、圧縮され たビットレートの大きさ、μを、上記ビットレート制約により決定される定数と するとき、λが費用関数D+μHを最小化するように動的に制御されることを特 徴とする請求項11あるいは12の量子化器。 14.第1の(q1,λ1)型量子化器において量子化された圧縮信号に対して 動作する第2の(q2,λ2)型量子化器における第2世代λ2値が、関数 λ2=λ2(fhor,fver,q1,λ1,q2,λ2,ref,y1) として制御されることを特徴とする圧縮変換符号化器。 15.上記パラメータλ2,refが、第1世代符号化をバイパスし、原振幅を第 2世代基準振幅に直接的にマッピングする概念的基準(q2,λ2,ref)型量子化 器をあらわすことを特徴とする請求項14の圧縮変換符号化器。 16.上記パラメータλ2,refは経験的に選択されることを特徴とする請求項 14の圧縮変換符号化器。 17.上記パラメータλ2,refは各周波数について固定されていることを特徴 とする請求項16の圧縮変換符号化器。
JP53742098A 1997-02-25 1998-02-25 改良された量子化処理を用いたデジタル信号圧縮符号化方法 Withdrawn JP2001518247A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB9703831.9 1997-02-25
GB9703834.3 1997-02-25
GBGB9703834.3A GB9703834D0 (en) 1997-02-25 1997-02-25 Quantiser for compression systems
GB9703831A GB2323493A (en) 1997-02-25 1997-02-25 Quantisation for compression systems
PCT/GB1998/000582 WO1998038800A1 (en) 1997-02-25 1998-02-25 Digital signal compression encoding with improved quantisation

Publications (1)

Publication Number Publication Date
JP2001518247A true JP2001518247A (ja) 2001-10-09

Family

ID=26311057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53742098A Withdrawn JP2001518247A (ja) 1997-02-25 1998-02-25 改良された量子化処理を用いたデジタル信号圧縮符号化方法

Country Status (7)

Country Link
US (1) US6668088B1 (ja)
EP (1) EP0963657B1 (ja)
JP (1) JP2001518247A (ja)
AU (1) AU727884B2 (ja)
CA (1) CA2280819A1 (ja)
DE (1) DE69809713T2 (ja)
WO (1) WO1998038800A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011510563A (ja) * 2008-01-17 2011-03-31 トムソン ライセンシング ビデオ符号化に於いてレート制御を正確にする方法及び装置
JP2012060210A (ja) * 2010-09-06 2012-03-22 Nippon Telegr & Teleph Corp <Ntt> 適応量子化方法,適応量子化装置および適応量子化プログラム
JP2023509826A (ja) * 2020-07-15 2023-03-10 テンセント・アメリカ・エルエルシー 置換ニューラル残差圧縮の方法、装置およびコンピュータプログラム

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010022752A (ko) * 1998-06-11 2001-03-26 요트.게.아. 롤페즈 디지털 비디오 레코더용 트릭 플레이 신호 발생
WO2000044176A1 (en) * 1999-01-21 2000-07-27 Koninklijke Philips Electronics N.V. Method and arrangement for quantizing data
US6414992B1 (en) * 1999-01-27 2002-07-02 Sun Microsystems, Inc. Optimal encoding of motion compensated video
GB2352903B (en) * 1999-07-30 2003-10-29 Sony Uk Ltd Video data compression
GB2352906B (en) * 1999-07-30 2003-10-29 Sony Uk Ltd Video data compression
CN1186940C (zh) * 1999-11-03 2005-01-26 皇家菲利浦电子有限公司 改进的数字视频和图像的级联压缩方法和系统
US6417949B1 (en) 1999-11-05 2002-07-09 Scientific-Atlanta, Inc. Broadband communication system for efficiently transmitting broadband signals
CN101035277A (zh) 2000-03-13 2007-09-12 索尼公司 产生压缩的代码转换提示元数据的方法和设备
KR100856398B1 (ko) * 2000-05-17 2008-09-04 삼성전자주식회사 복수 매핑 테이블을 이용한 가변장 부호화 및 복호화방법과 그 장치
KR20030086331A (ko) 2001-03-28 2003-11-07 소니 가부시끼 가이샤 양자화 장치, 양자화 방법, 양자화 프로그램 및 기록 매체
US6950463B2 (en) * 2001-06-13 2005-09-27 Microsoft Corporation Non-compensated transcoding of a video stream
US6763068B2 (en) 2001-12-28 2004-07-13 Nokia Corporation Method and apparatus for selecting macroblock quantization parameters in a video encoder
AU2002951574A0 (en) * 2002-09-20 2002-10-03 Unisearch Limited Method of signalling motion information for efficient scalable video compression
AU2003260192B2 (en) * 2002-09-20 2010-03-04 Newsouth Innovations Pty Limited Method of signalling motion information for efficient scalable video compression
EP1439712A1 (en) 2002-12-17 2004-07-21 Visiowave S.A. Method of selecting among "Spatial Video CODEC's" the optimum CODEC for a same input signal
US7403561B2 (en) * 2003-04-04 2008-07-22 Avid Technology, Inc. Fixed bit rate, intraframe compression and decompression of video
US7433519B2 (en) * 2003-04-04 2008-10-07 Avid Technology, Inc. Bitstream format for compressed image data
BRPI0506846B1 (pt) * 2004-01-30 2018-12-11 Thomson Licensing codificador de vídeo e método para codificar quadros de imagens divisíveis em macro-blocos
US7746927B1 (en) * 2004-03-26 2010-06-29 Apple Inc. Robust single-pass variable bit rate encoding
US7573952B1 (en) * 2005-08-23 2009-08-11 Sun Microsystems, Inc. Barycentric coordinate technique for resampling quantized signals
EP1937002B1 (en) * 2006-12-21 2017-11-01 Rohde & Schwarz GmbH & Co. KG Method and device for estimating the image quality of compressed images and/or video sequences
EP1940176A3 (en) 2006-12-28 2008-07-09 Siemens Aktiengesellschaft Method and device for coding a sequence of digitized images
WO2008080881A1 (en) * 2006-12-28 2008-07-10 Siemens Aktiengesellschaft Method and device for coding a sequence of digitized images
US10101049B2 (en) 2015-11-12 2018-10-16 Oracle International Corporation Determining parameters of air-cooling mechanisms
GB2568083B (en) * 2017-11-03 2021-06-02 Imagination Tech Ltd Histogram-based per-layer data format selection for hardware implementation of deep neutral network
GB2568081B (en) 2017-11-03 2022-01-19 Imagination Tech Ltd End-to-end data format selection for hardware implementation of deep neural network
EP3562156A1 (en) 2018-04-27 2019-10-30 InterDigital VC Holdings, Inc. Method and apparatus for adaptive context modeling in video encoding and decoding
KR102243119B1 (ko) * 2019-07-17 2021-04-21 한양대학교 산학협력단 가변 정밀도 양자화 장치 및 방법
US20230078190A1 (en) * 2021-09-15 2023-03-16 Synaptics Incorporated Image compression method and apparatus

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3511659A1 (de) 1985-03-29 1986-10-02 Siemens AG, 1000 Berlin und 8000 München Dpcm-coder/decoder mit adaptiv gesteuertem quantisierer
US5038209A (en) 1990-09-27 1991-08-06 At&T Bell Laboratories Adaptive buffer/quantizer control for transform video coders
DE69222332T2 (de) * 1991-02-21 1998-01-29 Nec Corp Kodierungsgerät zur Kompression von bewegten Bilddaten
US5293434A (en) * 1991-04-10 1994-03-08 International Business Machines Corporation Technique for use in a transform coder for imparting robustness to compressed image data through use of global block transformations
EP0509576B1 (en) * 1991-04-18 1998-01-28 Ampex Systems Corporation Method and apparatus for determining a quantizing factor for processes involving multiple compression/decompression of data
US5157488A (en) 1991-05-17 1992-10-20 International Business Machines Corporation Adaptive quantization within the jpeg sequential mode
EP0514663A3 (en) * 1991-05-24 1993-07-14 International Business Machines Corporation An apparatus and method for motion video encoding employing an adaptive quantizer
JPH06165151A (ja) 1992-11-25 1994-06-10 Matsushita Electric Ind Co Ltd 映像符号量制御装置
US5412429A (en) * 1993-03-11 1995-05-02 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Picture data compression coder using subband/transform coding with a Lempel-Ziv-based coder
KR0162203B1 (ko) 1993-06-21 1998-12-15 김광호 양자화스텝사이즈의 가변을 이용한 적응적 부호화방법 및 그 장치
DE69529579D1 (de) 1994-06-17 2003-03-13 Snell & Wilcox Ltd Komprimieren eines aus kompressionskodierten Videosignalen nach deren Teildekodierung kombinierten Signales
JPH08102943A (ja) 1994-09-30 1996-04-16 Fuji Xerox Co Ltd 画像符号化装置
JP3058028B2 (ja) * 1994-10-31 2000-07-04 三菱電機株式会社 画像符号化データ再符号化装置
US5889561A (en) * 1994-11-04 1999-03-30 Rca Thomson Licensing Corporation Method and apparatus for scaling a compressed video bitstream
US5706009A (en) 1994-12-29 1998-01-06 Sony Corporation Quantizing apparatus and quantizing method
EP0739138A3 (en) * 1995-04-19 1997-11-05 AT&T IPM Corp. Method and apparatus for matching compressed video signals to a communications channel
EP0768008B1 (en) * 1995-04-25 2000-07-05 Koninklijke Philips Electronics N.V. Device and method for coding video pictures
US5778192A (en) * 1995-10-26 1998-07-07 Motorola, Inc. Method and device for optimal bit allocation between different sources of information in digital video compression
KR100355375B1 (ko) * 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011510563A (ja) * 2008-01-17 2011-03-31 トムソン ライセンシング ビデオ符号化に於いてレート制御を正確にする方法及び装置
US9516328B2 (en) 2008-01-17 2016-12-06 Thomson Licensing Method and apparatus for rate control accuracy in video encoding
JP2012060210A (ja) * 2010-09-06 2012-03-22 Nippon Telegr & Teleph Corp <Ntt> 適応量子化方法,適応量子化装置および適応量子化プログラム
JP2023509826A (ja) * 2020-07-15 2023-03-10 テンセント・アメリカ・エルエルシー 置換ニューラル残差圧縮の方法、装置およびコンピュータプログラム

Also Published As

Publication number Publication date
EP0963657A1 (en) 1999-12-15
AU727884B2 (en) 2001-01-04
EP0963657B1 (en) 2002-11-27
DE69809713D1 (de) 2003-01-09
DE69809713T2 (de) 2003-05-15
US6668088B1 (en) 2003-12-23
CA2280819A1 (en) 1998-09-03
WO1998038800A1 (en) 1998-09-03
AU6303198A (en) 1998-09-18

Similar Documents

Publication Publication Date Title
JP2001518247A (ja) 改良された量子化処理を用いたデジタル信号圧縮符号化方法
JP6526869B2 (ja) ハイブリッドなビデオ符号化における予測誤差の適応符号化
JP5788927B2 (ja) ハイブリッドビデオ符号化のための量子化
JP3132456B2 (ja) 階層的画像符号化方式、及び階層的画像復号方式
JP5365518B2 (ja) 画像処理装置及び方法
KR100736104B1 (ko) 독립적 파싱을 지원하는 비디오 코딩 방법 및 장치
US20080240235A1 (en) Adaptive deadzone size adjustment in quantization
WO2009035149A1 (ja) 画像処理装置及び画像処理方法
WO2008072592A1 (ja) 映像符号化方法、映像符号化装置および映像符号化プログラム
JP2000516050A (ja) 符号化システムにおけるレート制御を最適にするための装置および方法
CN108574841B (zh) 一种基于自适应量化参数的编码方法及装置
JPH08172626A (ja) 画像圧縮符号化装置
TW201345265A (zh) 藉由預測階層資料單元的量子化參數對視訊進行編碼/解碼的方法及其裝置
JP3805734B2 (ja) 離散コサイン変換係数の予測方法
WO2009157581A1 (ja) 画像処理装置及び画像処理方法
JP5231243B2 (ja) 符号化装置及び符号化方法
US20240040128A1 (en) Image encoding device, image decoding device and program
US7965768B2 (en) Video signal encoding apparatus and computer readable medium with quantization control
JPH11513873A (ja) ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法
EP0784407B1 (en) Transform coefficient select method and apparatus for transform coding system
JPH0671333B2 (ja) 画像信号の符号化方法
KR101737006B1 (ko) 인지 품질 기반의 변환 부호화 고속화 방법 및 장치
JP3884410B2 (ja) ディジタル信号符号化の量子化ステップサイズ決定方法およびディジタル信号符号化装置
KR101070173B1 (ko) 동영상 압축 효율을 높이기 위한 변환블록의 부호화 장치와 방법
CN1643935A (zh) 使用量化器尺度选择来进行图像编码

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050207

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20050715