JP4234607B2 - 画像/ビデオエンコーダおよび/またはデコーダにおける符号化変換係数 - Google Patents

画像/ビデオエンコーダおよび/またはデコーダにおける符号化変換係数 Download PDF

Info

Publication number
JP4234607B2
JP4234607B2 JP2003581363A JP2003581363A JP4234607B2 JP 4234607 B2 JP4234607 B2 JP 4234607B2 JP 2003581363 A JP2003581363 A JP 2003581363A JP 2003581363 A JP2003581363 A JP 2003581363A JP 4234607 B2 JP4234607 B2 JP 4234607B2
Authority
JP
Japan
Prior art keywords
data symbols
zero
value data
maximum possible
codeword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003581363A
Other languages
English (en)
Other versions
JP2005522084A5 (ja
JP2005522084A (ja
Inventor
カーセレン,ラジップ
カルツェウィクツ,マータ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2005522084A publication Critical patent/JP2005522084A/ja
Publication of JP2005522084A5 publication Critical patent/JP2005522084A5/ja
Application granted granted Critical
Publication of JP4234607B2 publication Critical patent/JP4234607B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output

Description

本発明は、デジタルビデオを符号化するための、方法、エンコーダ、デコーダおよび装置に関する。さらに詳細には、本発明は、可変長符号化(VLC)を利用してビデオ/画像用エンコーダ/デコーダ内でのブロックベースの変換符号化の結果生成される量子化変換係数の符号化に関する。
フィルムに録画された通常の動画像のように、デジタルビデオシーケンスには一連の静止画像が含まれ、比較的高速なレート(一般に毎秒15〜30フレーム)で上記静止画像を次々に表示することにより動きの錯視が形成される。この比較的高速の表示レートに起因して、連続フレーム内の画像はきわめて類似したものになり、したがって、相当量の冗長な情報を含む傾向がある。例えば、一般的な場面には背景場面などの静止要素と、ニュースキャスタの顔や、人や車の動き等の多くの異なる形をとり得る若干の動画領域とが含まれる。上記とは別に、例えば、場面を録画するカメラ自体が移動している場合もある。その場合画像のすべての要素は同じ種類の動きを持つことになる。多くの場合、これは、1つのビデオフレームと次のフレームとの間の変化は全体としてはきわめて小さいことを意味する。
未圧縮のデジタルビデオシーケンスの個々のフレームは画像ピクセルからなる配列を有する。例えば、1/4共通交換フォーマット(QCIF)として知られる広く用いられているデジタルビデオフォーマットでは、1フレームに176×144ピクセルの配列が含まれ、各フレームは25、344個のピクセルを有する。個々のピクセルは、そのピクセルに対応する画像領域の輝度および/またはカラー内容に関する情報を担持する一定のビット数により表される。一般に、画像の輝度とクロミナンスの内容を表すためにいわゆるYUVカラーモデルが利用される。輝度(すなわちY)成分が画像の強度(輝度)を表すのに対して画像のカラー内容は、UとVでラベルされる2つのクロミナンスすなわち色差により表される。
三原色(赤、緑、青、RGB)を含む表示に基づくカラーモデルと比べた場合、画像内容の輝度/クロミナンス表示に基づくカラーモデルによって或る利点が得られる。人間の視覚系は、色の変動に対する場合に比べて強度の変動に対してより敏感であり、YUVカラーモデルは、輝度成分(Y)に対する空間分解能よりも低いクロミナンス成分(U,V)に対する空間分解能を用いることにより上記属性を利用するものである。このようにして、画像の品質を損なわない範囲で画像内のカラー情報の符号化に必要な情報量の低減を図ることが可能となる。
クロミナンス成分の低い空間分解能は、サブサンプリングを行うことにより通常達成される。一般に、ビデオシーケンスの個々のフレームはいわゆる“マクロブロック”に分画されている。この“マクロブロック”には輝度(Y)情報並びに空間的にサブサンプリングが行われる対応するクロミナンス(U,V)情報が含まれる。図3は、マクロブロックの形成を可能とする1つの方法を例示する図である。図3aはYUVカラーモデルを用いて表されるビデオシーケンスのフレームを示す図であり、個々の成分は同じ空間分解能を有する。マクロブロックは、16×16の画像ピクセル領域を表すことにより、輝度情報を示す4つのブロックとして原画像(図3b)内に形成され、個々の輝度ブロックには8×8の配列からなる輝度(Y)値、並びに、空間的に対応する2つのクロミナンス成分(UとV)が含まれる。この2つの色成分に対してxおよびy方向に2分の1のサブサンプリングを行って、8×8の対応する配列のクロミナンス(U,V)値が得られる(図3cを参照)。国際電気通信連合(ITU−T)勧告H.26Lなどの或るビデオ符号化勧告によれば、マクロブロック内で使用されるブロックサイズは、例えば4×8や4×4などの8×8以外にすることが可能である(ジョイントモデル(JM)2.0作業用ドラフト番号2、文献JVT−B118、ISO/IEC_MPEGのジョイントビデオチーム(JVT)およびITU−T VCEG、パタヤ、第2回JVT会議、ジェノバ、CH、2002年1月29日〜2月1日、セクション3.2を参照)。
QCIF画像には11×9のマクロブロックが含まれる。輝度ブロックとクロミナンスブロックとが(0〜255の範囲の数である)8ビット分解能で表される場合、マクロブロック当たりの必要総ビット数は、(16×16×8)+2×(8×8×8)=3072ビットとなる。したがって、QCIFフォーマットでビデオフレームを表すのに必要なビット数は、99×3072=304,128ビットとなる。これは、QCIFフォーマットで未圧縮のビデオシーケンスの送信/記録/表示を行うのに必要なデータ量であって、毎秒30フレームの速度でYUVカラーモデルを用いて表されるデータ量が9Mbps(毎秒百万ビット)よりも多いデータ量となることを意味する。このレートは非常に高速のデータレートであり、非常に大きな記憶容量、送信チャネル容量および求められるハードウェアの性能に起因して、アプリケーションのビデオ録画時、アプリケーションの送信時、および、アプリケーションの表示の際に使用するには実際的な速度でない。
ビデオデータが、ISDN(総合デジタル通信網)や従来のPSTN(公衆電話交換網)などの固定ラインネットワークを介してリアルタイムで送信される場合、利用可能なデータ送信帯域幅は一般に64kbit/sのオーダーである。無線通信リンクを介して少なくとも部分的に送信が行われる携帯型テレビ電話では、利用可能な帯域幅は20kbit/sほどの低い帯域幅になる可能性がある。これは、低い帯域幅の通信ネットワークでデジタルビデオシーケンスの送信を可能にするためには、ビデオデータを表すのに用いる情報量の著しい低減を達成することが必要であることを意味する。この理由のために、容認できる画像の品質を保持しながら送信を行う対象情報量の低減を図るビデオ圧縮技術が開発されてきた。
ビデオ圧縮法は、ビデオシーケンスの冗長な部分並びに知覚上無関係な部分の縮減に基づく方法である。ビデオシーケンス内の冗長性はカテゴリ上空間的、時間的およびスペクトル的冗長性に分類することができる。“空間的冗長性”とは、フレーム内で隣接するピクセル間の相関関係(類似性)の記述に用いる用語である。“時間的冗長性”という用語は、シーケンスの1つのフレーム内に現れる対象物が後続フレーム内に出現する可能性が大きいという事実を表現するものであり、一方、“スペクトル的冗長性”とは同じ画像の異なる色成分間での相関関係を意味するものである。
所定の画像シーケンス内の種々の形の冗長性を単に低減するだけでは十分効率のよい圧縮の達成を行うことは通常不可能である。したがって、最新のビデオエンコーダでは、ビデオシーケンスの主観的重要度が最も低い部分の品質を落すことも行われている。さらに、効率のよい、損失の少ない符号化によって、圧縮済みビデオビットストリーム自体の冗長性が低減される。一般に、これはエントロピー符号化として公知の手法を用いて達成される。
かなりの量の空間的冗長性が、デジタルビデオシーケンスの個々のフレームを形成するピクセル間に存在する場合が多い。言い換えれば、シーケンスのフレーム内のいずれのピクセル値もそのすぐ近辺の別のピクセル値とほぼ同一である。一般的に、ビデオ符号化システムは、"ブロックベースの変換符号化"として公知の技法を用いて空間的冗長性を低減するシステムであり、このシステムでは、2次元離散余弦変換(DCT)などの数学的変換が画像ピクセルのブロックに対して適用される。この適用によって、ピクセル値を含む表示から、空間周波数成分を表す1組の係数値を含む形式へ画像データが変換され、空間的冗長性を大幅に低減させて、それにより、画像データのさらにコンパクトな表示が生成される。
シーケンス内の他のいずれのフレームも参照することなく、ブロックベースの変換符号化を用いて圧縮されたビデオシーケンスのフレームはイントラ符号化フレーム(I−フレーム)と呼ばれている。これに加えて、また、可能な場合には、同じフレーム内で前に符号化されたブロックからイントラ符号化済みフレームのブロックが予測される。この手法は、イントラ予測として公知のものであるが、イントラ符号化済みフレームの表示に必要なデータ量をさらに減らす効果がある。
一般的に、ビデオ符号化システムでは、ビデオシーケンスの個々のフレーム内の空間的冗長性の低減だけでなく、シーケンス内の時間的冗長性を低減する"動き補償予測"として公知の手法も利用される。動き補償予測を利用して、デジタルビデオシーケンス内のいくつかの(しばしば多数の)フレームの画像内容が"参照"フレームとして公知の、シーケンス内の1または2以上の別のフレームから"予測される"。画像内容の予測は、"動きベクトル"を用いて、符号化対象(被圧縮)フレームと、参照フレームとの間の画像オブジェクトまたは画像領域の動きを追尾することにより達成される。一般に、参照フレームは、ビデオシーケンスの符号化対象フレームに先行するものであってもよいし、符号化対象フレームに後続するものであってもよい。イントラ符号化の場合のように、一般にビデオフレームの動き補償予測はマクロブロック毎に行われる。
動き補償予測を利用して圧縮されたビデオシーケンスのフレームは一般にインター符号化フレームすなわちP−フレームと呼ばれる。動き補償予測は単独でビデオフレームの画像内容を十分正確に表示することはめったにない。したがって、個々のインター符号化済みフレームにいわゆる"予測誤差"(PE)フレームを設けることが一般に必要となる。予測誤差フレームとは、インター符号化フレームの復号化バージョンと、符号化対象フレームの画像内容との間の差を表すフレームである。さらに詳しく言えば、予測誤差フレームには符号化対象フレーム内のピクセル値と、当該フレームの予測バージョンに基づいて形成される対応する再構成済みピクセル値との間の差を表す値が含まれる。その結果、予測誤差フレームは静止画像と類似の特徴を有するものとなり、この予測誤差フレームの空間的冗長性、したがって上記フレームを表すのに必要なデータ量(ビット数)の低減のためにブロックベースの変換符号化の適用が可能となる。
さらに詳細にビデオ符号化システムの作動を示すために、次に図1と図2とを参照することにする。図1は、イントラ符号化およびインター符号化の組み合わせを用いて、圧縮された(符号化済み)ビデオビットストリームを生成する一般的なビデオエンコーダのブロック図である。対応するデコーダが図2に示されている。このデコーダについては後程テキストで説明する。
ビデオエンコーダ100は、カメラまたは別のビデオソース(図示せず)からデジタルビデオ信号を受け取る入力部101を備える。ビデオエンコーダ100は、ブロックベースの離散余弦変換(DCT)を実行するように構成される変換ユニット104と、量子化器106と、逆量子化器108と、反転ブロックベースの離散余弦変換(IDCT)を実行するように構成される逆変換ユニット110と、コンバイナ112と116と、フレーム記憶部120も備える。エンコーダは、動き推定装置130、動きフィールドコーダ140および動き補償予測器150をさらに備える。スイッチ102と114はコントロールマネージャ160により協働して操作され、ビデオ符号化のイントラモードと、ビデオ符号化のインターモードとの間のエンコーダの切り替えが行われる。エンコーダ100は、エンコーダ100が生みだす種々のタイプの情報から単一のビットストリームを形成するビデオマルチプレクスコーダ170も備え、遠隔地にある受信端末へのさらなる送信や、例えば、コンピュータのハードドライブ(図示せず)などの大容量記憶媒体への記憶が行われる。
エンコーダ100は以下のように作動する。ビデオソースから入力部101へ出力される未圧縮のビデオの個々のフレームが、好適にはラスタ・スキャン順にマクロブロック毎に受信され、処理される。新たなビデオシーケンスの符号化が開始されると、符号化の対象とする第1のフレームがイントラ符号化済みフレームとして符号化される。次に、以下の条件、すなわち、1)符号化中のフレームの現マクロブロックが、その予測時に用いられる参照フレーム内のピクセル値とは非常に異なる種類のものであるため、過剰な予測誤差情報が生みだされていると判断され、その場合現マクロブロックがイントラ符号化フォーマットで符号化されたものである;2)予め規定されたイントラフレーム反復間隔が時間切れになっている;あるいは、3)イントラ符号化フォーマットでフレームを出力すべき旨の要求を示すフィードバックが受信端末から受信される;のうちの1つの条件が満たされない限り、エンコーダはプログラムされて、個々のフレームの符号化がインター符号化フォーマットで行われる。
条件1)の発生は、コンバイナ116の出力信号のモニタを行うことにより検出される。コンバイナ116は、符号化中のフレームの現マクロブロックと、動き補償予測ブロック150で生成される、符号化中のフレームの現マクロブロックの予測マクロブロックとの間の差を形成する。この差の測定値(例えばピクセル値の絶対差の和)が所定のしきい値を上回った場合、コンバイナ116は制御ライン119を介してコントロールマネージャ160にこれを通知し、コントロールマネージャ160は、制御ライン113を介してスイッチ102と114を作動させて、エンコーダ100のスイッチを入れ、イントラ符号化モードにする。このようにして、そうでない場合にはインター符号化フォーマットで符号化されるフレームはイントラ符号化済みマクロブロックを含むことができるようになる。条件2)の発生は、タイマまたはコントロールマネージャ160に実装されたフレームカウンタによってモニタされ、タイマが時間切れになった場合、または、フレームカウンタが所定数のフレームに達した場合、コントロールマネージャ160が制御ライン113を介してスイッチ102と114とを作動させて、エンコーダのスイッチを入れ、イントラ符号化モードにするように図られる。条件3)の場合、コントロールマネージャ160が、例えば受信端末によりイントラフレームのリフレッシュが必要であることを示す制御ライン121を介して受信端末からフィードバック信号を受け取った場合条件3)がトリガーされる。例えば、前に送信されたフレームがその送信の最中に障害によりひどく損なわれて受信側での復号化が不可能な場合に、このような条件が発生することが考えられる。この状況で、受信側デコーダは、イントラ符号化フォーマットで次のフレームを符号化する旨の要求を出し、符号化シーケンスの再初期化が行われる。
イントラ符号化モードでのエンコーダ100の作動について以下説明する。イントラ符号化モードで、コントロールマネージャ160はスイッチ102を作動させて、入力ライン118からビデオ入力を受け入れる。このビデオ信号入力は、入力ライン118を介してマクロブロック毎に入力部101から受信される。ビデオ信号入力が受信されると、マクロブロックを形成する輝度値とクロミナンス値とからなるブロックがDCT変換ブロック104へ渡され、このDCT変換ブロック104は、複数の値からなる個々のブロックに対して2次元離散余弦変換を実行して、個々のブロックに対応する2次元配列のDCT係数を生成する。DCT変換ブロック104は、個々のブロックに対応する係数値の配列を形成し、係数値の個数は、マクロブロックを形成するブロックの性質に依拠する。例えば、マクロブロックで使用される基本となるブロックサイズが4×4である場合、DCT変換ブロック104は個々のブロックに対してDCT係数の4×4の配列を形成する。ブロックサイズが8×8である場合、8×8配列のDCT係数が形成される。
個々のブロックに対応するDCT係数は、量子化器106へ渡され、この量子化器106で、量子化パラメータQPを用いてDCT係数の量子化が行われる。量子化パラメータQPの選択は、制御ライン115を介してコントロールマネージャ160により制御される。量子化係数が、DCT変換ブロック104により当初生成された係数よりも低い数値精度を持つため、量子化による情報の損失が生じる。この損失は、ビデオシーケンスの個々の画像を表すのに必要なデータ量を低減する更なる機構を提供する。しかし、実質的に損失のないDCT変換とは異なり、量子化により生じる情報の損失は、画質の不可逆的劣化を引き起こす。DCT係数に印加される量子化の程度が大きければ大きいほど、画質の損失は大きくなる。
個々のブロックに対する量子化DCT係数は、図1のライン125により示されるように、量子化器106からビデオマルチプレクスコーダ170へ渡される。ビデオマルチプレクスコーダ170は、ジグザグスキャニング手順を用いて個々のブロックに対応する量子化変換係数を並べる。この処理は2次元配列の量子化変換係数を一次元配列に変換する。図4に図示の4×4配列の場合のような一般的ジグザグスキャニング順序によって、空間周波数の昇順に近似的に係数が並べられる。これは、係数をその値に基づいて並べて、それによって一次元配列で以前に配置された係数のほうが配列内で後で配置された係数よりも大きな絶対値を持つ可能性が大きくなるようにするのに役立つ。これは、低い空間周波数のほうが、画像ブロック内でより高い振幅を持つ傾向があるということに起因する。したがって、量子化変換係数の一次元配列内の最後の値は一般に0である。
一般に、ビデオマルチプレクスコーダ170は、レベルとランと呼ばれる2つの値によって一次元配列の個々の非ゼロ量子化係数を表す。レベルとは量子化係数の値であり、ランとは当該係数に先行する連続するゼロ値係数の個数である。所定の係数に対するランとレベルとは、レベル値が対応するラン値に先行するように並べられる。0に等しいレベル値を利用して、ブロック内に非ゼロ係数値がそれ以上ないことが示される。この0-レベル値はEOB(ブロック終端)シンボルと呼ばれている。
上記とは別に、一次元配列内の個々の非ゼロ値量子化係数は3値(ラン,レベル,ラスト)によって表すことができる。レベルとランの意味は前の方式と同一であるのに対して、ラストは、現在の係数の後に続く一次元配列の中に別の任意の非ゼロ値係数が存在するかどうかを示す。したがって、個々のEOBシンボルが不要となる。
エントロピー符号化利用してラン値とレベル値(適用可能であればラスト値)とはさらに圧縮される。エントロピー符号化とは、符号化の対象となるデータセット内のシンボルが一般に異なる発生確率を有するという事実を利用する無損失の処理である。したがって、個々のシンボルを表すために固定数のビットを用いる代わりに、発生確率のより大きいシンボルがより少数のビットを持つコードワードにより表されるように可変ビット数が割り当てられる。このため、エントロピー符号化は可変長符号化(VLC)と呼ばれることが多い。或るレベル値とラン値の方が他の値に比べて発生確率が高いことに起因して、エントロピー符号化法を利用して、ラン値とレベル値を表すのに必要なビット数を効果的に少なくすることが可能となる。
ラン値とレベル値とをエントロピー符号化するとすぐに、ビデオマルチプレクスコーダ170は、当該種類の情報に適した可変長符号化法を用いてやはりエントロピー符号化した制御情報と上記値とを組み合わせ、符号化済み画像情報135の単一の圧縮ビットストリームを形成する。このビットストリームこそ、(ラン,レベル)対を表す可変長コードワードを含むものであり、エンコーダから送信されるものである。
ビデオマルチプレクスコーダ170により実行される処理と関連してエントロピー符号化について説明してきたが、別の実施例では別個のエントロピー符号化部を設けてもよいことに留意されたい。
マクロブロックのローカルな復号化バージョンもエンコーダ100で形成される。この形成は、逆量子化器108を介して量子化器106が出力する個々のブロックに対応する量子化変換係数を渡し、次いで、逆変換ブロック110で逆DCT変換を適用することにより行われる。このようにして、マクロブロックの個々のブロックに関連してピクセル値の再構成配列が構成される。結果として生じる復号化済み画像データがコンバイナ112へ入力される。イントラ符号化モードで、スイッチ114がセットされ、それによって、スイッチ114を介するコンバイナ112への入力信号はゼロになる。このようにして、コンバイナ112による実行処理は元のままの復号化画像データと同等となる。
現フレームの後続マクロブロックを受け取り、次いで、ブロック104、106、108、110、112での前述した符号化ステップおよびローカルな復号化ステップを経て、イントラ符号化済みフレームの復号化バージョンがフレーム記憶部120に蓄積される。現フレームの最期のマクロブロックのイントラ符号化を行い、その後復号化すると、フレーム記憶部120には、インター符号化フォーマットで後で受信したビデオフレームの符号化時に予測参照フレームとして利用できる完全に復号化されたフレームが含まれる。
インター符号化モードにおけるエンコーダ100の作動について以下説明する。インター符号化モードで、コントロールマネージャ160はスイッチ102を作動させ、コンバイナ116からの出力信号を含むライン117からその入力信号を受け取る。コンバイナ116は入力信号101からビデオ入力信号をマクロブロック毎に受け取る。コンバイナ116は、マクロブロックを形成する輝度値とクロミナンス値とからなるブロックを受け取ると、対応する予測誤差情報ブロックを形成する。予測誤差情報は、当該ブロックと、動き補償予測ブロック150で形成される、当該ブロックの予測との誤差を表す。さらに詳しく言えば、マクロブロックの個々のブロックに対応する予測誤差情報には2次元配列の値が含まれ、これら値の各々は、以下に説明する処理手順に基づいて、輝度情報またはクロミナンス情報からなるブロック内の符号化中のピクセル値と、当該ブロックに対応する動き補償予測を形成することにより得られる復号化済みピクセル値との間の差を表すものである。したがって、個々のマクロブロックが、例えば、輝度値とクロミナンス値とを含む4×4ブロックのアセンブリを含む状況では、マクロブロックの個々のブロックに対応する予測誤差情報にも同様に4×4配列の予測誤差値が含まれる。
マクロブロックの個々のブロックに対応する予測誤差情報は、予測誤差値の個々のブロックに対して2次元離散余弦変換を実行するDCT変換ブロック104へ渡され、個々のブロックに対応する2次元配列のDCT変換係数が形成される。DCT変換ブロック104は個々の予測誤差ブロックに対応する係数値の配列を形成し、係数値の個数はマクロブロックを構成するブロックの性質に依拠する。例えば、マクロブロックで使用される基本となるブロックサイズが4×4である場合、DCT変換ブロック104は個々の予測誤差ブロックに対してDCT係数の4×4の配列を形成する。ブロックサイズが8×8である場合、8×8配列のDCT係数が形成される。
個々の予測誤差ブロックに対する変換係数は量子化器106へ渡され、この量子化器106で、イントラ符号化モードでのエンコーダの作動と関連して上述した場合と同じ様に、量子化パラメータQPを用いて量子化される。この場合もまた、量子化パラメータQPの選択は制御ライン115を介してコントロールマネージャ160により制御される。
マクロブロックの個々のブロックに対応する予測誤差情報を表す量子化済みDCT係数は、図1のライン125により示されるように量子化器106からビデオマルチプレクスコーダ170へ渡される。イントラ符号化モードにおける場合のように、ビデオマルチプレクスコーダ170は、前述したジグザグスキャニング手順(図4を参照)を用いて個々の予測誤差ブロックに対応する変換係数を並べ、次いで、個々の非ゼロ量子化係数をレベル値及びラン値として表す。ビデオマルチプレクスコーダ170は、イントラ符号化モードと関連して上述した場合と同様に、エントロピー符号化を用いてこのラン値及びレベル値をさらに圧縮する。ビデオマルチプレクスコーダ170は、ライン126を介して動きフィールド符号化ブロック140からの動きベクトル情報(以下に解説)およびコントロールマネージャ160からの制御情報も受け取る。ビデオマルチプレクスコーダ170は、動きベクトル情報と制御情報とのエントロピー符号化を行い、次いで、エントロピー符号化済み動きベクトル、予測誤差および制御情報を含む、符号化済み画像情報の単一のビットストリーム135を形成する。
マクロブロックの個々のブロックに対応する予測誤差情報を表す量子化済みDCT係数は、量子化器106から逆量子化器108へも渡される。ここでDCT係数は逆量子化され、結果として生じる逆量子化DCT係数ブロックが逆DCT変換ブロック110に適用され、この逆変換ブロックでDCT係数は逆DCT変換を受け、予測誤差値のローカルに復号化されたブロックが形成される。次いで予測誤差値のローカルに復号化されたこのブロックはコンバイナ112に入力される。インター符号化モードでは、スイッチ114がセットされて、マクロブロックの個々のブロックに対応する予測ピクセル値であって、動き補償予測ブロック150により生成される予測ピクセル値をコンバイナ112がやはり受け取るようにセットされる。コンバイナ112は、予測誤差値のローカルに復号化されたブロックの各々を予測ピクセル値の対応するブロックと組み合わせ、再構成済み画像ブロックを生成し、これらの画像ブロックをフレーム記憶部120内に格納する。
ビデオ信号の後続するマクロブロックをビデオソースから受け取り、次いで、ブロック104、106、108、110、112で前述した符号化および復号化ステップを経て、フレームの復号化バージョンがフレーム記憶部120に蓄積される。フレームの最期のマクロブロックが処理されたとき、フレーム記憶部120には、インター符号化フォーマットで後程受信されるビデオフレームの符号化時に予測参照フレームとして利用できる完全に復号化されたフレームが含まれることになる。
現フレームのマクロブロック予測の形成について以下説明する。インター符号化フォーマットで符号化されたいずれのフレームも動き補償予測用参照フレームを必要とする。これは、ビデオシーケンスの符号化時に、シーケンス内の第1のフレームであるか、別の何らかのフレームであるかに関わらず、符号化の対象とする第1のフレームをイントラ符号化フォーマットで符号化しなければならないことを必然的に意味する。次いで、これは、コントロールマネージャ160によりビデオエンコーダ100のスイッチが入れられ、インター符号化モードにされたとき、前に符号化したフレームをローカルに復号化することにより形成される完全な参照フレームがエンコーダのフレーム記憶部120ですでに利用可能であることを意味する。一般に、イントラ符号化済みフレームか、インター符号化済みフレームかのいずれかをローカルに復号化することにより参照フレームは形成される。
現フレームのマクロブロックに対する予測値を形成する第1のステップは動き推定ブロック130により実行される。動き推定ブロック130は、ライン128を介して符号化を行う対象フレームの現マクロブロックを形成する、輝度値とクロミナンス値とからなるブロックを受け取る。次いで、動き推定ブロック130はブロックマッチング処理を実行して、現マクロブロックとほぼ一致する参照フレーム内の領域の特定を図る。ブロックマッチング処理を実行するために、動き推定ブロックはライン127を介してフレーム記憶部120に格納された参照フレームデータにアクセスする。さらに詳しく言えば、動き推定ブロック130は、チェック中のマクロブロックと、フレーム記憶部120に格納された参照フレームから得られるピクセルの最適マッチングの候補領域との間のピクセル値の差を表す差値(絶対差の和など)を計算することによりブロックマッチングを実行する。参照フレームの予め規定された探索領域内での全ての可能なオフセット値で候補領域に対する差値が生成され、動き推定ブロック130は最小の計算された差値を決定する。現フレーム内のマクロブロックと、基準フレーム内のピクセル値の候補ブロックとの間の、最小の差値を生成するオフセット値によって当該マクロブロックに対する"動きベクトル"が規定される。
動き推定ブロック130は、ひとたびマクロブロックに対する動きベクトルを生成すると、動きフィールド符号化ブロック140へ動きベクトルを出力する。動きフィールド符号化ブロック140は、1組の基底関数と動き係数とを含む動きモデルを用いて、動き推定ブロック130から受信した動きベクトルを近似する。さらに詳しく言えば、動きフィールド符号化ブロック140は、基底関数を乗じたときに動きベクトルの近似値を形成する1組の動き係数値として動きベクトルを表す。一般に、2つだけの動き係数と、基底関数とを有する並進動きモデルが用いられるが、さらに大きな複雑さを示す動きモデルの使用も可能である。
動き係数は動きフィールド符号化ブロック140から動き補償予測ブロック150へ渡される。動き補償予測ブロック150は動き推定ブロック130により特定されたピクセル値の最適マッチング候補領域もフレーム記憶部120から受け取る。動きフィールド符号化ブロック140により生成される動きベクトルの近似表示と、参照フレームから得られる最適マッチング候補領域のピクセル値とを用いて、動き補償予測ブロック150は、マクロブロックの個々のブロックに対する予測ピクセル値の配列を生成する。予測ピクセル値の個々のブロックはコンバイナ116へ渡され、このコンバイナ116で、現マクロブロックの対応するブロックにおける実際の(入力)ピクセル値から予測ピクセル値が減算される。このようにしてマクロブロックに対応する1組の予測誤差ブロックが得られる。
図2に図示のビデオデコーダ200の作動について以下説明する。デコーダ200は、エンコーダ100から符号化済みビデオビットストリーム135を受け取り、ビデオビットストリーム135をその構成要素に多重分離するビデオマルチプレクスデコーダ270と、逆量子化器210と、逆DCT変換器220と、動き補償予測ブロック240と、フレーム記憶部250と、コンバイナ230と、コントロールマネージャ260と、出力部280とを備える。
コントロールマネージャ260は、イントラ符号化済みフレームとインター符号化済みフレームのいずれが復号化されているかに応答してデコーダ200の作動を制御する。イントラ/インタートリガ制御信号は、復号化モード間でのデコーダの切り替えを生じさせるが、この制御信号は、例えば、エンコーダから受信した個々の圧縮済みビデオフレームと関連づけられるピクチャ種別情報から導出される信号である。イントラ/インタートリガ制御信号はビデオマルチプレクスデコーダ270により符号化済みビデオビットストリームから取り出され、制御ライン215を介してコントロールマネージャ260へ渡される。
イントラ符号化済みフレームの復号化はマクロブロック毎のベースで実行され、個々のマクロブロックに関する符号化済み情報がビデオビットストリーム135で受信されるのとほぼ同時に個々のマクロブロックの復号化が行われる。ビデオマルチプレクスデコーダ270は、マクロブロックのブロックに対応する符号化情報を当該マクロブロックに関する可能な制御情報から分離する。イントラ符号化済みマクロブロックの個々のブロックに対応する符号化済み情報には、ブロックの非ゼロ量子化DCT係数に対応するエントロピー符号化されたレベル値とラン値とを表す可変長コードワードが含まれる。ビデオマルチプレクスデコーダ270は、エンコーダ100で使用される符号化方法に対応する可変長復号化法を用いて上記可変長コードワードを復号化し、それによって、レベル値とラン値とを回復する。次いで、ビデオマルチプレクスデコーダ270は、マクロブロックの個々のブロックに対応する量子化変換係数値の配列を再構成し、これらの量子化変換係数値を逆量子化器210へ渡す。マクロブロックに関するいずれの制御情報も適正な復号化方法を用いてビデオマルチプレクスデコーダで復号化され、コントロールマネージャ260へ渡される。特に、変換係数に適用される量子化レベルに関する情報は、ビデオマルチプレクスデコーダ270により符号化済みビットストリームから取り出され、制御ライン217を介してコントロールマネージャ260へ出力される。次いで、コントロールマネージャは、制御ライン218を介してこの情報を逆量子化器210へ送信する。逆量子化器210は、マクロブロックの個々のブロックに対応する量子化済みDCT係数を制御情報に基づいて逆量子化し、その逆量子化されたDCT係数を逆DCT変換器220へ出力する。
逆DCT変換器220は、マクロブロックの個々のブロックに対応する逆量子化DCT係数に対して逆DCT変換を実行して、再構成済みピクセル値を含む画像情報の復号化済みブロックを形成する。マクロブロックの個々のブロックに対応する再構成済みピクセル値は、コンバイナ230を介してデコーダのビデオ出力部280へ渡され、このビデオ出力部280で、例えば、上記ピクセル値を表示装置(図示せず)へ出力することができる。マクロブロックの個々のブロックに対応する上記再構成済みピクセル値はやはりフレーム記憶部250に格納される。イントラ符号化済みマクロブロックの符号化/復号化の際に動き補償予測は利用されないため、コントロールマネージャ260はコンバイナ230を制御してピクセル値の個々のブロックをそのままビデオ出力部280とフレーム記憶部250とへ渡す。イントラ符号化済みフレームの後続するマクロブロックが復号化され、格納されるにつれて、復号化済みフレームがフレーム記憶部250に漸次蓄積される結果、この復号化済みフレームはその後受信したインター符号化済みフレームの復号化と対応する動き補償予測用参照フレームとして利用できるようになる。
インター符号化済みフレームがマクロブロック毎に復号化され、個々のインター符号化済みマクロブロックに関する符号化済み情報がビットストリーム135に受信されるのとほぼ同時に個々のインター符号化済みマクロブロックは復号化される。ビデオマルチプレクスデコーダ270は、符号化済み動きベクトル情報およびマクロブロックに関する可能な制御情報から、当該インター符号化済みマクロブロックの個々のブロックに対応する符号化済み予測誤差情報を分離する。上記で説明したように、マクロブロックの個々のブロックに対応する符号化済み予測誤差情報には、当該予測誤差ブロックの非ゼロ量子化変換係数に対応するエントロピー符号化されたレベル値とラン値とを表す可変長コードワードが含まれる。ビデオマルチプレクスデコーダ270は、エンコーダ100で使用される符号化方法に対応する可変長復号化法を用いて上記可変長コードワードを復号化し、それによって、レベル値とラン値とを回復する。次いで、ビデオマルチプレクスデコーダ270は、個々の予測誤差ブロックに対応する量子化変換係数値の配列を再構成し、これらの量子化変換係数値を逆量子化器210へ渡す。インター符号化済みマクロブロックに関する制御情報が適正な復号化方法を用いてビデオマルチプレクスデコーダ270で復号化され、コントロールマネージャ260へ渡される。予測誤差ブロックの変換係数に適用される量子化レベルに関する情報は、符号化済みビットストリームから取り出され、制御ライン217を介してコントロールマネージャ260へ出力される。次いで、コントロールマネージャは、制御ライン218を介して逆量子化器210へこの情報を送信する。逆量子化器210は、マクロブロックの個々のブロックに対応する予測誤差情報を表す量子化済みDCT係数を制御情報に基づいて逆量子化し、その逆量子化されたDCT係数を逆DCT変換器220へ出力する。次いで、個々のブロックに対応する予測誤差情報を表す逆量子化DCT係数が逆DCT変換器220で逆変換され、マクロブロックの個々のブロックに対応する再構成済み予測誤差値の配列が生成される。
マクロブロックと関連づけられた符号化済み動きベクトル情報はビデオマルチプレクスデコーダ270により符号化済みビデオビットストリーム135から取り出され、復号化される。このようにして得られた復号化済み動きベクトル情報は制御ライン225を介して動き補償予測ブロック240へ渡され、動き補償予測ブロック240は、エンコーダ100でインター符号化済みマクロブロックの符号化に用いる動きモデルと同じ動きモデルを用いて、マクロブロックに対応する動きベクトルの再構成を行う。この再構成済み動きベクトルは、エンコーダの動き推定ブロック130により当初定められた動きベクトルを近似する。デコーダの動き補償予測ブロック240は、上記再構成済み動きベクトルを用いて、フレーム記憶部250に格納された予測参照フレームの再構成済みピクセル領域の位置を特定する。上記参照フレームは、例えば、前に復号化された、イントラ符号化済みフレームであってもよいし、あるいは、前に復号化された、インター符号化済みフレームであってもよい。いずれの場合にせよ、再構成済み動きベクトルにより指示されるピクセル領域を利用して当該マクロブロックに対する予測値が形成される。さらに詳しく言えば、動き補償予測ブロック240は、上記参照フレームで特定されるピクセル領域から、対応するピクセル値をコピーすることにより、マクロブロックの個々のブロックに対応するピクセル値からなる配列を形成する。参照フレームから導出されたピクセル値のブロックである予測値は、動き補償予測ブロック240からコンバイナ230へ渡され、コンバイナ230で復号化済み予測誤差情報と組み合わされる。実際には、個々の予測済みブロックのピクセル値が、逆DCT変換器220により出力された対応する再構成済み予測誤差値に加算される。このようにして、マクロブロックの個々のブロックに対応する再構成済みピクセル値の配列が得られる。上記再構成済みピクセル値はデコーダのビデオ出力部280へ渡され、やはりフレーム記憶部250に格納される。
イントラ符号化済みフレームの後続するマクロブロックが復号化され、格納されるにつれて、復号化済みフレームがフレーム記憶部250に漸次蓄積された結果、この復号化済みフレームは、別のインター符号化済みフレームの動き補償予測用参照フレームとして利用できるようになる。
可変長符号化(VLC)法を用いる量子化変換係数と対応するラン値とレベル値のエントロピー符号化を次にさらに詳細にチェックする。
一般に、ラン-レベル対は単一のシンボルとして符号化される。これは、個々の可能なラン-レベル対と規定されたコード番号との間でマッピングを規定することにより達成される。ラン-レベル対のコード番号へのマッピングの1例がルックアップテーブルとしての表3に示されている。ルックアップテーブル内のマッピングを利用して、ブロックの個々の(ラン,レベル)対へコード番号が割り当てられ、この結果生じるコード番号がVLC符号化により符号化される。例えば、ジョイントモデル(JM)2.0作業用ドラフト番号2、文献JVT−B118、ISO/IEC_MPEGのジョイントビデオチーム(JVT)およびITU−T VCEG(パタヤ、第2回JVT会議、ジェノバ、CH、2002年1月29日〜2月1日、(H.26Lビデオ符号化規格))では、コード番号上へ上記(ラン,レベル)対をマップ化する2つの異なるルックアップテーブルが規定されている。どの表を使用すべきかの選択は、QP値と、ブロックの符号化モードとに基づいている。さらに詳細には、符号化モードがイントラで、かつ、QPが24より小さい場合には、そうでない場合とは異なる表が用いられる。
JVT H.26LのジョイントモデルJM2.0では、いわゆる“ユニバ−サル”可変長符号化方式(UVLCと呼ばれる)が利用される。これに応じて、H.26L JM2.0に準拠して実装されるビデオエンコーダでは、単一組の可変長コードワードを用いて、エンコーダからビットストリームの形で送信されるすべての情報(シンタックス要素)のエントロピー符号化が行われる。使用されるコードワードは同じであるが、異なるタイプの情報の符号化用として、異なるデータシンボルからコードワードへの所定数のマッピングが規定される。例えば、2つのデータシンボルからコードワードへのマッピングが輝度情報を含むブロックに対して行われ、マッピングの選択は、量子化されたDCT変換係数の並べかえに用いるジグザグスキャニング処理(単純スキャニングまたは2重スキャニング)のタイプに応じて決められる。H.26Lに準拠して規定されてい単純ジグザグスキャニングと2重ジグザグスキャニング方式の詳細については、JVT−B118、作業用ドラフト番号2、文献JVT−B118、ISO/IEC_MPEGのジョイントビデオチーム(JVT)およびITU−T VCEG(パタヤ、第2回JVT会議、ジェノバ、CH、2002年1月29日〜2月1日)を参照されたい。特に、マクロブロックタイプ(MB_Type)情報、動きベクトルデータ(MVD)およびイントラ予測モード情報に対しては異なるマッピングも行われる(下記の表3を参照)。
H.26L JM2.0に規定されているUVLCコードワードは、下記の表1に示す以下の圧縮した形で書き込むことができる。但し、xnの項は0または1のいずれかの値をとることができる。
Figure 0004234607
表2が表1に示した方式に準拠して生成された最初の16個のUVLCコードワードを示すのに対して、表3はH.26Lに準拠して行われる異なるデータシンボルからコードワードへのマッピングを示す。これらマッピングの完全な記載については、ジョイントモデル(JM)2.0作業用ドラフト番号2、文献JVT−B118(ISO/IEC_MPEGのジョイントビデオチーム(JVT)およびITU−T VCEG、パタヤ、第2回JVT会議、ジェノバ、CH、2002年1月29日〜2月1日、セクション3.2)を再度参照されたい。
Figure 0004234607
Figure 0004234607
H.26Lで採用されているユニバ−サル可変長符号化方式は複数の技術的な利点を提供する方式である。特に、表1に示す規則のような単純な規則に基づいて構成することができる単一組のVLCコードワードを利用することにより1ビットずつのコードワードの作成が可能となる。これによって、エンコーダとデコーダ内にコードワード表を記憶する必要がなくなるため、エンコーダとデコーダ双方のメモリ要件が少なくなる。言うまでもなく、別の実現例で、エンコーダとデコーダでコードワード表の生成と記憶とを行うことが可能であることを付記しておく。異なるデータシンボルからコードワードへのマッピングを行うことによって、エントロピー符号化された種々のタイプの画像関連データと制御情報の異なる統計的性質に対して、UVLC符号化方式の少なくとも限定された適合を行うことが可能となる。データシンボルからコードワードへの種々のマッピングをエンコーダとデコーダとに記憶することができるため、エンコーダからデコーダへビットストリームでマッピング情報を送信する必要はない。これは誤り復元力の保持に役立つ。
しかし、UVLCエントロピー符号化方式には、いくつかの欠点があるという問題点もある。特に、異なるデータシンボルからコードワードへのマッピングによって与えられる固定されたコードワードと限定されたレベルの適合性とによる必然の結果として、最適のデータ圧縮が得られない問題点がある。この問題は、画像符号化時に、異なる変換係数の発生頻度(すなわち発生確率)、したがって、異なる(ラン,レベル)対の発生確率が、画像内容と、符号化対象画像のタイプとに相応して変化するという事実に起因して生じるものである。したがって、単一組の可変長コードワードを使用し、かつ、符号化/復号化の対象データシンボルとVLC間で単一のマッピングのみを行う場合、一般に、最適の符号化効率の達成は不可能である。
この理由のために、基本UVLC符号化方式の修正が提案されている。さらに詳細には、2組以上のVLCコードワードを含むことが示唆されている。このような1つの提案は、Q.15/SG16“イントラLuma係数のための2つのVLC間での適応型切り替えデータシンボルの統計的性質の利用”(文献Q15-K-30、2000年8月)でGisle Bjontegaardにより行われた。この提案は、或るタイプの情報のエントロピー符号化のための第2の組のVLCコードワードの利用を示唆したものである。文献Q15-K-30によれば、この提案された第2の組のVLCコードワード(VLC2と呼ばれる)は表4の下記に示す方式に基づいて構成される。特にこの第2の組のVLCコードワードを利用して、H.26Lに準拠して規定された2重スキャンジグザグスキャニング方式を用いてスキャンされた4×4ピクセルイントラ符号化輝度ブロックの量子化変換係数と関連づけられるラン値とレベル値との符号化が行われる。表5は、VLC2の最初の16個のコードワードを明確な形で示すものである。
Figure 0004234607
Figure 0004234607
表4と表5を表1と表2とそれぞれ比較することによりわかるように、最初の組のUVLCコードワード内の最短コードワードへ割り当てられた単一ビットとは対照的に、VLC2の最短コードワードは2ビットを有する。VLCコードワードが、他のいずれのコードワードのプレフィックスでもないようにするという一般的復号可能要件に起因して、この変更は他のVLC2コードワードの構造に対して著しい影響を有する変更である。特に、最短コードワードへ2ビットを割り当てることによって、より高いインデックスを有するコードワードをより少数のビットで表すことが可能となる。例えば、表2を参照すると、インデックス7を持つUVLCコードワードが7ビットを有するのに対して、インデックス7を持つVLC2コードワードは6ビットしか有していないということがわかる。
あるブロック内の非ゼロ係数の個数と同じブロック内の可能な(ラン,レベル)対との間の強い相関関係が存在することも観察された。あるブロック内の非ゼロ係数の個数は、(4×4の変換用の16などの)変換ブロックサイズにより制限されることに留意されたい。同様に、ラン値は、(4×4変換用の15などの)変換ブロックサイズにより制限される。非ゼロ係数の個数が大きい場合(たとえば配列の合計サイズに近い場合)、ラン値が小さく、レベル値が高い(ラン,レベル)対のほうがより高い発生確率を有することが観察されている。例えば、15個の非ゼロ係数を持つ4×4変換の場合、ランは[0,1]の範囲の値しかとることできない。
これらの観察に基づいて、Karczewiczが行った1つの提案“高ビットレート用VLC係数符号化”(文献JVT−B072、第2回JVT会議、ジェノバ、CH、2002年1月29日〜2月1日)による可変長符号化方法が示唆された。この方法では、異なる個数の非ゼロ値量子化変換係数に対応して別々のルックアップテーブルが与えられる。この提案によれば、これらのテーブルの個々のテーブルに対応するコードワードと、(ラン,レベル)対とコードワードとの間でのマッピングとは、指定された個数の非ゼロ値係数を持つ量子化変換係数値の配列から導出された1組の(ラン,レベル)対に適用されると、最適なデータ圧縮を行うように設計される。非ゼロ値量子化変換係数の個数と対応する(ラン,レベル)対の統計的性質の変動に関する情報は、例えば、複数のテスト(“トレーニング”)画像またはビデオシーケンスを予め符号化することにより経験的に得られる。次いで、VLCコードワードと、上記コードワード間でのマッピングとを設計し、これらを1または2以上のルックアップテーブルとしてエンコーダ内に記憶することができる。
Karczewiczにより提案されたアルゴリズムの明細は以下のようなものである:画像ピクセルまたは予測誤差値のブロックを変換符号化して、2次元配列の変換係数値を形成し、さらに、係数値の各々を量子化した後に、上記配列内の非ゼロ量子化係数値の個数を決定する。Ncと呼ばれる値が当該個数へ割り当てられ、この値を利用して配列内の非ゼロ係数値の個数が明白に伝えられる。したがって、EOBシンボル(例えば0に等しいレベル値)はもはや不要となる。次いで、(ラン,レベル)対とコードワード間のマッピングを規定するルックアップテーブルを用いてコードワード上への当該ブロック内の個々の(ラン,レベル)対のマッピングが行われ、ルックアップテーブルは上記Nc値に依拠して選択される。
2組以上のコードワード間でのコンテキストベースの切り替えによりコードワードが選択される前述のVLC符号化法の双方方法は、単一組のVLCコードワードを利用する方法と比べてデータ圧縮効率の向上を提供するものである。しかし、多くのデータ圧縮の適用時に、特に、ビデオ符号化の適用時に、データ圧縮効率の向上を図りたいという継続的要望が存在する。したがって、計算の複雑さが少なく、メモリ要件が少なく、さらに、良好な誤り復元力を保持しながら、このタイプの方法に対する改善された適合性と、符号化対象のデータシンボルの統計的性質とを提供する新たな可変長符号化方法の開発に対する相当の関心が今でも存在している。この状況こそ本発明に準拠する方法が開発された状況である。
本発明の要約
本発明は、一般に、(ラン,レベル)対として表されるデータシンボルの可変長符号化に関するものである。本発明は、データシンボルとVLCコードワード間での少なくとも2つのマッピングの利用を含み、マッピング間での切り替え規則を規定するものである。このマッピングは、可変長コード化を行う対象データシンボルの統計的性質を考慮に入れるものである。これにって、データシンボルとコードワード間での固定マッピングを利用するVLC符号化法と比べると改善されたデータ圧縮効率が得られる。この切り替え規則による設計の結果、ビットストリーム内に含むべきマッピング選択に関する情報をまったく必要とすることなく、本発明の方法に基づいて形成されるVLCコードワードを含むビットストリームの復号化が可能となる。言い換えれば、ビットストリーム内に個々のコードワードを生成するのに用いるマッピングについて明確な指示を行う必要がなくなり、この特性によってデータ圧縮効率の改善が図られる。
特に、本発明は、符号化効率の向上を図るための、量子化変換係数の新たな符号化方法を提案するものである。さらに詳しく言えば、本発明の特定の目的は、非ゼロ値量子化変換係数を表す(ラン,レベル)対の符号化を行うための新しく、より効率的な方式を提供することである。“高ビットレート用VLC係数符号化”(文献JVT−B072、第2回JVT会議、ジェノバ、CH、2002年1月29日〜2月1日)でKarczewiczにより提案された方法のように、本発明は、変換係数からなるブロックにおける非ゼロ値係数の個数が、ラン値の場合と同様、変換ブロックサイズにより制限されているという観察に基づくものである。実世界画像を処理するエンコーダについての上記観察およびその他の分析によって、本発明の発明者らはブロック内の非ゼロ係数の個数と当該ブロックのラン値との間に相関関係が存在することを認識するに至った。特に、本発明の発明者らは、次第に多くの(ラン,レベル)対がブロックから符号化されるにつれて、ラン-レベルの組み合わせの可能性のある個数が減少し始めることを認識した。この後者の認識こそが本発明を導き出したものである。
したがって、本発明によるVLC符号化法は、連続的(ラン,レベル)対がコードワードへ割り当てられるにつれて、符号化対象の次の(ラン,レベル)対に対応するラン値の可能な範囲がさらに制限されるという事実を考慮に入れるものである。
ランの可能値が(ラン,レベル)対の個々の符号化と共に変化するという事実は、(ラン,レベル)対のインデックスのコード番号への割当て中に好適に利用することができる。
さらに詳細には、本発明の実施形態によれば、(ラン,レベル)対をコード番号に関係づけるために少なくとも2組のマッピングが行われる。ランがとり得る最大値を規定するmax_runの値に応じて、少なくとも2組のマッピングのうちの一方のマッピングから選択されたマッピング表を用いて、コード番号に対して個々の(ラン,レベル)対のマッピングがまず行われる。max_runは、ブロック内の非ゼロ値係数の個数を考慮することにより初期化され、次いで、個々の(ラン,レベル)対の符号化後に更新される。以下の例はその要点を例示するものである:
量子化変換係数のブロックにおいて、(ラン,レベル)対の中に、(2,1)、(3,2)、(4,3)、(2,3)および(1,2)を持つ5個の非ゼロ係数が含まれていると仮定する。通常、所定の係数のラン値とレベル値とは、レベル値が対応するラン値に先行するように並べられていることにここで留意されたい。このため、如上の(ラン,レベル)対では、レベル値は個々の対の第1の数(2,3,4,2,1)であり、ラン値は個々の対の最後の数(1,2,3,3,2)である。符号化処理の開始時に、5個の非ゼロ係数が存在し、多くて16個のこのような係数が存在する能性があるため、ランは、多くて11個の値をとる可能性がある。この最大可能ラン値をmax_runと示すと、(2,1)である第1の(ラン,レベル)対の符号化後、max_runは、減少する(正確には、現在のラン値を減じることにより、前回のmax_run値の更新により得られる10になる)ことがわかる。さらに詳細には、max_runは以下のように更新される:
max_run=max_run−run
但し、max_runはブロックの符号化の開始時に16−Ncにより初期化される。
本発明の第1の態様によれば、ゼロ値データシンボルと非ゼロ値データシンボルとを含む1組のデータシンボルを符号化する方法が提供され、該方法は、マッピング処理によって、非ゼロ値データシンボルおよび先行するまたは後続するゼロ値データシンボルの対応する個数を表すようにコードワードを割り当てることを含む方法を有する。本方法によれば、非ゼロ値データシンボルと、該非ゼロ値データシンボルの先行するまたは後続するゼロ値データシンボルの対応する個数とへコードワードを割り当てるマッピング処理は、上記組のデータシンボル内のゼロ値データシンボルの最大可能個数に依拠するものとなる。
本発明の第2の態様によれば、ゼロ値データシンボルと非ゼロ値データシンボルとを含む1組のデータシンボルを表す1組のコードワードを復号化する方法が提供され、上記方法は、前記組のデータシンボル内の非ゼロ値データシンボルの個数の指示を受け取ることと、非ゼロ値データシンボルと、先行するまたは後続するゼロ値データシンボルの対応する個数とを表すコードワードを受け取ることと、逆マッピング処理を行うことにより、コードワードを復号化して、非ゼロ値データシンボルと、先行するまたは後続するゼロ値データシンボルの対応する個数とを回復することと、を有する。本方法によれば、非ゼロ値データシンボルと、該非ゼロ値データシンボルの先行するまたは後続するゼロ値データシンボルの対応する個数とを前記コードワードから復号化する逆マッピング処理は、前記組のデータシンボル内のゼロ値データシンボルの最大可能個数に依拠するものとなる。
本発明の第3の態様によれば、ゼロ値データシンボルと非ゼロ値データシンボルとを含む1組のデータシンボルを符号化するエンコーダであって、マッピング処理を行うことにより非ゼロ値データシンボルと、先行するまたは後続するゼロ値データシンボルの対応する個数とを表すためにコードワードを割り当てる手段を備えるエンコーダが提供される。本発明によれば、上記エンコーダで与えられるコードワードを割り当てる手段は、前記組のデータシンボル内のゼロ値データシンボルの最大可能個数に依拠してコードワードを割り当てるマッピング処理を適合させるように構成される。
本発明の第4の態様によれば、1組のデータシンボルを表す1組のコードワードを復号化するデコーダが提供され、前記組のデータシンボルには、ゼロ値データシンボル、並びに、非ゼロ値データシンボルが含まれ、上記デコーダは、前記組のデータシンボル内の非ゼロ値データシンボルの個数の指示を受け取る手段と、非ゼロ値データシンボルと先行するまたは後続するゼロ値データシンボルの対応する個数とを表すコードワードを受け取る手段と、逆マッピング処理を行うことにより、コードワードを復号化して、前記非ゼロ値データシンボルと、非ゼロ値データシンボルの先行するまたは後続するゼロ値データシンボルの対応する個数とを回復する手段とを備える。本発明によれば、コードワードを復号化する上記手段は、前記組のデータシンボル内のゼロ値データシンボルの最大可能個数に依拠して、非ゼロ値データシンボルと、該非ゼロ値データシンボルの先行するまたは後続するゼロ値データシンボルの対応する個数とを復号化する逆マッピング処理を適合させるように構成される。
本発明の第5の態様によれば、本発明の第3の態様に基づくエンコーダを備えたマルチメディア端末装置が提供される。
本発明の第6の態様によれば、本発明の第4の態様に基づくデコーダを備えたマルチメディア端末装置が提供される。
好適には、本発明の第5および/または第6の態様に基づく上記マルチメディア端末装置は、無線接続によって移動通信ネットワークと交信するように構成される移動マルチメディア端末装置であることが望ましい。
以下、添付図面を参照しながら、例示によって本発明の実施形態について説明する。
本発明の詳細な説明
以下の詳細な説明において、本発明の例示の実施形態を提示する。これらの実施形態は、ビデオエンコーダにおけるブロックベース変換符号化の結果として生成される非ゼロ値変換係数を表す(ラン,レベル)対の可変長符号化、並びに、対応するビデオデコーダにおける上記対の後続する復号化に関する。しかし、当業者であれば理解できるように、本発明による方法は(ラン,レベル)対として表されるデータシンボルのVLC符号化に対して、または符号化の対象とする1組のデータシンボルの任意の等価表現に対して一般に適用することが可能である。
図5は、本発明によるVLC符号化法を適用できるビデオエンコーダ600の概略ブロック図である。図5に図示のビデオエンコーダの構造は、図1に図示の従来技術によるビデオエンコーダ構造とほぼ同一であるが、可変長符号化処理が行われるエンコーダの当該部分に対して適切な修正が施されている。前述した従来技術によるビデオエンコーダと同一の方法で機能を実現し、作動するビデオエンコーダのすべての部分は同一の参照番号によって特定される。本明細書において、すべての可変長符号化処理はビデオマルチプレクスコーダ670において行われるものと仮定されている。しかし、本発明の別の実施形態では、単数または複数の別々の可変長符号化ユニットを設けることも可能であると理解すべきである。ビデオエンコーダにより形成されるデータシンボル(非ゼロ値変換係数に対応する(ラン,レベル)対など)のうちの或る一定のデータシンボルに対して本発明による方法を適用することも可能であること、さらに、別のVLC符号化法を用いて別のデータシンボルを符号化することも可能であることも付記しておく。
次にビデオエンコーダ600の作動について詳細に考察する。デジタルビデオのフレームを符号化する際、エンコーダ600は図1と関連して前述した方法と同様の方法で作動して、イントラ符号化され、インター符号化された圧縮済みビデオフレームを生成する。本テキストで前述したように、イントラ符号化モードでは、画像データ(ピクセル値)の個々のブロックに離散余弦変換(DCT)が適用され、変換係数値の対応する2次元配列の形成が図られる。変換ブロック104でDCT処理が行われ、この処理の結果生成された係数がその後量子化器106へ渡され、そこで上記の量子化が行われる。インター符号化モードで、ブロック104で行われたDCT変換が予測誤差値のブロックに対して適用される。この処理の結果生成された変換係数も量子化器106へ渡され、上記変換係数もそこで量子化される。
インター符号化されたフレームがイントラ符号化された画像ブロックを含むものであってもよいこと、さらに、状況によっては、特定の画像ブロックに対して変換符号化が適用されないことに留意されたい。例えば、イントラ符号化モードでイントラ予測を利用する場合、1または2以上の予め符号化済みの画像ブロックからいくつかの画像ブロックがエンコーダで予測される。この場合、エンコーダは予測時に使用する前のブロックの指示をデコーダに与え、変換係数データを出力しない。さらに、インター符号化モードでは、或るブロックに対する予測値とブロック自体の画像データとの間の差が非常に小さいため、予測誤差情報を送信しないことがデータ圧縮比という点からは好都合である。したがって、本発明によるVLC符号化法は、変換符号化と、後続する変換係数量子化とを受ける当該画像ブロックに対して適用されることになる。
本発明によれば、ビデオマルチプレクスコーダ670は、量子化変換係数ブロック(2次元配列)を受け取ると、配列内の非ゼロ値係数の個数Ncを決定し、この個数の指示がビットストリーム635の形でデコーダへ送信される。本発明の好ましい実施形態では、この送信に先行してNcは可変長コード化される。別の実施形態では、Ncがそのまま送信される場合もあれば、別の符号化法が適用される場合もある。
次にビデオマルチプレクスコーダ670は(ラン,レベル)対として非ゼロ値係数を表す。さらに詳細には、2次元配列の量子化変換係数が、図4に図示の順序のような予め規定されたスキャニング順序を用いてまずスキャンされ、一次元配列が生成される。次いで、この順序に並べられた一次元配列の個々の非ゼロ値係数値が、ラン値とレベル値とにより表される。但し、レベル値は係数の値を表し、ラン値は非ゼロ値係数に先行する連続するゼロ値係数の個数を表す。
次いで、ビデオマルチプレクスコーダ670はラン値とレベル値に対して可変長符号化を適用して、個々の(ラン,レベル)対へ単一のVLCコードワードを割り当てるように図る。本発明の好ましい実施形態によれば、シンボルを符号化する前に最大可能ラン(max_runとして示す)を考慮しながら、(ラン,レベル)対の異なるマッピングを選択することにより(ラン,レベル)対がコード番号に符号化される。量子化変換係数ブロックにおける最初の(ラン,レベル)対を符号化する際、max_runは、(ブロック内に存在する可能性がある非ゼロ値係数の最大可能個数−所定の決定されたNcの値)に等しくなるように設定される。したがって、4×4ブロックの場合、max_runは以下のように初期化される:
max_run=16−Nc (1)
以下の例示の擬似コードは、本発明に基づく(ラン,レベル)対へコードワードを割り当てる1つの処理手順を示すものである。
Index_RL=RL_index[max_run,level,run](2)
但し、RL_indexは、max_run値に依拠して異なるコード番号に対するラン-レベル値の整数値をマッピングする。トレーニング用データを用いてシミュレーションを実行した後、RL_indexの初期化が行われる。最後に、Index_RLは、表2または表5に掲載したVLCコードワードのうちの1つのリストを用いて符号化される。
さらに詳細には、max_runの個々の可能値に対する、異なる(ラン,レベル)対の発生確率を分析することによりビデオデータの1または2以上の検査シーケンスから経験的にマッピング関数RL_indexが構成される。次いで、マッピング処理手順の適用により生成されるコード番号(すなわちIndex_RL値)を用いて、(ラン,レベル)対を表すコードワードをコードワード表から選択する。本発明の望ましい実施形態では、表2の形で上記に示したコードワード表か表5に示したコードワード表かのいずれかの表が使用される。
表6と表7とに、max_run値に基づくコード番号に対する(ラン,レベル)対の例示マッピングが示されている。双方の表では、行はレベル値に対応し、列はラン値に対応しているのに対して、個々のセル内へのエントリは当該特定のラン-レベル対(すなわちラン値とレベル値との組み合わせ)に対するVLCコードワードのコード番号を指示している。最も蓋然性の高い対に対してはコード番号1が割り当てられ、第2に蓋然性の高い対にはコード番号2が割り当てられる等々となる。表6と表7の双方の表には最初の15個の最も蓋然性の高い対が掲載されている。表6は、max_runが8である場合を示す表であるのに対して、表7は、max_runが3である場合を示す表である。
Figure 0004234607
Figure 0004234607
上述のマッピング処理手順を用いて、特定の(ラン,レベル)対を表すために、VLCコードワードを選択し、ビデオマルチプレクスコーダ670はビットストリーム635の形でデコーダへコードワードを送信する。現在のブロックに対する符号化の対象とすべきさらに多くの(ラン,レベル)対が存在する場合、ビデオマルチプレクスコーダ670は、現在のラン値を減じることにより、次の(ラン,レベル)対の符号化と関連して利用するmax_runの更新を行う。すなわち:
max_run=max_run−run
所定のブロックに対するすべての(ラン,レベル)対がコードワードとして表されるまで上記符号化処理手順は続く。その際、ビデオマルチプレクスコーダ670は符号化するための量子化変換係数の次の符号化用ブロックを受け取り、次のブロックに対する符号化プロセスを繰り返す。
本発明に基づくビデオデコーダ700の作動について以下図6を参照して説明する。図6に例示のビデオデコーダの構造は、図2に図示の従来技術によるビデオデコーダの構造とほぼ同一であるが、可変長復号化処理を行うデコーダの当該部分に対して適切な修正が施されている。前述した従来技術によるビデオデコーダと同一の方法で機能を実行し、作動するビデオデコーダのすべての部分は同一の参照番号によって特定される。後続の説明では、すべての可変長復号化処理がビデオマルチプレクスデコーダ770内で行われると仮定されている。しかし、本発明の別の実施形態では、単数または複数の別々の可変長復号化ユニットを設けることも可能であると理解すべきである。
ビデオデコーダの作動について以下詳細に説明する。ここで、図6のビデオデコーダは、図5と関連して説明したエンコーダに対応するものであり、したがって、エンコーダ600により送信されたビットストリーム635を受け取り、これを復号化することが可能であると仮定されている。このデコーダで、ビットストリームはビデオマルチプレクスデコーダ770により受信され、その構成要素へ分離される。従来技術についての前の説明と関連して説明したように、ビットストリームから取り出された圧縮済みのビデオデータはマクロブロック毎に処理される。本発明によれば、イントラ符号化されたマクロブロック用として圧縮済みのビデオデータには、個々のブロック内に存在する非ゼロ値量子化変換係数の個数Ncの指示、並びに、符号化済み制御情報(例えば量子化パラメータQPに対応する)と共に、マクロブロックの個々のブロックに対してVLC符号化された(ラン,レベル)対を表す可変長コードワードが含まれる。インター符号化されたマクロブロック用圧縮済みビデオデータには、個々のブロックに対するVLC符号化された予測誤差情報(VLC符号化された(ラン,レベル)対と個々のブロックに対するNcの指示とを含む)と、マクロブロックに関連する動きベクトル情報と、符号化済み制御情報とが含まれる。
イントラ符号化されたマクロブロックの個々のブロックに対する、並びに、インター符号化されたマクロブロックに対応する予測誤差データの個々のブロックに対するNc値と、VLC符号化された(ラン,レベル)対とは同一の方法で処理される。
さらに詳細には、イントラまたはインター符号化済みの画像ブロックに対してVLC符号化済みの(ラン,レベル)対の復号化時に、ビデオマルチプレクスデコーダ770はブロック内の非ゼロ値量子化変換係数の個数をまず決定する。前述したように、非ゼロ値量子化変換係数の個数(Nc)に関する情報はエンコーダ600によりビットストリーム635の中へ挿入される。デコーダ700のビデオマルチプレクスデコーダ770は受信したビットストリームからこの情報を取り出す。
次いで、ビデオマルチプレクスデコーダ770は、画像ブロックに対するVLC符号化済みの(ラン,レングス)対の復号化を開始する。本発明によれば、この復号化処理はエンコーダ内で行われる符号化処理手順の場合と同様に、また、上記記載のように行われる。さらに詳細には、特定の画像ブロックに対応する最初の可変長コードワードを復号化する際、ビデオマルチプレクスデコーダ770は、(ブロック内に存在し得る非ゼロ値係数の最大個数−受信したビットストリームから取り出した当該ブロックに対応するNcの値)に等しくなるように上記最初の可変長コードワードを設定することによりmax_runの値を初期化する。次いで、ビデオマルチプレクスデコーダ770は、受信コードワードに対応するコード番号を決定し、max_runの値に依拠して、コード番号をラン値とレベル値の特定の組み合わせに関係づけるマッピング表を選択し、これらのマッピング表は、エンコーダ内でコードワードの生成に使用したマッピング表に対応して、デコーダ内で使用される。
ブロックの最初の非ゼロ値量子化変換係数に対応するレベル値とラン値を回復した後、ビデオマルチプレクスデコーダ770は、決定したばかりのラン値の減算を行うことによりmax_runの値を更新し、次いで、ブロック用の次のコードワードの復号化を開始する。特定の画像ブロックを表すすべてのコードワードが復号化されるまで上記処理は続き、その際、ビデオマルチプレクスデコーダ770は、復号化済みの(ラン,レベル)対からブロック用の量子化変換係数値を再構成し、これらの量子化変換係数値を逆量子化器210へ渡す。再構成されたピクセル値を個々の画像ブロック用として形成するビデオ復号化処理手順の残り部分は、従来技術によるビデオデコーダ200と関連して記載したように進行する。
図7は、本発明に従って作動するように適合できるビデオ符号化用および復号化用機器を備えた端末装置を示す図である。さらに正確に述べれば、この図はITU−T勧告H.324に準拠して実現されるマルチメディア端末装置80を示す図である。この端末装置はマルチメディア送受信装置と考えることができる。上記端末装置は、通信ネットワークを介して送信するために、マルチメディアデータストリームを取得し、符号化し、多重化するエレメント、並びに、受信したマルチメディアコンテンツを受け取り、多重分離し、復号化し、表示するエレメントを備える。ITU−T勧告H.324は端末装置の処理全体を規定し、該端末装置の種々の構成部の作動を決定する別の勧告を参照するものである。この種のマルチメディア端末装置は、通話用テレビ電話などのリアルタイムアプリケーションや、例えばインターネット内のマルチメディアコンテンツサーバから得られるビデオクリップの検索および/またはストリーミングなどの非リアルタイムアプリケーションで利用することができる。
本発明のコンテキストでは、図7に図示のH.324端末装置は、本発明の方法の適用に適した複数の代替マルチメディア端末実施構成のうちの1つの実施構成にすぎないと理解すべきである。複数の代替実施構成が端局装置の位置と実施構成とに関連して存在することにも留意されたい。図7に例示のように、マルチメディア端末装置は、アナログPSTN(公衆電話交換網)などの固定ライン電話ネットワークと接続された通信用機器内に配置される場合もある。この場合、マルチメディア端末装置は、ITU−T勧告V.8、V.34およびオプションとしてV.8bisに準拠するモデム91を装備している。上記とは別に、マルチメディア端末装置は外部モデムと接続されたものであってもよい。このモデムによって、多重化されたデジタルデータおよびマルチメディア端末装置により生成された制御信号をPSTNを介する送信に適したアナログ形式に変換することが可能となる。さらに、上記モデムによって、マルチメディア端末装置によるデータの受信と、PSTNからのアナログ形式の信号の制御と、上記信号のデジタルデータストリームへの変換とが可能となり、このデジタルデータストリームは端末装置により多重分離され、適切な方法で処理することが可能である。
H.324マルチメディア端末装置を実装して、ISDN(総合デジタル通信網)などのデジタル固定ラインネットワークと直接接続できるようにしてもよい。この場合、モデム91はISDNユーザ網インタフェースよって置き換えられる。図7に、このISDNユーザ網インタフェースが別のブロック92により表されている。
H.324マルチメディア端末装置は移動通信用アプリケーションでも使用できるように適合させることが可能である。無線通信用リンクと共に使用する場合、モデム91は、図7に別のブロック93により表されているように任意の適当な無線用インタフェースより置き換えることが可能である。例えば、H.324/Mマルチメディア端末装置は、現在の第2世代GSM移動電話ネットワークや、本発明が提案する第3世代UMTS(一般移動電話システム)との接続を可能にする無線トランシーバを備えるものであってもよい。
ビデオデータの送受信のために2方向通信用として設計されたマルチメディア端末装置では、本発明に基づいて実装されたビデオエンコーダとビデオデコーダの双方を設けると好適であることを付記しておく。このようなエンコーダとデコーダの対は、“コーデック”と呼ばれる単一の複合型機能ユニットとして実装される場合が多い。
図7を参照しながら一般的なH.324マルチメディア端末装置について以下さらに詳細に説明する。
マルチメディア端末装置80は“端局装置”と呼ばれる種々のエレメントを備えている。このマルチメディア端末装置80には、それぞれ参照番号81、82、83により一般的に示されるビデオ用装置、オーディオ用装置、およびテレマティック用装置が含まれる。ビデオ機器81は、例えば、ビデオ画像取得用ビデオカメラ、受信したビデオの内容を表示するモニタ、およびオプションのビデオ処理用機器を備えるものであってもよい。オーディオ用機器82は、一般に、例えば、音声メッセージを取得するマイクと、受信した音声の内容を再生するスピーカーとを備える。オーディオ用機器は追加の音声処理用ユニットを備えるものであってもよい。テレマティック機器83は、データ端末装置、キーボード、電子ホワイトボードやファックス装置などの静止画像送受信装置を備えるものであってもよい。
ビデオ機器81はビデオコーデック85と接続される。ビデオコーデック85は、本発明に基づいて実装されたビデオエンコーダと対応するビデオデコーダの双方を備える。このようなエンコーダとデコーダとについて以下説明する。ビデオコーデック85は、通信リンクを介してさらに送信するために、取得済みビデオデータを適切な形式で符号化する役割と、通信ネットワークから受信した圧縮済みビデオ内容を復号化する役割とを果たすものである。図7に図示の例では、ビデオコーデックはITU−T勧告H.26Lに準拠して実装されたものであるが、本発明による適応型可変長符号化法を実現するための適切な修正がビデオコーデックのエンコーダとデコーダの双方に施されている。
端末のオーディオ用機器は、参照番号86によって図7に示す音声コーデックと接続される。ビデオコーデックのように、音声コーデックも1対のエンコーダ/デコーダを備える。音声コーデックは端末のオーディオ用機器により取得した音声データを通信リンクを介する送信に適した形に変換し、ネットワークから受信した符号化済み音声データを端末のスピーカーなどで再生するのに適した形に変換する。音声コーデックの出力信号は遅延ブロック87へ渡される。この遅延ブロックによって、ビデオ符号化プロセスにより生じた遅延の補正が行われ、それによって音声内容とビデオ内容との同期が保証される。
マルチメディア端末のシステム制御ブロック84は、適切な制御プロトコル(信号制御ブロック88)を用いて、終端からネットワークへの信号の制御を行って、送信端末と受信端末間での通常行われる動作モードを確立する。信号制御ブロック88は、送信端末と受信端末の符号化機能および復号化機能に関する情報を交換し、ビデオエンコーダの種々の符号化モードを可能にするために利用することができる。システム制御ブロック84はデータの暗号化の利用の制御も行う。データ送信時に利用する暗号方式の種別に関する情報は、暗号化ブロック89からマルチプレクサ/デマルチプレクサ(MUX/DMUXユニット)90へ渡される。
マルチメディア端末からのデータ送信中、テレマティック機器83からのデータ入力と可能な制御データとを用いて、MUX/DMUXユニット90は符号化済みでかつ同期化済みのビデオストリームおよびオーディオストリームの合成を行い、単一のビットストリームを形成する。(何らかの暗号化が行われる場合)暗号化ブロック89により行われる、ビットストリームに適用されるデータ暗号化の種別に関する情報を利用して暗号化モードが選択される。これに対応して、多重化され、おそらく暗号化されたマルチメディアビットストリームの受信の際、MUX/DMUXユニット90はビットストリームを解読し、このビットストリームを構成マルチメディアコンポーネントに分割して、復号化と再生とを行う適切なコーデックおよび/または端局装置へ当該コンポーネントを渡す役割を果たす。
本発明に基づくマルチメディア端末、ビデオエンコーダ、デコーダおよびビデオコーデックの機能エレメントは、ソフトウェアまたは専用ハードウェアあるいはこれら2つの組み合わせとして実現することが可能であることを付記しておく。本発明に基づく可変長符号化と復号化方法とは、本発明の機能ステップを実行するためのコンピュータでの読み取りが可能な命令を含むコンピュータプログラムの形での実施構成に特に適している。したがって、本発明に基づく可変長エンコーダおよびデコーダは記憶媒体に記憶されるソフトウェアコードとして実装され、デスクトップパソコンなどのコンピュータにおいて実行可能である。
マルチメディア端末80が移動端末装置である場合、すなわち、無線トランシーバ93を装備している場合、マルチメディア端末80が追加のエレメントを備えるものであってもよいことは当業者であれば理解するであろう。1つの実施形態では、マルチメディア端末80は、ユーザによるマルチメディア端末80の作動を可能とする、表示部とキーボードとを有するユーザインタフェースと、マルチメディア端末装置の様々な機能の役割を果たすブロックを制御する、マイクロプロセッサなどの中央演算処理装置と、ランダムアクセスメモリRAMと、リードオンリメモリROMと、デジタルカメラとを備えるものとなる。マイクロプロセッサの処理命令、すなわちマルチメディア端末80の基本機能に対応するプログラムコードは、リードオンリメモリROMに記憶され、必要に応じて、例えばユーザの制御の下でマイクロプロセッサにより実行することが可能である。このプログラムコードに基づいて、マイクロプロセッサは無線トランシーバ93を利用して、移動通信ネットワークとの接続を形成し、それによって無線路を介する、マルチメディア端末装置80による移動通信ネットワークとの情報の送受信が可能となる。
マイクロプロセッサはユーザインタフェースの状態をモニタし、デジタルカメラを制御する。ユーザコマンドに応答して、マイクロプロセッサはデジタル画像をRAMの中へ保存するようにカメラに命令する。画像が取得された後に、或いは、画像の取得プロセス中に、マイクロプロセッサは画像を画像セグメント(例えばマクロブロック)にセグメント化し、次いで、エンコーダを用いて上記セグメントの動き補償符号化を実行して、上記で説明したように圧縮済み画像シーケンスの生成を図るようにする。ユーザは、マルチメディア端末80にコマンドを出して、取得した画像を該端末装置の表示部に表示したり、別のマルチメディア端末装置や、固定ラインネットワーク(PSTN)と接続されたテレビ電話や、別の何らかの通信装置へ無線トランシーバ93を用いて圧縮済み画像シーケンスを送ったりしてもよい。好ましい実施形態では、最初のセグメントが符号化されるとすぐに画像データの送信が開始されて、受信側が、対応する復号化処理を最少の遅延で開始できるようになる。
特定の実施形態というコンテキストで説明したが、上記教示に対する複数の修正および種々の変更を行うことが可能であることは当業者には自明である。したがって、本発明の1または2以上の好ましい実施形態と関連して本発明を特に示し、説明を行ったが、上記に記載のように本発明の範囲と精神から逸脱することなく何らかの修正や変更を行うことが可能であることは当業者の理解するところであろう。
本発明の別の実施形態は、係数のジグザグスキャニングが係数の値に従って係数を並べる傾向があるため、一次元配列で前に配置された係数の方が、配列内の後半に配置された係数よりも大きな絶対値を持つ可能性が大きくなるという観察に基づくものである。したがって、連続するレベル値は著しい類似性を示す。すなわち、所定の変換係数ブロック内では、符号化対象の係数のレベルは一般に、前に符号化された係数のレベルとほぼ同様の大きさを有する。この代替実施形態は、以下の関係式に基づいて(ラン,レベル)対の符号化を行うことにより、上記類似性を利用するものである:
Index_RL=RL_index[max_run,level,run,prev_level] (3)
但し、prev_levelはブロック内で前回符号化されたレベル値である。前述した実施形態と比べると、(ラン,レベル)対へのインデックス値の割当てに影響を与える付加パラメータ(すなわちprev_level)が存在する。
本発明の別の実施形態は、連続するレベル値が強い相関関係を示すという事実に基づくものである。さらに詳細には、前回符号化されたレベル値を用いて異なるVLCコードブックを割り当て、インデックス割当て時における利用に加えて、現在のシンボルの符号化を行うことができるというものである。以下の例示の擬似コードは、前述した本発明の実施形態のうちの1つを用いることにより、(ラン,レベル)対のコード番号へVLCコードブックを割り当てるための1つの処理手順を示すものである。
VLC_N=Nc_map[prev_level] (4)
但し、prev_levelはブロック内で前回符号化されたレベル値であり、Nc_mapは、種々の異なる利用可能なVLCコードに対して整数値のマッピングを行う配列である。
従来技術に基づく一般的ビデオエンコーダの概略ブロック図である。 従来技術に基づく、図1に図示のエンコーダに対応する一般的ビデオデコーダの概略ブロック図である。 従来技術に基づくマクロブロックの構成を示す図である。 例示のジグザグスキャニング順序を示す図である。 本発明の実施形態に基づくビデオエンコーダの概略ブロック図である。 本発明の実施形態に基づく、図5に図示のエンコーダに対応するビデオデコーダの概略ブロック図である。 本発明による方法を実現することが可能なマルチメディア通信端末の概略ブロック図である。

Claims (43)

  1. ゼロ値データシンボル非ゼロ値データシンボルを含むデータシンボルの集合を符号化する方法であり、
    前記データシンボルの集合内のゼロ値データシンボルの最大可能個数に少なくとも部分的に基づいて適合させたマッピング処理を行うことによって、非ゼロ値データシンボルと、これに付随させて、先行または後続するゼロ値データシンボルの個数と、を組み合わせたデータシンボル対を表すコードワードを割り当て、
    前記データシンボル対をコードワードへ割り当てる際に、ゼロ値データシンボルの前記最大可能個数から、前記先行または後続するゼロ値データシンボルの個数を減じて、ゼロ値データシンボルの更新済み最大可能個数を生成することにより、前記データシンボルの集合内のゼロ値データシンボルの前記最大可能個数を更新し、
    前記マッピング処理は、データシンボル対に次のコードワードを割り当てる際に、ゼロ値データシンボルの前記更新済み最大可能個数に少なくとも部分的に基づいて適合されることを特徴とする符号化方法。
  2. 前記データシンボルの集合内の全てのデータシンボル対にコードワードが割り当てられるまで、符号化を続けることを特徴とする請求項1に記載の符号化方法。
  3. 前記データシンボルの集合内のデータシンボルの全個数から、前記データシンボルの集合内の非ゼロ値データシンボルの個数を減じることにより、前記データシンボルの集合内のゼロ値データシンボルの個数の最大可能個数を決定することを特徴とする請求項1または2に記載の符号化方法。
  4. 前記データシンボルの集合内の非ゼロ値データシンボルの個数の指示を対応する復号化装置へ送信することを特徴とする請求項1、2または3に記載の符号化方法。
  5. 前記データシンボルの集合内のゼロ値データシンボルの前記最大可能個数に少なくとも部分的に基づいて、マッピング表の集合から特定のマッピング表を選択することにより前記マッピング処理を行い、前記マッピング表の集合内の各々のマッピング表が、コードワードへのデータシンボルの割当てを規定することを特徴とする請求項1乃至4のいずれか一項に記載の符号化方法。
  6. 前記マッピング表の各々が、前記データシンボルのコードワードへの割り当てを規定することを特徴とする請求項5に記載の符号化方法。
  7. 前記マッピング表の各々が、前記データシンボル対のコード番号への割り当てを規定し、各コード番号がコードワードの集合中におけるあるコードワードを代表し、このコード番号を使用してコードワードの集合内を参照することにより、前記データシンボル対のコードワードへの割り当てが規定されることを特徴とする請求項5に記載の符号化方法。
  8. 前記データシンボルの集合が変換係数値を表すことを特徴とする請求項1乃至7のいずれか一項に記載の符号化方法。
  9. 前に符号化した非ゼロ値データシンボルの値を使用して、コードワードを含むコードブックの集合の中からコードブックを割り当て、現在の非ゼロ値データシンボルを符号化することを特徴とする請求項1乃至8のいずれか一項に記載の符号化方法。
  10. ビデオエンコーダで利用する請求項1乃至9のいずれか一項に記載の符号化方法。
  11. ゼロ値データシンボル非ゼロ値データシンボルを含むデータシンボルの集合を表すコードワードの集合の復号化方法であって、
    非ゼロ値データシンボルと、これに付随させて、先行または後続するゼロ値データシンボルの個数と、を組み合わせたデータシンボル対を表すコードワードを受信し、
    前記データシンボルの集合内のゼロ値データシンボルの最大可能個数に少なくとも部分的に基づいて適合させた逆マッピング処理を行うことにより、前記コードワードを復号化して前記データシンボル対を再生し、
    受信したコードワードを復号化してこのコードワードにより表されるデータシンボル対 を再生する際に、ゼロ値データシンボルの前記最大可能個数から、前記先行または後続するゼロ値データシンボルの個数を減じて、ゼロ値データシンボルの更新済み最大可能個数を生成することにより、前記データシンボルの集合内のゼロ値データシンボルの前記最大可能個数を更新し、
    前記逆マッピング処理は、次のコードワードを復号化してこれにより表されるデータシンボル対を再生する際に、ゼロ値データシンボルの前記更新済み最大可能個数に少なくとも部分的に基づいて適合されることを特徴とする復号化方法。
  12. 前記データシンボルの集合内の非ゼロ値データシンボルの個数の指示を、受信することを特徴とする請求項11に記載の復号化方法。
  13. 前記データシンボルの集合内のデータシンボルの全個数から、前記データシンボルの集合内の非ゼロ値データシンボルの個数を減じることにより、前記データシンボルの集合内のゼロ値データシンボルの最大可能個数を決定することを特徴とする請求項11または12に記載の復号化方法。
  14. 前記データシンボルの集合内の非ゼロ値データシンボルの個数の指示を対応する符号化装置から受信することを特徴とする請求項12または13に記載の復号化方法。
  15. 前記データシンボルの集合内のゼロ値データシンボルの前記最大可能個数に少なくとも部分的に基づいて、逆マッピング表の集合から特定の逆マッピング表を選択することにより前記逆マッピング処理を行い、前記逆マッピング表の集合内の各々の逆マッピング表が、データシンボルへのコードワードの割当てを規定することを特徴とする請求項11乃至14のいずれか一項に記載の復号化方法。
  16. 前記逆マッピング表の各々が、データシンボル対へのコードワード割当てを規定することを特徴とする請求項15に記載の復号化方法。
  17. 前記受信したコードワードを復号化してコード番号を再生し、
    このコード番号を利用して、前記データシンボルの集合内のゼロ値データシンボルの最大可能個数に少なくとも部分的に基づいて選択された前記特定の逆マッピング表内を参照することにより、
    前記コードワードにより表されるデータシンボル対を再生することを特徴とする請求項15に記載の復号化方法。
  18. 前記データシンボルの集合が変換係数値を表すことを特徴とする請求項11乃至17のいずれか一項に記載の復号化方法。
  19. 前に復号化した非ゼロ値データシンボルの値を使用して、非ゼロ値データシンボルを表すコードワードを含むコードブックの集合の中から、現在のコードワードを復号化するためのコードブックを選択することを特徴とする請求項11乃至18のいずれか一項に記載の復号化方法。
  20. ビデオデコーダで利用する請求項11乃至19のいずれか一項に記載の復号化方法。
  21. ゼロ値データシンボル非ゼロ値データシンボルを含むデータシンボルの集合を符号化するエンコーダであって、
    マッピング処理を行うことにより、非ゼロ値データシンボルと、これに付随させて、先行または後続するゼロ値データシンボルの個数と、を組み合わせたデータシンボル対を表すコードワードを割り当てる手段であって、前記マッピング処理を、前記データシンボルの集合内のゼロ値データシンボルの最大可能個数に少なくとも部分的に基づいて適合させるように構成される、コードワードを割り当てる手段と、
    前記データシンボル対をコードワードへ割り当てる際に、ゼロ値データシンボルの前記最大可能個数から、前記先行または後続するゼロ値データシンボルの個数を減じて、ゼロ値データシンボルの更新済み最大可能個数を生成することにより、前記データシンボルの集合内のゼロ値データシンボルの前記最大可能個数を更新する手段と、を備え、
    前記データシンボル対を表すコードワードを割り当てる手段は、データシンボル対に次のコードワードを割り当てる際に、ゼロ値データシンボルの前記更新済み最大可能個数に 少なくとも部分的に基づいて、前記マッピング処理を適合させるように構成されることを特徴とするエンコーダ。
  22. 前記データシンボルの集合内の全てのデータシンボル対にコードワードが割り当てられるまで、符号化を続けるように構成されることを特徴とする請求項21に記載のエンコーダ。
  23. 前記データシンボルの集合内のデータシンボルの全個数から、前記データシンボルの集合内の非ゼロ値データシンボルの個数を減じることにより、前記データシンボルの集合内のゼロ値データシンボルの最大可能個数を決定するように構成されることを特徴とする請求項21または22に記載のエンコーダ。
  24. 前記データシンボルの集合内の非ゼロ値データシンボルの個数の指示を対応する復号化装置へ送信するように構成されることを特徴とする請求項21、22または23に記載のエンコーダ。
  25. 前記データシンボル対を表すコードワードを割り当てる手段が、前記データシンボルの集合内のゼロ値データシンボルの前記最大可能個数に少なくとも部分的に基づいて、マッピング表の集合から特定のマッピング表を選択することにより前記マッピング処理を行うように構成され、
    前記マッピング表の集合内の各々のマッピング表がコードワードへのデータシンボルの割当てを規定する
    ことを特徴とする請求項21乃至24のいずれか一項に記載のエンコーダ。
  26. 前記マッピング表の各々が、前記データシンボルへのコードワードの割り当てを規定することを特徴とする請求項25に記載のエンコーダ。
  27. 前記マッピング表の各々が、前記データシンボル対のコード番号への割り当てを規定し、
    各コード番号がコードワードの集合中におけるあるコードワードを代表し、
    前記データシンボル対を表すコードワードを割り当てる手段が、このコード番号を使用してコードワードの集合内を参照するように構成される、ことにより、
    前記データシンボル対のコードワードへの割り当てが規定されることを特徴とする請求項25に記載のエンコーダ。
  28. 前記データシンボルの集合が変換係数値を表すことを特徴とする請求項21乃至27のいずれか一項に記載のエンコーダ。
  29. 前に符号化した非ゼロ値データシンボルの値を使用して、コードワードを含むコードブックの集合の中からコードブックを割り当て、現在の非ゼロ値データシンボルを符号化することを特徴とする請求項21乃至28のいずれか一項に記載のエンコーダ。
  30. 請求項21乃至29のいずれか一項に記載のエンコーダを備えるビデオエンコーダ。
  31. ゼロ値データシンボル非ゼロ値データシンボルを含むデータシンボルの集合を表すコードワードの集合を復号化するデコーダであって、
    非ゼロ値データシンボルと、これに付随させて、先行または後続するゼロ値データシンボルの個数と、を組み合わせたデータシンボル対を表すコードワードを受信する手段と、
    コードワードを復号化する手段であって、逆マッピング処理を行うことにより、受信した前記コードワードを復号化してデータシンボル対を再生するとともに、前記逆マッピング処理を、前記データシンボルの集合内のゼロ値データシンボルの最大可能個数に少なくとも部分的に基づいて適合させるように構成される手段と、
    受信したコードワードを復号化してこのコードワードにより表されるデータシンボル対を再生する際に、ゼロ値データシンボルの前記最大可能個数から、前記先行または後続するゼロ値データシンボルの個数を減じて、ゼロ値データシンボルの更新済み最大可能個数を生成することにより、前記データシンボルの集合内のゼロ値データシンボルの前記最大可能個数を更新する手段と、を備え、
    前記コードワードを復号化する手段は、次のコードワードを復号化してこれにより表さ れるデータシンボル対を再生する際に、ゼロ値データシンボルの前記更新済み最大可能個数に少なくとも部分的に基づいて、逆マッピング処理を適合させるように構成されることを特徴とするデコーダ。
  32. 前記データシンボルの集合内の非ゼロ値データシンボルの個数の指示を、受信するように構成される特徴とする請求項31に記載のデコーダ。
  33. 前記データシンボルの集合内のデータシンボルの全個数から、前記データシンボルの集合内の前記非ゼロ値データシンボルの個数を減じることにより、前記データシンボルの集合内の前記ゼロ値データシンボルの最大可能個数を決定するように構成されることを特徴とする請求項31または32に記載のデコーダ。
  34. 前記データシンボルの集合内の非ゼロ値データシンボルの個数の前記指示を対応する符号化装置から受信する手段を備えることを特徴とする請求項32または33に記載のデコーダ。
  35. 前記コードワードを復号化する手段が、前記データシンボルの集合内のゼロ値データシンボルの前記最大可能個数に少なくとも部分的に基づいて、逆マッピング表の集合から特定の逆マッピング表を選択することにより前記逆マッピング処理を行うように構成され
    前記逆マッピング表の集合内の各々の逆マッピング表がデータシンボルへのコードワードの割当てを規定する
    ことを特徴とする請求項31乃至34のいずれか一項に記載のデコーダ。
  36. 前記逆マッピング表の各々が、データシンボル対へのコードワード割当てを規定することを特徴とする請求項35に記載のデコーダ。
  37. 前記コードワードを復号化する手段が、受信したコードワードを復号化してコード番号を再生し、このコード番号を利用して、前記データシンボルの集合内のゼロ値データシンボルの最大可能個数に少なくとも部分的に基づいて選択された前記特定の逆マッピング表内を参照するように構成される、ことにより、
    前記コードワードにより表されるデータシンボル対を再生することを特徴とする請求項35に記載のデコーダ。
  38. 前記データシンボルの集合が変換係数値を表すことを特徴とする請求項31乃至37のいずれか一項に記載のデコーダ。
  39. 前記コードワードを復号化する手段が、前に復号化した非ゼロ値データシンボルの値を使用して、非ゼロ値データシンボルを表すコードワードを含むコードブックの集合の中から、現在のコードワードを復号化するためのコードブックを選択するように構成されることを特徴とする請求項31乃至38のいずれか一項に記載のデコーダ。
  40. 請求項31乃至39のいずれか一項に記載のデコーダを備えるビデオデコーダ。
  41. 請求項30に記載のビデオエンコーダを備えるマルチメディア端末装置。
  42. 請求項40に記載のビデオデコーダを備えるマルチメディア端末装置。
  43. 無線通信ネットワークと接続する無線リンクを形成する手段を備えることを特徴とする請求項41または42に記載のマルチメディア端末装置。
JP2003581363A 2002-04-02 2003-04-02 画像/ビデオエンコーダおよび/またはデコーダにおける符号化変換係数 Expired - Lifetime JP4234607B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36950002P 2002-04-02 2002-04-02
PCT/FI2003/000253 WO2003084076A1 (en) 2002-04-02 2003-04-02 Coding transform coefficients in image / video encoder and/or decoders

Publications (3)

Publication Number Publication Date
JP2005522084A JP2005522084A (ja) 2005-07-21
JP2005522084A5 JP2005522084A5 (ja) 2006-07-06
JP4234607B2 true JP4234607B2 (ja) 2009-03-04

Family

ID=28675579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003581363A Expired - Lifetime JP4234607B2 (ja) 2002-04-02 2003-04-02 画像/ビデオエンコーダおよび/またはデコーダにおける符号化変換係数

Country Status (13)

Country Link
EP (1) EP1490975B1 (ja)
JP (1) JP4234607B2 (ja)
KR (1) KR101010722B1 (ja)
CN (1) CN100521550C (ja)
AT (1) ATE439704T1 (ja)
AU (1) AU2003219198A1 (ja)
DE (1) DE60328761D1 (ja)
ES (1) ES2328916T3 (ja)
HK (1) HK1082125A1 (ja)
MX (1) MXPA04009543A (ja)
RU (1) RU2335845C2 (ja)
WO (1) WO2003084076A1 (ja)
ZA (1) ZA200407932B (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8848789B2 (en) 2006-03-27 2014-09-30 Qualcomm Incorporated Method and system for coding and decoding information associated with video compression
US8401082B2 (en) 2006-03-27 2013-03-19 Qualcomm Incorporated Methods and systems for refinement coefficient coding in video compression
US7778472B2 (en) 2006-03-27 2010-08-17 Qualcomm Incorporated Methods and systems for significance coefficient coding in video compression
EP2337288A3 (en) * 2006-05-09 2011-07-27 Interdigital Technology Corporation MIMO precoding using a baseline codebook and local codebooks
US8599926B2 (en) 2006-10-12 2013-12-03 Qualcomm Incorporated Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
US9319700B2 (en) 2006-10-12 2016-04-19 Qualcomm Incorporated Refinement coefficient coding based on history of corresponding transform coefficient values
US8325819B2 (en) 2006-10-12 2012-12-04 Qualcomm Incorporated Variable length coding table selection based on video block type for refinement coefficient coding
US8565314B2 (en) 2006-10-12 2013-10-22 Qualcomm Incorporated Variable length coding table selection based on block type statistics for refinement coefficient coding
US8467449B2 (en) 2007-01-08 2013-06-18 Qualcomm Incorporated CAVLC enhancements for SVC CGS enhancement layer coding
US7702633B2 (en) 2007-03-05 2010-04-20 Microsoft Corporation Previews providing viewable regions for protected electronic documents
US8938009B2 (en) 2007-10-12 2015-01-20 Qualcomm Incorporated Layered encoded bitstream structure
BRPI0818444A2 (pt) * 2007-10-12 2016-10-11 Qualcomm Inc codificação adaptativa de informação de cabeçalho de bloco de vídeo
CN102017472B (zh) * 2008-05-06 2015-09-23 皇家飞利浦电子股份有限公司 将数据合并到所发射的光中的光模块、照明系统和方法
KR101624649B1 (ko) * 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN102195760A (zh) * 2010-03-16 2011-09-21 松下电器产业株式会社 无线通信系统、基站、终端及码本生成方法
KR20110112168A (ko) * 2010-04-05 2011-10-12 삼성전자주식회사 내부 비트뎁스 확장에 기반한 비디오 부호화 방법 및 그 장치, 내부 비트뎁스 확장에 기반한 비디오 복호화 방법 및 그 장치
WO2011126277A2 (en) 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US8982961B2 (en) 2010-04-05 2015-03-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9049450B2 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment
US8410959B2 (en) * 2010-04-09 2013-04-02 Qualcomm, Incorporated Variable length codes for coding of video data
EP2591605B1 (en) * 2010-07-06 2019-11-06 Nokia Technologies Oy Method and apparatus for determining mapping between a syntax element and a code word for variable length coding
RU2553084C2 (ru) * 2010-10-07 2015-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для оценки уровня кодированных аудио кадров в области битового потока
US20120114034A1 (en) * 2010-11-08 2012-05-10 Mediatek Inc. Method and Apparatus of Delta Quantization Parameter Processing for High Efficiency Video Coding
US9490839B2 (en) 2011-01-03 2016-11-08 Qualcomm Incorporated Variable length coding of video block coefficients
CN102685503B (zh) * 2011-03-10 2014-06-25 华为技术有限公司 变换系数的编码方法、变换系数的解码方法,和装置
US9516316B2 (en) 2011-06-29 2016-12-06 Qualcomm Incorporated VLC coefficient coding for large chroma block
US9826238B2 (en) 2011-06-30 2017-11-21 Qualcomm Incorporated Signaling syntax elements for transform coefficients for sub-sets of a leaf-level coding unit
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
RU2477891C1 (ru) * 2011-09-02 2013-03-20 Открытое акционерное общество "Концерн радиостроения "Вега" Способ обнаружения модификации электронного изображения (варианты)
KR102124138B1 (ko) * 2011-12-15 2020-06-18 타지반 투 엘엘씨 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 복호 장치
CN104322064A (zh) 2012-04-16 2015-01-28 韩国电子通信研究院 编码方法和解码方法以及使用其的设备
TWI450230B (zh) * 2012-05-22 2014-08-21 Hanking Digital Tec Co Ltd 同步教學系統
RU2504027C1 (ru) * 2012-07-03 2014-01-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ создания кодовой книги и поиска в ней при векторном квантовании данных
CN112399181B (zh) * 2019-08-19 2022-08-26 华为技术有限公司 图像编解码的方法、装置和存储介质
CN112564713B (zh) * 2020-11-30 2023-09-19 福州大学 高效率低时延的动觉信号编解码器及编解码方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0162197B1 (ko) * 1992-05-30 1998-12-15 강진구 영상데이타의 가변장부호와/복호화방법 및 장치
US6023296A (en) * 1997-07-10 2000-02-08 Sarnoff Corporation Apparatus and method for object based rate control in a coding system
GB2332127B (en) * 1997-12-08 2003-05-07 Daewoo Electronics Co Ltd Variable-length coding method and apparatus thereof
US6166664A (en) * 1998-08-26 2000-12-26 Intel Corporation Efficient data structure for entropy encoding used in a DWT-based high performance image compression

Also Published As

Publication number Publication date
AU2003219198A1 (en) 2003-10-13
HK1082125A1 (en) 2006-05-26
RU2004131857A (ru) 2005-04-20
EP1490975A1 (en) 2004-12-29
ATE439704T1 (de) 2009-08-15
RU2335845C2 (ru) 2008-10-10
DE60328761D1 (de) 2009-09-24
CN100521550C (zh) 2009-07-29
ES2328916T3 (es) 2009-11-19
JP2005522084A (ja) 2005-07-21
WO2003084076A1 (en) 2003-10-09
KR20040099391A (ko) 2004-11-26
CN1656690A (zh) 2005-08-17
KR101010722B1 (ko) 2011-01-24
EP1490975B1 (en) 2009-08-12
MXPA04009543A (es) 2005-01-25
ZA200407932B (en) 2006-03-29

Similar Documents

Publication Publication Date Title
JP4234607B2 (ja) 画像/ビデオエンコーダおよび/またはデコーダにおける符号化変換係数
JP4510465B2 (ja) イメージ/ビデオ符号器及び/又は復号器における変換係数の符号化
KR100969645B1 (ko) 적응 가변장 부호화
JP4611640B2 (ja) ビデオシーケンス内の動きを符号化する方法
US6696993B2 (en) Variable length coding
JP4571489B2 (ja) ビデオ符号化システムにおける量子化器パラメータを表示するための方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080916

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081211

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4234607

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131219

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term