JP2005516497A - イメージ/ビデオ符号器及び/又は復号器における変換係数の符号化 - Google Patents

イメージ/ビデオ符号器及び/又は復号器における変換係数の符号化 Download PDF

Info

Publication number
JP2005516497A
JP2005516497A JP2003563226A JP2003563226A JP2005516497A JP 2005516497 A JP2005516497 A JP 2005516497A JP 2003563226 A JP2003563226 A JP 2003563226A JP 2003563226 A JP2003563226 A JP 2003563226A JP 2005516497 A JP2005516497 A JP 2005516497A
Authority
JP
Japan
Prior art keywords
symbols
variable
encoded
variable length
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003563226A
Other languages
English (en)
Other versions
JP4510465B2 (ja
Inventor
カーツェウィッツ,マータ
カーセレン,ラギップ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27615952&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2005516497(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from US10/054,610 external-priority patent/US6690307B2/en
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2005516497A publication Critical patent/JP2005516497A/ja
Application granted granted Critical
Publication of JP4510465B2 publication Critical patent/JP4510465B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、データシンボルの集合が第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含む可変長符号化方法に関し、この方法では、可変長符号化されるシンボルの集合がデータシンボルの前記集合から形成され、可変長符号化されるシンボルの該集合に対して可変長符号化が適用される。この方法では、可変長符号化されるシンボルの集合に適用される可変長符号化の少なくとも1つの特徴が可変長符号化されるシンボルの数に従って改められ、可変長符号化されたシンボルの数の表示が提供される。本発明では、該表示は、可変長符号化されるシンボルの数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されるシンボルの数を表わす可変長コードワードである。本発明はまた、対応する可変長復号方法と、本発明の可変長符号化及び復号化の方法を実施する符号器及び復号器とにも関する。

Description

本発明は、ディジタルビデオの符号化のための方法、システム及び装置に関する。より具体的には、本発明は、可変長符号化(VLC)を用いるビデオ/イメージ符号器/復号器におけるブロックベースの変換符号化の結果として作られた量子化された変換係数の符号化に関する。
フィルムに記録されている普通の映画のようにディジタルビデオ・シーケンスは静止イメージのシーケンスから成り、動きの錯覚は、通常は毎秒15から30フレームの割合に速い速度でイメージを次々に表示することによって作られる。表示速度が割合に速いので、連続するフレーム内のイメージは非常に良く似ていて、従ってかなりの量の冗長情報を含む傾向がある。例えば、典型的なシーンは、背景の景色などの何らかの動かない要素と、何らかの動いている領域とを含み、この動いている領域は、例えばニュースキャスターの顔、往来する人や車などのさまざまな形を取ることができる。或いは、シーンを記録しているカメラ自体が動くことがあり、この場合にはイメージの全ての要素が同じ種類の動きを有する。多くの場合、このことは、1つのビデオフレームと次のビデオフレームとの間の全体としての変化がどちらかといえば小さいことを意味する。
圧縮されていないディジタルビデオ・シーケンスの各フレームはイメージピクセルのアレイから成る。例えば、クオーター・コモン・インターチェンジ・フォーマット(QCIF)として知られている広く使われているディジタルビデオフォーマットでは、フレームは176×144ピクセルのアレイから成り、この場合には各フレームは25,344ピクセルを有する。各ピクセルは、そのピクセルに対応するイメージの領域の輝度及び/又は純色量に関する情報を担う一定数のビットにより表わされる。一般に、イメージの輝度及び色差内容を表わすためにいわゆるYUVカラー・モデルが使用される。輝度成分即ちY成分はイメージの強さ(明るさ)を表わし、イメージの純色量はU及びVと呼ばれる2つの色差成分により表わされる。
イメージ内容の輝度/色差表示に基づくカラー・モデルは、原色(即ち赤、緑及び青、RGB)に関係する表示に基づくカラー・モデルと比べて一定の利点を提供する。人の視覚系は色の変化より強度変化に対して敏感であり、YUVカラー・モデルは、この特性を利用して、色差成分(U,V)に関しては輝度成分(Y)に関してよりも低い空間分解能を用いる。この様にして、イメージの色情報を符号化するために必要な情報の量を、許容できる画質低下で減少させることができる。
色差成分の低い空間分解能は、普通は副次サンプリングによって達成される。通常、ビデオシーケンスの各フレームはいわゆる“マクロブロック”に分割され、このマクロブロックは、輝度(Y)情報と、空間的に副次サンプリングされる関連色差(U,V)情報とから成る。図3は、マクロブロックを形成する1つの方法を示している。図3aはYUVカラー・モデルを用いて表わされるビデオシーケンスのフレームを示し、各成分は同じ空間分解能を有する。マクロブロックは、元のイメージ中の16×16イメージ・ピクセルの領域(図3b)を輝度情報の4つのブロックとして表わすことにより形成され、各輝度ブロックは輝度(Y)値の8×8アレイと2つの空間的に一致する色差成分(U及びV)とから成り、これらはx及びy方向に2の割合で副次サンプリングされて8×8色差(U,V)値の対応するアレイをもたらす(図3cを参照)。国際電気通信連合(ITU−T)勧告H.26L等の一定のビデオ符号化勧告に従って、マクロブロック内で使用される基本ブロック・サイズは8×8以外であっても良くて、例えば4×8又は4×4であっても良い(G.ビヨンテガールド(G.Bjontegaard)の“H.26L試験モデル長期間ナンバー8(TML−8)ドラフト0(H.26L Test Model Long Term Number 8(TML−8) draft0)”、VCEG−N10、2001年6月、セクション2.3を参照)。
QCIFイメージは11×9マクロブロックから成る。輝度ブロックと色差ブロックとが8ビットの分解能(即ち0から255の範囲内の数)で表わされるならば、マクロブロックあたりに必要とされるビットの総数は(16×16×8)+2×(8×8×8)=3072ビットである。従ってQCIFフォーマットのビデオフレームを表わすのに必要とされるビットの数は99×3072=304,128ビットである。このことは、YUVカラー・モデルを用いて表わされたQCIFフォーマットの圧縮されていないビデオシーケンスを毎秒30フレームの速度で送信/記録/表示するために必要とされるデータの量が9Mbps(毎秒9百万ビット)より多いことを意味する。これは極めて高いデータ転送速度であり、ビデオ記録、送信及び表示アプリケーションに用いるには非現実的であり、その理由は非常に大きな記憶容量、送信チャネル容量及びハードウェア性能が必要とされることにある。
ビデオデータがISDN(総合デジタル通信網)又は在来のPSTN(公衆交換電話回線網)などの固定回線ネットワークを介してリアルタイムで送信されるときには、利用できるデータ伝送帯域幅は通常は64kbits/s程度である。送信が少なくとも部分的に無線通信リンクを介して行われる移動テレビ電話では、利用できる帯域幅は20kbits/sの低さである可能性がある。このことは、低帯域幅通信ネットワークを介するディジタルビデオ・シーケンスの送信を可能にするために、ビデオデータを表わすために使われる情報の量を大幅に減少させなければならないことを意味する。そのため、許容可能な画質を保ちながら送信される情報の量を減少させるビデオ圧縮手法が開発されている。
ビデオ圧縮方法は、ビデオシーケンスの冗長部分と知覚に関して重要でない部分とを切りつめることに基づく。ビデオシーケンスにおける冗長性は、空間的冗長性、時間的冗長性及びスペクトル的冗長性に分類することができる。空間的冗長性は、フレーム内の隣り合うピクセル間の相関性(類似性)を記述するために使われる用語である。“時間的冗長性”という用語は、シーケンス中の1フレームに現れる物はその後のフレームにも現れそうであるという事実を表わし、“スペクトル的冗長性”は、同じイメージの異なる色成分間の相関関係を指す。
充分に効率の良い圧縮は、単に与えられたイメージのシーケンス中のいろいろな形の冗長性を減らすだけでは普通は達成できない。従って、現在の殆どのビデオ符号器は、ビデオシーケンスの、主観的に重要性が最も低い部分の質を低下させる。更に、圧縮されているビデオ・ビットストリーム自体の冗長性が、効率の良い無損失符号化によって低減される。一般に、これは、エントロピー符号化と称される手法を用いて達成される。
ディジタルビデオシーケンスの各フレームを構成するピクセル間にかなりの量の空間的冗長性が存在することが良くある。換言すると、シーケンスのフレーム内のどのピクセルの値も、その直ぐ近くにある他のピクセルの値と実質的に同じである。通常、ビデオ符号化システムは、“ブロックベースの変換符号化”と称される手法を用いて空間的冗長性を低減させ、この手法では数学的変換をイメージのピクセルに対してマクロブロック毎に適用する。変換符号化はイメージデータをピクセル値から成る表示から係数値の集合から成る形に変換し、その各係数値は、問題の変換の基底関数についての重み係数(乗数)である。2次元離散余弦変換(DCT)等の一定の数学的変換を用いることにより、ディジタルビデオシーケンスのフレーム内の空間的冗長性を顕著に低減し、このことによりイメージデータのよりコンパクトな表示を作ることができる。
シーケンス内の他のどのフレームとも関係なくブロックベース変換符号化を用いて圧縮されたビデオシーケンスのフレームは、イントラ符号化されたフレーム或いはI−フレームと称される。更に、可能な場合には、イントラ符号化されているフレームのブロックが同じフレーム内の前に符号化されたブロックから予測される。イントラ予測と称されるこの手法は、イントラ符号化されているフレームを表わすために必要とされるデータの量を更に低減するという効果を有する。
一般に、ビデオ符号化システムは、ビデオシーケンスの個々のフレーム内での空間的冗長性を低減するだけではなくて、“動き補償予測”と称される手法を用いてシーケンス内での時間的冗長性を低減する。動き補償予測を用いて、ディジタルビデオシーケンス内の幾つかの(多数であることが良くある)フレームのイメージ内容が該シーケンス内の“参照”又は“アンカー”フレームと称される1つ以上の他のフレームから“予測”される。イメージ内容の予測は、符号化(圧縮)されるフレームと参照フレームとの間でのイメージの物体又は領域の動きを“動きベクトル”を用いて追跡することによって達成される。一般に、参照フレームは、ビデオシーケンスの中で、符号化されることになるフレームより先行しても良く、その後に続いても良い。イントラ符号化の場合と同じく、ビデオフレームの動き補償予測は、通常はマクロブロック毎に実行される。
動き補償予測を用いて圧縮されたビデオシーケンスのフレームは、一般にインター符号化されたフレーム或いはP−フレームと称される。動き補償予測だけでビデオフレームのイメージ内容の充分に精密な表示を提供することは希であり、従って、通常は、各インター符号化されたフレームと共にいわゆる“予測誤差”(PE)フレームを提供する必要がある。予測誤差フレームは、インター符号化されたフレームの復号されたバージョンと符号化されるフレームのイメージ内容との差を表わす。より具体的には、予測誤差フレームは、符号化されるフレーム内のピクセル値と、問題のフレームの予測されたバージョンに基づいて形成された対応する復元されたピクセル値との差を表わす値からなる。その結果として、予測誤差フレームは静止イメージに類似する特徴を持っており、その空間的冗長性を低減するために、従ってそれを表わすために必要とされるデータの量(ビット数)を低減するために、ブロック・ベース変換符号化を適用することができる。
ビデオ符号化システムの動作を更に詳しく説明するために、図1及び2を参照する。図1はイントラ符号化及びインター符号化の組み合わせを使用して圧縮された(符号化された)ビデオビットストリームを作る一般的ビデオ符号器の略図である。対応する復号器が図2に示されており、本書において後に説明する。
ビデオ符号器100は、カメラ又は他のビデオソース(図示されていない)からディジタルビデオ信号を受け取るための入力101を含む。それは、ブロック・ベースの離散余弦変換(DCT)を実行するように構成されている変換ユニット104、量子化器106、逆量子化器108、逆ブロック・ベース離散余弦変換(IDCT)を実行するように構成されている逆変換ユニット110、結合器112及び116、及びフレーム記憶装置120も含む。該符号器は、動き推定器130、動き場符号器140及び動き補償予測器150を更に含む。スイッチ102及び114は、該符号器をビデオ符号化のイントラ・モードとビデオ符号化のインター・モードとの間で切り換えるように制御マネージャー160により共調的に操作される。符号器100はビデオマルチプレックス符号器170も含んでおり、これは、遠方の受信端末へ更に伝送するため、或いは例えばコンピュータのハードドライブ(図示されていない)等の大容量記憶媒体に記憶させるために、符号器100により作られる種々の情報から単一のビットストリームを形成する。
符号器100は次のように動作する。ビデオソースから入力101に提供される圧縮されていないビデオの各フレームは、マクロブロック毎に、好ましくはラスター走査順に、受信され処理される。新しいビデオシーケンスの符号化が始まるとき、符号化される第1フレームはイントラ符号化フレームとして符号化される。その後、該符号器は、次の条件:即ち1)符号化されつつあるフレームの現在のマクロブロックがその予測に用いられる参照フレーム中のピクセル値に似ていないために過剰な予測誤差情報が作られると判定されたこと(この場合には現在のマクロブロックはイントラ符号化フォーマットに符号化される);2)所定のイントラ・フレーム繰り返し間隔が経過したこと;或いは3)フレームをイントラ符号化フォーマットで提供するように求める要求を示すフィードバックが受信端末から受信されたこと、のうちの1つが満たされるときを除いて、各フレームをインター符号化フォーマットに符号化するようにプログラムされている。
条件1)の発生は、結合器116の出力を監視することにより検出される。結合器116は、符号化されているフレームの現在のマクロブロックと動き補償予測ブロック150で作られたその予測との差を形成する。この差の程度(例えばピクセル値の絶対差の和)が所定閾値を上回ると、結合器116は制御ライン119を介して制御マネージャー160に知らせ、制御マネージャー160は制御ライン113を介してスイッチ102及び114を操作して符号器100をイントラ符号化モードに切り換える。この様にして、他の部分がインター符号化フォーマットで符号化されているフレームがイントラ符号化マクロブロックを含むことがある。条件2)の発生は制御マネージャー160において具体化されているタイマー又はフレームカウンターによって監視され、もし該タイマーが満了するか或いは該フレームカウンターがフレームの所定数に達したならば制御マネージャー160は制御ライン113を介してスイッチ102及び114を操作して該符号器をイントラ符号化モードに切り換える。条件3)は、受信端末がイントラ・フレーム・リフレッシュを要求していることを示すフィードバック信号を制御マネージャー160が例えば受信端末から制御ライン121を介して受け取ると、トリガーされる。この様な条件は、例えば、前に送信されたフレームが伝送中の障害によりひどく変形して、受信装置で復号することを不可能にしている場合に、生じる。この場合には、受信している復号器は、次のフレームをイントラ符号化フォーマットで符号化することを求める要求を発し、従って符号化シーケンスを再初期化する。
イントラ符号化モードでの符号器100の動作を説明する。イントラ符号化モードでは、制御マネージャー160は入力ライン118からビデオ入力を受け入れるようにスイッチ102を操作する。ビデオ信号入力は、マクロブロック毎に入力101から入力ライン118を介して受信される。受信されると、マクロブロックを構成する輝度値及び色差値のブロックがDCT変換ブロック104に渡され、これは、値の各ブロックに対して2次元離散余弦変換を実行し、各ブロックについてDCT係数の2次元アレイを作る。DCT変換ブロック104は各ブロックについて係数値のアレイを作り、その係数値の数は、マクロブロックを構成するブロックの性質に依存する。例えば、マクロブロックで使われる基本的ブロック・サイズが4×4であれば、DCT変換ブロック104は各ブロックについてDCT係数の4×4アレイを作る。ブロック・サイズが8×8ならば、DCT係数の8×8アレイが作られる。
各ブロックについてのDCT係数は量子化器106に渡され、ここで量子化パラメータQPを用いて量子化される。量子化パラメータQPの選択は、制御ライン115を介して制御マネージャー160により制御される。量子化された係数は、DCT変換ブロック104により始めに作られた係数より低い数値精度を有するので、量子化は情報の損失をもたらす。これは、ビデオシーケンスの各イメージを表わすために必要とされるデータの量を低減させることのできる更なるメカニズムを提供する。しかし、本質的に無損失であるDCT変換とは異なって、量子化によりもたらされる情報の損失は、画質の不可逆的劣化の原因となる。DCT係数に対して適用される量子化の度合いが大きいほど、画質の損失が大きくなる。
図1のライン125により示されるように、各ブロックについての量子化されているDCT係数は量子化器106からビデオ・マルチプレックス符号器170に渡される。ビデオ・マルチプレックス符号器170は、ジグザグ走査手順を用いて各ブロックについての量子化された変換係数を配列する。この操作は、量子化された変換係数の2次元アレイを1次元アレイに変換する。図4に示されている4×4アレイについての順序などの代表的ジグザグ走査順序は、該係数をおおよそ空間周波数の昇順に配列する。このことは、1次元アレイ内で前の方に位置する係数が該アレイ内で後の方に位置する係数より大きな絶対値を持つ可能性が大きくなるように、係数を該係数の値に従って並べる傾向も有する。その理由は、低い空間周波数がイメージ・ブロック内で大きな振幅を有しがちであることにある。その結果として、量子化された変換係数の1次元アレイの終わり近くにある値はゼロである傾向を有する。
通常、ビデオ・マルチプレックス符号器170は、1次元アレイ内のゼロでない量子化された各係数を、レベル及びランと称される2つの値で表わす。レベルは量子化された係数の値であり、ランは、問題の係数に先立つゼロの値の連続する係数の個数である。与えられた係数についてのラン及びレベルの値は、レベル値が関連するラン値の先に位置するように配列される。ゼロに等しいレベル値は、ブロック内にそれ以上の非ゼロ係数値が存在しないことを示すために使われる。この0レベル値はEOB(end−of−block(ブロックの終わり))シンボルと称される。
或いは、1次元アレイ内の非ゼロ値を有する量子化された各係数は、3つの値(ラン、レベル、ラスト)により表示可能である。レベル及びランの意味は前の方式と同一であるが、ラストは、1次元アレイ内で現在の係数の後に他の非ゼロ値の係数があるか否かを示す。従って、別のEOBシンボルは不要である。
ラン値及びレベル値(該当する場合にはラストも)は、エントロピー符号化を用いて更に圧縮される。エントロピー符号化は、符号化されるべきデータ集合内のシンボルは一般にいろいろな出現確率を有するという事実を利用する無損失操作である。従って、一定数のビットを用いて各シンボルを表わす代わりに、より出現しやすそうなシンボルがより少数のビットを有するコードワードにより表わされることとなるように可変数のビットを割り当てる。この理由から、エントロピー符号化は良く可変長符号化(VLC)と称される。レベル及びランの或る値は他の値より出現しやすいので、ラン及びレベル値を表わすのに要するビットの数を減らすためにエントロピー符号化手法を有効に使用することができる。
ラン値及びレベル値がエントロピー符号化されると、ビデオマルチプレックス符号器170は、問題の情報の種類に適する可変長符号化方法を用いてエントロピー符号化されている制御情報と該ラン値及びレベル値とを更に組み合わせて、符号化されたイメージ情報の単一の圧縮されたビットストリーム135を形成する。該符号器から送信されるのは、(ラン、レベル)対を表わす可変長コードワードを含むこのビットストリームである。
エントロピー符号化をビデオマルチプレックス符号器170により実行される操作との関係で記述したけれども、代わりの実施態様では別のエントロピー符号化ユニットを設けても良いことに留意するべきである。
マクロブロックの局所的に復号されたバージョンも符号器100で形成される。このことは、量子化器106から出力される、各ブロックについての量子化されている変換係数を逆量子化器108を通過させ、逆変換ブロック110で逆DCT変換を適用することによって実行される。この様にして、マクロブロックの各ブロックについてピクセル値の復元されたアレイが作られる。その結果としての復号されたイメージデータは結合器112に入力される。イントラ符号化モードでは、スイッチ114は、スイッチ114を介する結合器112への入力がゼロであるようにセットされる。この様にして、結合器112により実行される操作は、復号されたイメージデータを元のまま通過させることと同等である。
現在のフレームの後続のマクロブロックが受信され、ブロック104,106,108,110及び112での前述の符号化及び局所復号のステップを受けるとき、イントラ符号化されたフレームの復号されたバージョンがフレーム記憶装置120で作られる。現在のフレームの最後のマクロブロックがイントラ符号化され、その後に復号され終わったとき、フレーム記憶装置120は、後に受信されたビデオフレームをインター符号化されたフォーマットに符号化するときに予測参照フレームとして利用できる完全に復号されたフレームを含んでいる。
インター符号化モードでの符号器100の動作を説明する。インター符号化モードでは、制御マネージャー160はスイッチ102をライン117からの入力を受け取るように操作するが、それは結合器116の出力から成る。結合器116は、入力101からビデオ入力信号をマクロブロック毎に受け取る。結合器116は、マクロブロックを構成する輝度値及び色差値のブロックを受け取るとき、予測誤差情報の対応するブロックを形成する。予測誤差情報は、問題のブロックと、動き補償予測ブロック150で作られた該ブロックの予測との差を表わす。より具体的には、マクロブロックの各ブロックについての予測誤差情報は、値の2次元アレイからなり、その各々は、符号化される輝度又は色差情報のブロック中のピクセル値と、以下で説明する手順に従って該ブロックについての動き補償予測を形成することによって得られる復号されたピクセル値との差を表わす。各マクロブロックが、例えば、輝度値及び色差値から成る4×4ブロックのアセンブリーから成る場合には、該マクロブロックの各ブロックについての予測誤差情報は、同様に、予測誤差値の4×4アレイから成る。
マクロブロックの各ブロックについての予測誤差情報はDCT変換ブロック104に渡され、これは、予測誤差値の各ブロックに対して2次元離散余弦変換を実行して各ブロックについてDCT変換係数の2次元アレイを作る。DCT変換ブロック104は、各予測誤差ブロックについての係数値のアレイを作り、係数値の個数はマクロブロックを構成するブロックの性質に依存する。例えば、マクロブロックに使われる基本ブロックサイズが4×4ならば、DCT変換ブロック104は、各予測誤差ブロックについてDCT係数の4×4アレイを作る。ブロック・サイズが8×8ならば、DCT係数の8×8アレイが作られる。
各予測誤差ブロックについての変換係数は量子化器106に渡され、ここで該係数は、イントラ符号化モードでの該符号器の動作に関して前述した態様と同様の態様で量子化パラメータQPを用いて量子化される。量子化パラメータQPの選択は、制御ライン115を介して制御マネージャー160により制御される。
マクロブロックの各ブロックについての予測誤差情報を表わす量子化されたDCT係数は、図1においてライン125により示されているように、量子化器106からビデオマルチプレックス符号器170に渡される。イントラ符号化モードのときと同じく、ビデオマルチプレックス符号器170は、各予測誤差ブロックについての変換係数を前述したジグザグ操作手順(図4を参照)を用いて配列し、各々のゼロでない量子化された係数をレベル値及びラン値として表わす。ビデオマルチプレックス符号器は、イントラ符号化モードと関連して前述した態様と同様の態様で、エントロピー符号化を用いてラン値及びレベル値を更に圧縮する。ビデオマルチプレックス符号器170は、更に、ライン126を介して動き場符号化ブロック140から(次に説明する)動きベクトル情報を受け取り、制御マネージャー160から制御情報を受け取る。それは、動きベクトル情報と制御情報とをエントロピー符号化し、そのエントロピー符号化された動きベクトル、予測誤差及び制御情報を含む符号化されたイメージ情報の単一のビットストリーム135を形成する。
マクロブロックの各ブロックについての予測誤差情報を表わす量子化されたDCT係数は、量子化器106から逆量子化器108にも渡される。ここで、それらは逆量子化され、その結果として逆量子化されたDCT係数のブロックは逆DCT変換ブロック110に加えられ、ここでそれらは逆DCT変換を受けて予測誤差値の局所復号されたブロックを作る。予測誤差値の局所復号されたブロックは結合器112に入力される。インター符号化モードでは、スイッチ114は、結合器112が動き補償予測ブロック150により作られたマクロブロックの各ブロックについての予測されたピクセル値も受け取るようにセットされる。結合器112は、予測誤差値の各々の局所復号されたブロックを予測されたピクセル値の対応するブロックと組み合わせて、復元されたイメージブロックを作り、それらをフレーム記憶装置120に記憶させる。
ビデオ信号の後続のマクロブロックがビデオソースから受け取られてブロック104,106,108,110,112で前述したように符号化及び復号のステップを受けるとき、フレームの復号されたバージョンがフレーム記憶装置120で構築される。フレームの最後のマクロブロックが処理されたとき、フレーム記憶装置120は、後に受け取られたビデオフレームをインター符号化されたフォーマットに符号化するときに予測参照フレームとして利用できる完全に復号されたフレームを含んでいる。
現在のフレームのマクロブロックについての予測の形成を説明する。インター符号化されたフォーマットで符号化されているフレームは、動き補償予測のために参照フレームを必要とする。このことは、必然的に、ビデオシーケンスを符号化するとき、符号化されることになる第1のフレームが、該第1フレームが該シーケンス中の第1フレームであるかそれとも他のフレームであるかを問わずに、イントラ符号化されたフォーマットで符号化されなければならないことを意味する。そして、このことは、ビデオ符号器100が制御マネージャー160によりインター符号化モードに切り換えられるとき、前に符号化されたフレームを局所的に復号することによって形成された完全な参照フレームが該符号器のフレーム記憶装置120で既に利用可能になっているということを意味する。一般に、参照フレームは、イントラ符号化されたフレーム又はインター符号化されたフレームを局所的に復号することにより形成される。
現在のフレームのマクロブロックについて予測を形成する第1ステップは動き推定ブロック130により実行される。動き推定ブロック130は、符号化されるべきフレームの現在のマクロブロックを構成する輝度値及び色差値のブロックをライン128を介して受け取る。それは、参照フレーム中の、現在のマクロブロックと実質的に一致する領域を特定するためにブロックマッチング操作を実行する。ブロックマッチング操作を実行するために、動き推定ブロックは、フレーム記憶装置120に記憶されている参照フレームデータにライン127を介してアクセスする。より具体的には、動き推定ブロック130は、調べられるマクロブロックと、フレーム記憶装置120に記憶されている参照フレームからのピクセルの候補最良マッチング領域との間のピクセル値の差を表わす差値(例えば、絶対差の合計)を計算することによってブロックマッチングを実行する。参照フレームの所定探索領域内で可能なあらゆるオフセットで候補領域について差値が作られ、動き推定ブロック130は最小の計算された差値を決定する。現在のフレーム中のマクロブロックと、最小の差値を生じさせる参照フレーム中のピクセル値の候補ブロックとの間のオフセットが問題のマクロブロックについての動きベクトルを定める。
動き推定ブロック130は、マクロブロックについて動きベクトルを作ると、その動きベクトルを動き場符号化ブロック140へ出力する。動き場符号化ブロック140は、基底関数及び動き係数の集合からなる動きモデルを用いて、動き推定ブロック130から受け取られた動きベクトルを近似する。より具体的には、動き場符号化ブロック140は、基底関数を乗じたときに動きベクトルの近似値を形成する動き係数値の集合として動きベクトルを表わす。通常、動き係数及び基底関数を2つだけ有する並進動きモデルが使用されるが、もっと複雑な動きモデルも使用可能である。
動き係数は動き場符号化ブロック140から動き補償予測ブロック150に渡される。動き補償予測ブロック150は、更に、動き推定ブロック130により特定されたピクセル値の最良マッチング候補領域をフレーム記憶装置120から受け取る。動き場符号化ブロック140により作られた動きベクトルの近似表示と参照フレームからのピクセルの最良マッチング候補領域のピクセル値とを使って、動き補償予測ブロック150はマクロブロックの各ブロックについて予測されるピクセル値のアレイを作る。予測されたピクセル値の各ブロックは結合器116に渡され、ここで、予測されたピクセル値は、現在のマクロブロックの対応するブロック中の実際の(入力された)ピクセル値から差し引かれる。この様にして、マクロブロックについて予測誤差ブロックの集合が得られる。
図2に示されているビデオ復号器200の動作を説明する。復号器200は、符号器100から符号化されているビデオビットストリーム135を受け取ってそれをその構成部分に多重分離するビデオマルチプレックス復号器270、逆量子化器210、逆DCT変換器220、動き補償予測ブロック240、フレーム記憶装置250、結合器230、制御マネージャー260、及び出力280から成る。
制御マネージャー260は、イントラ符号化されているフレームが復号されるのか、それともインター符号化されているフレームが復号されるかにより、復号器200の動作を制御する。例えば、符号器から受信された各々の圧縮されているビデオフレームのヘッダ部分に与えられている画像タイプ情報から、該復号器を該復号モード間でスイッチングさせるイントラ/インター・トリガー制御信号が得られる。このイントラ/インター・トリガー制御信号は、符号化されているビデオビットストリームからビデオマルチプレックス復号器270により抽出されて、制御ライン215を介して制御マネージャー260に渡される。
イントラ符号化されているフレームの復号はマクロブロック毎に実行され、各マクロブロックは、それに関連する符号化されている情報がビデオビットストリーム135で受信されると実質的に直ぐに復号される。ビデオマルチプレックス復号器270は、マクロブロックのブロックについての符号化されている情報を問題のマクロブロックに関連するあり得る制御情報から分離する。イントラ符号化されているマクロブロックの各ブロックについての符号化されている情報は、該ブロックのゼロでない量子化されているDCT係数についてエントロピー符号化されているレベル値及びラン値を表わす可変長コードワードから成る。ビデオマルチプレックス復号器270は、符号器100で使われた符号化方法に対応する可変長復号方法を用いて可変長コードワードを復号し、これによりレベル値及びラン値を回復する。復号器270は、マクロブロックの各ブロックについての量子化されている変換係数値のアレイを復元し、これらを逆量子化器210に渡す。マクロブロックに関連する制御情報も適切な復号方法を用いてビデオマルチプレックス復号器で復号されて制御マネージャー260に渡される。特に、変換係数に対して適用される量子化のレベルに関連する情報は、ビデオマルチプレックス復号器270により、符号化されているビットストリームから抽出されて制御ライン217を介して制御マネージャー260に提供される。制御マネージャーは、この情報を制御ライン218を介して逆量子化器210に伝える。逆量子化器210は、制御情報に従ってマクロブロックの各ブロックについての量子化されているDCT係数を逆量子化し、その逆量子化されたDCT係数を逆DCT変換器220に提供する。
逆DCT変換器220は、マクロブロックの各ブロックについて逆量子化されたDCT係数に対して逆DCT変換を実行して、復元されたピクセル値から成るイメージ情報の復号されたブロックを形成する。動き補償予測はイントラ符号化されているマクロブロックの符号化/復号には用いられないので、制御マネージャー260は、イントラ符号化されているマクロブロックの復号に参照情報が用いられることを妨げるように結合器230を制御する。マクロブロックの各ブロックについての復元されたピクセル値は復号器のビデオ出力280に渡され、ここで該ピクセル値を例えば表示装置(図示されていない)に提供することができる。マクロブロックの各ブロックについて復元されたピクセル値はフレーム記憶装置250に格納される。イントラ符号化されているフレームの後続のマクロブロックが復号されて格納されるとき、復号されたフレームがフレーム記憶装置250で漸次組み立てられて、後に受信されるインター符号化されているフレームの復号と関連する動き補償予測のための参照フレームとして利用することができるようになる。
インター符号化されているフレームもマクロブロック毎に復号され、各々のインター符号化されているマクロブロックは、これに関連する符号化されている情報がビットストリーム135で受信されると実質的に直ぐに復号される。ビデオマルチプレックス復号器270は、インター符号化されているマクロブロックの各ブロックについて符号化されている予測誤差情報を、問題のマクロブロックに関連する符号化されている動きベクトル情報及びあり得る制御情報から分離する。前述したように、マクロブロックの各ブロックについて符号化されている予測誤差情報は、問題の予測誤差ブロックのゼロでない量子化されている変換係数についてのエントロピー符号化されているレベル値及びラン値を表わす可変長コードワードから成る。ビデオマルチプレックス復号器270は、符号器100で使われる符号化方法に対応する可変長復号方法を用いて可変長コードワードを復号し、これによりレベル値及びラン値を回復する。次にそれは各予測誤差ブロックについて量子化されている変換係数値のアレイを復元して、それらを逆量子化器210に渡す。インター符号化されているマクロブロックに関連する制御情報も、適切な復号方法を用いてビデオマルチプレックス復号器270で復号され、制御マネージャー260に渡される。予測誤差ブロックの変換係数に適用される量子化のレベルに関連する情報が符号化されているビットストリームから抽出されて制御ライン217を介して制御マネージャー260に提供される。制御マネージャーは、この情報を制御ライン218を介して逆量子化器210に伝える。逆量子化器210は、マクロブロックの各ブロックについての予測誤差情報を表わす量子化されているDCT係数を制御情報に従って逆量子化し、この逆量子化されたDCT係数を逆DCT変換器220に提供する。各ブロックについての予測誤差情報を表わす逆量子化されているDCT係数は、逆DCT変換器220で逆変換されて、マクロブロックの各ブロックについて復元された予測誤差値のアレイを生じさせる。
マクロブロックに関連する符号化されている動きベクトル情報が、符号化されているビデオビットストリーム135からビデオマルチプレックス復号器270により抽出されて復号される。この様にして得られた復号された動きベクトル情報は制御ライン225を介して動き補償予測ブロック240に渡され、これは、符号器100でインター符号化されているマクロブロックを符号化するために使われるものと同じ動きモデルを用いて該マクロブロックについての動きベクトルを復元する。その復元された動きベクトルは、符号器の動き推定ブロック130により始めに決定された動きベクトルを近似する。復号器の動き補償予測ブロック240は、復元された動きベクトルを使って、フレーム記憶装置250に格納されている予測参照フレーム内の復元されたピクセルの領域の場所を特定する。参照フレームは、例えば、前に復号されたイントラ符号化されているフレーム、又は前に復号されたインター符号化されているフレームであって良い。いずれの場合にも、復元された動きベクトルにより示されるピクセルの領域は、問題のマクロブロックについての予測を形成するために使用される。より具体的には、動き補償予測ブロック240は、参照フレームで特定されたピクセルの領域から対応するピクセル値をコピーすることによってマクロブロックの各ブロックについてピクセル値のアレイを形成する。予測、即ち参照フレームから得られたピクセル値のブロック、は動き補償予測ブロック240から結合器230に渡され、ここでそれらは復号された予測誤差情報と結合される。実際には、各々の予測されたブロックのピクセル値は、逆DCT変換器220により出力された対応する復元された予測誤差値に加えられる。この様にして、マクロブロックの各ブロックについて復元されたピクセル値のアレイが得られる。復元されたピクセル値は復号器のビデオ出力280に渡され、またフレーム記憶装置250に格納される。インター符号化されているフレームの後続のマクロブロックが復号されて格納されるとき、復号されたフレームがフレーム記憶装置250で漸次組み立てられて、他のインター符号化されているフレームの動き補償予測のための参照フレームとして利用することができるようになる。
可変長符号化(VLC)の手法を使用する量子化された変換係数と関連するラン値及びレベル値のエントロピー符号化を詳しく検討する。
通常、ラン−レベル対は単一のシンボルとして符号化される。これは、可能な各ラン−レベル対と定められたコード番号との間のマッピングを定めることにより達成される。コード番号へのラン−レベル対のマッピングの例がルックアップ・テーブルとしてテーブル3に示されている。このルックアップ・テーブルのマッピングを用いて、コード番号がブロックの各(ラン、レベル)対に割り当てられ、その結果としてのコード番号はVLC符号化によって符号化される。例えば、ジョイントモデル(JM)2.0“ワーキング・ドラフト・ナンバー2、Doc.JVT−B118、ISO/IEC MPEG及びITU−T VCEG Pattayaのジョイントビデオチーム(JVT)、第2回JVT会議、ジュネーブ、CH、2002年1月29日−2月1日(Working Draft Number 2、Doc.JVT−B118,Joint Video Team(JVT) of ISO/IEC MPEG and ITU−T VCEG Pattaya,2nd JVT Meeting, Geneva,CH,Jan.29−Feb.1,2002)”(H.26Lビデオ符号化規格)において、(ラン、レベル)対をコード番号にマッピングする2つの異なるルックアップ・テーブルが定められている。どちらのテーブルを使うかの選択はQP値とブロックの符号化モードとに基づく。より具体的には、符号化モードがイントラであり、QPが24より小さければ、他の場合とは異なるテーブルが使用される。
JVT H.26LのジョイントモデルJM2.0は、UVLCと称されるいわゆる“ユニバーサル”可変長符号化方式を使用する。H.26L JM2.0に従って実現されたビデオ符号器は、該符号器からビットストリームで送信される全ての情報(シンタックス・エレメント)をエントロピー符号化するために可変長コードワードの単一の集合を使用する。いろいろなタイプの情報の符号化のために、使用されるコードワードは同じだけれども所定数のいろいろなデータシンボル対コードワード・マッピングが定義される。例えば、輝度情報を含むブロックのために2つのデータシンボル対コードワード・マッピングが提供され、マッピングの選択は、量子化されたDCT変換係数を配列するために使われるジグザグ走査動作(シンプルスキャン又はダブルスキャン)のタイプに依存する。H.26Lに従って定義されるシンプル及びダブルスキャン・ジグザグ走査方式の詳細については、ワーキング・ドラフト・ナンバー2、Doc.JVT−B118、ISO/IEC MPEG及びITU−T VCEG Pattayaのジョイントビデオチーム(JVT)、第2回JVT会議、ジュネーブ、CH、2002年1月29日−2月1日、を参照されたい。特にマクロブロック・タイプ(MB_Type)情報、動きベクトル・データ(MVD)及びイントラ予測モード情報のために異なるマッピングも設けられている(下のテーブル3を参照)。
H.26L JM2.0で定義されているUVLCコードワードは以下のテーブル1に示されている圧縮された形で書かれても良く、ここでxn項は値0又は1をとることができる。
Figure 2005516497
テーブル2は、テーブル1に提示されている方式に従って作られた始めの16個のUVLCコードワードを提示し、テーブル3は、H.26Lに従って提供されるいろいろなデータシンボル対コードワード・マッピングのうちの幾つかを示す。該マッピングの完全な記述については、読者は再びワーキング・ドラフト・ナンバー2、Doc.JVT−B118、ISO/IEC MPEG及びITU−T VCEG Pattayaのジョイントビデオチーム(JVT)、第2回JVT会議、ジュネーブ、CH、2002年1月29日−2月1日、を参照するべきである。
Figure 2005516497
Figure 2005516497
H.26Lで採用されているユニバーサル可変長符号化方式は多くの技術上の利点を提供する。特に、テーブル1に提示されているルールなどの簡単なルールに従って作ることのできる単一のVLCコードワード集合を用いているので、コードワードを1ビットずつ作ってゆくことができる。このことは、符号器及び復号器にコードワードテーブルを格納しておく必要を無くし、従って符号器及び復号器の両方におけるメモリー要件を低減させる。もちろん、代わりの実施態様においてはコードワードテーブルを作って符号器及び復号器に格納しておいても良いことに注意するべきである。いろいろなデータシンボル対コードワード・マッピングは、エントロピー符号化される種々のタイプのイメージ関連データ及び制御情報の種々の統計的特性にUVLC符号化方式を少なくとも限定的に適応させることを可能にする。種々のデータシンボル対コードワード・マッピングを符号器及び復号器に格納することができ、従ってマッピング情報をビットストリームで符号器から復号器へ送る必要はない。このことは誤差復元力を維持する上で役立つ。
しかし、UVLCエントロピー符号化方式には欠点も幾つかある。特に、コードワードが固定されていて、いろいろなデータシンボル対コードワード・マッピングにより提供される適応性が限られている結果として、必然的にデータ圧縮があまり良くなくなる。その原因は、いろいろな変換係数の発生頻度(即ち、確率)が、従っていろいろな(ラン、レベル)対の確率が、イメージ内容及び符号化されるイメージのタイプに依存して変化するという事実である。従って、可変長コードワードの集合が1つだけ使用され、符号化/復号されるデータシンボルとVLCとのマッピングが1つだけ提供されるならば、一般に、最高の符号化効率を達成することはできない。
この理由から、基本のUVLC符号化方式の改変形が提案されている。より具体的には、VLCコードワードの2つ以上の集合を含めることが提案されている。その様な一提案がガイル・ビヨンテガールドによりQ.15/SG16“イントラ・ルーマ係数のための2つのVLC間での適応スイッチングの使用(Use of Adaptive Switching Between Two VLCs for INTRA Luma Coefficients)”、Doc.Q15−K−30、2000年8月発表である。これは、一定のタイプの情報のエントロピー符号化のためにVLCコードワードの第2の集合を使うことを提案したものである。文書Q15−K−30によると、VLC2と称されるVLCコードワードの提案された第2の集合は、以下のテーブル4に示されている方式に従って作られる。それは、特に、H.26Lに従って定められるダブルスキャン・ジグザグ走査方式を用いて走査される4×4ピクセルのイントラ符号化輝度ブロックの量子化された変換係数と関連するラン値及びレベル値を符号化するために使用される。テーブル5は、明示的な形でVLC2の始めの16個のコードワードを示している。
Figure 2005516497
Figure 2005516497
テーブル4及び5をテーブル1及び2とそれぞれ比較すれば分かるように、UVLCコードワードの元の集合においては最短のコードワードに単一のビットが割り当てられるのに対して、VLC2の最短のコードワードは2ビットを有する。VLCコードワードは他のコードワードの接頭辞たり得ないという一般的復号可能性要件に起因して、この変化は他のVLC2コードワードの構造に重要な影響を及ぼす。具体的には、最短のコードワードに2ビットを割り当てているので、より高いインデックスを有するコードワードをより少数のビットで表示することができる。例えば、テーブル2を参照すると、インデックス7のUVLCコードワードは7ビットを有するが、インデックス7のVLC2コードワードは6ビットを有するに過ぎないことが分かる。
コードワードの2つ以上の集合間での文脈ベースのスイッチングによりコードワードを選択する前述のVLC符号化方法は、VLCコードワードの集合を1つだけ使用する方法と比べてデータ圧縮効率を改善する。しかし、多くのデータ圧縮アプリケーションでは、特にビデオ符号化に関連するアプリケーションでは、データ圧縮効率を向上させたいという希望が引き続き存在する。計算の複雑さ及びメモリ要件を低く抑え、且つ良好な誤差復元力を保ちながら、符号化されるデータシンボルのタイプ及び統計的特性への適応性を改善する新しい可変長符号化方法を開発することが依然として相当な関心事である。本発明の方法が開発されたのはこの文脈においてである。
本発明の要約
本発明の方法は、計算の複雑さを低く抑え、且つ良好な誤差復元力を保ちながら、符号化されるデータシンボルのタイプ及び統計的特性への可変長符号化方法の適応性を改善することに関連する上記問題に対処しようとするものである。
一般的に言えば、本発明は、ビデオ符号器におけるブロック・ベースの変換符号化の結果として作られる量子化された変換係数の可変長符号化に関する。しかし、本発明の可変長符号化及び復号方法を、より一般的に、符号化される他のタイプのデータにも適用し得ることが理解されるべきである。
特に、本発明はVLC符号化方法に関し、この方法では量子化された変換係数のブロック中の非ゼロ値を有する係数の個数Ncが特定されて、対応する復号器に送られるビットストリームで明示的に伝えられる。前述したように、Ncの明示的信号はEOBシンボルを送る必要を無くし、このことは符号化効率の改善をもたらすことができる。より具体的には、本発明は、ブロック中の非ゼロ値の係数の個数を表わすNc値自体がVLC符号化されるようになっている方法を提案する。このことは符号化効率のなお大きな改善をもたらす。
本方法はNcについての値をVLC符号化するためにVLCコードワードの少なくとも2つの集合を使用することを含むと共にコードワードの該集合間でのスイッチングのためのルールを定め、それは、そのNc値が符号化されるブロックの隣りのブロック(1つ又は複数)中の非ゼロ値の係数の個数を考慮に入れる。スイッチングのルールは、Ncを表わすVLCコードワードを含んでいて本発明の方法に従って形成されたビットストリームを、コードワードの選択に関連する情報を該ビットストリームに包含させることを必要とせずに復号することができるように設計される。換言すれば、本発明によれば、Nc値を表わす各コードワードがその中から選択されるところの集合の明示的表示を提供する必要はない。この特性はデータ圧縮効率を高める。
当業者は、本発明の方法を、一般的に、(ラン、レベル)対として表わされるデータシンボルのVLC符号化に、或いは符号化されるべきデータシンボルの集合の何らかの同等表示に適用できることを理解するであろう。
本発明の第1の局面に従って、第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含むデータシンボルの集合を符号化する方法が提供され、この方法では可変長符号化されるシンボルの集合が前記データシンボルの集合から形成され、可変長符号化されるシンボルの集合に対して可変長符号化が適用される。該方法によると、可変長符号化されるシンボルの集合に適用される可変長符号化の少なくとも1つの特徴が可変長符号化されるシンボルの数に従って改められ、可変長符号化されたシンボルの数の表示が提供される。該表示は、可変長符号化されるシンボルの数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されるシンボルの数を表わす可変長コードワードであるのが有利である。
本発明の第2の局面に従ってデータシンボルの集合を表わす可変長コードワードを復号する方法が提供され、該データシンボルの集合は第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含み、該データシンボルの集合は、データシンボルの前記集合から可変長符号化されるデータシンボルの集合を形成することによって符号化されており、前記可変長コードワードは、可変長符号化されるシンボルの集合に対して可変長符号化を適用することにより形成されている。この方法によると、可変長コードワードに適用される復号化の少なくとも1つの特徴が、可変長符号化されたシンボルの集合中のシンボルの数の表示に応じて改められる。該表示は、可変長符号化されたシンボルの数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されたシンボルの数を表わす可変長コードワードであるのが有利である。
本発明の第3の局面に従って、第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含むデータシンボルの集合を符号化するための符号器が提供され、この符号器では、可変長符号化されるシンボルの集合がデータシンボルの前記集合から形成されるようになっており、該符号器は可変長符号化されるシンボルの前記集合を可変長符号化するための符号化手段を含む。本発明に従って、該符号器は、可変長符号化されるシンボルの集合に適用される可変長符号化の少なくとも1つの特徴を可変長符号化されるシンボルの数に従って改めるようになっていると共に、可変長符号化されたシンボルの数の表示を提供するようになっている。該表示は、可変長符号化されるシンボルの数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されるシンボルの数を表わす可変長コードワードであるのが有利である。
本発明の第4の局面に従って、データシンボルの集合を表わす可変長コードワードを復号するための復号器が提供され、該データシンボルの集合は第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含み、該データシンボルの集合は、可変長符号化されるシンボルの集合を形成することによって符号化されており、前記可変長コードワードは、可変長符号化されるシンボルの前記集合に対して可変長符号化を適用することにより形成されている。本発明に従って、該復号器は、可変長コードワードに適用される復号化の少なくとも1つの特徴が、可変長符号化されたシンボルの集合中のシンボルの数の表示に応じて改められるようになっている。該表示は、可変長符号化されたシンボルの数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されたシンボルの数を表わす可変長コードワードであるのが有利である。
本発明の第5の局面により、本発明の第3局面に従う符号器を含むマルチメディア端末が提供される。
本発明の第6の局面により、本発明の第4局面に従う復号器を含むマルチメディア端末が提供される。
好ましくは、本発明の第5及び/又は第6局面に従うマルチメディア端末は、無線接続によって移動通信ネットワークと通信するようになっている移動マルチメディア端末である。
より精密に述べれば、本発明による符号化方法は、主として、可変長符号化されるシンボルの集合に適用される可変長符号化の少なくとも1つの特徴が可変長符号化されるシンボルの数に従って改められ、可変長符号化されたシンボルの数の表示が提供されることを特徴としており、前記表示は、可変長符号化されるシンボルの前記数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されるシンボルの前記数を表わす可変長コードワードである。本発明の復号方法は、主として、可変長コードワードに適用される復号化の少なくとも1つの特徴が、可変長符号化されたシンボルの前記集合中のシンボルの数の表示に応じて改められることを特徴としており、前記表示は、可変長符号化されたシンボルの前記数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されたシンボルの前記数を表わす可変長コードワードである。本発明の符号器は、主として、可変長符号化されるシンボルの集合に適用される可変長符号化の少なくとも1つの特徴を可変長符号化されるシンボルの数に従って改めるようになっていると共に、可変長符号化されたシンボルの数の表示を提供するようになっていることを特徴としており、前記表示は、可変長符号化されるシンボルの前記数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されるシンボルの前記数を表わす可変長コードワードである。本発明の復号器は、主として、可変長コードワードに適用される復号化の少なくとも1つの特徴が、可変長符号化されたシンボルの前記集合中のシンボルの数の表示に応じて改められるようになっていることを特徴としており、前記表示は、可変長符号化されたシンボルの前記数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されたシンボルの前記数を表わす可変長コードワードである。
添付図面を参照して例を挙げて本発明の実施態様を説明する。
本発明の詳細な説明
本発明についての以下の詳細な説明において、本発明の方法の模範的実施態様を提示する。この模範的実施態様は、ビデオ符号器におけるブロック・ベースの変換符号化の結果として作られる非ゼロ値の変換係数を表わす(ラン、レベル)対の可変長符号化と、対応するビデオ復号器において後に行われる前記の対の復号とに関する。
図6はビデオ符号器600の略ブロック図であり、ここで本発明のこの実施態様に従う方法を適用することができる。図6に示されているビデオ符号器の構造は、図1に示されている従来技術のビデオ符号器のそれと実質的に同一ではあるが、該符号器の可変長符号化操作を実行する部分は適宜改造されている。該ビデオ符号器の、前述した従来技術のビデオ符号器と同一の機能を実行して同一の態様で動作する全ての部分は、同一の参照番号で特定されている。この明細書では、全ての可変長符号化操作がビデオマルチプレックス符号器670で実行されるということが仮定される。しかし、本発明の代わりの実施態様では別個の可変長符号化ユニットを設けても良いことが理解されるべきである。ビデオ符号器により作られたデータシンボルの幾つか(例えば、非ゼロ値の変換係数に関連する(ラン、レベル)対)に対して本発明の方法を適用することができ、他のデータシンボルを符号化するために他のVLC符号化方法を使用できることにも注意するべきである。
ビデオ符号器600の動作を詳しく検討する。ディジタルビデオのフレームを符号化するとき、符号器600は、図1に関して前述した態様と同様の態様で動作してイントラ符号化された圧縮されているビデオフレームとインター符号化されている圧縮されているビデオフレームとを作る。本書において前に説明したように、イントラ符号化モードでは、変換係数値の対応する2次元アレイを作るためにイメージデータ(ピクセル値)の各ブロックに離散余弦変換(DCT)が適用される。DCT操作は変換ブロック104で実行され、その様にして作られた係数はその後に量子化器106に渡され、ここで量子化される。インター符号化モードでは、ブロック104で実行されるDCT変換は、予測誤差値のブロックに適用される。この操作の結果として作られた変換係数も量子化器106に渡され、ここでそれらも量子化される。インター符号化されたフレームは、イントラ符号化されたイメージ・ブロックを含むことができる。場合によって変換符号化は特定のイメージ・ブロックに対しては適用されない。例えば、イントラ符号化モード時にイントラ予測が使用されれば、幾つかのイメージ・ブロックは符号器において前に符号化された1つ以上のイメージ・ブロックから予測される。この場合、符号器は、予測に使われることになる前のブロックの表示を復号器に提供し、変換係数データは出力しない。インター符号化モード時には、一定のブロックについての予測とブロック自体のイメージデータとの差があまりに小さいためにデータ圧縮比の見地から予測誤差情報を全く送らないことが有利である可能性がある。
この実施態様では、本発明の方法は、変換符号化され、その後に変換係数量子化されるイメージ・ブロックに対して適用される。
ビデオマルチプレックス符号器670は、量子化されている変換係数のブロック(2次元アレイ)を受け取ると、該アレイ内の非ゼロ値の係数の個数を判定する。本発明によると、Ncと称されるこの数は、可変長符号化されてビットストリーム635で復号器へ送られる。Nc値の可変長符号化のために可変長コードワードの集合が少なくとも2つ設けられる。本発明の1つの実施態様では、該集合は、例えば、本書において前述した、表2及び5においてそれぞれ定められているVLCコードワードである。より具体的には、Ncは、前に符号化されたNcシンボルの値に応じて可変長コードワードの少なくとも2つの集合のうちの1つから選択されたコードワードを用いて可変長符号化される。VLCコードワードを割り当てるために使用される前に符号化されたNcシンボルは、符号化されるブロックの近くに存するブロックから選択されるのが有利である。
図5は、VLC符号化されることになるイメージブロックと、これに隣接するブロックとを示す。Nc_L、Nc_TL、Nc_T及びNc_TRは、それぞれ、符合化されることになる現在のイメージブロックの左、上左、上及び上右のブロック内の非ゼロ値の量子化された係数の個数を意味する。
現在のイメージブロックについてのNc値は、直ぐ隣りのブロックの既に符号化されたNc値を考慮することにより選択された、VLC符号の利用可能な集合のうちの1つからのコードワードを用いて可変長符号化される。下記の符号は、前に符号化された隣接するイメージブロックのNc値を考慮に入れて可変長符号をNc値に割り当てるための模範的手順を提示している:
VLC_N = Nc_map[fn(Nc_L, Nc_TL, Nc_T, Nc_TR)] (1)
式(1)において、fnは関数(その例が下で式(2)において定義される)であり、Nc_mapは整数値を種々の利用可能なVLC符号にマッピングするアレイであり、VLC_Nはその中からコードワードが選択されるところのテーブルの番号を示す。fnの例は“平均値”及び“メジアン”を含む。本発明の1つの実施態様では、Nc_L及びNc_Tの“平均値”が使用される。この模範的実施態様では、式(1)で提示される割り当ては
VLC_N = Nc_map[(Nc_L+Nc_T)/2] (2)
となる。次の例は、本発明の方法によるNcの符号化を更に説明する。符号化されることになる現在のNc値は3であり、隣接するNc_L値及びNc_T値はそれぞれ4及び2により与えられ、Nc_mapはNc_map=[111112222]で与えられ、VLC1及びVLC2はそれぞれテーブル2及びテーブル5からのコードワードに対応すると仮定する。式(2)を適用するとVLC_Nは1に等しい。この場合、Nc=3は、テーブル2からのVLCコードワードを用いて00100として符号化される。
ビデオマルチプレックス符号器670は、次に、非ゼロ値の係数を(ラン、レベル)対として表わす。このことは、従来技術から知られている態様で行われて良い。より具体的には、量子化された変換係数の2次元アレイは、始めに、例えば図4に示されているような所定走査順序を用いて走査されて、配列された1次元アレイを作る。この配列された1次元アレイ内の各々の非ゼロ係数値は、その後、ラン値及びレベル値により表わされ、このレベル値は係数の値を表わし、ラン値は非ゼロ値の係数の前にある連続するゼロ値の係数の個数を表わす。前述したランレングス符号化の従来技術方法とは異なって、本発明の方法ではEOBシンボルを送信する必要はない。本発明の方法では非ゼロ値の量子化された変換係数の個数が復号器に対して明示的に示されるので、EOBシンボルを送信しない可能性が生じるのである。従って、与えられたイメージブロックについて(ラン、レベル)対を復号するとき、復号器は復号された対の数を数えることができる。(非ゼロ値の係数の個数に対応する)復号された対の数が復号器に対して示された非ゼロ値の係数の個数に達すると、問題のブロックのための復号を止めることができる。
ビデオマルチプレックス符号器670は、単一のVLCコードワードが各(ラン、レベル)対に割り当てられるようにラン値及びレベル値に可変長符号化を適用する。本発明では、VLC符号化は、符号器600に格納されている可変長符号化(ルックアップ)テーブルの集合のうちの1つを選択することによって実行される。該符号化テーブルは、各々、可変長コードワードの集合を定めるとともに、該コードワードとイメージブロックについての量子化された変換係数データに生じる可能性のある(ラン、レベル)対の可能な値との間のマッピングを定める。本発明では、ビデオマルチプレックス符号器670は、符号化されるイメージブロックについて量子化された変換係数のアレイの中の非ゼロ値の係数の個数に応じて使用される符号化テーブルを選択する。選択されたルックアップテーブルで定められているマッピングを用いて、ビデオマルチプレックス符号器は、各(ラン、レベル)対にコードワードを割り当て、そのコードワードをビットストリーム635で復号器へ送る。
種々のVLC符号化テーブルの数は、本発明の種々の実施態様において変動しても良い。本発明の一実施態様では、非ゼロ値の量子化された変換係数の各々の可能な数について別々のルックアップテーブルが設けられる。コードワードと、(ラン、レベル)対と1つ1つのテーブルのためのコードワードとの間のマッピングとは、指定された数の非ゼロ値係数を有する量子化された変換係数値のアレイから得られた(ラン、レベル)対の集合に適用されたときに最善のデータ圧縮を提供する様に設計される。非ゼロ値の量子化された変換係数の数に関しての(ラン、レベル)対の統計的特性の変動に関する情報は、例えば数個の試験(トレーニング)イメージ又はビデオシーケンスを前もって符号化することによって経験的に得ることができる。VLCコードワードとコードワード間のマッピングとを、符号器における1つ以上のルックアップテーブルとして設計して格納することができる。
1つの好ましい実施態様では、4×4イメージブロックから得られた(ラン、レベル)対を符号化するときに使用されるVLC符号化テーブルが2つだけ設けられ、その1つは非ゼロ値の量子化された変換係数の数が8以下であるときに使用され、1つは非ゼロ値の量子化された変換係数の数が8より大きいときに使用される。テーブル6及び7は、本発明のこの実施態様での(ラン、レベル)対の異なる確率分布を示す。統計は、現行のITU−T勧告H.26Lのテストモデル8(TML8)に従って実現されたビデオ符号器を用いて集められており、インター符号化されたイメージブロックに関連する。該テーブルにおいては、最も確からしい対に数1が割り当てられ、2番目に確からしい対に数2が割り当てられ、以降同様である。始めの15個の非常に確からしい対がリストされている。
Figure 2005516497
Figure 2005516497
本発明の一代替実施態様では、送信されるシンボルのタイプを変えることによって符号化効率を改善することができる。量子化された変換係数は、(ラン、レベル)対として表わされる代わりに、(レベル、ラスト)対により表わされ、VLCコードワードが各々の(レベル、ラスト)対に割り当てられる。(レベル、ラスト)対のレベルは、係数の値を示すけれども、前述した(ラン、レベル)対とは異なって値0をとることができる。パラメータ“ラスト”は、当該ブロック内にもはやそれ以上の非ゼロ値の係数が存在しないことを示すために使われる。例えば、特定の係数のレベル値がゼロであって且つその後の係数値がすべてゼロならばラストが1に等しくセットされるように、ラストをバイナリー・フラグとして使うことができる。この、量子化された変換係数の代替表示方法は、特にイントラ符号化されたブロックについて、そして小さなQP値が使用される場合に、符号化効率(データ圧縮)を改善することができる。
本発明の別の代替実施態様では、VLCコードワードの固定された集合が使用され、該コードワードと、符号化されることになる(ラン、レベル)対との間のマッピングだけが非ゼロ値の係数の個数に依存して変化する。
本発明の更に別の代替実施態様では、特定のイメージブロックについて選択されたVLC符号化テーブルは、例えばイメージブロックの変換係数を量子化するために使われる量子化パラメータ(QP)の値或いはフレーム又はイメージブロックのタイプ(イントラ/インター)などの、他の何らかのパラメータに依存しても良い。この場合、量子化された変換係数の特定のアレイについてのVLC符号化テーブルの選択は、非ゼロ値の係数の個数と他のパラメータの値との両方に依存する。
本発明のなお別の代替実施態様では、ゼロ値の量子化変換係数値の個数を判定し、その個数を、VLCコードワードと、該コードワード及びデータシンボル間のマッピングとを設計するとともにVCLルックアップテーブルを選択するための基準となるパラメータとして使用することができる。
本発明の1つの実施態様に従うビデオ復号器700の動作を図7を参照して説明する。図7に示されているビデオ復号器の構造は、図2に示されている従来技術のビデオ復号器のそれと実質的に同一であるが、該復号器の可変長復号操作を実行する部分は適宜改変されている。該ビデオ復号器の、前述した従来技術のビデオ復号器と同一の機能を実現して動作する部分は全て同一の参照番号で特定されている。以下の記述では、全ての可変長復号操作がビデオマルチプレックス復号器770で実行されるということが前提とされている。しかし、本発明の別の実施態様では別個の可変長復号ユニットを設けても良いことが理解されるべきである。
ビデオ復号器の動作を詳しく説明する。ここでは、図7のビデオ復号器は図6との関係で記述された符号器と対応し、従って符号器600により送信されたビットストリーム635を受け取って復号し得るということが仮定されている。該復号器において、ビットストリームがビデオマルチプレックス復号器770により受信されてその構成部分に分離される。従来技術についての前の記述に関して説明したように、ビットストリームから抽出された圧縮されているビデオデータはマクロブロック毎に処理される。イントラ符号化されているマクロブロックについての圧縮されているビデオデータは、マクロブロックの各ブロックについてのVLC符号化されているNc値及び(ラン、レベル)対を表わす可変長コードワードと、符号化されている制御情報(例えば、量子化パラメータQPに関する)とを含む。インター符号化されたマクロブロックについての圧縮されているビデオデータは、各ブロックについてのVLC符号化されている予測誤差情報(VLC符号化されているNc値とVLC符号化されている(ラン、レベル)対とを含む)、該マクロブロックについての動きベクトル情報、及び符号化されている制御情報を含む。
イントラ符号化されているマクロブロックの各ブロックとインター符号化されているマクロブロックに関連する予測誤差データの各ブロックとについてのVLC符号化されているNc値とVLC符号化されている(ラン、レベル)対とは、同一の態様で復号される。
より具体的には、イントラ符号化又はインター符号化されているイメージブロックについてVLC符号化されている(ラン、レベル)対を復号するとき、ビデオマルチプレックス復号器770は、始めに、該ブロック中の非ゼロ値の量子化されている変換係数の個数を判定する。前述したように、非ゼロ値の量子化されている変換係数の個数Ncは符号器600によってビットストリーム635に挿入される。復号器700は、受け取ったビットストリームからこの情報を抽出する。本発明によれば、Nc値自体がVLC符号化されるので、ビデオマルチプレックス復号器770は、適切な可変長復号操作を実行してNcに関する情報を回復する。前述したように、特定のイメージブロックについてNc値を符号化するために使われるVLC符号化テーブルは、前に符号化されたイメージブロックに関連するNc値に基づいて選択される。このことは、与えられたブロックについてのNc値を表わすコードワードは、一般に、そのコードワードがそれから選び出されたところのVLC符号化テーブルの明示的指示無しに復号可能である。従って、復号器が知る必要のあるものは、始めの(幾つかの)符号化されているイメージブロックについてのNc値がそこから選択されたところのVLC符号化テーブルと、該イメージブロックの符号化順序と、その後のNc値を符号化するときに使用されることになるVLCテーブルを決定するために使われたルールとだけである。Ncのための選択されたVLC符号化テーブルについての明示的知識をそのイメージブロックのために持つことが必要であるところのイメージブロックの正確な個数は、後のNc値のためのVLC符号化テーブルを選択するために使われるルールの性質とブロック走査順序とに依存する。例えば、後のNc値を符号化するためのVLCテーブルを選択するために左、上左、上及び上右のブロックからのNc値が使用され、ブロック走査(符号化)順序がイメージの上左から1ローずつ走査されるという順序である場合には、イメージの第1ロー内のブロックと第2ローの第1ブロックについてNc値を所定方式に従って符号化するのが有利である。その後の全てのイメージブロックについてのNc値は、上記の式(1)により記述されるルールに従って符号化可能であり、使用されたVLC符号化テーブルの明示的指示無しに復号器で復号可能である。
今説明したばかりの手順に従ってイメージブロック内の非ゼロ値の量子化された変換係数の個数が判定されると、ビデオマルチプレックス復号器770は、可変長復号テーブルを選択して、イメージブロックについてVLC符号化されている(ラン、レングス)対を復号し始める。本発明に従って、VLC復号テーブルがNcに依存して選択される。復号テーブルは、符号器で使われるものと同一のルックアップ・テーブルの集合から選択される。復号テーブルは、前もって復号器に格納され、ビットストリーム635で受信されるVLCコードワードと、イメージブロックについて量子化された変換係数のデータ中に生じる可能性のある(ラン、レベル)対の可能な値との間のマッピングを定義する。非ゼロ値の量子化された変換係数の個数に応じて該テーブルを選択した後、ビデオマルチプレックス復号器770は、選択されたルックアップ・テーブルにおいて定義されているマッピングを使用してラン値及びレベル値を回復する。それは、その後、該ブロックについて量子化された変換係数値を復元し、それらを逆量子化器210に渡す。ビデオ復号手順の、各イメージブロックについて復元されたピクセル値を形成する残りの部分は、従来技術のビデオ復号器200に関して説明したように行われる。
本発明の方法は、前述したVLC符号化の従来技術方法と比べて重要な利点を提供するということが理解されるべきである。特に、本発明の方法は、比較的に低い計算の複雑さと伝送誤差に対する高い復元力とを維持しながら符号化/復号されるデータシンボルの統計的特性に対して適応性のある可変長符号化及び復号の方法を提供する。この方法の適応性は、いろいろな個数の非ゼロ値の量子化された変換係数を有するイメージブロックについていろいろな可変長コードワード及び/又はマッピングを使用することに由来する。計算の複雑さは、いろいろなコードワード及び/又はマッピングを符号器及び復号器にルックアップ・テーブルとして設けることにより、低く保たれる。これは、与えられたイメージブロックについて使用される特定のルックアップ・テーブルが、該ブロック中の非ゼロ値の変換係数の個数を示す値によって復号器に伝えられるので、データ伝送誤差に対する過敏性を低下させるのにも役立つ。
図8は、本発明に従って動作するように改変されて良い符号化装置及び復号装置を含む端末装置を提示する。より精密には、この図は、ITU−T勧告H.324に従って具体化されたマルチメディア端末80を示す。この端末は、マルチメディア・トランシーバー装置と見なし得るものである。これは、通信網を介して伝送されるマルチメディア・データストリームを捉え、符号化し、多重化するエレメントと、受信したマルチメディア・コンテンツを受信し、多重分離し、復号して表示するエレメントとを含む。ITU−T勧告H.324は、端末の動作全体を定めるとともに、そのいろいろな構成部分の動作を支配する他の勧告に言及している。この種のマルチメディア端末は、在来のビデオ電話などのリアルタイム・アプリケーション、或いは例えばインターネットにおけるマルチメディア・コンテンツ・サーバーからのビデオクリップの検索及び/又はストリーミングなどの非リアルタイム・アプリケーションに使用することができる。
本発明の文脈において、図8に示されているH.324端末は本発明の方法を適用するのに適するいろいろなマルチメディア端末の実施態様のうちの1つに過ぎないということが理解されるべきである。該端末装置の場所及び実現に関していろいろな選択肢が存在することにも注意するべきである。図8に示されているように、該マルチメディア端末は、アナログPSTN(公衆交換電話回線網)などの固定回線電話網に接続された通信装置に配置されても良い。この場合、該マルチメディア端末は、ITU−T勧告V.8、V.34及び随意にV.8bisに従うモデム91を備える。或いは、該マルチメディア端末は外付けのモデムに接続されても良い。該モデムは、該マルチメディア端末により作られた多重化されているディジタルデータ及び制御信号をPSTNを介して伝送するのに適するアナログ形に変換することを可能にする。それは、更に、該マルチメディア端末がアナログ形のデータ及び制御信号をPSTNから受け取って、それらを該端末により適宜多重分離され処理され得るディジタルデータストリームに変換することを可能にする。
H.324マルチメディア端末は、ISDN(総合デジタル通信網)などのディジタル固定回線網に直接接続できるようにも実現可能である。この場合、モデム91はISDNユーザ・ネットワーク・インターフェースに取って代わられる。図8において、このISDNユーザ・ネットワーク・インターフェースは代わりのブロック92により表示されている。
H.324マルチメディア端末は、移動通信アプリケーションに用いられるようにも改造可能である。無線通信リンクで使用される場合、図8において代替ブロック93により表示されているように、モデム91の代わりに任意の適切な無線インターフェースを使うことができる。例えば、H.324/Mマルチメディア端末は、現行の第2世代GSM移動電話網に、或いは提案されている第3世代UMTS(ユニバーサル移動電話システム(Universal Mobile Telephone System))への接続を可能にする無線トランシーバーを含むことができる。
2方向通信用に、即ちビデオデータの送信及び受信用に設計されているマルチメディア端末では本発明に従って実現されるビデオ符号器及びビデオ復号器の両方を設けるのが有利である。その様な符号器及び復号器の対は、“コーデック”と称される単一の複合機能ユニットとして実現されることが良くある。
代表的なH.324マルチメディア端末について、図8を参照して更に詳しく説明する。
マルチメディア端末80は、“端末装置”と称される種々のエレメントを含んでいる。これは、参照番号81,82及び83によりそれぞれ包括的に示されるビデオ装置、オーディオ装置及びテレマティック装置を含んでいる。ビデオ装置81は、例えば、ビデオイメージを捉えるためのビデオカメラ、受信されたビデオコンテンツを表示するためのモニター、及び任意のビデオ処理装置を含むことができる。オーディオ装置82は、通常、例えば口頭伝言を捉えるためのマイクロフォン、及び受信されたオーディオコンテンツを再生するためのスピーカーを含む。オーディオ装置は、付加的なオーディオ処理ユニットも含むことができる。テレマティック装置83は、データ端末、キーボード、電子ホワイトボード、或いはファックスユニット等の静止画トランシーバーを含むことができる。
ビデオ装置81はビデオコーデック85に結合されている。ビデオコーデック85は、ともに本発明に従って実現されたビデオ符号器と対応するビデオ復号器とを含む。この符号器及び復号器について次に説明する。ビデオコーデック85は、捉えられたビデオデータを通信リンクを介して更に伝送するために適切な形に符号化するとともに、通信網から受信された圧縮されているビデオコンテンツを復号する役割を担っている。図8に示されている例では、ビデオコーデックは、ITU−T勧告H.26Lに従って実現され、該ビデオコーデックの符号器及び復号器の両方において本発明に従う適応可変長符号化方法を実施するために適宜改造される。
該端末のオーディオ装置は、図8において参照番号86により示されているオーディオコーデックに結合される。ビデオコーデックと同様に、このオーディオコーデックは符号器/復号器の対を含む。それは、該端末のオーディオ装置により捉えられたオーディオデータを通信リンクで伝送するために適する形に変換するとともに、ネットワークから受信された符号化されているオーディオデータを例えば該端末のスピーカーで再生するために適する形に変換する。オーディオコーデックの出力は遅延ブロック87に渡される。これはビデオ符号化プロセスによりもたらされた遅延を補償することによりオーディオコンテンツとビデオコンテンツとの同期を確保する。
マルチメディア端末のシステム制御ブロック84は、適切な制御プロトコル(シグナリング・ブロック88)を用いて端末・ネットワーク間シグナリングを制御して送信端末と受信端末との間に共通動作モードを確立する。シグナリング・ブロック88は、送信端末及び受信端末の符号化能力及び復号能力に関する情報を交換し、ビデオ符号器の種々の符号化モードを可能にするために使用可能である。システム制御ブロック84は、データ暗号方式の使用も制御する。データ伝送に使われる暗号方式のタイプに関する情報は、暗号ブロック89からマルチプレクサ/デマルチプレクサ(MUX/DMUXユニット)90に渡される。
マルチメディア端末からデータ送信が行われているとき、MUX/DMUXユニット90は、符号化され且つ同期化されたビデオストリーム及びオーディオストリームをテレマティック装置83からのデータ入力及び考えられる制御データと結合させて単一のビットストリームを形成する。暗号ブロック89により提供される、ビットストリームに適用されることになるデータ暗号方式(もしあるならば)のタイプに関する情報は、暗号モードを選択するために使われる。対応的に、多重化され、また場合によっては暗号化されたマルチメディア・ビットストリームが受信されているとき、MUX/DMUXユニット90は、そのビットストリームを解読し、それをそのマルチメディア構成コンポーネントに分割し、それらのコンポーネントを復号及び再生のために適切なコーデック及び/又は端末装置に渡す。
本発明に従うマルチメディア端末の機能エレメント、ビデオ符号器、復号器及びビデオコーデックはソフトウェア又は専用ハードウェアとして、或いはこの2つの組み合わせとして、実現可能であることに注意するべきである。
本発明の可変長符号化及び復号の方法は、本発明の機能ステップを実行するための機械読み取り可能な命令から成るコンピュータプログラムの形で実施されるのに特に適している。そういうものとして、本発明の可変長符号器及び復号器は、記憶媒体に格納されてパーソナルデスクトップコンピュータなどのコンピュータで実行されるソフトウェアコードとして実現されても良い。
マルチメディア端末80が移動端末であれば、即ち無線トランシーバー93を備えていれば、それが付加的なエレメントを含んでも良いことが当業者に理解されるであろう。一実施態様では、それは、ユーザによるマルチメディア端末80の操作を可能にするディスプレイ及びキーボードを有するユーザインターフェースと、該マルチメディア端末のいろいろな機能を果たすブロックを制御するマイクロプロセッサ等の中央処理装置と、ランダムアクセスメモリーRAMと、読み出し専用メモリROMと、ディジタルカメラとを含む。
マイクロプロセッサの動作命令、即ちマルチメディア端末80の基本機能に対応するプログラムコードは、読み出し専用メモリROMに格納され、例えばユーザの制御下でマイクロプロセッサにより要求された様に実行可能である。プログラムコードに従って、マイクロプロセッサは、無線トランシーバー93を使って移動通信ネットワークとの接続を形成し、マルチメディア端末80が無線経路を介して移動通信ネットワークと情報をやり取りすることを可能にする。
マイクロプロセッサは、ユーザインターフェースの状態を監視し、ディジタルカメラを制御する。ユーザコマンドに応答して、マイクロプロセッサはディジタルイメージをRAMに記録するようにカメラに命令する。イメージが捉えられると、或いはその捉えるプロセス中、マイクロプロセッサは、前述したように圧縮されたイメージシーケンスを作るために、イメージをイメージセグメント(例えばマクロブロック)に分割し、符号器を使って該セグメントの動き補償符号化を実行する。ユーザは、捉えられたイメージを自分のディスプレイで表示するようにマルチメディア端末80に命令し、或いは圧縮されているイメージシーケンスを無線トランシーバー93を用いて他のマルチメディア端末、固定回線ネットワーク(PSTN)に接続されているテレビ電話或いは他の何らかの通信装置に送るように命令する。1つの好ましい実施態様では、受信者が対応する復号プロセスを最小限の遅延で開始できるように、イメージデータの送信は第1セグメントが符号化された後に直ちに開始される。
従来技術による一般的ビデオ符号器の略ブロック図である。 従来技術による、図1に示されている符号器に対応する一般的ビデオ復号器の略ブロック図である。 従来技術によるマクロブロックの形成を示す図である。 模範的ジグザグ走査順序を示す図である。 符号化される現在のイメージ・ブロックと、これに隣接する前に符号化されたイメージ・ブロックとを示す図である。 本発明の実施態様によるビデオ符号器の略ブロック図である。 本発明の実施態様による、図6に示されている符号器に対応するビデオ復号器の略ブロック図である。 本発明の方法を実施できるマルチメディア通信端末の略ブロック図である。

Claims (53)

  1. 第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含むデータシンボルの集合を符号化する方法であって、可変長符号化されるシンボルの集合が前記データシンボルの集合から形成され、可変長符号化されるシンボルの前記集合に対して可変長符号化が適用される前記方法であって、可変長符号化される前記シンボルの集合に適用される前記可変長符号化の少なくとも1つの特徴が可変長符号化されるシンボルの数に従って改められ、可変長符号化されたシンボルの数の表示が提供され、前記表示は、可変長符号化されるシンボルの前記数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されるシンボルの前記数を表わす可変長コードワードであることを特徴とする方法。
  2. それがビットストリームで復号装置に送られることを特徴とする請求項1に記載の方法。
  3. 前に符号化されたデータシンボルの集合の少なくとも1つの中の可変長符号化されたシンボルの数に基づいて可変長符号化されるシンボルの前記数を表わす可変長コードワードを選択することを含むことを特徴とする請求項1又は2に記載の方法。
  4. 前に符号化されたデータシンボルの集合の2つ以上の中の可変長符号化されたシンボルの数の平均値に基づいて可変長符号化されるシンボルの前記数を表わす可変長コードワードを選択することを含むことを特徴とする請求項3に記載の方法。
  5. コードワードへの値の割り当てを定めるマッピング操作を実行することによって可変長符号化されるシンボルの前記数を表わす可変長コードワードを選択することを含むことを特徴とする請求項1から4のうちのいずれか一項に記載の方法。
  6. 前記マッピング操作は、マッピングテーブルの集合のうちの1つであるマッピングテーブルによって実行され、前記マッピングテーブルは前に符号化されたデータシンボルの集合の少なくとも1つの中の可変長符号化されたシンボルの数に基づいて選択されることを特徴とする請求項5に記載の方法。
  7. 前記方法は、前記第2数のデータシンボルの各々を該データシンボルの値を示す第1値と前記データシンボルの前又は後のゼロ値のデータシンボルの数を示す第2値とを含む値の対によって表わすことを含んでおり、これにより可変長符号化される前記シンボルを表わす第1及び第2の値の対の集合を形成することを特徴とする請求項1から6のいずれか一項に記載の方法。
  8. 前記方法はマッピング操作を実行することを含み、この操作において可変長符号化される前記シンボルの各々がコードワードに割り当てられ、これにより可変長符号化される前記シンボルを表わす符号化された値の集合を形成し、該コードワードはコードワードの集合から選択され、前記コードワードの集合は、前記マッピング操作に使用されるときに可変長符号化される前記シンボルを表わすのに必要とされる情報の量を減少させるように設計されていることを特徴とする請求項1から7のいずれか一項に記載の方法。
  9. 前記マッピング操作は前記第2数のデータシンボルに依存することを特徴とする請求項8に記載の方法。
  10. 前記マッピング操作は、可変長符号化されるシンボルのコードワードへの割り当てを各々定める選択可能な割り当てテーブルの集合のうちの1つを選択し、前記選択された割り当てテーブルによって定められている割り当てに従って可変長符号化される前記シンボルの各々をコードワードに割り当てることによって実行されることを特徴とする請求項9に記載の方法。
  11. 前記の所定の第1数のデータシンボルはゼロ値のデータシンボルであり、前記の所定の第2数のデータシンボルは非ゼロ値のデータシンボルであることを特徴とする請求項1から10のいずれか一項に記載の方法。
  12. データシンボルの前記集合は、量子化された変換係数値の集合であることを特徴とする請求項1から11のいずれか一項に記載の方法。
  13. データシンボルの集合を表わす可変長コードワードを復号する方法であって、データシンボルの該集合は第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含み、データシンボルの前記集合は、データシンボルの前記集合から可変長符号化されるデータシンボルの集合を形成することによって符号化されており、前記可変長コードワードは、可変長符号化されるシンボルの前記集合に対して可変長符号化を適用することにより形成されている前記方法であって、前記可変長コードワードに適用される復号の少なくとも1つの特徴が、可変長符号化されたシンボルの前記集合中のシンボルの数の表示に応じて改められ、前記表示は、可変長符号化されたシンボルの前記数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されたシンボルの前記数を表わす可変長コードワードであることを特徴とする方法。
  14. 可変長符号化されたシンボルの前記集合中のシンボルの数の前記表示は符号化装置から受け取られることを特徴とする請求項13に記載の方法。
  15. 前に符号化されたデータシンボルの集合の少なくとも1つの中の可変長符号化されたシンボルの数に基づいて可変長符号化されたシンボルの前記数を表わす前記可変長コードワードを復号することを含むことを特徴とする請求項13又は14に記載の方法。
  16. 前に符号化されたデータシンボルの集合の2つ以上の中の可変長符号化されたシンボルの数の平均値に基づいて可変長符号化されたシンボルの前記数を表わす前記可変長コードワードを復号することを含むことを特徴とする請求項15に記載の方法。
  17. 値へのコードワードの割り当てを定める逆マッピング操作を実行することにより、可変長符号化されたシンボルの前記数を表わす前記可変長コードワードを復号することを含むことを特徴とする請求項13から16のいずれか一項に記載の方法。
  18. 前記逆マッピング操作はマッピングテーブルの集合の中の1つであるマッピングテーブルによって実行され、前記マッピングテーブルは前に符号化されたデータシンボルの集合の少なくとも1つの中の可変長符号化されたシンボルの数に基づいて選択されることを特徴とする請求項17に記載の方法。
  19. 可変長符号化された前記数のシンボルの各々は、データシンボルの値を示す第1値と前記データシンボルの前又は後に存在するゼロ値のデータシンボルの数を示す第2値とから成る値の対によって表わされ、第1値及び第2値の前記対は可変長符号化された前記シンボルを表わすことを特徴とする請求項13から18のいずれか一項に記載の方法。
  20. 該方法は逆マッピング操作を実行することを含んでおり、この操作では、各可変長コードワードは可変長符号化されたシンボルの前記集合の中の特定の1つを特定するために使用されることを特徴とする請求項13から19のいずれか一項に記載の方法。
  21. 前記逆マッピング操作は、可変長符号化されたシンボルの前記集合の中のデータシンボルの該第2数の前記表示に依存することを特徴とする請求項20に記載の方法。
  22. 符号化されるシンボルのコードワードへの割り当てを各々定める選択可能な割り当てテーブルの集合の中の1つを選択し、前記選択された割り当てテーブルにより定められる割り当てに従って可変長符号化された前記シンボルのうちの特定の1つを特定することによって前記逆マッピング操作が実行されることを特徴とする請求項21に記載の方法。
  23. 前記所定の第1数のデータシンボルはゼロ値のデータシンボルであり、前記所定の第2数のデータシンボルは非ゼロ値のデータシンボルであることを特徴とする請求項13から22のいずれか一項に記載の方法。
  24. 第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含むデータシンボルの集合を符号化するための符号器であって、この符号器では、可変長符号化されるシンボルの集合がデータシンボルの前記集合から形成されるようになっており、該符号器は可変長符号化されるシンボルの前記集合を可変長符号化するための符号化手段を含み、該符号器は、可変長符号化されるシンボルの前記集合に適用される可変長符号化の少なくとも1つの特徴を可変長符号化されるシンボルの数に従って改めるようになっていると共に、可変長符号化されたシンボルの数の表示を提供するようになっていることを特徴とし、前記表示は、可変長符号化されるシンボルの前記数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されるシンボルの前記数を表わす可変長コードワードであることを特徴とする符号器。
  25. 可変長符号化されるシンボルの数の前記表示を含むビットストリームを形成するようになっていることを特徴とする請求項24に記載の符号器。
  26. 前記ビットストリームを復号装置に送るようになっていることを特徴とする請求項24又は25に記載の符号器。
  27. 可変長符号化されるシンボルの前記数を表わす可変長コードワードを前に符号化されたデータシンボルの集合の少なくとも1つの中の可変長符号化されたシンボルの数に基づいて選択するようになっていることを特徴とする請求項24から26のいずれか一項に記載の符号器。
  28. 可変長符号化されるシンボルの前記数を表わす可変長コードワードを前に符号化されたデータシンボルの集合の2つ以上の中の可変長符号化されたシンボルの数の平均値に基づいて選択するようになっていることを特徴とする請求項27に記載の符号器。
  29. 可変長符号化されるシンボルの前記数を表わす可変長コードワードを、値のコードワードへの割り当てを定めるマッピング操作を実行することによって選択するようになっていることを特徴とする請求項24から28のいずれか一項に記載の符号器。
  30. マッピングテーブルの集合の中の1つであるマッピングテーブルによって前記マッピング操作を実行し、前に符号化されたデータシンボルの集合の少なくとも1つの中の可変長符号化されたシンボルの数に基づいて前記マッピングテーブルを選択するようになっていることを特徴とする請求項29に記載の符号器。
  31. データシンボルの値を示す第1値と前記データシンボルの前又は後に存在するゼロ値のデータシンボルの数を示す第2値とを含む値の対によって前記第2数のデータシンボルの各々を表わし、このことにより可変長符号化される前記シンボルを表わす第1値及び第2値の対の集合を形成するようになっていることを特徴とする請求項24から30のいずれか一項に記載の符号器。
  32. 該符号器はマッピング操作を実行するようになっており、この操作において可変長符号化される前記シンボルの各々がコードワードに割り当てられ、これにより可変長符号化される前記シンボルを表わす符号化された値の集合を形成し、該コードワードはコードワードの集合から選択され、コードワードの前記集合は、前記マッピング操作に使用されるときに可変長符号化される前記シンボルを表わすのに必要とされる情報の量を減少させるように設計されていることを特徴とする請求項24から32のいずれか一項に記載の符号器。
  33. 前記マッピング操作は前記第2数のデータシンボルに依存するようになっていることを特徴とする請求項32に記載の符号器。
  34. 前記マッピング操作は、可変長符号化されるシンボルのコードワードへの割り当てを各々定める選択可能な割り当てテーブルの集合のうちの1つを選択し、前記選択された割り当てテーブルによって定められている割り当てに従って第2数のデータシンボルの各々をコードワードへ割り当てることによって実行されるようになっていることを特徴とする請求項33に記載の符号器。
  35. 前記所定の第1数のデータシンボルはゼロ値のデータシンボルであり、前記所定の第2数のデータシンボルは非ゼロ値のデータシンボルであることを特徴とする請求項24から34のいずれか一項に記載の符号器。
  36. ビデオ符号器に設けられた、請求項24から35のいずれか一項に記載の符号器。
  37. コンピュータ読み出し可能な記憶媒体に格納された機械実行可能なコードとして実現された、請求項24から36のいずれか一項に記載の符号器。
  38. データシンボルの集合を表わす可変長コードワードを復号するための復号器であって、データシンボルの前記集合は第1の値を有する所定の第1数のデータシンボルと前記第1の値以外の値を有する所定の第2数のデータシンボルとを含み、データシンボルの前記集合は、可変長符号化されるシンボルの集合を形成することによって符号化されており、前記可変長コードワードは、可変長符号化されるシンボルの前記集合に対して可変長符号化を適用することにより形成されており、該復号器は、前記可変長コードワードに適用される復号の少なくとも1つの特徴が、可変長符号化されたシンボルの前記集合中のシンボルの数の表示に応じて改められるようになっていることを特徴とし、前記表示は、可変長符号化されたシンボルの前記数に従って可変長コードワードの少なくとも2つの択一的集合のうちの1つから選択された可変長符号化されたシンボルの前記数を表わす可変長コードワードであることを特徴とする復号器。
  39. 可変長符号化されたシンボルの前記集合中のシンボルの前記数の前記表示は符号化装置から受け取られることを特徴とする請求項38に記載の復号器。
  40. 可変長符号化されたシンボルの前記数を表わす前記可変長コードワードを、前に符号化されたデータシンボルの集合の少なくとも1つの中の可変長符号化されたシンボルの数に基づいて復号するようになっていることを特徴とする請求項38又は39に記載の復号器。
  41. 可変長符号化されたシンボルの前記数を表わす前記可変長コードワードを、前に符号化されたデータシンボルの集合の2つ以上の中の可変長符号化されたシンボルの数の平均値に基づいて復号するようになっていることを特徴とする請求項40に記載の復号器。
  42. コードワードの値への割り当てを定める逆マッピング操作を実行することにより、可変長符号化されたシンボルの前記数を表わす前記可変長コードワードを復号するようになっていることを特徴とする請求項38から41のいずれか一項に記載の復号器。
  43. マッピングテーブルの集合のうちの1つであるマッピングテーブルによって前記逆マッピング操作を実行するようになっており、また前に符号化されたデータシンボルの集合の少なくとも1つの中の可変長符号化されたシンボルの数に基づいて前記マッピングテーブルを選択するようになっていることを特徴とする請求項42に記載の復号器。
  44. データシンボルの値を示す第1値と前記データシンボルの前又は後に存在するゼロ値のデータシンボルの数を示す第2値とから成る値の対を含むデータシンボルを表わす可変長コードワードを復号するようになっていることを特徴とする請求項38から43のいずれか一項に記載の復号器。
  45. 各可変長コードワードを使って可変長符号化されたシンボルの前記集合のうちの特定の1つを特定する逆マッピング操作を実行することによって前記可変長コードワードを復号するようになっていることを特徴とする請求項38から44のいずれか一項に記載の復号器。
  46. データシンボルの前記集合中のデータシンボルの第2数の前記表示に依存して前記逆マッピング操作を実行するようになっていることを特徴とする請求項45に記載の復号器。
  47. 可変長符号化されたシンボルのコードワードへの割り当てを各々定める選択可能な割り当てテーブルの集合の中の1つを選択し、前記選択された割り当てテーブルにより定められる割り当てに従って可変長符号化された前記シンボルのうちの特定の1つを特定することによって前記逆マッピング操作を実行するようになっていることを特徴とする請求項46に記載の復号器。
  48. 前記所定の第1数のデータシンボルはゼロ値のデータシンボルであり、前記所定の第2数のデータシンボルは非ゼロ値のデータシンボルであることを特徴とする請求項38から47のいずれか一項に記載の復号器。
  49. ビデオ復号器に設けられた、請求項38から48のいずれか一項に記載の復号器。
  50. コンピュータ読み出し可能な記憶媒体に格納された機械実行可能なコードとして実現された、請求項38から48のいずれか一項に記載の復号器。
  51. 請求項24から37のいずれか一項に記載の符号器を含むマルチメディア端末。
  52. 請求項38から50のいずれか一項に記載の復号器を含むマルチメディア端末。
  53. 無線接続によって移動通信ネットワークと通信するようになっている移動マルチメディア端末であることを特徴とする請求項40又は41に記載のマルチメディア端末。
JP2003563226A 2002-01-22 2003-01-22 イメージ/ビデオ符号器及び/又は復号器における変換係数の符号化 Expired - Lifetime JP4510465B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/054,610 US6690307B2 (en) 2002-01-22 2002-01-22 Adaptive variable length coding of digital video
US36950002P 2002-04-02 2002-04-02
PCT/FI2003/000056 WO2003063501A1 (en) 2002-01-22 2003-01-22 Coding transform coefficients in image/video encoders and/or decoders

Publications (2)

Publication Number Publication Date
JP2005516497A true JP2005516497A (ja) 2005-06-02
JP4510465B2 JP4510465B2 (ja) 2010-07-21

Family

ID=27615952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003563226A Expired - Lifetime JP4510465B2 (ja) 2002-01-22 2003-01-22 イメージ/ビデオ符号器及び/又は復号器における変換係数の符号化

Country Status (10)

Country Link
EP (1) EP1470724B1 (ja)
JP (1) JP4510465B2 (ja)
KR (1) KR100953677B1 (ja)
CN (1) CN1620816A (ja)
DE (1) DE60347000C5 (ja)
ES (1) ES2529344T3 (ja)
MX (1) MXPA04007053A (ja)
RU (1) RU2354073C2 (ja)
WO (1) WO2003063501A1 (ja)
ZA (1) ZA200405535B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011007719A1 (ja) * 2009-07-17 2011-01-20 ソニー株式会社 画像処理装置および方法
US9088802B2 (en) 2005-01-07 2015-07-21 Nippon Telegraph And Telephone Corporation Video encoding method and apparatus, video decoding method and apparatus, programs therefor, and storage media for storing the programs

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1314271C (zh) * 2003-09-09 2007-05-02 华为技术有限公司 一种视频编解码方法
US8275045B2 (en) 2006-07-12 2012-09-25 Qualcomm Incorporated Video compression using adaptive variable length codes
US9319700B2 (en) 2006-10-12 2016-04-19 Qualcomm Incorporated Refinement coefficient coding based on history of corresponding transform coefficient values
US8599926B2 (en) 2006-10-12 2013-12-03 Qualcomm Incorporated Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
US8325819B2 (en) 2006-10-12 2012-12-04 Qualcomm Incorporated Variable length coding table selection based on video block type for refinement coefficient coding
US8565314B2 (en) 2006-10-12 2013-10-22 Qualcomm Incorporated Variable length coding table selection based on block type statistics for refinement coefficient coding
US8335261B2 (en) 2007-01-08 2012-12-18 Qualcomm Incorporated Variable length coding techniques for coded block patterns
US8467449B2 (en) 2007-01-08 2013-06-18 Qualcomm Incorporated CAVLC enhancements for SVC CGS enhancement layer coding
CN101658042B (zh) 2007-03-13 2016-03-02 诺基亚技术有限公司 用于视频编码和解码的系统和方法
BRPI0808774A2 (pt) 2007-03-14 2014-08-19 Nippon Telegraph & Telephone Método de estimativa de quantidade de código, e aparelho, programa e meio de armazenamento para o mesmo
CA2678574C (en) 2007-03-14 2015-06-16 Nippon Telegraph And Telephone Corporation Motion vector search method and apparatus, program therefor, and storage medium which stores the program
WO2008111458A1 (ja) 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
CA2679764C (en) 2007-03-14 2014-02-04 Nippon Telegraph And Telephone Corporation Quantization control method and apparatus, program therefor, and storage medium which stores the program
US8571104B2 (en) 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US8488668B2 (en) 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
KR100842042B1 (ko) * 2007-07-16 2008-06-30 충남대학교산학협력단 암호화된 실행코드에 대하여 동적으로 복호화할 수 있게 한코드블록 암호화 방법
US8848787B2 (en) 2007-10-15 2014-09-30 Qualcomm Incorporated Enhancement layer coding for scalable video coding
JP5248619B2 (ja) * 2007-10-15 2013-07-31 クゥアルコム・インコーポレイテッド スケーラブルビデオ符号化のための改良された拡張レイヤ符号化
US8902972B2 (en) * 2008-04-11 2014-12-02 Qualcomm Incorporated Rate-distortion quantization for context-adaptive variable length coding (CAVLC)
CN101785318B (zh) * 2008-06-27 2012-12-12 索尼公司 图像处理装置和图像处理方法
RU2479942C2 (ru) * 2008-06-27 2013-04-20 Сони Корпорейшн Устройство обработки изображения и способ обработки изображения
US8457425B2 (en) * 2009-06-09 2013-06-04 Sony Corporation Embedded graphics coding for images with sparse histograms
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101768207B1 (ko) 2010-01-19 2017-08-16 삼성전자주식회사 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치
US20120082230A1 (en) * 2010-10-01 2012-04-05 Qualcomm Incorporated Variable length coding of video block coefficients
US9490839B2 (en) 2011-01-03 2016-11-08 Qualcomm Incorporated Variable length coding of video block coefficients
US10397577B2 (en) 2011-03-08 2019-08-27 Velos Media, Llc Inverse scan order for significance map coding of transform coefficients in video coding
US20120230396A1 (en) * 2011-03-11 2012-09-13 Mitsubishi Electric Research Laboratories, Inc. Method for Embedding Decoding Information in Quantized Transform Coefficients
CN102231832B (zh) * 2011-06-24 2013-04-24 北京瀚景锦河科技有限公司 变长码编解码方法和系统
US9516316B2 (en) 2011-06-29 2016-12-06 Qualcomm Incorporated VLC coefficient coding for large chroma block
US20130083856A1 (en) * 2011-06-29 2013-04-04 Qualcomm Incorporated Contexts for coefficient level coding in video compression
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
CN111083475B (zh) * 2019-12-31 2022-04-01 上海富瀚微电子股份有限公司 量化变换系数管理装置及适用于hevc标准的编码器
CN115514967B (zh) * 2022-11-07 2023-03-21 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于二进制块双向编码的图像压缩方法及图像解压方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05347710A (ja) * 1992-06-15 1993-12-27 Nippon Telegr & Teleph Corp <Ntt> 適応的可変長符号化方法
JPH06225279A (ja) * 1992-10-26 1994-08-12 Sony Corp 符号化方法、復号化方法、符号化装置及び復号化装置
US5400075A (en) * 1993-01-13 1995-03-21 Thomson Consumer Electronics, Inc. Adaptive variable length encoder/decoder
JPH08316846A (ja) * 1995-05-18 1996-11-29 Matsushita Electric Ind Co Ltd 画像符号化装置、画像復号化装置、画像符号化方法および画像復号化方法
US5640420A (en) * 1995-03-28 1997-06-17 Daewoo Electronics Co., Ltd. Variable length coder using two VLC tables
JP2001346212A (ja) * 2000-06-02 2001-12-14 Nippon Telegr & Teleph Corp <Ntt> 符号化データ再圧縮方法および符号化データ復元方法ならびにそれらの方法を記録した記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE454734B (sv) 1987-02-20 1988-05-24 Harald Brusewitz Forfarande och anordning for sendning och mottagning vid variabel lengdkodning

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05347710A (ja) * 1992-06-15 1993-12-27 Nippon Telegr & Teleph Corp <Ntt> 適応的可変長符号化方法
JPH06225279A (ja) * 1992-10-26 1994-08-12 Sony Corp 符号化方法、復号化方法、符号化装置及び復号化装置
US5400075A (en) * 1993-01-13 1995-03-21 Thomson Consumer Electronics, Inc. Adaptive variable length encoder/decoder
US5640420A (en) * 1995-03-28 1997-06-17 Daewoo Electronics Co., Ltd. Variable length coder using two VLC tables
JPH08316846A (ja) * 1995-05-18 1996-11-29 Matsushita Electric Ind Co Ltd 画像符号化装置、画像復号化装置、画像符号化方法および画像復号化方法
JP2001346212A (ja) * 2000-06-02 2001-12-14 Nippon Telegr & Teleph Corp <Ntt> 符号化データ再圧縮方法および符号化データ復元方法ならびにそれらの方法を記録した記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9088802B2 (en) 2005-01-07 2015-07-21 Nippon Telegraph And Telephone Corporation Video encoding method and apparatus, video decoding method and apparatus, programs therefor, and storage media for storing the programs
WO2011007719A1 (ja) * 2009-07-17 2011-01-20 ソニー株式会社 画像処理装置および方法
CN102474618A (zh) * 2009-07-17 2012-05-23 索尼公司 图像处理装置和方法

Also Published As

Publication number Publication date
DE60347000C5 (de) 2020-08-06
KR20040077754A (ko) 2004-09-06
RU2004125588A (ru) 2006-01-27
ES2529344T3 (es) 2015-02-19
KR100953677B1 (ko) 2010-04-20
WO2003063501A1 (en) 2003-07-31
ZA200405535B (en) 2005-05-25
CN1620816A (zh) 2005-05-25
RU2354073C2 (ru) 2009-04-27
EP1470724A1 (en) 2004-10-27
MXPA04007053A (es) 2004-10-11
JP4510465B2 (ja) 2010-07-21
EP1470724B1 (en) 2014-11-19

Similar Documents

Publication Publication Date Title
JP4510465B2 (ja) イメージ/ビデオ符号器及び/又は復号器における変換係数の符号化
KR100969645B1 (ko) 적응 가변장 부호화
KR101010722B1 (ko) 영상의 코딩 변환 계수/비디오 인코더 및/또는 디코더
EP1391121B1 (en) Variable length coding
EP1497990B1 (en) Method and device for indicating quantizer parameters in a video coding system
EP1486065B1 (en) Method for coding motion in a video sequence

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090317

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090616

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100330

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4510465

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term