JPH08289294A - 適応量子化による動画像圧縮システム - Google Patents

適応量子化による動画像圧縮システム

Info

Publication number
JPH08289294A
JPH08289294A JP8074140A JP7414096A JPH08289294A JP H08289294 A JPH08289294 A JP H08289294A JP 8074140 A JP8074140 A JP 8074140A JP 7414096 A JP7414096 A JP 7414096A JP H08289294 A JPH08289294 A JP H08289294A
Authority
JP
Japan
Prior art keywords
picture
area
region
small
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8074140A
Other languages
English (en)
Inventor
Elliot Neil Linzer
エリオット・ニール・リンザー
Heidi Aarlien Peterson
ハイディ・アーリエン・ピーターソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH08289294A publication Critical patent/JPH08289294A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Discrete Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 改良された適応量子化サブシステムを用いて
ビデオ・データを符号化する方法および装置を提供する
こと。 【解決手段】 ピクチャを複数の領域に分割し、さらに
各領域を複数の小領域に分割する。次に、各小領域内の
ピクセルの線形結合を算出する。線形結合の処理によっ
て確立された、その小領域の粗さ許容度に基づいて、各
小領域の小領域適応量子化パラメータを決定する。小領
域適応量子化パラメータの関数として各領域の領域量子
化パラメータを決定し、次にその領域量子化パラメータ
に基づいて各領域の量子化レベルを決定する。各領域の
領域量子化レベルが決定したら、それを変形符号化す
る。各領域の変形符号化表現を連結して、ピクチャ全体
の符号化表現を得た後、それを復号して表示または記憶
することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ圧縮の分野
に関し、具体的には、ディジタル動画像信号を圧縮する
システムおよび技法に係わる。
【0002】
【従来の技術】ディジタル伝送網、ディジタル記憶媒
体、超大規模集積デバイスと、ビデオ信号および音声信
号のディジタル処理の技術的進歩は、多様な応用分野に
おけるディジタル・ビデオの伝送と記憶を経済的にする
方向に収斂しつつある。ディジタル・ビデオ信号の記憶
と伝送は、多くの応用分野の中核であり、ビデオ信号の
非圧縮表現は大量の記憶域を必要とするために、この進
歩し続ける技術分野にとってディジタル・ビデオ圧縮技
法の使用はきわめて重要である。この関連では、過去1
0年間にディジタル・ビデオ信号の圧縮に関するいくつ
かの国際標準が生まれており、さらに多くの標準が現在
作成中である。これらの標準は、テレビ電話やテレビ会
議、高品位ディジタル・テレビジョンの同軸ケーブル網
および光ファイバ網による伝送や地上波放送および直接
衛星放送、CD−ROM、ディジタル・オーディオ・テ
ープ、およびウィンチェスタ・ディスク・ドライブに記
憶された対話型マルチメディア製品など、多様な用途に
おける圧縮ディジタル・ビデオの伝送と記憶のためのア
ルゴリズムに適用される。
【0003】これらの標準のいくつかには、たとえばC
CITT(国際電信電話諮問委員会)のH.120勧
告、CCITTのH.261勧告、ISO/IECのM
PEG−1、MPEG−2標準などの圧縮技法の共通の
中核に基づくアルゴリズムが含まれている。MPEG−
2標準は、国際標準化機構(ISO)と国際電気標準会
議(IEC)との共同技術委員会に属するムービング・
ピクチャ・エキスパート・グループ(MPEG)によっ
て作成された。MPEG委員会は、ビデオ信号とそれに
付随する音声信号の多重化圧縮表現に関する標準を開発
してきた。それらの標準では、圧縮ビット・ストリーム
の構文と、復号の方法を規定しているが、エンコーダの
設計についてはかなりの自由度が残されている。
【0004】エンコーダが行うタスクの1つは、各画像
の様々な部分をどの程度良好に表現するか(すなわちデ
コーダによる再構成後の各部の品質)を決定することで
ある。これには通常、いくつかの符号化上の考慮点の間
で折り合いをつける必要がある。たとえば、MPEG−
2エンコーダでは、エンコーダが品質とビット・レート
生成との間で折り合いをつけるために使用する主要な手
段は、各マクロブロックの量子化パラメータ(QP)の
設定である。これは、シーケンス・レベルとマクロブロ
ック・レベルの両方に当てはまる。シーケンス内のQP
の値をすべて上昇または低下させると、シーケンスの品
質とビット・レートがそれぞれ、向上または低下する。
1つのMBのQPを上昇または低下させると、そのマク
ロブロックに使用される品質とビット数は、それぞれ向
上または低下する。
【0005】
【発明が解決しようとする課題】ピクチャには他の領域
に比べて量子化雑音の「影響を受けやすい」領域があ
る。つまり、大きな値のQPを使用することによって引
き起こされるひずみが、画像の一部の領域では他の領域
よりも顕著になる。したがって、エンコーダは、量子化
ひずみによって重大な知覚上の劣化が生じないピクチャ
の領域では大きなQP値を使用し、量子化雑音の影響を
受けやすいピクチャの領域ではより小さいQP値を使用
しようとする。この処理は、適応量子化と呼ばれ、MP
EG標準の対象にはなっていない。その結果、2つのエ
ンコーダが適応量子化のためにまったく異なる技法を使
用することができ、それにもかかわらずそれぞれが有効
なビット・ストリームを生成することができる。しか
し、エンコーダによって生成されたビット・ストリーム
から復号されたピクチャの全体的品質は、適応量子化機
構に左右されることになる。さらに、異なる適応量子化
ごとに実現コストがまちまちになる可能性がある。
【0006】適応量子化を使用するビデオ・エンコーダ
は、ゴンザレス等の「Apparatus and Method for Motio
n Video encoding employing an Adaptive quantiser」
という名称の米国特許第5301242号に記述されて
いる。
【0007】適応量子化を使用したビデオ・エンコーダ
の他の例は、1993年4月発行のISO−IEC/J
TC1/SC29/WG11/NO−400「Test Mod
el 5」に記述されている。この適応量子化技法は、各マ
クロブロックのサブブロックの差異の算出に基づいてい
る。
【0008】
【課題を解決するための手段】上記に鑑みて、本発明は
新規な適応量子化サブシステムを使用してビデオ・デー
タを符号化するシステムおよび方法を含む。好ましい実
施例では、各マクロブロックをサブブロックに分割し、
それぞれをブロック・パラメータ生成回路に送る。ブロ
ック・パラメータ生成回路は各サブブロックのブロック
適応量子化パラメータを算出し、それらのパラメータか
ら、パラメータ合体機構がマクロブロック適応量子化パ
ラメータを算出する。具体的には、ブロック・パラメー
タ生成回路が入力サブブロック内のピクセルの線形結合
を算出し、次にその線形結合からブロック適応量子化パ
ラメータを決定する。エンコーダはマクロブロック適応
量子化パラメータを使用して、マクロブロックの量子化
レベルを決定する。
【0009】
【発明の実施の形態】
a. MPEG環境 本発明はMPEG−2エンコーダと組み合わせて適用す
ることができるため、本発明を理解しやすくするため
に、MPEG−2ビデオ圧縮標準のいくつかの関係点に
ついて検討する。しかし、本発明は、MPEG−2標準
の特徴のいくつかを共有する他のビデオ・コーディング
・アルゴリズムにも適用可能であることに留意された
い。
【0010】まず始めに、テキストのページ、画像、音
声のセグメント、またはビデオ・シーケンスなど、どの
ようなデータ・オブジェクトの圧縮も、一連のステップ
で実行されることを理解されたい。この一連のステップ
には、1)当該オブジェクトをトークンの集合に分解す
るステップと、2)それらのトークンを、ある意味で最
小の長さを有する2進ストリングによって表現するステ
ップと、3)ストリングを明確に定義された順序で連結
するステップが含まれる。ステップ2および3には損失
がない。すなわち、逆の操作によって元のデータを忠実
に回復することができる。ステップ2はエントロピー符
号化と呼ばれる。
【0011】ステップ1は一般に、損失がない場合とあ
る場合がある。ほとんどのビデオ圧縮アルゴリズムは、
ビット・レート要件が厳しいために損失がある。有効な
有損失圧縮アルゴリズムは冗長情報や無関係な情報をな
くして、視覚的に重大でないと思われる場合には比較的
大きな誤差を許容し、人間の目がきわめて敏感になるシ
ーケンスの局面は綿密に表現する。MPEG−2標準で
ステップ1のために採用している技法については、予測
/補間動き補償ハイブリッドDCT/DPCM符号化と
して説明することができる。ステップ2では、可変長符
号化とも呼ばれるハフマン符号化が使用される。前述の
ように、MPEG−2標準は実際にはデコーダと圧縮ビ
ット・ストリーム構文の仕様であるが、MPEG−2仕
様に関する以下の説明では、わかりやすくするために主
としてエンコーダの視点から説明する。
【0012】MPEGビデオ標準では、伝送のためのビ
デオの符号化表現が規定されている。これらの標準は、
インタレースまたは非インタレース・コンポーネント・
ビデオに適用されるように作成されている。各ピクチャ
は、輝度(Y)、赤色差(Cr)、青色差(Cb)の3つ
の成分を有する。Cr成分とCb成分のサンプル数はそれ
ぞれ、水平方向と垂直方向の両方でY成分の半分であ
る。
【0013】MPEGデータ・ストリームは、システム
情報とおそらくは他のビット・ストリームとともにシス
テム・データ・ストリームにパックされた、ビデオ・ス
トリームと音声ストリームから成り、層を成していると
みなすことができる。MPEGデータ・ストリームのビ
デオ層内では、圧縮データがさらに層を成している。こ
の層の構成の説明は、本発明の理解の助けとなるであろ
う。
【0014】これらの層は、圧縮方式の動作と、圧縮ビ
ット・ストリームの構成に関係する。最上位層はビデオ
・シーケンス層で、シーケンス全体の制御情報とパラメ
ータが含まれている。次の層では、シーケンスが、ピク
チャ・グループ(GOP)と呼ばれる数組の連続ピクチ
ャに細分されている。この層の概略図を図1に示す。復
号は、先行GOPとは本質的に無関係に、GOPのどこ
からでも開始することができる。GOP内に含めること
ができるピクチャの数には制限がなく、すべてのGOP
に同じ数のピクチャが入っている必要もない。
【0015】3番目の層、すなわち「ピクチャ」層は、
単一のピクチャである。ピクチャの「マクロブロック」
細分化の図を、図2に示す。各ピクチャの輝度成分は1
6×16の領域に細分される。色差成分は16×16の
輝度領域と空間的に同じ場所に配置された適切な大きさ
のブロックに細分されている。4:4:4ビデオの場
合、色差成分は16×16であり、4:2:2ビデオの
場合は色差成分は8×16、4:2:0ビデオの場合は
色差成分は8×8である。これらの同じ場所に配置され
た輝度領域と色差領域をすべて合わせると、「マクロブ
ロック」(MB)と呼ばれる5番目の層が構成される。
ピクチャ内のマクロブロックには、ラスタ走査順に連続
した番号が付けられている。
【0016】ピクチャ層とMB層の間には、4番目の層
である「スライス」層がある。各スライスは、いくつか
の連続したMBから成る。スライスの大きさは同一ピク
チャ内でも異なるピクチャ間でも一様である必要はな
い。ピクチャのスライス細分化の例を図3に示す。
【0017】最後に、各MBは4個の8×8輝度ブロッ
クと(4:4:4、4:2:2、および4:2:0ビデ
オの)8個、4個、または2個のクロミナンス・ブロッ
クから成る。各輝度ピクチャの幅(画素数すなわちピク
セル数)をCで示し、高さをRで示した場合(Cは列、
Rは行を表す)、1つのピクチャの幅はC/16MBで
高さはR/16MBとなる。
【0018】シーケンス層、GOP層、ピクチャ層、お
よびスライス層はそれに関連するヘッダを持っている。
ヘッダはバイト位置合わせされた「開始コード」で始ま
り、対応する層に含まれているデータに関係する情報が
入っている。
【0019】ピクチャはフィールド構造またはフレーム
構造とすることができる。フレーム構造ピクチャには、
フレーム全体、すなわち2つのフィールドを再構成する
ための情報が入っている。フィールド構造ピクチャに
は、1つのフィールドを再構成するための情報が入って
いる。各輝度フレームの幅(画素数すなわちピクセル
数)をCで示し、高さをRで示した場合(Cは列、Rは
行を表す)、フレーム構造ピクチャにはC×Rピクセル
の情報が含まれ、フィールド構造ピクチャにはC×R/
2ピクセルの情報が含まれる。
【0020】フィールド構造ピクチャ内のマクロブロッ
クには、1つのフィールドの16×16ピクセルのセグ
メントが含まれる。フレーム構造の非インタレース・ピ
クチャ内のマクロブロックには、非インタレース・フレ
ームの16×16ピクセルのセグメントが含まれる。フ
レーム構造のインタレース・ピクチャ内のマクロブロッ
クには、2つのフィールドによって構成されるフレーム
の16×16ピクセルのセグメントが含まれ、各マクロ
ブロックには、2つのフィールドのそれぞれの16×8
の領域が含まれる。フレーム構造インタレース・ピクチ
ャ内のマクロブロックの図を図4に示す。図4の各
「X」または「O」は1つのピクセルを表す。Oは上部
フィールドのピクセルを表し、Xは下部フィールドのピ
クセルを表す。
【0021】MPEG−2シーケンスにおける各フレー
ムは、2つの符号化フィールド・ピクチャまたは1つの
符号化フレーム・ピクチャで構成されていなければなら
ない。たとえば、2つのフレームを、1つのフィールド
構造ピクチャの後に1つのフレーム構造ピクチャが続
き、その後に1つのフィールド構造ピクチャが続いた構
成として符号化することは不当である。正当な組合せ
は、2つのフレーム構造ピクチャ、4つのフィールド構
造ピクチャ、2つのフィールド構造ピクチャの後に1つ
のフレーム構造ピクチャ、または1つのフレーム構造ピ
クチャの後に2つのフィールド構造ピクチャのいずれか
の組合せである。したがって、MPEG−2構文にはフ
レーム・ヘッダはないが、概念的にはMPEG−2のフ
レーム層を考えることができる。
【0022】GOP内には、3つの「タイプ」のピクチ
ャを含むことができる。ピクチャのタイプを区別する特
徴は、使用されている圧縮方法である。第1のタイプの
モード内ピクチャすなわちIピクチャは、他のピクチャ
とは独立して圧縮されている。Iピクチャ間の距離には
一定した上限はないが、ランダム・アクセスおよびその
他の特別な動作モードを容易にするために、シーケンス
全体にわたって点在すると予想される。予測動き補償ピ
クチャ(Pピクチャ)は、そのピクチャ内と、前に表示
されたIピクチャまたはPピクチャからの最も最近に再
構成された2つのフィールド内の圧縮データから再構成
される。双方向動き補償ピクチャ(Bピクチャ)は、そ
のピクチャ内と、前に表示されたIピクチャまたはPピ
クチャからの2つの再構成フィールド内および将来表示
されるIピクチャまたはPピクチャからの2つの再構成
フィールド内の圧縮データから再構成される。再構成さ
れたIピクチャまたはPピクチャを使用して他のピクチ
ャを再構成することができるため、これらのピクチャは
アンカー・ピクチャと呼ばれる。本明細書では、次のア
ンカー・ピクチャがIピクチャである場合にアンカー・
ピクチャをターミナル・ピクチャと呼ぶ。
【0023】1つのきわめて有用な画像圧縮技法は、変
換符号化である。MPEGおよびその他のいくつかの圧
縮標準では、離散コサイン変換(DCT)を変換方式と
して選択している。Iピクチャの圧縮は、1)ピクセル
のブロックのDCTを行うステップと、2)DCT係数
を量子化するステップと、3)その結果をハフマン符号
化するステップとによって行われる。MPEGでは、D
CT操作によって、8×8ピクセルの1ブロックを1組
の8×8の変換係数に変換する。DCT変換自体は無損
失の操作であり、実行に使用している計算装置とアルゴ
リズムの精度内に変換することができる。
【0024】2番目のステップであるDCT係数の量子
化は、MPEG標準における有損失性のおもな発生源で
ある。DCT係数の2次元配列の要素をCmnで示し、m
およびnが0ないし7の値をとることができるとする
と、切り捨て修正や丸め修正は別にして、各DCT係数
mnをWmn×QPで割ることで量子化を行うことができ
る。このWmnは重み係数であり、QPはマクロブロック
量子化係数である。重み係数Wmnによって、視覚的によ
り重要でない係数にはより粗い量子化を適用することが
できる。
【0025】以下の量子化では、各MBのDCT係数情
報が1組のハフマン・コードを使用して構成され、符号
化される。このステップの詳細は本発明の理解にとって
は重要ではなく、当技術分野で一般に理解されているた
め、本明細書では詳細を述べない。
【0026】ほとんどのビデオ・シーケンスは連続した
ピクチャ間で強い相互関係を示している。ピクチャを符
号化する前にこの冗長性を取り除く有用な方法が「動き
補償」である。
【0027】以下に、動き補償について説明する。マク
ロブロックごとに1つまたは複数の動きベクトルをビッ
ト・ストリームに符号化する。これらの動きベクトルに
よって、デコーダはアンカー・ピクチャ内のデータから
予測マクロブロックと呼ぶマクロブロックを再構成する
ことができる。エンコーダは、符号化するマクロブロッ
クから予測マクロブロックを差し引いて、差分マクロブ
ロックを形成する。エンコーダは、内部マクロブロック
を圧縮するために使用する手段と本質的に同様の手段を
使用して、差分マクロブロックを圧縮する。
【0028】Pピクチャでは、動き補償を使用して、現
行ピクチャよりも先の時点に出現するアンカー・ピクチ
ャから予測マクロブロックを構成する。Bピクチャで
は、動き補償を使用して、現行ピクチャよりも先の時点
と後の時点に出現するアンカー・ピクチャから予測マク
ロブロックを構成する。
【0029】MPEG−2圧縮方法は、固定ビット・レ
ート伝送媒体または記憶媒体でも可変ビット・レート伝
送媒体または記憶媒体でも使用することができる。可変
ビット・レート伝送の場合、エンコーダは各マクロブロ
ック(または各ピクチャ)で使用するビット数を決定す
る自由度が比較的高いが、完全に自由というわけではな
い。伝送媒体または記憶媒体のピーク・ビット・レート
とデコーダ・バッファのサイズとによって制約を受け
る。
【0030】MPEG−2を固定ビット・レート伝送ま
たは記憶媒体と可変ビット・レート伝送または記憶媒体
のどちらで使用する場合も、エンコーダはすべてのマク
ロブロックまたはすべてのピクチャで同じビット数を使
用する必要はない。エンコーダは、この自由を、デコー
ダへの入力の前に配置されたバッファを使用することで
得る。記憶または伝送媒体がデコーダのバッファをいっ
ぱいにしても、デコーダはそのバッファを本質的に任意
の高速で空にすることができる。
【0031】エンコーダは各マクロブロックまたは各ピ
クチャについて同じビット数を使用する必要はないが、
生成することができるビット数には制約がある。MPE
G−2標準ではこれらの制約の詳細が規定されている。
たとえば、固定ビット・レートの場合、エンコーダの長
期間の平均ビット・レートはチャネルのビット・レート
からわずかしか変動できない。さもないと、デコーダ・
バッファがオーバーフローまたはアンダーフローするこ
とになる。
【0032】前述のように、MPEG−2においてエン
コーダが品質とビット・レート生成の間で折り合いをつ
けるための主要な手段は、各マクロブロックにQPを設
定することである。これは、シーケンス・レベルでもマ
クロブロック・レベルでも当てはまる。シーケンス内の
すべてのQP値を上昇または低下させると、そのシーケ
ンスの品質とビット・レートがそれぞれ、向上または低
下する。1つのMBについてQPを上昇または低下させ
ると、そのマクロブロックに使用される品質とビット数
がそれぞれ向上または低下する。
【0033】ピクチャの一部の領域は、他の領域に比べ
て量子化雑音の「影響を受けやすい」。すなわち、大き
い値のQPを使用することによって生ずるひずみが画像
の一部の領域で他の領域よりも顕著になる。したがっ
て、エンコーダは、大きなQP値を使用しても重大な知
覚上の劣化が生じないピクチャの領域では大きなQP値
を使用して、量子化ひずみの影響を受けやすいピクチャ
の領域ではより小さい値を使用しようとする。この処理
は適応量子化と呼ばれ、MPEG標準の対象にはなって
いない。その結果、2つのエンコーダが適応量子化のた
めにまったく異なる装置または方法を使用することがで
き、それにもかかわらずそれぞれが有効なビット・スト
リームを生成することができる。しかし、エンコーダに
よって生成されたビット・ストリームから復号されたピ
クチャの全体的品質は、適応量子化機構に左右されるこ
とになる。さらに、異なる適応量子化ごとに実現コスト
がまちまちになる可能性がある。
【0034】b.実施例 まず、図15を参照しながら本発明の原理による符号化
方法の概要を説明する。
【0035】ステップ1502で、ディジタル化ピクチ
ャがエンコーダに入力される。ステップ1504で、エ
ンコーダはそのピクチャを複数の領域に分割し、次にス
テップ1506で各領域を複数の小領域に分割する。ス
テップ1508で、エンコーダは各小領域内のピクセル
の線形結合を算出する。ステップ1510で、エンコー
ダは、各小領域について線形結合の関数として小領域適
応量子化パラメータを決定する。この関数によって、各
小領域の粗さ許容度が確立される。
【0036】ステップ1512で、エンコーダは適応量
子化の関数として各領域の領域量子化パラメータを決定
し、次にステップ1514で領域量子化パラメータに基
づいて各領域の量子化レベルを決定する。
【0037】領域の領域量子化レベルが決定すると、そ
れがステップ1516で変換符号化される。静止画像の
場合、ピクセル・データ自体が変換符号化される。動画
像圧縮を使用して符号化された動画像の場合、動画像圧
縮差分信号が変換符号化される。
【0038】ステップ1518で、各領域の変換符号化
表現が連結されてピクチャ全体の符号化表現が得られ
る。ピクチャ全体の符号化表現は、ステップ1520で
復号されてから、ステップ1522で表示または記憶さ
れる。
【0039】エンコーダが行うタスクの1つは、各MB
のQPを設定することである。QPを設定するための従
来の装置を図5に示す。適応量子化機構101が各マク
ロブロックについて信号Q1を発生する。この信号によ
って、マクロブロックの量子化雑音に対する敏感度を記
述する。レート制御機構102が、目標ビット・レート
を実現する(または一定の最大ビット・レートを超えな
い)ために使用しなければならない全体的な量子化レベ
ルを記述する信号Q2を発生する。最終量子化スケール
決定機構103が、この2つの数値を結合して、各マク
ロブロックで使用するQPの値を生成する。
【0040】図6に図示する最終量子化スケール決定機
構は、2つの入力信号Q1およびQ2を有する。この2
つの信号は乗算器201に送られ、乗算器201はQ1
とQ2の積に等しい出力dを出力する。丸め機構202
が、dに最も近い、QPの正当な値である出力QPを出
力する。
【0041】図7は本発明の応用に適した従来の適応量
子化サブシステムの概要を示す。この適応量子化サブシ
ステムには2つの入力信号と1つの出力信号がある。入
力信号は輝度マクロブロック・ペル値mとパラメータ・
セットpである。出力信号は知覚量子化係数Q1であ
る。輝度マクロブロック・ペル値はブロック形成機構3
01に送られる。ブロック形成機構はKブロックのピク
セルを形成する。これを信号a1、a2、...akと
して示す。これらの各信号には輝度マクロブロック・ペ
ル値のサブセット(適正であるとは限らない)が含まれ
ている。ピクセル・ブロックa1、a2、...akは
1組のブロック・パラメータ生成回路302_1、30
2_2、..302_kに送られる。各MBについて、
1つのブロック・パラメータ生成回路が1ブロックのペ
ルを受け取って1つの数値を生成する。これらの数値は
図7に示す信号b1、b2、...bkである。ブロッ
ク・パラメータ生成回路302_1、302_2、..
302_kが、それぞれb1、b2、...bkを生成
する。信号b1、b2、...bkとパラメータ・セッ
トpは、パラメータ合体機構303に送られる。パラメ
ータ合体機構は知覚量子化係数Q1を生成する。
【0042】ブロック形成機構の実施例の動作につい
て、図8を参照しながら説明する。この実施例では、ブ
ロック形成機構は8個のサブブロックを形成する。図8
には、MB内の輝度ピクセルの2つの表現が示されてい
る。各表現では、ピクセルが数字で表されている。
「1」というラベルの付いたピクセルはサブブロックa
1に属し、「2」というラベルの付いたピクセルはサブ
ブロックa2に属し、以下同様である。サブブロックは
重なり合っていることに留意されたい。
【0043】この特定のブロック形成機構は、フレーム
構造インタレース・ピクチャ・マクロブロックに有用で
ある。フィールド構造ピクチャまたは非インタレース・
ピクチャの場合、サブブロックa1、a2、a3、およ
びa4のみを使用した方がよいことが多い。この実施例
では8×8ピクセルのサブブロック・サイズを使用して
いるが、他のブロック・サイズも可能である。
【0044】図9に本発明の実施例による改良されたブ
ロック・パラメータ生成回路を示す。ピクセル・サブブ
ロックaが線形変換機構401(これについては以下で
図10を参照しながら詳述する)に入力され、線形変換
機構は各入力サブブロックaのピクセル値の線形結合
(c1、c2、...cm)を生成する。線形結合c
1、c2、...cmは係数累算機構402(これにつ
いては以下で図11を参照しながら詳述する)に送ら
れ、係数累算機構はc1、c2,...cmからブロッ
ク適応量子化パラメータbを算出する。
【0045】図10は線形変換機構401の詳細図であ
る。この機構は、メモリ501_1、501_
2、...501_mを有する。各メモリには、入力ブ
ロックa内の各ピクセルの1つの変換係数が格納されて
いる。線形変換機構にはm個の累算器502_1、50
2_2..502_mがある。メモリと累算器の数m
は、たとえばサブブロック内のピクセル数(この実施例
では64個)と等しい数を選定することができる。各累
算器はサブブロックが読み込まれる前にゼロに初期設定
されている。
【0046】サブブロックの第1の要素が読み込まれる
と、メモリ501_1、501_2、...がそれぞ
れ、乗算器503_1、503_2、...503_m
を使用して入力ブロック内の第1のピクセルによって乗
ずる、信号e1、e2、...emとして図示されてい
る第1の変換係数を送る。この乗算の結果は信号f1、
f2、...fmである。これらの信号は、それぞれ加
算器504_1、504_2,...504_mによっ
て、累算器502_1、502_2、...502_m
の内容に加算され、その結果がそれぞれの累算器に書き
戻される。サブブロックの第2の要素が読み込まれる
と、メモリ機構501_1、501_2、...はそれ
ぞれのメモリから、入力サブブロック内の第2のピクセ
ルで乗ずる第2の変換係数を送る。この各積がそれぞれ
累算器502_1、502_2,...502mの内容
に加算され、その結果がそれぞれの累算器に書き戻され
る。このプロセスはブロック全体が読み込まれるまで続
けられる。その後、累算器は出力信号c1、c
2、...cmを保持する。
【0047】係数累算機構を図11に詳細に示す。入力
信号c1、c2、...cmがそれぞれ絶対値機構60
1_1、601_2、...602_mに送られ、絶対
値機構は信号g1、g2、...gmを生成し、giは
すべてのiについてciの絶対値に等しい。信号g1、
g2,...gmは次に一連のスケーラ602_1、6
02_2、...602_mに送られる。これらのスケ
ーラはそれぞれh1、h2、...hmを算出する。h
iはすべてのiについてgiとSiの積に等しく、Si
は定数スケーラである。信号h1、h2、...hmは
加算器603で合計され、その結果が出力bである。
【0048】本発明の実施例による改良されたパラメー
タ合体機構を、図12に詳細に示す。このパラメータ合
体機構への入力信号はb1、b2、...bkおよびp
1、p2、p3、p4である。このパラメータ合体機構
の実施例では、p1、p2、p3、およびp4が図6の
パラメータ・セットpを構成する。パラメータp1とb
1,b2,...bkは最小値回路701に送られる。
最小値回路はp1およびb1、b2,...bkの最小
値に等しい出力r0を出力する。次に信号r0に乗算器
702でパラメータp2を乗じ、その結果はr1=p2
×r0となる。最大値回路703が、r1とp3のいず
れか大きい方であるr2を算出する。加算器704はQ
1=r2+p4を算出する。Q1はマクロブロック適応
量子化パラメータである。
【0049】本発明の他の実施例による代替パラメータ
合体機構を図13に示す。このパラメータ合体機構への
入力信号は、b1、b2、...bkと、p5およびp
6である。この実施例のパラメータ合体機構では、p5
およびp6が図6のパラメータ・セットpを構成する。
信号b1、b2、...bkは最小値回路801に送ら
れ、b1、b2、...bkの最小値に等しい出力信号
t1が生成される。この信号t1は平方積機構802に
送られ、平方積機構は出力t2=t1×t1を生成す
る。乗算器803がt3をt3=t2×p6として算出
する。加算器804がt4をt4=t3+p5として算
出する。乗算器805がt5をt5=p5×p6として
算出する。(各MBのp5とp6が同じ場合は、各MB
についてt5を計算し直す必要はないことに留意された
い。)加算器806がt6をt6=t5+t2として算
出する。除算回路807がQ1をQ1=t4/t6とし
て算出する。
【0050】上記の適応量子化サブシステムの動作は、
パラメータ・セットp、乗数S1、S2、...Sm、
および図10のメモリ501_1、501_2、..5
01_mの内容によって決まる。次に、メモリの内容を
どのように設定することができるかという例を2つ示
す。第1の例は、偏差(DFM)方式であり、第2の例
はアダマール(HAD)方式である。図7のブロック形
成機構301によって生成される1ブロックのピクセル
内の要素数をnで示す。DFM法とHAD法のいずれの
場合も、線形変換機構(図10)の出力信号数mはnと
等しい。
【0051】DFM法では、メモリ素子i内のj番目の
変換係数はiがjと等しくない場合は−1/nに等し
く、jがiと等しい場合には1−(1/n)に等しい。
【0052】HAD法では、線形変換機構がピクセルの
入力ブロックに対してアダマール変換を計算する。アダ
マール変換は従来からの方法であり、たとえばC.ゴン
ザレスとP.ウィンツによる「Digital Imaga Processi
ng」1987年第2版の第3.5.2節で述べられてい
る。(前述のブロック形成機構の実施例の場合のよう
に)n=64の場合、HAD法の描画表現を図14に示
す。図14には、「+」記号と「−」記号の2次元配列
がある。配列の各行は図10のメモリを表し、各列はメ
モリ内の項目番号を表す。メモリ素子i内のj番目の番
号は、図10のマトリックスのi番目の行内のj番目の
記号が「+」の場合は+1であり、図10のマトリック
スのi番目の行のj番目の記号が「−」の場合には−1
である。
【0053】上記のシステムおよび方法は、コンピュー
タ・システムにおいてハードウェア論理回路でもプログ
ラム・コードでも実施可能であることを理解されたい。
【0054】以上、本発明について好ましい実施例を用
いて説明したが、当業者なら様々な変更および改良を思
いつくであろう。したがって、好ましい実施例は例示的
なものであり、限定的なものではないことを理解された
い。本発明の範囲は、特許請求の範囲によって規定され
る。
【0055】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0056】(1)ディジタル・ピクチャを符号化する
方法であって、ピクチャを複数の領域に分割するステッ
プと、各領域を複数の小領域に分割するステップと、各
小領域内のピクセルの線形結合を決定するステップと、
各小領域の粗さ許容度を確立する線形結合の関数とし
て、各小領域の小領域適応量子化パラメータを決定する
ステップと、小領域適応量子化パラメータの関数とし
て、各領域の領域量子化パラメータを決定するステップ
と、領域量子化パラメータに基づいて各領域の量子化レ
ベルを決定するステップと、量子化レベルを使用して各
領域の変換符号化を行うステップと、各領域の変換符号
化表現を連結して、ピクチャ全体の符号化表現を得るス
テップとを含む方法。 (2)ピクチャ全体の符号化表現をデコーダに送るステ
ップと、ピクチャ全体を復号された形で表示装置上に表
示するステップとをさらに含む、上記(1)に記載の方
法。 (3)線形結合が、各小領域内のピクセル値に対してア
ダマール変換を行うことによって算出されることを特徴
とする、上記(1)に記載の方法。 (4)ピクチャを複数の領域に分割する手段と、各領域
を複数の小領域に分割する手段と、各小領域内のピクセ
ルの線形結合を算出する手段と、各小領域の粗さ許容度
を確立する線形結合の関数として、各小領域の小領域適
応量子化パラメータを決定する手段と、小領域適応量子
化パラメータの関数として、各領域の領域量子化パラメ
ータを決定する手段と、領域量子化パラメータに基づい
て各領域の量子化レベルを決定する手段と、量子化レベ
ルを使用して各領域の変換符号化を行う手段と、各領域
の変換符号化表現を連結してピクチャ全体の符号化表現
を得る手段とを備える、ディジタル・ピクチャを符号化
するエンコーダ。
【図面の簡単な説明】
【図1】1対のピクチャ・グループ(GOP)の例を示
す図である。
【図2】(4:2:0形式の場合の)ピクチャのマクロ
ブロック(MB)細分化の例を示す図である。
【図3】ピクチャのスライス細分化の例を示す図であ
る。
【図4】フレーム構造インタレース・ピクチャにおける
マクロブロック形式を示す図である。
【図5】従来の量子化スケール生成サブシステムを示す
ブロック図である。
【図6】従来の最終量子化スケール決定機構を示すブロ
ック図である。
【図7】従来の適応量子化サブシステムを示す図であ
る。
【図8】マクロブロックの区分化を示す図である。
【図9】本発明の実施例によるブロック・パラメータ生
成器を示すブロック図である。
【図10】図9の線形変換機構の詳細図である。
【図11】図9の係数累算機構の詳細図である。
【図12】本発明の実施例によるパラメータ合体機構を
示す図である。
【図13】本発明の他の実施例による代替パラメータ合
体機構を示す図である。
【図14】アダマール変換を描画表現した図である。
【図15】本発明の原理によるコーディング方法の概要
を示す図である。
【符号の説明】
603 加算器 702 乗算器 704 加算器 802 平方積機構 807 除算回路
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ハイディ・アーリエン・ピーターソン アメリカ合衆国10012 ニューヨーク州ニ ューヨーク モット・ストリート 284 アパートメント5エイチ

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】ディジタル・ピクチャを符号化する方法で
    あって、 ピクチャを複数の領域に分割するステップと、 各領域を複数の小領域に分割するステップと、 各小領域内のピクセルの線形結合を決定するステップ
    と、 各小領域の粗さ許容度を確立する線形結合の関数とし
    て、各小領域の小領域適応量子化パラメータを決定する
    ステップと、 小領域適応量子化パラメータの関数として、各領域の領
    域量子化パラメータを決定するステップと、 領域量子化パラメータに基づいて各領域の量子化レベル
    を決定するステップと、 量子化レベルを使用して各領域の変換符号化を行うステ
    ップと、 各領域の変換符号化表現を連結して、ピクチャ全体の符
    号化表現を得るステップとを含む方法。
  2. 【請求項2】ピクチャ全体の符号化表現をデコーダに送
    るステップと、 ピクチャ全体を復号された形で表示装置上に表示するス
    テップとをさらに含む、請求項1に記載の方法。
  3. 【請求項3】線形結合が、各小領域内のピクセル値に対
    してアダマール変換を行うことによって算出されること
    を特徴とする、請求項1に記載の方法。
  4. 【請求項4】ピクチャを複数の領域に分割する手段と、 各領域を複数の小領域に分割する手段と、 各小領域内のピクセルの線形結合を算出する手段と、 各小領域の粗さ許容度を確立する線形結合の関数とし
    て、各小領域の小領域適応量子化パラメータを決定する
    手段と、 小領域適応量子化パラメータの関数として、各領域の領
    域量子化パラメータを決定する手段と、 領域量子化パラメータに基づいて各領域の量子化レベル
    を決定する手段と、 量子化レベルを使用して各領域の変換符号化を行う手段
    と、 各領域の変換符号化表現を連結してピクチャ全体の符号
    化表現を得る手段とを備える、ディジタル・ピクチャを
    符号化するエンコーダ。
JP8074140A 1995-04-05 1996-03-28 適応量子化による動画像圧縮システム Pending JPH08289294A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US418141 1995-04-05
US08/418,141 US5729294A (en) 1995-04-05 1995-04-05 Motion video compression system with novel adaptive quantization

Publications (1)

Publication Number Publication Date
JPH08289294A true JPH08289294A (ja) 1996-11-01

Family

ID=23656886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8074140A Pending JPH08289294A (ja) 1995-04-05 1996-03-28 適応量子化による動画像圧縮システム

Country Status (5)

Country Link
US (1) US5729294A (ja)
EP (1) EP0736843B1 (ja)
JP (1) JPH08289294A (ja)
KR (1) KR100238622B1 (ja)
DE (1) DE69624399T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013084781A1 (ja) * 2011-12-07 2013-06-13 株式会社日立国際電気 画像符号化装置及び画像符号化方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ID21557A (id) * 1996-11-28 1999-06-24 Thomson Multimedia Sa Proses untuk pengkodean dengan daerah informasi
US6192075B1 (en) * 1997-08-21 2001-02-20 Stream Machine Company Single-pass variable bit-rate control for digital video coding
US6212232B1 (en) 1998-06-18 2001-04-03 Compaq Computer Corporation Rate control and bit allocation for low bit rate video communication applications
US6831947B2 (en) 2001-03-23 2004-12-14 Sharp Laboratories Of America, Inc. Adaptive quantization based on bit rate prediction and prediction error energy
DE10156851C1 (de) * 2001-11-20 2003-07-03 Infineon Technologies Ag Verfahren und Vorrichtung zur Bildkompression
US7181071B2 (en) * 2001-11-27 2007-02-20 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding key value data of orientation interpolator node
JP3846488B2 (ja) * 2004-05-10 2006-11-15 セイコーエプソン株式会社 画像データ圧縮装置、エンコーダ、電子機器及び画像データ圧縮方法
JP5053081B2 (ja) * 2004-06-18 2012-10-17 トムソン ライセンシング ビデオ・コーデック量子化のための方法および装置
GB0428155D0 (en) 2004-12-22 2005-01-26 British Telecomm Buffer underflow prevention
KR101170799B1 (ko) 2005-05-21 2012-08-02 삼성전자주식회사 영상 압축 방법 및 그 장치와 영상 복원 방법 및 그 장치
US8306918B2 (en) * 2005-10-11 2012-11-06 Apple Inc. Use of media storage structure with multiple pieces of content in a content-distribution system
US8126283B1 (en) 2005-10-13 2012-02-28 Maxim Integrated Products, Inc. Video encoding statistics extraction using non-exclusive content categories
US8149909B1 (en) 2005-10-13 2012-04-03 Maxim Integrated Products, Inc. Video encoding control using non-exclusive content categories
US8081682B1 (en) 2005-10-13 2011-12-20 Maxim Integrated Products, Inc. Video encoding mode decisions according to content categories
US9479794B2 (en) 2005-11-10 2016-10-25 Freescale Semiconductor, Inc. Resource efficient video processing via prediction error computational adjustments
US8077775B2 (en) 2006-05-12 2011-12-13 Freescale Semiconductor, Inc. System and method of adaptive rate control for a video encoder
US7773672B2 (en) 2006-05-30 2010-08-10 Freescale Semiconductor, Inc. Scalable rate control system for a video encoder

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868653A (en) * 1987-10-05 1989-09-19 Intel Corporation Adaptive digital video compression system
US4972260A (en) * 1988-08-22 1990-11-20 Matsushita Electric Industrial Co., Ltd. Apparatus for coding a moving-picture signal
US5051840A (en) * 1988-12-14 1991-09-24 Fuji Photo Film Co., Ltd. Device for coding a picture signal by compression
EP0444918B1 (en) * 1990-02-28 1996-06-05 Victor Company Of Japan, Limited Data compression apparatus
US5249053A (en) * 1991-02-05 1993-09-28 Dycam Inc. Filmless digital camera with selective image compression
EP0514663A3 (en) * 1991-05-24 1993-07-14 International Business Machines Corporation An apparatus and method for motion video encoding employing an adaptive quantizer
US5369437A (en) * 1991-08-28 1994-11-29 Nec Corporation Time-varying image signal coding/decoding system
US5351083A (en) * 1991-10-17 1994-09-27 Sony Corporation Picture encoding and/or decoding system
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5521717A (en) * 1992-02-03 1996-05-28 Canon Kabushiki Kaisha Image processing apparatus and method therefor
US5440346A (en) * 1993-06-16 1995-08-08 Intel Corporation Mode selection for method and system for encoding images

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013084781A1 (ja) * 2011-12-07 2013-06-13 株式会社日立国際電気 画像符号化装置及び画像符号化方法
JP2013121045A (ja) * 2011-12-07 2013-06-17 Hitachi Kokusai Electric Inc 画像符号化装置及び画像符号化方法
US9503754B2 (en) 2011-12-07 2016-11-22 Hitachi Kokusai Electric Inc. Image encoding device and image encoding method

Also Published As

Publication number Publication date
DE69624399D1 (de) 2002-11-28
EP0736843A2 (en) 1996-10-09
EP0736843B1 (en) 2002-10-23
US5729294A (en) 1998-03-17
DE69624399T2 (de) 2003-06-18
KR100238622B1 (ko) 2000-01-15
EP0736843A3 (en) 1997-01-08
KR960040006A (ko) 1996-11-25

Similar Documents

Publication Publication Date Title
KR100253931B1 (ko) 디지탈 영상 시퀀스의 디코딩 방법 및 장치
US5414469A (en) Motion video compression system with multiresolution features
Le Gall The MPEG video compression algorithm
US5719632A (en) Motion video compression system with buffer empty/fill look-ahead bit allocation
USRE43061E1 (en) Method and apparatus for encoding interlaced macroblock texture information
US20060088098A1 (en) Method and arrangement for reducing the volume or rate of an encoded digital video bitstream
KR100246168B1 (ko) 격행비디오를 위한 계층적 움직임 추정
KR100325492B1 (ko) 디지탈화상신호의계층적엔코딩/디코딩장치및방법
KR100591114B1 (ko) 비디오 처리 방법 및 시스템
KR100238622B1 (ko) 새로운 적응형 양자화기를 이용한 동영상 압축 시스템 및 방법
EP0827344A2 (en) Video decoder
US6865229B1 (en) Method and apparatus for reducing the “blocky picture” effect in MPEG decoded images
US5757967A (en) Digital video decoder and deinterlacer, format/frame rate converter with common memory
KR100510756B1 (ko) 화상복호화장치와 그 방법 및 화상재생장치
US5652629A (en) Bidirectional motion estimation in a motion video compression system
US6968003B1 (en) Speed-memory tradeoff for MPEG decoders
JPH08275158A (ja) 保証されたビット発生限界を有する動画像圧縮システム
US20040141654A1 (en) Texture encoding procedure
US7426311B1 (en) Object-based coding and decoding apparatuses and methods for image signals