JP2002524007A - イメージ圧縮方法および装置 - Google Patents

イメージ圧縮方法および装置

Info

Publication number
JP2002524007A
JP2002524007A JP2000568051A JP2000568051A JP2002524007A JP 2002524007 A JP2002524007 A JP 2002524007A JP 2000568051 A JP2000568051 A JP 2000568051A JP 2000568051 A JP2000568051 A JP 2000568051A JP 2002524007 A JP2002524007 A JP 2002524007A
Authority
JP
Japan
Prior art keywords
data
circuit
image compression
zigzag
coupled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000568051A
Other languages
English (en)
Other versions
JP2002524007A5 (ja
Inventor
ヤオ ウー トニー フン
ウェイ チュン リー
シア フン チェン
ダー レン チュー
ウェイ チュン ソフィア カオ
カン ファイ ワン
レン ユー ワン
Original Assignee
ディヴィオ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ディヴィオ インコーポレイテッド filed Critical ディヴィオ インコーポレイテッド
Publication of JP2002524007A publication Critical patent/JP2002524007A/ja
Publication of JP2002524007A5 publication Critical patent/JP2002524007A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform

Abstract

(57)【要約】 入力端子に供給されたイメージデータを圧縮し、圧縮済みデータを出力端子に供給するイメージ圧縮装置は、入力端子に結合され、イメージデータを重み付けされた周波数データに変換するように構成された重み付けされた4x4デジタルコサイン変換器(DCT)を有する。ジグザグ回路は、DCTに結合され、周波数データをジグザグ処理し、かつ作成済みジグザグデータを生成するように構成される。Q値エスッティメイタは、DCTに結合され、周波数データを推定し、かつQ値を生成するように構成される。DC符号化回路は、ジグザグ回路に結合され、ジグザグデータを符号化し、かつDC符号を生成するように構成される。量子化回路は、ジグザグ回路およびQ値エスティメイタに結合され、Q値に基づいてジグザグデータを量子化し、かつ量子化済みデータを生成するように構成される。ランレングス符号化回路は、DC符号化回路および量子化回路に結合され、可変レングスデータを出力端子への圧縮済みデータとして作成するために量子化済みデータを符号化するように構成される。この仕方において、元のイメージが圧縮される。本発明は特定のハードウェアに関して記述されるが、本発明は、ここで記述されるような機能を用いるソフトウェアにも実装可能である。本発明の利点には、高速かつ高効率のイメージ圧縮技法が含まれる。更に、本発明は、動くイメージにも適用可能な高速かつ高効率のイメージ圧縮技法を提供する。

Description

【発明の詳細な説明】
【0001】 (関連出願の参照) 本出願は引用によってここに組み込み済みの暫定出願1998年9月2日出願
の第60/098,844号、1998年9月1日出願の第60/098,77
2号、1998年9月1日出願の第60/098,728号、1998年9月1
日出願の第60/098,752号への優先位を請求するものである。
【0002】 (分野) 本発明はイメージ圧縮方法および装置に関する。詳細には、本発明は、従来の
イメージ圧縮技法よりも更に高速かつ更に効率的なイメージ圧縮技法を提供する
【0003】 (背景) 視覚的通信は、時期、可能性、又は、計画性の観点からはもはや検討される段
階にない。必要性および基礎となる技術は現在充分である。失われつつあるもの
は、禁止的でない経費において可能な最良の品質および性能のデジタルビデオの
可用性である。デジタルビデオカメラはPC(パーソナルコンピュータ)にとっ
て大きな次期入力デバイスとなりつつある。高品質のビデオイメージをPCに取
り入れる唯一の方法はカメラを介して実施することである。ただし、莫大な量の
ビデオデータを伝送するためには大きい帯域幅が必要なので、実行可能な解決方
法を決定することでエンジニャは精一杯である。
【0004】 従来の解決方法は、カメラに結合された外部捕捉カードを使用することである
。この場合、カメラは、ビデオデータの全てのフレームを通常のケーブルを介し
て捕捉カードへ送り返す。本システムをインストールするためには、ユーザはコ
ンピュータハウジングを取り外し、カードを差し込み、システムを作動させるた
めに、ハードウェアとソフトウェア間の相克を潜在的に解決しなければならない
。この解決方法は、全フレーム速度および全色深度を支援できるが、幾分高価な
解決方法である。
【0005】 別の解決方法は、イメージを画定するデータサイズを縮小するための有益な技
法であるイメージ圧縮である。従来のイメージ圧縮技法は当該技術分野において
有名であり、これにはJPEG(静止画像対象)およびMPEG(動く画像対象
)が含まれる。JPEG規格は静止画像を対象とするが、イメージが各フレーム
ベースで通信される限り、動くイメージにも適用される。MPEG規格は、高度
の圧縮を提供する洗練された運動分析を用いるが、相当の処理能力をも必要とす
る。
【0006】 従来型JPEGイメージ圧縮はイメージを領域(一般に画素の8x8グループ
)化し、各領域をブロックとして特徴付ける。次に、この技法においては、離散
型コサイン変換(DCT)を用いて、ブロックを時間ドメインから周波数ドメイ
ンに変換する。次に、データは量子化され、エントロピ符号化される。JPEG
は、対象イメージに応じて、イメージデータを非常に(50−90%だけ)減少
させることができる。ただし、JPEGは、データを処理するために相当な処理
能力を必要とする。従って、従来型JPEGの限界の1つは、ブロックサイズが
8x8に固定されることであり、イメージを圧縮および圧縮解除するために相当
の処理能力を必要とする。
【0007】 本発明の目標は識別された限界を克服し、高速かつ高効率なイメージ圧縮技法
を提供するこである。その上、本発明の目標は、動くイメージに適用可能な高速
かつ高効率のイメージ圧縮技法を提供することである。
【0008】 (概要) 本発明は識別された問題を克服し、高速かつ高効率のイメージ圧縮技法を提供
する。その上、本発明は動くイメージに適用可能な高速かつ高効率のイメージ圧
縮技法を提供する。ここでは、本発明はJPEG−Liteと呼ばれることもあ
る。入力端子へ供給されたイメージデータを圧縮し、圧縮されたデータを出力端
子へ供給するイメージ圧縮装置の典型的実施形態には、入力端子に結合され、イ
メージデータを重み付けされた周波数データへ変換するように構成された重み付
け済み4x4デジタルコサイン変換器(DCT)が含まれる。ジグザグ回路はD
CTに結合され、周波数データをジグザグ処理し、作成済みジグザグデータを生
成するように構成される。Q値エスティメイタはDCTに結合され、周波数デー
タを推定し、Q値を生成するように構成される。DC符号化回路はジグザグ回路
に結合され、ジグザグデータを符号化し、かつDC符号を生成するように構成さ
れる。量子化回路はジグザグ回路およびQ値エスティメイタに結合され、Q値に
基づきジグザグデータを量子化し、量子化済みデータを生成するように構成され
る。ランレングス符号化回路はDC符号化回路および量子化回路に結合され、出
力端子への圧縮済みデータとして可変レングスデータを作成するために量子化済
みデータを符号化するように構成される。この仕方において、元のイメージが圧
縮される。
【0009】 本発明の一態様において、本発明は、重み付けされた4x4DCTを処理のた
めに2次元DCTに分割する。本発明の他の一態様において、2次元DCTは、
更に、処理のために1次元DCTに分割される。本発明のこれらの態様において
、高度の圧縮を達成するために特殊係数表が用いられる。量子化表は、相当量の
元のイメージの再現性を保持したままの状態で、高圧縮を達成するように選定さ
れる。DCコーダも、圧縮を改良するように選定される。ランレングス符号化(
RLC)及び可変レングス符号化(VLC)も圧縮を改良するように用いられる
【0010】 本発明の一実施形態においては、イメージ捕捉デバイス(例えばカメラ)と記
憶デバイス(例えばコンピュータ)または再生デバイス(例えばモニタ)の間の
帯域幅が限定されている場合には、高品質イメージを維持した状態のままで、こ
の帯域幅を短縮するために動的ビットレートコントローラが用いられる。本発明
の他の一実施形態においては、エラー検出が実施され、その結果として、受信デ
バイスがエラーを識別し、エラーがイメージ全体を腐敗させるステップが用いら
れる。更に、本発明は特定のハードウェアに関して説明されたが、本発明は、こ
こに記述された機能を用いるソフトウェアにおいても実施可能である。
【0011】 本発明の利点には高速かつ高効率的のイメージ圧縮技法も含まれる。更に、本
発明は、動くイメージにも適用可能な高速かつ高効率的のイメージ圧縮技法を提
供する。
【0012】 本発明の追加的利点は、図面を参照して以下の詳細な記述を読むことにより明
白になるはずである。 (詳細な記述) 特定の構成に関して典型的実施形態について記述される。当該技術分野におけ
る当業者は、本特許請求の範囲内に留どまったままで、種々の改変および修正が
実施可能であることを理解するはずである。例えば、本発明は特定のハードウェ
ア実装に関して記述されるが、本発明はソフトウェアにおいて達成可能である。
【0013】 A.ビデオ圧縮アーキテクチャ 図1は本発明の実施形態にしたがったビデオ圧縮アーキテクチャ10を示す。
イメージは、イメージデータと呼ばれる画素表現に基づいて入力端子18に供給
される。フィルタ及びシャッフル回路20は入力端子に結合され、イメージデー
タをシャッフルように構成される。4x4デジタルコサイン変換(DCT)回路
22はフィルタおよびシャッフル回路に結合され、イメージデータを重み付けさ
れた周波数データに変換するように構成される。DCTの重み付けについては以
下に述べる。ジグザグ(折り畳み)回路24はDCTに結合され、周波数データ
をジグザグデータをジグザグ処理し、ジグザグデータを作成するように構成され
る。Q値エスティメータ26はDCTに結合され、ジグザグ回路と平行に配置さ
れる。Q値エスティメータは周波数データを推定し、Q値を生成するように構成
される。DCコード化回路28はジグザグ回路に結合され、ジグザグデータをコ
ード化し、DCコードを生成するように構成される。量子化回路30はジグザク
回路およびQ値エスティメータに結合され、Q値エスティメータによって供給さ
れるQ値に基づいてジグザグデータを量子化し、量子化済みデータを生成するす
るように構成される。ランレングス符号化回路(RLC)32はDC符号化回路
および量子化回路に結合され、出力端子34への圧縮済みデータとして可変レン
グスデータを作成するために量子化済みデータを符号化するように構成される。
一実施形態において、パッキング及びレングス推定回路36は出力端子以前にラ
ンレングス符号化回路に結合される。ビットレートコントローラ(BRC)38
はパッキング及びレングス推定回路、および、ランレングスエンコーダ回路に結
合される。BRCは、VLCからの出力データを監視し、以下に説明するように
必要に応じてデータを減少させるように構成される。
【0014】 他の一実施形態において、出力端末34に結合された受信デバイスはエラー検
出および圧縮済みデータ内のエラーを識別し、データ実行からエラーを防止する
ように構成されたリカバリ回路36を含む。エラー検出およびリカバリ回路は、
受信デバイスがイメージを復元し、かつ後続するイメージの復元を妨害するエラ
ーを防止することを可能にする。
【0015】 B.濾波およびシャッフル この設計の目的は4:2:2 YUVビデオを4:1:1 YUVビデオに変
換すること及びラスタからブロックへの変換(シャッフル)を実施することにあ
る。シャッフルする目的は入力ラスタフォーマットをブロック(4x4)フォー
マットに変換することにある。Ym,nがm行の第n画素を表すものとする。入力
ラスタフォーマットは図2Aに示すように、1行当たり640画素を持つものと
する。図2Bに示すように、シャッフル用アルゴリズムは画素データを提供する
【0016】 ラスタからブロックへの変換を実施するには、画素データを一時的に記憶する
ためのオンチップメモリが有用である。メモリサイズが8行データを記憶するに
十分な大きさであれば、シャッフリングはハードウェアにおいて容易に達成可能
である。このメモリは各々が4行データを記憶する2つのバンクに分割される。
最初の4行データが完全にシャッフルされた後で、シャッフルされたデータが読
みとられ、同時に入来する次の4行データがもう一方のメモリバンクに記憶され
る。この方法を用いると、制御論理は直截的であり、静的ランダムアクセスメモ
リ(SRAM)アドレス技法は固定されるが、このメモリは依然として8行デー
タが必要とされる。ただし、8行データ用に必要なメモリサイズは、特に1行が
多数の画素を含む場合には重要である。実際には、シャフリング用メモリの最小
サイズは4行データである。メモリが4行データのみを記憶可能である場合には
、最初の4行データが完全にシャッフルされた後で、シャッフルされたデータは
読みとられ、同時に、その次の4行データのデータが受け取られ、シャッフルさ
れたデータが読みとられつつあスペースに記憶される。最初の4つの行の書込み
及び読取り順序は異なるので、SRAMアドレススキームは各4行ブロックに関
して固定されない。図2Cは最初の4つの行に関する書込みアドレスを示す。図
2Dは最初の4行(シャッフルされたデータ用)に関する読取りアドレス、およ
び、その次の4行に関する書き込みアドレスを示す。
【0017】 この実装においては、シャッフリングアドレス技法は、バイト書込みコントロ
ールを備えた32ビットSRAMを使用することによって更に簡素化可能である
。書込み段階に際して、バイト書込みコントロールによって選定された4つの8
ビットのなかの1つに8ビットデータが書き込まれる。読取り段階に際して、1
つの32ビットワードが同時に読みとられる。このSRAMインタフェースを用
いて、本発明は4つのバイトを1つのダブルワードにパックできる。例えば、Y 0,0 からY0,3(Y0,0-3)までを一方のダブルワード内に、Y0,4からY0,7(Y0 ,4-7 )までをもう一方のダブルワード内へ記憶可能である。読みとり段階に際し
て、Y0,0からY0,3までを含むダブルワードは同時に読みとられる。図2Eに示
すように、本発明は、最初の4行(第0行から第3行まで)に関する書込みアド
レスのアドレススキーム方式を再配置構成することが出来る。次に、最初の4行
(シャッフルされたデータ用)に関する読取りアドレス及びその次の4行に関す
る書込みアドレスを図2Fに示す。
【0018】 元の技法と比べると、幅32ビットのSRAMを使用する本発明の態様はシャ
ッフルするためのSRAMアドレススキームを更に簡素化できる。このアドレス
スキームを計算可能にするアルゴリズムを次に示す。 (1)1行当たりのデータ個数が与えられると、(4−1)行当たりのDPLデ
ータ個数が決定される。 (2)初期距離=1 (3)初期アドレス=0 (4)X=現行アドレス+距離を評価する。 (5)(X>DPL)であれば、その次のアドレス=X−DPL 他の場合には、その次のアドレス=X (6)4つの行のエンドまでステップ(4)に戻る。 (7)その次の4つの行に関する新規距へ距離を設定する。 (8)イメージのエンドまでのステップ(3)に戻る。
【0019】 ステップ(7)において、本発明は、4つの行を書き込んだ後で、距離を設定
する。第2行内のデータの書き込みに際して、その次の4つの行に関する距離が
アドレスから導出されろ。この例から得られる第2行の第1データのアドレスは
0160であり、従って、本発明は、その次の4つの行に関する距離を0160
に設定する。最初の4つの行に関するシャッフルされたデータの読み取りに際し
て、距離は0160であり、第5行の最初のデータの書き込みに際して、本発明
は第8から第11行までに関するアドレス0002からの距離を求める。
【0020】 C.デジタルコサイン変換(DCT) 図3A−Hを参照して、重み付けされた4x4DCTについて説明する。4x
4DCTは、例えば簡略化されたメモリ必要条件および高速演算のような利点を
もつ。本発明の一態様において、図3Aに示すように、4x4DCTは2次元D
CTに簡略化される。2次元DCTは分離可能であるので、図3Bに示すように
2次元DCTは更に1次元DCTに簡略化される。マトリックスAに用いられる
係数を図3Cに示す。1次元DCTを代替形式に書くことが可能であることを図
3Dに示す。表1の係数を用いた2次元DCT重み付けを図3Eに示す。
【0021】 高周波成分を更にデエンファシスするために、これらのDCT係数S(v,u
)は、データ量を更に減少させることのできるSw(v,u)になるように、係
数W(v,u)によって更に重み付けされる。本発明に用いられる重み付け係数
を表1に示す。 表1:DCT重み付け係数
【0022】 1次元DCTを組み合わせ、最終1次元DCT方程式を重み付けした後の方程
式を図3Fに示す。図3Gは、一次元DCTの機能的なアーキテクチャを示す。
図3Hは、ハードウェアにおいてDCTを実行する方法を示す。DCTの結果は
、重み付けされた周波数データの4x4ブロックである。
【0023】 D.ジグザグ走査 ジグザグ走査は順序AC係数を2次元配列から1次元線形配列に再配置構成す
る。順序は低周波成分から高周波成分までを走査する動作に近似する。各4x4
ブロックにおける正確なジグザグ走査順序を図4に示す。
【0024】 ジグザグ走査順序に従い、4x4領域は2つの異なる帯域に分割される。各帯
域は異なるQ値に関連する量子化係数の自体集合を持つ。画素位置と帯域の間の
関係を図5に示す。
【0025】 E.Q値エスティメータ 符号化スペースを更に限定するためにはAC係数の動的範囲を縮小しなければ
ならない。ここで使用される技法は量子化と呼ばれ、AC係数の各々を特定の事
前決数によって割り算する。事前決定数は量子化係数と呼ばれる。標準JPEG
において使用されるようにイメージ全体に関して一定した量子化係数が用いられ
るのとは対照的に、JPEG−Liteアルゴリズム用現行4x4ビデオブロッ
クの複雑性に従ってこれらの量子化係数は調節可能であなくてはならない。この
ように実施することは、個別ブロックの間で変化する複雑さへのエンコーダ適応
性を支援する。これらの係数に関連して、選択可能な4つのQ値、即ち0、1、
2、3がある。AC係数の範囲に従って異なるQが選定される。これらの関係は
表2に従って定義される。この表においてACmaxは各4x4ブロック内の最大
AC係数である。 表2 Q値決定判定基準
【0026】 表2によれば、最大AC係数が24以上であればQ値は3であり、最大AC係
数が12以上であればQ値は2であり、最大AC係数が6以上であればQ値は1
であり、これら以外の場合にはQ値は0である。数24、12、6は、ビデオの
品質を制御するために用いられる3つの調節可能なパラメータである
【0027】 F.量子化 量子化係数の設定が異なれば異なるQ値が関連する。ハードウェア計算必要条
件を簡略化するためには、量子化ステップと呼ばれる係数は2の累乗に設定され
る。従って、シフト演算は、除算(または乗算)演算の代わりに用いられる。
【0028】 同一Qに関して、帯域が異なれば量子化ステップが異なる。簡素化にために、
Y、U、V成分は表3に示す同一量子化表を共有するものとする。量子化の後で
、DC係数は8ビット数(2の補数)に保持され、AC係数は5ビット数プラス
1符号ビットにクランプされる。これは、コードブックサイズおよび探索範囲を
限定することを助ける。 表3 Y、U、V全ての成分に関する異なる帯域における量子化係数
【0029】 G.DC符号化セレクタ 未加工の各生4x4ブロックは128ビット(4x4x8=128)を占有す
る。目標圧縮比率を4から6とすると、各ブロックにとって多くのスペースが利
用可能ではない(わずか20−30ビット)。その上、DC係数は最大8ビット
を占有する。オーバヘッドを減少させるために、前のDC係数と現在のDC係数
の差は、この差が+15/−16未満であれば、伝達される。シミュレーション
によれば、イメージの複雑さに依存して約2ビット節減が可能である。差が用い
られるならば、DC_TYPEビットは1(微分モード)に設定される。そうで
なければ、DC_TYPEビットは0(直接モード)に設定される。パッキング
スキームにおいて、このビットはQ数の後に付加される。
【0030】 この表現を選定する1つの理由は、全ゼロ2バイトヘッダとの混同を避けるた
めである。例えば、第1DC係数がゼロであれば、DC値は微分モードにおいて
DC_TYPEビット=1と共に送られる。第1DCが非ゼロであるならば、少
なくとも1つの非ゼロのビットを含む直接モードで送られる。従って、ビデオス
トリームの最初の2つのバイト内には「1」がなくてはならない。
【0031】 特殊パッキングメカニズムであるので、Y0とY2は一緒にパックされ、Y1
とY3は対である。これは、UとVブロックに関して同じである。各Yブロック
はそのDC値を正面におけるブロックと比較する。この場合には、Y1はY0と
比較し、Y2はY1と比較しY3はY0と比較する。ただし、UおよびVブロッ
クはDC値を相互ではなくてそれら自体のカラーブロックと比較する。このスキ
ームは色の連続性を最も良く組み込むことが可能であり、微分モードにおいて正
確に表すための機会は約85%から90%である。
【0032】 興味深い一点は各水平行の開始点(各フレームの開始点を含む)に所在する。
この場合、前のDC値は、記録された最後のDC値でなくて0に設定される。理
由は、上述の注記における説明と同じである。この規定に関する理由は、全ゼロ
の2バイトヘッダとの混同を避けようとする意図に関する上述の理由と同じであ
る。
【0033】 H.ランレングス符号化(RLC)及び可変レングス符号化変(VLC) ランレングス符号化は量子化済みAC係数に適用される。2つの非ゼロAC係
数の間のゼロは他の符号化パラメータとみなされる。これら15AC係数の順序
は、(run[0],amp[0])、(run[1],amp[1])等々の
対として再編成され得る。これらの対は、図6に示すランレングス表に従った或
る特定の符号ビットストリームに対応する。最後の画素まで継続する連続したゼ
ロはその代りに記号EOBによって表される。復号効率の場合には、EOBは各
ブロックの端部に挿入される。これは、最後のAC係数さえも非ゼロであること
を意味する。
【0034】 図6に示す表は、JPEG−Liteスキームに使われるRLCコードブック
である。最初に、多数の異なるイメージ(50以上)が処理されて、異なる(r
un,amp)対の統計値が生成する。次に、ハフマン符号化アルゴリズムが、
確率に従ってビットシーケンスを割り当てるために適用される。確率が高ければ
高い程、符号長さは更に短い。図6は本発明に用いられるランレングス符号表を
示す。
【0035】 表の底部のrrrr」は4ビット数に符号化されたラン(run)カウントを
表し、「aaaa」は同様に4ビット数に符号化された絶対振幅を表す。文字「
s」は振幅の符号を表し、振幅が負であれば「1」である。
【0036】 対応する符号化スペースを図7に示す。中に数字が記入されたセルは、直接符
号化が可能であり、数字が長さを示すこれらの(run,amp)対である。単
斜線の引かれたセルは、0100110接頭ビットを持ち、後続する3ビットラ
ンレングス、5ビット振幅、及び、1ビット符号によって符号化される(run
,amp)対を示す。複斜線の引かれたセルは、0100111接頭ビットを持
ち、後続する4ビットランレングス、4ビット振幅、及び、1ビット符号によっ
て符号化される(run,amp)対を示す。5<run<14およびamp>
15である空白領域は、起こることなく無視される(run,amp)対を示す
【0037】 I.パッキング及び長さ推定 可変レングス符号化の後で、異なる長さの符号は、伝送および記憶用として、
16ビットワードにパックされなければならない。異なるブロックから成るビッ
トストリームを連結することによって、全体の長さを更に短縮することが可能で
ある。
【0038】 パックされた各符号は、Q値数(2ビット)および第1YブロックのDC符号
化タイプ(1ビット)によって開始する。DC係数が差として符号化される場合
には、その次の5ビットはDC差である。そうでない場合には、その次の8ビッ
トはDC係数である。次に、パックされたデータはACランレングス符号化され
た結果によって継続される。符号化処理中に、非ゼロAC係数が最大数に達した
場合には、RLCは、残りのAC係数の符号化を停止し、完了するために「EO
B」トークンを送る。そうでない場合には、最後の係数に達して、「EOB」ト
ークンによって後続されるまで、符号化処理は継続する。
【0039】 可変レングス符号化処理は第2Yブロック、第3ブロック、および、第4ブロ
ックに関して進行する。次に、1つのUブロック及び1つのVブロックから符号
が挿入される。各ブロック行の終端部まで同じ順序が繰り返される。各ブロック
行の開始に際して、新規な前のDC値がゼロに設定されることは別として、ビッ
トストリームは継続する。1つのビデオフレームのちょうどその終端部において
、追加「1」ビットが最後のワードに添付され、完全な16ビットワードを完成
させる。
【0040】 YブロックおよびUVブロックまでの非ゼロAC係数の最大の数は、現行圧縮
統計に従って調節可能である。データの全体量が所要予算よりはるかに多い場合
には、これらの数は、現行ブロック行の終端部において減少させられる。
【0041】 図8はYUV411入力ストリームに関するパッキングスキームを示す。デー
タストリームはY0、Y1、Y2、Y3、U、Vの順序で入来し、パッキング順
序が同様に後続する。ビデオデータビットストリームは、各フレームの最初にお
いて、ワード境界から始まることに注意されたい。
【0042】 データ転送に際して、符号の全長は、各ブロック行および各フレームに関して
累積される。ビットレート制御が用いられる場合には、一定のビットレートを維
持するための圧縮設定を調整するために、各ブロック行又はフレームの長さはビ
ットレートコントローラ(BRC)に報告される。
【0043】 J.動的ビットレートコントローラ(BRC) 汎用直列バス(USB)インタフェースの導入は、デジタル捕捉デバイス(例
えばカメラ)とコンピュータの間の通信実施にとって有利である。USBは、コ
ンピュータとアドオンデバイス間の「プラグ・アンド・プレイ」インタフェース
である。毎秒12メガビットのデータレートをサポートするUSB能力を用いる
と、例えばオーディオプレーヤ、ジョイスチック、鍵盤、電話、スキャナ、及び
、プリンタなどの広範囲に亙ってデバイスを収容できる。アダプタカードの必要
なしに、または、USB周辺にプラグインする前にコンピュータの電源を切るこ
とさえ必要とせずに、新規デバイスをパーソナルコンピュータ(PC)に追加で
きる。従って、コンピュータユーザは、正しい直列ポートの選択、拡張カードの
インストール、または、ディップスイッチ、ジャンパ、ソフトウェアドライバ、
IRQ設定、DMAチャネル、及び、I/0アドレスについての技術的な煩わし
さから解放される。
【0044】 本発明の一態様において、ビデオコンプレッサはUSBを介して他のデバイス
に結合される。USBバスは固定した事前指定済みデータ転送速度(等時性転送
)を備えているので、一定のビデオデータレートを提供するデータ転送を監視す
るために動的ビットレートコントローラが重要である。動的ビットレートコント
ローラ(BRC)は、最大許容非ゼロAC係数を調節することによってデータレ
ートを制御できる。そうすることにより、ビデオ品質を犠牲にして(ビデオ品質
の更なる貧弱化に帰着)符号化済みデータレートは低下される。
【0045】 ビデオ会議またはビデオ郵便への適用を更に有用にするには、更に大きいサイ
ズのビデオイメージを送信することが望ましい。サポート可能な幾つかの一般向
けビデオフォーマットがある。即ち、CIF、QCIF、SIF、QSIF、及
び、VGAである。これらのビデオサイズ及び必要とされる転送データレートを
図9に示す。
【0046】 USBインタフェースには限界がある。サポートされる4つのデータ転送スキ
ームにおいて、大量のビデオデータを扱うには等時性転送が最良である。他の3
スキーム、即ち、バルク転送、割込み転送、及び、制御転送は必要な帯域幅を維
持することが困難である。USB等時性転送の場合には、各デバイスに関する最
大帯域幅は毎秒1メガバイトである。圧縮スキームなしでビデオカメラがサポー
トできるフォーマットはQCIFとQSIFだけである。
【0047】 既に、JPEG、11.261、H.263、MPEG1/2、及び、DVな
ど少数の従来型ビデオ圧縮アルゴリズムが存在する。JPEGアルゴリズムは最
も簡単であるが、一定ビットレートデータをサポートする能力を欠く。他の4つ
のアルゴリズムは一定ビットレートデータをサポートできるが、符号化処理に関
して非常に複雑な数学的な計算を必要とする。多くのハードウェアによる解決方
法は、ビデオイメージをリアルタイムで圧縮および圧縮解除するために必要な性
能を備えるが、システム全体のコストが非常に高い。ユニット価格が高いことは
、複雑なJPEGアルゴリズムを処理するために大きいシリコンエリアを必要と
すること、および、VRAMまたはDRAMフレームバッファメモリチップが余
分に必要とされることに起因する。
【0048】 本発明(JPEG−Lite)は、ハードウェアに要求される必要条件が最小
であって、入来ビデオデータストリームを4:1から6:1の比率で能率的に圧
縮可能であり、更に、要求される計算必要条件が最小であるPCにおいて、ビッ
トストリームの圧縮解除が可能であるDCTを基調とする圧縮スキームである。
動的ビットレート制御能力は、視覚的劣化なしに、伝送チャネル(例えばUSB
)を流れるビットレートの調節を可能にする。
【0049】 PCイメージ捕捉デバイス(例えばカメラ)はUSBインタフェースを介して
PCと通信する。通信チャネルは、当該チャネルを通過するデータのうちの或る
個数のデータのみを収容できるチャネルとして特徴付けられる。チャネルが処理
できない程データ量が多い場合には、オーバフロー状態と呼ばれ、最悪の場合に
は幾らかのデータが失われることがあり得る。
【0050】 ビデオイメージを圧縮するために従来型JPEGアルゴリズムを用いると、図
10Aに示すように、圧縮されたデータがランダムレートで入来する問題が起き
ることがあり得る。符号化されるべきイメージの部分が更に複雑化して、多量の
データとビットストリームの量が多くなることがある。蓄積されると、USBイ
ンターフェイスが処理できる量よりもデータが多くなると、オーバフロー問題が
起きるはずである。
【0051】 ビットレートコントローラ(BRC)は、レギュレータとして作用し、符号化
アルゴリズムを修正することによってデータレートを円滑化する。データレート
を低下させるために、いくらかの情報が廃棄される。ビットレートコントローラ
が適用されると、図10Aのグラフは図10Bのように変更される。ビットレー
トコントローラはデータレートが固定した数値になるように強制することなく、
所要数値の直ぐ下の妥当な範囲内に調節する。
【0052】 USBは固定した事前規定済みデータ転送速度(等時性転送用)を提供するの
で、一定のビデオレートを提供するためには、データ転送を監視する動的ビット
レートコントローラが重要である。動的ビットレートコントローラ(BRC)は
、最大許容非ゼロAC係数を調節することによってレートを制御する。
【0053】 保持される非ゼロAC係数の最大数はインデックス(ridx)と呼ばれ、2
組のYブロックとU,Vブロックにそれぞれマッピングされる。ridxと保持
AC係数の間の関係を表4に示す。インデックス数が大きければ大きい程、より
多くのAC係数が保持され、品質が更に高くなることを意味する。 表4:最大非ゼロAC係数とridxの関係 #1:Yブロック用最大非ゼロAC係数、#2 U,Vブロック用最大非
ゼロAC係数 上記の表が準拠する法則を次に示す。 (1)Y成分は輝度情報を表すので、Y成分の方がU,V成分よりも重要である
。理由は、Y係数の数値はインデックスと共に線形増加することによる。 (2)低い圧縮インデックスにおいて保持する必要のある係数の個数は更に少な
くなるので、U,V成分の果たす役割の重要性は小さい。この時点における圧縮
比は更に高く、品質は更に低い。
【0054】 BRCに関しては、3つの調節可能なパラメータがある。即ち、初期インデッ
クスridx_ini、最大インデックスridx_max、および、最小イン
デックスridx_minである。各フレームの開始に際して、インデックスは
ridx_iniに設定される。圧縮と符号化が進行するにつれて、符号化され
るビットストリームの長さに応じてridxは上下に変動するが、最小および最
大値によって制限される。ridxが大きければ大きい程、符号化処理状態に保
持されるAC係数の個数は多くなり、結果的に更に良質のイメージが得られる。
図10Cは、最大値と最小値によって制限される圧縮インデックス(ridx)
の変化を示す。
【0055】 非ゼロAC係数の最大数は、全てのブロック行の終端部において変化する。各
ブロック行は、図10Dに示すように、各ビデオフレームにおいて4x4DC変
換が左から右まで実施される(4x幅)画素領域として画定される。各ブロック
行の終端部において、次に示す2つの判定基準に基づいてBRCは調整を実施す
る。即ち、局所データストリームインクリメント(増分)及び大局データストリ
ーム累積である。
【0056】 些細な変化の常時発生を回避するために、些細なオーバラン又はアンダランを
緩衝するプログラム可能なしきい値としてLth値が用いられる。ブロック行BL
[i]の終端部において、BRCは、大局データストリーム累算値(Lall)と
所要の累算値(Lacc)を比較する。判定は次の4つの場合に分類される。 (1)全データカウントが所要カウントより少ない。 (2)データカウントが、所要カウントにしきい値(Lth)の2倍を加算したカ
ウントより多い。 (3)データカウントが、所要カウントにしきい値(Lth)を加算したカウント
より多いが(2)の場合には該当しない。 (4)1、2、3いずれの場合にも該当しない。
【0057】 前述の作動状態を記述するための大局レベルにおける判定ステップを疑似Cプ
ログラムを次に示す。 (Lall−Lacc)>(2*Lth)ならば、場合(2)である。 (Lall−Lacc)>Lthならば、場合(3)である。 (Lacc−Lall)<Lthならば、場合(1)である。 以上に該当しないならば、場合(4)である。
【0058】 符号化からのデータストリームは比較的高い圧縮レートで入来するので、(1
)の場合には、圧縮インデックス(ridx)は一般的に増大可能である。(2
)と(3)の場合には、エンコーダが生成するデータは多過ぎるので、インデッ
クスは減少されなければならない。ただし、第1の場合であっても圧縮インデッ
クス(ridx)を減少されなければならないことも稀に発生する。これは、任
意の時点においてUSB等時性転送帯域幅が限定されていることに起因する。判
定基準1に該当する状況は、入来データレートが特定の或る範囲内であることを
必ずしも保証するとは限らない。任意の期間中(USBにおける行)に転送でき
るデータ量は制限される。
【0059】 各ブロック行において生成される新規データ量を知るために、BRCは、所要
インクリメント(Lopt)と共にローカルデータストリームインクリメント値(
inc)を比較する。次の4つの場合に関して、再び判定が行われる。 (1)データインクリメントが所要インクリメント未満である。 (2)データインクリメントが、所要インクリメントにしきい値(Lth)の2倍
を加算した値より大きい。 (3)データインクリメントが、所要インクリメントにしきい値(Lth)を加算
した値より大きいが、(2)の場合には該当しない。 (4)場合1,2,3のいずれにも該当しない。
【0060】 前述の作動状態を記述するための局所レベルにおける判定ステップを疑似Cプ
ログラムを次に示す。 (Linc−Lopt)>(2*Lth)ならば、場合(2)である。 (Linc−Lopt)>Lthならば、場合(3)である。 (Lopt−Linc)<Lthならば、場合(1)である。 以上に該当しないならば、場合(4)である。
【0061】 BRCモジュールは前述の大局および局所比較に基づいて、圧縮インデックス
(ridx)の実際の変化を判定する。ridxの実際の変化は、表5をチェッ
クすることによって決定される。発生する変化は、データレートを減少させるに
十分なだけ大きく、突然の品質喪失を回避するのに十分なだけ小さいように特殊
設計されることに注意されたい。 表5:ridxの変化に関する条件
【0062】 各ビデオフレームの終端部において、圧縮インデックスは、記憶されている値
でなく、初期値にリセットされる。この理由は、ビデオイメージの底部が複雑で
ない場合には圧縮インデックスが大きい値に増大することに因る。最終ridx
が記憶されていて、その次のビデオフレームへ適用されるならば、ビデオイメー
ジの最上部分が幾分複雑になる可能性がある。この時点において、生成される圧
縮済みデータが多すぎるために、この状況にBRCが極めて急速に対処できず、
ハードウェアが故障することもあり得る。従って、圧縮インデックスを初期値に
戻すことは最良の技法である。
【0063】 K.エラーの検出およびリカバリ 本発明の一実施形態において、簡単かつ低オーバヘッドのエラーリカバリ(回
復)方法が用いられる。本発明の一態様において、エラー検出およびリカバリは
USBインタフェース用に設計される。既に述べたように、等時性転送は大量の
ビデオデータを処理することができる。USB等時性転送の場合には、各デバイ
ス用最大帯域幅は毎秒1メガバイトである。
【0064】 直列バス伝送に際して、あらゆるビットにおいてもエラーが発生し得る。可能
な位置を次に示す。 (1)エラービットがヘッダで起こる。ヘッダのサイズ寸は固定されているので
、エラービットは、ビデオデータでなく、ビデオパラメータの復号にのみ影響す
る。(2)エラービットがQ値ビットで起こる。AC係数のスケールは、当該ブ
ロック内において正しく非量子化されない。ただし、損傷は特定の当該ブロック
のみに限定される。 (3)エラービットがDC_TYPEビットで起こる。復号順序が完全に誤りで
あり、エラーは終端部まで伝播することもあり得る。 (4)エラービットがDC値で起こる。これは、現行ブロック及び微分モードに
おいて指定された後続ブロックのDC値に影響する。従って、これらのブロック
が影響されることになる。ただし、デコーダがインクリメント値としてでなく直
接符号化されたDC値を見付けさえすれば、結果は正しくなる。 (5)エラービットが(run,amp)符号の符号のビットで起こる。これは
、AC値ならびに復元されたブロックの符号を変更する。ただし、損傷は当該ブ
ロックのみに限定される。 (6)エラービットが(run,amp)符号で起こる。時折、ソフトウェアデ
コーダは、長さが同じであれば異なる(run、amp)対を、ビットストリー
ムを更に腐敗させることなく、復号することがあり得る。そうでなければ、エラ
ーは有意であり、場合によっては、当該符号の終端部まで継続することがあり得
る。 この分析から、3及び6の場合には、ソフトウェアデコーダがその次のフレー
ムで作動し続けるようなエラー回復スキームを必要とすることが明瞭である。エ
ラーに関する他の場合には、ソフトウェアオーバヘッドが大きいので、エラー訂
正ステップは一切実施されない。 本発明によって用いられる革新的技法は、全ての値が送られる「直接符号化モ
ード」においては、各ブロック行における先行DC値は、各ブロック行の最初に
おいてゼロではないという事実に準拠する。当該ブロック行の第1DCがゼロで
あれば、このDC値は、DC_TYPEビット=1と共に微分モードにおいて送
られる。第1DCが非ゼロであれば、このDC値は、少なくとも1つの非ゼロビ
ットを含む直接モードにおいて送られる。従って、ビデオストリームの最初の2
つのバイト内に「1」が含まれる。これは、各ブロック行の初めにおいて連続し
た2つのゼロバイトを受け取った場合に、ソフトウェアデコーダがエラーを検出
可能であることを意味する。
【0065】 従って、ビットストリームの終端部に特定個数のゼロバイトを添付すれば、当
該システムによるデータ腐敗の回復に役立つ。この場合の正確なバイト個数はイ
メージサイズに依存する。ただし、ハードウェアコスト(ゼロ生成のため)およ
び記憶コスト(PCのメインメモリ)の観点から、最小個数のゼロを添付される
ことが望ましい。
【0066】 例えば、352x288のCIFイメージサイズであるものとすれば、各ブロ
ック行内には、22(3521414)Uブロック及び22Vブロックと共に8
8(352/4)Yブロックが含まれる。各ブロック行には合計132個のブロ
ックが含まれる。最悪の場合において、DCが直接モードで符号化され、即座に
終了したと仮定すれば、最も短い符号は、1つのゼロDC値と1つのEOB(A
C係数の残りが全てゼロであることを意味する)である。そして、各ブロックは
、13ビット(おおよそ116ビットの語(ワード)に等しい)を使う。従って
、添付すべきゼロワードの最小個数は352*(1/4*3/2)=352*(3
/8)=132ワードである。ゼロを添付するためのタスクは、EOF(ビデオ
フレームのエンド)信号を送る以前にハードウェアエンコーダにおいて行われる
【0067】 各ブロック行の初めにチェックすることだけが必要なので、ソフトウェア復号
におけるオーバヘッドは非常に低い。ゼロを添付すると、圧縮済みデータビット
ストリームをわずか1%(268/25000)だけ増大させるでけである。結
論として、これは非常に効果的なエラーリカバリ(回復)スキームである。
【0068】 全ての前記討論はUSB転送エラーに関する。ただし、他のタイプのエラーは
、USB FIFOが満杯になって、溢れる場合に発生する。CCDから入来す
る入力画素データは休止不可能であるので、多数のFIFOがバッファとして挿
入されない限り、画素処理中のパイプラインを停止する方法はない。FIFOが
エラーで一杯になった場合には、USB FIFOモジュールはVPACKモジ
ュールを承認し、送られたデータを無視する。VPACKモジュールは中断する
ことなく継続するが、エラー状態を記憶していなければならない。1つのフレー
ムの送信が終了すると、VPACKはUSB制御レジスタを介して、当該エラー
に関してホストに通知しなければならない。腐敗したビデオデータは放棄され、
ソフトウェアデコーダは次のビデオフレームのデータを待つ。ゼロパディング演
算を実施するための期間は、終了時に起こるFIFOオーバフローエラーを回避
可能な待機状態を挿入することによって拡大可能である。更に、USBに関して
説明したが、本発明を使用すれば、任意の通信メディアが使用可能である。
【0069】 L.ソフトウェアデコーダ JPEG−Liteアルゴリズムは、ハードウェアによる符号化を簡素化する
ばかりでなく、ソフトウェア復号を効率的にするように設計される。PCは、ソ
フトウェアによる復号を実施し、ビデオシーケンスをスクリーン上にディスプレ
イしなければならないので、高性能ソフトウェアデコーダが望ましい。
【0070】 ソフトウェアシミュレーションに従い、達成可能なソフトウェア復号フレーム
レートを要約して表6に示す。JPEG−Liteアルゴリズムが適切なソフト
ウェアによる復号能力を提供し得ることは明瞭である。CPUの余分な予備力は
、ビデオメール処理、ビデオ会議、および、類似の用途などの他のアプリケーシ
ョン用に使用できる。 表6:ソフトウェア復号性能の比較
【0071】 M.結論 本発明の利点には、高速かつ高効率のイメージ圧縮技法が含まれる。その上、
本発明は、動くイメージに適用可能な高速かつ高効率のイメージ圧縮技法を提供
する。
【0072】 典型的実施形態および最良モードが開示したが、請求項によって定義される本
発明の請求範囲内に維持されたままで、開示された実施形態を修正および改変す
ることが可能である。
【図面の簡単な説明】
【図1】 本発明の一実施形態に従ったビデオ圧縮アーキテクチャを示す図
である。
【図2Aから図2F】 本発明の一実施形態に従った画素データを示す図で
ある。
【図3Aから図2H】 本発明に用いられる4x4デジタルコサイン変換を
示す図である。
【図4】 本発明に用いられるジグザグパターンを示す図である。
【図5】 本発明に用いられる量子化帯域を示す図である。
【図6】 本発明に用いられるランレングス符号表を示す図である。
【図7】 本発明用の符号化スペースを示す図である。
【図8】 YUV411入力ストリームに関するパッキングスキームを示す
図である。
【図9】 サポートされるビデオデータフォーマットのリストを示す図であ
る。
【図10A】 固定レートチャネルを介してオーバフローするデータを示す
図である。
【図10B】 本発明に従ったビットレートコントローラによって調節され
たデータレートを示す図である。
【図10C】 最大値と最小値によって限定された圧縮指標(ridx)の
変化を示す図である。
【図10D】 1つのブロック行を示す図である。
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成12年3月31日(2000.3.31)
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】図1
【補正方法】変更
【補正内容】
【図1】
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図2A
【補正方法】変更
【補正内容】
【図2A】
【手続補正3】
【補正対象書類名】図面
【補正対象項目名】図2B
【補正方法】変更
【補正内容】
【図2B】
【手続補正4】
【補正対象書類名】図面
【補正対象項目名】図2D
【補正方法】変更
【補正内容】
【図2D】
【手続補正5】
【補正対象書類名】図面
【補正対象項目名】図2F
【補正方法】変更
【補正内容】
【図2F】
【手続補正6】
【補正対象書類名】図面
【補正対象項目名】図3A
【補正方法】変更
【補正内容】
【図3A】
【手続補正7】
【補正対象書類名】図面
【補正対象項目名】図3B
【補正方法】変更
【補正内容】
【図3B】
【手続補正8】
【補正対象書類名】図面
【補正対象項目名】図3D
【補正方法】変更
【補正内容】
【図3D】
【手続補正9】
【補正対象書類名】図面
【補正対象項目名】図3E
【補正方法】変更
【補正内容】
【図3E】
【手続補正10】
【補正対象書類名】図面
【補正対象項目名】図3F
【補正方法】変更
【補正内容】
【図3F】
【手続補正11】
【補正対象書類名】図面
【補正対象項目名】図3G
【補正方法】変更
【補正内容】
【図3G】
【手続補正12】
【補正対象書類名】図面
【補正対象項目名】図3H
【補正方法】変更
【補正内容】
【図3H】
【手続補正13】
【補正対象書類名】図面
【補正対象項目名】図6
【補正方法】変更
【補正内容】
【図6】
【手続補正14】
【補正対象書類名】図面
【補正対象項目名】図7
【補正方法】変更
【補正内容】
【図7】
【手続補正15】
【補正対象書類名】図面
【補正対象項目名】図8
【補正方法】変更
【補正内容】
【図8】
【手続補正16】
【補正対象書類名】図面
【補正対象項目名】図9
【補正方法】変更
【補正内容】
【図9】
【手続補正17】
【補正対象書類名】図面
【補正対象項目名】図10A
【補正方法】変更
【補正内容】
【図10A】
【手続補正18】
【補正対象書類名】図面
【補正対象項目名】図10B
【補正方法】変更
【補正内容】
【図10B】
【手続補正19】
【補正対象書類名】図面
【補正対象項目名】図10C
【補正方法】変更
【補正内容】
【図10C】
【手続補正20】
【補正対象書類名】図面
【補正対象項目名】図10D
【補正方法】変更
【補正内容】
【図10D】
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 60/098,772 (32)優先日 平成10年9月1日(1998.9.1) (33)優先権主張国 米国(US) (31)優先権主張番号 60/098,844 (32)優先日 平成10年9月2日(1998.9.2) (33)優先権主張国 米国(US) (31)優先権主張番号 09/386,251 (32)優先日 平成11年8月31日(1999.8.31) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),CN,JP (72)発明者 チェン シア フン アメリカ合衆国 カリフォルニア州 94086 サニーヴェイル アーカディア テラス 614 (72)発明者 チュー ダー レン アメリカ合衆国 カリフォルニア州 95129 サン ホセ エンプレス コート 6237 (72)発明者 カオ ウェイ チュン ソフィア アメリカ合衆国 カリフォルニア州 95014 クーパーティノ ジョン ドライ ヴ 20064 (72)発明者 ワン カン ファイ アメリカ合衆国 カリフォルニア州 95070 サラトーガ デ ハヴィランド 19166 (72)発明者 ワン レン ユー アメリカ合衆国 カリフォルニア州 95014 クーパーティノ ジャネット コ ート 7852 Fターム(参考) 5C059 LA06 MA23 MC16 MC24 MC32 MC34 MD07 ME02 ME05 PP01 PP04 PP16 RF01 RF09 RF21 SS07 UA02 UA34 5C078 AA09 BA22 BA57 CA31 DB18 【要約の続き】 発明は特定のハードウェアに関して記述されるが、本発 明は、ここで記述されるような機能を用いるソフトウェ アにも実装可能である。本発明の利点には、高速かつ高 効率のイメージ圧縮技法が含まれる。更に、本発明は、 動くイメージにも適用可能な高速かつ高効率のイメージ 圧縮技法を提供する。

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 入力端子へ供給されたイメージデータを圧縮し、圧縮された
    データを出力端子へ供給するイメージ圧縮装置であって、 前記入力端子へ結合され、前記イメージデータを重み付けされた周波数データ
    へ変換するように構成された重み付けされた4x4デジタルコサイン変換器(D
    CT)と、 前記DCTへ結合され、前記周波数データをジグザグ処理し、かつ作成済みジ
    グザグデータを生成するように構成されたジグザグ回路と、 前記DCTへ結合され、前記周波数データを推定し、かつQ値を生成するよう
    構成されたQ値エスティメイタと、 前記ジグザグ回路へ結合され、前記ジグザグデータを符号化し、かつDCコー
    ドを生成するように構成されたDCコード化回路と、 前記ジグザグ回路および前記Q値エスティメイタへ結合され、前記Qに基づい
    て前記ジグザグデータを量子化し、かつ量子化済みデータを生成するように構成
    された量子化回路と、 前記DCコード化回路および前記量子化回路へ結合され、前記出力端への前記
    圧縮済みデータとして可変長さデータを作成するために前記量子化済みデータを
    符号化するよう構成された符号化回路と を有する装置。
  2. 【請求項2】 重み付けされた前記4x4DCTが処理用2次元DCTに分
    割される請求項1に記載のイメージ圧縮装置。
  3. 【請求項3】 前記2次元DCTが更に1つの処理用1次元DCTに分割さ
    れる請求項2に記載のイメージ圧縮装置。
  4. 【請求項4】 前記DCTが高度の圧縮を得るために使用される特殊係数表
    を有する請求項1に記載のイメージ圧縮装置。
  5. 【請求項5】 前記DCTが4個の量子化係数のみの特殊係数表を有する請
    求項1記載のイメージ圧縮装置。
  6. 【請求項6】 前記DC符号化回路が前記データビットを更に減少させるた
    めに動的DCプレディクタを使用する請求項1に記載のイメージ圧縮装置。
  7. 【請求項7】 前記量子化回路が相当量の前記元イメージ再現性を保持した
    状態で高度の圧縮を達成するように選定された量子化表を有する請求項1に記載
    のイメージ圧縮装置。
  8. 【請求項8】 前記量子化回路が高周波係数と低周波係数を区別するための
    2つの量子化帯域を備えた量子化表を有する請求項1に記載のイメージ圧縮装置
  9. 【請求項9】 前記符号化回路が少なくとも1つのランレングス符号化(R
    LC)および可変レグス符号化(VLC)を実施する請求項1に記載のイメージ
    圧縮装置。
  10. 【請求項10】 前記符号化回路に結合され、前記出力端子へ引渡される前
    記帯域幅が限定されている場合に前記圧縮済みデータ内のビット数を減少させる
    ように構成された動的ビットレートコントローラを有する請求項1に記載のイメ
    ージ圧縮装置。
  11. 【請求項11】 前記符号化回路が保持されるべきAC係数の個数を決定す
    る圧縮指標を用いる請求項1に記載のイメージ圧縮装置。
  12. 【請求項12】 前記符号化回路が前記圧縮指標の変更を決定するためにロ
    ーカルデータインクレメント及びグローバルデータ累算結果を用いる請求項10
    に記載のイメージ圧縮装置。
  13. 【請求項13】 前記符号化回路がハードウェアオーバヘッドを減少させる
    ブロック行の終端部においてのみ前記圧縮指標を更新する請求項10に記載のイ
    メージ圧縮装置。
  14. 【請求項14】 前記出力端子に結合され、前記圧縮済みデータを受け取り
    、かつ前記圧縮済みデータ内エラーを検出するように構成された受信デバイスを
    有し、 ここに前記受信デバイスが不良データを含む前記イメージの有効部分を復元す
    るように構成される請求項1に記載のイメージ圧縮装置。
  15. 【請求項15】 前記圧縮装置が有効圧縮データが所在する状態においては
    発生しない独特のエラー条件符号を使用する請求項13に記載のイメージ圧縮装
    置。
  16. 【請求項16】 前記圧縮装置が有効圧縮データが所在する状態においては
    発生しないEOBとして、独特のエラー条件符号00を使用する請求項13に記
    載のイメージ圧縮装置。
  17. 【請求項17】 前記DCTがソフトウェアに実装され、 前記ジグザグ回路がソフトウェアに実装され、 前記Q値エスティメイタがソフトウェアに実装され、 前記DC符号化回路がソフトウェアに実装され、 前記量子化回路がソフトウェアに実装され、 前記符号化回路がソフトウェアに実装される 請求項1に記載のイメージ圧縮装置。
JP2000568051A 1998-09-01 1999-09-01 イメージ圧縮方法および装置 Pending JP2002524007A (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US9877298P 1998-09-01 1998-09-01
US9875298P 1998-09-01 1998-09-01
US9872898P 1998-09-01 1998-09-01
US9884498P 1998-09-02 1998-09-02
US60/098,844 1999-08-31
US09/386,251 1999-08-31
US09/386,251 US6353685B1 (en) 1998-09-01 1999-08-31 Method and apparatus for image compression
US60/098,728 1999-08-31
US60/098,752 1999-08-31
US60/098,772 1999-08-31
PCT/US1999/020041 WO2000013135A2 (en) 1998-09-01 1999-09-01 Method and apparatus for image compression

Publications (2)

Publication Number Publication Date
JP2002524007A true JP2002524007A (ja) 2002-07-30
JP2002524007A5 JP2002524007A5 (ja) 2006-10-19

Family

ID=27536896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000568051A Pending JP2002524007A (ja) 1998-09-01 1999-09-01 イメージ圧縮方法および装置

Country Status (5)

Country Link
US (1) US6353685B1 (ja)
EP (1) EP1116168A2 (ja)
JP (1) JP2002524007A (ja)
CN (1) CN100338620C (ja)
WO (1) WO2000013135A2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6499072B1 (en) * 1999-09-02 2002-12-24 Ati International Srl Data bus bandwidth allocation apparatus and method
US6934420B1 (en) * 1999-12-22 2005-08-23 Trident Systems Incorporated Wave image compression
JP2002094992A (ja) * 2000-09-19 2002-03-29 Sony Corp 符号化データ長検出装置とその方法および画像符号化装置
US7596277B2 (en) * 2002-04-09 2009-09-29 Senthil Govindaswamy Apparatus and method for detecting error in a digital image
KR101127221B1 (ko) * 2005-07-15 2012-03-29 삼성전자주식회사 주파수 공간에서 컬러 성분간 예측을 이용한 컬러영상부호화/복호화 방법 및 장치
KR20080008137A (ko) 2006-07-19 2008-01-23 삼성전자주식회사 영상 복원 장치 및 방법
JP4274234B2 (ja) * 2006-12-04 2009-06-03 ソニー株式会社 圧縮データ量制御方法及び画像データ圧縮装置
US8077063B2 (en) 2010-01-18 2011-12-13 Freescale Semiconductor, Inc. Method and system for determining bit stream zone statistics
CN103139567B (zh) * 2013-01-28 2015-11-18 东软集团股份有限公司 一种图像压缩和解压缩的方法和装置
CN104216696B (zh) * 2013-06-05 2017-08-25 北京齐尔布莱特科技有限公司 一种缩略图构件方法
CN109643456A (zh) 2016-06-17 2019-04-16 因默希弗机器人私人有限公司 图像压缩方法与设备
AU2018217434C1 (en) 2017-02-08 2023-04-27 Immersive Robotics Pty Ltd Displaying content to users in a multiplayer venue
AU2018373495B2 (en) 2017-11-21 2023-01-05 Immersive Robotics Pty Ltd Frequency component selection for image compression
EP3714602A4 (en) 2017-11-21 2021-07-28 Immersive Robotics Pty Ltd IMAGE COMPRESSION FOR DIGITAL REALITY

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1007701B (zh) * 1985-09-21 1990-04-25 利奥诺拉·乔斯特 经皮肤的和经粘膜的旋涡泡沫体装置
US5379351A (en) 1992-02-19 1995-01-03 Integrated Information Technology, Inc. Video compression/decompression processing and processors
AU3274593A (en) 1991-12-13 1993-07-19 Avid Technology, Inc. Quantization table adjustment
US5355450A (en) 1992-04-10 1994-10-11 Avid Technology, Inc. Media composer with adjustable source material compression
US5809200A (en) 1995-08-07 1998-09-15 Victor Company Of Japan, Ltd. Video signal recording apparatus
JP3129392B2 (ja) * 1996-02-02 2001-01-29 日本電気株式会社 2次元idct回路
US5870144A (en) * 1997-03-28 1999-02-09 Adaptec, Inc. Reduced-quality resolution digital video encoder/decoder
US6134270A (en) * 1997-06-13 2000-10-17 Sun Microsystems, Inc. Scaled forward and inverse discrete cosine transform and video compression/decompression systems employing the same

Also Published As

Publication number Publication date
EP1116168A2 (en) 2001-07-18
WO2000013135A2 (en) 2000-03-09
WO2000013135A8 (en) 2000-06-02
WO2000013135A3 (en) 2000-07-27
CN100338620C (zh) 2007-09-19
CN1406360A (zh) 2003-03-26
US6353685B1 (en) 2002-03-05

Similar Documents

Publication Publication Date Title
US6219457B1 (en) Method and system for decoding data encoded in a variable length code word
US7072404B2 (en) Decoding apparatus, control method therefor, and storage medium
JP2891772B2 (ja) イメージフレームのランダムスキャンニングを用いるディジタルイメージコーディング法
US5253078A (en) System for compression and decompression of video data using discrete cosine transform and coding techniques
AU654929B2 (en) Variable length code word decoder for use in digital communication systems
US6184936B1 (en) Multi-function USB capture chip using bufferless data compression
US6008745A (en) Variable length decoding using lookup tables
US8098947B2 (en) Method and apparatus for processing image data by rearranging wavelet transform data
JP2005510981A (ja) 複数チャネル・ビデオトランスコーディング・システムおよび方法
JP5156655B2 (ja) 画像処理装置
JP2002524007A (ja) イメージ圧縮方法および装置
KR0157570B1 (ko) 복수경로를 통해 mpeg2 비트열을 복호하는 복호화장치
JP3940672B2 (ja) 画像処理装置及び画像処理方法
JP2010098352A (ja) 画像情報符号化装置
JPH07222164A (ja) ディジタルビデオ・ビットストリームコーダ
JPH05115010A (ja) 画像復号化装置
JP3202433B2 (ja) 量子化装置、逆量子化装置及び画像処理装置並びに量子化方法、逆量子化方法及び画像処理方法
JP3880088B2 (ja) 符号化装置及び復号化装置
JP2002112268A (ja) 圧縮画像データ復号装置
KR100249235B1 (ko) 에이치디티브이 비디오 디코더
JP2010135885A (ja) 画像符号化装置および画像符号化方法
US20210344900A1 (en) Image processing device
CN111541895B (zh) 用于残差电平数据的位置相关熵编码的嵌入式编解码器(ebc)电路系统
JP2004501531A (ja) ビデオ・データをランレングス符号化するための方法と装置
US6970603B2 (en) Data encoding apparatus and method of same and camera system

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060825

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100121

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100708