JP4800571B2 - 損失の無い方法でディジタル画像を符号化するための装置および方法 - Google Patents

損失の無い方法でディジタル画像を符号化するための装置および方法 Download PDF

Info

Publication number
JP4800571B2
JP4800571B2 JP2003511463A JP2003511463A JP4800571B2 JP 4800571 B2 JP4800571 B2 JP 4800571B2 JP 2003511463 A JP2003511463 A JP 2003511463A JP 2003511463 A JP2003511463 A JP 2003511463A JP 4800571 B2 JP4800571 B2 JP 4800571B2
Authority
JP
Japan
Prior art keywords
original image
data file
frame
residual
compressed data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003511463A
Other languages
English (en)
Other versions
JP2005520360A (ja
JP2005520360A5 (ja
Inventor
ラビーンドラン、ビジャヤラクシュミ・アール
スヤガラジャン、カダヤム
ラッツェル、ジョン
モーレイ、スティーブン・エー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2005520360A publication Critical patent/JP2005520360A/ja
Publication of JP2005520360A5 publication Critical patent/JP2005520360A5/ja
Application granted granted Critical
Publication of JP4800571B2 publication Critical patent/JP4800571B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Description

【技術分野】
【0001】
本発明は、画像処理および圧縮に関する。特に、本発明は周波数領域のビデオ画像および音声情報の損失の無い符号化に関する。
【背景技術】
【0002】
ディジタル画像処理は、ディジタル信号処理の一般的な専門分野において、重要な位置を有する。人間の視覚認知の重要性は、ディジタル画像処理の技術および科学において、著しい関心および進展を促進させた。フィルムまたは映画を投影するために使用されるビデオ信号のようなビデオ信号の送受信の分野において、種々の改良が画像圧縮技術になされつつある。現在のおよび提案されたビデオシステムの多くは、ディジタル符号化技術を利用する。この分野の観点は、画像符号化、画像復元および画像特徴選択を含む。画像符号化は、効率的な方法でディジタル通信の画像を送信するための試みを表し、同時に、必要とされる帯域幅をできるだけ最小にするように数ビットを使用し、ある制限内で歪みを維持する。画像復元は物体の真の画像を再生するための努力をあらわす。通信チャネル上に送信される符号化された画像は種々の要因により歪みを生じるかもしれない。質が低下する原因は、もともと物体から画像を創出する際に生じていたかもしれない。特徴選択は、画像のある属性の選択に言及する。そのような属性は、より広い文脈において、認識、分類および決定において必要かもしれない。
【0003】
ディジタル映画のようなビデオのディジタル符号化は、改良された画像圧縮技術から利益を得る領域である。ディジタル画像圧縮は、一般的に、2つのカテゴリに分類されるかもしれない。すなわち、損失の無い方法と損失のある方法である。損失の無い画像は、いかなる情報の損失も無しに再生される。損失のある方法は、以下を含む:圧縮比、圧縮アルゴリズムの質、およびアルゴリズムの実施に応じて多少の情報の回復できない損失。一般に、費用効率が高いディジタル映画手法のために要望される圧縮比を得るために損失のある圧縮手法が考慮される。ディジタル映画の品質レベルを得るために、圧縮手法は、視覚的に損失の無いレベルの性能を提供しなければならない。従って、圧縮処理の結果として情報の数学的な損失があるけれども、この損失によって生じた画像歪みは通常の画像観察下で視聴者に感知できないようでなければならない。
【0004】
既存のディジタル画像圧縮技術は、ほかの応用のために開発されてきた、すなわち、テレビシステムのために開発されてきた。そのような技術は、意図したアプリケーションに対して設計上の妥協を適当なものとしたが映画プレゼンテーションに必要な品質要件に適合しない。
【0005】
ディジタル映画圧縮技術は、映画ファンが以前経験した視覚の質を提供しなければならない。理想的には、ディジタル映画の視覚品質は、高品質の公開版フィルムの品質を超えようと試みなければならない。同時に、この圧縮技術は高符号化効率を実用的にさせなければならない。本願明細書において定義されるように、コーディング効率はある質的レベルを満たすために圧縮された画像品質に必要なビットレートに言及する。さらに、システムおよび符号化技術は、異なるフォーマットに対応するように内蔵の柔軟性を有さなければならず、費用効率が高くなければならない。すなわち、小さなサイズで効率的なデコーダまたはエンコーダ処理でなければならない。
【0006】
入手可能な多くの圧縮技術は、有意水準の圧縮を提供するが、結果として,ビデオ信号の品質の劣化を生じる。典型的に、圧縮された情報を転送するための技術は、圧縮された情報が一定のビットレートで転送されることを必要とする。
【0007】
ビデオ信号に対して所望のレベルの品質を維持しながら、有意水準の圧縮を提供することができる1つの圧縮技術は、符号化された離散コサイン変換(DCT)係数データの順応して大きさに合わせて作られたブロックおよびサブブロックを利用する。この技術は、以下において、順応ブロックサイズ離散コサイン変換(ABSDCT)方法と呼ばれるであろう。この技術は、この発明の譲受人に譲渡され、参照することにより、本願明細書に組み込まれる米国特許番号第5,021、891号、(発明の名称:「順応ブロックサイズ画像圧縮方法およびシステム」)に開示される。DCT技術は、また、この発明の譲受人に譲渡され参照することにより本願明細書に組み込まれる米国特許番号第 5,107、345号(発明の名称:「順応ブロックサイズ圧縮方法およびシステム」)にも開示される。さらに、微分四部木と組み合わせたABSDCT技術も、この発明の譲受人に譲渡され、参照することにより、本願明細書に組み込まれる、米国特許番号第5,452,104号(発明の名称:「順応ブロックサイズ画像圧縮方法およびシステム」)に開示されている。これらの特許において開示されるシステムは、「フレーム内」符号化と呼ばれるものを利用し、画像データの各フレームはその他のフレームの内容に関係無く符号化される。 ABSDCT技術を用いて、なし遂げられるデータレートは、画質の識別可能な劣化のない約15億ビット/秒からおおよご5000万ビット/秒まで、低減してもよい。
【0008】
ABSDCT技術は、白黒かカラー画像を圧縮するかまたは画像を表す信号を圧縮するために使用してもよい。カラー入力信号は、YIQフォーマットであってもよく、Yは輝度または光度サンプルであり、IおよびQは、各4:4:4または代替フォーマットに対して、クロミナンスまたはカラーサンプルである。YUV,YCbCrまたはRGBフォーマットのような他の周知のフォーマットも、使用してもよい。色に対する目の低空間の感度のため、大部分の調査は、色成分の副サンプルが水平および垂直方向に4だけ合理的であることを示した。したがって、ビデオ信号は4つの輝度サンプルおよび2つのクロミナンス・サンプルによって表されることができる。
【0009】
ABSDCTを用いて、ビデオ信号は一般に処理のため、ピクセルのブロックに分割されるであろう。各々のブロックに対して、輝度およびクロミナンス成分は、ブロックサイズ割当てエレメントまたはブロックインターリーバーに渡される。例えば、16×16(ピクセル)ブロックは、ブロックインターリーバーに渡してもよい。ブロックインターリーバーは各16×16ブロック内で画像サンプルを順序付けるかまたは組織化して離散コサイン変換(DCT)解析のためにデータのブロックおよび合成副ブロックを生成する。DCTオペレータは、時間および空間のサンプル信号を同じ信号の周波数表示に変換する1つの方法である。周波数表示に変換することによって、DCT技術は、量子化器が画像の周波数分布特性を利用するように設計することができるように、非常の高レベルの圧縮を可能にすることを示してきた。好適実施形態において、1つの16×16DCTは第1の順序づけに適用され、4つの8×8DCTは第2の順序づけに適用され、16の4×4DCTは、第3の順序付けに適用され、および64の2×2DCTは第4の順序付けに適用される。
【0010】
DCT操作は、ビデオソースに固有の空間冗長度を低減する。DCTが実行された後、殆どのビデオ信号エネルギーは、2乃至3のDCT係数に集中する傾向がある。さらなる変換、微分四部木変換(DQT)は、DCT係数の中で冗長度を低減するために使用してもよい。
【0011】
16×16のブロックおよび各副ブロックに対して、DCT係数値および(DQTが使用されるなら)DQT値が解析され、ブロックまたは副ブロックを符号化するのに必要なビット数を決定する。次に、符号化するために最少数のビットを必要とする副ブロックの組合せが選択され、画像セグメントを表す。例えば、2つの8×8副ブロック、6つの 4×4副ブロックおよび8つの2×2副ブロックは、画像セグメントを表すために選択してもよい。
【0012】
次に、選択されたブロックまたは副ブロックの組合せは適切に順番に16×16のブロックに配列される。次に、DCT/DQT係数値は、送信の準備のために、周波数重みづけされ、量子化され、(可変長符号化)のような符号化をしてもよい。上記したABSDCT技術は、著しくよく実行するけれども、それはコンピュータを必要とするほど強力である。
【0013】
さらに、上述したABSDCTの使用は視覚的に損失が無いけれども、時には、データが符号化される正確な方法でデータを再生することが望ましい。例えば、マスタリングおよび永久保存の目的は、正確にもとの状態に再生することができるようにデータを圧縮する必要がある。
【0014】
典型的に損失の無い画像のための圧縮システムは、予測子から構成され、予測子は符号化される現在のピクセルの値を推定する。残りのピクセルは実際のピクセルと予測されるピクセルとの間の差分として得られる。次に、残りのピクセルはエントロピー符号化され記憶されまたは送信される。予測はピクセルの相関を除去するので、残りのピクセルは特徴のある両面のある指数(ラプラシアン)分布を有した低減されたダイナミックレンジを有する。それゆえに、圧縮を有する。残りの圧縮量は、予測および次のエントロピー符号化方法に依存する。大部分の共通して使う予測方法は、差分PCM(DPCM)および適応DPCM(ADPCM)のようなその変形である。
【発明の開示】
【発明が解決しようとする課題】
【0015】
ペルに基づく予測を伴う問題は、残差がまだ高エネルギーを有するということである。それは、少数の隣接したピクセルだけが予測方法において使われるという事実による。したがって、ペルに基づく予測スキームの符号化効率を改良する余地がある。
【課題を解決するための手段】
【0016】
本発明の実施例は、圧縮を達成するために、損失の無い方法でディジタル画像およびビデオデータを圧縮するためのシステムを記載する。システムは、ハイブリッドである。このことは、損失のある方法で前記データを圧縮する一部と損失の無い態様で残差データを圧縮する一部とを有することを意味する。損失のある部分に対して、システムは適応ブロックサイズ離散コサイン変換(ABSDCT)アルゴリズムを使用する。ABSDCTシステムは、高い表示品位および圧縮比を生じる前記データを圧縮する。残像は、オリジナルと、ABSDCTシステムから解凍されたものとの間の差分として得られる。この残差は、ゴロンブ−ライス(Golomb-Rice)符号化アルゴリズムを用いて損失無く符号化される。 視覚的に基づいた適応ブロックサイズおよびDCT係数の量子化により、残差は非常に低いエネルギーを有し、従って、全体に損失の無い圧縮比を生じる。
【0017】
ABSDCTシステムは、映画の品質において、高い圧縮比を得る。ABSDCTシステムはブロックに基づくので、ABSDCTシステムはいかなるペルに基づくスキームよりも非常によいピクセル相関を除去する。したがって、ABSDCTシステムは本願明細書において記載される損失の無いシステムにおける予測として使用される。この予測子と連動して、損失の無い符号化システムが加えられ、ハイブリッドの損失の無い圧縮システムを形成する。留意すべきは、システムは、動画像同様に静止画像を圧縮することができるという点である。静止画像なら、ABSDCT圧縮データおよびエントロピー符号化された残差データのみが圧縮された出力として使用される。運動順序のために、フレーム内圧縮を使用するかまたはフレーム間圧縮を使用するかの決定がなされる。例えば、f(t)が時刻tにおける画像フレームを表すなら、F(t)およびF(t+Δt)は、それぞれ時刻tおよびt+Δtにおける画像フレームのDCTを示す。Δtが2つの連続的なフレーム間の時間間隔と対応する点に注意する必要がある。
【0018】
この発明は、データが符号化された正確な方法でデータを再生することを可能にするデータを圧縮するための装置および方法に具現化される。実施形態は、フレーム内符号化、フレーム間符号化または、それら2つのハイブリッドを実行するシステムを含む。このシステムは、離散コサイン変換係数データの順応した大きさに合わせて作られたブロックおよび副ブロックを利用する品質に基づいたシステムである。1つのブロックのピクセルデータは、エンコーダに対する入力である。エンコーダは、ブロックサイズ割当て(BSA)構成要素を含み、ブロック割当て構成要素は処理のためにピクセルの入力ブロックを分割する。ブロックサイズ割当ては、入力ブロックおよびさらに再分割されたブロックの分散に基づく。一般に、ブロックおよび副ブロックの平均値が異なる所定の範囲に入るなら、より大きい分散を伴うエリアは、より小さなブロックに再分割され、より小さな分散を伴うエリアは再分割されない。従って、最初に、ブロックの分散閾値は、その平均値に応じて公称値から変更され、次に、ブロックの分散はこの閾値と比較され、そして、分散が閾値より大きい場合、そのブロックは再分割される。
【0019】
ブロックサイズ割当ては変換構成要素に供給され、変換構成要素はピクセルデータを周波数領域データに変換する。この変換は、ブロックサイズ割当てを介して選択されたブロックおよび副ブロックのみに実行される。AC構成要素の場合、量子化および連続化を介してその変換データにスケーリング処理をする。変換データの量子化は、コントラスト、係数カウント、レート歪み、ブロックサイズ割当ての密度及び/または過去スケールファクタに対して調節するスケールファクタのような、画像品質測定基準に基づいて量子化される。ジグザグスキャンのような連続化は同じ値の最も長い可能なランレングスを作ることに基づく。次に、データのストリームは送信に備えて、可変長符号化器により符号化される。コーディングはハフマン・コーディングであってもよい、または、ゴロンブ−ライス符号化のような指数分布に基づいてもよい。
【0020】
ABSDCTのようなハイブリッド圧縮システムの使用は、ピクセルまたはDCT値の良好な予測子のように動作する。それゆえ、ABSDCTは、ペルに基づく予測を使用しているシステムより高い損失の無い圧縮比を生じる。損失のある部分は、ディジタル映画品質結果を供給する。すなわち、視覚的に損失の無いファイルに圧縮結果を供給する。損失の無い部分の場合、ハフマンコードと異なり、ゴロンブ−ライス符号化はいかなる先験的符号発生を必要としない。それゆえ、ゴロンブ−ライス符号化は、ハフマン符号化の場合に記憶される拡張コードブックを必要としない。これは、チップの有効スペースの効率的な使用を生じる。それゆえに、チップ・サイズは、ハードウエア実施において低減される。さらに、ゴロンブーライス符号化は、ハフマン符号化より実施するのにより簡単である。また、DCT係数または残りのピクセルは必然的に指数分布を有するので、ゴロンブーライス符号化は、ハフマン符号化よりも高い符号化効率を 得る。さらに、圧縮システムの損失のある部分がブロック再分割において視覚的に重要な情報を使用するので、コンテクストモデリングは残差符号化において固有である。これは、残差符号化のためにコンテクストデータを集めるのに、余分な記憶レジスタが必要ないという点で、重要である。また、運動推定が使われないので、システムは実施するのに非常に簡単である。
【0021】
画像情報を表す信号を損失が無いように圧縮し符号化するための装置および方法が請求される。画像情報を表す信号は、圧縮され、画像の圧縮されたバージョンを作る。画像の圧縮されたバージョンは量子化され、それにより、画像の損失のあるバージョンを作る。画像の圧縮されたバージョンは、また、順番に並べられ、画像の順番に並べられた量子化された圧縮されたバージョンを作る。このバージョンは、次に、解凍され、オリジナル画像と解凍されたバージョンとの間の差分が決定され、それにより画像の残差バージョンを作る。画像の損失のあるバージョンおよび画像の残差バージョンは、別個にまたは結合されて別に出力してもよく、その場合、画像の解凍された損失のあるバージョンと、画像の残差バージョンとの組合せは実質的にオリジナル画像と同じである。
【0022】
画像情報を表す信号を損失無く圧縮し、符号化する方法が、請求される。損失のある圧縮されたデータファイルおよび残りの圧縮されたデータファイルが発生される。損失のある圧縮されたデータファイルおよび残りの圧縮されたデータファイルが結合されると、実質的にオリジナルデータファイルと同一であり損失の無いデータファイルが作られる。
【0023】
したがって、効率的に損失の無い圧縮を提供するための装置および方法を提供することが、実施形態の1つの観点である。
【0024】
マスタリングおよびアーカイブの目的の助けとなる方法で、損失無く、ディジタル画像情報およびオーディオ情報を圧縮することは実施形態の他の観点である。
【0025】
フレーム間に基づいて、損失の無い圧縮システムを提供することは実施形態の他の観点である。
【0026】
フレーム内に基づいて損失の無い圧縮システムを提供することは実施形態の他の観点である。
【発明を実施するための最良の形態】
【0027】
ディジタル信号のディジタル伝送を容易にして、対応する利益を享受するために、一般的にある形態の信号圧縮を採用することが必要である。結果として生じる画像の高い圧縮を実現する一方、画像の高品質が維持されることもまた、重要である。さらに、コンパクトなハードウエア実施のための計算効率が望まれる。この計算効率は多くのアプリケーションにおいて重要である。
【0028】
本発明の一実施形態を詳細に説明する前に、本発明は、そのアプリケーションにおいて、構成の詳細におよび以下の記載で述べるまたは、図で図解される部品の配列に限定されないことが理解されるべきである。本発明は他の実施形態を実施することができ、種々の方法で実行される。また、ここで使用される言葉遣いおよび専門用語は、記載の目的のためであり、制限と見なされるべきではない。
【0029】
一実施形態の一観点において採用される画像圧縮は、この発明の譲受人に譲渡され、参照することによりここに組み込まれる、1999年11月8日に出願されたシリアル番号第09/436、085の同時係属米国特許出願(発明の名称:「コントラスト感応分散に基づく適応ブロックサイズ画像圧縮」)に開示されるような離散コサイン変換(DCT)に基づく。DCTを利用した画像圧縮および解凍システムは、この発明の譲受人に譲渡され、参照することによりここに組み込まれる、2000年、1月28日に出願されたシリアル番号第09/494、192号の同時係属米国特許出願(発明の名称:「品質に基づく画像圧縮」)に記載されている。一般に、ディジタル領域において処理される画像は、N×Nのサイズの重畳しないブロックの配列に分割されたピクセルデータから成る。二次元のDCTを、各ブロック上で実行してもよい。二次元のDCTは、以下の関係によって定義される:
【数1】
Figure 0004800571
【0030】
但し、
【数2】
Figure 0004800571
【0031】
およびx(m,n)はN×Mブロック内のロケーション(m,n)におけるピクセルでありX(k,l)は対応するDCT係数である。
【0032】
ピクセル値が0以上であるので、DCT成分X(0、0)は常に正で、通常最も多くのエネルギーを有する。実際、代表的な画像の場合、大部分の変換エネルギーは、成分(0、0)周辺に集中する。このエネルギー圧縮特性は、DCT特性をかくも魅力的な圧縮方法にしているところのものである。
【0033】
画像圧縮技術は、コントラスト適応符号化を利用して、さらなるビットレートの低減を得る。大部分の自然の画像は、相対的にゆっくりと変化する平らな領域、および物体境界および高コントラストテクスチャのような人通りの多い場所から構成される。コントラスト適応符号化スキームは、より多くのビットを人通りの多い場所に割当てより少ないビットをより少ない人通りの多い場所に割当てることにより、この要因を利用する。
【0034】
コントラスト適応方法は、フレーム間符号化(時空間的処理)の代わりに、フレーム内符号化(空間処理)を利用する。フレーム間符号化は、本質的に、より多くの複雑の処理回路に加えて複数のフレームバッファを必要とする。多くのアプリケーションにおいて、複雑さを低減することは、実際の実施のために必要である。フレーム間符号化は、また時空間的符号化スキームの機能が衰えて、その動作が悪化した情況で有効である。例えば、毎秒24コマの映画は、機械的シャッターによる積分時間が相対的に短いので、このカテゴリに入れることができる。短い積分時間は、より高い度合いの時間的エリアシングを可能にする。高速に移動すると完結的になるので、フレームとフレームの相関関係の仮定がこわれる。フレーム内符号化はまた、50HZおよび60HZの電力線周波数が含まれる時に、標準化するのがより容易である。テレビ放送は、現在50Hzか60Hzで信号を送る。ディジタル手法である、フレーム内スキームの使用は50Hzおよび60Hzの両方に適合する。あるいは、空間分解能に対してフレーレートをトレードオフすることにより毎秒24コマの映画にさえも適用できる。
【0035】
画像処理の目的のために、重畳しないブロックの配列に分割されるピクセルデータにDCT動作が実行される。ブロックサイズはN×Nのサイズであるとして本願明細書において論じられるけれども、種々のブロックサイズを用いても良いことが想像される点に留意すべきである。例えば、N×Mのブロックサイズは、MがNより大きいまたは未満であって、NおよびMの両方が整数である場合に、利用してもよい。他の重要な観点は、ブロックが、N/ixN/i、N/ixN/j、N/ixM/j(但し、iおよびjは整数)等のような少なくとも1つのレベルの副ブロックに分割可能である。さらに、本願明細書において議論される例示ブロックサイズは、DCT係数の対応するブロックおよび副ブロックを有する16×16のピクセルブロックである。偶数または奇数の両方の整数値、例えば9×9のような種々他の整数を使用しても良いことがさらに想像される。
【0036】
図1および図2は構成可能なシリアライザーの概念を組み込んだ画像処理システム100を図解する。画像処理システム100は受信したビデオ信号を圧縮するエンコーダ104を含む。圧縮信号は、伝送路または物理的な媒体108を使用して送られ、デコーダ112によって受信される。デコーダ112は、受信した符号化されたデータを画像サンプルに復号し、次に、それを表示してもよい。
【0037】
一般に、画像は処理のためにピクセルのブロックに分割される。イメージは、加工度のための画素のブロックに分割される。カラー信号は、RGB−YC1C2変換器116を使用して、RGB空間からYC1C2空間に変換してもよい。この場合、Yは輝度成分、または光度成分であり、C1およびC2はクロミナンス成分または色成分である。色に対する眼の空間感度が低いので、多くのシステムは水平方向および垂直方向にC1成分およびC2成分を4だけサブサンプルする。しかしながら、サブサンプリングは必要でない。4:4:4フォーマットとして知られる、完全分解能はディジタル映画をカバーするものと言われているようないくつかのアプリケーションにおいて非常に有効または必要かもしれない。2つの可能なYC1C2表示はYIQ表示およびYUV表示であり、両方は技術的によく知られている。また、YCbCrとして知られているYUV表示の変化を採用することも可能である。これを、さらに、奇数成分と偶数成分に分解してもよい。したがって、実施の形態において、表示Y−偶数、Y−奇数、Cb−偶数、Cb−奇数、Cr−偶数、Cr−奇数が使用される。
【0038】
好適実施形態において、偶数および奇数のY、CB、およびCr成分の各々はサブサンプリング無しに処理される。このように、16×16ブロックのピクセルの6つの成分の各々の入力はエンコーダ104に供給される。図示するために、Y偶数成分のためのエンコーダ104が図解されている。同様のエンコーダが、Y-奇数成分および偶数および奇数のCbおよびCr成分のために使用される。エンコーダ104は、ブロックサイズ割当て構成要素120を含み、ブロックサイズ割当て構成要素120はビデオ圧縮の準備のために、ブロックサイズ割当てを実行する。ブロックサイズ割当て構成要素120は、ブロック内の画像の知覚特性に基づいて16×16のブロックのブロック分解を決定する。ブロックサイズ割当ては、各16×16のブロックを、16×16ブロック内の行動に応じて、四部木態様で8×8、4×4、および2×2のようなより小さなブロックにさらに分割する。ブロックサイズ割当て構成要素120は、長さが1ビットと21ビットとの間にあるPQRデータと呼ばれる、四部木データを発生する。従って、ブロックサイズ割当てが、16×16ブロックサイズを分割すると決定するなら、PQRデータのRビットが設定され、4つの分割された8×8ブロックに対応するQデータの4つのさらなるビットが続く。ブロックサイズ割当てが、8×8ブロックのいずれかを分割することを決定するなら、さらに分割された8×8ブロックの各々に対してPデータのさらなるビットが追加される。
【0039】
図3を参照すると、ブロックサイズ割当て構成要素120の動作の詳細を示すフロー図が提供される。ブロックの分散が、ブロックをさらに分割するという決定の測定基準として使われる。ステップ202から始まって、16×16ブロックのピクセルが読まれる。ステップ204において、16×16のブロックの分散が計算される。
【0040】
分散は、次のように計算される:
【数3】
Figure 0004800571
【0041】
但し、N=16であり、xijはN×Nブロック内のi行j列のピクセルである。ステップ206において、閾値T16の分散が変更され新しい閾値T’16が与えられ、ブロックの平均値が2つの所定値間にあるなら、そのブロック分散は新しい閾値T’16と比較される。
【0042】
分散16が閾値T16より大きくなければ、ステップ208において、16×16ブロックの開始アドレスが一時記憶装置に書き込まれ、PQRデータのRビットは0に設定され、16×16ブロックの再分割されないことを示す。次に、アルゴリズムは次の16×16ブロックのピクセルを読む。分散v16が閾値T16より大きければ、ステップ210において、PQRデータのRビットが1に設定され、16×16ブロックが4つの8か×8ブロックに再分割されることを示す。
【0043】
4つの8×8ブロック、すなわちi=1:4は、ステップ212に示すように、さらなる再分割のために順次考慮される。各8×8ブロックに対して、分散、v8iがステップ214において、計算される。ステップ216において、最初に、分散閾値T8が変更され、新しい閾値T’8が与えられ、ブロックの値が2つの所定値間にあれば、ブロック分散はこの新しい閾値と比較される。
【0044】
ステップ218において、分散v8iが閾値T8より大きくなければ、8×8ブロックの開始アドレスは一時記憶装置に書き込まれ、対応するQビット、Qiは0に設定される。次に、次の8×8ブロックが処理される。ステップ220において、分散v8iが閾値T8より大きければ、対応するQビット、Qiは1に設定され、8×8ブロックが4つの4×4ブロックに再分割されることを示す。
【0045】
4つの4×4ブロックji=1:4は、ステップ222に示すように、さらなる再分割のために、順次考慮される。各4×4ブロックに対して、分散、v4ijはステップ224において、計算される。ステップ226において、最初に、分散閾値T4が変更されて、新しい閾値T’4が与えられ、ブロックの平均値が2つの所定間であれば、ブロック分散はこの新しい閾値と比較される。
【0046】
分散v4ijが閾値T4より大きくなければ、ステップ228において、4×4ブロックのアドレスが書き込まれ、対応するPビット、Pは0に設定される。次に、次の4×4ブロックが処理される。分散v4ijが閾値T4より大きければ、ステップ230において、対応するPビット、Pijは1に設定され、4×4ブロックは4つの2×2ブロックに再分割されることを示す。さらに、4つの2×2ブロックのアドレスは一時記憶装置に書き込まれる。
【0047】
閾値T16、T8およびT4は所定の定数であってよい。これは、つらい決断として知られる。あるいは、適応的意思決定または柔軟な意思決定を実施してもよい。例えば、柔軟な意志決定は2×2ブロックの平均ピクセル値に応じて分散のための閾値を変化させる(但しNは8、4、または2の値を取り得る)。従って、平均ピクセル値の関数を閾値として用いてもよい。
【0048】
説明のために以下の例を考察する。Y成分のための所定の分散閾値を、それぞれ16×16ブロック、8×8ブロック、および4×4ブロックの場合に、50、1100、および880とする。言い換えれば、T16=50、T8=1100、およびT4=880とする。平均値の範囲を80および100とする。16×16ブロックの計算された分散を60と仮定する。60はT16より大きいので、平均値90は80と100との間にあり、16×16ブロックは4つの8×8の副ブロックに再分割される。8×8ブロックの計算された分散が、1180、935、980、および1210であると仮定する。8×8ブロックのうちの2つはT8を越える分散を有するので、これらの2つのブロックはさらに再分割され、合計8つの4×4の副ブロックを生成する。最後に、8つの4×4ブロックの分散が620、630、670、610、590、525、および690であり、対応する平均値が90、120、110、115であると仮定する。最初の4×4ブロックの平均値は範囲(80、100)に入るので、閾値は、880未満であるT’4=200に下がるであろう。従って、この4×4ブロックは7番目の4×4ブロックと同様に再分割される。
【0049】
同様の手続を用いて、輝度成分Y−奇数および色成分CbおよびCrに対してブロックサイズを割当てる点に留意する必要がある。色成分は、水平方向、垂直方向、またはその両方において、大幅に低減してもよい。
【0050】
さらに、ブロックサイズ割当てがトップダウン手法として記述されたけれども、最大のブロック(この例では16×16)が最初に評価され、その代わりにボトムアップ手法を用いても良いことに留意する必要がある。ボトムアップ手法は、最初に最も小さいブロック(この例では、2×2)を評価するであろう。
【0051】
図1に戻ると、PQRデータは選択されたブロックのアドレスとともに、DCT構成要素124に供給される。DCT構成要素124はPQRデータを用いて、選択されたブロックに関して適当なサイズの離散コサイン変換を実行する。選択されたブロックだけがDCT処理を行う必要がある。
【0052】
画像処理システム100はまた、DCTのDC係数の中で冗長度を低減するためにDQT構成要素128から成る。DC係数は、各DCTブロックの左上隅にある。DC係数は、一般に、AC係数に比べて大きい。サイズにおける不一致は、有効な可変長コーダーを設計することを困難にさせる。従って、DC係数の中で冗長度を低減することは利点がある。
【0053】
DQT構成要素128はDC係数に2−D DCTsを実行し、一度に2×2の単位で行なう。4×4ブロック内で、2×2ブロックから始めて、4つのDC係数に関して2−D DCTが実行される。この2×2DCTは微分四部木変換、または4つのDC係数のDQTと呼ばれる。次に、8×8ブロック内の3つの隣接するDC係数とともにDQTのDC係数を用いて次のレベルDQTを計算する。最後に、16×16ブロック内の4つの8×8ブロックのDC係数を用いてDQTを計算する。従って、16×16ブロックにおいて、1つのDC係数があり、残りはDCT及びDQTに対応するAC係数である。
【0054】
変換係数(DCTおよびDQTの両方)は量子化のために量子化器に供給される。好適実施形態において、DCT係数は、周波数重み付けするマスク(FWMs)および量子化スケール因子を用いて量子化される。FWMは、入力DCT係数のブロックと同じ次元の周波数重みのテーブルである。周波数重みは、異なるDCT係数に異なる重みを印加する。重みは、人間の視覚または光学システムがより敏感である周波数内容を有する入力サンプルを強調するように設計され、そして、視覚または光学システムがより敏感でない周波数内容をされている。重みは、また見える距離等のような因子に基づいて設計してもよい。
【0055】
重みは、経験によるデータに基づいて選択される。8×8DCT係数のための重み付けマスクを設計するための方法は、ISO/IEC JTC1 CD 10918「連続諧調静止画像のディジタル圧縮および符号化−パート1:要件およびガイドライン」、国際標準化機構1994、これは参照することにより本願明細書に組み込まれる。一般に、2つのFMWは、1つが輝度成分のためのそして1つがクロミナンス成分のために設計される。ブロックサイズ2×2、4×4のためのFWMテーブルは大幅に減らすことにより得られ、16×16のためのFWMテーブルは、8×8ブロックのためのFWMテーブルの補間により得られる。スケールファクタは、量子化された係数の質およびビットレートを制御する。
【0056】
従って、各DCT係数は以下の関係式に従って量子化される。
【数4】
Figure 0004800571
【0057】
但し、DCT(i,j)は入力DCT係数であり、fwm(i,j)は周波数重み付けするマスクであり、qはスケールファクタであり、およびDCTq(i,j)は量子化された係数である。DCT係数の符号に応じて、大括弧内の最初の項は端数のない形に切り上げるかまたは端数が切り捨てられることに留意する必要がある。DQT係数は、また、適切な重み付けマスクを使用して量子化される。しかしながら、複数のテーブルまたはマスクを使用することができ、Y成分,Cb成分、およびCr成分の各々に印加することができる。
【0058】
次に、AC値がDC値から分離され130、別個に処理される。DC構成要素に対して、各スライスの最初のDC成分値が符号化される。従って、各スライスの各次のDC成分値は、自分自身と自分より先行するDC成分値との差分として表され、符号化される134。損失の無い符号化の場合、各スライスの初期DC成分値と前記差分は図6および図8に対して記載したように、ゴロンブ−ライスを用いて符号化される138。連続するDC成分値間の差分のためにゴロンブ−ライス符号化を使用することは、DC成分値の差が2辺のある指数分布を有する傾向があるという点で利点がある。次にデータは、一時的にバッファ142を用いて記憶され、次に、送信チャネル108を介してデコーダ112に転送または送信される。
【0059】
図8はDC成分値を符号化するプロセスを図解する。このプロセスは等価的に静止画、(これらに限定されるわけではないが、映画または高品質テレビジョンのような)ビデオ画像、およびオーディオに適用できる。データ804の所定のスライスに対して、スライスの第1のDC成分値が検索される808。次に、第1のDC成分値が符号化される812。AC成分値と異なって、DC成分値は、量子化される必要はない。一実施形態において、16×16ブロックのための単一DC値は、ブロックサイズの割当てが停止しているにもかかわらず、使用される。8×8または4×4、またはブロックサイズ割当てにより定義されるいずれかの可変ブロックサイズのようないかなる固定のサイズのブロックも使用できると予想される。次に、所定のスライスの第2または次の、DC成分値が検索される816。次に第2のDC成分値が第1のDC成分値と比較され、その差分すなわち残差が符号化される820。従って、第2のDC成分値は、自分自身と第1の値との間の差分として表すしか必要としない。このプロセスは、スライスの各DC成分値に対して繰り返される。このように、問合せ824はスライス(最後のブロックそれゆえ、最後のDC値)の終わりに到達したかどうかに関してなされる。そうでなければ828、スライスの次のDC値が検索され816、プロセスは繰返される。そうであれば、832、次のスライスが検索され804、このプロセスは、フレームの全てのスライス、およびファイルの全てのフレームが処理されるまで繰返される。
【0060】
DC成分値の損失の無い符号化の目的は、低分散を有する傾向がある残差値を生成することである。DCTを使用する際に、DC係数成分値は、最大の画素エネルギーを与える。それゆえ、DC成分値を量子化しないことによって、残差の分散は、低減される。
【0061】
AC要素の場合、データのブロックおよび周波数重み付けマスクは次に、量子化器146またはスケールファクターエレメントにより倍率がかけられる。DCT係数の量子化は、大多数のDCT係数をゼロまで低減し、その結果圧縮が生じる。好適実施形態において、平均ビットレートに対応する32のスケールファクタがある。MPEG2のような他の圧縮方法と異なり、平均ビットレートは目標のビットレートおよびバッファステータスの代わりに処理される画像の品質に基づいて制御される。
【0062】
さらに圧縮を増大させるために、量子化されたAC係数はシリアライザ150に供給される。シリアライザ150は量子化された係数のブロックを走査し、順番に並べられたストリームの量子化された係数を生成する。ジグザグ走査、カラム走査または行走査を採用してもよい。ジグザグ以外のパターン同様、多数の異なるジクザグ走査パターンを選択してもよい。好適な技術は、ジクザグのスキャンのための8×8ブロックサイズを採用する。量子化された係数のジクザグのスキャンは、ゼロ値の大きいランに遭遇する機会を改良する。このゼロのランは、本質的に減少する確率を有し、ハフマン符号を使用して、効率的に符号化してもよい。
【0063】
順番に並べられ、量子化されたAC係数のストリームは、可変長コーダーに供給される。AC成分値は、ハフマン符号またはゴロンブ−ライス符号化のいずれかを用いて符号化してもよい。DC成分値の場合、ゴロンブ−ライス符号化が利用される。ランレングスコーダーは、係数をゼロの係数と非ゼロの係数に分けるが、詳細は図6に対して記載される。一実施形態において、ゴロンブ−ライス符号化が利用される。ゴロンブ−ライス符号化は指数分布を有する負でない整数を符号化する際に効率的である。ゴロンブ符号を用いることにより、指数的に分布される変数に対してより短いレングスコードを供給する際の圧縮のためにより最適である。
【0064】
ゴロンブ符号化ランレングスにおいて、ゴロンブ符号は負でない整数mによりパラメータ化される。例えば、パラメータmを与えられると、正の整数nのゴロンブ符号化は、単項式符号のn/mの商により表されその後に変更されたバイナリコードにより表される剰余が続く。この剰余は、剰余が
【数5】
Figure 0004800571
【0065】
以下ならば、
【数6】
Figure 0004800571
【0066】
ビット長であり、そうでなければ
【数7】
Figure 0004800571
【0067】
ビット長である。ゴロンブ−ライス符号化は、パラメータmがm=2kとして表される場合のゴロンブ符号化の特別な場合である。そのような場合、n/mの商は整数nのバイナリ表示をkビットだけ右にシフトすることにより得られ、n/mの残りはnの最小のkビットにより表される。従って、ゴロンブ−ライス符号は2つの連結である。ゴロンブ−ライス符号化は、
【数8】
Figure 0004800571
【0068】
により与えられるニ辺の幾何学的な(指数関数)分布を有した正および負の整数を符号化するために使用することができる。
【0069】
(1)において、αはxの確率の減少を特徴づけるパラメータであり、cは正規化定数である。Pα(x)は単調であるので、整数値の系列は、
【数9】
Figure 0004800571
【0070】
を満足することがわかる。
【0071】
図4A、4B、4Cおよび5A、5B、5Cに図解するように、量子化された係数マトリクスにおけるゼロランおよび振幅は、指数分布を有する。これらの図に図解される分布は、実像からのデータに基づく。図4Aは、相対周波数に対するゼロランレングスのY成分分布400を図解する。同様に、図4Bおよび4Cは、それぞれ相対周波数410および420に対するゼロランレングスのCbおよびCr成分分布を図解する。図5Aは、相対周波数に対する振幅サイズのY成分分布500を図解する。同様に、図5bおよび5cはそれぞれ、相対周波数に対する振幅サイズのCb成分分布およびCr成分分布を図解する。図5A、5B、および5Cにおいて、プロットは、DCT係数のサイズの分布を表すことに留意する必要がある。各サイズは、係数値のレンジを表す。例えば、4のサイズ値は、レンジ{−15,−14、・・・−8,8,・・・,14,15}、合計16の値を有する。同様に、10のサイズ値は、レンジ{−1023、−1022,・・・,−512,512,・・・1022,1023}}、合計1024の値を有する。ランレングスと振幅サイズの両方が指数分布を有することは図4A、4B、4C、5A、5Bおよび5Cからわかる。振幅の実際の分布は、以下の式(3)に適合するように示すことができる:
【数10】
Figure 0004800571
【0072】
(3)において、Xk,lはそれぞれ、垂直次元および水平次元における周波数kおよびlに対応するDCT係数を表し、平均値μxは
【数11】
Figure 0004800571
【0073】
を表し、分散
【数12】
Figure 0004800571
【0074】
は、
【数13】
Figure 0004800571
【0075】
を表す。したがって、記載した方法で、ゴロンブ−ライス符号化を使用することはDCTsにおいてデータを処理する際に、より最適である。
【0076】
以下は、画像データの圧縮に対して記載されるけれども、実施形態は、等価的にオーディオデータを圧縮する実施形態に適用可能である。画像データを圧縮する際に、例えば、画像信号またはビデオ信号は、線形のまたはログ符号化されたピクセル値を有したRGB成分、またはYIQ成分またはYCbCr成分であってもよい。
【0077】
図6はゼロ係数および非ゼロ係数のプロセス600を図解する。DCTマトリクスがスキャンされると、ゼロ係数および非ゼロ係数が別個に処理され、分離される604。ゼロデータの場合、ゼロランのレングスが決定される608。ランレングスは正の整数であることに留意する必要がある。例えば、ランレングスがnであるとわかると、ゴロンブパラメータmが決定される612。実施形態において、ゴロンブパラメータは、ランレングスの関数として決定される。他の実施の形態において、ゴロンブパラメータ(m)は以下の式(4)により決定される。
【数14】
Figure 0004800571
【0078】
情況に応じて、ランレングスの長さおよび関連するゴロンブパラメータはカウンタまたはレジスタによりカウントされる616。nのラベルがつけられたゼロのランレングスを符号化するために、商が符号化される620。一実施形態において、商はゼロのランレングスの関数およびゴロンブパラメータとして決定される。他の実施の形態において、商(Q)は、以下の式(5)により決定される。
【数15】
Figure 0004800571
【0079】
一実施形態において、商Qは実施例において、商Qは単項コードで符号化される。これはQ+1ビットを必要とする。次に、剰余が符号化される624。一実施形態において、剰余はランレングスおよび商の関数として符号化される。他の実施の形態において、剰余(R)は、以下の式(6)を用いて決定される。
【数16】
Figure 0004800571
【0080】
他の実施形態において、剰余Rはmビットバイナリコードで符号化される。その後、商Qおよび剰余Rが決定され、QおよびRに対する符号が連結され628、nのラベルが付けられたランレングスのための全体のコードを表す。
【0081】
非ゼロ係数もゴロンブ−ライスを用いて符号化される。係数振幅は正または負でありえるので、サインビットを用いる必要があり、与えられた振幅の絶対値を符号化する必要がある。非ゼロ係数の振幅がxであると仮定すると、振幅の絶対値およびサインの関数として表しても良い。したがって、振幅は以下の式(7)を用いてyとして表すことができる。
【数17】
Figure 0004800571
【0082】
従って、非ゼロ係数の値はカウンタまたはレジスタにより最適にカウントされる632。次に、振幅がゼロより大きいかまたは等しいかが決定される。そうであるなら、与えられた値の2倍の値として符号化される640。そうでない場合には、絶対値の2倍の値より1少ない値として符号化される644。他のマッピングスキームを使用してもよいことが予期される。キーポイントは、値の符号を区別する余分なビットが必要ないということである。
【0083】
式(7)により表される振幅を符号化することにより、xの正の値が偶数の整数となり、負の値が奇数の整数となる。さらに、このマッピングは(2)のxの確率割当てを保存する。式(7)で図示したように、符号化の利点は、正の数および負の数を表すために符号ビットを用いて回避することを可能にする。マッピングが成された後、yはゼロランに対して成されたと同様の方法で符号化される。全ての係数が現在のブロックにおいて走査されるまで、手続は続けられる。
【0084】
この発明の実施形態は、式(1)乃至(7)の関数として係数およびランレングスの値を決定することであるけれども、式(1)
乃至(7)そのものを使用する必要はない。画像データおよびオーディオデータのより効率的な圧縮を可能にすることは、ゴロンブ−ライス符号化およびDCT係数の指数分布の利用である。
【0085】
符号化の後のゼロランは、ゼロラン振幅と区別できないので、固定長の特別な前につけるコードを用いて最初のゼロランの発生をマークすることが必要かもしれない。振幅が非ゼロになった後では、ブロック内がすべてゼロになることはよくあることである。そのような場合、ゴロンブ−ライスコードよりもエンドオブブロック(EOB)コードと呼ばれるコードを使用することはより効率的かもしれない。EOBコードは、また一方、情況に応じて特定の固定長コードである。
【0086】
式(1)または(3)によれば、DCT係数マトリクス内の振幅またはランレングスの確率分布はα又はλによりパラメータ化される。言外の意味は、特定のDCT係数ブロックが生じるという情況で符号化効率が改良されるかもしれないということである。従って、関心の質を符号化するために、適当なゴロンブーライスパラメータを使用してもよい。一実施形態において、それぞれの累積値およびそのような値が生じる対応する回数を計算するために、各ランレングスおよび振幅サイズ値に対してカウンタまたはレジスタが使用される。例えば、累積値を記憶するためのレジスタおよび蓄積されるエレメントの数が、それぞれ、RrlおよびNrlであるなら、以下の式(6)をライス−ゴロンブパラメータとして用いて、ランレングスを符号化してもよい。
【数18】
Figure 0004800571
【0087】
同様の手続を、振幅に対して使用してもよい。
【0088】
残差ピクセルは、最初に、ABSDCTデコーダを用いて圧縮されたデータを解凍し、次に、それをオリジナルデータから減算することにより発生される。残差ダイナミックレンジが小さければ小さいほど、圧縮は高くなる。圧縮はブロックベースなので、残差もブロックベースで発生される。残差ピクセルは両面のある指数分布であって、通常ゼロに中心がある指数分布を有することはよく知られた事実である。ゴロンブ−ライスコードはそのようなデータに対してより最適であるので、ゴロンブーライス符号化手続きを用いて残差データを圧縮する。しかしながら、符号化すべきランレングスが無いので、特別のコードは必要としない。さらに、EOBコードの必要がない。従って、圧縮されたデータは2つの成分から成る。一方は、損失のある圧縮器からの成分であり、他方は、損失の無い圧縮器からの成分である。
【0089】
動作系列を符号化するとき、一時的な相関性を利用する便宜も得ることができる。一時的な相関性を完全に利用するために、ピクセル置換は最初に動作により推定され、次に、残差ピクセルを得るために動作補償予測が実行される。ABSDCTは順応性のあるブロックサイズ符号化を実行するので、ブロックサイズ情報は、動作による置換の手段として代替的に使用してもよい。さらに簡単にするために、場面変更検出は使用しない。その代わり、系列内の各フレームに対して、最初にイントラフレーム圧縮されたデータが得られる。次に、現在のフレームDCTおよび以前のフレームDCTとの間の差分がブロック単位で発生される。これは、参照することにより本願明細書に組み込まれる、2001年6月7日に出願された米国特許出願シリアル番号第09/877,578にさらに詳細に記載されている。DCT領域のこれらの残差は、ハフマン符号化手続きおよびゴロンブ−ライス符号化手続きの両方を用いて符号化される。従って、最終の圧縮された出力はフレームあたり最小のビット数を使用する圧縮された出力に対応する。
【0090】
損失の無い圧縮アルゴリズムは、損失の無い部分を取り除くことにより、再度目的を持たせ、一方のコードを他方のコードに変換するのに好適であるハイブリッドスキームである。従って、ABSDCTを用いることは、空間領域内のピクセル相関を最大化し、予測スキームにおいて使用された残差ピクセルよりも低い分散を有する残差ピクセルを生じる。全体的なシステムの損失のある部分によって、ユーザは、フレーム間処理の助けを求める必要が無くして、分布目的のために必要な品質およびデータレートを得ることができる。これはディジタル映画アプリケーションのために配布されるプログラムにおいて、特に重要である。何故なら、圧縮された部材の損失のある部分は、配布の際により高いレベルの品質を必要とするからである。
【0091】
図9はハイブリッドの損失の無い符号化装置を図解する。図10はそのような装置上で動作してもよいプロセスを図解する。オリジナルディジタル情報904は記憶装置上に常駐し、または送信される。図9のエレメントの多くは、図1および図2に対してより詳細に記載されている。データのフレームは、ブロックサイズ割当てエレメント912、DCT/DQT変換エレメント916および量子化器920で構成される圧縮器908に送られる。 DCT /DQTがデータ上で実行された後、そのデータは周波数領域に変換される。1つの出力922において、そのデータは量子化器920により量子化され、出力924に転送される、これは、記憶装置および/またはスイッチングで構成してもよい。上述した処理のすべては、フレーム内ベースである。上記した処理の全ては、フレーム内に基づく。
【0092】
量子化器の出力はまた解凍器928に転送される。解凍器928は圧縮器のプロセスを元に戻し、BSAにより定義されたPQRデータの知識と共に、逆量子化器932およびIDQT/IDCT936を通過する。解凍器940の結果は減算器944に供給され、そこで、オリジナルと比較される。減算器944は、各ブロックに対して未圧縮ピクセルおよび圧縮されたおよび解凍されたピクセルとの間の差分とした残差画像を計算する差分器のような、種々のエレメントであってよい。さらに、差分器は、条件的なフレーム間符号化のために各ブロックに対してDCT領域内の残差を得るようにしてもよい。解凍されたデータとオリジナルデータとの間の比較の結果948がピクセル残差ファイルである。すなわち、結果948は、圧縮されたおよび解凍されたデータにより経験された損失を示している。従って、オリジナルデータは結果と組み合わされた出力922に等しい。次に、結果948は順番に並べられ、ハフマンおよび/またはゴロンブ−ライス符号器956に送られ、第2出力960として供給される。ハフマンおよび/またはゴロンブ−ライスエンコーダ956は、ゴロンブ−ライス符号化を使用している残差画素を符号化する一種のエントロピー・エンコーダであってもよい。意思決定は、各々のフレームのための最小のビットに基づいて、フレーム内かフレーム間かを使用するべきかどうかなされる。残差のゴロンブーライス符号化の使用は、システムのより高い全体的な圧縮比に導く。
【0093】
従って、損失の無いフレーム間出力は、損失のある高品質の画像ファイル(922またはA)および残りのファイル(960またはC)の組合せまたはハイブリッドである。
【0094】
フレーム間符号化も利用してもよい。量子化器の出力は、BSAの知識と共に、記憶装置964に転送される。1フレーム分のデータを集めると、減算器966は記憶したフレームを次のフレーム968と比較する。その差分はDCT残差970を生じる。この残差は次に順番に並べられ、および/またはゴロンブ−ライス符号化され974、第3出力データセット976を出力924に供給する。従って、BおよびCのフレーム間の損失の無いファイルは、コンパイルされる。従って、組合せ(A+CまたはB+C)のいずれかをサイズの考察に基づいて選択してもよい。さらに、純粋なフレーム内出力は、編集目的のために望ましいかもしれない。
【0095】
図1に戻ると、エンコーダ104により発生された圧縮された画像信号は一時的にバッファ142を用いて記憶してもよく、その次に、送信チャネル108を用いてデコーダ112に送信してもよい。送信チャネル108は磁気のまたは光学の記憶装置のような物理的な媒体であってもよく、または、有線または無線の輸送処理または装置であってもよい。ブロックサイズ割当て情報を含むPQRデータもデコーダ112(図2)に供給される。デコーダ112はバッファ164および可変長デコーダ168を含む。可変長デコーダ168は、ランレングス値および非ゼロ値をデコードする。可変長デコーダ168は同様に動作するが、図6で記載した方法と反対の方法で動作する。
【0096】
可変長デコーダ168の出力は、採用される走査スキームに従って係数を順序づける逆シリアライザ172に供給される。例えば、ジクザグ走査、垂直走査、および水平走査の混合が使用されるなら、逆シリアライザ172は、採用された走査のタイプの知識を用いて、その係数を再順序付けするであろう。逆シリアライザ172は、PQRデータを受信し、復号係数ブロックへの係数の適切な順序付けを支援する。
【0097】
復号ブロックは、量子化器スケールファクタおよび周波数重み付けマスクの使用により処理を元に戻すために、逆量子化器174に供給される。
【0098】
微分四部木変換が適用されたなら、次に、係数ブロックはIDQTエレメント186に供給され、その後にIDCTエレメント190が続く。そうでなければ、係数ブロックは、直接IDCTエレメント190に供給される。IDQTエレメントおよびIDCTエレメント190は、係数を逆変換し、ピクセルデータのブロックを生成する。従って、ピクセルデータは、補間され、RGBフォームに変換されなければならないかもしれない、そして、次に、将来の表示のために記憶される。
【0099】
図7はゴロンブ−ライス符号化のための装置を図解する。図7の装置は、望ましくは、図6に対して記載されたプロセスを実施する。決定器704はランレングスおよびゴロンブパラメータ(m)を決定する。情況に応じて、各ランレングスおよび振幅サイズ値に対してカウンタまたはレジスタ708が使用され、それぞれの累積値およびそのような値が生じる対応する回数を計算する。エンコーダ712は、ランレングスおよびゴロンブパラメータの関数として商(Q)を符号化する。エンコーダ712は、また、ランレングス、ゴロンブパラメータおよび商の関数とし、剰余(R)を符号化する。他の実施形態において、エンコーダ712は、非ゼロデータ値および非ゼロデータ値の符号の関数として非ゼロデータを符号化する。連結器716を用いてQ値をR値と連結する。
【0100】
例として、種々の実例となる論理ブロック、フローチャート、および本願明細書に開示した実施形態に関連して記載したステップは、特定用途向け集積回路(ASIC)、プログラマブルロジックデバイス、ディスクリートゲートまたはトランジスタロジック、例えばレジスタおよびFIFOのようなディスクリートハードウエアコンポーネント、一組のファームウエア命令を実行するプロセッサ、いかなる一般的なプログラマブルソフトウエアおよびプロセッサ、またはそれらのいずれかの組合せを用いて実施、または実行してもよい。プロセッサは、有利にはマイクロプロセッサであってよいが、他の形態では、プロセッサ、いかなる一般的なプロセッサ、コントローラ、マイクロコントローラまたステートマシンであってよい。ソフトウェアは、RAMメモリー、フラッシュメモリ、ROMメモリー、レジスタ、ハードディスク、リムーバブル・ディスク、CD−ROM、DVD−ROMまたは技術的に知られている他のいずれかの形態の記憶媒体に常駐することができる。
【0101】
好適実施形態の上述の記述は、技術に熟達したいかなる人もがこの発明を製作し、または使用することができることを可能にする。これらの実施例に対する種々の変更は、当業者には容易に、明白であり、本願明細書において定義される一般的な原理は発明の能力を用いずに他の実施形態に適用してもよい。従って、本発明は本願明細書において示される実施形態に限定されることを意図したものではなく、本願明細書において開示される原理および新規な特徴に一致する最も広い範囲が許容されるべきである。
【0102】
本発明の他の特徴および利点は以下のクレームに記載される。
【図面の簡単な説明】
【0103】
【図1】図1は、画像圧縮および処理システムのエンコーダ部分のブロック図である。
【図2】図2は、画像圧縮および処理システムのデコーダ部分のブロック図である。
【図3】図3は、分散ベースのブロックサイズ割当てに関係している処理ステップを例示するフローチャートである。
【図4A】図4Aは、DCT係数マトリクスのY成分ランレングスの指数分布を図解する。
【図4B】図4Bは、DCT係数マトリクスのCb成分ランレングスの指数分布を図解する。
【図4C】図4Cは、DCT係数マトリクスのCr成分ランレングスの指数分布を図解する。
【5A】図5Aは、Y成分の振幅サイズの指数分布またはDCT係数マトリクスにおけるY成分の振幅サイズの指数分布を図解する。
【図5B】図5Bは、Cb成分の振幅サイズの指数分布またはDCT係数マトリクスのCb成分の振幅サイズの指数分布を図解する。
【図5C】図5Cは、Cr成分の振幅サイズの指数分布またはDCT係数マトリクスにおけるCr成分の振幅サイズの指数分布を図解する。
【図6】図6は、ゴロンブ−ライス符号化プロセスを図解する。
【図7】図7は、ゴロンブ−ライス符号化のための装置を図解する。
【図8】図8は、DC成分値を符号化するプロセスを図解する。
【図9】図9は、損失の無い圧縮のための装置を図解する。
【図10】図10は、ハイブリッドの損失の無い圧縮の方法を図解する。

Claims (25)

  1. 下記を具備する、各フレームがオリジナル画像を含む、複数のフレームを備えたビデオデータを符号化する方法:
    前記複数のフレーム内の各フレームの前記オリジナル画像に関連する損失のある圧縮されたデータファイルを発生することであって、損失のある圧縮されたデータファイルを発生することは、各オリジナル画像をピクセルのブロックに適応的にブロックサイジングすることと、DC係数とAC係数を取得するためにピクセルのブロックに変換処理を実行することと、前記DC係数を量子化することなく前記AC係数を量子化することとを含む
    前記複数のフレーム内の各フレームの前記オリジナル画像に関連する残差圧縮データファイルを発生することであって、各残差圧縮データファイルの前記発生は、それぞれ各オリジナル画像を適応的にブロックサイジングすることにより以前に発生されたデータを使用する;
    各損失のある圧縮されたデータファイルを各それぞれの残差圧縮データファイルと結合し、損失の無いデータファイルを作成する、前記損失の無いデータファイルは、複数の画像を生成するために使用することができ、各画像は、前記複数のフレーム内の各フレームのオリジナル画像と実質的に同一である。
  2. 各損失のある圧縮されたデータファイルおよび各残差圧縮データファイルは、フレーム内に基づいて発生される、請求項1に記載の方法。
  3. 各残差圧縮データファイルは、フレーム間に基づいて発生される、請求項1に記載の方法。
  4. 各損失のある圧縮データファイルまたは各残差圧縮データファイルを発生することは、ディスクリートコサイン変換(DCT)技術とディスクリート四部木変換(DQT)技術の組み合わせを利用する、請求項1に記載の方法。
  5. 各残差圧縮データファイルを発生することはGolomb-Rice符号化技術を利用する、請求項1に記載の方法。
  6. 前記複数のフレーム内の各フレームの前記オリジナル画像に関連する各残差圧縮データファイルを発生するためにフレーム内またはフレーム間圧縮を使用するかどうかを決定することをさらに具備する、請求項1の方法。
  7. 下記を具備する、各フレームがオリジナル画像を含む複数のフレームを備えたビデオデータを符号化する装置:
    前記複数のフレーム内の各フレームの前記オリジナル画像に関連する損失のある圧縮されたデータファイルを発生する手段であって、前記損失のある圧縮されたデータファイルを発生する手段は、各オリジナル画像をピクセルのブロックに適応的にブロックサイジングする手段、DC係数とAC係数を取得するためにピクセルのブロックに変換処理を実行する手段と、前記DC係数を逆量子化することなく前記AC係数を逆量子化する手段を含む、手段と;
    前記複数のフレーム内の各フレームの前記オリジナル画像に関連する残差の圧縮されたデータファイルを発生する手段であって、前記各残差圧縮データファイルの発生は、それぞれ各オリジナル画像を適応的にブロックサイジングすることにより以前に発生されたデータを使用する、手段;および
    各損失のある圧縮されたデータファイルと、各それぞれの残差圧縮データファイルを結合し、損失の無いデータファイルを作成する手段であって、前記損失の無いデータファイルは複数の画像を生成するために使用することができ、各画像は前記複数のフレーム内の各フレームの前記オリジナル画像と実質的に同一である、手段。
  8. 各損失のある圧縮されたデータファイルを発生する手段および各残差の圧縮されたデータファイルを発生する手段は、フレーム内に基づいて発生される、請求項7に記載の装置。
  9. 各残差圧縮データファイルはフレーム間に基づいて発生される、請求項7に記載の装置。
  10. 前記各損失のある圧縮データファイルまたは各残差圧縮データファイルを発生する手段は、ディスクリートコサイン変換(DCT)技術およびディスクリート四部木変換(DQT)技術の組み合わせを利用する、請求項7に記載の装置。
  11. 前記各残差圧縮データファイルを発生する手段は、Golomb-Riceコーディング技術を利用する、請求項7に記載の装置。
  12. 前記複数のフレーム内の各フレームの前記オリジナル画像に関連する各残差圧縮データファイルを発生するためにイントラフレームまたはインターフレーム圧縮を使用するかどうかを決定する手段をさらに具備した、請求項7の装置。
  13. 下記を具備する、各クレームがオリジナル画像を含む複数のフレームを備えたビデオデータを符号化する方法:
    各オリジナル画像を表す信号を圧縮し、それにより、各オリジナル画像の圧縮されたバージョンを作成することであって、前記圧縮は、各オリジナル画像を適応的にブロックサイジングして各オリジナル画像のピクセルのブロックに変換処理を実行し、各オリジナル画像の各圧縮されたバージョンのDC係数およびAC係数を取得することにより発生されたデータを使用する;
    各オリジナル画像の各圧縮されたバージョンのDC係数を量子化することなく各オリジナル画像の各圧縮されたバージョンの前記AC係数を量子化し、それによりオリジナル画像の損失のあるバージョンを作成する;
    各オリジナル画像の圧縮されたバージョンを解凍し、各圧縮されたバージョンの解凍された画像を作成することであって、前記解凍は、各オリジナル画像を適応的にブロックサイジングすることにより発生されるデータを使用する;
    各オリジナル画像と各それぞれの解凍された画像との間の差分を決定し、それにより、各オリジナル画像に関連する残差データを作成する;および
    各オリジナル画像の各損失のあるバージョンと各オリジナル画像に関連する残差データを出力することであって、各オリジナル画像の各損失のあるバージョンと各オリジナル画像に関連する各残差データは複数の画像を作成するために使用することができ、各画像は前記複数のフレーム内の各フレームの前記オリジナル画像と実質的に同じである。
  14. 各圧縮はフレーム内に基づく、請求項13に記載の方法。
  15. 圧縮は、ディスクリートコサイン変換(DCT)技術およびディスクリート四部木(DQT)変換技術を利用する、請求項13記載の方法。
  16. 下記を具備する、各フレームがオリジナル画像を含む複数のフレームを備えたビデオデータを処理する装置:
    各オリジナル画像を表すデータにディスクリートコサイン変換(DCTs)およびディスクリート四部木変換(DQTs)を実行し、それによりDC係数およびAC係数を取得し各オリジナル画像の圧縮されたバージョンを作成するように構成された圧縮器エレメント、前記圧縮器エレメントは各オリジナル画像を適応的にブロックサイジングすることにより発生されるデータを使用する;
    前記圧縮器エレメントに接続され、各オリジナル画像の各圧縮されたバージョンの前記DC係数を量子化することなく各オリジナル画像の各圧縮されたバージョンの前記AC係数を量子化し、それにより各オリジナル画像の損失のあるバージョンを作成するように構成された量子化器エレメント;
    各オリジナル画像の前記圧縮されたバージョンに対して逆DCTs(IDCTs)および逆DQTs(IDQTs)を実行し、各圧縮されたバージョンの解凍された画像を作成するように構成された解凍器エレメントであって、前記解凍器エレメントは、各オリジナル画像を適応的にブロックサイジングすることにより発生されたデータを使用する;
    各オリジナル画像と各それぞれの解凍された画像との間の差分を決定し、それにより各オリジナル画像に関連する残差データを作成するように構成された決定器エレメント;
    各オリジナル画像の前記損失のあるバージョンと、各オリジナル画像に関連する残差データとを結合し、複数の画像を作成するように構成された結合器エレメントであって、各画像は前記複数のフレーム内の各フレームの前記オリジナル画像と実質的に同じである。
  17. 下記を具備する、各フレームがオリジナル画像を含む複数のフレームを備えたビデオデータを符号化するためにコンピューターにより実行可能なコードを記憶するコンピューター読み取り可能媒体:
    コンピューターに、前記複数のフレーム内の各フレームの前記オリジナル画像に関連する損失のある圧縮されたデータファイルを発生させるコードであって、前記コンピューターに前記損失のある圧縮されたデータファイルを発生させるためのコードは、前記コンピューターに各オリジナル画像をピクセルのブロックに適応的にブロックサイズさせ、前記ピクセルのブロックに変換処理を実行させ、DC係数とAC係数を取得させ、前記DC係数を量子化させることなく前記AC係数を量子化させるためのコードを備える
    コンピューターに、前記複数のフレーム内の各フレームの前記オリジナル画像に関連する残差圧縮データファイルを発生させるコードであって、前記各残差圧縮データファイルの発生はそれぞれ各オリジナル画像を適応的にブロックサイジングすることにより以前に発生されたデータを使用する;
    コンピューターに各損失のある圧縮されたデータファイルと各それぞれの残差圧縮データファイルと結合させ、損失の無いデータファイルを作成させるコードであって、前記損失の無いデータファイルは、複数の画像を生成するために使用することができ、各画像は、前記複数のフレーム内の各フレームの前記オリジナル画像に実質的に同一である。
  18. 各損失のある圧縮されたデータファイルと各残差圧縮データファイルはフレーム内に基づいて発生される、請求項17に記載のコンピューター読み取り可能媒体。
  19. 各残差圧縮データファイルはインターフレームに基づいて発生される、請求項17に記載のコンピューター読み取り可能媒体。
  20. 前記コンピューターに各損失のある圧縮データファイルまたは各残差圧縮データファイルを発生させるコードは、ディスクリートコサイン変換(DCT)技術とディスクリート四部木変換(DQT)技術の組み合わせを利用する、請求項17に記載のコンピューター読み取り可能媒体。
  21. 前記コンピューターに各残差圧縮データファイルを発生させるコードは、Golomb-Riceコーディング技術を利用する、請求項17に記載のコンピューター読み取り可能媒体。
  22. コンピューターに前記複数のフレーム内の各フレームの前記オリジナル画像に関連する各残差圧縮データファイルを発生するためにフレーム内またはフレーム間圧縮を使用するかどうかを決定させるコードをさらに具備する、請求項17に記載のコンピューター読み取り可能媒体。
  23. 下記を具備する、各フレームがオリジナル画像を含む複数のフレームを備えたビデオデータを符号化するためにコンピューターにより実行可能なコードを記憶するコンピューター読み取り可能媒体:
    コンピューターに各オリジナル画像を表すデータを圧縮させ、それにより各オリジナル画像の圧縮されたバージョンを作成させるコードであって、前記圧縮は、各オリジナル画像の各圧縮されたバージョンのDC係数およびAC係数を取得するために各オリジナル画像のピクセルのブロックに変換処理を実行するために各オリジナル画像をブロックサイジングすることにより発生されたデータを使用する;
    コンピューターに、各オリジナル画像の各圧縮されたバージョンの前記DC係数を量子化することなく、各オリジナル画像の各圧縮されたバージョンの前記AC係数を量子化させ、それにより各オリジナル画像の損失のあるバージョンを作成させるコード;
    コンピューターに各オリジナル画像の各圧縮されたバージョンを解凍させ、各圧縮されたバージョンの解凍された画像を作成させるコードであって、前記解凍は各オリジナル画像を適応的にブロックサイジングすることにより発生されたデータを使用する;
    コンピューターに各オリジナル画像と各それぞれの解凍された画像との間の差分を決定させ、それにより各オリジナル画像に関連する残差データを作成させるコード;
    コンピューターに各オリジナル画像の各損失のあるバージョンと各オリジナル画像に関連する各残差データを出力させるコードであって、各オリジナル画像の各損失のあるバージョンおよび各オリジナル画像に関連する各残差データは複数の画像を作成するために使用することができ、各画像は、前記複数のフレーム内の各フレームの前記オリジナル画像と実質的に同じである。
  24. 各圧縮はフレーム内に基づく、請求項23に記載のコンピューター読み取り可能媒体。
  25. 前記コンピューターに圧縮させるコードは、ディスクリートコサイン変換(DCT)技術とディスクリート四部木変換(DQT)技術の組み合わせを利用する、請求項23のコンピューター読み取り可能媒体。
JP2003511463A 2001-07-02 2002-07-02 損失の無い方法でディジタル画像を符号化するための装置および方法 Expired - Fee Related JP4800571B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US30285301P 2001-07-02 2001-07-02
US60/302,853 2001-07-02
US10/180,828 2002-06-26
US10/180,828 US7483581B2 (en) 2001-07-02 2002-06-26 Apparatus and method for encoding digital image data in a lossless manner
PCT/US2002/021151 WO2003005626A2 (en) 2001-07-02 2002-07-02 An apparatus and method for encoding digital image data in a lossless manner

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008256739A Division JP2009081860A (ja) 2001-07-02 2008-10-01 損失の無い方法でディジタル画像を符号化するための装置および方法

Publications (3)

Publication Number Publication Date
JP2005520360A JP2005520360A (ja) 2005-07-07
JP2005520360A5 JP2005520360A5 (ja) 2006-01-05
JP4800571B2 true JP4800571B2 (ja) 2011-10-26

Family

ID=26876673

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2003511463A Expired - Fee Related JP4800571B2 (ja) 2001-07-02 2002-07-02 損失の無い方法でディジタル画像を符号化するための装置および方法
JP2008256739A Pending JP2009081860A (ja) 2001-07-02 2008-10-01 損失の無い方法でディジタル画像を符号化するための装置および方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2008256739A Pending JP2009081860A (ja) 2001-07-02 2008-10-01 損失の無い方法でディジタル画像を符号化するための装置および方法

Country Status (11)

Country Link
US (4) US7483581B2 (ja)
EP (1) EP1402464A4 (ja)
JP (2) JP4800571B2 (ja)
KR (1) KR100946600B1 (ja)
CN (1) CN1293509C (ja)
AU (1) AU2002318196B2 (ja)
BR (1) BRPI0210786B1 (ja)
CA (1) CA2452550C (ja)
HK (1) HK1070452A1 (ja)
MX (1) MXPA04000129A (ja)
WO (1) WO2003005626A2 (ja)

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7436329B2 (en) * 2003-04-17 2008-10-14 Droplet Technology, Inc. Multiple technique entropy coding system and method
US7525463B2 (en) 2003-04-17 2009-04-28 Droplet Technology, Inc. Compression rate control system and method with variable subband processing
US7412100B2 (en) 2003-09-04 2008-08-12 Qualcomm Incorporated Apparatus and method for sub-sampling images in a transform domain
JP2007507147A (ja) * 2003-09-25 2007-03-22 アミモン リミテッド 高画質映像の無線伝送
JP4949037B2 (ja) * 2003-11-18 2012-06-06 スカラド、アクチボラグ ディジタル画像を処理するための方法および画像表現形式
WO2006001384A1 (ja) * 2004-06-25 2006-01-05 Matsushita Electric Industrial Co., Ltd. 画像符号化方法および画像復号化方法
US7664184B2 (en) * 2004-07-21 2010-02-16 Amimon Ltd. Interpolation image compression
TWI285055B (en) * 2004-09-30 2007-08-01 Nippon Telegraph & Telephone Method for progressive lossless video coding, method for progressive lossless video decoding, progressive lossless video coding apparatus, progressive lossless video decoding apparatus, and recording media of progressive lossless video coding program...
DE102004056447A1 (de) 2004-11-23 2006-05-24 Siemens Ag Codierverfahren und Decodierverfahren, sowie Codiervorrichtung und Decodiervorrichtung
US8780957B2 (en) * 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
AR052601A1 (es) * 2005-03-10 2007-03-21 Qualcomm Inc Clasificacion de contenido para procesamiento de multimedia
US8879635B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
US20070206117A1 (en) * 2005-10-17 2007-09-06 Qualcomm Incorporated Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video
US8654848B2 (en) 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US8948260B2 (en) * 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US20070171280A1 (en) * 2005-10-24 2007-07-26 Qualcomm Incorporated Inverse telecine algorithm based on state machine
US7843995B2 (en) * 2005-12-19 2010-11-30 Seiko Epson Corporation Temporal and spatial analysis of a video macroblock
US7778472B2 (en) * 2006-03-27 2010-08-17 Qualcomm Incorporated Methods and systems for significance coefficient coding in video compression
US9131164B2 (en) * 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
JP4853199B2 (ja) * 2006-09-25 2012-01-11 株式会社ニコン 画像圧縮方法、装置、電子カメラ、およびプログラム
MX2009004121A (es) * 2006-10-20 2009-06-08 Nokia Corp Indicacion generica de trayectos de adaptacion para multimedia escalable.
US8086465B2 (en) * 2007-03-20 2011-12-27 Microsoft Corporation Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
US7991622B2 (en) * 2007-03-20 2011-08-02 Microsoft Corporation Audio compression and decompression using integer-reversible modulated lapped transforms
KR101403338B1 (ko) * 2007-03-23 2014-06-09 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JP2010532944A (ja) * 2007-07-06 2010-10-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号処理方法及び装置
EP2187645A3 (en) * 2007-07-18 2012-10-24 Humax Co., Ltd. Adaptive bit-precision entropy coding
JP4958832B2 (ja) * 2008-04-02 2012-06-20 キヤノン株式会社 画像符号化装置及びその制御方法
JP4958831B2 (ja) * 2008-04-02 2012-06-20 キヤノン株式会社 画像符号化装置及びその制御方法
KR101511082B1 (ko) * 2008-05-09 2015-04-13 삼성전자주식회사 최하위 비트를 이용한 엔트로피 부호화 방법과 그 장치 및엔트로피 복호화 방법과 그 장치
US20090304073A1 (en) * 2008-06-06 2009-12-10 Mohammad Usman Systems and Methods for the Bandwidth Efficient Processing of Data
TWI387314B (zh) * 2009-03-10 2013-02-21 Univ Nat Central Image processing apparatus and method thereof
JP5199955B2 (ja) * 2009-06-16 2013-05-15 キヤノン株式会社 画像復号装置及びその制御方法
JP5199956B2 (ja) * 2009-06-16 2013-05-15 キヤノン株式会社 画像復号装置及びその制御方法
EP2278550B1 (en) * 2009-06-17 2013-08-14 Canon Kabushiki Kaisha Method of encoding and decoding a graphics path sequence into a layered scheme
KR101457894B1 (ko) 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
TWI713356B (zh) 2010-04-13 2020-12-11 美商Ge影像壓縮有限公司 樣本區域合併技術
KR101529842B1 (ko) 2010-04-13 2015-06-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 샘플 배열 멀티트리 세부분할에서 계승
CN106067983B (zh) 2010-04-13 2019-07-12 Ge视频压缩有限责任公司 解码数据流的方法、生成数据流的方法及解码器
HUE025960T2 (en) 2010-04-13 2016-04-28 Ge Video Compression Llc Video coding using multi-tree subdivisions of images
US20110292247A1 (en) * 2010-05-27 2011-12-01 Sony Corporation Image compression method with random access capability
US8559741B2 (en) * 2010-06-02 2013-10-15 Altek Corporation Lossless image compression method
US8798171B2 (en) 2010-06-28 2014-08-05 Richwave Technology Corp. Video transmission by decoupling color components
CA2810899C (en) 2010-10-05 2016-08-09 General Instrument Corporation Coding and decoding utilizing adaptive context model selection with zigzag scan
JP5741076B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
JP2012160985A (ja) * 2011-02-02 2012-08-23 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
TWI454150B (zh) * 2011-05-06 2014-09-21 Altek Corp 影像檔案的處理方法
CN102769743B (zh) * 2011-05-06 2014-11-26 华晶科技股份有限公司 影像文件的处理方法
TWI487381B (zh) * 2011-05-19 2015-06-01 Nat Univ Chung Cheng Predictive Coding Method for Multimedia Image Texture
MX354286B (es) 2011-06-30 2018-02-22 Samsung Electronics Co Ltd Método de codificación de video con ajuste de profundidad de bits para conversión de punto fijo y aparato para el mismo, y método de decodificación de video y aparato para el mismo.
US8891616B1 (en) 2011-07-27 2014-11-18 Google Inc. Method and apparatus for entropy encoding based on encoding cost
TWI478587B (zh) * 2011-09-30 2015-03-21 Nat Univ Chung Cheng A Fast Method for Predicting Modular Multimedia Video Coding
TWI502973B (zh) * 2011-12-06 2015-10-01 Acer Inc 多媒體檔案的展示方法與電子裝置
US8811758B2 (en) * 2011-12-18 2014-08-19 Numerica Corporation Lossy compression of data points using point-wise error constraints
CN104869412B (zh) * 2011-12-22 2018-10-12 三星电子株式会社 视频解码方法
US20130195198A1 (en) * 2012-01-23 2013-08-01 Splashtop Inc. Remote protocol
TWI562644B (en) 2012-01-30 2016-12-11 Samsung Electronics Co Ltd Method for video decoding in spatial subdivisions and computer-readable recording medium
US9774856B1 (en) 2012-07-02 2017-09-26 Google Inc. Adaptive stochastic entropy coding
US8675731B2 (en) * 2012-08-13 2014-03-18 Gurulogic Microsystems Oy Encoder and method
US10333547B2 (en) 2012-08-13 2019-06-25 Gurologic Microsystems Oy Encoder and method for encoding input data using a plurality of different transformations or combinations of transformations
US9258389B2 (en) 2012-08-13 2016-02-09 Gurulogic Microsystems Oy Encoder and method
US9509998B1 (en) 2013-04-04 2016-11-29 Google Inc. Conditional predictive multi-symbol run-length coding
CN103297776B (zh) * 2013-05-17 2016-02-10 西安电子科技大学 星上未配准多光谱图像无损/有损编码系统与方法
KR101726572B1 (ko) * 2013-05-22 2017-04-13 세종대학교산학협력단 무손실 이미지 압축 및 복원 방법과 이를 수행하는 장치
GB2519070A (en) * 2013-10-01 2015-04-15 Sony Corp Data encoding and decoding
US9392288B2 (en) 2013-10-17 2016-07-12 Google Inc. Video coding using scatter-based scan tables
US9179151B2 (en) 2013-10-18 2015-11-03 Google Inc. Spatial proximity context entropy coding
US9890094B2 (en) 2015-03-03 2018-02-13 Uop Llc High meso-surface area and high acid site density pentasil zeolite for use in xylene conversion
US9688587B2 (en) 2015-03-03 2017-06-27 Uop Llc Process for oxygenate to olefin conversion using 2-D pentasil zeolite
WO2016164459A1 (en) 2015-04-10 2016-10-13 Red.Com, Inc. Video camera with rate control video compression
US9596380B1 (en) 2015-10-19 2017-03-14 Xerox Corporation Methods and systems for image compression
US9734597B2 (en) * 2015-12-18 2017-08-15 Intel Corporation Interpolated minimum-maximum compression/decompression for efficient processing of graphics data at computing devices
US9946956B2 (en) * 2016-06-15 2018-04-17 Qualcomm Incorporated Differential image processing
RU2640296C1 (ru) 2016-12-06 2017-12-27 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) на сервере
US10319573B2 (en) 2017-01-26 2019-06-11 Protein Metrics Inc. Methods and apparatuses for determining the intact mass of large molecules from mass spectrographic data
CN106955084A (zh) * 2017-02-24 2017-07-18 重庆金山医疗器械有限公司 一种无线电胶囊医用系统
US10341671B2 (en) 2017-04-21 2019-07-02 Xerox Corporation Method and system for image compression
EP3649783A1 (en) 2017-07-05 2020-05-13 Red.Com, Llc Video image data processing in electronic devices
US11626274B2 (en) 2017-08-01 2023-04-11 Protein Metrics, Llc Interactive analysis of mass spectrometry data including peak selection and dynamic labeling
US10510521B2 (en) 2017-09-29 2019-12-17 Protein Metrics Inc. Interactive analysis of mass spectrometry data
US11575922B2 (en) * 2017-12-06 2023-02-07 V-Nova International Limited Methods and apparatuses for hierarchically encoding and decoding a bytestream
US11640901B2 (en) 2018-09-05 2023-05-02 Protein Metrics, Llc Methods and apparatuses for deconvolution of mass spectrometry data
CN111035381B (zh) * 2018-10-15 2023-02-14 深圳华清心仪医疗电子有限公司 一种实时心电数据无损压缩方法
TWI703856B (zh) * 2019-04-18 2020-09-01 瑞昱半導體股份有限公司 影像壓縮方法及影像壓縮器
US11346844B2 (en) 2019-04-26 2022-05-31 Protein Metrics Inc. Intact mass reconstruction from peptide level data and facilitated comparison with experimental intact observation
CN112004095B (zh) * 2020-08-26 2022-07-15 深圳市迪威码半导体有限公司 一种无存储介质的静止图像帧间无损恢复方法
WO2022047368A1 (en) 2020-08-31 2022-03-03 Protein Metrics Inc. Data compression for multidimensional time series data
US11818191B1 (en) 2021-11-11 2023-11-14 Two Six Labs, LLC Stateless lossless compression
US20230254493A1 (en) * 2022-02-08 2023-08-10 Synaptics Incorporated Lossless compression for low-latency video transmission in resource-constrained encoding environment
US20230334718A1 (en) * 2022-04-14 2023-10-19 Tencent America LLC Online training computer vision task models in compression domain

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4903317A (en) * 1986-06-24 1990-02-20 Kabushiki Kaisha Toshiba Image processing apparatus
JP2593453B2 (ja) 1986-08-12 1997-03-26 株式会社東芝 画像圧縮装置
US5021891A (en) * 1990-02-27 1991-06-04 Qualcomm, Inc. Adaptive block size image compression method and system
US5107345A (en) * 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
JPH04101278A (ja) * 1990-08-20 1992-04-02 Fuji Photo Film Co Ltd 画像ファイリング装置
CA2110264C (en) * 1991-06-04 2002-05-28 Chong U. Lee Adaptive block size image compression method and system
KR100287624B1 (ko) 1992-09-28 2001-04-16 야스카와 히데아키 화상데이타의압축,해제방법및그장치
JP3673529B2 (ja) * 1992-09-28 2005-07-20 セイコーエプソン株式会社 画像データの圧縮・伸長方法およびそのための装置
US5497246A (en) * 1993-07-15 1996-03-05 Asahi Kogaku Kogyo Kabushiki Kaisha Image signal processing device
JP2663922B2 (ja) 1995-06-30 1997-10-15 日本電気株式会社 動画像符号化装置
US5680129A (en) * 1995-07-18 1997-10-21 Hewlett-Packard Company System and method for lossless image compression
US6256349B1 (en) * 1995-12-28 2001-07-03 Sony Corporation Picture signal encoding method and apparatus, picture signal transmitting method, picture signal decoding method and apparatus and recording medium
JPH09238345A (ja) 1995-12-28 1997-09-09 Sony Corp 画像信号符号化方法及び装置、画像信号伝送方法、画像信号復号方法及び装置並びに記録媒体
US5737446A (en) * 1996-09-09 1998-04-07 Hughes Electronics Method for estimating high frequency components in digitally compressed images and encoder and decoder for carrying out same
CN1151685C (zh) * 1997-02-12 2004-05-26 萨尔诺夫公司 编码系统中用于优化速率控制的装置和方法
US6304607B1 (en) * 1997-03-18 2001-10-16 Texas Instruments Incorporated Error resilient video coding using reversible variable length codes (RVLCS)
US6198842B1 (en) * 1997-06-19 2001-03-06 International Business Machines Corporation Multi-spectral image compression with bounded loss
US6021227A (en) * 1997-06-30 2000-02-01 Hewlett-Packard Company Image compression system including encoder having run mode
SG116400A1 (en) * 1997-10-24 2005-11-28 Matsushita Electric Ind Co Ltd A method for computational graceful degradation inan audiovisual compression system.
JP3380763B2 (ja) 1998-01-23 2003-02-24 松下電器産業株式会社 画像処理方法
JP3132456B2 (ja) * 1998-03-05 2001-02-05 日本電気株式会社 階層的画像符号化方式、及び階層的画像復号方式
US6108447A (en) 1998-03-26 2000-08-22 Intel Corporation Method and apparatus for estimating frame rate for data rate control
JP3907875B2 (ja) * 1998-10-23 2007-04-18 パイオニア株式会社 符号化レート制御装置及び情報符号化装置
US6529634B1 (en) * 1999-11-08 2003-03-04 Qualcomm, Inc. Contrast sensitive variance based adaptive block size DCT image compression
US6600836B1 (en) * 2000-01-28 2003-07-29 Qualcomm, Incorporated Quality based image compression
US20020191695A1 (en) * 2001-06-07 2002-12-19 Irvine Ann Chris Interframe encoding method and apparatus

Also Published As

Publication number Publication date
US8270738B2 (en) 2012-09-18
CA2452550C (en) 2012-09-18
HK1070452A1 (en) 2005-06-17
WO2003005626A2 (en) 2003-01-16
BR0210786A (pt) 2007-11-20
US20110299595A1 (en) 2011-12-08
CN1549988A (zh) 2004-11-24
JP2005520360A (ja) 2005-07-07
US20030021485A1 (en) 2003-01-30
AU2002318196B2 (en) 2008-04-03
US8098943B2 (en) 2012-01-17
US8023750B2 (en) 2011-09-20
EP1402464A4 (en) 2006-05-10
US20110299594A1 (en) 2011-12-08
CA2452550A1 (en) 2003-01-16
US20080279465A1 (en) 2008-11-13
MXPA04000129A (es) 2004-06-22
KR20040018414A (ko) 2004-03-03
JP2009081860A (ja) 2009-04-16
CN1293509C (zh) 2007-01-03
US7483581B2 (en) 2009-01-27
BRPI0210786B1 (pt) 2015-12-22
KR100946600B1 (ko) 2010-03-09
EP1402464A2 (en) 2004-03-31
WO2003005626A3 (en) 2003-04-10

Similar Documents

Publication Publication Date Title
JP4800571B2 (ja) 損失の無い方法でディジタル画像を符号化するための装置および方法
JP4113114B2 (ja) Golomb−riceコーディングを使用するdct圧縮
JP4927888B2 (ja) ゴロム・ライスを使用する無損失フレーム内符号化
KR100932412B1 (ko) 구성가능한 패턴 옵티마이저
JP2015039176A (ja) ディジタル画像および音声データを無損失に復号化するためのシステムおよび方法
JP2004531995A5 (ja)
AU2002318196A1 (en) An apparatus and method for encoding digital image data in a lossless manner
AU2002316546A1 (en) Lossless intraframe encoding using golomb-rice
CN100566419C (zh) 以无损的方式编码数字图像数据的设备和方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050701

A524 Written submission of copy of amendment under section 19 (pct)

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20050802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080123

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080130

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080229

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080307

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080312

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081001

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081016

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20081219

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100713

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100716

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110804

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees