JP2005517316A - 構成可能なパターン最適化器 - Google Patents

構成可能なパターン最適化器 Download PDF

Info

Publication number
JP2005517316A
JP2005517316A JP2003506213A JP2003506213A JP2005517316A JP 2005517316 A JP2005517316 A JP 2005517316A JP 2003506213 A JP2003506213 A JP 2003506213A JP 2003506213 A JP2003506213 A JP 2003506213A JP 2005517316 A JP2005517316 A JP 2005517316A
Authority
JP
Japan
Prior art keywords
data
blocks
block
color components
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003506213A
Other languages
English (en)
Other versions
JP2005517316A5 (ja
Inventor
ゴビンダスワミイ、センスィル
スヤガラジャン、カダヤム
レビン、ジェフレイ・エー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2005517316A publication Critical patent/JP2005517316A/ja
Publication of JP2005517316A5 publication Critical patent/JP2005517316A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Systems (AREA)

Abstract

【課題】構成可能なパターン最適化器
【解決手段】ディジタルシネマシステムにおいて周波数ベースの画像データを直列化するための装置および方法が開示されている。16×16データブロックで表すことが可能な少なくとも一つのデータグループがコンパイルされる。あるいはまた、データフレームがコンパイルされる。データグループは4個のグループに分割され、各々は8×8ブロックで表すことが可能である。4個の8×8データブロックの各々は、ジグザグ走査、垂直走査、および/または水平走査を使用して直列化される。

Description

本発明は画像処理および圧縮に関する。より具体的には、本発明は圧縮画像用の構成可能なパターン最適化器に関する。
ディジタルピクチャ処理は、ディジタル信号処理の一般原理において重要な地位を占めている。人間の視覚認知の重要性は、ディジタルピクチャ処理の分野における多くの関心および発達を促進してきた。フィルムや動画を写すのに使用されるような、ビデオ信号の送受信の分野における画像圧縮技術に対して種々の改良がなされている。現在提案されているビデオシステムの多くはディジタル符号化技術を利用している。この分野の態様は、画像符号化、画像復元、および画像特徴選択を含んでいる。画像符号化は、必要な帯域を最小化できる程度のビットを利用して、ディジタル通信チャネルのピクチャを効率的に送信すると同時に、一定の制限内に歪みを維持しようとするものである。画像復元は、オブジェクトの正確な画像を復元しようとするものである。通信チャネル上で送信されている符号化画像は種々の要因によって歪みが生じていた。劣化の原因は元々、オブジェクトから画像を作成する際に生じていた。特徴選択とはピクチャの特定の属性の選択のことである。このような属性はより広い意味で、認識、分類、および判断において必要とされる。
デジタルカメラなどでのビデオのディジタル符号化は、改良された画像圧縮技術に恩恵を受けている分野である。ディジタル画像圧縮は一般的に、非損失性方法および損失性方法の2つのカテゴリに分類することができる。非損失性画像は情報の損失なく復元される。損失性方法は、圧縮比、圧縮アルゴリズムの品質、およびアルゴリズムの実現によっては、一部の情報について復元不可能な損失を伴っている。一般的に、損失性圧縮アプローチは費用効果的なディジタルシネマアプローチに望まれる圧縮比を得ると考えられている。ディジタルシネマの品質レベルを得るためには、圧縮アプローチは視覚的に損失のないレベルの性能を提供すべきである。従って、圧縮プロセスの結果として情報の数学的損失はあるが、この損失による画像の歪みは通常の閲覧条件下では閲覧者には知覚されないはずである。
既存のディジタル画像圧縮技術は他のアプリケーション、すなわちテレビシステムに対して開発されてきた。このような技術は目的のアプリケーションにふさわしい設計的な妥協をしてきたが、シネマ表示に必要な品質要件を満たしていない。
ディジタルシネマ圧縮技術は、映画ファンがすでに体験している視覚的品質を提供すべきである。理想的には、ディジタルシネマの視覚的品質は、高品質の公開版フィルムを超えることを目的とすべきである。同時に、圧縮技術は実用的な、高い符号化効率を有するべきである。ここに定義されているように、符号化効率とは、一定の品質レベルを満たすために、圧縮画像品質に必要なビットレートのことである。さらに、システムおよび符号化技術は異なるフォーマットに対応するための柔軟性を内蔵し、かつ費用効果的な、すなわち小型かつ効率のよい復号化または符号化プロセスであるべきである。
多数の使用可能な圧縮技術が相当な圧縮レベルを提供しているが、ビデオ信号の品質低下を招いている。一般的に、圧縮情報を送信するための技術は、圧縮情報が一定のビットレートで送信されることを要する。
ビデオ信号に所望の品質レベルを維持しつつ、相当な圧縮レベルを提供できる圧縮技術は、符号化離散コサイン変換(DCT)係数データの適応サイズのブロックよびサブブロックを利用している。この技術は以下に、適応ブロックサイズによる離散コサイン変換(ABSDCT)方法と称される。この技術は、本発明の譲受人に譲渡され、かつ参照してここに組み込まれている、「適応ブロックサイズによる画像圧縮方法およびシステム(Adaptive Block Size Image Compression Method and System)」と題された、米国特許第5,021,891号に開示されている。DCT技術はまた、本発明の譲受人に譲渡され、かつ参照してここに組み込まれている、「適応ブロックサイズによる画像圧縮方法およびシステム(Adaptive Block Size Image Compression Method and System)」と題された、米国特許第5,107,345号に開示されている。さらに、差分カッドツリー変換(Differential Quadtree Transform)技術と組み合わせたABSDCT技術の使用は、これもまた本発明の譲受人に譲渡され、かつ参照してここに組み込まれている、「適応ブロックサイズによる画像圧縮方法およびシステム(Adaptive Block Size Image Compression Method and System)」と題された、米国特許第5,452,104号に説明されている。これらの特許に開示されているシステムは、画像データの各フレームが他のフレームのコンテンツに関係なく符号化される、「イントラフレーム」符号化と称されるものを利用している。ABSDCT技術を使用すると、取得可能なデータレートは、目に見える画像品質の劣化なしに、毎秒約15億ビットから毎秒約5000万ビットに減少することが可能である。
ABSDCT技術を使用して、白黒画像、あるいはカラー画像または画像を表す信号のいずれかを圧縮することができる。カラー入力信号はYIQフォーマットであってもよく、Yは輝度、すなわち明度サンプルであり、IおよびQは4×4画素ブロックごとの色度、すなわちカラーサンプルである。YUV、YC、またはRGBフォーマットなどの他の既知のフォーマットもまた使用することができる。色に対する目の空間感覚は低いため、多くの研究は、垂直および水平方向における係数4によるカラー成分のサブサンプルが理想的であることを示している。従って、ビデオ信号は4つの輝度成分と2つの色度成分によって表すことができる。
ABSDCTを使用して、ビデオ信号は一般的に処理用に画素ブロックに分割される。ブロックごとに、輝度および色度成分がブロックインタリーバに渡される。例えば、16×16(画素)ブロックがブロックインタリーバに提供されてもよく、これは各16×16ブロック内で画像サンプルを配列または編成し、ブロックを生成して、離散コサイン変換(DCT)分析用のデータのサブブロックを複合する。DCT演算子は、時間/空間サンプル信号を同じ信号の周波数表示に変換するための方法である。周波数表示に変換することによって、DCT技術は、量子化器が画像の周波数分布特徴を利用するように設計可能なように、非常に高レベルの圧縮を見込んでいると示されている。好ましい実施形態において、1個の16×16DCTが第一の配列に適用され、4個の8×8DCTが第二の配列に適用され、16個の4×4DCTが第三の配列に適用され、そして64個の2×2DCTが第四の配列に使用される。
DCT動作はビデオソースに固有の空間冗長性を減少させる。DCTが実行された後、ビデオ信号エネルギーの多くは少数のDCT係数に集中しやすい。別の変換である、差分カッドツリー変換(DQT)を使用して、DCT係数間の冗長性を減少させることができる。
16×16ブロックと各サブブロックについて、DCT係数値と(DQTが使用される場合には)DQT値を分析して、ブロックやサブブロックを符号化するのに必要なビット数を判断する。そして、符号化に最小のビット数でよいブロックまたはサブブロックの組み合わせが選択されて、画像セグメントを表す。例えば、2個の8×8サブブロックと、6個の4×4サブブロックと、8個の2×2サブブロックが選択されて、画像セグメントを表すことができる。
選択されたブロック、またはサブブロックの組み合わせは、16×16ブロックに適切に配列される。DCT/DQT係数値は、送信用に周波数重み付け、量子化、および(可変長符号化)などの符号化を実行してもよい。上記のABSDCT技術は極めて良好に機能するが、計算的に集中してしまう。従って、この技術のコンパクトなハードウェアの実現は困難であろう。
可変長符号化は、ランレングス(run length)およびサイズの形態で実行されてきた。ジョイント・フォトグラフィック・エキスパーツ・グループ(Joint Photographic Experts Group)(JPEG)やムービング・ピクチャ・エキスパーツ・グループ(Moving Picture Experts Group)(MPEG−2)などの他の圧縮方法は、処理ブロックサイズ全体において標準ジグザグ走査方法を使用している。しかしながら、ABSDCTを使用して、異なるブロックサイズがデータブロック内の分散に基づいて生成される。従って、標準ジグザグ走査方法は必ずしも処理ブロックサイズ全体に最適であるわけではない。さらに、各ブロックサイズに対する標準ジグザグ走査方法はハードウェアでの実現が困難である。さらに、ジグザグパターンは必ずしも所与のブロックやフレームに対して最適なパターンではない。従って、最適パターンを判断するための方法および装置が必要となる。
本発明の実施形態は、最適パターン判断のための装置および方法を提供する。一実施形態において、最適パターンはフレーム単位で構成可能である。別の実施形態においては、所定のブロックサイズのデフォルトパターンが、適応ブロックサイズによる離散コサイン変換(discrete cosine transform)(ABSDCT)技術によって決定されるような実際のブロックサイズに関係なく使用される。
本発明は、離散コサイン変換係数データおよび品質に基づく量子化スケール係数の適応サイズブロックとサブブロックとを利用する、画像圧縮用の品質に基づくシステムおよび方法である。画素データ(pixel data)のブロックは符号器に入力される。符号器は、入力された画素ブロックを処理するために分割するブロックサイズ割当(a block size assignment)(BSA)要素を備えている。ブロックサイズ割当は入力ブロックおよびさらなる再分割ブロックの分散に基づいている。一般的に、ブロックおよびサブブロックの平均値が異なる所定の範囲にある場合、分散の大きい領域はより小さなブロックに再分割され、分散の小さい領域は再分割されない。従って、まずブロックの分散閾値がその平均値によるその名目値から修正され、次いでブロックの分散が閾値と比較され、分散が閾値より大きい場合ブロックは再分割される。
ブロックサイズ割当が、画素データを周波数ドメインデータ(frequency domain data)に変換する変換要素に提供される。変換は、ブロックサイズ割当によって選択されたブロックおよびサブブロックに対してのみ実行される。そして、変換データは量子化および直列化(serialization)によってスケーリングを実行する。変換データの量子化は、コントラスト、係数カウント、レート歪み、ブロックサイズ割当の密度、および/または過去のスケール係数に関して調整するスケール係数などの画像品質基準に基づいて実行される。直列化は同一の値の可能な最長ランレングスの生成に基づいている。一実施形態において、固定ブロックサイズでのジグザグ走査を利用して、ブロックサイズ割当に関係なくデータを直列化してデータストリームを生成する。別の実施形態においては、ブロックサイズは8×8である。データストリームは送信用に可変長符号器によって符号化されてもよい。符号化データは送信チャネルを介して復号器に送信され、ここで画素データは表示用に再構成される。
別の実施形態において、デジタルカメラシステムにおいて周波数ベースの画像データを直列化するための方法を説明する。16×16データブロックで表すことができる少なくとも一つのデータグループがコンパイルされる。あるいはまた、データフレームがコンパイルされる。データグループは4個のグループに分割され、各々は8×8ブロックで表されてもよい。4個の8×8データブロックの各々は、ジグザグ走査、垂直走査、および/または水平走査を使用して直列化される。
従って、実施形態の一態様は、実際のブロックサイズ割当に関係なく、8×8ブロックでの走査の固定パターンを使用してデータブロックを処理することである。
実施形態の別の態様は、フレーム単位の最適走査技術を判断し、実行することである。
実施形態の別の態様は、ユーザに構成可能な走査パターンを提供することである。
本発明の特徴および利点は以下の図面と関連してなされる詳細な説明からより明らかとなる。同一の参照番号は図面全体にわたって対応部分を示している。
好ましい実施の形態の詳細な説明
ディジタル信号のディジタル送信を容易にし、かつ相当の利益を享受するために、一般的に信号圧縮の複数の形態を採用することが必要である。生じた画像の高圧縮を得るためには、画像の高品質が維持されることもまた重要である。さらに、コンパクトな計算効率のハードウェアの実現に望まれ、これは多数のアプリケーションにおいて重要である。
本発明の一実施形態を詳細に説明する前に、本発明は、そのアプリケーションにおいて以下に説明および図示される構成要素の構成および配置の詳細に限定されないことを理解すべきである。本発明は他の実施形態も可能であり、種々の方法で実行される。また、ここで使用されている表現および専門用語は説明目的のためであり、限定とみなされるべきではない。
一実施形態の態様において用いられる画像圧縮は、本発明の譲受人に譲渡され、かつ参照してここに組み込まれている、1999年11月8日に出願された、「一定の感度分散に基づく適応ブロックサイズによるDCT画像圧縮(Constant Sensitive Variance Based Adaptive Block Size DCT Image Compression)」という、同時係属の米国特許出願第09/436,085号に開示されるような離散コサイン変換(DCT)技術に基づいている。一般的に、ディジタルドメインで処理される画像は、N×Nサイズの非重複ブロックアレイに分割された画素データからなる。二次元DCTが各ブロックで実行されてもよい。二次元DCTは以下の関係によって定義される:
Figure 2005517316
ここで、
Figure 2005517316
及び、x(m,n)はM×Mブロック内の位置(m,n)の画素であり、
X(k,l)は対応するDCT係数である。
画素値は負ではないので、DCT成分X(0,0)は常に正であり、常に最大エネルギーを有する。実際、一般的な画像については、変換エネルギーの大半が成分X(0,0)付近に集中している。このエネルギー圧縮特徴によって、DCT技術は非常に魅力的な圧縮方法となっている。
画像圧縮技術はコントラスト適応符号化を利用して、更なるビットレートの減少を実現する。多くの自然画像が比較的ゆっくり変化する平らな領域と、オブジェクトの境界およびハイコントラストテクスチャなどの込み入った領域とで形成されていることが分かっている。コントラスト適応符号化スキームは、込み入った領域に多数のビットを、またそれほど込み入っていない領域には少数のビットを割り当てることによってこの要因をうまく活用している。
コントラスト適応方法は、インターフレーム符号化(interframe coding)(時空処理(spatio-temporal processing))ではなく、イントラフレーム符号化(intraframe coding)(空間処理)を利用する。インターフレーム符号化は本質的に、多数の複雑な処理回路に加えて多数のフレームバッファを必要とする。多数のアプリケーションにおいて、複雑さの減少は実行に必要である。イントラフレーム符号化はまた、時空符号化スキームが正常に機能せず、うまく行かない状況において有用である。例えば、毎秒24個のフレームの動画は、機械的シャッターによる積分時間(integration time)が比較的短いため、このカテゴリに入る。短い積分時間はより高い時間エリアシング度(aliasing)を許容する。フレーム対フレームの相関の前提は、それが発作性になると、速い動きに対して正常に機能しない。イントラフレーム符号化はまた、50Hzおよび60Hzの電力ライン周波数の双方を伴う場合には、標準化するのがより容易である。現在テレビは50Hzと60Hzのいずれかで信号を送信している。ディジタルアプローチであるイントラフレームスキームの使用は、フレームレートと空間解像度を交換することによって、50Hzおよび60Hzの動作の双方に、または毎秒24個のフレームの動画にさえも適応可能である。
画像処理目的のため、DCT動作は非重複ブロックアレイに分割されている画素データで実行される。ブロックサイズはここではN×Nサイズとして論じられているが、種々のブロックサイズの使用が想定されていることに注目すべきである。例えば、N×Mブロックサイズを使用することができる(ここでNおよびMの両方とも整数であり、MはNより大きくても小さくてもよい)。別の重要な態様は、ブロックが、N/ixN/i、N/ixN/j、N/ixM/jなどの(ここでiおよびjは整数である)少なくとも一つのサブブロックレベルに分割されることである。さらに、ここで論じられている例示的ブロックサイズは、DCT係数の対応するブロックおよびサブブロックを有する16×16画素ブロックである。奇数および偶数の値の両方の、他の種々の整数の使用、例えば9×9がさらに想定されている。
図1および2は、構成可能な直列化器の概念を組み込んでいる画像処理システム100を示している。画像処理システム100は、受信ビデオ信号を圧縮する符号器104を備えている。圧縮信号は送信チャネル、すなわち物理的媒体108を使用して送信され、復号器112によって受信される。復号器112は受信した符号化データを画像サンプルに復号化し、その後これは表示されてもよい。
一般的に、画像は処理用に画素ブロックに分割される。カラー信号はRBG/YCコンバータ116を使用してRGB空間からYC空間に変換されることが可能であり、この場合、Yは輝度すなわち明度成分であり、CおよびCは色度すなわちカラー成分である。色に対する目の空間感度は低いため、多数のシステムがCおよびC成分を垂直および水平方向における係数4によってサブサンプリングする。しかしながら、サブサンプリングは不要である。4:4:4フォーマットとして既知の最大解像度画像は、「ディジタルシネマ」をカバーすると言われるような一部のアプリケーションにおいては非常に有用、あるいは必要であろう。2つの可能なYC表示は、双方とも当業界において既知である、YIQ表示およびYUV表示である。YCbCrとして知られているYUV表示の変形を用いることも可能である。これはさらに、奇数および偶数成分に分割されてもよい。従って、実施形態において、表示Y−偶数、Y−奇数、Cb−偶数、Cb−奇数、Cr−偶数、Cr−奇数が使用される。
好ましい実施形態において、偶数および奇数のY、Cb、およびCr成分の各々はサブサンプリングなしで処理される。従って、16×16画素ブロックの6つの成分の各々の入力は符号器104に提供される。図示目的のために、Y−偶数成分に対する符号器104が示されている。同様の符号器がY−奇数成分と、偶数および奇数のCbおよびCr成分に使用される。符号器104はブロックサイズ割当要素120を備えており、これはビデオ圧縮用にブロックサイズ割当を実行する。ブロックサイズ割当要素120は、ブロックの画像の視覚的特徴に基づいて16×16ブロックのブロック分解を判断する。ブロックサイズ割当は各16×16ブロックを、16×16ブロック内の動きによってカッドツリー方式(a quad-tree fashion)で、8×8、4×4、および2×2などのより小さいブロックに再分割する。ブロックサイズ割当要素120はPQRデータと呼ばれるカッドツリーデータを生成し、その長さは1〜21ビットの間である。従って、ブロックサイズ割当が、16×16ブロックを分割すると決定すると、PQRデータのRビットが設定され、4個の分割された8×8ブロックに対応するQデータの4個のさらなるビットが続く。ブロックサイズ割当が、8×8ブロックのいずれかを再分割すると決定すると、再分割された8×8ブロックごとのPデータの4個のさらなるビットが追加される。
次に図3を参照すると、ブロックサイズ割当要素120の動作の詳細を示している図が示されている。ブロックの分散が、ブロックの再分割を決定する際の基準として使用されている。ステップ202で開始し、16×16画素ブロックが読み取られる。ステップ204において、16×16ブロックの分散v16が計算される。分散は以下のように計算される:
Figure 2005517316
ここで、N=16であり、xi,jはN×Nブロック内のi行目、j列目の画素である。ステップ206において、ブロックの平均値が2つの所定値間にある場合には、まず分散閾値T16を変形して新たな閾値T’16を提供し、次いでブロック分散を新たな閾値T’16と比較する。
分散v16が閾値T16以下の場合、ステップ208において、16×16ブロックの開始アドレスが一時的記憶装置に書き込まれ、PQRデータのRビットが0に設定されて、16×16ブロックは再分割されないことを示す。そしてアルゴリズムは次の16×16画素ブロックを読み取る。分散v16が閾値T16より大きい場合、ステップ210において、PQRデータのRビットが1に設定されて、16×16ブロックが4個の8×8ブロックに分割されることを示す。
4個の8×8ブロック(i=1:4)は、ステップ212に示されているように、順次さらに再分割されると考えられる。8×8ブロックごとに、分散v8がステップ214において計算される。ステップ216において、ブロックの平均値が2つの所定値間にある場合にはまず分散閾値T8を変形して新たな閾値T’8を提供し、次いでブロック分散をこの新たな閾値と比較する。
分散v8が閾値T8以下である場合、ステップ218において、8×8ブロックの開始アドレスが一時的記憶装置に書き込まれ、対応するQビットQが0に設定される。そして次の8×8ブロックが処理される。分散v8が閾値T8より大きい場合、ステップ220において、対応するQビットQが1に設定され、8×8ブロックが4個の4×4ブロックに再分割されることを示す。
4個の4×4ブロック(j=1:4)は、ステップ222において示されているように、順次さらに再分割されると考えられる。4×4ブロックごとに、分散v4ijがステップ224において計算される。ステップ226において、ブロックの平均値が2つの所定値間にある場合、まず分散閾値T4が変形されて新たな閾値T’4を提供し、次いでブロック分散がこの新たな閾値と比較される。
分散v4ijが閾値T4以下である場合、ステップ228において、4×4ブロックのアドレスが書き込まれ、対応するPビットPijが0に設定される。そして次の4×4ブロックが処理される。分散v4ijが閾値T4より大きい場合、ステップ230において、対応するPビットPijが1に設定され、4×4ブロックが4個の2×2ブロックに再分割されることを示す。加えて、4個の2×2ブロックのアドレスが一時的記憶装置に書き込まれる。
閾値T16、T8、およびT4は所定の定数であってもよい。これは硬判定(the hard decision)として知られている。あるいはまた、適応または軟判定(adaptive or soft decision)が実行されてもよい。例えば、軟判定は2N×2Nブロックの平均画素値によって分散の閾値を変化させる(ここでNは8、4、または2であってもよい)。従って、平均画素値の関数を閾値として使用することができる。
図示目的のために、以下の例を考える。Y成分の所定の分散閾値を、16×16ブロック、8×8ブロック、および4×4ブロックに対してそれぞれ50、1100、および880とする。すなわち、T16=50、T8=1100、およびT4=880となる。平均値の範囲を80〜100とする。16×16ブロックに対して計算された分散は60であるとする。60はT16より大きいため、平均値90は80と100の間であり、16×16ブロックは4個の8×8サブブロックに再分割される。8×8ブロックに対して計算された分散は1180、935、980、および1210とする。8×8ブロックのうちの2つはT8以上の分散を有しているため、これら2つのブロックはさらに再分割され、合計8個の4×4サブブロックを生成する。最後に、8個の4×4ブロックの分散は620、630、670、610、590、525、930、および690であり、対応する平均値は90、120、110、115であるとする。第一の4×4ブロックの平均値は範囲(80、100)内にあるため、その閾値は、880未満のT’4=200に低下する。従って、この4×4ブロックは7個の4×4ブロックと同様に再分割される。これに伴うブロックサイズ割当が図4aに示されている。対応するカッドツリー分解は図4bに示されている。さらに、このブロックサイズ割当によって生成されたPQRデータが図4cに示されている。
同様の手順を使用してブロックサイズをカラー成分Y−奇数、Cb−even、Cb−odd、Cr−evenおよびCr−oddに割り当てることに注目すべきである。カラー成分は水平、垂直、または両方で間引きされてもよい。
さらに、ブロックサイズ割当は、最大ブロック(本例では16×16ブロック)がまず評価されるトップダウンアプローチとして説明されているが、ボトムアップアプローチを使用してもよいことに注目すべきである。ボトムアップアプローチはまず最小ブロック(本例では2×2ブロック)を評価する。
図1を再び参照すると、選択ブロックのアドレスに伴うPQRデータがDCT要素124に提供される。DCT要素124はPQRデータを使用して、適切なサイズの離散コサイン変換を選択ブロックに実行する。選択ブロックのみがDCT処理の実行を必要とする。
画像処理システム100もまた、DCTのDC係数間の冗長性を低下させるためのDQT要素128を備えている。DC係数は各DCTブロックの左上角で遭遇する。一般的にDCT係数はAC係数と比較される。サイズの相違によって、効率的な可変長符号器を設計することは困難である。従って、DC係数間の冗長性を低下させることは有利なことである。
DQT要素128は、一度に2×2ずつ、二次元DCTをDC係数に実行する。4×4ブロック内の2×2ブロックで開始して、二次元DCTは4個のDC係数に実行される。この2×2DCTは4個のDC係数の差分カッドツリー変換、すなわちDQTと称される。次に、8×8ブロック内の3つの隣接するDC係数に伴うDQTのDC係数を使用して、次のレベルのDQTを計算する。最後に、16×16ブロック内の4個の8×8ブロックのDC係数を使用して、DQTを計算する。従って、16×16ブロックにおいて、1つの真のDC係数が存在し、残りはDCTおよびDQTに対応するAC係数である。
変換係数(DCTおよびDQT双方)が量子化用の量子化器に提供される。好ましい実施形態において、DCT係数は周波数重みマスク(frequency weighting masks)(FWM)および量子化スケール係数を使用して量子化される。FWMは入力されたDCT係数のブロックと同一次元の周波数重みのテーブルである。周波数重みは異なる重みを異なるDCT係数に適用する。重みは、人間の視覚または光学システムが敏感な周波数コンテンツを有する入力サンプルを強調し、かつ視覚または光学システムが敏感ではない周波数コンテンツを有するサンプルを強調しないように設計されている。重みはまた見える距離などの要因に基づいて設計されてもよい。
重みは経験上のデータに基づいて選択される。8×8DCT係数に対する重みマスクを設計するための方法は、参照してここに組み込まれている、1994年の国際標準機構(International Standards Organization)による、ISO/IEC JTC1 CD10918の、「連続トーンの静止画像のディジタル圧縮および符号化(Digital compression and encoding of continuous−tone still images)―パート1:要件および指針(Requirement and guideline)に開示されている。一般的に、2つのFWMが設計され、1つは輝度成分用で、もう1つは色度成分用である。ブロックサイズ2×2と4×4のFWMテーブルは間引きによって得られ、16×16のFWMテーブルは8×8ブロックの補間によって得られる。スケール係数は量子化係数の品質およびビットレートをコントロールする。
従って、各DCT係数は以下の関係に従って量子化される:
Figure 2005517316
ここでDCT(i,j)は入力DCT係数であり、fwm(i,j)は周波数重みマスクであり、qはスケール係数であり、DCTq(i,j)は量子化係数である。DCT係数の符号によって大括弧内の第一の項は切り上げまたは切り捨てられることに注目すべきである。DQT係数はまた適切な重みマスクを使用して量子化される。しかしながら、複数のテーブルまたはマスクが、Y、Cb、およびCr成分の各々に使用および適用されてもよい。
画素データブロックおよび周波数重みマスクは量子化器130、すなわちスケール係数要素によってスケーリング(scaled)される。好ましい実施形態において、平均ビットレートに対応する32個のスケール係数がある。MPEG2などの他の圧縮方法と異なり、平均ビットレートは、目標ビットレートおよびバッファ状態ではなく、処理画像の品質に基づいてコントロールされる。
量子化係数は走査直列化器152に提供される。直列化器152は量子化係数のブロックを走査し、量子化係数の直列化ストリームを生成する。ジグザグ走査、列走査、または行走査が用いられてもよい。ジグザグ以外のパターンならびに、多数の異なるジグザグ走査パターンもまた選択されてよい。他のサイズを使用することもできるが、好ましい技術はジグザグ走査に8×8ブロックサイズを用いる。
異なる走査技術が図4および5を参照してここに説明される。図4bは16×16ブロック400全体のジグザグ走査を示している。DCTなどの周波数ベースのブロックにおいて、値は、DC値が左上角にあるように符号化および表示され、AC値は右下角に近づくと減少する。従って、16×16ブロック内のブロックサイズ割当に関係なく、16×16ブロック全体をジグザグ走査する走査技術は非効率な符号化を招く。すなわち、このようなジグザグ走査は同一値のより短いランレングスを招く。
図4cは、係数が所与のブロックにおいて配列されている順序を利用する、より最適な走査技術を示している。各ブロック404、406、408、410、412、414、416、418、420、422、424、426、および428は別個のジグザグ走査を用いる。一実施形態において、各ブロックは、垂直、水平、または逆ジグザグなどの異なる走査パターンを用いることができる。この実施形態は最大ランレングスの維持においてかなり最適化されているが、各ブロックの別個のジグザグ走査の計算はより集中してしまい、またハードウェアでの実現はより困難であろう。
従って、図5aおよび5bに示されているような走査の実現は、ハードウェアの実現において容易に平衡化されるランレングスを最大化する最適化を平衡化するであろうと判断されている。図5aは、ブロックサイズ割当によって、ブロック504、506、508、510、512、514、516、518、520、522、524、526、および528に再分割されている16×16ブロック500を示している。一実施形態において、BSAブレークダウンに関係なく、16×16ブロックの各8×8象限に対するジグザグ走査が用いられる。従って、ブロック504、506、508、および510はジグザグ走査によって直列化され、ブロック512もジグザグ走査によって直列化され、ブロック514もジグザグ走査によって直列化され、またブロック516、518、520、522、524、526、および528もジグザグ走査によって直列化される。
図5bは、ブロックサイズ割当によって、ブロック554、556、558、560、562、564、566、568、570、572、574、576、および578に再分割されている16×16ブロック550を示している。この実施形態において、異なるタイプの走査が、16×16ブロックの各8×8象限に対して用いられる。用いられているこのタイプの走査は、8×8ブロック内の値を評価し、最も効率的な走査方法を判断することによって決定される。例えば、図5bにおいて、水平走査がブロック554、556、558、560に対して用いられ、ブロック562はジグザグ走査によって直列化され、ブロック564は垂直走査によって直列化され、ブロック566、568、570、572、574、576、および578はジグザグ走査によって直列化される。代替実施形態において、最適な走査方法は、ブロック単位ではなくフレーム単位で決定される。フレーム単位の最適な走査方法を決定することは、ブロック単位の方法とは反対に計算の集中が少ない。
図6aは、直列化が生じるプロセス600を示している。データグループが読み取られる(604)。読み取られているデータは可変ブロックサイズに基づいているので、読み込まれているデータは均一の長さではない。データはコンパイルされる(compiled)か(608)、あるいは16×16ブロックで表されることができる形態に構成される。次いでデータは4個の8×8ブロックサイズに分割される。次いで、ジグザグ走査が各8×8ブロックに実行される(616)。そしてデータはバッファにルーティングされる(620)。
図6bは、直列化の代替実施形態650を示している。データフレームが読み取られる(654)。データフレームが評価されて(658)、最適な直列化技術を決定する。評価に基づいて、ジグザグ走査662、垂直走査664、あるいは水平走査668が用いられる。走査方法の一つに基づいた直列化の際に、データはバッファにルーティングされる(672)。
再度図1を参照すると、直列化または量子化係数のストリームが可変長符号器156に提供される。可変長符号器156はハフマン符号化(Huffman encoding)に続くゼロのランレングス符号化を利用してもよい。この技術は、参照してここに込みこまれ、かつここに要約されている前述の米国特許第5,021,891号、第5,107,345号、および第5,452,104号に詳述されている。ランレングス符号器は量子化係数を用いて、非ゼロ係数からゼロを分離する。ゼロの値はランレングス値と称され、ハフマン符号化される。非ゼロ値は別個にハフマン符号化される。
量子化係数の修正ハフマン符号化もまた可能であり、好ましい実施形態において使用される。ここで、ジグザグ走査の後に、ランレングス符号器が各8×8ブロック内のランレングス/サイズ対を判断する。次いでこれらのランレングス/サイズ対はハフマン符号化される。
ハフマン符号は画像の測定または理論統計のいずれかから設計される。多くの自然画像は平らな、または比較的ゆっくりと変化する領域と、オブジェクトの境界およびハイコントラストテクスチャなどの込み入った領域とからなることが分かっている。DCTなどの周波数ドメイン変換によるハフマン符号器はこれらの特徴を、込み入った領域には多数のビットを、また平らな領域には少数のビットを割り当てることによって利用する。一般的に、ハフマン符号器はルックアップテーブルを使用してランレングスおよび非ゼロ値を符号化する。所望なら1つまたは2つのテーブルが用いられるが、複数のテーブルが一般的に使用され、本発明においては3つのテーブルが好ましい。
符号器104によって生成された圧縮画像信号はバッファ160を用いて一時的に記憶され、送信チャネル108を使用して復号器112に送信される。ブロックサイズ割当情報を含んでいるPQRデータもまた復号器112に提供される。復号器112はバッファ164と、可変長復号器168とを含んでおり、これはランレングス値と非ゼロ値を復号化する。
可変長復号器168の出力は、用いられている走査スキームに従って係数を配列する逆直列化器172に提供される。例えば、ジグザグ走査、垂直走査、および水平走査の組み合わせが使用されると、逆直列化器172は、用いられている走査タイプの情報によって係数を適切に再配列する。逆直列化器172はPQRデータを受信して、複合係数ブロックへの係数の適切な配列を支援する。
複合ブロックはセレクタ174を使用して、量子化スケール係数および周波数重みマスクの使用による処理を実行するための逆量子化器176に提供される。
そして、差分カッドツリー変換が適用されていれば、係数ブロックは、IDCT要素186が続くIDQT要素186に提供される。そうでない場合、係数ブロックはIDCT要素190に直接提供される。IDQT要素186およびIDCT要素190は係数を逆変換し、画素データブロックを生成する。次いで、画素データは補間され、RGB形態に変換され、そして更なる表示のために記憶されなければならない。
従って、画素分散に基づいてブロックサイズ割当を実行する画像圧縮のためのシステムおよび方法が提供される。分散に基づくブロックサイズ割当は複数の利点を提供する。離散コサイン変換はブロックサイズが判断された後に実行されるため、効率的な計算ができる。計算が集中的な変換は選択ブロックのみで必要とされる。さらに、ブロック選択プロセスは、画素値の分散は数学的に計算が容易であるために、効率的である。分散に基づくブロックサイズ割当のさらに別の利点は、それが知覚的に基づいたものである点である。画素分散はブロックの動きの一つの手段であり、エッジやテクスチャ(textures)などの存在を示す。それは、画素値の平均などの測定よりも良好にブロックの詳細を捕捉する。従って、本発明の分散に基づく割当はエッジの多きい領域には小さいブロックを、平らな領域には大きなブロックを割り当てる。その結果、優れた品質が再構成画像において得られる。
例として、ここに開示されている実施形態と関連して説明されている種々の説明的論理ブロック、フローチャート、およびステップがハードウェアまたはソフトウェアにおいて、特定用途向け集積回路(ASIC)、プログラマブル論理装置、離散ゲートまたはトランジスタ論理、レジスタおよびFIFOなどの離散ハードウェアコンポーネント、ファームウェア命令を実行するプロセッサ、従来のプログラマブルソフトウェアおよびプロセッサ、またはこれらの組み合わせによって実現または実行されることが可能である。プロセッサはマイクロプロセッサが好都合であるが、別の方法では、プロセッサは従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であってもよい。ソフトウェアはRAMメモリ、フラッシュメモリ、ROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM,DVD−ROM,または当業において既知の記憶媒体の形態であってもよい。
好ましい実施形態に関する前述の説明によって、当業者なら誰でも本発明をなし、または使用することができる。これらの実施形態に対する種々の修正は当業者には容易に明らかであり、ここで定義されている一般原理は、本発明の機能を使用せずとも他の実施形態に適用可能である。従って、本発明はここに示されている実施形態に限定されることを意図しておらず、ここに開示されている原理および新規の特徴に矛盾しない最大限の範囲を認めることになる。
本発明の他の特徴および利点は以下の請求項において示される。
図1は、本発明の分散に基づくブロックサイズ割当システムおよび方法を組み込んでいる品質に基づく画像処理システムの符号化部分のブロック図である。 図2は、本発明の分散に基づくブロックサイズ割当システムおよび方法を組み込んでいる品質に基づく画像処理システムの復号化部分のブロック図である。 図3は、分散に基づくブロックサイズ割当に関する処理工程を示しているフロー図である。 図4aは例示的ブロックサイズ割当を示している。 図4bは、16×16ブロックサイズに対するジグザグ走査パターンを示している。 図4cは、各可変ブロックサイズ内のジグザグ走査パターンを示している。 図5aは、実際のブロックサイズと関係ない、8×8ブロックのジグザグ走査パターンを示している。 図5bは、実際のブロックサイズと関係ない、8×8ブロックで実現されている異なる走査パターンを示している。 図6aは、直列化プロセスの一実施形態を示している。 図6bは、直列化プロセスの別の実施形態を示している。

Claims (35)

  1. ディジタルシネマシステムにおいて、周波数ベースの画像データを直列化するための方法、該方法は下記を具備する:
    16×16ブロックで表すことが可能な少なくとも一つのデータグループをコンパイルする;
    該データグループを4個の8×8ブロックで表すことが可能なグループに分割する;
    該4個の8×8データブロックの各々を直列化する。
  2. 直列化することは、該4個の8×8データブロックの各々をジグザグ走査することを備えている、請求項1に記載の方法。
  3. 直列化することは、該4個の8×8データブロックの各々を垂直走査することを備えている、請求項1に記載の方法。
  4. 直列化することは、該4個の8×8データブロックの各々を水平走査することを備えている、請求項1に記載の方法。
  5. 少なくとも一つのグループをコンパイルすることは、複数の16×16ブロックで表すことが可能なデータフレームをコンパイルすることを備えている、請求項1に記載の方法。
  6. 該周波数ベースの画像データは、Y、Cb、およびCrカラー成分に分離される、請求項1に記載の方法。
  7. 該Y、Cb、およびCrカラー成分がさらに偶数および奇数のカラー成分に分離される、請求項6に記載の方法。
  8. ディジタルシネマシステムにおいてディジタル画像を圧縮するための方法、該画像は画素データを備え、
    該画素データはカラー成分に分離される、該方法は下記の動作を具備する:
    画素データのカラー成分のグループを読み取る;
    ブロックサイズ割当を生成して、画素のカラー成分のグループを画素データのサブブロックに分割する;
    画素データのサブブロックを、対応する周波数ドメイン表示に変換する;
    該周波数ドメイン表示をデータストリームにスケーリングする、ここにおいて、該スケーリング動作は該画像の品質と相関する品質基準に基づいている;
    少なくとも一つのデータグループを、16×16ブロックで表すことが可能な該ストリームデータからコンパイルする;
    該16×16データグループを、4個の8×8ブロックで表すことが可能なグループに分割する;
    該4個の8×8データブロックの各々を直列化する。
  9. 該スケーリング動作は、さらに周波数重みマスクを該画素データのサブブロックに提供する動作を備えており、該周波数重みマスクは、人間の視覚システムがより敏感な該画像の部分を強調し、人間の視覚システムがより敏感でない該画像の部分はより低く強調する、請求項8に記載の方法。
  10. 該スケーリング動作は、さらに該画像の品質に基づいて該画素データのサブブロックを量子化する動作を備えている、請求項8に記載の方法。
  11. 該品質基準は信号対雑音比である、請求項8に記載の方法。
  12. 該変換動作は、離散コサイン変換を実行する、請求項8に記載の方法。
  13. 該変換動作は離散コサイン変換に続いて差分カッドツリー変換を実行する、請求項8に記載の方法。
  14. 該カラー成分はY、Cb、およびCrカラー成分である、請求項8に記載の方法。
  15. 該Y、Cb、およびCrカラー成分は、偶数および奇数カラー成分に分離される、請求項14に記載の方法。
  16. ディジタルシネマシステムにおいて、周波数ベースの画像データを直列化するための装置、該装置は下記を具備する:
    16×16ブロックで表すことが可能な少なくとも一つのデータグループをコンパイルするための手段;
    該データグループを4個の8×8ブロックで表すことが可能な複数のグループに分割するための手段;
    該4個の8×8データブロックの各々を直列化するための手段。
  17. 該直列化手段が、該4個の8×8データブロックの各々をジグザグ走査するための手段を備えている、請求項16に記載の装置。
  18. 該直列化手段は、該4個の8×8データブロックの各々を垂直走査するための手段を備えている、請求項16に記載の装置。
  19. 該直列化手段は、該4個の8×8データブロックの各々を水平走査するための手段を備えている、請求項16に記載の装置。
  20. 少なくとも一つのグループをコンパイルするための手段は、複数の16×16ブロックで表すことが可能なデータフレームをコンパイルするための手段を備えている、請求項16に記載の装置。
  21. 該周波数ベースの画像データは、Y、CbおよびCrカラー成分に分離される、請求項16に記載の装置。
  22. さらに該Y、CbおよびCrカラー成分は、偶数および奇数のカラー成分に分離される、請求項21に記載の装置。
  23. ディジタルシネマシステムにおいて、ディジタル画像を圧縮するための装置、該画像は画素データを備え、該画素データはカラー成分に分離される、該装置は下記を具備する:
    画素データのグループを読み取るための手段;
    該画素グループを画素データのサブブロックに分割するために、ブロックサイズ割当を生成するための手段;
    画素データの該サブブロックを、対応する周波数ドメイン表示に変換するための手段;
    該周波数ドメイン表示をデータストリームにスケーリングするための手段、ここにおいて該スケーリング動作は、該画像の品質と相関する品質基準に基づいている;
    少なくとも一つのデータグループを、16×16ブロックで表すことが可能な該ストリームデータからコンパイルするための手段;
    該16×16データグループを、4個の8×8ブロックで表すことが可能なグループに分割するための手段;
    該4個の8×8データブロックの各々を直列化するための手段。
  24. 該変換動作は、離散コサイン変換を実行する、請求項23に記載の装置。
  25. 該変換動作は、離散コサイン変換に続いて差分カッドツリー変換を実行する、請求項23に記載の装置。
  26. 該カラー成分はY、CbおよびCrのカラー成分である、請求項23に記載の装置。
  27. 該Y、CbおよびCrカラー成分は、偶数および奇数のカラー成分に分離される、請求項26に記載の装置。
  28. ディジタルシネマシステムにおいて、周波数ベースの画像データを直列化するための装置、該装置は下記を具備する:
    16×16ブロックで表すことが可能な少なくとも一つのデータグループをコンパイルするように構成されたコンパイラ;
    該データグループを4個の8×8ブロックで表すことが可能な複数のグループに分割するように構成された分割器;
    該4個の8×8データブロックの各々を直列化するように構成された直列化器。
  29. 該直列化器は、さらに、該4個の8×8データブロックの各々をジグザグ走査するように構成されたジグザグスキャナを備えている、請求項28に記載の装置。
  30. 該直列化器は、さらに、該4個の8×8データブロックの各々を垂直走査するように構成された垂直スキャナを備えている、請求項28に記載の装置。
  31. 該直列化器は、さらに該4個の8×8データブロックの各々を水平走査するように構成された水平スキャナを備えている、請求項28に記載の装置。
  32. 該コンパイラは、複数の16×16ブロックで表すことが可能なデータフレームをコンパイルするように構成されている、請求項28に記載の装置。
  33. 該周波数ベースの画像データは、Y、CbおよびCrカラー成分に分離される、請求項28に記載の装置。
  34. 該Y、CbおよびCrカラー成分は、さらに偶数および奇数のカラー成分に分離される、請求項33に記載の装置。
  35. ディジタルシネマシステムにおいて、ディジタル画像を圧縮するように構成された装置、該画像は画素データを備えている、該装置は下記を具備する:
    画素データのグループを読み取るように構成された読み取り器;
    該画素グループを画素データのサブブロックに分割するためのブロックサイズ割当を生成する生成器;
    該画素データのサブブロックを、対応する周波数ドメイン表示に変換するように構成された変換器;
    該周波数ドメイン表示をデータストリームにスケーリングするように構成されたスケーラ、ここにおいて、該スケーリング動作は該画像の品質と相関する品質基準に基づいている;
    少なくとも一つのデータグループを、16×16ブロックで表すことが可能な該ストリームデータからコンパイルするように構成されたコンパイラ;
    該16×16データグループを、4個の8×8ブロックで表すことが可能な複数のグループに分割するように構成された分割器;
    該4個の8×8データブロックの各々を直列化するように構成された直列化器。
JP2003506213A 2001-06-15 2002-06-13 構成可能なパターン最適化器 Pending JP2005517316A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/882,753 US6870963B2 (en) 2001-06-15 2001-06-15 Configurable pattern optimizer
PCT/US2002/018962 WO2002104039A1 (en) 2001-06-15 2002-06-13 Configurable pattern optimizer

Publications (2)

Publication Number Publication Date
JP2005517316A true JP2005517316A (ja) 2005-06-09
JP2005517316A5 JP2005517316A5 (ja) 2006-01-05

Family

ID=25381264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003506213A Pending JP2005517316A (ja) 2001-06-15 2002-06-13 構成可能なパターン最適化器

Country Status (12)

Country Link
US (1) US6870963B2 (ja)
EP (2) EP2405657B1 (ja)
JP (1) JP2005517316A (ja)
KR (1) KR100932412B1 (ja)
CN (2) CN1593064A (ja)
AU (1) AU2002315160C1 (ja)
BR (1) BR0210418A (ja)
CA (1) CA2450733C (ja)
ES (1) ES2584035T3 (ja)
HK (1) HK1166429A1 (ja)
MX (1) MXPA03011623A (ja)
WO (1) WO2002104039A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US7190840B2 (en) * 2002-01-07 2007-03-13 Hewlett-Packard Development Company, L.P. Transform coefficient compression using multiple scans
KR100510137B1 (ko) * 2003-04-30 2005-08-26 삼성전자주식회사 고속 움직임 추정을 위한 참조 픽쳐 및 블록 모드 결정방법, 그 장치, 블록 모드 결정 방법 및 그 장치
JP4066882B2 (ja) * 2003-05-22 2008-03-26 トヨタ自動車株式会社 車載燃料電池発電システムの制御装置および制御方法
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US7251372B2 (en) * 2004-01-14 2007-07-31 Nec Solutions (America) Inc. Method and system for compressing digitized fingerprint images by a uniform degree of compression
US20060227865A1 (en) * 2005-03-29 2006-10-12 Bhaskar Sherigar Unified architecture for inverse scanning for plurality of scanning scheme
KR101088375B1 (ko) 2005-07-21 2011-12-01 삼성전자주식회사 가변 블록 변환 장치 및 방법 및 이를 이용한 영상부호화/복호화 장치 및 방법
US20070025345A1 (en) * 2005-07-27 2007-02-01 Bachl Rainer W Method of increasing the capacity of enhanced data channel on uplink in a wireless communications systems
EP1958453B1 (en) 2005-11-30 2017-08-09 Koninklijke Philips N.V. Encoding method and apparatus applying coefficient reordering
US8595281B2 (en) 2006-01-11 2013-11-26 Qualcomm Incorporated Transforms with common factors
US8849884B2 (en) 2006-03-29 2014-09-30 Qualcom Incorporate Transform design with scaled and non-scaled interfaces
KR100882949B1 (ko) 2006-08-17 2009-02-10 한국전자통신연구원 화소 유사성에 따라 적응적인 이산 코사인 변환 계수스캐닝을 이용한 부호화/복호화 장치 및 그 방법
KR100927733B1 (ko) * 2006-09-20 2009-11-18 한국전자통신연구원 잔여계수의 상관성에 따라 변환기를 선택적으로 이용한부호화/복호화 장치 및 그 방법
US8542726B2 (en) * 2006-10-17 2013-09-24 Microsoft Corporation Directional and motion-compensated discrete cosine transformation
KR20090097013A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 영상 부호화장치 및 영상 복호화장치
KR20090129926A (ko) * 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
KR101619972B1 (ko) 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
US9497472B2 (en) 2010-11-16 2016-11-15 Qualcomm Incorporated Parallel context calculation in video coding
US8976861B2 (en) * 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
JP5741076B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
CN107105281B (zh) * 2010-12-14 2019-11-12 M&K控股株式会社 用于解码运动画面的设备
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US9049444B2 (en) * 2010-12-22 2015-06-02 Qualcomm Incorporated Mode dependent scanning of coefficients of a block of video data
US20130003857A1 (en) * 2011-06-29 2013-01-03 General Instrument Corporation Methods and system for using a scan coding pattern during inter coding
US9756360B2 (en) 2011-07-19 2017-09-05 Qualcomm Incorporated Coefficient scanning in video coding
US8848261B1 (en) * 2012-02-15 2014-09-30 Marvell International Ltd. Method and apparatus for using data compression techniques to increase a speed at which documents are scanned through a scanning device
US10304217B2 (en) * 2012-07-30 2019-05-28 Toshiba Medical Systems Corporation Method and system for generating image using filtered backprojection with noise weighting and or prior in
US9826229B2 (en) 2012-09-29 2017-11-21 Google Technology Holdings LLC Scan pattern determination from base layer pixel information for scalable extension
US9350988B1 (en) 2012-11-20 2016-05-24 Google Inc. Prediction mode-based block ordering in video coding
US9681128B1 (en) 2013-01-31 2017-06-13 Google Inc. Adaptive pre-transform scanning patterns for video and image compression
US10630985B2 (en) * 2016-05-27 2020-04-21 Samsung Electronics Co., Ltd. Method for scanning coding blocks inside a video frame by video codecs
WO2018008678A1 (ja) * 2016-07-08 2018-01-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 復号装置、符号化装置、復号方法及び符号化方法
US10887589B2 (en) * 2019-04-12 2021-01-05 Realnetworks, Inc. Block size determination for video coding systems and methods

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4821119A (en) * 1988-05-04 1989-04-11 Bell Communications Research, Inc. Method and apparatus for low bit-rate interframe video coding
US5241395A (en) * 1989-08-07 1993-08-31 Bell Communications Research, Inc. Adaptive transform coding using variable block size
US5021891A (en) 1990-02-27 1991-06-04 Qualcomm, Inc. Adaptive block size image compression method and system
US5107345A (en) 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
DE69222766T2 (de) 1991-06-04 1998-05-07 Qualcomm Inc System zur adaptiven kompression der blockgrössen eines bildes
KR960013055A (ko) * 1994-09-27 1996-04-20 김광호 조건부 퀴드트리 분할방식의 화상압축방법 및 장치
JPH08205140A (ja) * 1995-01-31 1996-08-09 Canon Inc 画像圧縮装置
US5812788A (en) * 1995-07-21 1998-09-22 Intel Corporation Encoding/decoding video signals using quantization tables based on explicitly encoded base and scale matrices
US6028635A (en) * 1996-12-03 2000-02-22 Stmicroelectronics, Inc. Reducing the memory required for decompression by storing compressed information using DCT based techniques
JP3901287B2 (ja) 1997-02-27 2007-04-04 松下電器産業株式会社 映像信号変換装置、映像信号変換方法及び映像提供システム
US6529634B1 (en) 1999-11-08 2003-03-04 Qualcomm, Inc. Contrast sensitive variance based adaptive block size DCT image compression
US6600836B1 (en) 2000-01-28 2003-07-29 Qualcomm, Incorporated Quality based image compression

Also Published As

Publication number Publication date
KR20040010722A (ko) 2004-01-31
WO2002104039A1 (en) 2002-12-27
US6870963B2 (en) 2005-03-22
AU2002315160B2 (en) 2007-11-15
HK1166429A1 (zh) 2012-10-26
CA2450733A1 (en) 2002-12-27
KR100932412B1 (ko) 2009-12-17
CN1593064A (zh) 2005-03-09
AU2002315160C1 (en) 2008-07-03
ES2584035T3 (es) 2016-09-23
US20030007698A1 (en) 2003-01-09
EP1405524A1 (en) 2004-04-07
CN102238389A (zh) 2011-11-09
MXPA03011623A (es) 2004-07-01
BR0210418A (pt) 2006-11-14
EP2405657A1 (en) 2012-01-11
EP2405657B1 (en) 2016-06-01
EP1405524B1 (en) 2013-03-27
CA2450733C (en) 2012-12-11

Similar Documents

Publication Publication Date Title
KR100932412B1 (ko) 구성가능한 패턴 옵티마이저
JP4927888B2 (ja) ゴロム・ライスを使用する無損失フレーム内符号化
JP5384696B2 (ja) 分散に基づいた適応性ブロックサイズdct画像圧縮
JP5107495B2 (ja) 品質ベースのイメージ圧縮
KR100926381B1 (ko) Golomb-rice 코딩을 사용한 dct 압축
JP4870743B2 (ja) デジタルイメージに対する選択的なクロミナンスデシメーション
JP2015039176A (ja) ディジタル画像および音声データを無損失に復号化するためのシステムおよび方法
AU2002315160A1 (en) Configurable pattern optimizer
JP2004528791A (ja) インターフレーム符号化方法および装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050601

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080116

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080123

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080213

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080331

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081001

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081016

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20081219

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100706

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100709

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100813

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100819

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100913

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100916