JP2021520728A - 画像圧縮のためのさらに改善された方法及び装置 - Google Patents

画像圧縮のためのさらに改善された方法及び装置 Download PDF

Info

Publication number
JP2021520728A
JP2021520728A JP2020554294A JP2020554294A JP2021520728A JP 2021520728 A JP2021520728 A JP 2021520728A JP 2020554294 A JP2020554294 A JP 2020554294A JP 2020554294 A JP2020554294 A JP 2020554294A JP 2021520728 A JP2021520728 A JP 2021520728A
Authority
JP
Japan
Prior art keywords
group
sample
code
bits
significant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020554294A
Other languages
English (en)
Other versions
JPWO2019191811A5 (ja
Inventor
スコット タウプマン、デイビッド
スコット タウプマン、デイビッド
Original Assignee
カカドゥ アール アンド ディー ピーティーワイ リミテッド
カカドゥ アール アンド ディー ピーティーワイ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2018901112A external-priority patent/AU2018901112A0/en
Application filed by カカドゥ アール アンド ディー ピーティーワイ リミテッド, カカドゥ アール アンド ディー ピーティーワイ リミテッド filed Critical カカドゥ アール アンド ディー ピーティーワイ リミテッド
Publication of JP2021520728A publication Critical patent/JP2021520728A/ja
Publication of JPWO2019191811A5 publication Critical patent/JPWO2019191811A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

本発明は、画像圧縮のための改善された方法及び装置に関し、特に、これに限定されるものではないが、JPEG2000規格とともに使用するための、圧縮のための改善されたブロック符号化装置及び方法に関する。静止画像、ビデオ・フレーム、又は関連メディアから導出される、ブロック及びサブバンド・サンプルを符号化及び復号するための方法であって、3つのビット・ストリームと、サンプルをブロックから規定のグループへと分割することとを含む、方法が提供される。第1のビット・ストリームが、グループ全体の有意性を符号化する。第2のビット・ストリームが、各グループ内の個々のサンプルの有意性を符号化する。第2のビット・ストリームはまた、各有意なグループの符号なし残差値も符号化する。第3のビット・ストリームが、有意なサンプル値を表すのに必要な符号ビット及び任意の追加の大きさビットを提供する。指数予測子が、ブロック内の先行するサンプルと関連付けられる指数境界と追加の大きさビットの両方を使用して計算される。

Description

本発明は、画像圧縮のための改善された方法及び装置に関し、特に、ただしこれに限られることなく、画像圧縮のための改善されたブロック符号化装置及び方法に関する。
画像圧縮システムが既知である。JPEG及びJPEG2000が、画像圧縮のための一般的な規格である。
JPEG2000は、多くの多様な分野に用途を見出す豊富な特徴セットを提供する。最も重要な特徴の一部は、以下のとおりである。
圧縮効率
品質スケーラビリティ
解像度スケーラビリティ
関心領域アクセス可能性
並列処理
反復的符号化を必要としない最適化されたレート制御
視覚的に関連する最適化目標を標的化することができる
エラー耐性
圧縮ドメイン(すなわち、非常にローメモリの)転置及びフリップ動作
コード・ブロック、区域又はJ2Kパケットのレベルにおいて情報を並べ直すことができる
これらの特徴のほとんどは、EBCOTアルゴリズム(切り捨てが最適化された埋め込みブロック符号化:Embedded Block Coding with Optimized Truncation)の使用から導き出され、一方、階層的離散ウェーブレット変換(DMT、Discrete Wavelet Transform)の使用も、重要な役割を果たす。
これらの核心的な特徴に加えて、JPEG2000規格スイートは、以下の用途に対する良好なサポートを提供する。
JPIPを介した映像(ビデオ及びアニメーションを含む)の効率的且つ反応のよい遠隔対話的閲覧
膨大な映像ソースからの任意の領域の効率的なオンデマンドのレンダリング
非線形トーン・カーブ及び/又はカスタム浮動小数点マッピングを使用することによる高ダイナミック・レンジ圧縮
豊富なメタデータ・アノテーション
ハイパースペクトル及びボリューメトリック・コンテンツの効率的な圧縮
JPEG2000規格の1つの重大な欠点は、計算複雑度である。JPEG2000は効率的なハードウェア・ソリューションを標的化するために使用することができる多くのモードを提供するため、これがハードウェア実施にとってどれほど重大な制限であるかは直ちに明らかにはならない。また、ほぼどのような表示可能なサイズの画像でも、モバイル・デバイスを含む現代のプラットフォーム上でほぼ瞬時にレンダリングすることができるのに十分に、ソフトウェア実施態様は効率的である。しかしながら、ビデオ用途及び特に電力が意識される用途にとって、圧縮及びレンダリングの複雑度は問題になり得る。
先行する国際特許出願PCT/AU2017/050484は、高速ブロック符号化アルゴリズムを組み込んだ、画像圧縮のための改善された方法及び装置を開示している。この先行出願の開示は、参照により本明細書に組み込まれる。
国際特許出願PCT/AU2017/050484
第1の態様によれば、本発明は、静止画像、ビデオ・フレーム、又は関連メディアから導出される、サブバンド・サンプル値のブロックを符号化するための方法であって、3つのビット・ストリームと、サンプルをブロックから規定のグループへと分割することとを含み、
a.第1のビット・ストリーム(MELビット・ストリーム)が、因果関係のある隣接グループがすべて非有意であるグループ(AZCグループ)全体の有意性を符号化し、非ゼロの大きさを有するサンプルは有意であると識別され、ゼロの大きさを有するサンプルは非有意であると識別され、
b.第2のビット・ストリーム(VLCビット・ストリーム)が、有意なAZCグループであるか、又は、AZCグループでないかのいずれかである各グループ内の個々のサンプルの有意性を符号化し、
c.上記第2のビット・ストリーム(VLCビット・ストリーム)はまた、指数予測子(exponent predictor)のセットに加えられると、グループ内の各有意なサンプルの大きさ指数の上限を与える、各有意なグループの符号なし残差値も符号化し、
d.第3のビット・ストリーム(MagSgnビット・ストリーム)は、対応する指数境界を所与として、有意なサンプル値を表すのに必要な符号ビット及び任意の追加の大きさビットを提供し、
e.上記指数予測子は、ブロック内の先行するサンプルがブロックの境界の外部にある場合を除いて、ブロック内の先行するサンプルと関連付けられる指数境界と追加の大きさビットの両方を使用して計算される、
方法を提供する。
第2の態様によれば、本発明は、静止画像、ビデオ・フレーム、又は関連メディアを生成する、サブバンド・サンプル値のブロックを復号するための方法であって、そのようなサンプルは、規定のグループに構成されており、3つのビット・ストリームを使用して表され、
a.第1のビット・ストリーム(MELビット・ストリーム)が、因果関係のある隣接グループがすべて非有意であるグループ(AZCグループ)全体の有意性を発見するために復号され、非ゼロの大きさを有するサンプルは有意であると識別され、ゼロの大きさを有するサンプルは非有意であると識別され、
b.第2のビット・ストリーム(VLCビット・ストリーム)が、有意なAZCグループであるか、又は、AZCグループでないかのいずれかである各グループ内の個々のサンプルの有意性を発見するために復号され、
c.上記第2のビット・ストリーム(VLCビット・ストリーム)の復号はまた、指数予測子のセットに加えられると、グループ内の各有意なサンプルの大きさ指数の上限を与える、各有意なグループの符号なし残差値を発見するためにも使用され、
d.第3のビット・ストリーム(MagSgnビット・ストリーム)は、対応する指数境界を所与として、各有意なサンプルの値を推測するために使用される符号ビット及び任意の追加の大きさビットを発見するためにアンパックされ、
e.上記指数予測子は、ブロック内の先行するサンプルがブロックの境界の外部にある場合を除いて、ブロック内の先行して復号されているサンプルと関連付けられる指数境界と追加の大きさビットの両方を使用して計算される、
方法を提供する。
第3の態様によれば、本発明は、サブバンド・サンプル値のブロックを符号化するための装置であって、本発明の第1の態様の方法を実施するように構成されている処理装置を含む、装置を提供する。
実施例において、装置は、プロセッサと、メモリと、本発明の第1の態様の方法を実施するためのソフトウェア・プロセスを実施するオペレーティング・システムとを備えることができる。他の実施例において、装置は、本方法を実施するハードウェア、又は、本方法を実施するハードウェアとソフトウェアとの混合物を含むことができる。
第4の態様によれば、本発明は、サブバンド・サンプルのブロックを復号するための装置であって、本発明の第2の態様の方法を実施するように構成されている処理装置を含む、装置を提供する。
実施例において、装置は、プロセッサと、メモリと、本発明の第2の態様の方法を実施するためのソフトウェア・プロセスを実施するオペレーティング・システムとを備えることができる。他の実施例において、装置は、本方法を実施するハードウェア、又は、本方法を実施するハードウェアとソフトウェアとの混合物を含むことができる。
第5の態様によれば、本発明は、本発明の第1の態様による方法を実施するようにコンピュータを制御するための命令を含む、コンピュータ・プログラムを提供する。
第6の態様によれば、本発明は、本発明の第5の態様によるコンピュータ・プログラムを提供する、不揮発性コンピュータ可読媒体を提供する。
第7の態様によれば、本発明は、本発明の第5の態様によるコンピュータ・プログラムを含む、データ信号を提供する。
第8の態様によれば、本発明は、本発明の第2の態様の方法を実施するようにコンピュータを制御するための命令を含む、コンピュータ・プログラムを提供する。
第9の態様によれば、本発明は、本発明の第8の態様によるコンピュータ・プログラムを提供する、不揮発性コンピュータ可読媒体を提供する。
第10の態様によれば、本発明は、本発明の第8の態様によるコンピュータ・プログラムを含む、データ信号を提供する。
例としてのみ与えられ添付の図面を参照する、本発明の実施例の以下の詳細な説明から、本発明の特徴及び利点が明らかになる。
一実施例による、TERMINATION(終端)モード・フラグあり/なしで生成される符号語セグメントを示すFASTコーディング・パス、及び、符号化器によって生成され、最終的にコード・ストリームに放出され得るコーディング・パスの実例を示す図である。 一実施例による、FAST Cleanup(クリーンアップ)パス及び符号化プロセスの概観を示す図である。 一実施例による、FAST Cleanupパス復号プロセスの概観を示す図である。 一実施例による、3つのバイト・ストリームを有する、FASTブロック・コーダのCleanupパスの符号語構造を示す図である。 H=3本のライン及び奇数幅Wを有するコード・ブロックを示す、正方形2×2グループによるラインがインターリーブされた走査順序を示す図である。 一実施例による、それぞれ、コード・ブロック内の最初のものでないライン対及び最初のライン対に見出される2×2グループの符号化コンテクストを形成するために使用される重要性近傍情報(significance neighborhood information)を示す図である。 一実施例による、最初のものでないグループ行内の指数予測子の形成を示す図である。 一対のグループからのVLCビットのインターリーブを示す図である。ビット・カウント範囲は、コード・ブロックの最初のものでないグループ行に適用可能である。図の下部にある矢印は、復号依存関係を明らかにしている。 FASTブロック符号化アルゴリズムの使用が示されている、JPEG2000パケット・ヘッダに記録されている可能なコーディング・パス寄与を示す図である。
本発明の一実施例は、IS15444−1(JPEG2000パート1)の付属書C及びDに記載されている元のJPEG2000ブロック符号化アルゴリズムの当座の代替に関する。本明細書全体を通じて、「J2K−1ブロック・コーダ」及び「J2K−1アルゴリズム」という用語は、IS15444−2(JPEG2000パート2)、IS15444−3(モーションJPEG2000)、IS15444−6(複合文書圧縮)及びIS15444−9(JPIP)を含む他のJPEG2000規格にとっても中心的である、このブロック符号化アルゴリズムを識別するために使用されるものとする。JPK−1アルゴリズムの当座の代替として、本実施例において記載されているブロック符号化アルゴリズムは、ほとんどの既存の特徴を保持しながら、スループットを劇的に増大させるために、これらの他の規格とともに使用されることが可能である。
重要なことには、本明細書において記載されているブロック符号化アルゴリズムは、J2K−1アルゴリズムを使用して生成されているコード・ストリームへの/からの完全に損失のないコード変換を可能にする。
本明細書に記載されているブロック符号化アルゴリズムと関連付けられる複雑度の劇的な低減の代償として、圧縮効率がわずかに低減し、加えて、JPEG2000の品質スケーラビリティ特徴がなくなる(又はほぼなくなる)。
品質スケーラビリティは、特に、品質スケーラビリティが本質的に通信の大きな節約及び/又は閲覧アプリケーションの応答性の増大につながる、JPIPを介した対話的閲覧アプリケーションにとって重要である。品質スケーラビリティはまた、配信システムにおいても重要であり得、これは、必要な場合に画像/ビデオ・アーカイブの漸進的な劣化に対する見事な解決策を提供し、また、すべてが多くのアプリケーションにとって重要であるコンテンツの選択的保護及び/又は暗号化も可能にする。しかし、都合のよいことに、本実施例における提案されているアルゴリズムのコード変換特徴は、メディア・システム内の性能及び電力消費目標を管理するために、画像、ビデオ・フレーム、ボリューム、又は画像若しくはボリューム内の個々の領域と関連付けられるブロック・ビット・ストリームを選択的にコード変換することによって、品質スケーラビリティを随意に取り戻し又は一時的に放棄することができることを意味する。
本発明においては、提案されている手法にFBCOT(切り捨てが最適化されたFASTブロック・コーダ:FAST Block Coder with Optimized Truncation)という用語を使用する。これは、元のEBCOTアルゴリズムの「埋め込み」特性が大きく(完全にではないが)失われており、ただし、圧縮後速度歪み最適化は依然として実施することができるためである。本明細書全体を通じて、FASTという用語は単に、ブロック符号化アルゴリズム自体を指すために使用され、一方、FBCOTは、このアルゴリズムと、レート制御アルゴリズムとの組合せを指す。
FBCOTアルゴリズムのレート制御態様は、他の場所において大きく取り上げられており、本明細書がFASTブロック・コーダ自体の詳細な説明に焦点を当てることが可能になっている。
本実施例において記載されているアルゴリズムは、特に低ビットレートにおいてその目標性能が他の手法よりも大幅に高かった、元々JPEG−XS CfPに応答して提案されたFBCOTアルゴリズムからの発展を表す。JPEG−XS評価プロセス中に、高スループットに対するJPEG2000拡張が、JPEG2000の規格ファミリパート15になることが期待される高スループットJPEG2000(HTJ2K)として知られる、別個の活動を通じて最良に管理されることが決定された。FBCOTアルゴリズム、及び、特に、そのFASTブロック・コーダの背後にある動機は、HTJ2K活動の動機と正確に一致する。
特に、本実施例の目標は、以下のとおりである。
1.HTJ2Kブロック符号化アルゴリズムが、J2K−1ブロック・ビット・ストリームへの/からの可逆的コード変換をサポートするものとする。
2.HTJ2Kを介してJPEG2000に導入される技術の影響は、コード・ブロック・ビット・ストリームの符号化及び復号のみに限定されるものとし、新たな符号化スタイルの存在をシグナリングするためのコード・ストリーム/タイル部分ヘッダ・マーカに必要とされる必然的な変化以外の、パケット・ヘッダ構文を含むコード・ストリーム構文に影響を及ぼさない。
3.HTJ2Kブロック復号器は、平均して、コード変換されたコンテンツ及びHTJ2Kを使用して直接的に符号化されたコンテンツを含む、実際の適用において重要である範囲の条件にわたって一般的な商用Kakadu(商標)ツールキット(脚注1)内でのJ2K−1ブロック復号器実施態様よりも少なくとも10倍高速であるものとする。
4.HTJ2Kブロック符号化器は、平均して、実際の適用において重要である範囲の条件にわたって、Kakadu(商標)内でのJ2K−1ブロック符号化器実施態様よりも少なくとも10倍高速であるものとする。
5.HTJ2Kブロック符号化アルゴリズムの符号化効率は、平均して、実際の適用において重要である範囲の条件にわたって、J2K−1ブロック符号化アルゴリズムよりも15%を超えて不良ではないものとする。
本明細書においては、すべてHTJ2K規格について予期される枠組み内で実現することができる、本明細書において記載されているFBCOTアルゴリズムから受益することができる3つの適用領域を記載する。
高解像度ビデオ・キャプチャ
ほとんどのモバイル・デバイスは、J2K−1ブロック符号化アルゴリズムが使用される場合、それらの画像センサが生成することが可能である高解像度ビデオ・ストリームを直接的に圧縮するのに十分なCPU能力を有しない。FASTブロック符号化オプションは、圧縮ストリームがリアルタイムで生成されることを可能にし、例えば、JPIPを介した効率的な対話的閲覧のために、品質スケーラビリティ属性が重要である場合に、後にJ2K−1表現にコード変換されることを可能にすることによって、この問題に対処する。コード変換は、任意の2つの圧縮フォーマットの間で可能であるが、本明細書において記載されているFBCOTアルゴリズムの利点は、以下のとおりである。
a)コード変換は、変換された領域において行うことができる。
b)コード変換は、たとえ圧縮自体が損失を伴うものであったとしても、本質的に損失を伴わない。
c)コード変換は必要に応じて選択的に、コード・ブロック単位にさえ行うことができる。
エネルギー効率的な画像/ビデオのレンダリング
JPEG2000の多くの用途において、コンテンツは複数回レンダリングされる。例えば、大きい画像は、連続的にレンダリングされるビューが一般的に多くのコード・ブロックを含むような解像度又は関心領域によって対話的に閲覧される。完全に解凍されたコード・ブロックをメモリ内にキャッシュすることはほとんど実際的ではなく、FASTブロック符号化オプションが利用可能であるということは、インテリジェントなコンテンツ・キャッシュが、繰り返しアクセスされているコード・ブロックを、より迅速に又はより少ないエネルギー消費で復号することができる表現にコード変換することを選択することができることを意味する。本明細書において記載されているアルゴリズムの利点は、J2K−1ブロック・ビット・ストリームからFASTブロック・ビット・ストリームへのコード変換が、計算効率的であるとともに、全体的に損失がなく、元のJPEG2000表現のすべての態様が正確に保持されることである。
クラウドに基づくビデオ・サービス
JPEG2000は、送達点に近い関心解像度(又はさらには領域)が効率的に抽出されることを可能にする、ビデオ・コンテンツの中間配布フォーマットとしての優れた枠組みを提供し、これを受けて、ビデオ・コンテンツは、いくつかの一般的なストリーミング・ビデオ・フォーマットのうちのいずれかにコード変換することができる。この使用はすでに実行可能であり、他の手法よりも好都合である可能性があるが、そのような適用は、すべての他の関連機能を保持する、軽量ブロック・コーダが利用可能であることから、さらに受益することができる。
J2K−1ブロック符号化アルゴリズムの簡潔な概説
IS15444−1に記載されているものとしてのJ2K−1ブロック・コーダは、一連のコーディング・パスを通じて各コード・ブロック内のサブバンド・サンプルを処理する。次の節において、FASTブロック符号化アルゴリズムの異なる、しかしなお関連するコーディング・パス構造を説明するために、これを簡潔に見直すことが有用である。
X[n]が、位置n=(n,n)によってインデックス付けされる、コード・ブロック内のサンプルを示すものとし、0≦n<Wは水平位置を表し、0≦n<Hは垂直位置を示し、Wはコード・ブロック幅であり、Hはコード・ブロックの高さである。各コーディング・パスはビットプレーン・インデックスp≧0に属し、それに関連して、サンプルX[n]の量子化された大きさが、以下によって与えられる。
Figure 2021520728

ここで、Δは、可逆的符号化手順については存在しない、量子化ステップ・サイズである。
本明細書においては、M[n]≠0である場合、サンプルX[n]はビットプレーンpに関して「有意」であると言う。
最も精細なビットプレーン(最高品質)は、p=0に対応し、一方、最も粗い品質はp=K−1に対応し、Kはコード・ストリーム・ヘッダに記録されているサブバンド特有のパラメータによって決定される、所与のサブバンドに属する任意のコード・ブロックのビットプレーンの最大数である。
各コード・ブロックについて、パラメータMstartが、関連するJPEG2000パケット・ヘッダを介して通信され、これは、コード・ブロックの表現内の失われたビットプレーンの数として解釈される。J2K−1ブロック復号器は、コード・ブロック内のすべてのサンプルがビットプレーンp≧K−Mstart内で有意でないと予測することを認められる。同等に、有意なサンプルを含み得るビットプレーンの総数は、以下によって与えられる。
P=K−Mstart
第1のJ2K−1コーディング・パスは、ビットプレーンp=P−1の有意性情報及び符号(有意なサンプルのみについて)を符号化する。このコーディング・パスは、「Cleanup」パスとして識別される。重要なことに、このCleanupパスにおいて符号化される任意の有意なサンプルは、大きさ1を有しなければならない。
次により精細な各ビットプレーンについて、「SigProp」(有意性伝播)及び「MagRef」(精度改善(magnitude refinement))コーディング・パスとして識別される、3つのコーディング・パスが生成される。このとき、合計して、以下の構造を有する3P−2個のコーディング・パスが存在する。
Cleanup(p=P−1):すべてのサンプルの、ビットプレーンp内の有意性+有意サンプルの符号を符号化する。
SigProp(p=P−2):プレーンp内の、既知の有意サンプルの、それらの有意性(及び符号)を符号化する、非有意隣接サンプルを訪問する。
MagRef(p=P−2):M[n]の最下位ビットを符号化する、プレーンp+1に関してすでに有意であったサンプルを訪問する。
Cleanup(p=P−2):有意性がまだ確立されていなかったすべてのサンプルの、ビットプレーンp内の有意性(及び符号)を符号化する。
SigProp(p=P−3):…
MagRef(p=P−3):…
Cleanup(p=P−3):…

Cleanup(p=0):…
符号化器は、最終的なコード・ストリームに含まれる情報から、任意の数の最後方のコーディング・パスを削除し得ることに留意されたい。事実、符号化器は、そのようなコーディング・パスが削除されることになると合理的に予期することができる場合、そもそもそのようなコーディング・パスを生成する必要がない。
J2K−1ブロック・コーダのすべてのコーディング・パスは、4本のライン・ストライプを有するストライプ指向の走査パターンを採用する。各ストライプの列は、左から右へと訪問され、その後、次のストライプに移動し、一方、各ストライプ列の内部で、ストライプ列の4つのサンプルが、上から下へと走査される。
ブロック・コーダは、Cleanupパス内のすべてのシンボルの算術符号化を利用するが、任意選択的に、特定のSigProp及びMagRefコーディング・パスについて、未処理の(符号化されていない)ビットを放出することができる。未処理のビットが非Cleanupパスについて放出されるこのモードは、関連するCOD/COCマーカ・セグメント内のコード・ブロック・スタイル・フィールドのビット0(LSB)によって識別されるものとして、「算術コーダ・バイパス」モード、又は略して単に「BYPASS(バイパス)」モードとして識別される。
FASTブロック符号化アルゴリズムの概説
コーディング・パス構造
FASTブロック・コーダも、ビットプレーンpに対して定義されるCleanup、SigProp及びMagRefコーディング・パスを有するコーディング・パス構造を採用する。しかしながら、重要なことに、各ビットプレーンpと関連付けられるCleanupパスは、M[n]≠0であるサンプルの大きさM[n]及び符号を完全に符号化する。この情報は、それらのコード・ストリームへの放出における点が存在しないように、すべての先行する(pがより大きい)コーディング・パスと関連付けられるものを完全に包含する。
これによって、最初に放出されるコーディング・パスがCleanupパスである限り、符号化器により先頭と最後方の両方のコーディング・パスが削除され得る(又は決して生成され得ない)ということになる。事実、符号化器は、最終的なコード・ストリーム内の任意の所与のコード・ブロックについて、決して、4つ以上のコーディング・パスを含むことを必要としない。図1は、FASTブロック符号化器によって生成され、及び/又は、最終的なコード・ストリームに放出され得るコーディング・パスを示す。
復号器の観点から、JPEG2000パケット・ヘッダを解析することによって復元されるMstart値は依然として、そのコード・ブロックについて最初に利用可能なコーディング・パスと関連付けられるビットプレーン・インデックスp=K−Mstart−1を識別する役割を果たす。しかしながら、FAST Cleanupパスは任意の所与のサンプルの複数の大きさビットを符号化することができるため、Mstartはもはや、すべて0である先頭の大きさビットの数として解釈することはできない。符号化器は、Mstartが、各コード・ブロックについての非ゼロの長さを有する、最初に放出されるコーディング・パスを正確に記述することを保証するために、慎重であるべきである。
注記:確認されるように、FAST Cleanupパスは、必ず少なくとも2バイトを含む。コード・ストリームの書き手が、ゼロの長さを有する最初のコーディング・パスを識別するパケット・ヘッダを生成することを可能にすることが好都合であり得る。これは、これらのコーディング・パスが、FASTブロック・コーダを使用するためにコード変換されているJ2K−1符号化コード・ブロックからのコーディング・パスと関連付けられ得るためである。これによって、当該コード変換表現が、品質層とコード・ブロック切り捨て点との間の元の関係を失うことなく、元のJ2K−1表現にコード変換し直されることが可能である。
FASTブロック・コーダによって生成されるSigProp及びMagRefコーディング・パスは互いに依存せず、それらは、直前のCleanupパスのみに依存する。FASTブロック・コーダによって生成されるSigProp及びMagRefコーディング・パスは、J2K−1ブロック・コーダの対応するコーディング・パスと正確に同じ情報を符号化し、その結果、Cleanup、SigProp又はMagRefパスの終わりの表現の切り捨てと関連付けられる実効的な量子化は、FASTブロック符号化アルゴリズムが使用されるか、又は、J2K−1アルゴリズムが使用されるかにかかわらず、同じである。
SigPropパスからのすべての有意性及び関連する符号情報は、未処理の2進数として放出され、MagRefパスからのすべての精度改善情報は未処理の2進数として放出され、これらの未処理のビット・ストリームは、FF90h〜FFFFhの範囲内の偽マーカ・コード(false marker code)の出現を回避するために、J2K−1アルゴリズムによって使用されるビット・スタッフィング手順のみを受ける(脚注2)。
FASTブロック符号化アルゴリズムによって採用されるMagRefパスは、コード・ビットがリトル・エンディアン・ビット順序でバイトにパックされることを除いて、BYPASSモードにおいて動作するJ2K−1アルゴリズムのものと同一である。すなわち、バイト内の最初のコード・ビットが、そのMSBとは反対に、そのLSB内に現れる。
FASTブロック符号化アルゴリズムによって採用されるSigPropコーディング・パスも、BYPASSモードにおいて動作するJ2K−1ブロック・コーダのものと非常に類似しているが、以下の2つの違いがある。
1.J2K−1ブロック・コーダがビッグ・エンディアン・ビット・パック順序を使用する一方で、コード・ビットはここでもリトル・エンディアン・ビット順序で未処理のビット・ストリームのバイトにパックされる。
2.J2K−1ブロック・コーダが同じサンプルの大きさビットの直後に任意の必要な符号ビットを挿入する一方で、1つ又は複数のストライプ列と関連付けられる有意性ビットが最初に放出され、続いて、関連する符号ビットが放出され、その後、次のストライプ列セットに進む。
これらの修正はともに、特にソフトウェアに基づく実施態様について、J2K−1アルゴリズムの方法にまさる、実施上の利点を有する。上記でリストされている第2の修正は、穏当なルックアップ・テーブルに基づく加速された復号を可能にするように、慎重に作成されることが留意される。
ブロック符号化アルゴリズム自体を別とすると、FASTブロック・コーダは、他のJPEG2000コード・ストリーム構造又はそれらの解釈に影響を及ぼさない。区域、パケット、タイル、変換、及びすべての他のJPEG2000要素は変化しないままである。特に、JPEG2000パケットの構造は、ブロック・コーダによって生成される符号語セグメントに依存する。
符号語セグメントは、長さが必ずパケット・ヘッダを介して識別される、バイト・シーケンスである。J2K−1ブロック・コーダは、すべてのコーディング・パスを単一の符号語セグメントにパックすることができ(デフォルト・モード)、一方、TERMINATIONモードにおいては、各コーディング・パスがそれ自体の符号語セグメントを割り当てられ、一方、TERMINATIONのないBYPASSモードにおいては、連続するSigProp及びMagRefコーディング・パスが、単一の符号語セグメントに割り当てられる。
FAST Cleanupパスは、常にそれ自体の符号語セグメントを割り当てられ、そのため、BYPASSモードには影響がない。しかしながら、TERMINATIONモードは影響を受ける。
CAUSAL(因果関係)モード・フラグも、SigPropコーディング・パスによって表される情報に影響を及ぼすため、J2K−1ブロック・ビット・ストリームへの/からの完全に可逆的なコード変換を保証するために、FASTブロック・コーダによってサポートされる。
SEGMARK、ERTERM、RESET及びBYPASSモード・フラグは、FASTブロック・コーダに関連して見出されるとき、無視されるが、これらのフラグはすべて、J2K−1ブロック・コーダに基づくコード・ストリームからFASTブロック・コーダに基づくコード・ストリームへの、及び再び逆に戻す真に可逆的なコード変換をサポートするために保持することができる。
Cleanupパス概説
本明細書の大部分は、FASTブロック・コーダのCleanupパスの説明に割かれる。エラー!引用元が見当たりません。図2及び図3は、エラー!引用元が見当たりません。それぞれ符号化及び復号プロセスの要約ブロック図を提供する。
これらの図面内の記憶要素は、コード・ブロックのサンプル、及び何らかの推定状態情報を記憶することができるバッファを表す。符号化中、記憶要素には、サブバンド・サンプルがデータ投入され、その後、導出される量(有意性フラグ及び大きさ指数)を直ちに求めることができる。復号中、記憶要素には、復号が進行するにつれて、サブバンド・サンプル及び導出される量(有意性フラグ及び大きさ指数)が漸進的にデータ投入される。記憶要素は、必ずしもコード・ブロック全体のすべてのサンプル又は導出される量に対応する必要はなく、物事をこのように概念化することが最も容易である。
Cleanupパスの重要な特徴は、その符号語セグメントが、実際には、異なる方向に成長する3つのバイト・ストリームから成ることである。これらの別個のビット・ストリームは、ビット・スタッフィングを受け、FF90h〜FFFFhの範囲内の偽マーカ・コードの出現を回避するように、3つのバイト・ストリームにパックされる。符号語セグメント全体に偽マーカ・コードがなく、FFhで終端しないように、バイト・ストリームを単一のCleanup符号語セグメントに組み合わせることにも注意が払われ、これはすべてのJPEG2000符号語セグメントにとって基本要件である。
この3ビット・ストリーム構成には、単一のインターリーブ・ビット・ストリームとは明確に異なる利点がある。特に、3ビット・ストリーム構成は、符号化アルゴリズム及び復号アルゴリズムの種々の要素間の重要な分離を可能にし、これらの要素が、並列に、又は、実施プラットフォームにとって最も有益である順序において実行されることを可能にする。ソフトウェア環境において、レジスタ及びベクトル処理ブロックは、3ビット・ストリーム編成を用いずに可能であるよりも、はるかに積極的に最適化することができる。ハードウェア実施態様において、3ビット・ストリーム編成は、より良好な同時性を提供し、ローカル・ストレージの実際の量が、2本又は3本程度と少ないコード・ブロック・ラインまで、非常に積極的に低減されることを可能にする。基本的に、アルゴリズムの種々の要素の最適な順序付けは、符号化と復号とで異なり、ハードウェア展開とソフトウェア展開とにおいて異なり、またベクトル処理長にも依存する。密にインターリーブされたビット・ストリームは、2つ以上の処理順序には一切対応することができず、一方、3ビット・ストリーム編成は、広範なプラットフォーム上での高効率的な実施態様を作成するのに必要な柔軟性を提供する。
Cleanupパス内で利用される3つのビット・ストリームは、本明細書においては「MELビット・ストリーム」(又は単にMELストリーム)、「VLCビット・ストリーム」(又は単にVLCストリーム)及び「MagSgnビット・ストリーム」(又は単にMagSgnストリーム)として既知である。
FAST Cleanupパス・アルゴリズムの詳細な説明
有意性値、指数値、Implicit−1(暗黙1)値及びMagSgn値
FAST Cleanupアルゴリズムを理解するために、関与する重要な量の定義を与えることから始める。すでに言及したように、Cleanupパスは、特定のビットプレーンpと関連付けられ、サンプルX[n]の大きさは、以下のように理解され、
Figure 2021520728

サンプルは、M[n]≠0である場合に、有意であると考えられる。サンプルの大きさ指数E[n]は、本明細書においては以下のように定義される。
Figure 2021520728

式中、
Figure 2021520728

は自然数の集合である。表1は、サンプル大きさMと指数Eとの間の関係の詳細な精緻化を可能にする。JPEG2000規格ファミリがサポートするサブバンド・サンプルの大きさは237まで(ただし、この値を含まない)であり、そのため、指数が38を超える必要はないことに留意されたい。
Figure 2021520728
サンプルは、その指数が非ゼロである場合にのみ有意であることが観察される。FAST Cleanupアルゴリズムは、有意性情報を明示的に符号化し、その後、必要なのは、各有意サンプルについて、符号χ[n]及びM[n]−1の値を符号化することのみである。この情報は、いわゆる「MagSgn」値に組み合わされる。
Figure 2021520728
非ゼロ指数は、指数予測子κ[n]のセットに関していわゆる「符号なし残差」を介して符号化される。この残差符号化プロセスの性質は、符号化情報が指数に対する境界しか与えることができないというものである。
[n]≧E[n]
[n]のU[n]個のLSBは、特に、各有意サンプルの符号及び大きさの完全な記述を提供する。しかしながら、境界が密であり(すなわち、U[n]=E[n])、E[n]>1であることを復号器が知ることができる場合、v[n]のU[n]個のLSBの間での最上位ビットは黙示的に1であることが分かるため、v[n]のU[n]−1個のLSBのみを放出することで十分である。
これを理解するために、「implicit−1」条件を定義する。
Figure 2021520728
このとき、有意サンプルのMagSgnビット・ストリームにパックされるv[n]からのLSBの数は、以下によって与えられる。
[n]=U[n]−i[n]
以下の小節は、各サンプルについて有意性情報及びU[n]値を符号化し、implicit−1条件i[n]を導出するために使用される方法の詳細な説明を与える。
便宜上、通常、文脈によって暗示されることを考慮して、上記で展開した表記から下付き文字p(ビットプレーン・インデックス)を削除することとし、一方、コード・ブロック内のサンプル位置を識別する2Dインデックスnを下付き位置に動かす。等価な表記は以下のようになる。M[n]≡M、E[n]≡E、U[n]≡U、κ[n]≡κ、i[n]≡i、及びv[n]≡v
注目に値する符号化アルゴリズムのいくつかの特徴が、ここで前もって下記に要約され得る。これらの特徴は、図2及び図3の符号化及び復号ブロック図内に容易に認めることができる。
1.コード・ブロック内のサブバンド・サンプルは、2×2グループg内で処理され、それらの各々が、当該グループ内の各サンプルの有意性を示す4ビット有意性パターンρを割り当てられる。
2.有意性パターンは、適応的MELCODE及び非適応的VLCコードのセットの、2つの異なる技法の組合せを使用して符号化される。
3.指数境界Uは、2×2グループ内のすべてのサンプルに共通である「符号なし予測残差」uを介して符号化され、その結果、グループg内のすべての位置nについてU=fpred(κ,u)となり、fpred()は、ほぼ常にκ+uを返す固定関数である。
4.予測子κは、それ自体はコード・ブロック内の先行するサンプルのMagSgn値に依存する、特定の先行して符号化されているサンプルの大きさ指数から導出される。
5.あるグループの有意性パターンρ及び符号なし予測残差uは、そのうちの一方(CxtVLCコード)が隣接有意性コンテクストcに依存して、テーブル検索手法に最良に適し、一方で他方(U−VLCコード)が必要な場合に直接的な計算に適している、2つのサブコードを伴うVLC符号化方式を使用してともに符号化される。
6.2×2グループの対のVLCコード・ビットは、所望される場合に4サンプル・グループが個々に符号化又は復号されることを可能にしながら、一度に8個のサンプルをともに符号化又は復号することを容易にするように、インターリーブされる。
ビット・スタッフィング及びバイト・ストリームのパック
言及したように、JPEG2000コード・ストリーム構造との互換性のために、FASTブロック・コーダのCleanupパスは、その長さが既存の方法を使用して関連パケット・ヘッダについて通信される、単一の符号語セグメントを生成する。しかしながら、FASTブロック・コーダにおいては、この符号語セグメントは、ビット・スタッフィングすること、及び、以下の3つのビット・ストリームからのビットをパックすることによって導出される、3つのバイト・ストリームに分割する。
A.そのパックされたバイトが符号語セグメントの始まりから前方に成長するMagSgnビット・ストリーム、
B.そのパックされたバイトが符号語セグメントの終わりから後方に成長するVLCビット・ストリーム、及び
C.そのパックされたバイトがMagSgnバイト・ストリームの終わりから前方に成長するMELビット・ストリーム。
本明細書においては、ビット・ストリーム及びバイト・ストリームと言う用語は、慎重に使用される。各ビット・ストリームは、符号化アルゴリズムによって生成されるビットの列から成り、一方、対応するバイト・ストリームは、最終的な符号語セグメント内での偽マーカ・コードの出現を回避する役割を果たすビット・スタッフィング・アルゴリズムを受ける、それらのビットがパックされるバイトから成る。前方及び後方に成長するバイト・ストリームの構成は図4に示されている。
ビットパック順序及びビット・スタッフィング
MagSgnビット・ストリームからのビットは、リトル・エンディアン順序でMagSgnビット・ストリームのバイトにパックされ、その結果、MagSgnビット・ストリームからの最初のビットが、MagSgnバイト・ストリームからの最初のバイトのLSB(ビット0)に現れる。バイトが一杯になると、バイトの値がFFhである場合、次のバイトのMSB(ビット7)が、値0を有するスタッフィング・ビットになり、その結果、バイトは利用可能なビットを7ビットしか有せず、7Fhの値を超えることができない。これは、連続するバイトからなるいずれの対も、FF80h〜FFFFhの範囲内の16ビットのビッグ・エンディアン符号なし整数を形成することができず、MagSgnビット・ストリームからパックされる15ビットごとに導入されるスタッフィング・ビットが最大で1であることを意味する。
復号器は、ビットをアンパックし、スタッフィング・ビットを除去する前に、FFhバイトによって、MagSgnバイト・ストリームを拡張すべきである。
注記:符号化器は、そうでなければMagSgnバイト・ストリームに放出される任意の終端FFhを廃棄することができ、一般的にそうすべきである。
MELビット・ストリームからのビットは、ビッグ・エンディアン順序でMELバイト・ストリームのバイトにパックされ、その結果、MELビット・ストリームからの最初のビットが、MELバイト・ストリームからの最初のバイトのMSB(ビット7)に見出される。バイトが満たされると、バイトの値がFFhである場合、次のバイトのMSB(ビット7)が、値0を有するスタッフィング・ビットになり、次のMELビットがそのバイトのビット6にパックされる。ここでも、これは、MELバイト・ストリームからの連続するバイトからなるいずれの対も、FF80h〜FFFFhの範囲内の値を有する16ビットのビッグ・エンディアン符号なし整数を形成することができず、MELビット・ストリームからパックされる15ビットごとに導入されるスタッフィング・ビットが最大で1であることを意味する。
VLCビット・ストリームからのビットはリトル・エンディアン順序でVLCバイト・ストリームのバイトにパックされるが、バイト自体は、符号語セグメントの終わりから後方に作用する。バイトが逆順に放出され、消費されるという事実は、異なるビット・スタッフィング手順が必要とされることを意味する。特に、Bcurが、符号化中にビットがパックされている現在のバイト、又は、復号中にビットがアンパックされている現在のバイトを示すものとし、Bprevが、符号化中に放出されている先行するバイト又は復号中に消費されている先行するバイトを示すものとする。Bprev>8Fhであり、Bcurの7つのLSBがすべて1である場合、BcurのMSBは、0であるべきであるスタッフィング・ビットである。Bcurが実際にはFAST Cleanup符号語セグメント内でBprevに先行することに留意すると、このビット・スタッフィング手順は、VLCバイト・ストリームからの連続するバイトから成るいずれの対も、任意のマーカ・セグメント内の外部のJPEG2000コード・ストリーム内で現れてはならないマーカ・コードの範囲内であるFF90h〜FFFFhの範囲内の値を有する16ビットのビッグ・エンディアン符号なし整数を形成できないことを確実にする。
インターフェース・ロケータ語(Interface Locator Word)を介したサフィックス長Sの通信
FAST Cleanupパスの符号語セグメントの長さLは常に、関連付けられるJPEG2000パケット・ヘッダ内で通信される。MELバイト・ストリーム及びVLCバイト・ストリームを含むこの符号語セグメントの部分は、Sバイトから成る符号語サフィックスとして識別される。L−Sが、符号語セグメントの前方に成長するMagSgnバイト・ストリーム部分とMELバイト・ストリーム部分との間のインターフェースを識別するため、Sの値は、インターフェース・ロケータ語(ILW)として確保されている12ビット内で符号化される。
12ILWビットは、符号語セグメント内の最後から2番目のバイトの4つのLSBとともに、符号語セグメント内の最後のバイトの8ビットに対応し、すべてのFAST Cleanup符号語セグメントは、2以上の長さL及びサフィックス長Sを有するべきである。ILWビットは、VLCバイト・ストリーム自体の中にあると考えられる。復号器は、ILWビットを読み取り、Sの値を復号し、その後、そこからVLCビットが抽出されるVLCバイト・ストリーム内の符号語セグメントの変更された最後の2バイトを含め、ILWビットを1で上書きすべきであるが、そのような抽出された最初の12ビットは破棄する。符号化器は、実際のVLCビットをパックする前に12個の1をVLCバイト・ストリームにパックすべきであり、その後、バイト・ストリームはCleanup符号語セグメントに組み合わされており、12個のILWビット位置は1を保持するはずであり、これは符号化サフィックス長Sと置き換えられるべきである。これらの手順は、VLCバイト・ストリームと関連付けられるビット・スタッフィング及びビット・アンスタッフィング手順が、サフィックス長自体に依存しないように動作することを確実にする。
VLCバイト・ストリームからの実際のVLCビットのアンパックは、そのバイト(Bcur)の4つのLSBを1とし、BprevをFFhとして、符号語セグメント内の最後から2番目のバイトのビット4から開始することができることに留意されたい。
サフィックス長Sは、以下のように12ILWビット内で符号化される。
S=BL−1+(BL−2&0Fh)×255
式中、BL−1は符号語セグメント内の最後のバイトであり、BL−2は最後から2番目のバイトであり、(BL−2&0Fh)は、BL−2の4つのLSBを分離する。この表現において、BL−1FFhに等しくないものとする。
変形形態1:サフィックス長は、境界
Figure 2021520728

に決して違反しない必要があり、そのため、BL−2の4つのLSBは、すべて1になることができないことを示すことができる。これを念頭に置いて、Sの符号化を単純化するとともに、スタッフィング・ビットが符号語セグメントの最後から2番目のバイト(VLCバイト・ストリームの第2のバイト)に出現する可能性を確定的に回避するように、最終的な規格のために本発明において使用されるILW符号化ポリシを改善することができる。これを行うために、Sの12ビット表現の8つのMSBを変更せずにBL−1にパックし、これによって、Sの4つのLSBも、変更せずにBL−2にパックすることができる。このとき、BL−1は8Fhを超えないはずであり、その結果、スタッフィング・ビットはBL−2内にある必要はなく、VLCバイト・ストリームからのVLCビットのアンパック中に12個すべてのILWビットを0に置き換えることが安全である。これは、元のアルゴリズムに対する望ましい変更である。
終端手順
前方に成長するMELバイト・ストリームと逆方向に成長するVLCバイト・ストリームとの間の境界は、明示的にシグナリングされない。復号器は、ビットをアンパックするときにMELバイト・ストリームとVLCバイト・ストリームの両方に属するように、FAST Cleanup符号語セグメントのS個すべてのサフィックス・バイトを考慮すべきである。これは、サフィックスからのいくつかのビットが両方のビット・ストリームにアンパックされ得ることを意味する。
注記:上述したようなILWビットの置換は、任意のMEL又はVLCビットが符号語サフィックスからアンパックされる前に行われるべきである。
符号化器は、この結果として正確な復号が行われる限り、MELバイト・ストリームとVLCバイト・ストリームとの間の重複をもたらす終端手順を自由に採用することができる。実際、符号化器がこれらのストリームの間の1バイトの重複を探索することは有意義であり、相対的に単純である。
3つのバイト・ストリームと関連付けられる個々のビット・スタッフィング手順は、バイト・ストリーム間のインターフェースにおける偽マーカ・コードの回避を保証しない。これは、符号化器終端中に保証されなければならない。偽マーカ・コードは、FF90h〜FFFFhの範囲内の16ビットのビッグ・エンディアン符号なし整数を形成する一対の連続するバイトである。MELバイト・ストリームとVLCバイト・ストリームとの間の偽マーカ・コードを回避するには、符号化器が、追加のバイト(例えば、00hバイト)を挿入することが必要であり得る。
すでに上記で述べたように、復号器は常に1つの最後方のFFhを合成するため、符号化器は、一般的に、MagSgnバイト・ストリームに放出されることになる任意の末端FFhバイトを排除すべきである。この手法は、効率化を助けるとともに、FAST Cleanup符号語セグメントのプレフィックスとサフィックスとの間のインターフェースに偽マーカ・コードが生じる任意の可能性を回避する。
走査順序及び2×2グループ構造
高さW及び幅Hのコード・ブロックからのサンプルが、2×2グループに編成され、図5に認められるライン・インターリーブ様式で処理される。すべての2×2グループが4つのサンプルを走査パターンに確実に与えるように、幅が奇数であるコード・ブロックの右に追加の列が実効的に挿入され、高さが奇数であるコード・ブロックの下に追加の行が挿入されることに留意されたい。この付け足しは、FAST Cleanupコーディング・パスのみにおいて適用され、他のコーディング・パスには影響を与えない。付け足された位置と関連付けられるサンプル値は符号化されるが、すべて非有意、すなわち、M=0であるべきである。
有意性パターン、コンテクスト及びAZCグループ
各グループgは、グループ内の任意のサンプルが有意である場合は1であり、そうでなければ0である2進有意性状態σを有する。加えて、グループgは、0〜15の範囲内の4ビットの有意性パターンρを有し、その各ビット(走査順序においてLSB〜MSB)は、グループ内の対応するサンプルが有意である場合は1である。明らかに、σ=0⇔ρ=0である。
各グループは、走査順序において訪問される、先行するグループと関連付けられる有意性情報のみに依存する符号化コンテクストcを割り当てられる。これによって、大きさ及び符号情報の前に有意性が復号されることが可能であり、これによって、少なくとも符号化器と復号器の両方のソフトウェア実施態様において、計算スループットが改善し、また、SigProp及びMagRefコーディング・パスがCleanupパスと並行して符号化及び復号されることが可能になる。
AZCグループのMEL適応的符号化
=0であるグループgは、全ゼロ・コンテクスト(AZC:All−Zero−Context)状態にあると言われる。実際、これらは、因果関係のある隣接グループがすべて非有意であるグループであり、このことがAZCという用語を説明している。適応的符号化は、AZCグループの有意性σを符号化するためにのみ利用される。具体的には、シーケンス内の各AZCグループと関連付けられる2値シンボルσは、連結されて、MELビット・ストリーム内で符号化される、可変長2進列σAZC[i]を形成する。このAZCシンボル列の符号化及び復号は、任意の他の符号化又は復号ステップと同期される必要はない。
AZCシンボル・ストリームσAZC[i]は最初にラン・レングスRAZC[j]のシーケンスに変換され、各ランは、次の1に先行する0の数を表す。4つのコード・ブロック・サンプルから成るグループごとに存在するAZCシンボルは最大で1つであり、4096よりも多いサンプルを有するコード・ブロックは存在し得ないため、符号化される必要がある最大ラン・レングスは、完全に非有意なコード・ブロックに対応する1024である。
MEL符号化手順は、MELCODEとして知られる、JPEG−LS規格内の適応的ラン・レングス符号化アルゴリズムの変形形態である。JPEG−LS規格において使用されるMELCODEは32個の状態を有するが、0〜12の範囲内の13個のみの状態インデックスkを有する異なる状態機械が、FASTブロック・コーダによって利用される。各状態kは、指数EMEL[k]及び閾値
Figure 2021520728

と関連付けられる。表2は、重要な量の値を列挙している。
Figure 2021520728
MELコードは、ラン・レングスRAZC[j]のための一タイプの適応的ゴロム・コードであり、閾値TMEL[k]は、ゴロム・パラメータの役割を果たす。差し当たって適応を無視すると、符号化手順は、以下のように要約することができる。
R≧Tである間、1(「ヒット」)を放出し、RからTを減算する
0(「ミス」)を放出し、その後、RのE個のLSBを放出する
指数関数的に分布した情報源の最適なゴロム・パラメータは、その平均値の半分をわずかに上回る。したがって、典型的なランRは、ミスが後続する1つのヒットによって符号化されるべきである。これは、適応的状態機械が、各ランについて1つのヒット及び1つのミスを経験すべきであることを暗示し、これは、表2に示すように、各ヒット後に状態をインクリメントし、各ミス後に状態をデクリメントすることによって達成される。
完全なMEL符号化アルゴリズムは、以下のとおりである。
k=0に初期化する
for 各j=0,1,…
RをRAZC[j]に設定する
while R≧TMEL[k]
「1」(「ヒット」)を放出する
RをR−TMEL[k]に更新する
kをmin{k+1,12}に更新する
「0」(「ミス」)を放出する
RのEMEL[k]個のLSBを放出する
kをmax{k−1,0}に更新する
注記:上記アルゴリズムは、ラン・レングスの符号化に関して表現されているが、2進算術符号化がランに対して動作する状態機械としてリキャストすることができるように、上記アルゴリズムは、個々のシンボルに対して動作する適応的状態機械として常にリキャストすることができる。個々のAZCシンボルの符号化器として、MELコーダはここで、6を超えるコード・ビットを生成することができず、多くの場合、まったくビットを生成しない。J2K−1アルゴリズムによって使用されるMQ算術コーダとMEL符号化手法は両方とも、ここで概ね同じ数の状態遷移を呈するが、MELコーダの利点は、状態機械が非常に小さいことである。ソフトウェアにおいて、ランの符号化及び復号を駆動するために小さいルックアップ・テーブルを使用することが賢明であり、ここで、ほとんどの場合、ラン全体を符号化又は復号するためには単一の検索で十分である。
MELコーダによって放出されるビットは、MELビット・ストリームを構成する。コード・ブロック内の最後のAZCシンボルが0である場合、最後のランは「オープン」であると考えられ、これは、符号化ラン値が、少なくとも、AZCシンボル列の最後方のゼロの数であるRlast程度の大きさである任意の値を有することができることを意味する。
注記:符号化器は、後方に成長するVLCバイト・ストリームとの重複の機会を最大化するように、MELバイト・ストリームを終端させるために「オープン」ランの柔軟性を利用することができる。
CxtVLCコードを介して有意性及びuoff符号化
非AZCグループ、及び、有意である(すなわち、σ=1)AZCグループについて、個々の2×2グループに対して動作する可変長コードを使用して、有意性パターンρが、他の情報とともに符号化される。本明細書においてはCxtVLCコード及びU−VLCコードとして識別される、2つのタイプのコードが利用される。結果もたらされるコード・ビットは、後に説明するようにグループ対単位でインターリーブされ、FASTブロック・コーダのVLCビット・ストリームを形成する。
この節は、有意性パターンρ、及び、対応する指数境界Uを得るためにオフセットがグループg内のサンプルと関連付けられる予測子κに適用される必要があるか否かを示す2進値
Figure 2021520728

をともに表すために使用されるCxtVLCコードのみに関する。これらの
Figure 2021520728

値の正確な意味は、本明細書において後に与えられる。
先行するラインからのコンテクスト情報が存在しないコード・ブロック内の最初のライン対(同等に、2×2グループの最初の行)と、すべての最初のものでないライン対とが区別される。図6は、これらの2つの事例のコンテクスト・ラベルを形成するために使用される有意性情報を示す。対応するコンテクスト・ラベルが、以下のように、この情報から計算される。
最初のものでないグループ行:
Figure 2021520728

最初のグループ行:
Figure 2021520728
変形形態2:コンテクスト・ラベルは、ここでは、最初のグループ行と最初のものでないグループ行の両方について、0〜7の値をとる。各事例について別個のCxtVLCコード・テーブルが使用されるため、実施態様のフットプリントを低減するように、コーダの全体的な性能に対する影響がより少ない、コンテクストのより小さいセットをグループの最初の行に使用することが好ましい場合がある。特に、本発明においては、以下が使用され得る。
最初のグループ行(代替形態):
Figure 2021520728
注記:これらのラベルの正確な定義は、CxtVLCコード・テーブルの正確な解釈のためにのみ重要である。コンテクスト・ラベルの置換が、CxtVLCコード・テーブルの対応する置換とともに、同等に利用され得る。
最初のものでないグループ行のCxtVLC符号語長
最初のものでないグループ行(コード・ブロックの最初のものでないライン対)に見出されるグループについて、CxtVLC符号語は、最大7ビットの長さを有する。8つの別個のコンテクストcが存在し、それらの各々は、4ビットの有意性パターンρ及び2進
Figure 2021520728

値の有効な組合せに対応する、最大31個の異なる符号語を有する。グループ全体が非有意である場合、
Figure 2021520728

の値は、復号器にとって何の意味もなく、ここで説明を目的として0であるものとして解釈され、そのため、組合せ
Figure 2021520728

は有効でない。コンテクストc=0は、その全体的な有意性がMELビット・ストリーム内で符号化されるAZCグループに対応し、その結果、
Figure 2021520728

が0又は1に等しい非ゼロρパターンに対応する30個のみの有効な符号語が存在する。
表3は、コンテクストと符号語との有効な各組合せの符号語長を与える。符号語長の、実際の符号語へのマッピングは、この節において後に説明する。
Figure 2021520728
注記:実施態様は、条件付き分岐を回避するように、c=0とρ=0との無効な組合せについて、コーディング・テーブルにゼロ長のエントリをデータ投入するために有用であることが見出され得る。
変形形態3:本明細書において提供されるCxtVLC符号語テーブルは、一定範囲の映像タイプにわたって符号化効率を最適化するために、さらなる変更を受けることができる。特に、種々のサブバンド配向に対して個別の符号語テーブルを提供することが望ましい場合がある。
変形形態m1:符号語長が7未満である
Figure 2021520728

組合せについて符号化されている情報を拡張する機会が存在する。bが、対応する境界Uによって決定されるような、グループg内の各サンプルの最上位の大きさビットをキャプチャする4ビット語(ビットパターン)を示すものとする。すなわち、4ビットのパターン語b及びρ内のビットjに対応するサンプルの位置をnと表現すると、bのビットjは、ρのビットjが0でない限り、
Figure 2021520728

のビット
Figure 2021520728

であり、これは、
Figure 2021520728

が0であることを意味し、この場合、bのビットjは0である。bをグループgの「msbパターン」として識別する。本明細書において後に説明するように、
Figure 2021520728

且つ
Figure 2021520728

であるときはいつでも、msbパターンは明示的な通信なしで復号器によって推測されることができず、そのため、グループ内の各有意サンプルのmsbパターン・ビットは通常、MagSgnビット・ストリームに含まれる。しかしながら、代わりに拡張されたCxtVLCコード内のこれらのビットの内の1つ又は複数を符号化する機会が存在する。VLC復号複雑度はほぼ全体的に、最大符号語長によって駆動され、そのため、基礎となる確率が、表現を効率的にするために7ビットよりも長い符号語を必要とすることなくmsbパターン符号化によって導入される追加のダイバーシティに対応するのに十分に大きい、一部の符号語のmsbパターン情報のみを提供する。その上、一般的に、msbパターン情報の一部のみが、CxtVLC内で符号化される。
この変形形態は、変数−変数長さ符号化方式を構成し、各符号語の長さと各符号語によって表される情報の量の両方が変数である。具体的には、この変形形態において、増強CxtVLC内の各符号語は、
Figure 2021520728

対を、部分的msbパターン
Figure 2021520728

、及び、
Figure 2021520728

内のいずれのビット位置が、
Figure 2021520728

であるときはいつでも0である有効なmsbパターン情報φを含むことを示す有効性マスクφとともに識別する。
この事例におけるFASTブロック符号化アルゴリズムは、MagSgnビット・カウントmが、そのφビットが1である各サンプルについて1だけ低減され、そのような各サンプルのimplicit−1値i
Figure 2021520728

の対応するビットに設定されることを除いて、実質的に変更されないままである。これは、VLC復号プロセスを大幅に改変することなく、又は、MagSgnパック/アンパック・プロセスを変更することなく、msbパターン・データのCxtVLCに基づく符号化と関連付けられる(穏当な(脚注3))符号化効率改善を得ることができることを意味する。CxtVLC符号化は、この変形形態の下ではいくらかより複雑になると予測され得るが、特にCxtVLC検索待ち時間が符号化器スループットに(復号器スループットとは異なり)にほぼ影響を与えないことに留意すると、管理可能なサイズのルックアップ・テーブルによって達成することができる。この変更の、ソフトウェア・スループットに対する主な影響は、各サンプルのm及びi値の計算の複雑度が増大することである。しかしながら、これは、符号化器と復号器の両方において全体的にベクトル化可能である。
上述した増強CxtVLCは、4ビットの有効性マスクφを、有効でない
Figure 2021520728

の最後のビットの数を示す2ビット値に置き換えることによって、いくらか単純化することができる。
Figure 2021520728

のすべてのビットが無効である場合を明示的に通信する必要はないことに留意されたい。これは、φ=0及び
Figure 2021520728

などの、他の様態では不可能な組合せによってこれを容易に識別することができるためであり、これは、すべてのmsbパターン・ビットが0に等しいことを意味し、これは、
Figure 2021520728

である場合には不可能である。さらにより単純な変形形態は、
Figure 2021520728

と関連付けられる情報を、0であることが分かっているbの最初のエントリの数を識別するただ単一の2ビット量に低減することを含む。
Figure 2021520728

である場合、正確にbは0になり得ないため、ゼロの数がグループ内の有意サンプルの数よりも1少ない場合はいつでも、復号器は、そのような0に後続するimplicit−1を推測することができることが留意される。
最初のグループ行のCxtVLC符号語長
グループの最初の行について、指数境界の符号化も、これらのグループについては異なるため、ここで
Figure 2021520728

値を符号化することはしない。この場合、8個のコンテクスト・ラベルの各々について最大16個の有効な符号語が存在し、符号語長は表4に記録されている。
変形形態4:最初のグループ行に使用される符号化手順と最初のものでないグループ行に使用される符号化手順との間の類似性を増大させることが好ましい場合があり、そのため、その後、
Figure 2021520728

値を含む、グループの最初の行の符号化テーブルが採用され得る。これは、下記の「最初のグループ行内で利用される符号化技法」の節に見られる注記においてさらに論じる。
Figure 2021520728
表3及び表4の各々のエントリと関連付けられる実際のVLC符号語cは、各コンテクストのプレフィックス・コードをもたらすマクミラン割り当て手順を介して得られる。上記の表においてエントリwを有する符号語の長さをlと表現し、ここで、w=0はコンテクスト・ラベルの最初の有効エントリであり、w=W−1は最後のエントリであり、Wはそのコンテクストの有効な符号語の数である。符号語は最初に、以下のように、インデックス・テーブルidx[]を使用して最短のものから最長のものへとソートされる。
for 各w=0,1,…,W−1
for 各i=0,1,…,w−1
IF (l<lidx[i])又は((l=lidx[i])且つ(i mod 2≠0))
idx[i]エントリi〜w−1を位置i+1〜wに移動させる
iを進めることなくループを脱出する
idx[i]=wを割り当てる
このソート手順における条件(i mod 2≠0)はそれほど重要ではなく、FASTブロック・コーダの符号化効率の評価中に利用される符号語を生成するために使用される手順と一貫させるためのものに過ぎない。
ソートが完了すると、各符号語は、以下に従って、lmaxビットの符号なし整数Iを割り当てられ、
Figure 2021520728

に従い、
Figure 2021520728

である。
最後に、VLCの実際の符号語cが、ビッグ・エンディアン順序において書き込まれるIの最上位のlビットから形成される。すなわち、cの最初のビットはIのMSB(ビットlmax−1)でり、一方、符号語cの最後のビットは、Iのビットlmax−lである。すでに言及したように、これは周知のマクミラン割り当てである。割り当ては、順序が上記の明示的なソート手順によって規定される、同一の長さを有する符号語の置換を除いて一意的である。
最初のものでないグループ行の予測子、U境界及びU−VLCコード
この節は、排他的に、最初のものでないグループ行の大きさ指数境界の符号化に関する。コード・ブロック内のグループの最初の行に属するサンプルは、後述するように、いくらか別様に処理される。
予測子κが、先行するグループ行からの大きさ指数に基づいて、各有意サンプルについて形成される。図7は、グループg内の有意サンプル(脚注4)の予測子を形成するために使用される4つの指数を識別し、位置の下付き文字nが、より好都合なグループ関連ラベル「tl」、「bl」、「tr」及び「br」に置き換えられている。復号器は、一般的に、先行するグループ行の第2のライン内の完全に復号されたサンプル値からこれらの大きさ指数を導出する必要がある。
予測子の形成の最初のステップは、推定指数
Figure 2021520728


Figure 2021520728


Figure 2021520728

及び
Figure 2021520728


Figure 2021520728


Figure 2021520728


Figure 2021520728

及び
Figure 2021520728

から形成することである。利用される割り当ては単純に以下のとおりである。
Figure 2021520728

式中、グループgが2つ以上の有意サンプルを有する場合、γは1に等しく、そうでない場合は0である。γ値は、「複数有意性」マスクとして解釈することができる。
推定指数は、以下を使用して予測子に変換され、
κ=max{P,1}−Z
式中、Zは、グループ内のすべての有意サンプルが2以上の推定指数を有する場合は1であり、そうでなければ0である、位置nが属するグループgの予測オフセットである。オフセットZは実効的に、uが−1程度と小さい予測残差を表すことを可能にし、これは形式的に以下のように書くことができる。
Figure 2021520728
各有意グループgについて、単一の符号なし残差u∈{0,1,…,36}が、CxtVLC及びU−VLCコードを介してともに符号化される。特に、CxtVLCコードは、以下の2進値を通信するために使用され、
Figure 2021520728

一方、U−VLCコードは、
Figure 2021520728

が1であるときの実際のu値を表す。
位置nを含むグループのκ及びu値から、復号器は、以下に従って指数境界Uを導出する。
Figure 2021520728
ここで、2進有意性値σは、すべての非有意サンプルについてUを強制的にゼロにする。
注記:ただU−VLCコードが36を超えるu値を表現することが可能でないために、特別な条件u=36が必要とされ、一方、κは、1程度と小さくすることができ、JPEG2000規格ファミリは、大きさ指数が38程度と大きくなり得るサブバンド・サンプルを提供する。これに対処するために、u=36は、有意サンプルに強制的にU=38の最大指数境界をとらせる「エスケープ・コード」として処理される。
符号化器は、uの値が、U≧Eという要件と一致する最小の非負値を取ることを保証することを必要とされ、これは以下のように書くことができる。
Figure 2021520728

この厳しい制約は、精度が限定された(例えば、最大32ビット/サンプル)サブバンド・サンプルのみをサポートする復号器実施態様が、上記に記した特別な条件u=36を試験及び処理する必要性を回避することができることを保証する。これはまた、グループgが1つのみの有意サンプルを有する場合に、そのサンプルの指数境界Uが、u>0且つu>36であるときはいつでも、Eに等しくなることも保証する。これによって、以下のように、グループgに属する位置nにあるサンプルについてimplicit−1ビットを割り当てることが可能になる。
Figure 2021520728

すなわち、位置nにあるサンプルがそのグループg内の唯一の有意サンプルであり(すなわち、γ=0)、
Figure 2021520728

且つuが36のエスケープ値に等しくない場合はいつでも、復号器はMagSgnビット・ストリームにパックされるMagSgn値vのm個のLSBを直ちに超えるimplicit−1の存在を推測することができる。
注記:上記の説明において、いくつかの量は、
Figure 2021520728

を離れる推定指数割り当ての結果として、同じグループ内のすべてのサンプルについて同じ値をとる。したがって、各グループは、実際には1つの指数予測子
Figure 2021520728

のみを有し、そのため、Uはσと書くことができ、iはσと書くことができ、ここで、
Figure 2021520728

であり、符号化器は、以下を選択する必要がある。
Figure 2021520728
の非ゼロ値を表すために使用されるU−VLCコードは、グループ対単位でインターリーブされるように設計されているプレフィックス及びサフィックス成分から構成される。プレフィックスは、存在する場合、サフィックスの長さを一意に決定し、一対のグループのプレフィックスが、穏当なテーブル検索を使用してともに復号されることを可能にするのに十分に小さい。表5は、このコードのすべての関連する詳細を与える。
Figure 2021520728
コード・ブロック内のグループの最初の行について、先行する走査ラインから利用可能な大きさ指数はない。
この事例は、コード・ブロック高さが通常小さい、低待ち時間用途においては重要であり得るため、追加の待ち時間を導入することなく達成することができる、ある形態の水平予測を含む、指数境界を符号化するための代替のメカニズムが利用される。
本発明において開発されている代替のメカニズムはここでも、予測子及び符号なし残差uを含むが、予測は、グループごとに適合され、状態変数として解釈することができる基線値Bに対して形成される。以下の値を有する単一の指数境界Uが、各グループgについて復号され、
Figure 2021520728

ここで、基線Bは以下に従って更新される。
Figure 2021520728
グループgが2つ以上の有意サンプルを有する場合、γは1に等しく、そうでない場合γは0に等しいことを想起されたい。最初のものでない行グループについて、この定式化は、符号化可能な最大値(u−2)=36を特別なエスケープ・コードとして処理することによって、Uが38と大きい値をとることを可能にする。
2つ以上の有意サンプルを有するグループの連続的な集合について、符号なし残差uは、この場合U=Ug−1+(u−2)であるため、Uの連続する値の間の(2だけ)オフセットされた差として理解することが可能である。1つのみの有意サンプルを有するグループについて、上記の関係は、Bを強制的に1にし、その結果、U=u−2は先行するグループに依存しない。B=0の特別な値は、U値が符号化又は使用されない非有意グループに対応するため、厳密には重要でないが、この特別な値は、ルックアップ・テーブルに基づく効率的な実施を容易にするために使用することができる。
最初のものでないグループ行と同様に、符号化器は、グループg内の各位置nについてU≧Eを保証しながら上記式と一貫するuの最小値を選択する必要がある。
明らかに、uのいくつかの値は許容すべきでなく、これは、最初のグループ行内でのuの変更されたU−VLCコードの使用に反映される。最初のグループ行に採用されているU−VLCコードは、基線変数Bの値について条件付けされる。その上、ここでは、
Figure 2021520728

値は最初のグループ行内のCxtVLCの一部として符号化されず、そのため、U−VLCは、すべての有意グループの空でない符号語を含む。
グループの最初の行に対するimplicit−1条件は、以下のとおりである。
Figure 2021520728
グループの最初の行において使用されるB依存U−VLC(又は「BU−VLC」)コードは、表6において指定される。符号語のプレフィックスは決して4ビット長を超えないため、条件ρg+1=0又はMg+1=0について調整された後に、プレフィックス長を返す4ビットの符号語プレフィックス、サフィックス長(ゼロであることが多い)、復号されたU境界、及び、グループg+1のBU−VLCテーブルをインデックス付けするために使用されることになる更新されたB値とともに、2ビットのBg−1値によってインデックス付けされる、効率的なLUTに基づく復号戦略を開発することができる。
Figure 2021520728
変形形態5:本明細書に記載されているような、最初のグループ行及び最初のものでないグループ行の異なる処理は、特にハードウェア実施態様に対してコストを課す。ほとんどの用途において、最初のグループ行は、全体的な符号化効率に対する寄与が相対的に少なく、そのため、手法をすべての最初のものでないグループ行に対して使用されるものにより類似したものに変更することが好ましい場合がある。1つの手法は、すべての推定指数をP=1に設定し、CxtVLCコードを介して符号化される有意性パターンを有する2進
Figure 2021520728

変数を含め、表5のU−VLCコードを採用して、最初のものでないグループ行のものと正確に同じ方法を使用することである。
変形形態6:上記単純化の後、有意義な改善は、特定の符号なし予測残差uに対するオフセットを適応的に通信するためにMEL符号化機械を使用することを含む。具体的には、AZCシンボル・ストリームσAZC[i]は、
Figure 2021520728

である非AZCグループについて2進シンボル
Figure 2021520728

を含めることによって増強される。その後、表5のU−VLCコードは、
Figure 2021520728

を符号化するために使用され、ここで、Tは正の整数の定数である。符号化器は、u’≧1を離れる場合にのみ、
Figure 2021520728

を選択する。結果として、
Figure 2021520728

である場合、uの値は必ず1〜Tの範囲内にあり、これによって、U−VLCコードが切り捨てされることが可能である。
Figure 2021520728

であるときの切り捨てされたU−VLCコードは単一の2進数まで縮小するため、値T=2が特に関心を持たれる。この変更は、MEL符号化シンボル・ストリームsMEL[i]がグループあたり最大1つの2進シンボルを保持するという有意義な特性と干渉せず、最初のグループ行及び最初のものでないグループ行内で利用される符号化方法を調和させる助けとなる。低ビットレートにおいて、又は、低アクティビティにおいて、σAZC
Figure 2021520728

の両方のコード・ブロックは、結果0に向かって大きく歪曲された確率分布を呈するはずであり、これは、適応的MEL符号化手順を使用して効率的に符号化することができる。
変形形態k1:単純化及びスループットのさらなる増強の利益のために、変形形態6と関連付けられる、可能性のある非AZCシンボルの数を低減することが有意義である。この変形形態は、
Figure 2021520728

及び
Figure 2021520728

が両方とも1に等しいときはいつでも、CxtVLCビット及びU−VLCビットが下記に説明するようにインターリーブされる、グループg=2g及びg=2g+1から成るグループ対に対して単一の非AZC MEL符号化2進シンボル
Figure 2021520728

を導入する。シンボル
Figure 2021520728

は、
Figure 2021520728


Figure 2021520728

の両方が、好ましい値がここでもT=2である定数Tよりも大きい場合は1であり、そうでない場合、
Figure 2021520728

である。
Figure 2021520728

であるとき、U−VLCコードは、
Figure 2021520728

及び
Figure 2021520728

に適用され、そうでなく、
Figure 2021520728

であるが、
Figure 2021520728

である場合、U−VLCコードは、
Figure 2021520728

、及び、
Figure 2021520728

にならない限り、その後また
Figure 2021520728

に適用され、この場合、
Figure 2021520728

は切り捨てされたU−VLCコードを使用する。ここでも、T=2の場合、切り捨てされたU−VLCコードは、値
Figure 2021520728

を符号化する単一の2進数に縮小する。変形形態6のこの変更は平均して符号化効率がわずかに劣るが、変形形態6よりも低い複雑度及び高いスループットで実施することができることが分かる。変形形態6にまさるこの変形形態の1つの利点は、グループがAZCグループであるか否かに関する依存性を導入する必要がないことである。代わりに、
Figure 2021520728

シンボルの存在、及び、各クワッドの符号なし残差値の符号化に関するその実施態様は、効率的な対単位のU−VLC符号化及び復号実施態様にすでに含まれている
Figure 2021520728

及び
Figure 2021520728

のみに依存する。
変形形態m2:部分msbパターンを、結果として符号語長が増大されない増強CxtVLCテーブルに組み込むための、変形形態m1に記載されている同じ手法が、またグループの最初の行に利用され得る。この場合、最初のグループ行内では事例
Figure 2021520728

がより一般的であるため、符号化効率における利益は大きくなると予測することができる。
VLCビット・ストリームの編成
VLCビット・ストリームは、グループ対単位でインターリーブされる、CxtVLCコード及びU−VLCコードからのビットから構成される。グループ行あたり奇数の2×2グループを有するコード・ブロックについて、各グループ行は、CxtVLC符号語又はAZCシンボルを有せず、常に非有意であり、その結果、U−VLC符号語も有しない追加の2×2グループによってパディングされる。このように、各グループ行は、左から右へと、整数のグループ対に分割される。
VLCビット・ストリームは、最初に、グループ対と関連付けられる(場合によってからである(脚注5))有意性CxtVLC符号語を放出し、その後、対のうちの各グループの任意のU−VLCコード・プレフィックスを放出し、最後に、対のうちの各グループの任意のU−VLCコード・サフィックスを放出することによって形成される。すべてのそのようなVLCビットは、辞書順において次のグループ対からのものに先行する。このインターリーブ戦略は、関連付けられる復号依存性とともに、図8に示されている。インターリーブ手順は、コードブック内の最初のグループ行と最初のものでないグループ行とについて同一であるが、各インターリーブ構成要素と関連付けられるビット数は、最初のグループ行において異なり得る。
インターリーブの1つの利点は、U−VLCプレフィックスの対をともに復号することができることであり、その後、U−VLCサフィックス長が分かり、CxtVLC復号を、次のグループ対内で直ちに開始することができる。第2の利点は、符号化器が、グループ対あたり合計2回のみのテーブル検索を使用してCxtVLCビットとU−VLCビットの両方を生成することができることである。
MagSgnビット・ストリームの編成及びサンプル値復号
MagSgnビット・ストリームは、図5に示す走査順序に従って、各サンプルのMagSgn値vからのm個のLSBを連結することによって形成され、ここで、
=U−i
=χ+2(M−1)
であり、χはサンプルの符号ビットであり、サンプルが負である場合は1であり、それ以外の場合は0である。非有意である、すなわち、σ=0であるサンプルについて、U、i及びmはすべてゼロであり、そのため、非有意サンプルは、MagSgnビット・ストリームに寄与しないことに留意されたい。すべての有意サンプルは、MagSgnビット・ストリームに少なくとも1ビット寄与する。
のm個のLSBはリトル・エンディアン順序においてMagSgnビット・ストリームにパックされ、これは、vのLSB(ビット0)が最初に現れ、ビット(m−1)で終わることを意味する。
復号器は、MagSgnビット・ストリームからこれらのmビットをアンパックし、
Figure 2021520728

を追加して符号化MagSgn値vを復元し、そこから大きさM=M[n]符号χ=χ[n]が得られる。復号器は、一般的に、2×2グループの次の行内のサンプルについて指数予測子κを形成するために、復号された大きさMから大きさ指数Eのうちの少なくともいくつかを再構築する必要が有り、その結果、m値をそれらのサンプルについて推測することができる。
十分なAZCグループ有意性シンボルがMELビット・ストリームから復号されている限り、これらの行間依存性が、有意性パターンρ及び符号なし残差uがVLCビット・ストリームから復号される順序を制約しないことは注目に値する。その上、MEL復号手順は、全体的に、VLCとMagSgnの両方の復号プロセスから独立している。要約すると、VLC復号はMEL復号のみに依存し、MagSgn復号はVLC及びMEL復号のみに依存し、一方、VLC復号及びMagSgn復号プロセスは各々、それぞれ先行するVLC復号ステップ及びMagSgn復号ステップの完了に対する内部依存性を有する。
FAST MagRefコーディング・パスの詳細な説明
FAST MagRefコーディング・パスは、未処理の精度改善ビットがビッグ・エンディアン順序とは対照的にリトル・エンディアン順序においてバイトにパックされることを除いて、BYPASSモードが使用されるときのJ2K−1アルゴリズムの精度改善パスと同一である。
FAST MagRefパスは、先行するFAST Cleanupパスからの有意サンプルの大きさの精度を改善するために、追加の精度ビットを提供する。pがそのCleanupパスと関連付けられるビットプレーンを示すものとする。MagRefパスは、p>0の場合にのみ存在し得る。MagRefパスは、ビットプレーンpに関して有意である各サンプル位置、すなわち、M[n]≠0である各位置について、
[n]=(Mp−1[n] mod 2)∈{0,1}
の値を提供する。
FAST MagRefパスは、非有意位置をスキップし、すべての他の位置からr[n]ビットをMagRefビット・ストリームに放出する、J2K−1ブロック・コーダと同じ4ライン・ストライプ配向走査パターンを使用する。
MagRefビット・ストリームからのビットは、各バイトのLSBから開始して、リトル・エンディアン順序においてバイトにパックされる。バイト全体がアセンブルされると、そのバイトの値がFFhである場合、スタッフィング・ビット(0)が、MagRefビット・ストリームからの7ビットのみを収容することが可能である、次のバイトのMSB(ビット7)に導入される。復号器は、バイトから漸進的にビットを抽出し、各バイトのLSBから開始してMSBに向かって作用し、これは、MagRefバイト・ストリーム内の先行するバイト(存在する場合)が値FFhを有していた場合にはスキップされる。
FAST MagRefバイト・ストリーム内の最後のバイトは、値FFhを有するべきではなく、これは、符号化器が、上述した手順を介して生成される任意のスタッフィング・ビットを含むバイトを放出する必要があることを意味する。MagRefバイト・ストリームの最後のバイト内の未使用ビットは、FFhに等しい最後のバイトを残さない限り、任意の値をとってもよい。
FAST SigPropコーディング・パスの詳細な説明
FAST SigPropコーディング・パスは、有意性ビット及び符号ビットが再配置されビッグ・エンディアン順序とは対照的にリトル・エンディアン順序においてバイトにパックされることを除いて、BYPASSモードが使用されるときのJ2K−1アルゴリズムの有意性伝播パスと同じである。
FAST SigPropパスは、FAST Cleanupパス又はFAST SigPropパスのいずれかの中で先行して符号化されている情報に基づいて、有意な隣接サンプルを有する限り、先行するFAST Cleanupパス内で非有意であるとして符号化されたサンプルの精度が改善された大きさ情報を提供する。pが先行するCleanupパスと関連付けられるビットプレーンを示すものとする。SigPropパスは、p>0の場合にのみ存在し得る。SigPropパスは、各位置nについて大きさビット
[n]=(Mp−1[n] mod 2)∈{0,1}
を符号化し、その結果、
Figure 2021520728

となり、
Figure 2021520728

は2進SigProp成員変数(binary SigProp membership variable)であり、これは以下から計算される。
Figure 2021520728
ここで、Nは、コードブック内に存在する位置nの8つすべての近接隣接位置を含むすべての隣接位置であり、ただし、関連COD/COCマーカ・セグメント内でCAUSALモード・フラグが設定されている場合を除き、この場合、Nは、次の4ライン・ストライプに見出される任意の隣接位置(すなわち、位置nを含むストライプに後続するもの)を省略する。
Figure 2021520728

は、4ライン・ストライプ配向走査パターン内で位置nに先行する隣接位置のみを含むことを除いて、Nと同様である隣接位置である。
全高ストライプ(すなわち、各ストライプ列内に4つの実際のコード・ブロックを有するもの)について、ストライプ列内のすべての成員位置(すなわち、
Figure 2021520728

である位置)からのr[n]ビットが、新たに有意になる成員(
Figure 2021520728

であるもの)と関連付けられる符号ビットを放出する前に、SigPropビット・ストリームに放出される。すなわち、大きさビットr[n]及び符号ビットは、各4ライン・ストライプ内で列単位でインターリーブされる。対照的に、J2K−1有意性伝播パスは、大きさ及び符号ビットをサンプル単位でインターリーブする。
コード・ブロックが高さ3の不完全なストライプで終わる場合、大きさ及び符号ビットもまた、そのストライプ内で列単位でインターリーブされるが、無論、そのような各列内には最大3つの成員位置が存在する。
コード・ブロックが高さ2の不完全なストライプで終わる場合、大きさ及び符号ビットは、そのストライプ内で列対単位でインターリーブされ、これは、ストライプ列の最初の対内のすべての成員(4サンプル)からの大きさビットが、そのストライプ列対内の任意の新たに有意になる成員の符号の前にSigPropビット・ストリームに放出され、コード・ブロック内の各後続のストライプ列対について同じことが行われることを意味する。実際にコード・ブロック内に存在する位置のみが成員であり得る。
コード・ブロックが高さ1の不完全なストライプで終わる場合、大きさ及び符号ビットは、列クワッド単位でインターリーブされ、これは、4つの列の集合内のすべての成員(この場合は4サンプル)からの大きさビットが、その列集合からの符号の前にSigPropビット・ストリームに放出されることを意味する。ここでも、実際にコード・ブロック内に存在する位置のみが成員であり得る。
注記:大きさ及び符号ビットの列及び複数列に基づくインターリーブは、少なくとも符号化と(特に)復号の両方にとって、ソフトウェア実施態様に大いに有益な影響を与えることができる。ここで、コード・ブロックがそれらの公称寸法以下を切り捨てられる縮退事例において高スループットを可能にするために重要である、高さ2及び高さ1を有するストライプの特別な事例に注目する。これは、画像又はビデオ・フレームの下方境界のみにおいて起こり得るが、特に低い待ち時間又はメモリ利用を達成するために、画像がタイルに分割されるか、又は、短く広い区域寸法が使用される場合には、はるかにより頻繁に起こり得る。これらの特別な事例の全体的な有意性は、用途に極めて依存し、さらなる検討を正当化し得る。
変形形態7:特にハードウェア実施態様について、1、2、3又は4本のラインを有するストライプのより統一された処理を採用することが好ましい。高さ1及び2のストライプでさえ高いソフトウェア復号スループットを保持しながらこれを達成する1つの良好な方法は、高さにかかわらず、すべてのストライプにおいて、列クワッド単位で大きさ及び符号ビットをインターリーブすることである。この場合、4ストライプ列の集合内のすべての成員からの大きさビットが、4ストライプ列のその集合内の新たに有意になるサンプルからの符号の前にSigPropビット・ストリームに放出される。4本のラインを有する全高ストライプについて、この変形形態の結果として、最大16の大きさビットがSigPropパスに放出され、その後、新たに有意になるサンプルに対応する最大16の符号ビットが放出される。高さ1のストライプについて、SigPropパスのこの変形形態と上述したものとの間に差はない。
FAST SigPropビット・ストリームからのビットは、リトル・エンディアン順序においてバイトにパックされ、FAST MagRefビット・ストリームと正確に同じビット・スタッフィング手順を受け、SigPropバイト・ストリームがもたらされる。
任意のFAST SigPropバイト・ストリームは、FAST Cleanup符号語セグメントに直に後続する符号語セグメントの始まりから開始するべきである。関連COD/COCマーカ・セグメント内でTERMINATIONモード・フラグが設定されている場合、SigPropバイト・ストリームは、それ自体の符号語セグメントを占有すべきであり、その符号語セグメントの最後のバイトはFFhに等しくなるべきではない。この場合、FAST MagRefバイト・ストリーム(存在する場合)は、後続の符号語セグメントを占有するべきであり、また、前に説明したように、FFhで終端するべきではない。
TERMINATIONモード・フラグが設定されない場合、SigPropビット・ストリーム及びMagRefビット・ストリーム(存在する場合)は連結され、結果もたらされるビット・ストリームが、リトル・エンディアンの慣例に従って単一のバイト・ストリームにパックされ、ここでもFFhで終わるべきではない単一の符号語セグメントがもたらされる。
変形形態8:TERMINATIONフラグが設定されていないときのSigPropコーディング・パスとMagRefコーディング・パスとの同時処理を可能にするために、現行の手法に対する望ましい変更は、MagSgnバイト・ストリームが前方ではなく後方に成長するように構成することであり、その結果、SigPropバイト・ストリームとMagRefバイト・ストリームの両方の開始を、それらが共有する単一の符号語セグメント内で直ちに識別することができる。
コード・ストリーム構文
この節は、FASTブロック・コーダの導入をサポートするために必要とされる、IS15444−1に記載されているコード・ストリーム構文に対する変更の小さいセットを説明する。これらの変更の背後にある原理の一部は強調するに値する。
1.JPEG2000規格ファミリにわたって、J2K−1ブロック・コーダの当座の代替としてFASTブロック・コーダを使用することが可能である。
2.量子化画像サンプルに関する情報を一切失うことなく、J2K−1に基づくコード・ストリームを、FASTブロック・コーダを使用するものにコード変換することが可能である。この特性は本質的に、J2K−1アルゴリズム内で対応するものと正確に同じ情報を符号化するFAST SigPropコーディング・パス及びMagRefコーディング・パスを提供することによってすでに付与される。
3.たとえFASTブロック・コーダ自体が高度にスケーリング可能でない場合であっても、各コード・ブロックと関連付けられる層境界に関するすべての情報も保持しながら、複数の品質層を有するJ2K−1に基づくコード・ストリームを、FASTブロック・コーダを使用するものにコード変換することが可能であり、その結果、元の精細に埋め込まれた表現にコード変換し戻すことを、情報を一切損失することなく行うことができる。
4.FASTブロック符号化アルゴリズムの使用を識別するために新たなシグナリング方法が導入される必要がある範囲までを除いて、JPEG2000コード・ストリーム構文、又はJPEG2000パケットの構造に変更が行われない。
JPEG2000パケット内のFASTブロック・バイト・ストリームのキャリッジ
IS15444−1の付属書Bに記載されているように、コード・ブロックは区域に編成され、各区域は、品質層ごとに1つの、パケットのシーケンによって表される。各パケットは、区域の各コード・ブロックによってそのパケットに行われる寄与を識別するヘッダと、区域のコード・ブロックからの関連する符号化バイトを保持する本体とを有する。パケット・ヘッダは、コーディング・パスの数及び寄与する各コード・ブロックの関連する符号化長情報とともに、寄与を行う各コード・ブロックの最初の失われている最上位の大きさビットプレーンの数を識別する。
ブロック符号化モードに依存して、各コード・ブロックからの符号化バイトは、1つ又は複数の符号語セグメントに分割される。コード・ブロックが、複数の符号語セグメントからパケットへのコーディング・パスに寄与する場合、パケット・ヘッダは、符号語セグメント間の境界を識別するのに十分な長さ情報を含む。特に、TERMINATIONモード・フラグ(コード・ブロック・スタイル・フィールドのビット2)が関連COD/COCマーカ・セグメント内で設定される場合、各コーディング・パスは、それ自体の符号語セグメントを占有し、そのため、パケット・ヘッダによって通信される長さの数は、含まれるコーディング・パスの数と同一である。BYPASSモード・フラグ(コード・ブロック・スタイル・フィールドのビット0)が設定される場合、各バイパス有意性伝播は、符号語セグメントの始まりに現れなければならず、各バイパス精度改善パスは、TERMINATIONモード・フラグが設定されない限り、先行する精度改善パスによって開始される同じ符号語セグメントになる、符号語セグメントの終わりに現れなければならない。
FASTブロック符号化アルゴリズムが使用されるとき、BYPASSモード・フラグが設定されるか否かにかかわらず、FAST Cleanupパスは、それ自体の符号語セグメントを占有しなければならず、FAST SigPropパスは、符号語セグメントの始まりに現れなければならず、各FAST MagRefパスは、符号語セグメントの終わりに現れなければならない。
注記1:FASTコーディング・パスの符号語セグメントへのこの構成は、BYPASSモード・フラグが設定されるとき、J2K−1ブロック・コーダによって使用されるものと一貫する。しかしながら、BYPASSモード・フラグ自体は、FASTブロック復号器にとっては何の意味もない。
注記2:これは、J2K−1に基づくコード・ストリームから、FASTブロック・コーダを使用するものへとコード変換するときに、BYPASSモード・フラグが保持されることを可能にし、その結果、後続のコード変換動作を通じて後に元の表現を復元することができる。
TERMINATIONモード・フラグが設定される場合、FAST SigProp及びMagRefコーディング・パスはそれら自体の符号語セグメントを占有する。
関連COD/COCマーカ・セグメントがそのFASTブロック・コーダを識別する場合、パケット・ヘッダに記録されるコーディング・パス寄与は、図9に示す構造に一致する。
多くの事例において、最初のコーディング・パス寄与はFAST Cleanupパスになる。しかしながら、FAST Cleanupパスが、すべてゼロ長を有するものとして識別される、「空コーディング・パス」のセットによって先行されることが可能である。FAST Cleanupパスは少なくとも2バイトを有しなければならないため、これらは、復号器によってFASTコーディング・パスとして解釈されるべきではない。空のコーディング・パスの数は、存在する場合、3Zであるべきであり、Zは非負整数である。最初のFAST Cleanupパスと関連付けられるビットプレーン・インデックスpは以下によって与えられ、
p=K−Mstart−Z−1
式中、Kはサブバンドと関連付けられる大きさビットプレーンの最大数であり、Mstartは、コード・ブロックの最初の寄与を識別するパケット・ヘッダ内でシグナリングされるような、失われているMSBの数であり、Zは、非ゼロ長を有する最初の寄与の前に識別されるコーディング・パスの空のトリプレットの数である。
注記1:3Z個の空のコーディング・パスが最初のFAST Cleanupパスに先行することを可能にする理由は、元のコード・ストリームからの品質層境界に関連するすべての情報を依然として保持しながら、J2K−1に基づくコード・ストリームがFASTブロック・コーダを使用するためにコード変換されることを可能にすることである。この情報は、コード変換された元のコード・ストリームを再構築するために使用することができる。
注記2:CAPマーカ・セグメントは、最初のFAST Cleanupパスの前にコード・ブロックが空のコーディング・パスに寄与し得るか否かについて、復号器にアドバイスするために使用される。
Zが非ゼロである場合、3Zの空のコーディング・パスと関連付けられる符号語セグメントは、これらのコーディング・パスがJ2K−1ブロック符号化アルゴリズムを使用して符号化されているかのように、関連COD/COCマーカ・セグメントのコード・ブロック・スタイル・フィールドに見出されるモード・フラグに基づいて決定される。特に、BYPASSモード・フラグが設定される場合、算術コーダがバイパスされたことになる空のSigPropパスは、それらの符号語セグメントの始まりに現れ、算術コーダがバイパスされたことになる空のMagRefパスは、TERMINATIONモード・フラグが設定されない限り、先行するSigPropパスと同じ符号語セグメントになる、それらの符号語セグメントの終わりに現れる。
コード・ブロックがコード・ストリームへの任意の空でないコーディング・パスに寄与する必要はなく、又は実際にはコーディング・パスには一切寄与する必要はない。4つ以上のFASTコーディング・パスがコード・ブロックによって寄与されることが可能であり、この場合、連続する各FAST Cleanupパスは、先行するインデックスよりも小さいインデックスであるビットプレーン・インデックスpを有し、したがって、すべての先行するコーディング・パスによって具現化されるすべての情報を符号化する。
注記1:復号器は、後続するFAST SigPropパス(存在する場合)及びFAST MagRefパス(存在する場合)とともに、コード・ブロックの最後の利用可能なFAST Cleanupパスを処理するように推奨される。
注記2:CAPマーカ・セグメントは、コード・ブロックが4つ以上のFASTコーディング・パスに寄与し得るか否かについて、復号器にアドバイスするために使用される。
JPEG2000パケット内の混合ブロック符号化タイプのキャリッジ
参考:他のコード・ブロックはJ2K−1アルゴリズムを使用して符号化される一方で、FASTブロック符号化アルゴリズムを使用してタイル構成要素のいくつかのコード・ブロックを符号化することが有用であり得る。これは、コード・ブロックが1つの表現から別の表現へとオンデマンドに(例えば、映像の一部分を表示又は通信するために必要とされるときに)コード変換され、その結果、他のコード・ブロックがコード変換されていない一方で、いくつかのコード・ブロックがコード変換されている用途において必要になり得る。
ブロック符号化タイプの混合は、下記に説明するように、これが関連COD/COCマーカ・セグメント内でシグナリングされる場合にのみ許容される。その上、この場合、CAPマーカ・セグメントは、節0において説明されているように、混合符号化タイプの可能性があることを復号器にアドバイスするために使用される。
混合符号化タイプの可能性がこのように示されるとき、コード・ブロックに使用されるブロック符号化タイプは、パケット・ヘッダ内で長さ情報をシグナリングすることを通じて間接的に識別される。すべてのJPEG2000コード・ストリームにおいて、コード・ブロック寄与と関連付けられる長さは、各コード・ブロックに特有である「Lブロック(Lblock)」状態変数に依存するビット数を使用してシグナリングされ、パケット・ヘッダ解析中に漸進的に調整される。コード・ブロックへの最初の空でない寄与の長さが、必要であるよりも大きいLブロック値を使用してシグナリングされる場合、そのFASTブロック符号化アルゴリズムが使用されており、すべてのコード・ブロック寄与の構造は、図9に示されるものとなる。そうでなく、Lブロックが必要とされる値以下である場合、J2K−1ブロック符号化アルゴリズムが使用されており、そのコード・ブロックのすべての含まれているコーディング・パスは、J2K−1アルゴリズムに従って処理される。
COD/COCマーカを介したFASTブロック・コーダ技術のシグナリング
FASTブロック・コーダを使用するコード・ストリームは、メイン・ヘッダ内に、パート15機能への依存を広告するCAPマーカ・セグメントを含む。FASTブロック・コーダが所与のタイル構成要素に属するコード・ブロック内で使用される場合、FASTモード・フラグ(コード・ブロック・スタイル・フィールドのビット7)が、関連COD又はCOCマーカ内で(1に等しく)設定される。
表7は、FASTブロック符号化アルゴリズムがすべてのモード・フラグの解釈に及ぼす影響を識別する、コード・ブロック・スタイル・フィールドが果たす役割を要約している。
Figure 2021520728
そのCOD/COCマーカ・セグメントのScod又はScocフィールド(適切な場合)のビット5が設定される場合、COD/COCマーカ・セグメントはまた、そのMSB(ビット15)が、コード・ブロックがJ2K−1ブロック符号化アルゴリズムを使用して符号化され得るか否かを示す16ビットのSXcodフィールドも含む。これが「混合符号化」モード・フラグである。混合符号化フラグが設定される場合、復号器は、コード・ブロックの非ゼロ長を有する最初の寄与の長さを符号化するために使用される「Lブロック」パケット解析状態変数が、その長さを符号化するのに必要であるよりも大きいか否かをチェックする。上記で説明したように、Lブロックが必要であるよりも大きい場合、FASTブロック復号器が、そのコード・ブロックを処理するために利用され、そうでない場合、J2K−1ブロック復号器が使用される。
注記:SXcodフィールドも、IS15444−2/AMD4において使用され、SXcodフィールドのビット5がまた、その存在をシグナリングするために使用される。IS15444−2/AMD4において、コード・ブロック・スタイル・フィールドのBYPASSモード・フラグ(ビット0)が設定されるときはいつでも、SXcodフィールドの2つのLSBが、使用されるべき追加のバイパスされるビットプレーンの数を識別する値BBを符号化する。BYPASS=1且つBB=01であるとき、SigPropコーディング・パスとMagRefコーディング・パスの両方について、算術符号化はすべてのビットプレーン内でバイパスされる。FASTブロック・コーダが使用される場合、SXcodフィールドのこれら2つのLSBは、復号器にとっては何の意味もないが、FASTブロック・コーダを使用するためにコード変換されている、元のJ2K−1に基づくJPEG2000コード・ストリーム内で使用されたブロック・コーダ・モードを保持するために使用され得る。
コード・ブロック・スタイル・フィールドのビット7が設定され、ただし、Scod又はScocフィールドのビット5が設定されない場合、16ビットのSXcodフィールドはCOD/COCマーカ・セグメント内に存在せず、すべての影響を受けるタイル構成要素のコード・ブロックは、FASTブロック符号化アルゴリズムのみを使用して符号化される。
パート15機能フラグ
本発明においては、以下のように、CAPマーカ・セグメント内でパート15機能語の3つのビット・フラグを定義することを提案する。
「空のパス(Empty Passes)」フラグは、コード・ストリームがFAST Cleanupパスの前にZ>0個の空のコーディング・パスを含み得ることを示す。このフラグが設定されない(すなわち、0)場合、FASTブロック符号化アルゴリズムを使用する任意のコード・ブロックからの最初のパケット寄与はFAST Cleanupパスである。
「複数のFAST Cleanup(Multiple FAST Cleanup)」フラグは、コード・ストリームがコード・ブロックの2つ以上のFAST Cleanupパスを含み得ることを示す。このフラグが設定されない(すなわち、0)場合、最大1つのFAST Cleanupパスが、任意のコード・ブロックによって、その区域のパケットに寄与される。
「混合符号化」フラグは、上述したように示される、2つ以上のタイプの符号化技術が、コード・ブロックについて可能であり得ることを示す。このフラグが設定されない(すなわち、0)場合、そのCOD/COCマーカ・セグメントがFASTモード・フラグ(コード・ブロック・スタイル・フィールドのビット7)を設定されているすべてのコード・ブロックが、FASTブロック符号化アルゴリズムを使用して復号され、SXcodフィールドは存在しないか、又は、その「混合符号化」モード・フラグが0になる。
「混合符号化」フラグが設定される場合、上記で説明したように、16ビットのSXcodフィールドが含まれることを識別するビット5が、コード・ストリームのCOD及び/又はCOCマーカ・セグメント内で設定され得る。
上記の実施例を使用して符号化及び復号するための方法は、ソフトウェア、ソフトウェアとハードウェアとの混合、プログラム式ゲート・アレイ(PGA)若しくはFPGA、又は任意の他のアーキテクチャによって構成することができる処理装置によって実施される。ソフトウェアは、モジュールの形態で提供され得る。ソフトウェアが使用される場合、ルーチン及びサブ・ルーチン、又は任意のソフトウェア・アーキテクチャが、本発明の実施例を実施する。本発明を実施するためにソフトウェアが使用される場合、ソフトウェアは、ディスクなどのコンピュータ可読媒体上で、若しくは、インターネットなどのネットワーク上のデータ信号として、又は、任意の他の様式で提供することができる。
上記の実施例は、JPEG2000フォーマット内での使用に関する。本発明の実施例はこれに限定されない。一部の実施例は、他の画像処理フォーマットにおいて使用されてもよい。実施例は、他の画像処理コンテクストに用途を見出し得る。
本発明の実施例の使用は、画像又はビデオ・フレームに限定されず、任意の他のタイプのメディアに使用されてもよい。例えば、実施例は、マルチ・ビュー・イメージング及びビデオ又は任意の他の視覚メディアの深さ符号化によって利用されてもよい。
広範に記載されているような本発明の思想又は範囲から逸脱することなく、特定の実施例に示すように、本発明に多数の変形及び/又は変更を行うことができることが、当業者には諒解されよう。それゆえ、本発明の実施例は、すべての点において限定ではなく例示として解釈されるべきである。

脚注
1 http://www.kakadusoftware.com−比較は、50%だけより高速であり得るKakaduスピードパック・エディションとは対照的に、通常のKakadu配布に関する。
2 実際には、JPEG2000の未処理の符号語セグメントにおけるビット・スタッフィングによって、ビッグ・エンディアン16進値がFF80h〜FFFFhの範囲内にあるバイト対の出現が回避されるが、ブロック符号化アルゴリズムは一般に、FF90h〜FFFFhの範囲直野マーカ・コードを回避するためにのみ必要とされる。
3 初期実験は、この変形形態からもたらされる符号化効率の典型的な改善が1.5%を超える確率は低いことを示唆している。
4 グループ内の非有意サンプルの予測子は同じように形成することができるが、符号化又は復号プロセスには影響を及ぼさない。
5 「空の」とは、本明細書においては、CxtVLC符号語が存在しない非有意AZCグループ、及び、各グループ行が整数のグループ対を有することを保証するための付け足しとして加えられるグループを指す。

Claims (46)

  1. 静止画像、ビデオ・フレーム、又は関連メディアから導出される、サブバンド・サンプル値のブロックを符号化するための方法であって、3つのビット・ストリームと、サンプルを前記ブロックから規定のグループへと分割することとを含み、
    a.第1のビット・ストリーム(MELビット・ストリーム)が、因果関係のある隣接グループがすべて非有意であるグループ(AZCグループ)全体の有意性を符号化し、非ゼロの大きさを有するサンプルは有意であると識別され、ゼロの大きさを有するサンプルは非有意であると識別され、
    b.第2のビット・ストリーム(VLCビット・ストリーム)が、有意なAZCグループであるか、又は、AZCグループでないかのいずれかである各グループ内の個々のサンプルの有意性を符号化し、
    c.前記第2のビット・ストリーム(VLCビット・ストリーム)はまた、指数予測子のセットに加えられると、前記グループ内の各有意なサンプルの大きさ指数の上限を与える、各有意なグループの符号なし残差値も符号化し、
    d.第3のビット・ストリーム(MagSgnビット・ストリーム)が、対応する指数境界を所与として、有意なサンプル値を表すのに必要な符号ビット及び任意の追加の大きさビットを提供し、
    e.前記指数予測子は、前記ブロック内の先行するサンプルが前記ブロックの前記境界の外部にある場合を除いて、前記ブロック内の前記先行するサンプルと関連付けられる指数境界と前記追加の大きさビットの両方を使用して計算される、方法。
  2. 前記MELビット・ストリームは、AZCグループと関連付けられるグループ有意性シンボルの列に適用される適応的ラン・レングス符号化プロセスによって形成される、請求項1に記載の方法。
  3. あるグループの前記因果関係のある隣接グループは、グループの最初の行を除いて、前記グループの左及びグループの同じ行内、又は、グループの先行する行内のいずれかに見出される、前記グループに隣接するサンプル位置に対応し、あるグループの前記因果関係のある隣接グループは、前記グループ内で直ぐ左に見出されるサンプル位置に対応し、前記ブロック内に含まれていない隣接グループは非有意であると解釈される、請求項1又は2に記載の方法。
  4. グループ内のすべてのサンプルの有意性(前記グループの有意性パターン)は、前記グループの因果関係のある隣接グループの有意性から形成されるコンテクスト・ラベルに基づいてともに符号化される、請求項1、2又は3に記載の方法。
  5. 前記有意性パターンの符号化は、前記コンテクスト・ラベルに依存する可変長コード(CxtVLCコード)の使用を含む、請求項4に記載の方法。
  6. 前記符号なし残差の符号化は、符号語がプレフィックス構成要素及びサフィックス構成要素から成る、可変長コード(U−VLCコード)を含み、前記サフィックスの長さは、前記サフィックスの値によって完全に決定される、請求項1から5までのいずれか一項に記載の方法。
  7. 符号なし残差オフセット値が、コンテクスト依存可変長コード(CxtVLCコード)を使用してグループの前記有意性パターンとともに符号化され、前記符号なし残差オフセットは、前記符号なし残差が非ゼロであるか否かを示し、前記U−VLCコードは、非ゼロである符号なし残差を符号化するためにのみ使用される、請求項5と6の両方に記載の方法。
  8. 前記CxtVLCコードは、符号語と関連付けられる前記符号なし残差オフセット値が非ゼロであるいくつかの有意サンプルの大きさビットを識別するように増強され、前記大きさビットはこのとき、前記MagSgnビット・ストリーム内に含まれない、請求項7に記載の方法。
  9. 前記指数予測子は、前記ブロックのグループの最初の行内を除き、グループの先行する行からのサンプルの値を使用して形成される、請求項1から8までのいずれか一項に記載の方法。
  10. グループは、前記ブロック内の連続する行から成る対の中の連続する列から成る対からの前記サンプルから構成される、2×2のサイズを有する、請求項1から9までのいずれか一項に記載の方法。
  11. 前記ブロックのグループの最初のものでない行内にあるグループ内のサンプルの前記指数予測子は、前記グループの直上にあるサンプルの行上に見出される、前記グループに隣接する4つのサンプルの前記大きさ指数の最大値から形成される、請求項10に記載の方法。
  12. グループ内の有意サンプルの前記指数予測子は、前記グループ内の唯一の有意サンプルである場合には強制的に1にされる、請求項1から11までのいずれか一項に記載の方法。
  13. 前記グループの最初の行において、MELシンボル・ストリームは、グループの集合の1つの追加の符号なし残差オフセット・シンボルを用いて増強され、集合の好ましいサイズは2つの連続するグループであり、該グループの有意性パターンとともに符号化される前記符号なし残差オフセット値がすべて非ゼロである場合にのみ、前記集合内のすべてのグループの前記符号なし残差が、U−VLCコードを前記グループの調整済みの符号なし残差に適用する前に、共通の追加の符号なし残差オフセット値に基づいて調整される、請求項7と併せた、請求項1から12までのいずれか一項に記載の方法。
  14. 前記CxtVLCコード・ビット及び前記U−VLCコード・ビットは、グループの規定の集合にわたってインターリーブされ、その結果、前記集合内のすべてのグループの前記CxtVLCビットは、同じグループの前記U−VLCコード・ビットの前に現れ、集合内のすべてのグループのU−VLCプレフィックス・ビットは、同じグループの前記U−VLCサフィックス・ビットの前に現れ、前記グループの集合は好ましくは、水平方向に隣接するグループから成る対から構成される、請求項5及び6と併せた、請求項1から13までのいずれか一項に記載の方法。
  15. 前記Melビット・ストリーム、前記VLCビット・ストリーム、及び前記MagSgnビット・ストリームは各々、ビット・スタッフィング手順を受け、バイトにパックされて、MELバイト・ストリーム、VLCバイト・ストリーム、及びMagSgnバイト・ストリームを形成し、前記VLCバイト・ストリームは、ブロックを表す単一のバイト列(符号語セグメント)の終わりから後方に成長し、一方、前記MagSgnバイト・ストリームは、前記バイト列の始まりから前方に成長し、前記MELバイト・ストリームは、前記MagSgnバイト・ストリームの終わりから前方に成長し、その結果、前記MagSgnバイト・ストリームと前記MELバイト・ストリームとの間の前記境界のみが、前記バイト列にとともに明示的に与えられる必要がある、請求項1から14までのいずれか一項に記載の方法。
  16. 符号化される前記サンプル値は、所与の大きさビットプレーン(p値)と関連付けられる精度までの可能な切り捨ての後の、量子化サブバンド・サンプルに対応する、請求項1から15までのいずれか一項に記載の方法。
  17. 追加のコーディング・パス(SigPropパス)が、最初の大きさビットプレーン(p値)と関連付けられる精度において非有意(ゼロ)である特定のサンプルの、次に精細な大きさビットプレーンに対する大きさを符号化するために、及び、より精細な大きさビットプレーンに関して有意であるすべての前記サンプルの符号ビットも符号化するために使用され、前記ブロック・サンプルを通じてストライプ配向走査に従い、ストライプ列の規定の集合からSigPropビット・ストリームにすべての関連する大きさビットを放出し、その後、前記放出されている大きさビットに基づいて有意として識別される前記ストライプ列の集合内の前記サンプルの符号ビットを放出する、請求項16に記載の方法。
  18. 追加のコーディング・パス(MagRefパス)が、前記最初の大きさビットプレーン(p値)と関連付けられる精度において有意(非ゼロ)として符号化されるサンプルの、次に精細な大きさビットプレーンに対する最下位の大きさビットを符号化するために使用され、前記ブロック・サンプルを通じてストライプ配向走査に従い、MagRefビット・ストリームにすべての関連する大きさビットを放出する、請求項16又は17に記載の方法。
  19. 前記SigPropビット・ストリーム及び前記MagRefビット・ストリームは各々、ビット・スタッフィング手順を受け、SigPropバイト・ストリーム及びMagRefバイト・ストリームにパックされ、前記SigPropバイト・ストリームは精度改善コード・バイト列の始まりから前方に成長し、前記MagRefバイト・ストリームは精度改善コード・バイト列の終わりから後方に成長する、請求項17及び18に記載の方法。
  20. 静止画像、ビデオ・フレーム、又は関連メディアを生成する、サブバンド・サンプルのブロックを復号するための方法であって、前記サンプルは、規定のグループに構成されており、3つのビット・ストリームを使用して表され、
    a.第1のビット・ストリーム(MELビット・ストリーム)が、因果関係のある隣接グループがすべて非有意であるグループ(AZCグループ)全体の有意性を発見するために復号され、非ゼロの大きさを有するサンプルは有意であると識別され、ゼロの大きさを有するサンプルは非有意であると識別され、
    b.第2のビット・ストリーム(VLCビット・ストリーム)が、有意なAZCグループであるか、又は、AZCグループでないかのいずれかである各グループ内の個々のサンプルの有意性を発見するために復号され、
    c.前記第2のビット・ストリーム(VLCビット・ストリーム)の復号はまた、指数予測子のセットに加えられると、前記グループ内の各有意なサンプルの大きさ指数の上限を与える、各有意なグループの符号なし残差値を発見するためにも使用され、
    d.第3のビット・ストリーム(MagSgnビット・ストリーム)は、対応する指数境界を所与として、各有意なサンプルの値を推測するために使用される符号ビット及び任意の追加の大きさビットを発見するためにアンパックされ、
    e.前記指数予測子は、前記ブロック内の先行するサンプルが前記ブロックの境界の外部にある場合を除いて、前記ブロック内の先行して復号されているサンプルと関連付けられる指数境界と追加の大きさビットの両方を使用して計算される、方法。
  21. 適応的ラン・レングス復号プロセスが、前記MELビット・ストリームを復号するために使用され、各AZCグループの有意性を識別するグループ有意性シンボルの列が生成される、請求項20に記載の方法。
  22. あるグループの前記因果関係のある隣接グループは、グループの最初の行を除いて、前記グループの左及びグループの同じ行内、又は、グループの先行する行内のいずれかに見出される、前記グループに隣接するサンプル位置に対応し、前記サンプルの有意性はすでに復号されており、あるグループの前記因果関係のある隣接グループは、前記グループ内で直ぐ左に見出されるサンプル位置に対応し、前記サンプルの有意性はすでに復号されており、前記ブロック内に含まれていない隣接グループは非有意であると解釈される、請求項20又は21に記載の方法。
  23. グループ内のすべてのサンプルの有意性(前記グループの有意性パターン)は、前記グループの因果関係のある隣接グループの有意性から形成されるコンテクスト・ラベルを使用してともに復号される、請求項20、21又は22に記載の方法。
  24. 前記有意性パターンの復号は、前記コンテクスト・ラベルに依存する可変長コード(CxtVLCコード)の復号を含む、請求項23に記載の方法。
  25. 前記符号なし残差の復号は、符号語がプレフィックス構成要素及びサフィックス構成要素から成る、可変長コード(U−VLCコード)の復号を含み、前記サフィックスの長さは、前記サフィックスの値によって完全に決定される、請求項20から24までのいずれか一項に記載の方法。
  26. 符号なし残差オフセット値が、コンテクスト依存可変長コード(CxtVLCコード)を復号するプロセスにおいてグループの前記有意性パターンとともに復号され、前記符号なし残差オフセットは、前記符号なし残差が非ゼロであるか否かを示し、前記グループのU−VLC符号語の復号は、前記符号なし残差オフセット値が非ゼロである場合にのみ実施され、前記実施を受けて、前記U−VLC復号結果が、前記符号なし残差オフセット値に加えられる、請求項24と25の両方に記載の方法。
  27. 前記復号されている符号なし残差オフセット値が非ゼロであるいくつかのコンテクスト依存可変長符号語(CxtVLCコード)を復号するプロセスにおいて、追加の大きさビットが、前記有意性パターン及び符号なし残差オフセット値とともにいくつかの有意係数について復号され、前記追加の大きさビットが、前記関連付けられるサンプル値を再構築するために、前記MagSgnビット・ストリームからのビットと組み合わされる、請求項26に記載の方法。
  28. 前記指数予測子は、前記ブロックのグループの最初の行内を除き、グループの先行する行からのサンプルの値を使用して形成され、前記サンプル値は以前に復号されている、請求項20から27までのいずれか一項に記載の方法。
  29. グループは、前記ブロック内の連続する行から成る対の中の連続する列から成る対からの前記サンプルから構成される、2×2のサイズを有する、請求項20から28までのいずれか一項に記載の方法。
  30. 前記ブロックのグループの最初のものでない行内にあるグループ内のサンプルの前記指数予測子は、前記グループの直上にあるサンプルの行上に見出される、前記グループに隣接する4つの位置にある前記大きさ指数の最大値から形成され、前記大きさ指数は、前記4つの位置にある先行して復号されているサンプル値から計算される、請求項29に記載の方法。
  31. グループ内の有意サンプルの前記指数予測子は、前記グループ内の唯一の有意サンプルである場合には強制的に1にされる、請求項20から30までのいずれか一項に記載の方法。
  32. 前記グループの最初の行について、前記増強されたMELシンボル・ストリームは、グループの集合の共通の追加の符号なし残差オフセット値を提供し、集合の好ましいサイズは2つの連続するグループであり、該グループの有意性パターンとともに復号される前記符号なし残差オフセット値がすべて非ゼロである場合にのみ、前記集合内のすべてのグループの前記符号なし残差が、前記グループの前記U−VLCコードの復号後に、前記共通の追加の符号なし残差オフセット値に基づいて調整される、請求項25と併せた、請求項20から31までのいずれか一項に記載の方法。
  33. グループの規定の集合と関連付けられる前記CxtVLCコード・ビットが、前記VLCビット・ストリーム内でともに見出され、その結果、前記グループの集合の前記CxtVLCコードは、最初に復号されなければならず、続いて前記集合内のすべてのグループのU−VLCプレフィックスが復号され、次いで、前記集合内のすべてのグループのU−VLCサフィックスが復号され、その後、復号は、グループの任意の後続の集合について進行することができ、前記グループの集合は好ましくは、水平方向に隣接するグループから成る対から構成される、請求項24及び25と併せた、請求項20から32までのいずれか一項に記載の方法。
  34. 前記Melビット・ストリーム、前記VLCビット・ストリーム、及び前記MagSgnビット・ストリームは各々、それぞれMELバイト・ストリーム、VLCバイト・ストリーム、及びMagSgnバイト・ストリームからのビットをアンパックし、ビット・スタッフィング手順を介して前記バイト・ストリームに導入されている場合があるスタッフィング・ビットを除去することによって復元され、前記VLCバイト・ストリームは、ブロックを表す単一のバイト列(符号語セグメント)の終わりから後方に成長し、一方、前記MagSgnバイト・ストリームは、前記バイト列の始まりから前方に成長し、前記MELバイト・ストリームは、前記MagSgnバイト・ストリームの終わりから前方に成長し、前記MagSgnバイト・ストリームと前記MELバイト・ストリームとの間の前記境界が、前記バイト列自体とともに明示的に識別される、請求項20から34までのいずれか一項に記載の方法。
  35. 復号される前記サンプル値は、所与の大きさビットプレーン(p値)と関連付けられる精度までの可能な切り捨ての後の、量子化サブバンド・サンプルに対応する、請求項20から34までのいずれか一項に記載の方法。
  36. 最初の大きさビットプレーン(p値)と関連付けられる精度において非有意(ゼロ)であるとして復号された特定のサンプルの、次に精細な大きさビットプレーンに対する大きさを発見するために、及び、より精細な大きさビットプレーンに関して有意であると見出されたすべての前記サンプルの符号ビットも復元するために、追加の復号パス(SigPropパス)が実施され、前記ブロック・サンプルを通じてストライプ配向走査に従い、SigPropビット・ストリームからのストライプ列の規定の集合のすべての関連する大きさビットを取り出し、その後、前記取り出されている大きさビットに基づいて有意として識別される前記ストライプ列の集合内の前記サンプルの符号ビットを取り出す、請求項35に記載の方法。
  37. 前記最初の大きさビットプレーン(p値)に関して有意としてすでに復号されているサンプルの、次に精細な大きさビットプレーンに対する最下位の大きさビットを発見するために、追加の復号パス(MagRefパス)が実施され、前記ブロック・サンプルを通じてストライプ配向走査に従い、MagRefビット・ストリームからすべての関連する大きさビットを取り出す、請求項35又は36に記載の方法。
  38. 前記SigPropビット・ストリーム及び前記MagRefビット・ストリームは、単一の制度改善コード・バイト列内で、それぞれ、前方に成長するSigPropバイト・ストリーム及び後方に成長するMagRefバイト・ストリームからのビットをアンパックし、ビット・スタッフィング手順を介して前記バイト・ストリームに導入されている場合があるスタッフィング・ビットを除去することによって復元される、請求項36及び37に記載の方法。
  39. サンプル値のブロックを符号化するための装置であって、請求項1から19までのいずれか一項に記載の方法を実施するように構成されている符号化装置を備える、装置。
  40. 請求項1から19までのいずれか一項に記載の方法を実施するようにコンピュータを制御するための命令を含む、コンピュータ・プログラム。
  41. 請求項40に記載のコンピュータ・プログラムを提供する、不揮発性コンピュータ可読媒体。
  42. 請求項40に記載のコンピュータ・プログラムを含む、データ信号。
  43. 請求項20から38までのいずれか一項に記載の方法を実施するように構成されている復号器装置を含む、サンプルのブロックを復号するための装置。
  44. 請求項20から38までのいずれか一項に記載の方法を実施するようにコンピュータを制御するための命令を含む、コンピュータ・プログラム。
  45. 請求項44に記載のコンピュータ・プログラムを提供する、不揮発性コンピュータ可読媒体。
  46. 請求項44に記載のコンピュータ・プログラムを含む、データ信号。
JP2020554294A 2018-04-04 2019-04-04 画像圧縮のためのさらに改善された方法及び装置 Pending JP2021520728A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
AU2018901112A AU2018901112A0 (en) 2018-04-04 An Improved Method and Apparatus for Image Compression
AU2018901112 2018-04-04
AU2018901249A AU2018901249A0 (en) 2018-04-13 An Improved Method and Apparatus for Image Compression
AU2018901249 2018-04-13
AU2018901512A AU2018901512A0 (en) 2018-05-03 A Further Improved Method and Apparatus for Image Compression
AU2018901512 2018-05-03
PCT/AU2019/050299 WO2019191811A1 (en) 2018-04-04 2019-04-04 A further improved method and apparatus for image compression

Publications (2)

Publication Number Publication Date
JP2021520728A true JP2021520728A (ja) 2021-08-19
JPWO2019191811A5 JPWO2019191811A5 (ja) 2022-06-08

Family

ID=68099677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020554294A Pending JP2021520728A (ja) 2018-04-04 2019-04-04 画像圧縮のためのさらに改善された方法及び装置

Country Status (5)

Country Link
US (1) US11265550B2 (ja)
EP (1) EP3777187A4 (ja)
JP (1) JP2021520728A (ja)
AU (2) AU2019247481B2 (ja)
WO (1) WO2019191811A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019191811A1 (en) 2018-04-04 2019-10-10 Kakadu R & D Pty Ltd A further improved method and apparatus for image compression
US11357020B2 (en) 2020-02-06 2022-06-07 International Business Machines Corporation Connecting computer processing systems and transmitting data
US11290575B2 (en) * 2020-02-06 2022-03-29 International Business Machines Corporation Connecting computer processing systems and transmitting data
US11405766B2 (en) 2020-02-06 2022-08-02 International Business Machines Corporation Connecting computer processing systems and transmitting data
CN113965761B (zh) * 2021-10-22 2023-06-02 长安大学 基于gpu实现的htj2k图像压缩方法、装置及设备
CN116527904B (zh) * 2023-07-03 2023-09-12 鹏城实验室 熵编码方法、熵解码方法及相关装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017201574A1 (en) * 2016-05-23 2017-11-30 Newsouth Innovations Pty Limited A method and apparatus for image compression

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6678419B1 (en) * 1999-03-26 2004-01-13 Microsoft Corporation Reordering wavelet coefficients for improved encoding
JP4135617B2 (ja) * 2003-09-08 2008-08-20 ソニー株式会社 画像符号化装置及び方法
CA2807919C (en) * 2012-08-31 2016-06-14 Research In Motion Limited Methods and devices for entropy coding in scalable video compression
US9930348B2 (en) * 2014-03-14 2018-03-27 Qualcomm Incorporated Coefficient level coding in a video coding process
US10362310B2 (en) * 2015-10-21 2019-07-23 Qualcomm Incorporated Entropy coding techniques for display stream compression (DSC) of non-4:4:4 chroma sub-sampling
US10609367B2 (en) * 2016-12-21 2020-03-31 Qualcomm Incorporated Low-complexity sign prediction for video coding
WO2019191811A1 (en) 2018-04-04 2019-10-10 Kakadu R & D Pty Ltd A further improved method and apparatus for image compression

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017201574A1 (en) * 2016-05-23 2017-11-30 Newsouth Innovations Pty Limited A method and apparatus for image compression

Also Published As

Publication number Publication date
US11265550B2 (en) 2022-03-01
EP3777187A1 (en) 2021-02-17
AU2023241351A1 (en) 2023-10-26
US20210112250A1 (en) 2021-04-15
EP3777187A4 (en) 2021-12-22
WO2019191811A1 (en) 2019-10-10
AU2019247481B2 (en) 2023-07-06
AU2019247481A1 (en) 2020-10-01

Similar Documents

Publication Publication Date Title
JP2021520728A (ja) 画像圧縮のためのさらに改善された方法及び装置
JP7037554B2 (ja) 画像を圧縮する方法および装置
KR101955143B1 (ko) 엔트로피 인코딩 및 디코딩 방식
EP2614592B1 (en) Entropy encoding and decoding scheme
AU2019356526B2 (en) A method and apparatus for image compression

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220404

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230607

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230907

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240705

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240820