JP7477178B2 - 画像圧縮のための方法及び装置 - Google Patents
画像圧縮のための方法及び装置 Download PDFInfo
- Publication number
- JP7477178B2 JP7477178B2 JP2021519707A JP2021519707A JP7477178B2 JP 7477178 B2 JP7477178 B2 JP 7477178B2 JP 2021519707 A JP2021519707 A JP 2021519707A JP 2021519707 A JP2021519707 A JP 2021519707A JP 7477178 B2 JP7477178 B2 JP 7477178B2
- Authority
- JP
- Japan
- Prior art keywords
- coding
- samples
- magnitude
- group
- bits
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 114
- 238000007906 compression Methods 0.000 title claims description 27
- 230000006835 compression Effects 0.000 title claims description 25
- 230000008569 process Effects 0.000 claims description 38
- 230000003044 adaptive effect Effects 0.000 claims description 30
- 230000008901 benefit Effects 0.000 description 27
- 238000013459 approach Methods 0.000 description 23
- 230000009977 dual effect Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 14
- 239000003550 marker Substances 0.000 description 13
- 230000001364 causal effect Effects 0.000 description 8
- 238000013139 quantization Methods 0.000 description 8
- 230000006837 decompression Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 241000209094 Oryza Species 0.000 description 5
- 235000007164 Oryza sativa Nutrition 0.000 description 5
- 239000013256 coordination polymer Substances 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 235000009566 rice Nutrition 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 3
- 238000012856 packing Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 241000611421 Elia Species 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/64—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
- H04N19/645—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/93—Run-length coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Auxiliary Devices For And Details Of Packaging Control (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Description
・ 圧縮効率
・ 品質スケーラビリティ
・ 解像度スケーラビリティ
・ 関心領域アクセシビリティ
・ 並列計算
・ 反復符号化なしの最適化されたレート制御
・ 視覚的に関係する最適化目標をターゲットにする能力
・ 誤り耐性
・ 圧縮されたドメイン(すなわち、超低メモリ)転置及び反転動作
・ コード・ブロック、プレシンクト又はJ2Kパケット・レベルにおいて情報を再シーケンス化する能力
・ JPIPを介した(ビデオ及びアニメーションを含む)像の効率的で応答型のリモート対話型ブラウズ。
・ 巨大な像ソースからの任意の領域の効率的なオンデマンドのレンダリング。
・ 非線形トーン曲線及び/又はカスタム浮動小数点マッピングの使用による、高いダイナミック・レンジ圧縮。
・ リッチなメタデータ注釈。
・ ハイパースペクトル及びボリュメトリック・コンテンツの効率的な圧縮。
走査順序において前のサンプルの有意性(significance)のみに依存するコードを使用して、サンプルのセットについての有意性情報をコーディングするステップと、
走査順序において前のマグニチュード(magnitude)及び有意性情報のみに依存するコードを使用して、サンプルのセットについてのマグニチュード及び符号(sign)情報をコーディングするステップと、
有意性及びマグニチュード・コード・ビットを、サンプルの各セットに関連する有意性ビットが、コーディングされた表現(コードワード・セグメント)中で一緒に出現するように、セットごとに構成するステップと、
コード・ブロック中のサンプルの各セットについてコーディングするステップ及びコード・ビット構成ステップを繰り返すステップと
を含む。
既存のJPEG2000ブロック・コーディング・アルゴリズムは、コーディング・パスのシーケンスを通して各コード・ブロック内のサブバンド・サンプルを処理する。次のセクションにおけるFASTブロック・コーディング・アルゴリズムの異なるが関係するコーディング・パス構造を説明するために、これを簡単に復習することは役立つ。
によって与えられる。
P=K-Mstart
によって与えられる。
Cleanup(p=P-1): ビットプレーンpにおいて、有意サンプルの符号に加えて、すべてのサンプルの有意性をコーディングする。
SigProp(p=P-2): プレーンpにおいて、知られている有意サンプルの非有意近傍にアクセスし、それらの有意性(及び符号)をコーディングする。
MagRef(p=P-2): プレーンp+1に関してすでに有意であったサンプルにアクセスし、Mp[n]の最下位ビットをコーディングする。
Cleanup(p=P-2): ビットプレーンpにおいて、有意性がまだ確立されていないすべてのサンプルの有意性(及び符号)をコーディングする。
SigProp(p=P-3): ...
MagRef(p=P-3): ...
Cleanup(p=P-3): ...
...
Cleanup(p=0): ...
エンコーダが最終のコードストリーム中に含まれる情報から任意の数の末尾のコーディング・パスをドロップし得ることに留意されたい。事実上、エンコーダが、そのようなコーディング・パスがドロップされることになることを合理的に予期することができる場合、エンコーダは、初めからそれらのコーディング・パスを生成する必要はない。
コーディング・パス構造
FASTブロック・コーダはまた、ビットプレーンpに関して定義された、Cleanupコーディング・パス、SigPropコーディング・パス及びMagRefコーディング・パスを伴う、コーディング・パス構造を採用する。しかしながら、重要なことに、各ビットプレーンpに関連するCleanupパスは、Mp[n]≠0であるサンプルのマグニチュードMp[n]及び符号を完全に符号化する。この情報は、すべての前の(より大きいp)コーディング・パスに関連するものを完全に包含し、したがって、コードストリームにそれらを放出しても意味がない。
1.コード・ビットは、同じく、リトルエンディアン・ビット順序を用いて未加工ビットストリームのバイトにパックされるが、JPEG2000コーダは、ビッグエンディアン・ビット・パッキング順序を使用する。
2.高さ3又は高さ4のストライプの場合、各ストライプ列に関連する有意性ビットが最初に放出され、次のストライプ列に進む前に、関連する符号ビットが続く。
3.高さ2のストライプの場合、ストライプ列の各ペアに関連する有意性ビットが最初に放出され、ストライプ列の次のペアに進む前に、関連する符号ビットが続く。
4.高さ1のストライプ列の場合、4つのストライプ列(4つのサンプル)の各グループに関連する有意性ビットが最初に放出され、4つのストライプ列の次のグループに進む前に、関連する符号ビットが続く。
このセクションの残りは、FASTブロック・コーダのCleanupパスについて説明することに充てられる。進行する前に、エンコーダについての要約ブロック図を提供することは役立つ。後の説明を容易にするために、本明細書によってカバーされるFAST cleanupパスのいくつかの異なる変形態に対応するいくつかのバージョンにおいて符号化ブロック図を提供する。変形態は、以下のように、2つの主要なやり方において区別される。
1.各変形態は、デュアル・ビットストリーム構造又はトリプル・ビットストリーム構造のいずれかを有する。デュアル・ビットストリーム構造は、圧縮観点から、概念的により簡単でごくわずかにより効率的であるが、トリプル・ビットストリーム構造は、ソフトウェア及びハードウェア最適化のためにより多くのオプションを提供し、したがって、一般に好まれることになる。デュアル・ビットストリーム構造は、1つのビットストリーム内でVLCビット及びMagSgnビットをインターリーブするが、トリプル・ビットストリーム構造は、別個のVLCビットストリーム及びMagSgnビットストリームを提供する。
2.他の顕著な特徴は、各有意サンプルについてのマグニチュード情報が、1つのビットストリーム(MagSgnビットストリーム)内に統合されるのか、VLCビットストリームとMagSgnビットストリームとの間で分散されるのかである。分散手法は、統計的冗長性を活用するわずかにより少ない機会を提供するが、サンプル間依存性を低減又は除去することによって、ソフトウェア復号スループットを改善し、ハードウェア復号クロック・レートを増加させる。分散手法はまた、MagSgnビットストリームに関連するワースト・ケース・データ・レートを低減し、それは、ハードウェア実装形態の場合、より良好である。
上述のように、JPEG2000コードストリーム構造との適合性のために、FASTブロック・コーダのCleanupパスは、既存の方法を介して(1つ又は複数の)関係するパケット・ヘッダについて長さが通信される単一のコードワード・セグメントを作り出す。しかしながら、FASTブロック・コーダでは、このコードワード・セグメントは、2つ又は3つのビットストリームに分割される。
A. 前方に伸長する適応的にコーディングされたビットストリーム、
B. コードワード・セグメントの終端から後方に伸長する未加工ビットストリーム、及び
C. いくつかの変形態における、コードワード・セグメントの開始から前方に伸長する第2の未加工ビットストリーム。
1. MagSgnビットストリームは、高いビットレートにおいてビットストリームの最大のものである傾向があり、したがって、このビットストリームをコードワード・セグメントの開始から前方に伸長させることにある程度の利益があり、各コード・ブロックの終端において、生成されたバイトを再構成するために必要とされる労力を最小限に抑える。
2. VLCビットストリームと適応的にコーディングされたビットストリームとの組み合わせられたサイズは、確定的に制限され得る。
a.有意サンプルについてのすべてのマグニチュード関係ビットがMagSgnビットストリームのみにおいて見つけられる統合マグニチュード情報があれば、この制限は、VLCビットストリーム内で利用されるコードについての好適な選定を条件として、Smax<1020バイトを満たすように示され得、L=10ビット・インターフェース・ロケータ・ワード(ILW:interface locator word)を使用して2つの前方伸長ビットストリーム間の境界をシグナリングすることを可能にする。
b.コーディングされたマグニチュード情報をVLCビットストリームとMagSgnビットストリームとの間で分散する変形態の場合、VLCビットストリームと適応的にコーディングされたビットストリームとの組み合わせられたサイズが増大し、VLCビットストリームとともに利用されるコードについての好適な選定を条件として、Smax<2040バイトを満たすように示され得る制限を伴う。これは、L=11ビット・インターフェース・ロケータ・ワード(ILW)を使用して2つの前方伸長ビットストリーム間の境界をシグナリングすることを可能にする。
JPEG2000において、及びJBIG2においても使用されるMQ算術コーダは、それが偽マーカー・コードを放出することができない特性をすでに有している。
(V&7FFFh)>7F8Fh
を見つけた場合、Vの最上位ビットは、新たに生成されたバイトを放出する前にリセットされ、その後、削除されたばかりのビットは、それが次のバイトの最下位ビットになるように、放出未加工に受け渡される。
(V&7F80h)≠0
算術コーディングは極めて強力でフレキシブルな技術であるが、FASTブロック・コーダは、AZCシンボルとして知られている、バイナリ・シンボルの可変長ストリングσAZC[i]を表すために適応コーディングを使用する。以下で説明されるように、これらのサンプルはすべて、同一の(全0)近隣を有し、したがって、それらを、異なる統計値をもつサブクラスに分離するためのアプリオリなやり方はない。したがって、符号化実装形態と復号実装形態の両方を簡略化する、1つの適応MQコーディング・コンテキストのみが利用される必要がある。
MELCODEは、適応ランレングス・コードとして最も容易に理解される。したがって、説明の便宜上、AZCシンボル・ストリームσAZC[i]がランレングスRAZC[j]のシーケンスに最初にコンバートされると考え、ここで、各ランは、次の1に先行する0の数を表す。4つのコード・ブロック・サンプルのあらゆるグループについて多くとも1つのAZCシンボルがあり、コード・ブロックは4096個よりも多いサンプルを有し得ないので、コーディングされる必要がある最大ランレングスは1024であり、これは、完全に非有意なコード・ブロックに対応し、したがって、通常発生するはずはないが、とはいえ、その可能性を考慮に入れる。これは、空でないコードワード・セグメントが完全に空のコード・ブロックを表すために使用されることを可能にし、これは、非効率的であるが、CBR適用例では、バッファ・アンダーフローの回避のために有用であり得る。
とに関連する。表1は、主要な量の値をリストする。
R≧Tである間、1(「ヒット」)を放出し、RからTを減算する
0(「ミス」)を放出し、RのE個のLSBが続く
k=0を初期化する
各j=0,1,...について
R←RAZC[j]を設定する
R≧TMEL[k]である間
「1」(「ヒット」)を放出する
R←R-TMEL[k]を更新する
k←min{k+1,12}を更新する
「0」(「ミス」)を放出する
RのEMEL[k]LSBを放出する
k←max{k-1,0}を更新する
FASTブロック・コーディング・アルゴリズムの重要な特性は、Cleanupパスについての有意性情報がグループにおいて収集され、他の情報より先にコーディングされることである。有意性の効率的なコーディングは、特により低いビットレートにおいて極めて重要であり、ここで、コード・ブロックにおけるどのサンプルが有意(すなわち、非0)であるかを識別して、コーディングされたビットの半分以上が消耗され得る。FASTブロック・コーダは、グループ中のすべてのサンプルの有意性(又はそれ以外)を一度に識別するためにVLCコードワードの固定セットを使用する。さらに、FASTブロック・コーダは、AZC(全0コンテキスト(All-Zero Context))グループとして知られている、サンプルのいくつかのグループを完全に非有意である可能性があるものとして識別し、適応(MQ又はMEL)コーディング・エンジンは、各AZCグループが実際に完全に非有意であるか否かを効率的に符号化するために使用される。
1.線形(又は1×4)グループは、単一の走査ライン内の4つの水平方向に隣接するサンプルからなる。コード・ブロック幅が4で割り切れない場合、各走査ライン内の最後のグループは、0値サンプルでパディングされる。
2.正方形(又は2×2)グループは、2つの連続するコード・ブロック行のストライプからの2つの連続する列からなる。幅又は高さが2で割り切れないコード・ブロックは、同じく、簡単のために、単に0でパディングされる。
上述のように、有意性は、グループごとにコーディングされる。各グループgは、グループ中の任意のサンプルが有意である場合1であり、他の場合0であるバイナリ有意性状態σgを有する。さらに、グループgは、範囲0~15において4ビット有意性パターンρgを有し、(走査順序においてLSBからMSBまでの)その各ビットは、グループ中の対応するサンプルが有意である場合、1である。明らかに、σg=0⇔ρg=0である。
ここで、線形1×4グループで作業するとき、現在の実装形態において使用されるグループ有意性コンテキストcgの特定のセットについて説明する。図11に示されているように、ρg-1を、左のグループの有意性パターンを示すものとし(ない場合0)、
を、左のサンプルの有意性を示すものとし、
を、2つ左のサンプルの有意性を示すものとし、
~
を、前の走査ライン上のグループgの上を中心とした6つのサンプルの有意性を示すものとする(それが存在しない場合、各々は0である)。
であるが、すべての他の走査ラインについて、
である。
2×2正方形グループ構造の場合、現在の実装形態において使用される有意性コーディング・コンテキストが図12に示されている。この場合、ラインの第1のペアについて完全に別個のVLCコードブックを使用することを選好し、ここで、前の走査ラインの有意性は利用可能でなく、この場合、8つの固有のコンテキストがあり、走査ラインの非初期ペア内で見つけられるグループについて別の8つのコンテキストがある。
~
として識別された、走査順序において先行する4つのサンプルの有意性を使用して形成され、
それらのすべては、gがコード・ブロックにおいて第1のグループである場合0になるようにとられる。この場合のグループ・コンテキストは、
によって与えられる。
及び
の有意性を、
~
として図12において識別される前の走査ライン上の4つの近接サンプルの有意性とともに使用して形成される。以下の簡単な公式化のうちの1つが、次いで、グループ・コンテキストのために採用され得る。
、又は
ここで、適応的にコーディングされたビットストリーム内で有意として識別された、非AZCグループとAZCグループとについての有意性パターンを符号化するために使用されるVLC符号に関する特定の情報を提供する。
として上記で識別された「不平衡(unbalanced)」ラベルに対応する。最適化されたVLCコードワードの使用は、2×2グループの場合における圧縮性能に、それらが1×4線形グループのための場合よりも、さらに重要である。それぞれの最適化されたVLCコードワードを使用するときに、2×2グループの場合の全体的コーディング効率が、1×4グループの場合よりもわずかに高く、表2の単純なコードワードが使用された場合は、その逆が当てはまることがわかる。
上述のように、ビットプレーンpでは、サンプルX[n]のマグニチュードは、
になるようにとられ、サンプルは、Mp[n]≠0である場合、有意であると見なされる。ビットプレーンpにおけるサンプルについての「マグニチュード指数」Ep[n]は、以下のように定義される。
ここで、
は自然数(非負整数)のセットである。以下の表は、この定義について説明するのに役立つはずである。
Mp:0 1 2 3 4 5 ... 8 9 ... 16 17 ... 32 ... 230+1 ... 231
Ep:0 1 2 3 3 4 ... 4 5 ... 5 6 ... 6 ... 32 ... 32
次に、有意であることが知られているサンプルについてのマグニチュード及び符号情報のコーディングに注目する。重要なことには、サンプルが有意であると知られているので、Mp-1≧0の値をコーディングすることで十分である。また、この場合、マグニチュード指数Ep-1≧0を有し、
を有する。すなわち、Ep-1は、Mp-1の値を表すために必要とされるビットの最小数である。これがそうなるために、マグニチュード指数定義を精密に考案した。マグニチュード指数は単純でないやり方でビットプレーンpに依存し、これは、有意サンプルのマグニチュードの効率的なコーディングにとって重要である。
までの範囲にわたって一様に分散されるようにMpをとり、したがって、Ep自体の値が確立されると、Mp-1のEp-1最下位ビットを関係するビットストリームに放出することで十分である。また、一様に分散されるように各有意サンプルの符号をとり、したがって、また、符号ビットを未加工2進数字として放出することで十分である。
ロケーションnにおける有意サンプルについてのマグニチュード情報のコーディングは、それの因果的近傍のマグニチュード指数を累積することによって形成されるコンテキストに基づく。以下では、すべてのマグニチュード及びマグニチュード指数から下付き文字pを削除するが、ビットプレーン・インデックスが暗示されるものとする。
Esum[n]=EW[n]+ENW[n]+EN[n]+ENE[n]
から形成され、ここで、EW[n]は、左の近傍のマグニチュード指数(左の近傍がない場合0)であり、EN[n]は、上の近傍のマグニチュード指数(前の走査ラインがない場合0)であり、ENW[n]及びENE[n]は、前の走査ライン上のロケーションnの左上又は右上の近傍(そのような近傍がない場合0)に対応する。上付き文字W、NW、N及びNEは、コンパス方向を示すことを意図される。
コード・ブロック中の第1のラインの場合、
Esum[n]=(2EW[n]+EWW[n])
を使用し、ここで、EWW[n]は、左の2番目のサンプルのマグニチュード指数(ない場合0)である。これらの近傍設定は、図13に示されている。
から生じることを見つけ、ここで、定数κoffは4に設定される。値3及び5は、ほぼ有効であることが判明したが、計算するにはわずかに効率が劣る。
ここで、符号なし(したがって、「U」)予測残差
u[n]=max{0,E[n]-1-κ[n]}
を表すコンマ・コードを放出する。
ここで、
m[n]=κ[n]+u[n]-i[n]
として放出されなければならないマグニチュード・ビットの数を決定し、ここで、
である。
0≦M-1<2E-1
を満たすことに留意し、ここで、E-1≧0である。符号なし予測残差u>0である場合、デコーダは、E-1=κ+uであること、及び2E-2≦M-1<2E-1であることを確実にすることができ、したがって、M-1の最下位E-2=κ+u-1ビットは、その値を識別するのに十分であり、デコーダは、暗黙的最上位1を再加算して、これらのmビットからM-1を復元する。u=0である場合、デコーダは、E-1≦κ+uであることのみを知っており、したがって、0≦M-1<2κ+uであり、これが、m=κ+uビットが放出される理由である。
マグニチュード・コーディングのための上記の方法は、事実上、パラメータκ[n]をもつ、M[n]-1についての指数ゴロム・コードであり、実際には、符号ビットがコンマ(コードの単項部分)とマグニチュード・ビットとの間でインターリーブされることに留意し、なぜなら、これは、効率的なソフトウェア・ベースのデコーダ実装形態を容易にするようになるからである。
代替ストラテジーは、符号付き予測残差
s[n]=E[n]-1-κ[n]
のκ[n]依存ライス・マッピングを利用することである。
このセクションは、上記で説明された構成に対する、UステップとRステップとによって放出されたビットについての代替構成を提示する。この代替構成は、上記の構成のものと同じコーディング効率を有し、これは、それが、放出されたビットの並べ替えにすぎないからであり、言い換えれば、この代替表現のためにまったく同じビット数を必要とする。
・ ケース1:u[n]>κ[n]。表6において要約されるこのケースにおいて、エンコーダは、u[n]個の0を放出し、1(コンマ)が続き、M[n]の符号X[n]が続き、次いで、M[n]-1のκ[n]+u[n]-1=E[n]-2最下位ビットが続く。これは、2E-2≦M-1<2E-1であることを知っているので可能である。これは、u[n]>0であるときにセクション0によって放出されたのとまったく同じコードである。
・ ケース2:κ[n]≧u[n]>0。このケースにおいて、エンコーダは、u[n]-1個の0を放出し、1(コンマ)が続き、次いで、(d[n]=0によって示される)単一の0が続き、M[n]の符号X[n]が続き、次いで、M[n]-1のκ[n]+u[n]-1=E[n]-2最下位ビットが続く。表6を参照されたい。
・ ケース3:u[n]=0、及びp[n]<κ[n]、ここで、p[n]=κ[n]-(E[n]-1)である。このケースにおいて、2κ-p-1≦M-1<2κ-pを有する。エンコーダは、p[n]個の0を放出し、1(コンマ)が続き、次いで、(d[n]=1によって示される)単一の1が続き、M[n]の符号X[n]と、M[n]-1のκ[n]-p[n]-1=E[n]-2最下位ビットとが続く。表6を参照されたい。
・ ケース4:u[n]=0、及びp[n]=κ[n]。このケースにおいて、E[n]-1=M[n]-1=0である。エンコーダは、κ[n]個の0を放出し、1(コンマ)が続き、次いで、M[n]の符号X[n]が続く。表6を参照されたい。
・ l[n]=κ[n]である場合:これはケース4であり、復号は、M[n]の符号ビットX[n]を読み取ることによって進行することができ、M[n]-1=0を有する。
・ l[n]>κ[n]である場合:これはケース1であり、ここで、l[n]=u[n]であり、復号は、ビットストリームから、M[n]の符号ビットX[n]と、M[n]-1のκ[n]+l[n]-1=E[n]-2 LSBとを読み取ることによって進行することができる。デコーダは、次いで、M[n]-1の暗黙的MSBを加算する必要があり、暗黙的MSBは、2E-2であることが知られているので、送信されなかった。
・ l[n]<κ[n]である場合:これは、ケース2又はケース3のいずれかであり得る。デコーダは、コンマの後のビット、d[n]を検査することによってケースを識別することができる。ケース2の場合、d[n]=0を有し、ケース3の場合、d[n]=1を有する。ケースに応じて、デコーダは、以下のように進行することになる。
〇 ケース2(d[n]=0)の場合、ここで、l[n]=u[n]-1であり、デコーダは、次いで、ビットストリームから、M[n]の符号ビットX[n]と、M[n]-1のκ[n]+l[n]=E[n]-2 LSBとを読み取ることになる。デコーダは、次いで、M[n]-1の暗黙的MSBを加算する必要があり、暗黙的MSBは、2E-2であることが知られているので、送信されなかった。
〇 ケース3(d[n]=1)の場合、ここで、l[n]=p[n]であり、デコーダは、次いで、ビットストリームから、M[n]の符号ビットX[n]と、M[n]-1のκ[n]-l[n]-1=E[n]-2 LSBとを読み取ることになる。デコーダは、次いで、M[n]-1の暗黙的MSBを加算する必要があり、暗黙的MSBは、2E-2であることが知られているので、送信されなかった。
上記の代替形態の各々によって対処される問題は、有意サンプルのマグニチュードを符号化/復号するために使用されるコンテキスト(又は予測子)が、走査順序において先行するサンプルのマグニチュード指数に依存することから生じる。
Esum[n]=ENW[n]+2EN[n]+ENE[n]
しかしながら、この手法は、まったく予測子がなければ、最初の走査ライン上のマグニチュードを残すことに留意されたい。
FASTブロック・コーディング・アルゴリズムの分散マグニチュード・コーディング変形態では、有意サンプルのマグニチュード指数を発見するために必要とされる情報の一部は、VLCビットストリームに移動される。一実例として、上記で説明された単項コーディングされた符号なし予測残差u[n]は、MagSgnビットストリームを参照せずにVLCビットストリームが復号され得るという重要な特性を損なうことなしに、VLCビットストリームに容易に移動され得る。復号されたu[n]値は、有意サンプルのマグニチュード指数E[n]を復元するために直ちに使用され得ず、なぜなら、これは、MagSgnビットストリームにおいて見つけられるマグニチュード・ビットに依存し得る以前のマグニチュード指数の知識を必要とするからである。しかしながら、u[n]値を前もって復号する能力は、クリティカル・パス・レイテンシを低減し、復号スループットを増加させることができる。
コード・ブロック内の非初期グループ行、すなわち、1×4グループをもつ非初期走査ライン、又は2×2グループをもつ非初期ライン・ペアについてのugのコーディング及び解釈を説明することから始める。予測子κg[n]が、前の走査ラインからのマグニチュード指数に基づいて、グループg中の各有意サンプルについて形成される。ここで、nは、走査順序において、グループg内のサンプルをインデックス付けする。図14は、ライン因果指数
、
、
及び
を識別し、それらは、1×4グループ構造と2×2グループ構造の両方について、好ましい方法で予測子κg[n]を形成するために使用される。
Ug[n]=ug+κg[n]
を形成する。すなわち、
Eg[n]-1≦Ug[n]
である。
として定義し、グループg中の各有意サンプルについての放出されたマグニチュード・ビットの数が、
mg[n]=Ug[n]-ig
になるように定義する。
、
、
及び
から導出され得る。
特に、ソフトウェア実装形態の場合、グループのペアにわたってuコードのプレフィックス成分とサフィックス成分とをインターリーブすることは、有益であることがわかる。詳細には、VLCビットストリームは、最初に、グループのペアに関連する(場合によっては空の)有意性VLCコードワードを放出し、次いで、ペア中の各有意なグループについてのuコード・プレフィックスを放出し、最後に、ペア中の各有意なグループについてのuコード・サフィックスを放出することによって形成される。ソフトウェア・エンコーダの場合、これは、適度のルックアップ・テーブルがグループのペアについての完全なuコードを一度に生成するために使用されることを可能にする。ソフトウェア・デコーダの場合、小さいルックアップ・テーブルが、クワッドのペアについてのuコード・プレフィックスを一度に復号するのに十分であり、組み合わせられたコードワード長とサフィックス・ロケーションとが極めて効率的に決定されることを可能にする。グループの各行は、必要な場合、有意性VLCコードワード又はAZCシンボルを有せず、常に非有意である余分のグループを追加することによって、整数個のグループ・ペアに拡張され、したがって、それはまた、uコード成分を有しない。
コード・ブロック内のグループの初期行の場合、マグニチュード指数は、前の走査ラインから入手可能でない。このケースは、常に、上記で展開された方法を使用してハンドリングされ得るが、
、
、
及び
がすべて0になるようにとられる。
Eg[n]-1≦Ug
を満たすような制限である。
であり、ここで、
である。
である。
mg[n]=Ug[n]-ig
によって与えられ、MagSgnビットストリームは、走査順序において各有意サンプルにアクセスすることによって形成され、最初に符号ビットを放出し、次いで、Mg[n]-1のmg[n]最下位ビットを放出する。
圧縮後レートひずみ最適化(PCRD-opt:Post-Compression Rate-Distortion Optimization)は、JPEG2000アルゴリズムの有益な特徴であり、これは、1つ又は複数のターゲットの圧縮されたビットレートが、単に、すでに生成されたコード・ブロック・ビットストリームを切断することによって達成されることを可能にする。最適切断ポイントを見つけることは、各切断ポイントについてのひずみ推定値(又は測定値)のセットが与えられれば、比較的簡単である。
上記で説明されたFASTブロック・コーディング・アルゴリズムは、厳密には組み込まれないが、それは、PCRD-optベースのレート制御方法の展開を可能にするのに十分なレベルの組込みを提供する。依然として、ビットプレーンごとの3つのコーディング・パスがあり、それらのレートひずみプロパティは、標準JPEG2000ブロック・コーダのレートひずみプロパティと極めて同様であることがわかる。典型的な写真像(photographic imagery)を用いた実験において、図1に示されているFASTブロック・コーディング・パスのセットに最適切断アルゴリズムを適用することが、標準JPEG2000ブロック・コーダを用いて達成される圧縮効率と同様の圧縮効率を生じることがわかる(脚注3)。
JPEG2000のためのPCRD-opt方法の高度実装形態は、すでに、PCRD-optレート制御段階によって後で見つけられることになる最適切断ポイント以外に存在する可能性がある多くのコーディング・パスを生成することを回避するために予測ストラテジーを利用している。FASTブロック・コーダの場合、PCRD-opt切断ポイントによって保持される後のCleanupパスによって包含される可能性があるコーディング・パスを生成することを回避するために、追加のストラテジーが使用され得る。すなわち、予測ストラテジーは、図1によって示唆されるように、生成するに値する最後のコーディング・パスと、コーディング・パスを生成し始める最初の(最も粗い)ビットプレーンの両方を決定するために使用され得る。
1.符号化プロセス中に粗いビットプレーンを廃棄することは、PCRD-opt段階を切り抜けることを予想しない細かいコーディング・パスを廃棄することよりも「危険」である。コード・ブロックについての最初の生成されたビットプレーンが、あまりに多くのビットの生成を生じた場合、PCRD-opt段階は、コード・ブロックについてのコンテンツをまったく含むことが可能でないことがある。したがって、より粗いビットプレーンを廃棄するという決定に関連するワースト・ケースひずみ影響は、より細かいビットプレーンを廃棄することに関連するひずみ影響よりもはるかに大きい。
2.より粗いビットプレーンは、概して、少なくとも、ソフトウェア実装形態内では、より細かいビットプレーンよりも少ない計算リソースを消費し、したがって、実装形態にとって、それが必要とするよりも細かいビットプレーンではなく、それが必要とするよりも粗いビットプレーンを生成し過ぎることが望ましい。実際、粗いビットプレーンがまったくスキップされないときでも、FASTブロック・エンコーダは、依然としてJPEG2000よりもはるかに高速になり得る。
3.高スループット・ハードウェア実装形態は、決定的なやり方で、所与のコード・ブロックについて生成されることになるコーディング・パスの総数を固定する必要があり得る。これは、適応アルゴリズムがより容易に実装されるソフトウェア環境よりも大きい課題を提供する。
4.低いエンドツーエンド・レイテンシをもつ一定ビットレート圧縮データ・ストリームを必要とする適用例は、コーディング・パス又はビットプレーンを選択的に生成するアルゴリズムにとって最も困難である。不十分な決定が大きいひずみを生じる可能性は、PCRD-optアルゴリズムが厳しいビット・バジェットに準拠することを強制される場合、特に、これがコード・ブロックの小さいセットに対して定期的に行われる場合、大幅に増加される。
このセクションでは、ブロック符号化プロセス中に粗いビットプレーンの生成をスキップするために使用され得る第1のアルゴリズムについて説明する。このアルゴリズムは、コーディングされた長さ推定値及び測定値に依拠して、コード・ブロック全体がPCRD-optアルゴリズムによって廃棄されなければならないという危険を緩和する。本方法は、少なくとも2つのビットプレーンが符号化され、ただし好ましくは3つ又はそれ以上のビットプレーンが符号化され、それらが、同時にではなく連続的に符号化される状況に好適である。これは、各符号化されたビットプレーンの符号化された長さが、符号化すべき後続のビットプレーンの選択を案内することを可能にする。これらの属性は、アルゴリズムを、ハードウェアよりもソフトウェア実装形態に好適にし得る。
を記録する。これらは、
バイト/サンプルに従って、「示唆された」サブバンド・データ・レートのセット
にコンバートされ得、ここで、Nbは、コード・ブロックb中のサンプルの数であり、したがって、
は、サブバンドβ中のサンプルの総数にすぎない。
を、フレームkのコード・ブロックb内のビットプレーンpに属するCleanupパスに関連する(バイト単位の)長さであるとし、後続の(生成されている)フレームkgenを考慮する。サブバンドβ中の各コード・ブロックbが、
である、少なくとも1つの生成されたCleanupパスを有する限り、PCRD-optアルゴリズムは、全長がLmaxよりも大きくない、フレームkgenについてのコードストリームを生成することが可能になることを確実にすることができる。実際に、この制約がなくても、PCRD-optアルゴリズムは、長さ制約Lmaxを満たすために1つ又は複数のコード・ブロックを完全に廃棄することが、常に可能である。しかしながら、これは、コード・ブロックが廃棄されている場合、品質の大きい劣化を招き得、これは、単に、十分に粗いビットプレーンに関連するコーディング・パスがブロック・エンコーダによって生成されなかったからである。
である。1つのグループ化手法は、別個のJPEG2000プレシンクトを用いて各コード・ブロック・グループγを識別することであるが、(別個のグループを介して)プレシンクト内のコード・ブロックの別個のサブバンド配向(たとえば、HH、LH、HL)をさらに区別することは好ましいことがある。また、コード・ブロックの重複するグループを使用することが望ましいことがある。一方の極端な例では、グループは、単一のコード・ブロックからなるが、他方の極端な例では、画像成分のウェーブレット分解における所与の解像度レベルからのすべてのサブバンドは、単一のグループをなすと見なされ得る。いずれの場合も
は、PCRD-optアルゴリズムがフレームkについてのコードストリーム中に組み込むことを選定するグループγ中のコード・ブロックからのCleanupパスに関連する最も粗いビットプレーンである。さらに、γbを、コード・ブロックbについての「自然」グループであるとし、「自然」グループは、複数のそのようなグループ(重複するグループ)がない限り、単にコード・ブロックbが属するグループであり、その場合、γbは、幾何学的中心がコード・ブロックbの幾何学的中心と最も密接に一致するグループである。
コーディングされた長さ
を生じる。ここで、
は、コード・ブロックb中のサンプルがフレームkgenにおいて有意である、最も粗い(最上位)ビットプレーンである。本質的に、ブロック・エンコーダは、コード・ブロックbの近隣(グループγb)内で、コーディング・パスが以前のフレームk中で放出された最も粗いビットプレーンを、それがフレームkgenにおいて考慮する必要がある最も粗いビットプレーンについての初期推定値として解釈する。オフセットΔadj≧0は、アルゴリズムが(時間とともに)準最適な状態に置かれることがないことを確実にするように、少なくとも時々非0でなければならない。
を、上記の式(RB)によって与えられる、示唆されたサブバンド・データ・レートと比較する。
が、制限
を超え、
である場合、ビットプレーン・インデックスpは1だけ増加され、新しいCleanupパスが符号化され、(概してより小さい)長さ
を有する。このプロセスは、最も粗い生成されたCleanupパスが、示唆されたレート制限を満たすか、又はより粗い有意ビットプレーンが存在しなくなるまで、繰り返される。この条件が達せられると、エンコーダは、さらにより粗いビットプレーンについてのコンテンツを生成して、利用可能な計算リソースを条件としてコンテンツのより大きいダイバーシティをPCRD-optアルゴリズムに提供し得る。
このセクションでは、所与のコード・ブロック中の規定された最大数のコーディング・パスを生成するためのアルゴリズムについて説明する。アルゴリズムは、処理されるべきビットプレーンが、連続的符号化プロセスに依拠することなしに、前もって決定されるので、高性能ハードウェア実装形態、並びにソフトウェアに好適である。処理すべき最も粗いビットプレーンの決定のみを考慮した先行するセクションとは異なり、ここでは、所与のコード・ブロックについて処理されるべきコーディング・パスのフル・セットの決定を検討する。
を、生成されている現在フレームにおける単一のフラッシュ・セット(コード・ブロックのグループ)γに適用される長さ制約を表すものとする。
を、フラッシュ・セットγについてのひずみ長さ勾配しきい値を表すものとする。勾配しきい値
は、ひずみ長さ性能に従って各コード・ブロックから適切なコーディング・パスを選択するために使用される。コード・ブロックbについてのコーディング・パスcpを選定することから生じるひずみ長さ勾配を指すために、記法
を使用する。これは、ひずみの低減とコーディングされた長さの増加との間の比であり、コード・ブロックの動作ひずみ長さ特性の凸閉包上にあるコーディング・パス間で測定され、これらの勾配値は、コーディング・パスが粗いビットプレーンから最も細かいビットプレーンに進むにつれて、必然的に単調に減少する。PCRD-optアルゴリズムは、もしあれば、生成されたフラッシュ・セット中にコード・ブロックbから含まれるべき最後のコーディング・パスcpを識別する。詳細には、cpは、もしあれば、
である、最後の(最も細かい)コーディング・パスである。
を、ひずみ長さ勾配目標に従う選択されたコーディング・パスcpについてのコード・ブロックbの長さを表すものとする。フラッシュ・セット中の各コード・ブロックからのすべての長さ寄与の合計
は、初期長さ値を提供し、初期長さ値は、次いで、フラッシュ・セット・ターゲット長さ
と比較され得る。初期長さ
がターゲット長さ
を超えた場合、
は適宜に増加され得、コーディング・パス選択プロセスは、フラッシュ・セットについて繰り返され得る。
についてのより大きい値は、各コード・ブロックからより粗いビットプレーンが潜在的に選択されることになり、それにより全長への寄与を低減することを意味する。勾配しきい値
は、総フラッシュ・セット長さ
が、もはやターゲット
を超えなくなるまで、繰り返し増加され得る。同様にして、初期に
がターゲット長さ
よりも低い場合、勾配しきい値
は減少され得、コーディング・パス選択プロセスは繰り返され得る。
についてのより低い値は、各コード・ブロックからより細かいビットプレーンが潜在的に選択されることになり、全長への寄与を増加させることを暗示する。
の属性によって誘導され得る。好ましい実施例は、
のいくつかの記憶された属性を利用し、これらは、ビットプレーン
と、ビットストリーム中に最後に含まれていた、関連するコーディング・パス
(すなわち、Cleanup、SigProp又はMagRef)とを含む。多くの事例において、
は、コーディングが実施されるべきである現在のコード・ブロックのビットプレーンについての良好な推定値であることがわかる。したがって、ビットプレーン
におけるCleanupパスと、関連するSigPropパス及びMagRefパスとは、常に、現在のコード・ブロックについて生成される。レート制御アルゴリズムがフレームごとにコンテンツの変化に適応することを可能にするために、予測されたアンカー
に関してより粗いビットプレーン及びより細かいビットプレーンについてのコーディング・パスを生成することを考慮することも重要である。好ましい実施例では、ビットプレーン
及び
についてのコーディング・パスが、前のフレームにおける対応するコード・ブロック
のステータスに応じて考慮される
が、前のコード・ブロック
について生成された最も粗いビットプレーンに等しく、含まれた対応する最後のコーディング・パス
がCleanupパスである場合、「初期コーディング・パス」フラグは、1に設定される(INITIAL_CP=1)。これは、より粗いビットプレーンが有用であった可能性があるが、前のコード・ブロック
にとって利用可能でなかったことを示す。したがって、現在のコード・ブロックは、より粗いビットプレーン
を考慮し、Cleanupパスと、随意に関連するSigPropパス及びMagRefパスとを生成する。SigPropとMagRefとを含むことは、生成されるべきであるコーディング・パスの総数に対するユーザ定義上限に依存して行われ得る。
が、前のコード・ブロック
について生成された最も細かいビットプレーンに等しく、含まれた対応する最後のコーディング・パス
がMagRefパスである場合、「最終コーディング・パス」フラグは、1に設定される(FINAL_CP=1)。これは、より細かいビットプレーンが有益であった可能性があるが、前のコード・ブロック
について生成されなかったことを示す。
より細かいビットプレーンを考慮することの利益をさらに検証するために、コーディング・パス
に対応するひずみ長さ勾配
は、フラッシュ・セットしきい値
と比較され、ここで、
は、前のコード・ブロック
を含むフラッシュ・セットを示す。
と
との間に小さい差のみがある場合、これは、生成されたコーディング・パス
が適切であり、現在のコード・ブロックについてのより細かいビットプレーンを考慮することにおいて利得がほとんどないことがあることを暗示する。しかしながら、「最終コーディング・パス」フラグが1に設定され(すなわち、FINAL_CP=1)、勾配値
がフラッシュ・セットしきい値
よりも実質的に大きい場合、より細かいビット・プレーン
は、現在のコード・ブロックについて考慮される。Cleanupパスと、随意に関連するSigPropパス及びMagRefパスとは、次いで、ビット・プレーン
について生成される。再び、SigPropパス及びMagRefパスの生成は、生成されるべきであるコーディング・パスの総数に対するユーザ定義上限に依存して行われ得る。
と現在ブロックbとの間の欠落したMSBの大きい差が、コード・ブロックの複雑さの急速な変化のおおまかな測度として使用され得る。好ましい実施例では、現在ブロックbについての欠落したMSBの数が、前のブロック
の欠落したMSBの数よりも大きい場合、より細かいビット・プレーン
についてのコーディング・パスは、FINAL_CPフラグ、又は
と
とについての値にかかわらず生成され、これは、これらの測度が、コード・ブロック複雑さの急速な変化により、有効であると見なされないからである。欠落したMSBの数がコーディング・パス生成に対して有することがある影響は、サブバンドに応じて選択的にされ得、たとえば、LLサブバンドについての好ましい実施例では、欠落したMSBの数は、コード・ブロック複雑さの変化の信頼できる測度と見なされない。
と
との間の差が小さいかどうかのみに依拠するので、前のフレームからのひずみ長さ勾配としきい値とを記憶することは、実際には必要でない。
上記で説明された方法は、ビデオ・シーケンス中の連続フレーム間で複雑さの大きい変化が経験される場合を除いて、あらゆるコード・ブロックが2つ以下の連続するビットプレーンを処理するように制約されるときでも、実際にはうまく機能する。特に、フレーム(又はフレームの領域)が極めて低い複雑さ(たとえば、小さいテクスチャ、少ないエッジなど)を呈する場合、PCRD-optアルゴリズムは、各関係するコード・ブロックについて利用可能な最も細かいビットプレーンを選択する傾向がある。フレームのシーケンスにわたって、これは、動作点を、コンテンツの極めて細かい量子化を表す動作点に急速に移動させる。次いで、複雑さが突然増加した場合、この細かい動作点は、あまりに多くのビットを作り出し、PCRD-optアルゴリズムは、全コード・ブロックを廃棄することを強制され、大きいひずみという不利益を生じる。その条件は、典型的には、大きい複雑さの過渡から2つ又は3つのフレーム内で復元される高性能により急速に消滅し、これは、知覚可能なひずみを回避するのに十分であろうが、そのような過渡を低減又は除去するためのステップをとることが望ましい。このセクションでは、上記で説明されたコーディング・パス選択アルゴリズムを向上させるために使用され得る、全体的複雑さと局所的複雑さの両方を測定するやり方について説明する。
として表され得る。
ここで、Vvは、同じ垂直解像度を有する各サブバンドからのコード・ブロックの1つの行からなる、サブバンド・サンプルの単一の「vセット」(垂直セット(vertical set))を識別する。所与のvセットに寄与するサブバンドは、異なる画像成分に属し得るが、関係するJPEG2000プレシンクト区画の効果を考慮に入れると、同じ垂直サンプリング・レート(脚注4)及び同じ垂直コード・ブロック・サイズを有するべきである。したがって、Gvは、vによってインデックス付けされたvセット内に見つけられるコード・ブロックの面積加重平均複雑さとして理解され得る。
最も簡単なケースでは、U(Vv)は単にVv自体であり、したがって、
である。
からなる。
及び
を、ビデオ・シーケンスの前のフレームにおいて計算されたような、対応する量を示すものとし、ここで、
及び
は、現在フレームにおけるb及びβに対応する、前のフレームからのコード・ブロック及びサブバンドである。これらがすべての対数量であるので、2つ又は3つの少数ビットをもつ8ビット固定小数点表現は、たいていの実際的適用例の場合、それらをフレーム間に記憶するために十分であるはずである。セクション0のコーディング・パス選択方法は、オフセットδbを、そこで説明される、予測されたアンカー・ビットプレーン
に加算することによって修正される。詳細には、
であり、ここで、αは小さい正の定数(たとえば、0.5又は0.25)である。
を設定することは、全体的シーンの複雑さの変化を近似的に補償することが予想され得る。上記の式中の第2の項は、相対的複雑さ(全体的に対する局所的)が増加したコード・ブロックについてのさらにより粗いビットプレーンの生成を助長する。これは、コード・ブロック内であまりに多くのデータを生成し、それにより、それらのコード・ブロックが複雑さの大きい増加をこうむり、それが、他の場所で複雑さの減少があるとしても、完全には補償されないことがあるという危険を低減する。基本的に、パラメータαは、複雑さの突然の変化が、フラッシュ・セット中に含まれるべきコード・ブロックに関連する情報にとって大きすぎる生成されたコーディング・パスを生じ、大きい局所的ひずみを生じ得るという、前に述べられた危険を管理するために使用される。
は、必然的に整数である。もちろん、δbは、整数値に丸められるべきであるが、δbの残りの小数部分はまた、生成すべきコーディング・パスの選択において考慮に入れられ得る。セクション0において述べられたように、実際に生成される最も粗いビットプレーンは、前のフレームにおいて選択された実際のコーディング・パス、INITIAL_CPフラグ、FINAL_CPフラグ、及び関係するひずみ長さ勾配に応じて、アンカー・ビットプレーンの上又は下にあり得る。その上、一般的な適用例では、少なくとも2つのビットプレーンが生成され、通常、各々、3つのコーディング・パス(Cleanup、プラスSigProp及びMagRefリファインメント)を伴う。δbの小数部分は、明らかに、これらの決定をバイアスするために使用され得る。
上記で説明されたアルゴリズムは、コード・ブロックbをビットプレーンpにコーディングするときに経験されるビットレートが、形式R0+Cβ[b]-pのものであるべきであるという仮定に関して理解され得、ここで、R0は、フレームごとに変動しない定数である。これは、多くのサンプルが非有意であるより低いビットレート(より粗いビットプレーン)において正確であることを予想しない極めておおまかなモデルである。
を準備するが、これは、各フレームのコーディングされたサイズが変動することを意味し得る。ターゲット平均ビットレートを維持するように、外部ループが、
を時間とともに緩やかに調整し、これは、通常、古典的な「リーキー・バケット」モデルを介して行われる。そのような適用例では、PCRD-optアルゴリズムは、コード・ブロックが実際に符号化される時点より前に知られているしきい値
によって直接駆動され、したがって、各ビットプレーンpについてのひずみ長さ勾配推定値は、コード・ブロックについて生成されるべきであるコーディング・パスを決定するために使用され得る。
よりも大きくなるように、最も小さい(すなわち、最高品質の)pを見つけ、このpについてのCleanupパス、及び後続の1つ又は場合によっては2つのより高品質の(より小さいp)Cleanupパスを、それらのそれぞれのSigProp及びMagRefコーディング・パスとともに生成することで十分である。次いで、実際のPCRD-optアルゴリズムは、生成されたコーディング・パスのこの限られたセットとともに動作する。
B. 有意性のコーディングは、いくつかのやり方で他のコーディング・ステップに先行する。
a. 最初に、好ましい実施例では、(AZCグループとして知られている)グループの特定のサブセットの有意性は、それ自体のビットストリームを生成する適応コーディング・エンジンを使用してコーディングされる。
b. 他の有意性情報は、有意サンプルについてのマグニチュード及び符号情報がコーディングされる前に、グループごとにコーディングされる。
c. デュアル・ビットストリーム実施例では、有意性情報は、コード・ブロック・サンプルの1つのライン全体についてコーディングされ、それから、それらのサンプルについてのマグニチュード及び符号情報がコーディングされ、その後に次のラインが処理され、以下同様である。
d. トリプル・ビットストリーム実施例では、有意性符号化及び復号は、マグニチュード及び符号コーディング・プロセスから完全に切り離され、したがって、有意性が任意の順序において符号化され得るが、デコーダは、同時に、又は最終のマグニチュード及び符号情報より先にのいずれかで、所望のマージンによって、有意性情報を復元することができる。
C. 有意性コーディングがグループ・コンテキストに基づき、ここで、グループのコンテキストは、コード・ブロック内ですでにコーディングされた有意性情報のみに依存する。
D. 有意性のコーディングは、可変長コーディングを、さもなければ完全に非有意であることが知られていない各グループについて放出される単一のコードワードとともに利用し、ここで、コードワードは、グループ・コンテキストに依存する。
E. 有意サンプルについてのマグニチュード情報のコーディングは、すでにコーディングされたマグニチュードに関連するマグニチュード指数を利用する。これらは、コンテキスト又は予測子を形成するために使用され、コンテキスト又は予測子に関して、有意サンプルのマグニチュード指数に対する上限がコーディングされる。この制限は、符号ビットとともに、有意サンプルについての未加工ビットストリームに放出されなければならない追加のマグニチュード・ビットの数を決定する。
実施例では、近接マグニチュード指数の和は、上述のコンテキストを形成するために使用され、2つの先行する近傍は、コード・ブロックの第1のライン中で使用され、4つの近傍(左、左上、上及び右上)は、コード・ブロック中のすべての他のラインについて使用される。
F. マグニチュード・コーディング・コンテキストは予測子Gにコンバートされ、次いで、コンマ・コードが、R=max{0,E-1-G}を符号化するために使用され、ここで、Eは有意サンプルのマグニチュード指数(必然的に非0)であり、その後に、R>0である場合、符号及びR+G最下位マグニチュード・ビットが放出され、他の場合、符号及びR+G+1マグニチュード・ビットが放出される。
G. 他の実施例では、マグニチュード指数制限は、有意性がコーディングされるのと同じグループであるグループ中でコーディングされる。そのような実施例では、これらの制限についての予測子は、前にコーディングされたマグニチュードに基づいて、好ましくはコード・ブロック内のグループの前の行から形成され、予測残差は、予測された制限と実際の制限との間の差を識別するためにコーディングされ、それは、厳しいものである必要はない。好ましい実施例では、予測残差は可変長コードを使用してコーディングされ、少なくとも1つの有意サンプルを含んでいる各グループについて1つのコードワードを生成する。好ましくは、これらの残差コードワードは、同じグループについての有意性をコーディングする可変長コードワードとインターリーブされ、指数制限残差コードワード及び有意性コードワードが、有意サンプルの実際のマグニチュード・ビット及び符号が同じ又は異なる未加工ビットストリームからアンパックされる必要がある時点より先に復号されることを可能にする。コーディングされたマグニチュード制限残差は、概して、予測子が、最初に復号されなければならないマグニチュードに基づくので、マグニチュード又はさらにマグニチュード指数の自己充足的な説明を提供しない。
H. 対応するビットプレーンについてのJPEG2000有意性伝搬コーディング・パスと同じ情報を符号化する、各コード・ブロックについての追加のSigPropコーディング・パスの使用。実施例では、このコーディング・パスは、有意性ビット及び符号ビットを未加工コードワード・セグメントに放出する。いくつかの実施例では、元のJPEG2000有意性伝搬パスはこの目的のために使用され、「適応コーダBYPASSモード」で動作し得る。実施例では、元のJPEG2000有意性伝搬パスは、サンプルのセットに関連する関係する有意性ビットが、有意性ビット及び符号ビットをサンプルごとにインターリーブするのではなく、サンプルのそのセットについて対応する符号ビットより先に未加工ビットストリームに放出されるように修正される。好ましい実施例は、4つのサンプルのセットに基づいてこのインターリービングを実施する。実施例は、ビットが、ビッグエンディアン・ビット順序ではなく、リトルエンディアンを用いて未加工ビットストリームのバイトにパックされるという追加の修正を含み得る。
I. 対応するビットプレーンについてのJPEG2000マグニチュード・リファインメント・コーディング・パスと同じ情報を符号化する、各コード・ブロックについての追加のMagRefコーディング・パスの使用。実施例では、このコーディング・パスは、リファインメント・ビットを未加工コードワード・セグメントに放出する。いくつかの実施例では、このコーディング・パスは、「適応コーダBYPASSモード」で動作する元のJPEG2000マグニチュード・リファインメント・コーディング・パスと同等であり得る。実施例では、JPEG2000マグニチュード・リファインメント・パスは、ビッグエンディアン・ビット順序ではなく、リトルエンディアンを用いて、ビットを未加工ビットストリームのバイトにパックすることによって修正される。
J. Cleanupパスが、各コード・ブロックの1つ又は複数のビットプレーンについて、前記ビットプレーンの一部又は全部についてのSigProp及びMagRefコーディング・パスとともに、様々なコーディング・パスについてのひずみ推定値とともに、生成される画像符号化方法であって、最終のコードストリームに放出される実際のコーディング・パスが、レートひずみ最適化ステップに基づいて生成されたものから選択される、画像符号化方法。
K. コーディング・パスがコード・ブロック内で生成される最も粗いビットプレーンが、コーディング・パスが、類似しているコード・ブロックからビデオ・シーケンス中の前のフレームのコードストリームに放出される最も粗いビットプレーンに基づいて決定される上記の方法であって、ここで、類似度が、コード・ブロックが属する空間ロケーション及びサブバンドに関して測定される、上記の方法。
L. コーディング・パスがコード・ブロック内で生成される最も粗いビットプレーンが、先行するフレームにおけるレート制御プロセスの挙動から推論されるサブバンド固有の最大データ・レート目標を条件として決定される、上記の方法。
M. コード・ブロック内に生成されるコーディング・パスの完全セットが、前のフレームにおけるコード・ブロックについてのレートひずみ最適化ステップによって選択された、コーディング・パスに関する情報とともに、前記前のフレームにおける同じコード・ブロックから収集された要約統計値の小さいセットに基づいて決定される、上記の方法。
N. 実施例では、上記の方法は、コーディング・パスが生成される最も粗いビットプレーンを、画像内の各コード・ブロック及びより大きい領域の圧縮率を示す複雑さ推定値に基づいて上又は下に調整することによって、修正される。実施例は、各コード・ブロック内のサブバンド・サンプルの絶対値を累積することと、結果の近似対数をとることとによって形成される、複雑さ推定値を利用する。この形式の複雑さ値は、局所的複雑さとより全体的な複雑さとの比較が、前に圧縮されたコンテンツに対して、各コード・ブロックの周りに形成され得るように生成及び記憶され、前に圧縮されたコンテンツのレートひずみ最適化結果は、コーディング・パスが生成されているビットプレーンを決定するために参照として使用される。
O. 実施例では、上記の方法は、各コード・ブロックについてのレート及びひずみ長さ勾配推定値の組込みによって修正され、それらのレート及びひずみ長さ勾配推定値は、各コード・ブロックについて累積される要約統計値への、サブバンド・サンプルについての統計モデルの適合から、又は複数のマグニチュード・ビットプレーンの各々においてコード・ブロック内の有意サンプルの計数から様々に形成される。
脚注
1 実際に、JPEG2000未加工コードワード・セグメントにおけるビット・スタッフィングは、ビッグエンディアン16進値が範囲FF80h~FFFFh内にあるバイト・ペアの出現を回避するが、ブロック・コーディング・アルゴリズムは、概して、範囲FF90h~FFFFhにおけるマーカー・コードを回避することを必要とされるにすぎない。
2 ソフトウェア実装形態の場合、すべてのビット・スタッフィング・プロシージャは効率的にベクトル化され得、したがって、個々のバイト指向テストは必要とされない。
3 この観測は、標準JPEG2000ブロック・コーディング・アルゴリズムが全BYPASSモードで動作する場合に当てはまり、ここで、すべてのSigPropコーディング・パス及びMagRefコーディング・パスは未加工ビットを放出し、適応コーディングはCleanupパスにおいてのみ使用される。
4 垂直解像度によって、(最高垂直解像度をもつ画像成分からの)画像ラインがウェーブレット変換にプッシュされるにつれてサブバンド・ラインが出現するレートを意味する。丸め効果は別として、サブバンドの垂直解像度は、画像の高さで除算された、サブバンド中のラインの数である。
Claims (18)
- 画像圧縮の方法であって、前記画像圧縮は画像のウェーブレット変換を伴い、サブバンド・画像サンプルが、ブロック・コーディング・プロセスを使用して、コード・ブロックに形成され、前記方法は、
前記ブロック・コーディング・プロセスの前に、
各コード・ブロックについて、サンプルを、走査順序において走査パターンに従ってn個の連続するサンプルのグループに収集するステップと、
各サンプルについて、前記サンプルが、サンプルが非ゼロの場合は有意であると決定され、そうでない場合は有意でないと決定するように、有意であるのか又は有意でないのかを決定するステップと
を実行し、
ビットストリームを生成するために、コーディング・パスを実行する前に、
複数のビットプレーンに対応する複数のコーディング・パスについて、ビットストリームのコーディングされた長さ及びひずみ長さ勾配を推定するステップであって、推定されたコーディングされた長さ及びひずみ長さ勾配が、複雑さの測度として使用される、ステップと、
コーディング・パスが前記コーディングされた長さ及びひずみ長さ勾配の推定に基づいて前記コード・ブロックについて生成されるべきビットプレーンのセットを、前記複数のビットプレーンから選択するステップと、
前記ブロック・コーディング・プロセスを使用して、前記選択されたビットプレーンをコーディングするステップであって、前記ブロック・コーディング・プロセスは、
走査順序において前記コード・ブロックの前のサンプルの有意性のみに依存するコードを使用して、前記コード・ブロックのサンプルのグループについての有意性情報をコーディングするステップと、
前記走査順序において前のマグニチュード及び有意性情報のみに依存するコードを使用して、前記コード・ブロックのサンプルのグループについてのマグニチュード及び符号情報をコーディングするステップと、
前記有意性及びマグニチュード・コード・ビットを、各グループに関連する有意性ビットが前記コード・ブロックのコーディングされた表現中で一緒に出現するように、グループごとに少なくも2つの別個のビットストリームに構成するステップと、
前記コード・ブロックのサンプルの各グループについてコーディングするステップ及びコード・ビット構成ステップを繰り返すステップと
を含む、ステップと
を含む方法。 - 前記推定されたコーディングされた長さが、複数のビットプレーンの各々においてコード・ブロック中で見つけられた有意サンプルの数を計数することに基づく、請求項1に記載の方法。
- 前記推定されたコーディングされた長さ及びひずみ長さ勾配が、コード・ブロック内の前記サブバンド・サンプルの確率密度関数についての一般化されたガウス・モデルに基づき、前記モデルについてのパラメータが、前記コード・ブロックのサンプル値から計算される要約統計から形成される、請求項1に記載の方法。
- 前記推定されたコーディングされた長さが、ビット・スタッフィングより前に個々のビットストリームに放出されることになるビットの数を決定するために、前記個々のビットストリームを生成することなしに、Cleanupパスのいくつかの要素を実行することに基づいて取得される、請求項1に記載の方法。
- ビット・スタッフィングより前にMagSgn及び可変長コーディング(VLC)ビットストリームに放出されたビットの数を推定するために、VLCコードワード・テーブルが、各グループについてのVLCビットの数と、有意サンプルの数と、残差マグニチュード・ビットの数との和を返すルックアップ・テーブルと置き換えられる、請求項4に記載の方法。
- 各グループが4つのサンプルを含む、請求項1から5までのいずれか一項に記載の方法。
- グループ有意性シンボルは、前記コード・ブロック内のいくつかのグループについて、各前記グループが有意サンプルを含んでいるのか有意サンプルをまったく含んでいないのかを通信するための適応コードを使用してコーディングされる、請求項1から6までのいずれか一項に記載の方法。
- 前記ブロック・コーディング・プロセスが、複数のビットストリームを含む単一のコードワード・セグメントを作り出すステップを含む、請求項1から7までのいずれか一項に記載の方法。
- 前記単一のコードワード・セグメントが、前記単一のコードワード・セグメントの始まりから開始する前方伸長ビットストリーム及び前記単一のコードワード・セグメントの終わりから開始する後方伸長ビットストリームによって作り出され、それにより、前記前方伸長ビットストリーム及び後方伸長ビットストリームの長さが別個に通信される必要がない、請求項8に記載の方法
- 前記単一のコードワード・セグメントは、前記単一のコードワード・セグメントの始まりから開始する2つの前方伸長ビットストリームと、前記単一のコードワード・セグメントの終わりから開始する1つの後方伸長ビットストリームとを含む、3つのビットストリームによって作り出され、前記2つの前方伸長ビットストリーム間のインターフェースと前記コードワード・セグメントの全長が識別される、請求項8に記載の方法。
- グループ有意性シンボルの適応コーディングによって作り出されたビットが、前記コード・ブロックのコードワード・セグメント内のそれら自体のビットストリームに割り当てられる、請求項1から10までのいずれか一項に記載の方法。
- グループ有意性シンボルが、適応算術コーディング・エンジンを使用してコーディングされる、請求項1から11までのいずれか一項に記載の方法。
- グループ有意性シンボルが、適応ランレングス・コーディング・エンジンを使用してコーディングされる、請求項1から12までのいずれか一項に記載の方法。
- サンプルのグループについての有意性情報をコーディングする前記ステップが、コンテキストに基づき、サンプルのグループの前記コンテキストが、走査ライン順序において、前記コード・ブロック中のサンプルの前のグループについてすでにコーディングされた前記有意性情報のみに依存する、請求項1から13までのいずれか一項に記載の方法。
- マグニチュード及び符号情報をコーディングする前記ステップが、各有意サンプルについての未加工ビットストリーム中に含まれる必要があるマグニチュード情報のビットの数をコーディングするステップを伴う、請求項1から14までのいずれか一項に記載の方法。
- 各有意サンプルについての前記未加工ビットストリーム中に含まれる必要があるマグニチュード情報のビットの前記数をコーディングする前記ステップが、マグニチュード・コーディング・コンテキストに基づき、前記マグニチュード・コーディング・コンテキストが、近接サンプルのマグニチュード指数から形成される、請求項15に記載の方法。
- 前記マグニチュード・コーディング・コンテキストが、前記近接サンプルのマグニチュード指数の和から形成される、請求項16に記載の方法。
- 請求項1から17までのいずれか一項に記載の方法を実装するように構成される、符号化装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2018903869 | 2018-10-12 | ||
AU2018903869A AU2018903869A0 (en) | 2018-10-12 | A method and apparatus for image compression | |
PCT/AU2019/051105 WO2020073098A1 (en) | 2018-10-12 | 2019-10-11 | A method and apparatus for image compression |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022504604A JP2022504604A (ja) | 2022-01-13 |
JP7477178B2 true JP7477178B2 (ja) | 2024-05-01 |
Family
ID=70163647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021519707A Active JP7477178B2 (ja) | 2018-10-12 | 2019-10-11 | 画像圧縮のための方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11595692B2 (ja) |
EP (1) | EP3864848A4 (ja) |
JP (1) | JP7477178B2 (ja) |
AU (1) | AU2019356526B2 (ja) |
WO (1) | WO2020073098A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2019356526B2 (en) | 2018-10-12 | 2023-08-10 | Kakadu R & D Pty Ltd | A method and apparatus for image compression |
WO2021077178A1 (en) | 2019-10-25 | 2021-04-29 | Kakadu R & D Pty Ltd | Method and apparatus for complexity control in high throughput jpeg 2000 (htj2k) encoding |
US20240119562A1 (en) * | 2022-10-11 | 2024-04-11 | Samsung Electronics Co., Ltd. | Least significant bit (lsb) information preserved signal interpolation with low bit resolution processors |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005110185A (ja) | 2003-09-08 | 2005-04-21 | Sony Corp | 画像符号化装置及び方法 |
US20060262984A1 (en) | 2005-05-18 | 2006-11-23 | Dts Az Research, Llc | Rate control of scalably coded images |
WO2017201574A1 (en) | 2016-05-23 | 2017-11-30 | Newsouth Innovations Pty Limited | A method and apparatus for image compression |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6012091A (en) * | 1997-06-30 | 2000-01-04 | At&T Corporation | Video telecommunications server and method of providing video fast forward and reverse |
US6778709B1 (en) * | 1999-03-12 | 2004-08-17 | Hewlett-Packard Development Company, L.P. | Embedded block coding with optimized truncation |
JP3743384B2 (ja) * | 2002-04-19 | 2006-02-08 | ソニー株式会社 | 画像符号化装置及び方法、並びに画像復号装置及び方法 |
US8599926B2 (en) * | 2006-10-12 | 2013-12-03 | Qualcomm Incorporated | Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers |
US9819946B2 (en) * | 2012-04-05 | 2017-11-14 | Newsouth Innovations Pty Limited | Method and apparatus for coding of spatial data |
AU2019356526B2 (en) | 2018-10-12 | 2023-08-10 | Kakadu R & D Pty Ltd | A method and apparatus for image compression |
-
2019
- 2019-10-11 AU AU2019356526A patent/AU2019356526B2/en active Active
- 2019-10-11 JP JP2021519707A patent/JP7477178B2/ja active Active
- 2019-10-11 WO PCT/AU2019/051105 patent/WO2020073098A1/en active Search and Examination
- 2019-10-11 US US17/283,587 patent/US11595692B2/en active Active
- 2019-10-11 EP EP19871904.9A patent/EP3864848A4/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005110185A (ja) | 2003-09-08 | 2005-04-21 | Sony Corp | 画像符号化装置及び方法 |
US20060262984A1 (en) | 2005-05-18 | 2006-11-23 | Dts Az Research, Llc | Rate control of scalably coded images |
WO2017201574A1 (en) | 2016-05-23 | 2017-11-30 | Newsouth Innovations Pty Limited | A method and apparatus for image compression |
Also Published As
Publication number | Publication date |
---|---|
WO2020073098A1 (en) | 2020-04-16 |
AU2019356526A1 (en) | 2021-04-15 |
US11595692B2 (en) | 2023-02-28 |
JP2022504604A (ja) | 2022-01-13 |
EP3864848A1 (en) | 2021-08-18 |
AU2019356526B2 (en) | 2023-08-10 |
US20210392377A1 (en) | 2021-12-16 |
EP3864848A4 (en) | 2022-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11470322B2 (en) | Method and apparatus for image compression | |
US7321695B2 (en) | Encoder rate control | |
US7016545B1 (en) | Reversible embedded wavelet system implementation | |
KR102438562B1 (ko) | 엔트로피 인코딩 및 디코딩 방식 | |
JP7477178B2 (ja) | 画像圧縮のための方法及び装置 | |
JP2007267384A (ja) | 圧縮装置及び圧縮方法 | |
JP2005218124A (ja) | データ圧縮システム | |
JP2024150498A (ja) | 画像圧縮のためのさらに改善された方法及び装置 | |
US7457473B2 (en) | Method for block sequential processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20210609 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20231205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240327 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240411 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7477178 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |