JP2000041249A - 視覚的プログレッシブコ―ディング方法 - Google Patents

視覚的プログレッシブコ―ディング方法

Info

Publication number
JP2000041249A
JP2000041249A JP11114028A JP11402899A JP2000041249A JP 2000041249 A JP2000041249 A JP 2000041249A JP 11114028 A JP11114028 A JP 11114028A JP 11402899 A JP11402899 A JP 11402899A JP 2000041249 A JP2000041249 A JP 2000041249A
Authority
JP
Japan
Prior art keywords
visual
coding unit
coding
importance
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11114028A
Other languages
English (en)
Other versions
JP3792067B2 (ja
Inventor
Lee Jin
リー ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/252,245 external-priority patent/US6327392B1/en
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2000041249A publication Critical patent/JP2000041249A/ja
Application granted granted Critical
Publication of JP3792067B2 publication Critical patent/JP3792067B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 ビデオ画像における埋め込み符号化の画質を
向上させ、埋め込み符号化に柔軟な視覚的制御を与え
る。 【解決手段】 画像の視覚的プログレッシブコーディン
グ方法は、画像を1組みの変換係数に変換し、変換係数
の組みを、同一の視覚的特性を有する変換係数のグルー
プを各々含む複数帯域に分割し、各帯域に1組みのアク
ティブな重みを割り当て、符号化単位を生成し(4
2)、1組みの符号化単位候補を特定し、各符号化単位
候補の重要度を決定し(44)、各符号化単位候補の視
覚的重要度を決定し(46)、最大の視覚的重要度を有
する複数の符号化単位候補を符号化し(48)、アクテ
ィブな重みを更新する(52)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ビデオ画像におけ
る埋め込み符号化(embedded coding)方法に関し、特
に埋め込み符号化の画質を向上させ、埋め込み符号化に
柔軟な視覚的制御を与える方法に関する。
【0002】
【従来の技術】埋め込み符号化においては、符号化ビッ
トストリームを切り縮め、種々のビットレート範囲で使
用することが出来る。高いビットレートの視覚条件又は
外観は、低いビットレートの視覚条件又は外観と本質的
に異なる。視覚的プログッレシブコーディング(visual
progressive coding(VPC))は、より良い主観的
画質を全てのビットレート範囲にわたって得られるよう
に全ての符号化ビットレートに対し視覚条件を調整する
ための機構と方法を提供する。視覚の重み付け(visual
weighting)が埋め込み画像の主観的画質を向上させる
有効な手段であることは証明されている。視覚される波
長帯域内で係数に対するビットの割り当てを増やし、視
覚されない波長帯域内で係数に対するビットの割り当て
を少なくする視覚的重み付けは、人間の目により多く感
知される特徴を強調し、画像の主観的画質を向上させ
る。従来、画像の重み付けは次の2つ方法のいずれかで
実施されている。即ち、視覚系のコントラスト感度関数
(contrast sensitivity function(CSF))モデル
を用い、変換係数を式(1)で乗徐算し、重み付けた係
数?i,jをエントロピー符号化する方法、又は式(2)
によりCSF関数の逆数により量子化ステップサイズを
調整する方法による。
【0003】
【数1】
【0004】式(1)及び式(2)共、固定視覚重み付
けスキームとして知られており、式中のfi,jとf
i,j(キャップ)は各々視覚重み付けしない変換係数と
視覚重み付けした変換係数であり、xi,jは量子化され
た係数であり、iは周波数帯域を示し、jは帯域i内の
位置である。qは前記帯域iに関連した量子化ステップ
サイズであり、重みに反比例するように調節される。Q
は量子化器である。wiは係数xiの周波数成分と視覚条
件に関連して重み付けファクタである。重みwiは前記
視覚系のコントラスト視感度関数(CSF)モデルと画
像を見る距離から導き出せる。多くの埋め込みスキーム
(embedding shemes)に式(1)による実行例を用いる
場合、量子化操作は行わない。通常、視覚重み付けファ
クタwiは符号化プロセス中で固定であると仮定され
る。かようなスキームは固定視覚重み付けとして知られ
ている。JPEGのような量子化操作を明らかに含むス
キームの場合、式(2)による操作はより簡単であり広
く使用されている。固定視覚重み付けの実行は簡単なの
で、視覚的に最適な符号化に関して現在行われている研
究は殆んど、先に引用した文献に記述されているよう
に、視距離からの重み付けファクタwiの導出に向けら
れている。
【0005】要約すると、符号化は、(A)変換及びエ
ントロピー符号化の2段階操作または(B)変換、量子
化及びエントロピー符号化の3段階操作で実施出来る。
(A)による方法は埋め込み符号器に多く用いられる。
上記2種類の符号化の場合、固定視覚重み付けを個別に
実施する必要がある。即ち、(A)による方法の場合は
式(1)による実施を要し、(B)による方法の場合は
式(2)による実施を要する。
【0006】画像の符号化における最近の成果の1つ
は、埋め込み符号化(embedded coding)である。埋め込
みゼロツリーウェーブレット符号化“(Embedded zero
tree Wavelet coding(EZW))J.Shapiro、“Embedd
ed image coding using zero tree of wavelet coeffic
ients(ウェーブレット係数のゼロツリーを用いた埋め
込み画像符号化)”(IEEE会報、On Signal Proces
sing(信号処理)、41巻、3445-3462頁、1993
年)のような埋め込み符号器は、後続処理段において切
り捨てることが出来、視覚的に認知できる画像を表示す
るために復号化可能な符号化ビットストリームを生成す
る能力を有する。この埋め込み符号器はインターネット
画像のブラウジング、画像データベース、デジタルカメ
ラ等に主として用いられる。
【0007】一例としてインターネット画像のブラウジ
ングにこの埋め込み符号化を用いると、圧縮画像の1バ
ージョンだけを中央データベースに保管すれば良い。ユ
ーザは、低い忠実度で多数の画像を迅速にブラウジング
ができるよう最初は各画像毎にビットストリームの小さ
な部分だけを要求する。興味のある画像を発見した時
に、ユーザはビットストリームの残りを要求し、完全な
分解能の忠実な画像を得る。EZW技法は、画像をビッ
トプレーン毎に符号化し、各ビットプレーン内でゼロツ
リー構造を用いて重要でない係数を組にし、効率良く符
号化する。
【0008】埋め込み符号化の分野において他にも多数
の文献が刊行されており、多数の特許が認められてい
る。この分野において良く知られている文献の1つに、
D.TaubmanとA.Zakhorにより提案された階層化ゼロ符号
化法がある(Multirate 3-D subband coding of vide
o,IEEE会報、画像処理、第3巻5号、1994年
9月、572-588頁)。ここでは階層化ゼロ符号化(Layer
ed Zero Coding)(LZC))と呼ばれている埋め込み
符号化法が記述されている。この方式は、変換された係
数を文脈適応算術符号化を用いてビットプレーン毎に符
号化するものである。これは、EZWより優れた速度歪
み性能を達成するが、しかし、この文献は人間の視覚特
性については何も触れていない。すぐれた性能に加え、
LZCで生成した符号化ビットストリームを編成して、
画質又は分解能を向上させることが出来、埋め込みプロ
セスに柔軟性を付加する。
【0009】階層ツリーにおける設定区画(SPIH
T)がA.SaidとW.Pearlmanによって提案されている
(“A new, fast and efficient image codec based on
set partitioning in hierarchical trees(階層ツリ
ーにおける設定区画に基づく新しい高速高能率のイメー
ジコーデック)”、IEEE会報、On Circuit and Sys
temfor Video Technology(ビデオ技術用回路とシステ
ム)、第6巻3号、1996年6月、243-250頁)。この
SPIHTは重要でない係数の集団を再規定し、EZW
との比較で、より優れた成果を達成する。さらに、或る
モードのSPIHTはエントロピー符号器を不要とし、
符号器と復号器を非常に簡単に出来る。しかしながら、
人間の視覚特性は何も考慮されていない。
【0010】H.WangとC.J.Kuoは文献“A multi-thresho
ld wavelet coder(MTWC)forhigh fidelity image
(高忠実度画像用多しきい値ウェーブレット)”(IE
EE International Conference On Image Processing
(IEEE画像処理に関する国際会議)、1997年)
中に、最大しきい値でウェーブレット係数を最初に符号
化することによりLZCをこえる改善をもたらすスキー
ムを開示している。この方式においても人間の視覚特性
は考慮されていない。
【0011】J.Li及びS.Leiは、“An Embedded Still i
mage coder with rate-distortionoptimization(速度
歪みを最適化する埋め込み静止画像コーダ)”(SPI
E、Visual Communication and Image Processing(画
像通信と画像処理)、第3309巻、36-47頁、サンホ
セ、1998年1月)に、最大速度歪み勾配、即ち使用
符号化ビット当たりの最大歪み減少値で符号化単位を最
初に符号化することにより、埋め込み符号器の性能を最
適化するスキームを開示している。ここでは速度歪みを
最適化した符号器(rate-distortion optimized embedd
ing coder(RDE))が開示されており、この符号器
はなだらかな速度歪み曲線を有し、SPIHTとLZC
の性能を改善する。しかし、この方式も人間の視覚系に
関して考慮していない。
【0012】Jones,Daly,Gaborski及びRabbaniは、
“Comprative study of wavelet andDCT decomposition
s with equivalent quantization and encoding strate
giesfro medical images(ウェーブレットと等値量子化
によるDCT分解の比較研究と医用画像の符号化戦
略)”(SPIEV,2341,proceedings of Confe
rence Medical Imaging(医用画像会議の会報)、571-5
82頁、1995年)に、視覚的重みの計算方法を開示し
ている。A.Wastonの米国特許No.5,426,512、Image data
compression having minimumperceptual error(最小
知覚誤差を持つ画像データ圧縮)は、圧縮される画像に
よるDCT量子化マトリックスに適応またはカスタム化
する方法を開示している。A.Wastonの米国特許No.5,62
9,780、Image data compression having minimumpercep
tual error(最小知覚誤差を持つ画像データ圧縮)は、
輝度とコントラスト技法およびエラープーリング技法に
より視覚マスキングを用いて量子化マトリックスを調節
する方法を記述している。
【0013】Daly他の米国特許No.4,780,761、Digital
image compression and transmission system visually
waighted transform coefficients(デジタル画像圧縮
・伝送システムの視覚的重み付け変換係数)は人間の視
覚系感度の二次元モデルに従い、変換係数を量子化する
方法を開示している。この人間の視覚系のモデルは、水
平又は垂直方向の空間周波数に対する感度よりも斜め方
向の空間周波数に対する感度が低く、これを利用して画
像の圧縮度を高めることを特徴としている。モデルは、
固定視覚条件で使用している。
【0014】A.Bovior他の米国特許No.5,144,688、Meth
od and apparatus for visual pattern image cording
(視覚パターンによる画像符号化方法と装置)はサブバ
ンドの圧縮システムを記述している。画像を複数のサブ
バンドに分割する。サブバンドフィルタの特性、量子化
器の誤差分布及び人間の視覚系の特性に基づき知覚マト
リックスを決定する。この知覚マトリックスを用い、各
サブバンド信号の符号化に使用される量子化器を調節す
る。この教示も固定視覚条件に対してなされている。Ho
pkinsの米国特許No.4,939,645、Method and apparatus
to reduce transform compression visual artifacts i
n medical images(医用画像における変換圧縮の視覚的
人為要素の減少方法と装置)は、デジタル画像をブロッ
クに区分し、人間の目の重要な視覚的反応に従って個別
に符号化するデジタル画像符号化・復号化方法を記述し
ている。符号化は、各区画内のデジタル数から平均輝度
値を計算抽出し、合成残像ブロック内の視覚的に知覚出
来るエッジ位置を検出することにより達成される。視覚
的に知覚できるエッジがブロック内にあれば、各エッジ
ブロック内のエッジの反対側における勾配値と方向を計
算し適正に符号化する。ブロック内に知覚できるエッジ
が含まれていない場合は、そのブロックは均等輝度ブロ
ックとして符号化する。復号化においては、符号化平均
輝度値、勾配の大きさ、及びパターンコードを受信し、
これらの3つの指示値を組合わせて最初のデジタル画像
と同様な配置となるように復号化することが必要であ
る。視覚条件は固定である。
【0015】J.Sapiroの米国特許No.5,321,776、Date c
ompression system including successive approximati
on quantizer(遂次近似量子化器を含むデータ圧縮シス
テム)は、遂次洗練量子化(successive refinement qu
antization)とエントロピー符号化(entropy coding)
によるデータ圧縮を容易にするデータ圧縮システムを記
述している。生成され圧縮されたビットストリームは、
任意の時点で切り捨てても知覚可能な画像を生成出来
る。ビットストリームは、画質の漸次改善を達成する。
即ち、切り捨て点における平均二乗誤差を最小化するよ
うに配列される。このスキームも人間の視覚特性を考慮
していない。
【0016】固定した視覚的重み付けは、視覚系のコン
トラスト感度関数(CSF)のモデルを用いて変換係数
を乗徐算することにより埋め込み符号器に容易に組込む
ことが出来る。しかしながら、埋め込み符号器の場合、
符号化ビットストリームは若干遅れた時点で切り捨てら
れ、埋め込み段階が異なれば視覚条件はかなり異なる。
低いビットレートにおいて、圧縮画像の画質は貧しく、
詳細な画像の特徴は得られない。画像は通常比較的遠い
距離をおいて目視され、観察者は全体的な特徴に関心を
持つ。受信ビット数が増えれば増える程、画像の画質は
向上し、観察者は全体的な特徴だけでなく画像の細部に
も関心をもつことが出来る。画像はより近い距離で観察
され、画像分析がなされるか或いは検査のため拡大さ
れ、視覚距離も短くなる。かように、異なる視覚条件
が、異なる埋め込み段階において要求される。
【0017】(発明の要約)画像の視覚的画質を漸次向
上させる符号化方法は、画像を1組の変換係数に変換
し、この変換係数の組を、同一の視覚特性を有する変換
係数群を各々含む複数バンドに分割し、各バンドに1組
のアクティブな重みを割り当て、符号化単位を生成し、
1組の符号化単位の候補を特定し、各符号化単位候補の
重要度を決定し、最大の視覚的重要度を有する複数の符
号化単位候補を符号化し前記のアクティブな重みを更新
するステップを含む。
【0018】
【発明が解決しようとする課題】この本発明の目的は、
ユーザが完全な分解能の高画質画像を要求する前に低分
解能・低画質の画像を見ることが出来る符号化方法を提
供することである。本発明の他の目的は、視覚的画質を
漸次向上させる符号化方法を速度歪みを最適化した埋め
込み技術に適用することである。本発明のさらなる目的
は、視覚的画質を漸次向上させる符号化方法をサブバン
ド又はDCTインデックスレベルにおいて適用すること
である。これらの目的及び他の諸目的並びに諸利益は以
下の説明を図面を参照して読めば明瞭となろう。
【0019】
【発明の実施の形態】ここに記述する発明は、視覚的プ
ログレッシブコーディング方法(VPC)と命名した視
覚的重み付け方法である。VPCは先行技術のように変
換係数に重みを乗算したり或いは重みに反比例する量子
化ステップサイズに調整したりすることはない。代わり
に、埋め込みの順番を変えるために重みを用いる。多数
の重みをVPC符号化プロセスに用いることが出来、各
時点で新しい組の重みがアクティブであり、VPCは新
しい重みに従って残りのビットストリームを記録する。
新しい重みは既に符号化したビットストリームの順番に
影響しない。VPCは現にある埋め込み符号器を用いて
実施することができ、完全な埋め込み符号化に柔軟な視
覚的調整を加えることが出来る。
【0020】VPCは埋め込み符号化の主観的画質を改
善する。埋め込み符号化において、符号化ビットストリ
ームは後処理時に切り捨てることができ、それでも知覚
出来る画像を復号化出来る。高ビットレートにおける視
覚条件は低ビットレートでの視覚条件と非常に異なる。
本発明による視覚的プログレッシブコーディング方法
は、より良い主観的画質を得るために全符号ビットレー
トにわたって視覚条件を調整する方法を提供する。
【0021】埋め込み符号化された画像が或る特定の距
離から観察される場合、視覚的重み付けは変換係数に重
みwiを乗ずることにより符号器に容易に組込むことが
出来る。しかしながら、見る条件が異なれば、異なる埋
め込み段階を要する。埋め込み機能を用いた画像データ
ベースへの照会を例にとると、圧縮ビットストリームの
1バージョンのみが中央データベースに保管される。ユ
ーザは、多数の画像を低分解能・低忠実度で、例えば画
像当たり16分の1のスクリーンで迅速にブラウジング
を行うために、最初は各画像共極く小部分のビットスト
リームを要求する。興味を引く画像が見つかると、ユー
ザは全スクリーン分解能でその画像を見る。ユーザはそ
の画像に満足すれば、分析のために完全無欠な圧縮画像
を要求し印刷する。照会プロセス中には視覚条件が変化
する。受信ビットレートが増大するにつれて、画像は拡
大されるか或いは接近して観察される。低ビットレート
では、画像は通常比較的遠い距離をおいて観察される。
この場合、圧縮画像の画質が低く詳細な画像の特徴はい
ずれにしても得られないので、ユーザは画像の全体的な
特徴に興味をおいている。画像の画質は受信ビットレー
トが増すにつれて向上し、ユーザは全体的な特徴だけで
なく画像の細部にも関心を持つようになる。画像をより
近い距離で見るようになると、画像分析操作が行われ、
或いは引き伸ばされて点検され、その分視距離は減少す
る。前述した式(1)又は式(2)のいずれかを用いて
重みを変えて実施するのは、重みが変わる度に毎回、係
数に新しい重みを乗じるか再度量子化しなければならず
不都合である。さらに、そのような実施例では、重みが
変わる度にその都度エントロピー符号器に送る係数の二
進表現を変更するので、変化する統計値のために次のエ
ントロピー符号器の性能が低下する。
【0022】主観的な視覚的重み付けは、符号化された
画像の主観的画質を向上させる効果的な方法であること
は証明されている。図1を参照し、先行技術による視覚
的重み付け方式のフローチャート10を説明する。画像
12の従来の視覚的重み付けは、次の2つの方法のいず
れか、即ち、視覚系のコントラスト感度関数(CSF)
モデルにブロック14の変換係数を、視覚的重み付けブ
ロック16に示すように乗除算する方法(1)か、また
はブロック18の量子化操作で視覚的重み付けを累積す
る方法(2)のいずれかにより実施する。
【0023】重み付けられた係数はブロック20でエン
トロピー符号化される。画像は先ずブロック22でエン
トロピー復号化され、ブロック24で重み係数が逆量子
化され、ブロック26で逆重み付けされ、ブロック28
で逆変換され、出力画像30が得られる。これに代わ
り、重みに反比例するように量子化ステップサイズを調
節する逆量子化により視覚的重み付けを累積することが
出来る。
【0024】低ビットレートの場合、画像の全体的な特
徴のみに関心が集まり、画像も比較的遠い距離から観察
される。細部の特徴はビットレートが十分でないので得
られない。しかしながら、高ビットレートの場合、画像
は詳細に検査され、比較的近い距離から観察される。画
像は分析のためにさらに拡大される。かように、埋め込
み段階が異なると、異なる視覚的重み付けが要求され
る。埋め込みプロセス中に視覚的重み付けファクタを調
節出来る公知の埋め込み符号器は無い。
【0025】調節可能な埋め込み符号器用シンタクス及
び特殊な装置について説明する。シンタクスは重み付け
ファクタを埋め込みプロセスにおいて調節可能にする。
かような符号器は視覚的プログレッシブコーダ(VP
C)と呼ばれ、そのプロセスも視覚的プログレッシブコ
ーディングプロセス(VPC)と呼ばれる。VPCの幾
つかの実施例について記述する。
【0026】視覚的プログレッシブコーディング方法
(VPC) VPCは埋め込みプロセス中の視覚的重み付けファクタ
の柔軟な調節を可能にする。VPCのこの機能性によ
り、符号器は低いビットレートにおける視覚的重み付け
の利点を生かし、低いパス係数により多数のビットを割
り当て、画像全体的の外観を改善する。高ビットレート
の場合、VPCは次第にこの重み付けを止めてより柔軟
な視覚条件に適応させ、高周波画像の細部を維持する。
VPCは埋め込み符号化の主観的画質を向上させる。視
覚的重みにより係数を乗除算したり又は視覚的重みによ
り量子化ステップサイズを調整するのではなく、VPC
は視覚的重みに従って埋め込み順位を調整する。言い換
えれば、VPCは符号化の内容ではなく符号化の順位を
制御する視覚的重み付けを用いる。
【0027】視覚的プログレッシブコーディング方法
(VPC)の実施 VPCにおいて、画像は先ず1組の係数に変換される。
ここでの変換は、DCT(離散コサイン変換)、ウェー
ブレット又は偶数(Even)ウェーブレットパケット
であって良い。VPCにおいては、一般性を失うことな
く、1つのバンドを同一の視覚特性を有する変換係数群
と定義する。ウェーブレット/ウェーブレットパケット
の変換において、1つのバンドは1つのウェーブレット
/ウェーブレットパケットのサブバンドであり、DCT
の場合は1つのバンドは同じDCT基底を有する全ての
係数を含む。変換係数はfi,jのように添字される。こ
こで、iはバンドを示し、jはバンドの位置を示す。転
換係数fi,jの2進表示は次の通りである。 ±b1,b2,b3,…,bn,…bL … 式(3)
【0028】ここで、b1は最上位ビットであり、bL
最下位ビットであり、bu(fi,j)はu番目の最上位ビ
ットもしくは係数fi,jのu番目の符号化層である。変
換により生じたサンプルビット配列を図2に示す。ビッ
ト配列の各行は変換係数を示しており、ビット配列の列
は符号化層を示している。最上位ビットは左端の列に位
置し、最下位ビットは右端の列に位置する。上位ビット
u(fi,j)は常に下位ビットbv(fi,j)(u<vの
場合)より先に符号化されなければならないことは明ら
かである。bu(fi,j)は、最上位の未符号化ビットで
あれば、即ち、同じ係数bv(fi,j)のより上位のビッ
ト(v=1,…,u−1)が全て符号化されていれば候
補ビットとして表示される。所定の時点において、符号
器は候補ビットの集合の中から次に符号化するビットを
選択しなければならない。係数は、その符号化されたビ
ットのいずれかがゼロでなければ重要であり、全てゼロ
であれば重要でないと見なされる。重要でない係数の候
補ビットは重要度の特定モード(mode of significance
identification)で符号化され、重要な係数の候補ビ
ットは洗練モード(mode of refinement)で符号化され
る。重要度の特定と洗練に関しては後述する。
【0029】従来の符号器とこの埋め込み符号器はビッ
ト配列を符号化する順番が異なる。従来のJPEGまた
はMPEGのような符号器は、先ず量子化の精度を決定
し又は同様に各係数毎に符号化するビット数を決定して
から、係数毎に符号化する。前記のビット配列を例にと
ると、従来の符号化は通常図2の32のような配列であ
る。図2の例の場合、w0からw7までの列はビットプレ
ーンb1〜b7を含んでいる。各列には+または−の符号
が付けられている。
【0030】従来の符号化と異なり、埋め込み符号化は
図3の34に示すように、画像をビットプレーン単位又
は列単位で符号化する。埋め込み符号化のビットストリ
ームは、各係数の最も重要な部分を最初に符号化するの
で途中で切り捨てても妥当な画質が維持される。復号画
像の画質はビットの受信数が増すにつれて徐々に向上す
るので順次画像伝送にも適している。VPCの場合、多
数の視覚的重みの組が存在する。 w(0)={w0 (0),w1 (0);…,wn (0)}; w(1)={w0 (1),w1 (1);…,wn (1)}; ・ ・ ・ w(m)={w0 (m),w1 (m);…,wn (m)}. … 式(4) VPCの重みシリーズに追加され、変換操作直後に使用
される最適な全体の重みの組wgは次の通りである。 wg={wg0,wg1,…,wgn} … 式(5) この全体的な重みの組は固定した視覚的重み付けで実施
される。所定の時点において、アクティブな重みwと表
示される1組の重みが付加される。 w={w0,w1,…,wn} … 式(6)
【0031】ここで、w1はバンドiに対するアクティ
ブな重みである。VPCの重要なコンセプトは、実施式
(1)の変換係数を重み付けするのではなく、或いは、
実施化式(2)の重みに反比例するように量子化を調節
するのではなく、重みを使用して埋め込みの順番を制御
することである。VPCにおける再順序付けの最小の単
位は符号化単位(coding unit(CU))として知られ
ており、kを添字する。符号化単位は、VPCを実施す
るための特別な埋め込みスキームによって異なる。符号
化単位候補は候補ビットのみから成る符号化単位(C
U)であると定義される。CU候補のみを符号化するこ
とが出来るので、VPCの操作はアクティブな重みに従
ってCU候補を順序づけることである。新しい重み付け
の組がアクティブである場合、VPCは残るCUに対し
新しい符号化順序を編成する。既に符号化されたCUの
符号化順序は新しい重みによって影響されない。この重
みによる再順位付け戦略により、VPC符号器は埋め込
みプロセス中に多数の重みの組を編入することが出来
る。
【0032】本発明によるVPC方法の全体的操作のフ
ローチャート40を図4に示す。入力画像12を受信
し、この画像を変換して符号化単位(CU)を生成する
(ブロック42)。変換後、全体的な重み付けの組wg
がある場合、これを実施式(1)又は(2)のいずれか
を用いた、固定視覚重み付け法により付加する。アクテ
ィブな重みの組wを初期化し、変換係数のビットを群別
して符号化単位(CU)を生成する。VPCはCU候補
を特定し、各々のCU候補の重要度skを決定する(ブ
ロック44)。重要度skは視覚的重み付けをしない埋
め込み順位に関する大きさの値である。その後、CUの
重要度にその重みを乗算してCUの視覚的な重要度Vsk
を決定する(ブロック46)。
【0033】
【数2】
【0034】式中、WiはCUが存在する帯域のアクテ
ィブな重みである。VPCは最大の視覚的重要度を有す
るCUを符号化する(ブロック48)。1つのCUの符
号化が終了すると、新しいCU候補が出現する。VPC
は新しく出現した複数のCU候補の重要度と視覚的重要
度(The largest Visual significance)を評価し、最
大の視覚的重要度を有するCUを符号化する。そして重
みを更新すべきか否かの決定をなす(ブロック50)。
更新すべきであれば、次のステップに移行する。更新す
べきでないなら、同一の重みを用いてブロック44から
のステップを繰り返す。アクティブな重みは何時でも変
えることが出来(ブロック52)、新しい重みがアクテ
ィブになると、残りのCUの埋め込み順位にのみ影響す
る。重みの変更は、符号器と復号器の間で折衝決定され
ねばならない。幾つかの有効な方法があるが、VPCの
シンタクスとして後述する。上記の符号化プロセスは、
或る終了判定基準が満たされるまで反復される(ブロッ
ク54)。例えば、全てのCUが符号化され、即ち、符
号化が無損失状態に達したか、最終符号化レートが達成
されたか、或いは符号化歪みが或る特定のしきい値に達
するまで反復される。その後、プロセスは終了する(ブ
ロック56)。前記の終了判定基準が満たされない場合
は、前記プロセスをブロック44から反復する。
【0035】個別ビットにおける視覚的画質の向上:視
覚的プログレッシブ方式による速度歪み最適化埋め込み
符号化(VPC RDE) 速度歪み最適化埋め込み法(RDE)は、前述のよう
に、LiとLeiによって開発された。RDEの場合、符号
化単位(CU)は1つの変換係数fi,jの単一ビットbu
(fi,j)である。RDEは候補ビットを、予想速度歪み
勾配(R−D勾配(Rate-Distortion(R−D)slop
e))の順番、即ち符号化ビット当たりの歪み減少順に符
号化する。
【0036】
【数3】
【0037】計算を容易にするために、ルックアップテ
ーブルを開発し、各候補ビット毎のR−D勾配の計算
を、符号化層、重要度状態および算術符号化コンテキス
ト(arithmetic coding content)をインデックスとし
て一回のルックアップテーブル操作だけで済むようにし
ている。速度歪みを最適化する埋め込み(RDE)のた
めのVPCを実施するために、符号化単位(CU),即
ち係数の個別ビットを視覚的重要度の降順で符号化す
る。CUの重要度はR−D勾配の平方根として定義す
る。 sij=√slope勾配ij … 式(9)
【0038】R−D勾配はエネルギー減少の測定値ある
ので、この平方根を適用する。一方、1符号化単位(C
U)の重要度は大きさの測定値である。CUの個数は非
常に多いので、CUは厳密な探索はされず、また、最大
の視覚的重要度では符号化されず、代わりに、しきい値
近似法が適用される。
【0039】1組の低減するしきい値をγ0>γ1>…γ
n>…として定義する。代表的なしきい値列は反復毎に
ファクタαだけ減少する。 γn=γ0・α-n … 式(10) VPC RDEは変換係数を多数回走査し、N回の走査
で、γnを越える視覚的重要度をもつ全てのCUを符号
化する。アクティブな重みはバンドiの範囲内では同一
であるので,各係数の重要度を計算して現在のしきい値
と比較する代わりに,バンドiに対するしきい値を逆に
重み付けする。
【0040】
【数4】
【0041】γ′iより大きい視覚的重要度を有する全
ての候補ビットを符号化する。VPC RDEのステッ
プは次の通りである。 ステップ1:画像変換 ステップ2:固定視覚重み付け:可能ならば全体的な重
みwgを加える。 ステップ3:最初のしきい値γ=γ0とアクティブな重
みWを設定する。 ステップ4:走査して符号化する。 画像は、最初に最低分解能バンドから最高分解能バンド
まで各帯域内をラスタ線の順序で走査する。バンドiの
場合、そのR−D勾配を、符号化層範囲内のルックアッ
プテーブルの操作と、重要度状態と、LiとLeiの文献に
記載されているインデックスとしての算術符号化コンテ
キストとを用いて決定する。候補ビットのR−D勾配
を、調節したしきい値γ′iと比較し、その調節したし
きい値より大きいR−D勾配を持つビットのみを符号化
する。 ステップ5:必要に応じアクティブな重みを更新する。 ステップ6:しきい値を減少させる。画像全体を走査し
た後、しきい値をファクタαだけ減少させる(γ←γ/
α)。ステップ4に戻り、ユーザが選択した最終ビット
レート、例えば20bppに達する等の終了条件が満た
されるまで符号化は継続実行される。
【0042】サブバンド又はDCTインデックスレベル
における視覚的プログレッシブコーディング Taubman及びZakhorが提案した階層ゼロ符号化(LZ
C)のようなビットプレーン方式、Zandi他の提案せる
可逆埋め込みウェーブレット符号器による圧縮(compre
ssion with reversible embedded warvelets(CRE
W))、及びWangとKuoの提案する複数しきい値ウェー
ブレット符号器(multi-threshold wavelet coder(M
TWC))の場合、VPCの符号化単位(CU)はベー
スバンドであり、同一符号化層内及び同一バンドの全て
のビットを含んでおり、そのビット構成はすでにMTW
C内に存在している。CUを拡大することにより、再配
列の粒度が増大するが、実現化はより容易となり、符号
器の大部分は同一のままである。この範疇のVPCの実
施は、JPEG2000VM2におけるVPCの実施化
として以下のように説明出来る。1つのバンドビットプ
レーン内で、ビットをさらに部分的ビットプレーン又は
3つのサブモデル、即ち、(1)現係数は重要でないが
その近傍の係数は重要である予測重要度モード(predic
ted significance mode)と、(2)現係数が重要であ
る洗練モード(refinement mode)と、(3)現係数も
近傍の全ての係数も重要でない予測非重要度モード(pr
edicted insignificance mode)に分類する。1つのバン
ドにおいて、符号器は常に最重要ビットプレーンから最
低重要度ビットプレーンに処理を進め、1つのビットプ
レーンにおいて、符号器は常に先ず予測重要度モードで
符号化し、次に洗練モードで符号化し、最後に非重要度
モードで符号化する。VPCを実施するために、符号化
単位(CU)を1ビットプレーンの1サブモードとして
規定し、CUをアクティブな重みに従って最配列する。
VPCを可能にするJPEG2000VM2は下記のよ
うに実施する。
【0043】ステップ1:画像を変換する。 ステップ2:スカラー量子化器またはトレリス符号化量
子化器(TCQ)により量子化し、可能ならば全体的な
重みwgで固定視覚的重み付けをする。 ステップ3:最初のアクティブな重みwを設定する。 ステップ4:各符号単位(CU)候補毎に重要度sk
計算する。 sk=31/2・2-n k 予測重要度モードの場合 sk=1・2-n k 洗練モードの場合 sk=(0.96)・2-n k 予測非重要度モードの場合 … 式(12) ここで、Nkは現符号化層である。定数31/2,1及び
0.961/2は異なる符号化モードのR−D勾配を概算
し、視覚的進展が活性化されない場合埋め込み順序を維
持する。 ステップ5:式(7)に従って各CU候補の視覚的重要
度を計算する。 ステップ6:最大の視覚的重要度を有するCU候補を符
号化する。CUの数が比較的少ないので、変更重みを符
号化する代わりに、JPEG2000VM2はCUの順
序を符号化する。1つのCUを符号化する前に、そのC
Uを特定するタグを符号化する。1つのバンド内におけ
る符号化順序は1つだけなので、タグはCUが含まれて
いるバンドを特定するだけで良い。 ステップ7:必要に応じアクティブな重みを更新する。
符号化は、終了条件が満たされるまで継続実行される。
【0044】マルチバンドの符号化単位を有する埋め込
み方式の場合の視覚的プログレシッブコーディング(V
PC)方法 複数バンドにまたがる係数を有するシンボルの符号化を
含む階層ツリー(SetPartitions In Hierarchical Tree
s(SPIHT))内の設定区分においてVPCを実施
する方法について記述する。この実施法はEZWのよう
な他の類似埋め込み方式にも一般化出来る。階層ツリー
(SPIHT)内に三種類の符号化シンボル、即ち、非
重要画素のリスト(list of insignificant pixels(L
IP))、重要画素のリスト(list of significant pi
xels(LSP))、及び非重要組のリスト(list of in
significant sets(LIS))が存在する。LIPとL
SPの構成要素は各々1つの係数の1つのビットであ
る。LISの構成要素には、複数の帯域にまたがる同一
層における重要でないビットの3つの集団を含んでい
る。VPCの再配列の最小単位である符号化単位(C
U)は、LIP,LSP又はLISの1つの要素である
と規定する。CUは多数なので、前述のVPC RDE
と同様なしきい値による処理を採用する。SPIHTに
よるVPCの符号化手順は次の通りである。
【0045】ステップ1:画像を変換する。 ステップ2:可能ならばグローバルな重み(global wei
ghts)wgで固定の視覚的重み付けをする。 ステップ3:最初の初期しきい値γ=γ0を設定しアク
ティブな重みWを設定する。 ステップ4:トラバースして符号化する。VPCはLI
S,LIPおよびLSPを縦覧横断し、各CUの重要度
と視覚的重要度を評定し、しきい値γより大きい重要度
を有するCUを符号化する。CUの重要度は量子化のス
テップサイズと符号化モードによって計算する。 sk=1.9・2-n k LIS構成要素の場合 … 式(13) sk=31/2・2-n k LIP構成要素の場合 sk=1・2-n k LSP構成要素の場合
【0046】ここで、NkはまだCUの符号化層であ
る。定数1.9、31/2及び1は異なる符号化モードのR
−D勾配を再び概算して定め、視覚的進展が活性化され
ない場合埋め込み順序を維持する。CUの視覚的重要度
は、CUの重要度にその重みを乗じて定める。1ビット
のCU(LIP又はLSP)の場合、その重みは、画素
が存在するバンドiのアクティブな重みwiである。複
数のバンドにまたがる重要でないビットのツリーを含む
LISの構成要素のCU場合、その重みは最も感度の強
い視覚バンドに従って式(14)のように計算するか、
或いは、重みの合計として式(15)のように計算する
ことが出来る。
【0047】
【数5】
【0048】式中のPcはバンドc(c=0,…,L)に
存在する画素数を意味する。式(14)の方法は、CU
の視覚的な画質を保証できるのでより好適である。計算
した視覚的重要度を現しきい値と比較し、しきい値を越
える重要度を有するCUのみを符号化する。CUの符号
化はSaidとPearlmanが記述した規則に厳格に従ってい
る。 ステップ5:必要に応じアクティブな重みを更新する。 ステップ6:しきい値を減少させる。LIS,LIP及
びLSPを走査後、しきい値γをファクタαだけ減少さ
せ(γ←γ/α)、ステップ4に戻る。終了条件が満た
されるまで符号化は継続実行される。
【0049】VPCのビットストリームシンタクス VPCの場合、復号器はアクティブな重みの変更につい
て知らされねばならないが、これには、3通りの方法が
ある。第1の方法は、デフォルト重み値の変更戦略を符
号器と復号器間で折衝出来るようにすることである。こ
のデフォルト重みのアプローチは復号器へ送られるオー
バーヘッドを除去するが、デフォルト重みの個数が制限
されるので視覚的進展の柔軟さが制限される。
【0050】より一般的な方法は、符号器に埋め込み時
の重み変更、即ち視覚条件の変更を制御させ、復号器は
符号器の指示に従って重みを受信し更新するだけとす
る。これには2通りの方法がある。符号化単位(CU)
の個数が少ない場合、JPEG200VM2におけるV
PCの実施の様に、CUの埋め込み順序を指定するタグ
を符号化出来る。これが、アクティブな重みの変更を知
らせる第2の方法を構成する。
【0051】或る特定の符号器の場合、付加タグは、次
のCUを符号化するために必要なビット数を特定するこ
とが要求される。CUの数が多い場合、通常の方法では
正規の間隔で視覚マーク(VM)を明示的に伝送し、重
みが変更されたか否かを復号器に知らせる。これが、ア
クティブな重みの変更を知らせる第2の方法を構成す
る。
【0052】図5に視覚マーク(VM)60のシンタク
スを示す。VMは、重みが変更されたか否かを示す1ビ
ットのシンボルMにより先導される。Mが0であれば、
先の重みがアクティブである。Mが1の場合、VPCは
全てのバンドについて重みを更新する。かようなシンタ
クスは重みの変更がない場合にオーバヘッドを最小にす
る。重み更新に関する事前折衝の間隔は、符号器と復号
器間で事前に取り決めておく。これは、例えば、1バン
ドビットプレーンを符号化後または全画像を走査後に実
施出来る。重み更新間隔が長ければ長い程、重み更新の
ためのオーバヘッドは短いが、重み変更の粒度は粗くな
る。
【0053】視覚マークのシンタクスは、複数バンドに
またがる係数を持つCUがない特別な場合に、画質と空
間のスケーラビリティを維持出来る。画質のスケーラビ
リティの場合、最初の重みは一様に1に設定し、重みが
変わっていないことを示す視覚マーク0を重み更新間隔
ごとに伝送する。空間スケーラビリティを実施するため
に、最低分解能に対する重みを全て1に設定し、残りの
分解能に対する重みを全て0に設定する。かような重み
を使用すれば最低分解能範囲外に存在する係数の視覚的
重要度が0になり、VPCは最低分解能の係数のみを符
号化出来る。最低分解能の全係数の全ビットプレーンを
符号化後、VPCは次の最低分解能の処理に進む。この
新しい分解能の重みを1に設定し、残りの分解能の重み
を0に設定する。新しい分解能の全係数を符号化した
後、VPCはより高い分解能の処理に進む。プロセスは
全ての係数を符号化するまで継続実行される。
【0054】実験結果 実験結果を得るために使用したシミュレーションソフト
ウェアはJPEG2000VM2であり、非視覚的重み
付けモード(non-visual weghting mode(NW))、固
定視覚的重み付けモード(fixed visual weighting mod
e(VW))及び視覚的プログレッションモード(visua
l progression mode(VPC))で実施した。試験画像
は図6に示した自転車の画像であり、寸法は2048×
2560である。
【0055】この画像を画素当たり1.0ビットで圧縮
し、0.125bppおよび1.0bppで各々埋め込み
/復号化した。固定視覚的重み付けの場合、画像は14
インチ(35センチ)の距離をおいて観察されると想定
し、コントラスト視感度関数(CSF)の視覚的重みは
Jones他の提案になる方法(以後Jones法と記す)に従い
計算する。同じCSF重みを0.125bpp以前のV
PCにおいて使用し、その後、重みを一様に1に設定す
る。結果画像を図7,図8及び図9に示す。符号化画像
のピーク信号対雑音比(PSNR)と実行値誤差(RM
SE)を参考までに表1に示すが、PSNR及びRMS
Eは視覚画質における良好な測定尺度を提供するもので
はない。
【0056】図7は、0.125bppの復号画像で、
NW,VPC及びVWの各モードで符号化した画像を各
々図7(a),図7(b),図7(c)に示してある。
図7(b)のVPC符号化画像の主観的画質は、図7
(a)のNW符号化画像の主観的画質より優れており、
図7(c)のVW符号化画像の主観的画質に近い。人間
の目に認識されやすい周波数成分を強調することによ
り、VPC符号化画像はより明瞭に見え、自転車の車輪
回りのリンギングアーチファクトも少ない。背景の縞模
様はVPCとVW符号化画像においてより明瞭である。
【0057】1.0bppで完全に復号した画像を図8
に示す。図8(a),図8(b)及び図8(c)は各々
NW,VPC及びVWで復号した画像であるが全て視覚
的画質は近似である。しかしながら、高ビットレートの
場合、ユーザは画像を拡大して詳しく見たいと思うであ
ろう。図9に示すように画像を4倍に拡大すると、VW
符号化画像9cはよりスムーズで、シャープなエッジ周
辺のリンギングアーチファクトがより強くなるが、VC
P符号化画像9a及びNW符号化画像9bはかようなア
ーチファクトは僅かである。高ビットレートの場合、V
PCの重みによる再順位付け戦略は、画像を近距離で見
られるように徐々に視覚的重み付けを無くして行くこと
を可能にする。VW符号化画像はかような柔軟性を持た
ない。
【0058】VPC法により符号化した画像は、埋め込
み時の視覚的重みをより柔軟に調節出来るようにする。
低いビットレートでの視覚的重み付けの利点を生かし、
低域パス係数により多くのビットを割り当て画像全体の
外観を向上させる。高ビットレートにおいては、より柔
軟な視覚条件に適応して高周波画像の細部を確保するた
めに視覚的重み付けを停止する。VPCは埋め込み符号
化画像の主観的画質を向上させる。
【0059】
【表1】
【0060】以上、視覚的プログレッシブコーディング
方法とその種々の変形例について説明してきたが、これ
らは好適な実施例とその代案であり、請求項に規定され
た本発明の範囲から離れることなく、さらなる変更と修
正をなし得ることは理解出来よう。
【図面の簡単な説明】
【図1】代表的な符号化フレームワークにおける先行技
術による重み付けを示すブロック図である。
【図2】従来の符号化方法のビット配列と符号化順序を
示す図である。
【図3】本発明による符号化方法のビット配列と符号化
順序を示す図である。
【図4】本発明の符号化方法のブロック図である。
【図5】本発明に用いられるシンタクスを示す図であ
る。
【図6】原画像を示す図である。
【図7】本発明により処理された画像を示す図である。
【図8】本発明により処理された画像を示す図である。
【図9】本発明により処理された画像を示す図である。
【符号の説明】
12…画像、14…変換、16…視覚的重み付け、18
…量子化、20…エントロピー符号化、22…エントロ
ピー復号化、24…逆量子化、26…逆重み付け、28
…逆変換、30…出力画像、40…フローチャート、4
2…変換,符号化単位(CU)の生成、44…各CU候
補の重要度の決定、46…視覚的重要度の決定、48…
最大の視覚的重要度を有するCUの符号化、50…重み
更新(?)、52…重み変更、54…終了(?)、56
…終了。

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 画像を1組の変換係数に変換し、前記変
    換係数の組を各バンドが各々同一の視覚特性を有する変
    換係数群を含む複数バンドに分割し、各バンドに1組の
    アクティブな重みを割り当て、符号化単位を生成し、1
    組の符号化単位の候補を特定し、各符号化単位候補の重
    要度を決定し、各符号化単位の候補の視覚的重要度を決
    定し、最大の視覚的重要度を有する複数の符号化単位候
    補を符号化し、前記アクティブな重みを更新することを
    特徴とする画像の視覚的プログレッシブコーディング方
    法。
  2. 【請求項2】 前記変換がDCTによる変換を含み、前
    記各バンドが同一のDCTに基底を有する係数を含んで
    いることを特徴とする請求項1に記載の方法。
  3. 【請求項3】 前記変換がウェーブレットによる変換を
    含み、前記各バンドがウェーブレットのサブバンドであ
    ることを特徴とする請求項1に記載の方法。
  4. 【請求項4】 前記変換後に全体的な重みによる固定し
    た視覚的重みを付加することをさらに含むことを特徴と
    する請求項1に記載の方法。
  5. 【請求項5】 前記アクティブな重みの更新が予備折衝
    にて定めた間隔で1ビットの視覚マークを送出すること
    を含み、重み付けを更新しない場合は、前記視覚マーク
    を0に設定し、前記アクティブな重みを変更する場合は
    前記視覚マークを1に設定し、該視覚マークが1の場合
    に更新されたアクティブな重みを送出することを特徴と
    する請求項1に記載の方法。
  6. 【請求項6】 1組のアクティブな重みを初期化し、符
    号化単位を生成し、1ビット視覚マークを復号化し、該
    視覚マークが1の場合に前記アクティブな重みを更新
    し、1組の符号化単位候補を特定し、全符号化単位候補
    の重要度を決定し、全ての符号化単位候補の視覚的重要
    度を決定し、最大の視覚的重要度を有する符号化単位を
    復号化し、全体的な重み付けと共に設定した前記視覚的
    重みを逆固定し、前記画像を空間ドメインに逆変換する
    ことにより、ビットストリームを復号化することを特徴
    とする請求項5に記載の方法。
  7. 【請求項7】 前記符号化は、符号化する次符号化単位
    を特定するタグの符号化と、該次符号化単位の符号化ビ
    ットストリームの符号化を含むことを特徴とする請求項
    1に記載の方法。
  8. 【請求項8】 前記次符号化単位を符号化するために必
    要なビット数を特定するタグの符号化をさらに含むこと
    を特徴とする請求項7に記載の方法。
  9. 【請求項9】 視覚的プログレッシブコーディングの間
    に符号器と複号器の間で通常設定重みの変更戦略の折衝
    を行なうことを特徴とする請求項1に記載の方法。
  10. 【請求項10】 前記の符号化単位の生成は、変換係数
    の各ビット毎に符号化単位を生成することを含み、前記
    符号化は、RDEによる符号化単位の重要度の決定とR
    DEによる符号化単位の符号化とを含むことを特徴とす
    る請求項9に記載の方法。
  11. 【請求項11】 前記符号化は、初期しきい値γ=γ0
    を設定し、バンドしきい値γ′i=γ2/wi 2を計算し、
    前記バンドしきい値γ′iを越える重要度の前記符号化
    単位を符号化し、しきい値γをαの係数によって減じる
    (γ←γ/α)ことを含むことを特徴とする請求項10
    に記載の方法。
  12. 【請求項12】 前記符号化単位の生成は、ビットプレ
    ーンバンドの部分ビットプレーン用の符号化単位の生成
    を含み、該部分ビットプレーンが予測重要度モード、洗
    練モード、及び予測非重要度モードより成るモード群か
    ら選択されたモードにあり、前記符号化単位候補の符号
    化がJPEG2000VM2による符号化単位の符号化
    を含むことを特徴とする請求項1に記載の方法。
  13. 【請求項13】 終了判定基準の設定を含むことを特徴
    とする請求項1に記載の方法。
  14. 【請求項14】 LIP、LSP、及びLISのそれぞ
    れの構成要素毎に符号化単位を生成し、該符号化がさら
    に前記LIS,LIP及びLSPの縦覧とSPIHTに
    よる前記符号化単位の符号化をさらに含むことを特徴と
    する請求項1に記載の方法。
  15. 【請求項15】 前記視覚的重要度の決定は、予測重要
    度モードの場合sk=31/2・2-n k、洗練モードの場合
    k=1・2-n k、予測非重要度モードの場合sk=(0.
    96)1/2・2-n k(nkは現符号化層)に従って符号化
    単位候補毎に重要度skを決定することを特徴とする請
    求項1に記載の方法。
  16. 【請求項16】 前記重要度の決定は、非重要画素のリ
    スト(LIP)と重要画素リスト(LSP)と非重要セ
    ットのリスト(LIS)の特定と、該LIS,LIP及
    びLSPの縦覧を含み、LIS要素の場合sk=1.9・
    -n k、LIP要素の場合sk=31/2・2-n k、LSP要
    素の場合sk=1・2-n k(nkは符号化単位の符号化
    層)に従って符号化単位の重要度を決定することを特徴
    とする請求項1に記載の方法。
  17. 【請求項17】 前記視覚的重要度の決定は、前記重要
    度に符号化単位の重みを乗ずる処理を含むことを特徴と
    する請求項1に記載の方法。
  18. 【請求項18】 符号化単位の前記重みは、符号化単位
    が1つのサブバンドに存在する場合は該符号化単位の存
    在するサブバンドの重みであり、該符号化単位が1つの
    サブバンドを占有している場合は該符号化単位の存在す
    る全てのサブバンドの重みの総計であることを特徴とす
    る請求項17に記載の方法。
  19. 【請求項19】 1組のアクティブな重みの前記割り当
    ては、前記符号化単位が1つのサブバンドに存在する場
    合は該符号化単位の重みを該符号化単位の存在するサブ
    バンドの重みに設定し、該符号化単位が1つのサブバン
    ドを占有している場合は該符号化単位の重みを該符号化
    単位の存在する全てのサブバンドの最大重みに設定する
    ことを特徴とする請求項17に記載の方法。
  20. 【請求項20】 前記視覚的重みの決定は、視距離の設
    定とJonesの技法によりなされるCSFの重みの決定と
    を含むことを特徴とする請求項1に記載の方法。
  21. 【請求項21】 前記符号化単位候補の符号化は、符号
    化単位に割り当てた前記視覚的重要度に従う符号化の順
    番の決定を含むことを特徴とする請求項1に記載の方
    法。
  22. 【請求項22】 画像を1組の変換係数に変換し、各変
    換係数が複数のビットを含み、該複数のビットの少なく
    とも1ビットが1符号化単位であり、前記変換係数の組
    を各バンドが各々同一の視覚特性を有する変換係数群を
    含む複数バンドに分割し、各バンドに1組のアクティブ
    な重みを割り当て、前記符号化単位が存在するバンドに
    割り当てられた前記アクティブな重みを各符号化単位の
    重要度に乗じることにより各符号化単位に対する視覚的
    重要度を決定し、視覚的重要度の降順で前記符号化単位
    を符号化し、重み更新間隔に達するまで前記アクティブ
    な重みを更新し、終了条件が満たされた時にプロセスを
    終了することを特徴とする画像の視覚的プログッレシブ
    コーディング方法。
  23. 【請求項23】 前記変換は、1変換係数の1ビットを
    1符号化単位として使用し、さらに前記変換後に全体的
    な視覚重みwgを設定し、前記符号化は、RDEによっ
    て符号化し、初期しきい値γ=γ0を設定し、バンドし
    きい値γ′I=γ2/wi 2を計算し、前記バンドしきい値
    γ′Iを越える重要度の前記符号化単位を符号化し、符
    号化単位の重要度をRDEにより決定し、全てのバンド
    と全ての係数をスキャンし、しきい値γをαの係数で減
    じる(γ←γ/α)ことを特徴とする請求項18に記載
    の方法。
  24. 【請求項24】 終了判定基準の設定を含むことを特徴
    とする請求項22に記載の方法。
  25. 【請求項25】 前記重要度の決定は、予測重要度モー
    ドの場合sk=31/2・2-n k、洗練モードの場合sk=1
    ・2-n k、予測非重要度モードの場合sk=(0.96)
    1/2・2-n k(nkは現符号化層)に従って符号化単位候
    補毎に重要度S kを決定することを特徴とする請求項2
    2に記載の方法。
  26. 【請求項26】 前記重要度の決定は、非重要画素のリ
    スト(LIP)、重要画素リスト(LSP)、及び非重
    要セットのリスト(LIS)の特定と、該LIS,LI
    P及びLSPの縦覧とを含み、前記符号化単位の重要度
    をLIS要素の場合Sk=1.9・2-n k、LIP要素の
    場合Sk=31/2・2-n k、LSP要素の場合Sk=1・2
    -n k(nkは符号化単位の符号化層)に従って決定するこ
    とを特徴とする請求項22に記載の方法。
JP11402899A 1998-03-19 1999-03-16 画像の視覚的プログレッシブ符号化方法 Expired - Fee Related JP3792067B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US7878198P 1998-03-19 1998-03-19
US09/252245 1999-01-28
US09/252,245 US6327392B1 (en) 1999-01-28 1999-01-28 Method of visual progressive coding
US60/078781 1999-01-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004223414A Division JP2005020768A (ja) 1998-03-19 2004-07-30 画像の視覚的プログレッシブ符号化方法

Publications (2)

Publication Number Publication Date
JP2000041249A true JP2000041249A (ja) 2000-02-08
JP3792067B2 JP3792067B2 (ja) 2006-06-28

Family

ID=26760930

Family Applications (2)

Application Number Title Priority Date Filing Date
JP11402899A Expired - Fee Related JP3792067B2 (ja) 1998-03-19 1999-03-16 画像の視覚的プログレッシブ符号化方法
JP2004223414A Pending JP2005020768A (ja) 1998-03-19 2004-07-30 画像の視覚的プログレッシブ符号化方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2004223414A Pending JP2005020768A (ja) 1998-03-19 2004-07-30 画像の視覚的プログレッシブ符号化方法

Country Status (3)

Country Link
EP (1) EP0944262B1 (ja)
JP (2) JP3792067B2 (ja)
DE (1) DE69943154D1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002064710A (ja) * 2000-05-26 2002-02-28 Eastman Kodak Co 増加する視覚品質レベルに対応して階層へ編成された圧縮ディジタル画像を生成する方法及びこのような圧縮ディジタル画像のレートを制御する方法
JP2003534734A (ja) * 2000-05-25 2003-11-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビットプレーンに依存する信号圧縮方法
US7613352B2 (en) 2003-12-26 2009-11-03 Mega Chips Lsi Solutions Inc. Compression encoder
JP2019165383A (ja) * 2018-03-20 2019-09-26 日本放送協会 帯域制限装置、帯域制限量制御装置、及びプログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2816154A1 (fr) * 2000-10-31 2002-05-03 Canon Kk Insertion d'information supplementaire dans des donnees numeriques
CN100391250C (zh) * 2002-08-20 2008-05-28 联发科技股份有限公司 渐进式联合图像专家组解码装置及方法
JP2007295503A (ja) * 2006-04-26 2007-11-08 Sios Technology Inc 階層符号化方法を用いた画像圧縮方法及び画像圧縮装置
US7813564B2 (en) * 2007-03-30 2010-10-12 Eastman Kodak Company Method for controlling the amount of compressed data

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2305829B (en) * 1994-09-20 1997-10-22 Ricoh Kk A coder

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003534734A (ja) * 2000-05-25 2003-11-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビットプレーンに依存する信号圧縮方法
JP2002064710A (ja) * 2000-05-26 2002-02-28 Eastman Kodak Co 増加する視覚品質レベルに対応して階層へ編成された圧縮ディジタル画像を生成する方法及びこのような圧縮ディジタル画像のレートを制御する方法
JP4554844B2 (ja) * 2000-05-26 2010-09-29 イーストマン コダック カンパニー 増加する視覚品質レベルに対応して階層へ編成された圧縮ディジタル画像を生成する方法及びこのような圧縮ディジタル画像のレートを制御する方法
US7613352B2 (en) 2003-12-26 2009-11-03 Mega Chips Lsi Solutions Inc. Compression encoder
JP2019165383A (ja) * 2018-03-20 2019-09-26 日本放送協会 帯域制限装置、帯域制限量制御装置、及びプログラム

Also Published As

Publication number Publication date
EP0944262A2 (en) 1999-09-22
JP3792067B2 (ja) 2006-06-28
DE69943154D1 (de) 2011-03-10
EP0944262B1 (en) 2011-01-26
JP2005020768A (ja) 2005-01-20
EP0944262A3 (en) 2004-01-28

Similar Documents

Publication Publication Date Title
US6327392B1 (en) Method of visual progressive coding
US7916961B2 (en) Compression encoder, compression encoding method and program
US6256415B1 (en) Two row buffer image compression (TROBIC)
JP3659353B2 (ja) ビデオ画像符号化方法
JP4273996B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
EP2270717B1 (en) Method and apparatus for decoding images
US7792376B2 (en) Compression encoder, compression encoding method and program
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
Sanchez et al. Prioritized region of interest coding in JPEG2000
JP2000511366A6 (ja) 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法
Sprljan et al. Modified SPIHT algorithm for wavelet packet image coding
WO1999017257A2 (en) System and method for compressing images using multi-threshold wavelet coding
JP3597779B2 (ja) 画像を圧縮及び圧縮解除する方法及び装置
JP3792067B2 (ja) 画像の視覚的プログレッシブ符号化方法
Zandi et al. CREW lossless/lossy medical image compression
Li Visual progressive coding
JP2004186902A (ja) 画像符号化装置及び方法、並びにプログラム及び記録媒体
KR20020055864A (ko) 칼라 정지영상의 부호화 및 복호화 방법
JP2004350034A (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
Kumar et al. A survey of contemporary medical image compression techniques
Hemami Image Compression—A Review
Zheng et al. Wavelet coding of image using quadtree representation and block entropy coding
Mandal Digital image compression techniques
Tsai Stack-Run-End compression for low bit rate color image communication
KR20000060518A (ko) 영상 압축 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040730

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050826

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060404

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090414

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees