JP2007142499A - 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 - Google Patents

画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2007142499A
JP2007142499A JP2005329271A JP2005329271A JP2007142499A JP 2007142499 A JP2007142499 A JP 2007142499A JP 2005329271 A JP2005329271 A JP 2005329271A JP 2005329271 A JP2005329271 A JP 2005329271A JP 2007142499 A JP2007142499 A JP 2007142499A
Authority
JP
Japan
Prior art keywords
coding
image
quantization
post
pass
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005329271A
Other languages
English (en)
Other versions
JP4327789B2 (ja
Inventor
Takayuki Nakachi
孝之 仲地
Yoshihide Tonomura
喜秀 外村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005329271A priority Critical patent/JP4327789B2/ja
Publication of JP2007142499A publication Critical patent/JP2007142499A/ja
Application granted granted Critical
Publication of JP4327789B2 publication Critical patent/JP4327789B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】動画圧縮時におけるフリッカー雑音を抑制する。
【解決手段】本発明は、原画像が入力されると、該画像に対してウェーブレット変換を行うことにより該画像をサブバンドに帯域分割し、ウェーブレット係数を補正するために量子化を行い、サブバンドをコードブロックに分割し、コードブロックに対してウェーブレット係数のビットプレーンに基づく係数ビットモデリングを行い、符号化パスに分解し、符号化パスに対して、算術符号化を行い、符号化パスの一部を廃棄し、残った符号化パスからビットストリームを生成し、出力する。
【選択図】図1

Description

本発明は、画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体に係り、特に、高い主観画質を保持し、かつ、効率的に伝送・蓄積するための画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体に関する。
フレーム毎に独立に符号化を行うフレーム内符号化は、MPEG4(例えば、非特許文献1参照)、H264(例えば、非特許文献2参照)等の時間方向の相関を利用したフレーム間符号化と比較して符号化効率は劣るものの、編集・加工が容易、ランダムアクセスが容易、エラー伝播が小さい、演算量が少ないなどの利点を有する。代表的なフレーム内符号化であるMotion JPEG2000(例えば、非特許文献3参照)は、これらフレーム内符号化の特性に加え、ブロックノイズ歪みが生じない、空間・SNRスケーラビリティ機能などMotion JPEG2000固有の優れた特徴を持つ。ハリウッドの7大メジャースタジオにより構成されるDCI(Digital Cinema Initiativies, LLC:例えば、非特許文献4参照)は、ディジタルシネマの符号化方式としてMotion JPEG2000を採用している(例えば、非特許文献5参照)。
しかしながら、Motion JPEG2000には、Flicker Artifact(フリッカー雑音)と呼ばれる固有の雑音が生じることが確認されている(例えば、非特許文献6,7,8,9参照)。これは、復号画像で知覚される細かいリンギング状の雑音である。この歪みは、静止画では目立たないが、動画像ではその大きさと位置がフレーム毎に変化するため、時間方向の歪みが発生し、視覚的に検知し易くなる。このフリッカー雑音の発生要因として、以下の2つの点が指摘されている。
(a)高周波数帯域ウェーブレット係数の量子化に伴うエリアジング雑音(例えば、非特許文献6参照)
(b)EBCOT(Embedded Block Coding with Optimized Truncation)ポスト量子化による誤差分布の空間的変動(例えば、非特許文献7参照)
(a)は、ウェーブレット変換固有の性質に起因するもので、サブバンド分割・合成において、高域分割領域で発生した量子化ノイズが、低域分割領域に折り返すことによるエリアジング雑音の一種である。特に、物体が移動する際のエッジ付近で視覚的に検知し易くなる。この歪みの低減に関しては、人間の視覚感度特性CSF(Contrast Sensitivity Function)によるウェーブレット係数の補正が有効であることがJPEG2000のWG1のコア実験において確認されている。
一方、(b)は、EBCOTのポスト量子化に起因するものである。EBCOTでは、ポスト量子化をMSE最小化規模で行うのが一般的である。この規範によればMSEは最小となる。しかしながら、その一方で、ポスト量子化によるレート制御ではコードブロック毎に符号化された符号化パスの数に開きが生じ、空間的な画質変動を伴い、主観画質を低下させる。この歪みは(a)とは逆に、静止領域においてよく検知される。非特許文献7では、(a)と(b)の比較検討を行っており、ポスト量子化の方がフリッカー雑音へ与える影響が大きいと報告されている。しかし、その具体的な解決方法は示されていない。非特許文献8では、時間方向の輝度値の変化を抑制するために、前後のフレームで係数を比較し、異なる場合には係数値を一致させる方法を提案している。しかし、この方法では原画の輝度値の変換に追従できない。また、非特許文献9では、現画像の輝度値の変換に追従できるよう非特許文献8の方法を改良した方法を提案しているが、その一方で動画像領域の画質が劣化する。また、両手法ともポスト処理による改善である。
三木弼一編著、"MPEG-4のすべて"工業調査会 角野眞也、菊池義浩、鈴木輝彦、大久保榮、"H.264/AVC教科書"、インプレス ISO/IEC 15444-3, "Information technology‐JPEG2000 image coding system‐part 3: Motion JPEG 2000," 2002 Digital Cinema Initiatives, LLC, <http://www.dcimovies.com> Digital Cinema Initiatives, LLC, "Digital cinema system specification v1.0," July 20, 2005 久下哲郎、"Wavelet画像符号化の視覚的歪みに関する考察、"映像情報メディア学会技術報告、vol. 25, no. 79, pp.33-38, HIR2001-97, Nov. 2001 加藤徹洋、田邉集、渡辺裕、富永英義、"Motion JPEG200におけるフリッカー雑音と量子化誤差の関係について、"第2回情報科学技術フォーラム FIT2003, J-039、Sep. 2003 A. Becker, W. chan, and D. Poulouin, "Flicker reduction in intraframe codecs, "Proc. IEEE data compression conference, Mar. 2004, pp.252-261 伊谷裕介、石川孝明、渡辺裕、富永英義、"Motion JPEG2000におけるフリッカー低減手法の検討、"信学会総合大会、D-II-61, Mar. 2005
上記のように、EBCOTポスト量子化によるJPEG2000レート制御では、MSEは最小となるものの、フリッカー雑音が発生する。この問題を解決すべく提案された従来方式では、ポスト処理によるもので根本的問題は解決されていない。そこで、フリッカー雑音が発生する根本的原因を解決する方式が必要とされている。
また、前処理やポスト処理を必要とせず、JPEG2000互換であることが望ましい。
本発明は、上記の点に鑑みなされたもので、JPEG2000互換でフリッカー雑音を抑制し得るJPEG2000のレート制御手法による画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体を提供することを目的とする。
図1は、本発明の原理構成図である。
本発明(請求項1)は、動画圧縮時に発生するフリッカー雑音を軽減するための画像符号化装置であって、
原画像が入力されると、該画像に対してウェーブレット変換を行うことにより該画像をサブバンドに帯域分割するウェーブレット変換手段110と、
ウェーブレット変換のウェーブレット係数を補正するために量子化を行う量子化手段111と、
サブバンドをコードブロックに分割するコードブロック分割手段112と、
コードブロックに対してウェーブレット係数のビットプレーンに基づく係数ビットモデリングを行い、符号化パスに分解する係数ビットモデリング手段113と、
符号化パスに対して、算術符号化を行う算術符号化手段114と、
符号化パスの一部を廃棄するポスト量子化手段115と、
ポスト量子化手段115の出力からビットストリームを生成し、出力するパケット化手段116と、
を有し、
ポスト量子化手段115は、
切捨て数設定方式として、各コードブロックで廃棄する符号化パスの数を、解像度レベル、サブバンド、色成分毎に一定とする方式を用いる。
また、本発明(請求項2)は、ポスト量子化手段115において、
切捨て数設定方式として、
「現フレームで廃棄する符号化パスの数を前フレームと同じく設定したときのビットレートと所望のビットレートの差が十分小さい」という条件、及び、「現フレームで廃棄する符号化パスの数を前フレームと同じく設定したときのビットレートと前フレームのビットレートの差が十分小さい」という条件の両方を満たすとき、現フレームで廃棄する符号化パスの数を前フレームと同じく設定することを、引き続く時間方向に対して適用する、方式を用いる。
また、本発明(請求項3)は、ポスト量子化手段115において、
原画像の領域についてブロック単位に静止領域か動領域かの判定を行う手段を有し、
切捨て数設定方式として、
静止領域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、
動領域の符号化パスについては、MSE(Mean Squared Error)を最小規範とするEBCOT(Embedded Block Coding with Optimized Truncation)を用いて符号化する、方式を用いる。
また、本発明(請求項4)は、ポスト量子化手段115において、
ウェーブレット変換手段110における帯域分割結果に基づいて、高周波帯域または、低周波数帯域かを判定し、
切捨て数設定方式として、
高周波数帯域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、
低周波数帯域の符号化パスについては、MSEを最小規範とするEBCOTを用いる、方式を用いる。
本発明(請求項5)は、コンピュータを、請求項1乃至4記載の画像符号化装置として機能させる画像符号化プログラムである。
本発明(請求項6)は、コンピュータを、請求項1乃至4記載の画像符号化装置として機能させるプログラムを格納したコンピュータ読み取り可能な記録媒体である。
上記のように本発明によれば、Motion JPEG2000に固有のフリッカー雑音を軽減するために、JPEG2000のレート制御を行うポスト量子化において、各コードブロックで廃棄する符号化パスの数を、解像度レベル、サブバンド、色成分毎に、一定とすることにより、前処理やポスト処理を必要とせず、JPEG2000互換でフリッカー雑音を抑制し得るJPEG2000の符号化データを生成することが可能となる。再生画像品質の良い符号化ができ、少ないディスク容量での保存・伝送が可能となる。
また、Motion JPEG2000のフリッカー雑音が静止領域で目立ち、動領域では目立たない人間の視覚特性を利用して、静止領域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、動領域の符号化パスについては、MSEを最小規範とするEBCOTを用いて符号化することにより、ビットレート制御が粗くなってしまう問題、及び、SNRが低下する問題を解決することができる。
また、フリッカー雑音に大きな影響を与える高周波数帯域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、フリッカー雑音にあまり影響を与えない低周波数帯域の符号化パスについては、MSEを最小規範とするEBCOTを用いることにより、ビットレート制御が粗くなってしまう問題、及びSNRが低下する問題を解決することができる。
以下、図面と共に本発明の実施の形態を説明する。
[第1の実施の形態]
図2は、本発明の第1の実施の形態におけるJPEG2000符号化器の構成図である。
同図に示すJPEG2000符号化器は、ウェーブレット変換部110、量子化部111、コードブロック分割部112、係数ビットモデリング部113、算術符号化部114、符号化パス切捨て部115、パケット化部116から構成される。
JPEG2000では、低ビットレートでの画像保持、解像度スケーラビリティ実現の容易さからウェーブレット変換(ウェーブレット変換器110)を用いる。分割方法は、1次元ウェーブレット変換を画像の縦横各方向に独立に施すことで画像を4つのサブバンドに帯域分割し、最低周波数帯域を再帰的に4バンドに分割するMallat分割を用いる。このような動作を行うウェーブレット変換器110では、低域から高域へ順次復号する仮定で解像度の異なる画像を容易に得ることができる。
次に、量子化部111は、ウェーブレット係数を必要に応じて量子化し、コードブロック分割部112は、EBCOT(Embedded Block Coding with Optimized Truncation)アルゴリズムによりサブバンドを符号化する。EBCOTアルゴリズムは、各サブバンドをコードブロックと呼ばれる正方形のブロック(例えば、64×64)に分割する。これらのコードブロックは、それぞれ独立に符号化される。
係数ビットモデリング部113は、各コードブロックについて、ウェーブレット係数のビットプレーンに基づく係数ビットモデリングを行うことで、MSB(Most Significant Bit)からLSB(Least Significant Bit)までの全てのビットプレーンは、それぞれのコンテクストに応じて、図3に示すように3つの符号化パス(significance, magnitude refinement, cleanup)に分解される。
次に、算術符号化部114は、係数モデリングにより生成されたエンベデット符号列に対して、算術符号化を施す。
全体のビットレート制御は、図4に示すように、符号化パス切捨て部115において符号化パスの切捨て、即ち、ポスト量子化により行われる。また、必要に応じてレイヤという単位にグループ分けされる。
最後にパケット化部116において、ヘッダ情報などを付加したものが、JPEG2000ビットストリームとなる。
JPEG2000ではビットレート制御を、
1)ウェーブレット係数の量子化;
2)ポスト量子化;
の2箇所で行っている。フリッカー雑音はこれらのビットレート制御手法と密接な関係がある。
1)ウェーブレット係数の量子化:
ウェーブレット係数は、次式により量子化される。
qb(u,v)= sing(ab(u,v))floor(|ab(u,v)/△b|)
ここで、bはサブバンド、(u,v)は空間座標、a(u,v)は量子化前のウェーブレット係数、q(u,v)は量子化後のウェーブレット係数、△bは量子化ステップサイズ、sing(・)は符号演算子、floor(・)は切り捨て演算子を表す。量子化ステップサイズの決定方法には、ImplictとExplicitの2種類がある。ここでは詳細は省略する。この量子化に伴うフリッカー雑音は、サブバンド分割・合成において、高域分割領域で発生した量子化ノイズが、低域分割領域に折り返すことによるもので、エリアジング雑音の一種である。動画像では、発生するエリアジング信号の位相がフレーム毎に変化するため、視覚的に検知し易くなる。特に、物体が移動する際のエッジ付近で顕著となる。この歪みの低減に関しては、人間の視覚感度特性CSFによるウェーブレット係数の補正が有効であることがJPEG2000のWG1のコア実験において確認されている。
2)ポスト量子化:
ポスト量子化(符号化パス切捨て部115)では、コードブロック毎に生成された算術符号化のそれぞれ一部を切り捨てることによりレート制御を行う。切捨ての基準に関しては詳細が定められておらず符号器に依存するが、EBCOTではMSE最小化規範で行うのが一般的である。この規範によればMSEは最小となるが、コードブロック毎に符号化された符号化パスの数に開きが生じ、これが2のべき乗のオーダーで量子化誤差に反映される結果、空間的な画質変動を伴い主観画質を低下させる。
本実施の形態では、フリッカー雑音を軽減するために、空間的な画質変動を抑制する方法を提案する。空間的な画質変動を抑制する従来法として、文献「S. Naito, A. Koike, and S. Matsumoto, “Optimal JPEG2000 encoder mechanism for low delay and efficient distribution of HDTV programs,” IEEE ICASSP2004, vol. V, pp.81-84, May 2004」では、符号化パスの切捨て数を、全てのコードブロックにおいて、一定とする方式を提案している。即ち、隣接するコードブロック間で符号化パス数が一定となり、空間的な誤差のバラツキが抑制されることになる。この方法は、本来フリッカー雑音を抑制する目的で提案されたものではないが、主観評価実験の結果、フリッカー雑音が抑制されていることが確認された。しかしながら、符号化パスの切捨て数が全コードブロックで一定であることから、MSE規範に基づくEBCOTと比較してPSNRが低下する。なぜなら、誤差はサブバンド、ウェーブレット分割レベル、コンポーネントに依存して異なるためである。例えば、LLとHLサブバンドでは、同じ量子化を行っても復号画像に与える影響は異なる。ここでは、空間的な画質変動を抑制するために同一サブバンドないでは符号化パスの切捨て数を一定としつつ、PSNRの低下を抑えるためにサブバンド間では異なる符号化パスの切捨て数を割り当てるように設計する。具体的には、切り捨てた際の誤差エネルギーが一定となるように各サブバンドの符号化パスの切捨て数を決定する。
ここで、サブバンドs、ウェーブレット分割レベルr、コンポーネントcのコードブロックにおいて、LSBからm番目のビットプレーンまで破棄したときの復号画像の誤差エネルギーをer,s,c(m)と定義する。このとき、破棄するビットプレーン数をサブバンド間で変化させ、誤差エネルギーが一致する組み合わせを見つける。その際に、CSF、周波数重み、ウェーブレットフィルタゲインを考慮に入れて計算する。得られた結果は記憶手段のテーブル(図示せず)に保存し、符号化パス切捨て部115が符号化の際に参照する。テーブルの作成法はいくつか考えられるが、一例を以下に示す。
図5は、本発明の第1の実施の形態における符号化パス切り捨て部で参照するテーブルの作成方法のフローチャートである。
ステップ101) 初期値をb=0と設定する。
ステップ102) コンポーネント0、解像度レベル1、サブバンドLLのコードブロックに対して、誤差エネルギーeLL,1,0(b)を計算する。
ステップ103) 与えられた全ての(r,s,c)パラメータの組み合わせに対して、
Figure 2007142499
Figure 2007142499
が最小となる
Figure 2007142499
を見つける。
ステップ104) bの値を1つ増加させる。
ステップ105) b∈(0,…,30)の全てのビットプレーンについて処理が終了するまでステップ102〜ステップ104の処理を繰り返す。
ステップ106) 取得したビットプレーンに対する組み合わせ(r,s,c)をテーブルに格納する。
以上の計算により、b∈(0,…,30)の各ビットプレーンに対する(r,s,c)の組み合わせが得られる。この計算はオフラインで行い、テーブルとして記憶手段に保存し符号化時に参照する。これらの組み合わせパターンは、画像の特性に依存せず、解像度レベル、ウェーブレットフィルタ、CSF関数にのみ依存する。
なお、符号化の際には、EBCOTと同様に、significance, magnitude refinement, cleanupの3つの符号化パス単位で符号化を行う。符号化パス切捨て部115において、各サブバンドの切捨てビットプレーンは、符号化パスを固定した上で、テーブル(図示せず)を参照して求める。例えば、LLサブバンドの切捨て点がb=3のcleanupパスであり、テーブルより参照したHHサブバンドのビットプレーンがb=4であった場合、HHサブバンドの切捨て点は、b=4のcleanupパスとなる。符号化の際には、符号化パス切捨て数mを一つずつ増加させ、所望のレート条件に達すると終了する。以上の手法により、空間的な画質変動を抑制しつつ、客観的PNSRを改善することが可能となる。
[第2の実施の形態]
本実施の形態は、第1の実施の形態で述べた空間的な画質変動を抑制する方法を、フリッカー雑音を抑制すべく、時間方向へ拡張する。
画像の特性は連続するフレーム間で異なることから、必要なビット割当量も変化する。ここでは、以下の2つの条件を満たすとき、符号化パス切捨て部115において、現フレームの符号化パスの切捨て数を前フレームと同じ値に設定し、符号化を行う。
条件1: |r −t|<δt
条件2: |r −tn−1 |<2δt
ここで、nは現フレーム番号、tは現フレームの所望ビットレート、pは前フレームの符号化パスの切捨て数、r はpを現フレームに適用した際のビットレートを表す。δは条件の許容幅を設定するパラメータであり、シーケンス毎に最適化できるが本実施の形態では0.1と設定している。条件1は、所望ビットレートが大きく変化した場合を表している。条件2は連続するフレーム間で画像特性が大きく変化した場合を表しており、わずかなビットレートの変動は許容している。上記の2つの条件を満たさない場合には、前フレームとは独立に第1の実施の形態の手法を用いて符号化する。
なお、インターフレーム拡張において必要なバッファは、前フレームでの符号化パスの切捨て数pとビットレートrn−1 を記憶するのに必要なバッファ分となる。この方法は、時間方向の画質変動を抑制することから、フリッカー雑音の低減に効果的である。
[第3の実施の形態]
本実施の形態では、
1)レートの制御の高精細化;
2)PSNRの向上:
を実現するために、第1の実施の形態とEBCOTを組み合わせたハイブリッド法を提案する。その実現のために、主観画質実験により得られた“フリッカー雑音が静止領域において顕著に検知され、動画領域ではさほど目立たない”特性を利用する。即ち、符号化パス切捨て部115では、静止領域においては第1の実施の形態、即ち、時間方向に連続する同位置のコードブロックにおける符号化パスの切捨て数を同じ値に設定し、符号化する。一方、動領域において、フリッカー雑音は動きによってマスキングされ目立たないことから、EBCOTによって符号化する。その結果、フリッカー雑音を抑制しつつPSNRの向上と詳細なビットレート制御が実現できる。
静止領域か動領域かの判定は、原画像領域で、ブロック単位で行う。ここでは、時間方向に連続する同位置のブロック間の差分をとり、十分小さい場合は静止領域、それ以外は動領域とするシンプルな判定基準を用いる。図6に示すように、その判定結果をサブバンド領域のコードブロックへマッピングすることにより、静止領域と動領域に分類する。
図7は、本発明の第3の実施の形態における符号化パス切捨て部の動作のフローチャートである。
ステップ301) 処理対象のフレームが第1フレーム(全コードブロックが動領域と判定されたフレーム)の場合は、ステップ302に移行し、そうでない場合はステップ303に移行する。
ステップ302) 第1フレームの場合は、第1の実施の形態の手法により符号化し、ステップ306に移行する。
ステップ303) 全てのコードブロックに対して第2の実施の形態の手法を適用する。得られた符号化パスの切捨て数pを当該符号化パス切捨て部115のバッファに保存する。
ステップ304) (動領域のコードブロックに対してのみではなく)すべてのコードブロックに対してEBCOTを適用する。得られた最適なRD曲線閾値sをバッファに保存する。
ステップ305) 上記のステップ303、ステップ304で得られた符号化パスの切捨て数pと最適なRD曲線閾値sを用いて、静止領域と動領域をそれぞれ符号化する。
ステップ306) 符号化するフレームがある場合には、ステップ301へ移行し、全フレームを符号化した場合は終了する。
本実施の形態による手法では、第2の実施の形態の手法の符号化パスの切捨て数とEBCOTのRD曲線閾値を独立に最適化している。その理由の一つには、計算量の削減がある。Pを符号化パス数の集合、SをRD曲線閾値の集合とすると、演算量は、同時最適化を行った場合にO(P×N)となるのに対して、本実施の形態の手法では、O(P)+O(N)となる。グローバルな最適解を得るためには同時最適化が必要となるが、独立に最適化した際に、低下する符号化効率の割合はそれほど大きくはないと考えられる。なぜなら、第2の実施の形態の手法によるレート制御幅は、EBCOTと比較するとかなり粗いことから、RD最適解の観点から、静止領域に対して割り当てられるビット数はかなり多いか少ないかのいずれかである。従って、大抵の場合、第2の実施の形態の符号化パスの切捨て数は同時最適化で求めた場合と一致すると考えられる。
[第4の実施の形態]
本実施の形態では、
1)レート制御の高精細化;
2)PSNRの向上:
を第3の実施の形態とは異なる手法で改善する。
第1の実施の形態とEBCOTを組み合わせたハイブリッド法であるという点は同じであるが、これらを切り換える基準が異なる。ここでは、主観画質実験により得られた“高周波数帯域はフリッカー雑音と大きな相関があり、低周波数帯域はフリッカー雑音との相関が小さい”性質を利用する。即ち、符号化パス切捨て部115では、高周波数帯域においては第1の実施の形態、即ち、時間方向に連続する同位置のコードブロックにおける符号化パスの切捨て数を同じ値に設定し、符号化する。一方、低周波数帯域は、EBCOTによって符号化する。その結果、フリッカー雑音を抑制しつつPSNRの向上と詳細なビットレート制御が実現できる。主観評価結果では、一例としてウェーブレット分割レベル=5のとき、4,5レベルの高周波数帯域は第1の実施の形態の手法、1−3レベルの低周波数帯域はEBCOTを用いると、PSNRを高く保持したまま、フリッカー雑音を抑制することを確認している。この方法は、第3の実施の形態のように動き検出の必要がないことから、少ない演算量で同じ程度の効果を得ることができる特徴がある。
なお、上記の第3の実施の形態と第4の実施の形態は、互いに素の関係であることから、両方式を同時に実現することも可能である。その際には、さらなるPSNRの向上と詳細なビットレート制御が実現できる。
また、図2に示す画像符号化装置の上記の第1〜第4の実施の形態の動作をプログラムとして構築し、コンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムを、ハードディスク装置に格納する、または、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納してコンピュータにインストールして実行させる、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、画像の符号化技術に適用可能である。
本発明の原理構成図である。 本発明の第1の実施の形態におけるJPEG2000符号化器の構成図である。 本発明の第1の実施の形態における3つの符号化パスによるビットプレーン符号化を示す図である。 本発明の第1の実施の形態におけるポスト量子化(符号化パスの切捨て)を示す図である。 本発明の第1の実施の形態における符号化パス切捨て部で参照するテーブルの作成方法のフローチャートである。 本発明の第3の実施の形態における原画像領域での動き検出とサブバンド領域へのマッピングを示す図である。 本発明の第3の実施の形態における符号化パス切捨て部の動作のフローチャートである。
符号の説明
110 ウェーブレット変換手段、ウェーブレット変換部
111 量子化手段、量子化部
112 コードブロック分割手段、コードブロック分割部
113 係数ビットモデリング手段、係数ビットモデリング部
114 算術符号化手段、算術符号化部
115 ポスト量子化手段、符号化パス切捨て部
116 パケット化手段、パケット化部

Claims (6)

  1. 動画圧縮時に発生するフリッカー雑音を軽減するための画像符号化装置であって、
    原画像が入力されると、該画像に対してウェーブレット変換を行うことにより該画像をサブバンドに帯域分割するウェーブレット変換手段と、
    前記ウェーブレット変換のウェーブレット係数を補正するために量子化を行う量子化手段と、
    前記サブバンドをコードブロックに分割するコードブロック分割手段と、
    前記コードブロックに対して前記ウェーブレット係数のビットプレーンに基づく係数ビットモデリングを行い、符号化パスに分解する係数ビットモデリング手段と、
    前記符号化パスに対して、算術符号化を行う算術符号化手段と、
    符号化パスの一部を廃棄するポスト量子化手段と、
    前記ポスト量子化手段の出力からビットストリームを生成し、出力するパケット化手段と、
    を有し、
    前記ポスト量子化手段は、
    前記切捨て数設定方式として、各コードブロックで廃棄する符号化パスの数を、解像度レベル、サブバンド、色成分毎に一定とする方式を用いる、
    ことを特徴とする画像符号化装置。
  2. 前記ポスト量子化手段は、
    前記切捨て数設定方式として、
    「現フレームで廃棄する符号化パスの数を前フレームと同じく設定したときのビットレートと所望のビットレートの差が十分小さい」という条件、及び、「現フレームで廃棄する符号化パスの数を前フレームと同じく設定したときのビットレートと前フレームのビットレートの差が十分小さい」という条件の両方を満たすとき、現フレームで廃棄する符号化パスの数を前フレームと同じく設定することを、引き続く時間方向に対して適用する、方式を用いる
    請求項1記載の画像符号化装置。
  3. 前記ポスト量子化手段において、
    原画像の領域についてブロック単位に静止領域か動領域かの判定を行う手段を有し、
    前記切捨て数設定方式として、
    静止領域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、
    動領域の符号化パスについては、MSE(Mean Squared Error)を最小規範とするEBCOT(Embedded Block Coding with Optimized Truncation)を用いて符号化する、方式を用いる
    請求項1または、2記載の画像符号化装置。
  4. 前記ポスト量子化手段は、
    前記ウェーブレット変換手段における帯域分割結果に基づいて、高周波帯域または、低周波数帯域かを判定し、
    前記切捨て数設定方式として、
    高周波数帯域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、
    低周波数帯域の符号化パスについては、MSEを最小規範とするEBCOTを用いる、方式を用いる
    請求項1または、2記載の画像符号化装置。
  5. コンピュータを、
    請求項1乃至4記載の画像符号化装置として機能させることを特徴とする画像符号化プログラム。
  6. コンピュータを、
    請求項1乃至4記載の画像符号化装置として機能させるプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2005329271A 2005-11-14 2005-11-14 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 Active JP4327789B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005329271A JP4327789B2 (ja) 2005-11-14 2005-11-14 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005329271A JP4327789B2 (ja) 2005-11-14 2005-11-14 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2007142499A true JP2007142499A (ja) 2007-06-07
JP4327789B2 JP4327789B2 (ja) 2009-09-09

Family

ID=38204890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005329271A Active JP4327789B2 (ja) 2005-11-14 2005-11-14 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4327789B2 (ja)

Also Published As

Publication number Publication date
JP4327789B2 (ja) 2009-09-09

Similar Documents

Publication Publication Date Title
US6895050B2 (en) Apparatus and method for allocating bits temporaly between frames in a coding system
KR100781525B1 (ko) 가중 평균합을 이용하여 fgs 계층을 인코딩 및디코딩하는 방법 및 장치
US8498335B2 (en) Adaptive deadzone size adjustment in quantization
JP4704374B2 (ja) ビデオトランスコーディング方法及び装置
KR100772878B1 (ko) 비트스트림의 비트율 조절을 위한 우선권 할당 방법,비트스트림의 비트율 조절 방법, 비디오 디코딩 방법 및 그방법을 이용한 장치
CN104980742B (zh) 用于视频解码的设备
US20060104354A1 (en) Multi-layered intra-prediction method and video coding method and apparatus using the same
US20060120450A1 (en) Method and apparatus for multi-layered video encoding and decoding
JP5300921B2 (ja) 符号化および復号のための方法および装置
US20070116125A1 (en) Video encoding/decoding method and apparatus
WO2000079802A1 (en) Apparatus and method for optimizing the rate control for multiscale entropy encoding
JP4410245B2 (ja) ビデオをトランスコーディングする方法
US20050036549A1 (en) Method and apparatus for selection of scanning mode in dual pass encoding
KR20030020382A (ko) Fgs 강화층에 대한 활동-기반 주파수 가중을 위한 방법및 시스템
KR100843080B1 (ko) 비디오 트랜스코딩 방법 및 장치
KR20060119736A (ko) 영상 신호의 인코딩 방법
EP1585338B1 (en) Decoding method and decoding device
JP2006500849A (ja) スケーラブルなビデオエンコード
JP4762486B2 (ja) マルチ・リゾルーション・ビデオ符号化および復号化
JP4327789B2 (ja) 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体
Richter et al. Towards high-speed, low-complexity image coding: variants and modification of JPEG 2000
JP4153774B2 (ja) 動画像符号化方法とその復号化方法、およびそれらの装置
Ilgin DCT Video Compositing with Embedded Zerotree Coding for Multi-Point Video Conferencing
Wang Joint 3-D dynamic resolution conversion with rate-distortion for video coding
Ngan et al. 3D subband VLBR video coding scheme

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070615

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090324

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090609

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090611

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120619

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4327789

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130619

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140619

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350