JP2007142499A - 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 - Google Patents
画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2007142499A JP2007142499A JP2005329271A JP2005329271A JP2007142499A JP 2007142499 A JP2007142499 A JP 2007142499A JP 2005329271 A JP2005329271 A JP 2005329271A JP 2005329271 A JP2005329271 A JP 2005329271A JP 2007142499 A JP2007142499 A JP 2007142499A
- Authority
- JP
- Japan
- Prior art keywords
- coding
- image
- quantization
- post
- pass
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】本発明は、原画像が入力されると、該画像に対してウェーブレット変換を行うことにより該画像をサブバンドに帯域分割し、ウェーブレット係数を補正するために量子化を行い、サブバンドをコードブロックに分割し、コードブロックに対してウェーブレット係数のビットプレーンに基づく係数ビットモデリングを行い、符号化パスに分解し、符号化パスに対して、算術符号化を行い、符号化パスの一部を廃棄し、残った符号化パスからビットストリームを生成し、出力する。
【選択図】図1
Description
(b)EBCOT(Embedded Block Coding with Optimized Truncation)ポスト量子化による誤差分布の空間的変動(例えば、非特許文献7参照)
(a)は、ウェーブレット変換固有の性質に起因するもので、サブバンド分割・合成において、高域分割領域で発生した量子化ノイズが、低域分割領域に折り返すことによるエリアジング雑音の一種である。特に、物体が移動する際のエッジ付近で視覚的に検知し易くなる。この歪みの低減に関しては、人間の視覚感度特性CSF(Contrast Sensitivity Function)によるウェーブレット係数の補正が有効であることがJPEG2000のWG1のコア実験において確認されている。
三木弼一編著、"MPEG-4のすべて"工業調査会 角野眞也、菊池義浩、鈴木輝彦、大久保榮、"H.264/AVC教科書"、インプレス ISO/IEC 15444-3, "Information technology‐JPEG2000 image coding system‐part 3: Motion JPEG 2000," 2002 Digital Cinema Initiatives, LLC, <http://www.dcimovies.com> Digital Cinema Initiatives, LLC, "Digital cinema system specification v1.0," July 20, 2005 久下哲郎、"Wavelet画像符号化の視覚的歪みに関する考察、"映像情報メディア学会技術報告、vol. 25, no. 79, pp.33-38, HIR2001-97, Nov. 2001 加藤徹洋、田邉集、渡辺裕、富永英義、"Motion JPEG200におけるフリッカー雑音と量子化誤差の関係について、"第2回情報科学技術フォーラム FIT2003, J-039、Sep. 2003 A. Becker, W. chan, and D. Poulouin, "Flicker reduction in intraframe codecs, "Proc. IEEE data compression conference, Mar. 2004, pp.252-261 伊谷裕介、石川孝明、渡辺裕、富永英義、"Motion JPEG2000におけるフリッカー低減手法の検討、"信学会総合大会、D-II-61, Mar. 2005
原画像が入力されると、該画像に対してウェーブレット変換を行うことにより該画像をサブバンドに帯域分割するウェーブレット変換手段110と、
ウェーブレット変換のウェーブレット係数を補正するために量子化を行う量子化手段111と、
サブバンドをコードブロックに分割するコードブロック分割手段112と、
コードブロックに対してウェーブレット係数のビットプレーンに基づく係数ビットモデリングを行い、符号化パスに分解する係数ビットモデリング手段113と、
符号化パスに対して、算術符号化を行う算術符号化手段114と、
符号化パスの一部を廃棄するポスト量子化手段115と、
ポスト量子化手段115の出力からビットストリームを生成し、出力するパケット化手段116と、
を有し、
ポスト量子化手段115は、
切捨て数設定方式として、各コードブロックで廃棄する符号化パスの数を、解像度レベル、サブバンド、色成分毎に一定とする方式を用いる。
切捨て数設定方式として、
「現フレームで廃棄する符号化パスの数を前フレームと同じく設定したときのビットレートと所望のビットレートの差が十分小さい」という条件、及び、「現フレームで廃棄する符号化パスの数を前フレームと同じく設定したときのビットレートと前フレームのビットレートの差が十分小さい」という条件の両方を満たすとき、現フレームで廃棄する符号化パスの数を前フレームと同じく設定することを、引き続く時間方向に対して適用する、方式を用いる。
原画像の領域についてブロック単位に静止領域か動領域かの判定を行う手段を有し、
切捨て数設定方式として、
静止領域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、
動領域の符号化パスについては、MSE(Mean Squared Error)を最小規範とするEBCOT(Embedded Block Coding with Optimized Truncation)を用いて符号化する、方式を用いる。
ウェーブレット変換手段110における帯域分割結果に基づいて、高周波帯域または、低周波数帯域かを判定し、
切捨て数設定方式として、
高周波数帯域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、
低周波数帯域の符号化パスについては、MSEを最小規範とするEBCOTを用いる、方式を用いる。
図2は、本発明の第1の実施の形態におけるJPEG2000符号化器の構成図である。
1)ウェーブレット係数の量子化;
2)ポスト量子化;
の2箇所で行っている。フリッカー雑音はこれらのビットレート制御手法と密接な関係がある。
ウェーブレット係数は、次式により量子化される。
ここで、bはサブバンド、(u,v)は空間座標、ab(u,v)は量子化前のウェーブレット係数、qb(u,v)は量子化後のウェーブレット係数、△bは量子化ステップサイズ、sing(・)は符号演算子、floor(・)は切り捨て演算子を表す。量子化ステップサイズの決定方法には、ImplictとExplicitの2種類がある。ここでは詳細は省略する。この量子化に伴うフリッカー雑音は、サブバンド分割・合成において、高域分割領域で発生した量子化ノイズが、低域分割領域に折り返すことによるもので、エリアジング雑音の一種である。動画像では、発生するエリアジング信号の位相がフレーム毎に変化するため、視覚的に検知し易くなる。特に、物体が移動する際のエッジ付近で顕著となる。この歪みの低減に関しては、人間の視覚感度特性CSFによるウェーブレット係数の補正が有効であることがJPEG2000のWG1のコア実験において確認されている。
ポスト量子化(符号化パス切捨て部115)では、コードブロック毎に生成された算術符号化のそれぞれ一部を切り捨てることによりレート制御を行う。切捨ての基準に関しては詳細が定められておらず符号器に依存するが、EBCOTではMSE最小化規範で行うのが一般的である。この規範によればMSEは最小となるが、コードブロック毎に符号化された符号化パスの数に開きが生じ、これが2のべき乗のオーダーで量子化誤差に反映される結果、空間的な画質変動を伴い主観画質を低下させる。
本実施の形態は、第1の実施の形態で述べた空間的な画質変動を抑制する方法を、フリッカー雑音を抑制すべく、時間方向へ拡張する。
条件2: |rn p−tn−1 p|<2δtn
ここで、nは現フレーム番号、tnは現フレームの所望ビットレート、pは前フレームの符号化パスの切捨て数、rn pはpを現フレームに適用した際のビットレートを表す。δは条件の許容幅を設定するパラメータであり、シーケンス毎に最適化できるが本実施の形態では0.1と設定している。条件1は、所望ビットレートが大きく変化した場合を表している。条件2は連続するフレーム間で画像特性が大きく変化した場合を表しており、わずかなビットレートの変動は許容している。上記の2つの条件を満たさない場合には、前フレームとは独立に第1の実施の形態の手法を用いて符号化する。
本実施の形態では、
1)レートの制御の高精細化;
2)PSNRの向上:
を実現するために、第1の実施の形態とEBCOTを組み合わせたハイブリッド法を提案する。その実現のために、主観画質実験により得られた“フリッカー雑音が静止領域において顕著に検知され、動画領域ではさほど目立たない”特性を利用する。即ち、符号化パス切捨て部115では、静止領域においては第1の実施の形態、即ち、時間方向に連続する同位置のコードブロックにおける符号化パスの切捨て数を同じ値に設定し、符号化する。一方、動領域において、フリッカー雑音は動きによってマスキングされ目立たないことから、EBCOTによって符号化する。その結果、フリッカー雑音を抑制しつつPSNRの向上と詳細なビットレート制御が実現できる。
本実施の形態では、
1)レート制御の高精細化;
2)PSNRの向上:
を第3の実施の形態とは異なる手法で改善する。
111 量子化手段、量子化部
112 コードブロック分割手段、コードブロック分割部
113 係数ビットモデリング手段、係数ビットモデリング部
114 算術符号化手段、算術符号化部
115 ポスト量子化手段、符号化パス切捨て部
116 パケット化手段、パケット化部
Claims (6)
- 動画圧縮時に発生するフリッカー雑音を軽減するための画像符号化装置であって、
原画像が入力されると、該画像に対してウェーブレット変換を行うことにより該画像をサブバンドに帯域分割するウェーブレット変換手段と、
前記ウェーブレット変換のウェーブレット係数を補正するために量子化を行う量子化手段と、
前記サブバンドをコードブロックに分割するコードブロック分割手段と、
前記コードブロックに対して前記ウェーブレット係数のビットプレーンに基づく係数ビットモデリングを行い、符号化パスに分解する係数ビットモデリング手段と、
前記符号化パスに対して、算術符号化を行う算術符号化手段と、
符号化パスの一部を廃棄するポスト量子化手段と、
前記ポスト量子化手段の出力からビットストリームを生成し、出力するパケット化手段と、
を有し、
前記ポスト量子化手段は、
前記切捨て数設定方式として、各コードブロックで廃棄する符号化パスの数を、解像度レベル、サブバンド、色成分毎に一定とする方式を用いる、
ことを特徴とする画像符号化装置。 - 前記ポスト量子化手段は、
前記切捨て数設定方式として、
「現フレームで廃棄する符号化パスの数を前フレームと同じく設定したときのビットレートと所望のビットレートの差が十分小さい」という条件、及び、「現フレームで廃棄する符号化パスの数を前フレームと同じく設定したときのビットレートと前フレームのビットレートの差が十分小さい」という条件の両方を満たすとき、現フレームで廃棄する符号化パスの数を前フレームと同じく設定することを、引き続く時間方向に対して適用する、方式を用いる
請求項1記載の画像符号化装置。 - 前記ポスト量子化手段において、
原画像の領域についてブロック単位に静止領域か動領域かの判定を行う手段を有し、
前記切捨て数設定方式として、
静止領域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、
動領域の符号化パスについては、MSE(Mean Squared Error)を最小規範とするEBCOT(Embedded Block Coding with Optimized Truncation)を用いて符号化する、方式を用いる
請求項1または、2記載の画像符号化装置。 - 前記ポスト量子化手段は、
前記ウェーブレット変換手段における帯域分割結果に基づいて、高周波帯域または、低周波数帯域かを判定し、
前記切捨て数設定方式として、
高周波数帯域の符号化パスについては、時間方向に連続する同位置のコードブロックにおける符号化パスの廃棄数を同じ値に設定して符号化し、
低周波数帯域の符号化パスについては、MSEを最小規範とするEBCOTを用いる、方式を用いる
請求項1または、2記載の画像符号化装置。 - コンピュータを、
請求項1乃至4記載の画像符号化装置として機能させることを特徴とする画像符号化プログラム。 - コンピュータを、
請求項1乃至4記載の画像符号化装置として機能させるプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005329271A JP4327789B2 (ja) | 2005-11-14 | 2005-11-14 | 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005329271A JP4327789B2 (ja) | 2005-11-14 | 2005-11-14 | 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007142499A true JP2007142499A (ja) | 2007-06-07 |
JP4327789B2 JP4327789B2 (ja) | 2009-09-09 |
Family
ID=38204890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005329271A Active JP4327789B2 (ja) | 2005-11-14 | 2005-11-14 | 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4327789B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112185291A (zh) * | 2019-07-03 | 2021-01-05 | 三星显示有限公司 | 显示装置及其操作方法 |
-
2005
- 2005-11-14 JP JP2005329271A patent/JP4327789B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112185291A (zh) * | 2019-07-03 | 2021-01-05 | 三星显示有限公司 | 显示装置及其操作方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4327789B2 (ja) | 2009-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6895050B2 (en) | Apparatus and method for allocating bits temporaly between frames in a coding system | |
KR100781525B1 (ko) | 가중 평균합을 이용하여 fgs 계층을 인코딩 및디코딩하는 방법 및 장치 | |
US8498335B2 (en) | Adaptive deadzone size adjustment in quantization | |
JP4704374B2 (ja) | ビデオトランスコーディング方法及び装置 | |
KR100772878B1 (ko) | 비트스트림의 비트율 조절을 위한 우선권 할당 방법,비트스트림의 비트율 조절 방법, 비디오 디코딩 방법 및 그방법을 이용한 장치 | |
CN104980742B (zh) | 用于视频解码的设备 | |
US20060104354A1 (en) | Multi-layered intra-prediction method and video coding method and apparatus using the same | |
US20060120450A1 (en) | Method and apparatus for multi-layered video encoding and decoding | |
JP5300921B2 (ja) | 符号化および復号のための方法および装置 | |
US20070116125A1 (en) | Video encoding/decoding method and apparatus | |
WO2000079802A1 (en) | Apparatus and method for optimizing the rate control for multiscale entropy encoding | |
JP4410245B2 (ja) | ビデオをトランスコーディングする方法 | |
US20050036549A1 (en) | Method and apparatus for selection of scanning mode in dual pass encoding | |
KR20030020382A (ko) | Fgs 강화층에 대한 활동-기반 주파수 가중을 위한 방법및 시스템 | |
KR100843080B1 (ko) | 비디오 트랜스코딩 방법 및 장치 | |
KR20060119736A (ko) | 영상 신호의 인코딩 방법 | |
EP1585338B1 (en) | Decoding method and decoding device | |
JP2006500849A (ja) | スケーラブルなビデオエンコード | |
JP4327789B2 (ja) | 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP4762486B2 (ja) | マルチ・リゾルーション・ビデオ符号化および復号化 | |
Richter et al. | Towards high-speed, low-complexity image coding: variants and modification of JPEG 2000 | |
JP4153774B2 (ja) | 動画像符号化方法とその復号化方法、およびそれらの装置 | |
CN118556401A (zh) | 对图片序列进行编码和解码 | |
Ilgin | DCT Video Compositing with Embedded Zerotree Coding for Multi-Point Video Conferencing | |
Wang | Joint 3-D dynamic resolution conversion with rate-distortion for video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070615 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090324 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090609 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090611 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4327789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130619 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140619 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |