JP2001285865A - 画像処理装置及びその方法、コンピュータ可読メモリ - Google Patents

画像処理装置及びその方法、コンピュータ可読メモリ

Info

Publication number
JP2001285865A
JP2001285865A JP2000089305A JP2000089305A JP2001285865A JP 2001285865 A JP2001285865 A JP 2001285865A JP 2000089305 A JP2000089305 A JP 2000089305A JP 2000089305 A JP2000089305 A JP 2000089305A JP 2001285865 A JP2001285865 A JP 2001285865A
Authority
JP
Japan
Prior art keywords
division
image data
moving image
sub
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000089305A
Other languages
English (en)
Inventor
Osamu Itokawa
修 糸川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000089305A priority Critical patent/JP2001285865A/ja
Priority to US09/816,453 priority patent/US6847736B2/en
Publication of JP2001285865A publication Critical patent/JP2001285865A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 動画像を効率よくかつ良好に符号化・復号化
することができる画像処理装置及びその方法、コンピュ
ータ可読メモリを提供する。 【解決手段】 動画像データに水平サブバンド分割を水
平DWT部102で行う。次に、得られるサブバンドに
基づいて、動画像データに施すサブバンド分割の種類を
判定部105で判定する。そして、その判定結果に基づ
いて、動画像データに対しフレーム単位あるいはフィー
ルド単位のサブバンド分割をフレームDWT部103、
フィールドDWT部104で行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、動画像を符号化・
復号化する画像処理装置及びその方法、コンピュータ可
読メモリに関するものである。
【0002】
【従来の技術】カラー静止画像の符号化方式として、国
際標準であるJPEGが広く知られている。また、JP
EGより更に高い圧縮率を実現する方法として、ウェー
ブレット変換をベースとした新たな符号化方式が規格化
されつつある。
【0003】近年CPUの処理速度の向上に伴い、この
符号化方式を採用した画像符号化装置で符号化処理を連
続的に行うことにより、動画像の符号化が実現可能にな
ってきた。画像符号化装置への動画像の入力方式には、
画面左上から右下に向かい1ラインずつ順番に読み込む
プログレッシブ方式と、1ライン毎に飛ばして奇数ライ
ンと偶数ラインの2回に分けて読み込むインターレース
方式がある。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の静止画符号化に用いられる符号化方式は、プログレ
ッシブ方式なので、インターレース方式の動画像をその
まま静止画符号化に適用すると、大幅に符号化効率が落
ちてしまう場合がある。
【0005】以下、その例を詳細に説明する。
【0006】インターレース方式は、1ラインおきに画
像を取り込むことで、扱う画素数を半分にする代わり
に、取り込みの周波数を倍にするという方式である。図
20はこのタイミングを示す説明図であり、プログレッ
シブ方式のフレーム周期を1/30秒とすると、インタ
ーレース方式のフィールド周期は1/60秒となる。
【0007】インターレース方式の動画像をプログレッ
シブ方式として扱う場合は、2つのフィールド画像を1
つのフレーム画像として扱うことになる。フレーム周期
で扱う画素数はどちらも同じである。
【0008】図21はある幅を持った縦の線が画面右か
ら左へ移動する画像を取り込んだときの様子を説明する
ための図である。
【0009】図21(a)はフレーム周期で取り込んだ
画像である。図21(b)はフィールド周期で取り込ん
だ画像である。図21(c)は図21(b)の画像をフ
レーム周期で表示したものである。取り込みタイミング
に時間差があるため、水平方向にずれが生じている。こ
のずれは、垂直方向から見た場合、高い周波数成分を含
んでいることになる。自然画像の一般的な特徴として、
サブバンドに分割した場合、低域により多くの係数を含
む。図21(c)において、低域側を再度サブバンド分
割しているのは、このためである。しかしながら、イン
ターレース方式の画像においては、図21の例で説明し
たように、高域側にも多くの係数を含んでしまうことに
なる。
【0010】本来、LLのみに集中していた係数が、H
Lにも多く現れることとなる場合、または、元々の信号
が水平方向に高周波成分を含んでいる場合は、LL,H
L共に多くの係数が現れる。そして、インターレース方
式の影響を受けると、LH,HHにも係数が現れること
となり、後段のエントロピ符号化の効率が著しく低下す
ることとなる。
【0011】また、1/60秒の間に水平方向の動きが
ない場合は、垂直方向には高い相関があるため、従来の
静止画符号化と同様に、フレーム単位の符号化を行った
方が高い符号化効率が得られる。
【0012】このように、インターレース方式の動画像
を効率よく符号化するには、フレーム単位の処理とフィ
ールド単位の処理を組み合わせた方がよい。
【0013】本発明は上記の問題点に鑑みてなされたも
のであり、動画像を効率よくかつ良好に符号化・復号化
することができる画像処理装置及びその方法、コンピュ
ータ可読メモリを提供することを目的とする。
【0014】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による画像処理装置は以下の構成を備える。
即ち、入力された動画像データを符号化する画像処理装
置であって、前記動画像データに水平サブバンド分割を
行う第1分割手段と、前記第1分割手段より得られるサ
ブバンドに基づいて、前記動画像データに施すサブバン
ド分割の種類を判定する判定手段と、前記判定手段の判
定結果に基づいて、前記動画像データに対しフレーム単
位あるいはフィールド単位のサブバンド分割を行う第2
分割手段とを備える。
【0015】また、好ましくは、前記判定手段は、前記
第1分割手段より得られるサブバンドの低域側のサブバ
ンドに基づいて、前記動画像データに施すサブバンド分
割の種類を判定する。
【0016】また、好ましくは、前記判定手段は、前記
低域側のサブバンドを構成する画素の差分絶対値和を演
算し、その演算値に基づいて、前記動画像データに施す
サブバンド分割の種類を判定する。
【0017】また、好ましくは、前記判定手段は、前記
低域側のサブバンドを構成する画素に対し、水平方向と
垂直方向の両方向もしくは一方向に間引いた画素に基づ
いて、前記動画像データに施すサブバンド分割の種類を
判定する。
【0018】また、好ましくは、前記判定手段は、前記
低域側のサブバンドに再帰的に水平サブバンド分割を行
い、最終の低域側のサブバンドに基づいて、前記動画像
データに施すサブバンド分割の種類を判定する。
【0019】また、好ましくは、前記第2分割手段より
得られるサブバンドと、前記判定手段による判定結果を
示す識別情報を含む符号化データを生成する符号化手段
を備える。
【0020】上記の目的を達成するための本発明による
画像処理方法は以下の構成を備える。即ち、入力された
動画像データを符号化する画像処理方法であって、前記
動画像データをに水平サブバンド分割を行う第1分割工
程と、前記第1分割工程より得られるサブバンドに基づ
いて、前記動画像データに施すサブバンド分割の種類を
判定する判定工程と、前記判定工程の判定結果に基づい
て、前記動画像データに対しフレーム単位あるいはフィ
ールド単位のサブバンド分割を行う第2分割工程とを備
える。
【0021】上記の目的を達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
入力された動画像データを符号化する画像処理のプログ
ラムコードが格納されたコンピュータ可読メモリであっ
て、前記動画像データに水平サブバンド分割を行う第1
分割工程のプログラムコードと、前記第1分割工程より
得られるサブバンドに基づいて、前記動画像データに施
すサブバンド分割の種類を判定する判定工程のプログラ
ムコードと、前記判定工程の判定結果に基づいて、前記
動画像データに対しフレーム単位あるいはフィールド単
位のサブバンド分割を行う第2分割工程のプログラムコ
ードとを備える。
【0022】
【発明の実施の形態】まず、ウェーブレット変換をベー
スにした従来の符号化・復号化方式について説明する。 (画像符号化装置)図7は従来の画像符号化装置の構成
を示すブロック図である。
【0023】図において、701は画像入力部、702
は離散ウェーブレット変換部、703は量子化部、70
4はエントロピ符号化部、705は符号出力部である。
【0024】まず、画像入力部701に対して符号化対
象となる画像を構成する画素信号がラスタースキャン順
に入力される。入力された画像信号は離散ウェーブレッ
ト変換部702に入力される。以降の説明では、画像信
号は、モノクロの多値画像を表現しているが、カラー画
像等、複数の色成分を符号化するならば、RGB各色成
分、あるいは輝度、色度成分を上記単色成分として圧縮
すればよい。
【0025】離散ウェーブレット変換部(DWT)70
2は、入力された画像信号に対して2次元の離散ウェー
ブレット変換処理を行い、変換係数を計算して出力す
る。ここで、離散ウェーブレット変換部702の基本構
成について、図8を用いて説明する。
【0026】図8は離散ウェーブレット変換部の基本構
成を示す図である。
【0027】図8において、入力された画像信号は、メ
モリ801に記憶され、処理部802により順次読み出
されて変換処理が行われ、再び、メモリ801に書きこ
まれる。
【0028】次に、処理部802の詳細構成について、
図9を用いて説明する。
【0029】図9は処理部の詳細構成を示す図である。
【0030】図9において、入力された画像信号xは、
遅延素子およびダウンサンプラの組み合わせにより、偶
数アドレスおよび奇数アドレスの信号に分離され、2つ
のフィルタpおよびuによりフィルタ処理が施される。
図中、sおよびdは、各々1次元の画像信号に対して1
レベルの分解を行った際のローパス係数およびハイパス
係数を表しており、次式により計算される。
【0031】 d(n)=x(2*n+1)-floor((x(2*n)+x(2*n+2))/2) (1) s(n)=x(2*n)+floor((d(n-1)+d(n))/4) (2) 但し、x(n)は、変換対象となる画像信号である。ま
た、floor(x)は、x未満の整数の中で最も大きい整数値
を表す。
【0032】以上の処理により、画像信号に対する1次
元の離散ウェーブレット変換処理が行われる。
【0033】2次元の離散ウェーブレット変換は、1次
元の変換を画像の水平・垂直方向に対して順次行うもの
であり、その詳細は公知であるので、ここでは説明を省
略する。
【0034】次に、2次元の離散ウェーブレット変換に
より得られる2レベルの変換係数群について、図10を
用いて説明する。
【0035】図10は2レベルの変換係数群の構成例を
示す図である。
【0036】画像信号は、異なる周波数帯域の係数列H
H1,HL1,LH1,…,LLに分解される。尚、以
降の説明ではこれらの係数列をサブバンドと呼ぶ。各サ
ブバンドは、後続の量子化部703に出力される。
【0037】再び、図7の説明に戻る。
【0038】量子化部703は、入力されたサブバンド
を、所定の量子化ステップΔにより量子化し、その量子
化値に対する量子化インデックスをエントロピ符号化部
704に出力する。量子化は、次式により行われる。
【0039】 q=sign(c) floor(abs(c)/Δ) (3) sign(c)=1 ;c>=0 (4) sign(c)=-1 ;c<0 (5) ここで、cは量子化対象となる係数である。また、Δの
値として1を選択することも可能である。この場合、実
際に量子化は行われず、量子化部703に入力されたサ
ブバンドは、そのまま、後続のエントロピ符号化部70
4に出力される。
【0040】エントロピ符号化部704は、入力された
量子化インデックスをビットプレーンに分解し、ビット
プレーンを単位に2値算術符号化を行ってコードストリ
ームを出力する。ここで、エントロピ符号化部704の
動作について、図11を用いて説明する。
【0041】図11はエントロピ符号化部の動作を説明
するための図である。
【0042】この例においては、4x4の大きさを持つ
サブバンド内の領域において非0の量子化インデックス
が3個存在しており、それぞれ+13,−6,+3の値
を持っている。エントロピ符号化部704は、このサブ
バンドを走査して最大値Mを求め、次式により最大の量
子化インデックスを表現するために必要なビット数Sを
計算する。
【0043】 S=ceil(log2(abs(M)))) (6) ここで、ceil(x)は、x以上の整数の中で最も小さい
整数値を表す。
【0044】図11(a)においては、最大値は13で
あるので、式(6)によってSは4となる。そのため、
シーケンス中の16個の量子化インデックスは、図11
(b)に示すように4つのビットプレーンを単位として
処理が行われる。最初に、エントロピ符号化部4は最上
位ビットプレーン(同図MSBで表す)の各ビットを2
値算術符号化し、ビットストリームとして出力する。
【0045】次に、ビットプレーンを1レベル下げ、以
下同様に対象ビットプレーンが最下位ビットプレーン
(同図LSBで表す)に至るまで、ビットプレーン内の
各ビットを符号化し符号出力部705に出力する。この
時、各量子化インデックスの符号は、ビットプレーン走
査において最初の非0ビットが検出されるとそのすぐ後
に当該量子化インデックスの符号がエントロピ符号化さ
れる。
【0046】次に、符号出力部705に出力される符号
配列の構成について、図12を用いて説明する。
【0047】図12は符号出力部に出力される符号列の
構成を示す図である。
【0048】図12(a)は符号列の全体の構成を示す
図あり、MHはメインヘッダ、THはタイルヘッダ、B
Sはビットストリームである。図12(b)はメインヘ
ッダMHの構成を示す図であり、符号化対象となる画像
のサイズ(水平および垂直方向の画素数)、画像を複数
の矩形領域であるタイルに分割した際のサイズ、各色成
分数を表すコンポーネント数、各成分の大きさ、ビット
精度を表すコンポーネント情報から構成されている。
尚、画像をタイルに分割しない場合は、タイルサイズと
画像サイズは同じ値を取り、対象画像がモノクロの多値
画像の場合コンポーネント数は1である。
【0049】また、図12(c)はタイルヘッダTHの
構成を示す図であり、当該タイルのビットストリーム長
とヘッダ長を含めたタイル長および当該タイルに対する
符号化パラメータから構成される。符号化パラメータに
は、離散ウェーブレット変換のレベル、フィルタの種別
等が含まれている。
【0050】また、図12(d)はビットストリームB
Sの構成を示す図であり、ビットストリームは各サブバ
ンド毎にまとめられ、解像度の小さいサブバンドを先頭
として順次解像度が高くなる順番に配置されている。さ
らに、各サブバンド内は上位ビットプレーンから下位ビ
ットプレーンに向かい、ビットプレーンを単位として符
号が配列されている。
【0051】上記のような符号配列とすることにより、
後述する図18に示すような階層的復号化を行うことが
可能となる。
【0052】また、符号配列は、図13のようにしても
良い。
【0053】図13は符号出力部に出力される符号列の
他の構成を示す図である。
【0054】図13(a)は符号列の全体の構成を示す
図であり、MHはメインヘッダ、THはタイルヘッダ、
BSはビットストリームである。図13(b)はメイン
ヘッダMHの構成を示す図であり、符号化対象となる画
像のサイズ(水平および垂直方向の画素数)、画像を複
数の矩形領域であるタイルに分割した際のサイズ、各色
成分数を表すコンポーネント数、各成分の大きさ、ビッ
ト精度を表すコンポーネント情報から構成されている。
尚、画像をタイルに分割しない場合は、タイルサイズと
画像サイズは同じ値を取り、対象画像がモノクロの多値
画像の場合コンポーネント数は1である。
【0055】また、図13(c)はタイルヘッダTHの
構成を示す図であり、当該タイルのビットストリーム長
とヘッダ長を含めたタイル長および当該タイルに対する
符号化パラメータから構成される。符号化パラメータに
は、離散ウェーブレット変換のレベル、フィルタの種別
等が含まれている。また、図13(d)はビットストリ
ームBSの構成を示す図であり、ビットストリームはビ
ットプレーンを単位としてまとめられ、上位ビットプレ
ーンから下位ビットプレーンに向かう形で配置されてい
る。各ビットプレーンには、各サブバンドにおける量子
化インデックスの当該ビットプレーンを符号化した結果
が順次サブバンド単位で配置されている。
【0056】上記のような符号配列とすることにより、
後述する図19に示すような階層的復号化を行うことが
可能となる。
【0057】上述した処理において、符号化対象となる
画像全体の圧縮率は、量子化ステップΔを変更すること
により制御することが可能である。
【0058】また、エントロピ符号化部704において
符号化するビットプレーンの下位ビットを必要な圧縮率
に応じて制限(廃棄)することも可能である。この場合
には、全てのビットプレーンは符号化されず上位ビット
プレーンから所望の圧縮率に応じた数のビットプレーン
までが符号化され、最終的な符号列に含まれる。 (画像復号化装置)次に、上述した画像符号化装置から
出力される符号列のビットストリームを復号化する画像
復号化装置について、図14を用いて説明する。
【0059】図14は従来の画像復号化装置の構成を示
すブロック図である。
【0060】図14において、1201は符号入力部、
1202はエントロピ復号化部、1203は逆量子化
部、1204は逆離散ウェーブレット変換部、1205
は画像出力部である。
【0061】まず、符号入力部1201は、符号列を入
力し、それに含まれるヘッダを解析して後続の処理に必
要なパラメータを抽出し、必要な場合は処理の流れを制
御し、あるいは後続の処理ユニットに対して該当するパ
ラメータを送出する。また、符号列に含まれるビットス
トリームは、エントロピ復号化部1202に出力され
る。
【0062】エントロピ復号化部1202は、ビットス
トリームをビットプレーン単位で復号化し、出力する。
ここで、エントロピ復号化部1202の動作について、
図15を用いて説明する。
【0063】図15はエントロピ復号化部の動作を説明
するための図である。
【0064】図15(a)は、復号対象となるサブバン
ドの一領域をビットプレーン単位で順次復号化し、最終
的に量子化インデックスを復元する流れを示しており、
同図の矢印の順にビットプレーンが復号化される。この
場合、図15(b)のようになる。そして、復元された
量子化インデックスは、逆量子化部1203に出力され
る。
【0065】逆量子化器1203は、入力した量子化イ
ンデックスから、次式に基づいて離散ウェーブレット変
換係数を復元する。
【0066】c'=Δ*q ;q≠0 (7) c'=0 ;q=0 (8) ここで、qは量子化インデックス、Δは量子化ステップ
であり、Δは符号化時に用いられたものと同じ値であ
る。c’は復元されたサブバンドであり、符号化時で
は、sまたはdで表される係数の復元したものである。
サブバンドc’は、後続の逆離散ウェーブレット変換
(逆DWT)部1204に出力される。ここで、逆離散
ウェーブレット変換部1204の基本構成について、図
16を用いて説明する。
【0067】図16は逆離散ウェーブレット変換部の基
本構成を示す図である。
【0068】図16において、入力されたサブバンド
は、メモリ1401に記憶される。メモリ1401に記
憶されたサブバンドに対し、処理部1402は、1次元
の逆離散ウェーブレット変換を行い、メモリ1401か
ら順次変換係数を読み出して処理を行うことで、2次元
の逆離散ウェーブレット変換を実行する。2次元の逆離
散ウェーブレット変換は、順変換と逆の手順により実行
されるが、詳細は公知であるので説明を省略する。
【0069】次に、処理部1402の詳細構成につい
て、図17を用いて説明する。
【0070】図17は処理部の詳細構成を示す図であ
る。
【0071】図17において、s’およびd’は各々1
次元の画像信号に対して1レベルの分解を行った際のロ
ーパス係数およびハイパス係数を表しており、それぞれ
偶数アドレスおよび奇数アドレスに対応する。そして、
それぞれのサブバンドは、2つのフィルタuおよびpに
よりフィルタ処理を施される。そして、フィルタ処理さ
れたサブバンドは、アップサンプラにより重ね合わされ
て画像信号x’が出力される。これらの処理は、次式に
より行われる。
【0072】 x'(2*n)=s'(n)-floor((d'(n-1)+d'(n))/4) (9) x'(2*n+1)=d'(n)+floor((x'(2*n)+x'(2*n+2))/2) (10) ここで、(1)、(2)、および(9)、(10)式に
よる順方向および逆方向の離散ウェーブレット変換は、
完全再構成条件を満たしているため、量子化ステップΔ
が1であり、ビットプレーン復号化において全てのビッ
トプレーンが復号されていれば、復元された画像信号
x’は原画像信号xと一致する。
【0073】以上の処理により、画像信号が復元されて
画像出力部1205に出力される。画像出力部1205
は、モニタ等の画像表示装置であってもよいし、あるい
は磁気ディスク等の記憶装置であってもよい。
【0074】以上説明した手順により、画像を復元表示
した際の画像の表示形態について、図18を用いて説明
する。
【0075】図18は画像を復元表示した際の画像の表
示形態を示す図である。
【0076】図18(a)は、符号列の例を示したもの
であり、基本的な構成は、図12に基づいている。画像
全体をタイルと設定した場合、符号列中には唯1つのタ
イルヘッダおよびビットストリームが含まれていること
となる。ビットストリームBS0には、図に示すよう
に、最も低い解像度に対応するサブバンドであるLLか
ら順次解像度が高くなる順に符号が配置されている。
【0077】画像復号化装置は、このビットストリーム
を順次読みこみ、各サブバンドに対応する符号を復号し
た時点で画像を表示する。図18(b)は、各サブバン
ドと表示される画像の大きさの対応を示したものであ
る。この例では、2次元の離散ウェーブレット変換が2
レベルであり、LLのみを復号・表示した場合は原画像
に対して画素数が水平および垂直方向に1/4縮小され
た画像が復元される。更に、ビットストリームを読み込
み、レベル2のサブバンド全てを復号して表示した場合
は、画素数が各方向に1/2に縮小された画像が復元さ
れ、レベル1のサブバンド全てが復号されれば、原画像
と同じ画素数の画像が復元される。
【0078】また、以上説明した手順により、画像を復
元表示した際の画像の表示形態について、図19を用い
て説明する。
【0079】図19は画像を復元表示した際の画像の表
示形態を示す図である。
【0080】図19(a)は、符号列の例を示したもの
であり、基本的な構成は図13に基づいている。画像全
体をタイルと設定した場合、符号列中には唯1つのタイ
ルヘッダおよびビットストリームが含まれていることと
なる。ビットストリームBS0には、図に示すように、
最も上位のビットプレーンから、下位のビットプレーン
に向かって符号が配置されている。
【0081】画像復号化装置は、このビットストリーム
を順次読みこみ、各ビットプレーンの符号を復号した時
点で画像を表示する。図19(b)は、上位のビットプ
レーンから順次復号が行われたとき、表示される画像の
画質変化の例を示したものである。この例では、上位の
ビットプレーンのみが復号されている状態では、画像の
全体的な特徴のみが表示されるが、下位のビットプレー
ンが復号されるに従って、段階的に画質が改善されてい
る。量子化において量子化ステップΔが1の場合、全て
のビットプレーンが復号された段階で表示される画像は
原画像と全く同じとなる。
【0082】上述した例において、エントロピ復号化部
1202において、復号する下位ビットプレーンを制限
(無視)することで、受信あるいは処理する符号化デー
タ量を減少させ、結果的に圧縮率を制御することが可能
である。このようにすることにより、必要なデータ量の
符号化データのみから所望の画質の復号画像を得ること
が可能である。また、符号化時の量子化ステップΔが1
であり、復号時に全てのビットプレーンが復号された場
合は、復元された画像が原画像と一致する可逆符号化・
復号化を実現することもできる。
【0083】以下、図面を参照して、本発明の実施形態
を詳細に説明する。
【0084】図1は本実施形態の画像符号化装置の概略
構成を示すブロック図である。
【0085】101は画像入力部、102は水平方向の
離散ウェーブレット変換を行う水平離散ウェーブレット
変換(水平DWT)部、103はフレーム単位の離散ウ
ェーブレット変換を行うフレーム離散ウェーブレット変
換(フレームDWT)部である。104はフィールド単
位の離散ウェーブレット変換を行うフィールド離散ウェ
ーブレット変換(フィールドDWT)部である。105
は判定部、106は量子化部、107はエントロピ符号
化部、108は符号出力部である。
【0086】まず、画像入力部101に対して符号化対
象となる画像信号を構成する画素信号がインターレース
方式で入力される。その出力信号は、フレーム単位に画
素配列され、水平DWT部102で、まず先に水平方向
の離散ウェーブレット変換を行う。変換されたデータ
は、判定部105に送られる。
【0087】判定部105では、入力された信号を基に
フレーム単位の処理をすべきか、フィールド単位の処理
をすべきかの選択を行う。判定方法の詳細は後に説明す
る。尚、判定処理はタイル毎に行う。タイル毎にどちら
の処理が選択されたかは、各タイルヘッダ内に1ビット
の識別情報を付与しておけばよい。また、このフレーム
/フィールドの識別情報は、必ずしもタイルヘッダ内に
ある必要はなく、ファイルフォーマットを規定して別に
データテーブルを用意してもよい。画像をタイルに分割
しない場合は、タイルサイズと画像サイズは同じ値とな
る。
【0088】量子化部106は、入力されたサブバンド
を所定の量子化ステップにより量子化し、その量子化値
に対する量子化インデックスを出力する。エントロピ符
号化部107では、入力された量子化インデックスをビ
ットプレーンに分解し、ビットプレーンを単位に2値算
術符号化を行ってコードストリームを符号出力部108
に出力する。量子化部106から符号出力部108の処
理は、従来技術で説明した図7の量子化部703から符
号出力部705の処理と同様であるが、フレーム単位の
場合とフィールド単位の場合で、処理内容を変更したい
場合は、タイルヘッダ内の識別情報が利用可能である。
【0089】次に、実施形態の画像符号化装置で実行さ
れる処理について、図2を用いて説明する。
【0090】図2は本実施形態の画像符号化装置で実行
される処理を示すフローチャートである。
【0091】尚、ここでの処理は、特に、図1の画像入
力部101からフィールドDWT部104の処理手順の
詳細な説明である。
【0092】まず、ステップS201において、フレー
ム画像の構成を行う。このときの画像イメージが図3
(a)である。次に、ステップS202において、水平
方向のDWT処理である水平サブバンド分割を行う。こ
のときの画像イメージが図3(b)である。ここで、L
は低域側、Hは高域側のサブバンドを示す。
【0093】次に、ステップS203において、フィー
ルド間の係数演算を行う。演算方法は、いくつか考えら
れるが、詳細は後に述べる。ステップS204におい
て、演算された演算値と予め設定された閾値との比較を
行う。演算値が閾値より小さい場合(ステップS204
でYES)、フレーム単位の処理と判定し、ステップS
206に進む。一方、演算値が閾値より大きい場合(ス
テップS204でNO)、フィールド単位の処理と判定
し、ステップS206に進む。
【0094】ステップS204において、フレーム単位
の処理と判定された場合、画像の構成はそのままなの
で、直接、ステップS206の処理に移る。フィールド
単位の処理を行う場合は、フレーム単位の画像データを
フィールド単位の画像データに再構成しなければならな
い。そこで、ステップS205において、フィールド画
像の構成を行う。通常の処理では、元画像の画像イメー
ジである図3(a)から図3(d)の画像イメージを生
成することになるが、本実施形態では、先にステップS
202において、元画像に対し水平サブバンド分割を行
っているので、図3(a)の画像イメージからのフィー
ルド画像の生成の必要はなく、図3(b)の画像イメー
ジからサブバンド分割を行って、図3(e)の画像イメ
ージを生成する。
【0095】ステップS206において、垂直方向のD
WT処理である垂直サブバンド分割を行う。先の処理
で、フレーム単位の処理と判定された場合は、この垂直
サブバンド分割によって、図3(c)の画像イメージが
生成される。一方、フィールド単位の処理と判定された
場合は、この垂直サブバンド分割によって、図3(f)
の画像イメージが生成される。
【0096】更に低域側を再帰的にサブバンド分割する
場合には、ステップS207において、必要なレベルま
で水平・垂直サブバンド分割を繰り返す。フレーム単位
の処理で生成された図3(c)の画像イメージに対し、
水平・垂直サブバンド分割を各1回行うと、図3(g)
の画像イメージが生成される。一方、フィールド単位の
処理で生成された図3(f)の画像イメージに対し、水
平・垂直サブバンド分割を各1回行うと、図3(h)の
画像イメージが生成される。
【0097】再度、図3を用いて、図2で実行される処
理の流れを整理すると、フレーム単位の処理の場合は、
図3(a)→図3(b)→図3(c)→図3(g)、フ
ィールド単位の処理の場合は、図3(a)→図3(b)
→図3(e)→図3(f)→図3(h)となる。
【0098】尚、フレーム単位の処理とフィールド単位
の処理の違いは画素の配列なので、入出力のデータ配列
を考慮すれば、ハードウエアでもソフトウエアでも処理
の共用化は可能である。
【0099】ここで、係数演算の詳細について説明す
る。
【0100】基本的にはフィールド間の演算処理となる
が、タイルサイズが大きい場合には、すべてのデータを
処理するには演算の負荷が大きくなる。特に、タイル分
割を行わない場合には、1つのタイルが1フレームに相
当するので、1度に全画素を処理しなければならない。
そこで、本実施形態では、先に、水平サブバンド分割で
得られた低域側のサブバンドを用いて、演算処理に要す
る負荷を低減する。
【0101】図4(a)は、図3(b)の画像イメージ
における低域側の画像イメージの図である。1つのタイ
ルが、水平方向にX画素、垂直方向にY画素のデータで
構成されているとすると、図4(a)の水平方向のデー
タサイズは、サブバンド分割されているため、X/2画
素となり、垂直方向のデータサイズは、Y画素となる。
図4(b)は、このタイルを構成する画素の配列を説明
するための図である。演算処理の1つの方法としては、
フィールド間の差分絶対値和を算出することが考えられ
る。位置(x,y)における画素値をP(x,y)とす
ると、演算値SUMは、次式で表すことができる。
【0102】
【数1】
【0103】(11)このように、サブバンド分割した
低域側のサブバンドを用いることで、演算するデータ量
を減らすことができるが、更に、簡便な方法として、こ
の低域側の水平方向のサブバンドを間引いた後に、演算
処理を行うことも可能である。図4(c)は水平方向に
画素を1/2間引いた例である。水平方向に画素を1/
2間引いた場合のデータサイズは、図5(a)に示すよ
うに、水平方向がX/4画素、垂直方向がY画素とな
る。そして、このタイルを構成する画素の配列は、図5
(b)となる。従って、演算値SUMは、次式で表すこ
とができる。
【0104】
【数2】
【0105】(12)また、低域側の垂直方向のサブバ
ンドを間引いた後に、演算処理を行うことも可能であ
る。但し、垂直方向のサブバンドを間引く場合は、上下
のペアのサブバンドは残さなければならない。図4
(d)は垂直方向に画素を1/2間引いた例である。垂
直方向に画素を1/2間引いた場合のデータサイズは、
図5(c)に示すように、水平方向がX/2画素、垂直
方向がY/2画素となる。そして、このタイルを構成す
る画素の配列は、図5(d)となる。従って、演算値S
UMは、次式で表すことができる。
【0106】
【数3】
【0107】(13)もちろん、水平・垂直両方向でデ
ータを間引いた後、演算処理を行うことも可能である。
水平・垂直方向にそれぞれ画素を1/2間引いた場合の
データサイズは、図5(e)に示すように、水平方向が
X/4画素、垂直方向がY/2画素となる。そして、こ
のタイルを構成する画素の配列は、図5(f)となる。
従って、演算値SUMは、次式で表すことができる。
【0108】
【数4】
【0109】(14)図2のステップS203の係数演
算の負荷を軽減するために、例えば、以下のように係数
演算を行っても良い。
【0110】つまり、図4(a)の画像イメージにおけ
る低域側の画像イメージに対し、再度、水平サブバンド
分割を行う。この結果、図3(b)の画像イメージにお
ける低域側の画像イメージ(Lデータ)である図4
(a)の画像イメージは、更に、低域側(LLデータ)
と高域側(HLデータ)に分割される。分割された低域
側の画像イメージは図6(a)となり、この画像イメー
ジのデータサイズは、水平方向がX/4画素、垂直方向
がY画素となる。そして、このタイルを構成する画素の
配列は、図6(b)となる。従って、演算値SUMは、
次式で表すことができる。
【0111】
【数5】
【0112】(15)このように、低域側の画像イメー
ジに対し、水平サブバンド分割を繰り返すことで、演算
精度をある程度保ちながら、演算処理で扱うデータ数を
減らしていくことができる。当然のことながら、再帰的
サブバンド分割とデータ間引きを組み合わせて、演算量
を削減することも可能である。つまり、図6(c)に示
すように、LLデータに対し、更に水平方向に画素を1
/2間引いた後、演算処理を行うことも可能であり、ま
た、図6(d)に示すように、水平・垂直方向にそれぞ
れ画素を1/2間引いた後、演算処理を行うことも可能
である。
【0113】尚、以上説明した画像符号化装置によるビ
ットストリームを復号化する画像復号化装置は、上述の
画像符号化装置の各構成に対応する逆構成(符号入力部
エントロピ復号化部、逆量子化部、フレーム/フィール
ド逆DWT部、水平逆DWT部、画像出力部)を構成
し、ビットストリーム内の識別情報に基づいて、適宜、
フレーム/フィールド逆DWT部を用い、元画像を復元
することができる。
【0114】以上説明しように、本実施形態によれば、
インターレース方式の動画像を、1レベルの水平サブバ
ンド分割を行った後、得られるサブバンドに対し演算処
理を行う。そして、この演算結果に基づいて、以降のD
WT処理をフレーム単位あるいはフィールド単位のDW
T処理を適宜選択して実行することで、画像情報をより
良好に維持しながらDWT処理を行うことができる。そ
のため、このDWT処理によって得られた符号化画像を
復号する場合にも、良好な復元画像を生成することがで
きる。
【0115】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インタフェース機器、リーダ、プリンタ
など)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、複写機、ファクシミリ装置な
ど)に適用してもよい。
【0116】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0117】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0118】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROMな
どを用いることができる。
【0119】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0120】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
【0121】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した図2に示すフローチャー
トに対応するプログラムコードが格納されることにな
る。
【0122】
【発明の効果】以上説明したように、本発明によれば、
動画像を効率よくかつ良好に符号化・復号化することが
できる画像処理装置及びその方法、コンピュータ可読メ
モリを提供できる。
【図面の簡単な説明】
【図1】本実施形態の画像符号化装置の概略構成を示す
ブロック図である。
【図2】本実施形態の画像符号化装置で実行される処理
を示すフローチャートである。
【図3】本実施形態の処理過程における画像イメージの
構成を示す図である。
【図4】本実施形態における係数演算を説明するための
図である。
【図5】本実施形態における係数演算を説明するための
図である。
【図6】本実施形態における係数演算を説明するための
図である。
【図7】従来の画像符号化装置の構成を示すブロック図
である。
【図8】離散ウェーブレット変換部の基本構成を示す図
である。
【図9】処理部の詳細構成を示す図である。
【図10】2レベルの変換係数群の構成例を示す図であ
る。
【図11】エントロピ符号化部の動作を説明するための
図である。
【図12】符号出力部に出力される符号列の構成を示す
図である。
【図13】符号出力部に出力される符号列の他の構成を
示す図である。
【図14】従来の画像復号化装置の構成を示すブロック
図である。
【図15】エントロピ復号化部の動作を説明するための
図である。
【図16】逆離散ウェーブレット変換部の基本構成を示
す図である。
【図17】処理部の詳細構成を示す図である。
【図18】画像を復元表示した際の画像の表示形態を示
す図である。
【図19】画像を復元表示した際の画像の表示形態を示
す図である。
【図20】フレームとフィールドのタイミングを説明す
るための図である。
【図21】フィールド画像の問題点を説明するための図
である。
【符号の説明】
101 画像入力部 102 水平DWT部 103 フレームDWT部 104 フィールドDWT部 105 判定部 106 量子化部 107 エントロピ符号化部 108 符号出力部

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 入力された動画像データを符号化する画
    像処理装置であって、 前記動画像データに水平サブバンド分割を行う第1分割
    手段と、 前記第1分割手段より得られるサブバンドに基づいて、
    前記動画像データに施すサブバンド分割の種類を判定す
    る判定手段と、 前記判定手段の判定結果に基づいて、前記動画像データ
    に対しフレーム単位あるいはフィールド単位のサブバン
    ド分割を行う第2分割手段とを備えることを特徴とする
    画像処理装置。
  2. 【請求項2】 前記判定手段は、前記第1分割手段より
    得られるサブバンドの低域側のサブバンドに基づいて、
    前記動画像データに施すサブバンド分割の種類を判定す
    ることを特徴とする請求項1に記載の画像処理装置。
  3. 【請求項3】 前記判定手段は、前記低域側のサブバン
    ドを構成する画素の差分絶対値和を演算し、その演算値
    に基づいて、前記動画像データに施すサブバンド分割の
    種類を判定することを特徴とする請求項2に記載の画像
    処理装置。
  4. 【請求項4】 前記判定手段は、前記低域側のサブバン
    ドを構成する画素に対し、水平方向と垂直方向の両方向
    もしくは一方向に間引いた画素に基づいて、前記動画像
    データに施すサブバンド分割の種類を判定することを特
    徴とする請求項2に記載の画像処理装置。
  5. 【請求項5】 前記判定手段は、前記低域側のサブバン
    ドに再帰的に水平サブバンド分割を行い、最終の低域側
    のサブバンドに基づいて、前記動画像データに施すサブ
    バンド分割の種類を判定することを特徴とする請求項2
    に記載の画像処理装置。
  6. 【請求項6】 前記第2分割手段より得られるサブバン
    ドと、前記判定手段による判定結果を示す識別情報を含
    む符号化データを生成する符号化手段を備えることを特
    徴とする請求項1に記載の画像処理装置。
  7. 【請求項7】 入力された動画像データを符号化する画
    像処理方法であって、 前記動画像データに水平サブバンド分割を行う第1分割
    工程と、 前記第1分割工程より得られるサブバンドに基づいて、
    前記動画像データに施すサブバンド分割の種類を判定す
    る判定工程と、 前記判定工程の判定結果に基づいて、前記動画像データ
    に対しフレーム単位あるいはフィールド単位のサブバン
    ド分割を行う第2分割工程とを備えることを特徴とする
    画像処理方法。
  8. 【請求項8】 前記判定工程は、前記第1分割工程より
    得られるサブバンドの低域側のサブバンドに基づいて、
    前記動画像データに施すサブバンド分割の種類を判定す
    ることを特徴とする請求項7に記載の画像処理方法。
  9. 【請求項9】 前記判定工程は、前記低域側のサブバン
    ドを構成する画素の差分絶対値和を演算し、その演算値
    に基づいて、前記動画像データに施すサブバンド分割の
    種類を判定することを特徴とする請求項8に記載の画像
    処理方法。
  10. 【請求項10】 前記判定工程は、前記低域側のサブバ
    ンドを構成する画素に対し、水平方向と垂直方向の両方
    向もしくは一方向に間引いた画素に基づいて、前記動画
    像データに施すサブバンド分割の種類を判定することを
    特徴とする請求項8に記載の画像処理方法。
  11. 【請求項11】 前記判定工程は、前記低域側のサブバ
    ンドに再帰的に水平サブバンド分割を行い、最終の低域
    側のサブバンドに基づいて、前記動画像データに施すサ
    ブバンド分割の種類を判定することを特徴とする請求項
    8に記載の画像処理方法。
  12. 【請求項12】 前記第2分割工程より得られるサブバ
    ンドと、前記判定工程による判定結果を示す識別情報を
    含む符号化データを生成する符号化工程を備えることを
    特徴とする請求項7に記載の画像処理方法。
  13. 【請求項13】 入力された動画像データを符号化する
    画像処理のプログラムコードが格納されたコンピュータ
    可読メモリであって、 前記動画像データに水平サブバンド分割を行う第1分割
    工程のプログラムコードと、 前記第1分割工程より得られるサブバンドに基づいて、
    前記動画像データに施すサブバンド分割の種類を判定す
    る判定工程のプログラムコードと、 前記判定工程の判定結果に基づいて、前記動画像データ
    に対しフレーム単位あるいはフィールド単位のサブバン
    ド分割を行う第2分割工程のプログラムコードとを備え
    ることを特徴とするコンピュータ可読メモリ。
JP2000089305A 2000-03-28 2000-03-28 画像処理装置及びその方法、コンピュータ可読メモリ Withdrawn JP2001285865A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000089305A JP2001285865A (ja) 2000-03-28 2000-03-28 画像処理装置及びその方法、コンピュータ可読メモリ
US09/816,453 US6847736B2 (en) 2000-03-28 2001-03-26 In image compression, selecting field or frame discrete wavelet transformation based on entropy, power, or variances from the high frequency subbands

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000089305A JP2001285865A (ja) 2000-03-28 2000-03-28 画像処理装置及びその方法、コンピュータ可読メモリ

Publications (1)

Publication Number Publication Date
JP2001285865A true JP2001285865A (ja) 2001-10-12

Family

ID=18605078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000089305A Withdrawn JP2001285865A (ja) 2000-03-28 2000-03-28 画像処理装置及びその方法、コンピュータ可読メモリ

Country Status (1)

Country Link
JP (1) JP2001285865A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015005367A1 (ja) * 2013-07-12 2015-01-15 ソニー株式会社 画像復号装置および方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015005367A1 (ja) * 2013-07-12 2015-01-15 ソニー株式会社 画像復号装置および方法
US11218710B2 (en) 2013-07-12 2022-01-04 Sony Corporation Image decoding device and method
US11812042B2 (en) 2013-07-12 2023-11-07 Sony Corporation Image decoding device and method for setting information for controlling decoding of coded data

Similar Documents

Publication Publication Date Title
TWI436287B (zh) 畫像編碼方法及裝置
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
US7302105B2 (en) Moving image coding apparatus, moving image decoding apparatus, and methods therefor
US8031951B2 (en) 2-dimensional signal encoding/decoding method and device
JP2001326936A (ja) 画像符号化装置及び方法
JP2001346047A (ja) 画像処理装置及び画像処理方法
JP2005517316A (ja) 構成可能なパターン最適化器
JP2002010216A (ja) 復号化装置及びその制御方法並びに記憶媒体
JP2003319185A (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
US7228000B2 (en) Image data generation with reduced amount of processing
JP2004505520A (ja) ウェーブレット分解を用いたビデオ符号化方法
WO2006046550A1 (ja) 画像符号化方法および装置、ならびに画像復号方法および装置
US6847736B2 (en) In image compression, selecting field or frame discrete wavelet transformation based on entropy, power, or variances from the high frequency subbands
KR100381204B1 (ko) 칼라 정지영상의 부호화 및 복호화 방법
JP4412688B2 (ja) 画像処理装置及びその方法
JP2001275119A (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JP2001285865A (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JP4194311B2 (ja) 動画像符号化装置及び動画像復号装置並びにそれらの方法
JP2001231041A (ja) 画像符号化方法及び装置
JP4034236B2 (ja) 特定変換係数優先符号化装置、特定変換係数優先符号化復号システム及び特定変換係数優先符号化方法
JP4667424B2 (ja) 画像復号装置
JP2003244443A (ja) 画像符号化装置及び画像復号装置
JP2001086506A (ja) 画像符号化装置及び方法
JP4174254B2 (ja) 動画像符号化装置及び動画像復号装置並びにそれらの方法
JP2004350034A (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605