JP2004040833A - 動画像符号化方法及び装置並びに動画像復号化方法及び装置 - Google Patents
動画像符号化方法及び装置並びに動画像復号化方法及び装置 Download PDFInfo
- Publication number
- JP2004040833A JP2004040833A JP2003347222A JP2003347222A JP2004040833A JP 2004040833 A JP2004040833 A JP 2004040833A JP 2003347222 A JP2003347222 A JP 2003347222A JP 2003347222 A JP2003347222 A JP 2003347222A JP 2004040833 A JP2004040833 A JP 2004040833A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- image signal
- signal
- area
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/004—Predictors, e.g. intraframe, interframe coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】入力画像信号の状態によらず発生符号量を設定符号量となるように制御することができ、画像の静止領域や動きの小さな領域では高い解像度を保ち、動きの大きな領域では過度の情報が発生することなく符号化を行う。
【解決手段】入力画像信号331をダウンサンプリングするダウンサンプリング回路321、ダウンサンプリングされた画像信号341について動き補償予測を行って予測信号332を生成する予測回路101、ダウンサンプリングされた画像信号341に対する予測信号332の予測残差信号333を符号化する符号化回路304〜306、及び入力画像信号331のフレーム毎にダウンサンプリング比を決定する制御部323を有する。
【選択図】図7
【解決手段】入力画像信号331をダウンサンプリングするダウンサンプリング回路321、ダウンサンプリングされた画像信号341について動き補償予測を行って予測信号332を生成する予測回路101、ダウンサンプリングされた画像信号341に対する予測信号332の予測残差信号333を符号化する符号化回路304〜306、及び入力画像信号331のフレーム毎にダウンサンプリング比を決定する制御部323を有する。
【選択図】図7
Description
本発明は、例えばTV電話、TV電議システム、ディジタルビデオディスクシステム、ディジタルTV放送システムのような画像を伝送または蓄積するシステムおよびこれら画像を受信または再生するシステムに関し、特に画像を少ない情報量に圧縮符号化する動画像符号化方法及び装置並びに圧縮符号化された情報を復元し画像を再生する動画像復号化方法及び装置に関する。
画像を伝送、蓄積するために少ない情報量に圧縮符号化する技術として、動き補償、離散コサイン変換、サブバンド符号化、ピラミッド符号化等の方式や、これらを組み合わせた方式など様々な方式が開発されている。また、動画像の圧縮符号化の国際標準方式としてISO・MPEG1,MPEG2、およびITU−T・H.261,H.262が規定されている。
従来の動画像符号化方式の例として、動き補償適応予測離散コサイン変換符号化方式について説明する。この方式は、例えば文献1:安田浩編著、“マルチメディア符号化の国際標準”、丸善(平成3年6月発行)等に詳しく述べられている。概略的な動作を説明すると、入力画像信号についてまず動き補償適応予測が行われる。すなわち、入力画像信号が複数のブロックに分割され、ブロック単位でフレームメモリ中に蓄えられている既に符号化/局部復号が行われた画像信号との間の動きベクトルが検出され、この動きベクトルを用いて第1の予測信号が作成される。次に、必要に応じて上記ブロックがさらに複数の小ブロックに分割され、この小ブロック単位で動きベクトル検出が行われて第2の予測信号が作成する。
第1の予測信号を用いる第1の予測モードと、第2の予測信号を用いる第2の予測モード、および入力画像信号をそのまま符号化に用いるフレーム内符号化モード(予測信号=0)のうち、符号化に最適な予測モードが選択され、対応する予測信号が出力される。そして、選択された予測モードを示す情報および動きベルトル情報が可変長符号化される。動きベクトル情報については、隣接の既に符号化したブロックの動きベクトルとの差分をとり、この差分を可変長符号化する方法が一般に用いられている。
一方、選択された予測信号が入力画像信号から減算されることにより、予測残差信号が生成される。この予測残差信号は一定の大きさのブロック単位で離散コサイン変換(DCT)され、これにより得られたDCT係数はさらに量子化される。量子化された信号は2分岐され、一方は可変長符号化され、他方は逆量子化された後、逆離散コサイン変換(逆DCT)される。逆DCTにより得られた信号は予測信号と加算され、フレームメモリに記憶される。
予測モードを示す情報および動きベルトル情報の可変長符号と、量子化されたDCT係数の可変長符号は、量子化幅を示す情報と共に多重化され、出力符号列として出力される。この出力符号列の符号量は、伝送路や蓄積媒体で定められている伝送/蓄積レートに合わせて制御する必要がある。一般に、このような符号量制御はDCT係数を量子化する際の量子化幅を制御することにより行われる。すなわち、量子化幅を大きくすればDCT係数を表す精度は低下して符号化品質が低下するが、符号量は少なくなり、逆に量子化幅を小さくすればDCT係数を表す精度が向上して符号化品質が向上する代わりに、符号量が増加する。量子化幅を決定する方法としては様々な方法が提案されているが、出力符号列を仮想的なバッファに入れたときのバッファ充填率を基に決定する方法や、入力画像信号あるいは予測残差信号のアクティビティを基に、出力符号列の符号量が設定符号量となる量子化幅を推定する方法等が用いられている。
しかし、上述したような量子化幅を制御することによって出力符号列の符号量を制御する従来の方式では、DCT係数情報の符号量は制御できるものの、それ以外の適応予測のモードを示す情報や動きベクトルに関する情報の符号量を制御することができないという問題がある。前述のように、モード情報や動きベクトル情報は可変長符号化されるため、符号化する画像の種類によって発生符号量が異なり、特に動きベクトル情報の符号量の変化は著しい。前述のように動きベクトルの差分をとって可変長符号化する方式においては、隣り合う動きベクトル成分が揃っている場合には差分が小さくなるため発生符号量は少ないが、動きが複雑でフレーム内で動きベクトルが大きく変化する場合には、発生符号量が多くなる。しかしながら従来の符号化装置では、動きベクトル情報の発生符号量を制御できないため、以下に示す様々な問題が生じていた。
第1に、特に設定符号量が少ない場合において複雑な動きのある画像信号を符号化すると、動きベクトル情報だけで設定符号量を上回ってしまい、量子化幅の制御のみでは発生符号量の制御不能に陥ってしまう場合がある。このような現象を避けるため、従来の符号化装置においては、前述した仮想的なバッファのバッファ充填率が規定値を超えた場合には全ての符号化を強制的に停止して符号が発生するのを抑えたり、入力画像信号の一部のフレームを間引くフレーム間引きによって符号量を抑える方法が用いられていた。しかし、このような方法では符号量が強制的に抑えられるため、符号化品質が著しく低下したり、動きが不自然になるなどの問題が生じる。
第2に、設定符号量が少ない場合には量子化幅が非常に大きな値となり、符号化品質が低下するという問題がある。特に、DCTを用いた符号化方式においては、量子化幅を大きくするとブロック歪やモスキート歪と呼ばれる歪が生じ、符号化品質が低下する。
上述したように、従来の動画像符号化装置においては、動き補償適応予測の予測残差信号を変換した信号を量子化する際の量子化幅を制御することによって発生符号量を設定符号量に制御しているため、設定符号量が少ない条件下で複雑な動きのある画像信号を符号化する場合などに符号量制御ができなくなったり、量子化幅が大きくなりすぎて符号化品質が低下するという問題点があった。
本発明の目的は、入力画像信号の状態によらず発生符号量を設定符号量となるように制御することができ、画像の静止領域や動きの小さな領域では高い解像度を保ち、動きの大きな領域では過度の情報が発生することなく符号化を行うことができる動画像符号化方法及び装置並びにこれに対応した動画像復号化方法及び装置を提供することにある。
上記課題を解決するため、本発明は入力画像信号をダウンサンプリングし、ダウンサンプリングされた画像信号について動き補償予測を行って予測信号を生成し、ダウンサンプリングされた画像信号に対する予測信号の予測残差信号を符号化し、前記入力画像信号のフレーム毎に前記ダウンサンプリングステップでのダウンサンプリング比を決定するステップとを有することを特徴とする。
また、入力画像信号をダウンサンプリングし、ダウンサンプリングされた入力画像信号について動き補償予測を行って予測信号を生成し、前記入力画像信号に対する前記予測信号の予測残差信号を所定の符号化制御パラメータで符号化し、前記入力画像信号および前記予測残差信号の少なくとも一方の信号のアクティビティを用いて発生符号量が設定値となる前記ダウンサンプリング手段でのダウンサンプリング比と前記符号化制御パラメータとの複数の組み合わせを推定し、これら複数の組み合わせから最適な組み合わせを選択して決定することを特徴とする。
一方、復号化側においては、符号化された予測残差信号及び動きベクトル情報を復号し、復号された予測残差信号から予測信号を生成し、前記予測残差信号と予測信号とを加算し、加算された信号をサンプリング密度情報に従ってアップサンプリングすることにより再生画像信号を生成することを特徴とする。
また、入力画像信号の第1領域をダウンサンプリングし、前記入力画像信号の前記第1領域およびダウンサンプリングされない第2領域についてそれぞれ動き補償予測を行って予測信号を生成し、前記入力画像信号に対する前記予測信号の予測残差信号を所定の符号化制御パラメータで符号化し、前記符号化手段により符号化された信号から画像信号を復号し、復号された画像信号を前記予測手段における前記第1領域についての動き補償予測のために一時記憶し、復号された画像信号のうち前記第1領域に対応する第3領域の画像信号をアップサンプリングし、前記復号された画像信号のうち前記第2領域に対応する画像信号と前記第3領域に対応する画像信号から再生画像信号を生成し、前記第2領域の予測のための画像信号を一時記憶すると共に、該一時記憶されている画像信号の一部を前記再生画像信号に置き換えることを特徴とする。
さらに、入力画像信号のダウンサンプリングされた第1領域およびダウンサンプリングされない第2領域についてそれぞれ動き補償予測を行って予測信号を生成し、前記第1領域および第2領域に対応する予測残差信号と前記予測手段により得られた予測信号から画像信号を復号し、復号された前記第1領域に対応する画像信号をアップサンプリングし、アップサンプリングされた画像信号と前記復号手段により復号された前記第2領域に対応する画像信号から再生画像信号を生成し、復号された画像信号を前記第1領域の画像信号の予測のために一時記憶し、復号された画像信号を前記第2領域の画像信号の予測のために一時記憶すると共に、該一次記憶されている画像信号の一部を前記再生画像信号に置き換えることを特徴とする。
本発明では、入力画像信号をダウンサンプリングして符号化し、そのダウンサンプリング比と量子化幅等の符号化制御パラメータの組み合わせから最適な組み合わせを選択しているため、サンプリング密度が固定で量子化幅のみを制御していた従来方式に比べ符号化品質が向上する。
また、入力画像信号をそのまま符号化する部分とダウンサンプリングして符号化する部分に分け、それぞれに対して予測を行っているため、静止領域や動きの小さな領域では高い解像度が保たれ、動きの大きな領域ではダウンサンプリングされて過度の情報が発生することなく符号化が行われる。さらに、このような動画像符号化装置により符号化された信号から基の画像信号が再生される。
本発明によれば、サンプリング密度が固定であった従来方式に比べ符号化品質が向上する。さらに、本発明によれば入力画像信号をそのまま符号化する部分とダウンサンプリングして符号化する部分に分け、それぞれに対して予測を行うことにより、静止領域や動きの小さな領域では高い解像度を保ち、動きの大きな領域ではダウンサンプリングされて過度の情報を発生することなく符号化を行うことが可能となる。
以下、図面を参照して本発明の実施形態を説明する。
図1は、本発明による動画像符号化装置の第1の実施形態のブロック図であり、動き補償適応予測DCT符号化方式を用いた例である。動き補償適応DCT符号化方式については、前述の文献1等に詳しいので動作の概略のみを説明し、従来方式との差異を詳細に説明する。
図1は、本発明による動画像符号化装置の第1の実施形態のブロック図であり、動き補償適応予測DCT符号化方式を用いた例である。動き補償適応DCT符号化方式については、前述の文献1等に詳しいので動作の概略のみを説明し、従来方式との差異を詳細に説明する。
この動画像符号化装置では、入力画像信号131についてまず動き補償適応予測が行われる。すなわち、動き補償予測回路101において、入力画像信号131とフレームメモリ102に蓄えられている既に符号化/局部復号が行われた画像信号(参照画像信号)との間の動きベクトルがブロック単位で検出され、この動きベクトルに基づいて動き補償予測信号が作成される。動き補償予測回路101では、さらに動き補償予測モード(フレーム間予測モード)と入力画像信号131をそのまま符号化するフレーム内符号化モード(予測信号=0)のうち最適な予測モードが選択され、選択された予測モードに対応する予測信号132が出力される。この動き補償予測回路101から出力される予測信号132は、減算回路103において入力画像信号131から減算され、予測残差信号133が出力される。
予測残差信号133はDCT(離散コサイン変換)回路104において一定の大きさのブロック単位で離散コサイン変換され、これにより得られたDCT係数は量子化回路105において量子化幅制御部121により制御された量子化幅(量子化ステップサイズともいう)で量子化される。量子化回路105からの出力は2分岐され、一方は第1の可変長符号化回路106で可変長符号化され、他方は逆量子化回路107で逆量子化され、さらに逆DCT回路108で逆離散コサイン変換される。逆DCT回路108からの出力は、加算回路109において適応予測信号132と加算され、フレームメモリ102に記憶される。
一方、動き補償予測回路101において選択された予測モードおよび動きベクトルを示すサイド情報134は、第2の可変長符号化回路110で可変長符号化される。この際、動きベクトル情報については隣接の既に符号化したブロックの動きベクトルとの差分が可変長符号化される。
第1および第2の可変長符号化回路106,110からの出力と、量子化幅制御部121からの量子化幅を示す情報は、マルチプレクサ111において多重化され、出力符号列135として出力される。
ここで、動き補償予測回路101において動き補償予測における動き補償を行う単位ブロックの大きさ(以下、動き補償サイズという)は可変であり、動き補償サイズ制御部122によって制御される。動き補償サイズ制御部122からは動き補償サイズの情報を含む動き補償領域を示す情報140が出力され、この動き補償領域情報140も第2の可変長符号化回路110で符号化され、出力符号列135中に付加されて出力される。動き補償サイズ制御部122では、第2の可変長符号化回路110の出力を受け、少なくとも予測に用いた情報である動きベクトル情報の情報量(符号量)に応じて動き補償サイズを制御する。以下、この動き補償サイズの制御方法について、詳細に説明する。
ここで、動き補償予測回路101において動き補償予測における動き補償を行う単位ブロックの大きさ(以下、動き補償サイズという)は可変であり、動き補償サイズ制御部122によって制御される。動き補償サイズ制御部122からは動き補償サイズの情報を含む動き補償領域を示す情報140が出力され、この動き補償領域情報140も第2の可変長符号化回路110で符号化され、出力符号列135中に付加されて出力される。動き補償サイズ制御部122では、第2の可変長符号化回路110の出力を受け、少なくとも予測に用いた情報である動きベクトル情報の情報量(符号量)に応じて動き補償サイズを制御する。以下、この動き補償サイズの制御方法について、詳細に説明する。
図2は、動き補償単位ブロックの第1の例を動きベクトルと共に示したものである。図2の例では、基本的に(a)のようにフレーム毎に定められた一定の大きさのブロックを動き補償単位ブロックとして、このブロックに区切って動き補償を行う。但し、画面端で一定のブロックの大きさでは割り切れない余りが生じた場合には、余りの部分は図2(b)のように小さなブロックとするか、あるいは隣接のブロックに統合する。動き補償単位ブロックの大きさ(動き補償サイズ)はフレーム単位に一定であるため、動き補償領域情報140はフレーム毎に1回符号化すればよく、これに伴う符号量の増加は極くわずかである。区切られた単位毎に動きベクトル検出を行い、図2中の矢印で示したように単位ブロック毎に一つずつ動きベクトルを求める。なお、(0,0)の動きベクトルは図2において「・」の記号で示してある。
図2(a)および(b)はそれぞれ動き補償単位ブロックを小さく取った場合および大きく取った場合の例である。図2(a)のように動き補償単位ブロックを小さくすると、それだけ細かな領域毎に動き補償が行われることになるため、動き補償の精度が向上し、予測残差信号133の符号量は少なくなる。しかし反面、多くの動きベクトル情報を符号化しなければならないため、動きベクトル情報の符号量が増加してしまう。一方、図2(b)のように動き補償単位ブロックを大きく取った場合には、図2(a)より動き補償精度は低下し、予測残差信号133の符号量は多くなくなるが、動きベクトル符号量は少なくなる。
このように、動き補償単位ブロックの大きさ、つまり動き補償サイズは、予測残差信号133の符号量(第1の可変長符号回路106の発生符号量)と動きベクトル情報の符号量とのトレードオフで最適なものがあるため、いくつかの動き補償サイズの候補を用意しておいて、それらの候補の中で予測残差信号と動きベクトル情報のトータルの符号量が最小となるようなサイズを選択すれば、最適な動き補償サイズを決定することができる。
但し、サイズ毎に動きベクトルを求め直すことが演算量の点から困難である場合には、最初に小さなブロック毎に動きベクトルを求めておき、大きなブロックサイズの動きベクトルは、フレーム上で位置的にそのブロックの中に入る動きベクトルあるいは隣接する小ブロックの動きベクトルを基に推定してもよい。あるいは、最初に大きなブロック単位に動きベクトルを検出し、小さなブロックの動きベクトルはフレーム上で位置的に含まれる大きなブロックの動きベクトルを基にしてその周囲で動きベクトル探索を行うようにしてもよい。
以上のようにして動き補償サイズを決定し、かつ動きベクトル検出を行うことにより、サイズ毎に動きベクトルを求め直す場合に比べて演算量は大幅に低下する。なお、予測残差信号133の符号量は実際にDCT、量子化、可変長符号化を行って符号量を調べてもよいが、予測残差信号133の自乗和、絶対値和等を基に符号量を推定するようにしてもよい。
ところで、画面内に複雑な動きが含まれる場合には、小さな動き補償単位で符号化を行おうとすると、動きベクトルの符号量が膨大なものとなる。この結果、量子化幅を非常に大きくしなければならなくなって符号化品質が低下したり、動きベクトル情報だけで符号量が設定符号量を上回ってしまい、符号量制御不能に陥ることがある。これを防ぐために、動きベクトル情報の符号量があるしきい値を上回らないように動き補償サイズの制御を行ってもよい。具体的には、例えば以下のようなアルゴリズムで制御を行えばよい。
if(MC_bits(t−1)>th1){
size=size(t−1)+C;
}else if(MC_bits(t−1)<th2){
size=size(t−1)−C;
}else{
size=size(t−1);
}
ここで、
size:動き補償サイズ(動き補償単位の大きさ)
size(t−1):直前に符号化したフレームの動き補償サイズ
MC_bits(t−1):直前に符号化したフレームの動きベクトル情報の符号量
th1,th2:しきい値(th1>th2)
C:定数
である。
size=size(t−1)+C;
}else if(MC_bits(t−1)<th2){
size=size(t−1)−C;
}else{
size=size(t−1);
}
ここで、
size:動き補償サイズ(動き補償単位の大きさ)
size(t−1):直前に符号化したフレームの動き補償サイズ
MC_bits(t−1):直前に符号化したフレームの動きベクトル情報の符号量
th1,th2:しきい値(th1>th2)
C:定数
である。
図3は、この制御をフローチャートで表したものである。すなわち、まず直前に符号化したフレームの動きベクトルの符号量:MC_bits(t−1)がしきい値th1を越えているかどうかを調べ(S11)、th1を越えていれば直前に符号化したフレームの動き補償サイズ:size(t−1)から定数Cを減じたものを新たな動き補償サイズ:sizeとする(S12)。
一方、符号量:MC_bits(t−1)がしきい値th1以上でない場合には、さらに符号量:MC_bits(t−1)がしきい値th2に満たないかどうかを調べ(S13)、th2に満たない場合は直前に符号化したフレームの動き補償サイズ:size(t−1)に定数Cを加えたものを新たな動き補償サイズ:sizeとし(S14)、そうでなければ直前に符号化したフレームの動き補償サイズ:size(t−1)を新たな動き補償サイズとする(S15)。
この例では、直前に符号化したフレームと現フレームの動きベクトル符号量には強い相関があることを利用して直前フレームの動きベクトル符号量でサイズの制御を行っている。直前に符号化したフレームの動きベクトル符号量がしきい値th1を上回るほど多い場合には、そのままのサイズで符号化すると動きベクトル符号量が過度に大きくなる可能性があるため、サイズを大きくして動きベクトル符号量を抑え、逆に以前に符号化したフレームの動きベクトル符号量を十分少ない場合にはサイズを小さくして動き補償精度を向上させるように制御する。
このような制御を行うことにより、動きが非常に複雑な画像でも動きベクトル符号量が過度に多くなって符号量制御不能に陥ったり量子化幅が大きくなりすぎることによって符号化品質が低下するといった問題がなくなり、また動きが小さく動きベクトル符号量がそれほど多くない画像では、高い精度で動き補償を行うことができる。
なお、動き補償サイズにある上限および下限を設け、サイズが一定の範囲内におさまるようにしてもよい。これによって、動き補償サイズが大きくなりすぎて動き補償の精度が低下しすぎたり、動き補償サイズが小さくなりすぎて動きベクトル符号量が極端に多くなることを防ぐことができる。
また、しきい値th1,th2は設定符号量等によって定められる定数としてもよいが、動きの大きさや動きベクトルが(0,0)となる領域の大きさ等を変えるようにしてもよい。
なお、本発明は一部の動き補償ブロックをさらに細かなブロックに分割してそれぞれ動き補償を行う技術と組み合わせて用いることも可能である。図4に、そのような分割を行ったときの動き補償ブロックの例を動きベクトルと共に示す。図中で破線によって示されているブロックが分割されたブロックであり、各分割ブロック毎に動きベクトルを求める。分割を行うか行わないかを示す情報も符号化する。特に、図4(b)のように動き補償ブロックを大きく取った場合には、大きなブロックでは動き補償精度が著しく低下する部分のブロックのみを分割して細かな単位で動き補償することにより、その部分の動き補償精度を向上させることができる。
なお、本発明は一部の動き補償ブロックをさらに細かなブロックに分割してそれぞれ動き補償を行う技術と組み合わせて用いることも可能である。図4に、そのような分割を行ったときの動き補償ブロックの例を動きベクトルと共に示す。図中で破線によって示されているブロックが分割されたブロックであり、各分割ブロック毎に動きベクトルを求める。分割を行うか行わないかを示す情報も符号化する。特に、図4(b)のように動き補償ブロックを大きく取った場合には、大きなブロックでは動き補償精度が著しく低下する部分のブロックのみを分割して細かな単位で動き補償することにより、その部分の動き補償精度を向上させることができる。
また、動き補償ブロック、つまり動き補償を行う単位領域の形状および大きさは、画像内の部分毎に異なっていてもよい。図5は、このような動き補償単位領域を動きベクトルと共に示した例である。フレーム内は図中の太線で示した画面上の対象物の概形を示す領域に分割されており、それがさらに細線で示す小領域に分割されている。この領域分割に関する情報も動き補償サイズ情報140中に含めて符号化する。
図5(a)と(b)は、動き補償単位領域をそれぞれ細かな領域および大きな領域に分割した例である。図5(a)と(b)とでは、太線を表す精度および、太線領域内をいくつの細線領域に分割するかが異なっている。図5(a)の方が図5(b)よりも太線を表す精度が高く、それだけ対象物体の概形を高い精度で表すことが可能となり動き補償の精度は高いが、領域情報は多い。さらに、図5(a)のほうが図5(b)よりも細かな補線領域に分割されているため、動き補償の精度は高いが動きベクトル情報は多くなる。そこで、動き補償精度と領域情報量および動きベクトル情報量とのトレードオフを考慮して、最適な領域に分割し符号化を行う。
なお、太線の表現精度および太線領域をどの程度の細線領域に分割するかは各太線領域で異なるものとしてもよい。例えば、人物の顔部分のように非常に重要な対象物体に対してはなるべく高い精度で太線を表現すると共に細かな細線領域に分割するようにし、背景部分のようにそれほど重要でない部分は太線を粗く表現すると共に大きな細線領域に分割する。図5(a)から図5(b)のように領域を粗くしていく場合にも、顔領域等の重要な領域はあまり粗い領域とならないようにし、背景部分のように重要度が高くない領域は粗い領域となるようにする。このように画像内で重要な部分とそうでない部分で領域が粗くする程度を変えることにより、画像全体の動き情報量を削減しても重要な領域は高い動き補償精度をとることができ、符号化画像の主観的品質が向上する。
以上の例では、動き補償単位領域内で同一の動きベクトルを用いることとしたが、隣接の領域の動きベクトルを用いて動きベクトルの補間を行い、領域内で異なる動きベクトルを用いることにしてもよい。また、動き補償単位の大きさに応じて補間の方法を変えたり、補間を行うか否かを選択するようにしてもよい。
図6は、図1の動画像符号化装置に対応した動画像復号化装置である。図1の動画像符号化装置から伝送/蓄積系を介して入力された符号列235は、動き補償情報符号列、予測残差信号符号列および量子化幅情報に分離され、それぞれ第1の可変長復号回路210、第2の可変長復号回路206および逆量子化回路207に入力される。
第2の可変長復号回路206では予測残差信号が可変長復号され、さらに逆量子化回路207において逆量子化、逆DCT回路208で逆離散コサイン変換という一連の処理が行われ、加算回路209で予測信号232と加算されることにより再生画像信号250が生成される。再生画像信号250は動画像復号化装置の外部へ出力されると共に、フレームメモリ220に記憶される。
一方、第1の可変長復号回路210では、動き補償情報符号列から予測モードおよび動きベクトル情報234と動き補償領域情報230が復号され、予測回路201へ入力される。予測回路201は、フレームメモリ220に記録されている復号画像信号を基にして、これらの情報234および240に従って図1における予測信号132と同一の信号232を出力する。
以上の処理は、図1の動画像符号化装置に対応して画像信号を再生する処理であり、逆量子化回路207、逆DCT回路208、加算回路209およびフレームメモリ209が行う処理は、それぞれ図1における逆量子化回路107、逆DCT回路108、加算回路109およびフレームメモリ120が行う処理とその実現手段は異なる場合もあるが本質的に同一である。また、第1および第2の可変長復号回路210,206およびデマルチプレクサ211は、それぞれ図1の可変長符号化回路110,106およびマルチプレクサ111の処理の逆の処理を行う。
図7は、本発明による動画像符号化装置の第2の実施形態のブロック図であり、第1の実施形態と同様に動き補償適応予測DCT符号化方式を用いた例である。また、本実施形態においても第1の実施形態で説明した動き補償領域の大きさを可変にする方式を用いているが、この部分は第1の実施形態との差異についてのみ詳細に説明する。
入力画像信号331はまずダウンサンプリング回路321において、必要に応じて入力画像信号331よりも空間的に少ない画素数にダウンサンプリングされる。入力画像信号331またはダウンサンプリングされた入力画像信号341は、減算回路303において予測回路301で作成された予測信号332が減算されて予測残差信号333となり、この予測残差信号333はDCT回路304で離散コサイン変換された後、量子化回路305で量子化される。量子化された信号は2分岐され、一方は第1の可変長符号化回路306で可変長符号化され、他方は逆量子化回路307で逆量子化され、さらに逆DCT回路308で逆離散コサイン変換された後、加算回路309で予測信号332と加算されてフレームメモリ302に記憶される。
ここで、ダウンサンプリング回路321におけるダウンサンプリング比は、符号化フレーム毎に異なった値をとる。また、予測回路301はダウンサンプリングした画像信号341を入力画像信号と考え、これを予測する予測信号332を作成する。予測信号332を作成する際、フレームメモリ302に記憶されている既に符号化されたフレームの局部復号画像信号を用いるが、フレームメモリ302に記憶されているフレームの局部復号画像信号と入力画像信号331をダウンサンプリングした信号341のサンプリング密度が異なる場合には、サンプリング変換回路322で信号341と同一のサンプリング密度にサンプリング変換して予測に用いる。
入力画像信号に対するダウンサンプリング比および量子化幅は、量子化幅・ダウンサンプリング比制御部323で決定して制御する。具体的には、発生符号量が予め設定した値に近い値になるものの中で最適なダウンサンプリング比と量子化幅を選択して決定する。
最初に、フレーム内符号化を行う場合(予測信号332=0)のダウンサンプリング比および量子化幅の決定法を説明する。この場合、まず入力画像信号331のアクティビティを計算する。これは例えば、分散や各画素から平均値を引いた絶対値和や二乗和を用いればよい。
次に、図8(a)に示すような与えられた設定符号量に対するアクティビティと量子化幅の関係を基に、発生符号量が設定符号量となるような量子化幅の推定値を求める。ここで、設定符号量はフレーム内符号化に対する設定符号量としてトータルの発生符号量を基にそのフレームの符号化に先だって定めておく。また、アクティビティと量子化幅の関係は符号化前に予め決定しておいてもよいし、既に符号化した画像信号におけるアクティビティ、符号量、量子化幅の関係から更新するようにしてもよい。次に、入力画像信号をダウンサンプリングした画像信号のアクティビティをいくつかのダウンサンプリング比について計算する。この計算は実際に入力画像信号をダウンサンプリングして求めてもよい。
また、図9に示すようなサンプリング密度とアクティビティの関係を予め定めておき、これを基に入力画像信号331のアクティビティから変換して計算してもよく、この場合はダウンサンプリングした画像信号からアクティビティを計算する場合に比べて計算量を削減することができる。
次に、図8(b)(c)のようなダウンサンプリングを行った画像信号に対するアクティビティと量子化比幅の関係を用い、それぞれのダウンサンプリング比に対して設定符号量となる量子化幅の推定値を求める。以上のようにして求められたいくつかのダウンサンプリング比と量子化幅の組の中から、符号化に用いて最適なものを選択する。この選択は、例えば量子化幅がある値以下になる最高のサンプリング密度となる組を選択してもよい。このようにすれば、量子化幅が非常に大きくなって符号化品質が著しく低下することがなくなる。また、ダウンサンプリングによって失われる成分と、量子化によって生じる歪という2つの歪の合計が最小になるような組を選択してもよい。あるいは、これら2つの歪に視覚的特性を考慮した重み付けフィルタリングを行った値が最小になる組を選択してもよい。このようにすれば、視覚的に最適なサンプリング密度と量子化幅が選択される。
次に、動き補償フレーム間予測符号化を行う場合のダウンサンプリング比および量子化幅の決定法について説明する。この場合は、予測残差信号の分散や絶対値和を用いてアクティビティを計算する。ただし、各ダウンサンプリング比について動きベクトルを検出して予測画像信号を求めると演算処理量が膨大なものとなってしまう。このため、直前に符号化したフレームのアクティビティを基にこれをサンプリング密度に応じて変換した値を用いてもよい。あるいは、入力画像信号に対して動きベクトル検出を行って予測画像信号を求めてこのアクティビティをサンプリング密度に応じて変換するようにし、符号化における予測信号332を求める際にもこの入力画像信号に対する動きベクトルを変換した動きベクトルを用いて動き補償を行うようにしてもよい。以上のようにすることにより、アクティビティ計算のための演算処理量を削減することができる。計算されたアクティビティからダウンサンプリング比と量子化幅の組を選択する手順は、上述のフレーム内符号化の場合と同様である。ただし、フレーム毎の設定符号量やアクティビティと量子化幅の関係、サンプリング密度とアクティビティの関係はフレーム内符号化とは異なるものを用いる。
なお、ダウンサンプリング比の決定はフレーム内符号化とフレーム間符号化で異なる方法を用いてもよい。例えば、フレーム間符号化については動きの大きさを考慮して決定するようにしてもよい。これは、例えば動きベクトル等動き補償に関する情報の発生符号量を基に、以下のようなアルゴリズムで制御を行うことにより実現することできる。
if(frame_size(t−1)>MIN_SIZE && MC_bits(t−1)>th1){
frame_size=frame_size(t−1)−C;
}else if(frame_size(t−1)<MAX_SIZE && MC_bits(t−1)<th2){
frame_size=frame_size(t−1)+C;
}else{
frame_size=frame_size(t−1);
}
ここで、
frame_size:ダウンサンプリング画像信号のフレーム内画素数
frame_size(t−1):直前に符号化したフレームのダウンサンプリング画像信号のフレーム内画素数
MC_bits(t−1):直前に符号化したフレームの動きベクトルの符号量
th1,th2:しきい値(th1>th2)
C:定数
MIN_SIZE:フレーム内画素数の最小値
MAX_SIZE:フレーム内画素数の最大値=入力動画像信号のフレーム内画素数
である。
frame_size=frame_size(t−1)−C;
}else if(frame_size(t−1)<MAX_SIZE && MC_bits(t−1)<th2){
frame_size=frame_size(t−1)+C;
}else{
frame_size=frame_size(t−1);
}
ここで、
frame_size:ダウンサンプリング画像信号のフレーム内画素数
frame_size(t−1):直前に符号化したフレームのダウンサンプリング画像信号のフレーム内画素数
MC_bits(t−1):直前に符号化したフレームの動きベクトルの符号量
th1,th2:しきい値(th1>th2)
C:定数
MIN_SIZE:フレーム内画素数の最小値
MAX_SIZE:フレーム内画素数の最大値=入力動画像信号のフレーム内画素数
である。
図10は、この制御をフローチャートで表したものである。すなわち、まず直前に符号化したフレームのダウンサンプリング画像信号のフレーム内画素数:frame_size(t−1)がフレーム内画素数の最小値:MIN_SIZEを越えているかどうかを調べ(S21)、MIN_SIZEを越えていれば、さらに直前に符号化したフレームの動きベクトルの符号量:MC_bits(t−1)がしきい値th1を越えているかどうかを調べ(S22)、th1を越えていればframe_size(t−1)から定数Cを減じたものを新たなフレームのダウンサンプリング画像信号のフレーム内画素数:frame_sizeとする(S23)。
一方、直前に符号化したフレームのダウンサンプリング画像信号のフレーム内画素数:frame_size(t−1)がフレーム内画素数の最小値:MIN_SIZE以上でない場合には、frame_size(t−1)がフレーム内画素数の最大値:MAX_SIZEに満たないかどうかを調べる(S24). そして、frame_size(t−1)がMAX_SIZEに満たない場合は、さらに直前に符号化したフレームの動きベクトルの符号量:MC_bits(t−1)がしきい値th2に満たないかどうかを調べ(S25)、th2に満たない場合はframe_size(t−1)に定数Cを加えたものを新たなフレームのダウンサンプリング画像信号のフレーム内画素数:frame_sizeとし(S26)、そうでなければframe_size(t−1)を新たなフレームのダウンサンプリング画像信号のフレーム内画素数:frame_sizeとする(S27)。
この例は、一般に視覚的特性として動きが大きい場合には空間的解像度はある程度低くしてもよく、逆に動きが小さい場合には高い空間的解像度が要求されることを利用して、動きベクトル符号量が多い場合にはダウンサンプリング比を大きくとって空間的解像度を落とし、逆に動きベクトル符号量が少ない場合にはダウンサンプリング比を小さくとって空間的解像度を上げる制御を行う例である。このような制御を行うことによって視覚的に好適な解像度を保ちながら符号化を行うことができる。なお、直前に符号化したフレームと現フレームの動きベクトル符号量には強い相関があることを利用して直前フレームの動きベクトル符号量でダウンサンプリング比の制御を行っている。また、直前フレームの画素数から定数Cだけ増減するようにして画素数を決定しているが、これは直前フレームからあまり大きく解像度を変化させると視覚的に好ましくないという問題を防ぐためである。
また、しきい値th1、th2は設定符号量等によって定められる定数としてもよいが、動きの大きさや動きベクトルが(0,0)となる領域の大きさ等を変えるようにしてもよい。例えば、動きベクトル(MV)が(0,0)となる領域の数を基に図11のような関係を定義して決めてもよい。図11に示されるように、動きベクトル=(0,0)の領域が多い場合には、しきい値を大きくすることによってサンプリング密度に制御されるようになる。これにより、特に高い空間的解像度を保ったほうが好ましい静止部分つまりMV=(0,0)の領域で常に高い空間的解像度が保たれるようになり、静止した背景の前で物体や人物が動いているような画像信号において符号化品質が向上する。
なお、動き補償サイズについてもダウンサンプリング比を考慮して決定する。具体的には、例えばダウンサンプリング比と動き補償サイズの拡大比を等しくとるようにしてもよい。これにより、各動き補償領域内に含まれる画素数は一定に保たれるようになる。動き補償領域内の画素数はDCTの単位と同一、あるいはその整数倍という関係を常に保つようにすれば、DCT係数情報の一部と動き補償適応予測に関する情報の一部をまとめて可変長符号化することにより符号量を削減することが可能になる。さらに、動き補償単位内の画素数が常に一定であるため、動きベクトル検出および動き補償予測用のハードウエアを簡素化することができる。
図12は、本発明による動画像符号化装置の第3の実施形態のブロック図であり、やはり動き補償適応予測DCT符号化方式を用いた例である。また、本実施形態においても第1および第2の実施形態で説明した技術を用いているが、この部分は先の実施形態との差異についてのみ詳細に説明する。
本実施形態においても、第2の実施形態と同様に入力信号をダウンサンプリングして符号化する技術を用いているが、画像内の一部はダウンサンプリングせずに予測符号化を行っていること、およびその部分の予測信号を作成するために第2のフレームメモリを有している。
まず、予測回路401において第2のフレームメモリ425に記憶されている画像信号を基に入力画像信号431を予測する第1の予測信号を作成し、予測残差信号433が小さくなる領域を判定する。こうして判定された領域ではスイッチ424で入力画像信号431を選択し、また予測回路401からは予測信号432として前記第1の予測信号を出力して入力画像信号431と同じサンプリング密度で予測符号化を行う。第1の予測信号による予測残差が大きな領域では、第2の実施形態と同様に入力画像信号431をダウンサンプリング回路421でダウンサンプリングし、予測回路401でダウンサンプリングした画像信号に対する第2の予測信号を作成してこれを予測信号432として出力し、スイッチ424でダウンサンプリングした入力画像信号を選択して予測符号化を行う。
局部復号画像信号433は、第1のフレームメモリ402に記憶されるとともに、アップサンプリング回路426で入力画像信号431と同じサンプリング密度にアップサンプリングされた後、スイッチ428を介して第2のフレームメモリ425にも入力され、このフレームメモリ425の内容を一部書き換えするためにも用いられる。この場合、選択部427において第2のフレームメモリ425の書き換えを行う領域を決定する。これは、例えば入力画像信号と比較して予測残差が小さい領域を選択し、その選択情報をサイド情報として符号化するようにしてもよい。あるいは、動きベクトルの大きさが小さい領域を選択してもよいし、量子化されたDCT係数の自乗和、絶対値和等の評価量が小さい領域を選択してもよく、この場合は選択情報は符号化する必要がない。こうして選択部427で選択された領域について、第2のフレームメモリ425内のデータの書換えを行う。
なお、局部復号画像信号にはサンプリング密度が入力画像信号と同じ部分とダウンサンプリングされた部分がある。このため、サンプリング変換回路422におけるサンプリング密度変換の際にはこの2つの部分に対して異なる比でサンプリング変換を行い、フレーム内の全ての部分がダウンサンプリング回路421でダウンサンプリングされた入力画像信号と同一のサンプリング密度を持つようにする。
本実施形態のように入力画像信号と同一のサンプリング密度を有するフレームメモリを用いることにより、入力画像信号と同一解像度の信号を予測に用いることが可能になり、予測精度が向上する。すなわち、本実施形態では静止ないしは動きが小さい背景部分等のように、ダウンサンプリングを行わなくてもそれほど多くの符号量が発生しないため高い解像度を保つことが可能な部分と、大きな動きがある領域のように、予測効率が悪くダウンサンプリングを行わないと発生符号量が多くなり過ぎてしまう部分とを切り分けている。こうすることにより、画面全体をダウンサンプリングする場合に比べわずかな符号量の増加で、背景部分等の符号化品質を改善できる。さらに、第2のフレームメモリ425には動きベクトルが小さい部分や予測残差が小さい部分のみの書換えを行っているために背景部分が記憶されていることが多く、第1のフレームメモリ402に記憶されている局部復号画像信号からは予測することが不可能な、いわゆるアンカバードバックグラウンドを予測することが可能になる。
なお、入力画像信号431と同じサンプリング密度を有する第1の予測信号を作成する際には、第2のフレームメモリ425内で入力画像信号431と空間的に同一の位置にある画像信号を予測信号として用いてもよい。あるいは、動き補償を用いれば予測の精度を向上させることができる。パン、ズーム、回転、平行移動等を伴う背景部分を予測する場合にはグローバル動き補償を用いてもよく、少ない動き補償情報で高い精度の予測を行うことができる。
図13は、図12の動画像符号化装置に対応した動画像復号化装置である。符号化装置から伝送系または蓄積系を介して入力された符号列535は、デマルチプレクサ511で予測残差信号符号列、動き補償情報符号列、量子化幅情報およびサンプリング密度情報に分割され、それぞれ第1の可変長復号回路506、第2の可変長復号回路510、逆量子化回路507およびアップサンプリング回路521に入力される。第1の可変長復号回路506では予測残差信号が可変長復号され、さらに逆量子化回路507において逆量子化、逆DCT回路508で逆離散コサイン変換という一連の処理が行われ、加算回路509で予測信号532と加算される。
図12の動画像符号化装置でダウンサンプリングして符号化された部分は、アップサンプリング回路521で入力画像信号と同じサンプリング密度までアップサンプリングされてスイッチ528を介して再生画像信号550として出力され、ダウンサンプリングされなかった部分はそのままスイッチ528を介して再生画像信号550として出力される。選択部527で再生画像信号550の一部が選択され、第2のフレームメモリ525の内容の一部書き換えが行われる。
一方、第2の可変長符号回路510で動き補償情報符号列から予測モードおよび動きベクトル情報534と動き補償領域情報530が復号され、予測回路501へ入力される。予測回路501は、第1のフレームメモリ502および第2のフレームメモリ525に記憶されている復号画像信号を基にして、これらの情報534および530に従って図14における予測信号432と同一の予測信号532を出力する。
以上の処理は、図12の動画像符号化装置に対応して画像信号を再生する処理であり、逆量子化回路507、逆DCT回路508、加算回路509、フレームメモリ502,525、アップサンプリング回路526およびサンプリング変換回路522が行う処理は、それぞれ図12における逆量子化回路407、逆DCT回路408、加算回路409、フレームメモリ402,425、アップサンプリング回路426およびサンプリング変換回路422と、その実現手段は異なる場合もあるが本質的に同一である。また、選択部527は図12の選択部427で選択した部分と同一の部分を選択する。また、第1および第2の可変長復号回路506,510、およびデマルチプレクサ511は、それぞれ図1の可変長符号化回路406,410およびマルチプレクサ411と逆の処理を行う。
301…動き補償予測回路、302…フレームメモリ、303…減算回路、304…DCT回路、305…量子化回路、306…可変長符号化回路、307…逆量子化回路、308…逆DCT回路、309…加算回路、310…可変長符号回路、311…マルチプレクサ320…動き補償サイズ制御部、321…ダウンサンプリング回路、322…サンプリング変換回路、323…量子化幅・ダウンサンプリング比制御部、331…入力画像信号332…予測信号、333…予測残差信号、335…符号列、340…動き補償領域情報、341…ダウンサンプリング画像信号、401…動き補償予測回路、402…フレームメモリ、403…減算回路、404…DCT回路、405…量子化回路、406…可変長符号化回路、、407…逆量子化回路、408…逆DCT回路、409…加算回路、410…可変長符号回路、411…マルチプレクサ、420…動き補償サイズ制御部、421…ダウンサンプリング回路、422…サンプリング変換回路、423…量子化幅・ダウンサンプリング比制御部、431…入力画像信号、432…予測信号、433…予測残差信号、435…符号列、440…動き補償領域情報、441…ダウンサンプリング画像信号、501…動き補償予測回路、502…フレームメモリ、506…可変長復号回路、507…逆量子化回路、508…逆DCT回路、509…加算回路、510…可変長復号回路、511…デマルチプレクサ、522…サンプリング変換回路、52、5…フレームメモリ、530…動き補償領域情報、532…予測信号、534…予測モード/動きベクトル情報、550…再生画像信号
Claims (10)
- 入力画像信号をダウンサンプリングするダウンサンプリングステップと、
ダウンサンプリングされた画像信号について動き補償予測を行って予測信号を生成する予測ステップと、
前記ダウンサンプリングされた画像信号に対する前記予測信号の予測残差信号を符号化する符号化ステップと、
前記入力画像信号のフレーム毎に前記ダウンサンプリングステップでのダウンサンプリング比を決定するステップとを有することを特徴とする動画像符号化方法。 - 入力画像信号をダウンサンプリングするダウンサンプリングステップと、
ダウンサンプリングされた画像信号について動き補償予測を行って予測信号を生成する予測ステップと、
前記ダウンサンプリングされた画像信号に対する前記予測信号の予測残差信号を所定の符号化制御パラメータで符号化する符号化ステップと、
前記入力画像信号のフレーム毎に前記入力画像信号および前記予測残差信号の少なくとも一方の信号のアクティビティを用いて発生符号量が設定値となる前記ダウンサンプリングステップでのダウンサンプリング比と前記符号化制御パラメータとの複数の組み合わせを推定し、これら複数の組み合わせから最適な組み合わせを選択して決定するステップとを有することを特徴とする動画像符号化方法。 - 入力画像信号の第1領域をダウンサンプリングするダウンサンプリングステップと、
前記入力画像信号の前記第1領域およびダウンサンプリングされない第2領域についてそれぞれ動き補償予測を行って予測信号を生成する予測ステップと、
前記入力画像信号に対する前記予測信号の予測残差信号を所定の符号化制御パラメータで符号化する符号化ステップと、
符号化された信号から画像信号を復号する局部復号ステップと、
前記局部復号ステップにより復号された画像信号を前記予測ステップにおける前記第1領域についての動き補償予測のために一時記憶する第1の一時記憶ステップと、
前記局部復号ステップにより復号された画像信号のうち前記第1領域に対応する第3領域の画像信号をアップサンプリングするアップサンプリングステップと、
前記局部復号ステップにより復号された画像信号のうち前記第2領域に対応する画像信号と前記第3領域に対応する画像信号から再生画像信号を生成するステップと、
前記予測ステップにおける前記第2領域の予測のための画像信号を一時記憶する第2の一時記憶ステップと、
前記第2の一時記憶ステップに記憶されている画像信号の一部を前記再生画像信号に置き換えるステップとを有することを特徴とする動画像符号化方法。 - 符号化された予測残差信号及び動きベクトル情報を復号する復号ステップと、
復号された予測残差信号から予測信号を生成する予測ステップと、
前記予測残差信号と予測信号とを加算する加算ステップと、
前記加算ステップにより得られる加算信号をサンプリング密度情報に従ってアップサンプリングすることにより再生画像信号を生成するアップサンプリングステップとを有することを特徴とする動画像復号化方法。 - 入力画像信号のダウンサンプリングされた第1領域およびダウンサンプリングされない第2領域についてそれぞれ動き補償予測を行って予測信号を生成する予測ステップと、
前記第1領域および第2領域に対応する予測残差信号と前記予測ステップにより得られた予測信号から画像信号を復号する復号ステップと、
前記復号ステップにより復号された前記第2領域に対応する画像信号をアップサンプリングするアップサンプリングステップと、
前記復号ステップにより復号された前記第2領域に対応する画像信号と前記アップサンプリングステップによりアップサンプリングされた画像信号から再生画像信号を生成するステップと、
前記復号ステップにより復号された画像信号を前記第1領域の画像信号の予測のために一時記憶する第1の一時記憶ステップと、
前記復号ステップにより復号された画像信号を前記第2領域の画像信号の予測のために一時記憶する第2の一時記憶ステップと、
前記第2の一時記憶ステップに記憶されている画像信号の一部を前記再生画像信号に置き換えるステップとを有することを特徴とする動画像復号化方法。 - 入力画像信号をダウンサンプリングするダウンサンプリング手段と、
ダウンサンプリングされた画像信号について動き補償予測を行って予測信号を生成する予測手段と、
前記ダウンサンプリングされた画像信号に対する前記予測信号の予測残差信号を符号化する符号化手段と、
前記入力画像信号のフレーム毎に前記ダウンサンプリング手段でのダウンサンプリング比を決定する手段とを有することを特徴とする動画像符号化装置。 - 入力画像信号をダウンサンプリングするダウンサンプリング手段と、
ダウンサンプリングされた入力画像信号について動き補償予測を行って予測信号を生成する予測手段と、
前記入力画像信号に対する前記予測信号の予測残差信号を所定の符号化制御パラメータで符号化する符号化手段と、
前記入力画像信号および前記予測残差信号の少なくとも一方の信号のアクティビティを用いて発生符号量が設定値となる前記ダウンサンプリング手段でのダウンサンプリング比と前記符号化制御パラメータとの複数の組み合わせを推定し、これら複数の組み合わせから最適な組み合わせを選択して決定する手段とを有することを特徴とする動画像符号化装置。 - 入力画像信号の第1領域をダウンサンプリングするダウンサンプリング手段と、
前記入力画像信号の前記第1領域およびダウンサンプリングされない第2領域についてそれぞれ動き補償予測を行って予測信号を生成する予測手段と、
前記入力画像信号に対する前記予測信号の予測残差信号を所定の符号化制御パラメータで符号化する符号化手段と、
前記符号化手段により符号化された信号から画像信号を復号する局部復号手段と、
前記局部復号手段により復号された画像信号を前記予測手段における前記第1領域についての動き補償予測のために一時記憶する第1の一時記憶手段と、
前記局部復号手段により復号された画像信号のうち前記第1領域に対応する第3領域の画像信号をアップサンプリングするアップサンプリング手段と、
前記局部復号手段により復号された画像信号のうち前記第2領域に対応する画像信号と前記第3領域に対応する画像信号から再生画像信号を生成する手段と、
前記予測手段における前記第2領域の予測のための画像信号を一時記憶する第2の一時記憶手段と、
前記第2の一時記憶手段に記憶されている画像信号の一部を前記再生画像信号に置き換える手段とを有することを特徴とする動画像符号化装置。 - 符号化された予測残差信号及び動きベクトル情報を復号する復号手段と、
復号された予測残差信号から予測信号を生成する予測手段と、
前記予測残差信号と予測信号とを加算する加算手段と、
前記加算手段からの出力信号をサンプリング密度情報に従ってアップサンプリングすることにより再生画像信号を生成するアップサンプリング手段とを有することを特徴とする動画像復号化装置。 - 入力画像信号のダウンサンプリングされた第1領域およびダウンサンプリングされない第2領域についてそれぞれ動き補償予測を行って予測信号を生成する予測手段と、
前記第1領域および第2領域に対応する予測残差信号と前記予測手段により得られた予測信号から画像信号を復号する復号手段と、
前記復号手段により復号された前記第1領域に対応する画像信号をアップサンプリングするアップサンプリング手段と、
前記アップサンプリング手段によりアップサンプリングされた画像信号と前記復号手段により復号された前記第2領域に対応する画像信号から再生画像信号を生成する手段と、
前記復号手段により復号された画像信号を前記第1領域の画像信号の予測のために一時記憶する第1の一時記憶手段と、
前記復号手段により復号された画像信号を前記第2領域の画像信号の予測のために一時記憶する第2の一時記憶手段と、
前記第2の一時記憶手段に記憶されている画像信号の一部を前記再生画像信号に置き換える手段とを有することを特徴とする動画像復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003347222A JP2004040833A (ja) | 2003-10-06 | 2003-10-06 | 動画像符号化方法及び装置並びに動画像復号化方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003347222A JP2004040833A (ja) | 2003-10-06 | 2003-10-06 | 動画像符号化方法及び装置並びに動画像復号化方法及び装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14768094A Division JP3778960B2 (ja) | 1994-06-29 | 1994-06-29 | 動画像符号化方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004040833A true JP2004040833A (ja) | 2004-02-05 |
Family
ID=31712823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003347222A Pending JP2004040833A (ja) | 2003-10-06 | 2003-10-06 | 動画像符号化方法及び装置並びに動画像復号化方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004040833A (ja) |
-
2003
- 2003-10-06 JP JP2003347222A patent/JP2004040833A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3778960B2 (ja) | 動画像符号化方法及び装置 | |
JP4186242B2 (ja) | 画像信号処理装置及び画像信号処理方法 | |
KR100803611B1 (ko) | 영상의 부호화, 복호화 방법 및 장치 | |
US6104434A (en) | Video coding apparatus and decoding apparatus | |
JP3788823B2 (ja) | 動画像符号化装置および動画像復号化装置 | |
KR100703788B1 (ko) | 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더 | |
EP1737243A2 (en) | Video coding method and apparatus using multi-layer based weighted prediction | |
JPH10341443A (ja) | 動画像符号化装置及び復号化装置並びに動画像符号化方法及び復号化方法 | |
JP2005506815A (ja) | 空間拡張可能圧縮のための方法及び装置 | |
KR20060088461A (ko) | 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치 | |
US20140247890A1 (en) | Encoding device, encoding method, decoding device, and decoding method | |
KR20040069210A (ko) | 코딩 정보 및 로컬 공간 특징을 이용한 디지털 비디오신호들의 후처리에서의 선명도 향상 | |
JP2006509437A (ja) | デジタルビデオ処理に対する統一測定基準(umdvp) | |
JPH10178645A (ja) | 動画像信号符号化方法及び装置、動画像信号伝送方法並びに信号記録媒体 | |
JP3787650B2 (ja) | デイジタル画像信号符号化装置及び方法、符号化画像信号復号装置及び方法 | |
JP2007522742A (ja) | 非線形量子化に基づくビデオ画像の符号化及び復号化 | |
JP3982615B2 (ja) | 符号化動画像データの方式変換装置 | |
JP5130245B2 (ja) | 撮影解像度予測型動画像符号化装置および復号装置 | |
JP4028900B2 (ja) | 動画像符号化装置及び動画像復号化装置 | |
KR20060069227A (ko) | 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치 | |
JP2614212B2 (ja) | 画像信号の符号化方法およびその装置 | |
JP2002058032A (ja) | 画像符号化装置および方法、画像復号装置および方法、ならびに画像処理装置 | |
JP4133581B2 (ja) | テロップ合成装置、テロップ合成方法及びテロップ合成プログラム | |
KR0172902B1 (ko) | 엠펙 ii 부호기 | |
JP2004040833A (ja) | 動画像符号化方法及び装置並びに動画像復号化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050426 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050627 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060725 |