JP2009272792A - 動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム - Google Patents

動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム Download PDF

Info

Publication number
JP2009272792A
JP2009272792A JP2008120155A JP2008120155A JP2009272792A JP 2009272792 A JP2009272792 A JP 2009272792A JP 2008120155 A JP2008120155 A JP 2008120155A JP 2008120155 A JP2008120155 A JP 2008120155A JP 2009272792 A JP2009272792 A JP 2009272792A
Authority
JP
Japan
Prior art keywords
orthogonal transform
transform coefficient
coefficient
signal
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008120155A
Other languages
English (en)
Other versions
JP4784618B2 (ja
Inventor
Motoharu Ueda
基晴 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2008120155A priority Critical patent/JP4784618B2/ja
Publication of JP2009272792A publication Critical patent/JP2009272792A/ja
Application granted granted Critical
Publication of JP4784618B2 publication Critical patent/JP4784618B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】復号画像信号に平滑化処理を行うことなく、動き補償予測符号化を用いた場合の予測誤差成分に起因する符号化歪を低減すると共に、消失した高解像度成分や動き補償ミスマッチ成分を復元し、劣化の少ない復号画像を得ることを可能とする。
【解決手段】直交変換係数推定器118は、復号されたDCT係数から、量子化されたDCT係数が失われた係数成分を推定し、その推定されたDCT係数を出力する。係数補正器119は、直交変換係数推定器118から出力される推定されたDCT係数と、逆量子化器110から出力される復号されたDCT係数とより、入力画像信号の持っていたDCT係数が量子化で失われた成分を判断し係数に補正を加える。補正DCT係数は、逆直交変換器111により逆DCT処理され、復号された画像信号として加算器112及び2次元ブロック逆変換器113を介して、参照画像メモリ114に参照画像として格納される。
【選択図】図1

Description

本発明は動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラムに係り、特に動き補償予測符号化を用いて動画像信号を符号化して符号化動画像信号を得る動画像符号化装置及び動画像符号化プログラム、並びに符号化動画像信号を復号化する動画像復号化装置及び動画像復号化プログラムに関する。
近年、デジタル化された画像・音声信号に対して高能率符号化による圧縮された情報を用いて、記録媒体により長時間のコンテンツを記録する装置や、衛星や地上局等からのデジタル放送波やネットワークを介してコンテンツを配信するサービスが実用化されている。このようなサービスにおいては、膨大な情報量を持つ画像・音声の情報を大量に放送・伝送するために、大きな圧縮率を実現する高能率符号化が必要となっている。この動画像の高能率符号化として国際規格であるMPEG2(Moving Picture Experts Group phase 2)、MPEG4(Moving Picture Experts Group phase 4)、ASP(Advanced Simple Profile)、MPEG4 AVC(Advanced Video Coding)等の符号化方式が用いられている。これらの符号化方式においては、画像信号の隣接画素間(空間方向)の相関および、隣接するフレーム間やフィールド間(時間方向)の相関を利用して情報量を圧縮する方式を用いている。一例として、以下にMPEG2画像符号化処理に関しての説明を行う。
MPEG2においては、時間的に連続して入力される画像フレームを、基準フレームと予測フレームに振り分けて処理を行う。基準フレームは空間方向の相関のみを用いて符号化することで、そのフレームの符号化データのみで復元することができる。予測フレームは、基準となるフレームからの時間方向の相関と空間方向の相関を共に用いて符号化することにより、基準フレームに対してより符号化効率を高めることができる。予測フレームの符号化データは、復元された基準フレームと予測フレームの符号化データより復元される。
基準フレームの画像信号は、輝度信号で水平方向16画素、垂直方向16画素のマクロブロックと呼ばれる処理単位に分割される。分割されたマクロブロックのデータは、更に水平方向8画素、垂直方向8画素単位の2次元ブロックに分割され、直交変換の一種であるDCT(Discrete Cosine Transform:離散コサイン変換)処理が行われる。
DCT変換後の信号はその2次元ブロックの周波数成分に準じた値を示すため、一般的な画像では低域に成分が集中する。また、高周波数成分の情報劣化は低周波数成分の情報劣化よりも視覚的に目立ちにくい性質がある。よって、低周波数成分を細かく高周波数成分を粗く量子化し、それにより得られた係数成分と成分が無い係数0の連続する長さを可変長符号化することにより、情報量を圧縮している。
予測フレームの画像信号は、基準フレームと同様に、輝度信号で水平方向16画素、垂直方向16画素のマクロブロックの単位に分割される。予測フレームにおいては、マクロブロック毎に基準フレームとの間の動きベクトルが求められ、マクロブロックの各画素に対して、動きベクトルにより切り出された2次元ブロックの各画素との差分ブロックが生成される。正確な動きベクトルが検出された場合には、差分ブロックの情報量は元のマクロブロックの持っている情報量よりも大幅に少なくなるため、基準フレームよりも粗い量子化処理が可能となる。
動きベクトルの検出は、一般的にブロックマッチングにより求められる。このブロックマッチングでは、マクロブロックの各画素と、動きベクトル値だけマクロブロックの存在する水平・垂直の位置を動かした場所の基準フレームを水平方向16画素、垂直方向16画素にブロック化した各画素の差分絶対値総和(もしくは差分二乗総和)を求め、その最小値を取る動きベクトルの値を、検出された動きベクトルとして出力する。画面の動きによっては、予測フレームとマッチングする画像が参照フレーム内に存在しない場合もあるため、差分ブロックを符号化するか非差分ブロック(イントラブロック)を符号化するかを選択し(予測モード判定)、選択されたブロックに対して基準フレームと同様にDCT・可変長符号化処理を施し、情報量を圧縮する。
図12は、従来の動画像符号化装置の一例のブロック図を示す。この動画像符号化装置は、上記のMPEG2符号化方式による動画像符号化装置である。同図において、入力端子1200より入力された符号化対象の動画像信号であるデジタル画像信号は、入力画像メモリ1201に供給されて記憶され、符号化シンタックスに従って符号化される順番に並べ替えを行うため遅延される。入力画像メモリ1201から出力されたデジタル画像信号は、2次元ブロック変換器1202にてマクロブロックが切り出される。
基準フレームにおいては、2次元ブロック変換器1202から出力されたマクロブロックデータは、減算器1203を介して直交変換器1204に供給され、水平方向8画素、垂直方向8画素の2次元ブロック単位で、直交変換の一種であるDCTが行われてDCT係数が出力される。DCT係数はさらに輝度信号で水平方向16画素、垂直方向16画素のマクロブロック単位にまとめられて、量子化器1205に送られる。量子化器1205においては、DCT係数を周波数成分毎に異なった値を持つ量子化マトリクスにより、係数毎に異なった値で除算することにより、量子化処理する。量子化されたDCT係数は、エントロピー符号化器1206において、符号化テーブル1207の係数に対応したアドレスを参照することにより、可変長または固定長の符号化が行われる。エントロピー符号化器1206から出力されたビットストリームは、ストリームバッファ1208に格納された後、出力端子1209を介して、記録媒体もしくは伝送路に出力される。
一方、量子化器1205において量子化されたDCT係数は、逆量子化器1210及び逆直交変換器1211において逆量子化及び逆DCT処理が順次に行われ、量子化されたDCT係数が復号される。逆直交変換器1211から出力された復号されたDCT係数は、加算器1212及び2次元ブロック逆変換器1213を介してローカルデコードデータとして生成され、参照画像メモリ1214に供給されて格納される。参照画像メモリ1214に格納されたローカルデコードデータは、予測フレームの符号化処理時に参照画像として使用される。
続いて、予測フレームにおいては、入力画像メモリ1201から切り出されたマクロブロックデータと参照画像メモリ1214に格納されている参照画像との間で、ME(動き推定)器1215によって、画像間での動きベクトルが求められる。ME器1215から出力された動きベクトルは、MC(動き補償)器1216に供給され、ここで参照画像メモリ1214内の参照画像から予測ブロックを切り出す。MC器1216では、複数切り出された予測ブロックの中から最適な予測モードの選択を行い、選択した予測ブロックを減算器1203及び加算器1212にそれぞれ供給する。
減算器1203は、入力画像ブロックと予測ブロックとの差分信号を直交変換器1204に送り出す。直交変換器1204は、上記の差分信号に対して、前記基準フレームの各ブロックと同様のDCT処理を行い、これにより得たDCT係数を量子化器1205により量子化処理させる。エントロピー符号化器1206は、MC器1216から出力される動きベクトルや予測モードを、量子化器1205から出力される符号化処理されたDCT係数と共に、所定の構文構造に基づいて符号化し出力することで、符号化ビットストリームを生成する。生成された符号化ビットストリームは、ストリームバッファ1208を介して出力端子1209に出力される。
一方、量子化器1205において量子化されたDCT係数は、逆量子化器1210及び逆直交変換器1211において逆量子化及び逆DCT処理が行われ、量子化されたDCT係数が復号され、更に加算器1212において予測ブロックと加算され、ローカルデコードデータが生成される。ローカルデコードデータは、参照を受ける画像の場合には2次元ブロック逆変換器1213を介して参照画像メモリ1214に供給されて参照画像として格納される。参照画像メモリ1214に格納された参照画像が、続く予測フレームの符号化処理時に使用される。
符号量の制御に関しては、符号量制御器1217においてエントロピー符号化器1206からストリームバッファ1208に出力されたビットストリームの符号量と、目標とする符号量との間で比較がとられ、目標符号量に近づけるために量子化器1205の量子化の細かさ(量子化スケール)を制御する。符号化処理における情報の集中度に依存して、量子化スケールが変動するため、集中度が十分でない場合には粗い量子化スケールで量子化が施されるため、それを復号した画像信号の品質が低下する。
図13は、従来の動画像復号化装置の一例のブロック図を示す。この動画像復号化装置は、MPEG2方式による復号化処理を行う装置である。同図において、入力端子1300に入力されたMPEG2方式で符号化された符号化信号からなるビットストリームは、ストリームバッファ1301に蓄えられ、エントロピー復号器1302に供給される。エントロピー復号器1302は、符号化テーブル1303を用いて可変長または固定長の符号を復号し、量子化されたDCT係数と動きベクトルや予測モードを復元する。
量子化されたDCT係数は、逆量子化器1304及び逆直交変換器1305において逆量子化及び逆DCT処理が行われ、復号データが生成される。基準フレームの場合には、加算器1306、2次元ブロック逆変換器1307を介して復号画像信号として出力画像メモリ1310に蓄えられて出力時刻順に並べ替えられた後、出力端子1311より出力される。また、復号画像信号は、参照画像メモリ1308にも供給されて格納される。
予測フレームにおいては、エントロピー復号器1302から出力される動きベクトル及びモード信号がMC(動き補償)器1309に入力され、参照画像メモリ1308より入力される参照画像を切り出す事により予測ブロックが生成される。生成された予測ブロックは加算器1306に供給され、復号データと加算される。加算器1306で加算された復号データは、基準フレームと同様に2次元ブロック逆変換器1307を介して復号画像信号として出力画像メモリ1310に蓄えられ出力時刻順に並べ替えられた後、出力端子1311より出力される。また、復号画像信号は該当フレームが参照を受ける画像の場合には、参照画像メモリ1308にも供給されて格納される。
上記のMPEG2の符号化方式にかかわらず、MPEG4 ASP、MPEG4 AVC等、多くの動画像符号化方式においては、2次元ブロック化された画像信号に対して、動き補償予測を施し時間方向の成分を集中させると共に、空間方向の成分に対してDCT等の直交変換を施し低域に成分を集中させ、高周波数成分を粗く量子化することで情報量を圧縮している。このような動画像符号化方式においては、必要以上の圧縮率で符号化する際に、DCT変換後の信号の高い周波数の収束度合いにより量子化スケールが上下することになり、高周波数成分の多い画像や、動き補償予測の精度が十分でない画像に関しては、量子化スケールが大きくなる。
量子化スケールが大きくなった場合に生じる劣化としては、2次元ブロックで画像信号が分割されて量子化処理が施されることに起因するブロック歪、動き補償予測が2次元ブロック単位で施されブロック毎の予測画像に不連続性が生じることに起因するブロック歪、画像信号そのものの高周波成分が粗く量子化されることによるモスキート歪、符号化される画像信号内に存在する物体のカメラに対する距離やフォーカス等が時間変化し、画面内の物体が変形することで動き補償予測にミスマッチが生じ、その結果生じる様々な周波数成分での誤差成分の蓄積による歪などが存在する。動き補償予測に用いられる参照画像信号は、符号化された信号の復号画像となるため、上記劣化成分は予測画像に混入されることにより更なる劣化を伴うことになる。
このような歪成分を低減させるための技術として、ブロック歪を低減させるフィルタ処理が考えられている(例えば、特許文献1参照)。この特許文献1においては、劣化成分の中のブロック歪に限定してその劣化を視覚的に低減させるために、復号化装置において、図13の出力画像メモリ1310に蓄えられた復号画像に対して、まず、図14(A)に示すようなブロックの境界の画素の差分を算出する。図14(A)において、対象ブロックをCとし、対象ブロックCの左側、上側、右側、下側にそれぞれ隣接する隣接ブロックをそれぞれL、U、R、Dとする。特許文献1記載の復号化装置では、対象ブロックCの画素C00、C10、・・・、C70と、隣接ブロックLの画素L07、L17、・・・、L77との各画素間の差分絶対値と、対象ブロックCの画素C00、C01、・・・、C07と、隣接ブロックUの画素U70、U71、・・・、U77との各画素間の差分絶対値と、対象ブロックCの画素C07、C17、・・・、C77と、隣接ブロックRの画素R00、R10、・・・、R70との各画素間の差分絶対値と、対象ブロックCの画素C70、C71、・・・、C77と、隣接ブロックDの画素D00、D02、・・・、D07との各画素間の差分絶対値をそれぞれ求める。
続いて、上記の復号化装置では、得られた上記のブロックの境界の各画素間差分絶対値と所定の閾値THとを比較して、すべての差分絶対値が閾値TH未満であるときは、ブロック歪が激しいと判断した境界を平均化させる低域フィルタ処理を施して、出力端子1211よりフィルタリングされた復号画像を出力する。ここで、上記の低域フィルタ処理では、例えば、対象ブロックCの画素C71と隣接ブロックDの画素D01とのブロック境界においては、図14(B)に示すように、対象ブロックCの画素C71とそれに上方向に隣接する2画素C61及びC51と、隣接ブロックDの画素D01とそれに下方向に隣接する画素D11の計5画素の値の平均値を求め、図14(C)に示すように、その平均値を対象ブロックCの画素C71の値C71’とする。
更に、動き補償予測による予測画像のブロック間不連続性を考慮したブロック歪低減フィルタとして、動き補償予測のブロック間の連続性を評価しフィルタ処理の強度を変化させることで、不必要なフィルタ処理を施さないような動作をさせる技術も開示されている(例えば、特許文献2参照)。この特許文献2に記載されたような処理は、MPEG4 AVC規格においては、符号化処理内で施すことが可能となるように定義されている。
特開平10−51775号公報 特許第3688283号公報
しかしながら、前述した特許文献1記載の復号化装置においては、DCT成分が量子化された際に生じるブロック境界の歪をブロック間の境界付近の画素に対する画像信号の平滑化を行うことで、不連続な状態を緩和することを試みているものの、歪成分の評価を復号画像の差分を基に判断しており、平滑化の強弱によってブロック間の不連続性を十分緩和することができない場合がある。
例えば、平滑化の強度が必要とする強度よりも弱い場合には、ブロック間の不連続性が十分改善することができずに依然としてブロック歪として影響が残る。また、平滑化の強度が必要とする強度よりも強い場合には、ブロック境界部分の不連続性は改善されるものの、ブロック境界部分のテクスチャ情報に対しても平滑化をかけすぎてしまうため、復号画像の解像度の低下が生じて必要なテクスチャ情報を消失する。
また、特許文献2記載の復号化装置においては、動き補償予測に用いられた動き量や使用した参照画像の同一性を基に予測画像の連続性を判断して、平滑化の強度を変化させている。このため、予測誤差が発生しない場合の復号画像への不必要な平滑化は避けられるものの、予測誤差が生じている場合に誤差のDCT成分が量子化されることにより生じるブロック歪には対応できておらず、歪成分の評価を特許文献1記載の復号化装置と同様に復号画像の視覚的検知から判断しており、本来画像信号に存在していた成分を復元する形の歪除去は施されていない。
以上のことから動き補償予測処理を用いた動画像符号化及び復号化においては、高い圧縮率で品質の良い復号画像を得るために、歪成分の評価を復号画像の視覚的検知からの判断からだけでなく、本来画像信号に存在していた成分を復元する形の歪除去を実現し、従来手法で行われていたブロック境界の歪成分を目立たなくする処理による解像度劣化の弊害を無くすと共に、十分に対応できていないモスキート歪や動き補償ミスマッチに起因する歪成分を除去する方法が必要となっている。
本発明は以上の点に鑑みなされたもので、復号画像信号に平滑化処理を行うことなく、動き補償予測符号化を用いた場合の予測誤差成分に起因する符号化歪を低減すると共に、消失した高解像度成分や動き補償ミスマッチ成分を復元し、劣化の少ない復号画像を得ることを可能とする、動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラムを提供することを目的とする。
上記の目的を達成するため、第1の発明は、入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して符号化を行う動画像符号化装置において、動き補償予測信号と、直交変換処理及び量子化処理が施された結果生成される量子化データを逆量子化することで生成される復号直交変換係数とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、直交変換係数推定手段より出力された推定直交変換係数と、復号直交変換係数と、量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に復号直交変換係数を推定直交変換係数に置き換えるか否かの判断を行って補正直交変換係数を生成する係数補正手段と、係数補正手段より出力される補正直交変換係数に逆直交変換処理を施して得た信号を動き補償予測信号と加算することで補正復号画像信号を生成する補正画像信号生成手段とを有し、補正復号画像信号を、続いて符号化対象となる動画像信号の参照画像として用いることを特徴とする。
また、上記の目的を達成するため、第2の発明は、入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して符号化された動画像信号のビットストリームを復号する、動画像復号化装置において、ビットストリームから量子化された直交変換係数と動きベクトルを復号するエントロピー復号手段と、エントロピー復号手段からの動きベクトルに基づき、過去の復号画像信号を参照信号として切り出して動き補償予測信号を生成する動き補償手段と、エントロピー復号手段より出力された量子化された直交変換係数を逆量子化することで生成される復号直交変換係数と、動き補償予測信号とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、直交変換係数推定手段より出力された推定直交変換係数と、復号直交変換係数及び量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に復号直交変換係数を推定直交変換係数に置き換えるか判断を行って補正直交変換係数を生成する係数補正手段と、係数補正手段より出力される補正直交変換係数に逆直交変換処理を行って得た信号に動き補償予測信号を加算することで補正復号画像信号を生成する補正復号画像信号生成手段とを有し、補正復号画像信号を、続いて符号化対象となる動画像信号の参照画像として用いることを特徴とする。
また、上記の目的を達成するため、第3の発明は、第2の発明と同様の動画像復号化装置において、ビットストリームから量子化された直交変換係数と動きベクトルを復号するエントロピー復号手段と、エントロピー復号手段からの動きベクトルに基づき、過去の復号画像信号を参照信号として切り出して動き補償予測信号を生成する動き補償手段と、エントロピー復号手段より出力された量子化された直交変換係数を逆量子化することで生成される復号直交変換係数と、動き補償予測信号とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、直交変換係数推定手段より出力された推定直交変換係数と、復号直交変換係数及び量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に復号直交変換係数を推定直交変換係数に置き換えるか判断を行い、置き換える係数と直交変換係数との差分情報である補正差分直交変換係数を出力する係数補正差分生成手段と、係数補正差分生成手段より出力される補正差分直交変換係数に対し、逆直交変換処理を施すことで補正差分信号に変換する逆直交変換手段と、復号直交変換係数を逆直交変換して得た信号と動き補償予測信号とを用いて復号した復号画像信号を参照画像として格納した後に、出力画像として出力する復号画像信号に対してのみ前記補正差分信号を加算して、再生画像に対して補正された復号画像信号を出力する画像信号復号手段とを有することを特徴とする。
また、上記の目的を達成するため、第4の発明は、入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して行う符号化をコンピュータにより実行させる動画像符号化プログラムにおいて、上記コンピュータを、第1の発明の構成である直交変換係数推定手段と、係数補正手段と、補正画像信号生成手段として機能させ、補正復号画像信号を続いて符号化対象となる動画像信号の参照画像として用いることを特徴とする。
また、上記の目的を達成するため、第5の発明は、入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して符号化された動画像信号のビットストリームを復号する、動画像復号化をコンピュータにより実行させる動画像復号化プログラムにおいて、上記コンピュータを、第2の発明のエントロピー復号手段と、動き補償手段と、復号直交変換係数と、直交変換係数推定手段と、係数補正手段と、補正復号画像信号生成手段として機能させ、補正復号画像信号を、続いて符号化対象となる動画像信号の参照画像として用いることを特徴とする。
また、上記の目的を達成するため、第6の発明は、第3の発明と同様の動画像復号化をコンピュータにより実行させる動画像復号化プログラムにおいて、上記コンピュータを、第3の発明のエントロピー復号手段と、動き補償手段と、直交変換係数推定手段と、係数補正差分生成手段と、逆直交変換手段と、画像信号復号手段として機能させることを特徴とする。
本発明によれば、動き補償予測処理が施された予測誤差信号が直交変換処理及び量子化処理によって生じる劣化成分を、量子化された予測誤差直交変換信号の切り捨てられた成分を推定する事により、劣化成分を補正することができる。その結果、復号画像信号に単純に平滑化処理を行い視覚的に目立たなくする方式でなく、ブロック間の不連続な状態に起因するブロック歪を解消すると共に、消失した高解像度成分や動き補償ミスマッチ成分を復元し、劣化の少ない復号画像を得ることができる。
また、本発明によれば、復号直交変換係数を推定する際に、ブロック内の信号の振る舞いを規定する2次関数等の所定のソースモデルで表現し、ブロック内の信号をブロックの境界条件に基づいて推定信号を生成する技術を用いる事で、ブロック間の歪成分が除去された形でブロック全体が保持している信号特性を推定できるため、領域情報により置き換え選択される有意な推定信号を生成でき、より補正処理を適切に機能できる。これにより、本発明によれば、従来よりも圧縮率を高めても劣化の少ない動画像符号化装置および動画像符号化プログラムを提供することができる。
更に、本発明によれば、従来よりも圧縮率が高められて伝送された情報を少ない劣化で再生できる、動画像復号化装置および動画像復号化プログラムを提供することができる。
次に、発明を実施するための最良の形態について図面を併せ参照して説明する。
(第1の実施の形態)
まず、本発明の動画像符号化装置、動画像復号化装置の第1の実施の形態について説明する。図1は、本発明になる動画像符号化装置の第1の実施の形態のブロック図を示す。
図1に示すように、本実施の形態の符号化装置は、入力端子100、入力画像メモリ101、2次元ブロック変換器102、減算器103、直交変換器104、量子化器105、エントロピー符号化器106、符号化テーブル107、ストリームバッファ108、出力端子109、逆量子化器110、逆直交変換器111、加算器112、2次元ブロック逆変換器113、参照画像メモリ114、ME(動き推定)器115、MC(動き補償)器116、符号量制御器117、直交変換係数推定器118、係数補正器119、及び画像バッファ120から構成される。入力端子100から符号量制御器117に関しては、従来技術である図12の入力端子1200から符号量制御器1217と同じ構成を用いる。本実施の形態は、加えて直交変換係数推定器118、係数補正器119を設けた点に特徴がある。
次に、本実施の形態の動画像符号化装置の動作について説明する。図1において、入力端子100より入力された符号化対象の動画像信号であるデジタル画像信号は、入力画像メモリ101に供給されて記憶され2次元ブロック変換器102にてマクロブロックデータが切り出される。マクロブロックデータは減算器103を介して直交変換器104に供給され、水平方向8画素、垂直方向8画素の2次元ブロック単位で直交変換の一種であるDCTが行われてDCT係数が出力される。DCT係数は更に輝度信号で水平方向16画素、垂直方向16画素のマクロブロック単位にまとめられて、量子化器105に送られる。
量子化器105はDCT係数に量子化処理を施す。エントロピー符号化器106は、量子化器105から出力された量子化されたDCT係数に対して、符号化テーブル107を参照して、可変長または固定長の符号化を行ってビットストリームを生成する。エントロピー符号化器106から出力されたビットストリームは、ストリームバッファ108を介して出力端子109より出力される。
一方、量子化器105において量子化されたDCT係数は、また、逆量子化器110において逆量子化処理が行われDCT係数が復号される。復号されたDCT係数は、直交変換係数推定器118及び係数補正器119に入力される、直交変換係数推定器118は、復号されたDCT係数から、量子化されたDCT係数が失われた係数成分を推定し、その推定されたDCT係数を出力する。係数補正器119は、直交変換係数推定器118から出力される推定されたDCT係数と、逆量子化器110から出力される復号されたDCT係数とより、入力画像信号の持っていたDCT係数が量子化で失われた成分を判断し係数に補正を加える。詳細動作は後述する。
係数補正器119から出力された補正DCT係数は、逆直交変換器111により逆DCT処理が行われ、復号された画像信号として加算器112及び2次元ブロック逆変換器113を介して、参照画像メモリ114に供給されて参照画像として格納される。基準フレームおいては、加算器112に入力される予測ブロックはMC器116より生成されないため、画像バッファ120は機能しない。参照画像メモリ114に格納された復号画像信号は、予測フレームの符号化処理時に参照画像として使用される。
続いて、予測フレームにおいては、ME(動き推定)器115は、入力画像メモリ101から切り出されたマクロブロックデータと参照画像メモリ114に格納されている画像との間で動きベクトルを求める。MC(動き補償)器116は、ME器115で求められた動きベクトルに基づいて、参照画像メモリ114内の参照画像から予測ブロックを切り出す。更に、MC器116では、複数切り出した予測ブロックの中から最適な予測モードの選択を行い、選択した予測ブロックを減算器103、画像バッファ120及び直交変換係数推定器118にそれぞれ供給する。
減算器103は、入力画像ブロックと予測ブロックとの差分信号を直交変換器104に送り出す。直交変換器104は、上記の差分信号に対して、前記基準フレームの各ブロックと同様のDCT処理を行い、これにより得た予測差分DCT係数を量子化器105により量子化処理させる。エントロピー符号化器106は、MC器116から出力される動きベクトルや予測モードを、量子化器105から出力される符号化処理されたDCT係数と共に、所定の構文構造に基づいて符号化し出力することで、符号化ビットストリームを生成する。生成された符号化ビットストリームは、ストリームバッファ108を介して出力端子109に出力される。
一方、量子化器105において量子化された予測差分DCT係数は、逆量子化器110において逆量子化処理が行われ予測差分DCT係数が復号される。復号された予測差分DCT係数は、直交変換係数推定器118及び係数補正器119に入力される、直交変換係数推定器118は、逆量子化器110から供給される復号された予測差分DCT係数と共に、MC器116より予測ブロックを受け取り、量子化された差分DCT係数が失われた係数成分を推定し、推定された差分DCT係数を出力する。係数補正器119は、直交変換係数推定器118で推定された差分DCT係数と、逆量子化器110で復号された差分DCT係数より、動き補償予測差分信号の持っていたDCT係数が量子化で失われた成分を判断し係数に補正を加える。この処理の詳細も後述する。
係数補正器119より出力された補正差分DCT係数は、逆直交変換器111により逆DCT処理が行われ、復号された予測差分信号とされる。画像バッファ120は、直交変換係数推定器118において、係数推定処理のために要する遅延を吸収するためのバッファであり、MC器116から出力された予測ブロック信号を固定時間遅延させ、加算器112に出力する。画像バッファ120の大きさは直交変換係数推定器118が要する遅延に依存し、遅延を生じない推定処理を行う場合には画像バッファ120を削除することが可能である。加算器112は、逆直交変換器111により得られた復号された予測差分信号と、画像バッファ120により遅延された予測ブロックとを加算し、復号画像信号を生成して出力する。
加算器112から出力された復号画像信号は、参照を受ける画像の場合には、2次元ブロック逆変換器113を介して参照画像メモリ114に供給されて参照画像として格納される。参照画像メモリ114に格納された参照画像が、続く予測フレームの符号化処理時に使用される。非参照となる予測フレームの場合には、逆量子化器110以降の復号画像信号生成処理は機能しなくてもよい。
次に、直交変換係数推定器118について更に詳細に説明する。図2は、直交変換係数推定器118の一実施の形態のブロック図を示す。同図において、直交変換係数推定器118には、MC器116より動き補償予測信号が、逆量子化器110より復号された予測差分DCT係数が入力される。動き補償予測信号は、直交変換器200において、水平方向8画素、垂直方向8画素の2次元ブロック単位で、直交変換(ここでは、直交変換の一種であるDCT)が行われて予測DCT係数とされて出力される。加算器201は、直交変換器200から出力された予測DCT係数と、逆量子化器110から出力された復号された予測差分DCT係数とを係数単位で加算することにより、復号DCT係数を生成する。この復号DCT係数は、復号画像信号に対して直交変換を施した結果と同等の成分になる。復号DCT係数は、係数バッファ202において水平方向分に相当するマクロブロック期間遅延される。本実施の形態では、水平方向分のマクロブロック係数を蓄積することにより、ターゲットとするDCTブロックの上下左右のDCTブロックに対する復号DCT係数を得る。
係数バッファ202からは、ターゲットとするDCTブロックとその上下左右のDCTブロックの復号DCT係数が、傾き相殺直交変換係数生成器203に入力される。傾き相殺直交変換係数生成器203においては、ターゲットとするブロックの画像信号と隣接するブロックの画像信号とのブロック境界を滑らかに接続するための、ブロック境界傾き相殺関数のDCT係数を生成する。
ブロック境界傾き相殺関数のDCT係数を生成する手法として、本実施の形態においては、ブロック境界の画像信号の傾きを境界条件としてポアソン方程式に適用することによってブロック内の予測信号を推定し、そのDCT係数を生成する多重調和局所余弦変換手法で用いられている推定技術を適用する。 続いて、この多重調和局所余弦変換手法の説明を行う。
図3は、多重調和局所余弦変換手法の基本概念を示すための概念図である。多重調和局所余弦変換手法は、公知の文献(Improvement of DCT-based Compression Algorithms Using Poisson's Equation)等で述べられているように、JPEG(Joint Photographic Experts Group)などで用いられるDCTの符号化効率を改善するための手法である。図3は、原画像フレーム内のある特定のブロックにおいて、その中のある特定のラインに注目し、注目したラインの原信号と、ブロック境界上にあるその原信号の境界の状態が、この手法によってどのように推移するかを示している。
図3(a)に示す原信号301に対して、ブロック境界304、305に対応する原信号301の両端部分における画像信号の傾き302、303を求める。この両端部分の画像信号の傾き302、303を境界条件とする。多重調和局所余弦変換手法は、ブロック内の信号の振る舞いを規定する2次関数等の所定のソースモデルを規定し、ブロック内の信号をその所定のソースモデルにより表現し、所定のソースモデルにより表現したブロック内の信号をブロックの境界条件に基づいて推定信号を生成することを、DCT(離散余弦変換)係数から導出できるようにした手法である。
ここでは、図3(b)に示すような原信号301の両端部分の画像信号の傾きを境界条件として、推定信号306を生成する。所定のソースモデルは、境界条件の下で原信号に最も近い信号を推定することができるモデルを採用することが望ましい。一般に、図3のような1次元の信号の場合には所定のソースモデルとして2次関数を適用することで容易に求めることが可能であるが、ここでは特にこのモデルに限定されるものではなく、1次関数等の低次の関数や、3次関数、4次関数等のより高次な関数でもよい。このように本実施の形態では、所定のソースモデルを導入することで膨大な演算量を費やしてポアソン方程式を数値的に解くことなく、解析的にブロック内の推定信号を生成している。
多重調和局所余弦変換手法においては、図3(b)のような境界条件に基づいた推定信号306を生成した後、原信号301と推定信号306との間で差分を求めることで、図3(c)に示すような残差信号307を生成する。このようにして求めた残差信号307に対して、通常の直交変換であるDCTや量子化及びエントロピー符号化を行うことで、通常のDCTによる符号化を行った場合よりも発生する符号量を抑制することが可能である。
本実施の形態においては、多重調和局所余弦変換手法におけるブロック内の推定処理を、復号画像信号に対して施すことにより、入力された原信号に近い信号を推定し、その推定信号から動き補償予測信号を減ずることにより、量子化処理によって切り捨てられた本来有していた予測差分DCT係数を復元させる処理に適用する。
続いて、傾き相殺直交変換係数生成器203における具体的な処理を説明する。まず、入力される動画像フレーム(本実施の形態では復号画像信号を示す)に対して、数1によって表現される図4に示される各ブロックとして動画像フレームの画像信号をとらえる。
Figure 2009272792
図4のΩ(0,0)が現在処理対象となっているブロックであるものとする。また、各ブロック内の各画素は、数2で表現される。
Figure 2009272792
続いて、図4に示すブロックの境界部分Γ(1)、Γ(2)、Γ(3)、Γ(4)の境界条件である画像信号の傾きを周波数領域で議論することができるように、DCT級数で表現する。ここでは数3に示した境界条件のDCT級数展開の式を利用して画像信号の傾きをgとした場合に数3に示した式中のGのようなDCT係数で表現する。
Figure 2009272792
また、ポアソン方程式の概念を導入してブロック内の原信号に対する推定信号を求める。ここで、ポアソン方程式は、処理対象ブロックQjにおいて、ブロック内の推定信号uのラプラシアンであるΔuがソース項Kとの間において、次式が成立する方程式である。
Δu=K
ブロック内の推定信号uはノイマンの境界条件とDCT級数表記を用いることで、数5に示す式のように表現することができる。これは、数4で示すような各境界からの推定信号のDCT級数展開成分を足し合わせることで求められる。
Figure 2009272792
Figure 2009272792
このような推定信号uに対してDCTを行うことで、数7を伴う数6で示されるような推定信号Uを得る。
Figure 2009272792
Figure 2009272792
数7に示した式より、ηおよびη*はブロック内の位置情報のみに依存し、ブロック内の画像信号には依存しないことから、予め一意に計算して求めておくことができる。従って、推定信号Uを求めるためには、傾きのDCT係数情報Gkを求めることが重要となる。
ここで、Gkをブロック内の原信号に対してDCTを行った後のDCT係数情報を利用して求めることを可能にするため、境界条件であるブロック境界における画像信号の傾きを求める際に、数8の式で示されるようなブロック内の各方向における信号成分の平均値を代表値としてブロック間の傾きを算出し、この傾きをブロック境界での傾きとして近似することでgを求める。
Figure 2009272792
続いて、この近似されたgに対してDCTを行うことでGを求める。ここで、傾きのDCT係数情報Gを求める際に数8に示した式を考慮して数9に示した式変形を行うことで、Gを数9に示した式中のF、つまりブロック内のDCT係数情報を利用して求めることが可能となる。
Figure 2009272792
傾き相殺直交変換係数生成器203においては、係数バッファ202より入力されたDCT係数情報をFとして数9に示した式から傾きのDCT係数情報Gを求めることで、推定信号uのDCT係数Uを生成する処理が施される。
具体的には、図5に示されるように、ターゲットとなる対象復号DCTブロック501、及びその対象復号DCTブロック501の左、上、右、下にそれぞれ隣接する復号DCTブロック502、503、504、505に対する、2次元DCTにおけるDC項及び1次元DCTにおけるDC項の係数値を持ってGを計算し、ターゲットとなる対象復号DCTブロック501のDC項を除く推定信号DCT係数Uを算出する処理が施される。
ここで、図5において、c00は対象復号DCTブロック501の2次元DCTのDC項、水平方向に並ぶc01〜c07は復号DCTブロック501の垂直1次元DCTのDC項、垂直方向に並ぶc10〜c70は復号DCTブロック501の水平1次元DCTのDC項を示す。また、l00、u00、r00、d00は、隣接復号DCTブロック502、503、504、505の2次元DCTのDC項を示す。また、水平方向に並ぶl01〜l07、u01〜u07、r01〜r07、d01〜d07は、それぞれ隣接復号DCTブロック502、503、504、505の垂直1次元DCTのDC項、垂直方向に並ぶc10〜c70、u10〜u70、r10〜r70、d10〜d70は、それぞれ隣接復号DCTブロック502、503、504、505の水平1次元DCTのDC項である。
図2に戻って説明する。傾き相殺直交変換係数生成器203から出力された推定信号DCT係数は、係数バッファ204から出力された予測DCT係数と共に、減算器205に入力され、推定信号DCT係数から予測DCT係数が係数単位で減算され、推定予測差分DCT係数として係数補正器119に出力される。
傾き相殺直交変換係数生成器203には、基準フレームの画像信号の場合には、逆量子化器110より復号DCT係数が入力され、MC器116からは動き補償予測信号は入力されないため、加算器201、減算器205への動き補償予測DCT係数は入力されず、係数補正器119へは、推定DCT係数が出力される。
次に、係数補正器119の動作を説明する。係数補正器119には、基準フレームの場合には逆量子化器110より復号DCT係数が入力され、直交変換係数推定器118より推定DCT係数が入力される。動き補償予測が用いられた場合には、上記の復号DCT係数は復号予測差分DCT係数となり、上記の推定DCT係数は推定予測差分DCT係数となる。
係数補正器119は、復号予測差分DCT係数を直交変換係数推定器118が推定予測差分DCT係数を算出するために必要な遅延を行い、ターゲットとなるDCTブロックの処理タイミングを一致させ、復号予測差分DCT係数と推定予測差分DCT係数とを係数毎に比較し、どちらのDCT係数を適用するかを選択する。
係数補正器119における、DCTブロック単位での係数を選択するアルゴリズムを図6のフローチャートを参照して説明する。まず、係数補正器119は、ターゲットとなるDCTブロックに対する、復号DCT係数DecCと推定DCT係数EstCを得る(ステップS600)。
続いて、ターゲットとなるDCTブロックが量子化された際の量子化ステップQ及び量子化マトリクスMを得る(ステップS601)。次に、係数補正器119は、DCTブロックのそれぞれの係数項に関して、復号されたDCT係数が量子化される前に取りうる範囲を計算する。MPEG2符号化においては、動き補償予測を用いたDCTブロックに関しては、DCT係数は量子化時に切り捨て処理が行われ、動き補償予測が用いられず、画像信号そのものがDCT処理された場合には、四捨五入処理が行われる。よって、ターゲットのDCTブロックが動き補償予測を用いた予測差分ブロックであるかどうかを判断する(ステップS602)。
係数補正器119は、ターゲットのDCTブロックが予測差分DCTの場合には、復号予測差分DCTにおける水平x、垂直yの係数をDecC(x,y)、水平x、垂直yの項の量子化マトリクス値をM(x,y)とすると、量子化される前に取りうる係数の絶対値の範囲を、以下のように計算する(ステップS603)。
最小値 EstCmin=abs(DecC(x,y))
最大値 EstCmax=abs(DecC(x,y))+Q*M(x,y)
一方、ターゲットのDCTブロックが予測差分DCTでない場合には、係数補正器119は、以下の計算を行う(ステップS604)。
最小値 EstCmin=0 : DecC(x,y)=0の時
abs(DecC(x,y))−Q*M(x,y)/2
: DecC(x,y)≠0の時
最大値 EstCmax=abs(DecC(x,y))+Q*M(x,y)/2
続いて、係数補正器119は、ステップS603又はS604で計算した最大値、最小値と推定DCT係数とを、以下の量子化される前に取りうる係数の範囲内であることを満たす条件を満足するか否か比較し(ステップS605)、その条件を満足する場合には、推定DCT係数EstC(x,y)を補正DCT係数CorC(x,y)として選択し(ステップS606)、その条件を満足しない場合には復号DCT係数DecC(x,y)を補正DCT係数CorC(x,y)として選択する(ステップS607)。
ここで、上記の取りうる係数の範囲内であることを満たす条件は、以下(1)と(2)と(3)とをすべて同時に満たすことである。
(1)推定DCT係数EstC(x,y)と復号DCT係数DecC(x,y)の極性が同一、もしくはDecC(x,y)=0
(2)EstCmin≦abs(EstC(x,y))<EstCmax
(3)DC項(x=0,y=0)でない
最後に、係数補正器119は、DCTブロックのDC項は復号DCTを選択し、その他すべての係数項に対して、ステップS606又はS607で得たDecC(x,y)とEstC(x,y)の選択された係数を、補正DCT係数CorC(x,y)として格納する(ステップS608)。係数補正器119は、上記のアルゴリズムに従いマクロブロック内のすべてのDCTブロックに対して補正DCT係数を求め、図1の逆直交変換器111に出力する。
本実施形態においては、予測残差成分のDCT領域にて量子化により切り捨てられた予測残差成分を推定して補正を行う仕組みを提供する。DCT領域でカットされた成分の範囲は、量子化スケールより推測できるため、推定されたDCT係数が適切な補正量の範囲にあるかどうかを復号されたDCT係数の各成分個別に判断を行う。DCT係数の推定処理に関しては、復号した画像の歪成分が除去された想定の信号を生成し、その信号が復号されるために出力されるべきDCT係数、及び予測差分DCT係数を算出することで実現する。
本実施の形態においては、ターゲットとするブロックの画像信号と隣接するブロックの画像信号とのブロック境界連続性より推定信号を特定する手法を用いたが、他の復号信号推定技術を用いることも可能である。本実施の形態では、推定された信号の正当性の判断を量子化処理が施された、DCT係数及び予測差分DCT係数の量子化誤差範囲に存在することを確認することで実現しており、そのため不必要な成分を変化させることなく、劣化成分を復元させることができる。
次に、本発明になる動画像復号化装置について説明する。図7は、本発明になる動画像復号化装置の第1の実施の形態のブロック図を示す。同図に示すように、本実施の形態の復号化装置は、入力端子700、ストリームバッファ701、エントロピー復号器702、符号化テーブル703、逆量子化器704、逆直交変換器705、加算器706、2次元ブロック逆変換器707、参照画像メモリ708、MC(動き補償)器709、出力画像メモリ710、出力端子711、直交変換係数推定器712、係数補正器713、および画像バッファ714から構成される。
入力端子700から出力端子711までの各部に関しては、図13の従来の動画像復号化装置の入力端子1300から出力端子1311までと同じ構成を用いる。本実施の形態は、従来の動画像復号化装置の構成に加えて、直交変換係数推定器712と係数補正器713と画像バッファ714とを設けた点に特徴がある。
入力端子700に入力された図1の動画像符号化装置又は後述する動画像符号化プログラムにより生成されたビットストリームは、ストリームバッファ701に蓄えられ、エントロピー復号器702に供給される。エントロピー復号器702では、符号化テーブル703を用いて可変長又は固定長の符号を復号し、量子化されたDCT係数と動きベクトルや予測モードを復元する。量子化されたDCT係数は、逆量子化器704により逆量子化処理が行われ、復号DCT係数が算出される。
復号されたDCT係数は、直交変換係数推定器712及び係数補正器713に入力される。直交変換係数推定器712は、符号化時に量子化によってDCT係数が失われた係数成分を推定し、推定されたDCT係数を出力する。係数補正器713は、推定されたDCT係数と復号されたDCT係数より、符号化された画像信号の持っていたDCT係数が量子化で失われた成分を選択し、復号されたDCT係数に補正を加えて補正DCT係数を算出する。
係数補正器713より出力された補正DCT係数は、逆直交変換器705により逆DCT処理が行われ、復号された画像信号として加算器706及び2次元ブロック逆変換器707を介して、参照画像メモリ708に供給されて格納される。基準フレームおいては、加算器706に画像バッファ714を介して入力される予測ブロックは、MC器709により生成されないため、画像バッファ714は機能しない。
参照画像メモリ708に格納された復号画像信号は、予測フレームの符号化処理時に使用される。また、復号画像信号は、出力画像メモリ710に蓄えられ出力時刻順に並べ替えられ、出力端子711より出力されることにより、符号化された動画像信号を再生することができる。
予測フレームにおいては、予測ブロックがエントロピー復号器702から出力される動きベクトル及びモード信号をMC器709に入力し、参照画像メモリ708より参照画像を切り出すことにより生成される。生成された予測ブロックは、画像バッファ714及び直交変換係数推定器712に供給される。予測フレームにおいては、逆量子化器704からは復号された差分DCT係数が出力され、直交変換係数推定器712及び係数補正器713に送られる。
直交変換係数推定器712は、復号された差分DCT係数と共に、MC器709より予測ブロックを受け取り、量子化された差分DCT係数が失われた係数成分を推定し、推定された差分DCT係数を出力する。係数補正器713は、推定された差分DCT係数と復号された差分DCT係数より、動き補償予測差分信号の持っていたDCT係数が量子化によって失った成分を選択し、復号された差分DCT係数に補正を加えて補正差分DCT係数を算出する。
係数補正器713より出力された補正差分DCT係数は、逆直交変換器705により逆DCT処理が行われ、復号された予測差分信号として、加算器706において画像バッファ714からの予測ブロックと加算され、復号画像信号として出力される。画像バッファ714は、直交変換係数推定器712において、係数推定処理のために要する遅延を吸収するためのバッファであり、MC器709から出力された予測ブロックを固定時間遅延させ、加算器706に出力する。画像バッファ714の容量の大きさは、直交変換係数推定器712が要する遅延に依存し、遅延を生じない推定処理を行う場合には画像バッファ714を削除することが可能である。
加算器706から出力された復号画像信号は出力画像メモリ710に蓄えられ出力時刻順に並べ替えられ、出力端子711より出力される。また、加算器706から出力された復号画像信号は、該当フレームが参照を受ける画像の場合には、2次元ブロック逆変換器707を介して参照画像メモリ708に供給されて格納される。参照画像メモリ708に格納された画像が、続く予測フレームの符号化処理時に使用される。
第1の実施の形態の動画像復号化装置における、直交変換係数推定器712及び係数補正器713の詳細動作に関しては、図1に示す第1の実施の形態の動画像符号化装置における、直交変換係数推定器118及び係数補正器119と同じ動作を行うことによって、符号化時と復号時の復元画像を一致させ、動き補償予測符号化処理における参照画像のミスマッチが生じないようにする。
第1の実施の形態においては、復号画像にDCTを施して生成された各係数値を求め、対象となるDCTブロックの入力時に保持していた係数成分を、対象ブロックの復号画像が持つDCT係数及び周辺ブロックの復号画像が持つDCT係数を基に推定し、動き補償予測符号化時の予測差分DCT成分を、推定した入力画像のDCT成分から予測ブロックのDCT成分より減算することで推定する。
第1の実施の形態においては、動き補償予測処理が施された予測誤差信号が直交変換処理及び量子化処理によって生じる劣化成分を、量子化された予測誤差直交変換信号の切り捨てられた成分を推定することにより、劣化成分を補正する。量子化で切り捨てられた差分成分は、量子化スケールと量子化マトリクスより範囲を限定できるため、推定された成分の妥当性を係数別に判断することができる。これにより、本実施の形態によれば、予測誤差信号が直交変換処理及び量子化処理によって生じる劣化成分である、ブロック歪を補正する成分、モスキート歪を補正する成分、動き補償予測のミスマッチにより生じた差分信号が量子化で切り捨てられた成分、それぞれに対して失われた成分などを適切に選択して符号化時に施された量子化処理を基準に復元させることができる。
復元した画像信号は、また動き補償予測の参照画像として用いられるため、品質の向上した参照画像と入力画像の時間方向相関を算出することができ、動きベクトルの精度も向上できると共に、劣化成分が予測フレームの復号画像に残ることによる劣化も防ぐことができる。
更に、本実施の形態によれば、復号直交変換係数を推定する際に、ブロック内の信号の振る舞いを規定する2次関数等の所定のソースモデルで表現し、ブロック内の信号をブロックの境界条件に基づいて推定信号を生成する技術を用いることで、ブロック間の歪成分が除去された形でブロック全体が保持している信号特性を推定できるため、領域情報により置き換え選択される有意な推定信号を生成でき、より補正処理を適切に機能できる。
(第2の実施の形態)
次に、本発明の動画像符号化装置、及び動画像復号化装置の第2の実施の形態について説明する。この第2の実施の形態は、動画像符号化装置に関して標準の符号化処理を行った場合に、復号される復号画像の品質を向上させる動画像復号化装置を提供する。
図8は、本発明になる動画像復号化装置の第2の実施の形態のブロック図を示す。同図に示すように、本実施の形態の動画像復号化装置は、入力端子800、ストリームバッファ801、エントロピー復号器802、符号化テーブル803、逆量子化器804、逆直交変換器805、加算器806、2次元ブロック逆変換器807、参照画像メモリ808、MC(動き補償)器809、出力画像メモリ810、出力端子811、直交変換係数推定器812、係数補正差分生成器813、逆直交変換器814、補正画像差分メモリ815及び加算器816から構成される。入力端子800から出力端子811までの回路部に関しては、図13の従来の動画像復号化装置の入力端子1200から出力端子1211までの回路部と同じ構成である。
また、直交変換係数推定器812は、第1の実施の形態の動画像復号化装置内の直交変換係数推定器712と同じ構成を用いる。本実施の形態は、第1の実施の形態の動画像復号化装置と比較すると、係数補正差分生成器813、逆直交変換器814、補正画像差分メモリ815を設け、画像バッファ714に相当する画像バッファを削除した点に特徴がある。
図8において、図12の動画像符号化装置などにより標準の符号化処理を行って得られたビットストリームが入力端子800に入力され、更にストリームバッファ801、エントロピー復号器802、符号化テーブル803、逆量子化器804からなる回路部により復号DCT係数が算出される。この動作は従来の動画像復号化装置と同様である。
復号されたDCT係数は、逆直交変換器805、直交変換係数推定器812及び係数補正差分生成器813に入力される、直交変換係数推定器812は、符号化時に量子化によってDCT係数が失った係数成分を推定し、推定されたDCT係数を出力する。係数補正差分生成器813は、推定されたDCT係数と復号されたDCT係数より、符号化された画像信号の持っていたDCT係数が量子化で失われた成分を選択し、選択された成分と復号されたDCT係数との差分情報を算出する。第1の実施の形態の動画像復号化装置との構成で異なる部分は、復号されたDCT係数に直接補正係数を加える処理を行わずに、局部復号処理を従来のDCT係数を処理させる部分である。
ここで、係数補正差分生成器813における、DCTブロック単位での係数を選択するアルゴリズムを図9のフローチャートを参照して説明する。まず、係数補正差分生成器813は、ターゲットとなるDCTブロックに対する、復号DCT係数DecCと推定DCT係数EstCを得る(ステップS900)。
続いて、ターゲットとなるDCTブロックが量子化された際の量子化ステップQ及び量子化マトリクスMを得る(ステップS901)。次に、係数補正差分生成器813は、DCTブロックのそれぞれの係数項に関して、復号されたDCT係数が量子化される前に取りうる範囲を計算する。MPEG2符号化においては、動き補償予測を用いたDCTブロックに関しては、DCT係数は量子化時に切り捨て処理が行われ、動き補償予測が用いられず、画像信号そのものがDCT処理された場合には、四捨五入処理が行われる。よって、ターゲットのDCTブロックが動き補償予測を用いた予測差分ブロックであるかどうかを判断する(ステップS902)。
係数補正差分生成器813は、ターゲットのDCTブロックが予測差分DCTの場合には、復号DCT係数における水平x、垂直yの係数をDecC(x,y)、水平x、垂直yの項の量子化マトリクス値をM(x,y)とすると、量子化される前に取りうる係数の絶対値の範囲を、以下のように計算する(ステップS903)。
最小値 EstCmin=abs(DecC(x,y))
最大値 EstCmax=abs(DecC(x,y))+Q*M(x,y)
一方、ターゲットのDCTブロックが予測差分DCTでない場合には、係数補正差分生成器813は、以下の計算を行う(ステップS904)。
最小値 EstCmin=0 : DecC(x,y)=0の時
abs(DecC(x,y))−Q*M(x,y)/2
: DecC(x,y)≠0の時
最大値 EstCmax=abs(DecC(x,y))+Q*M(x,y)/2
続いて、係数補正差分生成器813は、ステップS903又はS904で計算した最大値、最小値と取得した推定DCT係数とを、以下の量子化される前に取りうる係数の範囲内であることを満たす条件を満足するか否か比較し(ステップS905)、その条件を満足する場合には、推定DCT係数EstC(x,y)を補正DCT係数CorC(x,y)として選択し(ステップS906)、その条件を満足しない場合には復号DCT係数DecC(x,y)を補正DCT係数CorC(x,y)として選択する(ステップS907)。ここで、上記の取りうる係数の範囲内であることを満たす条件は、前述した図6のフローチャートのステップS605における条件と同じである。
最後に、係数補正差分生成器813は、DCTブロックのDC項に対しては補正DCT係数差分情報DifC(x,y)を0とし、残りのすべての復号DCT係数に対しては、次式
DifC(x,y)=CorC(x,y)−DecC(x,y)
に基づいて補正DCT係数差分情報DifCを算出し、出力する(ステップS908)。係数補正差分生成器813は、上記のアルゴリズムに従いマクロブロック内のすべてのDCTブロックに対して補正DCT係数差分情報DifCを求める。
係数補正差分生成器813より出力された補正DCT係数差分情報DifCは、従来の復号化装置が施す処理とは異なり、図8の逆直交変換器814により逆DCT処理が行われ、復号された画像信号に補正を行うための補正画像差分信号とされた後、補正画像差分メモリ815に格納される。補正画像差分メモリ815及び出力画像メモリ810においては、符号化処理構造に合わせて出力時刻順に並べ替えられると共に、同一時刻・同一位置の信号が出力されるように補正画像差分信号と出力画像の出力タイミングを一致させる。
一方、逆直交変換器805においては、逆量子化器804から復号DCT係数が入力されて逆DCT処理を施すことで、復号データを生成する。基準フレームの場合には、その復号データは、加算器806、及び2次元ブロック逆変換器807を介して復号画像信号として出力画像メモリ810に蓄えられると共に、参照画像メモリ808にも供給されて参照画像として格納される。
予測フレームにおいては、予測ブロックがエントロピー復号器802から出力される動きベクトル及びモード信号をMC器809に入力し、参照画像メモリ808より参照画像を切り出す事により生成される。生成された予測ブロックは加算器806に供給され、逆直交変換器805からの復号データと加算される。加算された復号データは、基準フレームと同様に2次元ブロック逆変換器807を介して復号画像信号として出力画像メモリ810に蓄えられると共に、該当フレームが参照を受ける画像の場合には、参照画像メモリ808にも供給されて参照画像として格納される。このように、参照画像として内部に格納される画像においては、従来の動画像符号化装置で生成される情報を格納できるように、処理を構成している。
加算器816は、出力画像メモリ810から出力された復号画像信号と、補正画像差分メモリ815から出力された補正画像差分信号とを加算することで補正された復号画像信号生成し、出力端子811より補正復号画像信号として出力する。
この第2の実施の形態においては、第1の実施の形態と同様に、対象とするブロックの復号画像信号が入力時に保持しているDCT係数を推定し、動き補償予測符号化時の予測差分DCT成分を、推定した入力画像のDCT成分から予測ブロックのDCT成分より減算する事で推定する。推定された成分の妥当性は、量子化スケールと量子化マトリクスより係数別に判断する部分も同様であるが、その推定成分に関しては、続く動画像の動き補償予測に用いられる参照画像には反映させないことで、既存の動画像符号化装置で生成されたビットストリームを誤差蓄積なく復号することが可能になる。
また、本実施の形態では、推定されたDCT成分から、復号されたDCT成分との差分成分を算出し、その差分成分に対する逆直交変換(IDCT)を施すことで、復号画像信号に対する補正信号を生成する。そして、生成した補正信号を、復号画像信号出力時に加算することで、ブロック歪補正、モスキート歪補正、動き補償予測のミスマッチにより生じた差分信号が量子化で切り捨てられた成分の補正が施された信号を再生できる。よって、本実施の形態によれば、既存の符号化処理により符号化され伝送・記録された情報の劣化成分を補正して再生できる動画像復号化装置を構築できる。
(第3の実施の形態)
次に、本発明の第3の実施の形態について説明する。この第3の実施の形態は、第1及び第2の実施の形態の動画像符号化装置、及び動画像復号化装置の機能を図10、図11に示すコンピュータである中央処理制御装置において実現させるための動画像符号化プログラム、及び動画像復号化プログラムであり、以下それらのプログラムについて説明する。
図10は、本発明になる動画像符号化プログラムにより動作する情報処理装置の一例の構成図を示す。同図において、情報処理装置1000は、各種の情報を入力するための入力装置1001と、各種の情報を出力するための出力装置1002と、本実施の形態の動画像符号化プログラムにより動作する中央処理制御装置1003と、外部記憶装置1004と、中央処理制御装置1003による演算処理の際の作業領域などに用いる一時記憶装置1005と、外部と通信するための通信装置1006とが、双方向のバス1007により接続された構成とされている。
中央処理制御装置1003は、本実施の形態の動画像符号化プログラムが記録媒体から、あるいは通信ネットワークを介して配信されて通信装置1006により取り込まれ、図1に示した2次元ブロック変換器102に相当する2次元ブロック変換手段1008、減算器103に相当する減算1009、直交変換器104に相当する直交変換手段1010、量子化器105に相当する量子化手段1011、エントロピー符号化器106に相当するエントロピー符号化手段1012、逆量子化器110に相当する逆量子化手段1013、逆直交変換器111に相当する逆直交変換手段1014、加算器112に相当する加算手段1015、2次元ブロック逆変換器113に相当する2次元ブロック逆変換手段1016、ME器115に相当するME手段1017、MC器116に相当するMC手段1018、符号量制御器117に相当する符号化制御手段1019、直交変換係数推定器118に相当する直交変換係数推定手段1020、係数補正器119に相当する係数補正手段1021の各機能を少なくとも有し、図1に示す動画像符号化装置と同様の動作をソフトウェア処理により実行する。
図11は、本発明になる動画像復号化プログラムの一実施の形態により動作する情報処理装置の一例の構成図を示す。同図において、情報処理装置1100に含まれる装置の基本構成は、図10における情報処理装置1000と同様であるため、説明を省略する。中央処理制御装置1103は、本実施の形態の動画像復号化プログラムが記録媒体から、あるいは通信ネットワークを介して配信されて通信装置1106により取り込まれ、図7のエントロピー復号化器702に相当するエントロピー復号化手段1108、逆量子化器704に相当する逆量子化手段1109、逆直交変換器705に相当する逆直交変換手段1110、加算器706に相当する加算手段1111、2次元ブロック逆変換器707に相当する2次元ブロック逆変換手段1112、MC器709に相当するMC手段1113、直交変換係数推定器712に相当する直交変換係数推定手段1114の各機能を少なくとも有し、係数補正器713に相当する係数補正手段1115の機能を有する事で、図7に示した第1の実施例の復号化装置と同様の動作をソフトウェア処理により実行する。
また、係数補正手段1115の替りに、図8に示した係数補正差分生成器813に相当する係数補正差分生成手段1116を有することで、図8に示した第2の実施の形態の動画像復号化装置と同様の動作をソフトウェアにより実行する。
図10及び図11において、画像及び係数を蓄えるメモリは一時記憶装置1002、1102において構成され、図8における逆直交変換器814の処理は、ソフトウェアとしては逆直交変換手段1014、1110で共用可能であるため、特に追加の手段を有してはいない。
なお、本発明の各実施の形態においては、動画像符号化の構成としてMPEG2符号化方式を用いたが、MPEG1、MPEG4 ASP、MPEG4 AVC、VC1などの、動き補償予測及び直交変換を用いた他の動画像符号化規格を用いても同様の効果を発揮する事が期待でき、有効に活用することが可能である。
本発明は、動画像信号を圧縮して伝送する符号化装置及び符号化プログラム等に適用できる。また本発明は、動画像信号が圧縮されて伝送された情報を復元する、復号化装置および復号化プログラム等に適用できる。
本発明の動画像符号化装置の第1の実施の形態のブロック図である。 図1中の直交変換係数推定器の一実施の形態のブロック図である。 多重調和局所直交変換の基本概念を表す概念図である。 復号画像ブロックにおけるブロック間の境界に関する定義を示すための概念図である。 本発明の第1の実施の形態の直交変換係数推定器において処理される係数データを示す概念図である。 図1中の係数補正器の動作を説明するフローチャートである。 本発明の第1の実施の形態の動画像復号化装置のブロック図である。 本発明の第2の実施の形態の動画像復号化装置のブロック図である。 図8中の係数補正差分生成器の動作を説明するフローチャートである。 本発明の動画像符号化装置が備える機能を、本発明の動画像符号化プログラムを実行させることにより実現する情報処理装置の基本構成を表す機能ブロック図である。 本発明の動画像復号化装置が備える機能を、本発明の動画像復号化プログラムを実行させることにより実現する情報処理装置の基本構成を表す機能ブロック図である。 従来のMPEG2符号化装置の一例を示すブロック図である。 従来のMPEG2復号化装置の一例を示すブロック図である。 従来のブロック歪除去フィルタの動作概念を示す概念図である。
符号の説明
100 デジタル画像信号入力端子
101 入力画像メモリ
102 2次元ブロック変換器
103、205 減算器
104、200 直交変換器
105 量子化器
106 エントロピー符号化器
107、703、803 符号化テーブル
108、701、801 ストリームバッファ
109、711、811 出力端子
110、704、804 逆量子化器
111、705、805 逆直交変換器
112、201、706、806、816 加算器
113、707、807 2次元ブロック逆変換器
114、708、808 参照画像メモリ
115 ME(動き推定)器
116、709、809 MC(動き補償)器
117 符号量制御器
118 直交変換係数推定器
119 係数補正器
120 画像バッファ
202、204 係数バッファ
203 傾き相殺直交変換係数生成器
700、800 ビットストリーム入力端子
702、802 エントロピー復号器
710 出力画像メモリ
711 出力端子
712、812 直交変換係数推定器
713 係数補正器
714 画像バッファ
813 係数補正差分生成器
815 補正画像差分メモリ
1000、1100 情報処理装置
1001、1101 入力装置
1002、1102 出力装置
1003、1103 中央処理制御装置
1004、1104 外部記憶装置
1005、1105 一時記憶装置
1006、1106 通信装置
1007、1107 双方向バス
1008 2次元ブロック変換手段
1009 減算手段
1010 直交変換手段
1011 量子化手段
1012 エントロピー符号化手段
1013、1109 逆量子化手段
1014、1110 逆直交変換手段
1015、1111 加算手段
1016、1112 2次元ブロック逆変換手段
1017 ME手段
1018、1113 MC手段
1019 符号量制御手段
1020、1114 直交変換係数推定手段
1021、1115 係数補正手段
1116 係数補正差分生成手段

Claims (10)

  1. 入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、前記矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、前記符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、前記矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して符号化を行う動画像符号化装置において、
    前記動き補償予測信号と、前記直交変換処理及び量子化処理が施された結果生成される量子化データを逆量子化することで生成される復号直交変換係数とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、
    前記直交変換係数推定手段より出力された前記推定直交変換係数と、前記復号直交変換係数と、量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、前記量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に前記復号直交変換係数を前記推定直交変換係数に置き換えるか否かの判断を行って補正直交変換係数を生成する係数補正手段と、
    前記係数補正手段より出力される補正直交変換係数に逆直交変換処理を施して得た信号を前記動き補償予測信号と加算することで補正復号画像信号を生成する補正画像信号生成手段とを有し、
    前記補正復号画像信号を、続いて符号化対象となる動画像信号の前記参照画像として用いることを特徴とする動画像符号化装置。
  2. 前記直交変換係数推定手段は、
    前記動き補償予測信号に対する直交変換係数を生成するための直交変換手段と、
    前記動き補償予測信号と前記復号直交変換係数とより復号画像信号の直交変換係数を生成する手段と、
    生成された前記復号画像信号の直交変換係数を、直交変換処理の対象となる矩形領域単位で周囲に存在する矩形領域の復号画像信号との対応する境界部分の境界条件を基に、ポアソン方程式を満たすような、前記矩形領域内の推定復号画像信号を生成することで、復号画像信号の推定直交変換係数を生成する、傾き相殺直交変換係数生成手段と、
    前記推定直交変換係数より、前記直交変換手段から出力された前記動き補償予測信号に対する直交変換係数を減算することで、推定予測差分直交変換係数を生成する減算手段と
    を有することを特徴とする請求項1記載の動画像符号化装置。
  3. 前記傾き相殺直交変換係数生成手段は、前記直交変換処理の対象となる矩形領域及び、その直交変換処理の対象となる矩形領域の周囲に存在する矩形領域の復号画像信号に対する直交変換係数とを入力として受け、入力された前記直交変換係数の加算・乗算により復号画像信号の推定直交変換係数を生成することを特徴とする請求項2記載の動画像符号化装置。
  4. 入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、前記矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、前記符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、前記矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して符号化された動画像信号のビットストリームを復号する、動画像復号化装置において、
    前記ビットストリームから量子化された直交変換係数と動きベクトルを復号するエントロピー復号手段と、
    前記エントロピー復号手段からの前記動きベクトルに基づき、過去の復号画像信号を参照信号として切り出して動き補償予測信号を生成する動き補償手段と、
    前記エントロピー復号手段より出力された前記量子化された直交変換係数を逆量子化することで生成される復号直交変換係数と、前記動き補償予測信号とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、
    前記直交変換係数推定手段より出力された前記推定直交変換係数と、前記復号直交変換係数及び量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、前記量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に前記復号直交変換係数を前記推定直交変換係数に置き換えるか判断を行って補正直交変換係数を生成する係数補正手段と、
    前記係数補正手段より出力される前記補正直交変換係数に逆直交変換処理を行って得た信号に前記動き補償予測信号を加算することで補正復号画像信号を生成する補正復号画像信号生成手段とを有し、
    前記補正復号画像信号を、続いて符号化対象となる動画像信号の前記参照画像として用いることを特徴とする動画像復号化装置。
  5. 入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、前記矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、前記符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、前記矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して符号化された動画像信号のビットストリームを復号する、動画像復号化装置において、
    前記ビットストリームから量子化された直交変換係数と動きベクトルを復号するエントロピー復号手段と、
    前記エントロピー復号手段からの前記動きベクトルに基づき、過去の復号画像信号を参照信号として切り出して動き補償予測信号を生成する動き補償手段と、
    前記エントロピー復号手段より出力された前記量子化された直交変換係数を逆量子化することで生成される復号直交変換係数と、前記動き補償予測信号とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、
    前記直交変換係数推定手段より出力された前記推定直交変換係数と、前記復号直交変換係数及び量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、前記量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に前記復号直交変換係数を前記推定直交変換係数に置き換えるか判断を行い、置き換える係数と前記直交変換係数との差分情報である補正差分直交変換係数を出力する係数補正差分生成手段と、
    前記係数補正差分生成手段より出力される前記補正差分直交変換係数に対し、逆直交変換処理を施すことで補正差分信号に変換する逆直交変換手段と、
    前記復号直交変換係数を逆直交変換して得た信号と前記動き補償予測信号とを用いて復号した復号画像信号を前記参照画像として格納した後に、出力画像として出力する前記復号画像信号に対してのみ前記補正差分信号を加算して、再生画像に対して補正された復号画像信号を出力する画像信号復号手段と
    を有することを特徴とする動画像復号化装置。
  6. 前記直交変換係数推定手段は、
    前記動き補償予測信号に対する直交変換係数を生成するための直交変換手段と、
    前記動き補償予測信号と前記復号直交変換係数とより復号画像信号の直交変換係数を生成する手段と、
    生成された前記復号画像信号の直交変換係数を、直交変換処理の対象となる矩形領域単位で周囲に存在する矩形領域の復号画像信号との対応する境界部分の境界条件を基に、ポアソン方程式を満たすような、前記矩形領域内の推定復号画像信号を生成することで、復号画像信号の推定直交変換係数を生成する、傾き相殺直交変換係数生成手段と、
    前記推定直交変換係数より、前記直交変換手段から出力された前記動き補償予測信号に対する直交変換係数を減算することで、推定予測差分直交変換係数を生成する減算手段と
    を有することを特徴とする請求項4又は5記載の動画像復号装置。
  7. 前記傾き相殺直交変換係数生成手段は、前記直交変換処理の対象となる矩形領域及び、その直交変換処理の対象となる矩形領域の周囲に存在する矩形領域の復号画像信号に対する直交変換係数とを入力として受け、入力された前記直交変換係数の加算・乗算により前記補正直交変換係数を生成することを特徴とする請求項6記載の動画像復号化装置。
  8. 入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、前記矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、前記符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、前記矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して行う符号化を、コンピュータにより実行させる動画像符号化プログラムにおいて、
    前記コンピュータを、
    前記動き補償予測信号と、前記直交変換処理及び量子化処理が施された結果生成される量子化データを逆量子化することで生成される復号直交変換係数とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、
    前記直交変換係数推定手段より出力された前記推定直交変換係数と、前記復号直交変換係数と、量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、前記量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に前記復号直交変換係数を前記推定直交変換係数に置き換えるか否かの判断を行って補正直交変換係数を生成する係数補正手段と、
    前記係数補正手段より出力される補正直交変換係数に逆直交変換処理を施して得た信号を前記動き補償予測信号と加算することで補正復号画像信号を生成する補正画像信号生成手段と、
    して機能させ、前記補正復号画像信号を、続いて符号化対象となる動画像信号の前記参照画像として用いることを特徴とする動画像符号化プログラム。
  9. 入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、前記矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、前記符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、前記矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して符号化された動画像信号のビットストリームを復号する動作をコンピュータにより実行させる動画像復号化プログラムにおいて、
    前記コンピュータを、
    前記ビットストリームから量子化された直交変換係数と動きベクトルを復号するエントロピー復号手段と、
    前記エントロピー復号手段からの前記動きベクトルに基づき、過去の復号画像信号を参照信号として切り出して動き補償予測信号を生成する動き補償手段と、
    前記エントロピー復号手段より出力された前記量子化された直交変換係数を逆量子化することで生成される復号直交変換係数と、前記動き補償予測信号とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、
    前記直交変換係数推定手段より出力された前記推定直交変換係数と、前記復号直交変換係数及び量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、前記量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に前記復号直交変換係数を前記推定直交変換係数に置き換えるか判断を行って補正直交変換係数を生成する係数補正手段と、
    前記係数補正手段より出力される前記補正直交変換係数に逆直交変換処理を行って得た信号に前記動き補償予測信号を加算することで補正復号画像信号を生成する補正復号画像信号生成手段と
    して機能させ、前記補正復号画像信号を、続いて符号化対象となる動画像信号の前記参照画像として用いることを特徴とする動画像復号化プログラム。
  10. 入力された符号化対象の動画像信号を所定の画素数からなる矩形領域毎に分割し、前記矩形領域を処理単位として、過去に符号化された画像の復号画像信号を参照画像として動き補償予測処理を行い、前記符号化対象の動画像信号である符号化対象画像と動き補償予測信号との差分信号に対して、前記矩形領域とは別に定義された矩形領域を処理単位として直交変換処理及び量子化処理を順次に施して符号化された動画像信号のビットストリームを復号する動作をコンピュータにより実行させる動画像復号化プログラムにおいて、
    前記コンピュータを、
    前記ビットストリームから量子化された直交変換係数と動きベクトルを復号するエントロピー復号手段と、
    前記エントロピー復号手段からの前記動きベクトルに基づき、過去の復号画像信号を参照信号として切り出して動き補償予測信号を生成する動き補償手段と、
    前記エントロピー復号手段より出力された前記量子化された直交変換係数を逆量子化することで生成される復号直交変換係数と、前記動き補償予測信号とを入力として受け、量子化された結果失われた直交変換係数を推定して推定直交変換係数を出力する直交変換係数推定手段と、
    前記直交変換係数推定手段より出力された前記推定直交変換係数と、前記復号直交変換係数及び量子化処理が施された際の量子化の細かさを示す係数毎の量子化値とを入力として受け、前記量子化値より量子化前の直交変換係数が取りうる領域情報を算出し、その領域情報を基に前記復号直交変換係数を前記推定直交変換係数に置き換えるか判断を行い、置き換える係数と前記直交変換係数との差分情報である補正差分直交変換係数を出力する係数補正差分生成手段と、
    前記係数補正差分生成手段より出力される前記補正差分直交変換係数に対し、逆直交変換処理を施すことで補正差分信号に変換する逆直交変換手段と、
    前記復号直交変換係数を逆直交変換して得た信号と前記動き補償予測信号とを用いて復号した復号画像信号を前記参照画像として格納した後に、出力画像として出力する前記復号画像信号に対してのみ前記補正差分信号を加算して、再生画像に対して補正された復号画像信号を出力する画像信号復号手段と
    して機能させることを特徴とする動画像復号化プログラム。
JP2008120155A 2008-05-02 2008-05-02 動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム Active JP4784618B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008120155A JP4784618B2 (ja) 2008-05-02 2008-05-02 動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008120155A JP4784618B2 (ja) 2008-05-02 2008-05-02 動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム

Publications (2)

Publication Number Publication Date
JP2009272792A true JP2009272792A (ja) 2009-11-19
JP4784618B2 JP4784618B2 (ja) 2011-10-05

Family

ID=41438971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008120155A Active JP4784618B2 (ja) 2008-05-02 2008-05-02 動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム

Country Status (1)

Country Link
JP (1) JP4784618B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8457210B2 (en) 2010-12-20 2013-06-04 Kabushiki Kaisha Toshiba Image decoding apparatus and method adding a sign of the coefficient before linear estimation
JP5850536B2 (ja) * 2011-03-18 2016-02-03 株式会社日立国際電気 動画像符号化装置及び動画像符号化方法
JP2016092804A (ja) * 2014-11-11 2016-05-23 日本電信電話株式会社 動画像符号化装置、動画像復号装置及びコンピュータプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8457210B2 (en) 2010-12-20 2013-06-04 Kabushiki Kaisha Toshiba Image decoding apparatus and method adding a sign of the coefficient before linear estimation
JP5850536B2 (ja) * 2011-03-18 2016-02-03 株式会社日立国際電気 動画像符号化装置及び動画像符号化方法
JP2016092804A (ja) * 2014-11-11 2016-05-23 日本電信電話株式会社 動画像符号化装置、動画像復号装置及びコンピュータプログラム

Also Published As

Publication number Publication date
JP4784618B2 (ja) 2011-10-05

Similar Documents

Publication Publication Date Title
US8625916B2 (en) Method and apparatus for image encoding and image decoding
CN100364338C (zh) 估计图像噪声的方法和设备和消除噪声的方法
JP5061179B2 (ja) 照明変化補償動き予測符号化および復号化方法とその装置
US20150312575A1 (en) Advanced video coding method, system, apparatus, and storage medium
US11743475B2 (en) Advanced video coding method, system, apparatus, and storage medium
JP2006211152A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化用プログラム、画像復号用プログラム
JP2006246474A (ja) カラー成分間の単一符号化モードを利用して予測映像を生成する方法、およびその装置と、該単一符号化モードを利用して映像およびビデオを符号化/復号化する方法およびその装置
JP2008507190A (ja) 動き補償方法
JP2006509437A (ja) デジタルビデオ処理に対する統一測定基準(umdvp)
JP2007336468A (ja) 再符号化装置、再符号化方法およびプログラム
JP2004215275A (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
JP4784618B2 (ja) 動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム
JP5362723B2 (ja) 圧縮画像ノイズ除去装置と再生装置
JP4719854B2 (ja) 動画像符号化装置、動画像符号化プログラム、動画像復号化装置及び動画像復号化プログラム
KR101979857B1 (ko) 비디오 신호의 디코딩 방법 및 장치
JP2008109700A (ja) ディジタル信号変換方法およびディジタル信号変換装置
KR101379189B1 (ko) 움직임 보상 프레임의 필터링을 이용한 영상 부호화/복호화 방법 및 장치
WO2016193949A1 (en) Advanced video coding method, system, apparatus and storage medium
JP5256095B2 (ja) 圧縮画像ノイズ除去装置と再生装置
JP2007020216A (ja) 符号化装置、符号化方法、フィルタ処理装置およびフィルタ処理方法
JP2006081066A (ja) 画像生成装置および画像生成プログラム
JP2006157083A (ja) 画像符号化装置、画像符号化方法、及びコンピュータプログラム
JP2001145108A (ja) 画像情報変換装置及び方法
JP2009260661A (ja) 画像処理装置、画像処理方法
JP2007006533A (ja) 符号化装置、符号化方法、フィルタ処理装置およびフィルタ処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100624

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110627

R151 Written notification of patent or utility model registration

Ref document number: 4784618

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350