JP2010021704A - 動画像符号化装置、復号化装置、符号化方法、及び復号化方法 - Google Patents

動画像符号化装置、復号化装置、符号化方法、及び復号化方法 Download PDF

Info

Publication number
JP2010021704A
JP2010021704A JP2008179064A JP2008179064A JP2010021704A JP 2010021704 A JP2010021704 A JP 2010021704A JP 2008179064 A JP2008179064 A JP 2008179064A JP 2008179064 A JP2008179064 A JP 2008179064A JP 2010021704 A JP2010021704 A JP 2010021704A
Authority
JP
Japan
Prior art keywords
image
motion
screen
motion vector
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008179064A
Other languages
English (en)
Inventor
Isao Karube
勲 軽部
Hiroo Ito
浩朗 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008179064A priority Critical patent/JP2010021704A/ja
Publication of JP2010021704A publication Critical patent/JP2010021704A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】3次元DCTを用いた動画像符号化において、残差画像の相関が低い場合でもより符号化効率の良い動画像符号化処理を実現すること。
【解決手段】第2動き検出部101は、残差画像P1をフレーム間で比較し、画像の動きベクトルMV2を検出し、第2動き補償部102は、第2動き検出部101で検出した動きベクトルMV2を用いて、フレーム間の画像の動きが小さくなるように画面を補正する。3次元DCT部103は、第2動き補償部102で補正した残差画像を2次元空間及び時間方向に離散コサイン変換処理を行う。ここに第2動き補償部102は、動きベクトルMV2に従い画面を分割し、分割した画面を入れ替えて画面を再構成する。
【選択図】図1

Description

本発明は、動画像の高画質符号化及び復号化技術に関する。
従来の動画像符号化技術として、空間内で2次元離散コサイン変換(2D−DCT)を用いた符号化方法が広く用いられている。また、2D−DCT方法の時間方向への拡張として、非特許文献1には、複数フレーム間の冗長性を除去するために時間方向へもDCTを行う3次元DCT(3D−DCT)を利用する方法が提案されている。また符号化効率を向上させるため、特許文献1には、動き補償付き時間方向ローパスフィルタリングを符号化の前処理として行う方法が提案されている。
石川亮,吉田俊之,「類似フレーム探索に基づく動画像の3D/2Dハイブリッド符号化」,2002年画像符号化シンポジウム(PCSJ2002),P−5.09,2002年11月,P85−86 特開2007−221208号公報
非特許文献1に開示される3D−DCTを利用する方法では、動き補償にて得られた残差画像に対して時間的なDCTを行って符号量の削減を図っているが、残差画像の相関が低い場合には十分な符号量削減を実現できないという課題があった。
特許文献1に開示される動き補償付き時間方向ローパスフィルタリング処理は2D−DCT符号化の前処理であり、本符号化部の前に、予測符号化を行う仮符号化部と、ローパスフィルタ処理を行うプレフィルタを新たに設ける必要があり、構成が複雑になるという課題がある。
本発明は上記課題を鑑みてなされたものであり、その目的は、より符号化効率の良い動画像符号化処理および復号化処理をより簡単な構成で実現することである。
本発明は、入力する動画像をその予測画像との残差画像を求め、離散コサイン変換、量子化、可変長符号化処理して符号化画像データを生成し出力する動画像符号化装置において、残差画像をフレーム間で比較し、画像の動きベクトルを検出する動き検出部と、動き検出部で検出した動きベクトルを用いて、フレーム間の画像の動きが小さくなるように画面を補正する動き補償部と、動き補償部で補正した残差画像を2次元空間及び時間方向に離散コサイン変換処理を行う3次元離散コサイン変換部とを備える。ここに動き補償部は、動き検出部で検出した動きベクトルに従い画面を分割し、分割した画面を入れ替えて画面を再構成する。
本発明は、入力する符号化画像データを可変長復号化、逆量子化、逆離散コサイン変換処理して残差画像を求め、その予測画像を加算して動画像を生成し出力する動画像復号化装置において、入力する符号化画像データは、残差画像のフレーム間の動きベクトルを用いて動き補償を行った後符号化処理されたものであって、逆量子化された残差画像を2次元空間及び時間方向に逆離散コサイン変換処理を行う3次元逆離散コサイン変換部と、3次元逆離散コサイン変換部にて変換された残差画像に対し、動きベクトルを用いてフレーム間の画像の動きを元に戻すように画面を補正する逆動き補償部とを備える。
本発明は、入力する動画像をその予測画像との残差画像を求め、離散コサイン変換、量子化、可変長符号化処理して符号化画像データを生成し出力する動画像符号化方法において、残差画像をフレーム間で比較し、画像の動きベクトルを検出するステップと、検出した動きベクトルを用いて、フレーム間の画像の動きが小さくなるように画面を補正するステップと、補正した残差画像を2次元空間及び時間方向に離散コサイン変換処理を行うステップとを備える。
本発明は、入力する符号化画像データを可変長復号化、逆量子化、逆離散コサイン変換処理して残差画像を求め、その予測画像を加算して動画像を生成し出力する動画像復号化方法において、入力する符号化画像データは、残差画像のフレーム間の動きベクトルを用いて動き補償を行った後符号化処理されたものであって、逆量子化された残差画像を2次元空間及び時間方向に逆離散コサイン変換処理を行うステップと、変換された残差画像に対し、動きベクトルを用いてフレーム間の画像の動きを元に戻すように画面を補正するステップとを備える。
本発明によれば、時間方向の離散コサイン変換による符号量削減効果を高め、より符号化効率の良い動画像符号化処理および復号化処理を簡単な構成で実現できる。
以下に、本発明の実施の形態を図面を参照しつつ説明する。なお、各図面において、同一の符号が付されている構成要素は同一の機能を有するものである。
図1は、本発明に係る動画像符号化装置の一実施例を示す構成図である。動画像符号化装置10において、101は第2動き検出部、102は第2動き補償部、103は3次元DCT部、104は量子化部、105は可変長符号化部で、入力画像P0を符号化して出力画像P5を生成する部分である。また106は逆量子化部、107は3次元逆DCT部、108は逆動き補償部、109はフレームメモリ、110は第1動き検出部、111は第1動き補償部であり、参照画像Prから予測画像Ppを生成する部分である。
第1動き検出部110は、入力された画像P0と、フレームメモリ109の参照画像Prとのマッチングを行い、動きベクトル(第1の動きベクトル)MV1を算出する。第1動き補償部111は、フレームメモリ109に保存している参照画像Prと動きベクトルMV1により予測画像Ppを生成する。入力画像P0は減算器112にて予測画像Ppとの差分を取られ、残差画像P1となる。
第2動き検出部101は、フレーム間の残差画像P1のマッチングを行い、残差画像の動きベクトル(第2の動きベクトル)MV2を検出する。第2動き補償部102は、第2の動きベクトルMV2に従い残差画像P1の画面を分割し、フレーム間の画像の動きが小さくなるように分割画面を入れ替える補正を行い、新たな残差画像P2を生成する。
3次元DCT部103は、送られてきた複数フレーム分の残差画像P2に対して、空間内の2次元DCTと時間方向のDCTを組み合わせた3次元DCTを実行し、画像データP3に変換する。量子化部104は、画像データP3を量子化し画像データP4とし、可変長符号化部105は、量子化された画像データP4と動きベクトルMV1,MV2を可変長符号化した画像データP5として出力する。
また、逆量子化部106は、量子化部104からの画像データP4を逆量子化し画像データP3’とする。3次元逆DCT部107は、画像データP3’に対して空間内の2次元逆DCTと時間方向の逆DCTを組み合わせた3次元逆DCTを実行し、残差画像P2’に変換する。逆動き補償部108は、第2の動きベクトルMV2に従い残差画像P2’の画面を分割し、分割画面を入れ替えて元の残差画像P1’に戻す補正を行う。残差画像P1’は、加算器113にて第1動き補償部111からの予測画像Ppと加算され、参照画像Prとなり、フレームメモリ109へ保存される。
このように本実施例の動画像符号化装置10では、第2動き検出部101は、フレーム間の残差画像P1に関する新たな動きベクトル(第2の動きベクトル)MV2を検出し、第2動き補償部102は、第2の動きベクトルMV2に基づきフレーム間の画像の動きが小さくなるように新たな残差画像P2を生成することに特徴がある。その結果、新たな残差画像P2は時間方向の動きが小さくなるので、3次元DCT部103処理後の画像データP3は高周波成分が除去され、出力する画像データP5は符号量が大幅に削減される。言い換えれば、時間方向に相関が低い残差画像の場合でも、時間方向の動き補償を行うことで、より効率的な符号化処理を実現するものである。
次に、第2動き検出部101と第2動き補償部102の行う動き補償処理について図面を用いて説明する。残差画像に関する第2の動きベクトルMV2は、ブロック毎に設定しても良いし、画面全体やある領域に対して1つのベクトルで動きを表しても良い。また、残差の動きベクトル検出方法は、ブロックマッチング法でも良いし、簡略なエッジ検出法などの手法で行っても良い。
図4は、残差画像に関する動き補償の一例を示す図であり、画面全体に対し1つの動きベクトルを適用する場合である。
(a)は、第2動き検出部101へ入力されるフレーム(N−1)の残差画像P1であり、例えば人物像401が含まれているとする。(b)は、次のフレーム(N)における残差画像P1であり、画面内を移動した人物像402が含まれているとする。ここで、(a)のフレーム(N−1)と(b)のフレーム(N)をマッチングすることで、人物像401から人物像402への第2の動きベクトルMV2を求める。
(c)は、第2動き補償部102により、動きベクトルMV2に従ってフレーム(N)の画面を分割した状態である。すなわち、画面左上隅から引いたベクトルMV2の先端を通る横線と縦線により、画面を上辺領域411と左辺領域412、及び人物を含む残りの領域413に分割する。さらに(d)は、分割領域を入れ替えて配置した状態である。ここでは、人物像を含む領域413をベクトルMV2の大きさだけ逆方向に移動させ領域413’とし、上辺領域411と左辺領域412は、それぞれ下辺領域411’と右辺領域412’に移動して配置する。
画面入れ替えの結果、フレーム(N−1)における人物像401と、次のフレーム(N)における人物像402’は、画面内の同一位置に配置されることになる。よって画面内の人物は時間的にあたかも静止しているような画像信号になるので、3次元DCT処理において高周波成分が消失して、符号量を大幅に削減することができる。
なお、このとき(d)における下辺領域411’と右辺領域412’の部分は残差の相関性が低い場合も考えられるため、テンプレート画像で代用することも可能である。
上記の例では、画面全体に1つの動きベクトルを適用する場合を示したが、図5のように画面を複数のブロック500に分割し、ブロック単位でそれぞれ第2の動きベクトルMV2’を適用することも可能である。ブロック単位で処理することにより、画面内の動きが均一でないような場合でもきめ細かな処理を行うことができる。
また、上記の例では3次元DCTのみを適用する場合を示したが、画面内の部分によって3次元DCTと2次元DCTを適応的に切り替えても良い。
図2は、本発明に係る動画像復号化装置の一実施例を示す構成図である。動画像復号化装置20において、201は可変長復号化部、202は逆量子化部、203は3次元逆DCT部、204は逆動き補償部、205はフレームメモリ、206は第1動き補償部であり、入力画像P5を復号化して出力画像P0を生成する。
可変長復号部201は、入力画像データP5に可変長復号処理を行い、量子化された動画像データP4と動きベクトルMV1とMV2を得る。逆量子化部202は、画像データP4に逆量子化処理を行い画像データP3を生成し、3次元逆DCT部203は、画像データP3に対して空間内の2次元逆DCTと時間方向の逆DCTを組み合わせた3次元逆DCT処理を実行し、残差画像P2に変換する。
逆動き補償部204は、可変長復号部201からの第2の動きベクトルMV2に従い残差画像P2の画面を分割し、分割画面を入れ替えて元の残差画像P1に戻す補正を行う。残差画像P1は、加算器207にて第1動き補償部206からの予測画像Ppと加算され、出力画像P0となる。出力画像P0は、フレームメモリ205へ保存され参照画像Prとなる。ここでフレームメモリ205の直前に、デブロッキングフィルタを入れても良い。第1動き補償部206は、フレームメモリ205から参照画像Prを読み出し、可変長復号部201からの動きベクトルMV1を用いて次のフレームを処理するときの予測画像Ppを生成する。
このとき逆動き補償部204の行う動き補償処理は、前記図4を逆方向に処理することになる。すなわち、フレーム(N)として(d)の画像データが入力すると、第2の動きベクトルMV2の逆ベクトル(−MV2)の先端を通る横線と縦線により、画面を右辺領域411’と下辺領域412’、及び人物402’を含む領域413’に分割する。次に(c)のように分割領域を入れ替えて配置する。ここでは、領域413’をベクトルMV2の大きさだけ移動させ領域413とし、下辺領域411’と右辺領域412’は、それぞれ上辺領域411と左辺領域412に配置する。画面入れ替えの結果、人物像402’は元の位置402に戻され、(b)のような残差画像が復元される。
このように本実施例の動画像復号化装置20では、実施例1の動画像符号化装置10にて符号化された画像データに対し、逆動き補償部204は第2の動きベクトルMV2に基づき分割画面を入れ替えて元の残差画像P1を再構成することに特徴がある。その結果、残差画像の第2の動きベクトルMV2を用いて符号化された画像データを、より効率的に復号化処理を行うことができる。
図3は、本発明の動画像符号化装置と動画像復号化装置を適用した映像表示装置の一例を示す構成図である。映像表示装置1は、符号化部(動画像符号化装置)10と復号化部(動画像復号化装置)20の他に、入力部30、記録部40、表示部50、出力部60などを備える。具体的には、録画機能付きテレビジョン装置が該当する。
入力部30は、他の機器から符号化ストリームを入力したり、デジタルテレビジョン放送を受信するなどして、動画像を含む符号化ストリームを取得する。符号化部10は取得した符号化ストリームに対し、実施例1で述べたように残差画像の動きベクトルを利用した動き補償と3次元DCT処理を行い、高効率の符号化処理を行う。記録部40は、符号化部10で符号化されたストリーム、または入力部30に入力した符号化ストリームを記録媒体に記録する。記録媒体としては、ハードディスクや光ディスクなどが用いられる。
復号化部20は、入力部30で取得した符号化ストリーム、または記録部40から再生した符号化ストリームを復号化し、例えばRGBまたはコンポーネント(Y/Cb/Cr)形式などの動画像信号を生成する。そのとき復号部20は、実施例2で述べたように、残差画像の動きベクトルを利用した動き補償と3次元逆DCT処理を行い、高効率の復号化処理を行う。復号化した動画像信号は、表示部50または出力部60に送られる。表示部50は、LCDやPDPなどの表示素子に動画像を表示する。出力部60は、動画像信号を他の機器等に出力する。
本実施例の映像表示装置1によれば、符号化部10と復号化部20は従来よりも符号量を削減して高効率に符号化処理を行うので、記録部40の記憶容量を節約し効率良く利用することができる。
なお、本発明の動画像符号化装置と動画像復号化装置を適用した他の装置として、符号化部10と記録媒体40と出力部60とを備えた動画像記録装置(レコーダー)を構成することも可能である。
本発明に係る動画像符号化装置の一実施例を示す構成図。 本発明に係る動画像復号化装置の一実施例を示す構成図。 動画像符号化装置と動画像復号化装置を適用した映像表示装置の一例。 残差画像に関する動き補償の一例を示す図。 画面をブロックに分割し、ブロック単位で動きベクトルを適用する場合。
符号の説明
1…映像表示装置、
10…動画像符号化装置(符号化部)、
20…動画像復号化装置(復号化部)、
101…第2動き検出部、
102…第2動き補償部、
103…3次元DCT部、
104…量子化部、
105…可変長符号化部、
106,202…逆量子化部、
107,203…3次元逆DCT部、
108,204…逆動き補償部、
109,205…フレームメモリ、
110…第1動き検出部、
111,206…第1動き補償部
201…可変長復号化部、
MV1,MV2…動きベクトル。

Claims (11)

  1. 入力する動画像をその予測画像との残差画像を求め、離散コサイン変換、量子化、可変長符号化処理して符号化画像データを生成し出力する動画像符号化装置において、
    上記残差画像をフレーム間で比較し、画像の動きベクトルを検出する動き検出部と、
    該動き検出部で検出した動きベクトルを用いて、フレーム間の画像の動きが小さくなるように画面を補正する動き補償部と、
    該動き補償部で補正した残差画像を2次元空間及び時間方向に離散コサイン変換処理を行う3次元離散コサイン変換部と、
    を備えたことを特徴とする動画像符号化装置。
  2. 請求項1に記載の動画像符号化装置において、
    前記動き補償部は、前記動き検出部で検出した動きベクトルに従い画面を分割し、分割した画面を入れ替えて画面を再構成することを特徴とする動画像符号化装置。
  3. 請求項1または2に記載の動画像符号化装置において、
    前記動き検出部は、比較するフレーム間でブロックマッチングまたはエッジ検出により動きベクトルを検出することを特徴とする動画像符号化装置。
  4. 請求項1に記載の動画像符号化装置において、
    各フレームの画面は複数のブロックに分割されていて、
    前記動き検出部は、上記ブロック単位で動きベクトルを検出し、
    前記動き補償部は、上記ブロック単位で画面を補正することを特徴とする動画像符号化装置。
  5. 請求項1に記載の動画像符号化装置において、
    前記動き検出部にて検出した動きベクトルを、生成した前記符号化画像データに含めて出力することを特徴とする動画像符号化装置。
  6. 入力する符号化画像データを可変長復号化、逆量子化、逆離散コサイン変換処理して残差画像を求め、その予測画像を加算して動画像を生成し出力する動画像復号化装置において、
    上記入力する符号化画像データは、残差画像のフレーム間の動きベクトルを用いて動き補償を行った後符号化処理されたものであって、
    上記逆量子化された残差画像を2次元空間及び時間方向に逆離散コサイン変換処理を行う3次元逆離散コサイン変換部と、
    該3次元逆離散コサイン変換部にて変換された残差画像に対し、上記動きベクトルを用いてフレーム間の画像の動きを元に戻すように画面を補正する逆動き補償部と、
    を備えたことを特徴とする動画像復号化装置。
  7. 請求項6に記載の動画像復号化装置において、
    前記逆動き補償部は、前記動きベクトルに従い画面を分割し、分割した画面を入れ替えて画面を再構成することを特徴とする動画像復号化装置。
  8. 入力する動画像をその予測画像との残差画像を求め、離散コサイン変換、量子化、可変長符号化処理して符号化画像データを生成し出力する動画像符号化方法において、
    上記残差画像をフレーム間で比較し、画像の動きベクトルを検出するステップと、
    該検出した動きベクトルを用いて、フレーム間の画像の動きが小さくなるように画面を補正するステップと、
    該補正した残差画像を2次元空間及び時間方向に離散コサイン変換処理を行うステップと、
    を備えたことを特徴とする動画像符号化方法。
  9. 請求項8に記載の動画像符号化方法において、
    前記画面を補正するステップは、前記動きベクトルに従い画面を分割し、分割した画面を入れ替えて画面を再構成することを特徴とする動画像符号化方法。
  10. 入力する符号化画像データを可変長復号化、逆量子化、逆離散コサイン変換処理して残差画像を求め、その予測画像を加算して動画像を生成し出力する動画像復号化方法において、
    上記入力する符号化画像データは、残差画像のフレーム間の動きベクトルを用いて動き補償を行った後符号化処理されたものであって、
    上記逆量子化された残差画像を2次元空間及び時間方向に逆離散コサイン変換処理を行うステップと、
    該変換された残差画像に対し、上記動きベクトルを用いてフレーム間の画像の動きを元に戻すように画面を補正するステップと、
    を備えたことを特徴とする動画像復号化方法。
  11. 請求項10に記載の動画像復号化方法において、
    前記画面を補正するステップは、前記動きベクトルに従い画面を分割し、分割した画面を入れ替えて画面を再構成することを特徴とする動画像復号化方法。
JP2008179064A 2008-07-09 2008-07-09 動画像符号化装置、復号化装置、符号化方法、及び復号化方法 Pending JP2010021704A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008179064A JP2010021704A (ja) 2008-07-09 2008-07-09 動画像符号化装置、復号化装置、符号化方法、及び復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008179064A JP2010021704A (ja) 2008-07-09 2008-07-09 動画像符号化装置、復号化装置、符号化方法、及び復号化方法

Publications (1)

Publication Number Publication Date
JP2010021704A true JP2010021704A (ja) 2010-01-28

Family

ID=41706188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008179064A Pending JP2010021704A (ja) 2008-07-09 2008-07-09 動画像符号化装置、復号化装置、符号化方法、及び復号化方法

Country Status (1)

Country Link
JP (1) JP2010021704A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102036075A (zh) * 2010-12-29 2011-04-27 东南大学 一种图像及数字视频编码及解码方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102036075A (zh) * 2010-12-29 2011-04-27 东南大学 一种图像及数字视频编码及解码方法
CN102036075B (zh) * 2010-12-29 2012-11-28 东南大学 一种图像及数字视频编码及解码方法

Similar Documents

Publication Publication Date Title
US8649431B2 (en) Method and apparatus for encoding and decoding image by using filtered prediction block
RU2718159C1 (ru) Высокоточная повышающая дискретизация при масштабируемом кодировании видеоизображений с высокой битовой глубиной
JP3788823B2 (ja) 動画像符号化装置および動画像復号化装置
KR101672607B1 (ko) 부호화 장치, 복호화 장치, 부호화 방법, 복호화 방법, 및 컴퓨터 판독가능 기억 매체
EP2524505B1 (en) Edge enhancement for temporal scaling with metadata
KR20150055005A (ko) 수정된 참조를 가진 차세대 비디오 코딩용 콘텐츠 적응적 예측 및 기능적 예측 픽처
KR102362840B1 (ko) 영상 코딩 시스템에서 서브 블록 단위의 움직임 예측에 기반한 영상 디코딩 방법 및 장치
JP4875007B2 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置
JP2009177417A (ja) 画像符号化装置および方法、画像復号装置および方法、並びにプログラム
US20080095239A1 (en) Method for video frame rate conversion
JP2007306152A (ja) 画像復号化装置及び画像復号化方法
JP6409516B2 (ja) ピクチャ符号化プログラム、ピクチャ符号化方法及びピクチャ符号化装置
JP2007274479A (ja) 画像符号化装置及び画像復号化装置
KR101883265B1 (ko) 패치 시프팅을 통해 벡터 양자화 에러를 감소시키기 위한 방법들 및 장치
Skorupa et al. Efficient low-delay distributed video coding
JP5137687B2 (ja) 復号装置及び復号方法、プログラム
EP3329678B1 (en) Method and apparatus for compressing video data
KR102276914B1 (ko) 비디오 인코딩 장치 그리고 이의 구동 방법
US8331447B2 (en) Apparatus for decoding video compression coded data
JP2008301336A (ja) 画像処理装置、画像符号化装置及び画像復号化装置
JP2014007469A (ja) 画像符号化装置及び画像符号化方法
JP2006246277A (ja) 再符号化装置、再符号化方法、および再符号化用プログラム
JP6539580B2 (ja) インター予測装置、インター予測方法、動画像符号化装置、動画像復号装置及びコンピュータ可読記録媒体
JP2010021704A (ja) 動画像符号化装置、復号化装置、符号化方法、及び復号化方法
WO2014156647A1 (ja) 複数の入力画像をエンコーディングする方法、プログラムを格納する記憶媒体および装置