JP2006324888A - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP2006324888A
JP2006324888A JP2005145596A JP2005145596A JP2006324888A JP 2006324888 A JP2006324888 A JP 2006324888A JP 2005145596 A JP2005145596 A JP 2005145596A JP 2005145596 A JP2005145596 A JP 2005145596A JP 2006324888 A JP2006324888 A JP 2006324888A
Authority
JP
Japan
Prior art keywords
motion
partition
mode
unit
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005145596A
Other languages
English (en)
Inventor
Hidemasa Miyoshi
秀誠 三好
Akira Nakagawa
章 中川
Atsushi Ichiki
篤史 一木
Yasuo Sumita
恭雄 簾田
Yasuhiro Ito
安弘 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005145596A priority Critical patent/JP2006324888A/ja
Publication of JP2006324888A publication Critical patent/JP2006324888A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】少ない演算量により動画像データの高能率符号化を実現する動画像符号化装置を提供する。
【解決手段】動画像データのフレームを複数のブロックに分割し、当該ブロック単位で、符号化済み参照フレームからの予測フレームと、符号化対象となる現フレームとの予測誤差信号及び動きベクトルを符号化する動画像符号化装置であって、当該ブロックを更にパーティション単位に分割するための分割形状を決定する複数のパーティションモードと、当該参照フレームを用いた動きベクトル予測方法を決定する複数の動き予測モードとの組合せを選択する選択部と、この選択部により選択されたパーティションモードと動き予測モードに基づいて、動きベクトルを算出する算出部とを備える。
【選択図】 図1

Description

本発明は、動画像符号化装置に関する。
動画像データは、一般に、データ量が大きいため、送信装置から受信装置へ伝送される際、或いは記憶装置に格納される際などには、動画像データの高能率符号化が行われる。この高能率符号化とは、あるデータ列を他のデータ列に変換する符号化であって、対象となるデータ量を圧縮する技術をいう。
動画像データの高能率符号化方法としては、動き補償フレーム間予測符号化方法が知られている(図4参照)。この符号化方法では、動画像データが時間方向に相関性が高いことを利用する。動画像を構成するフレームのうち、あるタイミングにおけるフレームデータと次のタイミングにおけるフレームデータとの類似度が高いことが多いという動画像一般の性質を利用した符号化方法である。
動き補償フレーム間予測符号化方法では、原画像がブロック(マクロブロック)に分割され、このブロック単位に、符号化済みフレームの復号画像からこの原画像ブロックと類似している領域が選択され、この類似領域と原画像ブロックの差分が求められ、他の冗長なデータが取り除かれる。そして、類似領域を指し示す動きベクトル情報と、冗長性の取り除かれた差分情報が符号化される。このように符号化されることにより、動画像データの高圧縮が実現される。
動き補償フレーム間予測符号化方法を用いたデータ伝送システムでは、例えば、以下のような処理がなされる。送信装置では、前フレームの画像から対象フレームの画像への「動き」を表す動きベクトルデータ、及びその前フレームの画像からその動きベクトルデータを用いて作成された対象フレームの予測画像と対象フレームの実際の画像との差分データが生成され、それら動きベクトルデータおよび差分データが受信装置に送出される。一方、受信装置では、受信された動きベクトルデータ及び差分データから対象フレームの画像が再生される。
このようなフレーム間予測符号化方法は、ITU−T H.263/H.264、ISO/IEC MPEG−1/2/4などの標準方式において採用されている。また、これらの標準方式では、動きベクトルデータを符号化する方法として、予測符号が用いられている。
以下、上記標準符号化方式であるH.264/MPEG−4AVCについて説明する。H.264/MPEG−4AVCでは、上述のマクロブロックをさらに小さなパーティションに分割し、この分割されたパーティション単位(以降、パーティションモードという)で動きベクトルを求めることができる(図5参照)。このパーティションの分割単位は、16×16画素のマクロブロックパーティションとして16×16、16×8、8×16、8×8、更にこの8×8画素の場合、サブマクロブロックパーティションとして8×8、8×4、4×8、4×4から選択可能である(図6参照)。これは、通常の動画像では、大きな領域が同じ方向に動くことが多いため、常に細分化するのは無駄であり、どの単位で分割するかを選択可能としているものである。
また、H.264/MPEG−4AVCでは、予測精度を上げるために動き予測モードが設けられている。動き予測モードには、フレーム間予測をするにあたり、時間的に前の
フレームを使う方法(前方向予測)、後のフレームを使う方法(後方向予測)、双方のフレームを使う方法(両方向予測)がある。そして、フレーム間予測としてBフレーム(Bi-directional Predicted Frame)が用いられる場合、上記パーティション毎に3種類(前
方向予測、後方向予測、 両方向予測)の動き予測モードから予測精度の高いモードが一
つ選択され、その動き予測モードにより符号化される。
また、H.264/MPEG−4AVCでは、動き補償の精度を上げるために、フル画素、1/2画素、1/4画素の精度で動きベクトル予測を行うことが可能となっている。物体の動きが整数画素単位になる確率は低いため、整数画素未満の精度(小数画素精度)での動きを利用することで動き補償の精度を上げるのを目的とする。
なお、上記動き補償予測符号化方式を用いた動画符号化装置については、以下の文献で開示されている。
特開2000−102016号公報
しかしながら、上記H.264/MPEG−4AVC等の従来技術による動画像データの高能率符号化方法では、全てのパーティションモード(組み合わせ総数は259通り)で3種類の動き予測モード及び3種類の動き補償精度を用いて動きベクトルが求められ、予測画像と符号化対象画像との差分情報がそれぞれ計算される。そして、その中から符号化効率が最適な一つの組み合わせが決定される。すなわち、従来の高能率符号化方法では、最適な符号化効率を決定するのに、莫大な演算量を有する。
本発明の目的は、少ない演算量により動画像データの高能率符号化を実現する動画像符号化装置を提供することである。
本発明は、上述した課題を解決するために以下の構成を採用する。即ち、本発明は、動画像データのフレームを複数のブロックに分割し、当該ブロック単位で、符号化済み参照フレームからの予測フレームと、符号化対象となる現フレームとの予測誤差信号及び動きベクトルを符号化する動画像符号化装置であって、当該ブロックを更にパーティション単位に分割するための分割形状を決定する複数のパーティションモードと、当該参照フレームを用いた動きベクトル予測方法を決定する複数の動き予測モードの組合せを選択する選択部と、この選択部により選択されたパーティションモードと動き予測モードに基づいて、動きベクトルを算出する算出部とを備える動画像符号化装置についてのものである。
そして、本発明に係る動画像符号化装置では、上記選択部が、フル画素以上の動き補償精度において、各パーティションモードのそれぞれについての評価値を求める評価部と、当該評価値に基づいて、選択されるべきパーティションモードとして、複数のパーティションモードのうちのいずれかを決定する決定部とを更に備える。
本発明では、パーティションモードと動き予測モードを選択するにあたり、フル画素以上の動き補償精度において、各パーティションモードのそれぞれについて評価値が求められ、その評価値に基づいてパーティションモードが選択される。
これにより、フル画素未満の動き補償精度では、既に選択されたパーティションモードにおいてのみ動きベクトルを算出すればよいため、動きベクトル算出処理に関する負担を大幅に軽減することができる。
また、本発明に係る動画像符号化装置では、上記評価部が、パーティション単位での、動きベクトルにおける各動き予測モードの予測フレームと現フレームとの画素差分情報を、各動き予測モードそれぞれについて求め、求められた各動き予測モードの画素差分情報のうち、所定の条件を満たす画素差分情報を評価要素として、各パーティションモードのそれぞれについての評価値を求める。
本発明では、上記パーティションモードを絞り込むにあたって、パーティション単位での各動き予測モードにおける動きベクトルを求め、参照フレームから各動き予測モードにおける当該動きベクトルにより予測される予測フレームと現フレームとの画素差分情報を評価要素とする評価値を各パーティションモードのそれぞれについて求める。
また、本発明に係る動画像符号化装置では、上記評価部が、パーティション単位で求められた評価要素をパーティションモード単位に正規化し、その正規化された評価要素に基づいて、前記各パーティションモードのそれぞれについての評価値を求める。
本発明では、先に算出されたパーティション単位での画素差分情報を各パーティションモードで正規化した値を評価値として、パーティションモードが決定される。
これにより、パーティションモードを絞り込むうえで、動き予測モードを考慮した評価値が用いられるため、処理負担を軽減したことによる符号化効率の悪化を防ぐことができる。
また、本発明に係る動画像符号化装置では、上記選択部が、上記決定部において決定されたパーティションモードで、フル画素未満の動き補償精度における各動き予測モードの画素差分情報を求め、当該画素差分情報が所定の条件を満たす動き予測モードを選択する。
これにより、パーティションモードを絞り込んだうえで、動き予測モードを選択することができるため、符号化処理の負荷を軽減することができる。
なお、本発明は、以上の何れかの機能を実現させるプログラムであってもよい。また、本発明は、そのようなプログラムをコンピュータが読み取り可能な記憶媒体に記録してもよい。
本発明によれば、少ない演算量により動画像データの高能率符号化を実現する動画像符号化装置を提供することができる。
[実施の形態]
以下、図面を参照して、本発明の実施形態に係る動画像符号化装置について説明する。実施形態の構成は例示であり、本発明は実施形態の構成に限定されない。
〔装置構成〕
図1は、本発明の実施形態による動画像符号化装置の構成を示す図である。以下に、本実施形態の動画像符号化装置の構成について図1を用いて説明する。本実施形態における動画像符号化装置は、動画像符号化の標準であるH.264/MPEG−4AVC方式に本発明を適用した場合の例である。なお、本動画像符号化装置は、CPU(Central Processing Unit)、各種メモリ、入出力インタフェース等を備え、このCPUによって、メ
モリに記憶される制御プログラムを実行することで動画像データの符号化を行うようにし
てもよい。その場合には、以下に示す各機能部は制御プログラムによって制御される。また、以下に示す各機能部はそれぞれハードウェアとして機能するようにしてもよい。
図1に示すように、本実施形態における動画像符号化装置100は、予測誤差信号生成部101、直交変換部102、量子化部103、エントロピー符号化部104、逆量子化部105、逆直交変換部106、復号画像生成部107、予測画像生成部108、復号画像記憶部109、及び動きベクトル計算部110を有している。各機能部についての概略を以下に説明する。
予測誤差信号生成部101は、入力された画像データの現フレームを16×16ピクセルのブロック(以降、マクロブロック(MB)という)に分割されたマクロブロックデータ(以降、ブロックデータともいう)を得て、そのブロックデータと、予測画像生成部108から供給される予測画像フレームのブロックデータとにより、予測誤差信号を生成する。予測誤差信号生成部101は、生成された予測誤差信号を直交変換部102に渡す。
直交変換部102は、入力された予測誤差信号を直交変換処理する。直交変換部102は、直交変換処理によって水平及び垂直方向の周波数成分に分離された信号を量子化部103に供給する。量子化部103は、直交変換部102の出力を量子化する。量子化部103は、符号化することによって当該予測誤差信号の符号量を低減し、エントロピー符号化部104及び逆量子化部105に供給する。
エントロピー符号化部104は、量子化部103からの出力をエントロピー符号化(可変長符号化)して出力する。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
逆量子化部105は、量子化部103の出力を逆量子化してから逆直交変換部106に供給する。逆直交変換部106は、逆量子化部105の出力を逆直交変換処理してから復号画像生成部107に供給する。これら逆量子化部105及び逆直交変換部106によって復号化処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
復号画像生成部107は、予測画像生成部108で動き補償されたフレームのブロックデータと、逆量子化部105及び逆直交変換部106により復号処理された予測誤差信号とを加算することにより、現画像データフレームの予測されるブロックデータを再生し、復号画像記憶部109に渡す。
復号画像記憶部109は、渡されたブロックデータを新たな参照フレームのデータとして記憶し、予測画像生成部108及び動きベクトル計算部110に供給する。
予測画像生成部108は、復号画像記憶部109から得た参照フレームのデータを動きベクトル計算部110から提供される動きベクトルで動き補償することにより、動き補償された参照フレームのブロックデータを生成する。生成された参照フレームのブロックデータは、予測誤差信号生成部101に供給される。
動きベクトル計算部110は、現画像データフレームにおけるブロックデータと、復号画像記憶部109から得る既に符号化された参照フレームのブロックデータを用いて、動きベクトルを求める。動きベクトルとは、ブロック単位で参照フレームから現フレームに最も類似している位置を探索するブロックマッチング技術を用いて求められるブロック単位の空間的なずれを示す値である。動きベクトル計算部110は、求めた動きベクトルを予測画像生成部108に渡す。
本実施形態における動きベクトル計算部110は、マクロブロックの中を更にパーティションに区切り、各パーティションでそれぞれ動きベクトルを求める。パーティションの区切り方(以降、パーティションモードという)については、図5に示すような7つのパーティションモードがある。そして、これらパーティションの組み合わせにより、マクロブロックは形成される。
また、動きベクトル計算部110の動きベクトルの算出方式として、動き予測モード(前方向予測、後方向予測、両方向予測)(図4参照)がある。前方向予測とは、符号化対象フレーム(現画像)から前方参照フレーム(過去参照画像)への動きベクトルを用いる予測モードである。後方向予測とは、符号化対象フレーム(現画像)から後方参照フレーム(未来参照画像)への動きベクトルを用いる予測モードである。両方向予測とは、符号化対象フレーム(現画像)から前方参照フレーム(過去参照画像)と後方参照フレーム(未来参照画像)への両方の動きベクトルを用いる予測モードである。
すなわち、動きベクトル計算部110は、動き予測モードに応じた参照フレームを復号画像記憶部109から得て、それら参照フレームを用いて動きベクトルを計算する。動きベクトル計算部110は、前方向予測であれば、時間的に先の既に符号化された参照フレームを用い、後方向予測であれば、時間的に後の参照フレームを用い、両方向予測であれば、両方向の参照フレームを用いる。
また、動きベクトル計算部110は、動き補償の精度を上げるために、フル画素、1/2画素、1/4画素の動き補償精度で動きベクトルを求める。
動きベクトル計算部110は、上記パーティションモードの組み合わせ、動き予測モード、及び動き補償精度を用いて、予測参照画像と現画像との画素差分が最小になる最適動きベクトルを算出する。なお、本実施形態の、パーティションモード、動き予測モード、及び動き補償精度のモードは、それぞれH.264/MPEG−4AVC方式に準拠したものであり、本発明はこの方式に限定されるものではない。本発明は、それぞれのモードの種類が増えた場合などにも対応可能な構成となる。
動きベクトル計算部110は、このような機能を実現するために、更に以下に示す詳細機能部を持つ。以下、動きベクトル計算部110の詳細について図2を用いて説明する。図2は、動きベクトル計算部110の詳細構成を示す図である。
動きベクトル計算部110は、動き補償精度毎に、フル画素動き探索部200、1/2画素動き探索部205、1/4画素動き探索部206を有する。動きベクトル計算部110は、この構成に限定されるものではなく、例えば、2倍画素動き探索部等を更に有するようにしてもよく、動き補償精度に合わせて機能部を付加するようにしてもよい。
また、動きベクトル計算部110は、パーティションモード毎にパーティションモード評価値演算部201−203を有する。これら各パーティションモード評価値演算部により、各パーティションモードにおける1マクロブロック当りの評価値を算出する。図2に示す構成例では、パーティションモードA評価値演算部201、パーティションモードB評価値演算部202、及びパーティションモードC評価値演算部203が示されている。なお、上記構成は例示であり、パーティションモードは図5に示すように7種類存在するため、そのモード毎に機能部を設けるようにしてもよい。図2に示すパーティションモード評価値演算部は、図3に示す各パーティションモードに対応している。図3は、本動画像符号化装置のパーティションモードの例を示す図である。
また、動きベクトル計算部110は、動き予測モード毎に動き予測モード演算部207−209を有する。これら各動き予測モード演算部により、それぞれ動き予測モードに応じたSAD値が求められる。図2に示す構成例では、動き予測モードA演算部207、動き予測モードB演算部208、動き予測モードC演算部209が示されている。本実施形態では、動き予測モードAとは前方向予測モードを、動き予測モードBとは後方向予測モードを、動き予測モードCとは両方向予測モードを意味する。なお、上記構成は例示であり、その他の予測モードに応じて構成を変更するようにしてもよい。
〈フル画素動き探索部〉
フル画素動き探索部200は、復号画像記憶部109から前方向参照フレーム及び後方向参照フレームをそれぞれ得る。フル画素動き探索部200は、それら参照フレームを用い、フル画素の動き補償精度で動き探索を行い、各パーティションモードでの前方向予測及び後方向予測のフル画素における最適ベクトルを求める。すなわち、フル画素動き探索部200は、図3の例で示すパーティションモードA、B及びCのそれぞれについて、前方向予測における最適動きベクトル、後方向予測における最適動きベクトルのそれぞれを求める。
フル画素動き探索部200は、求めた最適動きベクトルを各パーティションモードに対応するパーティションモード評価値演算部に渡す。例えば、フル画素動き探索部200は、パーティションモードAについて求めた最適動きベクトルをパーティションモードA評価値演算部201に渡す。
〈パーティションモード評価値演算部〉
パーティションモード評価値演算部201−203は、フル画素動き探索部200から得た当該パーティションモードに対応する前方向予測における最適動きベクトルと後方向予測における最適動きベクトルとを用いて、自身のパーティションモードにおける1マクロブロック当りの評価値を求める。この評価値演算方法については、〔動作例〕項で述べる。例えば、パーティションモードA評価値演算部201は、パーティションモードAにおける評価値を演算する。各パーティションモード評価値演算部は、求めた評価値とフル画素動き探索部200から受けた当該パーティションモードにおける最適動きベクトルを、それぞれパーティションモード選択部204に渡す。
〈パーティションモード選択部〉
パーティションモード選択部204は、各パーティションモード評価値演算部から、それぞれ当該パーティションモード毎の1マクロブロックあたりの評価値と、当該パーティションモードにおける前方向予測及び後方向予測それぞれの最適動きベクトルを得る。パーティションモード選択部204は、各パーティションモード評価値演算部から得た1マクロブロック当りの評価値を比較し、評価値が一番小さいパーティションモードを選択する。パーティションモード選択部204は、選択されたパーティションモード、及びそれに関する最適動きベクトルを1/2画素動き探索部205に渡す。
〈1/2画素動き探索部〉
1/2画素動き探索部205は、パーティションモード選択部204から、選択されたパーティションモード及びその選択されたパーティションモードにおけるフル画素の前方向予測及び後方向予測それぞれの最適動きベクトルを得る。1/2画素動き探索部205は、選択されたパーティションモードにおいて、1/2画素における前方向予測及び後方向予測それぞれの最適動きベクトルを求める。
そして、1/2画素動き探索部205は、求めた1/2画素における最適動きベクトルとパーティションモード選択部204から得たフル画素における最適動きベクトルを比較
し、動きベクトルが小さいほうの最適動きベクトルを前方向予測及び後方向予測のそれぞれについて選択する。例えば、前方向予測モードにおいて、フル画素における最適動きベクトルと1/2画素における最適動きベクトルを比較することにより、フル画素における最適動きベクトルがより小さい場合には、フル画素における最適動きベクトルが選択される。後方向予測モードにおいても同様に、例えば、1/2画素における最適動きベクトルのほうがフル画素における最適動きベクトルよりも小さい場合には、1/2画素における最適動きベクトルが選択される。
これにより、1/2画素動き探索部205は、選択された最適動きベクトル及び選択されたパーティションモードを1/4画素動き探索部206に渡す。
〈1/4画素動き探索部〉
1/4画素動き探索部206は、1/2画素動き探索部205から、前方向予測モード及び後方向予測モードそれぞれにおける選択されたパーティションモードでの最適動きベクトル、及び選択されたパーティションに関する情報を得る。1/4画素動き探索部206は、選択されたパーティションモードにおいて、1/4画素における最適動きベクトルを前方向予測モード及び後方向予測モードのそれぞれにおいて求める。
そして、1/4画素動き探索部206は、求めた1/4画素における最適動きベクトルと1/2画素動き探索部205から得た最適動きベクトルを比較し、動きベクトルが小さいほうの最適動きベクトルを選択する。これにより、1/4画素動き探索部206は、選択された最適動きベクトル及び選択されたパーティションモードを、それぞれ動き予測モード演算部207−209に渡す。
〈動き予測モード演算部〉
動き予測モード演算部207−209は、1/4画素動き探索部206から、選択されたパーティションモードに関する情報と、この選択されたパーティションモードにおける前方向予測モード及び後方向予測モードそれぞれの最適動きベクトルを得る。
動き予測モード演算部は、1/4画素動き探索部206から得た最適動きベクトルを用いることにより、対応する動き予測モードによって、選択されたパーティションモードにおけるパーティション毎の画素差分絶対値(SAD)を求める。例えば、動き予測モードA演算部207は、前方向予測モードにより、参照フレームと1/4画素動き探索部206から得た前方向予測モードの最適動きベクトルと現フレームにおける画素差分絶対値を求める。動き予測モードB演算部208は、後方向予測モードにより、参照フレームと1/4画素動き探索部206から得た後方向予測モードの最適動きベクトルと現フレームにおける画素差分絶対値を求める。動き予測モードC演算部209は、両方向予測モードにより、前方向及び後方向のそれぞれの参照フレームと前方向予測モード及び後方向予測モードのそれぞれの最適動きベクトルとから画素差分絶対値を求める。
各動き予測モード演算部は、それぞれ算出されたパーティション毎のSAD値を動き予測モード選択部210に渡す。
〈動き予測モード選択部〉
動き予測モード選択部210は、各動き予測モード演算部から受けたパーティション毎のSAD値からSAD値が最小となる動き予測モードを選択する。これにより、マクロブロック毎のパーティションモードと動き予測モードの組み合わせが決定されることになる。さらに、動きベクトル計算部110は、上記最適なパーティションモードと動き予測モードを用いて、予測参照画像と現画像との画素差分が最小になる最適動きベクトルを求めることができる。
〔動作例〕
次に、本実施形態における動画像符号化装置の動作例として、上述したパーティションモード評価値演算部201−203における評価値演算方法について、図3を用いて以下に説明する。図3は、パーティションモードの例を示す図である。
パーティションモード評価値演算部は、フル画素動き探索部200から得た当該パーティションモードに対応する前方向予測における最適動きベクトル、後方向予測における最適動きベクトル、及び参照フレームを用いて、自身のパーティションモードにおける1マクロブロック当りの評価値を算出する。
パーティションモードA評価値演算部201における評価値演算方法について以下に説明する。パーティションモードAは、図3に示すようにパーティションA−1及びA−2に区切られるモードである。パーティションモードA評価値演算部201は、各パーティションについて、それぞれ、前方向予測の画素差分絶対値(fw_sad_An(n=1,2,...))、及び後方向予測の画素差分絶対値(bw_sad_An(n=1,2,...))を算出する。画素差分絶対値は、前方向予測モードであれば、時間的に前方向の参照フレームの該当ブロックと、フル画素動き探索部200から得た前方向予測における最適動きベクトルが示す現フレームのブロックとの間における画素毎の差分の絶対値和である。
パーティションモードA評価値演算部201は、パーティションA−1について、前方向予測の画素差分絶対値(fw_sad_A1)、及び後方向予測の画素差分絶対値(bw_sad_A1)を算出する。同様に、パーティションA−2について、後方向予測の画素差分絶対値(fw_sad_A2)、及び後方向予測の画素差分絶対値(bw_sad_A2)が算出される。
次に、パーティションモードA評価値演算部201は、各パーティションについてそれぞれ前方向予測と後方向予測との画素差分絶対値の小さいほうの値を当該パーティションの評価値(E_An=min(fw_sad_An,bw_sad_An))として求める。すなわち、パーティションモードA評価値演算部201は、パーティションA−1についての評価値(E_A1=min(fw_sad_A1,bw_sad_A1))と、パーティションA−2についての評価値(E_A2=min(fw_sad_A2,bw_sad_A2))とを求める。
最後に、パーティションモードA評価値演算部201は、上記パーティション毎の評価値を加算し、1マクロブロック当りの評価値とする(E_A=E_A1+E_A2)。ここで、1マクロブロック当りの評価値を求めるのに、補正値a(E_A=E_A1+E_A2+補正値a)を用いるようにしてもよい。例えば、補正値は、パーティションモード毎に予め決められた所定の値を用いるようにしてもよい。この場合、例えば、図3に示すパーティションモードAを補正値“1”とし、パーティションモードBを補正値“2”とし、パーティションモードCを補正値“3”などと決めるようにしてもよい。このように、補正値は、ブロック毎の形状やその形状に応じた情報の多さに基づいて決めるようにしてもよい。
同様に、パーティションモードB評価値演算部202は、パーティションB−1及びB−2のそれぞれについて、評価値(E_B1=min(fw_sad_B1,bw_sad_B1))、(E_B2=min(fw_sad_B2,bw_sad_B2))を求め、上記パーティション毎の評価値を加算し、1マクロブロック当りの評価値とする(E_B=E_B1+E_B2+補正値b)。
同様に、パーティションモードC評価値演算部203は、パーティションC−1、C−2、C−3及びC−4のそれぞれについて、評価値(E_C1=min(fw_sad_C1,bw_sad_C1))、(E_C2=min(fw_sad_C2,bw_sad_C2))、(E_C3=min(fw_sad_C3,bw_sad_C3))、(E_C4=min(fw_sad_C4,bw_sad_C4))を求め、上記パーティション毎の評価値を加算し、1マクロブロック当りの評価値とする(E_C=E_C1+E_C2+E_C3+E_C4+補正値c)。
〈実施形態の作用効果〉
本実施形態による動画像符号化装置では、予測画像生成部108が予測画像フレームを生成するために用いる動きベクトルが、動きベクトル計算部110によって求められる。動きベクトル計算部110では、以下に示す内部機能部の作用により動きベクトルが算出される。
まず、フル画素動き探索部200が、フル画素の動き補償精度で各パーティションモードにおける前方向予測及び後方向予測の最適動きベクトルを算出する。
続いて、各パーティションモード評価値演算部が、フル画素動き探索部200から渡された当該パーティションモードにおける前方向予測及び後方向予測の最適動きベクトル、及び復号画像記憶部109に記憶される参照フレームを用い、各パーティションモードでの1マクロブロック当りの符号化に必要な評価値を算出する。
そして、各パーティションモード評価値演算部により求められた評価値に基づいて、パーティションモード選択部204が最適なパーティションモードを選択する。
以降、選択されたパーティションモードにおいて、1/2画素の動き補償精度、1/4画素の動き補償精度というふうに、それぞれの画素精度での前方向予測及び後方向予測それぞれについての最適動きベクトルが求められる。このとき、1/2画素動き探索部205、1/4画素動き探索部206では、画素精度毎の最適動きベクトルのうちより最適な動きベクトルが、前方向予測及び後方向予測それぞれについて選択される。
動き予測モード演算部では、選択されたパーティションモードにおいて、それまでに求められた前方向予測、後方向予測の最適動きベクトルが用いられ、前方向予測モード、後方向予測モード、及び両方向予測モードにおける1パーティション当りのSAD値が求められる。最終的に、動き予測モード選択部210が、全ての動き予測モードの中で、そのSAD値が最小となる動き予測モードを選択する。
このように、本実施形態では、フル画素の動き補償精度によって、全てのパーティションモードについて、前方向予測モード及び後方向予測モードそれぞれについての最適動きベクトルを求め、さらに、そこで求められた最適動きベクトルを使って算出された評価値を利用することにより、最適なパーティションモードを決定する。以降、選択されたパーティションモードについて、それ以外の画素の動き補償精度での各動き予測モードにおける最適動きベクトルが算出され、最適となる動き予測モードが決定される。最終的には、最適なパーティションモード、動き予測モードが決定され、それらとともに各画素における動き補償精度が考慮された、最適動きベクトルが算出される。
これにより、フル画素の動き補償精度での動きベクトル探索過程で、パーティションモードを絞り込むことができ、それ以降の画素精度での動きベクトル探索を絞り込まれたパーティションモードでのみ行えばよく、動きベクトル算出処理に関する負担を大幅に軽減
することができる。
また、本実施形態では、パーティションモードを選択するために算出される評価値として、まず、各パーティションの最適動きベクトルにおける前方向予測モード、後方向予測モードの予測画像と符号化対象画像との画素差分が計算され、差分絶対値和SADが求められる。そして、前方向予測モードのSAD値、後方向予測モードのSAD値のうち小さいほうのSAD値が、1パーティション当りの評価値とされ、これらの評価値の1マクロブロック分の和に補正値が加えられたものを1マクロブロック当りの評価値とされる。
これにより、パーティションモードを選択するのに、動き予測モードを考慮した最適化された評価値が用いられるため、処理負担を軽減したことによる符号化効率の悪化を防ぐことができる。
また、本実施形態では、上記評価値を求めるのに利用される補正値が、動きベクトルの符号化に必要なコストやパーティションモード自体の符号化に必要なコスト等からなる。全てのパーティションモードの中で、この1マクロブロック当りの評価値が最小となるパーティションモードを選択する。
[その他]
本実施形態は次の発明を開示する。各項に開示される発明は、必要に応じて可能な限り組み合わせることができる。
(付記1)
動画像データのフレームを複数のブロックに分割し、当該ブロック単位で、符号化済み参照フレームからの予測フレームと、符号化対象となる現フレームとの予測誤差信号及び動きベクトルを符号化する動画像符号化装置において、
前記ブロックを更にパーティション単位に分割するための分割形状を決定する複数のパーティションモードと、前記参照フレームを用いた動きベクトル予測方法を決定する複数の動き予測モードとの組合せを選択する選択部と、
前記選択部により選択されたパーティションモードと動き予測モードに基づいて、動きベクトルを算出する算出部とを備え、
前記選択部は、
フル画素以上の動き補償精度において、前記各パーティションモードのそれぞれについての評価値を求める評価部と、
前記評価値に基づいて、選択されるべきパーティションモードとして、前記複数のパーティションモードのうちのいずれかを決定する決定部と、
を更に備える動画像符号化装置。
(付記2)
前記評価部は、前記パーティション単位での、動きベクトルにおける、各動き予測モードの予測フレームと前記現フレームとの画素差分情報を、各動き予測モードそれぞれについて求め、求められた各動き予測モードの画素差分情報のうち、所定の条件を満たす画素差分情報を評価要素として、前記各パーティションモードのそれぞれについての評価値を求める付記1記載の動画像符号化装置。
(付記3)
前記評価部は、パーティション単位で求められた前記評価要素を前記パーティションモード単位に正規化し、その正規化された評価要素に基づいて、前記各パーティションモードのそれぞれについての評価値を求める付記2記載の動画像符号化装置。
(付記4)
前記評価部は、前記動きベクトルに関する付随情報を示す値、又は、前記パーティションモードに関する付随情報を示す値を評価要素とし、前記各パーティションモードのそれぞれについての評価値を求める付記3記載の動画像符号化装置。
(付記5)
前記選択部は、前記決定部において決定されたパーティションモードで、フル画素未満の動き補償精度における各動き予測モードの画素差分情報を求め、当該画素差分情報が所定の条件を満たす動き予測モードを選択する、
付記2乃至4のいずれかに記載の動画像符号化装置。
(付記6)
前記画素差分情報は、前記パーティション単位での画素差分絶対値の和である、
付記5記載の動画像符号化装置。
(付記7)
動画像データのフレームを複数のブロックに分割し、当該ブロック単位で、符号化済み参照フレームからの予測フレームと、符号化対象となる現フレームとの予測誤差信号及び動きベクトルを符号化する動画像符号化方法において、
前記ブロックを更にパーティション単位に分割するための分割形状を決定する複数のパーティションモードと、前記参照フレームを用いた動きベクトル予測方法を決定する複数の動き予測モードとから、フル画素以上の動き補償精度において、当該パーティション単位での、動きベクトルにおける、各動き予測モードの予測フレームと前記現フレームとの画素差分情報に基づいて、当該複数のパーティションモードのうちのいずれかを選択するパーティションモード選択ステップと、
フル画素未満の動き補償精度において、前記選択されたパーティションモードにおける各動き予測モードの動きベクトルをそれぞれ求めるステップと、
前記求められたそれぞれの動きベクトルに基づく各動き予測モードの画素差分情報が、所定の条件を満たす動き予測モードを選択するステップと、
を有する動画像符号化方法。
(付記8)
前記パーティションモード選択ステップは、
前記パーティション単位での、動きベクトルにおける各動き予測モードの予測フレームと前記現フレームとの画素差分情報を、各動き予測モードそれぞれについて求めるステップと、
求められた各動き予測モードの画素差分情報のうち所定の条件を満たす画素差分情報を、前記パーティションモード単位に正規化し、各パーティションモードのそれぞれについての評価値とするステップと、
前記評価値に基づいて、選択されるべきパーティションモードとして、前記複数のパーティションモードのうちのいずれかを決定するステップと、
を更に有する付記7記載の動画像符号化方法。
本実施形態による動画像符号化装置の構成を示す図である。 動きベクトル計算部の詳細構成例を示す図である。 本実施形態におけるパーティションモード例を示す図である。 動画像符号化方式を示す図である。 動画像符号化方式におけるパーティションモードを示す図である。 動画像符号化方式におけるパーティション選択例を示す図である。
符号の説明
100 動画像符号化装置
101 予測誤差信号生成部
102 直交変換部
103 量子化部
104 エントロピー符号化部
105 逆量子化部
106 逆直交変換部
107 復号画像生成部
108 予測画像生成部
109 復号画像記憶部
110 動きベクトル計算部
200 フル画素動き探索部
201 パーティションモードA評価値演算部
202 パーティションモードB評価値演算部
203 パーティションモードC評価値演算部
204 パーティションモード選択部
205 1/2画素動き探索部
206 1/4画素動き探索部
207 動き予測モードA演算部
208 動き予測モードB演算部
209 動き予測モードC演算部
210 動き予測モード選択部

Claims (5)

  1. 動画像データのフレームを複数のブロックに分割し、当該ブロック単位で、符号化済み参照フレームからの予測フレームと、符号化対象となる現フレームとの予測誤差信号及び動きベクトルを符号化する動画像符号化装置において、
    前記ブロックを更にパーティション単位に分割するための分割形状を決定する複数のパーティションモードと、前記参照フレームを用いた動きベクトル予測方法を決定する複数の動き予測モードとの組合せを選択する選択部と、
    前記選択部により選択されたパーティションモードと動き予測モードに基づいて、動きベクトルを算出する算出部とを備え、
    前記選択部は、
    フル画素以上の動き補償精度において、前記各パーティションモードのそれぞれについての評価値を求める評価部と、
    前記評価値に基づいて、選択されるべきパーティションモードとして、前記複数のパーティションモードのうちのいずれかを決定する決定部と、
    を更に備える動画像符号化装置。
  2. 前記評価部は、前記パーティション単位での、動きベクトルにおける、各動き予測モードの予測フレームと前記現フレームとの画素差分情報を、各動き予測モードそれぞれについて求め、求められた各動き予測モードの画素差分情報のうち、所定の条件を満たす画素差分情報を評価要素として、前記各パーティションモードのそれぞれについての評価値を求める請求項1記載の動画像符号化装置。
  3. 前記評価部は、パーティション単位で求められた前記評価要素を更に前記パーティションモード単位に正規化し、その正規化された評価要素に基づいて、前記各パーティションモードのそれぞれについての評価値を求める請求項2記載の動画像符号化装置。
  4. 前記選択部は、前記決定部において決定されたパーティションモードで、フル画素未満の動き補償精度における各動き予測モードの画素差分情報を求め、当該画素差分情報が所定の条件を満たす動き予測モードを選択する、
    請求項2又は3記載の動画像符号化装置。
  5. 動画像データのフレームを複数のブロックに分割し、当該ブロック単位で、符号化済み参照フレームからの予測フレームと、符号化対象となる現フレームとの予測誤差信号及び動きベクトルを符号化する動画像符号化方法において、
    前記ブロックを更にパーティション単位に分割するための分割形状を決定する複数のパーティションモードと、前記参照フレームを用いた動きベクトル予測方法を決定する複数の動き予測モードとから、フル画素以上の動き補償精度において、当該パーティション単位での、動きベクトルにおける、各動き予測モードの予測フレームと前記現フレームとの画素差分情報に基づいて、当該複数のパーティションモードのうちのいずれかを選択するパーティションモード選択ステップと、
    フル画素未満の動き補償精度において、前記選択されたパーティションモードにおける各動き予測モードの動きベクトルをそれぞれ求めるステップと、
    前記求められたそれぞれの動きベクトルに基づく各動き予測モードの画素差分情報が、所定の条件を満たす動き予測モードを選択するステップと、
    を有する動画像符号化方法。
JP2005145596A 2005-05-18 2005-05-18 動画像符号化装置 Pending JP2006324888A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005145596A JP2006324888A (ja) 2005-05-18 2005-05-18 動画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005145596A JP2006324888A (ja) 2005-05-18 2005-05-18 動画像符号化装置

Publications (1)

Publication Number Publication Date
JP2006324888A true JP2006324888A (ja) 2006-11-30

Family

ID=37544242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005145596A Pending JP2006324888A (ja) 2005-05-18 2005-05-18 動画像符号化装置

Country Status (1)

Country Link
JP (1) JP2006324888A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010067668A1 (ja) * 2008-12-08 2010-06-17 シャープ株式会社 画像符号化装置及び画像復号装置
WO2012000191A1 (en) * 2010-06-30 2012-01-05 France Telecom Research & Development Beijing Company Limited Pixel interpolation method and system
CN102857748A (zh) * 2011-06-30 2013-01-02 华为技术有限公司 变换系数扫描方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002315004A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 画像符号化方法及び装置、画像復号方法及び装置、並びに画像処理システム
US20050013366A1 (en) * 2003-07-15 2005-01-20 Lsi Logic Corporation Multi-standard variable block size motion estimation processor
JP2005057750A (ja) * 2003-07-24 2005-03-03 Matsushita Electric Ind Co Ltd 符号化モード決定装置、画像符号化装置、符号化モード決定方法、および符号化モード決定プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002315004A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 画像符号化方法及び装置、画像復号方法及び装置、並びに画像処理システム
US20050013366A1 (en) * 2003-07-15 2005-01-20 Lsi Logic Corporation Multi-standard variable block size motion estimation processor
JP2005057750A (ja) * 2003-07-24 2005-03-03 Matsushita Electric Ind Co Ltd 符号化モード決定装置、画像符号化装置、符号化モード決定方法、および符号化モード決定プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010067668A1 (ja) * 2008-12-08 2010-06-17 シャープ株式会社 画像符号化装置及び画像復号装置
WO2012000191A1 (en) * 2010-06-30 2012-01-05 France Telecom Research & Development Beijing Company Limited Pixel interpolation method and system
CN102857748A (zh) * 2011-06-30 2013-01-02 华为技术有限公司 变换系数扫描方法及装置

Similar Documents

Publication Publication Date Title
US8054882B2 (en) Method and system for providing bi-directionally predicted video coding
US8315310B2 (en) Method and device for motion vector prediction in video transcoding using full resolution residuals
CN102835111B (zh) 使用先前块的运动矢量作为当前块的运动矢量来对图像进行编码/解码的方法和设备
KR101239567B1 (ko) 움직임 추정에 대한 검색 범위 선택 방법과 그의 시스템 및 컴퓨터 판독가능 저장 매체
US8358698B2 (en) Method and device for motion vector estimation in video transcoding using full-resolution residuals
KR100955396B1 (ko) 양-예측 부호화 방법 및 장치, 양-예측 복호화 방법 및장치 및 기록매체
JP2019115061A (ja) 符号化装置、符号化方法、復号装置、復号方法、及びプログラム
KR102038243B1 (ko) 인코딩 방법 및 장치, 디코딩 방법 및 장치, 및 컴퓨터 판독가능 저장 매체
US20110170608A1 (en) Method and device for video transcoding using quad-tree based mode selection
US20110002390A1 (en) Methods and systems for motion vector derivation at a video decoder
US8340188B2 (en) Method and device for motion vector estimation in video transcoding using union of search areas
JP2007116351A (ja) 画像予測符号化装置、画像予測復号装置、画像予測符号化方法、画像予測復号方法、画像予測符号化プログラム、及び画像予測復号プログラム
WO2011099428A1 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
WO2011099440A1 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
CA2726974C (en) Method and device for motion vector estimation in video transcoding using full-resolution residuals
JP2006324888A (ja) 動画像符号化装置
CN1848960B (zh) 使用非标准化矢量量化编码器的符合视频标准的残差编码
JP2007096479A (ja) 階層間予測符号化方法および装置,階層間予測復号方法および装置,並びにそれらのプログラムおよび記録媒体
CA2726973C (en) Method and device for motion vector estimation in video transcoding using union of search areas
US11197011B2 (en) Decoding method
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
KR100978465B1 (ko) 양-예측 부호화 방법 및 장치, 양-예측 복호화 방법 및 장치 및 기록매체
JP4184389B2 (ja) 動きベクトル復号装置および復号方法
JP2012120108A (ja) 補間画像生成装置及びプログラム、並びに、動画像復号装置及びプログラム
JP2008017304A (ja) 画像符号化装置、画像復号装置、画像符号化方法、及び画像符号化するプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100826

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20100924