JP2007251497A - 動画像符号化方法、動画像符号化装置、動画像符号化プログラム - Google Patents

動画像符号化方法、動画像符号化装置、動画像符号化プログラム Download PDF

Info

Publication number
JP2007251497A
JP2007251497A JP2006070813A JP2006070813A JP2007251497A JP 2007251497 A JP2007251497 A JP 2007251497A JP 2006070813 A JP2006070813 A JP 2006070813A JP 2006070813 A JP2006070813 A JP 2006070813A JP 2007251497 A JP2007251497 A JP 2007251497A
Authority
JP
Japan
Prior art keywords
picture
macroblock
direct mode
direct
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006070813A
Other languages
English (en)
Other versions
JP4527677B2 (ja
Inventor
Akihiro Yamori
章弘 屋森
Akira Nakagawa
章 中川
Kiyoshi Sakai
潔 酒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006070813A priority Critical patent/JP4527677B2/ja
Priority to US11/460,260 priority patent/US8144776B2/en
Priority to EP20060254015 priority patent/EP1835748B1/en
Priority to CN2011101872013A priority patent/CN102202221B/zh
Priority to CN200610115967XA priority patent/CN101039433B/zh
Priority to KR20060081222A priority patent/KR100952802B1/ko
Publication of JP2007251497A publication Critical patent/JP2007251497A/ja
Application granted granted Critical
Publication of JP4527677B2 publication Critical patent/JP4527677B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】動画像符号化において、画質の劣化を生じることなく、ダイレクトモードによる圧縮効率の向上を実現する。
【解決手段】ピクチャ11aが、トップフィールド11b、ボドムフィールド11cからなるフィールド構造を有する動画像の符号化において、現ピクチャ(トップフィールド11b)をダイレクトモードで符号化する際に、参照先のList1の二つのピクチャ(トップフィールド11b、ボドムフィールド11c)が時間軸方向に偏って存在する場合に、二つの参照先ピクチャのList1のRef_idxを入れ換えることで、基準ベクトルMVが現ピクチャ(トップフィールド11b)を跨ぐように形成されるようにして、基準ベクトルMVから内分で生成されるダイレクトベクトル0,1に基づく動きベクトルの予測精度を向上させる。
【選択図】図4

Description

本発明は、動画像符号化方法、動画像符号化装置、動画像符号化プログラムに関し、たとえば、複数のピクチャの参照による動画像符号化に適用して有効な技術に関する。
映像情報のデジタル化の広範な進展に伴い、映像情報の伝送や蓄積におけるデータ量の削減および画質の向上への要求がますます増大している。
このような要求に呼応して、いわゆる次世代の動画像符号化技術として、たとえば、H.264/AVC(Advanced Video Coding)が注目されている。
この次世代の動画像符号化において、Bピクチャ(Bi−predictive Picture:双予測ピクチャ)の各マクロブロック(MB:Macro Block)の予測方法としては、イントラ(画面内)予測、前方向予測、後方向予測、両方向(双)予測、ダイレクトモードの大きく5つの方法を持っている。
中でも、ダイレクトモードは、動画像の一連性という点に着目し、時間的、空間的に隣接したマクロブロックの動きベクトルから現マクロブロックの動きベクトルを決定する方法である。
このダイレクトモードは、動きベクトルの時空間相関性を高めると共に、現マクロブロックの動きベクトル情報を伝送しなくて済むため、動き予測や情報量圧縮率の向上に貢献している。
また、従来のMPEG2等の動画像符号化においては、Bピクチャ(Bi−Directional prediction)の符号化は、参照ピクチャとして、基本的に前方向から1枚、後方向から1枚のピクチャを採用していた。
これに対して、H.264/AVCにおいては、3枚以上の参照ピクチャを用いる事も可能であるし、参照ピクチャが2枚のみの場合でも、前方向から2枚とか、後方向から2枚を選択する事も可能となった。また、従来は他のピクチャから参照する事が不可能だったBピクチャ自体が、参照ピクチャとなり得る様になった。
ここで、ダイレクトモードのうち特に時間方向ダイレクトモードについて説明する。ダイレクトモードとは既に述べた通り、現マクロブロックの動きベクトル情報を伝送しなくて済むモードであるが、この時時間ダイレクトモードの動きベクトルとしては、直前の処理ピクチャの同位置マクロブロックの動きベクトルを基準ベクトルとして選択し、そのベクトルから時間的な距離比率によりベクトルを決定する。つまり、通常の動画像符号化の順番では、ある特定の場所のBピクチャを基準に考えると、前方向(時間的に過去方向)参照画、後方向(時間的に未来)参照画、の後にBピクチャを処理するので、直前の処理ピクチャは時間的に未来のピクチャとなる。
図8に、時間ダイレクトモードの動きベクトル例を示す。この図8のように、基準ベクトルが2つのピクチャ(Pic)間で(−5,−10)の場合、左側に図示したB−Picのダイレクトモードベクトルは、前後共、基準ベクトルの半分の大きさで、前方向は同じ向きの(−2.5,−5),後方向は逆向きの(2.5,5)が時間ダイレクトモードの動きベクトルとなる。
ただし、B−Picが2枚だったり、飛び越し走査に対応した複数のフィールドからなるField構造を持つ場合は、その時間配分により重み付けが変わる。
一般的に、過去方向の参照画はList0、未来方向の参照画はList1と呼ばれる。
ダイレクトベクトルは、List1のReference_Index=0のピクチャ(Col−Pic:Co−located pictureと呼ばれる)の同位置マクロブロックの動きベクトルを基準ベクトルとして、時間的距離に応じたスケーリングにより生成される。
図9に、順次走査に対応したFrame構造時におけるダイレクトベクトルの例を示し、図10に、飛び越し走査に対応したField構造時におけるダイレクトベクトルの例を示す。
リファレンスピクチャList0とList1、つまり現フレームから見て、時間的に前後に分かれている場合、List1の各マクロブロックの動きベクトルがLsit0を参照ピクチャとして指していれば、ダイレクトモードの動きベクトルは、List1の同位置マクロブロックの動きベクトルを基準ベクトルとして、時間方向の距離のスケーリング、つまり、基準ベクトルの内分で生成される事になる。
しかし、List0,List1が共に、現ピクチャから見て片方向にあったり、フィールド構造符号化で動きベクトルが同一フレーム内の異パリティ(異なるフィールド)を指していたり、Bピクチャが参照フレームとなったりした場合に、基準ベクトルが、現フレームを跨がない動きベクトルとなり得る。この場合は、ダイレクトモードの動きベクトルは、基準ベクトルの外分で求めることになる。
具体例として、図11に基準ベクトルの外分でダイレクトベクトルが求められる場合の例を挙げる。
この図11の例はField構造時のものであるが、Frame構造時においてもBピクチャが参照ピクチャになった場合などは、当該図11のようになり得る。この場合、ダイレクトベクトル0(L0MV)、ダイレクトベクトル1(L1MV)は基準ベクトルMVの外分となる為、ベクトル精度の観点から悪くなる。図11の例では、L1MVはMVの4倍粗い精度しか表せない事になる。
ここで、ダイレクトモードの動きベクトルを外分で求め、場合によっては基準ベクトルより大きな成分の動きベクトルを発生させるという操作は、例えば基準ベクトルがquarterpel(=1/4画素)精度の動きベクトルだったとしても、ベクトルが2倍になるとハーフペル(=1/2画素)精度、4倍になると整数(単位画素)精度の動きベクトルしか生成できなくなり、最悪の場合、この動きベクトルの精度劣化が予測効率の劣化に繋がる恐れもある。
また、入力映像のフィールドを単位として符号化を行うField構造の場合には、通常の前後2fieldずつの参照枚数の取り方では、ref_idxの枚数が不足する事により、時間ダイレクトモードの動きベクトルを発生できない場合もある。
特許文献1には、動画像符号化の時間ダイレクトモードの場合において、動きベクトルを求めるためのスケーリング処理が可能か否かを判別する判定手段を備え、スケーリング処理ができないと判定された場合には、別の符号化モードを用いるか、もしくはスケーリング処理を行わずに動き補償を行う技術が開示されている。
しかし、この特許文献1の場合には、スケーリング処理ができない場合には、時間ダイレクトモードを放棄するため、時間ダイレクトモードの採用による圧縮効率の向上を効果的に利用できない懸念がある。
特開2004−215229号公報
本発明の目的は、動画像符号化において、画質の劣化を生じることなく、ダイレクトモードによる圧縮効率の向上を実現することにある。
本発明の他の目的は、動画像符号化において、動画像の走査方式に影響されることなく、ダイレクトモードの採用による予測効率、符号化効率、ひいては圧縮効率の向上を実現することにある。
本発明の他の目的は、動画像符号化において、ダイレクトモードが選択される頻度を大きくして、ダイレクトモードの採用による予測効率、符号化効率、ひいては圧縮効率の向上を実現することにある。
本発明の第1の観点は、第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとして含む動画像符号化方法であって、
可変な選択基準を用いて、前記符号化モードとして前記ダイレクトモードを選択する第1ステップと、
選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う第2ステップと、
を含む動画像符号化方法を提供する。
本発明の第2の観点は、第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとして含む動画像符号化装置であって、
前記符号化モードとして前記ダイレクトモードを選択する場合の選択基準が可変なモード選択手段と、
選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う符号化手段と、
を含む動画像符号化装置を提供する。
本発明の第3の観点は、第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとしてコンピュータに実行させる動画像符号化プログラムであって、
可変な選択基準を用いて、前記符号化モードとして前記ダイレクトモードを選択する第1ステップと、
選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う第2ステップと、
を前記コンピュータに実行ささせる動画像符号化プログラムを提供する。
上記した本発明によれば、本来予測効率・符号化効率を高める筈であるダイレクトモードにおいて、精度の悪くなる基準ベクトルが選択されることを回避し、動画像画面がField構造の場合において時間ダイレクトモードを選択できなくなることを防止できる。
すなわち、本発明では、Bピクチャのダイレクトモードの選択に関し、まず、第1に時間ダイレクトモードを選択出来ないと符号化効率が低くなるので、参照先のピクチャを変更することで基準ベクトルを変更し、可能な限り時間ダイレクトモードを選択可能にして、予測効率の向上を行う。
次に、リファレンスピクチャであるList0、List1が現ピクチャから見て、共に前方向もしくは後方向に偏って存在するか否かの判定手段を持ち、共に現ピクチャからみて片方向に存在する場合には、ダイレクトモードのうち時間ダイレクトモードの選択を抑制する。
この時間ダイレクトモードの抑制方法としては、全く選択しない方法、あるいは、基準ベクトルが0ベクトル近辺の成分の細かい動きの場合のみ、ダイレクトモードを採用可能とするなどの方法を取り得る。
本発明によれば、動画像符号化において、画質の劣化を生じることなく、ダイレクトモードによる圧縮効率の向上を実現することができる。
また、動画像符号化において、動画像の走査方式に影響されることなく、ダイレクトモードの採用による予測効率、符号化効率、ひいては圧縮効率の向上を実現することができる。
また、動画像符号化において、ダイレクトモードが選択される頻度を大きくして、ダイレクトモードの採用による予測効率、符号化効率、ひいては圧縮効率の向上を実現することができる。
以下、図面を参照しながら、本発明の実施の形態について詳細に説明する。
図1は、本発明の一実施の形態である動画像符号化方法を実施する動画像符号化プログラムの機能構成の一例を示す概念図である。
図2は、本発明の一実施の形態である動画像符号化装置を含む動画像符号化システムの構成の一例を示す概念図である。
図2に例示されるように、本実施の形態の動画像符号化システムは、動画像供給源10、動画像符号化装置20、動画像媒体30を含んでいる。
動画像供給源10は、たとえば動画像を撮影するカメラ、あるいは、動画像の放送を受信する放送受信器(チューナ)である。この動画像供給源10は、動画像データ11を動画像符号化装置20に出力する。
動画像符号化装置20は、符号化論理21を備えており、この符号化論理21により、後述のような動画像符号化によって動画像データ11を符号化し、符号化データ12として出力する。
符号化論理21は、専用のハードウェア回路で実現してもよいし、後述の動画像符号化プログラム100を、動画像符号化装置20に内蔵した図示しないコンピュータで実行することで実現してもよい。
動画像符号化装置20には、走査方法指定部22から走査方法通知信号23が入力される。この走査方法通知信号23は、動画像データ11が、1フィールドで1画面を構成する順次走査の動画像か、あるいは、2フィールドで1画面を構成する飛び越し走査の動画像か、を指定する信号である。
なお、この走査方法通知信号23は、動画像供給源10の側から入力するようにしてもよい。
動画像媒体30は、たとえば、蓄積媒体31、あるいは通信媒体32からなる。蓄積媒体31の場合には、動画像符号化装置20から受信した符号化データ12を蓄積して保持する。通信媒体32の場合には、動画像符号化装置20から受信した符号化データ12を他の場所や装置へ転送する。
図1に例示されるように、本実施の形態の動画像符号化プログラム100は、機能ブロックとして、差分演算部101、直交変換・量子化部102、可変長符号化部103、逆直交変換・逆量子化部104、加算演算部105、動き補償部106、フレームメモリ107、動きベクトル検出部108を含んでいる。
さらに、第1ダイレクトベクトル判定部109、ダイレクトベクトル決定部110、第2ダイレクトベクトル判定部111を含んでいる。
本実施の形態の動画像符号化プログラム100では、動画像供給源10より入力された動画像データ11は、マクロブロック単位に処理される。イントラマクロブロック以外は差分符号化を行うので、まず決定された動きベクトルと、参照ピクチャのマクロブロック画素(原画マクロブロック位置より動きベクトル分ずれた位置の参照画マクロブロックサイズ画素)、現ピクチャマクロブロック画素より、差分演算部101において画素毎の減算を行い、マクロブロック単位の差分画像を生成する。
差分画像は、直交変換・量子化部102において以下のように処理される。
差分画像は、8×8画素や4×4画素毎にDCT(Discrete Cosine Transform)変換、および符号化モードによってはアダマール(Hadamard)変換等の直交変換を施し、さらに周波数成分信号に変換する。これは画像の空間相関性により、周波数成分に変換する事により低周波成分に信号が集まり情報量圧縮を行う事が可能である。
直交変換後の値は、量子化部により標本化が行われ、より当該値における係数が0となる成分数を増し、結果として、非0となった係数のみを、可変長符号化部103により符号化して符号化データ12として出力する。
可変長符号化部103は、たとえば、基本的には出現頻度の高い係数の組合せにはより短い符号を、出現頻度の低い係数組合せにはより長い符号を割当て、全体的に符号長を短くするエントロピ符号化を行う。H.264では、CAVLCやCABACと呼ばれる方式の可変長符号を選択できる。
直交変換・量子化部102から出力される量子化後の係数は、逆直交変換・逆量子化部104における逆量子化および逆直交変により、画素成分に変換され、マクロブロック単位の差分画像となり、フレームメモリ107に蓄えられた参照画像に加算演算部105を介して足し込まれ、符号化データ12の出力先である図示しない復号化側と同等の処理画像を生成する。
この逆直交変換・逆量子化部104、動き補償部106、加算演算部105で生成され、フレームメモリ107に保持された画像は局所復号画像と呼ばれ、動画像データ11として到来する次ピクチャ以降の差分符号化に用いられる。
動きベクトル検出部108は、参照画像としてフレームメモリ107からの参照画像と動画像データ11の現画像との間におけるブロックマッチング(両画像のマクロブロック間の各画素についての差分絶対値の累積値を得る処理)により、動き探索を行いその最小値などにより、最適な動きベクトルを探索する。
動き探索には、画素の差分絶対値和の大きさのみでなく、動きベクトルの評価値も付加する事が一般的である。動きベクトルの符号化は、成分そのものでなく周辺マクロブロックの動きベクトルとの差分ベクトルを符号化するので、差分ベクトルを求め、その成分の大きさにより、動きベクトル符号長相当の評価値を出力する。
動き探索の評価値をcost、差分絶対値をSAD_cost(Sum Absolute Difference)、動きベクトルの符号量相当の評価値をMV_cost(Motion Vector)とすると、
cost = SAD_cost + MV_cost
として、このcostを最小値にする、動きベクトル位置を探し出す。
本実施の形態における第1ダイレクトベクトル判定部109、および第2ダイレクトベクトル判定部111は、それぞれピクチャ単位のダイレクトモードの決定、およびマクロブロック単位のダイレクトモードの決定を行う。
ピクチャ単位のダイレクトモードとしては、時間ダイレクトと空間ダイレクトの2通りがある。文字通り時間方向に動きの相関が高い場合は時間ダイレクトモード、空間(ピクチャ内)方向に動きの相関が高い場合は空間ダイレクトモードを選択した方が符号化効率は良くなる。
マクロブロック単位の第2ダイレクトベクトル判定部111では、各マクロブロックで生成するダイレクトベクトルを用いた予測画像が、フレーム間差分的に適切な動きベクトルとなっているかどうかを評価する。
まず、ダイレクトベクトル決定部110で該当マクロブロックのダイレクトベクトルを計算する。これは、時間ダイレクトモードの場合は、Col−Picの同位置マクロブロックの動きベクトルを基準ベクトルとして、時間的距離に応じたスケーリング(按分)により生成される。空間ダイレクトモードの場合は、同一ピクチャ内の処理済の周辺マクロブロックの動きベクトルの中間値により生成される。
第2ダイレクトベクトル判定部111では、決定したダイレクトベクトルによる動き探索の評価値(cost)を求めたり、後述の本実施の形態におけるダイレクトモードの選択/非選択の決定や、重み付け処理を行う事により、個々のマクロブロック毎に、ダイレクトモードの選択され易さ(選択される確率)を制御する。
図3のフローチャートを参照して、本実施の形態の動画像符号化プログラム100の全体の動作を説明する。
まず、走査方法通知信号23によって、1ピクチャが複数のフレームからなるフレーム構造を持つか否か(飛び越し走査画像か否か)を判別する(ステップ201)。そして、動画像データ11から1画面(1ピクチャ)を読み込む(ステップ202)。
次に、第1ダイレクトベクトル判定部109において、ピクチャレベルの符号化モードの選択を行う(ステップ203)。
さらに、第2ダイレクトベクトル判定部111にてマクロブロックレベルで、ピクチャレベルで選択された符号化モードを実施するか否かを決定し、最終的に選択された符号化モードを用いてマクロブロックの符号化を行う(ステップ204)。
このステップ204〜ステップ205の処理を当該ピクチャ内の全マクロブロックについて反復し(ステップ205)、さらに、動画像データ11の全ピクチャについて、ステップ202〜ステップ205を反復する(ステップ206)。
[符号化制御例1]
まず、上述のステップ203における第1ダイレクトベクトル判定部109の動作例についてさらに詳細に説明する。
第1ダイレクトベクトル判定部109では、予測効率を上げる為にピクチャ単位で、後述のように、ダイレクトモードの動きベクトルの基準ベクトルを変更することで、フィールド構造(飛び越し走査画像)時において、精度劣化や時間ダイレクトモードが選択できなくなる等の問題を回避する。
以下の操作は、フィールド構造時の場合、I,PピクチャのBottomフィールドだけで行えば良い。
図11は、動画像データ11の各ピクチャ11aが、トップフィールド11b(奇数番目の走査線を含むフィールド)、ボドムフィールド11c(偶数番目の走査線を含むフィールド)からなるフィールド構造を持つ場合において、時間ダイレクトモードを適用する場合を示している。
図11の上部には、個々のフィールドの符号化順序、ピクチャタイプ(PType:I(Intra Picture),P(Predictive Picture),B(Bi−predictive Picture))、List0およびList1の参照番号(REf_idx)が記され、その下に、対応する個々のピクチャが縦線で、左から右に表示(撮影)時間順に表示されている。
符号対象のボドムフィールド11c(Current)の時間ダイレクトモードによる符号化に際しては、それ以前に符号化が完了し、かつ、表示順では未来方向で直近のボドムフィールド11c(Col−Pic:符号化順=3)を基準とし、当該Col−Picの参照先であるトップフィールド11b(符号化順=2)との間に基準ベクトルMVが設定される。
そして、ボドムフィールド11c(Current)を起点として、前記ボドムフィールド11cおよびトップフィールド11bに対して、動き情報としてのダイレクトベクトル1およびダイレクトベクトル0が設定される。
すなわち、図11の例では、時間ダイレクトモードにおける参照先のボドムフィールド11cおよびトップフィールド11bが、符号対象のボドムフィールド11c(Current)からみて未来方向に偏って存在するため、基準ベクトルMVが、ダイレクトベクトル0およびダイレクトベクトル1よりもはるかに小さくなっている。
このように、フィールド構造で、同位置マクロブロックのダイレクトベクトル0,1(動きベクトル)が、同一フレーム(ピクチャ11a)内の異パリティ(トップフィールド11bおよびボドムフィールド11c)を指した場合、ダイレクトベクトル1は基準ベクトルMVの3倍、ダイレクトベクトルは基準ベクトルMVの4倍相当になり、それだけ動きベクトルの生成精度も粗くなる。
この図11の様な場合に、第1ダイレクトベクトル判定部109は、ダイレクトベクトル0,1を基準ベクトルMVの内分で生成可能な様に、List0のRef_idxの割り当てを入れ替え(図4参照)、時間ダイレクトモード選択の為の基準ベクトルを変更(操作)する。
これにより、図4に例示されるように、入れ換え後のトップフィールド11b(Col−Pic:符号化順序=2)の参照先は、Currentを介して反対側に位置するボドムフィールド11c(符号化順序=1)となるため、両者を起点および終点とする基準ベクトルMVは、現ピクチャ(Current)を跨ぐベクトルとなり、ダイレクトベクトル0,1の精度劣化の悪影響を取り回避する事が出来る。
図5に、第1ダイレクトベクトル判定部109における上述の入れ換え処理のフローチャートを示す。この図5のフローチャートは、上述の図3において、第1ダイレクトベクトル判定部109が実行するステップ203における詳細な処理例を示している。
すなわち、まず、当該ピクチャがフィールド構造を持つか否かを、走査方法通知信号23等の情報に基づいて判別する(ステップ211)。
そして、フィールド構造の場合には、さらに基準ベクトルMVの起点となる参照ピクチャ(Col_Pic)がボドムフィールド11cかを判別し、ボドムフィールド11cの場合に、List1のRef_idxを入れ換える(ステップ213)。
上述のステップ211でフィールド構造でない場合、および上述のステップ212で参照ピクチャがボドムフィールド11cでない場合には、上述の図11のような問題は発生しないので、参照先のピクチャの入れ換えは行われない。
このように、符号化制御例1の場合には、符号化対象の現ピクチャ(Current)に対して、ダイレクトモードにおける参照ピクチャが、過去または未来方向に偏って存在するために、基準ベクトルMVに対してダイレクトベクトル0,1が相対的に大きくなり、動きベクトルの精度が劣化することが懸念される場合、参照先のピクチャ(フィールド)のList1のRef_idxを入れ換えることで、ダイレクトベクトル0、ダイレクトベクトル1から得られる動きベクトルの精度劣化を回避する。
すなわち、画質の劣化を生じることなく、ダイレクトモードの採用による高圧縮率を達成することが可能となる。
また、符号化対象の現ピクチャ(Current)と参照先のピクチャ(フィールド)との位置関係から、ダイレクトモードを実現できなくなる、という問題も、参照先のピクチャ(フィールド)のList1のRef_idxを入れ換えることで解決できる。
[符号化制御例2]
この符号化制御例2では、ダイレクトモードを発生させない対策について説明する。この符号化制御例2の場合も、図11の様にダイレクトベクトル0,1が、基準ベクトルMVの外分で生成される場合の対策である。
図11では、Col_Picの同位置マクロブロックの基準ベクトルMVは、同フレーム内の異パリティ(トップフィールド11b)を指しているが、実際には、本マクロブロックは、List0のRef_idx=0のフィールド(符号化順序=1)の同位置マクロブロックを参照して動きベクトルを発生する事も可能である。この様な場合には、計算されるダイレクトベクトル0,1自体は基準ベクトルMVの内分で生成され、ベクトル精度の観点からは問題とならない。
従って、図11の様に、Currentを基準として未来または過去の時間方向に偏って基準ベクトルMVが存在する場合のみダイレクトモードを発生させない、という対策をとる。
すなわ、マクロブロック単位の切り替え処理となるので、図1に例示した第2ダイレクトベクトル判定部111で判定を行う。
図6に本操作のフローチャートを示す。この図6は、上述の図3におけるステップ204を、さらに詳細に例示したものである。
すなわち、当該マクロブロックが属する現ピクチャ(Current)がフィールド構造を有し(ステップ221)、かつ、参照先のList1のRef_idx=0のピクチャがボドムフィールド11cの場合に(ステップ222)、ダイレクトモードの基準ベクトルMVが、時間軸方向に現ピクチャを跨ぐか否かを判別する(ステップ223)。
そして、基準ベクトルMVが時間軸方向に現ピクチャを跨ぐと判定されない場合(図11の状態)には、現マクロブロックについては、ダイレクトモードを選択せず(ステップ224)、それ以外の符号モードを選択して(ステップ225)、当該マクロブロックの符号化を行う(ステップ226)。
この符号化制御例2の場合には、ダイレクトモードにおいて、基準ベクトルMVから生成されるダイレクトベクトル0、ダイレクトベクトル1に基づく動きベクトルの精度劣化による画質低下が予想される場合に、ダイレクトモードの採用を回避することで、予測画像の画質低下を確実に防止できる。
[符号化制御例3]
符号化制御例3としては、ダイレクトモードおよびその他の予測符号化モードでいずれの予測符号化モードを選択するかの判定において、図11のような精度劣化が予想される場合に、ダイレクトモードが選択され難くする。
すなわち、上述の符号化制御例2の場合には、図11に例示されるような精度劣化が懸念される状況に該当する場合に、完全にダイレクトモードを選択しない様に制御した。
これにたいして、本符号化制御例3では、図11に例示されるような精度劣化が懸念される状況に該当する場合に、より詳細に状況を定量的に分析し、ダイレクトモードの選択条件に重み付けして、選択されにくくするものである。
実際のマクロブロックの予測モードとしては、上述のように、イントラ予測、前方向予測、後方向予測、両方向予測、ダイレクトモード(ダイレクトモードについては、時間ダイレクトモードと空間ダイレクトモードがある)と、様々なマクロブロックレベルでの予測方法があるので、これらの予測方法の各々の予測評価値(予測誤差の大きさ)を比較してどのモードが最適かを選択する際にダイレクトモードを選択されにくくする。
一例として、予測評価値の算出方法を式で表すと以下の様になる。
ダイレクトモードのコスト(cost_direct)は、式(1)で得られる。
前方向予測のコスト(cost_forward)は、式(2)得られる。
後方向予測のコスト(cost_backward)は、式(3)得られる。
両方向予測のコスト(cost_bidirection)は、式(4)で得られる。
イントラ予測のコスト(cost_intra)は、式(5)で得られる。
ただし、式(1)〜式(5)において*orgは原画マクロブロックの情報、*refは、参照画マクロブロックの情報を示している。また、*mv,*prevmvは、原画マクロブロックおよび参照画マクロブロックの各々の動きベクトルを示している。
式(4)中の関数SAD()は、マクロブロック内の画素差分絶対値和を求めるもので、この場合、原画マクロブロックMBと参照画マクロブロックの16×16画素の差分絶対値和を求める関数である。一例として式(6)で表される。
実際には、マクロブロックは、1マクロブロック内に複数のサブブロックに分割可能なので、例えば8×8のサブブロック4つに分かれている場合は、8×8=64画素の差分絶対値和の4つの集まりが、SAD評価値となる。
ちなみに、サブブロックには、16×16,8×8の他にも8×16,16×8,4×8,8×4,4×4と様々な大きさが存在する。
イントラ予測の場合は、差分画像でなく原画像そのものを符号化するので、アクティビティ(式(5)のACT())という別の評価値を用いる。
イントラ予測の場合は、原画マクロブロックそのものを直交変換にかけるので、関数ACT()としては、式(7)に示されるように、マクロブロックの各画素のマクロブロック平均値(=AveMB)からの隔たり等により、求める。
式(2)〜式(4)の関数MV_COST()は、式(8)に示されるように、動きベクトルの符号量に比例した評価値を出力する。具体的に動きベクトルは、成分そのものではなくて、周辺マクロブロックとの差分ベクトルを符号化しますので、その絶対値の大きさにより評価値を決定する。重み定数λが使用され、MV_COST()の全体cost評価値に対する影響度を変更する事も一般的に行われている。
式(8)において、Table[]は、ベクトル差分の大きさを符号量相当に変換する変換テーブルである。
ここで、実際に意図的に重み付けを設定する方法は、様々な方法が考えられる。
たとえば、上述のようにして得られた、cost_directに重み定数Wのような固定値を加える方法が考えられる。
あるいは、cost_directを所定の重み係数αで定数倍する方法でもよい。
こうして得られた、各予測モードのcostを用いた実際の予測モード判定では、式(9)のような最小値判定関数min()を用いて最小の評価costをmin_costとして求め、このmin_costに該当する予測モードをマクロブロックの符号化に使用するマクロブロックタイプ(MB_Type)と決定する。
図7に上述の重み付け評価のフローチャートを示す。
この図7は、上述の図3におけるステップ204を、さらに詳細に例示したものである。
すなわち、当該マクロブロックが属する現ピクチャ(Current)がフィールド構造を有し(ステップ231)、かつ、参照先のList1のRef_idx=0のピクチャがボドムフィールド11cの場合に(ステップ232)、ダイレクトモードの基準ベクトルMVが、時間軸方向に現ピクチャを跨ぐか否かを判別する(ステップ233)。
そして、基準ベクトルMVが時間軸方向に現ピクチャを跨ぐと判定されない場合、すなわち図11の状態で、ダイレクトベクトルが基準ベクトルMVの外分で生成される場合には、現マクロブロックについて、ダイレクトモードにおけるコスト(cost_direct)に重み付けを行う(ステップ234)。
そして、min_costに該当するcostが最小の符号化モードを選択し(ステップ235)、当該マクロブロックの符号化を行う(ステップ236)。
なお、ステップ235では、時間ダイレクトモードの代わりに、ダイレクトモード以外の他の符号化モードに有線して、空間ダイレクトモードが選択されるようにしてもよい。
この符号化制御例3の場合には、ダイレクトモードにおいて動きベクトルの予測精度の低下による画質劣化が予想される場合に、ダイレクトモードと他の符号化モードとの比較において、ダイレクトモードが選択される比率が低くなるように制御することで、ダイレクトモードの採用による圧縮率の向上と、画質劣化とのバランスを考慮した、多様な符号化を実現することができる。
なお、本発明は、上述の実施の形態に例示した構成に限らず、その趣旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
(付記1)
第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとして含む動画像符号化方法であって、
可変な選択基準を用いて、前記符号化モードとして前記ダイレクトモードを選択する第1ステップと、
選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う第2ステップと、
を含むことを特徴とする動画像符号化方法。
(付記2)
付記1記載の動画像符号化方法において、
前記第1ステップでは、前記第1ピクチャ毎に、または前記マクロブロック毎に、前記符号化モードを選択することを特徴とする動画像符号化方法。
(付記3)
付記1記載の動画像符号化方法において、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードの場合、
前記第1ステップでは、前記ダイレクトベクトルが前記基準ベクトルよりも大きくなる場合には、前記ダイレクトモードを選択しないことを特徴とする動画像符号化方法。
(付記4)
付記1記載の動画像符号化方法において、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードの場合、
前記第1ステップでは、前記ダイレクトベクトルが前記基準ベクトルよりも大きくなる場合には、前記ダイレクトモードの発生を抑制することを特徴とする動画像符号化方法。
(付記5)
付記1記載の動画像符号化方法において、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードであり、
個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、参照先の前記第2ピクチャを変更することにより、前記基準ベクトルを変更することを特徴とする動画像符号化方法。
(付記6)
付記1記載の動画像符号化方法において、
前記ダイレクトモードが、
前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードと、
前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルと、前記第1ピクチャ内の符号化された動きベクトルから前記マクロブロックの動き情報を生成する空間ダイレクトモードと、を含み、
個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、前記空間ダイレクトモードを選択して前記マクロブロックの符号化を行うことを特徴とする動画像符号化方法。
(付記7)
付記1記載の動画像符号化方法において、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードであり、
個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、前記基準ベクトルが0ベクトルの場合だけ、前記時間ダイレクトモードを選択することを特徴とする動画像符号化方法。
(付記8)
付記1記載の動画像符号化方法において、
H.264/AVC(Advanced Video Coding)に適用される場合には、
前記第1ピクチャは、Bピクチャ(Bi−predictive Picture)であり、前記第2ピクチャは、Iピクチャ(Intra Picture)またはPピクチャ(Predictive Picture)であることを特徴とする動画像符号化方法。
(付記9)
第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとして含む動画像符号化装置であって、
前記符号化モードとして前記ダイレクトモードを選択する場合の選択基準が可変なモード選択手段と、
選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う符号化手段と、
を含むことを特徴とする動画像符号化装置。
(付記10)
付記9記載の動画像符号化装置において、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードの場合、
前記モード選択手段は、前記ダイレクトベクトルが前記基準ベクトルよりも大きくなる場合には、前記ダイレクトモードを選択しないことを特徴とする動画像符号化装置。
(付記11)
付記9記載の動画像符号化装置において、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードの場合、
前記モード選択手段は、前記ダイレクトベクトルが前記基準ベクトルよりも大きくなる場合には、前記ダイレクトモードの発生を抑制することを特徴とする動画像符号化装置。
(付記12)
付記9記載の動画像符号化装置において、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードであり、
個々の前記ピクチャが第1および第2フィールドで構成され、前記フィールドを一つのピクチャとして符号化を行う場合、
前記モード選択手段は、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、参照先の前記第2ピクチャを変更することにより、前記基準ベクトルを変更することを特徴とする動画像符号化装置。
(付記13)
付記9記載の動画像符号化装置において、
前記ダイレクトモードが、
前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードと、
前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルと、前記第1ピクチャ内の符号化された動きベクトルから前記マクロブロックの動き情報を生成する空間ダイレクトモードと、を含み、
個々の前記ピクチャが第1および第2フィールドで構成され、前記フィールドを一つのピクチャとして符号化を行う場合、
前記モード選択手段は、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、前記空間ダイレクトモードを選択して前記マクロブロックの符号化を行うことを特徴とする動画像符号化装置。
(付記14)
付記9記載の動画像符号化装置において、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードであり、
個々の前記ピクチャが第1および第2フィールドで構成され、前記フィールドを一つのピクチャとして符号化を行う場合、
前記モード選択手段は、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、前記基準ベクトルが0ベクトルの場合だけ、前記時間ダイレクトモードを選択することを特徴とする動画像符号化装置。
(付記15)
第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとしてコンピュータに実行させる動画像符号化プログラムであって、
可変な選択基準を用いて、前記符号化モードとして前記ダイレクトモードを選択する第1ステップと、
選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う第2ステップと、
を前記コンピュータに実行ささせることを特徴とする動画像符号化プログラム。
(付記16)
付記15記載の動画像符号化プログラムにおいて、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードの場合、
前記第1ステップでは、前記ダイレクトベクトルが前記基準ベクトルよりも大きくなる場合には、前記ダイレクトモードを選択しないことを特徴とする動画像符号化プログラム。
(付記17)
付記15記載の動画像符号化プログラムにおいて、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードの場合、
前記第1ステップでは、前記ダイレクトベクトルが前記基準ベクトルよりも大きくなる場合には、前記ダイレクトモードの発生を抑制することを特徴とする動画像符号化プログラム。
(付記18)
付記15記載の動画像符号化プログラムにおいて、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードであり、
個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、参照先の前記第2ピクチャを変更することにより、前記基準ベクトルを変更することを特徴とする動画像符号化プログラム。
(付記19)
付記15記載の動画像符号化プログラムにおいて、
前記ダイレクトモードが、
前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードと、
前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルと、前記第1ピクチャ内の符号化された動きベクトルから前記マクロブロックの動き情報を生成する空間ダイレクトモードと、を含み、
個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、前記空間ダイレクトモードを選択して前記マクロブロックの符号化を行うことを特徴とする動画像符号化プログラム。
(付記20)
付記15記載の動画像符号化プログラムにおいて、
前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードであり、
個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、前記基準ベクトルが0ベクトルの場合だけ、前記時間ダイレクトモードを選択することを特徴とする動画像符号化プログラム。
本発明の一実施の形態である動画像符号化方法を実施する動画像符号化プログラムの機能構成の一例を示す概念図である。 本発明の一実施の形態である動画像符号化装置を含む動画像符号化システムの構成の一例を示す概念図である。 本発明の一実施の形態である動画像符号化プログラムの全体の動作例を説明するフローチャートである。 本発明の実施の形態の作用を示す概念図である。 本発明の実施の形態の作用を示すフローチャートである。 本発明の実施の形態の作用の変形例を示すフローチャートである。 本発明の実施の形態の作用の変形例を示すフローチャートである。 時間ダイレクトモードの動きベクトルの生成例を示す概念図である。 順次走査に対応したFrame構造時におけるダイレクトベクトルの生成例を示す概念図である。 飛び越し走査に対応したField構造時におけるダイレクトベクトルの生成例を示す概念図である。 飛び越し走査に対応したField構造時におけるダイレクトベクトルの生成時の技術的課題を示す概念図である。
符号の説明
10 動画像供給源
11 動画像データ
11a ピクチャ
11b トップフィールド
11c ボドムフィールド
12 符号化データ
20 動画像符号化装置
21 符号化論理
22 走査方法指定部
23 走査方法通知信号
30 動画像媒体
31 蓄積媒体
32 通信媒体
100 動画像符号化プログラム
101 差分演算部
102 直交変換・量子化部
103 可変長符号化部
104 逆直交変換・逆量子化部
105 加算演算部
106 動き補償部
107 フレームメモリ
108 動きベクトル検出部
109 第1ダイレクトベクトル判定部(モード選択手段)
110 ダイレクトベクトル決定部
111 第2ダイレクトベクトル判定部(モード選択手段)
0 ダイレクトベクトル(動き情報)
1 ダイレクトベクトル(動き情報)
MV 基準ベクトル

Claims (10)

  1. 第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとして含む動画像符号化方法であって、
    可変な選択基準を用いて、前記符号化モードとして前記ダイレクトモードを選択する第1ステップと、
    選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う第2ステップと、
    を含むことを特徴とする動画像符号化方法。
  2. 請求項1記載の動画像符号化方法において、
    前記第1ステップでは、前記第1ピクチャ毎に、または前記マクロブロック毎に、前記符号化モードを選択することを特徴とする動画像符号化方法。
  3. 請求項1記載の動画像符号化方法において、
    前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードの場合、
    前記第1ステップでは、前記ダイレクトベクトルが前記基準ベクトルよりも大きくなる場合には、前記ダイレクトモードを選択しないことを特徴とする動画像符号化方法。
  4. 請求項1記載の動画像符号化方法において、
    前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードの場合、
    前記第1ステップでは、前記ダイレクトベクトルが前記基準ベクトルよりも大きくなる場合には、前記ダイレクトモードの発生を抑制することを特徴とする動画像符号化方法。
  5. 請求項1記載の動画像符号化方法において、
    前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードであり、
    個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
    前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、参照先の前記第2ピクチャを変更することにより、前記基準ベクトルを変更することを特徴とする動画像符号化方法。
  6. 請求項1記載の動画像符号化方法において、
    前記ダイレクトモードが、
    前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードと、
    前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルと、前記第1ピクチャ内の符号化された動きベクトルから前記マクロブロックの動き情報を生成する空間ダイレクトモードと、を含み、
    個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
    前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、前記空間ダイレクトモードを選択して前記マクロブロックの符号化を行うことを特徴とする動画像符号化方法。
  7. 請求項1記載の動画像符号化方法において、
    前記ダイレクトモードが、前記マクロブロックに対応した複数の前記第2ピクチャにおける符号化済みの二つのマクロブロックを起点および終点とする基準ベクトルを、前記第1ピクチャと複数の前記第2ピクチャの各々との時間間隔で按分することにより、前記動き情報として、前記マクロブロックを起点とする二つのダイレクトベクトルを生成する時間ダイレクトモードであり、
    個々の前記ピクチャが第1および第2フィールドで構成され、前記第2ステップでは、前記フィールドを一つのピクチャとして符号化を行う場合、
    前記第1ステップでは、前記第2ピクチャの前記第2フィールドが、前記基準ベクトルの起点となる場合には、前記基準ベクトルが0ベクトルの場合だけ、前記時間ダイレクトモードを選択することを特徴とする動画像符号化方法。
  8. 請求項1記載の動画像符号化方法において、
    H.264/AVC(Advanced Video Coding)に適用される場合には、
    前記第1ピクチャは、Bピクチャ(Bi−predictive Picture)であり、前記第2ピクチャは、Iピクチャ(Intra Picture)またはPピクチャ(Predictive Picture)であることを特徴とする動画像符号化方法。
  9. 第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとして含む動画像符号化装置であって、
    前記符号化モードとして前記ダイレクトモードを選択する場合の選択基準が可変なモード選択手段と、
    選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う符号化手段と、
    を含むことを特徴とする動画像符号化装置。
  10. 第1ピクチャを分割して得られるマクロブロックの各々の動き情報を、他の複数の第2ピクチャの符号化済みのマクロブロックの動き情報から予測して生成するダイレクトモードを、複数の符号化モードの一つとしてコンピュータに実行させる動画像符号化プログラムであって、
    可変な選択基準を用いて、前記符号化モードとして前記ダイレクトモードを選択する第1ステップと、
    選択された前記符号化モードに基づいて前記マクロブロックの符号化を行う第2ステップと、
    を前記コンピュータに実行ささせることを特徴とする動画像符号化プログラム。
JP2006070813A 2006-03-15 2006-03-15 動画像符号化方法、動画像符号化装置、動画像符号化プログラム Expired - Fee Related JP4527677B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2006070813A JP4527677B2 (ja) 2006-03-15 2006-03-15 動画像符号化方法、動画像符号化装置、動画像符号化プログラム
US11/460,260 US8144776B2 (en) 2006-03-15 2006-07-27 Direct mode video coding using variable selection criterion
EP20060254015 EP1835748B1 (en) 2006-03-15 2006-07-31 Video coding method, apparatus and program
CN2011101872013A CN102202221B (zh) 2006-03-15 2006-08-21 视频编码方法和视频编码装置
CN200610115967XA CN101039433B (zh) 2006-03-15 2006-08-21 视频编码方法和视频编码装置
KR20060081222A KR100952802B1 (ko) 2006-03-15 2006-08-25 동화상 부호화 방법 및 동화상 부호화 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006070813A JP4527677B2 (ja) 2006-03-15 2006-03-15 動画像符号化方法、動画像符号化装置、動画像符号化プログラム

Publications (2)

Publication Number Publication Date
JP2007251497A true JP2007251497A (ja) 2007-09-27
JP4527677B2 JP4527677B2 (ja) 2010-08-18

Family

ID=37547466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006070813A Expired - Fee Related JP4527677B2 (ja) 2006-03-15 2006-03-15 動画像符号化方法、動画像符号化装置、動画像符号化プログラム

Country Status (5)

Country Link
US (1) US8144776B2 (ja)
EP (1) EP1835748B1 (ja)
JP (1) JP4527677B2 (ja)
KR (1) KR100952802B1 (ja)
CN (2) CN101039433B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011099242A1 (ja) * 2010-02-12 2011-08-18 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP2011199362A (ja) * 2010-03-17 2011-10-06 Fujitsu Ltd 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100955396B1 (ko) * 2007-06-15 2010-04-29 성균관대학교산학협력단 양-예측 부호화 방법 및 장치, 양-예측 복호화 방법 및장치 및 기록매체
KR101505195B1 (ko) * 2008-02-20 2015-03-24 삼성전자주식회사 직접 모드 부호화 및 복호화 방법
JP5578775B2 (ja) 2008-09-02 2014-08-27 富士通株式会社 符号化装置および復号装置
US20110170605A1 (en) * 2008-09-24 2011-07-14 Kazushi Sato Image processing apparatus and image processing method
CN101883275B (zh) * 2009-05-04 2014-10-29 海信集团有限公司 视频编码方法
US9756357B2 (en) * 2010-03-31 2017-09-05 France Telecom Methods and devices for encoding and decoding an image sequence implementing a prediction by forward motion compensation, corresponding stream and computer program
MX2013001659A (es) 2010-09-24 2013-03-21 Panasonic Corp Metodo de codificacion de imagen, metodo de decodificacion de imagen, aparato de codificacion de imagen, y aparato de decodificacion de imagen.
WO2012096173A1 (ja) * 2011-01-12 2012-07-19 パナソニック株式会社 動画像符号化方法および動画像復号化方法
KR101878008B1 (ko) 2011-03-03 2018-07-13 선 페이턴트 트러스트 동화상 부호화 방법, 동화상 복호 방법, 동화상 부호화 장치, 동화상 복호 장치 및 동화상 부호화 복호 장치
US9225978B2 (en) * 2012-06-28 2015-12-29 Qualcomm Incorporated Streaming adaption based on clean random access (CRA) pictures
CN103634606B (zh) * 2012-08-21 2015-04-08 腾讯科技(深圳)有限公司 视频编码方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004208259A (ja) * 2002-04-19 2004-07-22 Matsushita Electric Ind Co Ltd 動きベクトル計算方法
JP2004215229A (ja) * 2002-11-01 2004-07-29 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
JP2005510984A (ja) * 2001-11-21 2005-04-21 ジェネラル・インストルメント・コーポレーション デジタルビデオコンテンツのためのピクチャレベルの適応フレーム/フィールド符号化

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1449197A (zh) * 2002-03-29 2003-10-15 Lg电子株式会社 视频编码系统中的b图象模式确定方法与装置
AU2003235174A1 (en) * 2002-04-19 2003-11-03 Matsushita Electric Industrial Co., Ltd Method for calculating motion vector
JP2004048632A (ja) 2002-05-16 2004-02-12 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
KR100506864B1 (ko) * 2002-10-04 2005-08-05 엘지전자 주식회사 모션벡터 결정방법
BRPI0306684B1 (pt) 2002-11-01 2018-03-13 Godo Kaisha Ip Bridge 1 “Método e aparelho de codificação de um sinal de imagem e método e aparelho de decodificação de um sinal de imagem”
US8036271B2 (en) * 2004-02-24 2011-10-11 Lsi Corporation Method and apparatus for determining a second picture for temporal direct-mode block prediction

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005510984A (ja) * 2001-11-21 2005-04-21 ジェネラル・インストルメント・コーポレーション デジタルビデオコンテンツのためのピクチャレベルの適応フレーム/フィールド符号化
JP2004208259A (ja) * 2002-04-19 2004-07-22 Matsushita Electric Ind Co Ltd 動きベクトル計算方法
JP2004215229A (ja) * 2002-11-01 2004-07-29 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011099242A1 (ja) * 2010-02-12 2011-08-18 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JPWO2011099242A1 (ja) * 2010-02-12 2013-06-13 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP5442039B2 (ja) * 2010-02-12 2014-03-12 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP2011199362A (ja) * 2010-03-17 2011-10-06 Fujitsu Ltd 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法

Also Published As

Publication number Publication date
KR20070093782A (ko) 2007-09-19
KR100952802B1 (ko) 2010-04-14
US8144776B2 (en) 2012-03-27
JP4527677B2 (ja) 2010-08-18
CN102202221B (zh) 2013-02-27
CN101039433A (zh) 2007-09-19
CN102202221A (zh) 2011-09-28
CN101039433B (zh) 2011-08-31
US20070217510A1 (en) 2007-09-20
EP1835748A1 (en) 2007-09-19
EP1835748B1 (en) 2013-05-22

Similar Documents

Publication Publication Date Title
JP4527677B2 (ja) 動画像符号化方法、動画像符号化装置、動画像符号化プログラム
JP6507114B2 (ja) デジタルビデオコンテンツのマクロブロックレベルにおける適応フレーム/フィールド符号化
US7567617B2 (en) Predicting motion vectors for fields of forward-predicted interlaced video frames
JP5368631B2 (ja) 画像符号化方法、装置、及びプログラム
US7426308B2 (en) Intraframe and interframe interlace coding and decoding
RU2310231C2 (ru) Пространственно-временное прогнозирование для двунаправлено прогнозируемых (в) изображений и прогнозирование вектора движения для компенсации движения множественных изображений с помощью эталона
JP5310614B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
JP2004056823A (ja) 動きベクトル符号化/復号化方法及びその装置
WO2012098845A1 (ja) 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置
JP5983430B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
US9036918B2 (en) Image processing apparatus and image processing method
JP2006100871A (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
JP6609004B2 (ja) 画像符号化方法及び画像復号化方法
JP6181242B2 (ja) 画像復号化方法
JP6367452B2 (ja) 画像符号化方法及び画像復号化方法
JP5951915B2 (ja) 画像復号化方法
JP6370977B2 (ja) 画像符号化方法及び画像復号化方法
JP5946980B1 (ja) 画像復号化方法
JP5911982B2 (ja) 画像復号化方法
JP5750191B2 (ja) 画像復号化方法
JP2008028882A (ja) 動画像符号化装置
JP2008078977A (ja) 画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100601

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100603

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees