JP2007228400A - 動画像変換装置 - Google Patents

動画像変換装置 Download PDF

Info

Publication number
JP2007228400A
JP2007228400A JP2006048794A JP2006048794A JP2007228400A JP 2007228400 A JP2007228400 A JP 2007228400A JP 2006048794 A JP2006048794 A JP 2006048794A JP 2006048794 A JP2006048794 A JP 2006048794A JP 2007228400 A JP2007228400 A JP 2007228400A
Authority
JP
Japan
Prior art keywords
motion vector
unit
video
mpeg
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006048794A
Other languages
English (en)
Inventor
Shunichi Sekiguchi
俊一 関口
Yuichi Izuhara
優一 出原
Kazuo Sugimoto
和夫 杉本
Etsuhisa Yamada
悦久 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2006048794A priority Critical patent/JP2007228400A/ja
Publication of JP2007228400A publication Critical patent/JP2007228400A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】少ない演算量で、ロバストかつ柔軟な動きベクトル変換処理を行うことのできる動画像変換装置を得る。
【解決手段】MPEG−2デコーダ部2から出力されるMPEG−2の符号化パラメータに基づいて、動きベクトル割り当て単位領域毎に動きベクトル候補を生成し、かつ、この生成を行い際、動きベクトル割り当て単位領域の部分領域内の位置と形状とに応じて、MPEG−2で符号化された所定部分領域のうちのどの部分領域の符号化パラメータを用いるかを適応的に定める動きベクトル推定部3を設ける。AVCエンコーダ部6は、動きベクトル推定部3で生成された動きベクトルに基づいて符号化を行う。
【選択図】図1

Description

この発明は、ディジタル圧縮符号化された動画像データを入力として、符号化方式、品質、解像度等を変換して新たな圧縮符号化動画像を出力する動画像変換装置に関するものである。
従来、MPEGやITU−T H.26x等の国際標準映像符号化方式では、映像信号の各フレームについて、輝度信号16×16画素とそれに対応する色差信号8×8画素分をまとめたブロックデータ(以下、マクロブロックという)を単位として、動き補償技術及び直交変換/変換係数量子化技術に基づいて圧縮する方法が採用されている。このことを利用して、ある国際標準映像符号化方式で符号化されたビットストリームを、異なる映像符号化方式、映像解像度、ビットレートのビットストリームへ演算量を抑えながら変換するビデオトランスコーディング技術が各所で研究・開発されている。
上記のような国際標準映像符号化方式は、デジタル放送、DVD、3G携帯動画コンテンツ、インターネットストリーミングなどの用途で現在世界的に利用されているが、動画データを扱う蓄積メディアやネットワークなどの制約により、映像解像度や符号化ビットレートなどの符号化パラメータをアプリケーションによって変えなければならない事情が発生する。ビデオトランスコーディング技術は、かような状況において、動画像を利用するアプリケーション間でシームレスにコンテンツをやりとりするための基本技術として重要である。理想的には、ビデオトランスコーディングは、入力ビットストリームを一度ベースバンド信号へ復号し、再度エンコーダを用いて出力ビットストリームを生成すればよいが、このような方法はデコーダとエンコーダのフル実装を必要とするほか、演算処理量の削減を行うことが難しい。したがって、ビデオトランスコーディング技術というときは、一般に入出力間の映像符号化方式の類似性を利用して、動きベクトル、変換係数やその他画像符号化情報の再利用を行うことで演算量を大幅に削減するアプローチのことをさす。
例えば、非特許文献1、2は、MPEG−2ビデオビットストリームからMPEG−4 AVC/H.264(以下、AVCと記す)に従うビデオビットストリームへのトランスコーディングを課題としており、最もクリティカルな演算負荷要因であるAVCの動きベクトルを決める処理に際して、MPEG−2の動きベクトル(MV)情報をAVC符号化の動き検出過程における初期探索点の候補の一つとすることで、AVC符号化における動き検出の結果を早期に収束させ、動き検出による予測効率を保ちながら処理量削減を図る工夫を開示している。
X.Lu他「Fast mode decision and motion estimation for H.264 with a focus on MPEG-2/H.264 transcoding」、ISCAS2005,May,2005 筑波他「MPEG-2/H.264トランスコーダにおける再動き検出に関する検討」、FIT2005、September,2005.
AVCでは一つの動きベクトルがサポートする画像領域範囲をマクロブロックだけでなく、マクロブロックを更に多様なブロックサイズへ分割した領域の単位とすることも可能となっており、これにより、非定常な映像信号への時間方向の予測の追随制を高めて圧縮効率を向上させている。上記の非特許文献1、2のような従来のMPEG−2→AVCトランスコーディング技術では、このような多様なブロックサイズに対する最適な動きベクトル変換を効率よく行うことが困難であった。
この発明は上記のような課題を解決するためになされたもので、少ない演算量で、ロバストかつ柔軟な動きベクトル変換処理を行うことのできる動画像変換装置を得ることを目的とする。
この発明に係る動画像変換装置は、第1の映像符号化方式における所定部分領域単位の符号化パラメータに基づいて、動きベクトル割り当て単位領域毎に動きベクトル候補を生成すると共に、その生成を行う際、動きベクトル割り当て単位領域の部分領域内の位置と形状とに応じて、第1の映像符号化方式で符号化された所定部分領域のうちのどの部分領域の符号化パラメータを用いるかを適応的に定める動きベクトル推定部を用いて、第1の映像符号化方式に従う映像符号化データを、第2の映像符号化方式に従う映像符号化データに変換するようにしたものである。
この発明の動画像変換装置は、第1の映像符号化方式に従う映像符号化データ中の動きベクトルや符号化モードの情報を再利用しながら、第2の映像符号化方式に従う映像符号化における最適な符号化モードおよび動きベクトルの決定を行うようにしたので、少ない演算量で、ロバストかつ柔軟な動きベクトル変換処理を行うことのできる動画像変換装置を得ることができる。
実施の形態1.
以下、この発明の実施の形態1について説明する。本実施の形態1における動画像変換装置は、第1の映像符号化方式に従う映像符号化データとして入力をMPEG−2、第2の映像符号化方式に従う映像符号化データとして出力をAVCとする符号化方式の変換を行う装置とする。入力と出力の間で映像解像度(フレームを構成する水平・垂直各画素数)、映像フレームレートは不変とし、特にビットレートの変換にも言及しない。
実施の形態1に係る動画像変換装置の特徴は、入力となるMPEG−2ビットストリーム中のある映像フレームを一度MPEG−2規格に従う復号方法によって復号し、その復号処理過程で取り出される情報を一時的に保持して、同映像フレームを再びAVC映像符号化方式に従ったビットストリームへ圧縮する過程で用いる動きベクトルを、前記符号化データを複合的に利用することで効率的に推定する点にある。説明の簡便化のため、以下では本装置の動作に際して入力MPEG−2ビットストリームはPピクチャのみを含むものとし、それを同じくAVCのPピクチャへ変換するものとする。
図1に、本実施の形態1における動画像変換装置の内部構成を示す。
本トランスコーダは、MPEG−2デコーダ部2、AVCエンコーダ部6が、動きベクトル推定部3を介してカスケード接続された構成で表される。
MPEG−2デコーダ部2は、可変長復号部201、逆量子化部202、逆DCT部203、動き補償部204、フレームメモリ205、加算器206を備えている。可変長復号部201は、MPEG−2の符号化方式で圧縮された入力圧縮データ1に対して、復号を行い、予測残差信号符号化データ2aと、MPEG−2符号化情報(符号化モード情報および動きベクトル情報)2bを生成する機能部である。逆量子化部202は、予測残差信号符号化データ2aを逆量子化し、逆DCT部203は、逆DCTを行う機能部であり、逆DCT部203から出力される予測残差信号復号値2cは、加算器206に出力されると共に、動きベクトル推定部3に出力されるよう構成されている。動き補償部204は、可変長復号部201からのMPEG−2符号化情報2bと、フレームメモリ205に格納された参照画像に基づいて、動き補償を行い、予測画像2dを出力する機能部である。フレームメモリ205は、復号画像5を参照画像として格納する記憶部である。また、加算器206は、予測残差信号復号値2cと、動き補償部204からの予測画像2dを加算し、復号画像5としてAVCエンコーダ部6に出力する機能部である。
動きベクトル推定部3は、MPEG−2における所定部分領域単位の符号化パラメータに基づいて、動きベクトル割り当て単位領域毎に動きベクトル候補を生成すると共に、その動きベクトル候補の生成を行う際、動きベクトル割り当て単位領域の部分領域内の位置と形状とに応じて、MPEG−2で符号化された所定部分領域のうちのどの部分領域の符号化パラメータを用いるかを適応的に定める機能を有している。
図2は、動きベクトル推定部3の内部構成図である。
動きベクトル推定部3は、メモリ301、BMV決定部302、マスク決定部303、動きベクトル加重平均処理部304、マスク内動きベクトル分散算出部305、動きベクトル孤立度算出部306、動きベクトル精度変換部307を備えている。
メモリ301は、入力されたMPEG−2符号化情報2bと、予測残差信号復号値2cとを保持するためのメモリである。BMV決定部302は、メモリ301に保持されているMPEG−2符号化情報である動きベクトル情報3aに基づいてBMV(CMV算出に用いるマスク内のマクロブロック単位動きベクトルであるが、これについては後で詳述する)を決定し、これをBMV3bとして出力する機能部である。マスク決定部303は、AVCのMCブロックサイズを示す予測モードの情報3cを入力し、マスクを決定して、このマスク情報3dを出力する機能部である。動きベクトル加重平均処理部304は、メモリ301から予測誤差量3eと、マスク決定部303からのマスク情報3dと、マスク内動きベクトル分散算出部305からのBMVの分散を示す値3fと、BMVの孤立度を示す値3gとに基づいて動きベクトルを求め、これを候補ベクトル3hとして出力する機能部である。
マスク内動きベクトル分散算出部305は、BMV決定部302からのBMV3bとマスク決定部303からのマスク情報3dに基づいてマスク内動きベクトル分散を算出し、BMVの分散を示す値3fとして動きベクトル加重平均処理部304に与えるための処理部である。動きベクトル孤立度算出部306は、メモリ301内の動きベクトル差分符号化情報3iと、BMV3bとマスク情報3dとを入力し、動きベクトルの孤立度を算出し、この値3gを動きベクトル加重平均処理部304に与えるための機能部である。動きベクトル精度変換部307は、動きベクトル加重平均処理部304からの候補ベクトル3hを入力し、動きベクトルの精度を変換し、動き候補ベクトル4を出力する機能部である。
図1に戻って、AVCエンコーダ部6は、符号化モード判定部601、動き補償部602、変換部603、量子化部604、可変長符号化部605、逆量子化部606、逆変換部607、加算器608、ループフィルタ609、フレームメモリ610、減算器611を備えている。
符号化モード判定部601は、動きベクトル推定部3で生成されたAVCにおける動きベクトルの候補のうち、動きベクトル候補を用いた場合の予測効率を評価する評価値に基づいて、最も効率がよいと判定される動きベクトル候補を、AVCエンコーダ部6において使用する動きベクトルとして決定するよう構成されている。
動き補償部602は、符号化モード判定部601で決定された予測モード、動きベクトルに基づいて予測画像6aを生成する機能部である。変換部603は例えばDCTといった変換処理を行い、量子化部604は量子化を行う機能部である。可変長符号化部605は、量子化部604の出力に対してAVCビデオストリームの形式に符号化して出力する機能部である。また、逆量子化部606および逆変換部607は、それぞれ量子化部604および変換部603の逆量子化および逆変換を行う機能部である。加算器608は、逆変換部607から出力された予測残差信号復号値6bと、予測画像6aとを加算する機能部である。ループフィルタ609は、ブロック歪み除去を行うフィルタである。フレームメモリ610は、動き補償部602で動き補償を行うためのフレームを保持するためのメモリである。また、減算器611は、復号画像5と予測画像6aとの差分をとり、予測残差信号6cを出力する機能部である。
次に、実施の形態1の動作について説明する。
MPEG−2デコーダ部2において一旦復号画像5を生成し、AVCエンコーダ部6で符号化を行う。この際、AVCエンコーダ部6の動きベクトル検出処理を省略するため、動きベクトル推定部3において、MPEG−2ビデオストリームから取り出した動きベクトルを、AVC符号化に利用可能な動きベクトルへ変換する。
以下、動作の詳細について説明する。
(1)入力MPEG−2ビデオストリームの復号処理
先ず、MPEG−2準拠の符号化方式で圧縮された入力圧縮データ1がMPEG−2デコーダ部2に入力される。MPEG−2デコーダ部2では、可変長復号部201においてMPEG−2規格に従い、入力圧縮データ1のシンタックス解析を行い、予測残差信号符号化データ2a、MPEG−2符号化情報(符号化モード情報および動きベクトル情報)2bを生成する。予測残差信号符号化データ2aは、逆量子化部202、逆DCT部203を経て、予測残差信号復号値2cに復号される。MPEG−2符号化情報2bは、動きベクトル推定部3にて動きベクトル推定処理に用いるため、動きベクトル推定部3内部に用意されるメモリ301中に1フレーム分保持される。
MPEG−2符号化情報2b中の動きベクトル情報は、動きベクトル値そのものだけでなく、フレーム予測かフィールド予測かを示すフラグなど、MC(動き補償)に関わる全ての情報を含むものとする。これは動き補償部204へ入力され、フレームメモリ205中に格納される参照画像データと動きベクトルとに従い、予測画像2dが生成される。そして、予測残差信号復号値2cと予測画像2dが加算器206で加算されて、復号画像5が生成される。復号画像5は、MPEG−2デコーダ部2の出力として、以後のフレームの動き補償に参照画像として用いるため、フレームメモリ205に格納される。
(2)動きベクトル推定処理
次に、本発明の特徴である動きベクトル推定処理について説明する。
図3は、動きベクトル推定部3による動きベクトル推定処理のフローチャートである。
AVCでは、図4に示すように、マクロブロックを複数の形状のMCブロックに分割して個々のMCブロック毎に動きベクトルを割り当てて動き補償予測を行うことができる(以下、マルチブロックサイズMCと呼ぶ)。図4において、mb_typeはマクロブロックの単位で指定されるMCブロックサイズ種別であり、mb_type==INTER8×8の場合には、8×8ブロックの単位で更にその内部を細分化できる(sub_mb_typeで指定)。従って、マクロブロック内では1〜16本まで多彩な動きベクトル割り当てが可能である。
例えば、映像中に動物体が存在する場合、マクロブロック中に動物体の輪郭と背景とが混在する場合があり、マクロブロック内に様々な動きが存在する可能性があるが、AVCではマルチブロックサイズMCの機構によって、従来のMPEG−2、MPEG−4といった標準方式に比べてこれらの動きを的確に予測することが可能となる。一方、MPEG−2では図5に示すようにマクロブロック内は最大2本の動きベクトル割り当てに止まり、AVCとMPEG−2とでは、一つの動きベクトル情報がサポートする画像領域に大きな差異がある。尚、図5において、(a)はフレーム構造符号化時の動き予測モード、(b)はフィールド構造符号化時の動き予測モードを示している。
従って、従来のビデオトランスコーディング技術(例えば、特開2003−309851号公報等に記載の技術)で用いられる単純な動きベクトルマッピングではAVC符号化時に使用する動きベクトルとして有益な情報が得られない可能性が高い。
そこで、本発明では、このような状況を鑑み、例えば、B.Shen他、“daptive Motion-Vector Resampling for Compressed Video Downsampling”,IEEE Transactions on Circuits And Systems for Video Technology,vol.9,no.6,Sep.1999で提案されている、入力圧縮データにおける予測残差と動きベクトル精度との相関を利用して加重平均により最終動きベクトルを得る手法を応用する。Shenらが、2:1の解像度変換を伴い、かつMCブロックのカバレージ単位が変換前後で変化しないトランスコーディングを前提としているのに対し、本発明は解像度変換の有無およびMCブロックサイズの変化に依存しない方式を提供する。そのために、推定対象となるMCブロックの位置と形状に応じて適応的に加重平均をとるエリア(以下、マスクと呼ぶ)を変化させる。さらに、加重平均に際して、Shenらの方式では提案されていない動きベクトルのマスク内での分散、および動きベクトルの孤立度合いを示す評価値に着目する。これらを加重平均の重みに組み入れて動きベクトル候補を算出することで、最終的に決定する動きベクトルの候補数を増加させ、より安定した動きベクトルの推定を可能とする。
1)MPEG−2復号情報の蓄積
可変長復号部201から出力される入力MPEG−2ビットストリームに含まれる情報のうち、以下の情報をMPEG−2符号化情報2bとして、メモリ301に1フレーム分蓄積する
・動きベクトル情報(V(i,j,k))
・動きベクトル差分符号化情報(MVD(i,j,k))
・マクロブロック符号化モード情報(M(i,j))
・動きタイプ(T(i,j))
ここで、(i,j)は1フレーム中のMPEG−2マクロブロック行・列番号(ラスタスキャン順)、kはマクロブロック中のMPEG−2動きベクトルの通し番号である。MPEG−2の場合、T(i,j)がフレームMCを示している場合k=1、フィールドMCまたはデュアルプライムMCを示している場合はk=2とし、MPEG−2復号に実際に使用される動きベクトル情報を格納する。また、M(i,j)がイントラまたはスキップMBであることを示す場合は、ビットストリーム中に動きベクトルは存在しないが、本実施の形態1では、イントラMBの場合はk=0,V(i,j,k)=PMV(PMVはカレントマクロブロックがインターMBだとした場合に動きベクトルの復号に用いる予測ベクトルのことを意味する。MPEG−2では、動きベクトル情報は周辺マクロブロックの情報から一意に生成される予測ベクトル=PMVとの差分を符号化する)、MVD(i,j,k)=0とし、スキップMBの場合はk=0,V(i,j,k)=0、MVD(i,j,k)=PMVとする。
また、逆DCT部203の出力である予測残差信号復号値2cを
・予測誤差量(E(i,j,n))
として蓄積する。ここで、nはマクロブロック内におけるDCT処理単位である8×8ブロックの通し番号(0<=n<4)である。E(i,j,n)は予測誤差量をスカラ値として定量化する値であれば任意の表現でよいが、本実施の形態1では、
Figure 2007228400
とする。(x,y)は、8×8ブロック内でのサンプル位置を示し、ei,j,n(x,y)は予測誤差復号値を示す。
M(i,j)がイントラMBであることを示す場合は、逆DCT部203の出力はイントラ符号化情報であってフレーム間予測残差ではなく、動きベクトルの推定の重みとして適さないため、逆DCT部203の出力を使用せず、E(i,j,n)には所定の固定値を設定する。尚、MPEG−2復号情報の蓄積処理は図3中のフローチャートには記載していないが、図3の処理が開始される前に1フレーム分の蓄積が完了している必要がある。
これらV(i,j,k),MVD(i,j,k),M(i,j),T(i,j),E(i,j,n)は、全てMPEG−2デコーダ部2の一連の動作の中で得られる情報であり、一部符号化データを直接使用できないケースでの簡易な演算以外は特別な演算処理を導入する必要はない。
次いで、V(i,j,k),MVD(i,j,k),M(i,j),T(i,j),E(i,j,n)に基づいて、AVCのMCブロック候補毎に動きベクトルの推定を行う。以下の説明では、AVCのMCブロックサイズを示す予測モードをm(i,j)とする。(i,j)は1フレーム中のMPEG−2およびAVCマクロブロックの通し番号(ラスタスキャン順)である。
m(i,j)として、以下を想定する。これらの定義は図4に示した通りで、本実施の形態1では説明を簡略化するため、INTER8×8の場合の8×8ブロック単位に与えられるsub_mb_typeは常にINTER8×8に固定、とする(即ち、INTER8×4、INTER4×8、INTER4×4は使用しないものとする)。個々のm(i,j)に対して定まるMCブロック毎の動きベクトルの候補をCMV(i,j,p)とする。pはm(i,j)に応じて定まるCMVの通し番号を表す(図4のINTER16×16、INTER16×8、INTER8×16、INTER8×8の各MCブロックに付与した番号がpを表す)。
m(i,j)=0:INTER16×16 (p=0)
m(i,j)=1:INTER16×8 (0≦p<2)
m(i,j)=2:INTER8×16 (0≦p<3)
m(i,j)=3:INTER8×8 (0≦p<4)
2)マスク決定処理
先ず、マスク決定部303は、m(i,j)(図2中の3c)に応じて、CMV算出に用いるマスク領域を決定する(図3のステップST1)。
図6および図7は、マスク決定の様子を示す説明図である。
これら図6および図7において、太実線の領域がカレントマクロブロックを、普通実線が8×8ブロックを、ハッチング領域が動きベクトル推定対象領域を、太点線領域がマスクを示す。また、これらの図において、(a)はm(i,j)=0:INTER16×16の場合、(b)はm(i,j)=1:INTER16×8の場合、(c)はm(i,j)=2:INTER8×16の場合、(d)はm(i,j)=3:INTER8×8の場合を示している。マスクはCMVの個数(即ち、MCブロックの個数)分設定される。このように、推定対象のMCブロックのサイズや位置に応じてマスク領域を変更することにより、MCブロックのサイズや位置によらず、最適な周辺動きベクトルを基に加重平均処理を行うことができる。
3)BMV決定処理
次いで、BMV決定部302は、CMV算出に用いるマスク内のマクロブロック単位動きベクトルBMVをMPEG−2の動きベクトルV(i,j,k)(図2中の3a)に基づいて決定する(ステップST2)。図6の(a)には、8×8ないしはマクロブロックの単位でMPEG−2符号化情報2bの状態を一緒に図示している。ここで、BMV(i,j)は、V(i,j,k)から定まるマクロブロックを単位とするMPEG−2動きベクトル情報であり、MPEG−2ビットストリームがフレームピクチャ構造で符号化されている場合は以下のルールで定める。
T(i,j)がフレームMCを示している場合、BMV(i,j)=V(i,j,0)
T(i,j)がフィールドMCまたはデュアルプライムMCを示している場合、BMV(i,j)はV(i,j,0)とV(i,j,1)のうち、予測残差が小さい方を選択する。
また、MPEG−2ビットストリームがフィールドピクチャ構造で符号化されている場合は以下のルールで定める。
T(i,j)がフィールドMCを示している場合、BMV(i,j)=V(i,j,0)
T(i,j)が16×8MCまたはデュアルプライムMCを示している場合、BMV(i,j)はV(i,j,0)とV(i,j,1)のうち、予測残差が小さい方を選択する。
予測残差には、E(i,j,n)を用いることができる。尚、BMV(i,j)の候補が2本あるケースについては、2本ともBMVとして扱い、CMVもBMVに対応して2本生成するように構成することもできる。この場合、CMVの算出処理回数が増えるが、上記予測残差情報を別途用意する必要はない上、MPEG−2符号化情報で与えられる選択肢を最大限利用してCMVの候補を増やすことができ、最終的に決定する動きベクトルの精度をより向上させることができる。また、BMVは図2中のデータ3bで表している。
4)CMV算出処理
本実施の形態1では、3種類のCMVを求める。以下、それらをCMV1、CMV2、CMV3と呼ぶ。これらは全て最終的なAVC符号化用動きベクトルを求める際の候補ベクトルとする。
4−1)CMV1の算出
先ず、動きベクトル加重平均処理部304は、BMV(i,j)(図2の3b)とE(i,j,n)(図2の3e)を用いてCMV1(i,j,p)を求める(ステップST3)。CMV1(i,j,p)は、m(i,j)=0,1,2,3のそれぞれについて求める(ステップST1〜ステップST8)。以下の説明においては、具体的な例として、図8に、m(i,j)=2(INTER8×16)の場合の左側のMCブロック(ハッチング部分)に対するCMV1(i,j,0)を求めることとする。ここで、CMV1算出に際しては、2)のマスク決定処理において点線で示すマスクR(図2の3d)を構成し、このマスクR内のBMV(i,j)とE(i,j,n)を用いる。もう一方のMCブロックに対するCMV1(i,j,1)も同様の方法で算出する。
具体的には、下式の加重平均で求める。(ここでは水平成分、垂直成分の種別を略して記載している。実際はCMV1の水平成分、垂直成分のそれぞれについて算出を行う)
Figure 2007228400
但し、CMVは8×16ブロックをカバーするMVであること、BMVは16×16ブロックをカバーするMVであることから、実際上は、
BMV(i−1,j−1)&E(i−1,j−1,3),
BMV(i,j−1)&[E(i,j−1,2)+E(i,j−1,3)]/2,
BMV(i+1,j−1)&E(i+1,j−1,2),
BMV(i−1,j)&[E(i−1,j,1)+E(i−1,j,3)]/2,
BMV(i,j)&[E(i,j,0)+E(i,j,2)]/2,
BMV(i,j)&[E(i,j,1)+E(i,j,3)]/2,
BMV(i−1,j+1)&E(i−1,j+1,1),
BMV(i,j+1)&[E(i,j+1,0)+E(i,j+1,1)]/2,
BMV(i+1,j+1)&E(i+1,j+1,0)
の組み合わせで加重平均をとる。予測誤差量の逆数で動きベクトルを重み付けすることで、予測誤差の小さいブロックに割り当てられた動きベクトルに強い重みが与えられる。
4−2)CMV2の算出
次に、CMV2を求める(ステップST4)。CMV2は、マスクR(3d)に基づいて、マスク内動きベクトル分散算出部305と動きベクトル加重平均処理部304とによって求める。具体的には下式の加重平均で求める。
Figure 2007228400
σRはマスクR(3d)内におけるBMVの分散(選択された所定部分領域全体に含まれる動きベクトルのばらつき度合いを示す分散値)を示し、マスク内動きベクトル分散算出部305で、BMV(図2中の3b)に基づいて算出される。h(σR)(図2の3f)は、σRに依存する単調減少の非線形関数である。
Figure 2007228400
CMV1と比較すると、CMV2では、マスクR内のBMVの分散が小さい場合に、対象MCブロックに対応するBMVが強く重み付けされる。つまりCMV2は、CMV1によって十分な精度の推定ができない場合、動きベクトル場を平滑化する方向のベクトル候補として機能する。
4−3)CMV3の算出
次に、CMV3を求める(ステップST5)。CMV3は、マスクR(3d)に基づいて、マスク内動きベクトル分散算出部305、動きベクトル孤立度算出部306、動きベクトル加重平均処理部304によって求める。CMV3では、CMV2に対して、下記のように関数gの定義を変更したものを用いる。
Figure 2007228400
BMVD(i,j)は、上記4−2)で示した手順でBMVとして採用したV(i,j,k)に対応するインデックスkのMVD(i,j,k)(図2の3f)を割り当てるものとする。p(x)はx-1に依存する非線形関数とし、p(BMVD(i,j))の部分は全体としてはBMVDの大きさの逆数を表す。また、p(BMVD(i,j))は図2中の3gに対応する。
BMVDの大きさはBMVの孤立度(選択された所定部分領域全体に含まれる動きベクトルの予測値からの差分量)を表し、BMVDが大きいほど孤立度が大きい可能性が高いので、このように重みの計算式にBMVDの大きさの逆数を取り入れることにより、孤立したベクトルの重みを小さくできる効果がある。孤立したベクトルは動き予測の信頼性が低い確率が高いという推定が根拠である。孤立したBMVの重みを小さくすることにより、CMVの推定精度を向上させる効果がある。
5)CMV表現精度の変換
MPEG−2の動きベクトルV(i,j,k)、動きベクトル差分MVD(i,j,k)はいずれも半画素を1とする精度で表現されている。そこで、AVCの動きベクトルとしてCMVを用いるために、動きベクトル精度変換部307により、CMV1〜CMV3のベクトル値をそれぞれ2倍して1/4画素を1とする動きベクトル値に変換する(ステップST6)。このような処理により、AVCエンコーダ部6で使用する動きベクトル候補4が決定される。
(3)AVC符号化処理
1)予測モード決定処理
上記(2)の処理により、AVCの予測モードm(i,j)で利用すべき動きベクトルの候補4が選定されたため、最終的にAVCエンコーダ部6で使用する予測モードを、符号化モード判定部601にて決定する。この結果として、最終的にカレントマクロブロックの符号化に用いる予測モードと動きベクトルが決定される。(尚、説明を簡単にするため、符号化モード判定部601では、AVCの予測モードm(i,j)のうち最適なモードを選択する処理とみなす(実際の符号化では、フレーム間予測モードだけでなく、フレーム内(イントラ)符号化モードなども考慮して最適な符号化モードを選ぶことになるが、その点は本発明の本質から外れるため、詳細は略す))。
このモード判定処理には、判定基準として、下式に示すレート歪コストJmを用いる。
Figure 2007228400
同式において、mは予測モード種別(m(i,j)のこと)、vmはモードmの場合の動きベクトル(CMV1〜CMV3のこと)、Mはモード種別の集合(M=(INTER16×16、INTER16×8、INTER8×16、INTER8×8))、αmはモードmに応じて定まる定数、Emはモードm使用時の予測誤差評価値、Rvmは動きベクトルがvmの場合の動きベクトル符号量、λは正の定数、m*,vm*は本評価の結果最終的に選定される予測モードと動きベクトルである。Emは輝度信号のみでなく、色差成分(Cb、Cr成分)を加味して定義するように構成してもよい。
λの値としては、例えば、Gary J. Sullivan and Thomas Wiegand,“Rate-Distortion Optimization for Video Compression”,IEEE Signal Processing Magazine,vol. 15,no. 6,pp. 74-90,Nov.1998.に開示される以下の値を用いることができる。但し、Qpは、符号化対象マクロブロックの量子化ステップパラメータである。
Figure 2007228400
以上のように、本実施の形態では、MPEG−2デコーダ部2で入力圧縮データ1から抽出・蓄積したMPEG−2符号化情報2bを再利用することにより、一切の動きベクトル再探索処理を実行することなく、AVCエンコード時に選択しうる予測モードmで用いるvmとしてCMV1〜CMV3の3種類を評価することができ、少ない演算量で効率のよい予測モード判定が可能となる。
2)符号化処理
MPEG−2デコーダ部2によって復号された復号画像5はそのままAVCエンコーダ部6へ入力信号として入力される。符号化モード判定部601により、予測モード、動きベクトルが定まると、動き補償部602で予測画像6aが生成され、また、減算器611により入力信号である復号画像5との差分をとって予測残差信号6cが生成され、それが変換部603、量子化部604を経て可変長符号化部605によってAVCビデオストリームの形式に配列される。
量子化後の予測残差信号は、逆量子化部606、逆変換部607を経て予測残差信号復号値6bに戻され、加算器608によって予測画像6aと加算された後、以降のフレームのMCに用いるためにフレームメモリ610に格納される。格納前に、必要に応じてループフィルタ609にてブロック歪み除去フィルタ処理が行われる。
尚、実施の形態1では、変換先としてAVCを想定したが、同様にマクロブロックを単位とする符号化方式(例えばMPEG−4、SMPTE VC−1等)への変換にも同様の方式を適用することができることは言うまでもない。
以上のように、実施の形態1の動画像変換装置によれば、映像信号の各フレームを所定部分領域に分割し、その単位で動きベクトルを含む符号化パラメータを選択して符号化を行う第1の映像符号化方式に従う映像符号化データを入力として、映像信号の各フレームを所定部分領域に分割し、その単位で符号化パラメータを選択して符号化を行うと共に、所定部分領域内を、複数の形状を有する動きベクトル割り当て単位領域に分割可能な第2の映像符号化方式に従う映像符号化データへの変換を行う動画像変換装置であって、第1の映像符号化方式における所定部分領域単位の符号化パラメータに基づいて、動きベクトル割り当て単位領域毎に動きベクトル候補を生成すると共に、その生成を行う際、動きベクトル割り当て単位領域の部分領域内の位置と形状とに応じて、第1の映像符号化方式で符号化された所定部分領域のうちのどの部分領域の符号化パラメータを用いるかを適応的に定める動きベクトル推定部と、生成された第2の映像符号化方式における動きベクトルの候補のうち、動きベクトル候補を用いた場合の予測効率を評価する評価値に基づいて、最も効率がよいと判定される動きベクトル候補を、第2の映像符号化方式において使用する動きベクトルとして決定する符号化モード判定部とを備えたので、少ない演算量で、ロバストかつ柔軟な動きベクトル変換処理を行うことができる。
また、実施の形態1の動画像変換装置によれば、動きベクトル推定部は、動きベクトル割り当て単位領域毎に動きベクトル候補を求めるに際して選択された、第1の映像符号化方式の部分領域内の符号化パラメータのうち、所定部分領域に割り当てられた符号化モード、動きベクトル、動き予測誤差信号評価値に基づいて動きベクトル候補を生成するようにしたので、安定した動きベクトルの推定を行うことができる。
また、実施の形態1の動画像変換装置によれば、動きベクトル推定部は、選択された所定部分領域全体に含まれる動きベクトルのばらつき度合いを示す分散値に基づいて動きベクトル候補を生成するようにしたので、最終的に決定する動きベクトルの候補数を増加させ、より安定した動きベクトルの推定を可能とすることができる。
また、実施の形態1の動画像変換装置によれば、動きベクトル推定部は、選択された所定部分領域全体に含まれる動きベクトルの予測値からの差分量に基づいて動きベクトル候補を生成するようにしたので、更に安定した動きベクトルの推定を行うことができる。
また、実施の形態1の動画像変換装置によれば、第1の映像符号化方式をMPEG−2、第2の映像符号化方式をMPEG−4 AVC/H.264としたので、MPEG−2からMPEG−4 AVC/H.264への変換を行うトランスコーダとして、少ない演算量で、ロバストかつ柔軟な動きベクトル変換処理を実現することができる。
この発明の実施の形態1による動画像変換装置を示す構成図である。 この発明の実施の形態1による動画像変換装置の動きベクトル推定部の内部構成図である。 この発明の実施の形態1における動きベクトル推定部による動きベクトル推定処理のフローチャートである。 AVCにおけるマルチブロックサイズMCの説明図である。 MPEG−2における動きベクトル割り当ての説明図である。 この発明の実施の形態1におけるマスク決定部のマスク決定処理の説明図(その1)である。 この発明の実施の形態1におけるマスク決定部のマスク決定処理の説明図(その2)である。 この発明の実施の形態1におけるm(i,j)=2の場合の左側のMCブロックに対するCMV1(i,j,0)の説明図である。
符号の説明
1 入力圧縮データ、2 MPEG−2デコーダ部、3 動きベクトル推定部、4 動き候補ベクトル、5 復号画像、6 AVCエンコーダ部、2b MPEG−2符号化情報、302 BMV決定部、303 マスク決定部、304 動きベクトル加重平均処理部、305 マスク内動きベクトル分散算出部、306 動きベクトル孤立度算出部、601 符号化モード判定部。

Claims (5)

  1. 映像信号の各フレームを所定部分領域に分割し、その単位で動きベクトルを含む符号化パラメータを選択して符号化を行う第1の映像符号化方式に従う映像符号化データを入力として、映像信号の各フレームを所定部分領域に分割し、その単位で符号化パラメータを選択して符号化を行うと共に、前記所定部分領域内を、複数の形状を有する動きベクトル割り当て単位領域に分割可能な第2の映像符号化方式に従う映像符号化データへの変換を行う動画像変換装置であって、
    前記第1の映像符号化方式における所定部分領域単位の符号化パラメータに基づいて、前記動きベクトル割り当て単位領域毎に動きベクトル候補を生成すると共に、当該生成を行う際、前記動きベクトル割り当て単位領域の前記部分領域内の位置と形状とに応じて、前記第1の映像符号化方式で符号化された所定部分領域のうちのどの部分領域の符号化パラメータを用いるかを適応的に定める動きベクトル推定部と、
    前記生成された第2の映像符号化方式における動きベクトルの候補のうち、当該動きベクトル候補を用いた場合の予測効率を評価する評価値に基づいて、最も効率がよいと判定される動きベクトル候補を、前記第2の映像符号化方式において使用する動きベクトルとして決定する符号化モード判定部とを備えた動画像変換装置。
  2. 動きベクトル推定部は、動きベクトル割り当て単位領域毎に動きベクトル候補を求めるに際して選択された、第1の映像符号化方式の部分領域内の符号化パラメータのうち、所定部分領域に割り当てられた符号化モード、動きベクトル、動き予測誤差信号評価値に基づいて動きベクトル候補を生成することを特徴とする請求項1記載の動画像変換装置。
  3. 動きベクトル推定部は、選択された所定部分領域全体に含まれる動きベクトルのばらつき度合いを示す分散値に基づいて動きベクトル候補を生成することを特徴とする請求項2記載の動画像変換装置。
  4. 動きベクトル推定部は、選択された所定部分領域全体に含まれる動きベクトルの予測値からの差分量に基づいて動きベクトル候補を生成することを特徴とする請求項3記載の動画像変換装置。
  5. 第1の映像符号化方式はMPEG−2、第2の映像符号化方式はMPEG−4 AVC/H.264であることを特徴とする請求項1から請求項4のうちいずれか1項記載の動画像変換装置。
JP2006048794A 2006-02-24 2006-02-24 動画像変換装置 Pending JP2007228400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006048794A JP2007228400A (ja) 2006-02-24 2006-02-24 動画像変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006048794A JP2007228400A (ja) 2006-02-24 2006-02-24 動画像変換装置

Publications (1)

Publication Number Publication Date
JP2007228400A true JP2007228400A (ja) 2007-09-06

Family

ID=38549738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006048794A Pending JP2007228400A (ja) 2006-02-24 2006-02-24 動画像変換装置

Country Status (1)

Country Link
JP (1) JP2007228400A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014093602A (ja) * 2012-11-01 2014-05-19 Toshiba Corp 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置
JP2017085598A (ja) * 2016-12-08 2017-05-18 株式会社東芝 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11275592A (ja) * 1998-01-22 1999-10-08 Victor Co Of Japan Ltd 動画像符号列変換装置及びその方法
JP2002010267A (ja) * 2000-06-26 2002-01-11 Sony Corp 動きベクトル変換装置及び方法
JP2003309851A (ja) * 2002-04-16 2003-10-31 Mitsubishi Electric Corp 映像データ変換装置および映像データ変換方法
JP2006295502A (ja) * 2005-04-08 2006-10-26 Pioneer Electronic Corp 再符号化装置、再符号化方法、および再符号化用プログラム
JP2007134810A (ja) * 2005-11-08 2007-05-31 Kddi Corp 符号化方式変換装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11275592A (ja) * 1998-01-22 1999-10-08 Victor Co Of Japan Ltd 動画像符号列変換装置及びその方法
JP2002010267A (ja) * 2000-06-26 2002-01-11 Sony Corp 動きベクトル変換装置及び方法
JP2003309851A (ja) * 2002-04-16 2003-10-31 Mitsubishi Electric Corp 映像データ変換装置および映像データ変換方法
JP2006295502A (ja) * 2005-04-08 2006-10-26 Pioneer Electronic Corp 再符号化装置、再符号化方法、および再符号化用プログラム
JP2007134810A (ja) * 2005-11-08 2007-05-31 Kddi Corp 符号化方式変換装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014093602A (ja) * 2012-11-01 2014-05-19 Toshiba Corp 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置
US10003782B2 (en) 2012-11-01 2018-06-19 Kabushiki Kaisha Toshiba Image processing device, method, computer-readable medium and 3D image display
JP2017085598A (ja) * 2016-12-08 2017-05-18 株式会社東芝 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置

Similar Documents

Publication Publication Date Title
TWI395489B (zh) A video coding apparatus, and an image decoding apparatus
RU2547634C2 (ru) Способ и устройство обработки изображения
JP5277257B2 (ja) 動画像復号化方法および動画像符号化方法
US20110176614A1 (en) Image processing device and method, and program
JP2008154015A (ja) 復号化方法および符号化方法
JP2010016454A (ja) 画像符号化装置および方法、画像復号装置および方法、並びにプログラム
WO2011121894A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
TWI722842B (zh) 影像預測解碼方法
JP2003309851A (ja) 映像データ変換装置および映像データ変換方法
KR20110008653A (ko) 움직임 벡터 예측 방법과 이를 이용한 영상 부호화/복호화 장치 및 방법
US20060109905A1 (en) Fast block mode determining method for motion estimation, and apparatus thereof
JP2009526436A (ja) ビデオ符号化向けの動き予測の予測子として利用可能な動き情報を再使用する方法及び装置
JP2009530960A (ja) 照明変化補償動き予測符号化および復号化方法とその装置
JP5560009B2 (ja) 動画像符号化装置
US20090028241A1 (en) Device and method of coding moving image and device and method of decoding moving image
JP2012142702A (ja) 画像処理装置および方法、並びにプログラム
JP2004032355A (ja) 動画像符号化方法,動画像復号方法,動画像符号化装置および動画像復号装置
JP2009049519A (ja) 動画像符号化装置の予測動きベクトル生成装置
JP2006100871A (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
JP2007228400A (ja) 動画像変換装置
JP2007251815A (ja) 再符号化装置及び再符号化用プログラム
JP2009055143A (ja) 動画像符号化における動き評価装置,方法およびそのプログラム並びにその記録媒体
JP5067471B2 (ja) 復号化方法、復号化装置、及びプログラム
JP2009206911A (ja) 動画像変換装置
KR20110134404A (ko) 화상 데이터의 블록을 예측하는 방법, 이 방법을 실행하는 복호 장치 및 부호화 장치

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070926

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080627

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101214