JP4507418B2 - Image information conversion apparatus and image information conversion method - Google Patents

Image information conversion apparatus and image information conversion method Download PDF

Info

Publication number
JP4507418B2
JP4507418B2 JP2001039099A JP2001039099A JP4507418B2 JP 4507418 B2 JP4507418 B2 JP 4507418B2 JP 2001039099 A JP2001039099 A JP 2001039099A JP 2001039099 A JP2001039099 A JP 2001039099A JP 4507418 B2 JP4507418 B2 JP 4507418B2
Authority
JP
Japan
Prior art keywords
inter
motion vector
image
information
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001039099A
Other languages
Japanese (ja)
Other versions
JP2002247586A (en
Inventor
数史 佐藤
邦明 高橋
輝彦 鈴木
陽一 矢ケ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001039099A priority Critical patent/JP4507418B2/en
Publication of JP2002247586A publication Critical patent/JP2002247586A/en
Application granted granted Critical
Publication of JP4507418B2 publication Critical patent/JP4507418B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、画像情報変換装置及び画像情報変換方法に関し、特に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報(ビットストリーム)を、衛星放送、ケーブルTV、インターネット等のネットワークを介して受信する際、或いは、光ディスク、磁気ディスク、フラッシュメモリ等の記憶媒体上で処理する際に用いられる画像情報変換装置及び画像情報変換方法に関する。
【0002】
【従来の技術】
近年、画像情報をディジタルデータとして取り扱う際、画像情報特有の冗長性を利用し、効率の高い情報の伝送及び蓄積を目的とした、例えば離散コサイン変換(Discrete Cosine Transform、以下、DCTと記す。)等の直交変換と動き補償により圧縮する方式に準拠した装置が、放送局などの情報配信及び一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG(Moving Picture Experts Group)によって標準化されているMPEG2は、汎用画像符号化方式としてISO/IEC 13818−2に定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅している。そのためMPEG2は、プロフェッショナル用途からコンシューマ用途まで、広範なアプリケーションに今後とも用いられるものと予想される。
【0004】
このようなMPEG2圧縮方式を用いることにより、例えば720×480画素をもつ標準解像度の飛び越し走査画像であれば4〜8Mbpsの符号量(以下、ビットレートと記す。)を、1920×1088画素をもつ高解像度の飛び越し走査画像であれば18〜22Mbpsのビットレートを割り当てることで、高い圧縮率と良好な画質の実現が可能である。
【0005】
MPEG2は、主として放送用に適合する高画質符号化を対象としていたが、MPEG1よりも低いビットレート、つまり、より高い圧縮率の符号化方式には対応していなかった。ところが携帯端末の普及とともに、今後より高い圧縮率の符号化方式のニーズは高まると予想されたことからMPEG4符号化方式の標準化が行われ、画像符号化方式に関しては、1998年12月にISO/IEC 14496−2として国際標準に承認されている。
【0006】
このように、ディジタル放送に対応するように一旦符号化されたMPEG2画像圧縮情報(以下、MPEG2ビットストリームと記す。)を、例えば、携帯端末等で処理するために、さらに低いビットレートのMPEG4画像圧縮情報(以下、MPEG4ビットストリームと記す。)に変換するための画像情報変換装置として、図5に示す装置がField-to-Frame Transcoding with Spatial and Temporal Downsampling (Susie J.wee,John G.Apostolopoulos,and Nick Feamster,ICIP'99)(以下「文献1」という。)に提案されている。
【0007】
図5に示す画像情報変換装置100において、入力端子110に供給された飛び越し走査のMPEG2ビットストリームにおける各フレームのデータは、まず、ピクチャタイプ判別部111に入力する。
【0008】
当該ピクチャタイプ判別部111では、各フレームの入力データがIピクチャ(画像内符号化画像)及びPピクチャ(前方予測符号化画像)に関するものか、又はBピクチャ(両方向予測符号化画像)に関するものであるかを判別し、前者のときのみ、そのI及びPピクチャに関する情報を後続のMPEG2画像情報復号化部(I/Pピクチャ)112に出力する。
【0009】
MPEG2画像情報復号化部112における処理は通常のMPEG2画像情報復号化装置と同様である。ただし、Bピクチャに関するデータはピクチャタイプ判別部111において廃棄されるため、MPEG2画像情報復号化部112における機能としてはI/Pピクチャのみを復号化できればよい。MPEG2画像情報復号化部112の出力となる画素値は、間引き部113に入力される。
【0010】
当該間引き部113は、水平方向については1/2の間引き処理を施し、垂直方向については第一フィールド若しくは第二フィールドのどちらか一方のデータのみを残し、もう一方を廃棄することにより、入力となる画像情報の1/4の大きさをもつ順次走査画像を生成する。間引き部113によって生成された順次走査画像は、一旦、ビデオメモリ114に蓄積された後に読み出され、MPEG4画像情報符号化部(I/P−VOP)115に入力する。
【0011】
ここで、例えば、入力となるMPEG2ビットストリームがNTSC(National Television System Committee)の規格に準拠したもの、つまり720×480画素、30Hzの飛び越し走査画像であった場合、上記間引き後の画枠は360×240画素ということになるが、後続のMPEG2画像情報符号化部115において符号化を行う際、マクロブロック単位の処理を行うには、水平方向、垂直方向ともに、その画素数が16の倍数である必要がある。したがって、このための画素の補填若しくは廃棄を間引き部113において同時に行う。すなわちこのときの間引き部113は、上記画素の補填若しくは廃棄として、例えば水平方向の右端若しくは左端の8ラインを廃棄して352×240画素とする。
【0012】
上記MPEG2画像情報符号化部115では、入力した順次走査画像の信号を符号化してMPEG4ビットストリームを生成し、そのMPEG4画像圧縮情報が出力端子118から後段へ出力される。その際、入力となるMPEG2ビットストリーム内の動きベクトル情報は、動きベクトル合成部116において間引き後の画像情報に対する動きベクトルにマッピングされ、また、動きベクトル検出部117では、動きベクトル合成部116において合成された動きベクトル値を元に高精度の動きベクトルを検出する。なお、MPEG4において、VOP(Video Object Plane)とは、オブジェクトを囲む1つ又は複数のマクロブロックから構成される領域を表し、MPEG2におけるフレームに相当するものである。このVOPの領域は、符号化される方式にしたがって、Iピクチャ、Pピクチャ、及びBピクチャのうちの何れかに分類される。I−VOP(IピクチャのVOP)は、動き補償を行うことなく、画像(領域)そのものが符号化(イントラ符号化)されるものである。P−VOP(PピクチャのVOP)は、基本的には、自身より時間的に前に位置する画像(I又はP−VOP)に基づいて、前方予測符号化される。B−VOP(BピクチャのVOP)は、基本的には、自身より時間的に前と後ろに位置する2つの画像(I又はP−VOP)に基づいて両方向予測符号化されるものである。
【0013】
上述のように、文献1には、入力となるMPEG2ビットストリームの1/2×1/2の大きさをもつ順次走査画像のMPEG4ビットストリームを生成する装置に関する技術が述べられている。すなわち、入力となるMPEG2ビットストリームが例えばNTSCの規格に準拠したものであった場合、出力となるMPEG4画像圧縮情報はSIFサイズ(352×240)ということになるが、上記図5の構成によれば、上記間引き部113における動作の変更を行うことにより、それ以外の画枠、例えば上記の例では約1/4×1/4の画枠であるQSIF(176×112画素)サイズの画像に変換することも可能となっている。
【0014】
また、文献1には、MPEG2画像情報復号化部112における処理として、水平方向、垂直方向それぞれについて、入力となるMPEG2ビットストリーム内の、8次の離散コサイン変換係数すべてを用いた復号処理を行う装置について述べられているが、図5に示した装置に関してはその限りではなく、水平方向のみ、或いは水平方向、垂直方向ともに、8次の離散コサイン変換係数のうちの低域成分のみを用いた復号処理を行い、画質劣化を最小限に抑えながら、復号処理に伴う演算量とビデオメモリ容量を削減することが可能とされている。
【0015】
ところで、図5に示した画像情報変換装置では、MPEG2画像情報符号化部115においてP−VOPの符号化を行う際に、各マクロブロックを、MPEG4に規定されるイントラ(Intra)マクロブロックとして符号化するか、16×16画素のインター(Inter)マクロブロックとして符号化するか、或いは、8×8画素のインター4V(Inter4V)マクロブロックとして符号化するかの符号化モードのタイプ判定を行う必要がある。
【0016】
ここで、モード判定の一般的な手法としては、MPEG-4 Video Verification Model(ISO/IEC JTC1/SC29/WG11 N2932、以下これを文献2とする)において定められた手法を用いることが考えられる。
【0017】
以下、図6を参照しながら、文献2において述べられているモード判定(図5のMPEG2画像情報符号化部115で行われるモード判定)の手法について述べる。
【0018】
まず、ステップS101として、動きベクトル検出により、インター動きベクトル及びインター4V動きベクトルを求める。
【0019】
次に、ステップS102において、インター動きベクトル及びインター4V動きベクトルにより生成される予測画をそれぞれRefInter、 RefInter4Vで表し、原画をOrgで表すとし、さらに、ステップS103において、当該マクロブロックをインターマクロブロック、及びインター4Vマクロブロックとして符号化した場合の予測誤差ERRInter、ERRInter4Vをそれぞれ式(1)及び式(2)によって算出し、また、当該マクロブロックに含まれる画素の平均値をMean_MBとして、当該マクロブロックをイントラマクロブロックとして符号化した場合の予測誤差ERRIntraを、式(3)のように定義する。
ERRInter=SAD(Org−RefInter) (1)
ERRInter4V=SAD(Org−RefInter4V) (2)
ERRIntra=SAD(Org−Mean_MB) (3)
なお、式中のSADは絶対値誤差和(Sum of Absolute Difference)を表す。
【0020】
次に、ステップS104として、上記式(1)及び式(2)で求められた予測誤差ERRInter、ERRInter4Vから、インターマクロブロックとして符号化するのと、インター4Vマクロブロックとして符号化するのと、どちらの符号化効率がよいかの判定を行う。すなわち、式(4)が成立すれば、インターマクロブロックとして符号化した方が符号化効率がよいとし、成立しなければインター4Vマクロブロックとして符号化した方が符号化効率がよいと判定する。
ERRInter−Offset<ERRInter4V (4)
なお、この式(4)において、Offsetはインターマクロブロックを選ばれ易くするためのパラメータで、文献2においては129と定められている。
【0021】
次に、式(4)によってインターマクロブロックが選ばれた場合、パラメータERRを式(5)のように定義し、一方、インター4Vマクロブロックが選ばれた場合、パラメータERRを式(6)のように定義する。
ERR=ERRInter (5)
ERR=ERRInter4V (6)
次にマクロブロックに含まれる餓死の平均値をMean_MBとして、当該マクロブロックをイントラマクロブロックとして符号化した場合の予測誤差ERRIntraを式(7)のように定義する。
ERRIntra=SAD(Org−Mean_MB) (7)
次に、上記パラメータERR及び前記式(3)により定義される予測誤差ERRIntraから、当該マクロブロックをイントラマクロブロックとして符号化するのと、式(4)によって選択されたマクロブロックモードで符号化するのとではどちらが符号化効率が高いかの判定を行う。
【0022】
すなわち式(8)が成立すれば、イントラマクロブロックとして符号化する方が効率がよいとし、成立しなければ式(3)によって選択されたマクロブロックモードで符号化する方が効率がよいとする。
ERRIntra<ERR (8)
つまり、図6のステップS105において、ERRInter<ERRIntraが成立しないときにはステップS108としてイントラマクロブロックモードで符号化する方が効率がよいとし、成立したときにはステップS107としてインターマクロブロックモードで符号化する方が効率がよいとする。また、ステップS106において、ERRInter4V<ERRIntraが成立しないときにはステップS108としてイントラマクロブロックモードで符号化する方が効率がよいとし、成立したときにはステップS109としてインター4Vマクロブロックモードで符号化する方が効率がよいとする。
【0023】
なお、前述の動きベクトル合成部116及び動きベクトル検出部117における動作原理に関しては様々な方法が考えられるが、図5に示した画像情報変換装置2のように、入力端子110に供給されたMPEG2ビットストリームの1/2×1/2の画枠をもつMPEG4ビットストリームを出力する場合には、例えば図7に示すような流れで動きベクトルの合成及び検出を行うことが考えられる。
【0024】
すなわち、動きベクトル合成部116では、まずステップS111として、入力されたMPEG2ビットストリームから動きベクトル情報を抽出し、次に、ステップS112として、当該抽出されたMPEG2画像圧縮情報に対する動きベクトル情報のスケーリング及び時間補正を行うことで、出力となるMPEG4ビットストリームに対するインター4V動きベクトル情報を合成する。さらに、動きベクトル合成部116では、ステップS113として、上記生成されたインター4V動きベクトルの平均値若しくは代表値をインター動きベクトルとする。
【0025】
次に、動きベクトル検出部117では、ステップS114として、動きベクトル合成部116で生成されたインター動きベクトル及びインター4V動きベクトルについて、その周辺の数画素をサーチし、それらインター動きベクトル及びインター4V動きベクトルの高精度化を行う。このようにして高精度化された動きベクトルが前記図6のMPEG4画像情報符号化部115に送られる。
【0026】
【発明が解決しようとする課題】
しかしながら、図6に示したマクロブロックモード判別法では、動き補償及び絶対値誤差和(SAD)の算出を行うため、多くの演算量を必要とする。
【0027】
そこで、本発明は、このような実情に鑑みてなされたものであり、マクロブロックモード判別を少ない演算量で実現可能とする、画像情報変換装置及び画像情報変換方法を提供することを目的とする。
【0028】
【課題を解決するための手段】
本発明は、少なくとも画像内符号化画像と画像間予測符号化画像からなる第1の画像符号化情報を第2の画像符号化情報へと変換する画像情報変換装置において、上記第2の画像符号化情報を構成する複数画像からなる各符号化単位に対応する動きベクトル情報を生成する動きベクトル生成手段と、上記生成された動きベクトル情報を格納する動きベクトル格納手段と、上記第1の画像符号化情報から抽出される動きベクトル情報に基づいて生成された第1の画像間予測符号化モードの符号化単位の動きベクトルと第2の画像間予測符号化モードの符号化単位の動きベクトルとに基づいて、上記第1の画像間予測符号化モードと上記第2の画像間予測符号化モードの何れを使用するかを決定する符号化モード判定を行うモード判定手段とを有し、上記モード判定手段は、上記第1の画像間予測符号化モードの符号化単位の動きベクトルと上記第2の画像間予測符号化モードの符号化単位の動きベクトルとの間のx方向成分の差分絶対値和とy方向成分の差分絶対値和との和として算出される分散値、若しくは上記第1の画像間予測符号化モードの符号化単位の動きベクトルと上記第2の画像間予測符号化モードの符号化単位の動きベクトルとの間のx方向成分の差分絶対値和とy方向成分の差分絶対値和との最大値として算出される分散値を求め、上記分散値と予め設定した閾値との比較に基づいて、当該第2の画像符号化情報を構成する上記符号化単位についての符号化モードを判定することにより上述した課題を解決する。
【0029】
また、本発明は、少なくとも画像内符号化画像と画像間予測符号化画像からなる第1の画像符号化情報を第2の画像符号化情報へと変換する画像情報変換方法において、上記第2の画像符号化情報を構成する複数画像からなる各符号化単位に対応する動きベクトル情報を生成する動きベクトル生成工程と、上記生成された動きベクトル情報を動きベクトル格納手段に格納する動きベクトル格納工程と、上記第1の画像符号化情報から抽出される動きベクトル情報に基づいて生成された第1の画像間予測符号化モードの符号化単位の動きベクトルと第2の画像間予測符号化モードの符号化単位の動きベクトルとに基づいて、上記第1の画像間予測符号化モードと上記第2の画像間予測符号化モードの何れを使用するかを決定する符号化モード判定を行うモード判定工程とを有し、上記モード判定工程では、上記第1の画像間予測符号化モードの符号化単位の動きベクトルと上記第2の画像間予測符号化モードの符号化単位の動きベクトルとの間のx方向成分の差分絶対値和とy方向成分の差分絶対値和との和として算出される分散値、若しくは上記第1の画像間予測符号化モードの符号化単位の動きベクトルと上記第2の画像間予測符号化モードの符号化単位の動きベクトルとの間のx方向成分の差分絶対値和とy方向成分の差分絶対値和との最大値として算出される分散値を求め、上記分散値と予め設定した閾値との比較に基づいて、当該第2の画像符号化情報を構成する上記符号化単位についての符号化モードを判定することにより、上述した課題を解決する。
【0030】
【発明の実施の形態】
本発明の実施の形態として示す画像情報変換装置は、少なくとも画像内符号化画像(Iピクチャ)と画像間予測符号化画像(Bピクチャ)からなるMPEG(Moving Picture Experts Group)によって標準化されたMPEG2画像圧縮情報をMPEG4画像圧縮情報へと変換する画像情報変換装置であって、MPEG2画像圧縮情報から抽出される動きベクトル情報に基づいて生成された第1の画像間予測符号化モードであるインター符号化モードの符号化単位の動きベクトルと第2の画像間予測符号化モードであるインター4V符号化モードの符号化単位の動きベクトルとに基づいて、インター符号化モードとインター4V符号化モードの何れを使用するかを決定する符号化モード判定を行うモード判定手段とを有することによって、マクロブロックモード判別をより少ない演算量で実現可能とするものである。
【0031】
以下、図面を参照し、本発明の実施例について説明する。画像情報変換装置1は、図1に示すように、主に、ピクチャタイプ判別部13と、圧縮情報解析部14と、MPEG2画像情報復号化部(I/Pピクチャ)15と、間引き部16と、ビデオメモリ17と、MPEG4画像情報符号化部(I/P−VOP)18と、動きベクトル合成部19と、動きベクトル検出部20と、Intra/Inter判定部21と、Inter/Inter4V判定部22と、情報バッファ23とを有して構成されている。
【0032】
画像情報変換装置1において、入力端子11に供給された飛び越し走査のMPEG2画像圧縮情報(以下、MPEG2ビットストリームと記す。)は、ピクチャタイプ判別部13に伝送される。
【0033】
ピクチャタイプ判別部13は、ピクチャタイプを判別する。すなわち、入力端子11からのMPEG2ビットストリームに対して、I及びPピクチャに関する情報は出力して圧縮情報解析部14へ送るが、Bピクチャに関する情報については破棄する。これによりフレームレートの変換が行われる。
【0034】
圧縮情報解析部14では、ピクチャタイプ判別部13から送られてきた画像圧縮情報の構文解析を行うことにより、当該MPEG2ビットストリームの符号化に関連する情報を抽出し、その符号化に関連する情報を情報バッファ23へ送り、また、当該MPEG2動きベクトル情報を動きベクトル合成部19へ送り、画像圧縮情報についてはMPEG2画像情報復号化部15へ送る。なお、上記圧縮情報解析部14により抽出される情報の詳細については後述する。
【0035】
MPEG2画像情報復号化部15は、図6に示した装置のものと同等である。Bピクチャに関する情報は前段のピクチャタイプ判別部13において既に破棄されているため、当該MPEG2画像情報復号化部10の機能としては、I及びPピクチャに関する情報のみの復号化処理を行えるものであればよい。MPEG2画像情報復号化部15の出力となる画素値は、間引き部16に入力される。
【0036】
間引き部16は、水平方向について1/2の間引き処理を施し、垂直方向について第一フィールド、若しくは第二フィールドのどちらか一方のデータのみを残し、もう一方を廃棄することにより、入力となる画像情報の1/4の大きさをもつ順次走査画像を生成する。ここで例えば、入力端子11へ供給されたMPEG2ビットストリームがNTSC(National Television System Committee)の規格に準拠したもの、つまり720×480画素、30Hzの飛び越し走査画像であった場合、上記間引き後の画枠は360×240画素ということになる。ただし、後続のMPEG2画像情報符号化部18において符号化を行う際、マクロブロック単位の処理を行うには、水平方向、垂直方向ともに、その画素数が16の倍数である必要がある。したがって、当該間引き部16は、上記間引きと同時に、上記画素数を16の倍数にするための画素の補填若しくは廃棄を同時に行う。すなわち、この例の場合の間引き部16は、例えば上記360×240画素に対して、例えば水平方向の右端若しくは左端の8ラインを廃棄することで、上記16の倍数である352×240画素の画枠を構成する。当該間引き部16によって生成された順次走査画像は、一旦、ビデオメモリ17に蓄積された後、後段のMPEG2画像情報符号化部18、又は後述するIntra/Inter判定部21の要求に応じて読み出される。
【0037】
また、動きベクトル合成部19では、MPEG2ビットストリームから取り出されたMPEG2動きベクトル情報を間引き後の画像情報に対する動きベクトルにマッピングし、さらに次段の動きベクトル検出部20では、動きベクトル合成部19において合成された動きベクトル値と、ビデオメモリ17に記憶された画像情報とに基づいて、高精度の動きベクトルを検出する。この検出された動きベクトルは、MPEG2画像情報符号化部18とIntra/Inter判定部21とに送られる。
【0038】
上記MPEG2画像情報符号化部18では、情報バッファ23に保持された前記MPEG2ビットストリームの符号化に関連する情報と、上記動きベクトル検出部20からの動きベクトル情報と、後述するIntra/Inter判定部21及びInter/Inter4V判定部22での判定処理により得られたInter/Inter4Vのモード情報とを用い、上記ビデオメモリ17から供給された順次走査画像の信号を符号化してMPEG4ビットストリームを生成する。当該MPEG4ビットストリームは、出力端子12から後段へ出力される。
【0039】
情報バッファ23、Intra/Inter判定部21、Inter/Inter4V判定部22における動作について、以下の図2乃至図3を用いて説明する。まず、Iピクチャから変換されるP−VOP以外の通常のP−VOPに対するモード判定の動作原理について、図2のフローチャート及び図3を参照しながら説明する。
【0040】
Intra/Inter判定部21は、情報バッファ23に格納された入力となるMPEG2ビットストリームから上記符号化に関連する情報を抽出し(ステップS1)、抽出された符号化に関する情報に基づいて、最初に、Interのモード判定を行う(ステップS2)。
【0041】
ここで、上記飛び越し走査のMPEG2ビットストリームの約1/2×1/2の画枠をもつ順次走査のMPEG4ビットストリームを出力する場合において、例えば図3に示すように、入力端子11に供給されたMPEG2ビットストリームを構成する画像STR2に含まれる4つのマクロブロックMBMPEG2,i(i=1,2,3,4)が、MPEG4ビットストリームを構成する画像STR4におけるマクロブロックMBMPEG4,1に対応している場合を例にあげて考えることとする。
【0042】
例えば、図3に示すように入力となるMPEG2ビットストリームにおける画像STR2の4つのマクロブロックMBMPEG2,i(i=1,2,3,4)が、出力となるMPEG4ビットストリームにおけるマクロブロックMBMPEG4,iに対応するとき、MBMPEG2,i(i=1,2,3,4)のなかでイントラマクロブロックとして符号化されているマクロブロックの個数をNIntra、インターマクロブロックとして符号化されているマクロブロックの個数をNInterとし、以下に示す式(9)が成立する場合、ステップS2において、このマクロブロックをイントラマクロブロックとして判定して符号化し、ステップS6において、上記出力となるMPEG4ビットストリームを構成する画像STR4のマクロブロックをイントラマクロブロックに決定する。
Intra≧NInter (9)
また、式(9)が成立しないとき、すなわち、イントラマクロブロックとして符号化されているマクロブロックの個数の方がインターマクロブロックとして符号化されているマクロブロックの個数よりも少ないとき、このマクロブロックをインターマクロブロック、若しくはインター4Vマクロブロックとして符号化すると決定しステップS3へ進む。
【0043】
ここでは、前述の式(8)のように、残差を用いたモード判定を行ってもよい。或いは、マクロブロックMBMPEG2,iにそれぞれ対する量子化スケールをQMPEG2,i(i=1,2,3,4)とし、それぞれ割り当てられた符号量(ビット数)をBMPEG2,i(i=1,2,3,4)としたとき、それらマクロブロックMBMPEG2,iに対するコンプレキシティXMPEG2,i(i=1,2,3,4)を、式(10)により計算し、このコンプレキシティを用いて符号化効率がよいと思われるモードを選択するようにしてもよい。
MPEG2,i=QMPEG2,i・BMPEG2,i (10)
【0044】
次に、上記Intra/Inter判定のステップS2において、インターマクロブロック若しくはインター4Vマクロブロックであると判定されたマクロブロックに関しては、動きベクトル検出部15に格納された当該VOPに対するインター動きベクトル及びインター4V動きベクトルを用いてインター/インター4Vを判定する。すなわち、ステップS3において、モード判定部16は、当該マクロブロックのインター動きベクトルのx方向成分、y方向成分をそれぞれmv16×16_x,mv16×16_yとし、インター4V動きベクトルのx方向、y方向成分をそれぞれmv×8_x,i,mv×8_y.i(i=1,2,3,4)として、動きベクトル情報の分散値Distを下記式(12)若しくは式(13)により算出する。
【0045】
【数1】

Figure 0004507418
【0046】
【数2】
Figure 0004507418
【0047】
続いて、ステップS4において、上記式(12)若しくは式(13)で求められた分散値(Distribution:Dist)及び求められた閾値Thに対して、以下の式(14)が成立するとき、ステップS5において、このマクロブロックをインターマクロブロックであるとし、成立しないとき、ステップS7においてインター4Vマクロブロックであると決定する。
Dist≦Th (14)
したがって、画像情報変換装置1は、上述したように、式(1)、式(2)及び式(6)で求めたような絶対値誤差和(SAD)を計算する必要がないため、画質劣化を最小限に抑えながら演算量を大幅に削減することが可能である。
【0048】
続いて、図4に本発明の第2の実施の形態である画像情報変換装置2を示す。画像情報変換装置2は、基本構造を図1に示した画像情報変換装置1と同様とするが、画像情報変換装置1では、動きベクトル検出部20において高精度化されたインター動きベクトル及びインター4V動きベクトルを用いてInter/Inter4Vの判定を行うのに対し、図4に示される画像情報変換装置2では、動きベクトル合成部31において生成されたインター動きベクトル及びインター4V動きベクトルを用いて、Inter/Inter4Vの判定を行う点に特徴を有している。図2に示す画像情報変換装置2では、図1に示した画像情報変換装置1と同様の構成については、同一符号を付してある。
【0049】
図4に示した画像情報変換装置2においては、動きベクトル検出部32において生成されたインター動きベクトル及びインター4V動きベクトルの高精度化を行うのに先立ち、Inter/Inter4V判定部34においてInter/Inter4Vの判定を行うことが可能である。
【0050】
このため、例えば、Inter/Inter4V判定部34において、マクロブロックがInterと判定された場合には、動きベクトル検出部32においてインター動きベクトルに対してのみ高精度化を行い、インター4V動きベクトルを高精度化する必要はない。これにより動きベクトル検出に伴う演算量の削減を実現することが可能となる。
【0051】
なお、以上の説明では、入力としてMPEG2ビットストリームを例にあげ、出力としてMPEG4ビットストリームを対象とした例をあげたが、入力、出力ともこれに限らず、例えばMPEG1やH.263などの画像圧縮情報(ビットストリーム)でもよい。
【0052】
【発明の効果】
以上説明したように、本発明に係る画像情報変換装置は、第2の画像符号化情報を構成する複数画像からなる各符号化単位に対応する動きベクトル情報を生成する動きベクトル生成手段と、生成された動きベクトル情報を格納する動きベクトル格納手段と、第1の画像符号化情報から抽出される動きベクトル情報に基づいて生成された第1の画像間予測符号化モードの符号化単位の動きベクトルと第2の画像間予測符号化モードの符号化単位の動きベクトルとに基づいて、第1の画像間予測符号化モードと第2の画像間予測符号化モードの何れを使用するかを決定する符号化モード判定を行うモード判定手段とを有する。
【0053】
したがって、本発明に係る画像情報変換装置によれば、画質劣化を最小限に抑えながら動きベクトル検出に伴う演算量の大幅な削減を実現することが可能となる。
【0054】
また、本発明に係る画像情報変換方法は、第2の画像符号化情報を構成する複数画像からなる各符号化単位に対応する動きベクトル情報を生成する動きベクトル生成工程と、生成された動きベクトル情報を動きベクトル格納手段に格納する動きベクトル格納工程と、第1の画像符号化情報から抽出される動きベクトル情報に基づいて生成された第1の画像間予測符号化モードの符号化単位の動きベクトルと第2の画像間予測符号化モードの符号化単位の動きベクトルとに基づいて、第1の画像間予測符号化モードと第2の画像間予測符号化モードの何れを使用するかを決定する符号化モード判定を行うモード判定工程とを有する。
【0055】
したがって、本発明に係る画像情報変換方法によれば、画質劣化を最小限に抑えながら動きベクトル検出に伴う演算量の大幅な削減を実現することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態として示す画像情報変換装置の構成を説明する構造図である。
【図2】本発明の実施の形態の一構成例として示す画像情報変換装置の情報バッファ、Intra/Inter判定部、Inter/Inter4V判定部における動作を示すフローチャートである。
【図3】MPEG2ビットストリームを構成する画像STR2に含まれる4つのマクロブロックMBMPEG2,iとMPEG4ビットストリームを構成する画像STR4におけるマクロブロックMBMPEG4,1との対応を説明する説明図である。
【図4】本発明の第2の実施の形態として示す画像情報変換装置の構成を説明する構造図である。
【図5】従来の画像情報変換装置の構成を説明する構造図である。
【図6】従来の画像情報変換装置におけるMPEG2画像情報符号化部でのモード判定の動作を説明するフローチャートである。
【図7】従来の画像情報変換装置における動きベクトル合成部及び動きベクトル検出部における動作を説明するフローチャートである。
【符号の説明】
1,2 画像情報変換装置、11 入力端子、12 出力端子、13 ピクチャタイプ判別部、14 圧縮情報解析部、15 MPEG2画像情報復号化部、16 間引き部、17 ビデオメモリ、18 MPEG4画像情報符号化部、19,31 動きベクトル合成部、20,32 動きベクトル検出部、21,33Intra/Inter判定部、22,34 Inter/Inter4V判定部、23 情報バッファ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image information conversion apparatus and an image information conversion method, and more particularly, to image information (bitstream) compressed by orthogonal transformation such as discrete cosine transformation and motion compensation, for networks such as satellite broadcasting, cable TV, and the Internet. The present invention relates to an image information conversion apparatus and an image information conversion method that are used when receiving via a storage medium or processing on a storage medium such as an optical disk, a magnetic disk, or a flash memory.
[0002]
[Prior art]
In recent years, when image information is handled as digital data, for example, a discrete cosine transform (hereinafter referred to as DCT) is used for the purpose of transmitting and storing information with high efficiency by using redundancy unique to image information. Devices that comply with a method of compressing by orthogonal transformation and motion compensation, etc. are becoming widespread in both information distribution such as broadcasting stations and information reception in general households.
[0003]
In particular, MPEG2 standardized by the Moving Picture Experts Group (MPEG) is defined in ISO / IEC 13818-2 as a general-purpose image encoding method, and both interlaced scanning images and progressive scanning images, as well as standard resolution images and It covers high-definition images. Therefore, MPEG2 is expected to be used in a wide range of applications from professional use to consumer use.
[0004]
By using such an MPEG2 compression method, for example, in the case of a standard resolution interlaced scanned image having 720 × 480 pixels, a code amount of 4 to 8 Mbps (hereinafter referred to as a bit rate) has 1920 × 1088 pixels. In the case of a high-resolution interlaced scanned image, a high compression rate and good image quality can be realized by assigning a bit rate of 18 to 22 Mbps.
[0005]
MPEG2 was mainly intended for high-quality encoding suitable for broadcasting, but did not support a lower bit rate than MPEG1, that is, a higher compression rate encoding method. However, with the widespread use of portable terminals, the need for an encoding method with a higher compression rate is expected to increase in the future, so the standardization of the MPEG4 encoding method has been carried out. As for the image encoding method, ISO / Approved to international standards as IEC 14496-2.
[0006]
In this way, MPEG2 image compression information (hereinafter referred to as MPEG2 bitstream) once encoded so as to correspond to digital broadcasting is processed by, for example, a portable terminal or the like, so that an MPEG4 image with a lower bit rate is used. As an image information conversion device for converting into compressed information (hereinafter referred to as MPEG4 bitstream), the device shown in FIG. 5 is Field-to-Frame Transcoding with Spatial and Temporal Downsampling (Susie J.wee, John G. Apostolopoulos). , and Nick Feamster, ICIP'99) (Hereinafter referred to as “Document 1”) Has been proposed.
[0007]
In the image information conversion apparatus 100 shown in FIG. 5, the data of each frame in the interlaced MPEG2 bit stream supplied to the input terminal 110 is first input to the picture type determination unit 111.
[0008]
In the picture type discriminating unit 111, the input data of each frame relates to an I picture (intra-encoded image) and a P picture (forward predictive encoded image) or a B picture (bidirectional predictive encoded image). Only in the former case, information regarding the I and P pictures is output to the subsequent MPEG2 image information decoding unit (I / P picture) 112.
[0009]
The processing in the MPEG2 image information decoding unit 112 is the same as that of a normal MPEG2 image information decoding device. However, since the data regarding the B picture is discarded in the picture type determination unit 111, the MPEG2 image information decoding unit 112 only needs to be able to decode an I / P picture. The pixel value output from the MPEG2 image information decoding unit 112 is input to the thinning unit 113.
[0010]
The thinning unit 113 performs 1/2 thinning processing in the horizontal direction, leaves only data in either the first field or the second field in the vertical direction, and discards the other to A progressively scanned image having a size of 1/4 of the image information is generated. The progressively scanned image generated by the thinning unit 113 is temporarily stored in the video memory 114 and then read out and input to the MPEG4 image information encoding unit (I / P-VOP) 115.
[0011]
Here, for example, when the input MPEG2 bit stream is based on the NTSC (National Television System Committee) standard, that is, a 720 × 480 pixel, 30 Hz interlaced scanned image, the image frame after the thinning is 360. × 240 pixels, but when performing encoding in the subsequent MPEG2 image information encoding unit 115, in order to perform processing in units of macroblocks, the number of pixels is a multiple of 16 in both the horizontal and vertical directions. There must be. Therefore, the thinning unit 113 simultaneously performs pixel compensation or discarding for this purpose. That is, the thinning unit 113 at this time, for example, discards 8 lines at the right end or the left end in the horizontal direction to make up 352 × 240 pixels as the above-described pixel compensation or discard.
[0012]
The MPEG2 image information encoding unit 115 encodes the input progressively scanned image signal to generate an MPEG4 bit stream, and the MPEG4 image compression information is output from the output terminal 118 to the subsequent stage. At that time, the motion vector information in the input MPEG2 bit stream is mapped to the motion vector for the image information after the thinning by the motion vector synthesizing unit 116, and the motion vector detecting unit 117 synthesizes the motion vector information in the motion vector synthesizing unit 116. A highly accurate motion vector is detected based on the obtained motion vector value. In MPEG4, VOP (Video Object Plane) represents an area composed of one or a plurality of macroblocks surrounding an object, and corresponds to a frame in MPEG2. The VOP area is classified into one of an I picture, a P picture, and a B picture according to the encoding method. An I-VOP (IOP VOP) is an image (region) itself encoded (intra-coded) without performing motion compensation. P-VOP (VOP of P picture) is basically forward-predictive coded based on an image (I or P-VOP) located temporally before itself. A B-VOP (VOP of a B picture) is basically a bi-directional predictive coding based on two images (I or P-VOP) positioned before and after the time.
[0013]
As described above, Document 1 describes a technique related to an apparatus that generates an MPEG4 bit stream of a progressively scanned image having a size of 1/2 × 1/2 of an input MPEG2 bitstream. That is, when the input MPEG2 bit stream conforms to, for example, the NTSC standard, the output MPEG4 image compression information is the SIF size (352 × 240). For example, by changing the operation of the thinning unit 113, an image frame other than that, for example, an image of QSIF (176 × 112 pixels) size, which is an image frame of about 1/4 × 1/4 in the above example, is obtained. It is also possible to convert.
[0014]
Also, in Document 1, as a process in the MPEG2 image information decoding unit 112, a decoding process using all the eighth-order discrete cosine transform coefficients in the input MPEG2 bitstream is performed in each of the horizontal direction and the vertical direction. Although the apparatus is described, the apparatus shown in FIG. 5 is not limited to this, and only the low frequency component of the eighth-order discrete cosine transform coefficient is used only in the horizontal direction or in both the horizontal and vertical directions. It is possible to reduce the amount of calculation and the video memory capacity associated with the decoding process while performing the decoding process and minimizing image quality degradation.
[0015]
In the image information conversion apparatus shown in FIG. 5, when the MPEG-2 image information encoding unit 115 performs P-VOP encoding, each macroblock is encoded as an intra macroblock defined in MPEG4. Encoding mode type determination needs to be performed, whether encoding is performed as a 16 × 16 pixel inter macroblock, or encoding is performed as an 8 × 8 pixel inter 4V macro block. There is.
[0016]
Here, as a general method of mode determination, it is conceivable to use a method defined in MPEG-4 Video Verification Model (ISO / IEC JTC1 / SC29 / WG11 N2932, hereinafter referred to as Document 2).
[0017]
Hereinafter, the method of mode determination (mode determination performed in the MPEG2 image information encoding unit 115 in FIG. 5) described in Document 2 will be described with reference to FIG.
[0018]
First, in step S101, an inter motion vector and an inter 4V motion vector are obtained by motion vector detection.
[0019]
Next, in step S102, the prediction images generated by the inter motion vector and the inter 4V motion vector are respectively referred to as Ref. Inter Ref Inter4V And the original picture is represented by Org. Further, in step S103, the prediction error ERR is encoded when the macroblock is encoded as an inter macroblock and an inter 4V macroblock. Inter , ERR Inter4V Are calculated by Expression (1) and Expression (2), respectively, and the prediction error ERR when the average value of pixels included in the macroblock is Mean_MB and the macroblock is encoded as an intra macroblock is calculated. Intra Is defined as in equation (3).
ERR Inter = SAD (Org-Ref Inter (1)
ERR Inter4V = SAD (Org-Ref Inter4V (2)
ERR Intra = SAD (Org-Mean_MB) (3)
Note that SAD in the equation represents the sum of absolute difference.
[0020]
Next, as step S104, the prediction error ERR calculated by the above equations (1) and (2). Inter , ERR Inter4V Therefore, it is determined which encoding efficiency is better, that is, encoding as an inter macro block or encoding as an inter 4V macro block. That is, if Expression (4) is established, it is determined that the encoding efficiency is better when encoded as an inter macroblock, and if it is not satisfied, it is determined that the encoding efficiency is better when encoded as an inter 4V macroblock.
ERR Inter -Offset <ERR Inter4V (4)
In Equation (4), Offset is a parameter for facilitating selection of an inter macroblock, and is defined as 129 in Document 2.
[0021]
Next, when the inter macroblock is selected according to the equation (4), the parameter ERR is defined as the equation (5), while when the inter 4V macroblock is selected, the parameter ERR is defined as the equation (6). Define as follows.
ERR = ERR Inter (5)
ERR = ERR Inter4V (6)
Next, the prediction error ERR when the average value of starvation included in the macroblock is Mean_MB and the macroblock is encoded as an intra macroblock. Intra Is defined as in equation (7).
ERR Intra = SAD (Org-Mean_MB) (7)
Next, the prediction error ERR defined by the parameter ERR and the equation (3). Intra Therefore, it is determined which of the coding efficiency is higher when the macroblock is coded as an intra macroblock or when the macroblock mode selected according to the equation (4) is coded.
[0022]
That is, if Expression (8) holds, it is more efficient to encode as an intra macroblock, and if not, it is more efficient to encode in the macroblock mode selected by Expression (3). .
ERR Intra <ERR (8)
That is, in step S105 of FIG. Inter <ERR Intra When the above is not established, it is assumed that it is more efficient to encode in the intra macroblock mode as step S108, and when it is established, it is assumed that it is more efficient to encode in the inter macroblock mode as step S107. In step S106, ERR Inter4V <ERR Intra If not, it is assumed that it is more efficient to encode in the intra macroblock mode as step S108, and if it is satisfied, it is assumed that it is more efficient to encode in the inter 4V macroblock mode as step S109.
[0023]
Various methods can be considered for the operation principle in the motion vector synthesizing unit 116 and the motion vector detecting unit 117 described above, but MPEG2 supplied to the input terminal 110 as in the image information converting apparatus 2 shown in FIG. In the case of outputting an MPEG4 bit stream having a 1/2 × 1/2 picture frame of the bit stream, for example, it is conceivable to synthesize and detect motion vectors according to the flow shown in FIG.
[0024]
That is, in step S111, the motion vector synthesis unit 116 first extracts motion vector information from the input MPEG2 bit stream, and then in step S112, scaling of motion vector information with respect to the extracted MPEG2 image compression information and By performing time correction, inter 4V motion vector information for the output MPEG4 bit stream is synthesized. Further, in step S113, the motion vector synthesis unit 116 sets the average value or the representative value of the generated inter 4V motion vector as the inter motion vector.
[0025]
Next, in step S114, the motion vector detection unit 117 searches several pixels around the inter motion vector and inter 4V motion vector generated by the motion vector synthesis unit 116, and the inter motion vector and inter 4V motion. Increase vector accuracy. The motion vector with high accuracy is sent to the MPEG4 image information encoding unit 115 shown in FIG.
[0026]
[Problems to be solved by the invention]
However, the macroblock mode discrimination method shown in FIG. 6 requires a large amount of calculation because motion compensation and absolute value error sum (SAD) calculation are performed.
[0027]
Therefore, the present invention has been made in view of such a situation, and an object thereof is to provide an image information conversion apparatus and an image information conversion method capable of realizing macroblock mode discrimination with a small amount of calculation. .
[0028]
[Means for Solving the Problems]
The present invention provides an image information conversion apparatus for converting first image encoded information including at least an intra-image encoded image and an inter-image predictive encoded image into second image encoded information. Motion vector generating means for generating motion vector information corresponding to each encoding unit consisting of a plurality of images constituting encoding information, motion vector storing means for storing the generated motion vector information, and the first image code A motion vector of a coding unit of the first inter-picture prediction coding mode and a motion vector of a coding unit of the second inter-picture prediction coding mode generated based on the motion vector information extracted from the coding information. Based on the first inter-picture predictive coding mode and the second inter-picture predictive coding mode. The mode determination means includes an x-direction component between a motion vector of a coding unit in the first inter-picture predictive coding mode and a motion vector of a coding unit in the second inter-picture predictive coding mode. The variance value calculated as the sum of the difference absolute value sum and the difference absolute value sum of the y-direction components, or the motion vector of the coding unit in the first inter-picture prediction coding mode and the second inter-picture prediction The variance value calculated as the maximum value of the sum of absolute differences of the x-direction components and the sum of absolute differences of the y-direction components between the motion vectors of the coding units in the coding mode is obtained, and the variance value is preset A coding mode for the coding unit constituting the second image coding information is determined based on the comparison with the threshold value. This solves the problems described above.
[0029]
In addition, the present invention provides an image information conversion method for converting first image encoded information including at least an intra-image encoded image and an inter-image predictive encoded image into second image encoded information. A motion vector generation step for generating motion vector information corresponding to each encoding unit comprising a plurality of images constituting the image encoding information, and a motion vector storage step for storing the generated motion vector information in a motion vector storage means; The motion vector of the coding unit of the first inter-picture prediction coding mode and the code of the second inter-picture prediction coding mode generated based on the motion vector information extracted from the first picture coding information A coding mode decision which determines which of the first inter-picture prediction coding mode and the second inter-picture prediction coding mode is used based on the motion vector of the coding unit. Yes and a mode determination step of performing In the mode determination step, an x-direction component between the motion vector of the coding unit in the first inter-picture prediction coding mode and the motion vector of the coding unit in the second inter-picture prediction coding mode The variance value calculated as the sum of the difference absolute value sum and the difference absolute value sum of the y-direction components, or the motion vector of the coding unit in the first inter-picture prediction coding mode and the second inter-picture prediction The variance value calculated as the maximum value of the difference absolute value sum of the x direction component and the sum of absolute difference values of the y direction component between the motion vector of the coding unit in the coding mode is obtained, and the variance value is set in advance A coding mode for the coding unit constituting the second image coding information is determined based on the comparison with the threshold value. This solves the above-described problem.
[0030]
DETAILED DESCRIPTION OF THE INVENTION
An image information conversion apparatus shown as an embodiment of the present invention is an MPEG2 image standardized by a Moving Picture Experts Group (MPEG) composed of at least an intra-picture coded picture (I picture) and an inter-picture predictive coded picture (B picture). An image information conversion apparatus for converting compressed information into MPEG4 image compression information, which is a first inter-picture predictive coding mode generated based on motion vector information extracted from MPEG2 image compression information Based on the motion vector of the coding unit of the mode and the motion vector of the coding unit of the inter 4V coding mode which is the second inter-picture predictive coding mode, either the inter coding mode or the inter 4V coding mode is selected. A macroblock having mode determining means for determining a coding mode for determining whether to use the macroblock The mode discrimination can be realized with a smaller calculation amount.
[0031]
Embodiments of the present invention will be described below with reference to the drawings. As shown in FIG. 1, the image information conversion apparatus 1 mainly includes a picture type determination unit 13, a compression information analysis unit 14, an MPEG2 image information decoding unit (I / P picture) 15, and a thinning unit 16. , Video memory 17, MPEG4 image information encoding unit (I / P-VOP) 18, motion vector synthesis unit 19, motion vector detection unit 20, Intra / Inter determination unit 21, and Inter / Inter4V determination unit 22. And an information buffer 23.
[0032]
In the image information conversion apparatus 1, MPEG2 image compression information (hereinafter referred to as MPEG2 bitstream) for interlace scanning supplied to the input terminal 11 is transmitted to the picture type determination unit 13.
[0033]
The picture type determination unit 13 determines the picture type. That is, for the MPEG2 bit stream from the input terminal 11, information regarding I and P pictures is output and sent to the compression information analysis unit 14, but information regarding B pictures is discarded. As a result, the frame rate is converted.
[0034]
The compression information analysis unit 14 extracts information related to the encoding of the MPEG2 bitstream by performing syntax analysis of the image compression information sent from the picture type determination unit 13, and information related to the encoding Is sent to the information buffer 23, the MPEG2 motion vector information is sent to the motion vector synthesis unit 19, and the compressed image information is sent to the MPEG2 image information decoding unit 15. Details of the information extracted by the compressed information analysis unit 14 will be described later.
[0035]
The MPEG2 image information decoding unit 15 is equivalent to that of the apparatus shown in FIG. Since the information about the B picture has already been discarded by the picture type determination unit 13 in the previous stage, the function of the MPEG2 image information decoding unit 10 can be any function that can decode only the information about the I and P pictures. Good. The pixel value that is output from the MPEG2 image information decoding unit 15 is input to the thinning unit 16.
[0036]
The thinning unit 16 performs a half thinning process in the horizontal direction, leaves only the data in either the first field or the second field in the vertical direction, and discards the other image to input an image. A progressively scanned image having a quarter of the information is generated. Here, for example, when the MPEG2 bit stream supplied to the input terminal 11 conforms to the NTSC (National Television System Committee) standard, that is, a 720 × 480 pixel, 30 Hz interlaced scanned image, the image after the thinning is performed. The frame is 360 × 240 pixels. However, when encoding is performed in the subsequent MPEG2 image information encoding unit 18, the number of pixels needs to be a multiple of 16 in both the horizontal direction and the vertical direction in order to perform processing in units of macroblocks. Therefore, the thinning unit 16 simultaneously performs pixel compensation or discarding for making the number of pixels a multiple of 16, simultaneously with the thinning. That is, in this example, the thinning unit 16 discards, for example, 8 lines at the right end or left end in the horizontal direction with respect to the 360 × 240 pixels, for example, so that an image of 352 × 240 pixels that is a multiple of 16 Configure the frame. The progressively scanned image generated by the thinning unit 16 is temporarily stored in the video memory 17 and then read in response to a request from the subsequent MPEG2 image information encoding unit 18 or an intra / inter determination unit 21 described later. .
[0037]
Further, the motion vector synthesis unit 19 maps the MPEG2 motion vector information extracted from the MPEG2 bit stream to a motion vector for the image information after the thinning, and the motion vector detection unit 20 in the next stage further maps the motion vector information in the motion vector synthesis unit 19. Based on the synthesized motion vector value and the image information stored in the video memory 17, a highly accurate motion vector is detected. The detected motion vector is sent to the MPEG2 image information encoding unit 18 and the Intra / Inter determination unit 21.
[0038]
In the MPEG2 image information encoding unit 18, information related to encoding of the MPEG2 bitstream held in the information buffer 23, motion vector information from the motion vector detection unit 20, and an Intra / Inter determination unit to be described later 21 and the Inter / Inter4V mode information obtained by the determination process in the Inter / Inter4V determination unit 22, the signal of the sequentially scanned image supplied from the video memory 17 is encoded to generate an MPEG4 bit stream. The MPEG4 bit stream is output from the output terminal 12 to the subsequent stage.
[0039]
Operations in the information buffer 23, the Intra / Inter determination unit 21, and the Inter / Inter4V determination unit 22 will be described with reference to FIGS. First, the operation principle of mode determination for a normal P-VOP other than a P-VOP converted from an I picture will be described with reference to the flowchart of FIG. 2 and FIG.
[0040]
The Intra / Inter determination unit 21 extracts information related to the encoding from the MPEG2 bit stream serving as an input stored in the information buffer 23 (step S1), and first, based on the extracted information related to encoding. Inter mode determination is performed (step S2).
[0041]
Here, when outputting an MPEG4 bit stream of progressive scanning having an image frame of about 1/2 × 1/2 of the MPEG2 bit stream of interlace scanning, for example, as shown in FIG. 3, it is supplied to the input terminal 11. 4 macroblocks MB included in the image STR2 constituting the MPEG2 bit stream MPEG2, i (I = 1, 2, 3, 4) is the macroblock MB in the image STR4 constituting the MPEG4 bit stream MPEG4,1 Let's consider the case where
[0042]
For example, as shown in FIG. 3, four macroblocks MB of the image STR2 in the input MPEG2 bit stream MPEG2, i (I = 1, 2, 3, 4) is a macroblock MB in the output MPEG4 bit stream MPEG4, i When corresponding to MB MPEG2, i The number of macroblocks encoded as intra macroblocks in (i = 1, 2, 3, 4) is N Intra , The number of macroblocks encoded as inter macroblocks is N Inter If the following equation (9) holds, the macro block is determined as an intra macro block in step S2 and encoded. In step S6, the macro of the image STR4 constituting the MPEG4 bit stream to be output is output. The block is determined to be an intra macroblock.
N Intra ≧ N Inter (9)
When Equation (9) does not hold, that is, when the number of macroblocks encoded as intra macroblocks is smaller than the number of macroblocks encoded as inter macroblocks, this macroblock Is determined to be encoded as an inter macro block or an inter 4V macro block, and the process proceeds to step S3.
[0043]
Here, mode determination using the residual may be performed as in the above-described equation (8). Or macroblock MB MPEG2, i The quantization scale for each MPEG2, i (I = 1, 2, 3, 4), and the assigned code amount (number of bits) is B MPEG2, i (I = 1, 2, 3, 4), the macroblock MB MPEG2, i Complexity X against MPEG2, i (I = 1, 2, 3, 4) may be calculated by the equation (10), and a mode that seems to have good coding efficiency may be selected using this complexity.
X MPEG2, i = Q MPEG2, i ・ B MPEG2, i (10)
[0044]
Next, with respect to the macro block determined to be an inter macro block or an inter 4V macro block in step S2 of the intra / inter determination, the inter motion vector and inter 4V for the VOP stored in the motion vector detecting unit 15 are used. Inter / inter 4V is determined using the motion vector. That is, in step S3, the mode determination unit 16 sets the x direction component and the y direction component of the inter motion vector of the macroblock to mv. 16 × 16_x , Mv 16 × 16_y And the x direction and y direction components of the inter 4V motion vector are mv 8 × 8_x, i , Mv 8 × 8_y. i As (i = 1, 2, 3, 4), the variance value Dist of the motion vector information is calculated by the following formula (12) or formula (13).
[0045]
[Expression 1]
Figure 0004507418
[0046]
[Expression 2]
Figure 0004507418
[0047]
Subsequently, in step S4, when the following expression (14) is established for the dispersion value (Distribution: Dist) obtained by the above expression (12) or expression (13) and the obtained threshold value Th, step In S5, it is determined that this macro block is an inter macro block, and when it is not established, it is determined in step S7 that it is an inter 4V macro block.
Dist ≦ Th (14)
Accordingly, as described above, the image information conversion apparatus 1 does not need to calculate the absolute value error sum (SAD) as calculated by the equations (1), (2), and (6), and therefore the image quality deterioration It is possible to greatly reduce the amount of calculation while minimizing the above.
[0048]
Next, FIG. 4 shows an image information conversion apparatus 2 according to the second embodiment of the present invention. The image information conversion apparatus 2 has the same basic structure as that of the image information conversion apparatus 1 shown in FIG. While the Inter / Inter4V determination is performed using the motion vector, the image information conversion apparatus 2 illustrated in FIG. 4 uses the inter motion vector and the inter 4V motion vector generated by the motion vector synthesis unit 31 to perform the Inter / Inter4V determination. / Inter4V is characterized in that it is determined. In the image information conversion apparatus 2 shown in FIG. 2, the same components as those of the image information conversion apparatus 1 shown in FIG.
[0049]
In the image information conversion apparatus 2 shown in FIG. 4, the Inter / Inter4V determination unit 34 performs Inter / Inter4V determination prior to increasing the accuracy of the inter motion vector and the inter 4V motion vector generated by the motion vector detection unit 32. It is possible to make a determination.
[0050]
For this reason, for example, when the Inter / Inter4V determination unit 34 determines that the macroblock is Inter, the motion vector detection unit 32 performs high accuracy only on the inter motion vector, and increases the inter 4V motion vector. There is no need to be precise. As a result, it is possible to reduce the amount of calculation associated with motion vector detection.
[0051]
In the above description, an MPEG2 bit stream is taken as an example of input and an MPEG4 bit stream is taken as an output, but the input and output are not limited to this. It may be image compression information (bitstream) such as H.263.
[0052]
【The invention's effect】
As described above, the image information conversion apparatus according to the present invention includes a motion vector generation unit that generates motion vector information corresponding to each encoding unit including a plurality of images constituting the second image encoding information, A motion vector storage means for storing the motion vector information, and a motion vector in a coding unit of the first inter-picture predictive coding mode generated based on the motion vector information extracted from the first picture coding information And whether to use the first inter-picture prediction coding mode or the second inter-picture prediction coding mode is determined based on the motion vector of the coding unit in the second inter-picture prediction coding mode. Mode determining means for performing encoding mode determination.
[0053]
Therefore, according to the image information conversion apparatus of the present invention, it is possible to achieve a significant reduction in the amount of calculation associated with motion vector detection while minimizing image quality degradation.
[0054]
In addition, the image information conversion method according to the present invention includes a motion vector generation step of generating motion vector information corresponding to each encoding unit composed of a plurality of images constituting the second image encoding information, and the generated motion vector A motion vector storage step of storing information in the motion vector storage means, and a motion of the coding unit of the first inter-picture predictive coding mode generated based on the motion vector information extracted from the first picture coding information Determining whether to use the first inter-picture predictive coding mode or the second inter-picture predictive coding mode based on the vector and the motion vector of the coding unit of the second inter-picture predictive coding mode And a mode determination step for performing encoding mode determination.
[0055]
Therefore, according to the image information conversion method according to the present invention, it is possible to achieve a significant reduction in the amount of calculation associated with motion vector detection while minimizing image quality degradation.
[Brief description of the drawings]
FIG. 1 is a structural diagram illustrating a configuration of an image information conversion apparatus shown as an embodiment of the present invention.
FIG. 2 is a flowchart illustrating operations in an information buffer, an Intra / Inter determination unit, and an Inter / Inter4V determination unit of the image information conversion apparatus shown as one configuration example of the embodiment of the present invention.
FIG. 3 shows four macro blocks MB included in an image STR2 constituting an MPEG2 bit stream. MPEG2, i And the macroblock MB in the image STR4 constituting the MPEG4 bitstream MPEG4,1 It is explanatory drawing explaining a response | compatibility.
FIG. 4 is a structural diagram illustrating a configuration of an image information conversion apparatus shown as a second embodiment of the present invention.
FIG. 5 is a structural diagram illustrating a configuration of a conventional image information conversion apparatus.
FIG. 6 is a flowchart illustrating an operation of mode determination in an MPEG2 image information encoding unit in a conventional image information conversion apparatus.
FIG. 7 is a flowchart illustrating operations in a motion vector synthesis unit and a motion vector detection unit in a conventional image information conversion apparatus.
[Explanation of symbols]
1, 2 Image information conversion device, 11 input terminal, 12 output terminal, 13 picture type discrimination unit, 14 compression information analysis unit, 15 MPEG2 image information decoding unit, 16 decimation unit, 17 video memory, 18 MPEG4 image information encoding , 19, 31 motion vector synthesis unit, 20, 32 motion vector detection unit, 21, 33 Intra / Inter determination unit, 22, 34 Inter / Inter4V determination unit, 23 information buffer

Claims (4)

少なくとも画像内符号化画像と画像間予測符号化画像からなる第1の画像符号化情報を第2の画像符号化情報へと変換する画像情報変換装置において、
上記第2の画像符号化情報を構成する複数画像からなる各符号化単位に対応する動きベクトル情報を生成する動きベクトル生成手段と、
上記生成された動きベクトル情報を格納する動きベクトル格納手段と、
上記第1の画像符号化情報から抽出される動きベクトル情報に基づいて生成された第1の画像間予測符号化モードの符号化単位の動きベクトルと第2の画像間予測符号化モードの符号化単位の動きベクトルとに基づいて、上記第1の画像間予測符号化モードと上記第2の画像間予測符号化モードの何れを使用するかを決定する符号化モード判定を行うモード判定手段とを有し、
上記モード判定手段は、上記第1の画像間予測符号化モードの符号化単位の動きベクトルと上記第2の画像間予測符号化モードの符号化単位の動きベクトルとの間のx方向成分の差分絶対値和とy方向成分の差分絶対値和との和として算出される分散値、若しくは上記第1の画像間予測符号化モードの符号化単位の動きベクトルと上記第2の画像間予測符号化モードの符号化単位の動きベクトルとの間のx方向成分の差分絶対値和とy方向成分の差分絶対値和との最大値として算出される分散値を求め、上記分散値と予め設定した閾値との比較に基づいて、当該第2の画像符号化情報を構成する上記符号化単位についての符号化モードを判定する
画像情報変換装置。
In an image information conversion apparatus that converts first image encoded information including at least an intra-image encoded image and an inter-image predictive encoded image into second image encoded information,
Motion vector generating means for generating motion vector information corresponding to each encoding unit comprising a plurality of images constituting the second image encoding information;
Motion vector storage means for storing the generated motion vector information;
A motion vector of a coding unit in the first inter-picture prediction coding mode generated based on motion vector information extracted from the first picture coding information and a coding in the second inter-picture prediction coding mode Mode determination means for performing a coding mode determination for determining which of the first inter-picture prediction coding mode and the second inter-picture prediction coding mode to be used based on a unit motion vector; Yes, and
The mode determination means includes an x-direction component difference between a motion vector of a coding unit in the first inter-picture prediction coding mode and a motion vector of a coding unit in the second inter-picture prediction coding mode. The variance value calculated as the sum of the sum of absolute values and the sum of absolute differences of y-direction components, or the motion vector of the coding unit in the first inter-picture predictive coding mode and the second inter-picture predictive coding A variance value calculated as the maximum value of the sum of absolute differences of the x-direction components and the sum of absolute differences of the y-direction components between the motion vectors of the mode encoding units is obtained, and the variance value and a preset threshold value are obtained. An image information conversion apparatus that determines an encoding mode for the encoding unit that constitutes the second image encoding information based on the comparison with .
上記モード判定手段は、上記分散値が上記閾値以下である条件が成り立つならば、上記第2の画像符号化情報を構成する上記符号化単位の符号化モードを第1の画像間予測符号化モードと判定し、上記分散値が上記閾値よりも大きい条件が成り立つならば、上記第2の画像符号化情報を構成する上記符号化単位の符号化モードを第2の画像間予測符号化モードと判定す請求項記載の画像情報変換装置。If the condition that the variance value is equal to or less than the threshold value is satisfied, the mode determination means sets the encoding mode of the encoding unit constituting the second image encoding information to the first inter-picture prediction encoding mode. If the condition that the variance value is larger than the threshold value is satisfied, the coding mode of the coding unit constituting the second image coding information is determined as the second inter-picture prediction coding mode. picture information converting apparatus according to claim 1, wherein you. 少なくとも画像内符号化画像と画像間予測符号化画像からなる第1の画像符号化情報を第2の画像符号化情報へと変換する画像情報変換方法において、
上記第2の画像符号化情報を構成する複数画像からなる各符号化単位に対応する動きベクトル情報を生成する動きベクトル生成工程と、
上記生成された動きベクトル情報を動きベクトル格納手段に格納する動きベクトル格納工程と、
上記第1の画像符号化情報から抽出される動きベクトル情報に基づいて生成された第1の画像間予測符号化モードの符号化単位の動きベクトルと第2の画像間予測符号化モードの符号化単位の動きベクトルとに基づいて、上記第1の画像間予測符号化モードと上記第2の画像間予測符号化モードの何れを使用するかを決定する符号化モード判定を行うモード判定工程とを有し、
上記モード判定工程では、上記第1の画像間予測符号化モードの符号化単位の動きベクトルと上記第2の画像間予測符号化モードの符号化単位の動きベクトルとの間のx方向成分の差分絶対値和とy方向成分の差分絶対値和との和として算出される分散値、若しくは上記第1の画像間予測符号化モードの符号化単位の動きベクトルと上記第2の画像間予測符号化モードの符号化単位の動きベクトルとの間のx方向成分の差分絶対値和とy方向成分の差分絶対値和との最大値として算出される分散値を求め、上記分散値と予め設定した閾値との比較に基づいて、当該第2の画像符号化情報を構成する上記符号化単位についての符号化モードを判定する
画像情報変換方法。
In an image information conversion method for converting first image encoded information including at least an intra-image encoded image and an inter-image prediction encoded image into second image encoded information,
A motion vector generation step of generating motion vector information corresponding to each encoding unit consisting of a plurality of images constituting the second image encoding information;
A motion vector storage step of storing the generated motion vector information in a motion vector storage means;
A motion vector of a coding unit in the first inter-picture prediction coding mode generated based on motion vector information extracted from the first picture coding information and a coding in the second inter-picture prediction coding mode A mode determination step for performing a coding mode determination for determining which of the first inter-picture predictive coding mode and the second inter-picture predictive coding mode to be used based on a unit motion vector; Yes, and
In the mode determination step, the difference in the x-direction component between the motion vector of the coding unit in the first inter-picture prediction coding mode and the motion vector of the coding unit in the second inter-picture prediction coding mode The variance value calculated as the sum of the sum of absolute values and the sum of absolute differences of y-direction components, or the motion vector of the coding unit in the first inter-picture predictive coding mode and the second inter-picture predictive coding A variance value calculated as the maximum value of the sum of absolute differences of the x-direction components and the sum of absolute differences of the y-direction components between the motion vectors of the mode encoding units is obtained, and the variance value and a preset threshold value are obtained. An image information conversion method for determining an encoding mode for the encoding unit constituting the second image encoding information based on the comparison with .
上記モード判定工程では、上記分散値が上記閾値以下である条件が成り立つならば、上記第2の画像符号化情報を構成する上記符号化単位の符号化モードを第1の画像間予測符号化モードと判定し、上記分散値が上記閾値よりも大きい条件が成り立つならば、上記第2の画像符号化情報を構成する上記符号化単位の符号化モードを第2の画像間予測符号化モードと判定す請求項記載の画像情報変換方法。In the mode determination step, if the condition that the variance value is equal to or less than the threshold value is satisfied, the encoding mode of the encoding unit constituting the second image encoding information is changed to the first inter-picture prediction encoding mode. If the condition that the variance value is larger than the threshold value is satisfied, the coding mode of the coding unit constituting the second image coding information is determined as the second inter-picture prediction coding mode. picture information converting method according to claim 3, wherein you.
JP2001039099A 2001-02-15 2001-02-15 Image information conversion apparatus and image information conversion method Expired - Fee Related JP4507418B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001039099A JP4507418B2 (en) 2001-02-15 2001-02-15 Image information conversion apparatus and image information conversion method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001039099A JP4507418B2 (en) 2001-02-15 2001-02-15 Image information conversion apparatus and image information conversion method

Publications (2)

Publication Number Publication Date
JP2002247586A JP2002247586A (en) 2002-08-30
JP4507418B2 true JP4507418B2 (en) 2010-07-21

Family

ID=18901962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001039099A Expired - Fee Related JP4507418B2 (en) 2001-02-15 2001-02-15 Image information conversion apparatus and image information conversion method

Country Status (1)

Country Link
JP (1) JP4507418B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10136375A (en) * 1996-10-30 1998-05-22 Hitachi Ltd Motion compensation method for moving image

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10136375A (en) * 1996-10-30 1998-05-22 Hitachi Ltd Motion compensation method for moving image

Also Published As

Publication number Publication date
JP2002247586A (en) 2002-08-30

Similar Documents

Publication Publication Date Title
JP4517495B2 (en) Image information conversion apparatus, image information conversion method, encoding apparatus, and encoding method
Xin et al. Digital video transcoding
EP1618744B1 (en) Video transcoding
US9197903B2 (en) Method and system for determining a macroblock partition for data transcoding
JP4682410B2 (en) Image processing apparatus and image processing method
US20020001343A1 (en) Method and apparatus for transcoding a digitally compressed high definition television bitstream to a standard definition television bitstream
JP2005260912A (en) Video image communication device and method
JP2002152759A (en) Image information converter and image information conversion method
JP5560009B2 (en) Video encoding device
JP4622077B2 (en) Image processing apparatus and image processing method
JP2002152752A (en) Image information converter and method
Lei et al. H. 263 video transcoding for spatial resolution downscaling
JP4517453B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP2002125227A (en) Image information converter and image information converting method
JP4517475B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP4507418B2 (en) Image information conversion apparatus and image information conversion method
JP4608801B2 (en) Image information conversion apparatus and method
JP4505992B2 (en) Image information conversion apparatus and method
JP4517465B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP4517468B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP4779207B2 (en) Motion vector conversion apparatus and motion vector conversion method
US7072402B2 (en) Methods and apparatus for dynamically adjusting f-codes for a digital picture header
JP6735370B2 (en) Decryption method
US20020034247A1 (en) Picture information conversion method and apparatus
JP6647432B2 (en) Decryption method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100413

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100426

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees