JP4682410B2 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP4682410B2
JP4682410B2 JP2000312309A JP2000312309A JP4682410B2 JP 4682410 B2 JP4682410 B2 JP 4682410B2 JP 2000312309 A JP2000312309 A JP 2000312309A JP 2000312309 A JP2000312309 A JP 2000312309A JP 4682410 B2 JP4682410 B2 JP 4682410B2
Authority
JP
Japan
Prior art keywords
motion vector
picture
discarded
discarding
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000312309A
Other languages
English (en)
Other versions
JP2002125236A (ja
Inventor
邦明 高橋
数史 佐藤
輝彦 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000312309A priority Critical patent/JP4682410B2/ja
Priority to US09/973,749 priority patent/US6826231B2/en
Publication of JP2002125236A publication Critical patent/JP2002125236A/ja
Priority to US10/947,197 priority patent/US7224732B2/en
Application granted granted Critical
Publication of JP4682410B2 publication Critical patent/JP4682410B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

【0001】
【発明の属する技術分野】
本発明は、例えば離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報を示すビットストリームを、衛星放送、ケーブルTV、インターネットなどのネットワークメディアを介して受信する際に、若しくは光、磁気ディスク、フラッシュメモリのような記憶メディア上で処理する際に用いられる画像処理装置及び画像処理法に関するものである。
【0002】
【従来の技術】
近年、画像情報をデジタルデータとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG2(ISO/IEC 13818−2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準方式で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに今後とも用いられるものと予想される。MPEG2の圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像や、4〜8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば、18〜22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。
【0004】
MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われる。これに対応して、MPEG4符号化方式の標準化が行われた。MPEG4の画像符号化方式に関しては、1998年12月にISO/IEC 14496−2としてその規格が国際標準として承認された。
【0005】
ところで、ディジタル放送用に一度符号化されたMPEG2の画像圧縮情報を示すビットストリームを、携帯端末上等で処理するのにより適した、より低い符号量(ビットレート)のMPEG4の画像圧縮情報を示すビットストリームに変換したいというニーズがある。
【0006】
かかる目的を達成する画像情報変換装置の従来例を図1に示し、以下これについて説明する。この図1の画像情報変換装置は、入力されたMPEG2の画像圧縮情報を示すビットストリームを、MPEG4の画像圧縮情報を示すビットストリームへ変換する装置である。すなわち、入力されたMPEG2の画像圧縮情報を示すビットストリームは、MPEG2の画像復号化装置1により復元される。復元された画像信号は、解像度・フレームレート変換装置2へ伝送され、任意の異なる解像度及びフレームレートを持つ画像信号に変換される。変換された画像信号は、MPEG4の画像符号化装置3に入力され、MPEG4の画像情報符号化装置3によりMPEG4の画像圧縮情報を示すビットストリームに符号化されて出力される。
【0007】
従来の画像情報変換装置では図1に示したように、MPEG2の復号化方式により復元された画像信号を、MPEG4の画像符号化装置により符号化し、MPEG4の画像圧縮情報を示すビットストリームを出力する。MPEG2の画像情報復号化装置1においては、水平及び垂直方向成分ともに、入力となるMPEG2の画像圧縮情報を示すビットストリームの8次のDCT(離散コサイン変換)係数すべてを用いた復号処理を行うことが考えられる。しかし、垂直方向には8次の係数すべてを用いるもの、水平方向には8次係数のうち低域4成分のみを用いた復号処理(以下これを4×8ダウンデコードと呼ぶ)、若しくは、水平、垂直方向ともに水平方向には8次係数のうち低域4成分のみを用いた復号処理(以下これを4×4ダウンデコードと呼ぶ)を行うことで、画質劣化を最小限に抑えながら、演算量とビデオメモリ容量を削減し、更に後段のダウンサンプリング処理を簡略化する構成も考えられる。
【0008】
このような従来方法では、MPEG4の画像符号化装置において、入力された画像信号を符号化する際、動きベクトルを検出する演算処理量は、全演算処理量の約60〜70パーセントを占める。そのため、画像のリアルタイムでの処理が困難となり、時間遅延が発生する、装置が大規模になってしまう等の問題点を生じる。
【0009】
かかる問題を解決する手段として、筆者らは先に、図2に示した画像情報変換装置(本願出願時未公知)(先行例)を提案した。
【0010】
ところで、図3は、MPEG2の画像圧縮情報を示すビットストリーム中の動きベクトルと、MPEG4の画像圧縮情報を示すビットストリーム中の動きベクトルの相関を示す図である。図3A、Bは、解像度変換前及び後の現フレームの画像をそれぞれ示す。画像の解像度が変換される際、変換後の前フレームでの位置から現フレームでの位置への動きベクトルの水平成分は、解像度変換前の動きベクトルの水平成分と、画像の横方向の解像度変換レートによって求めることができる。解像度変換後の垂直成分は、解像度変換前の動きベクトルの垂直成分と、画像の縦方向の解像度変換レートによって求められる。すなわち、解像度変換前の動きベクトルと、変換後の動きベクトルと大きな相関を持つ。その相関を利用し、解像度変換前の動きベクトルから変換後の動きベクトルを求めることができる。
【0011】
すなわち、図2の画像情報変換装置では、入力されたMPEG2の画像圧縮情報を示すビットストリームを、MPEG2のマクロブロックの動きベクトルやマクロブロックタイプ等のパラメータを利用して、MPEG4の動きベクトルへ簡潔に変換する。MPEG4の画像情報符号化装置7内では、動きベクトルの検出を行わず、変換された動きベクトルを用いた画像符号化を行う。結果として、MPEG4の画像符号化装置内での動き検出を行わないため、処理量が大幅に減らされる。
【0012】
このようにMPEG2の動きベクトルから、MPEG4の動きベクトルへの変換を行うこと、また動きベクトル以外にも、MPEG2での復号に用いたパラメータ、若しくは変換した後のパラメータを採用することにより、MPEG4の画像情報符号化装置7の処理量が減らされるので、この装置7による信号の時間遅延を少なくすることができる。
【0013】
図3において、入力されたMPEG2の画像圧縮情報を示すビットストリームは、図2のMPEG2の画像情報復号化装置4において、復号化処理が施されて、MPEG4の画像圧縮情報を示すビットストリームが出力される。MPEG2の画像情報復号化装置4においては、水平及び垂直方向成分ともに、入力となるMPEG2の画像圧縮情報を示すビットストリームの8次のDCT係数すべてを用いた復号処理を行うことが考えられるが、4×8ダウンデコード、若しくは4×4ダウンデコードを行うことで、画質劣化を最小限に抑えながら、演算量とビデオメモリ容量を削減し、更に後段のダウンサンプリング処理を簡略化する構成も考えられる。復号化装置4より出力された画像信号が、解像度フレームレート変換装置5へ送られ、解像度・フレームレート変換を行った後、外部から入力された画像サイズ調整フラグにより、MPEG4の画像符号化に適した解像度を持つ画像信号が出力される。
【0014】
ここで、解像度フレームレート変換装置5では、まず、MPEG2の画像復号化装置4より入力された画像信号を、解像度フレーム変換器によって解像度変換を行う。ここでは、縦・横とも解像度を1/2にする場合を例に挙げる。図4に示しているように、縦方向のダウンサンプリングは、入力された飛び越し走査画像の第一フィールド、若しくはを第二フィールドを抽出し、順次走査画像に変換する。横方向は、ダウンサンプリングフィルタを用いて、1/2の解像度に変換する。また、低ビットレートを実現するために、解像度の変換による圧縮だけではなく、I/Pピクチャのみ第一フィールド若しくは第二フィールドを抜き出し、時間方向においてフレームレートを落とす。たとえば、図4に示したMPEG2のIBBPの画像は解像度・フレーム変換後、IPの第一フィールドの構成になる。解像度・フレーム変換を行った画像は、MPEG4の画像符号化方式により符号化できるように、縦、横の画素数がともに16の倍数にする。そのため、外部から入力される画像サイズ調整フラグにより、画素の補填あるいは画素の除去回路によって、画素の補填あるいは画素の除去を行う。
【0015】
画像サイズ調整フラグは、解像度フレームレート変換装置5の外部から入力され、画像の縦・横の画素数が16の倍数でない場合に対し、画像への画素補填若しくは、除去を判別するためのフラグである。
【0016】
図5を参照して、画像サイズ調整フラグによる画像への処理を説明する。MPEG2の画像復号化装置4より出力された画像の解像度がm画素×n画素であるとすると、m、nは共に16の倍数であるが、縦、横ともに1/2にダウンサンプリングされたm/2,n/2は、16の整数倍、若しくは、16で割って8画素の余りがある。m/2,n/2が共に16の倍数の場合においては、MPEG4の符号化方式に適する画像になっているため、画像への処理は行わない。それ以外は、MPEG4符号化方式に適しないため、画像サイズ調整フラグによる画像への処理が必要となる。画像サイズ調整フラグには、画素の補填と除去の二つの選択肢を持つ。m/2若しくはn/2を16で割って、8画素が余った場合においては、画像の除去を選択すれば、余った8画素を除去する。すなわち、出力画像は(m/2−8)若しくは(n/2―8)となる。一方画素の補填を選択すれば、新たに作成した8画素若しくは元の画像から複製した8画素若しくは画像に適した8画素を行い、あるいは列の先頭若しくは、後部から付け加える。
すなわち、出力画像は(m/2+8)若しくは(n/2+8)となる。結果として、変換後の画像解像度の横と縦は16の倍数となり、MPEG4の符号化方式に適したサイズを持つ画像が出力される。
【0017】
一方、入力されたMPEG2の画像圧縮情報を示すビットストリームは、MPEG2の画像復号化装置4では、可変長符号の復号化を行った後、Pピクチャのみのマクロブロック動きベクトルやマクロブロックタイプなどその他のパラメータが取り出され、動きベクトル変換装置6へ伝送される。
【0018】
動きベクトル変換装置6における動きベクトル変換方法を、図6を用いて説明する。図6Aおよび、図6Bの実線で区切られている各正方格子の一つ一つがマクロブロックを示している。図6AはMPEG2の復号化装置4より出力された画像、すなわち、解像度変換前の画像である。図6Bは図6Aの画像を解像度フレームレート変換装置5により、縦・横の解像度とも1/2に変換された画像である。たとえば、変換前の図6Aの左上の斜線の付された16×16マクロブロックは、図6Bの左上の斜線の付された8×8ブロックに変換される。すなわち、図6Aに示した4つの網掛けされた16×16マクロブロックが、解像度変換された後、それぞれ図6Bに示した4つの網掛けされた8×8ブロックに変換され、それらによって1つの16×16マクロブロックが構成される。解像度変換前と後の動きベクトルの相関が大きいため、変換後の8×8ブロックの動きベクトルは、変換前の16×16マクロブロックの動きベクトルより求めることができる。さらに、4つの8×8の動きベクトルから1つの16×16の動きベクトルを求め、MPEG4の画像符号化方式により符号化するのに用いる動きベクトルの4つの8×8の動きベクトルと、1つの16×16の動きベクトルが生成される。
【0019】
図2の画像情報変換装置における動きベクトル変換装置6の詳細ブロック図を示す図7を参照して、動きベクトル変換の動作原理を説明する。入力されたMPEG2の画像圧縮情報を示すビットストリーム中の動きベクトル、画像サイズなどのパラメータは、MPEG2の16×16の動きベクトル→MPEG4の8×8の動きベクトル変換装置8によって、補整前の8×8の動きベクトルが作成される。
【0020】
図8のフローチャートを参照して、このMPEG2の16×16の動きベクトル→MPEG4の8×8の動きベクトル変換装置8の動作原理を説明する。入力されたMPEG2のマクロブロックの動きベクトルとマクロブロックタイプに対し、MPEG2の16×16の動きベクトル→MPEG4の8×8の動きベクトル変換装置8は次のように動作する。飛び越し走査のMPEG2の画像圧縮情報を示すビットストリームにおいては、一般的にフレーム構造が用いられるため、今回はフレーム構造の場合への処理のみの変換方法を説明する。
【0021】
ステップST−1で、入力されたMPEG2のマクロブロックの動きベクトルとマクロブロックタイプに対し、イントラマクロブロック、スキップマクロブロック及びインターマクロブロックのいずれであるかの判別を行う。イントラマクロブロックである場合には、MPEG2のイントラマクロブロックは、解像度変換後の8×8ブロックが動きベクトルを持つことを想定する。その処理としては、ステップST−2で、まず8×8の動きベクトルを0に設定し、さらに、補整器11による処理を行うため、イントラモードフラグを設ける。MPEG2では、イントラマクロブロックである場合、イントラモードフラグが立つ。
【0022】
スキップマクロブロックである場合には、ステップST−3で、各ブロックの動きベクトルを0と設定する。
【0023】
図9を参照して、インターマクロブロックである場合における、画像がフレーム構造、フレーム予測である場合の動きベクトル変換の概念を説明する。図9Aは解像度変換前を、図9Bは解像度変換後をそれぞれ示す。図3で説明したように、変換後の動きベクトルの水平成分は変換前の動きベクトルの水平成分と画像の横方向の解像度変換レートから求められる。垂直成分は変換前の動きベクトルの垂直成分と画像の縦方向の解像度変換レートから求められる。すなわち、横方向の解像度を1/2に変換した際、変換後の動きベクトルの水平成分も変換前の1/2になる。縦方向の解像度を1/2に変換した際、変換後の動きベクトルの垂直成分も変換前の1/2になる。
【0024】
図9に示した動きベクトルは、たとえば、変換前の(8,12)から変換後の(4,6)になる。尚、この場合は、整数画素の中間値(半画素)の間隔を1としている。図には、図9Aの解像度変換前では、黒丸は整数画素の位置を示し、菱形は半画素の位置を示している。図9Bの解像度変換後では、半画素を白丸で示す。図からわかるように、変換前整数画素の位置に示している動きベクトルは、変換後整数画素若しくは半画素の位置に示すが、変換前半画素の位置に示している動きベクトルは解像度変換後参照する画素がなくなる。そこで、変換前の動きベクトルが半画素の位置を示している場合、変換後の動きベクトルも予測画像の半画素の位置を示すようにする。それは本来、復号化された画像信号には、量子化による歪みが含まれているため、そのまま予測画像として使用すると予測効率が低下し、画質劣化を引き起こす場合がある。これを低減するために、低域通過フィルタに相当する参照画面での各画素間を1:1で直線補間した半画素精度を選択される場合もあり、これにより、画質劣化を避けることができる。従って、MPEG4の画像符号化方式による符号化も、予測効率を向上し、画質劣化を防ぐために、MPEG4で動きベクトルが半画素の位置に示している場合、MPEG4のフォーマットに変換した際も半画素の位置に示すように変換する。変換前と変換後の動きベクトルの対応関係を図10の表図に示す。
【0025】
次に、画像がフレーム構造でフィールド予測である場合だが、まず、第一フィールド予測である時について、図11に動きベクトル変換の概念図を示す。動きベクトルの水平成分は、図10と同様な処理を行われる。垂直方向は、第一フィールドを抽出することにより、解像度を1/2に変換することを可能とする。また、予測も第一フィールド予測を行っているため、変換前の動きベクトルは、そのまま変換後の動きベクトルになる。
【0026】
第二フィールド予測である場合の動きベクトル変換の概念図を図12及び図13に示す。解像度変換した際、第一フィールドのみが抽出されるため、変換後は第一フィールドの画素値を参照画像として用いる。そのため、MPEG2で予測画像として用いた第二フィールドの画素値を、解像度変換後の第一フィールド予測に変換するように、動きベクトルの時空間補整を行う。図12は、第二フィールド予測から近似的に第一フィールド予測に変換するための空間的な補整を行う手法を示した図である。図12Aは解像度変換前を、図12Bは解像度変換後をそれぞれ示す。すなわち、動きベクトルの垂直成分に1を加える。図からわかるように、第二フィールド予測で求めた動きベクトルの垂直成分に1を足すと、1行を繰り上げられることによって、第二フィールドが第一フィールドと同様の空間位置に達し、空間上で、第一フィールド予測で求めた動きベクトルのようになる。数1の式は空間補整により、第一フィールドと同様な空間位置にある第二フィールド、すなわち近似第一フィールドを予測とした時、動きベクトルMVtop の垂直成分を表している。
【0027】
【数1】
垂直成分:近似MVtop =MVbottom+1
【0028】
また、飛び越し走査のMPEG2の画像圧縮情報には第一フィールドと第二フィールドとで時間ずれがある。そのため、第二フィールドから近似された第一フィールドと実際の第一フィールドとの時間ずれの補整を行う。図13は各フィールドの時間的位置関係を示している。ここで、第一フィールドと第二フィールドの間隔を1とし、aをIピクチャの第二フィールドとPピクチャの第一フィールドの間隔とすると、aは1,3,5,7,‥‥‥‥‥‥のような奇数になる。尚、aが1の場合は、画像の構成がIPPP‥‥‥‥‥‥の場合である。時間補整した動きベクトルMV′を、数2の式に示す。
【0029】
【数2】
垂直成分:MV′={(a+1)/a}近似MVtop
【0030】
数1の式を数2の式に代入すると、変換後の動きベクトルの垂直成分は数3の式のようになる。
【0031】
【数3】
垂直成分:MV′={(a+1)/a}(MVbottom+1)
【0032】
尚、変換後の動きベクトルの水平成分は、変換前の動きベクトルに(a+1)/aを乗じ、時間的な補整を行った後、図10の表図に示す計算に従って求められる。
【0033】
動きベクトルの垂直成分に対して、場合により、時間的補整を行った後、空間的な補整を行ってもよい。その場合、動きベクトルMV′の垂直成分を、数4の式に示す。尚、水平成分は空間・時間補整(空間補整が行ってから時間補整を行う)と時間・空間補整(時間補整が行ってから空間補整を行う)は同様な値となる。
【0034】
【数4】
垂直成分:MV′={(a+1)/a}MVbottom+1
【0035】
数3の式と数4の式の差、すなわち、空間・時間補整を行った場合と、時間・空間補整を行った場合の動きベクトルの垂直成分の差は1/aになる。従って、aの値によって、その差による影響が異なるので、aが1の場合と、1より大きい、すなわち3,5,7,‥‥‥‥‥‥の2つの場合における補整方法を説明する。
【0036】
まず、a=1の場合について、数3の式のaに1を代入すると、動きベクトルの垂直成分は数5の式のようになる。
【0037】
【数5】
垂直成分:MV′=2×(MVbottom+1)
【0038】
数4の式のaに1を代入すると、動きベクトルの垂直成分は数6の式のようになる。
【0039】
【数6】
垂直成分:MV′=2×(MVbottom+1)−1
【0040】
その結果、変換前の動きベクトルMVbottomに0,1,2,‥‥‥‥‥‥を代入すると、数5の式による値は2,4,6,‥‥‥‥‥‥のような偶数になる。すなわち、空間・時間補整を行うと、変換前の動きベクトルは整数画素の位置に示しても、半画素の位置に示しても、変換後はすべて整数画素の位置に来る。また、数6の式による値は、1,3,5,‥‥‥‥‥‥のような奇数になる。すなわち、時間・空間補整を行うと、変換前の動きベクトルは整数画素の位置に示しても半画素の位置に示しても、変換後はすべて半画素の位置に来る。従って、変換前に整数画素の位置に示している動きベクトルは、変換後も整数画素の位置に来るようにする場合、空間・時間補整を行う。また、変換前の半画素の位置に示している動きベクトルは、変換後も半画素の位置に示すようにする場合、時間・空間補整を行う。すなわち、変換前の動きベクトルに対し、空間補整及び時間補整を交互に使用し、解像度変換後の動きベクトルに変換するか、若しくは、変換前の動きベクトルに対して、すべてが時間・空間補整を行う。
【0041】
以上の動きベクトル変換処理が終了した後、補整前のMPEG4の8×8の動きベクトルが出力される。出力された8×8の動きベクトルは、画像サイズ調整フラグによる動きベクトル調整器9(図7)に伝送され、外部より入力された画像サイズ調整フラグにより、画像サイズに適した動きベクトルを出力する。
【0042】
画像サイズ調整フラグによる動きベクトル調整器9における動作を、図14のフローチャートを参照して説明する。入力画像サイズm画素×n画素に対して、ステップST−11で、m/2,n/2が共に16の倍数であるか否かを判別し、m/2,n/2が共に16の倍数であれば、動きベクトル変換装置6から出力されたMPEG4の8×8の動きベクトルを、処理することなくそのまま出力する。m/2,n/2のいずれかが16の倍数でない場合、外部から入力された画像サイズ調整フラグが作動し、ステップST−12で画素除去か否かが判別され、画素除去の場合は、除去された8画素の8×8の動きベクトルを出力しないで、他の8×8の動きベクトルを出力する。画素除去でない場合は、ステップST−13で、画素補填か否かの判別を行い、画素補填の場合は、補填された8画素の8×8の動きベクトルを0に設定し、他の入力された8×8の動きベクトルと合わせて出力される。
【0043】
再び図7に戻って説明する。画像サイズ調整フラグによる動きベクトル調整器9より出力された画像サイズに適した8×8の動きベクトルは、MPEG4の8×8の動きベクトル→MPEG4の16×16の動きベクトル変換装置10、あるいは図16のMPEG4の8×8の動きベクトル→MPEG4の16×16の動きベクトル変換装置12によって変換される。
【0044】
図7の動きベクトル変換装置10においては、マクロブロックを構成する4つのブロックの中、イントラでないマクロブロックから変換されたブロックの動きベクトルの和をイントラでないマクロブロックから変換されたブロックの数で割った平均を16×16の動きベクトルとして出力する。
【0045】
図16に戻って説明する。第一の方法として、MPEG4の8×8の動きベクトル→MPEG4の16×16の動きベクトル変換装置15においては、MPEG2 16×16の動きベクトル→MPEG4の8×8の動きベクトル変換装置12において生成された、当該マクロブロックに対するMPEG4の8×8の動きベクトルのうち、もっとも符号化効率が高いと考えられるマクロブロックより生成されたものを選択し、MPEG4の16×16の動きベクトルとして出力する。
【0046】
符号化効率の判定は、マクロブロック情報バッファ14に格納された、画像情報変換装置の入力となるMPEG2の画像圧縮情報を示すビットストリームにおけるマクロブロック毎の情報を基に行う。
【0047】
すなわち、第一の方法は、4つのマクロブロックのうち、最も非零DCT係数の少ないマクロブロックを符号化効率が高いとする方法である。第二の方法は、4つのマクロブロックのうち、輝度成分のDCT係数に割り当てられたビット数の最も少ないマクロブロックを符号化効率が高いとする方法である。第三の方法は、4つのマクロブロックのうち、DCT係数に割り当てられたビット数の最も少ないマクロブロックを符号化効率が高いとする方法である。第四の方法は、4つのマクロブロックのうち、動きベクトル等を含めた、マクロブロックに割り当てられた全ビット数の最も少ないマクロブロックを符号化効率が高いとする方法である。第五の方法は、4つのマクロブロックのうち、割り当てられた量子化スケールが最も小さいマクロブロックを符号化効率が高いとする方法である。第六の方法は、4つのマクロブロックのうち、コンプレクシティの最も低いマクロブロックを符号化効率が高いとする方法である。各マクロブロックに割り当てられたコンプレクシティXは、そのマクロブロックに割り当てられた量子化スケールQ、及びビット数Bを用いて、数7の式のように計算される。
【0048】
【数7】
X=Q・B
【0049】
ここで、Bは、マクロブロック全体に割り当てられたビット数でも良いし、DCT係数に割り当てられたビット数でも良いし、輝度成分に割り当てられたDCT係数に割り当てられたビット数でも良い。
【0050】
再び図16に戻って説明する。第二の方法として、MPEG4の8×8の動きベクトル→MPEG4の16×16の動きベクトル変換装置15においては、MPEG2の16×16の動きベクトル→MPEG4の8×8の動きベクトル変換装置12において生成された、当該マクロブロックに対するMPEG4の8×8の動きベクトルのうち、もっとも重み付けが高いと考えられるマクロブロックより生成されたものを2回重複して数え、合計5つの8×8の動きベクトルのうち、中間値の長さを持つ動きベクトルをもっとも符号化効率が高いと選択し、MPEG4の16×16の動きベクトルとして出力する。ここで動きベクトルの長さの比較は水平方向、垂直方向のそれぞれの長さの二乗根の和を用い、平方根を求める処理は省略する。
【0051】
重み付けの判定は、マクロブロック情報バッファ14に格納された、画像情報変換装置の入力となるMPEG2の画像圧縮情報を示すビットストリームにおけるマクロブロック毎の情報を元に行う。
【0052】
すなわち、第一の方法は、4つのマクロブロックのうち、最も非零DCT係数の少ないマクロブロックを重み付けが高いとする方法である。第二の方法は、4つのマクロブロックのうち、輝度成分のDCT係数に割り当てられたビット数の最も少ないマクロブロックを重み付けが高いとする方法である。第三の方法は、4つのマクロブロックのうち、DCT係数に割り当てられたビット数の最も少ないマクロブロックを重み付けが高いとする方法である。第四の方法は、4つのマクロブロックのうち、動きベクトル等を含めた、マクロブロックに割り当てられた全ビット数の最も少ないマクロブロックを重み付けが高いとする方法である。第五の方法は、4つのマクロブロックのうち、割り当てられた量子化スケールが最も小さいマクロブロックを重み付けが高いとする方法である。第六の方法は、4つのマクロブロックのうち、コンプレクシティの最も低いマクロブロックを重み付けが高いとする方法である。各マクロブロックに割り当てられたコンプレクシティXは、そのマクロブロックに割り当てられた量子化スケールQ、及びビット数Bを用いて以下のように計算される。
【0053】
【数8】
X=Q・B
【0054】
ここで、Bは、マクロブロック全体に割り当てられたビット数でも良いし、DCT係数に割り当てられたビット数でも良いし、輝度成分に割り当てられたDCT係数に割り当てられたビット数でも良い。
【0055】
再び図7に戻って説明する。画像サイズ調整フラグによる動きベクトル調整器9より出力された画像サイズに適した8×8の動きベクトルは、MPEG2のイントラマクロブロックに対する動きベクトル補整器11に入力される。そこでMPEG2の画像圧縮情報を示すビットストリームにおいてはイントラであったマクロブロックから変換されたブロックの8×8の動きベクトルは、MPEG4の8×8の動きベクトル→MPEG4の16×16の動きベクトル変換装置10によって求められた16×16の動きベクトルに置きかえることによって補整される。補整後の8×8の動きベクトルと、MPEG4の8×8の動きベクトル→MPEG4の16×16の動きベクトル変換装置10で求めた16×16の動きベクトルを合わせて、MPEG4動きベクトルとして出力する。
【0056】
図7のMPEG2のイントラマクロブロックに対する動きベクトル補整器11の詳細構成図を示す図15を参照して、その動きベクトル補整の動作原理を説明する。画像サイズに適した8×8の動きベクトルがMPEG2のイントラマクロブロックに対する補整器11に入力し、イントラモードフラグが立っている場合、すなわち、MPEG2の画像圧縮情報を示すビットストリームにおいてはイントラマクロブロックである場合、スイッチSWの可動接点mが固定接点a側に倒れ、置換装置PKで、そのイントラマクロブロックから変換された8×8ブロックの動きベクトルを、MPEG4の8×8の動きベクトル→MPEG4の16×16の動きベクトル変換装置10より求められた16×16の動きベクトルに置き換えられる。この場合、そのイントラマクロブロックの周辺に存在するインターマクロブロックの動きベクトルから変換された動きベクトルに置換しても良く、若しくは、イントラマクロブロックに一番近いインターマクロブロックの動きベクトルから変換された動きベクトルに置換してもよい。尚、4つのブロックともイントラマクロブロックから変換された場合は、4つとも動きベクトルが0となり、MPEG4の8×8の動きベクトル→MPEG4の16×16の動きベクトル変換装置10によって求められる16×16の動きベクトルも0となるため、MPEG4の画像符号化に用いる動きベクトルは0となり、マクロブロックタイプがイントラモードとなる。また、イントラモードフラグが立たない場合、すなわち、MPEG2ではイントラマクロブロックがない場合、スイッチSWの可動接点mが固定接点b側に倒れ、入力された8×8の動きベクトルがそのまま出力される。
【0057】
次に生成された動きベクトルの再検索を行う場合について説明する。インターマクロブロックに対し、画像がフレーム構造、フレーム予測である場合の動きベクトル変換の概念図を図17に示す。図17Aは解像度変換前を、図17Bは解像度変換後をそれぞれ示す。図3で説明したように、変換後の動きベクトルの水平成分は変換前の動きベクトルの水平成分と画像の横方向の解像度変換レートから求められる。垂直成分は変換前の動きベクトルの垂直成分と画像の縦方向の解像度変換レートから求められる。すなわち、横方向の解像度を1/2に変換した際、変換後の動きベクトルの水平成分も変換前の1/2になる。縦方向の解像度を1/2に変換した際、変換後の動きベクトルの垂直成分も変換前の1/2になる。図9に示した動きベクトルは、たとえば、変換前の(8,12)から変換後の(4,6)になる。尚、この場合は、整数画素の中間値(半画素)の間隔を1としている。図17Aの解像度変換前では、黒丸は整数画素の位置を示し、菱形は半画素の位置を示している。図17Bの解像度変換後では、半画素は白丸で示す。
【0058】
図からわかるように、変換前の整数画素の位置に示している動きベクトルは、変換後整数画素若しくは半画素の位置に示すが、変換前半画素の位置に示している動きベクトルは解像度変換後、参照する画素がなくなる。そこで、変換前の動きベクトルが半画素の位置を示している場合、変換後の動きベクトルも予測画像の最も近い整数画素位置を示すようにする。これは、後に動きベクトル補整において動きベクトル周辺画素を再検索する際に、サーチウィンドウの中心画素値を整数画素にするためである。まず、サーチウィンドウ内で最も予測誤差が少ない整数画素の動きベクトルを求め、次にその整数画素周辺の9の半画素値を検索することにより処理のステップを削減している。変換前と変換後の動きベクトルの対応関係を図19に示す。
【0059】
以上、これに限らず、図9、10、11、12に示されたように半画素動きベクトルを生成し、これを中心に再検索を行うことも可能であるが、この場合半画素値をサーチウィンドウ内で事前に求める行程が必要となり、処理工数が増えることとなる。
【0060】
次に、画像がフレーム構造でフィールド予測である場合だが、まず、第一フィールド予測である時について、図19の動きベクトル変換の概念図を参照して説明する。図19Aは解像度変換前を、図19Bは解像度変換後をそれぞれ示す。動きベクトルの水平成分は、図18で説明したのと同様な処理を行われる。垂直方向は、第一フィールドを抽出することにより、解像度を1/2に変換することを可能とする。また、予測も第一フィールド予測を行っているため、変換前の動きベクトルは、そのまま変換後の動きベクトルになる。
【0061】
第二フィールド予測である場合の動きベクトル変換の概念図を図20に示す。図20Aは解像度変換前を、図20Bは解像度変換後をそれぞれ示す。解像度変換した際、第一フィールドのみが抽出されるため、変換後は第一フィールドの画素値を参照画像として用いる。フィールドのライン補整及び時間方向の動きベクトル補整は図12で説明している方法と同様に補整を行い、その後水平方向の画素値は変換後に整数画素を示すように、図18と同様な処理が行われる。
【0062】
次に図21を用いて再検索による動きベクトル補整処理を説明する。すなわち、動きベクトル補整装置は、図2の動きベクトル変換装置6により、スケーリングされた動きベクトルを入力とし、符号化効率を高めるために再検索により補整された動きベクトルを出力とする。また、動きベクトル補整方向情報フラグによるサーチウィンドウのサイズを設定する。動きベクトル補整方向情報フラグに関しては後に図23及び24を用いて説明する。
【0063】
すなわち、動きベクトル補整装置はより精度が高い動きベクトルを求めるために動きベクトル変換装置6により動きベクトルのスケーリングにより生じた歪みを再検索によって補整する。まず、入力されたMPEG4の8×8の動きベクトルの周辺画素を水平方向±2整数画素、垂直方向±1画素の動きベクトル検索を行う。これにより、動きベクトル変換装置6による求められた動きベクトルを中心にサーチウィンドウを水平5画素、垂直3画素に抑え、動きベクトル検索の処理数を大幅に減少させることが可能となる。以上、サーチウィンドウを水平5画素、垂直3画素に設定したが、ここではこれに限らず、水平、垂直方向のサーチウィンドウの検索画素数は任意に選択しても良い。また、検索処理数を削減させるために後に説する動きベクトル補整方向情報フラグを用いて、動きベクトルの補整用サーチウィンドウの大きさを動きベクトルの進行方向に対し、順方向、逆方向非対称に設定しても良い。
【0064】
図22に動きベクトル変換装置(本願出願時に未公知の先行例)の構成ブロック図を示す。動きベクトル変換装置は図2の動きベクトル変換装置6に示したものと同様である。まず、変換装置221では、上述した動きベクトルの空間・時間補整を行って、8×8の動きベクトルを生成する。次に、検索装置222において、8×8の動きベクトルに上述したように、8×8の動きベクトルの再検索処理を行う。例えば、生成された8×8の動きベクトルの参照先を中心に、検索サーチウィンドウを整数画素で縦横2画素ずつで検索を行う。これにより8×8の動きベクトルの予測精度を向上させることが可能である。次に一つのマクロブロックを構成する4つの8×8の動きベクトルそれぞれに対して再検索された予測誤差及び、再検索処理を施した8×8の動きベクトルを、変換装置223へ入力する。
【0065】
変換装置223では4つの8×8の動きベクトルのうち、8×8の動きベクトル再検索時に求められた予測残差のうち、最も予測誤差が少ない動きベクトルを判別し、16×16の動きベクトルに割り当てる。次に生成された16×16の動きベクトルを上述と同様に検索装置214において再検索処理を行って、16×16の動きベクトルの予測精度を向上させる。これによりMPEG4の8×8の動きベクトル及び、16×16の動きベクトルを生成し、出力する。
【0066】
出力された8×8の動きベクトル及び16×16の動きベクトルは、それぞれ半画素検索装置225に入力され、半画素精度で8×8及び16×16の動きベクトルが出力される。
【0067】
ここで図23及び図24を用いて図21及び図22に示した動きベクトル補整方向情報フラグについて説明する。動きベクトル補整装置は動きベクトル補整方向情報フラグにより動きベクトルの進行方向に対して、再検索サーチウィンドウのサイズを設定する。まず、図23Aに示すように変換前のMPEG2動きベクトルが整数画素であり変換後のMPEG4動きベクトルも整数画素値である場合は、同位相の画素が存在し、動きベクトルの画素値に歪みが生じないため、動きベクトル補整のサーチウィンドウは動きベクトルの進行方向に対して対称に設定する。図23Bに示すように変換前のMPEG2動きベクトルが整数画素値であり、変換後のMPEG4動きベクトルが半画素精度である場合、動きベクトルの進行方向に対し、繰り上げにより近似のMPEG4の整数画素値に修正するため、サーチウィンドウは動きベクトルの進行方向に対し、逆方向に大きくとることにより検索処理数を削減することが可能となる。例えば、動きベクトルと逆方向に2整数画素値、順方向に▲1▼整数画素値で検索する。勿論、動きベクトル変換時にMPEG4の動きベクトルを繰り下げにより近似のMPEG4の整数画素値とした場合、サーチウィンドウの設定は動きベクトルの進行方向に対して順方向に大きく設定する。
【0068】
図24A、Bの場合も同様に変換前のMPEG2動きベクトルが半画素精度を示し、MPEG4動きベクトルに変換する際に最も近いMPEG4の整数画素値に修正するため、図23Bのケースと同様に歪みが生じる方向を基にMPEG4の動きベクトル補整装置のサーチウィンドウを動きベクトルの進行方向に対し、順方向または逆方向に大きく設定することが出来る。これにより、動きベクトル再検索の処理数を減少させるため、動きベクトルの歪みの方向を動きベクトル装置6より出力し、動きベクトル補整装置に入力し、動きベクトルの補整検索を行うのに、最適なサーチウィンドウの大きさを設定することが出来る。
【0069】
MPEG4の画像符号化装置7では、解像度フレームレート変換装置5からの出力画像を受け取り、動きベクトル変換装置6から出力されたMPEG4の動きベクトルを用いて、MPEG4の画像符号化方式により符号化を行い、MPEG4の画像圧縮情報を示すビットストリームを出力する。
【0070】
以下に、本発明者らが発明した動きベクトル変換方法及び変換装置(本願出願時未公知)について説明する。
【0071】
図25にMPEG2ストリームからMPEG4ストリームへのピクチャタイプとVOP(Video Object Plane)タイプの対応概念図を示す。GOP(画面グルーブ)構造がN15M3である毎秒30フレームのMPEG2のストリームをGOP構造N5M1である毎秒5フレームのMPEG4のストリームに変換する場合、I及びPフレーム(I−frame 、P−frame )を一枚置きにMPEG4に変換する。図25に示すようMPEG2のストリームのN15M1の2GOPにMPEG4のストリームのN5M1の1GOVが対応するため、MPEG2からMPEG4への変換の際にPフレームを破棄する場合とIフレームを破棄する場合とがある。
【0072】
まず、Iフレームを破棄する場合について、図26の概念図について説明する。PフレームPn-2 及びPn-1 間のIフレームIn-1 においては動きベクトルが存在しないため、当該マクロブロックの動きベクトルMVn に捨てられたIフレームの動きベクトルを足し合わせて動きベクトルを合成することはできない。そこで、当該マクロブロックにおいては、先行例の技術で説明した方式に基づき、当該マクロブロックの動きベクトルMVn をスケーリングにより空間・時間補整を施し、次に捨てられたPフレームの前のIまたはPフレームより変換されたMPEG4のVOPを参照するように時間方向の動きベクトルMVn の長さを2倍に伸張して、動きベクトル2*MVn を得る。これにより、当該P−VOPの動きベクトルが捨てられたフレームの直前のIまたはPフレームより変換されたVOPを参照する。このようにして、空間・時間補整によるスケーリングを行い、その後に時間方向に2倍に伸張された動きベクトルを生成し、8×8の動きベクトルとして出力する。
【0073】
次に、Pフレームを破棄する場合について、図27、図28、図29及び図30を参照して説明する。まず、図27にPフレームを破棄する場合の処理の概念図を示す。IフレームIn-1 及びPフレームPn 間の破棄されるPフレームPn- 1 は動きベクトルMVn-1 を有しているため、当該マクロブロックの動きベクトルMVnに、破棄されるPフレームの動きベクトルMVn-1 を足し合わせて、破棄されるPフレームの前のフレームを参照する動きベクトル(MVn-1 +MVn)を生成する。
【0074】
図28に示すように、当該マクロブロックの動きベクトルは破棄されるフレームを参照するが、このとき参照する画素は複数のマクロブロックに重なる。
【0075】
図29に参照画素(MB0 )がどのように複数のマクロブロックに重なるかを示す。図からわかるように、参照画素(MB0 )は、1つ、または2つ、または4つのマクロブロック(MB)に重なる(Overlap) 場合がある。その参照画素(MB0 )のマクロブロックMBと重なった部分を、 refMB#0 、 refMB#1 、 refMB#2 、 refMB#3 として示す。破棄される(Dropped)Pフレームの動きベクトル及び、マクロブロックモード並びに予測モードまたはビット数、または量子化スケールは後に動きベクトルの足し合わせの合成を行うため、動きベクトル及びマクロブロック情報バッファにフレーム単位で格納する。MPEG2からMPEG4への動きベクトル変換を行う当該マクロブックにおいて、まず破棄されたPフレーム上で当該動きベクトルが参照する座標を計算する。図29に示すように、当該動きベクトルが参照する座標によっては参照画素(MB0 )が破棄される参照Pフレームの1つ、または2つまたは4つのマクロブロック(MB)と重なる場合がある。複数のマクロブロックに重なる場合には予め定めたパラメータXに基づいて、マクロブロックの符号化効率の順番を降順に並べ換える。
【0076】
すなわち、第1の方法では、パラメータXを「マクロブロックに重なっている画素数」とし、第2の方法では、パラメータXを「マクロブロックの重なっている画素数/マクロブロックのビット数」とし、第3の方法では、パラメータXを「マクロブロックの重なっている画素数/Q−スケール」(Q−スケールは、マクロブロック量子化スケールを意味する)とし、第4の方法では、パラメータXを「マクロブロックの重なっている画素数/(マクロブロックのビット数×Q−スケール)とし、第5の方法では、パラメータXを(1/マクロブロックのビット数)とし、第6の方法では、パラメータXを(1/Q−スケール)とし、第7の方法では、Xを1/(マクロブロックのビット数×Q−スケール)とする。そして、パラメータXの最も大きいものを最大値とし、パラメータXの最も小さいものを最小値とする。図28では、第1〜第4の方法におけるパラメータXを示している。図28において、MB overlapped areaは、マクロブロックに重なっている画素数を示す。Coef bitsは、マクロブロックのビット数を示す。Q-scaleは、マクロブロック量子化スケールを示す。
【0077】
図30にPフレームを破棄する場合の動きベクトル合成アルゴリズムのフローチャートを示し、以下これについて説明する。まず、当該マクロブロックのMPEG2動きベクトルが参照する画素に重複する(重なる)、マクロブロックを構成する1つまたは2つまたは4つのマクロブロック(MB)のうち、マクロブロック(MB)モードがNot Coded (DCT係数が符号化されていない)であり、且つ、重複する(重なる)画素値が閾値T以上であるマクロブロックを検索する(ステップST−21)。閾値Tは例えば100画素とする。重複するマクロブロックのうち一つでもNot Coded のマクロブロック(MV)が含まれていれば、そのマクロブロック(MV)アドレスが最も若いNot Coded のマクロブロックの動きベクトルMVn-1 を選択する(ステップST−22)。
【0078】
当該マクロブロックのMPEG2動きベクトルが参照する画素に重複する、マクロブロックを構成する1つまたは2つまたは4つのマクロブロックのうちNot Coded (DCT係数が符号化されていない)のマクロブロックが存在しない場合には、次に、マクロブロックモードが No MC(動き補償なし)であり、且つ、重複する画素値が閾値T以上であるマクロブロックを検索する(ステップST−23)。閾値Tは例えば100画素とする。重複するマクロブロックのうち、一つでもNo MC のマクロブロックが含まれていれば、そのマクロブロックアドレスが最も若いNot Coded のマクロブロックの動きベクトルMVn-1 を選択する(ステップST−24)。
【0079】
当該マクロブロックのMPEG2動きベクトルが参照する画素に重複する(重なる)、マクロブロックを構成する1つまたは2つまたは4つのマクロブロックのうち重複するマクロブロックにNot Coded DCT係数が符号化されていない)及びNo MC (動き補償なし)が存在しない場合には、次に、上述したパラメータXが最も大きいマクロブロックより順番にマクロブロック(MB)モードがイントラマクロブロック(MB)であるかを判別する(ステップST−25)。若し、参照マクロブロックがイントラマクロブロックであれば、次にパラメータXが大きいマクロブロックがイントラマクロブロックであるかを判別し、当該マクロブロックが参照する画素に重複するマクロブロック全てがイントラマクロブロックであるかを判別する(ステップST−26)。当該マクロブロックが参照する画素に重複するマクロブロック全てがイントラマクロブロックであれば、ゼロの動きベクトル(MV)を選択する(ステップST−27)。
【0080】
ステップST−25で、イントラマクロブロックでないマクロブロックを検索した場合には、次の判別ルーチンに移る。すなわち、イントラマクロブロックでないマクロブロックにおいて、予測モードが、第2フィールドを参照するフィールド予測であるかを判別する(ステップST−28)。第2フィールドを参照するフィールド予測である場合、パラメータXが次に大きい参照マクロブロックにおいて同様の判別を行う(ステップST−29)。N(イントラマクロブロックの個数)個の参照マクロブロックが第2フィールドを参照するフィールド予測である場合には、最も大きなパラメータXをもった参照マクロブロック(MB)の動きベクトルMVn-1 を選択する(ステップST−30)。Nは予め定めた数であり、1〜4の値を持つ。第2フィールドを参照するフィールド予測でないマクロブロックを検索した場合には、そのマクロブロックの動きベクトルMVn-1 を選択する(ステップST−31)。このようにして当該マクロブロックの動きベクトルに足し合わせる動きベクトルを選択する。
【0081】
図31に動きベクトルの第2フィールドを参照する動きベクトルの時間補整を示す。足し合わせた動きベクトルのスケーリング方法は先行例の技術で述べた動きベクトルの空間・時間補整を施すスケーリング方法と同様の方法で行う。よって、足し合わせたベクトルが参照フレームの第2フィールドを参照する場合は、動きベクトルの垂直成分に対し、フィールド補整を行い、さらに時間方向のベクトル補整として1フィールド間隔分動きベクトルを伸張する。図に示すように当該フィールドと参照する第2フィールドのフィールド間隔がaであり、よって1フィールド分の時間補整を施すのに動きベクトルに(a+1)/aを掛ける。このようにして8×8の動きベクトルを求めて出力する。
【0082】
図32にIフレームを破棄する場合の動きベクトル変換装置の構成ブロック図を示す。動きベクトル変換装置は図2の動きベクトル変換装置6に示したのと同様である。まず、MPEG2の動きベクトルを動きベクトル空間・時間補整装置321に入力して、上述と同様に、動きベクトルの空間・時間補整を行い8×8の動きベクトルを生成する。次に8×8の動きベクトルを8×8MV再検索装置322に入力して、先行例の技術で説明したように、8×8の動きベクトルの再検索処理を行う。例えば、生成された8×8の動きベクトルの参照先を中心に、検索サーチウィンドウを整数画素で縦横2画素ずつで検索を行う。これにより8×8の動きベクトルの予測精度を向上させることが可能である。次に一つのマクロブロックを構成する4つの8×8の動きベクトルそれぞれに対して再検索された予測誤差及び、再検索処理を施した8×8の動きベクトルを8×8MV→16×16MV変換装置323に入力する。
【0083】
8×8MV→16×16MV変換装置323では、4つの8×8の動きベクトルのうち、最も予測誤差が少ない動きベクトルを判別し、16×16の動きベクトルに割り当てる。次に生成された16×16の動きベクトルを、16×16MV再検索装置324に入力して、先行例の技術で述べたのと同様に再検索処理を行い、16×16の動きベクトルの予測精度を向上させる。これによりMPEG4の8×8の動きベクトル及び、16×16の動きベクトルが生成されて出力される。
【0084】
次に、図33にPフレームを破棄する場合の動きベクトル変換装置の更に他の例の構成ブロック図を示す。図33の動きベクトル変換装置は図2の動きベクトル変換装置6に示したのと同様である。まず、MPEG2の動きベクトルが入力される切換えスイッチ351は、破棄するPフレームの情報が来た場合には、MV及びMB情報バッファ352側に切換えられ、それの以外Pフレームの情報が来た場合には、参照MBアドレス計算装置354及び動きベクトル伸長空間・時間補整装置357側に切換えられる。
【0085】
MV及びMB情報バッファ352では、破棄するPフレームの動きベクトル情報及びマクロブロック予測モードをフレーム単位で格納し、場合によってはマクロブロック毎のビット量及び量子化スケールをも格納する。参照MBアドレス計算装置354においては、破棄するPフレームの次のPフレームの動きベクトルを入力とし、その当該動きベクトルの参照位置を計算する。動きベクトルの参照位置は足し合わせ動きベクトル判定装置353に入力され、参照位置を基に、参照画素に重なる破棄するPフレームのマクロブロックを算出する。足し合わせ動きベクトル判定装置353では、この情報を利用し、上述した足し合わせる動きベクトルを選択する手法に基づき処理を行い、足し合わせる動きベクトルを出力する。出力された動きベクトルは当該マクロブロックの動きベクトルと足し合わせ、合成された動きベクトルを生成する。
【0086】
次に、合成された動きベクトルは、動きベクトル空間・時間補整装置355に入力され、先行例の技術及び上段に述べた空間・時間の補整スケーリングにより変換を行って動きベクトルを生成する。動きベクトル伸長空間・時間補整装置357及び動きベクトル再検索装置358は、動きベクトルを伸張方式により求める手法であり、それぞれ動きベクトル空間・時間補整装置321及び8×8の動きベクトル再検索装置322と同様の処理を行う。これにより動きベクトルを生成する。動きベクトル再検索装置356及び動きベクトル再検索装置358より出力された動きベクトルは、それぞれ8×8の動きベクトル選択装置359に入力され、8×8の動きベクトル選択装置359において2つの動きベクトルより予測残差の少ない動きベクトルを8×8の動きベクトルとして出力する。8×8MV→16×16MV動きベクトル変換装置360及び16×16の動きベクトル再検索装置361の処理は、図32の動きベクトル変換装置における8×8MV→16×16MV動きベクトル変換装置323及び16×16の動きベクトル再検索装置324と同様の処理を施して、16×16の動きベクトルを生成する。これによりMPEG4の8×8の動きベクトル及び16×16の動きベクトルを生成して出力する。
【0087】
このようにPフレームを破棄する場合には一つのマクロブロックを構成する4つのブロックそれぞれにおいて動きベクトルの伸張により求められた動きベクトル、及び動きベクトルの足し合わせにより求められた動きベクトルの2つが存在する。それぞれの動きベクトルに対し、次の再検索処理を施し、予測残差が少ないものをMPEG4の8×8の動きベクトルとして出力する。再検索の方法は先行例の技術で述べた方法と同様で例えばサーチウィンドウの検索範囲は縦横2整数画素とする。これにより、一つのマクロブロックを構成する4つのブロックそれぞれにおいて2つの動きベクトルを再検索により求めることが出来る。
【0088】
次に、一つのブロックにおいて、これら2つの動きベクトルの予測残差を比較し、予測残差の少ないものをMPEG4の8×8の動きベクトルとして出力する。このように、動きベクトルの伸張をする方式と動きベクトルの足し合わせを行う方式のうち、最も符号化効率の高い動きベクトルを選択し、8×8の動きベクトルを生成することが可能である。次に、一つのマクロブロックにおいて、4つのMPEG4 8×8の動きベクトル再検索より求められる予測誤差を比較し、最も予測誤差の少ない8×8の動きベクトルを判定する。この最も予測誤差が少ない8×8の動きベクトルを16×16の動きベクトルに割り当てる。次に選択された16×16の動きベクトルにおいても、上述に述べた8×8の動きベクトル再検索方法と同様に再検索を行い、16×16の動きベクトルの符号化効率を最適化する。
【0089】
このように、MPEG2の画像情報圧縮情報を入力とし、MPEG4の8×8及び16×16の動きベクトルを求める手順において、動きベクトル変換装置により、動きベクトルを伸張または足し合わせ、さらにスケーリングされた動きベクトル情報を、動きベクトルを中心とした、再検索による動きベクトル補整を行うことにより、MPEG4画像符号化装置における符号化効率の低減を最小にすることが可能である。
【0090】
次に、図34に動きベクトル変換装置の他の例の構成ブロック図を示す。図34の動きベクトル変換装置は図2の動きベクトル変換装置6に示したものと同様である。まず、MPEG2→MPEG4の8×8MV変換装置271では上述した動きベクトルの空間・時間補整を行い8×8の動きベクトルを生成する。次に、動きベクトル整数画素検索装装置272において、8×8の動きベクトルに先行例の技術で説明したように、8×8の動きベクトルの再検索処理を行う。例えば、生成された8×8の動きベクトルの参照先を中心に、検索サーチウィンドウを整数画素で縦横2画素ずつで検索を行う。これにより8×8の動きベクトルの予測精度を向上させることが可能である。次に一つのマクロブロックを構成する4つの8×8の動きベクトルそれぞれに対して再検索された予測誤差及び、再検索処理を施した8×8の動きベクトルを、8×8の動きベクトル→16×16の動きベクトル変換装置273へ入力する。
【0091】
8×8の動きベクトル→16×16の動きベクトル変換装置273では、4つの8×8の動きベクトルのうち、8×8の動きベクトル再検索時に求められた予測残差のうち、最も予測誤差が少ない動きベクトルを判定し、16×16の動きベクトルに割り当てる。次に生成された16×16の動きベクトルを先行例の技術で述べたのと同様に、動きベクトル整数画素検索装置274において再検索処理を行い、16×16の動きベクトルの予測精度を向上させる。これによりMPEG4の8×8の動きベクトル及び、16×16の動きベクトルを生成して出力する。
【0092】
出力された8×8の動きベクトル及び16×16の動きベクトルをそれぞれ半画素検索装置275に入力され、半画素精度で8×8及び16×16の動きベクトルが出力される。
【0093】
このように、MPEG2画像情報圧縮情報を入力とし、MPEG4の8×8及び16×16の動きのベクトルを求める手順において、動きベクトル変換装置により、動きベクトルを伸張または足し合わせ、さらにスケーリングされた動きベクトル情報を、動きベクトルを中心とした、再検索による動きベクトル補整を行うことにより、MPEG4画像符号化装置における符号化効率の低減を最小にすることが可能である。
【0094】
【発明が解決しようとする課題】
上述した図34の動きベクトル変換装置では、MPEG2の動きベクトルを変換し、MPEG4の動きベクトルが生成されている。しかしながら、MPEG2のイントラフレームの動きベクトルをMPEG4に変換する際に、動きベクトル情報を生成せずに、MPEG4のI−VOP(MPEG4でイントラモードで符号化されるフレームを意味する)として変換され、MPEG4のビットストリームのI−VOP間隔が狭く、MPEG4の画像圧縮情報(ビットストリーム)に変換された後に符号化効率が低下するという問題点を有している。
【0095】
かかる点に鑑み、本発明は、飛び越し走査のMPEG2の画像圧縮情報を示すビットストリームを入力とし、順次走査のMPEG4の画像圧縮情報を示すビットストリームを出力とする画像情報変換方法における動きベクトル変換方法において、画像情報変換方法におけるMPEG4の画像符号化の符号化効率を一層高くすることのできるものを提案しようとするものである。
【0096】
又、本発明は、飛び越し走査のMPEG2の画像圧縮情報を示すビットストリームを入力とし、順次走査のMPEG4の画像圧縮情報を示すビットストリームを出力とする画像情報変換装置における動きベクトル変換装置において、画像情報変換装置におけるMPEG4の画像符号化装置の符号化効率を一層高くすることのできるものを提案しようとするものである。
【0097】
【課題を解決するための手段】
本発明は、ビットストリームを復号して画像データを生成し、復号により生成された画像データのPピクチャを一枚置きに破棄し、復号により生成された画像データのIピクチャを対象ピクチャとして、該対象ピクチャをPピクチャとして符号化する場合に、対象ピクチャの直前にある破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、対象ピクチャが参照ピクチャを参照する参照動きベクトルを生成し、生成された参照動きベクトルを利用して、所定間隔でPピクチャが破棄された画像データを符号化するようにしたものである。なお、復号により生成された映像データにおいては、破棄の対象とならないPピクチャがIピクチャの直前に存在していないようにしている。
【0104】
【発明の実施の形態】
以下、図面を参照して、本発明の実施の形態の動きベクトル変換方法及び変換装置の例を説明する。図35を参照して、イントラフレームから変換されるVOPをP−VOPに変換する方法を説明する。当該フレームがイントラフレームである場合、動きベクトルを所有しないため、画像符号化に動き補償予測を利用できず、符号化効率が下がる。そこで、動き補償予測用に動きベクトルを生成するために、破棄する直前のPフレームの動きベクトルをバッファに格納し、上述した空間・時間補整用のスケーリングを行い、当該フレームの同位置のマクロブロックにそれぞれ複製する。次に、直前のPフレームは破棄されるため、参照フレームとの時間間隔が2倍になる。よって、複製した動きベクトルを時間方向に2倍に伸張し、破棄するPフレームの直前のPフレームを参照するように補整を行う。
【0105】
図36に動きベクトル変換装置のブロック構成図を示す。図2の動きベクトル変換装置6に相当する動きベクトル変換装置部を示したものが図36のブロック図である。スイッチ361はI→P−VOP動きベクトル(MV)変換フラグにより動作し、MPEG4に変換するMPEG2イントラフレーム及びその直前のMPEG2がPフレームの時には、I→P−VOP動きベクトル変換装置362側に切り換えられ、それ以外のフレームでは、P→P−VOP動きベクトル変換装置363側に切り換えられる。
【0106】
I→P−VOP変換装置362については、後に説明する。P→P−VOP変換装置363は、図1の従来の技術で説明した動きベクトル変換装置と同様の処理を行う。
【0107】
図37にI→P−VOP動きベクトル変換装置の構成ブロック図を示す。まず、MPEG2の動きベクトルバッファ371にIフレームの破棄する直前のPフレームの動きベクトルを格納する。Iフレームのマクロブロックにそれぞれ破棄するPフレーム内の同位置のマクロブロックの動きベクトルを複製する。MPEG2→MPEG4の8×8のMV変換装置372においては、上述の技術で述べた動きベクトルの空間・時間補整を行った後に、Pフレームの破棄する直前のPフレームを参照するように時間方向に動きベクトルを2倍に伸張する。変換されたMPEG4の8×8動きベクトルは、0MVと予測誤差の比較装置373に入力され、動きベクトルが0の予測と、予測残差とを比較し、0動きベクトルの予測残差が生成した8×8の動きベクトルの予測残差より小さい場合には、8×8の動きベクトルを0に置き換える。これにより出力された8×8の動きベクトルは、動きベクトル整数画素検索装置374において、上述の技術で説明した方法と同様に、整数画素値で指定された任意のサーチウィンドウ内で再検索を行い、動きベクトルの予測精度を向上させる。
【0108】
そして、8×8MV→16×16MV変換装置375において、生成された8×8動きベクトル及びそれぞれの予測残差を入力とし、一つのマクロブロックを構成する4つのブロックのうち、最も予測残差が少なかった8×8の動きベクトルを16×16の動きベクトルに割り当てて出力する。0MVと予測誤差の比較装置376は、生成された16×16の動きベクトルを入力とし、0動きベクトルの予測残差と比較し、0動きベクトルの予測残差が生成された16×16の動きベクトルより予測残差が少なければ、16×16の動きベクトルを0に置き換える。これにより生成された16×16の動きベクトルを動きベクトル整数画素検索装置377の入力とし、動きベクトル整数画素検索装置377では16×16の動きベクトルを上述の技術で説明した方法に基づいて、整数画素で再検索を行って出力する。整数画素値で求められた8×8及び16×16の動きベクトルは、それぞれ動きベクトル半画素検索装置378に入力され、半画素精度でMPEG4の8×8及び16×16の動きベクトルを出力する。
【0109】
以上、入力としてMPEG2の画像圧縮情報を示すビットストリームを、出力としてMPEG4の画像圧縮情報を示すビットストリームを対象としてきたが、入力、出力ともこれに限らず、例えばMPEG−1やH.263などの画像圧縮情報(ビットストリーム)でも良い。
【0110】
【発明の効果】
本発明は、ビットストリームを復号して画像データを生成し、復号により生成された画像データのPピクチャを一枚置きに破棄し、復号により生成された画像データのIピクチャを対象ピクチャとして、該対象ピクチャをPピクチャとして符号化する場合に、対象ピクチャの直前にあって破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、対象ピクチャが参照ピクチャを参照する参照動きベクトルを生成し、生成された参照動きベクトルを利用して、所定間隔でPピクチャが破棄された画像データを符号化するようにしたものである。
【0117】
発明によれば、画像符号化の符号化効率を一層高くすることのできる画像処理装置及び画像処理方法を得ることができる。
【図面の簡単な説明】
【図1】MPEG2の画像圧縮情報を示すビットストリームからMPEG4の画像情報圧縮装置を示すビットストリームへの変換を実現する画像情報変換装置の従来例を示すブロック線図である。
【図2】筆者らの発明によるMPEG2の圧縮画像情報を示すビットストリームからMPEG4の圧縮画像情報を示すビットストリームへの変換を実現する画像情報変換装置(先行例)の構成を示すブロック線図である。
【図3】MPEG2の画像圧縮情報を示すビットストリーム中の動きベクトルと、MPEG4の画像圧縮情報を示すビットストリーム中の動きベクトルの相関を示す説明図である。
【図4】図2の画像情報変換装置における解像度フレームレート変換装置5における動作原理を示す説明図である。
【図5】図2の画像情報変換装置における画枠サイズ調整フラグに応じた解像度フレームレート変換装置5における画素の補填或いは除去の動作原理を示す説明図である。
【図6】図2の画像情報変換装置における動きベクトル変換装置6における動きベクトル変換方法を示す説明図である。
【図7】図2の画像情報変換装置における動きベクトル変換装置6の具体構成を示すブロック線図である。
【図8】図2の画像情報変換装置におけるMPEG2の16×16の動きベクトル→MPEG4の8×8の動きベクトル変換装置8における動作原理を示すフローチャートである。
【図9】図7の動きベクトル変換装置におけるMPEG2の16×16の動きベクトル→MPEG4の8×8の動きベクトル変換装置8でのフレーム構造、フレーム予測の場合の動きベクトル変換の概念を示す説明図である。
【図10】図9におけるMPEG2の画像圧縮情報を示すビットストリーム中の半画素精度の動きベクトルの、MPEG4の8×8の動きベクトルへの変換後の取り扱いを示す表図である。
【図11】図9における画像がフレーム構造で、第一フィールド予測であるときの動きベクトル変換の概念を示す説明図である。
【図12】図9における画像がフレーム構造で、第二フィールド予測であるときについての動きベクトル変換の概念を示す説明図である。
【図13】図9における画像がフレーム構造で、第二フィールド予測であるときについての動きベクトル変換の概念を示す説明図である。
【図14】図7の動きベクトル変換装置における画像サイズ調整フラグによる動きベクトル調整器9の動作を示すフローチャートである。
【図15】図7の動きベクトルにおけるMPEG2のイントラマクロブロックに対する動きベクトル補整器11の動作原理を示すブロック線図である。
【図16】図2の画像情報変換装置における動きベクトル変換装置6の具体構成を示すブロック線図である。
【図17】図7の動きベクトル変換装置における動きベクトル再検索を行うMPEG2の16×16の動きベクトル→MPEG4の8×8の動きベクトル変換装置8でのフレーム構造、フレーム予測の場合の動きベクトル変換の概念を示す説明図である。
【図18】図7の動きベクトル変換装置における動きベクトル再検索を行う場合のMPEG2の画像圧縮情報を示すビットストリーム中の半画素精度の動きベクトルの、MPEG4 8×8の動きベクトルへの変換後の取り扱いを示した表図である。
【図19】図7の動きベクトル変換装置における動きベクトル再検索を行う場合の画像がフレーム構造で、第一フィールド予測である時について動きベクトル変換の概念を示す説明図である。
【図20】図7の動きベクトル変換装置における動きベクトル再検索を行う場合の画像がフレーム構造で、第二フィールド予測であるときの動きベクトル変換の概念を示す説明図である。
【図21】動きベクトル補整装置を示すブロック線図である。
【図22】8×8動を動きベクトルに施し、予測残差に基づき16×16の動きベクトルを生成する方式の動きベクトル再検索装置を示すブロック線図である。
【図23】空間補整による動きベクトルの歪を示す説明図である。
【図24】空間補整による動きベクトルの歪を示す説明図である。
【図25】フレーム破棄の説明図である。
【図26】Iフレーム破棄の説明図である。
【図27】Pフレーム破棄の説明図である。
【図28】Pフレーム破棄の説明図である。
【図29】参照画素がどのように複数のマクロブロックに重なるかを示す説明図である。
【図30】Pフレームを破棄する場合の動きベクトル合成アルゴリズムを示すフローチャートである。
【図31】動きベクトルの第2フィールドを参照する動きベクトルの時間補整の説明図である。
【図32】動きベクトル変換装置を示すブロック線図である。
【図33】動きベクトル変換装置を示すブロック線図である。
【図34】動きベクトル変換装置を示すブロック線図である。
【図35】本発明の実施の形態の動きベクトル変換方法の例のイントラフレームから変換されるVOPをP−VOPに変換する方法を示す説明図である。
【図36】本発明の実施の形態の動きベクトル変換装置の例を示すブロック線図である。
【図37】本発明の実施の形態のI→P動きベクトル変換装置の例を示すブロック線図である。
【符号の説明】
361 切り換えスイッチ、362 I→P−VOP動きベクトル変換装置、363 P→P−VOP動きベクトル変換装置、371 MPEG2動きベクトルバッファ、372 MPEG2→MPEG4 8×8MV変換装置、373 0MVと予測誤差の比較装置、374 動きベクトル整数画素検索装置、3758×8MV→16×16MV変換装置、376 0MVと予測誤差の比較装置、377 動きベクトル整数画素検索装置、378 動きベクトル半画素検索装置。

Claims (11)

  1. ビットストリームを復号して画像データを生成する復号手段と、
    上記復号手段により生成された画像データのPピクチャを一枚置きに破棄する破棄手段と、
    上記復号手段により生成された画像データのIピクチャを対象ピクチャとして、該対象ピクチャをPピクチャとして符号化する場合に、上記対象ピクチャの直前にあって上記破棄手段により破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが上記参照ピクチャを参照する参照動きベクトルを生成する生成手段と、
    上記生成手段により生成された参照動きベクトルを利用して、上記破棄手段により所定間隔でPピクチャが破棄された画像データを符号化する符号化手段と、を有し、
    上記復号手段により生成された画像データにおいて、上記破棄手段による破棄の対象とならないPピクチャがIピクチャの直前に存在しないようにする
    画像処理装置。
  2. 上記参照ピクチャに対する動きベクトルを格納する格納手段を更に有し、
    上記生成手段は、上記格納手段により格納された参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが上記参照ピクチャを参照する参照動きベクトルを生成する
    請求項1に記載の画像処理装置。
  3. 記ビットストリームはMPEG規格に従って符号化されたデータである
    請求項1に記載の画像処理装置。
  4. 上記符号化手段は、MPEG規格に従って符号化する
    請求項1に記載の画像処理装置。
  5. ビットストリームを復号して画像データを生成する復号ステップと、
    上記復号ステップにより生成された画像データのPピクチャを一枚置きに破棄する破棄ステップと、
    上記復号ステップにより生成された画像データのIピクチャを対象ピクチャとして、該対象ピクチャをPピクチャとして符号化する場合に、上記対象ピクチャの直前にあって上記破棄ステップにより破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが上記参照ピクチャを参照する参照動きベクトルを生成する生成ステップと、
    上記生成ステップにより生成された参照動きベクトルを利用して、上記破棄ステップにより所定間隔でPピクチャが破棄された画像データを符号化する符号化ステップと、を含み、
    上記復号ステップにて生成された画像データにおいて、上記破棄ステップにて破棄の対象とならないPピクチャがIピクチャの直前に存在しないようにする
    画像処理方法。
  6. ビットストリームを復号して得られる画像データを符号化する画像処理装置において、
    Pピクチャが一枚置きに破棄された画像データと、破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルを受け取る受け取り手段と、
    Pピクチャが一枚置きに破棄される前の画像データにおいて、上記破棄されるPピクチャの直後にある記ビットストリームのIピクチャを対象ピクチャとして、該対象ピクチャをPピクチャとして符号化する場合に、上記受け取り手段により受け取られた動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが上記参照ピクチャを参照する参照動きベクトルを生成する生成手段と、
    上記生成手段により生成された参照動きベクトルを利用して、上記受け取り手段により受け取られた画像データを符号化する符号化手段と、を有し、
    上記Pピクチャが一枚置きに破棄される前の画像データにおいて、該破棄の対象となっていないPピクチャがIピクチャの直前に存在しないようにする
    画像処理装置。
  7. 上記参照ピクチャに対する動きベクトルを格納する格納手段を更に有し、
    上記生成手段は、上記格納手段により格納された参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが上記参照ピクチャを参照する参照動きベクトルを生成する
    請求項6に記載の画像処理装置。
  8. ビットストリームを復号して得られる画像データを符号化する画像処理方法において、
    Pピクチャが一枚置きに破棄された画像データと、破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルを受け取る受け取りステップと、
    Pピクチャが一枚置きに破棄される前の画像データにおいて、上記破棄されるPピクチャの直後にある記ビットストリームのIピクチャを対象ピクチャとして、該対象ピクチャをPピクチャとして符号化する場合に、上記受け取りステップにより受け取られた動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが上記参照ピクチャを参照する参照動きベクトルを生成する生成ステップと、
    上記生成ステップにより生成された参照動きベクトルを利用して、上記受け取りステップにより受け取られた画像データを符号化する符号化ステップと、を含み、
    上記Pピクチャが一枚置きに破棄される前の画像データにおいて、該破棄の対象となっていないPピクチャがIピクチャの直前に存在しないようにする
    画像処理方法。
  9. 第1のビットストリームを第2のビットストリームに変換する画像処理装置において、
    上記第1のビットストリームのPピクチャを一枚置きに破棄する破棄手段と、
    上記第1のビットストリームのIピクチャを対象ピクチャとして、該対象ピクチャをP
    ピクチャとして変換する場合に、上記対象ピクチャの直前にあって上記破棄手段により破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが上記参照ピクチャを参照する参照動きベクトルを生成する生成手段と、
    上記生成手段により生成された参照動きベクトルを利用して、上記破棄手段により所定間隔でPピクチャが破棄された第1のビットストリームを上記第2のビットストリームに変換する変換手段と、を有し、
    上記第1のビットストリームにおいて、上記破棄手段による破棄の対象とならないPピクチャがIピクチャの直前に存在しないようにする
    画像処理装置。
  10. 上記破棄手段により破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルを格納する格納手段を更に有し、
    上記生成手段は、上記格納手段により格納された参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが参照する参照動きベクトルを生成する
    請求項9に記載の画像処理装置。
  11. 第1のビットストリームを第2のビットストリームに変換する画像処理方法において、
    上記第1のビットストリームのPピクチャを一枚置きに破棄する破棄ステップと、
    上記第1のビットストリームのIピクチャを対象ピクチャとして、該対象ピクチャをPピクチャとして変換する場合に、上記対象ピクチャの直前にあって上記破棄ステップにより破棄されるPピクチャが参照する参照ピクチャに対する動きベクトルの時間方向の長さを伸張することにより、上記対象ピクチャが上記参照ピクチャを参照する参照動きベクトルを生成する生成ステップと、
    上記生成ステップにより生成された参照動きベクトルを利用して、上記破棄ステップにより所定間隔でPピクチャが破棄された第1のビットストリームを上記第2のビットストリームに変換する変換ステップと、を含み、
    上記第1のビットストリームにおいて、上記破棄ステップにて破棄の対象とならないPピクチャがIピクチャの直前に存在しないようにする
    画像処理方法。
JP2000312309A 2000-10-12 2000-10-12 画像処理装置及び画像処理方法 Expired - Fee Related JP4682410B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000312309A JP4682410B2 (ja) 2000-10-12 2000-10-12 画像処理装置及び画像処理方法
US09/973,749 US6826231B2 (en) 2000-10-12 2001-10-11 Motion vector conversion of interlaced MPEG-2 to progressive MPEG-4
US10/947,197 US7224732B2 (en) 2000-10-12 2004-09-23 Motion vector conversion method and conversion apparatus of interlaced MPEG-2 to progressive MPEG-4

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000312309A JP4682410B2 (ja) 2000-10-12 2000-10-12 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2002125236A JP2002125236A (ja) 2002-04-26
JP4682410B2 true JP4682410B2 (ja) 2011-05-11

Family

ID=18791929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000312309A Expired - Fee Related JP4682410B2 (ja) 2000-10-12 2000-10-12 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (2) US6826231B2 (ja)
JP (1) JP4682410B2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4378824B2 (ja) * 2000-02-22 2009-12-09 ソニー株式会社 画像処理装置及び方法
JP4622077B2 (ja) 2000-10-11 2011-02-02 ソニー株式会社 画像処理装置及び画像処理方法
JP2002247588A (ja) * 2001-02-21 2002-08-30 Sony Corp 動きベクトル変換方法及び変換装置
GB2369952B (en) * 2001-03-10 2002-12-04 Ericsson Telefon Ab L M Transcoding of video signals
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US7154952B2 (en) 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US7463686B2 (en) * 2002-10-16 2008-12-09 Lg Electronics Inc. Method for determining motion vector and macroblock type
US7558323B2 (en) * 2002-11-27 2009-07-07 Hitachi Kokusai Electric Inc. Video data transmission method for changing transmission data amounts in accordance with a transmission speed and a transmission system therefor
US20050013498A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
US7567617B2 (en) 2003-09-07 2009-07-28 Microsoft Corporation Predicting motion vectors for fields of forward-predicted interlaced video frames
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
CN1301015C (zh) * 2003-12-15 2007-02-14 财团法人资讯工业策进会 适应性降低画面速率视讯转换编码系统
US7394939B2 (en) * 2003-12-17 2008-07-01 Microsoft Corporation Managing file stream generation
KR20050062836A (ko) * 2003-12-18 2005-06-28 학교법인 대양학원 트랜스코딩 방법 및 장치
KR100681252B1 (ko) * 2004-10-02 2007-02-09 삼성전자주식회사 트랜스코딩을 위해 출력 매크로블록 모드와 출력움직임벡터를 추정하는 방법 및 이를 이용한 트랜스코더
JP2007110348A (ja) * 2005-10-12 2007-04-26 Ntt Docomo Inc 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム、および動画像復号化プログラム
JP2007324830A (ja) * 2006-05-31 2007-12-13 Toshiba Corp フレームレート変換装置及びフレームレート変換方法
US8265157B2 (en) * 2007-02-07 2012-09-11 Lsi Corporation Motion vector refinement for MPEG-2 to H.264 video transcoding
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
CN102187678A (zh) * 2008-10-29 2011-09-14 松下电器产业株式会社 动态图像压缩编码中的编码处理方法和编码处理装置
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
US9749657B2 (en) 2011-01-21 2017-08-29 Sharp Kabushiki Kaisha Buffer compression for motion vector competition
US9055304B2 (en) * 2011-07-01 2015-06-09 Qualcomm Incorporated Reduced resolution pixel interpolation
US11284133B2 (en) * 2012-07-10 2022-03-22 Avago Technologies International Sales Pte. Limited Real-time video coding system of multiple temporally scaled video and of multiple profile and standards based on shared video coding information
US9693060B2 (en) 2012-11-16 2017-06-27 Qualcomm Incorporated Device and method for scalable coding of video information
US9344218B1 (en) * 2013-08-19 2016-05-17 Zoom Video Communications, Inc. Error resilience for interactive real-time multimedia applications
KR102264591B1 (ko) * 2015-02-27 2021-06-15 삼성전자주식회사 영상 처리 방법 및 이를 지원하는 전자 장치
US11496747B2 (en) * 2017-03-22 2022-11-08 Qualcomm Incorporated Intra-prediction mode propagation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10112865A (ja) * 1996-10-04 1998-04-28 Nippon Telegr & Teleph Corp <Ntt> 復号信号の符号化方法
JPH10336672A (ja) * 1997-05-30 1998-12-18 Oki Electric Ind Co Ltd 符号化方式変換装置およびその動きベクトル検出方法
JP2000244927A (ja) * 1999-02-23 2000-09-08 Matsushita Electric Ind Co Ltd 動画変換装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132915A (ja) 1998-10-22 2000-05-12 Matsushita Electric Ind Co Ltd ディスク装置およびそのデータ処理方法
JP3782243B2 (ja) 1998-10-29 2006-06-07 株式会社曙ブレーキ中央技術研究所 ブレーキ用摩擦材
JP2000191616A (ja) 1998-12-24 2000-07-11 Senju Pharmaceut Co Ltd 新規ジペプチジルアルデヒド誘導体およびそれを含有する医薬
JP3789048B2 (ja) * 1999-02-22 2006-06-21 株式会社東芝 動画像再符号化装置
JP2000310836A (ja) 1999-02-23 2000-11-07 Fuji Photo Film Co Ltd 熱現像感光材料の包装物
EP1139669A1 (en) * 2000-03-28 2001-10-04 STMicroelectronics S.r.l. Coprocessor for motion estimation in digitised video sequence encoders
US20030031179A1 (en) * 2001-08-08 2003-02-13 Jintae Oh Self-updateable longest prefix matching method and apparatus
US6980596B2 (en) * 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10112865A (ja) * 1996-10-04 1998-04-28 Nippon Telegr & Teleph Corp <Ntt> 復号信号の符号化方法
JPH10336672A (ja) * 1997-05-30 1998-12-18 Oki Electric Ind Co Ltd 符号化方式変換装置およびその動きベクトル検出方法
JP2000244927A (ja) * 1999-02-23 2000-09-08 Matsushita Electric Ind Co Ltd 動画変換装置

Also Published As

Publication number Publication date
US20020122488A1 (en) 2002-09-05
US20050036552A1 (en) 2005-02-17
US6826231B2 (en) 2004-11-30
JP2002125236A (ja) 2002-04-26
US7224732B2 (en) 2007-05-29

Similar Documents

Publication Publication Date Title
JP4682410B2 (ja) 画像処理装置及び画像処理方法
JP4542447B2 (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
JP4014263B2 (ja) 映像信号変換装置及び映像信号変換方法
US20050053137A1 (en) Predicting motion vectors for fields of forward-predicted interlaced video frames
JP2003219426A (ja) 画像情報符号化装置及び方法、画像情報復号装置及び方法、並びにプログラム
JP2006279573A (ja) 符号化装置と方法、ならびに復号装置と方法
JP2009089332A (ja) 動き予測方法及び動き予測装置
WO2012098845A1 (ja) 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置
JP4622077B2 (ja) 画像処理装置及び画像処理方法
JP4616057B2 (ja) 画像符号化装置及び画像符号化方法
JP4360093B2 (ja) 画像処理装置および符号化装置とそれらの方法
JPH07212761A (ja) 階層符号化装置及び階層復号化装置
JP2003169349A (ja) 画像情報符号化方法及び装置、画像情報復号方法及び装置、並びにプログラム
JP2002010267A (ja) 動きベクトル変換装置及び方法
JP4529295B2 (ja) 動きベクトル変換方法及び変換装置
JP4556286B2 (ja) 動きベクトル変換装置及び方法
JP4779207B2 (ja) 動きベクトル変換装置及び動きベクトル変換方法
JP2002044669A (ja) 画像情報変換装置及び方法
JP6735370B2 (ja) 復号化方法
JP6434172B2 (ja) 復号化方法
JP2002199399A (ja) 動きベクトル変換方法及び変換装置
JP6181242B2 (ja) 画像復号化方法
JP5951915B2 (ja) 画像復号化方法
JP5946980B1 (ja) 画像復号化方法
JP2001309389A (ja) 動きベクトル変換装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20090210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100506

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees