JP2002034046A - Method and device for converting image information - Google Patents

Method and device for converting image information

Info

Publication number
JP2002034046A
JP2002034046A JP2000215111A JP2000215111A JP2002034046A JP 2002034046 A JP2002034046 A JP 2002034046A JP 2000215111 A JP2000215111 A JP 2000215111A JP 2000215111 A JP2000215111 A JP 2000215111A JP 2002034046 A JP2002034046 A JP 2002034046A
Authority
JP
Japan
Prior art keywords
image
information
cosine transform
discrete cosine
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000215111A
Other languages
Japanese (ja)
Inventor
Kazufumi Sato
数史 佐藤
Kuniaki Takahashi
邦明 高橋
Teruhiko Suzuki
輝彦 鈴木
Yoichi Yagasaki
陽一 矢ケ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000215111A priority Critical patent/JP2002034046A/en
Publication of JP2002034046A publication Critical patent/JP2002034046A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To simplify a process at reducing a macro block. SOLUTION: There are provided an MPEG2 image information decoding part (I/P picture 2×8 down decoder) 26 where a skip image is decoded using only 2×8 component among discrete cosine conversion factor of 8×8 component of a macro block which constitutes MPEG2 image compression information by skip scanning, a scan converting part 27 where any one of first and second fields of the decoded skip image is selected to generate an image of sequential scanning, the generated sequential-scanning image, and an MPEG4 image information encoding part (I/P-VOP) 28 where the generated image is encoded into an MPEG4 image compression information.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、画像情報を変換す
る画像情報変換装置及び方法に関し、詳しくは、離散コ
サイン変換等の直交変換と動き補償によって圧縮された
MPEG等の画像情報(ビットストリーム)を衛星放
送、ケーブルTV、インターネット等のネットワークメ
ディアを介して受信する際に、若しくは光、磁気ディス
クのような記憶メディア上で処理する際に用いられる画
像情報変換装置及び方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image information conversion apparatus and method for converting image information, and more particularly, to image information (bit stream) such as MPEG compressed by orthogonal transform such as discrete cosine transform and motion compensation. The present invention relates to an image information conversion apparatus and method used when receiving an image through a network medium such as satellite broadcasting, cable TV, or the Internet, or when processing the same on a storage medium such as an optical disk or a magnetic disk.

【0002】[0002]

【従来の技術】近年、画像情報をディジタルとして取り
扱い、効率の高い情報の伝送、蓄積を目的とし、画像情
報特有の冗長性を利用して、離散コサイン変換等の直交
変換と動き補償により圧縮するMPEGなどの画像情報
圧縮方式が提供されている。そして、このような画像情
報圧縮方法に準拠した装置は、放送局などの情報配信、
及び一般家庭における情報受信の双方において普及しつ
つある。
2. Description of the Related Art In recent years, image information is handled as digital data, and for the purpose of transmitting and storing information with high efficiency, compression is performed by orthogonal transform such as discrete cosine transform and motion compensation using redundancy inherent in image information. An image information compression system such as MPEG is provided. Then, an apparatus conforming to such an image information compression method is used for information distribution of a broadcasting station or the like,
It is becoming widespread in both information reception in general households.

【0003】特に、MPEG2(ISO/IEC 13
818−2)は、汎用画像符号化方式として定義されて
おり、飛び越し走査画像及び順次走査画像の双方、並び
に標準解像度画像及び高精細画像を網羅する標準で、プ
ロフェッショナル用途及びコンシューマー用途の広範な
アプリケーションに今後とも用いられるものと予想され
る。
In particular, MPEG2 (ISO / IEC 13
818-2) is defined as a general-purpose image coding method, and is a standard covering both interlaced scan images and progressive scan images, as well as standard resolution images and high-definition images, and has a wide range of applications for professional use and consumer use. It is expected to be used in the future.

【0004】MPEG2圧縮方式を用いることにより、
高い圧縮率と良好な画質の実現が可能である。このため
には、例えば、720×480画素を持つ標準解像度の
飛び越し走査画像であれば4〜8Mbps、1920×
1088画素を持つ高解像度の飛び越し走査画像であれ
ば18〜22Mbpsの符号量(ビットレート)を割り
当てることが必要である。
[0004] By using the MPEG2 compression method,
A high compression rate and good image quality can be realized. For this purpose, for example, a standard resolution interlaced scanning image having 720 × 480 pixels is 4 to 8 Mbps and 1920 × 480.
For a high-resolution interlaced scan image having 1088 pixels, it is necessary to allocate a code amount (bit rate) of 18 to 22 Mbps.

【0005】今後広く普及するであろうと思われるディ
ジタル放送においても、このような圧縮方式によって画
像情報が伝送されるが、その規格には、標準解像度の画
像及び高解像度の画像が存在し、受信機においてはこの
両方を復号することの出来る機能を持つことが望まれ
る。
[0005] In digital broadcasting which is expected to be widely used in the future, image information is transmitted by such a compression method. Standards include an image having a standard resolution and an image having a high resolution. It is desirable that the device has a function capable of decoding both of them.

【0006】特に、標準解像度画像との共存を図り、安
価な受信機を構築するためには、高解像度画像情報を画
質劣化を最小限に抑えながら何らかの形で間引いて処理
する必要性がある。かかる問題は、ディジタル放送など
の伝送メディアにおいてのみならず、光ディスクやフラ
ッシュメモリ等の蓄積メディアにおいても生じ得るもの
と考えられる。
In particular, in order to coexist with standard-resolution images and construct an inexpensive receiver, it is necessary to process high-resolution image information by thinning it in some form while minimizing image quality deterioration. It is considered that such a problem can occur not only in transmission media such as digital broadcasting, but also in storage media such as optical disks and flash memories.

【0007】かかる問題を解決するために、本願出願人
は、先に図8に示すようなダウンデコーダを提案した。
このダウンデコーダは、MPEG2画像圧縮情報(ビッ
トストリーム)の符号化画像を構成する垂直方向及び水
平方向共に8成分(以下、8×8と表記する。他も同様
とする。)のブロックを4×4ブロックに変換する4×
4ダウンデコーダである。
In order to solve such a problem, the present applicant has previously proposed a down decoder as shown in FIG.
This down decoder is a block of 8 components (hereinafter, referred to as 8 × 8; the same applies to other blocks) in a vertical direction and a horizontal direction, which constitute an encoded image of MPEG2 image compression information (bit stream). 4x to convert to 4 blocks
4 down decoder.

【0008】この4×4ダウンデコーダは、符号バッフ
ァ1と、圧縮情報解析部2と、可変長復号化部3と、逆
量子化部4と、逆離散コサイン変換部(4×4)5と、
逆離散コサイン変換部(フィールド分離)6と、加算器
7と、動き補償部(フィールド予測)8と、動き補償部
(フレーム予測)9と、ビデオメモリ10と、画枠変換
・位相ずれ補正部11とから較正されている。
The 4 × 4 down decoder includes a code buffer 1, a compression information analysis unit 2, a variable length decoding unit 3, an inverse quantization unit 4, an inverse discrete cosine transform unit (4 × 4) 5, ,
Inverse discrete cosine transform section (field separation) 6, adder 7, motion compensation section (field prediction) 8, motion compensation section (frame prediction) 9, video memory 10, image frame conversion / phase shift correction section 11 and is calibrated.

【0009】符号バッファ1は入力される画像圧縮情報
を一時的に保持し、圧縮情報解析部2は入力画像圧縮情
報を解析し、可変長符号化部3は入力画像圧縮情報を可
変長復号し、逆量子化部4は可変長復号化部3の出力を
逆量子化する。
A code buffer 1 temporarily stores input image compression information, a compression information analysis unit 2 analyzes the input image compression information, and a variable length coding unit 3 performs variable length decoding of the input image compression information. , The inverse quantization unit 4 inversely quantizes the output of the variable length decoding unit 3.

【0010】また、縮小逆離散コサイン変換部(4×
4)5は逆量子化部4から出力された8×8成分の内で
低域4×4成分のみに逆離散コサイン変換を施し、縮小
逆離散コサイン変換部(フィールド分離)5は飛び越し
走査の画像を構成する第1フィールド及び第2フィール
ドを分離する。
A reduced inverse discrete cosine transform unit (4 ×
4) 5 performs inverse discrete cosine transform only on the low-frequency 4 × 4 component among the 8 × 8 components output from the inverse quantization unit 4, and the reduced inverse discrete cosine transform unit (field separation) 5 performs interlaced scanning. A first field and a second field constituting an image are separated.

【0011】さらに、動き補償部(フィールド予測)8
はビデオメモリ10から与えられた画像に対してフィー
ルド単位で動き予測して動き補償を行い、動き補償部
(フレーム予測)9はビデオメモリ10から与えられた
画像に対してフレーム単位で動き予測して動き補償を行
い、加算器7はこれらの出力と縮小逆離散コサイン変換
部(4×4)5及び縮小逆離散コサイン変換部(フィー
ルド分離)6の出力を加算し、ビデオメモリ10は加算
器7からの出力を記憶し、画枠/位相ずれ補正部11は
ビデオメモリ10に記憶された画像に画枠補正及び位相
ずれ補正を施して出力する。
Further, a motion compensator (field prediction) 8
Performs motion compensation by performing motion prediction on the image supplied from the video memory 10 on a field basis and performs motion prediction on the image supplied from the video memory 10 on a frame basis. The adder 7 adds these outputs to the output of the reduced inverse discrete cosine transform unit (4 × 4) 5 and the reduced inverse discrete cosine transform unit (field separation) 6, and the video memory 10 The image frame / phase shift correction unit 11 performs image frame correction and phase shift correction on the image stored in the video memory 10 and outputs the image.

【0012】可変長復号化部3においては、当該マクロ
ブロックの離散コサイン変換(discrete cosine tran
sformation; DCT)モードがフィールド離散コサイン変
換モードであるかフレーム離散コサイン変換モードであ
るかに応じて、後続の縮小逆離散コサイン変換部(4×
4)5若しくは縮小逆離散コサイン変換部(フィールド
分離)6において必要な離散コサイン変換係数のみを復
号し、あとはEOBが検出されるまで処理を行わないと
いうことも考えられる。
In the variable length decoding unit 3, a discrete cosine transform (discrete cosine transform) of the macro block is performed.
Depending on whether the DCT mode is the field discrete cosine transform mode or the frame discrete cosine transform mode, the subsequent reduced inverse discrete cosine transform unit (4 ×
4) It is also conceivable that only the necessary discrete cosine transform coefficients are decoded in 5 or the reduced inverse discrete cosine transform unit (field separation) 6, and the processing is not performed until the EOB is detected.

【0013】ここで、入力となるMPEG2画像圧縮情
報(ビットストリーム)がジグザグスキャンである場合
の可変長符号化部3における動作原理について、図9を
用いて説明する。なお、図9中の数字は、離散コサイン
変換係数を読み取る順序を示している。
Here, the principle of operation of the variable length coding unit 3 when the input MPEG2 image compression information (bit stream) is a zigzag scan will be described with reference to FIG. The numbers in FIG. 9 indicate the order in which the discrete cosine transform coefficients are read.

【0014】フレーム離散コサイン変換モードの場合に
は、図9のAに示すように、縮小逆離散コサイン変換部
(4×4)5は、8×8成分のマクロブロックの内で破
線で囲まれた低域4×4成分の離散コサイン変換係数の
みを可変長復号する。フィールド離散コサイン変換モー
ドの場合には、図9のBに示すように、縮小逆離散コサ
イン変換部(フィールド分離)6は、8×8成分のマク
ロブロックの内で破線で囲まれた低域4×8成分の離散
コサイン変換係数のみを可変長復号する。
In the case of the frame discrete cosine transform mode, as shown in FIG. 9A, the reduced inverse discrete cosine transform unit (4 × 4) 5 is surrounded by a broken line in the macroblock of the 8 × 8 component. Only the discrete cosine transform coefficients of the low frequency 4 × 4 component are subjected to variable length decoding. In the case of the field discrete cosine transform mode, as shown in FIG. 9B, the reduced inverse discrete cosine transform unit (field separation) 6 converts the low band 4 surrounded by a broken line in the macroblock of 8 × 8 components. Only the discrete cosine transform coefficients of × 8 components are variable-length decoded.

【0015】入力となるMPEG2画像圧縮情報(ビッ
トストリーム)がオルタネートスキャンである場合の可
変長符号化部3における動作原理について、図10を用
いて説明する。
The principle of operation of the variable length coding unit 3 when the input MPEG2 image compression information (bit stream) is an alternate scan will be described with reference to FIG.

【0016】フレーム離散コサイン変換モードの場合に
は、図10のAに示すように、逆離散コサイン変換部
(4×4)5は、8×8成分のマクロブロックの内で破
線で囲まれた低域4×4成分の離散コサイン変換係数の
みを可変長復号する。フィールド離散コサイン変換モー
ドの場合には、図10のBに示すように、逆離散コサイ
ン変換部(フィールド分離)6は、8×8成分のマクロ
ブロックの位置で低域4×8成分の離散コサイン変換係
数のみを可変長復号する。
In the case of the frame discrete cosine transform mode, as shown in FIG. 10A, the inverse discrete cosine transform unit (4.times.4) 5 is surrounded by a broken line in the macro block of the 8.times.8 component. Only the discrete cosine transform coefficients of the low-frequency 4 × 4 component are variable-length decoded. In the case of the field discrete cosine transform mode, as shown in FIG. 10B, the inverse discrete cosine transform unit (field separation) 6 performs the discrete cosine transform of the low frequency 4 × 8 component at the position of the 8 × 8 component macroblock. Variable length decoding is performed only on the transform coefficients.

【0017】逆量子化部4にて逆量子化された離散コサ
イン変換係数は、当該マクロブロックの離散コサイン変
換モードがフレーム離散コサイン変換モードである場合
には縮小逆離散コサイン変換部(4×4)5において、
当該マクロブロックの離散コサイン変換モードがフィー
ルド離散コサイン変換モードである場合には縮小逆離散
コサイン変換部(フィールド分離)6において逆離散コ
サイン変換が施される。
When the discrete cosine transform coefficient of the macroblock is the frame discrete cosine transform mode, the discrete cosine transform coefficient inversely quantized by the inverse quantizing unit 4 is a reduced inverse discrete cosine transform unit (4 × 4). ) 5.
When the discrete cosine transform mode of the macroblock is the field discrete cosine transform mode, the discrete inverse cosine transform unit (field separation) 6 performs inverse discrete cosine transform.

【0018】縮小逆離散コサイン変換部(4×4)5又
は縮小逆離散コサイン変換部(フィールド分離)6から
の出力は、当該マクロブロックがイントラマクロブロッ
クの場合は、ビデオメモリ10にそのまま格納される。
The output from the reduced inverse discrete cosine transform unit (4 × 4) 5 or the reduced inverse discrete cosine transform unit (field separation) 6 is stored as it is in the video memory 10 when the macroblock is an intra macroblock. You.

【0019】縮小逆離散コサイン変換部(4×4)5又
は縮小逆離散コサイン変換部(フィールド分離)6から
の出力は、当該マクロブロックがインターマクロブロッ
クの場合は、動き補償モードがフィールド予測モードの
場合には動き補償部(フィールド予測)8により、動き
補償モードがフレーム予測モードの場合には動き補償部
(フレーム予測)9により、ビデオメモリ10内の参照
データを元に水平方向及び垂直方向共に1/4画素精度
の補間処理が施された予測画像と加算器7によって合成
されてビデオメモリ10に出力される。
The output from the reduced inverse discrete cosine transform unit (4 × 4) 5 or the reduced inverse discrete cosine transform unit (field separation) 6 indicates that the motion compensation mode is the field prediction mode when the macroblock is an inter macroblock. In the case of (1), the motion compensation unit (field prediction) 8 uses the reference data in the video memory 10 in the horizontal direction and the vertical direction based on the reference data in the video memory 10 when the motion compensation mode is the frame prediction mode. Both are combined by the adder 7 with the predicted image that has been subjected to the interpolation processing of 1/4 pixel precision and output to the video memory 10.

【0020】ビデオメモリ10に格納された画素値は、
上位レイヤーの画素に対応して、図11のAに示す上位
レイヤーや図11のBに示す下位レイヤーのように、第
1フィールド及び第2フィールドの間で位相ずれを含
む。
The pixel values stored in the video memory 10 are
Corresponding to the pixels in the upper layer, a phase shift is included between the first field and the second field as in the upper layer shown in FIG. 11A and the lower layer shown in FIG. 11B.

【0021】図11のAの上位レイヤーにおいては、第
1フィールドの画素a1及び第2フィールドの画素a2
が示されている。図11のBの下位レイヤーにおいて
は、第1フィールドの画素b1及び第2フィールドの画
素b2が示されている。図11のBに示す下位レイヤー
の画素値は縮小逆離散コサイン変換により上位レイヤー
の画素数を減じて得られるが、フィールド間の位相ずれ
を含んでいる。
In the upper layer of FIG. 11A, the pixel a1 in the first field and the pixel a2 in the second field
It is shown. In the lower layer of FIG. 11B, a pixel b1 in the first field and a pixel b2 in the second field are shown. Although the pixel value of the lower layer shown in FIG. 11B is obtained by reducing the number of pixels of the upper layer by the reduced inverse discrete cosine transform, it includes a phase shift between fields.

【0022】ビデオメモリ10に格納された画素値は、
画枠変換/位相ずれ補正部11によって表示装置に適し
た画枠サイズに変換されると同時にフィールド間の位相
ずれが補正される。
The pixel values stored in the video memory 10 are
The image frame is converted into an image frame size suitable for the display device by the image frame conversion / phase shift correction unit 11, and at the same time, the phase shift between the fields is corrected.

【0023】縮小逆離散コサイン変換部(4×4)5に
おける動作原理は、水平成分及び垂直成分共に、8×8
成分の離散コサイン変換係数の内低域4×4成分を取り
出し、これに4次の逆離散コサイン変換を施すというも
のである。
The principle of operation of the reduced inverse discrete cosine transform unit (4 × 4) 5 is that both the horizontal and vertical components are 8 × 8.
A 4 × 4 inner low-frequency component of the discrete cosine transform coefficient of the component is extracted, and a fourth-order inverse discrete cosine transform is performed on the component.

【0024】図12は、逆離散コサイン変換部(フィー
ルド分離型)5の処理を示したものである。すなわち、
入力となる画像圧縮情報(ビットストリーム)中の符号
化データである離散コサイン変換係数y1〜y8に、8×
8成分の逆離散コサイン変換を施し、復号化されたデー
タx1〜x8を得る。次に、これらを第1フィールドのデ
ータx1,x3,x5,x7と第2フィールドのデータ
2,x4,x6,x8に分離する。
FIG. 12 shows the processing of the inverse discrete cosine transform unit (field separation type) 5. That is,
The discrete cosine transform coefficients y 1 to y 8 , which are coded data in the input image compression information (bit stream), have 8 ×
Performs inverse discrete cosine transform of the 8 components to obtain data x 1 ~x 8 decoded. Next, to separate them in the first field data x 1 in, x 3, x 5, x 7 data x 2 in the second field, x 4, x 6, x 8.

【0025】分離されたそれぞれのデータ列に4×4成
分の離散コサイン変換を施し、第1フィールドに対する
離散コサイン変換係数z1,z3,z5,z7及び第2フィ
ールドに対する離散コサイン変換係数z2,z4,z6
8を得る。
Each of the separated data strings is subjected to a discrete cosine transform of 4 × 4 components, and discrete cosine transform coefficients z 1 , z 3 , z 5 , z 7 for the first field and discrete cosine transform coefficients for the second field. z 2 , z 4 , z 6 ,
get the z 8.

【0026】こうして得られた第1及び第2フィールド
に対する離散コサイン変換係数に間引き処理を行い低域
2成分を残す。すなわち、第1フィールドに対する離散
コサイン変換係数の内z5、z7、第2フィールドに対す
る離散コサイン変換係数の内z6、z8を破棄する。これ
によって、第1フィールドに対する離散コサイン変換係
数z1、z3及び第2フィールドに対する離散コサイン変
換係数z2、z4が残る。
The discrete cosine transform coefficients for the first and second fields obtained in this manner are subjected to thinning processing to leave two low-frequency components. That is, the inner z 5 of the discrete cosine transform coefficients for the first field, z 7, discards the inner z 6, z 8 discrete cosine transform coefficients for the second field. This leaves the discrete cosine transform coefficients z 1 , z 3 for the first field and the discrete cosine transform coefficients z 2 , z 4 for the second field.

【0027】間引きされた第1フィールドの低域離散コ
サイン変換成分z1、z3及び間引きされた第2フィール
ドの低域離散コサイン変換成分z2、z4に対してそれぞ
れ2×2の逆離散コサイン変換を施すことで、第1フィ
ールドに対する縮小された画素値x’1,x’3及び第2
フィールドに対する縮小され亜t画素値x’2,x’4
得られる。
The discrete discrete cosine transform components z 1 , z 3 of the decimated first field and the discrete cosine transform components z 2 , z 4 of the decimated second field are each 2 × 2 inverse discrete components. By performing the cosine transform, the reduced pixel values x ′ 1 , x ′ 3 and the second
By nitrous t pixel values x reduction for the field '2, x' 4 is obtained.

【0028】これらの値を再びフレーム合成することに
よって出力値となる画素値x’1〜x’4とする。
The pixel values x ′ 1 to x ′ 4 which are output values by synthesizing these values again in the frame are set.

【0029】尚、実際の処理はこれら一連の処理と等価
な行列を離散コサイン変換係数y1〜y8に施すことで、
直接画素値x’1〜x’4を得る。加法定理を用いて展開
計算することにより得られるこの行列[FSI]は次の
式(1)によって与えられる。
The actual processing is performed by applying a matrix equivalent to these series of processing to the discrete cosine transform coefficients y 1 to y 8 .
The pixel values x ′ 1 to x ′ 4 are directly obtained. This matrix [FS I ] obtained by expansion calculation using the addition theorem is given by the following equation (1).

【0030】[0030]

【数1】 (Equation 1)

【0031】但し、式(1)における要素A〜Jは、以
下のように定義される。
However, the elements A to J in the equation (1) are defined as follows.

【0032】[0032]

【数2】 (Equation 2)

【0033】[0033]

【数3】 (Equation 3)

【0034】[0034]

【数4】 (Equation 4)

【0035】[0035]

【数5】 (Equation 5)

【0036】[0036]

【数6】 (Equation 6)

【0037】[0037]

【数7】 (Equation 7)

【0038】[0038]

【数8】 (Equation 8)

【0039】[0039]

【数9】 (Equation 9)

【0040】[0040]

【数10】 (Equation 10)

【0041】[0041]

【数11】 [Equation 11]

【0042】4×4成分の縮小逆離散コサイン変換、及
びフィールド分離型縮小逆離散コサイン変換に関して
は、高速アルゴリズムによる実現が可能である。以下で
は、Wangのアルゴリズム(参考文献: Zhong de
Wang.,“Fast Algorithms for the Discrete W
Transform and for the Discrete Fourier Tra
nsform", IEEE Tr.ASSP-32, N0.4, pp.803-816, A
ug.1984)に基づく手法を示す。
The 4 × 4 reduced inverse discrete cosine transform and the field-separated reduced inverse discrete cosine transform can be realized by a high-speed algorithm. In the following, Wang's algorithm (reference: Zhong de
Wang., “Fast Algorithms for the Discrete W
Transform and for the Discrete Fourier Tra
nsform ", IEEE Tr.ASSP-32, N0.4, pp.803-816, A
ug.1984).

【0043】4×4成分の縮小逆離散コサイン変換を表
す行列は、Wangの高速化アルゴリズムを用いて、次
の式(2)のように分解される。
A matrix representing a reduced inverse discrete cosine transform of 4 × 4 components is decomposed as in the following equation (2) using a Wang speed-up algorithm.

【0044】[0044]

【数12】 (Equation 12)

【0045】但し、式(2)においては、以下のように
定義された小行列及び要素が用いられる。
However, in equation (2), small matrices and elements defined as follows are used.

【0046】[0046]

【数13】 (Equation 13)

【0047】[0047]

【数14】 [Equation 14]

【0048】[0048]

【数15】 (Equation 15)

【0049】この構成を表したものが図13である。こ
のように乗算器5個及び加算器9個を用いることで本装
置の実現が可能となる。
FIG. 13 shows this configuration. By using five multipliers and nine adders in this way, the present device can be realized.

【0050】図13においては、第0出力要素f(0)
は、加算器43において値s2及び値s5を加えること
により得られる。
In FIG. 13, the 0th output element f (0)
Is obtained by adding the value s2 and the value s5 in the adder 43.

【0051】ここで、値s2は、第0入力要素F(0)
と第2入力要素F(2)を加算器31にて加えた値を乗
算器34でA倍したものである。また、値s5は、第1
入力要素F(1)を乗算器37でC倍した値に加算器4
0において値s1を加えたものである。値s1は、第3
入力要素F(3)から第1入力要素F(1)を加算器3
3にて減じた値を乗算器38でD倍したものである。
Here, the value s2 is the 0th input element F (0)
And a second input element F (2) added by the adder 31 is multiplied by A in the multiplier 34. The value s5 is the first
An adder 4 adds a value obtained by multiplying the input element F (1) by C by the multiplier 37.
At 0, the value s1 is added. The value s1 is the third
The first input element F (1) is converted from the input element F (3) to an adder 3
The value reduced by 3 is multiplied by D in the multiplier 38.

【0052】第1出力要素f(1)は、値s3及び値s
4を加算器41において加えることにより得られる。
The first output element f (1) has a value s3 and a value s
4 in the adder 41.

【0053】ここで、値s3は、第0入力要素F(0)
から第2入力要素F(2)を加算器32で減じた値を乗
算器35でA倍したものである。値s4は、第3入力要
素F(3)を乗算器36でB倍した値から値s1を加算
器39において減算したものである。
Here, the value s3 is the 0th input element F (0)
And the second input element F (2) is subtracted by the adder 32 and multiplied by A in the multiplier 35. The value s4 is obtained by subtracting the value s1 in the adder 39 from the value obtained by multiplying the third input element F (3) by B in the multiplier 36.

【0054】第2出力要素f(2)は、値s4から値s
3を加算器42において減じることにより得られる。
The second output element f (2) changes the value s4 to the value s
It is obtained by subtracting 3 in the adder 42.

【0055】第3出力要素f(3)は、値s2から値s
5を加算器44において減じることにより得られる。
The third output element f (3) is calculated from the value s2 to the value s
5 in the adder 44.

【0056】図中では、次のような量が用いられてい
る。
In the figure, the following quantities are used.

【0057】 A=1/√2 B=−C1/8+C3/8 C=C1/8+C3/8 D=C3/8 但し、上の式では、以下のような数が用いられる。他も
同様である。
A = 1 / √2 B = −C 1/8 + C 3/8 C = C 1/8 + C 3/8 D = C 3/8 However, in the above equation, the following numbers are used. Can be Others are the same.

【0058】C3/8=cos(3π/8) フィールド分離型縮小逆離散コサイン変換を表す式
(1)の行列は、Wangの高速化アルゴリズムを用い
て、次の式(3)のように分解される。
C 3/8 = cos (3π / 8) The matrix of the expression (1) representing the field-separated reduced inverse discrete cosine transform is expressed by the following expression (3) using the Wang speed-up algorithm. Decomposed.

【0059】[0059]

【数16】 (Equation 16)

【0060】但し、式(3)における小行列は、以下の
ように定義されている。
However, the small matrix in equation (3) is defined as follows.

【0061】[0061]

【数17】 [Equation 17]

【0062】[0062]

【数18】 (Equation 18)

【0063】尚、要素A〜Jについては式(1)と同様
である。この構成を表したものが図14である。このよ
うに乗算器10個及び加算器13個を用いることで本装
置の実現が可能となる。
The elements A to J are the same as in the equation (1). FIG. 14 shows this configuration. By using 10 multipliers and 13 adders as described above, the present device can be realized.

【0064】すなわち、第0出力要素f(0)は、値s
16及び値s18が加算器70において加算されたもの
である。
That is, the zeroth output element f (0) has the value s
16 and the value s18 are added in the adder 70.

【0065】ここで、値s16は、値s11及び値s1
2が加算器66において加算されたものである。値s1
1は、第0入力要素F(0)が乗算器51においてA倍
されたものである。値s12は、第2入力要素F(2)
が乗算器52においてD倍された値と第4入力要素F
(4)が乗算器53においてF倍された値が加算器61
において加えられた値と、第6入力要素F(6)が乗算
器54においてH倍された値とが加算器63において加
えられたものである。
Here, the value s16 is the value s11 and the value s1.
2 is the value added by the adder 66. Value s1
1 is obtained by multiplying the zeroth input element F (0) by A in the multiplier 51. The value s12 is the second input element F (2)
Is multiplied by D in the multiplier 52 and the fourth input element F
The value obtained by multiplying (4) by F in the multiplier 53 is added to the adder 61.
, And the value obtained by multiplying the sixth input element F (6) by H in the multiplier 54 is added in the adder 63.

【0066】第1出力要素f(1)は、値s17から値
s19が加算器73において減ぜられたものである。
The first output element f (1) is obtained by subtracting the value s19 from the value s17 in the adder 73.

【0067】ここで、値s17は、値s11から値s1
2が加算器67において減ぜられたものである。値s1
9は、値s13及び値s15が加算器69において加え
られたものである。値s13は、第3入力要素F(3)
が乗算器55においてE倍された値から第5入力要素F
(5)が乗算器56においてG倍された値が加算器64
において減ぜられたものである。値s15は、第1入力
要素F(1)が乗算器58においてC倍された値及び第
7入力要素F(7)が乗算器60においてJ倍された値
が加算器65において加えられたものである。
Here, the value s17 is changed from the value s11 to the value s1.
2 has been subtracted in the adder 67. Value s1
9 is a value obtained by adding the value s13 and the value s15 in the adder 69. The value s13 is the third input element F (3)
From the value multiplied by E in the multiplier 55 to the fifth input element F
The value obtained by multiplying (5) by G in the multiplier 56 is added to the adder 64.
It was reduced in. The value s15 is obtained by adding the value obtained by multiplying the first input element F (1) by C in the multiplier 58 and the value obtained by multiplying the seventh input element F (7) by J in the multiplier 60 in the adder 65. It is.

【0068】第2出力要素f(2)は、値s17及び値
s19が加算器72において加えられたものである。
The second output element f (2) is obtained by adding the value s17 and the value s19 in the adder 72.

【0069】第3出力要素f(3)は、値s16から値
s18が加算器71において減ぜられたものである。
The third output element f (3) is obtained by subtracting the value s18 from the value s16 in the adder 71.

【0070】ここで、値s18は、値s13及び値s1
4が加算器68において加えられたものである。値s1
4は、第1入力要素F(1)が乗算器57においてB倍
された値及び第7入力要素F(7)が乗算器59におい
てI倍された値が加算器62において加えられたもので
ある。
Here, the value s18 is equal to the value s13 and the value s1.
4 has been added in the adder 68. Value s1
4 is a value obtained by adding the value obtained by multiplying the first input element F (1) by B in the multiplier 57 and the value obtained by multiplying the seventh input element F (7) by I in the multiplier 59 in the adder 62. is there.

【0071】次に、フィールド動き補償モード及びフレ
ーム動き補償モードに対応した動き補償部(フィールド
予測)8及び動き補償部(フレーム予測)9の動作につ
いて述べる。水平方向の補間に関しては、フィールド動
き補償モード、フレーム動き補償モードの場合共に、ま
ず、1/2精度相当の画素を、ハーフバンドフィルタの
様な2倍補間のフィルタによって作り出し、その作り出
された画素を元に1/4精度相当の画素を線形補間によ
って作り出す。その際、ハーフバンドフィルタを用いる
ことで、フレームメモリから取り出された画素と同じ位
相の画素値を予測画として出力する場合、タップ数に応
じた積和演算を行う必要がないために高速な演算が可能
である。また、ハーフバンドフィルタを用いることによ
り、補間に伴う除算をシフト演算で行うことが可能とな
り、さらに高速な実行が可能である。若しくは、4倍補
間のフィルタリングによって、動き補償に必要な画素を
直接作り出すことも考えられる。
Next, the operation of the motion compensation unit (field prediction) 8 and the motion compensation unit (frame prediction) 9 corresponding to the field motion compensation mode and the frame motion compensation mode will be described. Regarding the horizontal interpolation, in both the field motion compensation mode and the frame motion compensation mode, first, a pixel equivalent to 精度 precision is created by a double interpolation filter such as a half-band filter, and the created pixel is created. , A pixel equivalent to 1/4 precision is created by linear interpolation. At this time, when a half-band filter is used to output a pixel value having the same phase as a pixel extracted from the frame memory as a predicted image, it is not necessary to perform a multiply-accumulate operation according to the number of taps. Is possible. In addition, by using a half-band filter, division accompanying interpolation can be performed by a shift operation, and higher-speed execution is possible. Alternatively, it is also conceivable to directly create pixels required for motion compensation by filtering with quadruple interpolation.

【0072】図15はフィールド動き補償モード対応の
動き補償部8の垂直方向の補間に関するものである。ま
ず、入力となる画像圧縮情報(ビットストリーム)中の
動きベクトルの値に応じて、図15のAの様に、フィー
ルド間の位相ずれを含む画素値がビデオメモリ10から
取り出される。図中の左側の記号a1が第1フィールド
の画素に、右側の記号a2が第2フィールドの画素に、
それぞれ対応している。第1フィールドの画素及び第2
フィールドの画素は位相がずれている。
FIG. 15 relates to vertical interpolation of the motion compensator 8 corresponding to the field motion compensation mode. First, a pixel value including a phase shift between fields is fetched from the video memory 10 according to the value of the motion vector in the input image compression information (bit stream) as shown in FIG. In the figure, the symbol a1 on the left is a pixel in the first field, the symbol a2 on the right is a pixel in the second field,
Each corresponds. The pixels of the first field and the second
The pixels in the field are out of phase.

【0073】次に、図15のBの様に、ハーフバンドフ
ィルタ等の2倍補間フィルタを用いて、フィールド内で
1/2画素精度相当の画素値が作り出される。2倍補間
フィルタを用いて第1フィールド及び第2フィールド内
でそれぞれ2倍補間により作り出された画素はそれぞれ
記号b1及び記号b2で表される。
Next, as shown in FIG. 15B, a pixel value equivalent to 1/2 pixel precision is created in the field using a double interpolation filter such as a half band filter. Pixels created by double interpolation in the first field and the second field using the double interpolation filter are represented by symbols b1 and b2, respectively.

【0074】そして、図15のCの様に、フィールド内
で線形補間を行うことによって1/4画素精度相当の画
素値が作り出される。第1フィールド及び第2フィール
ド内でそれぞれ線形補間により作り出された画素はそれ
ぞれ記号c1及び記号c2にて示されている。その際、
ハーフバンドフィルタを用いることで、フレームメモリ
から取り出された画素と同じ位相の画素値を予測画とし
て出力する場合、タップ数に応じた積和演算を行う必要
がないために高速な演算が可能である。若しくは、図1
5のAの画素値を元に、4倍補間のフィルタリングによ
って図15のCの位相に相当する画素値を作り出すこと
も考えられる。
Then, as shown in FIG. 15C, by performing linear interpolation in the field, a pixel value equivalent to 1/4 pixel precision is created. Pixels created by linear interpolation in the first field and the second field, respectively, are indicated by symbols c1 and c2, respectively. that time,
By using a half-band filter, when outputting a pixel value having the same phase as a pixel extracted from the frame memory as a predicted image, it is not necessary to perform a product-sum operation according to the number of taps, so that high-speed operation is possible. is there. Or Figure 1
It is also conceivable to create a pixel value corresponding to the phase C in FIG. 15 by filtering the quadruple interpolation based on the pixel value A in FIG.

【0075】例えば、第1フィールドの画素が位置0、
位置1等に存在する場合には、2倍補間による画素は位
置0.5等に作り出される。さらに、線形補間による画
素は、位置0.25、位置0.75等に作り出される。
第2フィールドについても同様である。尚、図中では第
1フィールドの位置と第2フィールド位置とは0.25
ずれている。
For example, if the pixel in the first field is at position 0,
When the pixel exists at the position 1 or the like, the pixel by the double interpolation is created at the position 0.5 or the like. Further, pixels by linear interpolation are created at a position 0.25, a position 0.75, and the like.
The same applies to the second field. In the figure, the position of the first field and the position of the second field are 0.25.
It is out of alignment.

【0076】図16はフレーム動き補償モード対応の動
き補償部9の垂直方向の補間に関するものである。ま
ず、入力となる画像圧縮情報(ビットストリーム)中の
動きベクトルの値に応じて、図16のAの様に、フィー
ルド間の位相ずれを含む画素値がビデオメモリ10から
取り出される。図中の左側の記号a1が第1フィールド
の画素に、右側の記号a2が第2フィールドの画素に、
それぞれ対応している。第1のフィールドの画素及び第
2フィールドの画素は位相が擦れている。
FIG. 16 relates to the vertical interpolation of the motion compensation unit 9 corresponding to the frame motion compensation mode. First, according to the value of the motion vector in the input image compression information (bit stream), a pixel value including a phase shift between fields is fetched from the video memory 10 as shown in FIG. In the figure, the symbol a1 on the left is a pixel in the first field, the symbol a2 on the right is a pixel in the second field,
Each corresponds. The pixels in the first field and the pixels in the second field are out of phase.

【0077】次に、図16のBの様に、ハーフバンドフ
ィルタ等の2倍補間フィルタを用いて、フィールド内で
1/2画素精度相当の画素値が作り出される。2倍補間
フィルタを用いて第1フィールド及び第2フィールド内
でそれぞれ2倍補間により作り出された画素はそれぞれ
記号b1及び記号b2にて示されている。
Next, as shown in FIG. 16B, a pixel value equivalent to 1/2 pixel precision is created in the field using a double interpolation filter such as a half band filter. Pixels created by double interpolation in the first field and the second field using the double interpolation filter are indicated by symbols b1 and b2, respectively.

【0078】そして、図16のCの様に、フィールド間
で線形補間を行うことによって1/4画素精度相当の画
素値が作り出される。第1フィールド及び第2フィール
ドの画素の線形補間により作り出された画素は記号cに
て示されている。
Then, as shown in FIG. 16C, a pixel value equivalent to 1/4 pixel accuracy is created by performing linear interpolation between fields. Pixels created by linear interpolation of the pixels in the first and second fields are indicated by the symbol c.

【0079】例えば、第1フィールドの画素が位置0、
位置2等に、第2フィールドの画素が位置0.5、位置
2.5等に存在する場合には、第1フィールドの2倍補
間による画素は位置1等に、第2フィールドの2倍補間
による画素は位置1.5等に作り出される。さらに、線
形補間による画素は、位置0.25、位置0.75、位
置1.25及び位置1.75等に作り出される。
For example, if the pixel in the first field is at position 0,
If the pixel of the second field exists at the position 0.5, the position 2.5 or the like at the position 2 or the like, the pixel obtained by the double interpolation of the first field is at the position 1 or the like and the pixel of the second field is the double interpolation Are created at position 1.5 and so on. Further, pixels by linear interpolation are created at positions 0.25, 0.75, 1.25, 1.75, and the like.

【0080】このような補間処理を行うことにより、画
質劣化の要因となる、フィールド反転及びフィールドミ
ックスを防ぐことが出来る。また、ハーフバンドフィル
タを用いることで、フレームメモリから取り出された画
素と同じ位相の画素値を予測画として出力する場合、タ
ップ数に応じた積和演算を行う必要がないために高速な
演算が可能である。
By performing such interpolation processing, it is possible to prevent field inversion and field mixing, which cause image quality deterioration. In addition, by using a half-band filter, when outputting a pixel value having the same phase as a pixel extracted from the frame memory as a predicted image, it is not necessary to perform a product-sum operation according to the number of taps, so that high-speed operation can be performed. It is possible.

【0081】実際の処理としては、水平、垂直の場合共
に、上記の様な2倍補間フィルタと線形補間によって実
現される2段階の補間が、一度で行われる様な係数を予
め用意しておき、1段階の補間であるかの様に処理が行
われる。また、水平、垂直の場合共に、入力となる画像
圧縮情報(ビットストリーム)中の動きベクトルの値に
応じて、必要な画素値のみが作り出される。水平方向と
垂直方向の動きベクトルの値に応じたフィルタ係数を予
め用意しておき、水平方向と垂直方向の補間を一度に行
うことも可能である。
As the actual processing, in both the horizontal and vertical cases, coefficients are prepared in advance so that the two-stage interpolation realized by the double interpolation filter and the linear interpolation as described above is performed at once. The processing is performed as if it were a one-stage interpolation. In both horizontal and vertical cases, only necessary pixel values are created according to the value of the motion vector in the input image compression information (bit stream). It is also possible to prepare in advance filter coefficients according to the values of the horizontal and vertical motion vectors, and to perform interpolation in the horizontal and vertical directions at once.

【0082】尚、2倍補間のフィルタリングを行う際、
動きベクトルの値によって、ビデオメモリにおける画枠
の外を参照する必要が生じる場合がある。この場合は、
端点を中心にして必要なタップ数だけ対称に折り返すか
(以下これをミラー処理と呼ぶ。)、端点の画素値と同
じ値の画素が必要なタップ数の分だけ画枠の外に存在す
るものとして取り扱う(以下これをホールド処理と呼
ぶ。)。
When performing the double interpolation filtering,
Depending on the value of the motion vector, it may be necessary to refer to outside the image frame in the video memory. in this case,
Either wrap around the end point symmetrically for the required number of taps (hereinafter referred to as mirror processing) or have pixels with the same value as the pixel value of the end point outside the image frame by the required number of taps (This is hereinafter referred to as a hold process).

【0083】図17のAにミラー処理を示す。図中の記
号pはビデオメモリ10内の画素であり、記号qは補間
に必要となる画枠外の仮想的な画素である。この画枠外
の画素は、画枠内の画素を画枠について対称に折り返し
たものである。
FIG. 17A shows the mirror processing. The symbol p in the figure is a pixel in the video memory 10, and the symbol q is a virtual pixel outside the image frame required for interpolation. The pixels outside the image frame are obtained by folding the pixels inside the image frame symmetrically with respect to the image frame.

【0084】図17のBにはホールド処理を示す。この
画枠外の画素は、画枠内の画枠と垂直方向に対しては、
動き補償部(フィールド予測)8においても、動き補償
部(フレーム予測)9においても、ミラー処理若しくは
ホールド処理はフィールド単位で行う。或いはまた、水
平方向、垂直方向共に、画枠をはみ出した画素値に関し
ては、固定値(例えば128)とすることも考えられ
る。
FIG. 17B shows a hold process. Pixels outside this image frame are perpendicular to the image frame inside the image frame.
In both the motion compensation unit (field prediction) 8 and the motion compensation unit (frame prediction) 9, mirror processing or hold processing is performed in units of fields. Alternatively, a fixed value (for example, 128) may be considered for a pixel value that extends outside the image frame in both the horizontal direction and the vertical direction.

【0085】ところで、MPEG2は主として放送用に
適合する高画質符号化を対象としていたが、MPEG1
より低い符号量(ビットレート)、つまり高い圧縮率の
符号化方式には対応していなかった。携帯端末の普及に
より、今後そのような符号化方式のニーズは高まると思
われ、これに対応してMPEG4符号化方式の標準化が
行われた。画像符号化方式に関しては、1998年12
月にISO/IEC14496−2としてその規格書が
国際標準に承認された。
By the way, MPEG2 is mainly intended for high-quality encoding suitable for broadcasting, but MPEG1
It does not correspond to a coding method with a lower code amount (bit rate), that is, a high compression ratio. With the spread of mobile terminals, it is expected that the need for such an encoding system will increase in the future, and in response to this, the MPEG4 encoding system has been standardized. Regarding the image coding method,
In May, the standard was approved as an international standard as ISO / IEC14496-2.

【0086】また、ディジタル放送用に一度符号化され
たMPEG2画像圧縮情報(ビットストリーム)を、携
帯端末上等で処理するのにより適した、より低い符号量
(ビットレート)のMPEG4画像圧縮情報(ビットス
トリーム)に変換したいというニーズがある。
Also, MPEG4 image compression information (bit rate) having a lower code amount (bit rate), which is more suitable for processing MPEG2 image compression information (bit stream) once encoded for digital broadcasting on a portable terminal or the like. Bit stream).

【0087】かかる目的を達成する画像情報変換装置
(トランスコーダ)として、“Field-to-Frame Transc
oding with Spatial and Tempora1 Downsampling"
(SusieJ.Wee, John G.Apostolopoulos,and Nick Fe
amster,ICIP 99)では、図18に示すような装置が提案さ
れている。即ち、この装置は、ピクチャタイプ判別部1
2、MPEG2画像情報復号化部(I/Pピクチャ)1
3、間引き部14、MPEG4画像情報符号化部(I/
P−VOP)15、動きベクトル合成部16、動きベク
トル検出部17から構成されている。
Image information conversion apparatus for achieving the above object
(Transcoder) as “Field-to-Frame Transc
oding with Spatial and Tempora1 Downsampling "
(Susie J. Wee, John G. Apostolopoulos, and Nick Fe
amster, ICIP 99), an apparatus as shown in FIG. 18 was proposed.
Have been. In other words, this device includes a picture type discriminating unit 1
2. MPEG2 image information decoding unit (I / P picture) 1
3, thinning unit 14, MPEG4 image information encoding unit (I /
P-VOP) 15, a motion vector synthesis unit 16, a motion vector
It comprises a torque detector 17.

【0088】ピクチャタイプ判別部12には、飛び越し
走査のMPEG2画像圧縮情報(ビットストリーム)が
入力される。MPEG2画像圧縮情報(ビットストリー
ム)は、フレーム内で符号化されたイントラ符号化画像
(Iピクチャ)、表示順序で順方向を参照して符号化さ
れた順方向予測符号化画像(Pピクチャ)、表示順序で
順方向及び逆方向を参照して符号化された双方向予測符
号化画像(Bピクチャ)から構成されている。
The MPEG-2 image compression information (bit stream) of the interlaced scanning is input to the picture type determination unit 12. MPEG2 image compression information (bit stream) includes an intra-coded image (I picture) coded in a frame, a forward prediction coded image (P picture) coded by referring to the forward direction in the display order, It is composed of bidirectionally predicted coded images (B pictures) coded with reference to the forward and backward directions in the display order.

【0089】ピクチャタイプ判別部12においては、各
フレームのデータにおいて、I/Pピクチャに関するも
のか、Bピクチャに関するものであるかが判別され、前
者のみ、後続のMPEG2画像情報復号化部(I/Pピ
クチャ)13に出力される。
The picture type discriminating section 12 discriminates whether the data of each frame is related to an I / P picture or a B picture, and only the former is used for the subsequent MPEG2 image information decoding section (I / P P picture) 13.

【0090】MPEG2画像情報復号化部(I/Pピク
チャ)13における処理は通常のMPEG2画像情報復
号化装置と同様であるが、Bピクチャに関するデータは
ピクチャタイプ判別部12において廃棄されるため、M
PEG2画像情報復号化部(I/Pピクチャ)13にお
ける機能としてはI/Pピクチャのみを復号化出来れば
良い。
The processing in the MPEG2 image information decoding section (I / P picture) 13 is the same as that in the ordinary MPEG2 image information decoding apparatus.
The function of the PEG2 image information decoding unit (I / P picture) 13 only needs to be able to decode only the I / P picture.

【0091】MPEG2画像情報復号化部(I/Pピク
チャ)13の出力となる画素値は、間引き部14に入力
され、ここで、水平方向には1/2の間引き処理が施さ
れ、垂直方向には、第1フィールド若しくは第2フィー
ルドのどちらか一方のデータのみを残し、もう一方を廃
棄することで、入力となる画像情報の1/4の大きさを
持つ順次走査画像を生成する。
The pixel value output from the MPEG2 image information decoding unit (I / P picture) 13 is input to the thinning unit 14, where it is subjected to a half thinning process in the horizontal direction and to the vertical direction. In this method, only one of the data of the first field and the second field is left, and the other is discarded, thereby generating a progressively scanned image having a size of 1/4 of the input image information.

【0092】間引き部14によって生成された順次走査
画像はMPEG4画像情報符号化部(I/P−VOP)
15によつて符号化され、MPEG4画像圧縮情報(ビ
ットストリーム)として出力される。その際、入力とな
るMPEG2画像圧縮情報(ビットストリーム)中の動
きベクトル情報は、動きベクトル合成部16において間
引き後の画像情報に対する動きベクトルにマッピングさ
れ、動きベクトル検出部17においては、動きベクトル
合成部15において合成された動きベクトル値を元に高
精度の動きベクトルを検出する。
The progressively scanned image generated by the thinning unit 14 is an MPEG4 image information encoding unit (I / P-VOP)
15 and output as MPEG4 image compression information (bit stream). At this time, the motion vector information in the input MPEG2 image compression information (bit stream) is mapped to a motion vector for the decimated image information by the motion vector synthesis unit 16, and the motion vector A high-precision motion vector is detected based on the motion vector value synthesized by the unit 15.

【0093】図18に示した画像情報変換装置は、入力
となるMPEG2画像圧縮情報(ビットストリーム)が
NTSC規格(720×480画素、飛び越し走査)に
準ずるものである場合、その凡そ1/2×1/2の画枠
であるSIF(352×240画素、順次走査)の大き
さのMPEG4画像圧縮情報(ビットストリーム)を出
力するものである。しかしながら、MPEG4のターゲ
ットアプリケーションの1つである携帯情報端末におい
ては、モニタ部の解像度がSIFサイズの画像を表示し
きれないということもありうる。また、記憶メディアの
容量、或いは伝送経路のバンド幅により定められた符号
量(ビットレート)の元では、SIFサイズのままでは
良好な画質が得られないという問題が生じる場合もあ
る。このような場合、入力となるMPEG2画像圧縮情
報(ビットストリーム)の凡そ1/4×1/4の画枠で
あるQSIF(176×112画素、順次走査)に変換
する必要がある。さらに、後段で破棄されてしまう、画
像の持つ高域成分に関する情報もMPEG2画像情報復
号化部(I/Pピクチャ)13においては処理されてし
まうため、復号化に必要とされる演算量とメモリ容量が
冗長であると言える。
The image information conversion apparatus shown in FIG. 18 is arranged so that when the input MPEG2 image compression information (bit stream) conforms to the NTSC standard (720 × 480 pixels, interlaced scanning), about 1/2 × It outputs MPEG4 image compression information (bit stream) having a size of SIF (352 × 240 pixels, progressive scanning), which is a half image frame. However, in a portable information terminal that is one of the target applications of MPEG4, the resolution of the monitor unit may not be able to display an image having an SIF size. Also, under the condition of the code amount (bit rate) determined by the capacity of the storage medium or the bandwidth of the transmission path, there may be a problem that good image quality cannot be obtained with the SIF size. In such a case, it is necessary to convert the input MPEG2 image compression information (bit stream) into a QSIF (176 × 112 pixels, sequential scanning) which is an approximately 1/4 × 1/4 picture frame. Further, information on high-frequency components of the image, which is discarded in the subsequent stage, is also processed in the MPEG2 image information decoding unit (I / P picture) 13, so that the amount of computation and memory required for decoding are required. It can be said that the capacity is redundant.

【0094】かかる問題を解決するために、本願出願人
は、先に図19に示すような画像情報変換装置を提案し
た。
In order to solve such a problem, the present applicant has previously proposed an image information conversion apparatus as shown in FIG.

【0095】この画像情報変換装置は、ピクチャタイプ
判別部18と、MPEG2画像情報復号化部(I/Pピ
クチャ 4×4ダウンデコーダ)19と、走査変換部2
0と、間引き部21と、MPEG4画像情報符号化部
(I/P−VOP)22と、動きベクトル合成部23
と、動きベクトル検出部24とから構成されている。
This image information conversion apparatus includes a picture type discrimination section 18, an MPEG2 image information decoding section (I / P picture 4 × 4 down decoder) 19, and a scan conversion section 2.
0, a thinning unit 21, an MPEG4 image information encoding unit (I / P-VOP) 22, and a motion vector combining unit 23
And a motion vector detecting unit 24.

【0096】入力となる飛び越し走査のMPEG2画像
圧縮情報(ビットストリーム)は、まずピクチャタイプ
判別部18に入力され、ここで、I/Pピクチャに関す
る情報は出力されMPEG2画像情報復号化部(I/P
ピクチャ 4×4ダウンデコーダ)19の入力となる
が、Bピクチャに関する情報は破棄される。このように
してフレームレートの変換が行われる。MPEG2画像
情報復号化部(I/Pピクチャ 4×4ダウンデコー
ダ)19は図18に示したものと同等であるが、Bピク
チャに関する情報はピクチャタイプ判別部18において
既に破棄されているため、機能としてはI/Pピクチャ
のみの復号化処理が行えれば良い。水平方向及び垂直方
向共に低域4次情報のみを用いた復号化処理を行うこと
で、図19におけるMPEG2画像情報復号化部(I/
Pピクチャ 4×4ダウンデコーダ)19で必要とされ
るビデオメモリの容量は、図18におけるMPEG2画
像情報復号化部(I/Pピクチャ 4×4ダウンデコー
ダ)13の1/4で良く、また、逆離散コサイン変換に
要する演算量もフィールド離散コサイン変換モードの場
合には1/4、フレーム離散コサイン変換モードの場合
には1/2で良い。さらに、フレーム離散コサイン変換
モードの際、図20に示すように、4×8成分の離散コ
サイン変換係数の一部を0と置き換えることで、画質を
殆ど劣化させることなく演算量を削減することが可能で
ある。図中の記号aは、0と置き換える画素値を示して
いる。
The input MPEG-2 image compression information (bit stream) of the interlaced scanning is first input to the picture type discriminating section 18, where the information relating to the I / P picture is output and output to the MPEG2 image information decoding section (I / P P
Picture 4 × 4 down decoder) 19, but information on B pictures is discarded. The conversion of the frame rate is performed in this manner. The MPEG2 image information decoding unit (I / P picture 4 × 4 down decoder) 19 is the same as that shown in FIG. 18, but the information about the B picture has already been discarded by the picture type discriminating unit 18. As long as the decoding process of only the I / P picture can be performed. By performing the decoding process using only the low-frequency quaternary information in both the horizontal direction and the vertical direction, the MPEG2 image information decoding unit (I /
The capacity of the video memory required by the P picture 4 × 4 down decoder 19 may be 1/4 of the MPEG2 image information decoding unit (I / P picture 4 × 4 down decoder) 13 in FIG. The amount of calculation required for the inverse discrete cosine transform may be 1 / in the field discrete cosine transform mode, and 1 / in the frame discrete cosine transform mode. Furthermore, in the frame discrete cosine transform mode, as shown in FIG. 20, by replacing a part of the 4 × 8 discrete cosine transform coefficients with 0, it is possible to reduce the amount of calculation without substantially deteriorating the image quality. It is possible. Symbol a in the drawing indicates a pixel value to be replaced with 0.

【0097】MPEG2画像情報復号化部(I/Pピク
チャ 4×4ダウンデコーダ)19の出力となる、入力
となる画像圧縮情報(ビットストリーム)の1/2×1
/2の大きさを持つ飛び越し走査の画素データは、ま
ず、走査変換部20において、まず、第1フィールド若
しくは第2フィールドの内一方のみを残してもう一方を
破棄することで、入力となる画像圧縮情報(ビットスト
リーム)の1/2×1/4の大きさを持つ順次走査の画
素データへと変換され出力される。その動作原理を図2
1に示す。図21のAにおいて、第1フィールドの画素
a1及び第2フィールドの画素a2の内、第2フィール
ドa2の画素を破棄することにより図21のBに示す画
素bが得られる。
The output of the MPEG2 image information decoding unit (I / P picture 4 × 4 down decoder) 19 1 / × 1 × 1 of the input image compression information (bit stream)
The pixel data of the interlaced scanning having a size of / 2 is first input to the scan conversion unit 20 by leaving only one of the first field and the second field and discarding the other. The compressed information (bit stream) is converted into progressive scan pixel data having a size of 1/2 × 1 / and output. Fig. 2 shows the principle of operation.
1 is shown. In FIG. 21A, the pixel b shown in FIG. 21B is obtained by discarding the pixels in the second field a2 among the pixels a1 in the first field and the pixels a2 in the second field.

【0098】次に、走査変換部20の出力である、入力
となる画像圧縮情報(ビットストリーム)の1/2×1
/4の大きさを持つ順次走査の画素データは、間引き部
21へ入力され、ここで水平方向に1/2倍のダウンサ
ンプリングが施され、入力となる画像圧縮情報(ビット
ストリーム)の1/4×1/4の大きさを持つ順次走査
の画素データへと変換される。1/2倍のダウンサンプ
リングは、単純な間引き処理を用いても、或いは数タッ
プのローパスフィルタを用いても良い。その動作原理を
図22に示す。図22のAにおいて、画素aに対して水
平方向に1/2ダウンサンプリングすることにより図2
2のBに示す画素bが得られる。走査変換部20におけ
る処理と間引き部21の処理との順序は逆であっても良
い。間引き部21の出力である、入力となる画像圧縮情
報(ビットストリーム)の1/4×1/4の大きさを持
つ順次走査の画素データはMPEG4画像情報符号化部
(I/P−VOP)22において符号化処理がなされ
る。
Next, 1/2 × 1 of the input image compression information (bit stream) which is the output of the scan conversion unit 20
The pixel data of the progressive scanning having the size of / 4 is input to the thinning unit 21, where it is down-sampled by a factor of に in the horizontal direction, and 1 / 1 / of the input image compression information (bit stream). The data is converted into progressive scan pixel data having a size of 4 × 1 /. The downsampling of 1/2 times may use a simple thinning process or a low-pass filter with several taps. The operation principle is shown in FIG. In FIG. 22A, the pixel “a” is horizontally down-sampled by 1 / in FIG.
The pixel b shown in B of FIG. 2 is obtained. The order of the process in the scan conversion unit 20 and the process in the thinning unit 21 may be reversed. The pixel data of the progressive scanning having a size of 1 / × の of the input image compression information (bit stream) which is the output of the thinning unit 21 is an MPEG4 image information encoding unit (I / P-VOP). At 22, encoding processing is performed.

【0099】尚、MPEG4画像情報符号化部(I/P
―VOP)22においては、ブロック毎の処理を行うた
め、水平方向、垂直方向共に、輝度成分の画素数が16
の倍数である必要がある。色差成分に関しては、入力と
なる画像圧縮情報(ビットストリーム)が420フォー
マットの場合、水平方向、垂直方向共に8の倍数であれ
ば良い。422フォーマットの場合、水平方向は8の倍
数で良いが、垂直方向に関しては16の倍数でなければ
ならない。444フォーマットの場合には水平方向、垂
直方向共に16の倍数でなければならない。
Note that the MPEG4 image information encoding unit (I / P
-VOP) 22, since the processing is performed for each block, the number of pixels of the luminance component is 16 in both the horizontal and vertical directions.
Must be a multiple of Regarding the color difference component, when the input image compression information (bit stream) is in the 420 format, it may be a multiple of 8 in both the horizontal and vertical directions. In the case of the 422 format, the horizontal direction may be a multiple of 8, but the vertical direction must be a multiple of 16. In the case of the 444 format, it must be a multiple of 16 in both the horizontal and vertical directions.

【0100】このための垂直方向、水平方向の画素数の
調整をそれぞれ走査変換部20及び間引き部21にて行
う。すなわち、例えば入力となる画像圧縮情報(ビット
ストリーム)の輝度成分が720×480画素である場
合、走査変換部において第1若しくは第2フィールドの
み抜き出した後の画像の大きさは360×120とな
る。120は16の倍数でないので、16の倍数となる
よう、例えば下8ライン分の画素データを破棄して36
0×112画素とする。また、この画像を間引き部21
を用いて処理すると180×112画素となるが、18
0は16の倍数でないので、16の倍数となるよう、例
えば右8行を破棄し、176×112画素とする。
For this purpose, the number of pixels in the vertical and horizontal directions is adjusted by the scan converter 20 and the thinning unit 21, respectively. That is, for example, when the luminance component of the input image compression information (bit stream) is 720 × 480 pixels, the size of the image after extracting only the first or second field in the scan conversion unit is 360 × 120. . Since 120 is not a multiple of 16, pixel data for the lower eight lines are discarded so as to be a multiple of 16, for example, 36
It is assumed to be 0 × 112 pixels. Further, this image is converted to a thinning unit 21.
Is 180 × 112 pixels when processed using
Since 0 is not a multiple of 16, for example, the right 8 rows are discarded so as to be a multiple of 16 and are set to 176 × 112 pixels.

【0101】また、MPEG2画像情報復号化部(I/
Pピクチャ 4×4ダウンデコーダ)19において検出
される、入力となるMPEG2画像圧縮情報(ビットス
トリーム)中の動きベクトル情報は、動きベクトル合成
部23に入力され、ここで走査変換後の順次走査画像に
おける動きベクトル値にマッピングされる。動きベクト
ル検出部24においては、動きベクトル合成部23の出
力となる走査変換後の順次走査画像における動きベクト
ル値を元に高精度の動き検出を行う。
The MPEG2 image information decoding unit (I /
The motion vector information in the input MPEG2 image compression information (bit stream) detected by the P picture 4 × 4 down decoder 19 is input to the motion vector synthesis unit 23, where the sequentially converted image after scan conversion is input. To the motion vector value at. The motion vector detecting section 24 performs high-precision motion detection based on the motion vector values in the sequentially converted scanned image output from the motion vector synthesizing section 23.

【0102】[0102]

【発明が解決しようとする課題】ところで、図19に示
した画像情報変換装置におけるMPEG2画像情報復号
化部(I/Pピクチャ 4×4ダウンデコーダ)19
で、8次の離散コサイン変換係数のうち、低域4次係数
を取り出し、これに4次の逆離散コサイン変換を施すと
いう処理は、一種の低域通過フィルタバンクを施すのと
等価な処理であると言える。図19に示した画像情報変
換装置での水平成分に対する処理に関しては、まず、M
PEG2画像情報復号化装置(I/Pピクチャ 4×4
ダウンデコーダ)19において低域通過フィルタが施さ
れ、次に間引き部21において低域通過フィルタが施さ
れるため、2段階の低域通過フィルタ処理が行われるこ
とになり、処理が複雑になっていた。
The MPEG2 image information decoder (I / P picture 4 × 4 down decoder) 19 in the image information converter shown in FIG.
A process of extracting a low-order fourth-order coefficient from the eighth-order discrete cosine transform coefficients and performing a fourth-order inverse discrete cosine transform on this is a process equivalent to applying a kind of low-pass filter bank. It can be said that there is. Regarding the processing for the horizontal component in the image information conversion apparatus shown in FIG.
PEG2 image information decoding device (I / P picture 4 × 4
The low-pass filter is applied in the down decoder 19, and then the low-pass filter is applied in the decimation unit 21, so that two-stage low-pass filter processing is performed, which complicates the processing. Was.

【0103】本発明は、上述の実情に鑑みて提案される
ものであって、MPEG2画像圧縮情報(ビットストリ
ーム)の符号化画像を構成する画素ブロックを縮小する
際の処理を簡易化するような画像情報変換装置及び方法
を提供することを目的とする。
The present invention has been proposed in view of the above-described circumstances, and is intended to simplify the processing for reducing the pixel blocks constituting the encoded image of the MPEG2 image compression information (bit stream). It is an object to provide an image information conversion device and method.

【0104】[0104]

【課題を解決するための手段】上述の課題を解決するた
めに、本発明は、画像を水平方向及び垂直方向共に8成
分の画素からなる画素ブロックを単位として離散コサイ
ン変換した画像圧縮情報の解像度を変換するものであっ
て、飛び越し走査による画像を符号化した入力画像圧縮
情報を構成する画素ブロックの水平方向及び垂直方向共
に8成分の離散コサイン変換係数の内、水平方向に低域
2成分及び垂直方向に低域4成分のみを用いて飛び越し
走査の画像を復号し、復号された飛び越し走査の画像を
構成する第1フィールド及び第2フィールドのいずれか
一方を選択して順次走査の画像を生成し、生成された画
像を上記入力画像圧縮情報に対して水平方向及び垂直方
向共に1/4の解像度を有する出力画像圧縮情報に符号
化するものである。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, the present invention provides a resolution of image compression information obtained by performing discrete cosine transform on an image in units of a pixel block composed of pixels of eight components in both the horizontal and vertical directions. Of the discrete cosine transform coefficients of the eight components in both the horizontal and vertical directions of the pixel blocks constituting the input image compression information obtained by encoding the image obtained by the interlaced scanning, and The image of the interlaced scan is decoded using only the four low-frequency components in the vertical direction, and one of the first field and the second field constituting the decoded interlaced scan image is selected to generate an image of the progressive scan. Then, the generated image is encoded into output image compression information having a resolution of 1/4 in both the horizontal and vertical directions with respect to the input image compression information.

【0105】本発明は、飛び越し走査のMPEG2画像
圧縮情報(ビットストリーム)を入力画像圧縮情報と
し、順次走査のMPEG4画像圧縮情報(ビットストリ
ーム)を出力画像圧縮情報とする。
In the present invention, interlaced scanning MPEG2 image compression information (bit stream) is used as input image compression information, and progressive scanning MPEG4 image compression information (bit stream) is used as output image compression information.

【0106】MPEG2画像圧縮情報(ビットストリー
ム)及びMPEG4画像圧縮情報(ビットストリーム)
は、画像群すなわちGOP(group of pictures)及
びGOV(group of VOPs)からそれぞれ構成されて
いる。画像群であるGOP及びGOVは、複数の符号化
画像すなわちピクチャ(picture)及びVOP(videoob
ject plane)からそれぞれ構成され、符号化画像は複
数の画素から構成される画素ブロックすなわちマクロブ
ロックから構成されている。
MPEG2 image compression information (bit stream) and MPEG4 image compression information (bit stream)
Is composed of a group of pictures, that is, a group of pictures (GOP) and a group of VOPs (GOV). The group of images GOP and GOV includes a plurality of encoded images, that is, pictures and VOPs (videoob).
ject plane), and the encoded image is composed of a pixel block composed of a plurality of pixels, that is, a macroblock.

【0107】すなわち、本発明は、上述した課題を解決
するために、ピクチャタイプ判別部と、MPEG2画像
情報復号化部(I/Pピクチャ 2×4ダウンデコー
ダ)と、走査変換部と、MPEG4画像情報復号化部
(I/P−VOP)と、動きベクトル合成部と、動きベ
クトル検出部とを兼ね備え、入力となる画像圧縮情報
(ビットストリーム)の1/4×1/4の大きさを持つ
順次走査のMPEG4画像圧縮情報(ビットストリー
ム)を出力する手段を提供するものである。
That is, in order to solve the above-mentioned problems, the present invention provides a picture type discriminating unit, an MPEG2 image information decoding unit (I / P picture 2 × 4 down decoder), a scan conversion unit, and an MPEG4 image Combines an information decoding unit (I / P-VOP), a motion vector synthesis unit, and a motion vector detection unit, and has a size of 1 / × 1 / of the input image compression information (bit stream). It is intended to provide means for outputting MPEG4 image compression information (bit stream) of progressive scanning.

【0108】上記構成において、ピクチャタイプ判別部
は、入力となるMPEG2画像圧縮情報(ビットストリ
ーム)内で、I/Pピクチャに関するものだけ残してB
ピクチャに関するものは廃棄する。MPEG2画像情報
復号化部(I/Pピクチャ2×4ダウンデコーダ)は、
ピクチャタイプ判別部の出力となる、I/Pピクチャに
関する情報を、水平方向については8次の離散コサイン
変換係数のうち低域2次情報のみを用い、垂直方向につ
いては8次の離散コサイン変換係数のうち低域4次情報
のみを用いて部分復号を行う。走査変換部は、MPEG
2画像情報復号化部(I/Pピクチャ 2×4ダウンデ
コーダ)の出力となる画素値のうち、第一フィールド若
しくは第二フイールドのデータのみを残して残りを廃棄
することで入力画像の1/4×1/4の大きさの順次走
査画像へ変換する。MPEG4画像情報符号化部(I/
P−VOP)は、間引き部の出力となる順次走査の画像
データをMPEG4符号化して画像圧縮情報(ビットス
トリーム)として出力する。動きベクトル合成部は、M
PEG2画像情報復号化部(I/Pピクチャ 4×4ダ
ウンデコーダ)で検出された、入力となる画像圧縮情報
(ビットストリーム)内の動きベクトル値を元に、走査
変換後の画像データに対する動きベクトル値にマッピン
グを行う。動きベクトル検出部は、動きベクトル合成部
から出力される動きベクトル値を元に、高精度の動きベ
クトル検出を行う。
In the above arrangement, the picture type discriminating section leaves only those relating to I / P pictures in the MPEG2 image compression information (bit stream) to be input.
Discard the pictures. The MPEG2 image information decoding unit (I / P picture 2 × 4 down decoder)
Information about the I / P picture, which is output from the picture type discriminating unit, is obtained by using only low-frequency secondary information among the 8th-order discrete cosine transform coefficients in the horizontal direction, and the 8th-order discrete cosine transform coefficient in the vertical direction. , Partial decoding is performed using only the low-frequency fourth-order information. Scan conversion unit is MPEG
Of the pixel values output from the two-image information decoding unit (I / P picture 2 × 4 down decoder), only the data of the first field or the second field is left and the rest is discarded, so that 1/1 of the input image is discarded. The image is converted into a progressively scanned image having a size of 4 × 1 /. MPEG4 image information encoding unit (I /
P-VOP) encodes progressively scanned image data, which is output from the thinning unit, by MPEG4 encoding and outputs it as image compression information (bit stream). The motion vector synthesis unit calculates M
Based on the motion vector value in the input image compression information (bit stream) detected by the PEG2 image information decoding unit (I / P picture 4 × 4 down decoder), the motion vector for the image data after scan conversion Map to values. The motion vector detection unit performs highly accurate motion vector detection based on the motion vector value output from the motion vector synthesis unit.

【0109】[0109]

【発明の実施の形態】以下、図面を参照し、本発明の実
施の形態について説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0110】本発明を適用した画像情報変換装置を図1
を参照して説明する。
FIG. 1 shows an image information conversion apparatus to which the present invention is applied.
This will be described with reference to FIG.

【0111】この画像情報変換装置は、ピクチャタイプ
判別部25と、MPEG2画像情報復号化部(I/Pピ
クチャ 2×4ダウンデコーダ)26と、走査変換部2
7と、MPEG4画像情報復号化部(I/P−VOP)
28と、動きベクトル合成部29と、動きベクトル検出
部30とから構成される。
This image information conversion apparatus includes a picture type discrimination unit 25, an MPEG2 image information decoding unit (I / P picture 2 × 4 down decoder) 26, and a scan conversion unit 2
7, MPEG4 image information decoding unit (I / P-VOP)
28, a motion vector synthesis unit 29, and a motion vector detection unit 30.

【0112】ピクチャタイプ判別部25には、飛び越し
走査のMPEG2画像圧縮情報(ビットストリーム)が
入力される。このMPEG2画像圧縮情報(ビットスト
リーム)は、フレーム内で符号化されたイントラ符号化
画像(Iピクチャ)と、フレーム間で順方向に他の画像
を参照して予測符号化された順方向予測符号化画像(P
ピクチャ)と、フレーム間で順方向及び逆方向に他の画
像を参照して予測符号化された双方向予測符号化画像
(Bピクチャ)とから構成されている。
The MPEG2 image compression information (bit stream) of the interlaced scanning is input to the picture type determination unit 25. This MPEG2 image compression information (bit stream) is composed of an intra-coded image (I picture) coded in a frame and a forward prediction code predicted and coded by referring to another image in the forward direction between frames. Image (P
Picture) and a bidirectionally predicted coded image (B picture) that has been predictively coded with reference to other images in the forward and backward directions between frames.

【0113】ピクチャタイプ判別部25は、入力となる
MPEG2画像圧縮情報(ビットストリーム)内で、I
ピクチャ及びPピクチャだけ残してBピクチャは廃棄す
る。
[0113] The picture type discriminating section 25 determines whether or not the MPEG2 image compression information (bit stream) to be input is
The B picture is discarded while leaving only the picture and the P picture.

【0114】MPEG2画像情報復号化部26は、MP
EG2画像圧縮情報(ビットストリーム)の画像を構成
するマクロブロックの水平方向及び垂直方向共に8成分
(以下、8×8と表記する。)の離散コサイン変換(di
screte cosine transformation; DCT)係数の内で、
水平方向に低域2成分及び垂直方向に低域4成分(以
下、2×4と表記する。他でも同様とする。)のみを用
いてマクロブロックの部分的な復号を行う。
The MPEG2 image information decoding unit 26 outputs
Discrete cosine transform (di) of eight components (hereinafter, referred to as 8 × 8) in both the horizontal and vertical directions of macroblocks constituting an image of EG2 image compression information (bit stream).
screte cosine transformation (DCT) coefficient,
Partial decoding of a macroblock is performed using only two low-frequency components in the horizontal direction and four low-frequency components in the vertical direction (hereinafter, referred to as 2 × 4; the same applies to other components).

【0115】すなわち、MPEG2画像情報復号化部
(I/Pピクチャ 2×4ダウンデコーダ)26は、ピ
クチャタイプ判定部25からIピクチャ又はPピクチャ
(以下、I/Pピクチャと称する。)から構成されるM
PEG2画像圧縮情報(ビットストリーム)が入力さ
れ、I/Pピクチャから飛び越し走査の画像を復号す
る。
That is, the MPEG2 image information decoding section (I / P picture 2 × 4 down decoder) 26 is composed of an I picture or a P picture (hereinafter referred to as an I / P picture) from the picture type determination section 25. M
PEG2 image compression information (bit stream) is input, and an interlaced image is decoded from an I / P picture.

【0116】走査変換部27は、MPEG2画像情報復
号化部(I/Pピクチャ 2×4ダウンデコーダ)26
の出力となる飛び越し画像の内、第1フィールド又は第
2フィールドのいずれか一方を残して他を廃棄する。走
査変換部27は、残されたフィールドから順次走査の画
像を生成し、MPEG2入力画像圧縮情報(ビットスト
リーム)を構成する飛び越し走査の入力画像の1/4×
1/4の大きさの順次走査の画像に変換する。
The scan conversion unit 27 includes an MPEG2 image information decoding unit (I / P picture 2 × 4 down decoder) 26
Of the interlaced image output as above, one of the first field and the second field is discarded while the other is left. The scan conversion unit 27 generates a sequentially-scanned image from the remaining fields, and outputs 1/4 × of the interlaced input image constituting the MPEG2 input image compression information (bit stream).
The image is converted into a quarter-scan progressively scanned image.

【0117】MPEG4画像情報符号化部(I/P−V
OP)28は、走査変換部27から出力された、入力画
像の1/4×1/4の大きさを有する画像をMPEG4
符号化してMPEG4画像圧縮情報(ビットストリー
ム)として出力する。
The MPEG4 image information encoding unit (I / P-V
OP) 28 outputs the image output from the scan conversion unit 27 and having a size of 1/4 × 1 / of the input image according to MPEG4.
It is encoded and output as MPEG4 image compression information (bit stream).

【0118】このMPEG4画像圧縮情報(ビットスト
リーム)は、ビデオオブジェクト(video object; V
O)にて構成される。VOを構成する画面であるビデオ
オブジェクトプレイン(video object plane; VOP)
は、フレーム内符号化VOPであるI−VOPと、順方向
予測符号化VOPであるP−VOPと、双方向予測符号
化VOPと、スプライト符号化VOPとから構成され
る。
The MPEG4 image compression information (bit stream) is a video object (video object; V).
O). Video object plane (VOP), which is the screen that constitutes the VO
Is composed of an I-VOP which is an intra-frame coded VOP, a P-VOP which is a forward prediction coded VOP, a bidirectional prediction coded VOP, and a sprite coded VOP.

【0119】MPEG4画像情報符号化部(I/P−V
OP)28、走査変換部27から出力された画像をI−
VOP及び/又はP−VOP(I/P−VOP)にMP
EG4符号化してMPEG4画像圧縮情報(ビットスト
リーム)として出力する。
The MPEG4 image information encoding unit (I / P-V
OP) 28, the image output from the scan conversion unit 27 is
MP to VOP and / or P-VOP (I / P-VOP)
EG4 encoding and output as MPEG4 image compression information (bit stream).

【0120】動きベクトル合成部29は、MPEG2画
像情報復号化部(I/Pピクチャ2×4ダウンデコー
ダ)25で検出された、MPEG2画像圧縮情報(ビッ
トストリーム)内の動きベクトル値を元に、走査変換後
の画像にデータに対して動きベクトル値を用いたマッピ
ングを施す。
The motion vector synthesizing unit 29 is based on the motion vector value in the MPEG2 image compression information (bit stream) detected by the MPEG2 image information decoding unit (I / P picture 2 × 4 down decoder) 25. The image after the scan conversion is subjected to mapping using the motion vector value for the data.

【0121】動きベクトル検出部30は、動きベクトル
合成部29から出力される動きベクトル値を元に、高精
度の動きベクトル検出を行う。
The motion vector detecting section 30 performs highly accurate motion vector detection based on the motion vector value output from the motion vector synthesizing section 29.

【0122】次に、画像情報変換装置のMPEG2画像
情報復号化部(I/Pピクチャ 2×4ダウンデコー
ダ)26について、図2を参照して説明する。
Next, the MPEG2 image information decoding section (I / P picture 2 × 4 down decoder) 26 of the image information conversion apparatus will be described with reference to FIG.

【0123】このMPEG2画像情報復号化部(I/P
ピクチャ 2×4ダウンデコーダ)26は、符号バッフ
ァ31と、圧縮情報解析部32と、可変長復号化部33
と、逆量子化部34と、縮小逆離散コサイン変換部(2
×4)35と、縮小逆離散コサイン変換部(フィールド
分離)36と、加算器37と、動き補償部(フィールド
予測)38と、動き補償部(フレーム予測)39と、ビ
デオメモリ40とから構成されている。
This MPEG2 image information decoding unit (I / P
The picture 2 × 4 down decoder) 26 includes a code buffer 31, a compression information analyzer 32, and a variable length decoder 33.
, An inverse quantization unit 34, and a reduced inverse discrete cosine transform unit (2
× 4) 35, a reduced inverse discrete cosine transform unit (field separation) 36, an adder 37, a motion compensation unit (field prediction) 38, a motion compensation unit (frame prediction) 39, and a video memory 40. Have been.

【0124】MPEG2画像情報復号化部(I/Pピク
チャ 2×4ダウンデコーダ)26において、符号バッ
ファ31は入力される画像圧縮情報を一時的に保持し、
圧縮情報解析部32は入力画像圧縮情報を解析し、可変
長復号部33は入力画像圧縮情報を可変長復号し、逆量
子化部34は可変長復号化部33の出力を逆量子化す
る。
In the MPEG2 image information decoding section (I / P picture 2 × 4 down decoder) 26, the code buffer 31 temporarily stores the input image compression information.
The compression information analysis unit 32 analyzes the input image compression information, the variable length decoding unit 33 performs variable length decoding on the input image compression information, and the dequantization unit 34 dequantizes the output of the variable length decoding unit 33.

【0125】また、MPEG2画像情報復号化部(I/
Pピクチャ 2×4ダウンデコーダ)26において、縮
小逆離散コサイン変換部(2×4)35は逆量子化部3
4から出力された8×8成分の内で低域2×4成分のみ
に逆離散コサイン変換を施し、縮小逆離散コサイン変換
部(フィールド分離)36は飛び越し走査の画像を構成
する第1フィールド及び第2フィールドの分離をする。
The MPEG2 image information decoding unit (I /
In the P picture 2 × 4 down decoder) 26, the reduced inverse discrete cosine transform unit (2 × 4) 35 includes the inverse quantization unit 3
The inverse discrete cosine transform unit (field separation) 36 performs an inverse discrete cosine transform only on the low-frequency 2 × 4 component of the 8 × 8 components output from the first and second fields. Separate the second field.

【0126】さらに、MPEG2画像情報復号化部(I
/Pピクチャ 2×4ダウンデコーダ)26において、
動き補償部(フィールド予測)38はビデオメモリ40
から与えられた画像に対してフィールド単位で動き予測
して動き補償を行い、動き補償部(フレーム予測)39
はビデオメモリ40から与えられた画像に対してフレー
ム単位で動き予測して動き補償を行い、加算器37はこ
れらの出力と縮小逆離散コサイン変換部(4×4)35
及び縮小逆離散コサイン変換部(フィールド分離)36
の出力を加算し、ビデオメモリ40は加算器37からの
出力を記憶して出力する。
Further, the MPEG2 image information decoding unit (I
/ P picture 2 × 4 down decoder) 26
The motion compensator (field prediction) 38 is a video memory 40
The motion compensation unit (frame prediction) 39 performs motion compensation by performing motion prediction on an image given from
Performs motion compensation by predicting the motion of the image supplied from the video memory 40 on a frame basis, and the adder 37 outputs these outputs to the reduced inverse discrete cosine transform unit (4 × 4) 35
And reduced inverse discrete cosine transform unit (field separation) 36
, And the video memory 40 stores and outputs the output from the adder 37.

【0127】次に、MPEG2画像情報復号化部(I/
Pピクチャ 2×4ダウンデコーダ)26の縮小逆離散
コサイン変換装置(2×4)35及び縮小逆離散コサイ
ン変換装置(フィールド分離)36における水平方向に
対する動作原理について、図3を参照して説明する。
Next, the MPEG2 image information decoding unit (I /
The principle of operation in the horizontal direction of the reduced inverse discrete cosine transform device (2 × 4) 35 and the reduced inverse discrete cosine transform device (field separation) 36 of the P picture 2 × 4 down decoder 26 will be described with reference to FIG. .

【0128】離散コサイン変換装置(2×4)35及び
縮小逆離散コサイン変換装置(フィールド分離)36
は、入力となるMPEG2画像圧縮情報(ビットストリ
ーム)における8次の離散コサイン変換係数のうち、水
平方向には低域2次係数aのみを取り出し、これに2次
の逆離散コサイン変換を施す。この処理を図3に示す。
これにより、ビデオメモリの容量としては、入力となる
MPEG2画像圧縮情報(ビットストリーム)の持つ画
枠に対して、水平方向1/4及び垂直方向1/2で良
い。
The discrete cosine transform device (2 × 4) 35 and the reduced inverse discrete cosine transform device (field separation) 36
Extracts only the low-frequency second-order coefficient a in the horizontal direction from the eighth-order discrete cosine transform coefficients in the input MPEG2 image compression information (bit stream), and performs a second-order inverse discrete cosine transform. This process is shown in FIG.
Thus, the capacity of the video memory may be 1/4 in the horizontal direction and 1/2 in the vertical direction with respect to the image frame of the input MPEG2 image compression information (bit stream).

【0129】次に、MPEG2画像情報復号化部(I/
Pピクチャ 2×4ダウンデコーダ)26の動き補償装
置(フィールド予測)38及び動き補償装置(フレーム
予測)39における水平方向に対する動作原理につい
て、図4を参照して説明する。
Next, the MPEG2 image information decoding unit (I /
The principle of operation of the motion compensator (field prediction) 38 and the motion compensator (frame prediction) 39 of the P picture 2 × 4 down decoder 26 in the horizontal direction will be described with reference to FIG.

【0130】動き補償装置(フィールド予測)38及び
動き補償装置(フレーム予測)39においては、まず、
図4のAに示す通り、入力となるMPEG2画像圧縮情
報(ビットストリーム)における各マクロブロックに対
する動きベクトル情報を元に、ビデオメモリ40より画
素値aを抽出する。次に、図4のBに示すように、ビデ
オメモリ40より取り出された画素値aを元に、4倍補
間フィルタを用いて1/4画素精度の画素値bを生成す
る。フィルタリングに必要な画素値がビデオメモリ内の
アドレスに存在しない場合には、ミラー処理若しくはホ
ールド処理により仮想的な画素値を生成する。或いはま
た、固定された画素値(例えば128)を持つ画素が画
枠の外に仮想的に存在するとして処理を行っても良い。
更に、図4のCに示すように、線形内挿によって1/8
画素精度の画素値cを生成する。
In the motion compensation device (field prediction) 38 and the motion compensation device (frame prediction) 39, first,
As shown in FIG. 4A, the pixel value a is extracted from the video memory 40 based on the motion vector information for each macroblock in the input MPEG2 image compression information (bit stream). Next, as shown in FIG. 4B, based on the pixel value a extracted from the video memory 40, a pixel value b with 1/4 pixel accuracy is generated using a quadruple interpolation filter. If a pixel value required for filtering does not exist at an address in the video memory, a virtual pixel value is generated by mirror processing or hold processing. Alternatively, the processing may be performed assuming that a pixel having a fixed pixel value (for example, 128) virtually exists outside the image frame.
Further, as shown in FIG.
Generate a pixel value c with pixel accuracy.

【0131】実際の処理としては、一連の処理と等価な
係数を予め用意しておき、入力となるMPEG2画像圧
縮情報(ビットストリーム)における各マクロブロック
に対する水平方向成分及び垂直方向成分の動きベクトル
情報に応じた位相の画素値を直接生成することで高速な
実行が可能である。
As actual processing, coefficients equivalent to a series of processing are prepared in advance, and the motion vector information of the horizontal component and the vertical component for each macroblock in the input MPEG2 image compression information (bit stream) is prepared. By directly generating a pixel value having a phase corresponding to the above, high-speed execution is possible.

【0132】次に、MPEG2画像情報復号化部(I/
Pピクチャ 2×4ダウンデコーダ)26の可変長復号
化部33における処理について、図5を参照して説明す
る。可変長復号変換部33は、後続の縮小離散コサイン
変換部(2×4)35及び縮小離散コサイン変換部(フ
ィールド分離)36において必要な係数のみを複合化
し、後はEOBが検出されるまで処理を行わないように
することも出来る。
Next, the MPEG2 image information decoding unit (I /
The processing in the variable-length decoding unit 33 of the P picture (2 × 4 down decoder) 26 will be described with reference to FIG. The variable-length decoding conversion unit 33 combines only the necessary coefficients in the subsequent reduced discrete cosine conversion unit (2 × 4) 35 and reduced discrete cosine conversion unit (field separation) 36, and thereafter processes until the EOB is detected. Can be avoided.

【0133】フィールド離散コサイン変換モードの場
合、復号化される係数は、図5中で破線で囲まれた2×
4の離散コサイン変換係数である。図5のAはジグザグ
スキャンを、図5のBはオルタネートスキャンである。
図中の数字は、離散コサイン変換係数をスキャンする順
序を示すものである。これによって、可変長復号化部3
4における処理量の削減が可能である。
In the case of the field discrete cosine transform mode, the coefficient to be decoded is 2 ×
4 is the discrete cosine transform coefficient. FIG. 5A shows a zigzag scan, and FIG. 5B shows an alternate scan.
The numbers in the figure indicate the order in which the discrete cosine transform coefficients are scanned. Thereby, the variable length decoding unit 3
4, the amount of processing can be reduced.

【0134】同様に、フレーム離散コサイン変換モード
の場合、復号化される係数は、図6中の破線で囲まれた
2×4の離散コサイン変換係数である。図6中のAはジ
グザグスキャンを、図6中のBはオルタネートスキャン
である。図中の数字は、図5の場合と同様の意味であ
る。
Similarly, in the frame discrete cosine transform mode, the coefficients to be decoded are 2 × 4 discrete cosine transform coefficients surrounded by a broken line in FIG. A in FIG. 6 is a zigzag scan, and B in FIG. 6 is an alternate scan. The numbers in the figure have the same meanings as in FIG.

【0135】また、図7に示すように、2×8離散コサ
イン変換係数の一部の離散コサイン変換係数aを0と置
き換えることで、画質劣化を最小限に抑えながら、縮小
逆離散コサイン変換部(フィールド分離)36における
処理の削減が可能である。
Further, as shown in FIG. 7, by replacing a part of the 2 × 8 discrete cosine transform coefficients with 0, the reduced inverse discrete cosine transform unit can be performed while minimizing image quality deterioration. The processing in (field separation) 36 can be reduced.

【0136】以上述べた動作原理により、MPEG2画
像情報復号化部(I/Pピクチャ2×4ダウンデコー
ダ)26の出力として、入力となる飛び越し走査のMP
EG2画像圧縮情報(ビットストリーム)に対して1/
4×1/2の画枠を持つ、飛び越し走査の画像情報が得
られる。走査変換部27を用いて、この飛び越し走査の
画像情報の第一フィールド若しくは第二フィールドのみ
の情報を抽出して残りを破棄することで、入力となる飛
び越し走査のMPEG2画像圧縮情報(ビットストリー
ム)に対して1/4×1/4の画枠を持つ、順次走査の
画像情報が出力される。これにより、画像情報の間引き
を行う間引き部は不要になる。
In accordance with the operation principle described above, the output of the MPEG2 image information decoding unit (I / P picture 2 × 4 down decoder) 26 is used as the input of the interlaced scanning MP.
For EG2 image compression information (bit stream), 1 /
Interlaced image information having a 4 × 1/2 picture frame can be obtained. By using the scan converter 27 to extract information of only the first field or the second field of the interlaced image information and discarding the rest, the interlaced MPEG2 image compression information (bit stream) to be input is input. , A progressively scanned image information having an image frame of 4 × 1 / is output. This eliminates the need for a thinning unit for thinning image information.

【0137】以上、入力としてMPEG2画像圧縮情報
(ビットストリーム)を、出力としてMPEG4画像圧
縮情報(ビットストリーム)を対象としてきたが、入
力、出力ともこれに限らず、例えばMPEG−1やH.
263などの画像圧縮情報(ビットストリーム)でも良
い。
As described above, the MPEG2 image compression information (bit stream) has been targeted for input, and the MPEG4 image compression information (bit stream) has been targeted for output. However, input and output are not limited to this. For example, MPEG-1 or H.264.
H.263 or other image compression information (bit stream).

【0138】[0138]

【発明の効果】以上述べてきた様に、本発明は、飛び越
し走査のMPEG2画像圧縮情報(ビットストリーム)
を入力とし、より少ない演算処理量とビデオメモリ容量
を用いた回路構成により、入力となる画像圧縮情報(ビ
ットストリーム)の1/4×1/4解像度を持つ順次走
査のMPEG4画像圧縮情報(ビットストリーム)に変
換して出力する手段を提供するものである。
As described above, the present invention provides MPEG2 image compression information (bit stream) for interlaced scanning.
, And a progressively scanned MPEG4 image compression information (bit) having a resolution of 1 / × 1 / of the input image compression information (bit stream) by a circuit configuration using a smaller amount of arithmetic processing and video memory capacity. (Stream).

【0139】[0139]

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施の形態の画像情報装置の構成を示すブロ
ック図である。
FIG. 1 is a block diagram illustrating a configuration of an image information device according to an embodiment.

【図2】MPEG2画像情報復号化部(I/Pピクチャ
2×4ダウンデコーダ)の構成を示したブロック図で
ある。
FIG. 2 is a block diagram illustrating a configuration of an MPEG2 image information decoding unit (I / P picture 2 × 4 down decoder).

【図3】離散コサイン変換部(2×4)及び縮小逆離散
コサイン変換部(フィールド分離)における水平方向の
処理を示した図である。
FIG. 3 is a diagram illustrating horizontal processing in a discrete cosine transform unit (2 × 4) and a reduced inverse discrete cosine transform unit (field separation).

【図4】動き補償部(フィールド予測)及び動き補償部
(フレーム予測)における水平方向の処理を示した図で
ある。
FIG. 4 is a diagram illustrating horizontal processing in a motion compensation unit (field prediction) and a motion compensation unit (frame prediction).

【図5】入力となるMPEG2画像圧縮情報(ビットス
トリーム)がジグザグスキャンである場合の可変長復号
化部の動作原理を示した図である。
FIG. 5 is a diagram illustrating an operation principle of a variable length decoding unit when the input MPEG2 image compression information (bit stream) is a zigzag scan.

【図6】入力となるMPEG2画像圧縮情報(ビットス
トリーム)がオルタネートキャンである場合の可変長復
号化部の動作原理を示した図である。
FIG. 6 is a diagram illustrating an operation principle of a variable length decoding unit when the input MPEG2 image compression information (bit stream) is an alternate scan.

【図7】入力となる画像圧縮情報(ビットストリーム)
の当該マクロブロックがフレーム離散コサイン変換モー
ドである場合の処理量削減を実現する手法の例を示した
図である。
FIG. 7 is input image compression information (bit stream).
FIG. 5 is a diagram showing an example of a technique for realizing a reduction in the processing amount when the macroblock is in the frame discrete cosine transform mode.

【図8】本実施の形態の画像情報復号化装置(4×4ダ
ウンデコーダ)で、水平方向、垂直方向共に、8次の離
散コサイン変換係数の内、4次の低域情報のみを用いて
復号処理を行う装置構成を示したブロック図である。
FIG. 8 shows that the image information decoding apparatus (4 × 4 down decoder) according to the present embodiment uses only the fourth-order low-frequency information among the eight-order discrete cosine transform coefficients in both the horizontal and vertical directions. It is the block diagram which showed the apparatus structure which performs a decoding process.

【図9】入力となるMPEG2画像圧縮情報(ビットス
トリーム)がジグザグスキャンである場合の可変長復号
化部の動作原理を示した図である。
FIG. 9 is a diagram illustrating an operation principle of the variable length decoding unit when the input MPEG2 image compression information (bit stream) is a zigzag scan.

【図10】入力となるMPEG2画像圧縮情報(ビット
ストリーム)がオルタネートスキャンである場合の可変
長復号化部の動作原理を示した図である。
FIG. 10 is a diagram illustrating the operation principle of the variable length decoding unit when the input MPEG2 image compression information (bit stream) is an alternate scan.

【図11】ビデオメモリ内における画素の位相を示した
図である。
FIG. 11 is a diagram showing a phase of a pixel in a video memory.

【図12】縮小逆離散コサイン変換部(フィールド分
離)における動作原理を示した図である。
FIG. 12 is a diagram illustrating an operation principle in a reduced inverse discrete cosine transform unit (field separation).

【図13】縮小逆離散コサイン変換部(4×4)におけ
る動作を高速アルゴリズムを用いて実現する手法を示し
た図である。
FIG. 13 is a diagram illustrating a technique for realizing the operation in the reduced inverse discrete cosine transform unit (4 × 4) using a high-speed algorithm.

【図14】縮小逆離散コサイン変換部(フィールド分
離)における処理を、高速アルゴリズムを用いて実現す
る手法を示した図である。
FIG. 14 is a diagram illustrating a method of realizing the processing in the reduced inverse discrete cosine transform unit (field separation) using a high-speed algorithm.

【図15】動き補償部(フィールド予測)における動作
原理を示した図である。
FIG. 15 is a diagram illustrating an operation principle in a motion compensation unit (field prediction).

【図16】動き補償部(フレーム予測)における動作原
理を示した図である。
FIG. 16 is a diagram illustrating an operation principle in a motion compensation unit (frame prediction).

【図17】動き補償部(フィールド予測)及び動き補償
部(フレーム予測)におけるホールド処理/ミラー処理
の手法を示した図である。
FIG. 17 is a diagram showing a technique of a hold process / mirror process in a motion compensation unit (field prediction) and a motion compensation unit (frame prediction).

【図18】MPEG2画像圧縮情報(ビットストリー
ム)を入力とし、MPEG4画像圧縮情報(ビットスト
リーム)を出力する画像情報変換部(トランスコーダ)
の従来技術の構成を示した図である。
FIG. 18 is an image information conversion unit (transcoder) that receives MPEG2 image compression information (bit stream) and outputs MPEG4 image compression information (bit stream).
1 is a diagram showing the configuration of the related art.

【図19】本願出願人により提案された画像情報変換装
置の構成を示すブロック図である。
FIG. 19 is a block diagram showing a configuration of an image information conversion device proposed by the present applicant.

【図20】入力となる画像圧縮情報(ビットストリー
ム)の当該マクロブロックがフレーム離散コサイン変換
モードである場合の処理量削減を実現する手法の例を示
した図である。
FIG. 20 is a diagram illustrating an example of a technique for reducing the processing amount when the macroblock of the input image compression information (bit stream) is in the frame discrete cosine transform mode.

【図21】走査変換部における動作原理を説明した図で
ある。
FIG. 21 is a diagram illustrating the operation principle of the scan conversion unit.

【図22】間引き部における動作原理を説明した図であ
る。
FIG. 22 is a diagram illustrating the operation principle of the thinning unit.

【符号の説明】[Explanation of symbols]

25 ピクチャタイプ判別部、26 MPEG2画像情
報復号化部(I/Pピクチャ 2×4ダウンデコー
ダ)、27 走査変換部、28 MPEG4画像情報符
号化部(I/P−VOP)、29 動きベクトル合成
部、30動きベクトル検出部
25 picture type discriminator, 26 MPEG2 image information decoder (I / P picture 2 × 4 down decoder), 27 scan converter, 28 MPEG4 image information encoder (I / P-VOP), 29 motion vector synthesizer , 30 motion vector detection unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 輝彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 矢ケ崎 陽一 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5C053 FA20 FA23 FA30 GA11 GB07 GB38 GB40 KA04 KA11 KA21 KA24 LA06 LA14 5C059 KK10 KK15 KK33 LA05 LB16 LB18 MA00 MA04 MA05 MA14 MA23 MB14 MC38 ME01 NN01 SS02 SS08 SS12 TA08 TA18 TA50 TA57 TB08 TC12 TD20 UA02 UA05 5J064 AA02 BA09 BB03 BC01 BC08 BC16 BD03  ──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Teruhiko Suzuki 6-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Inside Sony Corporation (72) Inventor Yoichi Yagasaki 6-35, Kita-Shinagawa, Shinagawa-ku, Tokyo Sony Corporation F-term (reference) UA02 UA05 5J064 AA02 BA09 BB03 BC01 BC08 BC16 BD03

Claims (27)

【特許請求の範囲】[Claims] 【請求項1】 画像を水平方向及び垂直方向共に8成分
の画素からなる画素ブロックを単位として離散コサイン
変換した画像圧縮情報の解像度を変換する画像情報変換
装置において、 飛び越し走査による画像を符号化した入力画像圧縮情報
を構成する画素ブロックの水平方向及び垂直方向共に8
成分の離散コサイン変換係数の内、水平方向に低域2成
分及び垂直方向に低域4成分のみを用いて飛び越し走査
の画像を復号する復号化手段と、 上記復号化手段で復号された飛び越し走査の画像を構成
する第1フィールド及び第2フィールドのいずれか一方
を選択して順次走査の画像を生成する走査変換手段と、 上記走査変換手段で変換された画像を上記入力画像圧縮
情報に対して水平方向及び垂直方向共に1/4の解像度
を有する出力画像圧縮情報に符号化する符号化手段とを
有することを特徴とする画像情報変換装置。
An image information conversion apparatus for converting the resolution of image compression information obtained by performing discrete cosine transform on a pixel block composed of pixels of eight components in both the horizontal and vertical directions, wherein the image obtained by the interlaced scanning is encoded. 8 in both the horizontal and vertical directions of the pixel blocks constituting the input image compression information
Decoding means for decoding an image of interlaced scanning using only two low-frequency components in the horizontal direction and four low-frequency components in the vertical direction, among the discrete cosine transform coefficients of the components, and interlaced scanning decoded by the decoding means. Scan conversion means for selecting one of the first field and the second field constituting the image of the above and generating a progressively scanned image; and converting the image converted by the scan conversion means with respect to the input image compression information. Encoding means for encoding output image compression information having a resolution of 1/4 in both the horizontal and vertical directions.
【請求項2】 上記入力画像圧縮情報はMPEG2規格
によるものであり、上記出力画像圧縮情報はMPEG4
規格によるものであることを特徴とする請求項1記載の
画像情報変換装置。
2. The compressed image information according to the MPEG2 standard, and the compressed image information according to the MPEG4 standard.
2. The image information conversion device according to claim 1, wherein the image information conversion device conforms to a standard.
【請求項3】 上記入力画像圧縮情報は、フレーム内で
符号化されたイントラ符号化画像と、フレーム間で順方
向に他の画像を参照して予測符号化された順方向予測符
号化画像と、フレーム間で順方向及び逆方向に他の画像
を参照して予測符号化された双方向予測符号化画像とか
ら構成され、上記入力画像圧縮情報を構成する画像の種
類を判別し、イントラ符号化画像及び順方向予測符号化
画像を通過させるが双方向予測符号化画像を破棄する判
別手段を有し、上記復号化手段にはこの判別手段を介し
た画像圧縮情報が入力されることを特徴とする請求項1
記載の画像情報変換装置。
3. The input image compression information includes an intra-coded image coded in a frame, a forward prediction coded image predicted and coded with reference to another image in a forward direction between frames. And a bidirectional predictive coded image that is predictively coded with reference to another image in the forward and backward directions between frames, and determines the type of image that constitutes the input image compression information. And a discriminating means for passing the coded image and the forward predictive coded image but discarding the bidirectional predictive coded image, wherein the decoding means receives image compression information through the discriminating means. Claim 1
The image information conversion device described in the above.
【請求項4】 上記復号化手段は、イントラ符号化画像
及び順方向予測符号化画像のみ復号することを特徴とす
る請求項3記載の画像情報変換装置。
4. The image information conversion apparatus according to claim 3, wherein said decoding means decodes only the intra-coded image and the forward prediction coded image.
【請求項5】 上記入力画像圧縮情報は可変長符号化さ
れたものであって、上記復号化手段は、画像圧縮情報を
可変長復号する可変長復号化手段と、この可変長復号化
手段で可変長復号された画像圧縮情報に逆離散コサイン
変換を施す逆離散コサイン変換手段を有し、上記可変長
復号化手段は、上記入力画像圧縮情報を構成する画素ブ
ロックがフィールドモード又はフレームモードのいずれ
であるかに応じて上記逆離散コサイン変換手段における
逆離散コサイン変換に必要な離散コサイン変換係数のみ
を可変長復号することを特徴とする請求項1記載の画像
情報変換装置。
5. The input image compression information has been subjected to variable-length encoding. The decoding means includes a variable-length decoding means for performing variable-length decoding on the image compression information, and a variable-length decoding means. An inverse discrete cosine transform unit for performing an inverse discrete cosine transform on the variable-length-decoded image compression information, wherein the variable-length decoding unit determines whether the pixel blocks constituting the input image compression information are in a field mode or a frame mode. 2. The image information conversion apparatus according to claim 1, wherein only the discrete cosine transform coefficients necessary for the inverse discrete cosine transform in said inverse discrete cosine transform means are variable-length decoded according to the following equation.
【請求項6】 上記逆離散コサイン変換手段は、フィー
ルドモードに対応し、上記画素ブロックを構成する水平
方向及び垂直方向共に8成分の離散コサイン変換係数の
内で水平方向に低域2成分及び垂直方向に低域4成分の
離散コサイン変換係数に逆離散コサイン変換を施すこと
を特徴とする請求項5記載の画像情報変換装置。
6. The inverse discrete cosine transform means corresponds to a field mode, and includes two low-frequency components and a vertical component in a horizontal direction among discrete cosine transform coefficients having eight components in both horizontal and vertical directions constituting the pixel block. 6. The image information conversion apparatus according to claim 5, wherein an inverse discrete cosine transform is performed on the discrete cosine transform coefficients of four low-frequency components in the direction.
【請求項7】 上記逆離散コサイン変換は、所定の高速
アルゴリズムを用いて演算を実行することを特徴とする
請求項5記載の画像情報変換装置。
7. The image information conversion apparatus according to claim 5, wherein the inverse discrete cosine transform performs an operation using a predetermined high-speed algorithm.
【請求項8】 上記逆離散コサイン変換手段は、フレー
ムモードに対応し、上記画素ブロックを構成する水平方
向及び垂直方向共に8成分の離散コサイン変換係数の内
で水平方向に低域2成分の離散コサイン変換係数に逆離
散コサイン変換を施し、垂直方向にフィールド分離型の
逆離散コサイン変換を施すことを特徴とする請求項5記
載の画像情報変換装置。
8. The inverse discrete cosine transform means corresponds to a frame mode, and includes two discrete low-frequency cosine transform coefficients in the horizontal and vertical directions constituting the pixel block in both the horizontal and vertical directions. 6. The image information conversion apparatus according to claim 5, wherein an inverse discrete cosine transform is applied to the cosine transform coefficient, and a field separation type inverse discrete cosine transform is applied in a vertical direction.
【請求項9】 上記逆離散コサイン変換手段は、所定の
高速アルゴリズムを用いて演算を実行することを特徴と
する請求項8記載の画像情報変換装置。
9. The image information conversion apparatus according to claim 8, wherein said inverse discrete cosine transform means executes an operation using a predetermined high-speed algorithm.
【請求項10】 上記逆離散コサイン変換手段は、水平
方向に低域2成分及び垂直方向に8成分の離散コサイン
変換係数の内で、水平方向に低域2成分及び垂直方向に
低域4成分の離散コサイン変換係数に加えて水平方向及
び垂直方向共に低域2成分の離散コサイン変換係数のみ
を用い、残りの成分は0として逆離散コサイン変換を施
すことを特徴とする請求項8記載の画像情報変換装置。
10. The inverse discrete cosine transform means includes two low-frequency components in the horizontal direction and four low-frequency components in the vertical direction, among the discrete cosine transform coefficients of two low-frequency components in the horizontal direction and eight components in the vertical direction. 9. The image according to claim 8, wherein only the discrete cosine transform coefficients of two low-frequency components in both the horizontal and vertical directions are used in addition to the discrete cosine transform coefficients of the above, and the remaining components are set to 0 to perform inverse discrete cosine transform. Information conversion device.
【請求項11】 上記入力画像圧縮情報は動きベクトル
情報を用いて動き補償されたものであって、上記復号化
手段は動きベクトル情報を用いて画像を動き補償する動
き補償手段を有し、この動き補償手段は上記入力画像圧
縮情報の動きベクトル情報に基づいて、水平方向に1/
8及び垂直方向に1/4画素精度の補間処理を行うこと
を特徴とする請求項1記載の画像情報変換装置。
11. The input image compression information has been motion-compensated using motion vector information, and the decoding means has motion compensation means for motion-compensating an image using motion vector information. The motion compensator is configured to calculate 1/1 in the horizontal direction based on the motion vector information of the input image compression information.
2. The image information conversion apparatus according to claim 1, wherein interpolation processing is performed with a precision of 1/4 pixel in the vertical direction.
【請求項12】 上記動き補償手段は、水平方向の補間
処理を、2倍補間のディジタルフィルタを用いて1/4
画素精度の補間を行い、線形内挿により1/8画素精度
の補間を行うことを特徴とする請求項11記載の画像情
報変換装置。
12. The motion compensation means according to claim 1, wherein the interpolation processing in the horizontal direction is performed by using a 2 × interpolation digital filter.
12. The image information conversion apparatus according to claim 11, wherein interpolation is performed at a pixel precision, and interpolation is performed at a 1/8 pixel precision by linear interpolation.
【請求項13】 上記動き補償手段は、フィールドモー
ドの上記画素ブロックに対して、水平方向の補間処理
を、2倍補間のディジタルフィルタを用いて1/2画素
精度の補間を行い、さらに線形内挿により1/4画素精
度の補間をフィールド内で行うことを特徴とする請求項
11記載の画像情報変換装置。
13. The motion compensating means performs a horizontal interpolation process on the pixel block in the field mode with a half-pixel accuracy using a double interpolation digital filter. 12. The image information conversion apparatus according to claim 11, wherein interpolation of 1/4 pixel precision is performed in the field by interpolation.
【請求項14】 上記動き補償手段は、フレームモード
の上記画素ブロックに対して、垂直方向の補間処理を、
2倍補間のディジタルフィルタを用いて1/2画素精度
の補間を行い、さらに線形内挿により1/4画素精度の
補間をフィールド間で行うことを特徴とする請求項11
記載の画像情報変換装置。
14. The motion compensating means performs a vertical interpolation process on the pixel block in a frame mode.
12. A method according to claim 11, wherein a half-pixel precision interpolation is performed by using a two-fold interpolation digital filter, and a quarter-pixel precision interpolation is performed between fields by linear interpolation.
The image information conversion device described in the above.
【請求項15】 上記ディジタルフィルタは、ハーフバ
ンドフィルタであることを特徴とする請求項11記載の
画像情報変換装置。
15. The image information conversion device according to claim 11, wherein said digital filter is a half-band filter.
【請求項16】 上記ディジタルフィルタは、一連の補
間処理と等価な係数を予め算出し、上記入力画像圧縮情
報を構成する画素ブロックの動きベクトル情報の値に応
じ、画素値に上記係数を直接施すことを特徴とする請求
項15記載の画像情報変換装置。
16. The digital filter previously calculates a coefficient equivalent to a series of interpolation processing, and directly applies the coefficient to a pixel value according to a value of motion vector information of a pixel block constituting the input image compression information. The image information conversion device according to claim 15, wherein:
【請求項17】 上記動き補償手段は、2倍補間のフィ
ルタ処理を行うために必要な上記入力画像圧縮情報を構
成する画像の画枠の外に存在する画素に対しては、上記
画枠の外に必要な画素を仮想的に作り出すことによりフ
ィルタ処理を行うことを特徴とする請求項請求項11記
載の画像情報変換装置。
17. The image processing apparatus according to claim 1, wherein the motion compensating unit is configured to perform a double-interpolation filter process on pixels existing outside an image frame of the image constituting the input image compression information. 12. The image information conversion apparatus according to claim 11, wherein the filter processing is performed by virtually creating a necessary pixel outside.
【請求項18】 上記動き補償手段は、既存の画素の配
列の所定位置で折り返し、既存の画素の配列の延長、又
は所定値を用いることのいずれかにより上記画枠の外に
必要な画素を作り出すことを特徴とする請求項18記載
の画像情報変換装置。
18. The motion compensating means wraps a required pixel out of the image frame by folding back at a predetermined position of an existing pixel array and extending the existing pixel array or using a predetermined value. 19. The image information conversion device according to claim 18, wherein the image information conversion device creates the image information.
【請求項19】 上記走査変換手段は、上記復号化手段
にて復号された飛び越し走査の画像の第1フィールド又
は第2のフィールドのいずれか一方を選択することで上
記入力画像圧縮情報に対して水平方向に1/4及び垂直
方向共に1/2の解像度を有する飛び越し走査の画像か
ら上記入力画像圧縮情報に対して水平方向共に1/4の
解像度を有する順次走査の画像に変換することを特徴と
する請求項1記載の画像情報変換装置。
19. The scanning conversion means selects one of a first field and a second field of an interlaced scanning image decoded by the decoding means, thereby converting the input image compression information. It is characterized in that an interlaced image having a resolution of 1 / in the horizontal direction and 垂直 in both the vertical direction is converted into a progressively scanned image having a resolution of 共 に in both the horizontal direction and the input image compression information. The image information conversion device according to claim 1, wherein
【請求項20】 上記走査変換手段は、上記符号化手段
における画素ブロック対応の処理に対応するように垂直
方向の画素数を調整することを特徴とする請求項19記
載の画像情報変換装置。
20. The image information conversion apparatus according to claim 19, wherein said scan conversion means adjusts the number of pixels in the vertical direction so as to correspond to processing corresponding to a pixel block in said encoding means.
【請求項21】 上記出力画像圧縮情報は、フレーム内
で符号化されたイントラ符号化画像と、フレーム間で順
方向に他の画像を参照して予測符号化された順方向予測
符号化画像と、フレーム間で順方向及び逆方向に他の画
像を参照して予測符号化された双方向予測符号化画像
と、スプライト符号化画像とから構成され、上記符号化
手段は、上記イントラ符号化画像及び上記順方向予測符
号化画像により画像を符号化することを特徴とする請求
項1記載の画像情報変換装置。
21. The output image compression information includes an intra-coded image coded in a frame, a forward prediction coded image predicted and coded by referring to another image in a forward direction between frames, and A bidirectional predictive coded image predictively coded with reference to another image in the forward and backward directions between frames, and a sprite coded image, wherein the coding means includes the intra coded image 2. The image information conversion device according to claim 1, wherein the image is encoded using the forward prediction encoded image.
【請求項22】 上記画像圧縮情報は動きベクトル情報
によって動き補償されたものであって、この動き補償ベ
クトル情報を合成する動きベクトル合成手段を有し、上
記入力画像圧縮情報の動きベクトル情報に基づいて上記
間引き手段から出力された画像に対応する動きベクトル
情報を合成し、上記符号化手段はこの動きベクトル情報
に基づいて符号化を行うことを特徴とする請求項1記載
の画像情報変換装置。
22. The image compression information, which has been motion-compensated by motion vector information, has a motion vector synthesizing means for synthesizing the motion compensation vector information, and is based on the motion vector information of the input image compression information. 2. The image information conversion apparatus according to claim 1, wherein the motion vector information corresponding to the image output from the decimation means is combined, and the encoding means performs encoding based on the motion vector information.
【請求項23】 上記動きベクトル合成手段で合成され
た動きベクトル情報に基づいて動きベクトル情報を検出
する動きベクトル検出手段を有することを特徴とする請
求項22記載の画像情報変換装置。
23. The image information conversion apparatus according to claim 22, further comprising a motion vector detecting means for detecting motion vector information based on the motion vector information synthesized by said motion vector synthesizing means.
【請求項24】 画像を水平方向及び垂直方向共に8成
分の画素からなる画素ブロックを単位として離散コサイ
ン変換した画像圧縮情報の解像度を変換する画像情報変
換方法において、 飛び越し走査による画像を符号化した入力画像圧縮情報
を構成する画素ブロックの水平方向及び垂直方向共に8
成分の離散コサイン変換係数の内、水平方向に低域2成
分及び垂直方向に4成分のみを用いて飛び越し走査の画
像を復号し、 復号された飛び越し走査の画像を構成する第1フィール
ド及び第2フィールドのいずれか一方を選択して順次走
査の画像を生成し、 生成された画像を上記入力画像圧縮情報に対して水平方
向及び垂直方向共に1/4の解像度を有する出力画像圧
縮情報に符号化することを特徴とする画像情報変換方
法。
24. An image information conversion method for converting the resolution of image compression information obtained by performing discrete cosine conversion on a pixel block consisting of pixels of eight components in both the horizontal direction and the vertical direction, wherein an image obtained by interlaced scanning is encoded. 8 in both the horizontal and vertical directions of the pixel blocks constituting the input image compression information
Among the discrete cosine transform coefficients of the components, the interlaced scan image is decoded using only two low-frequency components in the horizontal direction and only four components in the vertical direction, and the first field and the second field constituting the decoded interlaced scan image are decoded. One of the fields is selected to generate a progressively scanned image, and the generated image is encoded into output image compression information having a resolution of 1/4 in both the horizontal and vertical directions with respect to the input image compression information. Image information converting method.
【請求項25】 上記入力画像圧縮情報はMPEG2規
格によるものであり、上記出力画像圧縮情報はMPEG
4規格によるものであることを特徴とする請求項24記
載の画像情報変換方法。
25. The input image compression information according to the MPEG2 standard, and the output image compression information
The image information conversion method according to claim 24, wherein the method is based on four standards.
【請求項26】 上記入力画像圧縮情報は、フレーム内
で符号化されたイントラ符号化画像と、フレーム間で順
方向に他の画像を参照して予測符号化された順方向予測
符号化画像と、フレーム間で順方向及び逆方向に他の画
像を参照して予測符号化された双方向予測符号化画像と
から構成され、上記入力画像圧縮情報を構成する画像の
種類を判別し、イントラ符号化画像及び順方向予測符号
化画像を通過させるが双方向予測符号化画像を破棄する
ことを特徴とする請求項24記載の画像情報変換方法。
26. The input image compression information includes an intra-coded image coded in a frame, and a forward prediction coded image predicted and coded by referring to another image in the forward direction between frames. And a bidirectional predictive coded image that is predictively coded with reference to another image in the forward and backward directions between frames, and determines the type of image that constitutes the input image compression information. 25. The image information conversion method according to claim 24, wherein the encoded image and the forward prediction encoded image are passed, but the bidirectional prediction encoded image is discarded.
【請求項27】 イントラ符号化画像及び順方向予測符
号化画像のみ復号することを特徴とする請求項26記載
の画像情報変換方法。
27. The image information conversion method according to claim 26, wherein only the intra-coded image and the forward prediction coded image are decoded.
JP2000215111A 2000-07-14 2000-07-14 Method and device for converting image information Withdrawn JP2002034046A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000215111A JP2002034046A (en) 2000-07-14 2000-07-14 Method and device for converting image information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000215111A JP2002034046A (en) 2000-07-14 2000-07-14 Method and device for converting image information

Publications (1)

Publication Number Publication Date
JP2002034046A true JP2002034046A (en) 2002-01-31

Family

ID=18710587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000215111A Withdrawn JP2002034046A (en) 2000-07-14 2000-07-14 Method and device for converting image information

Country Status (1)

Country Link
JP (1) JP2002034046A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006126530A1 (en) * 2005-05-25 2006-11-30 Nec Corporation Multi-media data recording/reproducing device and method, program, and recording medium
CN1332564C (en) * 2003-05-20 2007-08-15 索尼株式会社 Image decoding device and image decoding method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1332564C (en) * 2003-05-20 2007-08-15 索尼株式会社 Image decoding device and image decoding method
WO2006126530A1 (en) * 2005-05-25 2006-11-30 Nec Corporation Multi-media data recording/reproducing device and method, program, and recording medium

Similar Documents

Publication Publication Date Title
JP3975629B2 (en) Image decoding apparatus and image decoding method
US7088775B2 (en) Apparatus and method for converting image data
KR100370076B1 (en) video decoder with down conversion function and method of decoding a video signal
US7555043B2 (en) Image processing apparatus and method
JP3338639B2 (en) Digital video decoder and method for decoding digital video signal
US6862319B2 (en) Moving-picture coding and decoding method and apparatus with reduced computational cost
JP4026238B2 (en) Image decoding apparatus and image decoding method
JP2001285863A (en) Device and method for converting image information
JP3417443B2 (en) Apparatus and method for motion estimation for B picture
US20080123748A1 (en) Compression circuitry for generating an encoded bitstream from a plurality of video frames
KR20000077135A (en) Apparatus and method for deriving an enhanced decoded reduced-resolution video signal from a coded high-definition video signal
JP2003169349A (en) Image information encoding method and device, image information decoding method and device, and its program
JPH09182085A (en) Image encoding device, image decoding device, image encoding method, image decoding method, image transmitting method and recording medium
JP3937599B2 (en) Image decoding apparatus and image decoding method
JP2000041248A (en) Image decoder and image decoding method
JP2002034046A (en) Method and device for converting image information
JP2001285875A (en) Device and method for converting image information
JP2000175194A (en) Image decoder and image decoding method
JP5742049B2 (en) Color moving picture coding method and color moving picture coding apparatus
JP2002034041A (en) Method and device for converting image information
JP4051799B2 (en) Image decoding apparatus and image decoding method
JP4016166B2 (en) Image decoding apparatus and image decoding method
JP2001204027A (en) Image information converter and method
JP2002152745A (en) Image information conversion apparatus and method
JP2002199399A (en) Method and device for transforming moving vector

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071002