JPH0662388A - Dynamic image compressor - Google Patents

Dynamic image compressor

Info

Publication number
JPH0662388A
JPH0662388A JP16417893A JP16417893A JPH0662388A JP H0662388 A JPH0662388 A JP H0662388A JP 16417893 A JP16417893 A JP 16417893A JP 16417893 A JP16417893 A JP 16417893A JP H0662388 A JPH0662388 A JP H0662388A
Authority
JP
Japan
Prior art keywords
prediction
image
picture
correlation
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP16417893A
Other languages
Japanese (ja)
Other versions
JP3590976B2 (en
Inventor
Hiroyasu Ide
博康 井手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP16417893A priority Critical patent/JP3590976B2/en
Publication of JPH0662388A publication Critical patent/JPH0662388A/en
Application granted granted Critical
Publication of JP3590976B2 publication Critical patent/JP3590976B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

PURPOSE:To obtain a high predicting efficiency for any picture, and to improve a picture quality and a compressibility. CONSTITUTION:A dynamic image compressor is equipped with a predicted structure deciding device 2 which judges which correlation is stronger; a field correction or time correlation for the picture based on picture data imparted to decide a predicted structure, and decides the predicted structure by selecting the predicted structure from among a predicted picture group stored in a predicted structure group memory(PM) 3, predicted structure group memory(PM) 3 which stores plural predicted structure groups set based on the field correlation and the time correlation, and compressor 4 which compresses picture data according to the predicted structure selected by the predicted structure deciding device 2. Then, the predicted structure in which an error can be reduced is selected by predicting a P4 picture predicted close in time from an 12 picture and a P3 picture whose field is the same on the same condition, and the picture data are compressed according to the predicted structure.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、動画像圧縮処理等に用
いられる動画像圧縮装置に係り、詳細には、時間軸方向
の予測を伴う動画像圧縮装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a moving picture compression apparatus used for moving picture compression processing and the like, and more particularly to a moving picture compression apparatus with prediction in the time axis direction.

【0002】[0002]

【従来の技術】画像圧縮の国際標準としてJPEG(Jo
int Photograghic Expert Group)やMPEG(Moving
Picture Expert Group)がある。
2. Description of the Related Art As an international standard for image compression, JPEG (Jo
int Photograghic Expert Group) and MPEG (Moving
There is a Picture Expert Group).

【0003】MPEGは、MPEGI,MPEGII,M
PEGIIIの3レベルの規格案が検討されている。MP
EGIでは、1.5Mbpsの通信回線で伝送できる動
画像圧縮を目的としており、おもにテレビ電話やテレビ
会議などで使用することが考えられている。MPEGI
では、現行のNTSC方式のビデオ画像を320×24
0ピクセルの解像度として扱い、1フレームを構成する
2フィールドのうち1フィールドのみのデータを用い
る。MPEGIIでは、10Mbpsの通信回線で伝送で
きる圧縮が目標で、ISDNなどによる動画像伝送やデ
ィジタル・ビデオがターゲットとされている。そして、
MPEGIIIは、ハイビジョンなどによる次世代テレビ
が対象となっている。
MPEG is MPEGI, MPEGII, M
A three-level draft of PEGIII is under consideration. MP
EGI aims to compress a moving image that can be transmitted through a communication line of 1.5 Mbps, and is considered to be used mainly in videophones and videoconferences. MPEG I
Then, the current NTSC format video image is 320 x 24
It is treated as a resolution of 0 pixel, and data of only one field is used out of two fields constituting one frame. In MPEGII, compression is a goal that can be transmitted through a 10 Mbps communication line, and moving image transmission by ISDN and digital video are targets. And
MPEGIII is targeted for next-generation televisions such as HDTV.

【0004】MPEGの特徴は、DCT(Discrete Cos
ine Transform:離散コサイン変換)による静止画像圧
縮に加えて、時間軸方向の圧縮のためのフレーム間予測
処理を行なうことであるが、動画像圧縮の前提条件とし
てフレームのランダム・アクセスができること、早送り
による再生や巻戻し再生(逆方向)ができることがあげ
られている。従って、MPEGにおけるフレーム間予測
は、前向きと後向きの両方向を採用している。MPEG
にあっても、基本的にはMC(動き補償)+DCTを用
いる。動き補償を行なうブロックサイズは16×16
(但し8×8のモードもある)、DCTは8×8ブロッ
クに対して行なう。また、この動き補償は1/2画素精
度で行なう。1/2画素精度の動き補償は、予測に用い
る参照フレーム上において画素単位でずらした位置を調
べるのみならず、画素と画素の間の位置を補間によって
生成し、マッチングをとることによって行なう。
The feature of MPEG is that DCT (Discrete Cos
ine Transform: Discrete cosine transform) is used to perform inter-frame prediction processing for compression in the time axis direction in addition to still image compression. Random access of frames and fast-forwarding are prerequisites for moving image compression. It has been mentioned that playback and rewind playback (reverse direction) can be performed. Therefore, inter-frame prediction in MPEG employs both forward and backward directions. MPEG
However, basically, MC (motion compensation) + DCT is used. The block size for motion compensation is 16 × 16.
(However, there is also an 8 × 8 mode), DCT is performed on 8 × 8 blocks. Also, this motion compensation is performed with 1/2 pixel precision. Motion compensation with 1/2 pixel accuracy is performed not only by checking the position shifted in pixel units on the reference frame used for prediction, but also by generating the position between pixels by interpolation and performing matching.

【0005】通常の動き補償+DCTとの最も大きな違
いは、周期的なフレーム内符号化フレームを基本とした
動き補償予測である。図8及び図9はMPEG動画符号
化時の画面の予測構造を示す図であり、図中の四角形は
動画のフレームを意味する1枚1枚の画像(ピクチャ)
を示し、フレームから伸びる矢印は、根元のフレームが
予測に用いられることを示す。
The biggest difference from the normal motion compensation + DCT is the motion compensation prediction based on the periodic intra-frame coded frame. 8 and 9 are diagrams showing a prediction structure of a screen at the time of MPEG moving picture coding, and a quadrangle in the drawing means an image (picture) one by one which means a frame of a moving picture.
The arrow extending from the frame indicates that the root frame is used for prediction.

【0006】上記ピクチャは、符号化される方式に従っ
て以下のタイプに分類される。
The above pictures are classified into the following types according to the encoding method.

【0007】Iピクチャ(Intra-coded picture:イ
ントラ符号化画像) 符号化されるときその画像1枚の中だけで閉じた情報の
みを使う。換言すれば、復号化するときIピクチャ自身
の情報のみで画像が再構成できる。実際には、差分をと
らずそのままDCTして符号化する。この符号化方式
は、一般に効率が悪いが、これを随所に入れてIピクチ
ャだけを復号すればランダムアクセスや高速再生が可能
となる。さらに、Iピクチャを復号してメモリに蓄え、
逆方向に読み出すことを繰り返せば逆転再生をも可能と
なる。
I-picture (Intra-coded picture) When encoded, only the information closed in one image is used. In other words, when decoding, an image can be reconstructed using only the information of the I picture itself. Actually, the DCT is encoded as it is without taking the difference. This encoding method is generally inefficient, but random access and high-speed reproduction are possible by inserting this encoding everywhere and decoding only the I picture. Furthermore, I picture is decoded and stored in memory,
Reverse reading can be performed by repeating reading in the reverse direction.

【0008】Pピクチャ(Predictive-coded pictur
e:前方予測符号化画像) Pピクチャは、予測画像(差分をとる基準となる画像)
として、入力で時間的に前に位置し既に復号化されたI
ピクチャまたはPピクチャを使う。すなわち、図9に示
すように過去から現在の一方向に予測されるフレームで
ある。実際には動き補償された予測画像との差を符号化
するか差分をとらずに符号化する(イントラ符号化)か
効率のよい方をマクロブロック単位で選択できる。
P picture (Predictive-coded pictur
e: Forward predictive encoded image) P picture is a predictive image (image that serves as a reference for taking a difference)
As I, which was previously decoded in time at the input
Use picture or P-picture. That is, as shown in FIG. 9, it is a frame predicted in one direction from the past. In actuality, it is possible to select, in macroblock units, whichever is more efficient, whether the difference from the motion-compensated predicted image is coded or the difference is not taken (intra-coding).

【0009】Bピクチャ(Bidirectionally predicti
ve-coded picture:両方向予測符号化画像) Bピクチャは、予測画像として時間的に前に位置し既に
復号化されIピクチャまたはPピクチャ、時間的に後ろ
に位置するすでに復号化されたIピクチャまたはPピク
チャ、およびその両方から作られた補間画像の3種類を
使う。ここで、補間フレームの場合は両方向から予測を
行なうが、動き補償の予測モードは大きく分類して3つ
ある。過去から現在を予測する順方向動き補償、未来か
ら現在を予測する逆方向動き補償、過去と未来の両方か
ら現在を予測する補間動き補償である。上記順方向動き
補償と逆方向動き補償とは、一つの参照フレームから読
み出したブロックとマッチングをとるという点で、通常
の動き補償(MC)と同じ処理である。また、上記補間
動き補償は、2つの参照フレームから読み出したブロッ
クを、現在のフレームと参照フレームとの時間距離を考
慮した重みづけをして合成し、予測信号を得るものであ
る。
B-picture (Bidirectionally predicti
ve-coded picture: bidirectional predictive-coded image) A B-picture is a predicted image, which is a temporally preceding and already decoded I picture or P picture, and a temporally posterior already decoded I picture, or Three types of P-pictures and interpolated images made from both are used. Here, in the case of an interpolation frame, prediction is performed from both directions, but there are roughly three prediction modes for motion compensation. These are forward motion compensation that predicts the present from the past, backward motion compensation that predicts the present from the future, and interpolation motion compensation that predicts the present from both the past and the future. The forward motion compensation and the backward motion compensation are the same processes as the normal motion compensation (MC) in that they match a block read from one reference frame. In the interpolation motion compensation, the blocks read from the two reference frames are weighted and combined in consideration of the time distance between the current frame and the reference frame to obtain a prediction signal.

【0010】上記3種類の動き補償後の差分の符号化と
イントラ符号化の中で一番効率のよいものをマクロブロ
ック単位に選択できる。
The most efficient one of the above three types of difference encoding and intra-encoding after motion compensation can be selected in macroblock units.

【0011】一方、上記Iピクチャ、Pピクチャ及びB
ピクチャを含んで構成されるGOP(グループ・オブ・
ピクチャ)は、1または複数枚のIピクチャと0または
複数枚の非Iピクチャから構成される。Bピクチャを符
号化または復号化するには、その予測画像となる時間的
には後方にあるIピクチャまたはPピクチャが先に符号
化されていなくてはならないため、GOPを構成するに
はIピクチャ、Pピクチャ、Bピクチャは所定の順序が
必要であるが、Iピクチャの間隔、及びPピクチャの間
隔は自由でGOPの内部でも変わってもよい。
On the other hand, the I picture, P picture and B picture
GOP (Group of
A picture) is composed of one or more I-pictures and zero or more non-I-pictures. In order to encode or decode a B picture, an I picture or P picture that is a temporally backward image that becomes a predicted image of the B picture must be encoded first. , P pictures, and B pictures need to be in a predetermined order, but the intervals between I pictures and the intervals between P pictures are arbitrary and may change within the GOP.

【0012】[0012]

【発明が解決しようとする課題】上述したように、従来
の動画像における時間方向予測には図6に示す直前の画
像からの片側予測や図9に示す過去及び未来の画像から
の双方向予測等がある。
As described above, in the conventional temporal direction prediction for a moving image, one-sided prediction from the immediately preceding image shown in FIG. 6 and bidirectional prediction from past and future images shown in FIG. Etc.

【0013】一般に、蓄積メディア(MPEG)系にお
ける動画像圧縮は、上記図7の双方向予測が有効である
と考えられており、MPEGによる両方向予測画像(B
ピクチャ)の予測元となる画像は、その画像単体で再生
可能な(予測を伴わない)画像(Iピクチャ)若しくは
Bピクチャ以外からの片側予測を元にする画像(Pピク
チャ)である。ところが、フル動画像データは、前述し
たフィールド構造を持っているため、圧縮対象の画像が
予測元と同一フィールドではなく、時間の経過と共に垂
直方向の変化がない場合には予測効率がかなり悪化して
しまうという欠点がある。すなわち、例えばテレビ画像
では1/60秒毎に1フィールドを表示し、2フィール
ド(奇数フィールドと偶数フィールド)で1フレームと
なっており、空間軸方向に1ドットのずれが存在する。
従って、隣り合った画像同士は縦軸が合わず、予測を行
なうおうとしたとき一番近い画像が必ずしも一番似てい
るとは限らないため、時間経過と共に垂直方向の変化が
ない画像では予測効率が極端に悪化してしまう場合があ
る。
It is generally considered that the bidirectional prediction shown in FIG. 7 is effective for moving picture compression in a storage medium (MPEG) system.
An image serving as a prediction source of a picture is an image (I picture) that can be reproduced by the image alone (I picture) or an image (P picture) based on one-sided prediction other than a B picture. However, since full moving image data has the field structure described above, if the image to be compressed is not in the same field as the prediction source and there is no vertical change over time, the prediction efficiency will deteriorate considerably. There is a drawback that it will end up. That is, for example, in a television image, one field is displayed every 1/60 seconds, and two fields (odd field and even field) form one frame, and there is a shift of one dot in the spatial axis direction.
Therefore, the ordinates of adjacent images do not match, and the closest image is not always the most similar when trying to make a prediction. May become extremely worse.

【0014】ところで、前述したPピクチャにおいて
は、予測元画像からの時間経過量の点から予測効率はそ
れほど高くない場合が多いと考えられる。仮に、Pピク
チャが予測元と違うフィールドであった場合には画像に
よっては著しく予測効率が下がり、他の画像にまで影響
を及ぼしかねないことになる。しかし、Pピクチャが予
測元と同一フィールドであった場合には、ある1つのI
ピクチャを予測元とした全てのPピクチャの系列が同一
フィールドとなり、それらのIピクチャ及びPピクチャ
を予測元とする両方向予測画面(Bピクチャ)におい
て、その両予測元とも違うフィールドとなる場合が発生
し、画像によっては予測効率が減少してしまうという欠
点があった。
By the way, in the P picture described above, it is considered that the prediction efficiency is not so high in many cases in terms of the amount of time elapsed from the prediction source image. If the P picture is in a field different from that of the prediction source, the prediction efficiency will be significantly reduced depending on the image, which may affect other images. However, if the P picture is in the same field as the prediction source, one I
A series of all P pictures with a picture as a prediction source may be the same field, and in a bidirectional prediction screen (B picture) with those I pictures and P pictures as prediction sources, a field different from both the prediction sources may occur. However, there is a drawback that the prediction efficiency is reduced depending on the image.

【0015】このように従来のIピクチャ、Pピクチャ
等に基づく予測構造は設計者が時間相関を基に一義的に
決定していたため、圧縮対象の画像が予測元と同一フィ
ールドではなく時間の経過と共に垂直方向の変化が無い
場合には予測効率がかなり悪化してしまうことがある反
面、逆に、Pピクチャが予測元と同一フィールドである
場合であっても、上述した理由により画像によっては予
測効率の低下を招いてしまうことがある。
As described above, since the conventional predictive structure based on I-pictures, P-pictures, etc. is uniquely determined by the designer based on the time correlation, the image to be compressed is not in the same field as the predictor and the time elapses. In addition, when there is no change in the vertical direction, the prediction efficiency may be considerably deteriorated. On the contrary, even when the P picture is in the same field as the prediction source, the prediction may not be possible depending on the image for the above reason. This may lead to a decrease in efficiency.

【0016】そこで本発明は、どのような画像において
も高い予測効率を得ることができる動画像圧縮装置を提
供することを目的とする。
Therefore, an object of the present invention is to provide a moving picture compression apparatus capable of obtaining high prediction efficiency for any picture.

【0017】[0017]

【課題を解決するための手段】請求項1記載の発明は、
上記目的達成のため、複数の予測画像から構成される予
測構造を複数記憶する予測構造記憶手段と、符号化すべ
き画像データに基づいて前記予測構造記憶手段に記憶さ
れた予測構造を選択する予測構造選択手段と、前記予測
構造選択手段により選択された予測構造に従って画像デ
ータを圧縮するデータ圧縮手段とを備えている。
The invention according to claim 1 is
To achieve the above object, a prediction structure storage unit that stores a plurality of prediction structures configured from a plurality of prediction images, and a prediction structure that selects a prediction structure stored in the prediction structure storage unit based on image data to be encoded The selection means and the data compression means for compressing the image data according to the prediction structure selected by the prediction structure selection means are provided.

【0018】前記予測構造記憶手段に記憶される複数の
予測構造は、例えば請求項2に記載されているように、
フィールド相関が高い場合に使用される予測構造と、時
間相関が高い場合に使用される予測構造とを含んで構成
されるものであってもよく、また、前記予測構造は、例
えば請求項3に記載されているように、独立して符号化
可能な符号化画像と、過去から現在を予測する片側予測
画像と、過去及び未来の両方向から現在を予測する両方
向予測画像とを含む複数の画像により構成され、上記各
画像を予測元の画像として所定の順序で用いることによ
り予測を行うようにした構造であってもよい。また、前
記予測構造は、例えば請求項4に記載されているように
フレームを奇数フィールドと偶数フィールドの2つに分
割した一方のフィールドにおいて、独立して符号化可能
な第1の符号化画像と、前記他方のフィールドにおい
て、独立して符号化可能な第2の符号化画像とを含んで
構成されるものであってもよく、さらに前記予測構造
は、例えば請求項6に記載されているように、時間軸方
向の圧縮のためのフレーム間予測処理を行なうものであ
ってもよい。また、前記両方向予測画像は、例えば請求
項5に記載されているように、前記符号化画像又は前記
片側予測画像と前記符号化画像又は前記片側予測画像と
の間に位置する隣り合う2つの画像で構成するようにし
てもよい。
The plurality of prediction structures stored in the prediction structure storage means are, for example, as described in claim 2.
It may be configured to include a prediction structure used when the field correlation is high and a prediction structure used when the time correlation is high, and the prediction structure is defined in, for example, claim 3. As described, a plurality of images including a coded image that can be independently coded, a one-sided prediction image that predicts the present from the past, and a bidirectional prediction image that predicts the present from both past and future directions. The structure may be configured such that prediction is performed by using each of the images as a prediction source image in a predetermined order. In addition, the prediction structure has a first coded image that can be coded independently in one field obtained by dividing a frame into two fields, an odd field and an even field, as described in claim 4. , The other field may be configured to include a second coded image that can be coded independently, and the prediction structure may be, for example, as described in claim 6. In addition, inter-frame prediction processing for compression in the time axis direction may be performed. Further, the bidirectional predicted image is, for example, as described in claim 5, two adjacent images located between the coded image or the one-sided predicted image and the coded image or the one-sided predicted image. You may make it comprise.

【0019】また、前記予測構造選択手段は、例えば請
求項7に記載されているように、符号化しようとする画
像データがフィールド相関と時間相関とで何れの相関性
が強いかを判別し、該判別結果に基づいて前記予測構造
記憶手段に記憶された複数の予測構造のうち、相関性の
強い予測構造を選択するようにしてもよく、また、前記
予測構造選択手段は、例えば請求項8に記載されている
ように、前記符号化画像を予測元の画像として用いて予
測したとときに時間的に近い前記片側予測画像を予測し
たときの予測誤差と、前記符号化画像を予測の元の画像
として用いて予測したときにフィールドが同じ前記片側
予測画像を予測したときの予測誤差とを比較することに
より相関性を判別するものであってもよい。
Further, the predictive structure selecting means determines, for example, which of image correlation to be coded is stronger, field correlation and time correlation, as described in claim 7, A prediction structure having a strong correlation may be selected from a plurality of prediction structures stored in the prediction structure storage means based on the determination result, and the prediction structure selection means may be, for example, As described in, the prediction error when predicting the one-sided prediction image that is temporally close when the coded image is used as a prediction source image, and the coded image is the source of the prediction. It is also possible to determine the correlation by comparing with the prediction error when the one-sided prediction image having the same field when used as the image of 1.

【0020】[0020]

【作用】本発明の手段の作用は次の通りである。The operation of the means of the present invention is as follows.

【0021】請求項1、2、3、4、5、6、7及び8
記載の発明では、予測構造記憶手段にはフィールド相関
が高い場合に使用される予測構造と、時間相関が高い場
合に使用される予測構造とが記憶されているものとす
る。
Claims 1, 2, 3, 4, 5, 6, 7 and 8
In the described invention, it is assumed that the prediction structure storage means stores a prediction structure used when the field correlation is high and a prediction structure used when the time correlation is high.

【0022】この状態において、符号化すべき画像デー
タが予測構造選択手段に入力されると、予測構造選択手
段によってこの画像データがフィールド相関と時間相関
とで何れの相関性が強いかが判別され、その判別結果に
基づいて予測構造記憶手段に記憶された複数の予測構造
のうち、相関性の強い予測構造が選択される。そして、
予測構造選択手段により選択された予測構造に従って画
像データが圧縮される。
In this state, when the image data to be encoded is input to the prediction structure selecting means, the prediction structure selecting means determines which of the field correlation and the time correlation the image data has, and A prediction structure having a strong correlation is selected from the plurality of prediction structures stored in the prediction structure storage means based on the determination result. And
The image data is compressed according to the prediction structure selected by the prediction structure selecting means.

【0023】従って、どのような画像においても高い予
測効率を得ることができる。
Therefore, high prediction efficiency can be obtained in any image.

【0024】[0024]

【実施例】以下、本発明を図面に基づいて説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described below with reference to the drawings.

【0025】原理説明 本発明では、圧縮対象の画像が予測元と同一フィールド
ではなく時間の経過と共に垂直方向の変化が無い場合
と、予測元と同一フィールドであった場合の2つの状態
があることに着目し、圧縮しようとする画像を2つ用意
し、画像情報によりフィールド相関と時間相関のうち相
関性の高い方を利用した予測構造を選択するようにして
予測構造を変化させることで前述のような欠点を補い、
どのような画像においても高い予測効率を得るようにす
るものである。
Description of Principle According to the present invention, there are two states, that is, the image to be compressed is not in the same field as the prediction source, and there is no change in the vertical direction with the passage of time, and if it is in the same field as the prediction source. Focusing on, the two images to be compressed are prepared, and by changing the prediction structure by selecting the prediction structure that uses the higher correlation between the field correlation and the time correlation according to the image information, To make up for such drawbacks,
This is to obtain high prediction efficiency in any image.

【0026】図1は本発明に係る動画像圧縮装置の機能
ブロック図であり、図中、白抜き矢印はデータの流れを
示し、矢印は制御の流れを示す。
FIG. 1 is a functional block diagram of a moving picture compression apparatus according to the present invention. In the figure, a white arrow indicates a data flow and an arrow indicates a control flow.

【0027】図1において、動画像圧縮装置は、データ
圧縮すべき原画像データを記憶するフレームメモリ(F
M)1と、予測構造を決定するためにフレームメモリ
(FM)1から読出された画像データに基づいて画像が
フィールド相関(図5参照)と時間相関(図6参照)の
うち何れの相関性が強いかを判断し、予測構造群メモリ
(PM)3に記憶された予測画像群から予測構造を選ん
で予測構造を決定する予測構造決定装置2と、フィール
ド相関と時間相関に基づいて設定される複数の予測構造
群を記憶する予測構造群メモリ(PM)3と、予測構造
決定装置2により選ばれた予測構造に従ってフレームメ
モリ(FM)1から読出した画像データを圧縮する圧縮
器4と、上記各部の動作を制御する制御装置5とにより
構成されている。
In FIG. 1, the moving image compression apparatus is a frame memory (F) for storing original image data to be data-compressed.
M) 1 and which of the field correlation (see FIG. 5) and the time correlation (see FIG. 6) the image has based on the image data read from the frame memory (FM) 1 to determine the prediction structure. Is set, based on the field correlation and the time correlation, and the prediction structure determination device 2 that determines the prediction structure by selecting the prediction structure from the prediction image group stored in the prediction structure group memory (PM) 3. A prediction structure group memory (PM) 3 that stores a plurality of prediction structure groups, and a compressor 4 that compresses the image data read from the frame memory (FM) 1 according to the prediction structure selected by the prediction structure determination device 2. The control device 5 controls the operation of each of the above parts.

【0028】以上の構成において、まず、フレームメモ
リ(FM)1から読出した画像データを予測構造決定装
置2に出力する。予測構造決定装置2は、予測構造を決
定するために与えられた画像データに基づいて画像フィ
ールド相関と時間相関のうち何れの相関性が強いかを判
別して予測構造群メモリ(PM)3から予測構造を選ん
で予測構造を決定する。予測構造の決定結果は、制御装
置5に送られ、制御装置5はどの位置からどのように予
測するかという情報を圧縮器4に与える。圧縮器4は決
定された相関に対応する予測構造に従ってフレームメモ
リ(FM)1から読み出した画像データを圧縮し圧縮画
像データとして出力する。上記手順が後述する図4に示
すような画像グループ毎に繰り返される。
In the above structure, first, the image data read from the frame memory (FM) 1 is output to the prediction structure determination device 2. The prediction structure determination device 2 determines which one of the image field correlation and the time correlation is stronger based on the image data given for determining the prediction structure, and determines from the prediction structure group memory (PM) 3 Select the predictive structure to determine the predictive structure. The result of determination of the prediction structure is sent to the control device 5, and the control device 5 gives the compressor 4 information from which position and how to predict. The compressor 4 compresses the image data read from the frame memory (FM) 1 according to the prediction structure corresponding to the determined correlation, and outputs it as compressed image data. The above procedure is repeated for each image group as shown in FIG. 4 described later.

【0029】このように、上記原理説明に基づく動画像
圧縮装置は、予測構造を決定するために与えられた画像
データに基づいて画像がフィールド相関と時間相関のう
ち何れの相関性が強いかを判断して予測構造群メモリ
(PM)3に記憶された予測画像群から予測構造を選ん
で予測構造を決定する予測構造決定装置2と、フィール
ド相関と時間相関に基づいて設定される複数の予測構造
群を記憶する予測構造群メモリ(PM)3と、予測構造
決定装置2により選ばれた予測構造に従って画像データ
を圧縮する圧縮器4を設け、Iピクチャから予測される
時間的に近いPピクチャとフィールドが同じPピクチャ
をそれぞれ同一条件下で予測して誤差の少ない予測構造
を選択し、その予測構造で画像データを圧縮しているの
で、どのような画像においても高い予測効率を得ること
ができる。また、予測効率を上げることができるので同
一圧縮率の場合には画質の向上を図ることができ、同一
画質の場合には圧縮率を向上させることができる。
As described above, the moving picture compression apparatus based on the above explanation of the principle determines which of the field correlation and the time correlation the image has, based on the image data given for determining the prediction structure. Prediction structure determination device 2 for determining and selecting a prediction structure from a prediction image group stored in the prediction structure group memory (PM) 3, and a plurality of predictions set based on field correlation and time correlation A predictive structure group memory (PM) 3 for storing a structure group and a compressor 4 for compressing image data according to the predictive structure selected by the predictive structure determining device 2 are provided, and a temporally predicted P picture is predicted from an I picture. P-pictures with the same field are predicted under the same conditions, a prediction structure with a small error is selected, and the image data is compressed with this prediction structure. Oite also it is possible to obtain high prediction efficiency. Further, since the prediction efficiency can be increased, the image quality can be improved when the compression rate is the same, and the compression rate can be improved when the image quality is the same.

【0030】実施例 図2〜図7は本発明に係る動画像圧縮装置の一実施例を
示す図である。
Embodiment FIG. 2 to FIG. 7 are views showing an embodiment of a moving picture compression apparatus according to the present invention.

【0031】先ず、構成を説明する。図2は動画像圧縮
装置のブロック図であり、この図において、動画像圧縮
装置の符号化器は、画像モード、予測モード、動きベク
トル及び各種制御信号を出力して、システム全体の制御
を行なうコントローラ30と、データ圧縮すべき画像デ
ータを記憶する画像メモリ31と、画像メモリ31から
読み出した画像データに動き補償フレーム間予測処理に
よる予測結果を減算する減算器32と、減算器32によ
り減算された画像データをコントローラ30に出力する
とともに、該画像データに対しDCT演算を行なうDC
T演算部33と、コントローラ30で決定された量子化
幅に従ってDCT演算の出力データを一定の誤差の範囲
内で量子化する量子化部34と、量子化部34により量
子化された画像データに対し画像データのほか各種ブロ
ック属性信号を可変長符号化した後、定められたデータ
構造の符号列に多重化するVLC(Variable
Length Code:可変長符号化)35と、変動
する情報発生を一定レートに平滑化するバッファ36
と、周期的なフレーム内符号化フレームを基本とした動
き補償予測を行なう動き補償フレーム間予測部37と、
により構成されている。
First, the structure will be described. FIG. 2 is a block diagram of a moving image compression apparatus. In this figure, an encoder of the moving image compression apparatus outputs an image mode, a prediction mode, a motion vector and various control signals to control the entire system. The controller 30, an image memory 31 for storing image data to be data-compressed, a subtracter 32 for subtracting the prediction result of the motion-compensated inter-frame prediction process from the image data read from the image memory 31, and a subtractor 32 for subtraction. DC which performs DCT operation on the image data while outputting the image data to the controller 30.
The T calculation unit 33, the quantization unit 34 that quantizes the output data of the DCT calculation within a certain error range according to the quantization width determined by the controller 30, and the image data quantized by the quantization unit 34. On the other hand, in addition to image data, various block attribute signals are variable-length coded, and then VLC (Variable) which is multiplexed into a code string of a predetermined data structure.
Length Code (variable length coding) 35 and a buffer 36 for smoothing fluctuating information generation to a constant rate.
And a motion-compensated inter-frame prediction unit 37 that performs motion-compensated prediction based on periodic intra-frame coded frames,
It is composed by.

【0032】上記動き補償フレーム間予測部37は、量
子化部34により量子化された画像データを逆量子化す
る逆量子化部38と、逆量子化部38により量子化前の
画像データに戻されたデータに対し逆DCT(IDC
T)演算を施すIDCT演算部39と、IDCT演算部
39によりDCT処理される前の画像データに戻された
データに動き補償を加算する加算器40と、コントロー
ラ30からの画像モード、予測モードに従って信号経路
を切り換えるスイッチ41、42、43と、コントロー
ラ30で演算処理(図7参照)された動きベクトルによ
り動き補償予測を行なう予測器44、45とから構成さ
れる。
The motion-compensated inter-frame prediction unit 37 dequantizes the image data quantized by the quantization unit 34 and the dequantization unit 38, and the dequantization unit 38 restores the unquantized image data. Inverse DCT (IDC
T) According to the image mode and prediction mode from the controller 30, the IDCT calculation unit 39 that performs the calculation, the adder 40 that adds motion compensation to the data returned to the image data before the DCT processing by the IDCT calculation unit 39. It is composed of switches 41, 42 and 43 for switching signal paths, and predictors 44 and 45 for performing motion compensation prediction based on motion vectors calculated by the controller 30 (see FIG. 7).

【0033】上記画像メモリ31は、前記図1の機能ブ
ロック図のフレームメモリ(FM)1に対応し、上記D
CT演算部33及び量子化部34は全体として図1の圧
縮器4に対応している。また、コントローラ30は全体
として図1の予測構造決定装置2、予測構造群メモリ
(PM)3及び制御装置5に対応しており、コントロー
ラ30は、内蔵された予測構造群メモリ(PM)を用い
て予測構造決定処理を実行し、決定された予測構造を基
にシステム全体の動画像圧縮制御を行なう。
The image memory 31 corresponds to the frame memory (FM) 1 in the functional block diagram of FIG.
The CT calculator 33 and the quantizer 34 generally correspond to the compressor 4 of FIG. The controller 30 generally corresponds to the prediction structure determination device 2, the prediction structure group memory (PM) 3 and the control device 5 of FIG. 1, and the controller 30 uses the built-in prediction structure group memory (PM). Then, the predictive structure determining process is executed, and the moving image compression control of the entire system is performed based on the determined predictive structure.

【0034】また、動画像圧縮装置の復号器は、上記符
号化器とは逆の動作を行なうものであり、具体的には、
図2に示すように、変動する情報発生を一定レートに平
滑するバッファ46と、バッファ46に記憶された復号
化すべき画像データを前記ビデオマルチプレックス符号
化部(VLC)35の処理と逆の処理を行なって復号化
する逆ビデオマルチプレックス復号化部(VLC-1)4
7と、VLC-147で決定された量子化幅に従ってVL
C-147の出力に対し逆量子化する逆量子化部48と、
逆量子化部48で逆量子化されたデータに対し逆DCT
演算を施すIDCT演算部49と、IDCT演算部49
の出力に予測結果を加算する加算器50と、VLC-14
7からの画像モード、予測モードに従って信号経路を切
り換えるスイッチ51、52、53と、VLC-147で
算出された動きベクトルにより動き補償予測を行なう予
測器54、55とから構成される。
Further, the decoder of the moving picture compression apparatus performs an operation reverse to that of the above-mentioned encoder, and more specifically,
As shown in FIG. 2, a buffer 46 for smoothing fluctuating information generation to a constant rate, and image data to be decoded stored in the buffer 46, which is the reverse of the processing of the video multiplex encoding unit (VLC) 35. Inverse video multiplex decoding unit (VLC-1) 4 for performing decoding by performing
7 and VL according to the quantization width determined by VLC-147
An inverse quantizer 48 for inverse quantizing the output of C-147;
Inverse DCT is performed on the data inversely quantized by the inverse quantizer 48.
IDCT calculation unit 49 for performing calculation, and IDCT calculation unit 49
VLC-14 and an adder 50 for adding the prediction result to the output of
It is composed of switches 51, 52 and 53 for switching signal paths according to the image mode and prediction mode from 7 and predictors 54 and 55 for performing motion compensation prediction based on the motion vector calculated by VLC-147.

【0035】図4は上記動画像圧縮装置で用いられる画
像グループを説明するための図であり、図中の四角形は
画面を、I,P,Bは夫々Iピクチャ、Pピクチャ、B
ピクチャを示している。
FIG. 4 is a diagram for explaining an image group used in the above-mentioned moving image compression apparatus. In the figure, a rectangle is a screen, and I, P and B are I picture, P picture and B respectively.
Shows a picture.

【0036】一般に、時間予測を伴う圧縮では、予測元
となる画像が再生済でなければ、その圧縮データから画
像を展開することができない。現在有効であると考えら
れている画像圧縮には、画像展開時における特殊再生
(途中再生、高速再生等)や、誤差の蓄積による画像の
乱れ等に対応するため、時間予測を伴わない圧縮画像
(Iピクチャ)が存在している。この場合、あるIピク
チャから次のIピクチャまでの画像データは、それらの
外の画像情報に左右されないため、図4に示すようにそ
れらの画面群を1つのグループ(画像グループ)として
処理することができる。
In general, in compression involving temporal prediction, an image as a prediction source cannot be expanded from the compressed data unless the image has been reproduced. Image compression, which is currently considered to be effective, is a compressed image that does not involve time prediction in order to deal with special playback (intermediate playback, high-speed playback, etc.) during image expansion, and image distortion due to error accumulation. (I picture) exists. In this case, the image data from one I picture to the next I picture is not affected by the image information outside them, so that those screen groups should be processed as one group (image group) as shown in FIG. You can

【0037】図5及び図6は2つの相関による予測構造
を示す図であり、図5がフィールド相関が高い場合の予
測構造を、図6が時間相関が高い場合の予測構造を夫々
示している。前記図1に示した複数の予測構造群を記憶
する予測構造群メモリ(PM)3は、図5及び図6に示
すような複数の予測構造から構成されている。
FIGS. 5 and 6 are diagrams showing a prediction structure based on two correlations. FIG. 5 shows a prediction structure when the field correlation is high, and FIG. 6 shows a prediction structure when the time correlation is high. . The prediction structure group memory (PM) 3 for storing the plurality of prediction structure groups shown in FIG. 1 is composed of a plurality of prediction structures as shown in FIGS. 5 and 6.

【0038】また、本動動画像圧縮装置の予測構造は、
画像情報により予測構造を変化させるために以下のよう
なGOP(Group Of Picture)を構成するようにする。
The predictive structure of the main moving image compression apparatus is
The following GOP (Group Of Picture) is configured to change the prediction structure according to the image information.

【0039】まず、過去と未来の双方向から予測される
Bピクチャの数を、例えば“2”に固定する。すなわ
ち、基本的にはBピクチャはPピクチャ及びIピクチャ
の間に幾つ存在してもよいが、本実施例ではこのBピク
チャを2に固定することによって2つのBピクチャのう
ち必ず一方の画像はその隣のPピクチャまたはIピクチ
ャとで空間軸の縦軸が存在することになり、したがっ
て、上記Bピクチャの他方は必ず時間的に一番近い画像
となる。すなわち、BピクチャはPピクチャ(このPピ
クチャはIピクチャから予測される)からの予測が入る
ことになるが、図5及び図6に示すようにBピクチャの
数を2に固定することによってBピクチャとIピクチャ
(またはPピクチャ)とに関しては閉じた関係となり、
ある程度独立したものとみることができるようになる。
換言すれば、Bピクチャの数を2にすることによってB
ピクチャを独立させて影響を受けないようにすることが
できる。
First, the number of B pictures predicted bidirectionally in the past and the future is fixed at, for example, "2". That is, basically, any number of B pictures may exist between P pictures and I pictures, but in the present embodiment, by fixing this B picture to 2, one of the two B pictures must be The vertical axis of the spatial axis exists between the adjacent P picture or I picture, and therefore, the other of the B pictures is always the temporally closest image. That is, a B picture is predicted from a P picture (this P picture is predicted from an I picture), but by fixing the number of B pictures to 2 as shown in FIGS. The picture and I picture (or P picture) have a closed relationship,
It can be seen as something independent.
In other words, by setting the number of B pictures to 2,
The pictures can be independent and unaffected.

【0040】次に、片側から予測されるPピクチャを以
下のように決定する。1つ以上のIピクチャを含むフレ
ームメモリの列をGOPという。このGOPにおいて前
述したようにBピクチャを2つずつとって、あるGOP
を構成したときにあるIピクチャと次のIピクチャとが
違うフィールドとなるようにIピクチャとIピクチャと
の間の画面の数を調整する。具体的には、図4及び図5
に示すように、I1ピクチャと次のI2ピクチャとの間の
Pピクチャの数が偶数個(本実施例では、4個)あれば
I1ピクチャとI2ピクチャとは異なるフィールドをとる
ように切り換わるようになる。
Next, the P picture predicted from one side is determined as follows. A column of the frame memory including one or more I pictures is called a GOP. As described above, in this GOP, two B pictures are taken to obtain a certain GOP.
The number of screens between I-pictures is adjusted so that one I-picture and the next I-picture are different fields. Specifically, FIG. 4 and FIG.
As shown in FIG. 6, if the number of P pictures between the I1 picture and the next I2 picture is even (4 in this embodiment), the I1 picture and the I2 picture are switched so as to take different fields. become.

【0041】この場合、上記予測構造をとる上記Pピク
チャはある少し離れた片側の画像しか相関しないことに
なるので、このPピクチャの画像が時間的に近い方が予
測誤差が少ないのか、あるいは場所(フィールド)が同
一の方が予測誤差が少ないのかを判定し、その判定結果
に基づいて図5及び図6の予測構造のうち最適な予測構
造を選択する。すなわち、図5及び図6に示すように、
本動画像圧縮装置はフィールド相関が高い場合の予測構
造と時間相関が高い場合の予測構造をそれぞれ持ち、画
像情報によりどちらかを選択する。
In this case, since the P picture having the above prediction structure correlates only with the image on one side that is a little distant from the other, whether the P picture image is temporally closer has less prediction error, or the location It is determined whether the prediction error is smaller when the (fields) are the same, and the optimum prediction structure is selected from the prediction structures of FIGS. 5 and 6 based on the determination result. That is, as shown in FIG. 5 and FIG.
The moving image compression apparatus has a prediction structure when the field correlation is high and a prediction structure when the time correlation is high, and selects either one according to the image information.

【0042】選択方法は、I2ピクチャから予測され得
るP3ピクチャ,P4ピクチャを夫々同一条件下で予測
し、誤差の少ない方を予測構造に持つ方を選択する。例
えば、時間相関の方が強いときには一番時間の近いとこ
ろから予測し、また、フィールド(場所)相関が強いと
きには同一フィールドから予測できるように予測構造を
切り換える。図5に示すフィールド相関では各Pピクチ
ャを同一フィールドの画像から予測し、図6に示す時間
フィールドでは各Pピクチャを時間的に近い画像から予
測している。また、Bピクチャは片側が時間的に近い画
像、他方が同一のフィールドの画像となるようにしてい
る。
As the selection method, P3 picture and P4 picture which can be predicted from I2 picture are predicted under the same conditions, respectively, and one having a smaller error in the prediction structure is selected. For example, when the time correlation is stronger, the prediction structure is switched so that the prediction is performed from the closest time point and when the field (location) correlation is strong, the prediction can be performed from the same field. In the field correlation shown in FIG. 5, each P picture is predicted from an image in the same field, and in the time field shown in FIG. 6, each P picture is predicted from an image that is temporally close. In addition, the B picture is configured such that one side is an image that is close in time and the other side is an image in the same field.

【0043】次に、本実施例の動作を説明する。Next, the operation of this embodiment will be described.

【0044】図7はコントローラ30で実行される予測
構造決定処理のフローチャートであり、前記図1の予測
構造決定装置2における処理に対応する。
FIG. 7 is a flowchart of the predictive structure determining process executed by the controller 30, which corresponds to the process in the predictive structure determining device 2 of FIG.

【0045】先ず、ステップS1でI2ピクチャからP4
ピクチャを予測し、ステップS2でI2ピクチャからP3
ピクチャを予測する。すなわち、I1ピクチャとフィー
ルドが異なる次のI2ピクチャによって時間的に近いP
ピクチャとなるP4ピクチャを予測し(図6参照)、ま
た、同I2ピクチャによりフィールドが同じPピクチャ
となるP3ピクチャを予測する(図5参照)。
First, in step S1, I2 picture to P4
The picture is predicted, and the I2 picture is converted to the P3 in step S2.
Predict pictures. That is, a P that is temporally closer to the next I2 picture whose field is different from that of the I1 picture.
A P4 picture to be a picture is predicted (see FIG. 6), and a P3 picture having the same P picture in the same field is predicted from the same I2 picture (see FIG. 5).

【0046】次いで、ステップS3でP4ピクチャを予
測した方がP3ピクチャを予測するより誤差が少ないか
否かを判別する。この場合、選択方法は、I2ピクチャ
から予測され得るP3ピクチャ,P4ピクチャをそれぞれ
同一条件下で予測し、誤差の少ない方を予測構造に持つ
方を選択する。ここでは、フィールド相関では各Pピク
チャを時間的に近い画像から予測している。また、Bピ
クチャは片側が時間的に近い画像、他方が同一のフィー
ルドの画像である。
Then, in step S3, it is determined whether or not the prediction of the P4 picture has a smaller error than the prediction of the P3 picture. In this case, the selection method predicts the P3 picture and the P4 picture that can be predicted from the I2 picture under the same conditions, and selects the one having the smaller error in the prediction structure. Here, in the field correlation, each P picture is predicted from images that are temporally close. A B picture is an image in which one side is temporally close and the other is an image in the same field.

【0047】P4ピクチャを予測した方がP3ピクチャを
予測するより誤差が少ないときには時間相関の方が相関
が強いときであるからステップS4で図6に示す時間相
関予測構造を採用して本フローの処理を終え、また、P
3ピクチャを予測した方がP4ピクチャを予測するより誤
差が少ないときにはフィールド相関の方が相関が強いと
きであるからステップS5で図5に示すフィールド相関
予測構造を採用して本フローの処理を終える。
When the error of the P4 picture is smaller than that of the P3 picture, the time correlation is stronger than that of the P3 picture. Therefore, the time correlation prediction structure shown in FIG. After processing, P
When the error is smaller in predicting 3 pictures than in predicting P4 pictures, the field correlation is stronger, so that the field correlation prediction structure shown in FIG. 5 is adopted in step S5 and the processing of this flow ends. .

【0048】より詳しく説明すると、いま例えば図5及
び図6のような予測構造が用意されている場合、予測構
造の決定は前記図7のフローに示す手順で決定すること
ができる。
More specifically, when the prediction structures shown in FIGS. 5 and 6 are prepared, the prediction structure can be determined by the procedure shown in the flow of FIG.

【0049】先ず、I2ピクチャからP4ピクチャ及びP
3ピクチャへの予測は、動き補償(MC)を含む予測で
あり、通常の動画像予測と同様に行われ、その予測誤差
の合計を比べることによってP4ピクチャ及びP3ピクチ
ャの何れかの画像の方がよりI2ピクチャの画像に近い
かを決定し、P4ピクチャの画像の方が近ければ(すな
わち、予測誤差が少なければ)図5の時間相関構造を、
P3ピクチャの画像の方が近ければ図6のフィールド相
関構造を選択する。そして、どちらが選択されたかを示
す情報を図4の画像グループ毎に与えてやるようにすれ
ばデコード時に正常に行なうこともできる。なお、この
選択情報はMPEGIのフォーマットではGOPヘッダ
ーを1bit拡張することで実現できる。
First, from I2 picture to P4 picture and P
Prediction to 3 pictures is prediction including motion compensation (MC), and is performed in the same manner as normal moving picture prediction. By comparing the total of the prediction errors, either P4 picture or P3 picture is predicted. Is closer to the image of the I2 picture, and if the image of the P4 picture is closer (that is, if the prediction error is smaller), the temporal correlation structure of FIG.
If the P3 picture image is closer, the field correlation structure of FIG. 6 is selected. If information indicating which is selected is given for each image group in FIG. 4, normal operation can be performed at the time of decoding. It should be noted that this selection information can be realized by expanding the GOP header by 1 bit in the MPEGI format.

【0050】以上説明したように、本実施例に係る動画
像圧縮装置のコントローラ30は、I2ピクチャから予
測される時間的に近いP4ピクチャとフィールドが同じ
P3ピクチャをそれぞれ同一条件下で予測して誤差の少
ない予測構造を選択し、その予測構造で画像データを圧
縮しているので、どのような画像においても高い予測効
率を得ることができる。また、予測効率を上げることが
できるので同一圧縮率の場合には画質の向上を図ること
ができ、同一画質の場合には圧縮率を向上させることが
できる。
As described above, the controller 30 of the moving picture compression apparatus according to the present embodiment predicts the P4 picture that is temporally close to the I2 picture and the P3 picture having the same field under the same conditions. Since a prediction structure with a small error is selected and the image data is compressed with the prediction structure, high prediction efficiency can be obtained for any image. Further, since the prediction efficiency can be increased, the image quality can be improved when the compression rate is the same, and the compression rate can be improved when the image quality is the same.

【0051】なお、本実施例では、複数の予測構造を、
フィールド相関が高い場合に使用される予測構造と時間
相関が高い場合に使用される予測構造の2つの予測構造
としているが、これに限定されず、各相関(フィールド
相関、時間相関)に適した予測構造であればいかなる構
造であっても適用可能である。
In this embodiment, a plurality of prediction structures are
There are two prediction structures, a prediction structure used when the field correlation is high and a prediction structure used when the time correlation is high, but the present invention is not limited to this, and is suitable for each correlation (field correlation, time correlation). Any structure can be applied as long as it is a prediction structure.

【0052】また、本実施例では、符号化しようとする
画像データがフィールド相関と時間相関とで何れの相関
性が強いかをI2ピクチャから時間的に近いP4ピクチャ
を予測したときの予測誤差と、フィールドが同じP3ピ
クチャを予測したときの予測誤差とを比較することによ
り相関性を判別するようにしてるが、相関性を判別でき
るものであれば何でもよく、例えば画像の垂直方向への
動き量を調べる等の方法でもよい。
Further, in the present embodiment, which correlation between the image data to be coded is stronger between the field correlation and the time correlation is a prediction error when the P4 picture temporally close to the I2 picture is predicted. , The correlation is determined by comparing with the prediction error when the P3 picture with the same field is predicted, but any correlation can be determined, for example, the amount of movement of the image in the vertical direction. May be used.

【0053】また、上記予測構造は一例であり、Pピク
チャやBピクチャの数、位置、予測の方向等は前述した
実施例に限られないことは勿論である。
The above-described prediction structure is an example, and the number of P pictures and B pictures, positions, prediction directions, etc. are not limited to those in the above embodiments.

【0054】また、本実施例では、動画像圧縮装置をM
PEGアルゴリズムに基づく動画像圧縮装置に適用した
例であるが、勿論これには限定されず、予測構造に基づ
いて符号化を行なうものであれば全ての装置に適用可能
であることは言うまでもない。
Further, in the present embodiment, the moving image compression apparatus is M
This is an example applied to a moving image compression apparatus based on the PEG algorithm, but needless to say, the present invention is not limited to this and can be applied to all apparatuses as long as they perform encoding based on a prediction structure.

【0055】さらに、上記動画像圧縮装置を構成する回
路や部材の数、種類などは前述した実施例に限られない
ことは言うまでもなく、ソフトウェア(例えば、C言
語)により実現するようにしてもよい。
Further, it goes without saying that the number and types of circuits and members constituting the above-mentioned moving picture compression apparatus are not limited to those in the above-mentioned embodiment, but may be realized by software (for example, C language). .

【0056】[0056]

【発明の効果】請求項1、2、3、4、5、6、7及び
8記載の発明によれば、複数の予測画像から構成される
予測構造を複数記憶する予測構造記憶手段と、符号化す
べき画像データに基づいて前記予測構造記憶手段に記憶
された予測構造を選択する予測構造選択手段と、前記予
測構造選択手段により選択された予測構造に従って画像
データを圧縮するデータ圧縮手段を備えているので、ど
のような画像においても高い予測効率を得ることがで
き、画質及び圧縮率の向上を図ることができる。
According to the first, second, third, fourth, fifth, sixth, seventh and eighth aspects of the present invention, a prediction structure storage means for storing a plurality of prediction structures each composed of a plurality of prediction images, and a code A prediction structure selecting means for selecting a prediction structure stored in the prediction structure storing means based on image data to be converted; and a data compressing means for compressing the image data according to the prediction structure selected by the prediction structure selecting means. Therefore, it is possible to obtain high prediction efficiency for any image, and it is possible to improve image quality and compression rate.

【図面の簡単な説明】[Brief description of drawings]

【図1】動画像圧縮装置の機能ブロック図である。FIG. 1 is a functional block diagram of a moving image compression apparatus.

【図2】動画像圧縮装置の符号化器のブロック構成を示
す図である。
FIG. 2 is a diagram showing a block configuration of an encoder of a moving image compression apparatus.

【図3】動画像圧縮装置の復号化器のブロック構成を示
す図である。
FIG. 3 is a diagram showing a block configuration of a decoder of a moving image compression apparatus.

【図4】動画像圧縮装置の画像グループを示す図であ
る。
FIG. 4 is a diagram showing an image group of a moving image compression apparatus.

【図5】動画像圧縮装置の予測構造を示す図である。FIG. 5 is a diagram showing a prediction structure of a moving image compression apparatus.

【図6】動画像圧縮装置の予測構造を示す図である。FIG. 6 is a diagram showing a prediction structure of a moving image compression apparatus.

【図7】動画像圧縮装置の予測構造の決定処理を示すフ
ローチャートである。
FIG. 7 is a flowchart showing a predictive structure determination process of the moving image compression apparatus.

【図8】動画像圧縮装置の画面の予測構造を示す図であ
る。
FIG. 8 is a diagram showing a prediction structure of a screen of the moving image compression apparatus.

【図9】動画像圧縮装置の画面の予測構造を示す図であ
る。
FIG. 9 is a diagram showing a prediction structure of a screen of the moving image compression apparatus.

【符号の説明】[Explanation of symbols]

1 フレームメモリ(FM) 2 予測構造決定装置 3 予測構造群メモリ(PM) 4 圧縮器 5 制御装置 30 コントローラ 31 画像メモリ 32 減算器 33 DCT演算部 34 量子化部 35 VLC 36,46 バッファ 37 動き補償フレーム間予測部 38,48 逆量子化部 39,49 IDCT演算部 40,50 加算器 41,42,43,51,52,53 スイッチ 44,45,54,55 予測器 47 逆VLC 1 Frame Memory (FM) 2 Prediction Structure Determining Device 3 Prediction Structure Group Memory (PM) 4 Compressor 5 Controller 30 Controller 31 Image Memory 32 Subtractor 33 DCT Calculator 34 Quantizer 35 VLC 36, 46 Buffer 37 Motion Compensation Inter-frame predictor 38,48 Dequantizer 39,49 IDCT calculator 40,50 Adder 41,42,43,51,52,53 Switch 44,45,54,55 Predictor 47 Inverse VLC

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 複数の予測画像から構成される予測構造
を複数記憶する予測構造記憶手段と、 符号化すべき画像データに基づいて前記予測構造記憶手
段に記憶された予測構造を選択する予測構造選択手段
と、 前記予測構造選択手段により選択された予測構造に従っ
て画像データを圧縮するデータ圧縮手段と、 を具備したことを特徴とする動画像圧縮装置。
1. A prediction structure storage unit for storing a plurality of prediction structures each composed of a plurality of prediction images, and a prediction structure selection unit for selecting a prediction structure stored in the prediction structure storage unit based on image data to be encoded. And a data compression unit that compresses image data according to the prediction structure selected by the prediction structure selection unit.
【請求項2】 前記予測構造記憶手段に記憶される複数
の予測構造は、フィールド相関が高い場合に使用される
予測構造と、 時間相関が高い場合に使用される予測構造とを含んで構
成されたことを特徴とする請求項1記載の動画像圧縮装
置。
2. A plurality of prediction structures stored in the prediction structure storage means include a prediction structure used when field correlation is high and a prediction structure used when time correlation is high. The moving picture compression apparatus according to claim 1, wherein
【請求項3】 前記予測構造は、独立して符号化可能な
符号化画像と、 過去から現在を予測する片側予測画像と、 過去及び未来の両方向から現在を予測する両方向予測画
像とを含む複数の画像により構成され、 上記各画像を予測元の画像として所定の順序で用いるこ
とにより予測を行うようにした構造であることを特徴と
する請求項1又は請求項2の何れかに記載の動画像圧縮
装置。
3. The prediction structure includes a plurality of coded images that can be coded independently, a one-sided prediction image that predicts the present from the past, and a bidirectional prediction image that predicts the present from both past and future directions. 3. The moving image according to claim 1, wherein the moving image has a structure configured to perform prediction by using each image as a prediction source image in a predetermined order. Image compression device.
【請求項4】 前記予測構造は、フレームを奇数フィー
ルドと偶数フィールドの2つに分割した一方のフィール
ドにおいて、独立して符号化可能な第1の符号化画像
と、 前記他方のフィールドにおいて、独立して符号化可能な
第2の符号化画像とを含んで構成されたことを特徴とす
る請求項1、請求項2又は請求項3の何れかに記載の動
画像圧縮装置。
4. The prediction structure has a first coded image that can be independently coded in one field obtained by dividing a frame into an odd field and an even field, and independently in the other field. 4. The moving image compression apparatus according to claim 1, wherein the moving image compression apparatus is configured to include a second encoded image that can be encoded.
【請求項5】 前記両方向予測画像は、前記符号化画像
又は前記片側予測画像と前記符号化画像又は前記片側予
測画像との間に位置する隣り合う2つの画像であること
を特徴とする請求項3に記載の動画像圧縮装置。
5. The bidirectionally predicted image is two adjacent images located between the coded image or the one-sided predicted image and the coded image or the one-sided predicted image. 3. The moving image compression apparatus according to item 3.
【請求項6】 前記予測構造は、時間軸方向の圧縮のた
めのフレーム間予測処理を行なうものであることを特徴
とする請求項1、請求項2、請求項3、請求項4又は請
求項5の何れかに記載の動画像圧縮装置。
6. The predictive structure performs interframe predictive processing for compression in a time axis direction, claim 1, claim 2, claim 3, claim 4 or claim 6. 5. The moving image compression apparatus according to any one of 5 above.
【請求項7】 前記予測構造選択手段は、符号化しよう
とする画像データがフィールド相関と時間相関とで何れ
の相関性が強いかを判別し、該判別結果に基づいて前記
予測構造記憶手段に記憶された複数の予測構造のうち、
相関性の強い予測構造を選択するようにしたことを特徴
とする請求項1又は請求項2の何れかに記載の動画像圧
縮装置。
7. The predictive structure selecting means determines which of image correlation to be coded is stronger, field correlation or time correlation, and the predictive structure storing means stores it in the predictive structure storage means based on the determination result. Of the stored prediction structures,
The moving picture compression apparatus according to claim 1, wherein a prediction structure having a strong correlation is selected.
【請求項8】 前記予測構造選択手段は、前記符号化画
像を予測元の画像として用いて予測したとときに時間的
に近い前記片側予測画像を予測したときの予測誤差と、
前記符号化画像を予測の元の画像として用いて予測した
ときにフィールドが同じ前記片側予測画像を予測したと
きの予測誤差とを比較することにより相関性を判別する
ようにしたことを特徴とする請求項1又は請求項2の何
れかに記載の動画像圧縮装置。
8. The prediction structure selecting means, a prediction error when predicting the one-sided predicted image that is temporally close when predicted using the coded image as a prediction source image,
When the coded image is used as an original image for prediction, the correlation is determined by comparing with a prediction error when the one-sided predicted image having the same field is predicted. The moving image compression apparatus according to claim 1.
JP16417893A 1992-06-08 1993-06-07 Video compression device Expired - Fee Related JP3590976B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16417893A JP3590976B2 (en) 1992-06-08 1993-06-07 Video compression device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-174802 1992-06-08
JP17480292 1992-06-08
JP16417893A JP3590976B2 (en) 1992-06-08 1993-06-07 Video compression device

Publications (2)

Publication Number Publication Date
JPH0662388A true JPH0662388A (en) 1994-03-04
JP3590976B2 JP3590976B2 (en) 2004-11-17

Family

ID=26489378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16417893A Expired - Fee Related JP3590976B2 (en) 1992-06-08 1993-06-07 Video compression device

Country Status (1)

Country Link
JP (1) JP3590976B2 (en)

Also Published As

Publication number Publication date
JP3590976B2 (en) 2004-11-17

Similar Documents

Publication Publication Date Title
KR100592651B1 (en) Transcoding
US20030095603A1 (en) Reduced-complexity video decoding using larger pixel-grid motion compensation
JP3092281B2 (en) Highly efficient encoding and decoding apparatus for image signals
JPH08223577A (en) Moving image coding method and device therefor and moving image decoding method and device therefor
JPH07112284B2 (en) Predictive encoding device and decoding device
US20030016745A1 (en) Multi-channel image encoding apparatus and encoding method thereof
JPH0818979A (en) Image processor
JPH09294262A (en) Image coder
JPH06350995A (en) Moving picture processing method
JPH07193818A (en) Method and device for processing picture
JP3947316B2 (en) Motion vector detection apparatus and moving picture encoding apparatus using the same
KR19980030414A (en) Moving picture decoding apparatus based on compulsory one-way motion compensation
WO1996033573A1 (en) Device and method for coding moving image
JPH0951538A (en) Encoding method for image signal
JP3590976B2 (en) Video compression device
US6904093B1 (en) Horizontal/vertical scanning frequency converting apparatus in MPEG decoding block
JPH08154250A (en) Moving image coder
JP3188081B2 (en) Image encoding method and image encoding device
JP2883592B2 (en) Moving picture decoding apparatus and moving picture decoding method
JP3356413B2 (en) Image decoding method and apparatus
JP2000059779A (en) Dynamic image encoding device and dynamic image encoding method
JPH09238353A (en) Image coding method and device, image transmission method, and image recording medium
JPH11155147A (en) Image reproduction method, image coder, and image coding method
JPH10126749A (en) Sequential scanning conversion device
JP2000115777A (en) Image processing method and image processing unit

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040816

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070903

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080903

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090903

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100903

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100903

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110903

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees