KR100378795B1 - Flexible direct mode coding method for b pictures in moving picture - Google Patents

Flexible direct mode coding method for b pictures in moving picture Download PDF

Info

Publication number
KR100378795B1
KR100378795B1 KR10-2001-0017407A KR20010017407A KR100378795B1 KR 100378795 B1 KR100378795 B1 KR 100378795B1 KR 20010017407 A KR20010017407 A KR 20010017407A KR 100378795 B1 KR100378795 B1 KR 100378795B1
Authority
KR
South Korea
Prior art keywords
picture
mode
macroblock
direct
skip
Prior art date
Application number
KR10-2001-0017407A
Other languages
Korean (ko)
Other versions
KR20020077630A (en
Inventor
전병문
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR10-2001-0017407A priority Critical patent/KR100378795B1/en
Publication of KR20020077630A publication Critical patent/KR20020077630A/en
Application granted granted Critical
Publication of KR100378795B1 publication Critical patent/KR100378795B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 동영상 코딩 시스템에서 B 픽쳐의 다이렉트 스킵 모드를 사용하여 보다 효과적으로 비트 세이빙을 구현하는 기술에 관한 것이다. 이러한 본 발명은, B 픽쳐의 타겟 매크로블록에서 다이렉트 모드가 최적의 예측모드로 결정되는 제1과정과; B 픽쳐를 기준으로 넥스트 P 픽쳐(P2)의 동일 위치에 있는 매크로블록에서 사용된 예측 모드를 조사하는 제2과정과; 상기의 조사 결과 P2 픽쳐의 모드가 스킵 모드이거나 16 ×16 모드인 경우에는 상기 다이렉트 모드를 스킵으로 간주하여 나머지 데이터를 전송하지 않고, P2 픽쳐의 모드가 다른 모드인 경우에는 레지듀얼 코딩을 통해 나머지 데이터를 전송하게 하는 제3과정에 의해 달성된다.The present invention relates to a technique for more effectively implementing bit saving using a direct skip mode of a B picture in a video coding system. The present invention includes a first process of determining a direct mode as an optimal prediction mode in a target macroblock of a B picture; A second step of examining a prediction mode used in a macroblock at the same position of the next P picture P2 based on the B picture; As a result of the above investigation, when the mode of the P2 picture is the skip mode or the 16 × 16 mode, the direct mode is regarded as a skip, and the remaining data is not transmitted. When the mode of the P2 picture is another mode, the residual coding is performed through the residual coding. This is accomplished by a third process that allows data to be sent.

Description

동영상에서 B픽쳐의 신축적인 다이렉트 모드 코딩 방법{FLEXIBLE DIRECT MODE CODING METHOD FOR B PICTURES IN MOVING PICTURE}FLEXIBLE DIRECT MODE CODING METHOD FOR B PICTURES IN MOVING PICTURE}

본 발명은 동영상 코딩 시스템에서 오브젝트 모션에 기반한 B 픽쳐의 다이렉트 스킵모드를 정의하는 기술에 관한 것으로, 특히 넥스트 P 픽쳐의 엔코딩 과정에 적용되는 루미넌스 제한 조건 및 크로미넌스 제한조건을 제시 함으로써 완전한 복원을 보장하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법에 관한 것이다.The present invention relates to a technique for defining a direct skip mode of a B picture based on object motion in a moving picture coding system. In particular, the present invention relates to a complete constraint by presenting a luminance constraint and a chrominance constraint applied to an encoding process of a next P picture. The present invention relates to a flexible direct mode coding method of B pictures in a guaranteed video.

통상적으로, H.26L은 하나의 VLC(VLC: Variable Length Code)를 사용하고 있다. 따라서, B 픽쳐를 위한 코드 테이블에는 다이렉트 스킵(direct skip) 모드를 사용할 수 없는 문제점을 가지고 있다. 다시 말하면, 다이렉트 모드를 갖는 매크로블록이 나머지 데이터(residual data)의 존재와 관계없이 무조건 CBP(CBP: Coded Block Pattern) 및 양자화 계수(quantized coefficient) 값을 전송해야만 한다. 여기서, 나머지 데이터란 원래의 매크로블록에서 예측된 매크로블록을 감산한 결과를 의미한다.Typically, H.26L uses one variable length code (VLC). Therefore, the direct skip mode cannot be used in the code table for the B picture. In other words, a macroblock having a direct mode must unconditionally transmit a coded block pattern (CBP) and a quantized coefficient value regardless of the existence of residual data. Here, the remaining data means a result of subtracting the macroblock predicted from the original macroblock.

예를 들어, 현재의 매크로블록이 다이렉트 모드를 사용하고 있고, 원래의 매크로블록과 다이렉트 모드에 의해 예측된 매크로블록의 차인 나머지 데이터 값이 "0"일 경우, 엔코더는 매크로블록 레이어(macroblock layer)에서 매크로블록 타입으로 다이렉트 모드를 가르키는 코드 번호 0(1bit)와 블록 레이어에서 cbp=0를 반드시 비트 스트림(bit stream)에 포함시켜야 한다.For example, if the current macroblock is using the direct mode, and the remaining data value "0" which is the difference between the original macroblock and the macroblock predicted by the direct mode is "0", the encoder is a macroblock layer. In the macroblock type, code number 0 (1 bit) indicating the direct mode and cbp = 0 in the block layer must be included in the bit stream.

이와 같이 종래 기술에 의한 H.26L의 B 픽쳐에서의 코딩 방법에 있어서는 다이렉트 모드를 갖는 매크로블록이 나머지 데이터(residual data)의 존재와 관계없이 무조건 CBP 및 양자화 계수 값을 전송하게 되어 있어 결과적으로 불필요하게 비트 레이트를 증가시키게 되는 문제점이 있었다.As described above, in the H.26L B picture coding method according to the prior art, a macroblock having a direct mode unconditionally transmits CBP and quantization coefficient values irrespective of the existence of residual data. There was a problem of increasing the bit rate.

따라서, 본 발명의 목적은 H.26L의 B 픽쳐 코드 테이블에 다이렉트 스킵 모드를 새로이 정의하지 않는 대신 넥스트(next) P 픽쳐의 예측 모드를 바탕으로 다이렉트 스킵 모드를 선택적으로 결정하는 방법을 제공함에 있다.Accordingly, an object of the present invention is to provide a method of selectively determining a direct skip mode based on a prediction mode of a next P picture instead of newly defining a direct skip mode in a B picture code table of H.26L. .

본 발명의 또 다른 목적은 B 픽쳐의 매크로블록이 다이렉트 모드로 결정된 상태에서, 넥스트 P 픽쳐의 모드가 스킵 모드이거나 16 ×16 모드인 경우에는 다이렉트 스킵으로 간주하여 나머지 데이터를 전송하지 않고, 넥스트 P 픽쳐가 다른 모드일 경우에는 나머지 데이터를 전송하게 하는 방법을 제공함에 있다.It is still another object of the present invention, when the macroblock of the B picture is determined to be in the direct mode, when the next P picture mode is the skip mode or the 16 × 16 mode, the next skip is not regarded as a direct skip and the remaining data is not transmitted. When the picture is in another mode, the present invention provides a method for transmitting the remaining data.

도 1은 넥스트 픽쳐(P2)의 스킵모드 설명도.1 is a diagram illustrating a skip mode of a next picture P2.

도 2의 (a),(b)는 P2가 스킵모드일 때 B 픽쳐에서 타겟 매크로블록이 다른 분포를 갖는 예를 보인 설명도.2A and 2B are explanatory diagrams showing an example in which a target macroblock has a different distribution in a B picture when P2 is in a skip mode;

도 3의 (a)-(h)는 P1,B,P2 픽쳐의 동일 위치에 있는 매크로블록 사이의 오브젝트 모션을 보인 예시도.3 (a)-(h) are exemplary diagrams showing object motion between macroblocks at the same positions of P1, B, and P2 pictures.

도 4는 다이렉트 모드의 모션 벡터 설명도.4 is a motion vector explanatory diagram in the direct mode.

***도면의 주요 부분에 대한 부호의 설명****** Description of the symbols for the main parts of the drawings ***

P1,P2 : P 픽쳐 B : B 픽쳐P1, P2: P picture B: B picture

본 발명에 의한 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법은, B 픽쳐의 타겟 매크로블록에서 다이렉트 모드가 최적의 예측모드로 결정되는 제1과정과; B 픽쳐를 기준으로 이웃하는 넥스트 P 픽쳐(P2)의 동일 위치에 있는 매크로블록에서 사용된 예측 모드를 조사하는 제2과정과; 상기의 조사 결과 P2 픽쳐의 모드가 스킵 모드이거나 16 ×16 모드인 경우를 기준으로 하여 상기 다이렉트 모드를 스킵일 경우와 아닐 경우로 구분하여 스킵일 경우에는 나머지 데이터를 전송하지 않고, 스킵이 아닐 경우에는 나머지 데이터를 전송하게 하는 제3과정으로 이루어지는 것으로, 이와 같은 본 발명의 작용을 첨부한 도 1 내지 도 4를 참조하여 상세히 설명하면 다음과 같다.According to an aspect of the present invention, there is provided a method of flexible direct mode coding of a B picture, comprising: a first process of determining a direct mode as an optimal prediction mode in a target macroblock of a B picture; A second process of examining a prediction mode used in a macroblock at the same position of a neighboring next P picture P2 based on a B picture; As a result of the above investigation, based on the case in which the mode of the P2 picture is the skip mode or the 16 × 16 mode, the direct mode is divided into a case of skip and a case of skip. It consists of a third process for transmitting the remaining data, described in detail with reference to Figures 1 to 4 attached to the operation of the present invention as follows.

본 발명에서는 엔코더 및 디코더에서 B 픽쳐 코드 테이블에 존재하지 않는 다이렉트 스킵 모드를 넥스트 P 픽쳐에서 사용된 예측 모드로부터 선택적으로 결정하여 가능한 한 많은 비트 세이빙이 이루어지도록 하였다. 따라서, B 픽쳐의 현재 코딩하려는 매크로블록(target macroblock)이 인트라 예측(intra prediction), 전방 예측(forward prediction), 후방 예측(backward prediction), 양방향 예측(bi-direction prediction), 다이렉트 예측(direct prediction) 중 가장 작은 SAD(SAD: Sum of Absolute Difference) 값을 갖는 최적의 예측 모드로서 다이렉트 모드를 결정하였다고 가정한다.In the present invention, the direct skip mode that does not exist in the B picture code table in the encoder and the decoder is selectively determined from the prediction mode used in the next P picture so that bit saving is possible as much as possible. Therefore, the current target macroblock of the B picture is intra prediction, forward prediction, backward prediction, bi-direction prediction, direct prediction. Assume that the direct mode is determined as an optimal prediction mode having the smallest SAD (Sum of Absolute Difference) value.

이와 같이 현재 B 픽쳐의 임의의 매크로블록에서 다이렉트 모드가 최적의 예측모드로 결정되었다고 가정할 때, 선택된 다이렉트 모드에 대해 레지듀얼 코딩을 수행할 것인지 수행하지 않을 것인지를 넥스트 P 픽쳐의 동일 위치에 있는 매크로블록에서 사용된 예측 모드를 보고 결정하도록 하였다. 만일 사용된 예측모드가 스킵이거나 16 ×16이었다면 B 픽쳐의 매크로블록은 다이렉트 스킵을 사용하고, 다른 예측모드를 넥스트 P 픽쳐에서 사용하였다면 B 픽쳐는 레지듀얼 코딩을 하는 신축적인 다이렉트 모드를 사용하게 되는 것으로 이를 상세히 설명하면 다음과 같다.Thus, assuming that the direct mode is determined to be the best prediction mode in any macroblock of the current B picture, whether or not to perform residual coding for the selected direct mode is located at the same position of the next P picture. The prediction mode used in the macroblock is viewed and determined. If the prediction mode used is skip or 16 × 16, then the macroblock of picture B uses direct skip; if another prediction mode is used for the next P picture, the picture B uses the flexible direct mode with residual coding. This will be described in detail as follows.

먼저, 넥스트 P 픽쳐의 매크로블록이 스킵 모드일 경우에 대해 설명하면 다음과 같다.First, a case in which the macroblock of the next P picture is the skip mode will be described.

넥스트 P 픽쳐에서 타겟 매크로블록과 동일한 위치에 있는 매크로블록이 스킵 모드를 사용하였다고 가정하자. 이때, 넥스트 P 픽쳐의 스킵 모드는 16 ×16 블록 사이즈를 사용하고 제로 모션 및 나머지 데이터가 "0"일 때 정의되는 P 픽쳐에서 사용되는 예측 모드이다.Suppose that a macroblock at the same position as the target macroblock in the next P picture used the skip mode. In this case, the skip mode of the next P picture is a prediction mode used in a P picture defined when 16 × 16 block size is used and zero motion and the remaining data are “0”.

도 1에서 P2 픽쳐의 매크로 블록은 P1 픽쳐의 매크로블록과 동일하고, 시간적으로 B 픽쳐의 타겟 매크로블록은 P1 픽쳐와 P2 픽쳐의 매크로블록과 동일한 특성을 갖을 확률이 높기 때문에 타겟 매크로블록은 다이렉트 스킵으로 사용될 가능성이 매우 높다. 따라서, 타겟 매크로블록과 동일한 위치에 있는 넥스트 P픽쳐(P2)의 매크로블록이 스킵으로 선언되었을 경우에 타겟 매크로블록은 다이렉트 스킵을 사용하도록 정의한다.In FIG. 1, the macro block of the P2 picture is the same as the macroblock of the P1 picture, and since the target macroblock of the B picture has a high probability of having the same characteristics as the macroblocks of the P1 picture and the P2 picture in time, the target macroblock is directly skipped. It is very likely to be used. Therefore, the target macroblock is defined to use direct skip when the macroblock of the next P picture P2 at the same position as the target macroblock is declared skip.

그러나, 타겟 매크로블록이 P1과 P2의 매크로블록과 다른 특성을 갖는 경우도 존재할 수 있는데, 도 2는 그 예를 나타낸 것이다.However, there may be a case where the target macroblock has a different characteristic from the macroblocks of P1 and P2, but FIG. 2 shows an example.

도 2에서와 같이 B 픽쳐가 인접된 P 픽쳐(P1,P2)와 다른 분포를 갖는 경우, B 픽쳐의 타겟 매크로블록은 다이렉트 스킵 대신 레지듀얼 코딩을 하는 다이렉트 모드를 사용해야 디코더에서 타겟 매크로블록에 가깝게 재구성할 수 있다. 하지만, 이것은 본 발명의 다이렉트 스킵 정의에 위배되는 사항이다. 왜냐하면, 비록 P2 픽쳐가 스킵 모드를 사용할지라도 B 픽쳐의 타겟 매크로블록은 다이렉트 스킵 모드를 선택해서는 안되기 때문이다. 따라서, 본 발명의 다이렉트 스킵 정의를 보장받기 위한 방법으로 P2 픽쳐의 각 매크로블록을 디코딩할 때 도 2와 같은 경우에 대해서는 제한 조건을 두었다.When the B picture has a different distribution from the adjacent P pictures P1 and P2 as shown in FIG. 2, the target macroblock of the B picture should use a direct mode that uses residual coding instead of direct skipping so as to be closer to the target macroblock in the decoder. Can be reconfigured. However, this is a violation of the direct skip definition of the present invention. This is because the target macroblock of the B picture should not select the direct skip mode, even though the P2 picture uses the skip mode. Therefore, when decoding each macroblock of a P2 picture as a method for guaranteeing a direct skip definition of the present invention, a constraint is placed on the case shown in FIG.

도 2와 같은 경우를 검출하기 위한 방법으로 움직임 검출(Motion detection)기법을 사용한다. 예를 들어 P1 픽쳐와 B 픽쳐(또는 B와 P2)를 비교하여 두 매크로블록 사이에 변화가 발생(object motion)한 것을 인식할 할 수 있다. 이러한 오브젝트 모션을 검출하기 위한 방법으로 두 매크로블록의 픽셀 대 픽셀 사이의 절대치 차를 각기 구하여 이 값들 중에 어느 하나라도 임계치(예: 20) 이상의 값이 검출되면 오브젝트 모션이 발생되었다고 정의한다.As a method for detecting the case as shown in FIG. 2, a motion detection technique is used. For example, the P1 picture and the B picture (or B and P2) may be compared to recognize that an object motion occurs between two macroblocks. As a method for detecting the object motion, the absolute value difference between the pixels and the pixels of the two macroblocks is respectively determined, and when any one of these values is detected to be greater than the threshold (eg, 20), the object motion is generated.

따라서, 도 2의 경우 P1 픽쳐와 B 픽쳐의 두 매크로블록 사이에 모션이 존재하고 또한 B 픽쳐와 P2 픽쳐 사이에 모션이 존재하는 것이다. 따라서, P2 픽쳐의 각 매크로블록을 엔코딩할 때 움직임 검출과정에서 도 2와 같은 움직임이 검출되면 16 ×8 모드 이하로 예측하도록 강제적인 제한을 가하게 된다.Therefore, in FIG. 2, motion exists between two macroblocks of a P1 picture and a B picture, and a motion exists between the B picture and the P2 picture. Therefore, when encoding each macroblock of the P2 picture, if a motion such as that shown in FIG. 2 is detected in the motion detection process, a mandatory restriction is applied to predict a 16 × 8 mode or less.

이것은 P2 픽쳐가 본래 스킵 모드로 사용할 수 있음에도 불구하고 사용하지 못하게 함으로써 본 발명의 다이렉트 스킵 정의를 보장받을 수 있도록 하기 위함이다. 단, 엔코더에서 P1 픽쳐는 이미 디코딩된 매크로블록을 사용하고, P2 픽쳐는 코딩하려는 원래의 매크로블록, 그리고 B 픽쳐의 타겟 매크로블록은 P2 픽쳐 후에 코딩하기 위해 버퍼에 저장되어 있는 원래의 타겟 매크로블록을 사용한다.This is to ensure that the direct skip definition of the present invention is ensured by disabling the P2 picture even though it can be originally used in the skip mode. In the encoder, however, the P1 picture uses the already decoded macroblock, the P2 picture is the original macroblock to be coded, and the target macroblock of the B picture is the original target macroblock stored in the buffer for coding after the P2 picture. Use

한편, P2 픽쳐의 매크로블록이 스킵을 사용하지 않는 경우에도 B 픽쳐의 타겟 매크로블록과 동일한 위치에 있는 P1과 P2 픽쳐의 매크로블록 사이의 오브젝트 모션으로부터 다이렉트 스킵을 결정하는 다른 기법에 대해 도 3을 참조하여 설명한다.On the other hand, even if the macroblock of the P2 picture does not use skip, Figure 3 shows another technique for determining direct skip from the object motion between P1 and the macroblock of the P2 picture at the same position as the target macroblock of the B picture. It demonstrates with reference.

도 3의 (a)는 세 개의 매크로블록의 특성이 모두 비슷한 경우이고, (b)(c)는 B 픽쳐의 타겟 매크로블록과 P2 또는 P1 픽쳐의 각 매크로블록이 유사한 특성을 가지고 있는 경우이다. 이때, 타겟 매크로블록의 예측 모드는 다이렉트 모드로 선택되어 있음을 상기하면, 다른 예측 모드 특히 (a)의 경우에는 타겟 매크로블록과 같은 위치의 두 매크로블록이 유사한 특성을 가졌음에도 불구하고 전방 예측, 후방 예측 또는 양방향 예측이 아닌 다이렉트 예측 모드로 선택되었다는 사실은 다이렉트 모드로 예측한 결과가 다른 예측 모드에 비해 원래의 타겟 매크로블록에 가장 유사하게 예측됨을 의미한다. 마찬가지로, (b)의 경우는P2 픽쳐의 매크로블록이 타겟 매크로블록과 유사한 특성을 가졌지만 후방 예측이 아닌 다이렉트 모드로, (c)의 경우에는 P1 픽쳐의 매크로블록이 타겟 매크로블록과 유사한 특성을 가졌지만 전방 예측이 아닌 다이렉트 모드로 선택되어졌고 그 의미는 동일하다.3 (a) shows a case in which all three macroblocks have similar characteristics, and (b) (c) shows a case where the target macroblock of the B picture and each macroblock of the P2 or P1 picture have similar characteristics. In this case, recalling that the prediction mode of the target macroblock is selected as a direct mode, in the case of another prediction mode, particularly (a), although the two macroblocks at the same position as the target macroblock have similar characteristics, forward prediction, The fact that the direct prediction mode is selected rather than backward prediction or bidirectional prediction means that the result predicted by the direct mode is most similarly predicted to the original target macroblock as compared to other prediction modes. Similarly, in case of (b), the macroblock of the P2 picture has similar characteristics to the target macroblock, but in direct mode instead of backward prediction, in case of (c), the macroblock of the P1 picture has similar characteristics to the target macroblock. Has been selected but in direct mode rather than forward prediction and the meaning is the same.

따라서, 이와 같은 경우는 레지듀얼 코딩을 하는 다이렉트 모드 대신 다이렉트 스킵 모드를 사용하여 비트 레이트(bit rate)를 감소시키는 것이 가능하다. 물론, 레지듀얼 코딩에 비해 어느 정도의 화질 저하현상이 발생될 수 있지만 다이렉트 스킵 모드에 의해 절약되는 비트량에 비하면 무시할 만하다. 본 발명에서는 이와 같이 B 픽쳐의 타겟 매크로블록과 유사한 특성을 갖는 매크로블록이 P1 또는 P2 픽쳐에 존재하는 경우 다이렉트 스킵모드로 사용하고자 한다.Therefore, in such a case, it is possible to reduce the bit rate by using the direct skip mode instead of the direct mode for residual coding. Of course, some degradation in image quality may occur compared to residual coding, but it is negligible compared to the amount of bits saved by the direct skip mode. In the present invention, if a macroblock having similar characteristics to a target macroblock of a B picture exists in a P1 or P2 picture, the present invention intends to use the direct skip mode.

이와 반대로, 도 3의 나머지 경우(d∼h)를 보면, 공통적으로 P1 픽쳐와 B 픽쳐, B 픽쳐와 P2 픽쳐 사이에 오브젝트 모션이 존재함을 알 수 있다. 이와 같이 오브젝트 모션이 존재한다는 것은 두 매크로블록 사이에 유사한 특성을 갖고 있지 않다는 것을 의미한다. 따라서, 다이렉트 모드에 의해 예측된 결과가 원래의 타겟 매크로블록에 얼마나 유사하게 예측되었는지를 판단할 근거가 없게 된다. 따라서,(d)∼(h)와 같은 경우에 대해서는 반드시 나머지 코딩을 통한 다이렉트 예측을 해야 한다.On the contrary, in the remaining cases (d to h) of FIG. 3, it can be seen that an object motion exists between the P1 picture and the B picture, and the B picture and the P2 picture in common. As such, the existence of object motion means that there is no similar property between two macroblocks. Thus, there is no basis for determining how similarly the result predicted by the direct mode is predicted to the original target macroblock. Therefore, in the case of (d) to (h), direct prediction must be performed through the remaining coding.

본 발명에서는 도 3의 오브젝트 모션을 기반으로 한 다이렉트 스킵 모드를 정의하기 위해, P2 픽쳐의 매크로블록이 (a)∼(c)를 만족하면서 동시에 16 ×16으로 예측 모드를 사용하는 경우에 타겟 매크로블록은 다이렉트 스킵 모드로 예측하도록 하였다. 이때, 도 4에서와 같이 16 ×16 모드는 제로 또는 넌제로 모션 벡터를 갖게 되고, 이들로부터 다이렉트 전방 움직임 벡터(direct forward motion vector) 및 다이렉트 후방 움직임 벡터(direct backward motion vector)가 유도되어진다.In the present invention, in order to define the direct skip mode based on the object motion of FIG. 3, the target macro when the macroblock of the P2 picture satisfies (a) to (c) and uses the prediction mode at 16 × 16 simultaneously. The block was predicted in direct skip mode. In this case, as shown in FIG. 4, the 16 × 16 mode has a zero or non-zero motion vector, from which a direct forward motion vector and a direct backward motion vector are derived.

만일 P2 픽쳐의 매크로블록이 도 3의 (d)∼(h)와 같은 경우라면 본 발명의 오브젝트 모션에 기반한 다이렉트 스킵 정의를 보장하기 위하여, P2 픽쳐를 엔코딩할 때 움직임 검출 방법으로 도 3의 (d)∼(h) 경우를 검출한 후, B 픽쳐의 타겟 매크로블록이 다이렉트 스킵으로 선언되지 않도록 하기 위해 16 ×8 모드 이하로 예측하도록 강제적인 제한을 두었다.If the macroblock of the P2 picture is the same as (d) to (h) of FIG. 3, in order to guarantee the direct skip definition based on the object motion of the present invention, when the P2 picture is encoded, the motion detection method of FIG. After detecting the cases d) to (h), a mandatory restriction was made to predict the 16 × 8 mode or less so that the target macroblock of the B picture is not declared as a direct skip.

한편, 다이렉트 스킵 모드 선택을 위한 루미넌스(luminance) 제한 조건 및 컬러 정보 보존을 위한 크로미넌스(chrominance) 제한 조건에 대해 설명하면 다음과 같다.Meanwhile, the luminance constraint for selecting the direct skip mode and the chrominance constraint for preserving color information will be described as follows.

H.26L에서 사용되는 비디오는 움직임을 포함한 모든 비디오 정보를 제공하는 루미넌스 성분(Y)과 컬러 정보를 제공하는 크로미넌스 성분(U,V)로 나누어진다.The video used in H.26L is divided into a luminance component (Y) that provides all video information including motion and a chrominance component (U, V) that provides color information.

상기의 설명에서와 같이, 본 발명에서는 비트 세이빙을 위해 다이렉트 스킵모드를 P2 픽쳐의 매크로블록에서 사용된 예측 모드에 따라 선택적으로 결정하도록 하였다. 즉, P2 픽쳐의 매크로블록이 스킵 모드나 16 ×16 예측 모드를 사용하였다면, B 픽쳐의 타겟 매크로블록은 다이렉트 스킵 모드로 예측을 수행하게 하였다.As described above, in the present invention, the direct skip mode is selectively determined according to the prediction mode used in the macroblock of the P2 picture for bit saving. That is, if the macroblock of the P2 picture uses the skip mode or the 16 × 16 prediction mode, the target macroblock of the B picture causes prediction to be performed in the direct skip mode.

단, 도 2의 경우와 같이 P1 픽쳐와 B 픽쳐간에서 오브젝트 움직임이 검출되고 B 픽쳐와 P2 픽쳐간에서도 오브젝트 움직임이 검출되는 경우에는 설령 P2 픽쳐의 매크로블록이 스킵 모드일지라도 강제적으로 16 ×8 이하의 예측 모드를 결정하도록 제한하였다. 또한, P2 픽쳐의 매크로블록이 16 ×16 모드를 사용할 경우에 도 3의 (d)∼(h)와 같이 오브젝트 모션이 모두 검출될 때에는 스킵 모드 때와 마찬가지로 강제적으로 16 ×8 이하의 모드로 예측 모드를 결정하도록 제한을 두었다.However, as shown in FIG. 2, when object motion is detected between the P1 picture and the B picture, and object motion is detected between the B picture and the P2 picture, even if the macroblock of the P2 picture is in the skip mode, 16x8 or less may be forced. It was limited to determine the prediction mode of. Also, when the macroblock of the P2 picture uses the 16 × 16 mode, when all object motions are detected as shown in FIGS. 3D to 3H, the prediction is forced to 16 × 8 or less mode as in the skip mode. Limits were made to determine the mode.

이러한 오브젝트 모션에 기반한 다이렉트 스킵 모드의 선택은 비디오의 루미넌스 성분을 이용하게 되므로, 다이렉트 스킵 정의를 보장하기 위한 제한 조건들은 루미넌스 제한 조건이 되는 것이다.Since the selection of the direct skip mode based on the object motion uses the luminance component of the video, the constraints for guaranteeing the direct skip definition become the luminance constraint.

만일, 영상 프레임 사이에 급격한 컬러 전환이 있고, 루미넌스 성분에서 다이렉트 스킵 조건을 만족하여 B 픽쳐의 타겟 매크로블록이 다이렉트 스킵 모드를 사용할 경우, 컬러 성분을 제대로 재 구성하지 못하게 되는 문제점이 발생된다. 따라서, B 픽쳐의 타겟 매크로블록과 동일 위치에 있는 P1과 P2 픽쳐의 매크로블록의 크로미넌스를 조사하여 한 픽셀이라도 임계치(예: 60) 이상의 변화를 보이면 루미넌스 제한 조건과 동일하게 P2 픽쳐의 매크로블록에서 강제적으로 16 ×8 이하의 모드로 예측 모드를 결정하도록 제한을 두었다.If there is a sudden color change between image frames, and a direct macro skipping condition is used in the luminance component and the target macroblock of the B picture uses the direct skip mode, there is a problem that the color component is not properly reconstructed. Therefore, if the chrominance of the macroblocks of the P1 and P2 pictures at the same position as the target macroblock of the B picture is examined, and a pixel changes more than the threshold (for example, 60), the macro of the P2 picture is the same as the luminance constraint. The block is forced to determine the prediction mode to a mode of 16 × 8 or less.

이상에서 상세히 설명한 바와 같이 본 발명은 H.26L의 B 픽쳐 코드 테이블에 다이렉트 스킵 모드를 새로이 정의하지 않는 대신 넥스트 P 픽쳐의 예측 모드를 바탕으로 다이렉트 스킵 모드를 선택적으로 결정하도록 함으로써, 다이렉트 스킵을 정의할 수 없는 H.26L의 부호화 효율을 극대화 할 수 있는 효과가 있다.As described in detail above, the present invention does not newly define the direct skip mode in the B. picture code table of H.26L, but instead defines the direct skip mode based on the prediction mode of the next P picture. There is an effect that can maximize the coding efficiency of H.26L that can not.

또한, 오브젝트 모션에 기반한 B 픽쳐의 다이렉트 스킵 모드를 정의하기 위해 루미넌스 제한 조건 및 크로미넌스 제한 조건을 제시 함으로써, 허용 가능한 범위의 화질을 보장할 수 있는 효과가 있다.In addition, by providing a luminance constraint and a chrominance constraint to define the direct skip mode of the B picture based on the object motion, there is an effect of ensuring an acceptable range of image quality.

Claims (8)

B 픽쳐의 타겟 매크로블록에서 다이렉트 모드가 최적의 예측모드로 결정되는 제1과정과; B 픽쳐를 기준으로 넥스트 P 픽쳐(P2)의 동일 위치에 있는 매크로블록에서 사용된 예측 모드를 조사하는 제2과정과; 상기의 조사 결과 P2 픽쳐의 모드가 스킵 모드이거나 16 ×16 모드인 경우에는 상기 다이렉트 모드를 스킵으로 결정하여 나머지 데이터를 전송하지 않고, P2 픽쳐가 다른 모드를 사용하는 경우에는 레지듀얼 코딩을 통해 나머지 데이터를 전송하게 하는 제3과정으로 이루어지는 것을 특징으로 하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법.A first step of determining a direct mode as an optimal prediction mode in the target macroblock of the B picture; A second step of examining a prediction mode used in a macroblock at the same position of the next P picture P2 based on the B picture; As a result of the above investigation, when the mode of the P2 picture is the skip mode or the 16 × 16 mode, the direct mode is set to skip and the remaining data is not transmitted. When the P2 picture uses another mode, the residual coding is performed through the residual coding. A flexible direct mode coding method of a B picture in a video, characterized by comprising a third step of transmitting data. 제1항에 있어서, 넥스트 P 픽쳐를 엔코딩할 때, P1 픽쳐와 B 픽쳐, 또는 B 픽쳐와 P2 픽쳐 상에서 동일 위치에 있는 두 매크로블록의 픽셀 대 픽셀 사이의 절대치 차를 각기 구하여 이 값들 중에 어느 하나라도 임계치 이상의 값이 검출되면 오브젝트 모션이 발생된 것으로 판단하여 P2 픽쳐의 매크로블록이 스킵 모드일지라도 16 ×8 모드 이하로 예측하도록 강제적인 제한을 가하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법.The method of claim 1, wherein when encoding a next P picture, one of these values is obtained by obtaining an absolute difference between pixels of pixels of a P1 picture and a B picture, or two macroblocks in the same position on the B picture and the P2 picture, respectively. Even if a value above the threshold is detected, it is determined that the object motion has occurred, and the step of forcibly limiting the prediction to the 16x8 mode or less even if the macroblock of the P2 picture is skipped mode further comprises B. Flexible direct mode coding method for pictures. 제2항에 있어서, 두 매크로블록의 픽셀 대 픽셀 사이의 절대치 차를 구할 때, P1 픽쳐는 이미 디코딩된 매크로블록을 사용하고, P2 픽쳐는 코딩하려는 원래의 매크로블록을 사용하며, B 픽쳐의 타겟 매크로블록은 P2 픽쳐 후에 코딩하기 위해 버퍼에 저장되어 있는 원래의 타겟 매크로블록을 사용하는 것을 특징으로 하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법.The method of claim 2, wherein when obtaining an absolute difference between pixels of pixels of two macroblocks, the P1 picture uses the already decoded macroblock, the P2 picture uses the original macroblock to be coded, and the target of the B picture. A macroblock is a flexible direct mode coding method of a B picture in a video, characterized by using an original target macroblock stored in a buffer for coding after a P2 picture. 제2항에 있어서, 임계치는 20인 것을 특징으로 하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법.3. The method of claim 2, wherein the threshold is twenty. 제1항에 있어서, 제3과정은 P2 픽쳐의 모드가 스킵 모드가 아닐지라도, B 픽쳐의 타겟 매크로블록과 유사한 특성을 갖는 매크로블록이 P1 픽쳐 또는 P2 픽쳐에 존재하고, 동시에 16 ×16 으로 예측 모드를 사용하는 경우 타겟 매크로블록은 다이렉트 스킵으로 예측되도록 하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법.The method of claim 1, wherein the third process is that although the mode of the P2 picture is not the skip mode, a macroblock having characteristics similar to the target macroblock of the B picture is present in the P1 picture or the P2 picture and simultaneously predicted by 16 × 16. The method of claim 1, wherein the target macroblock further comprises the step of predicting the direct skip when the mode is used. 제1항에 있어서, 제3과정은 P2 픽쳐의 매크로블록이 16 ×16 모드를 사용할 경우, P1 픽쳐 및 P2 픽쳐에서 오브젝트 모션이 모두 검출되면 강제적으로 16 ×8 이하의 모드로 예측 모드를 결정하도록 제한하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법.The method of claim 1, wherein the third process is to forcibly determine the prediction mode to a mode of 16 × 8 or less if both object motions are detected in the P1 picture and the P2 picture when the macroblock of the P2 picture uses the 16 × 16 mode. A method of flexible direct mode coding of a B picture in a video, further comprising the step of limiting. 제1항에 있어서, 제3과정은 B 픽쳐의 타겟 매크로블록과 동일 위치에 있는 P1과 P2 픽쳐의 매크로블록의 크로미넌스를 조사하여 한 픽셀이라도 임계치 이상의변화를 보이면 P2 픽쳐의 매크로블록에서 강제적으로 16 ×8 이하의 모드로 예측 모드를 결정하도록 제한하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법.The method of claim 1, wherein the third process examines the chrominance of the macroblocks of the P1 and P2 pictures at the same position as the target macroblock of the B picture, and forcibly changes the macroblock of the P2 picture if a pixel changes more than a threshold. And limiting the determination of the prediction mode to a mode of 16 × 8 or less. 제7항에 있어서, 임계치는 60인 것을 특징으로 하는 동영상에서 B 픽쳐의 신축적인 다이렉트 모드 코딩 방법.8. The method of claim 7, wherein the threshold is 60.
KR10-2001-0017407A 2001-04-02 2001-04-02 Flexible direct mode coding method for b pictures in moving picture KR100378795B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0017407A KR100378795B1 (en) 2001-04-02 2001-04-02 Flexible direct mode coding method for b pictures in moving picture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0017407A KR100378795B1 (en) 2001-04-02 2001-04-02 Flexible direct mode coding method for b pictures in moving picture

Publications (2)

Publication Number Publication Date
KR20020077630A KR20020077630A (en) 2002-10-12
KR100378795B1 true KR100378795B1 (en) 2003-04-03

Family

ID=27699603

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0017407A KR100378795B1 (en) 2001-04-02 2001-04-02 Flexible direct mode coding method for b pictures in moving picture

Country Status (1)

Country Link
KR (1) KR100378795B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8625670B2 (en) 2008-03-17 2014-01-07 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4114859B2 (en) 2002-01-09 2008-07-09 松下電器産業株式会社 Motion vector encoding method and motion vector decoding method
KR100480028B1 (en) * 2002-05-07 2005-03-30 엘지전자 주식회사 Improved direct prediction mode for b pictures by addition of syntax element indicating scene change
KR100750110B1 (en) 2003-04-22 2007-08-17 삼성전자주식회사 4x4 intra luma prediction mode determining method and apparatus
WO2011074919A2 (en) * 2009-12-17 2011-06-23 에스케이텔레콤 주식회사 Image encoding/decoding method and device
US8885711B2 (en) 2009-12-17 2014-11-11 Sk Telecom Co., Ltd. Image encoding/decoding method and device
KR20110097704A (en) * 2010-02-23 2011-08-31 삼성전자주식회사 Method and apparatus for endconding/decoding prediction picture in a layered coding structure
CN106412601B (en) 2010-09-02 2019-12-17 Lg电子株式会社 Apparatus for encoding and decoding video and readable storage medium
KR20140018873A (en) * 2011-04-07 2014-02-13 엘지전자 주식회사 Method for encoding and decoding image information

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950701487A (en) * 1993-03-24 1995-03-23 오오가 노리오 Method of coding and decoding motion vector and apparatus therefor, method of coding and decoding picture signal and apparatus therefor
KR19980081098A (en) * 1997-04-04 1998-11-25 이데이노부유끼 Image editing apparatus and image editing method
KR19990015710A (en) * 1997-08-08 1999-03-05 윤종용 Picture decoding synchronization circuit and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950701487A (en) * 1993-03-24 1995-03-23 오오가 노리오 Method of coding and decoding motion vector and apparatus therefor, method of coding and decoding picture signal and apparatus therefor
KR19980081098A (en) * 1997-04-04 1998-11-25 이데이노부유끼 Image editing apparatus and image editing method
KR19990015710A (en) * 1997-08-08 1999-03-05 윤종용 Picture decoding synchronization circuit and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8625670B2 (en) 2008-03-17 2014-01-07 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image

Also Published As

Publication number Publication date
KR20020077630A (en) 2002-10-12

Similar Documents

Publication Publication Date Title
US11627317B2 (en) Moving image coding apparatus and moving image decoding apparatus
US6959044B1 (en) Dynamic GOP system and method for digital video encoding
KR100249223B1 (en) Method for motion vector coding of mpeg-4
US7856059B2 (en) Determining the number of unidirectional and bidirectional motion compensated frames to be encoded for a video sequence and detecting scene cuts in the video sequence
KR100267805B1 (en) Motion image decoding method and apparatus for judging contamination regions
US6625215B1 (en) Methods and apparatus for context-based inter/intra coding mode selection
EP1853069B1 (en) Decoding macroblock type and coded block pattern information
US6542642B2 (en) Image coding process and motion detecting process using bidirectional prediction
Suzuki et al. Inter frame coding with template matching averaging
JP2006101527A (en) Method and apparastus equipment of coding of sequence of picture
US7092443B2 (en) Process and device for video coding using the MPEG4 standard
KR100378795B1 (en) Flexible direct mode coding method for b pictures in moving picture
JP4133346B2 (en) Intra coding of video data blocks by selection of prediction type
US20080080779A1 (en) Image coding apparatus, image decoding apparatus, and image decoding method
US8964836B2 (en) Method and apparatus for spatial predictive encoding and/or decoding of video data
US6771825B1 (en) Coding video dissolves using predictive encoders
JP2006203597A (en) Digital image decoder and decoding method
US6922490B2 (en) Image compression of selected regions based on transmission bit rate, motion, and/or region information, and bit selection before compression based on transmission bit rate
JPH1093964A (en) Device for concealing error of image signal
US20110249736A1 (en) Codeword restriction for high performance video coding
JPS61164390A (en) Adaptive forecast coding device of inter-frame and between frames of animation picture signal
JP2001128173A (en) Object encoding device
Lainema Intra block copy masking
KR100295328B1 (en) Image Encoding and Decoding Method through Prediction of Residual Signal Between Blocks
JPH10210480A (en) Dynamic image coding system

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080102

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee