KR100466595B1 - Shape Information Encoding Method of Object Image - Google Patents

Shape Information Encoding Method of Object Image Download PDF

Info

Publication number
KR100466595B1
KR100466595B1 KR1019970032025A KR19970032025A KR100466595B1 KR 100466595 B1 KR100466595 B1 KR 100466595B1 KR 1019970032025 A KR1019970032025 A KR 1019970032025A KR 19970032025 A KR19970032025 A KR 19970032025A KR 100466595 B1 KR100466595 B1 KR 100466595B1
Authority
KR
South Korea
Prior art keywords
shape information
image
encoding
reconstructed
block
Prior art date
Application number
KR1019970032025A
Other languages
Korean (ko)
Other versions
KR19990009584A (en
Inventor
권지헌
김해광
문주희
Original Assignee
주식회사 팬택앤큐리텔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 팬택앤큐리텔 filed Critical 주식회사 팬택앤큐리텔
Priority to KR1019970032025A priority Critical patent/KR100466595B1/en
Publication of KR19990009584A publication Critical patent/KR19990009584A/en
Application granted granted Critical
Publication of KR100466595B1 publication Critical patent/KR100466595B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야1. TECHNICAL FIELD OF THE INVENTION

본 발명은 대상물 영상의 모양정보 부호화 방법에 관한 것임.The present invention relates to a method of encoding shape information of an object image.

2. 발명이 해결하려고 하는 기술적 과제2. The technical problem to be solved by the invention

본 발명은 내용물 기반의 영상 부호화시, 모양정보 손실 부호화가 적용되어 원영상 모양정보는 없고 복원된 모양정보만 존재할 경우, 복원된 모양정보만 있는 블럭에 패딩 과정을 적용함으로써, 쓰레기 정보가 그대로 부호화되는 것을 막아, 부호화효율 및 영상품질을 향상시킬 수 있는 대상물 영상의 모양정보 부호화 방법을 제공하는데 그 목적이 있음.According to the present invention, when content-based image coding is applied, shape information loss coding is applied and there is no original image shape information and only reconstructed shape information exists, by applying a padding process to a block containing only reconstructed shape information, garbage information is encoded as it is. The purpose of the present invention is to provide a method of encoding shape information of an object image, which can prevent encoding, and improve encoding efficiency and image quality.

3. 발명의 해결방법의 요지3. Summary of Solution to Invention

본 발명은, 영상 입력장치를 통해 인가되는 영상을 임의의 모양 정보를 갖는 각각의 대상물 영상과 배경 영상으로 분리하여 처리하는 모양 정보 부호화 방법에 있어서, 모양정보 손실부호화가 적용되어 원영상 모양정보는 없고 복원된 모양정보만 존재할 경우, 영상신호 및/또는 오차신호를 영상내 부호화(Intra texture coding) 및/또는 영상간 부호화(Inter texture coding)할 때, 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr)을 각각 구분하여 임의의 값으로 패딩하여 부호화한다.According to the present invention, a shape information encoding method for processing an image applied through an image input apparatus into a target image and a background image having arbitrary shape information is processed. If only the reconstructed shape information exists, the luminance component in the block in which only the reconstructed shape information exists when intra texture coding and / or inter texture coding of an image signal and / or an error signal is performed. (Y) and the two color components (Cb, Cr) are separated and encoded by padding with arbitrary values.

4. 발명의 중요한 용도4. Important uses of the invention

본 발명은 MPEG-4 시스템 등에 이용됨.The present invention is used in MPEG-4 system and the like.

Description

대상물 영상의 모양정보 부호화 방법Shape information encoding method of object image

본 발명은 영상 입력장치를 통해 인가되는 동영상을 임의의 모양 정보(Shape Information)를 갖는 각각의 대상물 영상과 배경 영상으로 분리하여 처리하는 모양정보 부호화 방법에 관한 것으로, 특히 모양정보 손실 부호화가 적용되어서 원영상 모양정보는 없고 복원된 모양정보만 있는 블록에 대해 영상내 부호화시 휘도정보와 두 색체정보 모두 128로 패딩하고, 영상간 부호화시 휘도정보는 "0", 색채정보는 "128"로 패딩함으로 인해, 부호화 효율 및 영상품질을 향상시키기 위한 것이다.The present invention relates to a shape information encoding method for processing a video applied through an image input apparatus into a target image and a background image having arbitrary shape information. In the case of intra-encoding, the luminance information and the two color information are padded with 128 for blocks that do not have the original image shape information but only the restored shape information. Therefore, to improve the coding efficiency and the image quality.

주지하다시피, 최근의 영상 처리 기술은 인가되는 한 프레임(Frame) 분의 영상을 전체적으로 압축 부호화하는 방법에서 탈피하여, 임의의 모양 정보를 갖는 소정의 단위 블럭으로 구분한 후 그 각각에 대해 압축 부호화하여 전송하는 방향으로 흐르고 있다.As is well known, recent image processing techniques break away from a method of compressing and encoding an image corresponding to one frame as a whole, dividing the image into predetermined unit blocks having arbitrary shape information, and then compressing and encoding each of them. In the direction of transmission.

즉, 인가되는 영상을 각각의 대상물 영상과 배경 영상으로 분리하여, 대상물 영상의 변화 여부만을 전송함으로써 압축 효율화 및 부호화 효율을 꾀하고 있으며, 이에 대한 국제 표준안을 마련하고 있다.That is, the applied image is separated into each object image and the background image, and only the change of the object image is transmitted to achieve compression efficiency and encoding efficiency, and an international standard for this is being prepared.

예를 들어, 세계 표준화 기구인 ISO/IEC 산하의 WG11에서는 미디어 통합계 동영상 압축의 국제표준(MPEG : Moving Picture Experts Group)-1, MPEG-2와는 달리 임의의 모양정보를 갖는 물체를 부호화하는 방식에 대산 표준화 작업인 MPEG-4를 진행하고 있으며, 상기 표준화가 진해되고 있는 MPEG-4는 임의의 모양정보를 갖는 단위 블럭으로 VOP(Video Object Plane)의 개념을 기초로 하고 있다.For example, WG11 under ISO / IEC, the world's standardization organization, encodes an object with arbitrary shape information, unlike MPEG-2 (International Standard for Moving Picture Experts Group) -1 and MPEG-2. MPEG-4, which is a standardization work in progress, is being carried out, and MPEG-4, which is being standardized, is a unit block having arbitrary shape information and is based on the concept of VOP (Video Object Plane).

여기서, 상기 VOP는 인가되는 영상을 배경 영상과 각각의 대상물 영상으로 분리하고, 분리된 배경 영상과 대상물 영상을 포함하는 사각형으로 정의되는 것으로, MPEG-4에서는 영상내에 소정의 물체 또는 소정의 영역으로 이루어진 대상물의 영역이 존재할 경우, 그 대상물의 영상을 각각의 VOP로 분리하고, 분리된 VOP를 각기 부호화하는 것을 골격으로 하고 있다.Here, the VOP is defined as a quadrangle that divides the applied image into a background image and each object image and includes the separated background image and the object image. In MPEG-4, the VOP is defined as a predetermined object or a predetermined region in the image. If there is a region of the object to be made up, it is a skeleton to separate the image of the object into respective VOPs and to encode the separated VOPs respectively.

이러한 VOP는 자연 영상, 또는 인공 영상 등을 대상물 영상의 단위로 하여 자유자재로 합성 내지는 분해할 수 있는 장점을 가지는 것으로, 컴퓨터 그래픽스 및 멀티미디어 분야 등에서 대상물의 영상을 처리하는데 기본이 되고 있다.The VOP has the advantage of freely synthesizing or decomposing a natural image or an artificial image as a unit of an object image, and is the basis for processing an object image in the field of computer graphics and multimedia.

예를 들어, 현재 MPEG-4의 기술이 응용될 것으로 기대되는 응용물로는 인터넷 멀티미디어(IMM : Internet Multimedia), 대화형 비디오 게임(IVG : Interactive Video Games), 영상회의 및 영상전화 등의 상호통신(IPC : Interpersonal Communications), 쌍방향 저장매체(ISM : Interactive Storage Media), 멀티미디어 전자우편(MMM : Multimedia Mailing), 무선 멀티미디어(WMM : Wireless Multimedia), ATM망 등을 이용한 네트워크 데이타베이스 서비스(NDB : Networked Database Service), 원격 응급 시스템(REs : Remote Emergency Systems), 원격 영상 감시(RVS : Remote Video Surveillance) 등이 있다.For example, applications currently expected to apply MPEG-4 technology include intercommunication such as Internet multimedia (IMM), interactive video games (IVG), video conferencing, and video telephony. Network database services (IPB: Interpersonal Communications), Interactive Storage Media (ISM), Multimedia Mailing (MMM), Wireless Multimedia (WMM), ATM networks, etc. Database Service), Remote Emergency Systems (REs), and Remote Video Surveillance (RVS).

이러한 기존의 응용물이나 앞으로 기대되는 응용물들을 지원하기 위해서는 사용자들이 영상내의 원하는 객체만을 통신할 수 있고, 찾고 읽을 수 있도록 접근할 수 있고, 자르고 붙일 수 있도록 편집할 수 있는 영상 부호화 기술이 필요하다. 세계표준화 작업이 진행중인 새로운 영상 및 음향 부호화 기술인 MPEG-4는 이러한 필요를 충족시키기 위한 것이다.In order to support these existing or future applications, a video encoding technique is required that allows users to communicate only with the desired objects in the image, access them to find and read them, and edit them to cut and paste them. . MPEG-4, a new image and audio coding technology underway with global standardization, aims to meet this need.

도 1 은 MPEG-4의 영상 부호화기의 구조를 나타낸 것으로, 이는 기존의 영상 부호화 세계표준화인 H.261, H.263, MPEG-2의 영상 부호화기 구조와는 다른 구조를 갖는다. 특히, 모양정보 부호화부(Shape Coder)와 VOP라는 개념의 도입이 가장 두드러진 차이를 보이고 있다. VOP는 사용자가 접근 및 편집할 수 있는 임의 모양의 내용물의 시간축상의 한 시점의 객체를 의미하고, 내용물 기반의 기능성(content-based functionality)을 지원하기 위해서는 VOP별로 부호화되어야 한다.1 illustrates a structure of an image encoder of MPEG-4, which has a structure different from that of H.261, H.263, and MPEG-2, which are the world standardizations of image encoding. In particular, the introduction of the concept of the shape coder (Shape Coder) and VOP shows the most noticeable difference. A VOP refers to an object at a point in time on an arbitrary shape of a content that can be accessed and edited by a user, and must be encoded for each VOP to support content-based functionality.

도 2 는 임의 모양을 가진 VOP의 일예를 보인 것이다. VOP는 영상 부호화를 위해 16x16 픽셀들로 구성된 매크로블럭들로 재구성된다. 이때, 재구성된 VOP내에는 도 3에서와 같이 세가지 종류의 매크로블럭이 존재하게 되는데, 이를 살펴보면 객체내의 정보만으로 구성되는 객체내 매크로블럭과, 객체내의 정보를 하나도 갖지않는 객체밖 매크로블럭과, 객체내의 정보를 부분적으로 갖는 물체경계 매크로블럭이 그것이다. 또한, 각 매크로블럭내의 휘도블럭과 색채블럭의 배열은 도 4와 같다. 물체내 매크로블럭은 물체내 블럭들로만 구성되고, 물체밖 매크로블럭은 물체 밖 블럭으로만 구성된다.2 shows an example of a VOP having an arbitrary shape. The VOP is reconstructed into macroblocks of 16x16 pixels for picture coding. At this time, three types of macroblocks exist in the reconstructed VOP, as shown in FIG. 3. In this case, macroblocks in an object composed of only information in the object, macroblocks outside the object having no information in the object, and objects It is an object boundary macroblock that partially has information in it. In addition, the arrangement of the luminance block and the color block in each macro block is as shown in FIG. Intra-object macroblocks consist only of intra-object blocks, and out-of-object macroblocks consist only of out-of-object blocks.

그런, 물체경계 매크로블럭내에는 도 5에 도시된 바와 같이 매크로블럭 종류와 동일한 특성을 지닌 8x8 픽셀들로 구성된 세가지 종류의 블럭이 존재할 수 있는데, 이를 살펴보면 물체내 블럭, 물체밖 블럭, 물체경계 블럭이 그것이다. 이때, 물체경계 블럭의 영상정보 및 예측오차정보를 부호화하기 위해서는 물체밖 영역에 있는 픽셀들의 픽셀값이 먼저 결정되어야 한다.In the object boundary macroblock, there can be three kinds of blocks composed of 8x8 pixels having the same characteristics as the macroblock type as shown in FIG. 5. This is it. In this case, in order to encode the image information and the prediction error information of the object boundary block, the pixel values of the pixels in the out-of-object region must be determined first.

MPEG-4 검증모델(VM : Verification Model) 7.0에서는 영상내 부호화시 물체내 영상정보를 이용한 LPE기술(Low-Pass Extrapolation Technique)을 수행하고, 영상내 부호화시 예측오차 정보의 부호화를 위해 제로패딩기술(Zero Padding Technique)을 수행한다.In MPEG-4 Verification Model (VM) 7.0, Low-Pass Extrapolation Technique (LPE) using intra-object image information is performed for intra-image encoding, and zero-padding technique for encoding prediction error information during intra-image encoding. Perform Zero Padding Technique.

상기 LPE기술은 물체밖 영역을 물체내 정보의 평균값으로 채운뒤 채워진 물체밖 영역의 정보를 저주파성분을 필터링하여 부호화하는 기술이며, 제로패딩기술은 정의된 물체밖 영역을 제로값으로 채운 뒤 부호화하는 기술이다.The LPE technique is a technique of encoding an information of an object outside an object by filtering a low frequency component and then encoding the information of an object outside an object with a zero value. Technology.

즉, VM7.0은 블럭 단위로 원영상의 모양정보를 이용하여 영상내 부호화시에는 LPE 패딩을, 영상간 부호화시에는 제로패딩을 한 후 그 블럭을 DCT(Discrete Cosine Transform)한다. 그러나, 모양정보를 손실 부호화할 때, 원영상의 모양정보는 없고, 복원된 영상의 모양정보만 존재하는 블럭이 존재할 수 있는데, 원영상 모양정보가 없기 때문에 그 블럭에 대해서는 VM7.0의 패딩기술이 적용될 수 없다.In other words, VM7.0 uses LPE padding for intra-image encoding using shape information of the original image on a block basis, and zero padding for inter-image encoding, and then blocks the block using DCT (Discrete Cosine Transform). However, when loss coding the shape information, there may be a block in which there is no shape information of the original image and only shape information of the reconstructed image. Since there is no original image shape information, the padding technique of VM7.0 is applied to the block. This can't be applied.

따라서, 영상정보와 상관없는 쓰레기 정보가 부호화되고 복호화되기 때문에 부호화효율과 영상품질 모두 나빠지게 되는 문제점이 있었다.Therefore, since garbage information that is not related to image information is encoded and decoded, both coding efficiency and image quality deteriorate.

즉, MPEG-4 VM7.0 (ISO/IEC N1642, "Text of MPEG-4 Video VM7.0")의 물체경계 블럭의 부호화는 LPE기술, 제로패딩기술 등을 이용한 DCT 기술을 적용하는데, 물체내 블럭은 패딩없이 DCT 부호화하지만, 물체경계 블럭은 물체밖 영역을 DCT 부호화를 위해 원영상의 모양정보를 이용하여 임의의 값으로 패딩하는 과정을 먼저 거쳐야 한다.That is, the encoding of the object boundary block of MPEG-4 VM7.0 (ISO / IEC N1642, "Text of MPEG-4 Video VM7.0") applies DCT technology using LPE technology, zero padding technology, etc. While the block is DCT encoded without padding, the object boundary block must first be padded with an arbitrary value using the shape information of the original image for DCT encoding.

그러나, 모양정보를 손실 부호화하는 경우에 원영상의 모양정보는 없고 복원된 모양정보만 있는 블럭이 발생할 수 있는데, 이 블럭은 패딩과정을 적용할 수 없어서, 쓰레기 정보를 그대로 부호화해야만 한다. 이로 인해, 부호화효율과 영상품질을 저하시키게 되는 문제점이 있었다.However, in the case of loss coding the shape information, a block having only the shape information of the original image without reconstruction may be generated. Since the padding process cannot be applied, the block information must be encoded as it is. As a result, there is a problem that the coding efficiency and image quality is reduced.

본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 내용물 기반의 영상 부호화시, 모양정보 손실 부호화가 적용되어 원영상 모양정보는 없고 복원된 모양정보만 존재할 경우, 복원된 모양정보만 있는 블럭에 패딩 과정을 적용함으로써, 쓰레기 정보가 그대로 부호화되는 것을 막아, 부호화효율 및 영상품질을 향상시킬 수 있는 대상물 영상의 모양정보 부호화 방법을 제공하는데 그 목적이 있다.The present invention has been proposed to solve the above problems, and when content-based image coding is applied, shape information loss coding is applied so that there is no original image shape information and only reconstructed shape information exists, padding is provided on the block having only the reconstructed shape information. It is an object of the present invention to provide a method of encoding shape information of an object image, which can prevent garbage information from being encoded as is, thereby improving encoding efficiency and image quality.

본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.Other objects and advantages of the present invention can be understood by the following description, and will be more clearly understood by the embodiments of the present invention. Also, it will be readily appreciated that the objects and advantages of the present invention may be realized by the means and combinations thereof indicated in the claims.

상기 목적을 달성하기 위한 본 발명의 장치는, 영상 입력장치를 통해 인가되는 영상을 임의의 모양 정보를 갖는 각각의 대상물 영상과 배경 영상으로 분리하여 처리하는 모양 정보 부호화 방법에 있어서, 모양정보 손실부호화가 적용되어 원영상 모양정보는 없고 복원된 모양정보만 존재할 경우, 영상신호 및/또는 오차신호를 영상내 부호화(Intra texture coding) 및/또는 영상간 부호화(Inter texture coding)할 때, 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr)을 각각 구분하여 임의의 값으로 패딩하여 부호화하는 것을 특징으로 한다.Apparatus of the present invention for achieving the above object, in the shape information loss method in the shape information encoding method for processing by separating the image applied through the image input device into each object image and the background image having arbitrary shape information, If the original image shape information is not applied and only reconstructed shape information exists, the reconstructed shape is obtained when intra texture coding and / or inter texture coding are performed on an image signal and / or an error signal. The luminance component (Y) and the two color components (Cb and Cr) in a block in which only information is provided are distinguished from each other and padded with an arbitrary value.

모양정보를 부호화할 때, 손실부호화 방법이 적용되면 도 6과 같이 복원된 모양정보와 원영상의 모양정보가 서로 불일치하게 되고, 이때 복원영상의 모양정보만 있는 경우가 발생할 수 있는데, 본 발명은 복원된 모양정보만 있는 블럭에 대해 적용되는 기술이다.When encoding the shape information, if the lossy coding method is applied, the restored shape information and the shape information of the original image are inconsistent with each other as shown in FIG. 6, and at this time, only the shape information of the reconstructed image may occur. This technique is applied to blocks with recovered shape information only.

따라서, 본 발명은 복원된 모양정보만 있는 블럭에 영상정보(original texture)를 그대로 부호화하는 영상내 부호화(Intra texture coding)가 적용될 경우에, 그 블럭전체의 휘도성분(Y)과 두 색채성분(Cb, Cr)을 각각 128, 128, 128로 패딩하여 DCT 부호화하고, 예측오차 정보(residue data)를 부호화하는 영상간 부호화(Inter texture coding)가 적용될 경우에는, 그 블럭의 휘도성분(Y)을 0으로, 두 색채성분을 128로 패딩하여 DCT 부호화한다.Accordingly, in the present invention, when intra texture coding is applied to a block having only reconstructed shape information as it is, the luminance component Y and the two color components of the entire block are applied. In the case where DCT coding is performed by padding Cb and Cr to 128, 128, and 128, and inter texture coding for encoding prediction error information is applied, the luminance component Y of the block is determined. With 0, two color components are padded with 128 and DCT encoded.

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings, whereby those skilled in the art may easily implement the technical idea of the present invention. There will be. In addition, in describing the present invention, when it is determined that the detailed description of the known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 발명은 복원된 모양정보만 있는 블럭에 영상정보(original texture)를 그대로 부호화하는 영상내 부호화(Intra texture coding)가 적용될 경우에, 그 블럭전체의 휘도성분(Y)과 두 색채성분(Cb, Cr)을 각각 128로 패딩하여 DCT 부호화하고, 예측오차 정보(residue data)를 부호화하는 영상간 부호화(Inter texture coding)가 적용될 경우에는, 그 블럭의 휘도성분(Y)을 0으로, 두 색채성분(Cb, Cr)을 각각 128로 패딩하여 DCT 부호화한다[제1 실시예].According to the present invention, when intra texture coding is applied to a block having only reconstructed shape information as it is, the luminance component Y and the two color components Cb, In the case where DC texture is performed by padding each of the two bits to 128, and inter texture coding for encoding prediction error information is applied, the luminance component (Y) of the block is zero, and two color components are used. (Cb, Cr) are each padded with 128 to perform DCT coding (first embodiment).

원영상 모양정보는 없고 복원된 모양정보만 있는 매크로블럭이 존재하는 경우에, 본 발명에서 제안된 블럭 단위로 패딩하여 부호화하는 방법 대신 매크로블럭 단위로 적용하는 방법, 즉 원영상 모양정보는 없고 복원된 모양정보만 있는 매크로블럭에 대해 영상내 부호화(Intra texture coding)시 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 128로 패딩하고, 영상간 부호화(Inter texture coding)시 휘도성분(Y)을 0으로, 두 색채성분(Cb, Cr)을 각각 128로 패딩하여 DCT 부호화한다[제2 실시예].In the case where there is a macroblock without original image shape information and only reconstructed shape information, a method of applying a macroblock unit instead of a padding and encoding method proposed in the present invention, that is, reconstructing without original image shape information For macroblocks with only shape information, the luminance component (Y) and both color components (Cb, Cr) are padded at 128 during intra texture coding, and the luminance component at inter texture coding. DCT coding is performed by padding (Y) to 0 and two color components (Cb and Cr) to 128, respectively (second embodiment).

또한, DCT 기술 대신 SADCT(Shape-Adaptive Discrete Cosine Transform) 기술이 사용될 경우, 본 발명의 '대상물 영상의 모양정보 부호화 방법'에서 제안된 블럭 단위의 패딩과 매크로블럭 단위의 패딩이 적용되는 방법이 각각 적용될 수 있다.In addition, when the SADCT (Shape-Adaptive Discrete Cosine Transform) technology is used instead of the DCT technology, the method of applying the block padding and the macroblock padding proposed in the 'shape information encoding method of the object image' is applied. Can be applied.

참고적으로, 색상의 표현은 YCbCr란 방법을 이용하여 표현한다. 보통의 경우, RGB란 방법을 사용하는데, 이 방법은 빛의 삼원소인 적색광(R), 녹색광(G), 청색광(B)의 색을 혼합하여 색을 표현하는 방법이다. 하지만, YCbCr은 색의 세기인 휘도(Y)와, 파란색과의 색의 차이정보(Cb), 빨간색과의 색의 차이정보(Cr)로 색을 표현하는 방법이다.For reference, the color is represented using a method called YCbCr. In general, RGB is a method, which is a method of expressing a color by mixing colors of red light (R), green light (G), and blue light (B), which are three elements of light. However, YCbCr is a method of expressing a color using luminance Y, which is the intensity of color, color difference information Cb with blue, and color difference information Cr with red.

한편, 도 1은 MPEG-4 VOP 부호화기의 구조를 나타낸 것으로, 차세대영상 및 음향 정보의 부호화 표준이 될 MPEG-4에서 고려되는 VOP 부호화기의 구조를 나타낸다. 또한, 도 2 는 VOP를 나타낸 것으로, VOP는 임의의 영상에서 전체 영상이나 그 영상을 이루는 의미있는 물체만으로 구성된 영상으로 구성된다.Meanwhile, FIG. 1 illustrates the structure of an MPEG-4 VOP encoder, and illustrates a structure of a VOP encoder considered in MPEG-4, which is a coding standard for next-generation video and audio information. In addition, FIG. 2 shows a VOP, wherein the VOP is composed of an entire image or an image composed only of meaningful objects forming the image.

또한, 도 3은 VOP 영상내의 매크로블럭의 종류를 나타낸 것이다. 즉, VOP는 부호화를 위해 매크로블럭 단위로 재구성되는데, 도 2를 재구성한 것이 도 3이다. 또한, 도 3의 각 매크로블럭은 영상 정보의 유무와 구성에 따라 물체밖 매크로블럭, 물체내 매크로블럭, 물체경계 매크로블럭으로 구성된다.3 illustrates the types of macroblocks in a VOP image. That is, the VOP is reconstructed in units of macroblocks for encoding, and FIG. In addition, each macroblock of FIG. 3 is composed of an out-of-object macroblock, an in-object macroblock, and an object boundary macroblock according to the presence or absence of image information.

도 4는 매크로블럭내의 블럭의 배열을 나타낸 것으로, 상단 좌측을 블럭1로, 상단 우측을 블럭2로, 하단 좌측을 블럭3으로, 하단 우측을 블록4로, 색채정보 Cb를 블럭5로, 색채정보 Cr을 블럭6으로 각각 정의한다.4 shows the arrangement of blocks in the macroblock, with the upper left side as block 1, the upper right side as block 2, the lower left side as block 3, the lower right side as block 4, the color information Cb as block 5, and color. The information Cr is defined as block 6, respectively.

도 5는 VOP 영상내의 블럭의 종류를 나타낸 것이다. 즉, 도 3과 같이 재구성된 VOP 영상내의 매크로블럭중 물체밖 매크로블럭은 물체밖 블럭으로만 구성되고, 물체내 매크로블럭은 물체내 블럭으로만 구성된다. 하지만, 물체경계 매크로블럭은 물체내 블럭, 물체경계 블럭으로 혹은 이와 아울러 물체밖 블럭으로 구성된다.5 shows the types of blocks in a VOP picture. That is, out-of-object macroblocks of the macroblocks in the reconstructed VOP image as shown in FIG. 3 are composed of only out-of-object blocks, and intra-object macroblocks are composed of only intra-object blocks. However, the object boundary macroblock is composed of an intra-object block, an object boundary block, or a block out of the object.

도 6은 모양정보의 손실부호화가 적용된 경우 원영상 모양정보는 없고 복원된 모양정보만 존재하는 블럭의 일예를 나타낸 것이며, 도 7은 기존 기술에 대한 영상정보 부호화 과정을 나타낸 것이다.FIG. 6 illustrates an example of a block in which no original image shape information is present and only reconstructed shape information exists when loss coding of shape information is applied, and FIG. 7 shows a process of encoding image information of the existing technology.

또한, 도 8은 본 발명에 따른 모양정보 부호화 방법을 나타낸 것이다.8 illustrates a shape information encoding method according to the present invention.

도 8에 도시된 바와 같이, MPEG-4 VM7.0의 물체경계 블럭의 부호화는 LPE 기술, 제로패딩기술 등을 이용한 DCT 기술을 적용하는데, 이때 물체내 블럭은 패딩없이 DCT 부호화가 가능하지만, 물체경계 블럭은 물체밖 영역을 DCT 부호화를 위해 원영상의 모양정보를 이용하여 임의의 값으로 패딩해야 한다. 그러나, 이때 모양정보를 손실 부호화하는 경우에 원영상의 모양정보는 없고 복원된 모양정보만 있는 블럭이 발생할 수 있는데, 본 발명에서는 이와 같이 '내용물 기반의 영상 부호화시 모양정보 손실부호화가 적용되어 원영상 모양정보는 없고 복원된 모양정보만 존재'할 경우, 영상신호 및 오차신호를 부호화할 때, 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr)을 각각 구분하여 임의의 값으로 패딩한다.As shown in FIG. 8, the encoding of an object boundary block of MPEG-4 VM7.0 applies a DCT technique using an LPE technique, a zero padding technique, and the like. In this case, a block within an object may be DCT encoded without padding. The boundary block should be padded to an arbitrary value using the shape information of the original image for DCT encoding. However, in the case of loss coding the shape information, a block having only reconstructed shape information without the shape information of the original image may be generated. In the present invention, the shape information loss encoding is applied when the content-based image encoding is applied. If there is no image shape information and only reconstructed shape information exists, the luminance component (Y) and the two color components (Cb, Cr) in the block in which only the reconstructed shape information exist when encoding the image signal and the error signal, respectively Separated and padded with arbitrary values.

일예로, 영상내 부호화(Intra texture coding)시, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 블릭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 같은 값으로 패딩하여 DCT 부호화한다. 예를 들면, 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화한다.For example, during intra texture coding, DCT is padded with the same luminance component (Y) and two color components (Cb, Cr) in a blick in which there is no original image shape information and only reconstructed shape information. Encode For example, the luminance component Y and the two color components Cb and Cr are padded with 128 to be DCT encoded.

또한, 영상간 부호화(Inter texture coding)시, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 다른 값으로 패딩하여 DCT 부호화한다. 예를 들면, 휘도성분(Y) 모두를 0으로 패딩하고, 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화한다.In inter texture coding, the luminance component (Y) and the two color components (Cb, Cr) in a block in which there is no original image shape information and only reconstructed shape information are padded with different values to perform DCT coding. do. For example, DCT coding is performed by padding both luminance components Y with 0 and padding both color components Cb and Cr with 128.

다른 예로, 영상내 부호화(Intra texture coding)시, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 매크로블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 같은 값으로 패딩하여 DCT 부호화한다. 예를 들면, 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화한다.As another example, when intra texture coding, the luminance component (Y) and the two color components (Cb, Cr) in a macroblock in which there is no original image shape information but only restored shape information are padded with the same value. DCT coded. For example, the luminance component Y and the two color components Cb and Cr are padded with 128 to be DCT encoded.

또한, 영상간 부호화(Inter texture coding)시, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 매크로블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 다른 값으로 패딩하여 DCT 부호화한다. 예를 들면, 휘도성분(Y) 모두를 0으로 패딩하고, 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화한다.In the inter texture coding, the luminance component (Y) and the two color components (Cb, Cr) in the macroblock in which the original image shape information is restored and only the restored shape information exist are padded with different values. Encode For example, DCT coding is performed by padding both luminance components Y with 0 and padding both color components Cb and Cr with 128.

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.As described above, the method of the present invention may be implemented as a program and stored in a recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.) in a computer-readable form. Since this process can be easily implemented by those skilled in the art will not be described in more detail.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.The present invention described above is capable of various substitutions, modifications, and changes without departing from the technical spirit of the present invention for those skilled in the art to which the present invention pertains. It is not limited by the drawings.

상기와 같은 본 발명은, MPEG VM7.0의 모양정보 부호화기술을 수정할 필요없이, 복원된 모양정보만 있는 블럭에 대해 패딩 과정을 적용함으로써, 즉 VOP 기반의 영상부호화시 모양정보 부호화 기술에 의해 복원된 모양정보만 존재하는 블럭이 발생하게 되면, 그 블럭 전체에 대해 영상내 부호화(Intra texture coding)시 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화하고, 영상간 부호화(Inter texture coding)시 휘도성분(Y)을 0으로, 두 색채성분(Cb, Cr)을 128로 패딩하여 DCT 부호화함으로써, 쓰레기 정보가 그대로 부호화되는 것을 막아, 부호화효율 및 영상품질을 높일 수 있는 효과가 있다.In the present invention as described above, the padding process is applied to a block having only the reconstructed shape information without modifying the shape information encoding technique of MPEG VM7.0, that is, the reconstruction is performed by the shape information encoding technique during VOP-based image encoding. When a block having only the shape information is generated, DCT coding is performed by padding both the luminance component (Y) and the two color components (Cb, Cr) to 128 during intra texture coding for the entire block. In inter texture coding, the luminance component (Y) is 0 and the two color components (Cb, Cr) are padded with 128 to DCT encoding, thereby preventing garbage information from being encoded as it is, thereby improving coding efficiency and image quality. It can increase the effect.

도 1 은 MPEG-4 VOP 부호화기의 구조를 나타낸 블록도,1 is a block diagram showing the structure of an MPEG-4 VOP encoder;

도 2 는 VOP의 일예를 나타낸 설명도,2 is an explanatory diagram showing an example of a VOP;

도 3 은 VOP 영상내의 매크로블럭의 종류를 나타낸 설명도,3 is an explanatory diagram showing types of macroblocks in a VOP image;

도 4 는 매크로블럭내의 블럭의 배열을 나타낸 설명도,4 is an explanatory diagram showing an arrangement of blocks in a macroblock;

도 5 는 VOP 영상내의 블럭의 종류를 나타낸 설명도,5 is an explanatory diagram showing types of blocks in a VOP video;

도 6 은 모양정보의 손실부호화가 적용된 경우 원영상 모양정보는 없고 복원된 모양정보만 존재하는 블럭의 일예를 나타낸 설명도,6 is an explanatory diagram showing an example of a block in which no original image shape information exists and only reconstructed shape information exists when loss encoding of shape information is applied;

도 7 은 종래 기술에 따른 영상정보 부호화 과정을 나타낸 설명도,7 is an explanatory diagram showing a video information encoding process according to the prior art;

도 8 은 본 발명에 따른 모양정보 부호화 방법을 나타낸 일실시예 설명도이다.8 is an exemplary diagram illustrating a shape information encoding method according to the present invention.

Claims (9)

영상 입력장치를 통해 인가되는 영상을 임의의 모양 정보를 갖는 각각의 대상물 영상과 배경 영상으로 분리하여 처리하는 모양 정보 부호화 방법에 있어서,In the shape information encoding method for processing by separating the image applied through the image input device into each of the object image and the background image having arbitrary shape information, 모양정보 손실부호화가 적용되어 원영상 모양정보는 없고 복원된 모양정보만 존재할 경우, 영상신호 및/또는 오차신호를 영상내 부호화(Intra texture coding) 및/또는 영상간 부호화(Inter texture coding)할 때, 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr)을 각각 구분하여 임의의 값으로 패딩하여 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.When the shape information loss encoding is applied and there is no original image shape information and only reconstructed shape information exists, when intra texture coding and / or inter texture coding are performed on an image signal and / or an error signal. And encoding the luminance component (Y) and the two color components (Cb and Cr) in the block in which only the reconstructed shape information exists, and padding and encoding them by arbitrary values. 제 1 항에 있어서,The method of claim 1, 상기 영상내 부호화(Intra texture coding)시,In the intra texture coding, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 동일한 값으로 패딩하여 이산여현변환(DCT) 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.An object image, characterized in that a discrete cosine transform (DCT) encoding is performed by padding both luminance components (Y) and two color components (Cb, Cr) in a block in which there is no original image shape information and only reconstructed shape information. Shape information encoding method of a. 제 2 항에 있어서,The method of claim 2, 상기 영상내 부호화(Intra texture coding)시,In the intra texture coding, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.12. A method of encoding shape information of an object image, characterized in that the luminance component (Y) and the two color components (Cb, Cr) in a block in which there is no original image shape information and only reconstructed shape information are padded by 128 are DCT encoded. 제 1 항에 있어서,The method of claim 1, 상기 영상간 부호화(Inter texture coding)시,In the inter texture coding, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 다른 값으로 패딩하여 이산여현변환(DCT) 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.An object image, characterized in that a discrete cosine transform (DCT) encoding is performed by padding the luminance component (Y) and the two color components (Cb, Cr) in a block in which there is no original image shape information and only reconstructed shape information. Shape information encoding method of a. 제 4 항에 있어서,The method of claim 4, wherein 상기 영상간 부호화(Inter texture coding)시,In the inter texture coding, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 블럭내의 휘도성분(Y) 모두를 0으로 패딩하고, 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.An object image, characterized in that the luminance component (Y) in a block in which there is no original image shape information and only reconstructed shape information is padded with 0, and both color components (Cb, Cr) are padded with 128 to be DCT encoded. Shape information encoding method of a. 제 1 항에 있어서,The method of claim 1, 상기 영상내 부호화(Intra texture coding)시,In the intra texture coding, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 매크로블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 동일한 값으로 패딩하여 이산여현변환(DCT) 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.An object characterized in that a discrete cosine transform (DCT) coding is performed by padding the luminance component (Y) and the two color components (Cb, Cr) in a macroblock in which the original image shape information is restored and only the restored shape information exists. Shape information encoding method of image. 제 6 항에 있어서,The method of claim 6, 상기 영상내 부호화(Intra texture coding)시,In the intra texture coding, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 매크로블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.Shape information encoding method of the target image, characterized in that the luminance component (Y) and the two color components (Cb, Cr) in the macroblock in which there is no original image shape information and only reconstructed shape information are padded with 128 to be DCT encoded. . 제 1 항에 있어서,The method of claim 1, 상기 영상간 부호화(Inter texture coding)시,In the inter texture coding, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 매크로블럭내의 휘도성분(Y)과 두 색채성분(Cb, Cr) 모두를 다른 값으로 패딩하여 이산여현변환(DCT) 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.An object characterized in that a discrete cosine transform (DCT) encoding is performed by padding the luminance component (Y) and the two color components (Cb, Cr) in a macroblock in which only the restored shape information exists without the original image information. Shape information encoding method of image. 제 8 항에 있어서,The method of claim 8, 상기 영상간 부호화(Inter texture coding)시,In the inter texture coding, 원영상 모양정보는 없고 복원된 모양정보만 존재하는 매크로블럭내의 휘도성분(Y) 모두를 0으로 패딩하고, 두 색채성분(Cb, Cr) 모두를 128로 패딩하여 DCT 부호화하는 것을 특징으로 하는 대상물 영상의 모양정보 부호화 방법.An object characterized in that all of the luminance components (Y) in a macroblock in which there is no original image shape information but only reconstructed shape information are padded with 0, and both color components (Cb, Cr) are padded with 128 to be DCT encoded. Shape information encoding method of image.
KR1019970032025A 1997-07-10 1997-07-10 Shape Information Encoding Method of Object Image KR100466595B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970032025A KR100466595B1 (en) 1997-07-10 1997-07-10 Shape Information Encoding Method of Object Image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970032025A KR100466595B1 (en) 1997-07-10 1997-07-10 Shape Information Encoding Method of Object Image

Publications (2)

Publication Number Publication Date
KR19990009584A KR19990009584A (en) 1999-02-05
KR100466595B1 true KR100466595B1 (en) 2005-07-12

Family

ID=37303329

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970032025A KR100466595B1 (en) 1997-07-10 1997-07-10 Shape Information Encoding Method of Object Image

Country Status (1)

Country Link
KR (1) KR100466595B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220410A (en) * 1991-10-02 1993-06-15 Tandy Corporation Method and apparaus for decoding encoded video data
JPH06152971A (en) * 1992-11-05 1994-05-31 Fujitsu Ltd Method and device for encoding picture data
KR940020834A (en) * 1993-02-27 1994-09-16 김광호 Image compression method and device
JPH08256267A (en) * 1996-03-07 1996-10-01 Canon Inc Color image processor
KR100203626B1 (en) * 1996-02-29 1999-06-15 전주범 Object based encoder for full motion image

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220410A (en) * 1991-10-02 1993-06-15 Tandy Corporation Method and apparaus for decoding encoded video data
JPH06152971A (en) * 1992-11-05 1994-05-31 Fujitsu Ltd Method and device for encoding picture data
KR940020834A (en) * 1993-02-27 1994-09-16 김광호 Image compression method and device
KR100203626B1 (en) * 1996-02-29 1999-06-15 전주범 Object based encoder for full motion image
JPH08256267A (en) * 1996-03-07 1996-10-01 Canon Inc Color image processor

Also Published As

Publication number Publication date
KR19990009584A (en) 1999-02-05

Similar Documents

Publication Publication Date Title
CN101222644B (en) Moving image encoding/decoding device and moving image encoding/decoding method
Wiegand et al. Overview of the H. 264/AVC video coding standard
KR100620270B1 (en) Method and apparatus for transcoding compressed video bitstreams
EP2357826B1 (en) Image encoding device, image decoding device, image encoding method, and image decoding method
JP3895431B2 (en) Video information encoding method using object boundary block merge / division
US8064516B2 (en) Text recognition during video compression
US7822125B2 (en) Method for chroma deblocking
JPH10155148A (en) Video information coding/decoding device and its method
TW202135528A (en) Method and apparatus for coding video sequence
Tsang et al. Exploiting inter-layer correlations in scalable HEVC for the support of screen content videos
JP2022517787A (en) Video coding method, video coding equipment and computer programs
CN108353192A (en) Layering deblocking filtering in processing system for video and method
KR100466595B1 (en) Shape Information Encoding Method of Object Image
US8326060B2 (en) Video decoding method and video decoder based on motion-vector data and transform coefficients data
Moon et al. Boundary block-merging (BBM) technique for efficient texture coding of arbitrarily shaped object
KR100941641B1 (en) Video coding method
Li et al. An introduction to high efficiency video coding range extensions
KR100466592B1 (en) Boundary block video data coding method
KR100483672B1 (en) Shape Information Encoding Method of Image Signal Processing
KR100467788B1 (en) Vop(video object planes)
KR100559713B1 (en) Color information encoding / decoding device for parallel scan and its method
KR100417131B1 (en) Shape-Adaptive Video Encoding Device Using Merging and Padding of Macroblocks
Singh et al. Review of compression techniques
KR100466591B1 (en) A method of encoding pixel values in a merged block after object boundary block merge
KR100530853B1 (en) Device for encoding video information of mpeg-4 encoder and thereof method

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091217

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee