KR20050095237A - Method and apparatus for coding video data based on switching between single description and multiple description - Google Patents

Method and apparatus for coding video data based on switching between single description and multiple description Download PDF

Info

Publication number
KR20050095237A
KR20050095237A KR1020040020493A KR20040020493A KR20050095237A KR 20050095237 A KR20050095237 A KR 20050095237A KR 1020040020493 A KR1020040020493 A KR 1020040020493A KR 20040020493 A KR20040020493 A KR 20040020493A KR 20050095237 A KR20050095237 A KR 20050095237A
Authority
KR
South Korea
Prior art keywords
expression
compression
error
signal
representation
Prior art date
Application number
KR1020040020493A
Other languages
Korean (ko)
Inventor
조남익
김일구
Original Assignee
주식회사 우암닷컴
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 우암닷컴 filed Critical 주식회사 우암닷컴
Priority to KR1020040020493A priority Critical patent/KR20050095237A/en
Publication of KR20050095237A publication Critical patent/KR20050095237A/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/02Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
    • H04W84/10Small scale networks; Flat hierarchical networks
    • H04W84/12WLAN [Wireless Local Area Networks]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 데이터 압축 기술에 관한 것으로서, 단일표현/다중표현 전환 방식을 이용한 하이브리드 압축 전송 기술을 적용한 동영상 데이터 압축 방법 및 장치를 제공한다. 본 발명의 데이터 압축 방법 또는 장치는 입력 데이터를 이산 신호로 변환하는 단계 또는 수단과, 변환된 이산 신호를 양자화하는 단계 또는 수단과, 양자화된 신호를 단일표현으로 압축할 것인지 다중표현으로 압축할 것인지를 결정하는 결정 단계 또는 수단과, 상기 결정 단계 또는 수단에서 다중표현 압축으로 결정한 경우에는 상기 양자화된 신호를 여러 개의 표현으로 나누고 각각의 표현을 압축하는 단계 또는 수단을 포함하며, 상기 단일표현/다중표현 결정은 동일한 중복량에서 복원 오차가 최소가 되도록 결정된다. 본 발명에서는 비트율-왜곡 최적화를 이용한 단일표현/다중표현 전환 기법을 이용하여 종래 다중표현 압축(MDC)에서 피할 수 없는 과다한 중복량을 제거하며, 패킷 손실율이 낮은 채널 환경에서는 압축 효율을 높이기 위해 단일표현 압축을 선택하고, 패킷 손신율이 높은 채널 환경에서는 에러 복원력을 높이기 위하여 다중표현 압축을 선택한다. 또한, 본 발명의 단일표현/다중표현 전환은 동영상의 압축 용량과 화질을 고려하거나 인간의 시각적 특성을 이용하여 최적화될 수 있다.The present invention relates to a data compression technology, and provides a video data compression method and apparatus using a hybrid compression transmission technology using a single expression / multiple expression conversion scheme. The data compression method or apparatus of the present invention provides a method or apparatus for converting input data into a discrete signal, a step or means for quantizing the transformed discrete signal, and whether to compress the quantized signal into a single expression or multiple expressions. A decision step or means for determining a signal, and if said decision step or means determines multi-expression compression, dividing said quantized signal into multiple representations and compressing each representation, said single representation / multiple The representation decision is determined so that the restoration error is minimal at the same amount of redundancy. In the present invention, by using a single-expression / multi-expression switching technique using a bit rate-distortion optimization, the redundant amount that is unavoidable in the conventional multi-expression compression (MDC) is eliminated, and in order to increase the compression efficiency in a channel environment with low packet loss rate, Representation compression is selected, and multi-expression compression is selected to improve error resilience in a channel environment with high packet loss rate. In addition, the single-expression / multi-expression conversion of the present invention can be optimized by considering the compression capacity and the image quality of the video or by using the human visual characteristics.

Description

단일표현/다중표현 전환을 이용한 동영상 데이터 압축 방법 및 장치 {Method and Apparatus for Coding Video Data Based on Switching between Single Description and Multiple Description}Method and apparatus for compressing video data using single / multiple expression switching {Method and Apparatus for Coding Video Data Based on Switching between Single Description and Multiple Description}

본 발명은 데이터 압축 기술에 관한 것으로서, 좀 더 구체적으로는 단일표현/다중표현 전환 방식을 이용한 하이브리드 압축 전송 기술을 적용한 동영상 데이터 압축 방법 및 장치에 관한 것이다.The present invention relates to a data compression technology, and more particularly, to a video data compression method and apparatus applying a hybrid compression transmission technology using a single expression / multiple expression conversion scheme.

디지털 멀티미디어 데이터의 증가로 인하여 이러한 자료의 저장과 전송에 대한 필요성이 대두되었다. 특히, 인터넷, 이동전화, 개인용 이동단말기 등이 널리 보급됨에 따라 동영상 데이터의 전송에 대한 관심이 크게 증가하고 있다. 기존의 전용선이나 전화선을 이용한 전송에서는 에러가 발생할 확률이 매우 적었지만, 새로운 전송 매체인 인터넷 혹은 무선 환경에서는 에러가 발생할 확률이 매우 높고 이러한 에러가 연속적으로 발생한다. 또한, 일반적으로 동영상은 자료의 용량이 매우 크기 때문에, MPEG 등과 같은 방법을 이용하여 압축하여 저장, 전송하게 된다. 이렇게 동영상을 압축하면 용량이 줄어드는 장점이 있는 반면에 압축된 신호가 에러에 매우 민감하다는 문제점을 갖게 된다. 또한, 압축 방법의 특성으로 인해 에러가 발생하면 그 부분 뿐만 아니라 주변으로까지 에러가 전파되어 화질이 크게 저하된다는 단점이 있다.The increase in digital multimedia data has created a need for the storage and transmission of such data. In particular, as the Internet, mobile phones, personal mobile terminals, and the like are widely used, interest in the transmission of video data is greatly increased. In the conventional transmission using a dedicated line or a telephone line, the probability of error is very low, but in the new transmission medium, the Internet or wireless environment, the probability of error is very high and such errors occur continuously. In addition, since a moving picture has a very large capacity, a moving picture is compressed, stored and transmitted using a method such as MPEG. This video compression has the advantage of reduced capacity, while the compressed signal is very sensitive to errors. In addition, when an error occurs due to the characteristics of the compression method, the error is propagated not only to the part but also to the periphery, and thus, the image quality is greatly degraded.

이러한 문제점을 해결하기 위해, 에러에 강인한 압축 전송 기술이 개발되어 왔다. 에러에 강인한 압축 전송 기술에는 에러가 발생한 경우 복원할 수 있는 정보를 부가 정보로 첨가하는 방법과 부가 정보의 첨가 없이 에러가 발생했을 때 발생한 에러를 숨기는 방법이 있다. 그런데, 부가 정보를 첨가하는 방법은 압축된 동양상의 용량이 증가한다는 단점이 있고, 에러를 숨기는 방법은 계산량이 증가한다는 단점이 있다. 또한, 이 방법의 가장 큰 문제점은 에러가 발생할 확률이 높거나 연속적인 에러가 발생하면 효과적이지 못하다는 것이다. 즉, 인터넷과 무선환경에는 적절하지 못한 방법이다.In order to solve this problem, an error-resistant compression transmission technique has been developed. Compression transmission techniques that are robust against errors include a method of adding information that can be restored when an error occurs as additional information, and a method of hiding an error that occurs when an error occurs without adding additional information. However, the method of adding additional information has a disadvantage of increasing the capacity of the compressed oriental image, and the method of hiding an error has a disadvantage of increasing the amount of calculation. Also, the biggest problem with this method is that it is not effective if there is a high probability of error or if a continuous error occurs. That is, it is not suitable for the Internet and wireless environment.

이에 비해 다중표현(Multiple Description) 압축 기술은 에러의 확률이 높거나 연속적인 에러가 발생한 경우에도 효과적인 데이터 전송을 수행할 수 있다. 원본신호에 대한 다중표현 기술은 정보이론 분야와 신호처리 분야에서 널리 연구되어 왔다(예컨대, V. A. Vaishampayan, "Design of multiple description scalar quantizer", IEEE Trans. Inform. Theory No. 39, pp. 821-834, May 1993 또는 V. Goyal, "Multiple description coding: Compression meets the network", IEEE Signal Processing Mag., Vol. 18, pp. 74-93, Sep. 2001 참조). 이 기술은 동영상을 중복성이 최소가 되도록 여러 개의 표현으로 나누어 압축하여 서로 다른 경로를 통해 데이터를 전송하는 방법이다. 서로 다른 경로를 이용하여 데이터를 전송할 경우에는 모든 경로에서 똑같은 에러가 발생할 확률이 매우 작아지기 때문에 일부 경로에서 에러가 발생하더라도 효과적으로 전송할 수 있다.In contrast, the multiple description compression technique can perform effective data transmission even when a high probability of error or a continuous error occurs. Multiple expression techniques for original signals have been widely studied in the field of information theory and signal processing (e.g., VA Vaishampayan, "Design of multiple description scalar quantizer", IEEE Trans. Inform. Theory No. 39, pp. 821-834 , May 1993 or V. Goyal, "Multiple description coding: Compression meets the network", IEEE Signal Processing Mag., Vol. 18, pp. 74-93, Sep. 2001). This technique is a method of transmitting data through different paths by compressing the video into multiple representations to minimize redundancy. When data is transmitted using different paths, the probability of the same error occurring in all paths is very small, so that even if an error occurs in some paths, it can be effectively transmitted.

그러나 다중표현 압축 기술에서는 여러 개의 표현 중에서 일부만을 받았을 경우에도 만족할만한 화질을 얻기 위해서 각각의 표현 사이에 중복되는 정보를 넣기 때문에 비트율이 증가하는 문제점이 있다. 이러한 비트율 증가에 따른 강인성 증가는 에러가 많은 환경에서는 효과적이지만 에러가 적게 발생하는 환경에서는 압축 효율을 크게 감소시키게 되므로 비트율 대 강인성의 최적 조절이 다중표현 동영상 압축의 과제이다.However, in the multi-expression compression technique, even if only a part of the multiple representations is received, the bit rate is increased because overlapping information is inserted between each representation to obtain satisfactory image quality. Increasing the robustness according to the increase of the bit rate is effective in an error-prone environment, but the compression efficiency is greatly reduced in an error-prone environment. Therefore, an optimal control of the bit rate versus robustness is a task of multi-expression video compression.

본 발명의 목적은 인터넷과 무선환경에서 동영상을 전송할 때 사용되는 기존의 다중표현 압축 기술에 비해 그 성능이 더욱 개선된 다중표현 압축 전송 기술을 제공하는 것이다.An object of the present invention is to provide a multi-expression compression transmission technology with improved performance compared to the existing multi-expression compression technology used when transmitting video in the Internet and wireless environment.

본 발명의 다른 목적은 비트율과 에러 강인성이 최적으로 조절되도록 한 동영상 데이터 압축 장치와 방법을 제공하는 것이다.Another object of the present invention is to provide an apparatus and a method for compressing video data, in which bit rate and error robustness are optimally adjusted.

본 발명의 제1 특징에 따르면, 동영상을 채널 환경에 따라 단일표현 또는 다중표현으로 선택하여 전송할 수 있다. 즉, 본 발명의 데이터 압축 방법 또는 장치는 입력 데이터를 이산 신호로 변환하는 단계 또는 수단과, 변환된 이산 신호를 양자화하는 단계 또는 수단과, 양자화된 신호를 단일표현으로 압축할 것인지 다중표현으로 압축할 것인지를 결정하는 결정 단계 또는 수단과, 상기 결정 단계 또는 수단에서 다중표현 압축으로 결정한 경우에는 상기 양자화된 신호를 여러 개의 표현으로 나누고 각각의 표현을 압축하는 단계 또는 수단을 포함하며, 상기 단일표현/다중표현 결정은 동일한 중복량에서 복원 오차가 최소가 되도록 결정된다.According to the first aspect of the present invention, a video may be selected and transmitted in a single expression or multiple expressions according to a channel environment. That is, the data compression method or apparatus of the present invention comprises the steps or means for converting the input data into a discrete signal, the step or means for quantizing the transformed discrete signal, and compressing the quantized signal into a single expression or multi-expression. A decision step or means for deciding whether or not to make a decision, and if said decision step or means determines multi-expression compression, dividing said quantized signal into multiple representations and compressing each representation or means; Multiple expression decisions are determined so that the reconstruction error is minimal at the same amount of redundancy.

본 발명에서는 비트율 왜곡(RD: Rate Distortion) 최적화를 이용한 단일표현/다중표현 전환 기법을 이용하여 종래 다중표현 압축(MDC: Multiple Description Coding)에서 피할 수 없는 과다한 중복량을 제거한다. 종래 MDC에서는 표현들 사이의 상관(correlation) 때문에 중복량을 피할 수 없는데 패킷 손실율이 낮은 환경에서는 이러한 중복량이 압축 효율을 떨어뜨린다. 이러한 종래 MDC의 문제를 해결하기 위해 본 발명에서는 채널 환경에 따라 단일표현/다중표현 전환을 제어하는 소위 하이브리드 MDC를 채택한다. 예를 들어서 패킷 손실율이 낮은 채널 환경에서는 압축 효율을 높이기 위해 단일표현 압축을 선택하고 패킷 손신율이 높은 채널 환경에서는 에러 복원력을 높이기 위하여 다중표현 압축을 선택한다. 단일표현/다중표현 전환을 최적으로 제어하기 위하여 본 발명에서는 비트율 왜곡 최적화 기법을 사용한다. 예컨대, 라그랑제 최적화 기술을 이용하여 비트율 왜곡 코스트 함수 D + λR(여기서 R은 실제로 압축된 비트율이고 D는 계산된 복원오차)가 최소가 되도록 단일표현/다중표현을 전환한다.The present invention eliminates excessive redundancy in the conventional multiple description coding (MDC) using a single expression / multiple expression switching technique using a rate distortion (RD) optimization. In the conventional MDC, duplication is inevitable due to correlation between representations. However, in the case of a low packet loss rate, the duplication reduces compression efficiency. In order to solve the problem of the conventional MDC, the present invention adopts a so-called hybrid MDC that controls single-expression / multi-expression switching according to the channel environment. For example, in a channel environment with a low packet loss rate, single expression compression is selected to improve compression efficiency, and in a channel environment with a high packet loss rate, multi-expression compression is selected. In order to optimally control the single-expression / multi-expression switching, the present invention uses a bit rate distortion optimization technique. For example, the Lagrangian optimization technique is used to convert the single expression / multiple expression so that the bit rate distortion cost function D + λ R (where R is actually the compressed bit rate and D is the calculated reconstruction error) is minimized.

본 발명에서 단일표현/다중표현의 결정은 동영상의 압축 용량과 화질을 고려하여 선택된다. 또한, 본 발명의 단일표현/다중표현의 결정은 인간의 시각적 특성을 이용하여 최적화될 수 있다.In the present invention, the determination of the single expression / multiple expression is selected in consideration of the compression capacity and the image quality of the video. In addition, the determination of monoexpression / multiexpression of the present invention can be optimized using human visual characteristics.

본 발명에서는 중앙 움직임 예측기와 측면 움직임 예측기를 포함하는 다중표현 동영상 압축기를 이용하여 다중표현을 압축할 수 있고, 주파수 위치와 주어진 목적 함수에 따라 중복, 번갈음 및 제한 양자화를 적용한 새로운 최적화 알고리즘을 사용한다.In the present invention, a multi-expression video compressor including a central motion predictor and a lateral motion predictor can be used to compress the multi-expression, and a new optimization algorithm using redundancy, alternating and limiting quantization according to frequency position and a given objective function is used. do.

구현예Embodiment

이하 도면을 참조로 본 발명의 구현예에 대해 설명한다. 아래의 설명에서 '압축'은 '부호화' 또는 '코딩'에 대응되며, '왜곡'과 '오차'는 같은 의미(distortion)로 사용된다.Embodiments of the present invention will be described below with reference to the drawings. In the following description, 'compression' corresponds to 'coding' or 'coding', and 'distortion' and 'error' are used in the same meaning (distortion).

본 발명이 적용될 수 있는 동영상의 비트 스트림(bit stream)은 도 1과 같이 구성될 수 있다. A bit stream of a video to which the present invention can be applied may be configured as shown in FIG. 1.

도 1에서 보는 것처럼, 동영상의 기본 블록은 8×8 화소 블록이며, 하나의 매크로 블록(macro block)은 4개의 휘도신호 블록(Y1, Y2, Y3, Y4)과 2개의 색차신호 블록(Cb, Cr)으로 구성된다. 이 매크로 블록에 대해 DCT 연산이 행해지는데, 휘도신호 블록에 대해 움직임 보상에 의한 시간적 정보압축(프레임간 예측)을 하며, 각 블록에 대해 DCT에 의한 공간적 정보압축을 할 수 있다. GOB (Group of Blocks)은 예컨대 11개의 매크로 블록으로 이루어지며, GOB 9개로 화상 프레임을 구성한다. 화상 프레임은 공통된 속성을 가지는 한 장의 화면이 되며, GOB는 한 장의 화면을 12개로 분할한 소화면이 된다.As shown in FIG. 1, the basic block of the video is an 8 × 8 pixel block, and one macro block includes four luminance signal blocks Y1, Y2, Y3, and Y4 and two color difference signal blocks Cb, Cr). A DCT operation is performed on this macro block. Temporal information compression (interframe prediction) is performed by motion compensation on the luminance signal block, and spatial information compression by DCT can be performed on each block. GOB (Group of Blocks) is composed of eleven macroblocks, for example, and constitutes an image frame with nine GOBs. The image frame becomes one screen having a common attribute, and the GOB becomes a small screen obtained by dividing one screen into 12 screens.

도 1에 나타낸 화상프레임은 예시적인 것에 지나지 아니하며 본 발명은 다른 구성의 화상 프레임(예컨대, 288 라인× 352 화소 등)에도 적용할 수 있다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 쉽게 이해할 수 있을 것이다. 도 1에 예로 든 동영상 비트 스트림에 대해 본 발명의 단일표현/다중표현 전환을 이용한 하이브리드 압축 전송 방법은 프레임 단위로 이루어진다.The image frame shown in FIG. 1 is merely exemplary and the present invention can be applied to an image frame having a different configuration (for example, 288 lines x 352 pixels, etc.). It will be easy to understand. The hybrid compression transmission method using the single-expression / multi-expression switching of the present invention for the video bit stream illustrated in FIG. 1 is performed in units of frames.

도 2는 본 발명에 따른 하이브리드 압축 방법의 진행 과정을 나타내는 블록도이다.2 is a block diagram showing the progress of a hybrid compression method according to the present invention.

도 2를 참조하면, 입력 프레임은 DCT (Discrete Cosine Transform)를 이용하여 이산여현변환 되고(10), 표준 비디오 코더와 같은 양자와 계수(QP)를 이용하여 양자화된다(20). 그 다음 단계에서는, 양자화된 프레임을 단일표현(Single Description)으로 압축할 것인지 다중표현(Multiple Description)으로 압축할 것인지를 결정한다(30). 단일표현 압축으로 결정되면, 양자화된 프레임을 일반적인 동영상 압축 방법과 동일하게 압축하여 채널(40)을 통해 전송한다. 한편, 결정 단계 또는 결정 수단(30)에서 다중표현 압축으로 결정하면, 최적화 과정을 통하여 프레임을 여러 개의 표현으로 나눈 후 각각의 표현들을 기존의 동영상 압축 방법과 동일한 방법으로 압축하고 서로 다른 경로의 채널(40)을 통해서 사용자에게 전송한다. 채널(40)을 통해서는 위에서 결정된 결과 즉, SD/MD (단일표현/다중표현) 전환 정보도 함께 전송하여 수신측에서 복호하는 데에 이용할 수 있도록 한다.Referring to FIG. 2, an input frame is discrete cosine transformed using a discrete cosine transform (DCT) (10), and quantized using a quantum and coefficient (QP) as a standard video coder (20). In a next step, it is determined whether to compress the quantized frame into a single description or multiple description (30). If it is determined as a single-expression compression, the quantized frame is compressed in the same manner as the general video compression method and transmitted through the channel 40. On the other hand, if the decision step or the decision means 30 determines with multi-expression compression, the frame is divided into multiple representations through an optimization process and then the respective representations are compressed in the same way as the existing video compression method, and channels of different paths are used. 40 is sent to the user. The channel 40 also transmits the above-determined result, that is, SD / MD (single-expression / multi-expression) switching information, so that the receiving side can use it for decoding.

결정 단계 또는 결정 수단(30)에서 이루어지는 단일표현/다중표현의 결정은 라그랑제 승수법(Lagrange multiplier method)을 이용하여 동일한 중복량(redundancy)에서 복원 오차(reconstruction distortion)가 최소가 되도록 하는 방법을 따르는 것이 바람직하다. 중복량을 구하기 위해서는 예컨대 허프만 부호화, 산술 부호화 등과 같은 엔트로피 부호화를 이용하여 발생할 비트율을 계산한다. 라그랑제 승수법에 사용되는 복원 오차는 채널에서 에러가 발생할 확률과, 에러가 발생했을 때 복호기에서 수행하는 에러 은닉 방법을 고려한 에러 모델을 이용하여 구한다. 에러 모델에 의해 구한 각 화소에 대한 복원 오차(dn i)는 다음의 수학식 1로 구할 수 있다.Determination of the single expression / multiple expression made in the decision step or the determining means 30 uses a Lagrange multiplier method to minimize the reconstruction distortion at the same redundancy. It is preferable to follow. In order to calculate the amount of redundancy, a bit rate to be generated is calculated using entropy coding such as Huffman coding and arithmetic coding. The reconstruction error used in the Lagrangian multiplier method is obtained using an error model considering the probability of an error occurring in a channel and an error concealment method performed by the decoder when an error occurs. The reconstruction error d n i for each pixel obtained by the error model can be obtained by the following equation.

위 수학식 1에서 은 확률변수로 표현한 원본화소로서 n번째 프레임의 i번째 화소이고 는 복원화소로서 에러 은닉 이후의 복호기의 복원화소이다. 부호화기에 대해 은 랜덤 변수이다. 위 수학식 1은 복원오차를 계산하는 데에 최소제곱오차(minimum squared error)를 이용하고 있는데, 이것은 계산이 간단하고 이를 통해 얻은 수치가 사람이 느끼는 화질과 밀접한 관계가 있다. 따라서 본 발명에서는 단일표현/다중표현의 전환 또는 결정을 인간의 시각적 특성을 이용하여 최적화할 수 있다.In Equation 1 above Is the original pixel expressed as the random variable and i-th pixel of n-th frame Is a decompression pixel of the decoder after error concealment. About the encoder Is a random variable. Equation 1 above uses a minimum squared error to calculate the reconstruction error, which is simple to calculate and the value obtained is closely related to the image quality that a person feels. Therefore, in the present invention, it is possible to optimize the conversion or determination of single expression / multiple expression using human visual characteristics.

한편, 복원오차 를 위 수학식 1로 구한다고 하면, 복호기의 조건(즉, 압축 순간에서의 복호기 복원 오차)은 패킷 손실율(PLR: Packet Loss Rate)을 이용하여 다음의 수학식 2와 같이 표현할 수 있다.Restoration error In Equation 1, the condition of the decoder (that is, the decoder restoration error at the compression moment) may be expressed as Equation 2 below using a packet loss rate (PLR).

여기서, D는 오차(distortion)이고 C1,~C2는 각각 표현 S1, S2에 대한 DCT 계수이다.Where D is the distortion and C 1 , C 2 are the DCT coefficients for the representations S1, S2, respectively.

한편, 수학식 1에서 평균(expectation)은 단일표현이냐 아니면 다중표현이냐에 따라 달라진다. 또한 인트라 형식(intra mode)으로 압축되느냐 혹은 인터 형식(inter mode)으로 압축되느냐에 따라서도 달라진다. 따라서 주어진 에러 모델에 의해 복원 에러를 구할 때는 다음과 같은 네 가지 경우를 고려해야 한다. 아래 수학식에서 i는 현재 화소의 인덱스(index)이고, j는 움직임 보상된 화소의 인덱스, k는 에러 은닉에 사용된 화소의 인덱스이다.Meanwhile, in Equation 1, the expectation varies depending on whether the expression is single or multiple. It also depends on whether it is compressed in intra mode or inter mode. Therefore, the following four cases should be considered when finding the restoration error by the given error model. In the following equation, i is an index of a current pixel, j is an index of a motion compensated pixel, and k is an index of a pixel used for error concealment.

(1) 단일표현 방법에서 인트라 형식일 경우(1) In the case of the intra form in the single expression method

위 수학식 3와 수학식 4에서 대문자 'I'는 인트라 형식을 의미하고, p는 패킷 손실율을 나타내며, (1-p)는 에러×확률, 는 양자화된 원본 화소를 나타낸다. 또한, 는 에러가 있어도 주변의 화소를 이용하여 복원이 가능한 화소를 의미하며, 는 복원이 불가능한 화소를 의미한다.In Equation 3 and Equation 4 above, the capital letter 'I' denotes an intra form, p denotes a packet loss rate, and (1-p) denotes an error × probability, Denotes the original quantized pixel. Also, Means a pixel which can be restored using the surrounding pixels even if an error occurs. Means a pixel that cannot be restored.

(2) 단일표현 방법에서 인터 형식일 경우(2) In case of inter format in single expression method

수학식 5와 수학식 6에서 P는 Prediction의 약자로 인터 형식을 나타내고, 는 움직임 보상되고 남은 나머지 값이다.In equations (5) and (6), P stands for Prediction and represents an inter form, Is the remaining value after motion compensation.

(3) 다중표현 방법에서 인트라 형식일 경우(3) In the case of the intra form in the multiple expression method

(4) 다중표현 방법에서 인터 형식일 경우(4) In case of inter format in multiple expression method

도 3은 본 발명에 따른 SD/MD 결정 과정을 설명하기 위한 블록도이다. 동영상 시퀀스에 N 개의 프레임이 있고 하나의 프레임에 M 개의 블록이 있다고 가정하면, M 개의 블록으로 된 N 개의 프레임(양자화된 프레임) 각각이 도 3의 단계 100에서 입력된다. 이러한 입력 프레임에 대한 SD 압축 또는 MD 압축의 최적 선택은 아래 수학식 11로 표현한 것처럼 코스트 함수를 최소로 하는 모드의 선택으로 이루어질 수 있다.3 is a block diagram illustrating an SD / MD determination process according to the present invention. Assuming that there are N frames in the video sequence and M blocks in one frame, each of N frames (quantized frames) of M blocks is input in step 100 of FIG. 3. The optimal selection of SD compression or MD compression for such an input frame may be made by selecting a mode that minimizes the cost function, as expressed by Equation 11 below.

여기서, Ei,mode는 아래 수학식 12로 정의할 수 있는 코스트 함수이다.Here, E i, mode is a cost function that can be defined by Equation 12 below.

여기서 μ는 상수로서 DCT 계수의 최적분할에 사용된 라그랑제 승수의 평균과 관련된 값이고, Di,mode와 μRi,mode는 각각 i번째 프레임의 복원오차와 총비트율(overall bit rate)로서 아래 수학식 13과 수학식 14로 정의할 수 있다.Where μ is a constant associated with the average of the Lagrange's multipliers used for optimal division of the DCT coefficients, and D i, mode and μR i, mode are the reconstruction error and the overall bit rate of the i th frame, respectively. Equations 13 and 14 may be defined.

여기서, di,j,mode와 ri,j,mode는 각각 j 번째 블록의 복원오차와 비트율이고 이것은 DCT 계수의 최적 분할을 통해 구할 수 있다.Here, d i, j, mode and r i, j, mode are the reconstruction error and the bit rate of the j th block, respectively, which can be obtained through the optimal division of the DCT coefficients.

앞에서 설명했던 라그랑제 승수법에서는 SD/MD 결정을 다음과 같은 라그랑제 코스트를 최소로 만드는 방법으로 선택한다.In the Lagrange multiplier described above, the SD / MD decision is chosen to minimize the Lagrange cost.

수학식 15에서 λ는 동영상의 화질과 비트율을 고려하여 미리 정해둔 라그랑제 승수이며, Dtotal은 앞에서 설명했던 에러 모델에 의해 구한 복원오차의 총합이고, ρ는 중복량이다. 중복량 ρ는 단일표현일 경우에는 '0'이 되며, 다중표현일 경우에는 모든 표현을 압축하는 데에 필요한 비트량에서 단일표현을 압축하는 데에 필요한 비트량을 뺀 값을 사용한다. 한편, 수학식 15에서 Dtotal은 단일표현/다중표현 결정에서 화질을 고려한 결정을 할 수 있도록 하는 변수이고, ρ는 압축 용량이 고려된 변수이다. 일반적으로 D가 작으면 화질이 좋은 것이고 ρ가 작으면 압축용량이 작은 것이다. 따라서, 본 발명의 단일표현/다중표현 전환 또는 결정은 동영상의 압축 용량과 화질을 고려하여 선택될 수 있다.In Equation 15, [lambda] is a Lagrange multiplier predetermined in consideration of video quality and bit rate, D total is a sum of reconstruction errors obtained by the error model described above, and ρ is an overlapping amount. The overlapping amount ρ becomes '0' in the case of a single expression, and in the case of multiple expressions, the bit amount required to compress the single expression is subtracted from the bit amount necessary to compress all the expressions. On the other hand, in Equation 15, D total is a variable that allows the decision in consideration of the image quality in the single / multi-expression decision, ρ is a variable considering the compression capacity. In general, smaller D means better image quality, and smaller ρ means smaller compression capacity. Therefore, the single expression / multi-expression conversion or determination of the present invention can be selected in consideration of the compression capacity and the image quality of the video.

먼저 J단일표현과 J다중표현을 구한다(도 3의 단계 130 및 160). J단일표현과 J다중표현을 구하기 위해서는 앞의 수학식 1∼수학식 10을 통해 단일표현, 다중표현 각각에 대한 에러 예측(단계 110 및 140)과 중복량 계산(단계 130 및 150)을 한다. 여기서 중복량 계산은 예컨대 'Rate다중표현 - Rate단일표현' 즉 '다중표현 압축인 경우의 비트'에서 '단일표현 압축인 경우의 비트'를 뺀 값으로 할 수 있다. 그 다음 J단일표현과 J다중표현을 비교하여(단계 170) 그 값이 작은 것을 선택하여 선택된 정보를 별도의 복호기로 전송하거나 또는 압축된 비트열에 포함하여 전송한다(단계180, 190, 200).First, J single expression and J multiple expression are obtained (steps 130 and 160 of FIG. 3). In order to obtain J single expression and J multiple expression , error prediction (step 110 and 140) and overlapping amount calculation (step 130 and 150) for single expression and multiple expressions are performed through Equations 1 to 10 above. Here, the amount of redundancy can be calculated by subtracting, for example, 'Rate multi-expression -rate single-expression ', that is, 'bit when single-expression compression' is subtracted from 'bit when multi-expression compression'. Next, J single expression is compared with J multiple expression (step 170), and the selected value is selected to be smaller and transmitted to a separate decoder or included in a compressed bit string (step 180, 190, 200).

다중표현 압축Multiexpression Compression

본 발명의 다중표현 압축에는 도 4의 다중표현 동영상 압축기를 이용할 수 있다.In the multi-expression compression of the present invention, the multi-expression video compressor of FIG. 4 may be used.

다중표현 동영상 압축은 크게 3가지가 있는데, 미리 설계된 다중표현 스칼라 양자화기(MDSQ)를 이용한 방법(예컨대, V. A. Vaishampayan & S. John 'Balanced interframe multiple description video compression' Prod. Int. Conf. Image Processing, Oct. 1999, pp. 812-816), 켤레별 상관 변환(PCT: pairwise correlating transform)을 이용한 방법(예컨대, A. Reibman, H. Jafarkhani, Y. Wang, M. Orchard & R. Puri, 'Multiple description coding for video using motion compensated prediction' Proc. Int. Conf. Image Processing, Oct. 1999, pp. 837-841 참조), 비트율-왜곡 최적화를 이용한 방법(예컨대, A. Reibman, H. Jafarkhani, Y. Wang & M. Orchard, 'Multiple description video using rate-distortion splitting' Proc. Int. Conf. Image Processing, May 2000, pp. 978-981 참조)이 그것이다. 비트율-왜곡 분할 방법은 표준에 대응하는 방법으로 부호화가 가능하고 구현이 단순하며 고비트율에서는 MDSQ (Multiple Description Scalar Quantization), PCT를 사용한 방법보다 성능이 더 좋다는 장점이 있다. 본 발명에서는 DCT 계수의 크기 뿐만 아니라 주파수 특성을 이용하고 중복시키거나 번갈아 저장하는 방법과, 제한 양자화를 고려한 새로운 알고리즘을 사용한다. 이것은 RRD (Redundancy-Rate Distortion) 곡선 상에서 더 많은 후보점을 찾을 수 있고 결과적으로 성능을 증가시킨다. 또한, 측면 복원 에러 뿐만 아니라 중앙 복원 에러도 고려한 새로운 왜곡 측정법을 정의하여 사용한다.There are three types of multi-expression video compression, including methods using a predesigned multi-expression scalar quantizer (MDSQ) (e.g. VA Vaishampayan & S. John ' Balanced interframe multiple description video compression ' Prod. Int. Conf. Image Processing, Oct. 1999, pp. 812-816), methods using pairwise correlating transform (PCT) (e.g., A. Reibman, H. Jafarkhani, Y. Wang, M. Orchard & R. Puri, ' Multiple description coding for video using motion compensated prediction '' Proc. Int. Conf. Image Processing, Oct. 1999, pp. 837-841), methods using bitrate-distortion optimization (eg, A. Reibman, H. Jafarkhani, Y. Wang & M. Orchard, `` Multiple description video using rate-distortion splitting '' Proc.Int.Conf.Image Processing, May 2000, pp. 978-981). The bit rate-distortion splitting method has a merit that it can be coded as a standard, simple to implement, and has higher performance than the method using multiple description scalar quantization (MDSQ) and PCT at a high bit rate. In the present invention, a method of using and overlapping or alternately storing frequency characteristics as well as the magnitude of DCT coefficients, and using a new algorithm considering limited quantization. This can find more candidate points on the Redundancy-Rate Distortion (RDR) curve and consequently increases performance. We also define and use a new distortion measurement method that considers not only the lateral recovery error but also the central recovery error.

도 4의 다중표현 동영상 압축기(300)는 입력 스트림을 두 개의 표현으로 나누는 것을 가정하고 있다. k 번째 프레임 Fk와 (k-1) 번째 복원 프레임들 이 주어지면 부호기(350)는 움직임 벡터(MV)를 예측할 수 있다. 은 두 개의 표현 모두를 이용한 복원 프레임이고, 은 각각 하나씩의 표현만을 이용한 복원 프레임이다. 부호기(350)는 움직임 벡터 (MV)를 예측하기 위해 복원 프레임 전부를 이용할 수 있다. MV는 각각의 움직임 예측기(320, 330, 340)에 적용되어 예측 신호 와 예측 에러 신호 를 만들어 낸다. 예측 신호 P0,k는 중앙 예측(central prediction)이라고 하고, P1,k와 P2,k를 측면 예측(side prediction)이라고 한다. 중앙 예측 에러(central prediction error) 는 두 개의 표현 로 나누어져 두 개의 독립적인 채널을 통해 디코더에 전송된다. 측면 예측 에러(side prediction error) 는 측면 복원 에러(side loop distortion) 을 계산하는 데에 사용된다. 이 측면 복원 에러(side reconstruction distortion)는 다중 표현 동영상 압축기에서 부호기와 복호기에서 예측 루프(prediction loop)가 서로 일치하지 않게 되는 중요한 원인이 된다. 만약 채널이 깨지게 되면 인코더에서의 참조 프레임(reference frame) 와 디코더에서의 복원 프레임(reconstruction frame) 만큼의 차이가 생기게 된다. 따라서 부호기와 복호기 사이에 불일치가 발생하고 성능이 떨어지게 된다. 부호기와 복호기 사이에 불일치를 미리 제거하기 위해서는 과잉 비트율 제한 조건 아래에서 왜곡 를 최소화하여야 한다. 도 4의 MD 부호기는 본 발명의 비트율-왜곡 연산자를 이용한 최적화 알고리즘에 따라 이러한 불일치를 최소화한다.The multi-expression video compressor 300 of FIG. 4 assumes that the input stream is divided into two representations. k th frame F k and (k-1) th reconstructed frames Given this, the encoder 350 can predict the motion vector (MV). Is a reconstruction frame using both representations, and Are reconstructed frames using only one representation each. The encoder 350 may use all of the reconstructed frames to predict the motion vector (MV). MV is applied to each motion predictor 320, 330, 340 to predict the signal And predictive error signals To produce The prediction signal P 0, k is called central prediction, and P 1, k and P 2, k are called side prediction. Central prediction error Has two representations Wow Divided into two independent channels and transmitted to the decoder. Side prediction error Wow Is a side loop distortion Used to calculate. This side reconstruction distortion is an important cause of the mismatch between the prediction loops in the encoder and decoder in a multi-express video compressor. If the channel is broken, a reference frame at the encoder And reconstruction frames at decoders Is There is a difference. As a result, there is a mismatch between the encoder and the decoder, resulting in poor performance. Distortion under excess bit rate constraints to eliminate inconsistency between encoder and decoder in advance Should be minimized. The MD encoder of FIG. 4 minimizes this mismatch according to the optimization algorithm using the bit rate-distortion operator of the present invention.

본 발명의 비트율-왜곡 연산자를 이용한 최적화 알고리즘은 주파수 위치와 주어진 목적 함수에 따라 중복(duplication), 번갈음(alternation) 및 제한 양자화(constrained quantization)의 세 가지 방법을 적용한다. 중복은 계수를 두 개의 표현에 동일하게 저장하고, 번갈음은 두 개의 표현 중 하나에만 계수를 저장하며, 제한 양자화는 양자화된 계수의 합이 원본 계수와 같도록 두 개의 새로운 계수로 양자화한다. 나누어진 계수들은 각각의 표현에 저장된다. 중복 연산과 번갈음 연산은 비트율-왜곡 분할 방법과 유사하다. 이론적으로 64 개의 계수를 갖는 입력 블록을 세 개의 연산자를 가지고 최적화하기 위해서는 364 번의 연산이 필요하다. 그러나 이러한 방법은 구현이 불가능하기 때문에, 그리디(greedy) 접근 방법을 사용한다. 즉, 작은 인덱스를 갖는 계수부터 큰 인덱스를 갖는 계수까지 순서대로 최적화하는 것이다. 이렇게 하면, 최대 연산 횟수는 64×3이 된다.The optimization algorithm using the bit rate-distortion operator of the present invention applies three methods of duplication, alternation and constrained quantization according to the frequency position and the given objective function. Redundancy stores coefficients identically in two representations, alternating stores coefficients in only one of the two representations, and constrained quantization quantizes into two new coefficients such that the sum of the quantized coefficients equals the original coefficients. The divided coefficients are stored in each representation. Redundancy and alternating operations are similar to the rate-distortion division method. Theoretically, an input block with 64 coefficients requires 3 64 operations to optimize with three operators. However, this method is impossible to implement, so we use the greedy approach. In other words, optimization is performed in order from coefficients with small indexes to coefficients with large indexes. In this way, the maximum number of operations is 64x3.

CODEC 구현예CODEC implementation

본 발명을 ITU-T H.263 비디오 코덱(video codec)에 기반하여 구현한 MDC 코덱에 대하여 설명한다. 본 발명의 MDC 코덱은 종래의 SD 및 MDC 비디오 부호기와 달리 SD/MD 전환을 복호기에 알려야 한다. H.263 비트 스트림 문법(syntac)을 지키기 위하여 화상 헤더(Picture Header) 영역에 PEI (Extra Insertion Information)와 PSUPP (Supplemental Enhancement Information) 비트를 이용한다. PSUPP 데이터는 4 비트 함수형 표기(4-bit function type indication) FTYPE와 그 뒤를 잇는 4 비트 변수 데이터 크기 규격 DSIZE로 구성된다. 지원되지 않는 함수형 표기를 수신한 복호기는 이 함수에 대한 변수 데이터 크기를 버릴 수 있다. SD/MD 전환 정보를 교환하기 위해 확장 함수형(Extended Function Type)을 사용하기 때문에, 이러한 함수형을 지원하지 않는 비디오 복호기는 SD/MD 전환 정보를 버릴 수 있다.An MDC codec embodying the present invention based on the ITU-T H.263 video codec will be described. Unlike conventional SD and MDC video coders, the MDC codec of the present invention should inform the decoder of the SD / MD conversion. In order to preserve the H.263 bit stream syntax, extra insertion information (PEI) and supplemental enhancement information (PSUPP) bits are used in a picture header area. PSUPP data consists of a 4-bit function type indication FTYPE followed by a 4-bit variable data size specification DSIZE. Decoders that receive unsupported functional notation may discard the variable data size for this function. Since an extended function type is used to exchange SD / MD switching information, a video decoder that does not support such a function type may discard the SD / MD switching information.

TMN8 비트율 제어 기법(rate control scheme)과 라그랑제 승수 선택법을 이용하여 비트율 제한 요건에 맞도록 한다. 발명자들이 실험한 바에 따르면, 최적의 라그랑제 승수 λ는 다음의 수학식 16으로 정해진다.The TMN8 rate control scheme and Lagrange multiplier selection are used to meet the bit rate constraints. According to the inventors' experiment, the optimal Lagrange multiplier λ is determined by the following equation (16).

여기서 상수 c는 H.263 비디오 부호기에서 0.85이다. SD-ROPE에서도 c의 값으로 0.85를 사용할 수 있다. MD 동영상 압축은 SD 동영상 압축과 다르기 때문에, 아래의 수학식 17과 같은 새로운 라그랑제 승수 선택법을 이용한다.Where the constant c is 0.85 in the H.263 video encoder. In SD-ROPE, 0.85 can be used as the value of c. Since MD video compression is different from SD video compression, a new Lagrangian multiplier selection method as shown in Equation 17 below is used.

MDC에서는 라그랑제 승수가 압축 효율 뿐만 아니라 에러 회복성(error resilience)을 제어한다. PLR (Packet Loss Rate)이 높으면, 패킷 손실 에러에 대비하기 위해 더 많은 중복량이 필요하게 된다. 따라서 PLR을 라그랑제 승수 선택 함수에 포함시키는 것이 바람직하다. 본 발명자들이 모의실험을 반복해 본 결과, MD-ROPE와 하이브리드 MDC의 경우 위 수학식 17에서는 상수 c를 0.15로 선택할 수 있다.In MDC, Lagrange multipliers control not only compression efficiency but also error resilience. If the PLR (Packet Loss Rate) is high, more redundancy is needed to prepare for packet loss errors. It is therefore desirable to include the PLR in the Lagrange multiplier selection function. As the inventors repeated the simulation, in the case of MD-ROPE and hybrid MDC, the constant c may be selected as 0.15 in Equation 17 above.

성능 평가 결과Performance evaluation result

발명자들은 TMN8 비트율 제어 및 앞에서 설명한 새로운 라그랑제 승수 선택법을 이용하여 본 발명의 하이브리드 MDC를 SDC-ROPE와 MDC-ROPE와 그 성능을 비교 평가하였다. 도 5는 이 평가에 적용한 3가지 알고리즘의 개념을 보여준다. 도 5에서 위쪽행은 패킷 손실율(PLR)이 높은 경우이고, 아래쪽 행은 패킷 손실율(PLR)이 낮은 경우이다. 회색 블록은 인트라 블록(intra block)을 의미한다. 본 발명의 하이브리드 MDC는 채널 환경에 따른 SD/MD 전환을 이용하는 반면, SDC-ROPE와 MDC-ROPE는 인트라/인터 모드 전환을 이용한다. 발명자들이 한 평가에는 베이스라인 H.263을 사용하고 GOB 헤더들이 포함되어 있다. 각각의 프레임은 2개의 표현으로 분할되는데, SD의 경우 기수 GOB들에게 하나의 표현이 할당되고 우수 GOB들에게 다른 표현이 할당된다. 인트라 프레임의 갱신율(update rate)은 매 10 프레임으로 하였다. The inventors compared the performance of the hybrid MDC of the present invention with SDC-ROPE and MDC-ROPE using TMN8 bit rate control and the new Lagrangian multiplier selection method described above. 5 shows the concept of three algorithms applied to this evaluation. In FIG. 5, the upper row shows a case where the packet loss rate PLR is high, and the lower row shows a case where the packet loss rate PLR is low. Gray blocks mean intra blocks. Hybrid MDC of the present invention uses SD / MD switching according to channel environment, while SDC-ROPE and MDC-ROPE use intra / inter mode switching. The inventor's evaluation uses baseline H.263 and includes GOB headers. Each frame is divided into two representations, in the case of SD, one representation is assigned to the odd GOBs and the other representation is assigned to the even GOBs. The update rate of the intra frame was set to every 10 frames.

각각의 동영상 시퀀스에 대해 30개의 서로 다른 패킷 손실 패턴을 주입하고 그 결과의 평균을 구하였다. 도 6과 도 7은 각각 Mother & Daughter 시퀀스와 Foreman 시퀀스에 대한 패킷 손실 성능을 보여준다. Mother & Daughter 시퀀스인 경우 낮은 패킷 손실율(PLR)에서 본 발명의 하이브리드 MDC에 비해 SDC-ROPE의 성능이 조금 더 우수한 것으로 나왔는데, 그 이유는 시퀀스의 낮은 움직임 특성과 SD/MD 전환 정보 때문이다. 그러나 Formenam 시퀀스인 경우에는, 낮은 패킷 손실율(PLR)과 높은 패킷 손실율(PLR) 모두에 대해서 본 발명의 하이브리드 MDC가 종래의 SD-ROPE 및 MD-ROPE에 비해 그 성능이 훨씬 더 우수한 것으로 나타났다.Thirty different packet loss patterns were injected for each video sequence and the results averaged. 6 and 7 show packet loss performance for the Mother & Daughter sequence and Foreman sequence, respectively. In case of mother & daughter sequence, the performance of SDC-ROPE is slightly better than that of hybrid MDC of the present invention at low packet loss rate (PLR), because of the low motion characteristics and SD / MD conversion information of the sequence. However, in the case of Formenam sequences, the hybrid MDC of the present invention is shown to be much better than the conventional SD-ROPE and MD-ROPE for both low packet loss rate (PLR) and high packet loss rate (PLR).

지금까지 도면을 참조로 본 발명의 구현예에 대해 설명하였다. 그러나, 이것은 발명의 구현을 위한 설명에 지나지 아니하며 본 발명의 범위를 제한하기 위한 것은 아니다. 예를 들어, 수학식 1∼9을 제시하면서 복원 오차를 구하는 방식을 설명하였지만, 본 발명이 반드시 이러한 방식을 통해서만 복원 오차를 구할 수 있는 것은 아니고, 예컨대 앞의 설명에서는 복원 오차를 화소 단위로 구하는 것을 중심으로 하였으나 복원 오차를 매크로 블록 단위로 구하는 것도 본 발명의 범위 내에서 가능하다.The embodiments of the present invention have been described above with reference to the drawings. However, this is only a description for the implementation of the invention and is not intended to limit the scope of the invention. For example, a method of obtaining a restoration error has been described by presenting Equations 1 to 9, but the present invention is not necessarily able to obtain a restoration error only through such a method. For example, in the above description, the restoration error is obtained in units of pixels. It is also possible to obtain the restoration error in macroblock units within the scope of the present invention.

앞에서 설명한 것처럼, 본 발명의 단일표현/다중표현 전환을 이용한 하이브리드 압축 전송 방법에 따르면 다음과 같은 효과가 있다. 기존의 다중표현 압축 방법은 에러가 많이 발생하는 환경에서는 효과적이었으나 에러가 적게 발생하는 환경에서는 압축 효율이 떨어지는 문제점이 있었다. 그러나, 본 발명의 방법에서는 변화하는 채널 환경에서도 채널 환경에 적응적으로 단일표현/다중표현을 전환하여 에러가 많이 발생하는 환경에서는 다중표현을 사용하여 에러에 대한 강인성을 높일 수 있고 에러가 적게 발생하는 환경에서는 단일표현 압축을 사용하여 압축 효율을 높일 수 있다.As described above, according to the hybrid compression transmission method using the single expression / multiple expression conversion of the present invention has the following effects. Conventional multi-expression compression methods have been effective in a high error environment, but have low compression efficiency in a low error environment. However, in the method of the present invention, even in a changing channel environment, the robustness of the error can be increased and the error is less generated by using multiple expressions in an environment where a large number of errors are generated by switching a single expression / multiple expression adaptively to the channel environment. In one environment, single-expression compression can be used to increase compression efficiency.

특히, 기존의 다중표현 압축 기법에 비해 에러가 더 많이 발생하는 환경에서는 본 발명의 방법이 에러에 더 강인하고 에러가 적게 발생하는 환경에서는 압축 성능이 더 우수하다.In particular, in an environment where more error occurs than conventional multi-expression compression schemes, the compression performance is better in an environment where the method of the present invention is more robust to errors and less error-prone.

도 1은 본 발명이 적용될 수 있는 동영상 비트 스트림의 구성을 나타내는 블록도.1 is a block diagram showing the configuration of a video bit stream to which the present invention can be applied.

도 2는 본 발명에 따른 단일표현/다중표현 전환을 이용한 동영상 데이터 압축 방법 또는 장치의 전체 흐름과 구성을 나타내는 블록도.2 is a block diagram showing the overall flow and configuration of a video data compression method or apparatus using a single expression / multiple expression conversion according to the present invention.

도 3은 본 발명의 단일표현/다중표현 전환을 이용한 하이브리드 압축 기법의 전체 흐름도.3 is a complete flow diagram of a hybrid compression technique using the single / multiple expression conversion of the present invention.

도 4는 본 발명에 사용될 수 있는 다중표현 동영상 압축기의 구조를 나타내는 블록도.Figure 4 is a block diagram showing the structure of a multi-expression video compressor that can be used in the present invention.

도 5는 본 발명에 따른 동영상 데이터 압축 장치의 성능을 평가하기 위한 3가지 알고리즘의 개념을 설명하기 위한 도면.5 is a view for explaining the concept of three algorithms for evaluating the performance of the video data compression apparatus according to the present invention.

도 6은 본 발명에 따른 동영상 데이터 압축 장치의 성능을 평가한 결과를 설명하기 위한 그래프.6 is a graph for explaining a result of evaluating the performance of the video data compression apparatus according to the present invention.

도 7은 본 발명에 따른 동영상 데이터 압축 장치의 성능을 평가한 결과를 설명하기 위한 그래프.7 is a graph for explaining a result of evaluating the performance of the video data compression apparatus according to the present invention.

<도면의 주요 부호에 대한 설명><Description of Major Symbols in Drawing>

10: DCT (Discrete Cosine Transform)10: DCT (Discrete Cosine Transform)

20: 양자화 30: SD/MD (단일표현/다중표현) 결정20: Quantization 30: SD / MD (Single Expression / Multiple Expression) Determination

40: 채널 320: 중앙 움직임 예측기40: channel 320: center motion predictor

330, 340: 측면 움직임 예측기330, 340: side motion predictor

Claims (13)

데이터 압축 장치로서,As a data compression device, 입력 데이터를 이산 신호로 변환하는 수단과,Means for converting input data into discrete signals, 변환된 이산 신호를 양자화하는 수단과,Means for quantizing the transformed discrete signal, 양자화된 신호를 단일표현으로 압축할 것인지 다중표현으로 압축할 것인지를 결정하는 결정 수단과,Determining means for determining whether to compress the quantized signal into a single representation or multiple representations; 상기 결정 수단에서 다중표현 압축으로 결정한 경우에는 상기 양자화된 신호를 여러 개의 표현으로 나누고 각각의 표현을 압축하는 수단을 포함하며,Means for dividing the quantized signal into multiple representations and compressing each representation when the decision means determines with multi-expression compression, 상기 결정 수단은 동일한 중복량(redundancy)에서 복원 오차(reconstruction distortion)가 최소가 되도록 결정하는 단계인 것을 특징으로 하는 데이터 압축 장치.And said determining means is a step of determining such that reconstruction distortion is minimized at the same redundancy. 제1항에서,In claim 1, 상기 복원 오차는 채널에서 에러가 발생할 확률과, 에러가 발생했을 때 복호기에서 수행하는 에러 은닉 방법을 고려한 에러 모델을 이용하여 구하는 것을 특징으로 하는 데이터 압축 장치.And the reconstruction error is obtained using an error model considering a probability of an error occurring in a channel and an error concealment method performed by a decoder when an error occurs. 제1항에서,In claim 1, 상기 결정 수단은 라그랑제 승수법(Lagrange multiplier method)을 이용하는 것을 특징으로 하는 데이터 압축 장치.And said determining means uses a Lagrange multiplier method. 제1항에서,In claim 1, 상기 중복량은 엔트로피 부호화를 이용하여 발생할 비트율을 계산하여 구하는 것을 특징으로 하는 데이터 압축 장치.And calculating the bit rate to be generated by using entropy encoding. 제1항에서,In claim 1, 상기 결정 수단은 Di,mode + μRi,mode로 표현되는 코스트 함수를 최소로 하는 모드를 선택하며, 여기서 μ는 상수이고, Di,mode와 μRi,mode는 각각 i번째 프레임의 복원오차와 총비트율로서 으로 정의되며, di,j,mode와 ri,j,mode는 각각 j 번째 블록의 복원오차와 비트율인 것을 특징으로 하는 데이터 압축 장치.It said determining means D i, mode + μR i, select the mode in which the cost function is expressed as a mode to a minimum, where and μ is a constant, D i, mode and μR i, mode is restored error of the i-th frame, respectively And the total bit rate And And d i, j, mode and r i, j, mode are the reconstruction error and the bit rate of the j th block, respectively. 제3항에서,In claim 3, 상기 결정 수단은 라그랑제 코스트 를 최소로 만드는 방법으로 선택되고, 여기서 λ는 라그랑제 승수이고 Dtotal은 에러 모델에 의해 구한 복원오차의 총합이며 ρ는 복원량인 것을 특징으로 하는 데이터 압축 장치.The determining means is Lagrange Coast Where λ is the Lagrange multiplier, D total is the sum of the restoration errors obtained by the error model, and ρ is the restoration amount. 제6항에서,In claim 6, 상기 라그랑제 승수 λ는 또는 으로 구하며, 여기서 c는 상수이고 QP는 양자화 계수이며 PLR은 패킷 손실율인 것을 특징으로 하는 데이터 압축 장치.The Lagrange multiplier λ is or Wherein c is a constant, QP is a quantization coefficient, and PLR is a packet loss rate. 제1항에서,In claim 1, 상기 양자화 수단에 의해 양자화된 신호에 대한 단일표현의 에러 예측값과 중복량을 계산하는 수단과,Means for calculating an error prediction value and an overlap amount of a single expression for a signal quantized by the quantization means; 상기 양자화 수단에 의해 양자화된 신호에 대한 다중표현의 에러 예측값과 중복량을 계산하는 수단과,Means for calculating an error prediction value and an overlap amount of the multi-expression of the signal quantized by the quantization means; 상기 계산하는 수단들에 의해 계산된 값을 기초로 단일표현 코스트와 다중표현 코스트를 구하고 그 값들을 서로 비교하여 단일표현 코스트의 값이 다중표현 코스트의 값보다 더 작은 경우에는 상기 양자화된 신호가 단일표현 압축되도록 하고 다중표현 코스트의 값이 단일표현 코스트의 값보다 더 작은 경우에는 상기 양자화된 신호가 다중표현 압축되도록 하는 수단을 더 포함하는 것을 특징으로 하는 데이터 압축 장치.A single expression cost and a multi-expression cost are obtained based on the values calculated by the calculating means, and the values are compared with each other, and when the value of the single-expression cost is smaller than the value of the multi-expression cost, the quantized signal is single. Means for causing representation compression and for causing the quantized signal to be multi-express compressed if the value of the multi-expression cost is less than the value of the single-expression cost. 제1항에서,In claim 1, 상기 결정 수단에서 다중표현 압축으로 결정한 경우에는 중앙 움직임 예측기와 측면 움직임 예측기를 포함하는 다중표현 동영상 압축기를 이용하여 상기 양자화된 신호를 압축하는 것을 특징으로 하는 데이터 압축 장치.And when the decision means determines the multi-expression compression, compressing the quantized signal using a multi-expression video compressor including a central motion predictor and a lateral motion predictor. 데이터 압축 장치로서,As a data compression device, 입력 데이터를 이산 신호로 변환하는 수단과,Means for converting input data into discrete signals, 변환된 이산 신호를 양자화하는 수단과,Means for quantizing the transformed discrete signal, 양자화된 신호를 단일표현으로 압축할 것인지 다중표현으로 압축할 것인지를 결정하는 결정 수단과,Determining means for determining whether to compress the quantized signal into a single representation or multiple representations; 상기 결정 수단에서 다중표현 압축으로 결정한 경우에는 상기 양자화된 신호를 여러 개의 표현으로 나누고 각각의 표현을 압축하는 수단을 포함하며,Means for dividing the quantized signal into multiple representations and compressing each representation when the decision means determines with multi-expression compression, 상기 결정 수단은 비트율 왜곡 코스트 함수 D + λR가 최소가 되도록 단일표현 압축과 다중표현 압축을 결정하며, 여기서 D는 계산된 복원오차이고 R은 실제로 압축된 비트율인 것을 특징으로 하는 데이터 압축 장치.And said determining means determines single-expression compression and multi-expression compression such that the bit rate distortion cost function D + lambda R is minimum, where D is the calculated reconstruction error and R is the actual compressed bit rate. 데이터 압축 방법으로서,As a data compression method, 입력 데이터를 이산 신호로 변환하는 단계와,Converting the input data into a discrete signal, 변환된 이산 신호를 양자화하는 단계와,Quantizing the transformed discrete signal, 양자화된 신호를 단일표현으로 압축할 것인지 다중표현으로 압축할 것인지를 결정하는 결정 단계와,A decision step of determining whether to compress the quantized signal into a single expression or multiple expressions, 상기 결정 단계에서 다중표현 압축으로 결정한 경우에는 상기 양자화된 신호를 여러 개의 표현으로 나누고 각각의 표현을 압축하는 단계를 포함하며,If the decision step is determined by multi-expression compression, dividing the quantized signal into multiple representations and compressing each representation; 상기 결정 단계는 비트율 왜곡 코스트 함수 D + λR가 최소가 되도록 단일표현 압축과 다중표현 압축을 결정하며, 여기서 D는 계산된 복원오차이고 R은 실제로 압축된 비트율인 것을 특징으로 하는 데이터 압축 방법.The determining step determines the single-expression compression and the multi-expression compression such that the bit rate distortion cost function D + λ R is minimum, where D is the calculated reconstruction error and R is the actual compressed bit rate. 제11항에서,In claim 11, 상기 결정 단계는 라그랑제 코스트 를 최소로 만드는 방법으로 선택되고, 여기서 λ는 라그랑제 승수이고 Dtotal은 에러 모델에 의해 구한 복원오차의 총합이며 ρ는 복원량인 것을 특징으로 하는 데이터 압축 방법.The determining step is Lagrange Coast Where λ is the Lagrange multiplier, D total is the sum of the restoration errors obtained by the error model, and ρ is the restoration amount. 제11항에서,In claim 11, 상기 양자화된 신호에 대한 단일표현의 에러 예측값과 중복량을 계산하는 단계와,Calculating an error prediction value and an overlap amount of a single expression for the quantized signal; 상기 양자화된 신호에 대한 다중표현의 에러 예측값과 중복량을 계산하는 단계와,Calculating an error prediction value and an overlapping amount of the multi-expression of the quantized signal; 상기 계산 단계들에 의해 계산된 값을 기초로 단일표현 코스트와 다중표현 코스트를 구하고 그 값들을 서로 비교하여 단일표현 코스트의 값이 다중표현 코스트의 값보다 더 작은 경우에는 상기 양자화된 신호가 단일표현 압축되도록 하고 다중표현 코스트의 값이 단일표현 코스트의 값보다 더 작은 경우에는 상기 양자화된 신호가 다중표현 압축되도록 하는 단계를 더 포함하는 것을 특징으로 하는 데이터 압축 방법.The single-expression cost and the multi-expression cost are obtained based on the values calculated by the calculation steps, and the values are compared with each other. Causing the quantized signal to be multi-express compressed if the value of the multi-expression cost is less than the value of the single-expression cost.
KR1020040020493A 2004-03-25 2004-03-25 Method and apparatus for coding video data based on switching between single description and multiple description KR20050095237A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040020493A KR20050095237A (en) 2004-03-25 2004-03-25 Method and apparatus for coding video data based on switching between single description and multiple description

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040020493A KR20050095237A (en) 2004-03-25 2004-03-25 Method and apparatus for coding video data based on switching between single description and multiple description

Publications (1)

Publication Number Publication Date
KR20050095237A true KR20050095237A (en) 2005-09-29

Family

ID=37275777

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040020493A KR20050095237A (en) 2004-03-25 2004-03-25 Method and apparatus for coding video data based on switching between single description and multiple description

Country Status (1)

Country Link
KR (1) KR20050095237A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10336040A (en) * 1997-01-30 1998-12-18 At & T Corp Multiple description encoding communication system
US20030138047A1 (en) * 1999-07-28 2003-07-24 Michael Orchard Method and apparatus for accomplishing multiple description coding for video

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10336040A (en) * 1997-01-30 1998-12-18 At & T Corp Multiple description encoding communication system
US20030138047A1 (en) * 1999-07-28 2003-07-24 Michael Orchard Method and apparatus for accomplishing multiple description coding for video

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
논문, Adaptive Multiple Description Coding For Internet Video. - SDC와 MDC의 성능비교에 관한 논문(2003. . ) *
논문, Multiple Description Source Coding And Diversity routing: A Joint Source Channel Coding Approach To Real-time Services Over Dense Networks(2003. 04. ) *
논문, On the Performance of Multiple Description Codes over Bit Error Channels - SD와 MD간 성능비교에 관한 논문(2001.06.24) *

Similar Documents

Publication Publication Date Title
US20230267649A1 (en) Apparatus and method for coding/decoding image selectively using discrete cosine/sine transform
KR102051083B1 (en) Video encoding apparatus for performing intra-prediction based on directionality of neighboring block, video decoding apparatus and video decoding method for performing the same
KR100654436B1 (en) Method for video encoding and decoding, and video encoder and decoder
KR101131689B1 (en) Video compression method using filter selection
KR101196429B1 (en) Video transcoding method and apparatus, and motion vector interpolation method
RU2335845C2 (en) Conversion factor coding in image/video signal coders and/or decoders
US9654798B2 (en) Device and method for image encoding/decoding using prediction direction conversion and selective encoding
KR100597402B1 (en) Method for scalable video coding and decoding, and apparatus for the same
KR100773761B1 (en) The apparatus and method of moving picture encoding
CN103782598A (en) Fast encoding method for lossless coding
JP2005524304A (en) Method and apparatus for displaying quantizer parameters in a video coding system
WO2008004768A1 (en) Image encoding/decoding method and apparatus
WO2006083113A1 (en) Method and apparatus for scalably encoding/decoding video signal
CN103916675B (en) A kind of low latency inner frame coding method divided based on band
KR20070077059A (en) Method and apparatus for entropy encoding/decoding
KR100712532B1 (en) Apparatus and method for transcoding video error-resiliently using single description and multiple description switching
KR100813001B1 (en) Video Encoding and Decoding Apparatus and Methods using Separation of Amplitude and Sign of a differential image signal
Lee et al. Towards MPEG4: An improved H. 263-based video coder
US11956453B2 (en) Content-adaptive online training for DNN-based cross component prediction with scaling factors
KR20120076815A (en) Adaptive scan apparatus and method therefor
KR100323701B1 (en) image coding device
KR101261525B1 (en) Method and apparatus for encoding and decoding image
KR100870554B1 (en) Motion compensated temporal filtering method for efficient wavelet-based scalable video coding and record-medium for executing method thereof
US20110182359A1 (en) Central decoding controller and controlling method thereof
KR20050095237A (en) Method and apparatus for coding video data based on switching between single description and multiple description

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application