KR101511230B1 - 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법 - Google Patents

적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법 Download PDF

Info

Publication number
KR101511230B1
KR101511230B1 KR20080094709A KR20080094709A KR101511230B1 KR 101511230 B1 KR101511230 B1 KR 101511230B1 KR 20080094709 A KR20080094709 A KR 20080094709A KR 20080094709 A KR20080094709 A KR 20080094709A KR 101511230 B1 KR101511230 B1 KR 101511230B1
Authority
KR
South Korea
Prior art keywords
quantization
unit
distributed video
adaptive
strength
Prior art date
Application number
KR20080094709A
Other languages
English (en)
Other versions
KR20100035364A (ko
Inventor
전병우
박종빈
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Priority to KR20080094709A priority Critical patent/KR101511230B1/ko
Priority to US12/585,835 priority patent/US8259798B2/en
Publication of KR20100035364A publication Critical patent/KR20100035364A/ko
Application granted granted Critical
Publication of KR101511230B1 publication Critical patent/KR101511230B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/395Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Abstract

본 발명은 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법에 관한 것으로서, 부호화 및 복호화시 적응양자화를 수행하여 한정된 자원 및 정보량을 효율적으로 이용하도록 적응 양자화를 수행하고, 채널 코딩을 위해 전송이 불필요한 비트 자리에 사전에 정의된 소정의 비트를 삽입하여 전체적으로 비트율 - 왜곡 성능을 향상시키는 분산 비디오 부호화 장치 및 복호화 장치 그리고 이에 따른 부호화/복호화 방법을 제공한다.

Description

적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법{Apparatus and Method for Distributed Video Encoding and Decoding Using Adaptive Quantization}
본 발명은 분산 비디오 부호화/복호화 장치 및 그 방법에 관한 것으로서, 특히 분산 비디오의 부호화 및 복호화 성능 향상을 위하여 적응 양자화를 이용하는 장치 및 그 방법에 관한 것이다. 적응 양자화를 사용해 한정된 자원 및 정보량을 효율적으로 이용하여 주관적, 객관적 화질을 개선하는 부호화와 복호화 장치 및 그 방법에 관한 것이다.
화상회의, 주문형 비디오(VOD) 수신기, 디지털 방송 수신기 및 케이블 텔레비전(CATV)등에서 사용되는 디지털 영상 데이터는 일반적으로 상당량의 데이터 크기를 갖기 때문에 그대로 사용되기 보다는 효율적인 압축방법에 의해 압축된다.
이러한 영상의 압축기술로는 MPEG(Moving Picture Experts Group), H.26x 등의 압축 표준이 있는데 이러한 기술들은 비디오 플레이어, VOD(Video On Demand), 영상 전화, DMB(Digital Multimedia Broadcasting) 등 많은 응용에 사용되고 있으며 최근에는 2.5G/3G 등의 무선 통신의 발달로 무선 모바일 환경(Wireless Mobile Base)에서의 영상 전송에도 사용되고 있다.
디지털 영상 데이터의 압축은 시간적 중복성(Temporal Redundancy)을 줄이는 방법과 공간적 중복성(Spatial Redundancy)을 줄이는 방법 및 발생 부호의 통계적 중복성(Statistical Redundancy) 줄이는 방법 등을 주로 사용한다. 이중 시간적 중복성을 줄이는 대표적인 방법이 바로 움직임 예측 및 보상 기술이다.
현재의 코딩 기술들은 이러한 시간적 중복성의 제거로 높은 부호화 효율을 달성하였다. 그러나 동영상 부호화기에서 가장 많은 연산량을 차지하는 부분 또한 움직임 탐색 및 보상 기술이기 때문에 센서 네트워크와 같은 한정적인 자원의 환경에서는 부호화기의 복잡도를 줄이는 것이 중요한 기술적 문제로 대두되고 있다.
Slepian-Wolf 이론을 기반으로 한 분산 소스 부호화(DSC: Distributed Source Coding) 기술은 이러한 부호화기의 복잡도 문제를 해결하기 위한 방법 중 하나로 주목 받고 있다. Slepian-Wolf 이론은 상관성이 있는 소스들을 독립적으로 부호화 하더라도 복호화를 서로 연계해서 한다면 각 소스를 같이 예측 부호화하여 얻을 수 있는 것과 동일한 정도까지의 부호화 이득을 얻을 수 있음을 수학적으로 증명한 것이다.
분산 비디오 부호화(DVC: Distributed Video Coding) 기술은 분산 소스 부호화 기술이 무손실 압축에 해당하던 것을 손실 압축의 경우로 확대한 것으로서 역시 분산 소스 부호화 기술의 이론적 토대인 Slepian-Wolf 이론을 손실부호화 경우로 확대한 Wyner-Ziv 이론에 근거한다.
비디오 부호화 기술(DVC)의 관점에서 보면 이 두 기술 모두 종래의 픽춰(Picture)간 중복성을 줄이기 위해 행해졌던 움직임 예측 및 보상 같은 처리절차를 별다른 부호화 이득 손실 없이 복호화기 쪽으로 옮길 수 있음을 의미한다.
분산 비디오 부호화 기술 중 알려진 것은 A. Aaron, S. Rane, R. Zhang, and B. Girod 등이 Proc. IEEE Data Compression Conference, 2003을 통해 발표한 논문인 "Wyner-Ziv coding for video: Applications to compression and error resilience"에 기반한 Wyner-Ziv 코딩 기술이다. 이 분산 비디오 부호화 기술은 복호화기에서 이웃 픽춰 간의 유사도를 이용하여 현재 픽춰에 대한 보조정보를 만들고, 이 보조정보는 복원하여야 할 현재 픽춰에 가상채널의 잡음이 부가된 것으로 간주하여, 부호화기에서 전송된 채널코드를 이용하여 보조정보 내의 잡음을 제거하는 방식으로 현재 픽춰를 재생하는 것이다.
도 1은 종래의 Wyner-Ziv 코딩 기술에 따른 부호화기(110)와 이에 상응하는 복호화기(130)의 구성을 도시한 도면이다.
도 1에 도시된 바와 같이, 종래의 Wyner-Ziv 코딩 기술에 따른 부호화기(110)는 블록단위화부(111), 양자화부(112), 채널코드 부호화부(113) 및 키픽춰 부호화부(114)를 포함한다. 또한, 이에 상응하는 복호화기(130)는 채널코드 복호화부(131), 영상복원부(132), 키픽춰 복호화부(133) 및 보조정보 생성부(134)를 포함한다.
Wyner-Ziv 코딩 기술에 따른 부호화기(110)는 부호화할 픽춰를 두 종류로 분류한다. 이 중 하나의 픽춰는 채널코드 부호화를 이용해 Wyner-Ziv 코딩되는 픽춰(이하, 'WZ픽춰'라 함)이며, 다른 하나의 픽춰는 H.264/AVC와 같이 종래의 부호화 방식에 의하여 부호화할 픽춰(이하, '키픽춰'라 함)이다.
키픽춰 부호화부(114)는 통상 H.264/AVC의 인트라픽춰(Intra Picture) 부호화 방식과 같이 사용자가 선택한 소정의 방법으로 키픽춰들을 부호화화고, 이를 복호화기(130)로 전송한다.
부호화기(110)에 상응하는 복호화기(130)의 키픽춰 복호화부(133)는 소정의 방법으로 부호화되어 전송된 키픽춰들을 복원하고, 보조정보 생성부(134)는 키픽춰 복호화부(133)에 의해 복원된 키픽춰를 이용하여 WZ픽춰에 해당하는 보조정보(Side Information)를 생성한다.
통상적으로 보조정보 생성부(134)는 WZ픽춰 전후에 위치한 키픽춰 간의 선형 움직임을 가정한 보간법을 이용하여 복원할 WZ픽춰에 해당하는 보조정보(Side Information)를 생성한다. 경우에 따라 보외법을 사용할 수도 있으나 성능 면에서 보간법이 보외법에 비해 앞서기 때문에 대부분의 경우 보간법이 사용되고 있다.
한편, WZ픽춰를 부호화하기 위해, 부호화기(110)의 블록단위화부(111)는 입력되는 WZ픽춰를 소정의 부호화단위로 구분한다. 양자화부(112)는 블록단위화부(111)에 의하여 구분된 부호화단위에 대하여 양자화를 수행한다. 그리고 채널코드부호화부(113)는 채널코드를 이용하여 양자화된 값에 대하여 패리티 비트를 생성한다. 생성된 패리티 비트는 패리티 버퍼(미도시)에 저장되었다가 피드백채널을 통한 복호화기(130)의 요청에 따라 순차적으로 전송된다.
한편, 도 1의 채널코드 복호화부(131)는 부호화기(110)로부터 전송되는 패리티를 받아 양자화된 값을 추정한다. 도 1의 영상복원부(132)는 채널코드 복호화부(131)에 의해 추정된 양자화값을 입력받아 이를 역양자화하여 복원된 WZ픽춰를 복원한다.
상기 과정에 있어 역양자화시에 발생하는 모호성(Ambiguity)은 보조정보 생성부(134)에 의해 입력되는 보조정보를 참조하여 해결할 수 있다. 이에 대한 구체적인 설명은 A. Aaron, S. Rane, R. Zhang, and B. Girod 등이 Proc. IEEE Data Compression Conference, 2003을 통해 발표한 논문인 "Wyner-Ziv coding for video: Applications to compression and error resilience"를 참조한다.
도 2는 도 1의 Wyner-Ziv 코딩 기술에서의 채널코드 복호화부(131)의 세부 구성을 도시한 도면이다.
도 2에 도시된 바와 같이, 채널코드 복호화부(131)는 두개의 SISO 복호화부(210a,210b), 채널 확률값 계산부(211a,211b), 인터리버(213a,213b), 역인터리버(214a,214b), 디먹스(215)(DEMUX) 및 결정부(216)를 포함한다.
부호화기(110)로부터 전송된 양자화값에 대한 패리티와 이를 인터리빙한 값에 대한 패리티로 구성되는 패리티 비트 데이터는, 도 2의 디먹스(215)(DEMUX)에 의해 분리되어 각각의 채널 확률 계산부(211a,211b)에 입력된다.
각각의 채널 확률값 계산부(211a,211b)는 보조 정보와 잡음에 대한 확률통계 특성 그리고 부호화기(110)에서 전송되는 패리티 비트를 입력받아 채널 확률값을 계산한다.
그리고 각각의 SISO(Soft-Input Soft-Output) 복호화부(210a,210b)는 상기 채널 확률값과 다른 SISO 복호화부(210a 또는 210b)로부터 제공받은 APrP (A Priori Probability) 값을 기반으로 복호화를 진행한다. 여기서, 각각의 SISO 복호화부(210a,210b)는 격자도상의 처음상태에서 마지막 상태로 진행해가며 천이 메트릭으로부터 순 방향 상태 메트릭을 구하고 마지막 상태에 도달하면 다시 반대 방향으로 진행하여 가며 역방향 상태 메트릭을 구한다. 이와 같이 구해진 상태 메트릭 값과 천이 메트릭 값을 이용하여 APoP(A Posteriori Probability) 값과 extrinsic probability 값을 계산한다.
결정부(216)는 APoP 값을 이용하여 에러율을 산출하며 이 값이 임계값 이하로 내려갈 경우 복호화를 끝마치고 그렇지 못할 경우 다른 SISO 복호화부(210a 또는 210b)에서 상기와 동일한 과정을 반복한다. 하지만 소정의 반복 이후에도 에러율이 임계값 이하로 내려가지 않으면 복호화기(130)는 피드백 채널을 통하여 부호화기(110)에 추가적인 패리티 데이터를 요청할 수 있다.
도 3은 도 1의 Wyner-Ziv 코딩 기술에서의 채널코드 복호화부(131)의 또 다른 구성을 나타낸 도면이다.
도 3에 도시된 바와 같이 LDPC(Low Density Parity Check Code) 채널코드 복호화기(300)는 LLR(Log Likelihood Ratio) 계산부(301), LDPC 복호화부(302)를 포 함한다. 1963년 MIT의 Robert Gallager에 의해 발명된 LDPC는 부호(code)의 검사 행렬에서 1의 개수가 부호어의 길이에 비해 매우 작기 때문에 검사행렬이 저밀도(low density)가 되며, 섀넌(Shannon)의 이론적 한계에 매우 근접하고 부호화 성능이 탁월한 것으로 알려진 오류정정 부호이다.
LDPC 복호화를 위해서 BP(Belief propagation) 알고리즘이 사용될 수 있다. LDPC 복호화를 위해서는 일반적으로 보조정보(Side Information), 패리티 데이터와 보조정보에 대한 채널 에러 예측 정보가 필요하다. 보조정보는 복원 하고자 하는 원본정보와 유사성을 가진 정보로서 도 3의 LLR 계산부(301)와 LDPC 복호화부(302)에 입력된다.
패리티 데이터는 원본정보를 입력으로 하여 LDPC 채널코딩에 의해 생성된 정보로서 LDPC 채널코드 복호화기(300) 내의 LDPC 복호화부(302)로 입력된다. 보조정보에 대한 채널 에러 예측 정보는 입력되는 보조정보가 원본정보와 닮아 있는 정도의 크기를 수치적으로 나타내는 것으로써 LLR 계산부(301)에 입력된다. 이러한 입력과 함께 LDPC 채널코드 복호화기(300)는 양자화된 WZ픽춰 데이터를 최종 복호화하여 출력한다.
상기 보조정보에 대한 채널 에러 예측 정보는, 보조정보가 조건부 사건으로 주어졌을 때 채널복호화할 값이 '0'이나 '1'이 될 조건부확률,
Figure 112008067810723-pat00001
,
Figure 112008067810723-pat00002
로 표현할 수 있다. 여기서, Y는 보조정보, X는 채널복호화할 값을 나타낸다. 일반적으로 조건부확률 값은 Log Likelihood Ratio(LLR)값의 계산에 필요하므로 LDPC 채널코드 복호화기(300)에 보조정보에 대한 채널 에러 예측정보로써 입력된다. 이 조건부확률 값을 이용하여 LLR은 다음의 수학식 1과 같이 계산될 수 있다. 물론, 수학식 1 이외의 방법으로 LLR을 계산할 수도 있다.
Figure 112008067810723-pat00003
수학식 1과 같이 LLR을 계산하였을 때, LLR=0인 경우에는 X의 비트가 0인지 1인지를 판단하는 불확실성이 가장 큰 상태이며, LLR이 양수이면 X=0이 될 가능성이 크다는 것을, 음수이면 X=1이 될 가능성이 크다는 것을 내포한다.
도 4는 도 1의 Wyner-Ziv 코딩 기술에서, 양자화부(112)의 동작을 보여주는 도면이다.
Wyner-Ziv 코딩 기술을 이한 양자화를 수행하는 종래의 방법은, 주어진 영상의 모든 영역에 대해서 동일한 양자화를 사용하는 것이었다. 통상적으로 영상을 블록단위로 구분한 후 각 블록에 동일한 강도의 양자화를 수행한 후 이를 다시 비 트플레인 단위로 처리한다. 이를 설명하기 위해, 주어진 영상 내 어느 블록인지를 나타내는 블록인덱스와 비트플레인중 어느 비트플레인을 나타내는 비트플레인 인덱스를 사용하여 양자화 결과를 2차원으로 표시한 것이 도 4이다. 일반적으로 양자화는 화소값에 적용될 수도 있고, DCT와 같은 소정의 변환 후 발생하는 변환계수에 적용될 수도 있다. 도 4에서, 블록인덱스는, 변환(transform)을 수행하지 않은 경우는 화소로 구성진 블록들을 가르키는 인덱스를 의미하며, 변환(transform)을 수행한 경우는 (도 1에 변환을 수행하는 블록은 미도시) 변환계수로 구성된 블록들을 가르키는 인덱스를 의미한다. 도 4에서 색이 칠해진 사각형은 양자화 한 후 버려지지 않은 전송이 필요한 비트를 나타내고, 색이 칠해지지 않은 사각형은 양자화 하여 버려진 정보에 해당하는 비트를 나타낸다. 또한 도 4에서 점선으로 둘러싸인 부분은 같이 채널코딩 되는 각 블록들의 비트들로 이루어진 채널코딩 메시지를 나타낸다. 도 4에 나타난 것과 같이 종래의 양자화 방법은, 양자화 강도를 주어진 영상의 모든 영역에 대해서 일정하게 적용하여 비트플레인별로 전송해야 하는 비트의 개수를 동일하게 하는 문제가 있다. 이는 부호화할 모든 비트플레인에 동일한 부호율(code rate)의 채널 코딩 방법을 사용하기 위함이었다.
하지만 실제 비디오 신호는 영상 내에서 영역마다 통계적 특성이 다르므로 종래의 방법과 같이 주어진 영상 전체에 대해 동일 강도의 양자화를 수행하면 부호화 성능 감소가 발생할 수 있다. 예를 들어 부호화가 필요한 영상 내 어떤 영역은 움직임이 심한 물체일 경우도 있으나 경우에 따라 상대적으로 정적인 영역도 많이 있을 수 있기 때문이다.
상기와 같은 기술적 요구에 부응하기 위해, 본 발명은 부호화 및 복호화시 적응 양자화를 수행하여 한정된 자원 및 정보량을 효율적으로 이용하도록 적응 양자화를 수행하고, 채널 코딩을 위해 전송이 불필요한 비트 자리에 사전에 정의된 소정의 비트를 삽입하여 전체적으로 비트율-왜곡 성능을 향상시키는 분산 비디오 부호화/복호화 장치 및 그 방법의 제공을 그 목적으로 한다.
본 발명의 일 측면에 따른 WZ 픽춰와 키 픽춰를 입력받는 분산비디오 부호화 장치는 상기 입력되는 키 픽춰를 부호화하여 출력하는 키픽쳐 부호화부; 상기 입력되는 WZ 픽춰를 소정의 부호화단위로 구분하는 블록단위화부; 상기 구분된 부호화단위 정보를 이용하여 영역별 양자화 강도를 결정하는 적응양자화 처리부; 상기 결정된 적응양자화 강도로 블록단위화부가 출력한 부호화단위 정보에 대하여 양자화를 수행하는 적응 양자화부; 및 상기 양자화된 입력정보에 대하여 채널 부호화하여 패리티를 출력하는 채널코드 부호화부를 포함한다.
본 발명의 다른 측면에 따른 패리티 신호와 부호화된 키 픽춰를 입력받는 분산비디오 복호화 장치는 상기 부호화된 키 픽춰를 복호화하여 출력하는 키픽쳐 복호화부; 상기 복호화된 키 픽춰를 이용하여 보조정보를 생성하는 보조정보 생성부; 보조정보 생성부로부터 입력되는 보조정보를 이용하여 적응역양자화를 위한 영역별 양자화 강도를 결정하는 적응역양자화 처리부; 상기 보조정보 생성부가 생성한 보조정보, 상기 적응역양자화 처리부가 결정한 양자화 강도 및 입력받은 패리티 신호를 이용하여 양자화된 값을 추정하는 채널코드 복호화부; 상기 영역별 양자화 강도와 상기 추정한 양자화된 값을 이용하여 역양자화된 값을 계산하는 적응양자화부; 및 상기 계산된 역양자화된 값과 상기 영역별 양자화 강도와 상기 보조정보를 이용하여 WZ픽춰를 복원하는 영상 복원부를 포함한다.
본 발명에 따른 부호화/복호화 장치 및 그 방법에 따르면 영상의 영역별로 적절한 강도의 양자화를 수행하도록 하여 전체 영상의 비트율-왜곡 (Rate-Distortion)성능의 향상을 얻을 수 있다. 또한 분산 비디오 코딩을 위해서 관심 영역에 대해서 차등적인 양자화를 수행할 수 있다. 본 발명에 따르면 양자화되어 버려져 채널 코딩 하지 않아도 되는 비트 자리 (이하 양자화버림위치라고 하자)에 사전에 정의된 비트를 채우도록 하여 일정 길이의 메시지를 구성함으로써 종래의 문제점을 해결할 수 있다.
또한 본 발명에 따른 부호화/복호화 장치는 다음과 같은 장점들을 제공한다. 먼저, 고정된 채널 코딩 부호율(Code Rate)을 사용하여 채널 부호화 및 복호화가 가능해진다. 둘째로, 적응양자화를 수행 했음에도 불구하고 비트플레인 단위로 메시지를 일정한 길이로 구성할 수 있게 되어 비트플레인 단위 채널 복호화가 가능해 진다. 비트플레인 단위 채널 복호화를 통해서 비트플레인 사이에 존재하는 상관성 정보를 이용할 수 있게 되고 결과적으로 더 적은 비트율로 원본정보를 복원할 수 있다. 셋째로 비트플레인 별로 평균 에러율이 일정하게 유지되어, 군집에러나 메시지의 비트 위치별로 에러율의 분산이 큰 경우 복호화 성능이 감소하는 채널 코딩 방법을 사용하는 분산 비디오 코딩에서도 유리하다. 넷째로 전송하지 않아도 되는 비트에 대해서 사전에 정의된 비트를 채움으로 인해서 부호화기에서 전송해야 하는 비트를 묶은 후 일정 길이의 메시지로 만들고 복호화기에서 복원된 메시지를 재조합하여 비트플레인 단위의 데이터를 재조합하기 위한 작업을 없앨 수 있다.
이하, 본 발명에 따른 적응 양자화를 이용한 분산 비디오 부호화복호화 장치 및 그 방법에 대하여 첨부된 도면을 참조하여 상세히 설명한다.
다양한 영상 특성에 따른 부호화 성능 감소 문제점을 해결하기 위하여 이하 도 5에서 설명하는 바와 같이 영역별로 적응적인 양자화를 수행하여 적정한 비트를 할당하는 Wyner-Ziv 부호화를 위한 적응적 양자화 방법을 이용할 수 있다.
도 5는 본 발명에 따른 Wyner-Ziv 코딩 기술에서의 적응양자화를 수행하는 개념을 나타낸 도면이다.
도 5의 방법을 사용하면 영상의 영역별 특성에 대응하여 적절한 양자화 강도 를 할당할 수 있다. 하지만 이렇게 할 경우 지금까지는 채널 코딩을 위한 메시지의 길이가 비트플레인 단위로 달라져서 기존의 방법대로 동일한 부호율을 가지는 채널 코딩 방법을 사용할 수 없게 되는 문제가 발생하였다. 이 문제를 해결하기 위해, 전송해야 하는 비트들의 위치 정보를 기록한 후 전송해야 하는 모든 비트들을 하나의 비트열로 묶은 후에 묶여진 비트열을 일정 길이로 분해하여 채널 부호화하고 이의 역과정을 통해 채널 복호화를 수행할 수 있다.
하지만 이 방법은 부호화와 복호화를 위해 비트들의 정렬 과정이 빈번히 요구되는 단점이 있다. 또한 서로 다른 비트플레인들의 비트들을 하나로 합치게 되는 경우가 발생하는데 이렇게 하면 채널 코딩하고자 하는 메시지 내에서 채널 에러율의 분산이 커지는 문제가 발생한다. 그리고 채널 에러율의 분산이 크거나 군집에러에 의해 성능감소를 보일 수 있는 채널 코딩 방법을 사용할 경우 성능 감소가 발생할 수 있다. 또한 비트들을 하나로 합친 후 분해하면 비트플레인 단위로 복호화가 이뤄질 수 없어지고 상호 정보를 이용할 수 없게 되어 복호화시 더 많은 패리티 데이터를 요구하는 문제가 발생한다.
따라서 이하 설명하는 바와 같이 영상의 영역별로 적응적인 양자화를 수행할 수 있게 하면서도 고정 길이 부호율의 채널 코딩 방법을 사용할 수 있고 비트플레인 단위로 채널 코딩을 처리할 수 있는 기술이 더 필요하다.
도 6은 본 발명에 따른 분산 비디오 부호화 및 이에 상응하는 분산 비디오 복호화 장치의 구성을 도시한 도면이다.
도 6을 참조하여 설명하면, 본 발명에 따른 분산 비디오 부호화기(610)는 블록 단위화부(611), 적응 양자화부(612), 채널코드 부호화부(613), 키픽춰 부호화부(614) 및 적응양자화처리부(615)를 포함한다. 상기 분산 비디오 부호화기(610)에 상응하는 분산 비디오 복호화기(630)는 채널코드 복호화부(631), 영상복원부(632), 키픽춰 복호화부(633), 보조정보 생성부(634), 적응역양자화 처리부(635) 및 적응역양자화부(636)를 포함한다.
키픽춰 부호화부(614)는 키픽춰를 입력받고, 이로부터 키픽춰를 부호화한다. 반면 키픽춰 복호화부(633)는 키픽춰 부호화부(614)로부터 전송받은 정보를 이용하여 키픽춰를 복원한다. 보조정보 생성부(634)는 복원된 키픽춰들을 이용하여 복원할 현재 WZ픽춰에 대한 보조정보를 생성한다.
부호화기(610)의 블록단위화부(611)는 입력되는 WZ픽춰를 소정의 부호화단위로 구분한다.
적응양자화 처리부(615)는 WZ픽춰 입력정보와 블록단위화부(611)가 출력한 부호화단위 정보를 이용하여 적응양자화를 위한 영역별 양자화 강도를 결정한다. 또한, 적응양자화 처리부(615)는 WZ픽춰 입력정보와 블록단위화부(611)의 부호화단위 정보와 분산 비디오 복호화기(630)에 포함된 적응역양자화 처리부(635)와 통신을 수행하여 받은 추가 정보를 이용하여 영역별 양자화 강도를 결정할 수도 있다.
반면 복호화기(630)에 포함된 적응역양자화 처리부(635)는 보조정보 생성부(634)로부터 입력되는 보조정보 및 분산 비디오 부호화기(610)에 존재하는 적응양자화 처리부(615)로부터 전달되는 정보를 이용하여 복호화시 적응역양자화를 위 한 영역별 양자화 강도를 결정한다.
상기 적응양자화 처리부(615)와 적응역양자화 처리부(635)는 양자화강도를 결정하기 위해서 다음과 같은 모드들을 제공할 수 있다. 먼저, 부호화기(610) 측에서 양자화강도를 결정하여 이 값을 부호화기(610)에서 사용하고 이를 복호화기(630)로 전송하여 복호화기(630)에서도 사용하도록 하는 모드가 존재한다. 또한 복호화기(630) 측에서 양자화강도를 결정하여 이 값을 복호화기(630)에서 사용하고, 양자화강도를 부호화기(610)로 전송하여 부호화기(610)에서도 사용하는 모드가 존재한다. 마지막으로, 부호화기(610)와 복호화기(630)가 동시에 상호 정보를 교환하여 양자화강도를 결정하고, 이 값을 부호화기(610)와 복호화기(630)가 동시에 사용할 수 있는 모드도 가능하다.
부호화기(610)의 적응양자화부(612)는 선택된 방법에 따라 결정된 양자화 강도로 블록단위화부(611)로부터 출력된 부호화단위 정보에 대하여 양자화를 수행한다.
채널코드 부호화부(613)는 적응양자화된 정보와 양자화 강도 정보를 입력 받고 채널 부호화하여 패리티를 생성하는 과정을 수행한다. 이때 적응양자화가 수행되므로 채널코드 부호화부(613)에서는 입력된 비트가 도 5에서 기술한 바와 같이 일정한 길이를 갖지 않고 전송해야 하는 비트와 전송하지 않아도 되는 비트가 섞이게 된다.
이에 대응하기 위해 본 발명에서는 전송해야 하는 비트는 그대로 두고 전송하지 않아도 되는 비트가 위치하는 비트를 강제로 사전에 정의된 비트를 채우는 과 정을 수행한다. 이와 같은 과정을 취하더라도 전송해야하는 비트율 측면에서는 이득이 있는 이유는 후술된다.
분산 비디오 복호화기(630)의 채널코드 복호화부(631)는 보조정보 생성부(634)로부터 입력받은 보조정보와 분산 비디오 부호화 장치(610)로부터 전송받은 패리티 비트, 양자화 강도 정보를 이용하여 양자화된 값들을 추정한다.
적응역양자화부 (636)는, 적응역양자화 처리부(635)를 통해 제공되는 양자화 강도를 사용하여, 채널코드 복호화부(631)를 통해 추정된 양자화된 값들을 역양자화하여 출력한다.
그리고 영상복원부(632)는 적응역양자화부 (636)에 의해 출력된 역양자화된 값과 보조정보와 양자화 강도를 이용하여 WZ픽춰를 복원하는 역할을 수행한다.
도 6의 채널코드 복호화부(631)는 채널코드 복호화를 수행해가며 신뢰도 있는 양자화된 값을 추정할 수 없다고 판별될 경우에, 신뢰도 있는 추정이 가능할 때까지 소정의 한도 내에서 계속적으로 패리티 비트를 분산 비디오 부호화기(610)에 요청하여 수신한다.
이 경우, 복호화에 필요한 패리티량만을 분산 비디오 부호화기(610)로부터 전송받기 때문에 비트율 감소측면에서 효율적이라는 장점이 있다. 이와 같은 과정은 패리티 비트를 요청하는 역방향채널(피드백채널)이 존재할 경우에만 가능하다.
이러한 문제를 완화하기 위해 사용자의 구성에 따라 미리 소정의 패리티 비트량을 매번 패리티를 요청하지 않고 패리티를 한 번에 채널코드 복호화부(631)가 수신하도록 구성하여 역방향채널로 패리티를 요청하지 않도록 구성할 수도 있다.
또한 요청하여 수신한 패리티 비트에 대한 정보를 모두 소진한 후에도 신뢰도가 낮다고 판단된 경우 채널코드 복호화부(631)는 추가로 패리티 비트에 대한 정보를 더 요청하도록 구성할 수도 있다.
또한 역방향 채널을 사용하지 않는다고 가정하고 분산 비디오 부호화기(610)는 미리 설정된 일정량의 패리티를 항상 복호화기(630)에 보내며 복호화기(630)는 패리티 비트를 요구하지 않는 형태로 구성될 수도 있다.
또한 도 6의 채널코드 복호화부(631)에서 사용하는 채널코드는 Shannon 한계에 거의 도달한다고 밝혀진 터보코드를 사용하거나 LDPC 채널코드를 사용하는 것이 바람직하다. 이외에도, 당업자는 부호화효율과 에러정정이 좋은 여타의 채널코드를 사용할 수 있음을 용이하게 생각할 수 있다.
도 7은 적응양자화된 비트들을 LDPC 부호화하기위한 LDPC 부호화기의 구성을 나타낸 도면이다.
도 7에 도시된 바와 같이 LDPC 채널코드 부호화기(700)는 비트 처리부(701)와 LDPC 부호화부(702)를 포함할 수 있다.
LDPC 부호화기(700)에는 WZ픽춰를 양자화한 정보와 영역별 양자화 강도 정보가 입력된다. 입력된 정보를 이용하여 비트 처리부(701)에서는 양자화된 WZ픽춰와 영역별 양자화 강도를 입력받아, 양자화된 WZ픽춰 데이터중 양자화버림위치의 비트들의 자리를, 사전에 정의된 소정의 '0'이나 '1'의 값으로 채운다. 이렇게 양자화된 WZ 픽춰는 LDPC 부호화부(702)에 의하여 채널 부호화 되어 패리티 데이터가 생 성된다.
도 8은 보조 정보를 사용하여 패리티 데이터를 채널코드 복호화하는 LDPC 채널코드 복호화기의 구성을 나타낸 도면이다.
도 8에 도시된 바와 같이 LDPC 채널코드 복호화기(800)는 LLR 계산부(801)와 LDPC 복호화부(802)를 포함할 수 있다.
LDPC 복호화부(802)는 패리티, 보조정보, 보조정보에 대한 채널 에러 예측값 및 영역별 양자화 강도 정보를 입력 받는다. 또한, LDPC 복호화부(802)는 입력된 신호에 대하여 LDPC 복호화를 수행하여, 복원된 양자화된 WZ픽춰 데이터를 출력한다.
상기 기술한 바와 같이 전송해야 하는 비트는 그대로 두고, 양자화버림 위치에 사전에 정의된 소정의 '0'이나 '1'의 비트를 채워 WZ픽춰 부호화를 수행하더라도 비트율 측면에서 유리하다. 그 이유는 다음과 같다. 채널코드 복호화부는 또는 더욱 구체적으로 LDPC 채널코드 복호화기(800)는 상기 기술했듯이 복호화 하고자 하는 비트들의 채널 에러 예측 정보를 입력받는다. 상기 채널 에러 예측 정보에 따라서, 에러가 적다고 예측된 비트는 복호화 시에 가중치를 크게 하고 에러가 많다고 예측된 비트는 상대적으로 가중치 값을 작게 한다. 이때 채널 에러 예측 정보는 복호화할 원 정보와 보조정보와의 실제 상호관계를 정확히 알 수 없으므로 정확한 값은 아니다. 이런 이유로 인해서 실제 비디오에 적용할 경우, 이상적인 복호화 경우에 비해 더 많은 패리티를 요구하게 된다.
그러나 본 발명을 사용할 경우 양자화버림위치에 사전에 미리알고 있는 소정의 '0' 이나 '1'을 채웠다는 것을 복호화기에서 미리 알 수 있으므로, 이 위치에서의 복호화 비트 정보에 대해서는 100% 신뢰도를 확보할 수 있다. 복호화기는 양자화버림위치 정보를 영역별 양자화 강도를 참조하여 알 수 있다. 일반적으로 100% 처럼 신뢰도가 높은 비트가 많을수록 LDPC와 같은 채널 코드 복호화가 더욱 정확해지고 복호화 속도도 빨라진다.
예를 들어, BP(Belief Propagation) 복호화 알고리즘을 사용하는 LDPC 복호화의 예를 생각하면 초기에 입력된 LLR값은 BP 알고리즘의 전파가 진행될수록 그 값의 갱신이 발생하는데, 미리 알고 있는 양자화버림위치의 비트들은 신뢰성이 높기 때문에 초기 LLR 값이 반복적인 연산에도 불구하고 적은 변화를 겪는다. 따라서 이러한 비트들이 LDPC 복호화 자체를 더욱 빠르고 정확히 진행되도록 주변에 영향을 준다.
이처럼 양자화버림위치를 사전에 정의된 소정의 비트값으로 채워 복호화시에 활용하는 것이 비트율의 절감에 영향을 주는 이유는 평균 채널 에러 관점에서도 타당하다. 일반적으로 채널 코딩의 복호화기는 보조정보와 원 정보 사이에 차이가 적을수록 평균 에러가 적고, 에러가 적은 보조정보를 입력받을수록 적은 패리티 데이터를 이용하여 에러를 완벽히 제거할 수 있다. 반면 평균 에러의 양이 많을수록 완벽한 복호를 위해 많은 패리티를 요구한다.
그런데 부호화기에서 양자화버림위치를 사전에 정의된 소정의 '0'이나 '1'로 채워, 해당 위치에 대해서는 에러가 전혀 없음을 보장할 수 있기 때문에 강제로 사 전에 정의된 정보를 삽입한 비트가 많을수록 평균에러가 감소하게 된다. 따라서 이런 경우 적은 패리티 데이터를 전송받음에도 불구하고 완벽한 복호화가 가능하다.
단, 상기의 방법에서 고려할 점은 강제로 '0'이나 '1'로 채워진 비트에 대해서는 원 정보를 표현하는 정보, 즉 패리티 데이터를 전송하지 않기 때문에 정보의 왜곡(distortion)이 발생할 수도 있다. 이 정보의 왜곡은 양자화를 수행하여 정보를 버리는 데서 기인하는 것이므로 이를 최소화하도록 영역별 양자화 강도를 결정하여야 한다.
도 8의 LLR 계산부(801)는 양자화버림위치를 파악하기 위하여 영역별 양자화 강도를 참조한다. 양자화버림위치가 아닌 비트들에 대해서는 보조정보에 대한 채널 에러 예측값을 사용하여 LLR을 계산하고 양자화버림위치의 비트에 대해서는 신뢰성 100%를 표현하는 LLR을 사용할 수 있다. 단, 신뢰성 100%에 대한 LLR은 절대값이 무한대이므로 수학적 계산이 가능한 적정값으로 수정될 수 있다.
도 9는 도 6의 분산 비디오 부호화기에 포함된 적응양자화 처리부의 제1 실시예를 나타낸 도면이다.
도 9에 도시된 바와 같이 적응양자화 처리부는 영역 설정부(901)와 양자화강도 계산부(902)를 포함할 수 있다.
영역 설정부(901)는 입력된 WZ픽춰 정보를 분석하여 하나 또는 복수개의 영역으로 WZ픽춰를 구분한다. 이때 영역은 같은 양자화 강도값을 공유할 WZ 픽춰의 부분집합이다. 바림직하게는 영역을 관심영역과 비관심 영역으로 구분할 수 있다.
여기서 관심영역은 해당 영상의 중요한 부분을 나타내는 곳으로써, 예를 들면, 인물과 배경을 함께 한 영상에서 인물부분을 의미한다. 반면 비관심영역은 배경부분으로 설정할 수 있다. 물론, 응용되는 상황에 따라 관심영역과 비관심영역을 반대로 설정할 수도 있다.
다른 바람직한 영역 설정 방법으로 소정의 율-왜곡 최적화 관점에서 동일한 양자화 강도를 갖는 연속된 블록들을 동일 영역으로 설정하는 방법이 있다. 이는 동일 강도로 적응양자화를 수행하는 영역의 기본 크기가 작을수록 양자화 강도 전송에 의한 비트율 증가가 발생하나 양자화가 영역별로 적응적으로 수행되고, 반대로 영역의 기본 크기가 커질수록 양자화에 대한 정보 전송에 드는 비트율은 감소하나 양자화가 영역별로 적응적이지 못하게 되므로, 소정의 율-왜곡 관계를 이용하여 최적의 영역 설정을 하도록 하는 것이다.
또한, 영역설정은 미리 입력된 알고리즘을 사용하여 자동 계산하여 설정되도록 하거나, 외부에서 사용자의 수동 입력에 의하여 설정되도록 할 수도 있다. 이렇게 사용자의 수동 입력에 의하여 영역 설정이 되고, 사용자의 외부 입력에 의하여 양자화 강도가 정해지는 경우, 적응양자화 처리부는 WZ픽춰 정보를 입력받지 않아도 동작되도록 구성될 수 있다.
또한 영역설정부(901)에 의해 설정된 영역의 위치, 크기, 모양 등 영역들의 공간상의 정의를 지시하는 정보는 복호화장치로 시그널링된다. 그러나 사전에 정 의된 일정한 패턴으로 영역(들)을 설정하는 경우는 복호화장치로 시그널링하지 않도록 구성할 수도 있다.
영역 설정부(901)의 또 다른 구현 예에서는, 영역설정을 복호화기(630)가 수행한 후, 이를 거꾸로 부호화장치로 전송하도록 할 수 있다. 이 경우에는 영역 설정부(901)는 WZ픽춰 정보를 분석하여 영역을 설정할 필요 없이, 복호화기(630)가 제공한 영역정보를 이용하여 영역을 설정한다.
양자화 강도 계산부(902)는 입력된 WZ 픽춰의 특성을 참조하여 양자화 강도를 계산한다. 또는 양자화 강도 계산부(902)는 비트율-왜곡 관점에서 우수한 성능을 보일 수 있는 양자화 강도를 계산하도록 할 수도 있다. 또는 양자화 강도 계산부(902)는 외부에서 입력된 외부의 양자화 강도 값을 그대로 사용하도록 할 수도 있다.
또한 응용에 따라서는, 양자화 강도 계산부(902)는 복호화기(630)에서 계산된 양자화 강도를 수신 받아서 이를 참조하여 양자화 강도를 계산하도록 할 수 있다. 이렇게 구현되는 실시예가 도 10에 나타나 있다.
도 10은 도 6의 분산 비디오 부호화기에 포함된 적응양자화 처리부의 제2 실시예를 나타낸 도면이다.
도 10에 도시된 적응양자화 처리부(1000)의 양자화 강도 계산부(1002)는 복호화기(630)가 제공한 양자화 강도 값을 참조하여 양자화 강도를 계산할 수 있다. 또 다른 방법으로는 복호화기(630)와 부호화기(610)가 상호 협력하여 양자화 강도를 같이 정하도록 할 수도 있다.
적응 양자화 처리부(900, 1000)가 계산한 영역별 양자화 강도는 부호화기(610)가 사용하고, 복호화기(630)로 전송된다. 복호화기(630)에서도 영역별로 부호화기(610)와 동일한 양자화강도를 사용한다.
그리고 구현예에 따라 복호화기(630)가 양자화 강도를 계산하여 이를 사용하고, 계산된 양자화 강도를 부호화기(610)로 전송할 수도 있다. 이 경우 일반적으로 부호화기(610)와 복호화기(630)가 동일한 값을 양자화강도로 사용한다. 마찬가지로 부호화기(610)와 복호화기(630)가 상호 협력하여 양자화 강도를 계산하는 경우에도 최종 계산된 양자화 강도는 부호화기(610)와 복호화기(630)에서 서로 동일하다.
일반적으로 동일 영역에 대하여 부호화기(610)에서 계산된 양자화 강도와, 해당 영역에 대하여 복호화기(630)가 사용하는 양자화 강도는 동일한 값인 것이 바람직하다. 그러나, 응용에 따라 다른 값을 사용하는 것도 가능하다.
도 11은 도 6의 분산 비디오 복호화기에 포함된 적응역양자화 처리부의 제1 실시예를 나타낸 도면이다.
적응역양자화 처리부(1100)는 영역설정부(1101)와 역양자화 강도 계산부(1102)를 포함한다.
적응역양자화 처리부(1100)의 영역설정부(1101)는 적응역양자화를 수행하는 영역을 설정한다. 즉, 동일한 양자화강도를 공유할 하나 또는 복수개의 영역들을 설정하는 것이다.
설정할 영역에 대한 정보는 부호화기(610)로부터 소정의 시그널링을 통해 전송받도록 할 수 있다. 경우에 따라서는 영역설정 정보를 부호화기(610)로부터 제공 받지 않고 복호화기(630) 자체에서 설정한 후, 이를 거꾸로 부호화기(610)로 제공할 수도 있다. 이를 위해 도 11의 영역설정부(1101)는 보조정보를 분석함으로써 사용할 영역들을 설정할 수 있다. 또는 사전에 정해진 일정한 설정패턴을 이용하도록 구성할 수도 있다. 적응 양자화 처리부(900, 1000)와 마찬가지로, 사용할 양자화강도를 외부로부터 입력받아 사용할 수도 있다.
도 12는 도 6의 분산 비디오 복호화기에 포함된 적응역양자화 처리부의 제2 실시예를 나타낸 도면이다.
도 12에 도시된 적응역양자화 처리부(1200)는 도 11의 적응역양자화 처리부(1100)와 비교할 때 부호화기(610)가 제공하는 양자화 강도를 입력받는 기능을 더 포함한다.
결론적으로 도 12의 적응역양자화 처리부(1200)는 부호화기(610)와의 통신을 수행하여 부호화기(610)의 양자화 강도 정보를 제공받아 복호화기(630)의 양자화 강도를 계산할 수 있다. 또한, 적응역양자화 처리부(1200)는 복호화기(630)가 사용하는 양자화 강도 정보를 부호화기(610)에 제공하여 부호화기(610)로 하여금 양자화 강도를 계산할 수 있도록 할 수 있다.
도 13은 관심 영역에 대하여 적응양자화를 이용한 분산 비디오 부호화 하는 효과를 설명하기 위한 도면이다.
도 13의 영상에는 영역 1과 영역 2가 표시되어 있다. 영역 2는 사람의 얼굴 을 주로 포함하고 있으며, 영역 1은 전체 영상에서 영역 2를 제외한 부분으로써, 주로 배경을 포함한다.
이 때 영역 2를 관심영역으로, 영역 1을 비관심 영역으로 설정하면, 관심영역에 대해서는 양자화 강도를 작게 하여 많은 비트를 할당하고, 이를 통해 화질을 더욱 좋게 할 수 있다. 또한 비관심영역에 대해서는 다소 화질이 열화되어도 무방하므로 상대적으로 큰 양자화 강도를 사용하여 적은 비트를 할당하여 압축효과를 극대화할 수 있다.
도 13에서는 관심의 정도에 따라 전체 영상을 두 가지의 영역, 즉 관심영역과 비관심영역으로 구분하였다. 그러나 당업자라면 관심의 정도에 따라 전체 영상을 두 가지가 아닌 복수개로 구분할 수도 있다.
또한 상기 실시예에서 관심 영역은 비관심 영역에 대해 상대적으로 약한 양자화를 적용하였으나 그 반대의 상황도 충분히 생각할 수 있다. 예를 들어 정보를 숨기고자 하는 관심 영역에 대해서는 보다 강한 양자화를 수행하여 정보의 전송량을 강제로 줄일 수 있는 것이다.
이와 관련된 또 다른 실시예로써 도로 과속 단속 카메라에 본 발명의 기술을 사용하는 경우 차량 운전자의 얼굴에 해당하는 관심영역에 대해서는 약한 양자화를 수행하여 많은 정보를 포함하게 하고 차량 보조석에 앉은 동행자의 얼굴에 해당하는 관심영역에 대해서는 강한 양자화를 수행하여 적은 정보를 포함하게 하는 것도 가능하다.
뿐만 아니라 도 13의 영상에 도시된 바와 같이 관심 영역을 반드시 직사각형으로 설정할 필요는 없다. 관심 영역은 사각형뿐만 아니라 일반적인 다각형, 도형이 될 수 있다. 관심 영역 설정의 정확성 또는 그 효율성에 따라 관심 영역을 구분하는 도형은 다양할 수 있다.
상기와 같이 본 발명의 바람직한 실시예에 따른 분산 비디오 코딩기술에서의 적응양자화 방법 및 그 장치에 대하여 설명하였으나 여러 가지 변형이 본 발명의 요지를 벗어나지 않는 범위의 다른 실시예가 존재할 수 있다. 따라서, 본 발명의 범위는 위에서 설명된 실시예에 의하여 정할 것이 아니고 아래 청구범위 및 그에 대한 해석을 통하여 정해져야 한다.
도 1은 종래의 Wyner-Ziv 코딩 기술에 따른 부호화기(110)와 이에 상응하는 복호화기(130)의 구성을 도시한 도면.
도 2는 도 1의 Wyner-Ziv 코딩 기술에서의 채널코드 복호화부(131)의 세부 구성을 도시한 도면.
도 3은 도 1의 Wyner-Ziv 코딩 기술에서의 채널코드 복호화부(131)의 또 다른 구성을 나타낸 도면.
도 4는 도 1의 Wyner-Ziv 코딩 기술에서, 양자화부(112)의 동작을 보여주는 도면.
도 5는 번 발명에 따른 Wyner-Ziv 코딩 기술에서의 적응양자화를 수행하는 개념을 나타낸 도면.
도 6은 본 발명에 따른 분산 비디오 부호화 및 이에 상응하는 분산 비디오 복호화 장치의 구성을 도시한 도면.
도 7은 적응양자화된 비트들을 LDPC 부호화하기위한 LDPC 부호화기의 구성을 나타낸 도면.
도 8은 보조 정보를 사용하여 패리티 데이터를 채널코드 복호화하는 LDPC 채널코드 복호화기의 구성을 나타낸 도면.
도 9는 도 6의 분산 비디오 부호화기에 포함된 적응양자화 처리부의 제1 실시예를 나타낸 도면.
도 10은 도 6의 분산 비디오 부호화기에 포함된 적응양자화 처리부의 제2 실 시예를 나타낸 도면.
도 11은 도 6의 분산 비디오 복호화기에 포함된 적응역양자화 처리부의 제1 실시예를 나타낸 도면.
도 12는 도 6의 분산 비디오 복호화기에 포함된 적응역양자화 처리부의 제2 실시예를 나타낸 도면.
도 13은 관심 영역에 대하여 적응양자화를 이용한 분산 비디오 부호화 하는 효과를 설명하기 위한 도면.
<도면의 주요 부분에 대한 부호의 설명>
610 : 분산 비디오 부호화 장치 611 : 블록 단위화부
612 : 적응 양자화부 613 : 채널코드 부호화부
614 : 키픽춰 부호화부 615 : 적응양자화 처리부
630 : 분산 비디오 부호화 장치 631 : 채널코드 복호화부
632 : 영상 복원부 633 : 키픽춰 복호화부
634 : 보조정보 생성부 635 : 적응양자화 처리부

Claims (14)

  1. WZ 픽춰와 키 픽춰를 입력받는 분산비디오 부호화 장치에 있어서,
    상기 입력되는 키 픽춰를 부호화하여 출력하는 키픽쳐 부호화부;
    상기 입력되는 WZ 픽춰를 소정의 부호화단위로 구분하는 블록단위화부;
    상기 구분된 부호화단위 정보를 이용하여 영역별 양자화 강도를 결정하는 적응양자화 처리부;
    상기 결정된 적응양자화 강도로 블록단위화부가 출력한 부호화단위 정보에 대하여 양자화를 수행하는 적응양자화부; 및
    영역별 양자화 강도를 참조하여 상기 양자화된 입력정보의 양자화 버림 위치를 소정의 비트들로 채운 다음, 양자화된 입력정보를 채널 부호화하며 패리티를 산출하는 채널코드 부호화부를 포함하는 분산 비디오 부호화 장치.
  2. 청구항 1에 있어서, 상기 채널코드 부호화부는 상기 분산 비디오 부호화 장치에 상응하는 분산 비디오 복호화 장치로부터 요청에 응답하여 패리티 비트를 전송하는 것을 특징으로 하는 분산 비디오 부호화 장치.
  3. 청구항 1에 있어서, 상기 채널코드 부호화부는 상기 분산 비디오 부호화 장치에 상응하는 분산 비디오 복호화 장치에 대해 항상 패리티 비트를 전송하는 것을 특징으로 하는 분산 비디오 부호화 장치.
  4. 청구항 1에 있어서, 상기 적응양자화 처리부는 상기 분산 비디오 부호화 장치에 상응하는 분산 비디오 복호화 장치로부터 역양자화에 관하여 피드백되는 추가 정보를 수신하고, 상기 구분된 부호화단위 정보 및 상기 추가 정보를 이용하여 영역별 양자화 강도를 결정하는 것을 특징으로 하는 분산 비디오 부호화 장치.
  5. 청구항 1에 있어서, 상기 적응양자화 처리부는
    같은 양자화 강도를 공유할 하나 이상의 영역으로 WZ 픽춰를 구분하는 영역 설정부; 및
    각각의 구분된 영역에 적용할 영역별 양자화 강도를 산출하는 양자화 강도 계산부를 포함하는 것을 특징으로 하는 분산 비디오 부호화 장치.
  6. 청구항 5에 있어서, 상기 양자화 강도 계산부는 상기 분산 비디오 부호화 장치에 상응하는 분산 비디오 복호화 장치로부터 제공된 양자화 강도를 기초로 각각의 구분된 영역에 적용할 영역별 양자화 강도를 산출하는 것을 특징으로 하는 분산 비디오 부호화 장치.
  7. 채널코드 부호화된 양자화 값, 패리티와 부호화된 키 픽춰를 입력받는 분산 비디오 복호화 장치에 있어서,
    상기 부호화된 키 픽춰를 복호화하여 출력하는 키픽쳐 복호화부;
    상기 복호화된 키 픽춰를 이용하여 보조정보를 생성하는 보조정보 생성부;
    적응역양자화를 위한 영역별 양자화 강도를 결정하는 적응역양자화 처리부;
    채널코드 부호화된 양자화 값을 채널코드 복호화하고, 상기 보조정보 생성부가 생성한 보조정보, 상기 적응역양자화 처리부가 결정한 영역별 양자화 강도 및 입력받은 패리티를 이용하여, 채널코드 복호화된 양자화 값으로부터 양자화 버림 위치에 채워진 소정의 비트들을 제외함으로써 본래의 양자화 값을 추정하는 채널코드 복호화부;
    상기 영역별 양자화 강도와 상기 추정된 양자화 값을 이용하여 역양자화된 값을 계산하는 적응역양자화부; 및
    상기 계산된 역양자화된 값과 상기 영역별 양자화 강도와 상기 보조정보를 이용하여 WZ픽춰를 복원하는 영상 복원부를 포함하는 분산 비디오 복호화 장치.
  8. 청구항 7에 있어서, 상기 채널코드 복호화부는
    특정 영역의 영역별 양자화 강도에 따라 양자화 버림 위치를 추정하고,
    채널코드 복호화된 양자화 값의 비트플레인에서 추정된 양자화 버림 위치에 상응하는 비트들을 제외하여 본래의 양자화 값을 추정하는 것을 특징으로 하는 분산 비디오 복호화 장치.
  9. 청구항 7에 있어서, 상기 채널코드 복호화부는
    특정 영역의 영역별 양자화 강도에 따라 추정된 양자화 버림 위치의 비트에 기초하여 또는 보조정보에 기초하여 채널 에러 예측값을 결정하고,
    결정된 채널 에러 예측값에 기초하여 필요한 양의 패리티 비트를 상기 분산 비디오 복호화 장치에 상응하는 분산 비디오 부호화 장치에 요청하는 것을 특징으로 하는 분산 비디오 복호화 장치.
  10. 청구항 7에 있어서, 상기 채널코드 복호화부는 상기 분산 비디오 복호화 장치에 상응하는 분산 비디오 부호화 장치로부터 항상 패리티 비트를 수신하는 것을 특징으로 하는 분산 비디오 복호화 장치.
  11. 청구항 7에 있어서, 상기 적응역양자화 처리부는 상기 분산 비디오 복호화 장치에 상응하는 분산 비디오 부호화 장치로부터 양자화 강도에 관하여 전송되는 추가 정보를 수신하고, 상기 추가 정보를 이용하여 영역별 양자화 강도를 결정하는 것을 특징으로 하는 분산 비디오 복호화 장치.
  12. 청구항 7에 있어서, 상기 적응역양자화 처리부는 상기 보조정보 생성부로부터 입력되는 보조정보를 이용하여 적응역양자화를 위한 영역별 양자화 강도를 결정하는 것을 특징으로 하는 분산 비디오 복호화 장치.
  13. 청구항 7에 있어서, 상기 적응역양자화 처리부는
    같은 양자화 강도를 공유할 하나 이상의 영역을 설정하는 영역 설정부; 및
    각각의 구분된 영역에 적용할 영역별 양자화 강도를 산출하는 역양자화 강도 계산부를 포함하는 것을 특징으로 하는 분산 비디오 복호화 장치.
  14. 청구항 13에 있어서, 상기 역양자화 강도 계산부는 상기 분산 비디오 복호화 장치에 상응하는 분산 비디오 부호화 장치로부터 제공된 양자화 강도를 기초로 각각의 구분된 영역에 적용할 영역별 양자화 강도를 산출하는 것을 특징으로 하는 분산 비디오 복호화 장치.
KR20080094709A 2008-09-26 2008-09-26 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법 KR101511230B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR20080094709A KR101511230B1 (ko) 2008-09-26 2008-09-26 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법
US12/585,835 US8259798B2 (en) 2008-09-26 2009-09-25 Distributed video encoder and decoder and distributed video decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20080094709A KR101511230B1 (ko) 2008-09-26 2008-09-26 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20100035364A KR20100035364A (ko) 2010-04-05
KR101511230B1 true KR101511230B1 (ko) 2015-04-13

Family

ID=42057466

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20080094709A KR101511230B1 (ko) 2008-09-26 2008-09-26 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법

Country Status (2)

Country Link
US (1) US8259798B2 (ko)
KR (1) KR101511230B1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008240343B2 (en) * 2008-10-31 2012-04-19 Canon Kabushiki Kaisha Rate-distortion control in DVC with no feedback
KR101311410B1 (ko) * 2011-10-21 2013-09-25 성균관대학교산학협력단 픽쳐 그룹의 구조를 변화시키는 분산 비디오 부호화/복호화 방법 및 이러한 방법을 수행하는 장치
KR101307469B1 (ko) * 2012-05-29 2013-09-12 서울대학교산학협력단 비디오 인코더, 비디오 디코더, 비디오 인코딩 방법 및 비디오 디코딩 방법
US9462283B2 (en) * 2013-04-18 2016-10-04 Spotlight Technologies Ltd. Efficient compression of Bayer images
KR102161741B1 (ko) 2013-05-02 2020-10-06 삼성전자주식회사 HEVC(high efficiency video coding)에서 코딩 유닛에 대한 양자화 파라미터를 변화시키는 방법과 장치, 및 시스템
CN110839109B (zh) 2014-05-23 2022-02-25 三星电子株式会社 用于提供通知的方法和设备
CN105338352B (zh) * 2014-07-24 2019-04-19 华为技术有限公司 一种视频编码中自适应反量化方法及装置
WO2016035367A1 (ja) * 2014-09-03 2016-03-10 オリンパス株式会社 復号装置、撮像システム、復号方法、符号化復号方法、及び復号プログラム
JP5876201B1 (ja) * 2014-09-03 2016-03-02 オリンパス株式会社 復号装置、撮像システム、復号方法、符号化復号方法、及び復号プログラム
US10548158B2 (en) * 2016-03-10 2020-01-28 Huawei Technologies Co., Ltd. Message passing algorithm decoder and methods
KR20190019925A (ko) * 2016-07-14 2019-02-27 삼성전자주식회사 영상을 부호화/복호화 하는 방법 및 그 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050013500A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Intelligent differential quantization of video coding
US20080031344A1 (en) * 2006-08-04 2008-02-07 Microsoft Corporation Wyner-Ziv and Wavelet Video Coding

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8446949B2 (en) * 2008-06-23 2013-05-21 Sungkyunkwan University Foundation For Corporate Collaboration Distributed coded video decoding apparatus and method capable of successively improving side information on the basis of reliability of reconstructed data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050013500A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Intelligent differential quantization of video coding
US20080031344A1 (en) * 2006-08-04 2008-02-07 Microsoft Corporation Wyner-Ziv and Wavelet Video Coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J. Zhang, et al. A Transform Domain Classification Based Wyner-Ziv Video Codec. IEEE International Conf. on Multimedia and Expo 2007. Jul. 2007, pp.144-147 *
J. Zhang, et al. A Transform Domain Classification Based Wyner-Ziv Video Codec. IEEE International Conf. on Multimedia and Expo 2007. Jul. 2007, pp.144-147*

Also Published As

Publication number Publication date
US20100080289A1 (en) 2010-04-01
US8259798B2 (en) 2012-09-04
KR20100035364A (ko) 2010-04-05

Similar Documents

Publication Publication Date Title
KR101511230B1 (ko) 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법
Brites et al. Evaluating a feedback channel based transform domain Wyner–Ziv video codec
WO2012072637A1 (en) Method and device for correlation channel estimation
JP4819024B2 (ja) 画像符号化・復号化方法及びシステム
Brites et al. An efficient encoder rate control solution for transform domain Wyner–Ziv video coding
KR20040026050A (ko) 미세단위 신축형 부호화 및 복호화 장치와 방법
US20100166057A1 (en) Differential Data Representation for Distributed Video Coding
US20110268186A1 (en) Encoding/decoding system using feedback
US8446949B2 (en) Distributed coded video decoding apparatus and method capable of successively improving side information on the basis of reliability of reconstructed data
KR100915097B1 (ko) 오류정정을 이용한 분산비디오부호화 영상의 복호화 장치및 그 방법
JP5004877B2 (ja) 画像符号化器及び画像復号化器及び画像符号化方法及び画像復号化方法及びプログラム
KR101639434B1 (ko) 와이너-지브 부호화 및 복호화 시스템 및 방법
KR101035746B1 (ko) 동영상 인코더와 동영상 디코더에서의 분산적 움직임 예측 방법
KR101103974B1 (ko) 분산 비디오 부호화/복호화 방법 및 분산 비디오 부호화/복호화 장치
Weerakkody et al. Enhanced reconstruction algorithm for unidirectional distributed video coding
Morbee et al. Reduced decoder complexity and latency in pixel-domain Wyner–Ziv video coders
Kodavalla et al. Distributed video coding: feedback-free architecture and implementation
Chien et al. Transform-domain distributed video coding with rate–distortion-based adaptive quantisation
KR101307469B1 (ko) 비디오 인코더, 비디오 디코더, 비디오 인코딩 방법 및 비디오 디코딩 방법
KR101413706B1 (ko) 움직임 정보 피드백을 갖는 위너-지브 비디오 코덱의 패리티 비트 요구량을 결정하는 방법
Taieb et al. Low complexity hybrid rate control schemes for distributed video coding
Chien et al. AQT-DVC: adaptive quantization for transform-domain distributed video coding
KR101059318B1 (ko) 분산 비디오 부호화/복호화 방법, 분산 비디오 부호화/복호화 장치 및 변환 부호화 장치
KR101334269B1 (ko) 전송 비트플레인 수에 의존적인 분산 비디오 부호화 및 복호화 방법
KR100969135B1 (ko) 복원정보 신뢰도에 기반하여 계속적으로 보조정보를 향상시키는 분산비디오 부호화 영상의 복호화 장치 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
LAPS Lapse due to unpaid annual fee