KR101180539B1 - 분산비디오 부호화 영상의 복호화 장치 및 그 방법 - Google Patents

분산비디오 부호화 영상의 복호화 장치 및 그 방법 Download PDF

Info

Publication number
KR101180539B1
KR101180539B1 KR20100071433A KR20100071433A KR101180539B1 KR 101180539 B1 KR101180539 B1 KR 101180539B1 KR 20100071433 A KR20100071433 A KR 20100071433A KR 20100071433 A KR20100071433 A KR 20100071433A KR 101180539 B1 KR101180539 B1 KR 101180539B1
Authority
KR
South Korea
Prior art keywords
noise
noise model
decoding
model
models
Prior art date
Application number
KR20100071433A
Other languages
English (en)
Other versions
KR20110010077A (ko
Inventor
전병우
심혁재
박천호
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Publication of KR20110010077A publication Critical patent/KR20110010077A/ko
Application granted granted Critical
Publication of KR101180539B1 publication Critical patent/KR101180539B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4383Accessing a communication channel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명에 따른 분산 비디오 부호화 영상의 복호화 장치 및 방법은 부호화 장치로부터 전송 받은 정보 및/또는 복호화 장치에서 생성 또는 복원되는 정보를 이용하여 채널의 특성을 반영하는 복수개의 후보 잡음모델들을 생성한 후, 복수개의 후보 잡음 모델들 중에서 복호화 장치에서 생성 또는 복원되는 정보 및/또는 부호화 장치로부터 전송 받은 정보를 이용하여 채널코드 복호화부에 입력된 소정 채널코딩단위 각각에 적합한 잡음모델을 선택하여, 채널 복호화를 수행한다.이에 따라, 본 발명에 따른 복호화 장치는 주어진 소정 채널코딩단위에 알맞은 잡음모델을 사용함으로써 WZ픽춰를 복원하는데 소요되는 상기 부호화 장치로부터 전송되는 압축데이터 양을 줄여 데이터 압축 성능을 상당히 개선시킬 수 있다.

Description

분산비디오 부호화 영상의 복호화 장치 및 그 방법{APPARATUS AND METHOD OF DECOMPRESSING DISTRIBUTED WAY CODED VIDEO}
본 발명은 다중잡음모델에 기반하여 압축 성능을 향상시키는 분산비디오 부호화 영상의 복호화 장치 및 그 방법에 관한 것이다.
일반적으로 압축전의 디지털 영상데이터는 상당한 양의 크기를 갖기 때문에, 종래의 MPEG, H.26X와 같은 효율적인 압축 방법에 의하여 압축되었다. 이러한 기술들은 DVD, 방송들과 같은 응용에 사용되었으며 최근에는 2.5G/3G 등의 무선 통신환경의 발달로 무선 모바일 영상전송에도 사용되고 있다.
디지털 영상데이터의 압축은, 압축전의 영상데이터로부터 다음 세가지 관점에서 필요 없거나 나중에 찾아낼 수 있는 정보를 찾아 줄임으로써 달성되는데, 첫 번째로 시간적인 중복성(Temporal redundancy)을 줄이는 것, 다음으로 공간적인 중복성(Spatial redundancy)을 줄이는 것, 마지막으로 통계적인 중복성(Statistical redundancy)을 줄이는 것이 그것이다.
MPEG, H.26X로 대표되는 기존의 압축 기술들은 움직임 예측/보상에 기반하는 시간적 중복성의 제거로 높은 압축효율을 달성하고 있지만, 동영상 부호화 장치에 많은 연산부담을 준다. 따라서 최근 사용량이 늘어나거나 향후 폭발적으로 늘어날 센서 네트워크나 휴대폰 영상통화와 같이, 부호화 장치의 연산량 및/또는 전력 자원이 한정된 응용에서는, 기존의 압축 기술들이 부적합하여, 부호화 장치의 복잡도를 줄이는 것이 중요한 기술적 문제로 대두 되어왔다.
이러한 부호화 장치의 복잡도 문제를 해결하기 위한 방법의 하나로 분산 소스 부호화(DSC: Distributed Source Coding) 기술이 주목 받고 있다. 분산 소스 부호화 기술은 Slepian-Wolf 이론을 기반으로 한다. Slepian-Wolf 이론에 따르면 상관성(correlation)이 존재하는 소스들을 독립적으로 각각 압축 부호화하여도 복호화시 상호 상관성을 이용한다면 각 소스를 서로 연계하여 예측 부호화를 한 것과 동일한 압축 부호화 이득을 얻을 수 있음을 알 수 있다.
Wyner-Ziv 이론을 기반으로 한 분산 비디오 부호화(DVC: Distributed Video Coding) 기술은, 상기의 분산 소스 부호화 기술이 무손실 부/복호화에 해당하던 것을 손실 압축 부호화의 경우까지 확대한 것이다. 이는 픽춰 간 중복성을 줄이기 위하여 지금까지 비디오 부호화 장치에서 이루어졌던 움직임 예측/보상 같은 일련의 신호처리 절차를 큰 압축 부호화 이득/손실 없이 복호화 장치 쪽으로 옮길 수 있음을 의미한다.
분산 비디오 부호화 기술 중 가장 대표적으로 알려진 것은 A. Aaron, S. Rane, R. Zhang, and B. Girod 등이 Proc. IEEE Data Compression Conference, 2003을 통해 발표한 논문인 "Wyner-Ziv coding for video: Applications to compression and error resilience"에서 소개한 Wyner-Ziv 코딩 기술이다.
이 분산 비디오 부호화 기술은 복호화 장치에서 압축된 현재 부호화 단위의 전,후 픽춰 간의 유사도를 이용하여 현재 부호화 단위에 해당하는 보조정보를 생성한 후, 보조정보와 현재 부호화 단위에 해당하는 영상데이터의 차를 가상의 채널에서 발생한 잡음으로 간주한 뒤, 부호화 장치에서 전송된 패리티 데이터를 이용하여 보조정보내의 잡음을 제거하는 방식으로 현재 부호화 단위에 해당하는 압축 전 영상데이터를 복원하는 것이다.
도 1은 종래의 Wyner-Ziv 코딩기술의 부호화 장치(110)와 복호화 장치(120)의 구성을 보여주는 도면이다.
도 1에 도시된 바와 같이, 종래의 Wyner-Ziv 코딩기술의 부호화 장치(110) 는 키픽춰 부호화부(111), 양자화부(112), 블록단위화 부(113), 그리고 채널코드 부호화부(114)를 포함하고, 이에 상응하는 복호화 장치(120)는 키픽춰 복원부(121), 보조정보 생성부(122), 잡음모델 생성부(123), 채널코드 복호화부(124), 그리고 영상 복원부(125)를 포함한다.
Wyner-Ziv 코딩기술에 따른 부호화 장치(120)는 압축할 데이터를 두 개의 부류로 나누는데, 하나는 분산비디오 부호화 방식에 의해 부호화 되는 영상데이터(이하, 'WZ픽춰'라 함)이고, 또 다른 하나는 분산비디오 부호화 방식 이외의 종래의 부호화방식에 의하여 부호화 되는 영상데이터(이하, '키픽춰'라 함)이다. 키픽춰들은 일반적으로 H.264/AVC의 인트라픽춰 부호화 방식과 같이 사용자가 미리 선택한 소정의 방법으로 키픽춰 부호화부(111)에 의해 부호화되어 복호화 장치(120)로 전송된다.
종래의 Wyner-Ziv 코딩기술에 따른 부호화 장치(110)에 상응하는 복호화 장치(120)의 키픽춰 복원부(121)는 H.264/AVC의 인트라픽춰 부호화 방식과 같이 사용자가 미리 선택한 소정의 방법으로 부호화되어 전송된 키픽춰를 복원하고, 보조정보 생성부(122)에서는 키픽춰 복원부(121)에 의하여 복원된 키픽춰들을 이용하여 보조정보(Side Information)를 생성한다. 이 보조정보는 복원할 WZ픽춰와 유사할 것이라고 간주되는, 복호화 장치에서 생성한 추정정보이며, 압축 전 영상데이터와 이에 대한 보조정보와의 차를 잡음오류로 간주한다. 이 잡음오류는 실제 통신채널상의 전송에 의하여 발생하는 잡음오류가 아니므로, 이런 오류를 발생시키는 잡음을 가상의 채널잡음(Virtual Channel Noise)이라 한다.
일반적으로 보조정보 생성부(122)에서 보조정보의 생성은 WZ픽춰의 전후에 위치하는 키픽춰 간의 선형적인 움직임을 가정한 보간법(interpolation)을 이용하여 이루어지며 보외법(extrapolation) 역시 사용할 수도 있지만 성능 면에서 보간법이 보외법 보다 뛰어나므로 대부분 보간법이 사용된다.
한편, WZ픽춰들을 부호화하기 위하여, 부호화 장치(110)의 양자화부(112)는 WZ 픽춰 정보에 대하여 양자화를 실행하고, 블록단위화부(113)는 양자화된 값을 부호화 단위로 구분한다. 채널코드 부호화부(114)는 양자화된 값을 소정 채널코딩단위로 나누며 채널코드를 이용하여 이에 대한 압축데이터를 생성하고 이를 버퍼(미도시)에 저장한다. 이때, 압축데이터는 압축할 부호화 단위에 해당하는 영상데이터에 대한 패리티데이터이다.
버퍼에 저장된 압축데이터, 즉 패리티데이터는 역방향 채널(즉, 피드백 채널)을 통한 복호화 장치(120)의 요청에 따라 순차적으로 전송된다. 도 1의 채널코드 복호화부(124)는 잡음모델 생성부(123)에서 생성한 가상의 채널에 대한 하나의 잡음모델에 기반하여, 부호화 장치(110)로부터 전송되는 패리티데이터를 사용하여 보조정보에 존재하는 잡음오류를 정정하여 양자화된 압축 이전의 영상데이터의 부호화 단위에 해당하는 중간영상데이터 값을 추정한다. 여기서 압축 이전의 영상데이터는 이후 원본영상과 동일한 개념으로 혼용한다. 도 1의 영상 복원부(125)는 채널코드 복호화부(124)에 의해 출력된 소정 채널코딩단위들의 집합인 중간영상데이터 값을 입력 받아 이를 역 양자화 하여 WZ 픽춰를 복원한다.
상기 과정에 있어 역 양자화시에 발생하는 모호성(Ambiguity)은 보조정보 생성부(122)에 의해 생성한 상기 보조정보와 잡음모델 생성부(123)에서 추정한 잡음모델을 참고하여 제거한다.
Wyner-Ziv 코딩 기술의 복호화 방법은 기본적으로 보조정보 내의 잡음오류를 채널코드를 이용하여 정정하는 것이다. 그러나 복호화 장치에는 잡음오류를 정정하는데 필요한 압축 전 영상데이터에 대한 정보가 없기 때문에 복호화 장치는 잡음오류를 정정하기 위해 필요한 패리티데이터의 양 역시 알 수 없다. 그러므로, 복호화 장치는 역방향 채널을 통해 점진적으로 패리티데이터를 부호화 장치에 요청하는 구조를 갖는다. 이에 대한 구체적인 설명은 A. Aaron, S. Rane, R. Zhang, and B. Girod 등이 Proc. IEEE Data Compression Conference, 2003을 통해 발표한 논문인 "Wyner-Ziv coding for video: Applications to compression and error resilience"를 참조한다.
한편, Wyner-Ziv 복호화 장치에서 가상의 채널에 대한 정보를 정확히 예측하는 것은 채널 복호화의 성능에 큰 영향을 미친다. 하지만 복호화 장치에서는 원본영상에 대한 정보가 없으므로 채널(잡음)에 대한 정확한 예측은 이루어 질 수 없으며, 그에 따라 선형적인 움직임을 가정한 전후 키픽춰 간의 차분을 통한 예측을 수행하는 것이 일반적이다. 이에 대한 구체적인 설명은 C. Brites, and F. Pereira가 Proc. IEEE Transactions on Circuits and Systems for Video Technology, 2008을 통해 발표한 논문인 "Correlation Noise Modeling for Efficient Pixel and Transform Domain Wyner-Ziv Video Coding"을 참조한다.
하지만 종래의 방법에 따른 잡음 모델은 실험적으로 하나의 잡음모델을 미리 생성하여 사용하는 것이므로 소정 채널코딩단위로 입력되는 압축데이터 각 단위에 대해서 모두 좋은 성능을 보장하지는 못한다. 이와 같이, 항상 좋은 성능을 보장하지 못하기 때문에 채널코드 복호화시 잡음오류 정정에 사용되는 패리티데이터의 낭비가 많았다. 또한, 항상 정확한 잡음모델을 생성할 수가 없고, 설사 하나의 적합한 잡음모델을 생성한다 하더라도 그 잡음모델을 생성할 때 확률적으로 비교적 낮게 판단되는 잡음오류가 압축데이터를 실제 복원시킬 때 발생한 경우 채널코드 복호화에 심각한 문제가 발생했다.
상기와 같은 문제점을 해결하기 위해, 본 발명은 다중잡음모델을 사용하여 복호화 성능을 향상시키기 위한 분산 비디오 부호화 영상의 복호화 장치 및 방법을 제공한다.
본 발명은, 분산비디오 부호화 영상을 복호하는 복호화 장치 및 방법을 제공한다. 상기 복호화 장치는 부호화 장치로부터 전송되는 키픽춰 정보를 복원하는 키픽춰 복원부와, 상기 키픽춰 복원부에서 복원한 상기 키픽춰를 이용하여 보조정보를 생성하는 보조정보 생성부와, 상기 보조정보에 있는 잡음오류들을 추정하기 위한 복수개의 후보 잡음모델들로 구성된 다중잡음모델을 생성하는 다중잡음모델 생성부와, 상기 다중잡음모델 생성부에서 생성된 복수개의 후보 잡음모델들 중에서 소정 채널코딩단위에 사용할 잡음모델을 결정하는 잡음모델 결정부와, 상기 결정된 상기 잡음모델에 기반하여 상기 보조정보의 잡음오류를 상기 부호화 장치로부터 전송되는 압축데이터를 사용하여 정정하고, 주어진 복호화 단위에 대한 소정 채널코딩단위들을 복호화하는 채널코드 복호화부와, 상기 채널코드 복호화부에서 복호화된 상기 소정 채널코딩단위들로 구성된 중간영상데이터 값과, 상기 보조정보 생성부에서 생성한 상기 보조정보와 상기 결정된 잡음모델들을 이용하여 WZ픽춰를 복원하는 영상 복원부를 포함한다.
또한, 분산비디오 부호화 영상을 복호하는 복호화 방법은 부호화 장치로부터 전송되는 키픽춰 정보를 복원하는 단계와; 상기 복원한 상기 키픽춰를 이용하여 보조정보를 생성하는 단계와; 상기 보조정보에 있는 잡음오류들을 추정하기 위한 복수개의 후보 잡음모델들로 구성된 다중잡음모델에 기초하여 소정 채널코딩단위에 대해 사용할 잡음 모델을 제공하는 단계와; 상기 제공된 잡음 모델에 기초하여 상기 부호화 장치로부터 전송되는 압축데이터를 사용하여 보조 정보의 잡음 오류를 정정하는 단계와; 소정의 복호화 단위에 대한 소정 채널코딩단위들을 복호하는 단계와; 상기 복호화된 상기 소정 채널코딩단위들로 구성된 중간영상데이터 값과, 상기 보조정보와 상기 제공된 잡음모델들을 이용하여 WZ픽춰를 복원하는 단계를 포함한다.
전술한 바와 같이 본 발명에 따른 복호화 장치는 부호화 장치로부터 전송되는 확인정보 및/또는 복호화 장치에서 생성 또는 복원한 정보를 이용하여 가상채널의 특성을 효과적으로 반영하는 복수 개의 후보 잡음모델들을 생성한다. 그리고 복호화 과정에서 생성 또는 복원하는 정보 및/또는 부호화 장치로부터 전송받는 확인정보를 이용하여 채널코드 복호화부에 입력된 소정 채널코딩단위에 적합한 잡음모델을 선택하게 된다. 이를 통해 채널코드 복호화기는 압축데이터의 낭비를 최소화 하면서 보조정보의 잡음오류를 효과적으로 제거함으로써 압축성능을 상당히 증가시킨다.
도 1은 기존의 Wyner-Ziv 코딩기술에 해당하는 부호화 장치와 그에 따른 복호화 장치의 구성을 도시한 도면이다.
도 2는 본 발명에 따른 화소영역에서의 Wyner-Ziv 코딩기술의 부호화 장치와 그에 따른 다중잡음모델을 사용하여 소정 채널코딩단위에 적응적인 잡음모델을 사용함으로써 복호화 효율을 높이는 분산 비디오 부호화 영상의 복호화 장치의 구성을 도시한 도면이다.
도 3은 도 2의 부/복호화 장치에서 신호처리 과정을 거치는 중간영상데이터 및 소정 채널코딩단위의 예를 도시한 도면이다.
도 4는 도 2의 복호화 장치의 다중잡음모델 생성부에서 생성하는 다중잡음모델의 일 예를 도시한 도면이다.
도 5는 도 2의 복호화 장치의 채널코드 복호화부의 구성을 도시한 도면이다.
도 6는 도 2의 복호화 장치의 영상 복원부의 구성을 도시한 도면이다.
도 7은 본 발명에 따른 변환영역에서의 Wyner-Ziv 코딩기술의 부호화 장치와 그에 따른 다중잡음모델을 사용하여 소정 채널코딩단위에 적응적인 잡음모델을 사용함으로써 복호화 효율을 높이는 분산 비디오 부호화 영상의 복호화 장치의 구성을 도시한 도면이다.
도 8은 본 발명의 일 실시예에 따른 복호화 방법의 흐름도를 도시한 도면이다.
도 9는 본 발명의 일 실시예에 따른 다중 잡음 모델들을 생성하기 위한 흐름도를 도시한다.
도 10은 본 발명의 일 실시예에 따른 분산비디오 부호화 영상의 복호화 방법에 대한 성능 평가 결과를 나타내는 그래프이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
본 발명에 따른 분산 비디오 부호화 영상의 복호화 장치 및 방법은 입력되는 소정 채널코딩단위 각각에 대하여, 발생할 수 있는 잡음의 정도를 파악하고 그에 알맞는 후보 잡음모델을 복수 개 생성한 후 이들 중에서 적응적으로 잡음모델을 선택하여 사용함으로써 영상데이터의 압축 성능을 개선할 수 있다.
구체적으로, 본 발명에 따른 분산 비디오 부호화 영상의 복호화 장치 및 방법은 부호화 장치로부터 전송 받은 정보 및/또는 복호화 장치에서 생성 또는 복원되는 정보를 이용하여 채널의 특성을 반영하는 복수개의 후보 잡음모델들을 생성한 후, 복수개의 후보 잡음 모델들 중에서 복호화 장치에서 생성 또는 복원되는 정보 및/또는 부호화 장치로부터 전송 받은 정보를 이용하여 채널코드 복호화부에 입력된 소정 채널코딩단위 각각에 적합한 잡음모델을 선택하여, 채널 복호화를 수행함으로써, 전송되는 압축데이터 양의 낭비를 줄인다.
이하에서는 첨부된 도면들을 참조하여 본 발명을 보다 상세하게 설명한다.
도 2는 본 발명에 따른 Wyner-Ziv 부호화 장치(10)와 다중잡음모델을 사용하여 복호화 성능을 향상시키는 분산 비디오 부호화 영상의 복호화 장치(20)의 구성을 도시한 도면이다.
도 2를 참조하여 설명하면, 본 발명에 따른 Wyner-Ziv 부호화 장치는 키픽춰 부호화부(11)와 WZ픽춰 부호화부(12)를 포함할 수 있다.
부호화 장치(120)는 압축할 데이터를 두 개의 부류로 나누는데, 하나는 분산비디오 부호화 방식에 의해 부호화 되는 WZ픽춰이고, 또 다른 하나는 분산비디오 부호화 방식 이외의 종래의 부호화방식에 의하여 부호화 되는 키픽춰이다. 키픽춰 부호화부(11)는 키픽춰들은 일반적으로 H.264/AVC의 인트라픽춰 부호화 방식과 같이 사용자가 미리 선택한 소정의 방법으로 부호화하여 복호화 장치(120)로 전송한다.
WZ픽춰 부호화부(12)는 WZ 픽춰 정보에 대하여 양자화를 실행하고, 양자화된 값을 부호화 단위로 구분한다. 여기서 부호화 단위는 영상을 부호화하고 복호화하는 단위로서, 프레임 또는 프레임을 세분한 다양한 크기의 블록을 포함하며, 화소영역 또는 이를 DCT(Discrete Cosine Transform)와 같은 변환(Transform)을 사용하여 얻어진 변환영역을 포함한다. 또한, 부호화 단위는 복호화 장치에서 복호화 대상이 되는 단위가 되어, 복호화 단위라는 용어와 같은 의미로 혼용하여 사용한다.
또한, WZ픽춰 부호화부(12)는 채널코드를 이용하여 양자화된 값에 대한 압축데이터를 소정 채널코딩 단위로 생성하고 이를 버퍼(미도시)에 저장한다. 이때, 압축데이터는 압축할 부호화 단위에 해당하는 영상데이터에 대한 패리티데이터이다.
도 3은 도 2의 부호화 장치에서 신호처리 과정을 거치는 중간영상데이터 및 소정 채널코딩단위의 예를 도시한 도면이다.
도 3을 참조하면, 프레임은 하나 또는 그 이상의 소정의 크기의 블록으로 이루어지며, 이 때, 블록내 및/또는 블록간 동일성분의 화소값 또는 변환영역 계수값은 양자화를 거친다.
상기 양자화는 소정 채널코딩단위 간에 및 소정 채널코딩단위 내에서 동일한 크기로 이루어 질 필요가 없으며 양자화가 이루어지지 않는 경우도 포함한다. 또한, 블록 내 및 블록간 동일성분의 화소값 또는 변환영역 계수값에 대하여 지그재그 스캔방식 또는 Alternate scan과 같은 미리 정해진 스캔방식에 따라 데이터 나열화가 이루어지며, 이는 필수적이지 않다.
여러 개의 양자화된 화소 값 혹은 변환영역 계수값이 나열화 된 것을 심벌 스트림이라 한다. 이 때 각각의 심벌 값(양자화된 화소 값 혹은 변환영역 계수값)은 이진화하였을 때 서로 다른 2M의 가중치를 갖는 비트들로 나타나며, 심벌 스트림은 동일하거나 서로 다른 M의 값을 갖는 비트 스트림(이후 비트 플레인이라는 용어와 혼용)으로 구성된다. 이 때 심벌 스트림을 구성하는 심벌 각각에 대하여 M이 최대값을 갖는 비트 플레인을 최상위 비트 플레인이라 하며, M이 최소값을 갖는 비트 플레인을 최하위 비트 플레인이라 한다. 이는 또한, 심볼 스트림을 구성하는 심볼 각각의 최하위 비트 플레인의 M이 0인 양자화가 이루어지지 않은 경우 역시 포함한다.
본 발명에서 채널코딩단위는 WZ픽춰 부호화부(12)에서 압축데이터, 즉 패리티 데이터를 생성하는 데이터 단위를 지칭하는 것으로서, 부호화 단위인 프레임 또는 프레임을 세분한 다양한 크기의 블록, 또는 부호화 단위를 세분화한 다양한 길이의 비트플레인, 또는 비트플레인의 일부를 포함한다. 또한, 패리티데이터를 생성하는 영상데이터는 화소영역에서의 값 또는 이를 DCT(Discrete Cosine Transform)와 같은 변환(Transform)을 사용하여 얻어진 변환영역에서의 계수값을 포함한다.
중간영상데이터는 소정 채널코딩단위의 집합으로 영상이 복원되기 이전의 데이터 값이다. 영상 복원부(25)의 영상복원이 이루어지는 단위(상기 부호화 단위)에 따라 양자화된 화소 값으로 이루어진 프레임 또는 프레임을 세분한 다양한 크기의 블록이 될 수 있으며, 이는 화소영역에서의 값뿐만 아니라 이를 DCT와 같은 변환(Transform)을 사용하여 얻어진 변환영역에서의 계수값을 포함한다.
또한, 본 발명은 채널코딩단위를 더 세분하여, 채널코딩단위 내 최소구성단위를 정의한다. 이것은 채널코딩단위 내에서 교차 확률(Cross-over Probability)를 계산하는 최소의 단위를 의미한다. 최소구성 단위는 채널코드 복호화기에 입력되는 채널코딩단위에 따라 프레임 또는 프레임을 세분한 다양한 크기의 블록을 구성하는 화소 값, 또는 다양한 길이의 비트플레인을 구성하는 비트의 경우를 포함한다. 또한 최소구성 단위는 화소영역에서의 값 또는 이를 DCT와 같은 변환(Transform)을 사용하여 얻어진 변환영역에서의 계수값을 포함한다.
다시 도 2를 참조하면, 본 발명에 따른 복호화 장치(20)는 키픽춰 복원부(21), 보조정보 생성부(22), 다중잡음 모델 기반 잡음모델 제공부(30), 채널코드 복호화부(24), 그리고 영상 복원부(25)를 포함한다.
키픽춰 복원부(21)는 키픽춰 부호화부(11)로부터 전송받은 정보를 이용하여 키픽춰를 복원한다. 보조정보 생성부(22)는 복원된 키픽춰들을 이용하여 현재 WZ픽춰로 간주되는 보조정보를 생성한다. 이 때, 상기 생성된 보조정보는 소정 채널코딩단위에 해당하는 원본영상에 가상의 채널에 의한 잡음오류가 첨가된 것으로 간주된다. 이 잡음오류를 오류정정기술을 이용하여 제거하는 목적의 채널코드 복호화를 위하여 가상의 채널에 존재하는 잡음의 예측이 필요하다.
다중잡음 모델 기반 잡음모델 제공부(30)는 상기 보조정보에 있는 잡음오류들을 추정하기 위한 복수개의 후보 잡음모델들로 구성된 다중잡음모델에 기초하여 소정 채널코딩단위에 사용할 잡음모델을 제공한다.
이를 위해, 다중잡음 모델 기반 잡음모델 제공부(30)는 다중잡음모델 생성부(23) 및 잡음모델 결정부(26)를 포함한다.
다중잡음모델 생성부(23)은 복호화 장치에서 생성 또는 복원한 정보 및/ 또는 상기 부호화 장치에서 전송된 확인정보를 이용하여 소정 채널코딩단위에 존재하는 잡음에 대하여 N개의 후보 잡음모델들을 생성한다.
여기에서, 확인정보는 복호화 장치에서 추정하거나 얻을 수 있는 원본영상(즉, 영상데이터)의 일반적/통계적 정보의 전체 혹은 일부를 말하며, 원본영상에 대한 CRC(Cyclic Redundancy Check) 값이 그 한 예이다.
분산 비디오 부호화 영상의 복호화 장치(20)는 정확한 잡음정보를 알 수 없다. 그러므로, 다중잡음모델 생성부(23)는 보조 정보에 있는 잡음 오류를 추정하기 위한 복수개의 후보 잡음 모델들을 생성하기 위해, 소정 채널코딩단위 내 최소구성단위인 비트 플레인을 구성하는 비트 각각에 대하여 잡음 확률분포(PMF)나, 잡음의 분포 특성(Stationary/Non-stationary), 실제의 잡음정보 추정 오류를 보상하기 위한 파라메터를 통하여 후보 잡음모델을 생성한다.
상기 잡음 모델들을 생성하기 위한 잡음 분포 PMF의 몇 가지 예로서 라플라시안(Laplacian), 가우시안(Gaussian), Two-sided Gamma 분포 등이 있다.
상기 잡음모델들은 채널코딩단위 내 잡음 분포 특성에 따라 채널코딩단위 내 최소구성단위 별로 각각 잡음추정을 하여 잡음 모델이 구성되는 Non-stationary 잡음모델과 채널코딩단위내의 구성요소들에 대하여 하나의 잡음추정 하에 잡음모델이 구성되는 Stationary 잡음모델을 포함한다.. 이외에 다른 분포 특성에 의한 구분이 존재할 수 있으며, 이를 이용하여 여러 개의 잡음모델을 생성하는 본 특허의 본질적인 의미를 벗어나지 않는다.
상기 파라메터는 복호화 장치에서 행하여지는 잡음예측은 정확할 수 없으므로 이를 보정하기 위하여 사용하게 되는 각종 보정변수를 의미한다. 이하, 다중잡음모델 생성부(23)의 동작을 도 4를 참조하여 더 상세히 설명한다. 설명의 용이함을 위해, 변환영역의 영상데이터에 대해 패리티데이터가 생성된다는 것과, 소정 채널코딩단위로서 한 프레임 내 양자화된 동일 주파수 밴드(동일 변환영역 계수값)의 비트 플레인을 사용하는 것을 가정한다.
다중잡음모델 생성부(23)는 소정 채널코딩단위인 비트 플레인에 대해 생성된 보조정보상의 잡음을 예측하기 위하여, 해당 키픽춰 블록 간의 차이를 구한다. 예컨대, 다중잡음모델 생성부(23)는 복호화 장치의 보조 정보 생성부(22)에서 보조정보 생성시 참조한 전후 키픽춰에 대한 움직임벡터가 가리키는 전후 키픽춰 상의 해당 블록을 찾고, 이 블록들의 동일한 주파수 밴드간의 차이를 잡음으로 예측한다(도 4의 310). 여기에서 하나의 블록은 부호화 장치에서 사용된 채널코딩 단위일 수 있다.
예컨대, 다중잡음모델 생성부(23)는 블록 간의, 예컨대, i번째 블록 간의 오차 블록을 생성한 후 오차 블록에 대한 변환을 수행하고 그 분산을 구한다. 이 분산이 i-번째 블록에 위치한 잡음의 분산값이 된다. 이어서, 다중잡음모델 생성부(23)는 상기 후보 잡음모델들을 생성할 때에는 적어도, 채널 잡음의 확률분포(PMF: Probability Mass Function) 및/또는 잡음모델의 잡음 분포 특성 등을 고려한다.
구체적으로 채널 잡음의 확률분포에 관련하여, 다중잡음모델 생성부(23)는 소정 채널코딩단위 내 최소구성단위인 비트 플레인을 구성하는 비트 각각에 대하여 잡음 확률분포(PMF)에 따라 잡음 모델을 생성한다(도 4의 320).
전술한 바와 같이 상기 후보 잡음모델들을 생성하기 위한 잡음 확률분포(PMF)의 몇 가지 예로서 라플라시안(Laplacian), 가우시안(Gaussian), Two-sided Gamma 분포 등이 있다.
복수개의 잡음 확률분포(PMF) 중 예컨대, 라플라시안 분포에 관련하여 설명한다. 잡음예측에서 생성된 소정 채널코딩단위를 구성하는 i-번째 블록에 위치한 잡음의 분산값을
Figure 112010047710059-pat00001
라고 하면, 다중잡음모델 생성부(23)는 라플라시안 분포에 따라, 하기 [수학식 1]에 의하여 소정 채널코딩단위 내 최소구성단위에 대한 잡음모델을 생성할 수 있다.
Figure 112010047710059-pat00002
상기 [수학식 1] 에서, x 는 잡음을 의미하고,
Figure 112010047710059-pat00003
는 소정 채널코딩단위 중i번째 블록의 라플라시안 계수값을 의미한다.
이와 같이, 다중잡음모델 생성부(23)는 비트 플레인 내의 비트 각각에 대하여 분산값
Figure 112010047710059-pat00004
을 구함으로써 잡음을 예측하고, 예측된 잡음 즉, 비트 각각에 대한 분산값들에 대해 라플라시안 분포에 따른 잡음모델을 생성한다.
이와 같은 방식으로 다중잡음모델 생성부(23)는 라플라시안(Laplacian) 분포 이외에도 가우시안(Gaussian) 분포, Two-sided Gamma 분포 등을 이용하여 잡음 모델들을 생성할 수 있다.
상기의 후보 잡음모델들을 생성할 때 고려하는 상기의 잡음 확률분포(PMF)는 잡음의 분포 형태를 결정하며, 이 확률분포를 이용하여 복호화 대상이 되는 소정 채널코딩단위 내 최소구성단위에 대한 교차 확률(Cross-over probability)을 계산한다. 예를 들면, 보조정보를 이루는 하나의 비트 플레인이 소정 채널코딩단위인 경우 이를 복호화 할 때에는, 그 비트 플레인을 이루는 각각의 비트가 소정 채널코딩단위 내 최소구성단위가 되어 이에 대한 교차 확률을 계산한다.
이어서, 다중잡음모델 생성부(23)는 잡음 분포 특성에 관련하여 생성된 잡음 모델의 잡음 분포 특성에 따라 추가의 잡음 모델들을 더 생성한다(도 4의 330). 구체적으로 다중잡음모델 생성부(23)는 잡음 확률 분포에 따라 생성된 잡음 모델의 Stationary/Non-stationary 특성 여부를 판단한다. 그리고, 다중잡음모델 생성부(23)는 Stationary 및 Non-stationary 특성들 중 잡음 모델이 가지지 않은 특성에 대해 잡음 모델을 더 생성한다.
예컨대, 상기 실시예에서 생성된 잡음 모델은 채널코딩단위 내 최소구성단위 별로 각각 잡음을 예측하여 잡음 모델이 구성되었으므로, 생성된 잡음 모델은 Non-stationary 잡음모델의 특성을 갖는다. 다중잡음모델 생성부(23)는 생성된 잡음 모델에 기초하여, stationary 특성을 갖도록 잡음 모델을 더 생성한다.
예컨대, 다중잡음모델 생성부(23)는 하나의 비트 플레인 전체에 대한 잡음추정을 이용하여 비트 플레인 모든 블록에 대하여 동일한 채널코딩단위 내 블록의 잡음 분산값(
Figure 112010047710059-pat00005
) 하나만을 사용한 잡음모델을 적용하면 stationary 특성을 갖는 잡음모델을 생성할 수 있다. 여기서 B는 비트 플레인을 구성하는 비트를 나타내기 위함이 아니며 해당 비트 플레인을 구성하는 각각의 블록에 위치한 잡음을 샘플로 하는 랜덤변수의 분산값을 나타내고 있음을 의미한다.
모델의 Stationary/Non-stationary 여부 결정에 의한, Stationary 잡음 분포는 소정 채널코딩단위 내 최소구성단위들에 대하여 공통적으로 하나의 교차 확률(Cross-over Probability)을 사용하는 것을 의미하며, Non-stationary 잡음 분포는 소정 채널코딩단위 내 최소구성단위에 대하여 각각의 교차 확률을 사용하는 것을 의미한다. 일반적으로는 Non-stationary 잡음모델의 성능이 좋지만, 잡음 예측이 매우 부정확 할 경우에는 stationary 잡음모델을 사용하는 것이 오히려 이득이 된다.
이러한 잡음예측은 추정된 움직임 벡터에 대응하는 전/후 키 픽춰상의 블록간 주파수 밴드의 차를 이용하여 실제의 잡음을 추정하는데 사용하므로 움직임 벡터의 추정이 정확하지 않거나, 이러한 잡음 예측방법이 잘 맞지 않는 경우에는 잘못된 잡음예측의 가능성이 높아, 이를 효과적으로 정정하는 것이 바람직하다.
그러므로, 다중잡음모델 생성부(23)는 잡음 확률 분포 및 잡음 분포 특성에 따라 여러 잡음 모델들을 생성한 후 실제의 잡음정보 추정 오류를 보상하기 위해 생성된 잡음 모델들을 변화시킴으로써 최종적인 후보 잡음 모델들을 생성한다.
구체적으로 설명하면 예측을 통하여 생성된 후보 잡음모델들이 실제 잡음모델과 상이할 수 있으며, 이 차이를 수치화 하여 나중에 이를 보상하기 위한 목적으로 소정의 파라메터들을 정의하여 후보잡음 모델 생성시에 사용할 수 있다. 예를 들어, 잡음 모델을 생성하는 중 발생할 수 있는 스케일링 인자(scaling factor)를 정의하여 사용할 수 있다.
이와 같이, 상기 잡음 예측은 정확한 잡음예측이 아니므로 다중잡음모델 생성부(23)는 상기 잡음예측치(잡음의 통계적인 값)를 기반으로 하여 실제의 잡음정보 추정 오류를 보상하기 위해 생성된 복수개의 잡음 모델들을 변화시킴으로써 복수개의 후보 잡음 모델들을 생성한다.
예컨대, 다중잡음모델 생성부(23)는 실제의 잡음정보 추정 오류를 보상하기 위한 파라메터를 변화시키면서 생성된 잡음 모델들에 적용함으로써복수개의 후보 잡음 모델들을 생성한다(도 4의 340).
이런 정정의 일 실시예로서, 주변의 잡음 예측치에 비하여 판이하게 다른 예측치를 갖는 블록을 찾아 이를 정정하는 경우가 있다. 다른 실시예로서, 생성된 보조정보에 대한 각 블록별 신뢰도, 부호화 장치에서 전송된 확인정보, 복호화 장치에서 추정한 움직임 벡터에 기반한 주변 블록 간 유사도 정보 등에 기반하여 정정하는 경우가 가능하다.
이하, 상기의 주변 잡음 예측치와의 비교를 통한 정정의 실시예를 설명한다. 주변 블록의 잡음 예측치를 비트 플레인에 존재하는 잡음의 분산값(
Figure 112010047710059-pat00006
)을 사용하여 계산할 경우, 다음의 세 가지의 경우가 존재할 수 있다.
다중잡음모델 생성부(23)는 주변 블록의 잡음 예측치를 비트 플레인에 존재하는 잡음의 분산값(
Figure 112010047710059-pat00007
)을 사용하여 계산할 경우, 다음과 같이 예측 잡음을 정정한다.
a)
Figure 112010047710059-pat00008
의 경우:
Figure 112010047710059-pat00009
Figure 112010047710059-pat00010
로 정정
b)
Figure 112010047710059-pat00011
의 경우:
Figure 112010047710059-pat00012
를 임계범위(
Figure 112010047710059-pat00013
) 내의 값으로 정정
c)
Figure 112010047710059-pat00014
의 경우:
Figure 112010047710059-pat00015
Figure 112010047710059-pat00016
로 정정
이 때, Non-stationary의 특성을 갖는 잡음모델에서 사용하는 주변 잡음 예측치(상기의 실시예의 경우
Figure 112010047710059-pat00017
)와 stationary의 특성을 갖는 잡음모델에서 사용하는 비트 플레인의 잡음 예측치(
Figure 112010047710059-pat00018
)는 실제 원본영상과 보조정보의 차를 통해 얻어진 값이 아니므로, 이를 보상하기 위한 보상계수(
Figure 112010047710059-pat00019
, Compensation factor)가 필요하다.
그에 따라, 다중잡음모델 생성부(23)는 비트 플레인에 존재하는 실제 잡음의 분산값을
Figure 112010047710059-pat00020
라 하고, 라플라시안(Laplacian) 분포를 따른다면 [수학식 2]의 조건을 만족하는 보상계수를 사용한다.
Figure 112010047710059-pat00021
그러므로, 다중잡음모델 생성부(23)는 실제의 잡음정보 추정 오류를 보상하기 위해 [수학식 2]의 조건을 만족하는 보상계수
Figure 112010047710059-pat00022
를 변화시키면서 생성된 후보 잡음 모델들에 적용함으로써 복수개의 최종 후보 잡음 모델들을 생성한다. 따라서, 라플라시안(Laplacian) 잡음모델에 대한 후보 잡음모델은 [수학식 2]를 만족하는
Figure 112010047710059-pat00023
의 값의 범위에 대하여 생성된다.
분산비디오 복호화 장치내의 원본정보 부재로 [수학식 2]를 만족하는 정확한 보상계수
Figure 112010047710059-pat00024
의 값을 알 수는 없으나, 적어도 [수학식 2]를 만족하는
Figure 112010047710059-pat00025
의 값의 범위는 알 수 있다. 따라서, 다중잡음모델 생성부(23)는
Figure 112010047710059-pat00026
값의 최소값에서 최대값 사이의 값을
Figure 112010047710059-pat00027
에 대입함으로써 여러 개의 최종 후보 잡음모델들을 생성할 수 있으며, 이는 Non-stationary/Stationary 특성 어느 경우에 상관없이 두 경우 모두에 대하여 적용할 수 있다. 도 4에서는
Figure 112010047710059-pat00028
은 0, 0.01 및 0.02 등에 대해 최종 후보 잡음 모델들이 생성되는 경우를 예시적으로 나타낸다.
이때, 보상계수
Figure 112010047710059-pat00029
는 라플라시안 잡음분포에 해당하는 하나의 예로써 다른 PDF에서도 이와 유사한 파라메터가 사용될 수 있으므로, 위의 보상계수
Figure 112010047710059-pat00030
이외의 다른 파라메터를 이용하여 실제잡음모델과 생성된 잡음모델사이의 차이를 보상하는 것도 역시 가능하다. 따라서, 실제잡음모델과 생성된 잡음모델사이의 값의 보상을 수행하기 위하여 다른 파라메터 값을 사용하는 것은 본 특허 기본 사상에 어긋나는 것이 아니며, 본 특허의 기본 사상을 구현하는 개개의 특수한 예의 범위를 벗어나지 않는다.
이때, 보상계수 는 라플라시안 잡음분포에 해당하는 하나의 예로써 다른 PDF에서도 이와 유사한 파라메터가 사용될 수 있으므로, 위의 보상계수 외의 다른 파라메터를 이용하여 실제잡음모델과 생성된 잡음모델사이의 차이를 보상하는 것도 역시 가능하다. 따라서, 실제잡음모델과 생성된 잡음모델사이의 값의 보상을 수행하기 위하여 다른 파라메터 값을 사용하는 것은 본 특허 기본 사상에 어긋나는 것이 아니며, 본 특허의 기본 사상을 구현하는 개개의 특수한 예의 범위를 벗어나지 않는다.
이러한 방식으로 다른 잡음 확률분포(PMF)에 대하여도 여러 개의 후보 잡음모델들을 생성할 수 있으며 이렇게 생성된 모든 후보 잡음모델들을 모아서 다중잡음모델이 생성된다. 다중잡음모델을 생성하는 방법의 구현에는 여러 방법이 있을 수 있으며, 따라서 상기 실시 예에 의해 본 특허가 어떠한 범위로도 제한 받는 것은 아니다.
이와 같이, 다중잡음모델 생성부(23)는 보조 정보에 있는 잡음 오류를 추정하기 위한 복수개의 후보 잡음 모델들을 생성하고 이들 후보 잡음 모델들을 잡음 모델 결정부(26)로 제공한다.
잡음모델 결정부(26)는 생성된 복수개의 후보 잡음모델들 중 현재 소정 채널코딩단위의 복호화에 알맞은 잡음모델을 결정하거나 후보 잡음모델의 개수를 줄인다.
채널코드 복호화부(24)는 결정된 상기 잡음모델에 기반하여 상기 보조정보 생성부에서 생성된 상기 보조정보의 잡음오류를 상기 부호화 장치로부터 전송되는 압축데이터를 사용하여 정정하여, 주어진 복호화 단위에 대한 소정 채널코딩단위들을 복호한다.
이러한 채널코드 복호화부(24)의 구성 및 동작을 도 5를 참조하여 설명한다.
도 5는 도 2의 복호화 장치의 채널코드 복호화부의 구성을 도시한 도면이다.
도 5를 참조하여 설명하면, 채널코드 복호화부(24)는 잡음모델 결정부(26)에서 선택된 잡음모델을 기반으로 부호화 장치(10)에서 압축데이터(즉, 패리티데이터)를 점진적으로 전송받으며 보조정보의 잡음을 제거하는 채널코드 복호화기(510)와, 채널코드 복호화기(510)에서 출력된 연판정 출력값 및/또는 부호화기로부터 전송된 확인정보를 이용하여 채널코드 복호화 신뢰도를 측정하는 채널코드 복호화 신뢰도 계산부(520)를 포함한다. 여기서, 채널코드 복호화 신뢰도 계산부(520)는 채널코드 복호화기에서 출력된 연판정 출력값 및/또는 부호화기로부터 전송된 CRC(Cyclic Redundancy Code) 정보와 같은 확인정보를 이용하여 복호화 신뢰도를 측정한다.
연판정 출력을 통한 신뢰도 측정은 연판정 출력을 임계값
Figure 112010047710059-pat00031
과 비교하여 임계값 보다 크면 그 복호화 결과를 신뢰하고 낮으면 신뢰하지 않는 방법으로 이루어진다. 이는 연판정 출력값의 경우 신뢰도가 낮을 수 있으므로 출력값을 바로 이용하기 보다는 일정이상의 신뢰도를 보이는 경우만 그 값을 이용하는 것이며, 이를 통하여 복호화 결과에 대한 에러율 산출이 가능하다. 이러한 방법은 복호화 결과의 신뢰도를 측정하는 하나의 예로 상기와 같은 실시 예 이외에도 다양한 접근이 가능하다.
이 경우, 잡음모델 결정부(26)는 상기 다중잡음모델 생성부(23)에서 생성된 복수개의 후보 잡음모델들 중에서 주어진 소정 채널코딩단위에 적합한 잡음모델을 결정한다. 구체적으로, 잡음모델 결정부(26)에서는 복호화 장치에서 생성 또는 복원한 정보 및/또는 부호화 장치에서 전송된 확인정보에 기반하여 생성된 복수개의 후보 잡음모델들 중 현재 소정 채널코딩단위의 복호화에 알맞은 잡음모델을 선택하거나 후보 잡음모델의 개수를 줄인다.
이에 대한 실시예는 다음과 같다.
실시예 1
채널코드 복호화기(510)는 패리티데이터를 점진적으로 수신하므로 최초의 패리티데이터를 수신 받아 다중잡음모델을 사용하여 채널복호화를 수행한다. 이 때 최초의 패리티데이터는 점진적으로 여러번에 나누어 패리티데이터를 수신할 경우 1번째 수신되는 패리티데이터를 의미하며, 이후 복호화 장치의 요청에 따라 추가의 패리티데이터가 수신된다. 패리티데이터 수신 후 채널 복호화의 결과로 연판정 출력값이 나오면 채널코드 복호화 신뢰도 계산부(520)에서 신뢰도를 측정하여 임계값
Figure 112010047710059-pat00032
보다 신뢰도가 높은 값들은 신뢰하고 낮은 값들은 신뢰하지 않는 방법으로 채널 복호화 결과(연판정 출력값)의 에러율을 계산한다. 이 때 잡음모델 결정부(26)에서는 수신된 패리티데이터로 채널 복호화가 이루어진 후 추정된 에러율을 바탕으로 1~N번의 잡음모델 중 수렴속도가 빠른 순으로 잡음모델을 추려나간다. 최종적으로 먼저 목표 에러율 이하의 추정된 에러율을 달성한 잡음모델이 소정 채널코딩단위에 대한 최적의 잡음모델이 된다. 이 때 최적의 잡음모델은 하나이상이 될 수도 있으며 소정 채널코딩단위에 대한 잡음모델로 모두 결정이 된다.
실시예 2
채널코드 복호화기(510)는 패리티데이터를 점진적으로 수신하므로 최초의 패리티데이터를 수신 받아 다중잡음모델을 사용하여 채널복호화를 수행한다. 이 때 최초의 패리티데이터는 점진적으로 여러번에 나누어 패리티데이터를 수신할 경우 1번째 수신되는 패리티데이터를 의미하며, 이후 복호화 장치의 요청에 따라 추가의 패리티데이터가 수신된다. 패리티데이터 수신 후 채널복호화의 결과로 연판정 출력값이 나오면 채널코드 복호화 신뢰도 계산부(520)에서 신뢰도를 측정하여 임계값
Figure 112010047710059-pat00033
보다 신뢰도가 높은 값들을 신뢰하고 낮은 값들은 신뢰하지 않는 방법으로 채널 복호화 결과의 에러율을 계산한다. 이 때 추정된 에러율이 일정 에러율 이하를 갖게 되면 부호화기에서 전송된 CRC정보를 사용하여 CRC검사를 통하여 채널 복호화 결과의 오류 여부를 결정하게 된다. 이때 잡음모델 결정부(26)에서는 1~N번의 복수개의 후보 잡음모델들 각각을 사용하여 독립적으로 복호화하여 최소의 패리티데이터를 사용하여 CRC 검사를 통과한 잡음모델을 소정 채널코딩대상에 대한 최적의 잡음모델로 선택한다. 이 때 최적의 잡음모델은 하나이상이 될 수도 있으며 소정 채널코딩단위에 대한 잡음모델로 모두 결정이 된다.
실시예 3
잡음모델 결정부(26)에서는 부호화 장치(10)에서 전송한 확인정보에 기반하여 생성된 복수개의 후보 잡음모델들 중 현재 소정 채널코딩단위의 복호화에 알맞은 잡음모델을 선택하거나 후보 잡음모델의 개수를 줄인다. 예를 들어 상기 다중잡음모델 생성부(23)의 다중잡음모델 생성 실시예 중 라플라시안 분포를 기반으로 한 후보 잡음모델들의 생성에서 사용된
Figure 112010047710059-pat00034
값은 비트 플레인의 잡음예측치 (
Figure 112010047710059-pat00035
)를 사용 하였을 때 이를 실제 잡음의 분산값()과 동일한 수준으로 만들기 위한 보상 계수이다. 따라서, 잡음모델 결정부(26)는 부호화 장치(10)로부터 부호화 단위에 해당하는 원본영상의 통계적인 데이터(
Figure 112010047710059-pat00036
)를 전송 받은 후, [수학식 3]에 의한 실제의 분산값 추정이 가능하며, 이를 이용하여 사용할 다중잡음모델의 범위를 줄이거나 잡음모델을 선택 할 수 있다. 이 때, 사용 예에 따라 [수학식3]에서 사용한 [가정1], [가정2]는 바뀔 수 있으며 부호화 장치에서 전송된 확인정보를 사용한다는 점에서 본 특허의 본질적인 내용을 벗어나지 않는다.
Figure 112010047710059-pat00037
E[x] : x값의 기대값, 평균
X : 복호화 단위에 해당하는 WZ픽춰의 원본정보
Y : 복호화 단위에 해당하는 보조정보의 정보
COV(X,Y) : X와 Y의 공분산
Figure 112010047710059-pat00038
[가정 1]
E[N]=0 : 라플라시안 가정에서는 잡음에 대한 평균은 0이며, 사용에 따라 예측된 비트 플레인의 잡음예측치의 평균값 등 복호화 장치에서 생성되거나 복원되는 정보 및/또는 부호화 장치에서 전송된 다른 확인정보를 사용할 수 있으며 현재의 가정에 본 특허가 제약을 받는 것은 아니다.
[가정 2]
COV(N, X)=0 : 보조정보의 영상에서는 잡음과 원본영상의 상관관계는 없으므로 공분산의 값은 0이며, 사용에 따라 복호화 장치에서 생성되거나 복원되는 정보 및/또는 부호화 장치에서 전송된 다른 확인정보를 다른 확인정보를 사용할 수 있으며 현재의 가정에 본 특허가 제약을 받는 것은 아니다.
라플라시안 잡음 분포의 경우 외에도 가우시안, Two-sided Gamma분포 등 다른 잡음분포의 다중잡음모델의 선택 및 범위제한에 부호화 장치에서 전송된 확인정보를 사용하는 것도 가능하다.
이외에 다른 실시예가 존재할 수 있으며 다중잡음모델 중 소정 채널코딩단위에 대한 최적의 잡음모델을 선택하는 본 발명의 목적에서 벗어나지 않는다.
이와 같이, 채널코드 복호화부(24)는 주어진 복호화 단위에 대한 소정 채널코딩단위들을 복호화하여 영상 복원부(25)로 출력한다.
영상 복원부(25)는 상기 채널코드 복호화부에서 복호화된 상기 소정 채널코딩단위들로 구성된 중간영상데이터 값과, 상기 보조정보 생성부에서 생성한 상기 보조정보와 상기 결정된 잡음모델들을 이용하여 WZ픽춰를 복원한다.
상기 영상 복원부(25)의 구성 및 동작을 도 6을 참조하여 설명한다.
도 6는 도 2의 복호화 장치의 영상 복원부의 구성을 도시한 도면이다.
도 6을 참조하면, 영상 복원부(25)는 상기 채널코드 복호화부(24)에서 출력된 소정 채널코딩단위들을 저장하여 이들로 구성된 중간영상데이터를 출력하는 데이터 버퍼(610)와, 상기 잡음모델 결정부(26)에서 상기 소정 채널코딩단위를 복호화시 결정한 잡음모델을 저장하는 잡음모델 버퍼(620)를 포함한다. 영상 복원부(25)는 또한, 상기 잡음모델 버퍼에 저장된 결정된 잡음모델들 중 영상 복원에 가장 적합한 잡음모델을 결정하는 영상복원 잡음모델 결정부(630)와, 데이터 버퍼에서 출력된 중간영상데이터와 보조정보와 상기 영상복원 잡음모델 결정부에서 결정된 잡음모델을 이용하여 영상을 복원하는 영상복원기(640)를 포함한다.
여기서 영상복원 잡음모델 결정부(630)는, 상기 잡음모델 버퍼에 저장된 잡음 모델들 중 부호화 단위를 복원할 때 가장 유리한 잡음 모델을 결정한다. 결정을 위한 방법은 여러 가지가 존재할 수 있다. 이를 좀 더 구체적으로 설명하기 위하여, 변환영역에서의 동일 주파수 밴드의 비트 플레인을 소정 채널코딩단위로 사용하였을 경우에 대하여 다음의 서로 다른 네 가지 결정방법의 실시예들이 있다. 다음의 실시예를 벗어나는 방법도 존재할 수 있으며, 이외의 방법으로 결정을 한 경우라도 본 특허 기본 사상에 어긋나는 것이 아니며, 본 특허의 기본 사상을 구현하는 개개의 특수한 예의 범위를 벗어나지 않는다.
1. 최상위 비트 플레인이 도 3의 심벌 스트림에서 차지하는 값이 크므로 잡음모델 버퍼에 저장된 잡음 모델들 중 최상위 비트 플레인을 복호화시 결정된 잡음모델을 결정한다.
2. 중간영상 데이터와 중간영상 데이터에 해당하는 보조정보를 비교하여 보조정보의 잡음의 분포를 추정한 뒤 잡음모델 버퍼에 저장된 잡음모델들 중 중간영상데이터와 보조정보의 차에 해당하는 잡음을 가장 잘 추정하여 영상복원시 MSE(Mean Squared Error)값을 작게 할 수 있을 것으로 예상되는 잡음모델을 결정한다. 이 때 MSE는 복원영상의 화질을 평가하는 일예로써 다른 방법에 의한 평가도 가능하며, 이는 본 특허의 기본사상에 어긋나지 않는다.
3. Stationary 잡음모델의 경우 소정 채널코딩단위 내 최소구성단위 각각에 대한 잡음 예측이 이루어 지지 않았으므로 블록 각각의 영상을 복원하기에 부적합 하다. 따라서non-stationary 잡음 모델 중 가장 최상위 비트 플레인을 복호화시 결정된 잡음모델을 사용한다.
4. 최하위 비트 플레인은 도 3을 참조하였을 경우, 심벌 스트림 혹은 양자화 된 원본영상을 구성하는 심벌 각각에 M이 최소값을 갖는 비트 플레인을 의미하며, 최하위 비트플레인 (예1)과 (예2)의 경우를 포함한다. 여기에서, M은 각각의 심벌 값(양자화된 화소 값 혹은 변환영역 계수값)이 2M으로 양자화되었을 경우 심벌의 최하의 비트에서 부터 M번째 위치하는 비트가 양자화된 값의 최하위 비트를 의미한다. 따라서 중간 복원영상을 이루는 심볼에서 가장 작은 값을 표현하는 데이터이므로 잡음모델 버퍼에 저장된 잡음모델들 중 채널 복호화에 실패하지 않은 최하위 비트 플레인의 복호화 시 결정된 잡음모델을 사용한다.
이외에 다른 실시 예가 존재할 수 있으며 다중잡음모델 중 복호화 단위를 복원하는데 최적의 잡음모델을 선택하는 본 발명의 목적에서 벗어나지 않는다.
본 발명에 따른 실시 예에서는 화소영역 및 변환영역에서의 예를 들었으며 이는 변환 영역의 경우 도 2와는 다르나, 도 7에 도시된 바와 같이 변환부(27) 및 역변환부(28)를 추가함으로써 설명할 수 있으며 이는 본 발명의 요지를 벗어나지 않아 별도로 설명하지 않는다. 또한 이에 대한 다양한 구성이 가능하다.
따라서 본 발명의 설명에 기술된 부호화 단위는 본 발명의 구현에 따라 화소영역뿐 아니라 정수변환, DCT변환 또는 웨이블렛 변환에서의 변환계수를 포함하며 이러한 경우 역시 도 7의 변환부(27) 및 역변환부(28)로써 구현이 가능하다.
그리고 본 발명에 따른 실시 예에서는 일반적인 WZ 복호화 과정을 다루었으나 다양한 방식의 분산 부호화 비디오 영상의 복호화 장치에서도 복호화 과정 중 원본영상의 복호화를 위하여 다중잡음모델을 적용할 수 있으며 이러한 경우 역시 본 발명의 요지를 벗어나지 않는다.
상기와 같이 본 발명의 바람직한 실시 예에 따른 Wyner-Ziv 코딩기술에서의 다중잡음모델에 기반한 잡음추정 및 최적의 잡음선택이 이루어 질 수 있다.
도 8은 본 발명의 일 실시예에 따른 복호화 방법의 흐름도를 도시한 도면이다.
복호화 장치는 단계 810에서 부호화 장치로부터 전송되는 키픽춰 정보를 복원한다. 복호화 장치는 단계 820에서 상기 복원한 상기 키픽춰를 이용하여 보조정보를 생성한다.
이어서 복호화 장치는 단계 830에서 상기 보조정보에 있는 잡음오류들을 추정하기 위한 복수개의 후보 잡음모델들로 구성된 다중잡음모델을 생성한다. 복호화 장치는 단계 840에서 복수개의 후보 잡음 모델들 중 소정 채널코딩단위에 대해 사용할 잡음 모델을 결정한다. 일 실시예에서, 복호화 장치는 부호화 장치로부터 수신된 패리티데이터로 채널 복호화가 이루어진 후 추정된 에러율을 바탕으로 1~N번의 후보 잡음모델 중 수렴속도가 빠른 순으로 잡음모델을 선택한다.
다른 실시예에서, 복호화 장치는 복수개의 후보 잡음모델들 각각을 사용하여 독립적으로 복호화하여 최소의 패리티데이터를 사용하여 CRC 검사를 통과한 잡음모델을 소정 채널코딩대상에 대한 최적의 잡음모델로 선택한다. 또 다른 실시예에서, 복호화 장치는 부호화 장치에서 전송한 확인정보, 예컨대, 부호화 단위에 해당하는 원본영상의 통계적인 데이터를 전송 받은 후, 실제의 분산값 추정이 수행하고, 이를 이용하여 사용할 다중잡음모델의 범위를 줄이거나 잡음모델을 선택 할 수 있다.
복호화 장치는 사용할 잡음 모델을 선택한 후 단계 850에서 결정된 잡음 모델에 기초하여 상기 부호화 장치로부터 전송되는 압축데이터를 사용하여 보조 정보의 잡음 오류를 정정하고, 단계 860에서 주어진 복호화 단위에 대한 소정 채널코딩단위들을 복호한다.
이어서, 복호화 장치는 단계 870에서 복호화된 상기 소정 채널코딩단위들로 구성된 중간영상데이터 값과, 상기 보조정보 생성부에서 생성한 상기 보조정보와 상기 결정된 잡음모델들을 이용하여 WZ픽춰를 복원한다.
상기 후보 잡음모델들로 구성된 다중잡음모델을 생성하는 단계를 도 9를 참조하여 설명한다.
도 9는 본 발명의 일 실시예에 따른 다중 잡음 모델들을 생성하기 위한 흐름도를 도시한다.
다중 잡음 모델을 생성하기 위해 복호화 장치는 단계 910에서 보조정보 전후의 키픽춰들 간의 차분을 이용하여 잡음을 예측한다. 구체적으로, 복호화 장치는 소정 채널코딩단위인 비트 플레인에 대해 생성된 보조정보상의 잡음을 예측하기 위하여, 해당 키픽춰 블록 간의 차이를 구한다. 예컨대, 복호화 장치는 보조정보 생성시 참조한 전후 키픽춰에 대한 움직임벡터가 가리키는 전후 키픽춰 상의 해당 블록을 찾고, 이 블록들의 동일한 주파수 밴드간의 차이를 잡음으로 예측한다.
이어서, 복호화 장치는 단계 920에서 예측 잡음에 기초하여 잡음 확률 분포에 따른 잡음 모델을 생성한다. 일 실시예에서, 복호화 장치는 소정 채널코딩단위 내 최소구성단위인 비트 플레인을 구성하는 비트 각각에 대하여 잡음 확률분포(PMF)에 따라 잡음 모델을 생성한다. 전술한 바와 같이 상기 후보 잡음모델들을 생성하기 위한 잡음 확률분포(PMF)의 몇 가지 예로서 라플라시안(Laplacian), 가우시안(Gaussian), Two-sided Gamma 분포 등이 있다.
이어서, 복호화 장치는 단계 930에서 생성된 잡음 모델의 잡음 분포 특성에 따라 추가의 잡음 모델들을 더 생성한다. 구체적으로 복호화 장치는 잡음 확률 분포에 따라 생성된 잡음 모델의 Stationary/Non-stationary 특성 여부를 판단한다. 그리고, 복호화 장치는 Stationary 및 Non-stationary 특성들 중 잡음 모델이 가지지 않은 특성에 대해 잡음 모델을 더 생성한다.
예컨대, 복호화 장치는 채널코딩단위 내 최소구성단위 별로 각각 잡음을 예측하여 잡음 모델이 구성되었으면, Non-stationary 특성을 가지므로, 해당 채널코딩단위 내 모든 비트에 대하여 하나의 잡음을 사용하여 잡음 모델을 구성한다.
모델의 Stationary/Non-stationary 여부 결정에 의한, Stationary 잡음 분포는 소정 채널코딩단위 내 최소구성단위들에 대하여 공통적으로 하나의 교차 확률(Cross-over Probability)을 사용하는 것을 의미하며, Non-stationary 잡음 분포는 소정 채널코딩단위 내 최소구성단위에 대하여 각각의 교차 확률을 사용하는 것을 의미한다. 일반적으로는 Non-stationary 잡음모델의 성능이 좋지만, 잡음 예측이 매우 부정확 할 경우에는 stationary 잡음모델을 사용하는 것이 오히려 이득이 된다.
이어서, 복호화 장치는 단계 940에서 실제의 잡음정보 추정 오류를 보상하기 위해 생성된 잡음 모델들을 변화시킴으로써 최종적인 후보 잡음 모델들을 생성한다.
전술한 바와 같이, 잡음예측은 추정된 움직임 벡터에 대응하는 전/후 키 픽춰상의 블록간 주파수 밴드의 차를 이용하여 실제의 잡음을 추정하는데 사용하므로 움직임 벡터의 추정이 정확하지 않거나, 이러한 잡음 예측방법이 잘 맞지 않는 경우에는 잘못된 잡음예측의 가능성이 높아, 이를 효과적으로 정정하는 것이 바람직하다. 그러므로, 복호화 장치는 예측을 통하여 생성된 후보 잡음모델들과 실제 잡음모델 간의 차이를 수치화하고 나중에 이를 보상하기 위한 목적으로 소정의 파라메터들을 정의하여 후보잡음 모델 생성시에 사용할 수 있다. 예를 들어, 잡음 모델을 생성하는 중 발생할 수 있는 스케일링 인자(scaling factor)를 정의하여 사용할 수 있다.
예컨대, 복호화 장치는 실제의 잡음정보 추정 오류를 보상하기 위한 파라메터의 값을 변화시키면서 생성된 잡음 모델들에 적용함으로써 복수개의 후보 잡음 모델들을 생성한다.
따라서, 실제잡음모델과 생성된 잡음모델사이의 값의 보상을 수행하기 위하여 다른 파라메터 값을 사용하는 것은 본 특허 기본 사상에 어긋나는 것이 아니며, 본 특허의 기본 사상을 구현하는 개개의 특수한 예의 범위를 벗어나지 않는다.
이러한 방식으로 다른 잡음 확률분포(PMF)에 대하여도 여러 개의 후보 잡음모델들을 생성할 수 있으며 이렇게 생성된 모든 후보 잡음모델들을 모아서 다중잡음모델이 생성된다. 다중잡음모델을 생성하는 방법의 구현에는 여러 방법이 있을 수 있으며, 따라서 상기 실시 예에 의해 본 특허가 어떠한 범위로도 제한 받는 것은 아니다.
도 10은 본 발명의 일 실시예에 따른 분산비디오 부호화 영상의 복호화 방법에 대한 성능 평가 결과를 나타내는 그래프이다.
본 발명에서는 성능을 평가하기 위하여 Foreman, Stefan, Salesman, 그리고 Mobile & calendar의 시퀀스를 사용하여 모의실험을 실시하였다. 실험에 사용한 영상은 Salesman 시퀀스가 225 프레임인 것을 제외하면 나머지 것들은 모두 각각 150 프레임이며 크기는 QCIF, 프레임 율은 15Hz 이다. 본 모의실험을 통하여 기존의 잡음 모델과 본 발명의 일 실시예에 따른 잡음 모델 생성방법을 율-왜곡 성능면세서 상호 비교하고 그 결과를 분석하였다.
도 10을 참조하면 율-왜곡(Rate-PSNR) 그래프 결과를 보면, 상대적인 율의 감소는 높은 QP(Quantization Parameter)가 낮은 QP의 결과에 비하여 컸는데 이는 잡음 모델 선택방법에 의한 성능이 어느 하나의 비트 플레인에 집중되기 보다는 전체 비트 플레인에 걸쳐 약간의 율을 감소시키므로 상대적으로 잡음제거에 패리티 정보를 덜 소모하는 상위의 비트 플레인에서 더 큰 효과가 있음을 알 수 있다. 또한, 동일한 이유로 제안하는 잡음 모델 선택방법은 부/복호화가 쉬운 선형적인 움직임이 많은 시퀀스에서 더 좋은 성능을 나타내며 여기서는 Mobile & calendar 영상이 이에 해당한다.

Claims (26)

  1. 분산비디오 부호화 영상을 복호하는 복호화 장치에 있어서,
    부호화 장치로부터 전송되는 키픽춰 정보를 복원하는 키픽춰 복원부와;
    상기 키픽춰 복원부에서 복원한 상기 키픽춰를 이용하여 보조정보를 생성하는 보조정보 생성부와;
    상기 보조정보에 있는 잡음오류들을 추정하기 위하여, 채널코딩단위에 포함된 적어도 하나의 비트를 기초로 생성한 복수개의 후보 잡음모델들로 구성된 다중잡음모델에 기초하여 소정 채널코딩단위에 사용할 잡음모델을 제공하는 다중잡음 모델 기반 잡음모델 제공부와;
    상기 제공된 잡음모델에 기반하여 상기 보조정보의 잡음오류를 상기 부호화 장치로부터 전송되는 압축데이터를 사용하여 정정하고, 주어진 복호화 단위에 대한 소정 채널코딩단위들을 복호화하는 채널코드 복호화부와;
    상기 채널코드 복호화부에서 복호화된 상기 소정 채널코딩단위들로 구성된 중간영상데이터 값과, 상기 보조정보 생성부에서 생성한 상기 보조정보와 상기 제공된 잡음모델들을 이용하여 WZ픽춰를 복원하는 영상 복원부를 포함하는 것을 특징으로 하는 복호화 장치.
  2. 제1항에 있어서, 상기 다중잡음 모델 기반 잡음모델 제공부는,
    상기 보조정보에 있는 잡음오류들을 추정하기 위하여, 채널코딩단위에 포함된 적어도 하나의 비트를 기초로 생성한 복수개의 후보 잡음모델들로 구성된 다중잡음모델을 생성하는 다중잡음모델 생성부와;
    상기 다중잡음모델 생성부에서 생성된 복수개의 후보 잡음모델들 중에서 소정 채널코딩단위에 사용할 잡음모델을 결정하는 잡음모델 결정부를 포함하는 복호화 장치.
  3. 제1항에 있어서, 상기 다중잡음모델 생성부는 상기 보조정보 전후의 키픽춰들 간의 차분을 이용하여 잡음을 예측하고, 예측 잡음에 기초하여 잡음 확률 분포에 따른 잡음 모델을 생성하고, 상기 생성된 잡음 모델의 잡음 분포 특성에 따라 추가의 잡음 모델들을 더 생성하는 것을 특징으로 하는 복호화 장치,
  4. 제2항에 있어서, 상기 다중잡음모델 생성부는 상기 생성된 잡음 모델의 잡음 분포 특성에 따라 상기 생성된 잡음 모델의 Stationary/Non-stationary 특성 여부를 판단하고, 상기 Stationary 및 Non-stationary 특성들 중 상기 생성된 잡음 모델이 가지지 않은 특성에 대해 잡음 모델을 더 생성하는 것을 특징으로 하는 복호화 장치.
  5. 제3항에 있어서, 상기 다중잡음모델 생성부는 실제의 잡음정보 추정 오류를 보상하기 위한 파라메터의 값을 변화시키면서 생성된 잡음 모델들에 적용함으로써 복수개의 후보 잡음 모델들을 생성하는 것을 특징으로 하는 복호화 장치.
  6. 제2항에 있어서, 상기 잡음 확률 분포는 라플라시안(Laplacian), 가우시안(Gaussian), 일반화된 가우시안(generalized gaussian) 및 Two-sided Gamma 분포들 중의 적어도 하나를 포함하는 것을 특징으로 하는 복호화 장치.
  7. 제1항에 있어서, 상기 잡음모델 결정부는 부호화 장치로부터 수신된 패리티데이터로 채널 복호화가 이루어진 후 추정된 에러율에 기초하여 후보 잡음모델 중 수렴속도가 빠른 순으로 잡음모델을 선택하는 것을 특징으로 하는 복호화 장치.
  8. 제1항에 있어서, 상기 잡음모델 결정부는 상기 복수개의 후보 잡음모델들 각각을 사용하여 독립적으로 복호화가 이루어진 후 최소의 패리티데이터를 사용하여 CRC 검사를 통과한 잡음모델을 선택하는 것을 특징으로 하는 복호화 장치.
  9. 제1항에 있어서, 상기 채널코드 복호화부는
    상기 부호화 장치로부터 전송되는 압축데이터와 상기 잡음모델 결정부에서 선택한 잡음모델을 이용하여 상기 소정 채널코딩단위에 해당하는 보조정보상의 잡음오류를 정정하는 채널코드 복호화기와,
    상기 채널코드 복호화기에서 복호화된 소정 채널코딩단위의 복호화 신뢰도를 측정하는 채널코드 복호화 신뢰도 측정부를 포함하는 것을 특징으로 하는 복호화 장치.
  10. 제9항에 있어서, 상기 채널코드 복호화 신뢰도 측정부는 상기 채널코드 복호화기의 연판정 출력(Soft Output) 및 부호화 장치로부터 전송받는 CRC(Cyclic Redundancy Check)에 기반하여 채널코드의 복호화 신뢰도를 측정하는 것을 특징으로 하는 복호화 장치.
  11. 제9항에 있어서, 상기 채널코드 복호화 신뢰도 측정부는 상기 채널코드 복호화기의 연판정 출력 또는 부호화 장치로부터 전송받는 CRC에 기반하여 채널코드의 복호화 신뢰도를 측정하는 것을 특징으로 하는 복호화 장치.
  12. 제2항에 있어서, 상기 영상 복원부는
    상기 채널코드 복호화부에서 출력된 소정 채널코딩단위들을 저장하여 이들로 구성된 중간영상데이터를 출력하는 데이터 버퍼와;
    상기 잡음모델 결정부에서 상기 소정 채널코딩단위를 복호화시 결정한 잡음모델을 저장하는 잡음모델 버퍼와;
    상기 잡음모델 버퍼에 저장된 결정된 잡음모델들 중 영상 복원에 사용할 잡음모델을 결정하는 영상복원 잡음모델 결정부와;
    데이터 버퍼에 저장된 소정 채널코딩단위들로 구성된 중간영상데이터들과 보조정보와 상기 영상복원 잡음모델 결정부에서 결정된 잡음모델들을 이용하여 영상을 복원하는 영상복원기를 포함하는 것을 특징으로 하는 복호화 장치.
  13. 제12항에 있어서, 상기 영상복원 잡음모델 결정부는,
    상기 잡음모델 버퍼에 저장된 결정된 잡음모델들 중 최상위 비트 플레인의 복호화시 결정된 잡음모델을 영상 복원에 사용할 잡음모델로 결정하는 것을 특징으로 하는 복호화 장치.
  14. 제12항에 있어서, 상기 영상복원 잡음모델 결정부는,
    상기 잡음모델 버퍼에 저장된 결정된 잡음모델들 중 영상 복원시 가장 작은 MSE(Mean Squared Error)을 가지는 잡음모델을 영상 복원에 사용할 잡음모델로 결정하는 것을 특징으로 하는 복호화 장치.
  15. 제12항에 있어서, 상기 영상복원 잡음모델 결정부는,
    상기 잡음모델 버퍼에 저장된 비정상(non-stationary) 잡음모델들 중 최상위 비트 플레인의 복호화시 결정된 잡음모델을 영상 복원에 사용할 잡음모델로 결정하는 것을 특징으로 하는 복호화 장치.
  16. 제12항에 있어서, 상기 영상복원 잡음모델 결정부는,
    상기 잡음모델 버퍼에 저장된 결정된 잡음모델들 중 최하위 비트 플레인의 복호화시 결정된 잡음모델을 영상 복원에 사용할 잡음모델로 결정하는 것을 특징으로 하는 복호화 장치.
  17. 분산비디오 부호화 영상을 복호하는 복호화 방법에 있어서,
    부호화 장치로부터 전송되는 키픽춰 정보를 복원하는 단계와;
    상기 복원한 상기 키픽춰를 이용하여 보조정보를 생성하는 단계와;
    상기 보조정보에 있는 잡음오류들을 추정하기 위하여, 채널코딩단위에 포함된 적어도 하나의 비트를 기초로 생성한 복수개의 후보 잡음모델들로 구성된 다중잡음모델에 기초하여 소정 채널코딩단위에 대해 사용할 잡음 모델을 제공하는 단계와;
    상기 제공된 잡음 모델에 기초하여 상기 부호화 장치로부터 전송되는 압축데이터를 사용하여 보조 정보의 잡음 오류를 정정하는 단계와;
    소정의 복호화 단위에 대한 소정 채널코딩단위들을 복호하는 단계와;
    상기 복호화된 상기 소정 채널코딩단위들로 구성된 중간영상데이터 값과, 상기 보조정보와 상기 제공된 잡음모델들을 이용하여 WZ픽춰를 복원하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  18. 제17항에 있어서, 상기 잡음 모델을 제공하는 단계는,
    상기 보조정보에 있는 잡음오류들을 추정하기 위하여, 채널코딩단위에 포함된 적어도 하나의 비트를 기초로 생성한 복수개의 후보 잡음모델들로 구성된 다중잡음모델을 생성하는 단계와;
    상기 복수개의 후보 잡음 모델들 중 소정 채널코딩단위에 대해 사용할 잡음 모델을 결정하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  19. 제17항에 있어서, 상기 다중잡음모델을 생성하는 단계는
    상기 보조정보 전후의 키픽춰들 간의 차분을 이용하여 잡음을 예측하는 단계와,
    예측 잡음에 기초하여 잡음 확률 분포에 따른 잡음 모델을 생성하는 단계와, 상기 생성된 잡음 모델의 잡음 분포 특성에 따라 추가의 잡음 모델들을 더 생성하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  20. 제19항에 있어서, 상기 추가의 잡음 모델들을 더 생성하는 단계는
    상기 생성된 잡음 모델의 잡음 분포 특성에 따라 상기 생성된 잡음 모델의 Stationary/Non-stationary 특성 여부를 판단하는 단계와,
    상기 Stationary 및 Non-stationary 특성들 중 상기 생성된 잡음 모델이 가지지 않은 특성에 대해 잡음 모델을 더 생성하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  21. 제19항에 있어서, 상기 다중잡음모델을 생성하는 단계는 실제의 잡음정보 추정 오류를 보상하기 위한 파라메터의 값을 변화시키면서 상기 생성된 잡음 모델들에 적용함으로써 복수개의 후보 잡음 모델들을 생성하는 단계를 더 포함하는 것을 특징으로 하는 복호화 방법.
  22. 제17항에 있어서, 상기 잡음 확률 분포는 라플라시안(Laplacian), 가우시안(Gaussian), 일반화된 가우시안(generalized gaussian) 및 Two-sided Gamma 분포들 중 적어도 하나를 포함하는 것을 특징으로 하는 복호화 방법.
  23. 제17항에 있어서, 상기 잡음모델을 결정하는 단계는 부호화 장치로부터 수신된 패리티데이터로 채널 복호화가 이루어진 후 추정된 에러율에 기초하여 후보 잡음모델 중 수렴속도가 빠른 순으로 잡음모델을 선택하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  24. 제17항에 있어서, 상기 잡음모델을 결정하는 단계는 상기 복수개의 후보 잡음모델들 각각을 사용하여 독립적으로 복호화가 이루어진 후 최소의 패리티데이터를 사용하여 CRC 검사를 통과한 잡음모델을 선택하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  25. 제17항에 있어서, 상기 복호 단계는
    채널코드 복호에 따른 연판정 출력(Soft Output) 및 부호화 장치로부터 전송받는 CRC(Cyclic Redundancy Check)에 기반하여 채널코드의 복호화 신뢰도를 측정하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  26. 제17항에 있어서, 상기 복호 단계는
    채널코드 복호에 따른 연판정 출력 또는 부호화 장치로부터 전송받는 CRC에 기반하여 채널코드의 복호화 신뢰도를 측정하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
KR20100071433A 2009-07-23 2010-07-23 분산비디오 부호화 영상의 복호화 장치 및 그 방법 KR101180539B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020090067298 2009-07-23
KR20090067298 2009-07-23

Publications (2)

Publication Number Publication Date
KR20110010077A KR20110010077A (ko) 2011-01-31
KR101180539B1 true KR101180539B1 (ko) 2012-09-06

Family

ID=43499563

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20100071433A KR101180539B1 (ko) 2009-07-23 2010-07-23 분산비디오 부호화 영상의 복호화 장치 및 그 방법

Country Status (2)

Country Link
KR (1) KR101180539B1 (ko)
WO (1) WO2011010895A2 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080316364A1 (en) * 2007-06-25 2008-12-25 The Hong Kong University Of Science And Technology Rate distortion optimization for video denoising
KR100915097B1 (ko) * 2007-11-02 2009-09-02 성균관대학교산학협력단 오류정정을 이용한 분산비디오부호화 영상의 복호화 장치및 그 방법

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
논문1:IEEE
논문2:한국방송공학회*
논문3:IEEE

Also Published As

Publication number Publication date
WO2011010895A3 (ko) 2011-05-19
WO2011010895A2 (ko) 2011-01-27
KR20110010077A (ko) 2011-01-31

Similar Documents

Publication Publication Date Title
Brites et al. Encoder rate control for transform domain Wyner-Ziv video coding
Artigas et al. The DISCOVER codec: architecture, techniques and evaluation
US8374255B2 (en) Moving picture encoder, decoder, and coding system
US8111755B2 (en) Method and system for low-complexity Slepian-Wolf rate estimation in Wyner-Ziv video encoding
US8014619B2 (en) Method and apparatus for encoding/decoding an image
KR20090095012A (ko) 연속적인 움직임 추정을 이용한 영상 부호화, 복호화 방법및 장치
US8259804B2 (en) Method and system for signal prediction in predictive coding
US8446949B2 (en) Distributed coded video decoding apparatus and method capable of successively improving side information on the basis of reliability of reconstructed data
Slowack et al. Rate-distortion driven decoder-side bitplane mode decision for distributed video coding
Zhou et al. Distributed video coding using interval overlapped arithmetic coding
US7333660B2 (en) Apparatus for and method of coding moving picture
Huong et al. Artificial intelligence based adaptive gop size selection for effective wyner-ziv video coding
KR101639434B1 (ko) 와이너-지브 부호화 및 복호화 시스템 및 방법
KR101035746B1 (ko) 동영상 인코더와 동영상 디코더에서의 분산적 움직임 예측 방법
KR101180539B1 (ko) 분산비디오 부호화 영상의 복호화 장치 및 그 방법
Kodavalla et al. Distributed video coding: feedback-free architecture and implementation
Chen et al. A frame-level encoder rate control scheme for transform domain Wyner-Ziv video coding
JP2005516501A (ja) Pbフレームモードでのビデオ画像の符号化
KR101311410B1 (ko) 픽쳐 그룹의 구조를 변화시키는 분산 비디오 부호화/복호화 방법 및 이러한 방법을 수행하는 장치
Thao et al. Side information creation using adaptive block size for distributed video coding
JPWO2012127706A1 (ja) 動画像符号化装置及び動画像符号化方法
Wu et al. Image vector quantization codec indices recovery using Lagrange interpolation
KR101074919B1 (ko) 분산 비디오 부호화 영상의 복호화 장치 및 그 방법
KR20120049108A (ko) 고속 부호율-적응 저밀도 패리티 코드를 이용한 복호화 방법 및 이러한 방법을 사용하는 부/복호화 장치
KR100209133B1 (ko) 움직임 벡터정보에 대한 오류 복원기능을 갖는 영상 복호화기

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150703

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160607

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee