KR20090061306A - 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법 - Google Patents

부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법 Download PDF

Info

Publication number
KR20090061306A
KR20090061306A KR1020070128277A KR20070128277A KR20090061306A KR 20090061306 A KR20090061306 A KR 20090061306A KR 1020070128277 A KR1020070128277 A KR 1020070128277A KR 20070128277 A KR20070128277 A KR 20070128277A KR 20090061306 A KR20090061306 A KR 20090061306A
Authority
KR
South Korea
Prior art keywords
frame
encoder
bit rate
motion complexity
video coding
Prior art date
Application number
KR1020070128277A
Other languages
English (en)
Inventor
장준영
조한진
이귀상
배영환
전인산
김원종
이미영
김주엽
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020070128277A priority Critical patent/KR20090061306A/ko
Priority to US12/142,708 priority patent/US8275032B2/en
Publication of KR20090061306A publication Critical patent/KR20090061306A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 부호화율 제어(Encoder Rate Control) 기능을 갖는 분산 비디오 코딩(Distributed Video Coding) 장치 및 방법에 관한 것으로, 부호화율 제어를 통해 피드백 채널(feedback channel)을 사용하지 않거나 피드백 횟수를 줄임으로써 인코더의 복잡도를 낮추면서도 시스템 지연과 디코딩 복잡도를 줄일 수 있는 효과가 있다.
DVC, 피드백 채널, 부호화율 제어

Description

부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법{Distributed Video Coding Encoder with Low Complexity Encoder Rate Control and Method thereof}
본 발명은 비디오 코딩 성능을 개선할 수 있는 분산 비디오 코딩(Distributed Video Coding : 이하 'DVC'라 함) 장치 및 방법에 관한 것으로, 더욱 상세하게는, 부호화율 제어(Encoder Rate Control)를 통해 낮은 복잡도를 가지는 분산 비디오 코딩 장치 및 방법에 관한 것이다.
본 발명은 정보통신부 및 정보통신연구진흥원의 IT원천기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2005-S-007-03, 과제명: 온칩 네트워크 기반 SoC Platform 개발].
요즘, 카메라로부터 받아들인 영상을 정확하게 전송할 수 있는 비디오 압축 기술에 관한 많은 애플리케이션이 있다. 그러나, 무선 센서 네크워크 또는 작은 카메라 칩들을 사용하는 애플리케이션에 있어서, 카메라나 센서와 같은 단말기들은 처리 능력의 한계와 제한된 배터리 수명이라는 제약 조건을 가진다.
그래서 상기 애플리케이션들은 단말기로부터 받아들이는 많은 양의 영상 데이터를 인코딩할 때, 데이터 전송 비용을 줄이기 위하여 높은 압축률을 가져야 하며, 또한 배터리의 수명을 지속하기 위하여 작은 계산량이 필요하며, 채널 손실에 강인한 인코딩이 이루어져야 한다.
이러한 요구에 대응하여, "Noiseless coding of correlated information sources(D. Slepian and J. Wolf, IEEE Transactions on Information Theory, vol. 19, pp.471-480, July 1973.)"에 따른 Slepian-Wolf 이론과, "The rate-distortion function for source coding with side information at the decoder(A. D. Wyner and J. Ziv, IEEE Transactions on Information Theory, vol. 22, pp.1-10, Jan.1976.)"에 따른 Wyner-Ziv 이론들에 기반한 분산 비디오 코딩(DVC: Distributed video coding) 기법이 제시되었다.
이 DVC 기법은 인코더의 복잡도를 디코더로 이동시키기 위한 영상 코딩 방법으로, 인코더의 많은 계산을 디코더로 이동시킬 수 있으며, 또한 동일한 율-왜곡을 유지하면서 상술한 애플리케이션들이 가지고 있는 처리 능력의 한계와 제한된 배터리 수명 등의 제약 조건들을 만족시킬 수 있다.
이러한 DVC 기법을 이용한 대부분의 코딩 방법들이 비트율을 제어하기 위하여 피드백 채널을 사용한다. 피드백 채널을 사용할 경우, Wyner-Ziv 프레임을 디코딩하기 위하여 많은 동작들을 반복해야 한다. 따라서 피드백 채널의 사용은 많은 지연과 디코딩 복잡도를 증가시킨다.
상기 DVC 기법을 이용한 코딩 방법들을 구체적으로 예시하면, 먼저, PRISM (Power-efficient, Robust, hIgh-compression, Syndrome-based Multimedia coding)("PRISM: A video coding architecture based on distributed compression principles", R. Puri and K. Ramchandran, ERL Technical Report, pp. 93-102, March 2003. 참조)이 있다.
이 PRISM은 낮은 복잡도의, 분산소스코딩에 의한, 에러에 강인한, 디코더 움직임추정에 기반한 코딩 방법이다. 실험에 의하면 PRISM은 피드백을 필요로 하지 않으면서도 에러에 매우 강인한 특성을 보여주었다. 그러나 PRISM은 성능에 한계가 있고, 유연성이 좋지 못하여 근래에는 사용하지 않고 있다.
또 다른 방법으로는 Turbo codes을 사용하는 Girod et al.에 의한 방법("Distributed video coding", B. Girod, A. Aaron, S. Raneand D. R. Monedero, Proceedings of the IEEE, Special Issue on Video Coding and Delivery, pp. 71-88, Jan. 2005. 참조)이 있다.
이 방법은 인코더에서는 인트라 프레임을, 디코더에서는 인터 프레임을 압축하는 방법을 제안하였다. 영상들은 key 프레임들과 Wyner-Ziv 프레임들로 나뉘며, key 프레임은 전통적인 인트라-프레임 코덱을 사용하고, Key 프레임 사이에 있는 Wyner-Ziv 프레임들은 인트라-프레임 코덱을 이용하여 인코딩되지만 디코딩은 인트라-프레임 디코딩보다는 인터-프레임(inter-frame) 디코딩을 사용한다. 이 방법은 Slepian-Wolf coder에 기반을 두고, Rate Compatible Punctured Turbo code(RCPT)를 이용한다.
상기 방법에 있어서 디코더는 각각의 Wyner-Ziv 프레임을 디코딩하기 위하여, 이미 디코딩된 key 프레임들과 Wyner-Ziv 프레임들을 사용하여 사이드 정보(side information)를 만든다. Turbo decoder는 사이드 정보(side information)와 전송된 패리티 비트들을 사용하여 Wyner-Ziv 프레임을 디코딩한다.
그리고 스탠포드 대학의 연구그룹에서 제안한 최근의 DVC 방법("Wyner-Ziv video coding with hash-based motion compensation at the receiver", A. Aaron, S. Rane and B. Girod, Proceedings of IEEE International Conference on Image Processing, pp. 3097-3100, Oct. 2004. 참조)은 디코더가 더욱 정확한 사이드 정보(side information)를 생성해 낼 수 있도록, 인코더가 현재 Wyner-Ziv 프레임들에 대한 추가적인 정보를 생성하여 전송한다.
그러나 상술한 대부분의 방법들은 피드백 채널을 사용함으로 인한 근본적인 결점을 갖고 있다. 즉, 디코더가 현재 Wyner-Ziv 프레임을 디코딩하기 위해서는 인코더에서 해당되는 정보를 전송하여야 하며, 이때 피드백 채널은 디코더가 인코더에게 패리티 비트들을 요청할 수 있도록 하기 위해 생성된다. 이러한 피드백 채널을 사용함으로써 비트율을 적당히 유지할 수는 있지만, 불필요한 지연이 발생하고 디코더의 계산량을 증가시키게 된다.
이를 개선하기 위해 DVC 기법을 이용한 코딩 방법들에 있어서 Wyner-Ziv 프레임의 부호화율을 제어하여 피드백 횟수를 줄이거나 피드백 채널을 제거할 필요가 있다. 인코더에서 디코더로 전달해야 하는 Wyner-Ziv 프레임의 부호화율은 디코더에서 발생한 사이드 정보(side information)에 의해 결정적 영향을 받는다. 예를 들어, 디코더의 사이드 정보(side information)의 화질이 좋을수록 인코더가 보내야할 Wyner-Ziv 비트율이 줄어든다.
그러나 인코더측은 디코더에서 생성되는 사이드 정보(side information)를 모르기 때문에 디코더로 보내야할 Wyner-Ziv 프레임의 적정 비트율을 알지 못한다. 이와 관련된 몇 가지 해결책이 다음과 같이 제시되었다.
먼저, "Encoder Rate Control for Transform Domain Wyner-Ziv Video Coding", (C. Brites, F. Pereira, IEEE International Conference on Image Processing, San Antonio, Texas, USA, September 2007.)에서는 인코더에서 디코더의 연산을 미리 재현함으로써 디코더의 비트율을 계산하는 방법을 제안하고 있지만, 이는 상당한 량의 계산을 인코더에서 필요로 하게 된다.
상세하게, 상기 방법의 ERC 모듈은 디코더측의 필요 비트율을 예측하기 위해 원본 Wyner-Ziv 프레임의 이웃 프레임들을 사용하여 디코더의 연산을 실행한다고 보고, 이에 필요한 비트율(bitrate)을 계산한다. 그리고 인코더에서는 사이드 정보(side information)를 얻기 위하여, 이것을 낮은 복잡도의 사이드 정보(side information) 생성 모듈에 적용할 수 있다.
그리고, 인코더에서 사이드 정보(side information)의 엔트로피(entropy)를 계산함으로써 비트율을 계산할 수 있다. 따라서 이 방법은 디코더측의 필요 비트율을 잘 예측할 수는 있지만 인코더에서의 계산량을 증가시키는 문제점이 있다.
다른 방법으로, "Unidirectional Distributed Video Coding for low cost Video Encoding(W.A.R.J. Weerakkody, W.A.C. Fernando, IEEE Transactions on Consumer Electronics, Vol. 53, No. 2, pp. 788-795, 2007.)"에서 제안된 시스템은 사용자가 인코더의 패리티 비트율(parity bitrate)을 제어(control)하기 위해서 펑처링 패턴(puncturing pattern)을 입력한다. 이 과정에서 인코더는 피드백 채널(feedback channel)을 제거하기 위한 비트율 제어(bitrate control)에서 패리티 펑처링 패턴(parity pucturing pattern)을 결정하는데 블라인드 기법(blind technique)을 이용한다. 사용자의 입력이 각 비트플랜(bitplane)의 비트율(bitrate)을 결정한다. 첫 번째 비트플랜(bitplane)에서는 1/8을 보내고, 점점 높은 비트플랜(bitplane)일수록 패리티 비트율(parity bitrate)은 점진적으로 증가한다. 이에 따라 비트플랜(bitplane)이 높아질수록 사이드 정보(side information)의 노이즈 레벨(noise level)도 증가하는 비효율적인 문제점이 있다.
상술한 바와 같이, 기존의 DVC 방법은 피드백 채널을 사용하기 때문에, 디코딩 지연과 디코더의 복잡도를 증가시킨다는 문제점이 있으며, 이를 해결하기 위해 몇몇 방법들이 제안되었으나, 이는 상기 문제점을 해결하는 대신에 디코더의 비트율을 예측하기 위하여 인코더의 계산량을 증가시키는 또 다른 문제점을 야기시켰다.
이에, 본 발명은 디코더의 비트율(bitrate)과 사이드 정보와 움직임 복잡도(motion complexity) 사이의 상관성을 기반으로, 인코더가 비디오 영상의 움직임 복잡도를 이용해 간단하게 디코더의 비트율을 예측하고, 이를 이용해 부호화율을 통제함으로써 피드백 수를 감소시키거나 완전히 피드백 채널을 제거할 수 있는 코딩 장치 및 방법을 제공하고자 한다.
본 발명의 일실시 형태에 따른 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치는 키(key) 프레임을 수신하여 인코딩하고, 인코딩된 키 프레임의 비트 스트림을 출력하는 인트라-프레임 인코더; 움직임 복잡도와 비트율의 상관관계를 이용해 현재 WZ(Wyner-Ziv) 프레임의 움직임 복잡도에 따른 비트율을 계산하는 ERC(Encoder Rate Control) 모듈; 및 상기 ERC 모듈에서 계산된 비트율로 상기 WZ 프레임을 인코딩하고, 인코딩된 WZ 비트 스트림을 출력하는 터보 인코더;를 포함한 다.
또한, 본 발명의 분산 비디오 코딩 장치는 상기 WZ 프레임을 균등 양자화하여 상기 터보 인코더에 제공하는 균등 양자화기; 및 상기 터보 인코더로부터 인코딩된 WZ 비트 스트림을 저장하여 비트열로 출력하는 버퍼;를 더 포함한다.
또한, 상기 터보 인코더는 상기 ERC 모듈에서 계산된 상기 비트율에 맞추어 패리티 비트 수를 결정한다.
또한, 상기 ERC 모듈은 상기 WZ 프레임과 키 프레임의 움직임 차이를 이용하여 움직임 복잡도를 구하고, 상기 움직임 복잡도에 상수 k를 곱하여 상기 비트율을 예측한다.
또한, 상기 상수 k는 디코더의 목표 영상 화질에 따라서 설정된다.
한편, 본 발명의 일실시 형태에 따른 부호화율 제어 기능을 갖는 분산 비디오 코딩 방법은 WZ 프레임과 키 프레임을 획득하는 단계; 상기 WZ 프레임과 키 프레임을 이용해 움직임 복잡도를 계산하는 단계; 상기 움직임 복잡도와 비트율의 선형적 상관관계를 이용해 WZ 비트 스트림의 비트율을 예측하는 단계; 및 상기 예측된 WZ 비트 스트림의 비트율에 따라서 상기 WZ 프레임을 인코딩하는 단계;를 포함한다.
또한, 상기 움직임 복잡도를 계산하는 단계는, 상기 WZ 프레임과 키 프레임을 이용하여 현재 WZ 프레임과 이전 키 프레임의 움직임 차이를 아래 식과 같이 계산하여 움직임 복잡도를 구한다.
Figure 112007088980341-PAT00001
(여기서,
Figure 112007088980341-PAT00002
는 WZ 프레임(X2i)에 대한 움직임 복잡도, m×n은 영상의 크기,
Figure 112007088980341-PAT00003
는 키(key) 프레임,
Figure 112007088980341-PAT00004
는 WZ 프레임, (k, l)은 픽셀 좌표를 각각 나타낸다.)
또한, 상기 움직임 복잡도를 이용해 비트율을 예측하는 단계는 상기 계산된 움직임 복잡도에 상수 k를 곱하여 비트율을 예측한다.
또한, 본 발명의 분산 비디오 코딩 방법은 목표 화질에 따라 상기 상수 k를 변경하여 디코딩될 영상의 화질을 조정하는 단계를 더 포함한다.
본 발명에 의하면, 인코더의 계산량을 증가시키지 않고, 간단하게 디코더의 비트율을 예측하여 부호화율 제어(encodig rate control)를 할 수 있으며, 그 결과, 인코더의 복잡도를 증가시키지 않으면서 피드백 채널을 없애거나 피드백 수를 감소시킴으로써 디코딩 지연과 디코딩 복잡도를 줄일 수 있는 효과가 있다.
이하 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있는 바람직한 실시 예를 상세히 설명한다.
다만, 본 발명의 바람직한 실시 예에 대한 동작 원리를 상세하게 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 또한, 도면 전체에 걸쳐 유사한 기능 및 작용을 하는 부분에 대해서는 동일한 도면 부호를 사용한다.
또한, '모듈'이란 용어는 특정한 기능이나 동작을 처리하는 하나의 단위를 의미하며, 이는 하드웨어 또는 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
본 발명의 일실시 형태에 따른 부호화율 제어를 이용한 분산 비디오 코딩 장치를 설명하기 전에, 도 1을 참조하여 본 발명에서 이용되는 영상에서의 움직임 복잡도(motion complexity)와 Wyner-Ziv(이하 'WZ'라고 함) 비트 스트림의 비트율(bitrate) 사이의 상관성에 대해 설명한다.
먼저, 영상에서의 움직임 복잡도와 WZ 비트 스트림의 비트율 사이의 상관성을 이해하기 위해, 디코더에서 생성되는 사이드 정보(side information)와 영상의 움직임 복잡도와의 상호작용 관계를 살펴보면, 영상의 움직임(motion)이 작고 물체의 움직임이 쉽게 예측되면, 즉 영상의 움직임 복잡도가 낮으면, 사이드 정보의 화질은 향상되고, 이와 반대인 경우는 사이드 정보의 화질이 나쁘게 된다. 그리고, 사이드 정보의 화질이 좋을수록 디코더에서도 더 적은 양의 WZ 비트 스트림의 비트율을 요구한다. 따라서, WZ 비트 스트림의 비트율은 영상의 움직임 복잡도에 비례함을 유추할 수 있다.
따라서, 영상에서의 움직임 복잡도와 WZ 비트 스트림의 비트율 사이에 존재하는 상관성을 이용하여 디코더에서 필요한 비트율을 예측할 수 있다.
도 1은 영상의 움직임 복잡도와 비트율과의 상관성을 나타낸 그래프이다.
먼저, 도 1의 (a)는 프레임간 움직임의 차이로 추정한 움직임 복잡도의 변화 정도를 나타낸 그래프로, 실험에서는 Foreman 영상의 50개 프레임을 사용하였다.
여기에서 영상의 움직임 복잡도를 예측하기 위해 두 개의 프레임간 움직임 차이를 이용한다. 그리고, 이전 프레임과 현재 프레임의 움직임 차이를 아래 수학식 1을 이용해 구한다.
Figure 112007088980341-PAT00005
여기서,
Figure 112007088980341-PAT00006
는 이전 프레임과 현재 프레임의 차이로 구한 움직임 복잡도, m ×n은 프레임의 크기, k는 현재 프레임, k-1은 이전 프레임, P(i, j)는 프레임에서의 픽셀 값을 나타낸다.
그리고, 도 1의 (b)는 도 1의 (a)와 동일한 프레임을 적용하여 측정된 프레 임별 비트율의 변화 정도를 나타낸 그래프이다. 도 1의 (a)와 (b)를 비교하면, 움직임 복잡도(
Figure 112007088980341-PAT00007
)와 비트율의 변화 정도가 매우 유사하다. 따라서 영상에서의 움직임 복잡도와 WZ 비트율 사이에 상관성이 존재함을 알 수 있다. 본 발명의 분산 비디오 코딩 장치는 이러한 움직임 복잡도와 비트율 사이의 상관성을 이용하여 부호화율을 제어한다.
도 2는 본 발명의 일실시 형태에 따른 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치의 구조를 나타낸 것이다.
도 2를 참조하면, 본 발명에 따른 분산 비디오 코딩 장치는 키 프레임(key frame)을 부호화하기 위한 인트라 프레임 인코더(intra-frame encoder)(200)와, WZ 프레임을 균등한 비트플랜(bitplane1,....., bitplaneMk)으로 양자화하는 2M-level 균등 양자화기(100)와, WZ 프레임의 비트플랜들을 부호화하는 터보 인코더(turbo encoder)(300)와, 터보 인코더의 부호화율을 제어하는 ERC 모듈(400)과 부화화된 프레임을 비트열로 출력하는 버퍼(500)로 구성되며, 터보 인코더(300)는 shepian-wolf encoder를 기반으로 한다.
또한, 본 발명에 따른 분산 비디오 코딩 장치는 상기 터보 인코더(300)에서 인코딩된 WZ 프레임의 비트 스트림을 수신하여 디코딩하는 터보 디코더(600)와 인코딩된 키프레임의 비트 스트림을 디코딩하는 인트라 프레임 디코더(700)와 상기 인트라 프레임 디코더(700)에서 디코딩된 키 프레임을 이용해 사이드 정보를 생성 하는 사이드정보 생성모듈(800)과 사이드 정보와 디코딩된 WZ 프레임을 재구성하는 재구성 모듈(900)을 포함하여 구성된다.
이와 같이 구성된 본 발명의 분산 비디오 코딩 장치에 있어서, 처리할 영상들은 키 프레임들과 WZ 프레임들로 나뉘며, 키 프레임은 인트라-프레임 인코더(200)에 의해 압축되고, 키 프레임들 사이에 있는 WZ 프레임들은 터보 인코더(300)를 사용하여 압축된다. 그리고, 본 발명의 분산 비디오 코딩 장치는 부호화율 제어를 위한 ERC 모듈(400)을 포함하여 터보 디코더(600)의 피드백 채널을 제거하거나 피드백 수를 감소시킴으로써 낮은 복잡도를 가진다.
구체적으로, ERC 모듈(400)은 현재의 WZ 프레임에 대한 움직임 복잡도를 추정하기 위해 현재 WZ 프레임과 이전 키 프레임의 움직임 차이를 계산한다. 이를 위해 ERC 모듈(400)이 현재 WZ 프레임들의 이전 프레임들을 쉽게 얻을 수 있다고 가정한다.
즉, ERC 모듈(400)은 모든 WZ 프레임(X2i)에 대한 움직임 복잡도(
Figure 112007088980341-PAT00008
)를 수학식 2를 이용해 계산한다.
Figure 112007088980341-PAT00009
여기서, m×n은 영상의 크기,
Figure 112007088980341-PAT00010
는 키(key) 프레임,
Figure 112007088980341-PAT00011
는 WZ 프레 임, (k, l)은 픽셀 좌표를 각각 나타낸다.
또한, 본 발명에 따른 분산 비디오 코딩 장치는 터보 인코더(300)의 부호화율 제어를 단순하게 유지하기 위하여 도 1에 도시된 바와 같은 영상의 움직임 복잡도와 비트율 사이의 선형적인 상관관계를 이용한다. 이러한 선형적인 상관관계는 수학식 3과 같다.
α2i=kβ2i
여기서, α2i는 WZ 프레임(
Figure 112007088980341-PAT00012
)의 비트율, β2i는 현재 프레임과 이전 프레임의 움직임 차이에 의해 계산된 움직임 복잡도, k는 상수를 나타낸다.
즉, ERC 모듈(400)은 움직임 복잡도(β2i)에 곱해지는 상수 k 값을 조절하여 터보 디코더(600)의 패리티 비트 수를 결정한다. 상수 k에 대한 초기값은 실험 결과를 이용하여 결정할 수 있으며, 또한 사용자가 필요한 화질과 시스템의 능력에 따라 k값을 조절할 수 있다.
바람직하게는, 피드백 채널을 사용하지 않는 경우는 사용자가 목표 화질을 맞추기 위하여 k를 변경할 때를 제외하고, 모든 영상에 있어서 같은 값의 k를 사용한다.
더하여, 피드백 채널을 사용하는 경우는 터보 인코더(300)에서 출력된 WZ 비트 스트림의 비트율이 터보 디코더(600)에서 필요한 비트율보다 많거나 적으면, 터 보 디코더(600)가 ERC 모듈(400)에게 새로운 비트율을 요청하는 메시지를 피드백 채널을 통해 보내도록 할 수 있다. 즉, 시스템은 k 값을 수정하기 위하여 피드백 채널을 이용할 수 있다.
따라서 본 발명은 ERC 모듈(400)을 통해, 움직임 복잡도와 비트율 사이의 선형적 상관관계를 이용해 부호화율을 간단하게 제어함으로써 터보 디코더(600)의 피드백 채널을 없애거나 피드백 수를 줄일 수 있다.
도 3은 본 발명의 일실시 형태에 따른 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치가 부호화율 제어를 통해 프레임을 코딩하는 과정을 나타낸 순서도이다.
도 3을 참조하면, ERC 모듈(400)에서 WZ 프레임과 키 프레임을 획득(S1010)하고, 상기 획득한 WZ 프레임과 키 프레임의 프레임간 움직임 차이를 이용해 움직임 복잡도를 수학식 2와 같이 계산한다(S1020). 그런 다음, 도 1에 도시된 바와 같은 움직임 복잡도와 비트율의 상관관계에 따라, 상기 움직임 복잡도로부터 WZ 비트 스트림의 비트율을 수학식 3과 같이 계산하여 예측한다(S1030). 예측한 WZ 비트 스트림의 비트율을 터보 인코더(300)에 전달한다.
터보 인코더(300)는 상기 ERC 모듈(400)에서 예측된 WZ 비트 스트림의 비트율에 따라 패리티 비트 수를 결정하여 상기 WZ 프레임을 부호화한다(S1040).
또한, 본 발명은 수학식 3에서 목표 화질에 따라 상수 k를 변경하는 것에 의해 WZ 비트 스트림의 비트율을 조절할 수 있다.
이상에서 설명한 본 발명은 전술한 실시 예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경할 수 있다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 당업자에게 있어 명백할 것이다.
도 1은 본 발명의 일실시 형태에 따른 부호화율 제어(Encoder Rate Control) 기능을 갖는 분산 비디오 코딩 장치에 있어서, 움직임 복잡도와 WZ 비트율과의 상관성을 나타낸 도면, 그리고,
도 2는 본 발명의 일실시 형태에 따른 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치의 구성을 나타낸 도면, 그리고,
도 3은 본 발명의 일실시 형태에 따른 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치가 부호화율 제어를 통해 프레임을 코딩하는 방법을 나타낸 순서도이다.

Claims (9)

  1. 키(key) 프레임을 수신하여 인코딩하고, 인코딩된 키 프레임의 비트 스트림을 출력하는 인트라-프레임 인코더;
    움직임 복잡도와 비트율의 상관관계를 이용해 현재 WZ(Wyner-Ziv) 프레임의 움직임 복잡도에 따른 비트율을 계산하는 ERC(Encoder Rate Control) 모듈; 및
    상기 ERC 모듈에서 계산된 비트율로 상기 WZ 프레임을 인코딩하고, 인코딩된 WZ 비트 스트림을 출력하는 터보 인코더;
    를 포함하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치.
  2. 제1항에 있어서,
    상기 WZ 프레임을 균등 양자화하여 상기 터보 인코더에 제공하는 균등 양자화기; 및
    상기 터보 인코더로부터 인코딩된 WZ 비트 스트림을 저장하여 비트열로 출력하는 버퍼;
    를 더 포함하는 것을 특징으로 하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치.
  3. 제1항에 있어서,
    상기 터보 인코더는 상기 ERC 모듈에서 계산된 상기 비트율에 맞추어 패리티 비트 수를 결정하는 것을 특징으로 하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치.
  4. 제1항에 있어서,
    상기 ERC 모듈은 상기 WZ 프레임과 키 프레임의 움직임 차이를 이용하여 움직임 복잡도를 구하고, 상기 움직임 복잡도에 상수 k를 곱하여 상기 비트율을 예측하는 것을 특징으로 하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치.
  5. 제4항에 있어서,
    상기 상수 k는 디코더의 목표 영상 화질에 따라서 설정되는 것을 특징으로 하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치.
  6. WZ 프레임과 키 프레임을 획득하는 단계;
    상기 WZ 프레임과 키 프레임을 이용해 움직임 복잡도를 계산하는 단계;
    상기 움직임 복잡도와 비트율의 선형적 상관관계를 이용해 WZ 비트 스트림의 비트율을 예측하는 단계; 및
    상기 예측된 WZ 비트 스트림의 비트율에 따라서 상기 WZ 프레임을 인코딩하는 단계;
    를 포함하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 방법.
  7. 제6항에 있어서, 상기 움직임 복잡도를 계산하는 단계는,
    상기 WZ 프레임과 키 프레임을 이용하여 현재 WZ 프레임과 이전 키 프레임의 움직임 차이를 아래 식과 같이 계산하여 움직임 복잡도를 구하는 것을 특징으로 하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 방법.
    Figure 112007088980341-PAT00013
    (여기서,
    Figure 112007088980341-PAT00014
    는 WZ 프레임(X2i)에 대한 움직임 복잡도, m×n은 영상의 크기,
    Figure 112007088980341-PAT00015
    는 키(key) 프레임,
    Figure 112007088980341-PAT00016
    는 WZ 프레임, (k, l)은 픽셀 좌표를 각각 나타낸다.)
  8. 제7항에 있어서,
    상기 움직임 복잡도를 이용해 비트율을 예측하는 단계는 상기 계산된 움직임 복잡도에 상수 k를 곱하여 비트율을 예측하는 것을 특징으로 하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 방법.
  9. 제8항에 있어서,
    목표 화질에 따라 상기 상수 k를 변경하여 디코딩될 영상의 화질을 조정하는 단계를 더 포함하는 것을 특징으로 하는 부호화율 제어 기능을 갖는 분산 비디오 코딩 방법.
KR1020070128277A 2007-12-11 2007-12-11 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법 KR20090061306A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070128277A KR20090061306A (ko) 2007-12-11 2007-12-11 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법
US12/142,708 US8275032B2 (en) 2007-12-11 2008-06-19 Distributed video coding apparatus and method capable of controlling encoding rate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070128277A KR20090061306A (ko) 2007-12-11 2007-12-11 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20090061306A true KR20090061306A (ko) 2009-06-16

Family

ID=40721639

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070128277A KR20090061306A (ko) 2007-12-11 2007-12-11 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법

Country Status (2)

Country Link
US (1) US8275032B2 (ko)
KR (1) KR20090061306A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110003094A (ko) * 2009-07-03 2011-01-11 성균관대학교산학협력단 비디오 부호화 장치, 비디오 복호화 장치, 비디오 부호화 방법 및 비디오 복호화 방법
US20130146262A1 (en) * 2011-12-12 2013-06-13 Hs R & A Co., Ltd. Double pipe heat exchanger having multi-directional connector and air conditioner for vehicle including the same
KR20150128072A (ko) * 2014-05-08 2015-11-18 삼성전자주식회사 분산 터보 코딩 장치 및 방법

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008240343B2 (en) * 2008-10-31 2012-04-19 Canon Kabushiki Kaisha Rate-distortion control in DVC with no feedback
AU2008246243B2 (en) * 2008-11-19 2011-12-22 Canon Kabushiki Kaisha DVC as generic file format for plenoptic camera
CA2689338A1 (en) * 2008-12-29 2010-06-29 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada Differential data representation for distributed video coding
US8599929B2 (en) * 2009-01-09 2013-12-03 Sungkyunkwan University Foundation For Corporate Collaboration Distributed video decoder and distributed video decoding method
CN101835042B (zh) * 2010-03-19 2013-01-23 西安电子科技大学 基于无反馈速率控制的Wyner-Ziv视频编码系统及方法
CN103997654A (zh) * 2014-06-09 2014-08-20 天津大学 低时延的多视点分布式视频编码系统帧排列方式
CN104079945A (zh) * 2014-07-09 2014-10-01 天津大学 多视点分布式视频编码系统帧排列选择方法
CN104301729B (zh) * 2014-09-07 2018-04-10 南京邮电大学 一种无反馈分布式视频编码的码率控制方法
US10257528B2 (en) 2015-10-08 2019-04-09 Electronics And Telecommunications Research Institute Method and apparatus for adaptive encoding and decoding based on image quality
CN110708570B (zh) * 2019-10-21 2022-05-17 腾讯科技(深圳)有限公司 视频的编码码率确定方法、装置、设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5543853A (en) * 1995-01-19 1996-08-06 At&T Corp. Encoder/decoder buffer control for variable bit-rate channel
US6859496B1 (en) * 1998-05-29 2005-02-22 International Business Machines Corporation Adaptively encoding multiple streams of video data in parallel for multiplexing onto a constant bit rate channel
US7623719B2 (en) * 2003-09-26 2009-11-24 The Regents Of The University Of California Video encoding methods and devices
US8355435B2 (en) * 2007-06-15 2013-01-15 Freescale Semiconductor, Inc. Transmission of packet data

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110003094A (ko) * 2009-07-03 2011-01-11 성균관대학교산학협력단 비디오 부호화 장치, 비디오 복호화 장치, 비디오 부호화 방법 및 비디오 복호화 방법
US20130146262A1 (en) * 2011-12-12 2013-06-13 Hs R & A Co., Ltd. Double pipe heat exchanger having multi-directional connector and air conditioner for vehicle including the same
USD819186S1 (en) 2011-12-12 2018-05-29 Hs R & A Co., Ltd. Connector for double pipe heat exchanger
KR20150128072A (ko) * 2014-05-08 2015-11-18 삼성전자주식회사 분산 터보 코딩 장치 및 방법

Also Published As

Publication number Publication date
US8275032B2 (en) 2012-09-25
US20090147841A1 (en) 2009-06-11

Similar Documents

Publication Publication Date Title
KR20090061306A (ko) 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법
Ascenso et al. The VISNET II DVC codec: architecture, tools and performance
KR101071725B1 (ko) 움직임 정보 피드백을 이용한 분산 비디오 코덱
Chiu et al. Hybrid distributed video coding with frame level coding mode selection
Slowack et al. Distributed video coding with feedback channel constraints
US20080279281A1 (en) Method and System for Compound Conditional Source Coding
Kodavalla et al. Distributed video coding: codec architecture and implementation
Song et al. Can gray code improve the performance of distributed video coding?
Belyaev et al. A Low-Complexity Joint Source-Channel Videocoding for 3-D DWT Codec.
Milani et al. Distributed video coding based on lossy syndromes generated in hybrid pixel/transform domain
US8576905B2 (en) Central decoding controller and controlling method thereof
Chiu et al. Distributed video coding: a promising solution for distributed wireless video sensors or not?
Majumdar et al. Complexity/performance trade-offs for robust distributed video coding
KR101035746B1 (ko) 동영상 인코더와 동영상 디코더에서의 분산적 움직임 예측 방법
Sechelea et al. On the rate-distortion function for binary source coding with side information
Song et al. Progressive correlation noise refinement for transform domain Wyner-Ziv video coding
Deligiannis et al. Efficient hash-driven Wyner-Ziv video coding for visual sensors
Hanca et al. Real-time distributed video coding for 1K-pixel visual sensor networks
Huang et al. Transform domain Wyner-Ziv video coding with refinement of noise residue and side information
Li et al. Distributed video coding based on conditional entropy hash
KR101072626B1 (ko) 비트율 제어 방법과 장치 및 이를 이용한 분산 비디오 코딩 방법과 장치
Micallef et al. Improved Wyner-Ziv video coding efficiency using bit plane prediction
Thao et al. Side information creation using adaptive block size for distributed video coding
Haqqani et al. Encoder rate control for transform domain Wyner-Ziv Video Coding
Slowack et al. Distributed Video Coding: principles and challenges

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application