KR100918560B1 - 실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법 - Google Patents

실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법 Download PDF

Info

Publication number
KR100918560B1
KR100918560B1 KR1020020059484A KR20020059484A KR100918560B1 KR 100918560 B1 KR100918560 B1 KR 100918560B1 KR 1020020059484 A KR1020020059484 A KR 1020020059484A KR 20020059484 A KR20020059484 A KR 20020059484A KR 100918560 B1 KR100918560 B1 KR 100918560B1
Authority
KR
South Korea
Prior art keywords
bit amount
dct
frame
bit
predicting
Prior art date
Application number
KR1020020059484A
Other languages
English (en)
Other versions
KR20040028332A (ko
Inventor
김재균
권재철
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020020059484A priority Critical patent/KR100918560B1/ko
Publication of KR20040028332A publication Critical patent/KR20040028332A/ko
Application granted granted Critical
Publication of KR100918560B1 publication Critical patent/KR100918560B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 H.263 영상 부호기에서 주어진 비트율과 왜곡 제약조건을 만족시키기 위해 적응적으로 영상의 부호율을 제어해야 하는 경우, 영상을 부호화하기 이전에 미리 해당 프레임으로부터 발생될 비트량을 예측함으로써, 예측의 정확성을 높이면서도 지연을 크게 줄일 수 있는 비트량 예측 장치 및 그 방법에 관한 것으로,
본 발명에 따른 비트량 예측장치는, 영상 부호화 시스템에서 각 영상 프레임을 부호화할 때 발생될 비트율과 왜곡의 양을 예측하기 위해 비트량 예측장치에 있어서, 이산여현변환(DCT)부로부터 프레임의 DCT 계수를 입력받아, DCT 블록의 (i,j)th 번째 계수 COEFFi,j의 양자화 레벨을 '0'으로 만드는 양자화 변수들 중 가장 작은 값 QPZi,j를 계산하는 QPZ 결정수단; 상기 QPZ 결정수단의 결과를 한 프레임동안 누적시켜 임의의 양자화 변수(Qp)값을 적용시켰을 때 '0'이 아닌 DCT 계수(NZC)들의 개수를 계산하는 NZC 계수수단: 상기 NZC 계수수단에 의해 얻어진 결과와 이전 프레임에서 얻은 비례계수 정보를 이용해 DCT 성분으로부터 발생되는 비트량을 예측하는 DCT 성분 비트량 예측수단; 및 상기 DCT 성분 비트량 예측수단에 의해 얻어진 결과와 이미 알려져 있는 이전 프레임의 non-DCT 성분에 대한 비트량으로부터 현재 프레임에 대한 총 비트량을 예측하는 총 비트량 예측수단을 포함한다.
영상, 부호, 비트율, 제어, 예측, 비트량

Description

실시간 H.263 영상 부호율 제어를 위한 비트량 예측 장치 및 그 방법{Apparatus and method for prediction of bit rate in real-time H.263 video coding rate control}
도1은 본 발명이 적용되는 실시간 H.263 영상 부호화 시스템의 블록 구성도.
도2는 본 발명에 따른 비트율 예측기의 블록 구성도.
도3은 양자화 변수 값에 따른 본 발명에 따른 R-Q 모델의 예측 성능을 나타낸 그래프.
도4a 및 도4b는 본 발명에 따른 비트량 예측기의 예측 성능(Qp=10일 때)을 설명하기 위한 그래프.
*도면의 주요부분에 대한 부호의 설명
21 : QPZ 결정부
22 : NZC 계수부
23 : DCT 성분 비트량 예측부
24 : 총 비트량 예측부
본 발명은 실시간 H.263 영상 부호화 알고리즘을 사용하는 영상 부호기에서 비트율 제약 조건을 만족시키기 위해 적응적으로 영상의 부호율을 제어해야 하는 경우, 영상을 부호화하기 이전에 미리 발생될 비트량을 예측함으로써 효율적인 비트율 제어가 가능하도록 하는데 필요한 비트량 예측 장치 및 그 방법에 관한 것이다. 더욱 자세하게는, 본 발명은 영상의 비트율을 제어하는데 있어서 각 영상 프레임을 부호화할 때 발생될 비트율과 왜곡의 양을 예측하여 주어진 여러 가지 제약 조건(채널전송률, 버퍼 충만도 등)을 동시에 만족시킬 수 있도록 영상 프레임들을 부호화하는데 필요한 비트량 예측장치 및 그 방법에 관한 것이다.
종래의 비트량 예측 방법으로는 크게 해석적 방식과 경험적 방식으로 구분된다.
해석적 방식은 영상 신호를 독립이고 동일분포(independent and identically distributed)인 가우스 분포 또는 라플라스 분포를 가지는 확률 변수로 근사화하고, 정보이론에서 제공하는 율-왜곡 함수를 구해 이를 비트량으로 환산하는 방식이다. 이 방식은 비트량과 왜곡간의 관계를 간단 명료한 수식으로 규정해 주지만, 실제 영상 신호는 가우스 분포나 라플라스 분포를 잘 따르지 않으므로 추정 오차가 큰 단점이 있다. 해석적 R-D(rate-distortion) 모델은 그 단순함에도 불구하고 예측 오차가 커지는 단점 때문에 실제의 경우 사용하기 어렵다. 따라서, 보다 정확 한 R-Q(rate-quantization parameter) 모델을 얻으려는 노력으로서 여러 가지 경험적 방식이 제안되었다.
경험적 방식은 비교적 정확한 R-Q 모델을 얻기 위해 처리 지연을 감수할 수 있는 응용에 적합한 방식이며, 주로 부호화하려는 현재 프레임을 서로 다른 양자화 변수값으로 사전에 여러 번 부호화해서 얻은 (R,Q)쌍 정보를 적절한 내삽(interpolation) 함수에 적용시켜 R-Q 또는 R-D 간의 관계를 모델링 한다.
따라서 다양한 내삽 모델이 존재할 수 있으며, 모델 변수가 많을수록 정확한 예측이 가능하다. 대개의 경우 모델 변수는 두 개 또는 세 개로 이루어진다. 대표적인 기존의 몇 가지 경험적 R-Q 또는 R-D 모델의 예를 들면 다음과 같다.
수학식 1의 모델은 세 개의 모델 변수로 R-Q 모델을 정의한다. 이 모델의 모델 변수를 얻기 위해서는 세 개의 (R,Q) 쌍 정보가 필요하기 때문에, 기본적으로 3 프레임 시간(frame time)의 부호화 지연이 발생한다.
Figure 112002032186668-pat00001
상기 수학식 1를 단순하게 변형한 것으로서 대수적(logarithmic) R-Q 모델도 제안되었다. 이 모델의 기본 아이디어는 양자화 변수값이 극단적인 값을 제외한 4≤Q≤25 인 보통의 경우 log R 값이 log Q와 선형 관계에 있다는 것을 이용한 것이다. 이 모델은 두 개의 모델 변수에 의해 정의되는데, 의미 있는 Q값 영역을 벗어나는 경우 예측 오차는 급격하게 증가하는 단점이 있다.
Figure 112002032186668-pat00002
아래의 수학식 3은 선형(linear) R-Q 모델로서, 세 개의 모델 변수에 의해 정의된다. 따라서 이 모델도 비교적 정확하게 예측하기 위해서는 3 프레임 시간(frame time)의 부호화 지연을 피할 수 없다.
Figure 112002032186668-pat00003
아래의 수학식 4는 이차식 기반(quadratic) R-Q 모델로서, 이론적 근거는 DCT 계수의 분포 특성이 라플라스 분포를 가진다는 가정으로부터 출발한다. 라플라스 분포에 대한 R-D 모델을 R(D)=ln(1/αD)로 근사화한 것을 다항식으로 전개하고, 대부분의 값이 첫 세 개의 항에 몰려 있다는 사실을 이용하여 수학식 4와 같은 모델로 다시 근사화하였다.
Figure 112002032186668-pat00004
이 모델은 위의 모델들에 비해 모델 변수가 하나 적어 두 프레임 시간의 지연만으로 모델 변수를 구할 수 있는 장점이 있지만, 여러 번 근사화 과정을 거쳤기 때문에 예측 성능에 있어서는 다소 떨어진다.
위에서 기술한 경험적 모델의 정확성은 정확한 모델 변수를 구하는데 의존하게 되는데, 만일 실시간 처리가 요구되는 응용에서 이러한 모델을 사용하는 경우에 는 이미 부호화를 끝낸 과거 프레임들의 (R, Qp) 정보로부터 모델 변수를 구해 현재 프레임에 적용해야 한다. 이 경우 모델 변수를 얻기 위해 이동평균, 직전프레임의 모델변수 사용, 선형 회기(linear regression) 등 여러 가지 방식이 사용될 수 있는데, 현재 프레임의 특성이 과거 프레임의 특성과 크게 다를 경우에는 예측 오차가 커지는 것을 막을 수 없다. 만일 영상의 재생 지연이 어느 정도 커도 관계가 없는 응용에서 이 모델을 사용하는 경우에는 현재 프레임을 두 번 또는 세 번 미리 부호화한 결과로 얻어지는 (R, Qp) 쌍 정보로부터 모델 변수를 구할 수 있으므로, 비교적 정확한 예측이 가능하다. 그러나 정확한 예측을 위해서는 한 프레임을 다른 Qp 값으로 여러 번 부호화해서 얻은 결과를 이용하여 모델 변수를 구해야 하므로, 처리 시간이 많이 소요되어 실시간 영상 부호화에는 적용하기 어려운 단점이 있다.
따라서, 본 발명은 상기와 같은 종래 기술의 문제점을 해결하기 위한 것으로, 본 발명은 영상 부호기에서 주어진 비트율과 왜곡 제약조건을 만족시키기 위해 적응적으로 영상의 부호율을 제어해야 하는 경우, 영상을 부호화하기 이전에 미리 해당 프레임으로부터 발생될 비트량을 예측함으로써, 예측의 정확성을 높이면서도 지연을 크게 줄일 수 있는 비트량 예측 장치 및 그 방법을 제공하는데 그 목적이 있다.
상기 목적을 달성하기 위한 본 발명에 따른 비트량 예측장치는, 영상 부호화 시스템에서 각 영상 프레임을 부호화할 때 발생될 비트율과 왜곡의 양을 예측하기 위해 비트량 예측장치에 있어서, 이산여현변환(DCT)부로부터 프레임의 DCT 계수를 입력받아, DCT 블록의 (i,j)th 번째 계수 COEFFi,j의 양자화 레벨을 '0'으로 만드는 양자화 변수들 중 가장 작은 값 QPZi,j를 계산하는 QPZ 결정수단; 상기 QPZ 결정수단의 결과를 한 프레임동안 누적시켜 임의의 양자화 변수(Qp)값을 적용시켰을 때 '0'이 아닌 DCT 계수(NZC)들의 개수를 계산하는 NZC 계수수단: 상기 NZC 계수수단에 의해 얻어진 결과와 이전 프레임에서 얻은 비례계수 정보를 이용해 DCT 성분으로부터 발생되는 비트량을 예측하는 DCT 성분 비트량 예측수단; 및 상기 DCT 성분 비트량 예측수단에 의해 얻어진 결과와 이미 알려져 있는 이전 프레임의 non-DCT 성분에 대한 비트량으로부터 현재 프레임에 대한 총 비트량을 예측하는 총 비트량 예측수단을 포함한다.
또한, 본 발명에 따른 비트량 예측방법은, 영상 부호화 시스템에서 각 영상 프레임을 부호화할 때 발생될 비트율과 왜곡의 양을 예측하기 위해 비트량 예측방법에 있어서, 이산여현변환(DCT) 블록의 (i,j)th 번째 계수 COEFFi,j의 양자화 레벨을 '0'으로 만드는 양자화 변수들 중 가장 작은 값 QPZi,j를 계산하는 제1 단계; 상기 계산된 QPZ의 결과를 한 프레임동안 누적시켜 임의의 양자화 변수(Qp)값을 적용시켰을 때 '0'이 아닌 DCT 계수(NZC)들의 개수를 계산하는 제2 단계: 상기 계산된 '0'이 아닌 DCT 계수(NZC) 개수와 이전 프레임에서 얻은 비례계수 정보를 이용해 DCT 성분으로부터 발생되는 비트량을 예측하는 제3 단계; 및 상기 예측된 DCT 성분으로부터 발생되는 비트량과 이미 알려져 있는 이전 프레임의 non-DCT 성분에 대한 비트량으로부터 현재 프레임에 대한 총 비트량을 예측하는 제4 단계를 포함한다.
더욱이 본 발명은, 각 영상 프레임을 부호화할 때 발생될 비트율과 왜곡의 양을 예측하기 위해 컴퓨터에서, 이산여현변환(DCT) 블록의 (i,j)th 번째 계수 COEFFi,j의 양자화 레벨을 '0'으로 만드는 양자화 변수들 중 가장 작은 값 QPZi,j를 계산하는 제1 단계; 상기 계산된 QPZ의 결과를 한 프레임동안 누적시켜 임의의 양자화 변수(Qp)값을 적용시켰을 때 '0'이 아닌 DCT 계수(NZC)들의 개수를 계산하는 제2 단계: 상기 계산된 '0'이 아닌 DCT 계수(NZC) 개수와 이전 프레임에서 얻은 비례계수 정보를 이용해 DCT 성분으로부터 발생되는 비트량을 예측하는 제3 단계; 및 상기 예측된 DCT 성분으로부터 발생되는 비트량과 이미 알려져 있는 이전 프레임의 non-DCT 성분에 대한 비트량으로부터 현재 프레임에 대한 총 비트량을 예측하는 제4 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명에 따른 비트량 예측 방법은 한 영상 프레임에서 발생된 실제 비트량(R)과 그 프레임의 이산여현변환(DCT: Discrete Cosine Transform) 계수를 양자화하였을 때 발생된 '0'이 아닌 DCT 계수(NZC: Non-Zero DCT Coefficient)의 개수가 강한 상관관계를 가지고 있다는 사실과 DCT계수 성분으로부터 발생되는 비트량이 다른 성분들(움직임 벡터, 헤더 정보, 제어 정보 등)로부터 발생되는 비트량 보다 상대적으로 양도 많고, 또 프레임에 따라 변동도 심하기 때문에, DCT계수 성분으로부터 발생되는 비트량의 예측 정확성이 전체 발생 비트량의 예측 정확성에 결정적인 영향을 미치게 된다는 사실을 이용한다.
따라서 DCT계수로부터 발생되는 비트량을 정확하게 예측하는 것이 비트량 예측의 관건이 된다. 이 목적을 달성하기 위해서 기존의 H.263 영상 부호화기에 비트량 예측 장치를 장착하고 관련 기능을 추가하여야 한다.
도1은 본 발명이 적용되는 H.263 영상부호화 시스템의 블록 구성도로서, 상기 영상 부호화 시스템은 공지의 기술로서, 이하에서는 간략하게 설명하기로 한다.
입력 영상은 움직임 추정 및 움직임 보상부(ME/MC: Motion Estimation/Motion Compensation)(5)에 의해 움직임 추정 및 보상이 이루어지며, 움직임 보상된 영상은 가산기(1)를 통해 이산여현변환부(DCT; 2)로 입력된다. DCT부(2)는 원영상과 움직임 보상된 재생 영상 사이의 오차 신호를 이산여현변환 부호화하는 기능을 수행하며, DCT계수 메모리(3)는 DCT 변환계수를 일시적으로 한 프레임 시간 정도 동안 저장하는 역할을 수행한다. 양자화부(Q: quantization)(6)는 DCT계수를 양자화하는 기능을 수행한다. 역양자화부(Q-1)(7)는 양자화된 DCT계수를 역양자화하며, 역이산여현변환부(IDCT)(8)는 DCT 역변환으로서, 역양자화된 DCT계수를 화소 영역으로 변환시킨다. 가변길이부호화부(VLC: variable length coding)(10)는 양자화된 DCT계수와 각종 헤더 정보, 제어 정보 등을 가변길이 부호화한다. 버퍼(11)는 가변 비트율로 생성되는 영상부호기의 출력 비트율을 일정한 채널전송율로 전달하기 위한 완충 장치이다.
부호율 제어기(9)는 본 발명에 따른 비트량 예측기(4)의 출력 정보, 버퍼의 충만도 등에 관한 정보를 입력으로 받아들여, 사전에 규정되어 있는 부호율 제어의 제약 조건들을 만족시키도록 부호기의 발생 비트량을 제어한다.
DCT부(2)에 의해 생성된 DCT 계수들은 한편으로는 DCT계수 메모리(3)에 저장되면서, 동시에 본 발명에 따른 비트량 예측기(4)로 입력된다. 입력된 DCT 계수들을 가지고 비트량 예측기(4)는 해당 프레임을 임의의 Qp로 양자화 하였을 때 발생될 비트량을 예측한다.
도2는 도1에 도시된 본 발명에 따른 비트량 예측기의 블록 구성도이다.
QPZ결정부(21)는 화면내(INTRA)/화면간(INTER) 부호화 모드에 따라 모든 DCT계수에 대해 QPZ 값을 구한다. 단 화면내(INTRA) 부호화 모드의 DC계수는 8비트 고정길이 부호화되므로 따로 개수를 카운트하여 Nn (I)로 저장하여 NZC 계수부(22)로 제공한다. 나머지 모든 화면내 DC아닌 DCT(non-INTRADC DCT) 계수들과 화면간 DCT 계수들에 대해서는 다음 수학식 5를 적용하여 해당 DCT계수의 QPZ값을 결정한다.
다시 말해, H.263 영상 부호화의 양자화 과정에서 DCT계수는 매크로 블럭당 결정되는 화면간(INTER) 부호화 모드와 화면내(INTRA) 부호화 모드에 따라 다른 양자화 변수로 부호화 된다. 화면내(INTRA) 부호화 모드에서 DCT 계수 중 DC 성분(INTRADC계수)은 8비트 고정길이(fixed length) 부호화되고, 다른 계수들은 가변길이(variable length) 부호화 된다. 화면간(INTER) 부호화 모드에서는 모든 DCT계수가 가변길이 부호화된다. 따라서 INTRADC DCT계수로부터 발생된 비트량은 양자화 변수 값에 의존하지 않기 때문에 DCT 계수들로부터 발생된 비트량을 예측하는데는 'INTRADC가 아닌(non-INTRADC)' DCT계수만 고려하면 충분하다.
8x8 DCT 블록의 (i,j)th 번째 계수 COEFFi,j의 양자화 레벨을 '0'으로 만드는 양자화 변수들 중 가장 작은 값을 QPZi,j라고 하면, H.263 양자화 과정으로부터 QPZi,j는 다음 수학식 5와 같이 유도된다.
Figure 112002032186668-pat00005
여기서 [·]는 버림(truncation)을 취하는 연산자이고, │COEFFi,j│는 COEFFi,j의 크기를 나타낸다. 만일 │COEFFi,j│가 충분히 크다면, 즉 QPZi,j >31 이라면, 이는 어떠한 양자화 변수값(이하 Qp와 혼용함)으로도 '0'을 만들 수 없음을 의미한다.
NZC계수부(22)는 QPZ결정부(21)의 결과를 다음 수학식 6과 같이 한 프레임동안 누적시켜 임의의 Qp값을 적용시켰을 때 '0'이 아닌 DCT계수들의 개수를 구한다.
Figure 112002032186668-pat00006
여기서,
Figure 112002032186668-pat00007
로서 n번째 프레임에서 양자화한 후에 그 값이 '0'이 되는 계수의 총 수이다. 또한, FrameSize(=W(pels)*H(lines)) 는 한 프레임을 구성하는 총 화소수이고, N은 한 프레임 내의 8x8 블록의 총 수이다. Nn (I) 는 화면내(INTRA) 부호화된 블록의 개수이다.
DCT성분 비트량 예측부(23)는 NZC 계수부(22)에서 얻어진 결과와 이전 프레임에서 얻은 비례계수 정보를 이용하여 수학식 7을 통해 DCT성분으로부터 발생되는 비트량을 예측한다.
일반적으로 각 Qp값에 대한 발생 비트량과 '0'이 아닌 계수의 개수 사이에는 선형 관계가 성립함이 알려져 있다. 따라서 이 선형 관계를 이용하면 한 프레임 내의 DCT계수로부터 발생되는 비트량은 NZC 갯수에 어떤 비례 계수를 곱하면 예측할 수 있다. 이 비례 계수는 프레임마다 달라지며, Qp 값에 따라서도 달라지는데, 한 프레임 내에서의 Qp 에 따른 변동은 상대적으로 매우 적으므로 n번째 프레임에서 각 Qp 에 대한 비례 계수
Figure 112002032186668-pat00008
는 근사적으로 이미 알고 있는 이전 프레임의 비례 계수
Figure 112002032186668-pat00009
으로 대체 가능하다.
그러므로 한 프레임에서 각 Qp 값에 대한 DCT계수를 부호화하는데 드는 비트 량은 다음 수학식 7과 같이 예측할 수 있다.
Figure 112002032186668-pat00010
여기서
Figure 112002032186668-pat00011
은 이전 프레임을 Qp = qn-1로 부호화하였을 때, DCT계수로부터 발생된 비트량이다. n번째 프레임의 다른 성분으로부터 발생된 비트량
Figure 112002032186668-pat00012
은 프레임에 따라 별로 변동하지 않기 때문에 근사적으로 이전 프레임의 동일 성분들에서 발생된 비트량으로 대체 가능하다.
따라서 n번째 프레임에 Qp를 적용하였을 때, 총 예측 비트량은 수학식 8과 같다.
Figure 112002032186668-pat00013
여기서,
Figure 112002032186668-pat00014
은 이전 프레임의 움직임 벡터, 헤더 및 각종 제어 정보로부터 발생된 비트량이다.
총비트량 예측부(24)는 DCT성분 비트량 예측부(23)의 결과와 이미 알려져 있는 이전 프레임의 non-DCT 성분에 대한 비트량으로부터 전술한 수학식 8을 통해 현재 프레임에 대한 총 비트량을 예측한다.
본 발명에 따른 비트량 예측 모델은 해당 프레임을 부호화하기 전에
Figure 112002032186668-pat00015
관계를 얻기 위해 한 프레임 시간 정도의 지연이 필요하게 된다.
이상에서 양호한 실시예에 근거하여 이 발명을 설명하였지만, 이러한 실시예는 이 발명을 제한하려는 것이 아니라 예시하려는 것이다. 이 발명이 속하는 분야의 숙련자에게는 이 발명의 기술사상을 벗어남이 없이 위 실시예에 대한 다양한 변화나 변경 또는 조절이 가능함이 자명할 것이다. 그러므로, 이 발명의 보호범위는 첨부된 청구범위에 의해서만 한정될 것이며, 위와 같은 변화예나 변경예 또는 조절예를 모두 포함하는 것으로 해석되어야 할 것이다.
본 발명에 따른 비트량 예측 방법의 성능을 평가하기 위해 시험 영상을 사용하여 모의 실험을 수행하였다.
도3은 양자화 변수값에 따른 제안된 방식의 비트량 예측 성능을 보여주고 있다. 시험에 사용된 영상은 CIF(common intermediate format) 규격의 'Foreman' 영상 20번째 프레임과 SIF(standard input format) 규격의 'Susie' 영상 20번째 프레임이며, 영상 부호화 알고리즘은 H.263을 사용하였다. 모든 양자화 변수에 대하여 본 발명에 따른 방법으로 예측된 결과가 실제 측정된 결과를 비교적 정확하게 예측하는 것을 볼 수 있다.
그 다음 양자화 변수를 고정하고 연속 영상에 대해 모의 실험을 수행하였다. 시험 영상은 'Foreman' 영상 첫 100 프레임과 'Susie' 영상 첫 100 프레임을 사용 하였으며, 부호화 알고리즘은 H.263을 사용하였고, 모든 영상 시퀀스에 대해 하나의 양자화 변수만을 사용하여 가변 비트율(VBR: variable bit rate)로 부호화 하였다.
도4는 연속 영상에 대해 본 발명의 비트량 예측기에 의해 예측된(estimated) 결과와 실제 측정한(measured) 결과와의 비교를 보여주고 있다. 수학식 7의 DCT계수로부터 발생된 비트량(generated bits for DCT coefficients)과 수학식 8의 총 발생 비트량(generated total bits) 모두 거의 정확하게 예측해 냄을 볼 수 있다. 이는 본 발명에 따른 비트량 예측 방법이 발생 비트량과 '0'이 아닌 DCT계수의 개수가 가지는 강한 상관관계를 이용한 결과이다.
따라서, 본 발명에 의한 효과를 요약하면 다음과 같다.
1) 기존의 어떠한 예측 방법보다도 더 정확한 발생 비트량의 예측으로 보다 효율적인 영상 부호율 제어가 가능하다.
2) 한 프레임 시간 정도의 처리 지연이 발생하지만, 이 정도의 지연은 실시간 영상 서비스에서도 수용가능한 범위이기 때문에 지연으로 인한 단점은 무시할 수 있다.

Claims (12)

  1. 영상 부호화 시스템에서 각 영상 프레임을 부호화할 때 발생될 비트율과 왜곡의 양을 예측하기 위해 비트량 예측장치에 있어서,
    이산여현변환(DCT)부로부터 프레임의 DCT 계수를 입력받아, DCT 블록의 (i,j)th 번째 계수 COEFFi,j의 양자화 레벨을 '0'으로 만드는 양자화 변수들 중 가장 작은 값 QPZi,j를 계산하는 QPZ 결정수단;
    상기 QPZ 결정수단의 결과를 한 프레임동안 누적시켜 임의의 양자화 변수(Qp)값을 적용시켰을 때 '0'이 아닌 DCT 계수(NZC)들의 개수를 계산하는 NZC 계수수단:
    상기 NZC 계수수단에 의해 얻어진 결과와 이전 프레임에서 얻은 비례계수 정보를 이용해 DCT 성분으로부터 발생되는 비트량을 예측하는 DCT 성분 비트량 예측수단; 및
    상기 DCT 성분 비트량 예측수단에 의해 얻어진 결과와 이미 알려져 있는 이전 프레임의 움직임 벡터, 헤더 및 각종 제어 정보로부터 발생된 비트량으로부터 현재 프레임에 대한 총 비트량을 예측하는 총 비트량 예측수단을 포함하며,
    상기 비례계수는 상기 DCT 성분으로부터 발생되는 비트량과 상기 '0'이 아닌 DCT 계수(NZC)들의 개수간의 선형 관계를 나타내는 값으로서 n번째 프레임에서의 비례계수는 n-1번째 프레임의 비례계수로 대체되는 비트량 예측장치.
  2. 제 1 항에 있어서,
    상기 QPZ 결정수단은,
    화면내 부호화 모드의 DC 계수는 8비트 고정길이 부호화되므로 따로 개수를 카운트하여 상기 NZC 계수수단으로 제공하는 것을 특징으로 하는 비트량 예측장치.
  3. 제 2 항에 있어서,
    상기 QPZ 결정수단은, 아래의 수학식을 통해 QPZ를 계산하는 것을 특징으로 하는 비트량 예측장치.
    Figure 112002032186668-pat00016
    여기서 [·]는 버림(truncation)을 취하는 연산자이고, │COEFFi,j│는 COEFFi,j의 크기를 나타낸다.
  4. 제 1 항에 있어서,
    상기 NZC 계수수단은, 아래의 수학식을 통해 '0'이 아닌 DCT계수들의 개수를 계산하는 것을 특징으로 하는 비트량 예측장치.
    Figure 112009030875837-pat00017
    여기서,
    Figure 112009030875837-pat00018
    로서 n번째 프레임에서 양자화한 후에 그 값이 '0'이 되는 계수의 총 수이고, FrameSize(=W(pels)*H(lines))는 한 프레임을 구성하는 총 화소수이며, N은 한 프레임 내의 8x8 블록의 총 수이고, Nn (I) 는 화면내 부호화된 블록의 개수이다.
  5. 제 1 항에 있어서,
    상기 DCT성분 비트량 예측수단은 아래의 수학식을 통해 DCT 성분으로부터 발생되는 비트량을 예측하는 것을 특징으로 하는 비트량 예측장치.
    Figure 112002032186668-pat00019
    여기서
    Figure 112002032186668-pat00020
    은 이전 프레임을 Qp = qn-1로 부호화하였을 때, DCT계수로부터 발생된 비트량이다.
  6. 제 1 항에 있어서,
    상기 총 비트량 예측수단은 아래의 수학식을 통해 총 비트량을 예측하는 것 을 특징으로 하는 비트량 예측장치.
    Figure 112002032186668-pat00021
    여기서,
    Figure 112002032186668-pat00022
    은 이전 프레임의 움직임 벡터, 헤더 및 각종 제어 정보로부터 발생된 비트량이다.
  7. 영상 부호화 시스템에서 각 영상 프레임을 부호화할 때 발생될 비트율과 왜곡의 양을 예측하기 위해 비트량 예측방법에 있어서,
    이산여현변환(DCT) 블록의 (i,j)th 번째 계수 COEFFi,j의 양자화 레벨을 '0'으로 만드는 양자화 변수들 중 가장 작은 값 QPZi,j를 계산하는 제1 단계;
    상기 계산된 QPZ의 결과를 한 프레임동안 누적시켜 임의의 양자화 변수(Qp)값을 적용시켰을 때 '0'이 아닌 DCT 계수(NZC)들의 개수를 계산하는 제2 단계:
    상기 계산된 '0'이 아닌 DCT 계수(NZC) 개수와 이전 프레임에서 얻은 비례계수 정보를 이용해 DCT 성분으로부터 발생되는 비트량을 예측하는 제3 단계; 및
    상기 예측된 DCT 성분으로부터 발생되는 비트량과 이미 알려져 있는 이전 프레임의 움직임 벡터, 헤더 및 각종 제어 정보로부터 발생된 비트량으로부터 현재 프레임에 대한 총 비트량을 예측하는 제4 단계를 포함하며,
    상기 비례계수는 상기 DCT 성분으로부터 발생되는 비트량과 상기 '0'이 아닌 DCT 계수(NZC)들의 개수간의 선형 관계를 나타내는 값으로서 n번째 프레임에서의 비례계수는 n-1번째 프레임의 비례계수로 대체되는 비트량 예측방법.
  8. 제 7 항에 있어서,
    상기 제1 단계는,
    화면내 부호화 모드의 DC 계수는 8비트 고정길이 부호화되므로 따로 개수를 카운트하여 저장하고,
    나머지 모든 화면내 DC아닌 DCT(non-INTRADC DCT) 계수들과 화면간 DCT 계수들에 대해서는 아래의 수학식을 통해 QPZ를 계산하는 것을 특징으로 하는 비트량 예측방법.
    Figure 112009030875837-pat00023
    여기서 [·]는 버림(truncation)을 취하는 연산자이고, │COEFFi,j│는 COEFFi,j의 크기를 나타낸다.
  9. 제 7 항에 있어서,
    상기 제2 단계는, 아래의 수학식을 통해 '0'이 아닌 DCT계수들의 개수(NZC)를 계산하는 것을 특징으로 하는 비트량 예측방법.
    Figure 112009030875837-pat00024
    여기서,
    Figure 112009030875837-pat00025
    로서 n번째 프레임에서 양자화한 후에 그 값이 '0'이 되는 계수의 총 수이고, FrameSize(=W(pels)*H(lines))는 한 프레임을 구성하는 총 화소수이며, N은 한 프레임 내의 8x8 블록의 총 수이고, Nn (I) 는 화면내 부호화된 블록의 개수이다.
  10. 제 7 항에 있어서,
    상기 제3 단계는, 아래의 수학식을 통해 DCT 성분으로부터 발생되는 비트량을 예측하는 것을 특징으로 하는 비트량 예측방법.
    Figure 112002032186668-pat00026
    여기서
    Figure 112002032186668-pat00027
    은 이전 프레임을 Qp = qn-1로 부호화하였을 때, DCT계수로부터 발생된 비트량이다.
  11. 제 7 항에 있어서,
    상기 제4 단계는, 아래의 수학식을 통해 총 비트량을 예측하는 것을 특징으로 하는 비트량 예측방법.
    Figure 112002032186668-pat00028
    여기서,
    Figure 112002032186668-pat00029
    은 이전 프레임의 움직임 벡터, 헤더 및 각종 제어 정보로부터 발생된 비트량이다.
  12. 각 영상 프레임을 부호화할 때 발생될 비트율과 왜곡의 양을 예측하기 위해 컴퓨터에서,
    이산여현변환(DCT) 블록의 (i,j)th 번째 계수 COEFFi,j의 양자화 레벨을 '0'으로 만드는 양자화 변수들 중 가장 작은 값 QPZi,j를 계산하는 제1 단계;
    상기 계산된 QPZ의 결과를 한 프레임동안 누적시켜 임의의 양자화 변수(Qp)값을 적용시켰을 때 '0'이 아닌 DCT 계수(NZC)들의 개수를 계산하는 제2 단계:
    상기 계산된 '0'이 아닌 DCT 계수(NZC) 개수와 이전 프레임에서 얻은 비례계수 정보를 이용해 DCT 성분으로부터 발생되는 비트량을 예측하는 제3 단계; 및
    상기 예측된 DCT 성분으로부터 발생되는 비트량과 이미 알려져 있는 이전 프레임의 움직임 벡터, 헤더 및 각종 제어 정보로부터 발생된 비트량으로부터 현재 프레임에 대한 총 비트량을 예측하는 제4 단계를 실행시키기 위한 프로그램으로서,
    상기 비례계수는 상기 DCT 성분으로부터 발생되는 비트량과 상기 '0'이 아닌 DCT 계수(NZC)들의 개수간의 선형 관계를 나타내는 값으로서 n번째 프레임에서의 비례계수는 n-1번째 프레임의 비례계수로 대체되는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020020059484A 2002-09-30 2002-09-30 실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법 KR100918560B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020059484A KR100918560B1 (ko) 2002-09-30 2002-09-30 실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020059484A KR100918560B1 (ko) 2002-09-30 2002-09-30 실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법

Publications (2)

Publication Number Publication Date
KR20040028332A KR20040028332A (ko) 2004-04-03
KR100918560B1 true KR100918560B1 (ko) 2009-09-21

Family

ID=37330548

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020059484A KR100918560B1 (ko) 2002-09-30 2002-09-30 실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법

Country Status (1)

Country Link
KR (1) KR100918560B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100793781B1 (ko) * 2005-01-14 2008-01-11 엘지전자 주식회사 실시간 동영상 부호화 장치 및 방법
KR100785855B1 (ko) * 2005-07-19 2007-12-14 한국전자통신연구원 향상된 snr 스케일러빌리티 제공을 위한 양자화 장치 및방법
KR101221874B1 (ko) * 2008-12-03 2013-01-15 한국전자통신연구원 영상 처리 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177513A (ja) * 1993-12-20 1995-07-14 Mitsubishi Electric Corp 映像信号符号化方式
KR19980030784A (ko) * 1996-10-30 1998-07-25 배순훈 디지탈 영상의 양자화 번호 결정 방법 및 장치
KR19980030785A (ko) * 1996-10-30 1998-07-25 배순훈 디지탈 영상의 양자화 번호 결정 방법 및 장치
KR19990079917A (ko) * 1998-04-10 1999-11-05 정선종 가변출력 동영상 비트율 제어 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177513A (ja) * 1993-12-20 1995-07-14 Mitsubishi Electric Corp 映像信号符号化方式
KR19980030784A (ko) * 1996-10-30 1998-07-25 배순훈 디지탈 영상의 양자화 번호 결정 방법 및 장치
KR19980030785A (ko) * 1996-10-30 1998-07-25 배순훈 디지탈 영상의 양자화 번호 결정 방법 및 장치
KR19990079917A (ko) * 1998-04-10 1999-11-05 정선종 가변출력 동영상 비트율 제어 방법

Also Published As

Publication number Publication date
KR20040028332A (ko) 2004-04-03

Similar Documents

Publication Publication Date Title
KR100484148B1 (ko) 개선된 비트율 제어 방법과 그 장치
US5686964A (en) Bit rate control mechanism for digital image and video data compression
KR100604702B1 (ko) 이미지 시퀀스를 인코딩하는 장치 및 이미지 신호를 양자화하기 위해서 양자화 스케일을 생성하는 방법
US6037987A (en) Apparatus and method for selecting a rate and distortion based coding mode for a coding system
EP1745653B1 (en) Encoder with adaptive rate control for h.264
EP1074148B1 (en) Moving pictures encoding with constant overall bit rate
RU2502213C2 (ru) Устройство обработки изображений и способ обработки изображений
EP1675402A1 (en) Optimisation of a quantisation matrix for image and video coding
US8094716B1 (en) Method and apparatus of adaptive lambda estimation in Lagrangian rate-distortion optimization for video coding
US8259793B2 (en) System and method of fast MPEG-4/AVC quantization
KR101603747B1 (ko) 비디오 인코딩에서 속도 제어 정확성을 위한 방법 및 장치
KR100790149B1 (ko) 비디오 인코딩 데이터율 제어 방법
US20100111180A1 (en) Scene change detection
EP1978745B1 (en) Statistical adaptive video rate control
US7397855B2 (en) Rate controlling method and apparatus for use in a transcoder
JP2006135557A (ja) 動画像符号化装置
KR100708182B1 (ko) 동영상 부호화기의 비트율 제어 장치 및 방법
KR100918560B1 (ko) 실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법
US7801214B2 (en) Method and apparatus for controlling encoding rate and quantization scales
JPH07203430A (ja) 画像符号化装置
JP4309703B2 (ja) 符号化誤差推定装置
KR101336445B1 (ko) 비디오 인코딩 데이터율 제어 방법
JP3858520B2 (ja) 動画像符号化装置及びその方法
Lee et al. A rate control algorithm for DCT-based video coding using simple rate estimation and linear source model
JP3812269B2 (ja) 動画像符号化装置及びその方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120904

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130904

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee