KR100797396B1 - 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법및 장치 - Google Patents

매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법및 장치 Download PDF

Info

Publication number
KR100797396B1
KR100797396B1 KR1020060046146A KR20060046146A KR100797396B1 KR 100797396 B1 KR100797396 B1 KR 100797396B1 KR 1020060046146 A KR1020060046146 A KR 1020060046146A KR 20060046146 A KR20060046146 A KR 20060046146A KR 100797396 B1 KR100797396 B1 KR 100797396B1
Authority
KR
South Korea
Prior art keywords
macroblock
current output
output picture
rate control
picture
Prior art date
Application number
KR1020060046146A
Other languages
English (en)
Other versions
KR20070061105A (ko
Inventor
전동산
김재곤
홍진우
한종기
곽상민
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20070061105A publication Critical patent/KR20070061105A/ko
Application granted granted Critical
Publication of KR100797396B1 publication Critical patent/KR100797396B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

1. 청구범위에 기재된 발명이 속하는 기술분야
본 발명은 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법 및 장치에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 기존의 TM5의 비트율 제어 방법을 개선하여 현재 입력 픽처의 정보를 이용한 매크로블록 단위의 비트율 제어를 수행함으로써, 출력 영상의 화질을 유지하면서도 비트율 축소가 가능한 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법 및 제어 장치를 제공하는데 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 매크로 블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법으로서, 현재 입력 픽처의 매크로블록 정보를 이용하여 모드가 고려된 현재 출력 픽처의 목표 비트수를 산출하는 비트 할당 단계; 상기 모드가 고려된 현재 출력 픽처의 목표 비트수에 기초하여 현재 출력 픽처의 매크로블록에 적용할 참조 양자화 파라미터를 산출하는 전송률 제어 단계; 및 상기 참조 양자화 파라미터를 DCT 영역의 매크로블록 공간 활성도에 기초하여 변조함으로써 최종 양자화 파라미터를 구하는 적응적 양자화 단계를 포함하되, 상기 모드는 엠펙-2 표준의 매크로블록 모드 중 인터(INTER) 또는 인트라(INTRA)임.
4. 발명의 중요한 용도
본 발명은 엠펙-2 트랜스코더 등에 이용됨.
비트율 제어(Bit-rate Control), 비트 할당, 전송률 제어, 적응적 양자화

Description

매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법 및 장치{Method and device for controlling transcoding bit-rate using complexity of macroblock}
도 1은 본 발명의 일실시예에 따른 비트율 제어 방법의 흐름도,
도 2는 도 1의 비트 할당 단계에 대한 상세 흐름도,
도 3은 도 1의 전송율 제어 단계에 대한 상세 흐름도,
도 4는 도 1의 적응적 양자화 단계에 대한 상세 흐름도,
도 5는 본 발명이 적용되는 엠펙-2 트랜스코더의 구성도이다.
* 도면의 주요 부분에 대한 부호 설명
510 : 복호화부 520 : 부호화부
511 : 가변길이 복호기 521 : 양자화기
513 : 역양자화기 523 : 가변길이 부호기
525 : 버퍼 527: 비트율 제어기
본 발명은 트랜스코딩 비트율 제어(bit-rate control)에 관한 것으로, 보다 상세하게는 엠펙-2 비트스트림(bitstream)을 비트율이 축소된 엠펙-2 비트스트림으로 트랜스코딩(transcoding)하기 위하여 기존의 엠펙-2 TM 5(Test Model 5)에서 제안된 비트율 제어 방법을 발전시킨 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법에 관한 것이다.
트랜스코딩은 소정 포맷으로 부호화된 비트스트림을 복호화한 후, 이를 다양한 단말 및 제한적인 채널 용량에 적합하게 재부호화하는 과정이다. 트랜스코딩은 비디오 포맷 자체를 바꾸는 경우뿐 아니라, 동일한 비디오 포맷에서 시간 및/또는 공간 해상도를 변경하거나 비트율을 변경하는 경우에도 필요하다.
일반적인 트랜스코더에서의 비트율 제어 방법은 트랜스코더의 복호화부로부터 얻어진 정보가 부호화부에서 재사용된다는 점에서 비디오 부호기에서의 비트율 제어 방법과 차이가 있으나, 기본적인 개념은 동일하다. 즉, 종래의 비트율 제어 방법에 따르면, 트랜스코더의 부호기 (또는 비디오 부호기)로부터 불규칙하게 출력되는 데이터를 일시 저장하는 버퍼를 마련하여, 소정량의 데이터를 전송함에 있어, 버퍼에 저장되어 있는 데이터량을 측정하고 당해 측정된 데이터량 정보를 양자화기로 피드백하여 양자화 간격 크기(quantizer step size)를 조절한다.
엠펙-2에서 대표적인 비트율 제어 방법으로 엠펙-2 TM 5가 있다. TM 5는 비 디오 부호기에서의 비트율 제어 방법에 관한 것으로, 비트 할당(bit allocation), 전송률 제어(rate control) 및 적응적 양자화(adaptive quantization)의 세 단계 알고리즘으로 이루어져 있다.
비트 할당 단계에서는 현재 픽처(current picture)를 부호화하기 전에 그 픽처에 할당될 목표 비트수(the number of target bits)가 추정되며, TM 5에서는 상기 목표 비트수를 구하기 위해서 이전 픽처(previous picture)의 복잡도를 이용한다. 여기서, 픽처들은 GOP(Group of Picture) 내에서 일정한 순서로 배열되고, 그 순서에 따라 엠펙-2 부호기로 입력되어 부호화된다. 현재 픽처는, 부호화되기 위해 엠펙-2 부호기로 입력될 픽처들 중 가장 먼저 존재하는 픽처이고, 이전 픽처는 상기 GOP 내에서 현재 픽처 바로 앞에 존재하여 이미 엠펙-2 부호기에서 부호화되어 출력된 픽처를 의미한다.
이렇듯, 종래 TM 5는 이전 픽처의 정보에 기초하여 현재 픽처의 목표 비트수를 추정하기 때문에 많은 움직임을 가지는 픽처 또는 장면(scene) 변환에 적용하기 어렵고, 픽처 단위의 복잡도를 사용하므로 정확한 현재 픽처의 목표 비트수를 산출하기 어려워 비트율 축소시 출력 영상의 화질이 저하되는 문제가 있다.
다음으로, 전송률 제어 단계에서는 상기 현재 픽처의 목표 비트수로부터 산출된 가상 버퍼의 충만도를 이용하여 현재 픽처의 각 매크로블록에 적용할 참조 양자화 파라미터(reference quantization parameter)가 산출된다.
이러한 TM 5의 전송률 제어는 가상 버퍼의 충만도가 이전 픽처의 정보를 이용한 현재 픽처의 목표 비트수에 기초하여 산출되었기 때문에 정확하지 못하다는 문제점이 있다. 또한, 한 픽처 내에서 각 매크로블록들은 적절한 모드로 부호화되기 때문에 각 매크로블록에는 다른 비트수가 할당되어야 함에도, 각 매크로블록들의 모드를 고려하지 않고 매크로블록들의 비트수가 할당되므로 정확한 가상 버퍼의 충만도를 산출하기 어려워 비트율 축소시 출력 영상의 화질이 저하되는 문제가 있다.
다음으로 적응적 양자화 단계에서는 상기 참조 양자화 파라미터를 이전 픽처의 각 매크로블록 공간 활성도를 고려하여 변조함으로써, 현재 픽처에 적응적으로 반영하기 위한 최종 양자화 파라미터를 산출한다. 각 매크로블록의 공간 활성도는 픽셀 단위의 밝기 신호의 분산(variance)값을 이용하여 산출된다.
이처럼 종래 TM5의 적응적 양자화 단계에서는 픽셀 영역까지 복호화가 이루어지는 것을 전제하는데 픽셀 영역까지의 복호화를 위해서는 IDCT(Inverse Discrete Cosine Transform) 및 DCT(Discrete Cosine Transform) 과정이 필요하므로 트랜스코딩 시스템의 복잡도가 높아진다는 문제점이 있다.
요약하자면, 종래의 TM5의 비트율 제어 방법은 이전 픽처의 정보를 이용하여 픽처 단위로 비트율 제어가 이루어지고 현재 픽쳐의 정보를 고려하지 않기 때문에 정확한 비트율 제어 파라미터 값들을 산출하기 어려운 문제점이 있고, 픽셀 영역 트랜스코딩 시스템을 전제하고 있어 시스템의 복잡도가 높아지는 문제점이 있어, 비트율 축소시 출력 영상의 화질이 저하된다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 제공된 것으로, 기존의 TM5의 비트율 제어 방법을 개선하여 현재 입력 픽처의 정보를 이용한 매크로블록 단위의 비트율 제어를 수행함으로써, 출력 영상의 화질을 유지하면서도 비트율 축소가 가능한 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법 및 제어 장치를 제공하는데 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명은, 매크로 블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법으로서, 현재 입력 픽처의 매크로블록 정보를 이용하여 모드가 고려된 현재 출력 픽처의 목표 비트수를 산출하는 비트 할당 단계; 상기 모드가 고려된 현재 출력 픽처의 목표 비트수에 기초하여 현재 출력 픽처의 매크로블록에 적용할 참조 양자화 파라미터를 산출하는 전송률 제어 단계; 및 상기 참조 양자화 파라미터를 DCT 영역의 매크로블록 공간 활성도에 기초하여 변조함으로써 최종 양자화 파라미터를 구하는 적응적 양자화 단계를 포함하되, 상기 모드는 엠펙-2 표준의 매크로블록 모드 중 인터(INTER) 또는 인트라(INTRA)이다.
또한 본 발명은, 트랜스코더의 비트율 제어 장치에 있어서, 현재 입력 픽처의 매크로블록 정보를 이용하여 모드가 고려된 현재 출력 픽처의 목표 비트수를 산출하는 수단; 상기 모드가 고려된 현재 출력 픽처의 목표 비트수에 기초하여 현재 출력 픽처의 매크로블록에 적용할 참조 양자화 파라미터를 산출하는 수단; 및 상기 참조 양자화 파라미터를 DCT 영역의 매크로블록 공간 활성도에 기초하여 변조함으로써 최종 양자화 파라미터를 구하는 수단을 포함하되, 상기 모드는 엠펙-2 표준의 매크로블록 모드 중 인터(INTER) 또는 인트라(INTRA)이다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
도 1은 본 발명의 일실시예에 따른 비트율 제어 방법의 흐름도이다.
도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 비트율 제어 방법은 비트 할당 단계(s101), 전송률 제어 단계(s103) 및 적응적 양자화 단계(s105)를 포함한다.
비트 할당 단계(s101)에서는 종래의 TM 5가 이전 픽처의 복잡도를 이용하는 것과 달리, 현재 입력 픽처의 매크로블록 정보를 이용하여 현재 출력 픽처의 목표 비트수를 추정한다(도 2 참조).
다음으로 전송률 제어 단계(s103)에서는 종래의 TM 5가 현재 픽처의 목표 비트수에 기초하는 것과 달리, 추정된 상기 현재 출력 픽처의 목표 비트수를 각 매크로블록에 할당한 후 가상 버퍼의 충만도 및 참조 양자화 파라미터를 산출한다(도 3참조)
다음으로 적응적 양자화 단계(s105)에서는 종래의 TM 5가 IDCT를 수행하여 픽셀 영역까지 복호화함으로써 이전 픽처의 픽셀 영역 데이터에 기초하는 것과는 달리, 현재 입력 픽처 DCT 영역 데이터에 기초하여 현재 출력 픽처의 각 매크로블록 공간 활성도 및 최종 양자화 파라미터를 산출한다(도 4 참조).
도 2는 도 1의 비트 할당 단계에 대한 상세 흐름도이다.
도 2에 도시된 바와 같이, 비트 할당 단계(s101)는 현재 입력 픽처의 매크로블록 정보를 이용하여 현재 출력 픽처의 매크로블록 복잡도를 추정하는 단계(s201), 현재 출력 픽처의 복잡도를 산출하는 단계(s203) 및 현재 출력 픽처의 목표 비트수를 추정하는 단계(s205)를 포함한다.
우선, 현재 입력 픽처의 j번째 매크로블록 정보(
Figure 112007053579842-pat00001
Figure 112007053579842-pat00002
)를 이용하여 다음의 [수학식 1]에 따라 모드(인트라 또는 인터)를 고려한 현재 출력 픽처의 j번째 매크로 블록 복잡도(
Figure 112007053579842-pat00003
)가 산출된다(s201).
Figure 112006036005217-pat00004
Figure 112006036005217-pat00005
,
Figure 112006036005217-pat00006
,
Figure 112006036005217-pat00007
Figure 112006036005217-pat00008
여기서,
Figure 112007053579842-pat00009
은 각 픽처의 타입, 대문자
Figure 112007053579842-pat00010
와 소문자
Figure 112007053579842-pat00011
는 각각 픽처와 매크로블록의 생성 비트수,
Figure 112007053579842-pat00012
(프라임)은 이전 픽처 관련 정보이다.
Figure 112007053579842-pat00013
,
Figure 112007053579842-pat00014
,
Figure 112007053579842-pat00015
,
Figure 112007053579842-pat00016
는 각각 픽처 타입에 있어서 매크로블록의 모드(인트라 또는 인터)에 따른 이전 입력 픽처와 출력 픽처의 평균 발생 비트수이다.
Figure 112007053579842-pat00017
Figure 112007053579842-pat00018
는 각각 현재 입력 픽처의 j번째 매크로블록의 발생 비트수 및 양자화 파라미터이다.
다음으로, 상기 현재 출력 픽처의 j번째 매크로 블록 복잡도(
Figure 112006036005217-pat00019
)를 이용하여 다음의 [수학식2]에 따라 현재 출력 픽쳐의 복잡도(
Figure 112006036005217-pat00020
)가 산출된다(s203).
Figure 112006036005217-pat00021
여기서,
Figure 112006036005217-pat00022
은 각 픽쳐의 매크로블록 총 수이다.
다음으로, 상기 현재 출력 픽쳐의 복잡도(
Figure 112006036005217-pat00023
)를 이용하여 다음의 [수학식3]에 따라 현재 출력 픽처의 목표 비트수(
Figure 112006036005217-pat00024
)가 산출된다(s205).
Figure 112006036005217-pat00025
Figure 112006036005217-pat00026
Figure 112006036005217-pat00027
여기서,
Figure 112006036005217-pat00028
Figure 112006036005217-pat00029
는 양자화 매트릭스에 종속적인 상수,
Figure 112006036005217-pat00030
Figure 112006036005217-pat00031
는 현재 GOP에 남아있는 P 픽처들과 B 픽처들의 수이다.
Figure 112006036005217-pat00032
은 현재 GOP에 할당된 비트의 남아있는 수이다.
이처럼 본 발명에 따르면, 모드를 고려한 현재 출력 픽처의 j번째 매크로 블록 복잡도(
Figure 112006036005217-pat00033
)로부터 산출된 현재 출력 픽쳐의 복잡도(
Figure 112006036005217-pat00034
)에 기초하여 현재 출력 픽처의 목표 비트수가 정확히 산출된다.
도 3은 도 1의 전송률 제어 단계에 대한 상세 흐름도이다.
도 3에 도시된 바와 같이, 전송률 제어 단계(s103)는 현재 출력 픽처의 각 매크로블록에 목표 비트수를 할당하는 단계(s301), 각 매크로블록의 가상 버퍼 충만도를 산출하는 단계(s303) 및 현재 출력 픽처의 각 매크로블록에 적용할 참조 양자화 파라미터를 산출하는 단계(s305)를 포함한다.
우선, 다음의 [수학식4]에 따라 현재 출력 픽처의 j번째 매크로블록에 할당될 목표 비트수(
Figure 112006036005217-pat00035
)가 산출된다(s301).
Figure 112006036005217-pat00036
여기서,
Figure 112006036005217-pat00037
는 현재 출력 픽처의 복잡도,
Figure 112006036005217-pat00038
는 현재 출력 픽처의 j번째 매크로 블록 복잡도,
Figure 112006036005217-pat00039
은 현재 출력 픽처의 잔여 비트수이다.
다음으로, 다음의 [수학식5]에 나타나는 바와 같이, 현재 출력 픽처의 j번째 매크로블록 목표 비트수(
Figure 112006036005217-pat00040
)에 기초하여 현재 가상 버퍼의 충만도(
Figure 112006036005217-pat00041
)가 산출된다(s303).
Figure 112006036005217-pat00042
여기서,
Figure 112006036005217-pat00043
는 가상 버퍼의 초기 충만도,
Figure 112006036005217-pat00044
는 현재 입력 픽처의 j-1 번째 매크로블록까지 포함하여 모든 매크로블록들을 부호화하는데 발생한 비트 수 ,
Figure 112006036005217-pat00045
은 현재 출력 픽처의 각 매크로블록의 목표 비트수이다.
다음으로, 현재 가상 버퍼의 충만도(
Figure 112006036005217-pat00046
)에 기초하여 다음의 [수학식6]에 따라 현재 출력 픽처의 j번째 매크로블록에 적용할 참조 양자화 파라미터(
Figure 112006036005217-pat00047
)가 산출된다(s305).
Figure 112006036005217-pat00048
이처럼 본 발명에 따르면 각 매크로블록의 모드(인트라 또는 인터)가 고려된 현재 출력 픽처의 j번째 매크로 블록 복잡도(
Figure 112007053579842-pat00049
)로부터 산출된 각 매크로블록 목표 비트수(
Figure 112007053579842-pat00050
)에 기초하여 적절한 참조 양자화 파라미터를 산출할 수 있다.
도 4는 도 1의 적응적 양자화 단계에 대한 상세 흐름도이다.
도 4에 도시된 바와 같이, 적응적 양자화 단계(s105)는 DCT영역에서 현재 출력 픽처의 각 매크로블록 공간활성도를 산출하는 단계(s401),각 매크로블록의 공간 활성도를 정규화하는 단계(s403) 및 최종 양자화 파라미터를 산출하는 단계(s405)를 포함한다.
우선, 현재 출력 픽처의 j번째 매크로블록 공간활성도(
Figure 112006036005217-pat00051
)는 다음의 [수학식7]에 따라 산출된다(s401).
Figure 112006036005217-pat00052
여기서,
Figure 112006036005217-pat00053
는 DCT 계수의 분산 값으로 다음의 [수학식8]에 따라 산출된다.
Figure 112006036005217-pat00054
여기서,
Figure 112006036005217-pat00055
는 하나의 8*8 블록에서 k 번째 DCT 계수,
Figure 112006036005217-pat00056
는 하나의 8*8 블록에서 최초 DCT 계수이다. 단, 현재 입력 픽처로부터 얻어진 매크로블록의 모드 정보를 고려하여, 상기 모드가 인트라인 매크로블록의 공간활성도는 상기 [수학식7] 및 [수학식8]에 의해 산출되나, 상기 모드가 인터인 매크로블록의 공간 활성도는 현재 입력 픽처로부터 얻어진 움직임 벡터 정보를 이용하여 참조 블록의 공간활성도로 대체된다.
다음으로 현재 출력 픽처의 j번째 매크로블록 공간활성도(
Figure 112006036005217-pat00057
)에 기초하여 다음의 [수학식9]에 따라 정규화된 j번째 매크로블록 공간 활성도(
Figure 112006036005217-pat00058
)가 산출된다(s403).
Figure 112006036005217-pat00059
여기서,
Figure 112006036005217-pat00060
는 현재 입력 픽처의 평균 공간 활성도이다.
다음으로, 현재 출력 픽처에 적응적으로 반영할 최종 양자화 파라미터(
Figure 112006036005217-pat00061
)는 다음의 [수학식10]에 따라 산출된다(s405).
Figure 112006036005217-pat00062
여기서,
Figure 112006036005217-pat00063
는 현재 출력 픽처의 j번째 매크로블록에 적용할 참조 양자화 파라미터(
Figure 112006036005217-pat00064
)이고,
Figure 112006036005217-pat00065
는 정규화된 j번째 매크로블록 공간 활성도이다.
이처럼 본 발명에 따르면, 현재 입력 픽처의 정보를 이용하여 DCT 영역에서 현재 출력 픽처의 각 매크로블록 공간 활성도(
Figure 112006036005217-pat00066
)에 기초하여 적절한 최종 양자화 파라미터를 산출할 수 있다.
도 5는 본 발명이 적용되는 엠펙-2 트랜스코더의 구성도이다.
도 5에 도시된 바와 같이, 엠펙-2 트랜스코더(500)는 복호화부(510) 및 부호화부(520)로 구성된다.
복호화부(510)는 엠펙-2 비트스트림을 복호화하는 구성으로서, 가변길이 복호화(VLD : Variable Length Decoding)를 수행하고, 원 영상 부호화시의 매크로블록 모드 정보, 복잡도 정보 및 움직임 벡터 정보 등을 출력하는 가변길이 복호기(511) 및 역양자화(IQ : Inverse Quantization)를 수행하는 역양자화기(513)를 포함한다. 본 실시예의 트랜스코딩 시스템은 그 복잡도를 줄이기 위하여 주파수 영역의 트랜스코딩 시스템인 것을 전제하므로, IDCT를 수행하는 구성이 포함되어 있지 않다. 이와 대응하여 부호화부(520)에도 DCT를 수행하는 구성이 포함되어 있지 않다.
부호화부(520)는 복호화부(510)로부터 복호화된 DCT 영역의 정보를 입력받아 엠펙-2 비트스트림으로 재부호화하여 채널로 출력하는 구성으로서, 양자 화(Quantization)를 수행하는 양자화기(521), 가변길이 복호기로부터 입력받은 매크로블록 모드 정보 및 움직임 벡터 정보를 이용하여 가변길이 부호화(VLC : Variable Length Coding)를 수행하는 가변길이 부호기(523), 가변길이 부호기(523)로부터 출력된 생성 비트를 일시 저장하고 비트스트림으로 출력하는 버퍼(525) 및 새로운 양자화 파라미터를 양자화기(521)로 피드백하여 양자화 간격 크기를 조절함으로써 채널로 전송되는 비트수를 제어하기 위해 적절한 양자화 파라미터를 산출하는 비트율 제어기(527)를 포함한다.
비트율 제어기(527)는 트랜스코더의 복호화부(510)로부터 입력받은 현재 픽처를 재부호화하는데 있어서, 가변길이 복호기(511)로부터 입력받은 현재 입력 픽처의 매크로블록 모드 정보(인트라 또는 인터), 매크로블록 복잡도 정보(
Figure 112007053579842-pat00067
Figure 112007053579842-pat00068
), 픽처 타입 정보(
Figure 112007053579842-pat00069
) 및 움직임 벡터 정보 등과 버퍼(525)로부터 입력받은 이전 픽처의 비트 발생 정보(
Figure 112007053579842-pat00070
) 등을 이용하여 상기 도 1내지 도4에서 도시된 방법에 따라 비트율 제어를 수행한다. 즉, 비트율 제어기(527)는 가변길이 복호기(511)로부터 입력받은 현재 입력 픽처의 매크로블록 정보 및 버퍼(525)로부터 입력받은 이전 픽처의 비트 발생 정보를 이용하여 현재 출력 픽처의 목표 비트수를 추정하고(s101), 상기 현재 출력 픽처의 목표 비트수를 가변길이 복호기(511)로부터 입력받은 매크로블록 모드 정보를 이용하여 각 매크로블록에 할당한 후 가상 버퍼의 충만도 및 참조 양자화 파라미터를 산출한다(s103). 상기 참조 양자화 파라미터를 DCT 영역에서 변조함으로써 현재 출력 픽처에 적응적으로 반영하기 위한 최종 양자화 파라미터가 산출된다(s105).
한편, 비트율 제어기(527)에서 수행되는 상기 도 1내지 도 4의 방법은, 비트율 제어기(527)의 하위 수단 으로서, 도 1내지 도 4에 도시된 각 단계를 수행하는 물리적 또는 논리적 수단에 의해서 실현될 수 있다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
이상에서 설명한 바와 같이 본 발명은, 기존의 TM5의 비트율 제어 방법을 개선하여 현재 입력 픽처의 정보를 이용한 매크로블록 단위의 비트율 제어를 수행함으로써, 출력 영상의 화질을 유지하면서도 비트율을 축소할 수 있다.

Claims (15)

  1. 삭제
  2. 매크로 블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법으로서,
    현재 입력 픽처의 매크로블록 정보를 이용하여 모드가 고려된 현재 출력 픽처의 목표 비트수를 산출하는 비트 할당 단계;
    상기 모드가 고려된 현재 출력 픽처의 목표 비트수에 기초하여 현재 출력 픽처의 매크로블록에 적용할 참조 양자화 파라미터를 산출하는 전송률 제어 단계; 및
    상기 참조 양자화 파라미터를 DCT 영역의 매크로블록 공간 활성도에 기초하여 변조함으로써 최종 양자화 파라미터를 구하는 적응적 양자화 단계
    를 포함하되,
    상기 모드는 엠펙-2 표준의 매크로블록 모드 중 인터(INTER) 또는 인트라(INTRA)인
    비트율 제어 방법.
  3. 제 2 항에 있어서,
    상기 비트 할당 단계는,
    현재 입력 픽처의 매크로블록 정보를 이용한 현재 출력 픽처의 매크로블록 복잡도를 모드를 고려하여 산출하는 단계;
    상기 현재 출력 픽처의 매크로블록 복잡도에 기초하여 현재 출력 픽쳐의 복잡도를 산출하는 단계; 및
    상기 현재 출력 픽처의 복잡도를 이용하여 현재 출력 픽처의 목표 비트수를 산출하는 단계
    를 포함하는 비트율 제어 방법.
  4. 제 3 항에 있어서,
    상기 현재 출력 픽처의 매크로블록 복잡도는 아래의 <수학식>으로부터 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00071
    ,
    Figure 112006036005217-pat00072
    Figure 112006036005217-pat00073
    ,
    Figure 112006036005217-pat00074
    Figure 112006036005217-pat00075
    여기서,
    Figure 112006036005217-pat00076
    는 현재 출력 픽처의 j번째 매크로 블록 복잡도,
    Figure 112006036005217-pat00077
    은 각 픽처 의 타입, 대문자
    Figure 112006036005217-pat00078
    와 소문자
    Figure 112006036005217-pat00079
    는 각 픽처와 각 매크로블록의 생성 비트수,
    Figure 112006036005217-pat00080
    (프라임)은 이전 픽처 관련 정보,
    Figure 112006036005217-pat00081
    ,
    Figure 112006036005217-pat00082
    ,
    Figure 112006036005217-pat00083
    ,
    Figure 112006036005217-pat00084
    는 각 매크로블록의 모드(인트라 또는 인터)에 따른 이전 입력 픽처와 출력 픽처의 평균 발생 비트수,
    Figure 112006036005217-pat00085
    Figure 112006036005217-pat00086
    는 현재 입력 픽처의 j번째 매크로블록의 발생 비트수 및 양자화 파라미터임.
  5. 제 4 항에 있어서,
    상기 현재 출력 픽처의 복잡도는 아래의 <수학식>으로부터 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00087
    여기서,
    Figure 112006036005217-pat00088
    는 현재 출력 픽쳐의 복잡도,
    Figure 112006036005217-pat00089
    는 현재 출력 픽처의 j번째 매크로블록 복잡도,
    Figure 112006036005217-pat00090
    은 각 픽쳐의 매크로블록 총 수임.
  6. 제 5 항에 있어서,
    상기 현재 출력 픽처의 목표 비트수는 아래의 <수학식>으로부터 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00091
    Figure 112006036005217-pat00092
    Figure 112006036005217-pat00093
    여기서,
    Figure 112006036005217-pat00094
    는 현재 출력 픽처의 목표 비트수(
    Figure 112006036005217-pat00095
    ),
    Figure 112006036005217-pat00096
    Figure 112006036005217-pat00097
    는 양자화 매트릭스에 종속적인 상수,
    Figure 112006036005217-pat00098
    Figure 112006036005217-pat00099
    는 현재 GOP에 남아있는 P 픽처들과 B 픽처들의 수,
    Figure 112006036005217-pat00100
    은 현재 GOP에 할당된 비트의 남아있는 수임.
  7. 제 6 항에 있어서,
    상기 전송률 제어 단계는,
    상기 모드가 고려된 현재 출력 픽처의 목표 비트수에 기초하여 현재 출력 픽처의 매크로블록에 할당된 목표 비트수를 산출하는 단계;
    상기 현재 출력 픽처의 매크로블록에 할당된 목표 비트수에 기초하여 가상 버퍼의 현재 충만도를 산출하는 단계; 및
    상기 가상 버퍼의 현재 충만도에 기초하여 현재 출력 픽처의 매크로블록에 적용할 참조 양자화 파라미터를 산출하는 단계
    를 포함하는 비트율 제어 방법.
  8. 제 7 항에 있어서,
    상기 현재 출력 픽처의 매크로블록에 할당된 목표 비트수는 아래의 <수학식>으로부터 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00101
    여기서,
    Figure 112006036005217-pat00102
    는 현재 출력 픽처의 j번째 매크로블록에 할당된 목표 비트수,
    Figure 112006036005217-pat00103
    는 현재 출력 픽처의 복잡도,
    Figure 112006036005217-pat00104
    는 현재 출력 픽처의 j번째 매크로 블록 복잡도,
    Figure 112006036005217-pat00105
    은 현재 출력 픽처의 잔여 비트수임.
  9. 제 8 항에 있어서,
    상기 가상 버퍼의 현재 충만도는 아래의 <수학식>과 같이 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00106
    여기서,
    Figure 112006036005217-pat00107
    는 가상 버퍼의 현재 충만도,
    Figure 112006036005217-pat00108
    는 가상 버퍼의 초기 충만도,
    Figure 112006036005217-pat00109
    는 현재 출력 픽처내에서 j-1 번째 매크로블록까지 포함하여 모든 매크로블록들을 부호화하는데 발생하는 비트 수 ,
    Figure 112006036005217-pat00110
    은 각 매크로블록의 목표 비트수임.
  10. 제 9 항에 있어서,
    상기 참조 양자화 파라미터는 아래의 <수학식>과 같이 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00111
    여기서,
    Figure 112006036005217-pat00112
    는 가상 버퍼의 충만도,
    Figure 112006036005217-pat00113
    는 현재 출력 픽처의 j번째 매크로블록에 적용할 참조 양자화 파라미터임.
  11. 제 10 항에 있어서,
    상기 적응적 양자화 단계는,
    DCT 영역에서 현재 출력 픽처의 매크로블록의 공간활성도를 구하는 단계;
    상기 매크로블록의 공간 활성도를 정규화하는 단계; 및
    상기 매크로블록의 공간 활성도를 정규화한 값 및 상기 참조 양자화 파라미터에 기초하여 최종 양자화 파라미터를 산출하는 단계
    를 포함하는 비트율 제어 방법.
  12. 제 11 항에 있어서,
    상기 매크로블록 공간활성도는 아래의 <수학식>과 같이 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00114
    Figure 112006036005217-pat00115
    여기서,
    Figure 112006036005217-pat00116
    는 현재 출력 픽처의 j번째 매크로블록 공간활성도,
    Figure 112006036005217-pat00117
    는 하나의 8*8 블록에서 k 번째 DCT 계수,
    Figure 112006036005217-pat00118
    는 하나의 8*8 블록에서 최초 DCT 계수,
    Figure 112006036005217-pat00119
    는 DCT 계수들의 분산값임.
  13. 제 12 항에 있어서,
    상기 매크로블록의 공간 활성도의 정규화는 아래의 <수학식>에 의하여 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00120
    여기서,
    Figure 112006036005217-pat00121
    는 정규화된 j번째 매크로블록 공간 활성도,
    Figure 112006036005217-pat00122
    는 현재 출력 픽처의 j번째 매크로블록 공간활성도,
    Figure 112006036005217-pat00123
    는 현재 입력 픽처의 평균 공간 활성도임.
  14. 제 13 항에 있어서,
    상기 최종 양자화 파라미터는 아래의 <수학식>에 의하여 산출되는
    비트율 제어 방법.
    <수학식>
    Figure 112006036005217-pat00124
    여기서,
    Figure 112006036005217-pat00125
    는 현재 출력 픽처에 적응적으로 반영할 최종 양자화 파라미터,
    Figure 112006036005217-pat00126
    는 현재 출력 픽처의 j번째 매크로블록에 적용할 참조 양자화 파라미터,
    Figure 112006036005217-pat00127
    는 정규화된 j번째 매크로블록 공간 활성도임.
  15. 트랜스코더의 비트율 제어 장치에 있어서,
    현재 입력 픽처의 매크로블록 정보를 이용하여 모드가 고려된 현재 출력 픽처의 목표 비트수를 산출하는 수단;
    상기 모드가 고려된 현재 출력 픽처의 목표 비트수에 기초하여 현재 출력 픽처의 매크로블록에 적용할 참조 양자화 파라미터를 산출하는 수단; 및
    상기 참조 양자화 파라미터를 DCT 영역의 매크로블록 공간 활성도에 기초하여 변조함으로써 최종 양자화 파라미터를 구하는 수단
    을 포함하되,
    상기 모드는 엠펙-2 표준의 매크로블록 모드 중 인터(INTER) 또는 인트라(INTRA)인
    비트율 제어 장치.
KR1020060046146A 2005-12-08 2006-05-23 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법및 장치 KR100797396B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20050120158 2005-12-08
KR1020050120158 2005-12-08

Publications (2)

Publication Number Publication Date
KR20070061105A KR20070061105A (ko) 2007-06-13
KR100797396B1 true KR100797396B1 (ko) 2008-01-28

Family

ID=38357041

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060046146A KR100797396B1 (ko) 2005-12-08 2006-05-23 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법및 장치

Country Status (1)

Country Link
KR (1) KR100797396B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101069254B1 (ko) 2009-05-29 2011-10-04 서울대학교산학협력단 H.264를 위한 프레임 단위 비트율 제어 방법
KR101168007B1 (ko) * 2010-08-02 2012-07-26 숭실대학교산학협력단 실시간 비디오 부호화를 위한 적응적인 유닛-레벨 비트율 제어방법
US11659194B2 (en) 2017-07-13 2023-05-23 Hanwha Techwin Co., Ltd. Method of adjusting bitrate of image and image capturing apparatus

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101060495B1 (ko) 2009-03-19 2011-08-30 주식회사 코아로직 인코딩 장치와 방법 및 그 인코딩 장치를 포함한 멀티미디어 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339720A (ja) 2000-05-25 2001-12-07 Sony Corp 画像情報変換装置及び方法
KR20030000310A (ko) * 2001-06-23 2003-01-06 엘지전자 주식회사 영상 변환 부호화 장치
KR20040048289A (ko) * 2002-12-02 2004-06-07 삼성전자주식회사 트랜스코딩 장치 및 방법, 이에 사용되는 타겟비트할당 및픽처 복잡도 예측 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339720A (ja) 2000-05-25 2001-12-07 Sony Corp 画像情報変換装置及び方法
KR20030000310A (ko) * 2001-06-23 2003-01-06 엘지전자 주식회사 영상 변환 부호화 장치
KR20040048289A (ko) * 2002-12-02 2004-06-07 삼성전자주식회사 트랜스코딩 장치 및 방법, 이에 사용되는 타겟비트할당 및픽처 복잡도 예측 장치 및 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101069254B1 (ko) 2009-05-29 2011-10-04 서울대학교산학협력단 H.264를 위한 프레임 단위 비트율 제어 방법
KR101168007B1 (ko) * 2010-08-02 2012-07-26 숭실대학교산학협력단 실시간 비디오 부호화를 위한 적응적인 유닛-레벨 비트율 제어방법
US11659194B2 (en) 2017-07-13 2023-05-23 Hanwha Techwin Co., Ltd. Method of adjusting bitrate of image and image capturing apparatus

Also Published As

Publication number Publication date
KR20070061105A (ko) 2007-06-13

Similar Documents

Publication Publication Date Title
KR101971909B1 (ko) 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
JP5806219B2 (ja) ビデオ符号化及び復号化における埋め込み量子化パラメータ調整方法及び装置
JP5174958B2 (ja) ビデオのコーダとデコーダとの同時最適化のための方法およびシステム
US7653129B2 (en) Method and apparatus for providing intra coding frame bit budget
KR100723507B1 (ko) I-프레임 움직임 예측을 이용한 동영상 압축 장치의 적응양자화 제어기 및 적응 양자화 제어 방법
KR100335052B1 (ko) 프레임 레벨 속도 제어 방법
US9025664B2 (en) Moving image encoding apparatus, moving image encoding method, and moving image encoding computer program
US8406297B2 (en) System and method for bit-allocation in video coding
KR20070001112A (ko) 적응형 레이트 제어를 구비한 인코더
KR20120013437A (ko) 비디오 인코딩 및 디코딩에 대한 개선된 양자화 라운딩 오프셋 조정을 위한 방법들 및 장치
KR20090042235A (ko) 화상 처리 장치 및 방법과 프로그램
WO2019104635A1 (en) System and method for controlling video coding at frame level
KR20100101665A (ko) 비디오 인코딩에서 속도 제어 정확성을 위한 방법 및 장치
KR100601615B1 (ko) 네트워크 대역폭에 적응적인 영상 압축 장치
WO2019104862A1 (en) System and method for reducing video coding fluctuation
WO2019104611A1 (en) System and method for controlling video coding within image frame
JP7343817B2 (ja) 符号化装置、符号化方法、及び符号化プログラム
KR100797396B1 (ko) 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법및 장치
JP2005530423A (ja) 画像鮮鋭度を符号化中に最適化する方法及びシステム
EP2060125B1 (en) Method and apparatus for analytical and empirical hybrid encoding distortion modeling
KR101336445B1 (ko) 비디오 인코딩 데이터율 제어 방법
KR20040007818A (ko) 동영상 부호화를 위한 dct연산량 조절 방법 및 그 장치
Hu Bit rate control for real-time multipoint video conferencing
KR20070033214A (ko) 화면내-영상 프레임(intra-frame)의 비트량 및왜곡량 추정 장치 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
J501 Disposition of invalidation of trial
B701 Decision to grant
GRNT Written decision to grant
G170 Publication of correction
FPAY Annual fee payment

Payment date: 20110104

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20111101

Year of fee payment: 20