KR100389892B1

KR100389892B1 - 내용을 고려한 비트율 제어방법

Info

Publication number: KR100389892B1
Application number: KR1019960026931A
Authority: KR
Inventors: 류성걸
Original assignee: 삼성전자주식회사
Priority date: 1996-06-30
Filing date: 1996-06-30
Publication date: 2003-10-10
Also published as: KR980007761A

Abstract

본 발명은 내용을 고려한 비트율 제어방법에 관한 것이다. 이를 위하여 원하는 VOP를 선택하여 해당 VOP의 화질을 임의로 결정하는 단계: 부호화할 VOP 단위 영상의 복잡도를 분류하는 단계, 부호화할 VOP 단위 영상을 시감특성별로 분류하는 단계: 복잡도 분류와 시감특성 분류에 의해 히스토그램을 계산하는 단계: 히스토그램, 사용하는 양자화 맥트릭스에 적합하게 제작된 비트 발생율을 추정을 위한 비트모델과 시감특성 분류에 의해 임의의 갯수로 분류된 각가의 클래스에 대한 시감열화 정도가 일정한 기준 양자화간격을 이용하여 예측되는 비트발생량을 계산하는 단계: 각 VOP별 목표비트를 계산하는 단계: 예측된 비트 발생량을 기준 양자화간격의 조절에 의해 목표비트와의 차를 보상하는 단계: 및 각 블럭별 처리시 목표비트에 근접시키기 위해 조절된 기준 양자화간격 및 매크로블럭의 시감특성 클래스, 버퍼점유량을 고려하여 최종 양자화간격을 조절하는 단계를 구비한다.

Description

내용을 고려한 비트율 제어방법

본 발명은 영상 부호화장치에 관한 것으로서, 특히 내용을 고려한 비트율 제어(bit rate control)방법에 관한 것이다.

기존의 디지탈 영상 부호화방법에서 입력된 영상의 처리는 입력영상의 각 프레임별 처리를 기본으로 하고 있다. 따라서 프레임별 비트발생량과 화질을 고려한 비트율 제어방법이 그 주종을 이루었다. 그러나, MPRG-4 등의 멀티미디어 화상처리장치에서는 화상의 특정 부분을 사용자가 조작할 수 있도록 엔코더와 디코더가 구성되어 있기 때문에 그에 맞는 적절한 초리가 요구되었다. 일예로, 사용자가 일정한 전송률에 맞추어 특정 VOP의 화질을 강조하고 다른 부분은 상대적으로 중요치 않을 경우 지정된 VOP의 화질을 높이면서 전송율을 만족시키는 비트율 제어방법이 요구된다. 지금까지의 비트율 제어방법은 버퍼점유량과 이전 프레임에서 발생한 비트량의 비교를 통한 방법(H.263의 TMN5 버전 1.6), 원하는 전송율을 각 프레임에 균등하게 분배하고 프레임내에서 버퍼점유량을 고려하면서 처리할 매크로블럭의 복잡도에 따라 양자화간격을 조절함으로써 비트발생량을 조절하는 기존의 MPEG-2 방법 등이 있다. 그러나 이런 방법들 모두 MPEG-4의 요구사항을 만족시킬 수 있다. 이를 좀 더 상세히 살펴보기로 한다.

먼저, MPEG-2 영상 부호화방식은, DPCM(Differencial Pulse Coded Modulation)과 DCT(Discrete Cosine Transform)을 결합한 하이브리드 부호화방식으로서, 매크로블럭(이하 MB라 약함) 단위로 양자화간격을 결정한다. DPCM과 DCT는 효율적인 부호화를 위한 전단계로서, 신호들간의 중복성을 줄일 뿐이고 실질적인 신호의 압축은 최종 양자화간격에 의한 양자화과정에서 발생하기 때문에 부호화의 성능은 양자화간격의 결정방식에 의해 크게 좌우된다. 특히, 화질의 열화를 최소로 하면서 신호의 압축효과를 최대로 하기 위해서는 인간의 시감특성을 충분히 반영하여 양자화간격을 결정하고, 영상 분포에 따라 적절히 비트를 할당해야 한다. MEPG-2에서는 영상 부호화방식을 제시하고는 있지만 제약을 두지 않고, 단지 디코더에서 수신되어 해석될 비트스트림만을 규정한다.

제1도는 MPEG-2에서 제시한 영상 부호화방식의 구성도이다. 영상신호를 입력되는 프레임의 순서에 따라 I,P,B 처리방식중 한가지 처리방식으로 부호화한다. I 프레임은 DPCM을 하지 않고 원화상을 직접 DCT 변환하며, P,B 프레임은 DPCM에 의한 차영상을 DCT 변환한다. 여기서, P 프레임은 단방향 움직임 벡터(Forward Motion Vector)만을 이용하여 차영상을 구하지만, B 프레임은 쌍방향 움직임 벡터(Bidirectional Motion Vector)를 이용하여 차영상을 구한다. 제1도를 살펴보면, MPEG-2 부호화방식은 액티비티(activity) 계산과 버퍼제어에 의한 비트율 제어를 통하여 양자화간격을 결정한다. 하지만 MPEG-2의 액티비티 계산과 버퍼제어는 다음과 같은 문제점으로 인하여 효과적인 양자화간격을 결정하지 못하기 때문에 부호화효율이 저하될 수 있다.

다음 식 1과 식 2는 MPEG-2의 목표비트할당과 버퍼제어에 의하여 기준 양자화간격을 결정하는 비트율 제어방식을 나타낸 것이다.

상기 식 1에서 D(j)는 i번째 매크로블럭 직전의 버퍼점유량, D_o는 프레임 초기 버퍼점유량, B(j-1)은 (j-1)번째 매크로블럭까지의 실제 비트발생량, TMB 는 매크로블럭 목표비트를 각각 나타낸다.

또한, 상기 식 2에서 R_Q는 j번째 매크로블럭의 기준 양자화간격,BufferSize는 버퍼용량을 각각 나타낸다.

부호화결과에 의한 실제 비트발생량이 주어진 전송속도에 수렴하도록 유도하기 위해 기준 양자화간격은 버퍼점유량에 비례한 값으로 결정되며 DCT 변환된 영상신호를 양자화를 위한 최종 양자화간격을 구할 때 이용된다. MPEG-2에서는 목표비트 발생량과 실제 비트 발생량의 차이로 부터 누적 버퍼 범유량을 계산하여 기준 양자화간격을 결정하는데, 프레임내의 영상신호 분포와 매크로블럭의 영상신호 특성은 고려하지 않고, 프레임내의 모든 매크로블럭에 일률적으로 동일한 목표 비트를 할당하기 때문에 제2A,2B도에서와 같은 문제가 발생한다.

한편, 영상 부호화방법 중 MPEG-4 등은 화상을 프레임 단위로 처리할 뿐만 아니라 내용(content)별로 영역을 나누어 처리하는 기법도 포함하고 있다. 이때 중요한 처리단위의 하나인 VOP(Video Object Plane)는 사용자가 임의로 조작가능한 비트스트림의 부분으로 MPEG-4에서 중요하게 다루어지는 부분이다. 따라서 엔코더에서는 각 VOP가 언제 그리고 어디에 디스플레이될 것인가를 나타낼 정보를 보내고, 디코더에서 그 정보를 사용하여 사용자가 조작가능하도록 해야 한다. VOP는 장면(scene)에서 의미있는(semantic) 객체로서 Y.U.V에 모양(shape)정보를 더한 것이다. MPEG-4에서는 각 VOP 단위로 사용자의 상호작용(interaction)을 허용하기 때문에 원하는 비트발생량을 만족하면서 원하는 VOP의 화질을 달리 할 수 있는 기법이 필요하다. 현재 MPEG-4는 비트율 제어방법을 기존의 H.263(TMN5)의 기법을 그대로 사용하고 있다. 이 방법의 경우 각 프레임당 동일한 양자화간격을 적용하고 이때 그 프레임의 양자화간격을 결정할 때 이전 프레임의 비트발생율이 현재 남아있는버퍼량을 남아있는 프레임수로 나눈 값보다 15% 이상 차이가 날 경우 이전 프레임에서 적용했던 양자화간격 10%를 가감시킨다. 이 방법의 경우는 각 프레임내에서는 MPEG-2와 같은 현상이 발생하지 않고 동일한 앙자화간격이 사용되지만 비트발생율을 제어하기가 곤란하고 한 프레임내의 화상특성을 무시한 채 동일한 양자화간격을 적용하는 단점이 있다. 여기서, H.263 TMN5 비트율 제어 알고리즘을 간격히 살펴보면 다음과 같다.

여기서, buf_rest 는 남아있는 부호화할 프레임수, buf 는 지금까지 사용된 비트수, buf_rest_pic 는 프레임당 남아있는 평균비트수, seconds는 처리할 초, B는 비트율, Q_step은 양자화간격, bits 는 이전 프레임에서 발생한 비트량을 각각 나타낸다.

상기 방법에서 보듯이 기존의 비트율 제어방법은 VOP 단위의 처리에 적합하지 않을 뿐 아니라 화상의 특성에 적절히 대응하지 못하는 단점이 있다.

따라서 본 발명의 목적은 MPEG-4에서 선택된 특정 VOP의 고화질을 유지하면서 전체 비트 발생량을 일정하게 유지할 수 있는 비트율 제어방법을 제공하는데 있다.

상기 목적을 달성하기 위하면 본 발명에 의한 내용을 고려한 비트율 제어방법은

원하는 VOP를 선택하여 해당 VOP의 화질을 임의로 결정하는 단계;

부호화할 VOP 단위 영상의 복잡도를 분류하는 단계;

상기 부호화할 VOP 단위 영상을 시감특성별로 분류하는 단계;

상기 복잡도 분류와 시감특성 분류에 의해 히스토그램을 계산하는 단계;

상기 히스토그램, 사용하는 양자화 매트릭스에 적합하게 제작된 비트 발생율을 추정을 위한 비트모델과 상기 시감특성 분류에 의해 임의의 갯수로 분류된 각가의 클래스에 대한 시감열화 정도가 일정한 기준 양자화간격을 이용하여 예측되는 비트발생량을 계산하는 단계;

각 VOP별 목표비트를 계산하는 단계;

상기 예측된 비트 발생량을 상기 기준 양자화간격의 조절에 의해 상기 목표비트와이 차를 보상하는 단계; 및

각 블럭별 처리시 목표비트에 근접시키기 위해 조절된 기준 양자화간격 및 매크로블럭의 시감특성 클래스, 버퍼점유량을 고려하여 최종 양자화간격을 조절하는 단계를 구비하는 것을 특징으로 한다.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 일실시예에 대하여 상세히 설명하기로 한다.

본 발명은 제3도에 도시된 비와 같이 VOP 단위의 처리가 가능한 영상처리방법에서 모양정보(Shape Information), 움직임정보(Motion Information) 그리고 텍스쳐(Texture Information) 중에서 비트발생량의 80% 정도를 차지하는 텍스쳐 정보량의 조절에 관한 것으로서, 그 세부 구성은 제4도에 도시된 바와 같다.

제4도는 본 발명에 의한 내용을 고려한 비트율 제어방식의 구성도로서, 화질선택 입력부(41), 복잡도 분류부(42), 비트모델부(43), 시감특성 분류부(44), 양자화간격 참조부(45), 히스트그램 계산부(46), 비트발생량 계산부(47), 목표비트 계산부(48), 기준 양자화간격 조정부(49), 목표비트 할당부(50)와 최종 양자화간격 계산부(51)로 이루어진다.

제4도의 구성에 의거하여 본 발명에 의한 내용을 고려한 비트율 제어방법 및 이를 이용한 고능률 동영상 부호화장치의 작용 및 효과에 대하여 설명하기로 한다.

화질 선택 입력부(41)는, 사용자가 임의의 VOP를 선택하고 그 VOP의 화질을 상대적으로 조절할 수 있게 하기 위하여 VOP 번호나 마우스 등으로 프레임내의 특정 부분을 클릭하였을 경우 클릭된 영역이 포함된 VOP 등에 대하여 그 VOP의 화질을 임의의 단계로 조절한다. 예를 들어 VOP 1번을 최상의 화질로 보고 싶다는 등의 입력을 받아 들일 수 있다. 이때 VOP 번호와 해당하는 화질의 단계는 VOP별 목표비트 할당부(50)에 입력으로 주어지고 이 값에 의해서 각 VOP별 비트율을 결정하게 된다.

복잡도 분류부(42)는 블럭의 영상신호를 특정 양자화간격(Rq)으로 양자화할 경우의 블럭 비트 발생량을 예측하기 위해 사용된다. 제5도는 양자화간격, 분산값, 비트발생량의 관계를 나타낸다. 일반적으로 같은 양자화간격으로 양자화할 경우의 비트발생량은 영상신호의 분산값에 비례하고, 같은 분산값을 갖는 영상신호의 경우비트발생량은 양자화간격에 반비례하기 때문에 양자화간격과 신호의 분산값을 알면 비트발생량을 대략 예측할 수 있다. 하지만 양자화간격, 분산값, 비트발생량의 관계가 비선형적이고 신호의 특성에 따라 불규칙하기 때문에 단순한 수식에 의해서는 비트발생량을 예측하기가 매우 어렵다. 따라서, 복잡도 분류부(42)에서는 비선형적이며 불규칙한 양자화간격, 분산값, 비트발생량의 관계로 부터 비트발생량을 예측하기 위해 블럭의 분산값을 16개의 단계로 분류하고, 여러 종류의 실험 영상에 대해 통계적 평균을 구한다. 비트모델부(43)는 복잡도 분류부(42)에서 구해진 양자화간격과 블럭 분산값의 관계에 의한 비트발생량을 표(비트모델)로 만든다. 비트발생량을 정확하게 예측하기 위해서는 블럭의 분산값 분류구간을 적절하게 결정하여야 한다. 본 발명에서는 블럭 분산값(Bv)분류구간을 충분히 작게 하여 실험 영상의 각 구간의 블럭 발생 빈도수, 블럭 분산값, 양자화간격, 비트발생량을 조사한 다음, 각 구간의 비트발생량과 블럭 발생 빈도수를 고려한 확률 평균 예측오차가 같게 되는 16개의 분류구간을 결정한다. 매크로블럭 클래스 분류의 경우는 시감특성을 반영하므로 I,P,B 프레임에 상관없이 원영상 신호에 대해 적용하지만 블럭 분산 분류의 경우는 양자화한 영상신호의 비트발생량을 예측하기 위한 것이므로 I 프레임은 원 영상신호에 대해 적용하고, P,B 프레임의 경우는 DPCM 후의 차영상신호에 대해 적용한다. 따라서 I.P,B 프레임의 종류에 따라 별개의 분류구간이 필요하다. 다음 표1은 블럭 분산값(variance) 분류구간을 나타낸다.

< 표1 >

본 발명에 의한 시감특성 분류부(44)에서는 인간의 시감특성을 충분히 반영하기 위하여 공간 주파수 계산과 임계 색차를 혼합한 영상의 복잡도 계산과 색의 변이에 의한 색차인식의 차이를 반영한 색차룩업테이블(이하 LUT라 약함)에 위한 색 민감도 분류로 시감특성을 분류하게 된다. 색차 LUT에 의해 도출되는 임계치(th)를 이용하여 매크로블럭의 공간주파수를 다음 식 3과 같이 계산한다. 즉, 인접화소간의 휘도신호의 밝기 차이가 임계치보다 클 경우에만 휘도신호 밝기의 변화를 인간이 식별할 수 있으므로 공간 주파수를 계산할 때 반영하고 인접 화소간의 휘도신호의 밝기 차이가 임계치보다 작을 경우에는 공간 주파수 계산에 반영하지 않는다.

상기 식 3과 같은 복잡도 분류를 사용하면 여러가지 형태의 복잡도의 예를 명확하게 구별할 수 있으므로 영상신호의 복잡도를 MPEG의 액티비티 척도에 비해 정확하게 계산할 수 있다.

한편, 색민감도 분류는 16*16 매크로블럭을 8*8 블럭 4개로 분리하고, 각각의 블럭에 대해 평균색을 구한다. 구해진 평균색에 대해 색차 룩업테이블에서 구해진 문턱치를 참조하여 4개의 블럭 중 문턱치값이 최소인 것을 사용하여 그 매크로블럭의 색민감도 클래스로 결정한다. 색민감도 클래스는 총 8개로 구성된다. 시감특성 분류는 복잡도와 색민감도 분류에 의해 32(4*8)개의 조합으로 구성된다.

히스토그램 계산부(46)에서는 매크로블럭 클래스 분류 결과(Mc=0∼15)와 블럭 분산 분류 결과(Bv=0∼15)에 의한 총 256가지의 분류 경우에 대하여 VOP내 블럭의 누적 발생빈도수(히스토그램)을 계산한다. 히스토그램과 비트모델을 사용하면 기준 양자화간격으로 양자화할 경우의 VOP내의 비트발생량을 예측할 수 있다. 영상신호는 이전 VOP간의 상관성이 매우 높으므로 히스토그램 계은 부호화하혀는 현재 VOP의 영상신호에 대해 구할 필요없이, 이전 프레임의 계산 결과를 이용할 수 있다. 따라서, 히스토그램 계산을 위한 시간적인 지연이 별도로 필요하지 않기 때문에 실시간 처리가 가능하다. 총 256가지의 분류경우에 대한 히스토그램 계산 결과를 H[Mc][Bv]라고 정의한다. 예를 들어, H[2][3]은 매크로블럭의 시감특성 클래스 분류결과가 2이고, 복잡도 분류결과가 3인 블럭의 VOP내 발생 빈도수를 나타낸다. 따라서 히스토그램에 의해 시감특성에 의한 영상신호의 VOP내 분포와 분산값에 의한 영상신호의 프레임내 분포를 알 수 있다.

비트모델부(43)에 대하여 살펴보면, 우선 기준 양자화간격으로 양자화할 경우에 영상신호 특성의 분포에 따라 비트발생량이 크게 다르다. 그러므로 주어진 목표 비트발생량에 근접하도록 하려면 기준 양자화간격을 조정할 필요가 있다. 기준 양자화간격의 조정폭을 결정하기 위해서는 기준 양자화간격으로 양자화할 경우의 비트발생량을 알아야 한다. 이를 위해 먼저 기준 양자화간격으로 양자화하여 비트발생량을 계산하고, 다시 기준 양자화간격을 조정하게 되면 시스템의 복잡도와 실시간 처리의 문제가 발생하게 된다. 따라서 본 발명에서는 이러한 문제를 해결하기 위하여 비트발생량 예측을 위한 비트모델을 만들어 사용한다. 비트모델은 임의의 블럭을 기준 양자화간격으로 양자화할 경우의 블럭 비트발생량 예측치를 의미하며, 기준 양자화간격 조정을 위한 비트발생량 예측과 매크로블럭 단위의 목표비트를 적응적으로 할당하기 위한 도구로서 사용된다. 비트모델은 제5도에 도시된 바와 같이 양자화간격, 분산값, 비트발생량의 관계로 부터 도출되며, 16개의 복잡도 분류 구간에서 각각의 기준 양자화간격으로 양자화할 경우의 블럭 비트발생량 평균값을 계산하여 구한다. 비트모델은 고정된 값이므로 부호화과정에서 별도로 구할 필요가 없다. 그러나, MPEG-4의 경우 양자화 매트릭스를 픽쳐 단위로 MPEG과 H.263의 방법 등을 사용할 수 있기 때문에 각 양자화 매트릭스에 적합한 비트모델을 구성한다. 기준 양자화간격은 매크로블럭의 시감특성 클래스 분류 결과와 일대일 대응이 되므로 비트모델은 기준 양자화간격과 Bv의 관계로 표현하는 대신, Mc와 Bv의 관계로 표현할 수 있다.

양자화간격 참조부(45)에 대하여 살펴보면, 우선 시감특성분류부(44)에 의해 분류된 영상은 각 클래스별로 양자화간격에 대한 화질열화 특성이 다르다. 따라서 양자화간격에 따른 화질 열화정도를 여러영상에서 실험하여 동일한 열화정도를 갖는 각 클래스별 양자화간격을 얻는다. 시감특성 분류부(44)에서 분류된 각 매크로블럭을 다음 표2와 표3에서 보인 기준 양자화간격으로 양자화할 경우 동일한 열화정도를 보인다. 이값들은 기준 양자화간격으로 사용되고, VOP당 발생할 비트량을 예측하는데 이용된다.

< 표2 > 인트라 프레임의 기준 양자화간격값

< 표3 > 인터 프레임의 기준 양자화간격값

다음, 목표비트 계산부(48)에 대하여 살펴보면, 우선 영상은 I 프레임과 P, B 프레임으로 구분되는데 각각을 같은 양자화간격으로 부호화할 경우 비트발생율이 다르다. 따라서, 목표비트율과 처리할 프레임수와 프레임의 종류에 따라 기본적으로 프레임당 목표비트를 할당할 수 있다. 프레임당 목표비트는 남아있는 전체 버퍼점유량에 의해 가변되지만 프레임내의 각 VOP들의 목표 비트는 히스토그램과 각 VOP가 포함하는 매크로블럭의 수 및 기준 양자화간격에 의해서 비율이 정해지게 되고, 정해진 각 비율들은 화질선택 입력부(41)에서 입력된 특정 VOP 번호와 원하는 화질에 맞추어 각 VOP 사이의 목표비트를 조정해야 한다. 따라서, 구해진 프레임별 목표 비트량에 대하여 각 VOP당 원하는 목표비트를 동적으로 할당한다.

다음, 비트발생량 계산부(47)에 대하여 살펴보면, 우선 VOP내의 모든 매크로블럭을 각각의 매크로블럭 클래스 분류 결과에 적합한 기준양자화간격으로 양자화할 경우에 발생하는 VOP 비트발생량을 예측한다. VOP 예측 비트발생량(VOPEstimatedBits)은 비트모델과 히스토그램을 이용하여 다음 식 4와 같이 구해진다.

다음, 목표비트 할당부(50)에 대하여 살펴보면, 우선 전송속도를 고혀한 VOP 목표비트(VOPTargetBits)와 기준 양자화간격에 의한 VOP 비트발생량 예측치(VOPEstimatedBits)의 오차를 비트모델에 반영하여 블럭 목표비트를 결정함으로써 인간의 시감특성, 영상신호의 분포, 전송속도를 고려하여 적응적으로 비트할당을 한다. 매크로블럭의 시감특성 클래스 분류결과가 Mc(0∼15)인 매크로블럭에 속하면서 블럭분산 분류결과가 Bv(0∼15)인 블럭에 할당될 목표비트를 Btarget[Mc][Bv]라고 하고 다음 식 5와 같이 계산한다.

4:2:0 영상의 경우 매크로블럭내의 휘도신호 블럭(4개)과 색신호 블럭(2개)에 할당될 블럭 목표비트를 합하면 매크로블럭 목표비트가 된다. 매크로블럭 목표비트는 비트율 제어과정에서 계산하고, 버퍼점유량을 계산하는데 이용된다. 다음의 과정은 블럭당 목표비트를 할당하는 과정을 보여준다.

제1단계: 비트모델에 의해 기준 양자화간격(Rq)에 의해 발생할 비트발생량(CalcFe)을 다음 식 6에 의해 추정한다.

제2단계: 목표비트와 Rq 값으로 발생할 실제 비트의 차(Diff)를 다음 식 7에 의해 계산한다.

제3단계: 차(Diff)에 의해 기준 양자화간격(Rq)값을 다음 식 8에 의해 조정한다.

이때, 웨이트(Weight)는 기준 양자화간격을 변경할 기준이 된다.

제4단계: 매크로블럭당 목표비트(Tb)를 다음 식 9에 의해 할당한다.

상기 식 9에서 i는 매크로블럭 클래스의 번호, j는 블럭 분산 클래스의 번호를 각각 나타낸다.

제5단계: 비트율 제어시 Tb값을 이용하여 각 매크로블럭당 비트발생량과 목표 비트발생량과의 차이를 보상하는 쪽으로 매크로블럭당 최종 양자화간격을 조정한다.

상술한 바와 같이 본 발명에 의한 내용을 고려한 비트율 제어방법에 의하면, 기존의 영상 부호화방법에 색시감특성을 적용함으로써, PEG-4와 같이 화상의 특정 부분을 원하는대로 처리할 수 있는 영상 부호화기법등에서 원하는 영역의 화질을 사용자 임의로 조절할 수 있으면서도 전체 비트발생량을 일정하게 유지할 수 있다. 즉, 예를 들어 동화상 전화 등에서 전체 화면의 열하가 많은 영상을 얼굴 부분은 고화질로 유지하면서 다른 부분은 상대적으로 화질을 떨어뜨리고도 전체 비트 전송량을 일정하게 함으로써 제한된 환경하에서도 사용자의 요구에 부응할 수 있다.

또한, 화상의 특성을 충분히 반영함으로써, 화질을 균일하게 유지할 수 있고MPEG-4 혹은 H.263 등에 적용할 경우 원하는 비트발생량을 보장할 수 있다.

제1도는 종래의 MPEG-2 부호화방법을 설명하기 위한 장치도.

제2A,2B도는 MPEG 액티비티에 의한 비트율 제어의 문제점을 설명하기 위한 도면.

제3도는 일반적인 MPEG-4 부호화방법을 설명하기 위한 장치도.

제4도는 본 발명에 의한 내용을 고려한 비트율 제어방법을 설명하기 위한 장치도.

제5도는 블럭 분산값과 양자화 간격별 비트 발생량과의 관계를 나타낸 그래프.

Claims

원하는 VOP를 선택하여 해당 VOP의 화질을 임의로 결정하는 단계:

부호화할 VOP 단위 영상의 복잡도를 분류하는 단계:

상기 부호화할 VOP 단위 영상을 시감특성별로 분류하는 단계:

상기 복잡도 분류와 시감특성 분류에 의해 히스토그램을 계산하는 단계:

상기 히스토그램, 사용하는 양자화 매트릭스에 적합하게 제작된 비트 발생율을 추정을 위한 비트모델과 상기 시감특성 분류에 의해 임의의 갯수로 분류된 각가의 클래스에 대한 시감열화 정도가 일정한 기준 양자화간격을 이용하여 예측되는 비트발생량을 계산하는 단계:

각 VOP별 목표비트를 계산하는 단계:

상기 예측된 비트 발생량을 상기 기준 양자화간격의 조절에 의해 상기 목표비트와의 차를 보상하는 단계: 및

각 블럭별 처리시 목표비트에 근접시키기 위해 조절된 기준 양자화간격 및 매크로블럭의 시감특성 클래스, 버퍼점유량을 고려하여 최종 양자화간격을 조절하는 단계를 구비하는 것을 특징으로 하는 내용을 고려한 비트율 제어방법.