KR100559924B1 - 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법 - Google Patents

코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법 Download PDF

Info

Publication number
KR100559924B1
KR100559924B1 KR1020007000443A KR20007000443A KR100559924B1 KR 100559924 B1 KR100559924 B1 KR 100559924B1 KR 1020007000443 A KR1020007000443 A KR 1020007000443A KR 20007000443 A KR20007000443 A KR 20007000443A KR 100559924 B1 KR100559924 B1 KR 100559924B1
Authority
KR
South Korea
Prior art keywords
frame
block
bit rate
target
blocks
Prior art date
Application number
KR1020007000443A
Other languages
English (en)
Other versions
KR20010021879A (ko
Inventor
타오 챵
흥-주 이
야-퀸 쟝
Original Assignee
미디어텍 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 미디어텍 인크. filed Critical 미디어텍 인크.
Publication of KR20010021879A publication Critical patent/KR20010021879A/ko
Application granted granted Critical
Publication of KR100559924B1 publication Critical patent/KR100559924B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer

Abstract

본 발명은 제공된 비트율(130)을 최적화하기 위해 프레임내의 각 매크로 블록에 대한 양자화 스케일을 선택하는 장치 및 방법에 관한 것이다. 양자화 스케일은 프레임의 타겟 비트율이 전체 프레임에 대한 균일한 시각 품질을 유지하는 동안 얻어지도록 각 프레임내의 각각의 매크로 블록(120)에 대하여 선택된다.

Description

코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한 장치 및 방법 {APPARATUS AND METHOD FOR MACROBLOCK BASED RATE CONTROL IN A CODING SYSTEM}
본 발명은 모션 비디오의 코딩을 최적화하는 장치 및 방법에 관한 것으로, 특히, 코딩율을 최적화하면서도 모션 비디오의 전체 품질을 유지하기 위해 프레임내의 각각의 매크로 블록에 대한 양자화 스케일을 적합하게 조절하는 장치 및 방법에 관한 것이다.
동영상 전문가 그룹(MPEG)은 코딩/디코딩 방법의 표준을 제정하기 위해 ISO/IEC 국제 표준 11172 및 13818(일반적으로 MPEG-1과 MPEG-2로 각각 언급됨)을 창설하였다. 이 MPEG 표준들은 MPEG에 따른 비트 스트림을 생성하는 일반적인 코딩 방법과 신택스를 규정하고 있지만, 데스크탑 비디오 출판, 비디오 회의, 디지털 저장 매체 및 텔레비젼 방송과 같은 다수의 다른 애플리케이션 및 서비스를 수용하기 위해 많은 변동이 허용될 수 있다.
비율 제어(rate control) 분야에서, MPEG는 인코더의 비트율(bit rate)을 제어하는 특정 방법을 한정하지는 않는다. 디코더 입력 버퍼가 오버플로우나 언더플로우되지 않도록 비트율을 제어하는 비율 제어 프로세스를 고안하는 것은 인코더 설계자의 과제이다.
일반적으로, 비트율을 제어하는 한가지 방법은 양자화 프로세스를 바꾸는 것이며, 이는 입력 비디오 이미지의 왜곡에 영향을 미치게 된다. 양자화 스케일(스텝 크기)을 바꿈으로써, 비트율이 변화되고 제어될 수 있다.
양자화 스케일을 변화시키는 것이 인코더의 비율 제어를 구현하는 효과적인 방법이지만, 열악한 비율 제어 프로세스는 실제로는 비디오 이미지의 시각 품질을 떨어뜨리게 된다. 즉, 양자화 스케일을 효율적인 방식으로 변경하는데 실패하여, 그 결과 오버플로우 및 언더플로우 상태를 피하기 위해 영상의 끝부분쪽에서 양자화 스케일을 급격하게 변경할 필요가 있다. 양자화 스케일을 바꾸는 것은 이미지 품질과 압축 효율 모두에 영향을 미치기 때문에, 비율 제어 프로세스가 이미지 품질을 저하시키지 않고 비트율을 제어하는 것이 중요하다.
현재의 MPEG 코딩 방법(예를 들면 다양한 MPEG 테스트 모델)에서 각 프레임에 대한 양자화 스케일은 동일 타입의 모든 영상들이 영상 그룹내에서 동일한 복잡도를 가진다는 가정하에 선택된다. 그러나, 이 기준에 의해 선택된 양자화 스케일은 각 영상의 복잡도가 시간에 따라 변하기 때문에 최적의 코딩 성능을 얻지 못할 수도 있다.
게다가, 글로벌-타입 변환, 예를 들면 웨이브렛 변환(또는 계층적 서브밴드 분해로 알려져 있음)을 이용하는 인코더도 유사한 문제를 가지고 있다. 예를 들면, 웨이브렛 변환은 저비트율 이미지 코딩, 즉, 넌-제로(non-zero) 값들의 위치를 가리키며 변환 계수의 중요도 맵으로도 알려져 있는 바이너리 맵(웨이브렛 트리)에 대한 코딩의 중요한 측면에 적용된다. 이어서, 양자화 및 엔트로피 코딩이 매우 낮은 비트율을 얻기위해 사용된다. 중요도 맵(웨이브렛 트리)을 인코딩하기 위한 양자화 스케일의 적당한 선택에 있어서의 상당한 개선은 압축 효율과 코딩율의 상당한 개선으로 이어지게 된다.
게다가, 비율 제어는 프레임내의 더 낮은 레벨, 예를 들면, 매크로 블록 또는 블록 레벨에서 구현될 수 있다. 그러나 양자화 파라미터(양자화 스케일)가 프레임 내에 있는 각각의 매크로 블록에서 변경되면 추가적인 오버헤드(overhead)가 있기 때문에, 매크로 블록 레벨의 비율 제어를 위해서는 보다 많은 비용이 들게 된다. 즉, 각각의 프레임 내부의 서로 다른 매크로 블록들에 대해 서로 다른 양자화 스케일들을 적용하는 디코더와 통신하기 위해서는 더 많은 비트들이 필요하다. 따라서, 적절한 비트 관리가 매우 중요한 저비트율 애플리케이션에서 그 중요성이 높아진다.
그러므로, 코딩율을 최적화하면서도 모션 비디오의 전체 품질을 유지하기 위해 프레임내의 각각의 매크로 블록에 대한 양자화 스케일을 적합하게 조절하는 장치 및 방법이 이 기술 분야에 요구되고 있다.
본 발명의 실시예는 코딩율을 최적화하면서도 비디오 이미지의 전체 품질을 유지하기 위해 각 프레임내의 각각의 블록, 예를 들면, 매크로 블록에 대한 양자화 스케일을 선택하는 방법 및 장치이다. 즉, 전체 프레임에 대하여 균일한 시각 품질을 유지하면서도 영상에 대한 타겟 비트율이 얻어지도록 각 프레임(영상)내의 각각의 매크로 블록에 대하여 양자화 스케일이 선택된다.
본 발명은 도면을 참조로하여 이하에서 상세히 설명된다.
도 1은 본 발명의 장치에 대한 블록 다이어그램을 나타낸다.
도 2는 이미지 내의 블록들에 기반하여 이미지에 대한 타겟 비트율을 산출하고 할당하는 방법에 대한 흐름도의 블록 다이어그램을 나타낸다.
도 3은 타겟 프레임 비트율을 결정하는 방법에 대한 흐름도를 나타낸다.
도 4는 현재의 이미지 내에 있는 매크로 블록들에 대하여 하나 이상의 타겟 매크로 블록 비트율을 결정하는 방법에 대한 흐름도를 나타낸다.
도 5는 본 발명의 장치에 대한 제 2 실시예의 블록 다이어그램을 나타낸다.
도 6은 웨이브렛 트리(wavelet tree)에 대한 도면이다.
도 7은 본 발명의 인코딩 시스템을 나타낸다.
이해를 위해, 도면들에 공통적인 동일한 구성 요소들을 지정하기 위해 동일한 도면 부호가 사용되었다.
코딩율을 제어하면서도, 비디오 이미지의 전체 품질을 유지하기 위해 각 프레임내의 각각의 매크로 블록에 대한 양자화 스케일을 산출하는 본 발명의 장치(100)의 블록 다이어그램이 도 1에 도시되어 있다. 본 발명은 MPEG에 따른 인코더를 참조하여 이하에서 설명되지만, 당업자는 다른 코딩/디코딩 표준에 따른 다른 인코더에도 본 발명이 적용될 수 있음을 이해할 것이다.
본 발명의 바람직한 실시예에서, 장치(100)는 인코더 또는 더욱 복잡한 블록-기반 모션 보상 코딩 시스템의 일부분이다. 이 장치(100)에는 모션 추정 모듈(140), 모션 보상 모듈(150), 비율 제어 모듈(130), DCT 모듈(160), 양자화(Q) 모듈(170), 가변 길이 코딩(VLC) 모듈(180), 버퍼(190), 역양자화(Q-1)모듈(175), 역DCT(DCT-1) 변환 모듈(165), 감산기(115), 가산기(155)가 포함된다. 다수의 모듈이 장치(100)에 포함되지만, 당업자는 여러 가지 모듈들에 의해 실행되는 기능들이 도 1에 도시된 바와 같이 별개의 모듈들로 서로 분리될 필요가 없다는 것을 이해할 것이다. 예를 들면, 모션 보상 모듈(150), 역양자화 모듈(175), 역DCT 모듈(165)을 포함하는 모듈 세트는 일반적으로 "내장형 디코더"로 알려져 있다.
도 1에는 MPEG 표준에 따라 디지털화되고 하나의 휘도(luminance)와 두 개의 색상 차이 신호들(Y, Cr, Cb)로 표현된, 신호 경로(110)상의 입력 이미지(이미지 시퀀스)가 도시되어 있다. 이러한 신호들은 또한 복수의 계층들(시퀀스, 영상 그룹, 영상, 슬라이스, 매크로 블록 및 블록)로 분할되어, 그 결과 각각의 영상(프레임)은 복수의 매크로 블록들에 의해 표현된다. 각각의 매크로 블록은 네개의 휘도 블록들, 한개의 Cr 블록 및 한개의 Cb 블록을 포함하며, 하나의 블록은 8행 8열 샘플 어레이로 정의된다. 영상을 블록 유니트로 분할함으로써 두 개의 연속된 영상 사이의 변화에 대한 식별력이 개선되고 저진폭 변환 계수(이하 후술됨)의 소거에 의한 이미지 압축 향상이 이루어진다. 디지털화된 신호는 선택적으로 적당한 윈도우, 해상도 및 입력 포맷을 선택하기 위한 포맷 전환과 같은 전프로세싱(preprocessing)을 실행할 수 있다.
이하의 설명은 MPEG 표준 용어를 사용한다; 그러나, 매크로 블록 또는 블록과 같은 용어는 임의의 크기 또는 형태의 픽셀을 가진 블록을 의미하는 것으로 이해되어야 한다. 대체적으로, "매크로 블록"은 단일 픽셀만큼 작을 수도 있고 또는 전체 비디오 프레임만큼 클 수도 있다.
경로(110)의 입력 이미지는 모션 벡터를 추정하는 모션 추정 모듈(140)로 수신된다. 모션 벡터는 현 영상의 블록의 좌표 위치로부터 기준 프레임의 좌표 위치로 오프셋(offset)을 제공하기 위한 모션 보상에 사용되는 2차원 벡터이다. 기준 프레임은 이전(previous) 프레임(P-프레임)이거나 이전 및/또는 이후(future) 프레임(B-프레임)일 수 있다. 모션 벡터의 사용은 채널을 통해 전송되는 정보량을 줄임으로써 이미지 압축을 크게 강화할 수 있는데, 이는 현 프레임과 기준 프레임 사이의 변화만 코딩되고 전송되기 때문이다.
모션 추정 모듈(140)의 모션 벡터는 샘플값들에 대한 예측 효율성을 향상시키기 위해 모션 보상 모듈(150)에 의해 수신된다. 모션 보상은 이전 및/또는 이후 기준 프레임들로 오프셋들을 제공하기 위해 모션 벡터들을 사용하여 예측하며, 상기 프레임들은 예측 에러를 형성하는데 이용되는 이전에 디코딩된 샘플값들을 포함한다. 즉, 모션 보상 모듈(150)은 현재의 프레임을 추정하기 위해 이전에 디코딩된 프레임과 모션 벡터들을 사용한다. 또한, 당업자는 모션 추정 모듈과 모션 보상 모듈에 의해 실행된 기능이 예를 들어 단일 블록 모션 보상기와 같은 결합된 모듈에서 구현될 수 있다는 것을 이해할 것이다.
또한, 주어진 매크로 블록에 대해 모션 보상 예측이 실행되기 전에 코딩 모드가 선택되어야 한다. 코딩 모드 결정 영역에서, MPEG는 다수의 다른 매크로 블록 코딩 모드를 제공한다. 특히 MPEG-2는 인트라(intra) 모드, 노 모션 보상 모드(no MC), 프레임/필드/듀얼-프라임 모션 보상 내부(inter) 모드, 포워드/백워드/평균 내부 모드 및 필드/프레임 DCT 모드를 포함하는 매크로 블록 코딩 모드들을 제공한다.
코딩 모드가 선택되면, 모션 보상 모듈(150)은 이전 및/또는 이후 기준 영상에 기반하여 블록의 내용물에 대한 경로(152)를 통해 보상된 예측 이미지(예측된 이미지)를 발생시킨다. 경로(152)의 상기 모션 보상된 예측 이미지는 경로(153)의 에러 신호 또는 예측 잔류(residual) 신호를 형성하기 위해 현재의 매크로 블록에 있는 경로(110)의 비디오 이미지로부터 감산기(115)에 의해 감산된다. 예측 잔류 신호가 형성됨으로써 입력 비디오 이미지의 리던던트(redundant) 정보를 효과적으로 제거할 수 있다. 만일 현재의 프레임이 I-프레임으로 인코딩된다면, 경로(153)의 신호는 단순히 원시(original) 영상이며 예측 잔류 신호가 아니라는 사실을 유의하여야 한다.
그 후에, DCT 모듈(160)은 DCT 계수의 8 행 8 열 블록 세트를 만들기 위해 예측 잔류 신호의 각각의 블록에 대하여 포워드 이산 코사인 변환 프로세스를 적용한다. DCT 기저 함수 또는 서브 밴드 분해에 의해 양자화의 다음 단계에서 중요한 사이코비쥬얼 기준((psychovisual creteria)을 효과적으로 사용할 수 있다.
생성된 DCT 계수의 8 행 8 열 블록은 양자화 모듈(170)에 의해 수신되고 상기 양자화 모듈(170)에서 DCT 계수가 양자화 된다. 양자화 프로세스는 정수값을 형성하기 위한 적절한 라운딩(rounding)을 통해 DCT 계수를 양자화값 세트로 분할함으로써 DCT 계수가 표시되는 정확도를 낮춘다. 양자화 값들은 (시각적으로 가중된 양자화로 알려진) DCT 기저 함수들(DCT basis functions)의 가시성(visibility)에 기반한 기준을 사용하여 각각의 DCT 계수에 대하여 개별적으로 설정될 수 있다. 즉, 양자화 값은 주어진 기저 함수의 가시성에 대한 임계값(threshold), 즉, 인간의 눈으로 탐지할 수 있는 계수 진폭에 대응한다. 상기 값을 이용하여 DCT 계수를 양자화함으로써, 많은 DCT 계수는 "0" 값으로 전환되고, 이에 따라 이미지 압축 효율은 개선된다. 양자화 프로세스는 시각 품질을 달성하고 인코더의 출력과 주어진 비트율이 매칭(matching)되도록 인코더를 제어(비율 제어)하는데 중요한 동작이며 수단이다. 다른 양자화값이 각각의 DCT 계수에 적용될 수 있기 때문에, "양자화 매트릭스"는 일반적으로 예컨대, 휘도 양자화 테이블 또는 색차(chrominance) 양자화 테이블과 같은 기준 테이블로서 설정된다. 그러므로, 인코더는 변환된 블록의 각각의 주파수 계수가 어떻게 양자화 될 것인지를 결정하는 양자화 매트릭스를 선택한다.
그러나, 양자화 에러에 대한 주관적 지각(subjective perception)은 주파수에 따라 크게 변하므로 고주파수에 대해서는 보다 조잡한(coarse) 양자화 값을 사용하는 것이 바람직하다. 즉, 양자화 에러에 대한 인간의 지각적 민감도는 공간 주파수가 높을수록 낮다. 그 결과, 고주파수는 저주파수보다 허용되는 값들의 개수가 적으며 더욱 조잡하게 양자화된다. 게다가, 정확한 양자화 매트릭스는 의도하는 디스플레이의 특성, 가시 거리 및 소스의 잡음량과 같은 많은 외부 파라미터들에 따라 좌우된다. 그러므로, 하나의 애플리케이션 또는 심지어 개별 시퀀스 프레임에 대하여 특정한 양자화 매트릭스를 만드는 것이 가능하다. 일반적으로, 맞춤형(customized) 양자화 매트릭스는 압축 비디오 이미지와 함께 문맥(context)으로 저장될 수 있다. 양자화 스케일의 적절한 선택은 비율 제어 모드(130)에 의해 수행된다.
다음으로, 양자화된 DCT 계수의 8 행 8 열 블록은 신호 접속부(171)를 통하여 가변 길이 코딩(VLC) 모듈(180)로 수신되며, 여기서 양자화 계수의 이차원 블록이 양자화 DCT 계수의 일차원 스트링으로 변환되도록 상기 양자화 계수의 이차원 블록은 "지그-재그" 순서로 스캐닝된다. 이러한 지그-재그 스캐닝 순서는 최저 공간 주파수로부터 최고 주파수로의 DCT 계수의 대략적인 순차적 순서이다. 그 후에, 가변 길이 코딩(VLC) 모듈(180)은 가변 길이 코딩과 런-렝스(run length) 코딩을 사용하여 양자화 DCT 계수들의 스트링과 매크로 블록의 모든 부차적 정보를 인코딩한다.
상기 데이타 스트림은 "FIFO(First In-First Out)" 버퍼(190)로 수신된다. 상이한 영상 타입과 가변 길이 코딩을 사용한 결과, FIFO로의 전체 비트율은 가변적이 된다. 즉, 각각의 프레임을 코딩하기 위해 사용된 비트들의 개수는 서로 다를 수 있다. 고정-비율(fixed-rate) 채널을 포함하는 애플리케이션에서, FIFO 버퍼는 비트율을 평탄하게(smoothing) 하기 위해 인코더 출력과 채널을 매칭하는데 사용된다. 그러므로, 경로(195)의 FIFO 버퍼(190)의 출력 신호는 경로(110)의 입력 비디오 이미지의 압축 형태 (또는 입력 이미지와 예측 이미지 사이의 차이를 나타내는 압축된 차이 신호)이며, 경로(195)를 통해 저장 매체 또는 무선 통신 채널로 전송된다.
비율 제어 모듈(130)은 데이타 스트림의 전송후 디코더 측(수신기 또는 타겟 저장 장치내부, 미도시)의 오버플로우 및 언더플로우를 방지하기 위해 FIFO 버퍼(190)로 입력되는 데이타 스트림의 비트율을 모니터링하고 조절하는 역할을 한다. 그러므로, 인코더에 의해 발생된 비트수를 제어하기 위해 버퍼(190)의 상태를 모니터링하는 것이 비율 제어 모듈(130)의 작업이다.
본 발명의 바람직한 실시예에서, 비율 제어 모듈(130)은 코딩율을 제어하면서도 비디오 이미지의 전체 품질을 유지하기 위해 각각의 블록, 예를 들어 각각의 프레임 내에 있는 매크로 블록에 대한 양자화 스케일을 선택한다. 즉, 프레임내 특정 블록들이 보다 많거나 또는 보다 적은 비트율 할당을 요구하는지 여부를 결정하기 위해 프레임이 평가(evaluate)될 수 있다. 다른 애플리케이션들의 경우, 여러가지 블록들은 다른 블록들보다 중요도가 높다. 예를 들면, 비디오 폰 애플리케이션에서 일반적으로 인간의 얼굴을 나타내는 블록은 배경을 나타내는 블록보다 휴먼 뷰어(human viewer)에서 중요도가 높다. 다른 예들에서는, 의료 애플리케이션의 경우, 특정 블록의 이미지, 즉, 잠재된 종양을 나타내는 블록은 주변 조직을 나타내는 블록보다 중요도가 높으며, 또한 감시 애플리케이션의 경우, 특정 블록의 이미지, 즉, 군사적 평가(assess)를 나타내는 블록은 주변 위장을 나타내는 블록보다 중요도가 높다. 그러므로, 특정 애플리케이션은 프레임내의 관련 블록들의 중요도를 정의하는 기준을 지시할 수 있다. 본 발명에서, 양자화 스케일은 전체 프레임을 통해 균일한 시각 품질을 유지하면서 프레임에 대한 타겟 비트율을 달성할 수 있도록 각 프레임 내부의 각각의 매크로 블록에 대해 선택된다.
본 발명은 시간(예를 들면, 모션 추정/보상) 및 공간(예를 들면, 이산 코사인 변환) 인코딩을 구현하는 인코더를 통해 설명되지만, 이에 제한되는 것은 아니다. 다른 시간 및 공간 인코딩 방법이 사용될 수 있으며, 어떠한 시간 및 공간 인코딩도 사용되지 않을 수 있다.
구체적으로, 비율 제어 모듈(130)은 프레임율 할당기(131) 및 매크로 블록율 할당기(132)를 포함한다. 프레임율 할당기(131)는 현재 프레임에 대해 비트 예산(budget)(타겟 프레임 비트율)을 할당하는 반면에, 매크로 블록율 할당기(132)는 현재 프레임 내부의 각각의 매크로 블록에 대한 비트 예산(타겟 매크로 블록 비트율 또는 타겟 블록 비트율)을 할당한다.
요컨대, 프레임율 할당기(131)는 먼저 이전의 인코딩된 영상으로부터 또는 다양한 MPEG 테스트 모델을 실행함에 의해 특정 타입의 영상(I,P,B)의 복잡도를 대략적으로 추정한다. 이러한 추정된 복잡도는 각 프레임을 코딩하는데 필요한 예측 비트수를 산출하는데 사용된다. 이를 바탕으로, 프레임에 대한 양자화 스케일은 다항식 형태를 가진 복잡도 척도(complexity measure)에 따라 계산된다. 이러한 복잡도 척도는 프레임에 대해 선택된 양자화 스케일이 영상의 타겟 비트율에 근접해야 한다는 제한 조건을 충족시키도록 유도된다. 일단 프레임이 인코딩되면, 비율 제어 모듈은 다항식 역행 프로세스(polynomial regression process)를 통해 복잡도 척도를 순환적으로 조절한다. 즉, 매크로 블록을 코딩하는데 필요한 실제적인 비트수는 다음 프레임에 대한 양자화 스케일의 예측을 향상시키기 위해 복잡도 척도를 개선하는데 사용된다. 양자화 스케일을 계산하는 동안, "타겟 프레임 비트율"도 또한 순환적으로 업데이트된다. 이러한 프레임율 할당 방법은 여기에 참조로서 통합된, 출원 번호가 09/022,349(대리인 서류 번호 SAR12459)이고 출원일이 1998년 2월 11일이며, 발명의 명칭이 "Apparatus And Method For Optimizing The Rate Control In A Coding System"인 특허 출원에 개시되어 있다. 본 발명은 다른 프레임 비트율 할당 방법, 예를 들면, 왜곡 척도(distortion measure) 등에 기반한 프레임 비트율 할당 방법들을 사용하여 구현될 수 있다.
요컨대, 매크로 블록율 할당기(132)는 하나 이상의 타겟 매크로 블록 비트율을 결정하기 위해 계산된 타겟 프레임 비트율을 적용하며, 타겟 프레임 비트율의 비트들은 매크로 블록의 절대차 평균(MAD)과 가중값(weighting)에 비례하여 분배된다. 타겟 매크로 블록의 비트율과 대응하는 양자화 스케일 선택 방법에 대한 상세한 설명은 도 4를 참조하여 아래에서 논의된다.
그러나, 인간의 시각 반응에 기인하여, 몇몇 매크로 블록들은 휴먼 뷰어에서 다른 매크로 블록보다 중요도가 높을 수 있다. 매크로 블록의 중요도는 선택적인 매크로 블록 분류 모듈(120)에 의해 결정된다. 매크로 블록 분류 모듈(120)은 각 프레임내의 매크로 블록들의 중요도를 정의하기 위해 필요한 기준을 포함한다. 예를 들어, 여기에 참조로서 통합된, 발명의 명칭이 "Apparatus And Method For Employing M-Ary Pyramids To Enhance Feature-Based Classification And Motion Estimation"이고 출원일이 1997년 12월 31일이며 출원 번호가 09/002258(대리인 서류번호 SAR 12626)인 특허 출원에 개시된 바와 같이, 다양한 매크로 블록 분류 방법들이 이용가능하다. 매크로 블록의 "중요도"는 이하 설명되는 가중치(weighting)의 사용을 통해 설명된다. 간단하게 말하자면, 만일 하나의 매크로 블록이 중요도가 높으면 이후 많은 비트가 상기 매크로 블록에 할당되는 반면에, 하나의 매크로 블록이 중요도가 낮으면 적은 비트가 상기 매크로 블록에 할당된다.
대안적으로, "매크로 블록 기반" 정보, 예를 들면, 어떤 매크로 블록들이 중요도가 높은지, 어떤 매크로 블록들이 하나의 프레임에서 전경, 배경, 또는 물체 등과 같은 정보 중 어떤 형태의 정보를 운반하는 지에 관한 정보는 경로(112)의 이미지 시퀀스로부터 직접 획득할 수 있다. 즉, 이미지 시퀀스가 이전에 프로세싱되고 저장 비디오 시퀀스 또는 서버의 프로그램과 같은 저장 매체에 저장되었다면, 저장된 비디오 시퀀스를 실행시킨 인코더는 "매크로 블록 기반" 정보를 전달할 수 있다. 다시 말하면, "매크로 블록 기반" 정보가 이미지 시퀀스와 함께 인코더(100)에 전송될 수 있다. 이러한 구현예에서, 매크로 블록 분류 모듈(120)은 생략될 수 있으며, 이는 매크로 블록 기반 정보를 이용할 수 있기 때문이다.
도 1로 돌아가서, 양자화 모듈(170)의 양자화된 DCT 계수의 8 행 8 열 블록은 또한 신호 접속부(172)를 통하여 역 양자화 모듈(175)로 수신된다. 이 단계에서, 인코더는 데이타를 디코딩함으로써 입력 비디오 이미지의 I-프레임들과 P-프레임들을 재생성하며 그 결과 상기 프레임들은 다음의 인코딩을 위한 기준 프레임으로 사용된다.
역양자화(dequantizing)된 DCT 계수의 8 행 8 열 블록은 역 DCT 모듈(165)을 통과하게 되며, 역 DCT 모듈(165)에서 디코딩된 에러 신호를 생성하도록 각각의 매크로 블록에 역 DCT가 적용된다. 상기 에러 신호는 가산기(155)를 통해 모션 보상 모듈로부터 예측 신호에 다시 부가되어 디코딩된 기준 영상(재구성된 이미지)을 생성한다.
도 2는 이미지내의 매크로 블록들에 기반하여 이미지에 대한 비트들을 산출 및 할당하는 방법(200)에 대한 흐름도의 블록 다이어그램이다. 더욱 상세하게는, 상기 방법(200)은 단계(205)에서 시작하고 현재 프레임에 대한 타겟 프레임 비트율이 결정되는 단계(210)로 진행된다. 바람직한 실시예에서, 타겟 프레임 비트율은 (도 3에 도시된) 다항식 역행 프로세스(polynomial regression process)를 사용하여 순환적으로 조절되는 복잡도 척도를 이용하여 결정된다.
도 3은 타겟 프레임 비트율을 결정하는 방법(300)의 흐름도를 도시한다. 도 3을 참조하면, 이 방법은 단계(305)에서 시작되고 프레임의 타겟 비트들(타겟 프레임 비트율), Tframe을 다음식으로 결정하는 단계(310)로 진행된다.
Figure 112000000705646-pct00001
여기에서 R은 프레임 시퀀스의 잔존 비트수이고, Nf는 시퀀스의 잔존 프레임의 개수이며, Tprevious frame은 이전 프레임의 인코딩에 사용된 비트수이며, past_percent 는 상수이다. 바람직한 실시예에서, 상수 past_percent는 0.05로 선택된다. 그러나, 본 발명이 이에 제한되지는 않는다. 다른 값들이 사용될 수 있으며, 상기 다른 값들은 특정 애플리케이션 또는 이미지의 내용에 따라 결정된다.
요컨대, 방정식(1)에서 타겟 프레임 비트율은 이용가능한 비트들 및 마지막으로 인코딩된 프레임 비트들에 기초하여 계산된다. 만일 마지막 프레임이 복잡하며 많은 비트들을 사용한다면, 이는 현재 프레임에 더 많은 비트들이 할당되어야 한다는 것을 의미한다. 그러나, 이러한 할당량의 증가는 나머지 프레임들을 인코딩하기 위해 이용가능한 비트수를 감소시킬 것이며, 이에 따라 상기 프레임에 대한 할당량의 증가를 제한할 것이다. 가중 평균은 방정식(1)의 두번째 항에 기술된 바와 같이 두개의 인자들의 절충(compromise)을 반영한다.
단계 320에서, 방법(300)은 다음과 같이 현재의 버퍼 풀니스(buffer fullness)에 의해 계산된 타겟 프레임 비트율(Tframe)을 조절한다.
Figure 112000000705646-pct00002
여기에서, T'frame은 조절된 타겟 비트율이며, "a"는 현재의 버퍼 풀니스(디코더로 전송될 비트들을 포함하는 버퍼의 일부분)을 나타내며, b는 (물리적인 버퍼 크기 - 버퍼 풀니스(a))를 나타내며, c는 값이 2인(다른 값이 사용될 수 있음) 상수이다. 이와 같이, "b"는 버퍼의 잔존 공간을 나타낸다. 방정식(2)은 버퍼가 반이상 채워지면, 조절된 타겟 비트율(T'frame)은 감소하게 됨을 나타낸다. 반대로, 만일 버퍼가 반이하로 채워지면, 조절된 타겟 비트율(T'frame)은 증가하게 된다. 만일 버퍼가 정확히 반만큼 채워지면, 어떠한 조절도 필요없으며, 이는 방정식(2)의 결과가 T'frame = Tframe이 되기 때문이다.
단계 330에서, 방법(300)은 타겟 프레임 비트율(Rs/30)의 하한(lower bound)이 다음과 같이 유지됨을 선택적으로 확인한다.
Figure 112000000705646-pct00003
방정식(3)에서 Tframe은 두개의 가능한 값들 중에서 큰 값(max)을 취하며, Rs는 시퀀스(또는 세그먼트)의 비트율(예를 들면, 24000 bits/sec)이다. 즉, 타겟율(Rs/30)의 하한은 최소 품질을 유지하거나 보장하는데 이용되며, 예를 들면 800 bits/frame이 최소값으로 설정될 수 있다. 최소 품질이 유지될 수 없는 경우, 인코더는 현재 프레임을 모두 스킵하는 옵션을 가지게 된다. 이 후, 방법(300)은 단계(340)에서 종결된다.
다른 프레임 비트율 할당 방법, 예를 들면, MPEG TM4 및 TM5가 본 발명에서 사용될 수 있다. 그러나, 타겟 매크로 블록 비트율은 타겟 프레임 비트율을 사용하여 산출되기 때문에, 계산상의 오버헤드 및 타겟 매크로 블록 비트율의 정확도는 사용된 프레임 비트율 할당 방법에 의해 영향을 받는다. 예를 들면, 만일 성능을 저하시키는 대신에 계산상 복잡도를 최소화하는 것이 바람직하다면, MPEG TM4 및 TM5와 같은 프레임 비트율 할당 방법들을 사용하는 것이 적절하다. 반대로, 계산상 복잡도가 증가하는 대신에 성능을 최대화하는 것이 바람직하다면, 특허 출원(대리인 서류 번호 SAR 12459)의 프레임 비트율 할당 방법 또는 다른 보다 복잡한 프레임 비트율 할당 방법들을 사용하는 것이 적절하다.
도 2로 돌아가서, 일단 Tframe이 결정되면, 방법(200)은 이하 도 4에 도시된 바와 같이 현재 이미지에 있는 매크로 블록들에 대하여 하나 이상의 타겟 매크로 블록 비트율을 결정한다. 이 후, 방법(200)은 단계(230)에서 종결된다.
도 4에 현재 이미지내에 있는 매크로 블록들에 대한 하나 이상의 타겟 매크로 블록 비트율을 결정하는 방법(400)에 대한 흐름도를 나타낸다. 상기 방법은 단계(405)에서 시작하고 절대차(absolute difference)의 합(SAD) Si가 각각의 매크로 블록 i에 대해 수행되는 단계(410)로 진행된다. 즉, (원시 이미지의) 각각의 픽셀값과 (예측된 이미지의) 대응하는 픽셀값 사이의 절대차는 매크로 블록내에 정의된 픽셀들에 대해 수행된다. 다음으로, 매크로 블록들에 대한 픽셀들의 모든 절대차의 합은 매크로 블록 i에 대한 SAD를 생성하도록 수행된다.
단계(420)에서, 방법(400)은 Si가 임계값(Hq)보다 큰지 여부를 묻는다. 본 발명의 매크로 블록 비트 할당 방법에서 임계값(Hq)은 여러 매크로 블록들을 제거하도록 선택된다. 즉, 공간 필터링 또는 양자화를 통해 특정 매크로 블록들의 정보는 제거되거나 "0" 값을 가지게 될 것이다. 이러한 매크로 블록들은 어떤 정보도 전달하지 않을 것이기 때문에, 비트들은 이러한 매크로 블록들에 할당되지 않을 것이다. 그리하여, 상기 사항들을 고려하여 임계값(Hq)은 여러 매크로 블록들을 제거하도록 제공된다.
동작시, 임계값(Hq)은 이전 프레임에서 스킵되었던 모든 절대차 평균(MAD)들의 평균값으로 선택되며, MADi는 매크로 블록 i의 픽셀수로 Si를 나눈 값으로 정의된다. 그러나, 현재 프레임이 이미지 시퀀스의 제 1 프레임인 경우, Hq는 현재 프레임에 존재하는 모든 MAD들의 평균의 절반값으로 세팅된다.
그리하여, 만일 단계(420)의 질문에 대한 응답이 '아니오'이면, 방법(400)은 매크로 블록 i가 비트 할당 수신을 위한 고려에서 제외되는 단계(425)로 진행된다. 만일 단계(420)의 질문에 대한 응답이 '예'이면, 방법(400)은 매크로 블록 i가 아래에서 설명될 바와 같이, 비트 할당 수신을 위해 고려되는 단계(423)로 진행된다.
단계(430)에서, 타겟 매크로 블록 비트율 Ri는 다음과 같이 각각의 매크로 블록 i(i=1,2,3,...)에 대하여 결정된다.
Figure 112000000705646-pct00004
여기에서 Madi는 매크로 블록 i의 절대차 평균(MAD)이며, "n"은 프레임에 있는 매크로 블록들의 개수이며, "w"는 가중 인자이며, Ri는 매크로 블록 i에 대한 추정된 타겟 매크로 블록 비트율이다. 가중 인자 w는 주어진 매크로 블록에 대한 Ri가 다른 기준에 따라 조절되도록 한다. 즉, 몇몇 매크로 블록들은 다른 매크로 블록들보다 중요도가 높을 수 있으며, "중요도"는 단지 매크로 블록의 MAD에 기반하여 결정되지는 아니다. 전술한 바와 같은 다양한 애플리케이션들은 특정 매크로 블록들을 강조할 수 있다. 선택적인 가중 인자 w를 결합함으로써, 다소의 비트들이 애플리케이션의 특정 기준에 따라 특정 매크로 블록에 할당될 수 있다. 바람직한 실시예에서, w는 "1"로 설정되지만, 특정 애플리케이션의 필요에 따라 다른 값들이 사용될 수 있다.
그리하여, 타겟 프레임 비트들(Tframe)은 매크로 블록의 절대차 평균(MAD)에 비례하여 분배된다. 예를 들면, 만일 이미지가 각각 MADa=1, MADb=1, MADc=3, MADd=4인 "a", "b", "c", "d"의 단지 4개의 매크로 블록을 가지고, Tframe=100이며, 매크로 블록 a와 b가 비트 할당 수신을 위한 고려에서 제외되도록 Hq가 선택되면, Rc 및 Rd는 각각 다음과 같이 계산된다.
Figure 112000000705646-pct00005
그러므로, 매크로 블록 a와 b의 MAD는 Rc및 Rd의 결정에 사용되지 않는다. 또한, 위 예는 Ri가 매크로 블록에 할당된 후에 Tframe을 업데이트하는 이유를 설명한다.
일단 이미지의 각각의 매크로 블록에 대한 Ri가 결정되면, 단계(440)에서 방법(400)은 각각의 매크로 블록 i에 대한 양자화 스케일(Qi)을 계산한다. 바람직한 실시예에서, 양자화 스케일(Qi)은 출원 번호가 09/022,349(대리인 명세서 SAR 12459)인 미국 특허 출원에 개시된 왜곡 척도에 따라 계산된다. 간단하게, 양자화 스케일(Qi)은 이하 기술된 이차 방정식(quadratic) 비율-왜곡 방법으로부터 산출된다.
Figure 112000000705646-pct00006
여기에서 Ri는 매크로 블록 i에 사용된 실제 비트들이며, Qi는 매크로 블록 i에 대하여 선택된 양자화 레벨 또는 스케일을 나타내고, Ei는 왜곡 척도를 나타낸다. 바람직한 실시예에서, Ei는 현재 프레임의 Ri를 포함한 매크로 블록들에 대한 모든 절대차 평균(MAD)의 합을 나타낸다. 즉, 척도(Ei)는 시퀀스의 연속된 프레임들 사이에서 매크로 블록 차이를 계산하기 위해 매크로 블록의 비트 예산(budget)을 조절하는 방법을 제공한다. 다시 말하면, 현재 프레임의 매크로 블록과 이전 프레임의 동일 매크로 블록 사이의 차이값이 커질수록 현재 프레임의 매크로 블록을 코딩하는데 필요한 비트수가 많아진다. 또한, 다른 왜곡 척도들이 사용될수 있으며, 그 결과 Ei는 평균 제곱 오차 또는 최소 식별 차이(just-noticeable difference; jnd)로 표현될 수 있다.
초기화 과정 동안, 방정식(6)에서 Ri는 Qi를 생성하도록 계산된 Ri로 대체된다. 파라미터 X1과 X2는 다음과 같이 초기화된다.
Figure 112000000705646-pct00007
Rs는 시퀀스(또는 세그먼트)에 대한 비트율, 예를 들면 24000 bits/second을 나타낸다. Ns는 인코딩된 프레임간의 거리를 나타낸다. 즉, 저비트율 애플리케이션에서, 시퀀스내의 특정 프레임들은 인코딩되지 않을 수 있다(스킵될 수 있다). 예를 들면, 인코더는 단지 매 4 프레임마다 인코딩될 수 있다. 스킵된 프레임수는 특정 애플리케이션의 요구에 띠리 변경될 수 있다. 그리하여, 단계(440)에서, 양자화 스케일(Qi)은 방정식(6)과 방정식(7)에 따라 결정될 수 있다.
그러나, 계산된 Qi는 매크로 블록들 사이에서 너무 현저하게 변경되지 않도록 하는 조건에 의해 제한된다. 즉, Qi는 다음과 같은 조건들에 의해 제한된다.
Figure 112000000705646-pct00008
여기에서, Qlast는 Ri를 포함하는 인접한 이전 매크로 블록의 양자화 스케일이며, "e"는 값이 "2"인 상수(애플리케이션에 따라 다른 값들이 선택될 수 있음)이다. 즉, 계산된 Qi는 매크로 블록들 사이에서 "2" 값보다 크지 않은 값으로 변경되도록 제한된다. 이러한 제한은 균일한 시각 품질을 유지시킨다. 즉, 이러한 제한은 매크로 블록들 사이에서 시각 품질의 현저한 변화를 최소화한다. 만일 인접 매크로 블록(Ri를 포함하지 않는 매크로 블록)이 스킵되었다면, Qlast는 "스킵되지 않은(non-skipped)" 그 다음의 인접한 매크로 블록을 기초로 결정된다.
단계(450)에서, Qi는 "실제 Ri"(매크로 블록을 인코딩하기 위해 사용되는 실제 비트수)를 생성하도록 매크로 블록을 인코딩하기 위해 이용된다. 실제 인코딩후, 실제 Ri 및 Qi는 파라미터 X1과 X2를 개선하기 위해 다항식 역행 모델 또는 이차 방정식 역행 모델을 사용하여 파라미터 X1과 X2를 업데이트하는데 이용된다. 즉, 상수 X1과 X2는 매크로 블록에 할당된 비트와 특정 양자화 레벨 또는 스케일의 매크로 블록을 코딩하는데 필요한 실제 비트수 사이의 불일치를 계산하기 위해 업데이트 된다. 역행 모델은 기술적으로 공지되어 있다. 다양한 역행 모델들은 예를 들면, Bowerman and O'Connell, Forecasting and Time Series, 3rd Edition, Duxbury Press, (1993, chapter 4)에 자세히 개시되어 있다.
또한, Tframe은 방정식(9)과 같이 Tframe에서 실제 Ri(actual Ri) 값을 뺀 값으로 업데이트된다.
Figure 112000000705646-pct00009
전체 프레임이 인코딩되었을 때, 실제 Tframe(프레임을 인코딩하기 위해 사용되는 실제 비트수)은 상기 도 3에 도시된 바와 같이, 타겟 프레임 비트율을 발생시키는 방법을 업데이트하는데 사용될 수 있다.
상술한 실시예에서는 매크로 블록의 양자화 스케일을 계산하기 위해 Ri를 사용하지만, 계산 자원의 할당과 같은 다른 코딩 파라미터들을 구현될 수 있다. 즉, 특정 매크로 블록 또는 일련의 매크로 블록들이 높은 Ri를 가지도록 결정된다면, 예를 들어, 특정 매크로 블록 또는 일련의 매크로 블록들의 코딩시 다중 프로세서 코딩 시스템의 많은 프로세서를 사용하여, 보다 많은 프로세싱 전력을 할당할 수 있다.
단계(470)에서, 방법(400)은 프레임에 다음 매크로 블록이 존재하는지 여부를 묻는다. 만일 물음에 대한 응답이 '아니오'이면, 방법(400)은 단계(480)에서 종결된다. 만일 물음에 대한 응답이 '예'이면, 방법(400)은 단계(430)로 복귀하고, 단계(430-460)는 모든 매크로 블록이 현재 프레임에서 평가될 때까지 반복된다.
도 5는 본 발명을 구체화한 웨이브렛(wavelet)-기반 인코더(500)를 도시한다. 인코더는 블록 모션 보상기(BMC) 및 모션 벡터 코더(504), 감산기(502), 이산 웨이브렛 변환(DWT) 코더(506), 비트율 제어기(510), DWT 디코더(512), 출력 버퍼(514)를 포함한다.
일반적으로, 상술한 바와 같이, 입력 신호는 비디오 이미지(비디오 시퀀스의 프레임을 정의하는 이차원 픽셀(화소) 어레이)이다. 저비트율 채널을 통해 이미지를 정확하게 전송하기 위해, 비디오 프레임 시퀀스의 공간 및 시간 리던던시는 상당히 감소되어야 한다. 이는 일반적으로 연속된 프레임 사이의 차이만을 코딩하고 전송함으로써 달성될 수 있다. 인코더는 세가지 기능을 가진다: 첫째, BMC 및 모션 벡터 코더(504)를 사용하여, 프레임들 사이에서 발생하는 모션을 나타내는 다수의 모션 벡터를 생성한다; 둘째, 모션 벡터들과 결합된 이전 프레임의 재구성된 버전을 이용하여 현재 프레임을 예측한다; 세째, 예측된 프레임은 코딩되고 모션 벡터를 따라 수신기로 전송되는 프레임 오차들(residuals)를 생성하기 위해 현재 프레임으로부터 감산된다.
이산 웨이브렛 변환은 입력 이미지의 통상적인 웨이브렛 트리 구조를 만들기 위해 웨이브렛 계층 서브밴드 분해(wavelet hierarchical subband decomposition)를 실행한다. 이러한 이미지 분해를 달성하기 위해, 이미지는 두번의 서브 샘플링을 사용하여 고수평-고수직(HH), 고수직-저수평(HL), 저수평-고수직(LH), 저수평-저수직(LL) 주파수 서브 밴드로 분해된다. 또한 LL 서브 밴드는 HH,HL,LH,LL 서브 밴드들의 세트를 만들기 위해 다시 두번 서브 샘플링된다. 이러한 서브 샘플링은 도 6에 도시된 바와 같이 세번의 서브 샘플링이 사용된 서브 밴드 어레이를 만들기 위해 순환적으로 실행된다. 바람직하게는 여섯번의 서브 샘플링을 실행한다. 서브 밴드간 부모-자식(parent-child) 의존 관계는 부모 노드의 서브 밴드로부터 자식 노드의 서브 밴드를 지시하는 화살표로 도시되어 있다. 가장 저주파수 서브 밴드는 좌측 상단의 LL1이며 가장 고주파수 서브 밴드는 우측 하단 HH3이다. 이 예에서, 모든 자식 노드는 하나의 부모 노드를 갖는다. 서브 밴드 분해에 대한 자세한 설명은 J.M.Shapiro, "Embedded Image Coding Using Zerotrees of Wavelet Coefficients", IEEE Trans. on Signal Processing, Vol. 41, No. 12, pp. 3445-62, December 1993에 개시되어 있다.
도 5의 DWT 코더는 "폭 우선(breadth first)" 또는 "깊이 우선(depth first)" 패턴으로 웨이브렛 트리의 계수들을 코딩한다. 폭 우선 패턴은 비트-평면 패턴에 의해 비트-평면의 웨이브렛 트리를 가로지른다. 즉, 모든 부모 노드, 모든 자식 노드, 모든 손자 노드의 순서로 노드를 양자화한다. 반대로, 깊이 우선 패턴은 저-저 서브 밴드(LL1)의 루트로부터 자식 노드로 (위에서 아래로) 또는 자식 노드로부터 저-저 서브 밴드(아래에서 위로)로 각각의 트리를 가로지른다. 비율 제어기(510)에 의한 적당한 양자화 레벨의 선택에 의해 상술한 바와 같이 시퀀스의 각 프레임내의 각각의 매크로 블록의 비트율이 제어된다. 이와 같이, 본 발명은 다른 변환을 사용하는 다양한 타입의 인코더에 적용될 수 있다.
도 7에 본 발명의 인코딩 시스템(700)이 도시되어 있다. 인코딩 시스템은 범용 컴퓨터(710)와 다양한 입/출력 장치(720)를 포함한다. 범용 컴퓨터는 CPU(712), 메모리(714) 및 이미지 시퀀스를 수신하고 인코딩하는 인코더(716)를 포함한다.
바람직한 실시예에서, 인코더(716)는 단순히 상술한 바와 같은 인코더(100) 및/또는 인코더(500)이다. 인코더(716)는 통신 채널에 의해 CPU(712)에 연결되는 물리적인 장치일 수 있다. 대안적으로, 인코더(716)는 저장 장치로부터 로딩되고 컴퓨터의 메모리(712)에 존재하는 소프트웨어 애플리케이션(또는 ASIC(application specific integrated circuits)와 같은 소프트웨어 및 하드웨어의 조합)으로 구현될 수 있다. 이와 같이, 본 발명의 인코더(100,500)는 메모리 또는 저장 장치와 같은 컴퓨터 판독 가능 매체에 저장될 수 있다.
컴퓨터(710)는 키보드, 마우스, 카메라, 캠코더, 비디오 모니터, 다수의 이미징 장치 또는 테이프 드라이브, 플로피 드라이브, 하드 디스크 또는 컴팩트 디스크 드라이브를 포함하지만 이들로 제한되지 않는 저장 장치와 같은 다수의 입/출력 장치(720)에 결합되어 있다. 입력 장치는 인코딩된 비디오 비트 스트림을 만들기 위해 컴퓨터에 입력을 제공하거나 저장 장치 또는 이미징 장치로부터 비디오 이미지의 시퀀스를 수신하는 역할을 한다. 마지막으로, 인코딩 시스템으로부터의 인코딩된 신호를 디코딩 시스템(미도시)으로 전달하는 통신 채널(730)이 도시되어 있다.
코딩율을 최적화하면서도 비디오 이미지의 전체 품질을 유지하기 위해 각 프레임내의 각각의 매크로 블록에 대한 양자화 스케일을 선택하는 새로운 장치 및 방법이 설명되고 도시되어 있다. 그러나, 본 발명의 많은 변화, 수정, 변경 및 다른 사용과 본 발명의 다른 애플리케이션은 당업자가 실시예를 개시한 본 명세서 및 도면을 참작한 후 용이하게 이용할 수 있다. 본 발명의 사상과 영역에서 벗어나지 않는 모든 변화, 수정, 변경 및 다른 사용과 다른 애플리케이션은 본 발명에 의해 설명될 것이다.

Claims (20)

  1. 이미지 시퀀스의 각각의 프레임을 인코딩하기 위해 비트들을 할당하는 방법으로서, 각각의 상기 프레임은 적어도 하나의 블록을 가지며, 상기 방법은,
    (a) 상기 프레임에 대한 타겟 프레임 비트율을 결정하는 단계; 및
    (b) 상기 적어도 하나의 블록에 대한 타겟 블록 비트율에 따라 상기 적어도 하나의 블록 사이에서 상기 타겟 프레임 비트율을 할당하는 단계를 포함하며,
    상기 적어도 하나의 블록에 대한 상기 타겟 블록 비트율은 상기 블록의 절대차 평균(Mad)에 따라 선택되는 것을 특징으로 하는 방법.
  2. 제 1 항에 있어서,
    상기 타겟 블록 비트율은, 수학식
    Figure 112005060141067-pct00019
    에 따라 결정되며, Mad는 블록의 상기 절대차 평균(MAD)이며, n은 상기 프레임에 있는 블록들의 개수이며, w는 가중 인자(weighting factor)이며, Ri는 상기 타겟 블록 비트율이며, Sad는 블록의 절대차의 합(SAD)이며, Tframe은 상기 타겟 프레임 비트율이며, Hq는 상수인 것을 특징으로 하는 방법.
  3. 제 1 항에 있어서,
    상기 타겟 블록 비트율은 임계값(Hq)에 따라 조절되는 것을 특징으로 하는 방법.
  4. 제 3 항에 있어서,
    상기 타겟 블록 비트율은 상기 적어도 하나의 블록 사이에서 상기 타겟 프레임 비트율을 할당하는 상기 단계 (b)로부터 상기 임계값(Hq) 이하인 절대차의 합(SAD)을 가진 상기 프레임 내에 있는 각각의 블록을 제거함으로써 조절되는 것을 특징으로 하는 방법.
  5. 제 1 항에 있어서,
    상기 블록은 매크로블록인 것을 특징으로 하는 방법.
  6. 제 1 항에 있어서,
    상기 타겟 프레임 비트율(Tframe)은, 수학식
    Figure 112005060141067-pct00020
    에 따라 산출되며, R은 상기 이미지 시퀀스에 대한 잔존 비트 수이며, Nf는 상기 이미지 시퀀스의 잔존 프레임의 개수이며, Tprevious frame은 이전 프레임을 인코딩하는데 사용된 비트 수이며, past_percent는 상수인 것을 특징으로 하는 방법.
  7. 제 1 항에 있어서,
    (c) 상기 타겟 블록 비트율에 따라 상기 적어도 하나의 블록에 대한 양자화 스케일을 생성하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  8. 제 7 항에 있어서,
    (c') 이전 블록의 이전 양자화 스케일에 따라 상기 양자화 스케일을 조절하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  9. 제 7 항에 있어서,
    (d) 상기 양자화 스케일을 이용하여 상기 적어도 하나의 블록을 인코딩하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  10. 이미지 시퀀스의 각각의 프레임을 인코딩하기 위한 장치로서, 상기 프레임은 적어도 하나의 블록을 가지며, 상기 장치는,
    현재 프레임의 예측된 이미지를 생성하는 모션 보상기;
    복수의 계수들을 생성하는 변환을 상기 현재 프레임과 상기 예측된 이미지 사이의 차이 신호에 적용하는 변환 모듈;
    적어도 하나의 양자화 스케일을 이용하여 상기 복수의 계수들을 양자화하는 양자화기; 및
    상기 적어도 하나의 블록에 대한 타겟 블록 비트율에 응답하여 현재 프레임에 대한 상기 적어도 하나의 양자화 스케일을 선택적으로 조절하는 제어기를 포함하며,
    상기 적어도 하나의 블록에 대한 상기 타겟 블록 비트율은 상기 블록의 절대차 평균(Mad)에 따라 선택되는 것을 특징으로 하는 장치.
  11. 제 10 항에 있어서,
    각각의 복수의 블록들에 대한 상기 타겟 블록 비트율은, 수학식
    Figure 112005060141067-pct00021
    에 따라 선택되며, Mad는 블록의 상기 절대차 평균(MAD)이며, n은 상기 프레임에 있는 블록들의 개수이며, w는 가중 인자(weighting factor)이며, Ri는 상기 타겟 블록 비트율이며, Sad는 블록의 절대차의 합(SAD)이며, Tframe은 상기 타겟 프레임 비트율이며, Hq는 상수인 것을 특징으로 하는 장치.
  12. 제 10 항에 있어서,
    상기 타겟 블록 비트율은 임계값(Hq)에 따라 조절되는 것을 특징으로 하는 장치.
  13. 제 12 항에 있어서,
    상기 타겟 블록 비트율은 상기 임계값(Hq) 이하인 절대차의 합(SAD)을 가진 상기 프레임 내에 있는 각각의 블록을 제거함으로써 조절되는 것을 특징으로 하는 장치.
  14. 제 10 항에 있어서,
    상기 블록은 매크로블록인 것을 특징으로 하는 장치.
  15. 제 10 항에 있어서,
    상기 타겟 블록 비트율은 타겟 프레임 비트율로부터 획득되는 것을 특징으로 하는 장치.
  16. 제 15 항에 있어서,
    상기 타겟 프레임 비트율(Tframe)은, 수학식
    Figure 112005060141067-pct00022
    에 따라 산출되며, R은 상기 이미지 시퀀스에 대한 잔존 비트 수이며, Nf는 상기 이미지 시퀀스의 잔존 프레임의 개수이며, Tprevious frame은 이전 프레임을 인코딩하는데 사용된 비트 수이며, past_percent는 상수인 것을 특징으로 하는 장치.
  17. 복수의 명령들을 저장하는 컴퓨터-판독 가능 매체로서, 상기 복수의 명령들은 프로세서에 의해 실행되면 상기 프로세서가 단계들을 수행하도록 하며, 상기 단계들은,
    (a) 프레임에 대한 타겟 프레임 비트율을 결정하는 단계; 및
    (b) 적어도 하나의 블록에 대한 타겟 블록 비트율에 따라 상기 적어도 하나의 블록 사이에서 상기 타겟 프레임 비트율을 할당하는 단계를 포함하며,
    상기 적어도 하나의 블록에 대한 상기 타겟 블록 비트율은 상기 블록의 절대차 평균(Mad)에 따라 선택되는 것을 특징으로 하는 컴퓨터-판독 가능 매체.
  18. 제 17 항에 있어서,
    상기 타겟 블록 비트율은, 수학식
    Figure 112005060141067-pct00023
    에 따라 결정되며, Mad는 블록의 상기 절대차 평균(MAD)이며, n은 상기 프레임에 있는 블록들의 개수이며, w는 가중 인자(weighting factor)이며, Ri는 상기 타겟 블록 비트율이며, Sad는 블록의 절대차의 합(SAD)이며, Tframe은 상기 타겟 프레임 비트율이며, Hq는 상수인 것을 특징으로 하는 컴퓨터-판독 가능 매체.
  19. 제 17 항에 있어서,
    상기 타겟 블록 비트율은 임계값(Hq)에 따라 조절되는 것을 특징으로 하는 컴퓨터-판독 가능 매체.
  20. 제 17 항에 있어서,
    상기 타겟 프레임 비트율(Tframe)은, 수학식
    Figure 112005060141067-pct00024
    에 따라 산출되며, R은 상기 이미지 시퀀스에 대한 잔존 비트 수이며, Nf는 상기 이미지 시퀀스의 잔존 프레임의 개수이며, Tprevious frame은 이전 프레임을 인코딩하는데 사용된 비트 수이며, past_percent는 상수인 것을 특징으로 하는 컴퓨터-판독 가능 매체.
KR1020007000443A 1997-07-14 1998-07-09 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법 KR100559924B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US5243797P 1997-07-14 1997-07-14
US60/052,437 1997-07-14
US09/099,617 1998-06-18
US09/099,617 US6690833B1 (en) 1997-07-14 1998-06-18 Apparatus and method for macroblock based rate control in a coding system
US9/099,617 1998-06-18
PCT/US1998/014132 WO1999004359A1 (en) 1997-07-14 1998-07-09 Apparatus and method for macroblock based rate control in a coding system

Publications (2)

Publication Number Publication Date
KR20010021879A KR20010021879A (ko) 2001-03-15
KR100559924B1 true KR100559924B1 (ko) 2006-03-13

Family

ID=26730598

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007000443A KR100559924B1 (ko) 1997-07-14 1998-07-09 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법

Country Status (8)

Country Link
US (1) US6690833B1 (ko)
EP (1) EP1012778B1 (ko)
KR (1) KR100559924B1 (ko)
CN (1) CN1223959C (ko)
AU (1) AU8478298A (ko)
BR (1) BR9810588A (ko)
CA (1) CA2294225A1 (ko)
WO (1) WO1999004359A1 (ko)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539124B2 (en) 1999-02-03 2003-03-25 Sarnoff Corporation Quantizer selection based on region complexities derived using a rate distortion model
US7277483B1 (en) * 2000-04-18 2007-10-02 Ati International Srl Method and apparatus for rate control for constant-bit-rate finite-buffer-size video encoder
US6904094B1 (en) * 2000-09-20 2005-06-07 General Instrument Corporation Processing mode selection for channels in a video multi-processor system
KR100355831B1 (ko) * 2000-12-06 2002-10-19 엘지전자 주식회사 2차원 최소 비트 예측 기반의 움직임 벡터 부호화 방법
JP4534106B2 (ja) * 2000-12-26 2010-09-01 日本電気株式会社 動画像符号化システム及び方法
FR2821998A1 (fr) * 2001-03-06 2002-09-13 Koninkl Philips Electronics Nv Procede de codage d'images numeriques base sur la dissimulation d'erreurs
GB0119708D0 (en) 2001-08-13 2001-10-03 Unilever Plc Process for the production of detergent granules
JP4769392B2 (ja) * 2001-09-25 2011-09-07 キヤノン株式会社 信号処理装置
US20030123539A1 (en) * 2001-12-28 2003-07-03 Hyung-Suk Kim Method and apparatus for video bit-rate control
EP1461955A2 (en) * 2001-12-28 2004-09-29 Koninklijke Philips Electronics N.V. Video encoding method
KR100466596B1 (ko) * 2002-01-07 2005-01-24 주식회사 팬택앤큐리텔 인트라 리프레쉬를 이용한 블럭기반 비디오 부호화기의적응적 율제어 방법
US7388912B1 (en) * 2002-05-30 2008-06-17 Intervideo, Inc. Systems and methods for adjusting targeted bit allocation based on an occupancy level of a VBV buffer model
US20040066849A1 (en) * 2002-10-04 2004-04-08 Koninklijke Philips Electronics N.V. Method and system for significance-based embedded motion-compensation wavelet video coding and transmission
US7953156B2 (en) * 2003-08-29 2011-05-31 Koninklijke Philips Electronics N.V. System and method for encoding and decoding enhancement layer data using descriptive model parameters
KR100987765B1 (ko) * 2003-09-30 2010-10-13 삼성전자주식회사 동영상 부호화기에서의 예측 수행 방법 및 장치
FR2862168B1 (fr) * 2003-11-06 2006-05-19 Canon Kk Procede et dispositif de regulation de debit d'une sequence d'images.
US7483583B2 (en) * 2003-12-16 2009-01-27 Infocus Corporation System and method for processing image data
CN100385453C (zh) * 2003-12-16 2008-04-30 富可视公司 处理图像数据的方法
EP1551185A1 (en) * 2004-01-05 2005-07-06 Thomson Licensing S.A. Encoding method, decoding method, and encoding apparatus for a digital picture sequence
US20050207501A1 (en) * 2004-03-18 2005-09-22 Sony Corporation Method of and system for video bit allocation for scene cuts and scene changes
BRPI0518821B8 (pt) * 2004-12-02 2019-08-27 Interdigital Madison Patent Holdings determinação de parâmetro de quantizador para controle de taxa em codificador de vídeo
US20060120612A1 (en) * 2004-12-08 2006-06-08 Sharath Manjunath Motion estimation techniques for video encoding
US20060146929A1 (en) * 2005-01-06 2006-07-06 Lg Electronics Inc. Method and system for acceleration of lossy video encoding owing to adaptive discarding poor-informative macroblocks
CN101151906A (zh) * 2005-01-28 2008-03-26 汤姆森特许公司 实时帧编码的方法和装置
US7956905B2 (en) * 2005-02-28 2011-06-07 Fujifilm Corporation Titling apparatus, a titling method, and a machine readable medium storing thereon a computer program for titling
US7403562B2 (en) * 2005-03-09 2008-07-22 Eg Technology, Inc. Model based rate control for predictive video encoder
CN100442848C (zh) * 2005-04-11 2008-12-10 华为技术有限公司 一种h263编码中码率的控制方法
US7848409B2 (en) * 2005-05-02 2010-12-07 Qualcomm Incorporated Macroblock level bit allocation
KR100952239B1 (ko) * 2005-07-14 2010-04-09 인텔 코오퍼레이션 레이트 제어 방법 및 장치
US8761259B2 (en) * 2005-09-22 2014-06-24 Qualcomm Incorporated Multi-dimensional neighboring block prediction for video encoding
JP4795223B2 (ja) * 2006-01-31 2011-10-19 キヤノン株式会社 画像処理装置
KR101172430B1 (ko) * 2007-08-17 2012-08-08 삼성전자주식회사 비트율 제어 방법 및 그 장치
US20090161766A1 (en) * 2007-12-21 2009-06-25 Novafora, Inc. System and Method for Processing Video Content Having Redundant Pixel Values
TWI428022B (zh) * 2008-10-24 2014-02-21 Nat Univ Chung Cheng Video control method for instant video encoding chips
JP5950157B2 (ja) * 2012-05-18 2016-07-13 ソニー株式会社 画像処理装置および方法、並びに、プログラム
KR102249819B1 (ko) * 2014-05-02 2021-05-10 삼성전자주식회사 시스템 온 칩과 이를 포함하는 데이터 처리 시스템
US10200716B2 (en) 2015-06-25 2019-02-05 Sony Interactive Entertainment Inc. Parallel intra-prediction encoding/decoding process utilizing PIPCM and/or PIDC for selected sections
US10142049B2 (en) * 2015-10-10 2018-11-27 Dolby Laboratories Licensing Corporation Near optimal forward error correction system and method
CN112738515B (zh) * 2020-12-28 2023-03-24 北京百度网讯科技有限公司 用于自适应量化的量化参数调整方法和装置
CN113282553B (zh) * 2021-05-24 2021-11-02 北京航空航天大学 一种电磁环境远场数据的快速无损压缩存储方法
CN113596451B (zh) * 2021-06-28 2024-01-26 无锡唐古半导体有限公司 视频编码方法、视频解码方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367629A (en) * 1992-12-18 1994-11-22 Sharevision Technology, Inc. Digital video compression system utilizing vector adaptive transform
US5493513A (en) * 1993-11-24 1996-02-20 Intel Corporation Process, apparatus and system for encoding video signals using motion estimation

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5134476A (en) 1990-03-30 1992-07-28 At&T Bell Laboratories Video signal encoding with bit rate control
US5231484A (en) 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5253059A (en) 1992-05-15 1993-10-12 Bell Communications Research, Inc. Method and circuit for adjusting the size of a video frame
US5440345A (en) 1992-07-17 1995-08-08 Kabushiki Kaisha Toshiba High efficient encoding/decoding system
WO1994018799A1 (en) 1993-02-03 1994-08-18 Qualcomm Incorporated Interframe video encoding and decoding system
US5440346A (en) * 1993-06-16 1995-08-08 Intel Corporation Mode selection for method and system for encoding images
US5509089A (en) * 1993-09-09 1996-04-16 Intel Corporation Method and system for encoding images using temporal filtering
US5528238A (en) * 1993-11-24 1996-06-18 Intel Corporation Process, apparatus and system for decoding variable-length encoded signals
US5532940A (en) * 1993-11-24 1996-07-02 Intel Corporation Process, apparatus and system for selecting quantization levels for encoding video signals
US5493514A (en) * 1993-11-24 1996-02-20 Intel Corporation Process, apparatus, and system for encoding and decoding video signals
US5594504A (en) 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367629A (en) * 1992-12-18 1994-11-22 Sharevision Technology, Inc. Digital video compression system utilizing vector adaptive transform
US5493513A (en) * 1993-11-24 1996-02-20 Intel Corporation Process, apparatus and system for encoding video signals using motion estimation

Also Published As

Publication number Publication date
BR9810588A (pt) 2000-09-05
WO1999004359A1 (en) 1999-01-28
US6690833B1 (en) 2004-02-10
CA2294225A1 (en) 1999-01-28
KR20010021879A (ko) 2001-03-15
EP1012778A1 (en) 2000-06-28
CN1223959C (zh) 2005-10-19
EP1012778A4 (en) 2006-04-26
EP1012778B1 (en) 2011-06-01
CN1274446A (zh) 2000-11-22
AU8478298A (en) 1999-02-10

Similar Documents

Publication Publication Date Title
KR100559924B1 (ko) 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법
US6023296A (en) Apparatus and method for object based rate control in a coding system
US6243497B1 (en) Apparatus and method for optimizing the rate control in a coding system
US6084908A (en) Apparatus and method for quadtree based variable block size motion estimation
US6160846A (en) Apparatus and method for optimizing the rate control in a coding system
US6895050B2 (en) Apparatus and method for allocating bits temporaly between frames in a coding system
US6192081B1 (en) Apparatus and method for selecting a coding mode in a block-based coding system
US6351491B1 (en) Apparatus and method for optimizing the rate control for multiscale entropy encoding
US7653129B2 (en) Method and apparatus for providing intra coding frame bit budget
US20050036549A1 (en) Method and apparatus for selection of scanning mode in dual pass encoding
US20060146928A1 (en) Method and apparatus for providing a rate control
KR20030014677A (ko) 비디오 코딩 방법 및 대응하는 인코딩 장치
JP4532607B2 (ja) ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130225

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140224

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150225

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160223

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20170228

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20180227

Year of fee payment: 13

EXPY Expiration of term