KR19980032089A - 화상 압축 부호화 장치 및 방법 - Google Patents

화상 압축 부호화 장치 및 방법 Download PDF

Info

Publication number
KR19980032089A
KR19980032089A KR1019970015492A KR19970015492A KR19980032089A KR 19980032089 A KR19980032089 A KR 19980032089A KR 1019970015492 A KR1019970015492 A KR 1019970015492A KR 19970015492 A KR19970015492 A KR 19970015492A KR 19980032089 A KR19980032089 A KR 19980032089A
Authority
KR
South Korea
Prior art keywords
image
target
coding
quantization parameter
picture
Prior art date
Application number
KR1019970015492A
Other languages
English (en)
Other versions
KR100471956B1 (ko
Inventor
노보루카타
카츠히코나카무라
Original Assignee
모리시타요우이치
마쓰시타덴키산교가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP10507896A external-priority patent/JP3173369B2/ja
Priority claimed from JP28050196A external-priority patent/JP3218994B2/ja
Application filed by 모리시타요우이치, 마쓰시타덴키산교가부시끼가이샤 filed Critical 모리시타요우이치
Publication of KR19980032089A publication Critical patent/KR19980032089A/ko
Application granted granted Critical
Publication of KR100471956B1 publication Critical patent/KR100471956B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명에 따르면, 어떤 하나의 화상 세그먼트의 그룹이 발생하는 목표 발생 비트량과 실제로 발생한 발생 비트량과의 오차가 복수의 다른 화상 세그먼트의 그룹의 각각이 발생하는 목표 발생 비트량에 반영되고, 어떤 화상 세그먼트의 서브세트(subset)를 부호화 했을 때의 발생 비트수가 소정의 범위 내에 존재하지 않을 경우, 후속하는 화상 세그먼트의 서브세트를 부호화할 양자화 파라미터는 그 이전의 양자화 파라미터와는 다른 값으로 제어된다.

Description

화상 압축 부호화 장치 및 방법
본 발명은, 영상 신호와 같은 화상의 디지털 압축 부호화 방법 및 장치에 관한 것으로, 특히 부호화할 때의 양자화 폭의 제어 및/또는 발생 비트수를 제어할 수 있는 장치 및 방법에 관한 것이다.
종래, 화상 신호를 압축하여 디지털 부호로 변환하는 변환 형식으로서, ISO/IEC 13818-2 (소위 MPEG-2)에 국제표준안이 제안되어 있다. 또한, 화상 신호를 이 형식에 의거하여 디지털 부호화 하는 대표적인 방법이, ISO-IEC/JTC/SC29/WG11 NO328의 테스트 모델(Test Model) 3에 기재되어 있다. 도 1에, 전형적인 MPEG-2 영상 부호화 장치의 블럭도가 도시되어 있다. 이 MPEG-2 영상 부호화 장치는, 입력 영상 신호 부호화 순서에 따라 변환하는 프레임 변환 블럭(frame converter)(101), 픽쳐 데이터를 매크로 블럭 단위로 변환하는 변환 블럭부(102), 입력 매크로 블럭과 그 화상 데이터에 대한 예측값 간의 차분을 구하는 감산기(103), DCT 변환 블록(DCT; discrete cosine transform)(104), 양자화기(105), 가변 길이 부호화 블럭(106), 역양자화 블럭(107), 역DCT 블럭(108), 움직임 보상 예측 처리 블럭(109), 모드 판단 블럭(110), 움직임 검출 블럭(111), 양자화기 제어 블럭(112), 엔코더 송출 버퍼(113) 및 가산기 블럭(114)을 포함한다.
이상과 같이 구성된 MPEG-2 영상 부호화 장치의 동작을 설명하기 전에, 부호화를 위한 화상 데이터 구조를 도 2를 참조하여 설명한다.
부호화 되는 화상의 각 픽쳐는 매크로 블럭으로 분할되어 부호화 된다. 픽쳐는 프레임(frame) 또는 필드(field) 단위의 화상이지만, 이하 설명에 있어서는 별다른 사항이 없는 한 프레임을 「픽쳐」라고 부른다. 이 매크로 블럭은 16×16 화소 영역의 데이터이며, 또한 휘도 및 색차 신호는 각각 8×8의 블럭으로 분할되어 부호화 된다.
복수의 매크로 블럭에서 하나의 슬라이스라고 불리우는 데이터 단위가 구성되고, 하나의 픽쳐는 복수의 「슬라이스」로 구성된다. 픽쳐는 픽쳐 내에서 부호화 되는 I 개의 픽쳐, 시간적으로 과거의 픽쳐로부터 예측 부호화 되는 P 픽쳐 및 시간적으로 I 픽쳐와 P 픽쳐로부터 예측 부호화 되는 B 픽쳐로 구성된다. 도 2에는 픽쳐의 전형적인 배치가 예로서 도시되어 있고, 최초의 I 픽쳐를 이용하여 3 항 앞의 P 픽쳐를 예측 부호화 하고, 그 사이에 포함되는 B 픽쳐를 양측으로 예측한다. 따라서, 부호화시 최초로 I 픽쳐를 부호화한 다음, P 픽쳐, B 픽쳐를 차례로 부호화할 필요가 있는데, 이 때문에 본래의 시간 방향의 화상 순서를 변환할 필요가 있다.
또한, I 픽쳐로부터 시작되는 복수의 픽쳐에 의해 GOP(group of picture)가 구성되고, 또한 임의의 수를 가지는 GOP로 하나의 영상 시크스가 구성된다. 상술하면, 매크로 블럭이 화상 세그먼트로서 정의되고, 복수의 매크로 블럭으로 구성되는 슬라이스, 픽쳐, GOP를 화상 세그먼트의 그룹으로 정의할 수 있다. 또한, 예를 들면 GOP를 화상 세그먼트의 그룹으로 했을 경우, 이보다 작은 화상 세그먼트의 그룹의 픽쳐는, GOP, 즉, 화상 세그먼트의 그룹의 서브세트(subset)로서 정의할 수 있다.
이상과 같은 데이터 구조를 바탕으로, 도 1의 MPEG-2 영상 부호화 장치의 동작을 설명한다.
입력 신호는, 화상 정렬 변환 블럭(101)에 입력되어 입력 화상의 각 픽쳐의 순서가 바뀌어진다. 화상 정렬 변환 블럭(101)의 출력은 주사선 변환 처리 블럭(102)에 공급되고, 주사선 변환 처리 블럭(102)은 입력된 화상을 16×16 화소의 매크로 블럭으로 분할하여 감산기(103)에 공급한다. 감산기(103)에서는 움직임 보상 예측 처리 블럭(109)으로부터 얻어진 예측값을, 주사선 변환 처리 블럭(102)으로부터 공급된 신호부터 감산함으로써 예측 오차가 구해진다. 예측 오차는 DCT 변환블럭(104)에서 8×8 블럭 단위로 DCT 변환하고, 각 변환계수는 양자화기(105)에서 양자화 처리됨으로써 양자화 데이터가 생성된다. 양자화 데이터는 가변 길이 부호화 블럭(106)에서 가변 길이 부호화 되어 압축된 부호화 데이터가 생성된다. 이 압축된 부호화 데이터는, 원하는 전송율로 전송되기 때문에, 일단 엔코더 송출 버퍼(113)에 저장된 후 출력된다.
한편, 양자화기(105)에서 양자화된 양자화 데이터는, 예측 화상을 생성하기 위해, 역양자화 블럭(107), 역DCT 변환 블럭(108)에 의해 재생 처리 된다. 재생된 화상 데이터는 움직임 보상 예측 처리 블럭(109)에서 예측값이 산출되어 감산기(103)에 공급된다. 움직임 검출 블럭(111)은, 매크로 블럭 단위로 움직임 벡터를 산출하고, 움직임 벡터는 움직임 보상 예측 처리 블럭(109)에 입력됨과 동시에 가변 길이 부호화 블럭(106)에 공급된다. 양자화기 제어 블럭(112)은, 가변 길이 부호화 블럭(106)으로부터 생성된 비트 스트림의 발생 비트수와 목표 전송율로부터 환산한 목표의 발생 비트수를 비교하여, 최종적으로 목표 비트수로 부호화가 완료되도록 양자화기(105)의 양자화 폭을 제어한다.
다음에, 양자화기 제어 블럭(112)의 처리 동작에 대해서 설명한다. 먼저, 목표 전송율로부터 환산한 GOP당 목표 비트수를 G라 하고, 부호화 과정에서 GOP 중에 남은 비트수를 R, 직전에 부호화된 I, P, B 각각의 픽쳐 화상의 발생 비트수를 SI, SP, SB, 그 때의 양자화 파라미터의 평균치를 각각 QI, QP, QB라 한다. 이때, 각 픽쳐의 부호화 복잡도 XI, XP, XB는 각각, XI=SI×QI, XP=SP×QP, XB=SB×QB로 정의되며, 각 픽쳐를 부호화할 경우의 목표 비트수를 I, P, B 각 픽쳐에 있어서 각각 하기식에 따라 계산한다.
[수학식 1]
[수학식 2]
[수학식 3]
여기에서 Kp, Kb는 상수, NP 및 NB는 아직 부호화되지 않은 남은 P 픽쳐 및 B 픽쳐의 수이다. R 값은 픽쳐에서 발생 비트수를 S로 하면, R=R-S로 갱신되고, GOP는 최초 R=R+G로 갱신된다. 즉, GOP당 발생 비트수를 구하여 이를 각 픽쳐의 구성비에 따라 비트를 할당하여 부호화하고, 각 픽쳐마다 발생 비트수를 계산함과 동시에, 그 값을 R로부터 빼서 다시 각 픽쳐에 목표 발생 비트수를 수정하여 할당하는 작업이 행해진다. 또한, 하나의 GOP를 부호화 했을 때에 필요한 비트수가 GOP에 할당된 목표 비트수와 다를 경우, 그 차이가 다음 GOP의 목표 발생 비트수에 할당된다.
다음으로, 각 픽쳐의 목표 발생 비트로부터 양자화 파라미터를 제어하는 방법을 이후에 설명한다. 먼저, I, P, B 각 픽쳐에 대하여 가상 버퍼가 상정되고, i 번째의 매크로 블럭을 부호화할 때의 각 매크로 블럭에서의 목표 발생 비트수를 일정하게 하여, 각 가상 버퍼의 데이터 잔량을 각각 dIi, dPi, dBi로 하면,
[수학식 4]
dIi=dI0+Bi-1-TI×(i-1)/MB- cnt
[수학식 5]
dPi=dP0+Bi-1-TP×(i-1)/MB-cnt
[수학식 6]
dBi=dB0+Bi-1-TB×(i-1)/MB-cnt
로 나타난다. 여기에서 Bi는 i를 포함한 지금까지의 모든 매크로 블럭의 발생 비트수, MB-cnt는 1 픽쳐당 포함되는 매크로 블럭수, dI0, dP0, dB0는 각각 픽쳐의 선두에서의 버퍼 잔량의 초기값이다. 상기 식에 있어서, 우변 제 2 항은 직전의 매크로 블럭까지를 부호화 하는데 필요한 비트수를, 제 3 항은 직전의 블럭까지 부호화함에 필요한 목표 비트수를 각각 나타내고, 우변 제 2 항과 제 3 항의 차를 이용하여, 실제 부호화에 필요한 비트수와 목표 비트수와의 오차가 구해진다. 이 오차를 버퍼 잔량의 초기값에 더함으로써, i 번째의 매크로 블럭을 부호화할 경우의 버퍼 잔량이 구해진다.
이상의 식에서 계산된 버퍼 잔량을 이용하여, i번째의 매크로 블럭에서의 양자화 파라미터 Qi는
[수학식 7]
로 구해진다. 또, r=2×(목표 전송율)/(픽쳐 레이트) 이다.
이상의 동작을 정리하면, 목표의 전송율에 대하여, 픽쳐 단위로 목표 발생 비트가 설정되고, 그 픽쳐가 포함된 GOP 단위로 발생 비트수가 목표 비트수로 제한된다. 또한, 각 매크로 블럭에 있어서, 발생 비트량이 일정하다고 가정했을 경우의 목표 비트수와, 실제 발생 비트수와의 오차에 기초하여 양자화 파라미터가 제어된다. 그 결과, 각 픽쳐의 목표 발생 비트수에 가까운 부호 발생량이 되도록 화상이 부호화된다.
그러나 상기와 같은 부호화 방법에서는, 픽쳐 단위로 목표의 발생 비트수를 설정하고, 이의 픽쳐가 포함되는 GOP 단위로 발생 비트수가 목표의 발생수에 가산되도록 양자화 파라미터가 제어되기 때문에, 화상이 급격히 변화하여 부호화시에 필요한 비트수가 많아지게 되어, 목표 비트수를 억제하기 위해 양자화 폭을 크게 제어하게 된다. 그 때문에, 화질 저하를 초래할 가능성이 있었다.
또한, 어느 GOP에서의 목표 발생 비트수보다도 실제의 발생 비트수가 상당히 증가했을 경우에는, 다음 GOP에 있어서 목표 발생 비트수가 그 오차를 흡수하도록 구성되어 있기 때문에, 해당 GOP에서의 화질이 저하될 가능성이 있었다.
또한, 하나의 픽쳐 내에 있어서 전반부분에 비교적 평탄한 화상이 집중하고, 후반부분에 복잡한 화상이 집중한 경우, 후반부분에 많은 비트를 할당하는 것이 이상적이다. 그러나, 상기한 방법에서는, 각 매크로 블럭에 균일한 목표 비트수를 할당하여, 각 매크로 블럭에 있어서 실제로 필요로 하는 비트수와의 오차에 따라 양자화 파라미터가 설정되기 때문에, 전반부분에 많은 비트가 할당되어, 후반부분에서 상당한 비트수가 발생될 가능성이 있었다. 또한, 그와 반대로 전반부에 복잡한 부분이 집중할 경우에는, 전반부에서의 발생 비트수가 억제되어 비트의 할당이 이상적으로 이루어지지 않는다는 문제가 있었다. 이와 같은 문제점을 극복하기 위하여는, 일단 전체 화상을 부호화하여, 화상 전체에 걸쳐서 최적의 비트 배분을 구한 후, 재차 부호화하는 방법도 고려되지만, 이것으로는 실시간에서 부호화 하기에는 곤란한 점이 있다.
본 발명의 하나의 목적은, 화상의 부호화에 있어서, 부호화의 복잡도에 대응한 적절한 비트 배분을 할 수 있는 화상 압축 부호화 장치 및 방법을 제공하는 것을 목적으로 한다.
본 발명의 다른 목적은, 전화상을 일단 부호화하지 않고, 적절한 비트 배분을 한 다음 적정한 양자화 폭을 설정하는 화상 압축 부호화 장치 및 방법을 제공하는 것을 목적으로 한다.
본 발명의 또다른 목적은, GOP 등 복수의 픽쳐로부터 되는 하나의 화상 세그먼트의 그룹에 있어서 발생할 목표 발생 비트수와, 실제로 발생한 발생 비트수와의 오차를, 복수의 화상 세그먼트의 그룹에 걸쳐 서서히 흡수하도록 목표 발생 비트를 정하는 화상 압축 부호와 장치 및 방법을 제공함을 목적으로 한다.
본 발명의 또다른 목적은, 인접하는 화상 세그먼트의 그룹에서의 목표 발생 비트량이 급격히 변화하지 않도록 목표 발생 비트량을 제어할 화상 압축 부호화 장치 및 방법을 제공하는 것을 목적으로 한다.
본 발명의 또다른 목적은, 하나의 화상 세그먼트의 그룹에 있어서 발생할 목표 발생비트수에 기초하여 적당한 양자화 폭을 제어할 수 있는 화상 압축 부호화 장치 및 방법을 제공하는 것을 목적으로 한다.
도 1은 일반적인 MPEG-2 부호화기의 일실시예를 도시한 블럭도.
도 2는 MPEG-2의 픽쳐 구성을 모식적으로 나타낸 모식도.
도 3은 본 발명의 제 1 실시예의 구성을 도시한 블럭도.
도 4는 도 3에서의 부호화 복잡도 산출 처리부(4)의 일실시예의 구성을 도시한 블럭도.
도 5는, 도 3에서의 양자화기 제어블럭(6)의 일실시예의 구성을 도시한 블럭도.
도 6은, 도 5에서의 제어블럭(16)에 의한 양자화 파라미터의 산출 방법을 도시한 흐름도.
도 7은 양자화 파라미터의 산출 방법을 모식적으로 나타낸 그래프.
도 8은 픽쳐마다의 양자화 파라미터의 산출 방법을 설명하는 흐름도.
도 9는 부호화 복잡도가 증가 했을 경우의 GOP당의 발생 비트수의 증감을 설명하기 위한 타이밍도.
도 10는 부호화 복잡도가 큰 정보가 길게 계속된 경우의 GOP 주변의 발생 비트수 및 화질의 변화를 모식적으로 설명하기 위한 타이밍도.
도 11는 종래의 방법과 본 발명의 제 1 실시예에 의한 방법과의 매크로 블럭당 목표 발생 비트수 및 발생 비트수의 비교를 나타내는 타이밍도.
도 12는 부호화 복잡도를 계산하는 다른 실시예의 구성을 나타내는 블럭도.
도 13은 본 발명의 제 2의 실시예의 구성을 나타내는 블럭도.
도 14는 도 13에 있어서 양자화 제어 블럭(22)의 일실시예의 구성을 나타내는 블럭도.
도 15는 도 14의 양자화 제어 블럭(22)이 행하는 양자화 파라미터 산출 방법을 설명하는 흐름도.
도 16 및 도 17은, 양자화 제어 블럭(22)이 행하는 양자화 파라미터 산출 방법을 설명하는 흐름도.
도 18은 화상의 부호화의 복잡도의 변화와 발생 비트수와 화질과의 상관 관계를 설명하기 위한 타이밍 차트.
도 19는 반응계수 T 를 제어하기 위한 일실시예의 구성을 나타내는 블럭도.
도 20은 반응계수 T의 일실시예를 나타내는 타이밍 차트.
도면의 주요부분에 대한 부호의 설명
1 : 프레임 변환 블럭2 : 1 프레임 지연 블럭
3 : 부호화 프로세서4 : 부호화 복잡도 산출 블럭
5 : 움직임 검출 블럭6 : 양자화기 제어 블럭
7 : 엔코더 송출 버퍼
101 : 프레임 변환 블럭102 : 변환 블럭부
103 : 감산기104 : DCT 변환 블럭
105 : 양자화기106 : 가변 길이 부호화 블럭
107 : 역양자화 블럭108 : 역DCT 블럭
109 : 움직임 보상 예측 처리 블럭110 : 모드 판단 블럭
111 : 움직임 검출 블럭112 : 양자화기 제어 블럭
113 : 엔코더 송출 버퍼114 : 가산기 블럭
본 발명에 따르면, 어느 하나의 화상 세그먼트의 그룹이 발생할 목표 발생 비트량과, 실제로 발생한 발생 비트량과의 오차가 복수의 다른 화상 세그먼트 그룹 각각이 발생할 목표 발생 비트량에 전가된다.
또한, 본 발명에 따르면, 어트 화상 세그먼트의 서브세트를 부호화했을 때의 발생비트수가 소정 범위를 초과할 경우에, 후속하는 화상 세그먼트의 서브세트를 부호화할 양자화 파라미터는 그 이전의 양자화 파라미터와는 상이한 것으로 제어된다.
도 3은 본 발명의 화상 압축 부호화 장치의 일실시예의 구성을 도시한 블럭도이다. 본 실시예에 따른 화상 압축 부호화 장치는, 프레임 변환 블럭(1), 1 프레임 지연 블럭(2), 부호화 프로세서(3), 입력 화상을 해석하고 부호화의 복잡도를 산출하는 부호화 복잡도 산출 블럭(4), 움직임 검출 블럭(5), 양자화기 제어 블럭(6), 엔코더 송출 버퍼(7)를 포함한다. 부호화 프로세서(3)는, 도 1에 도시한 전형적인 화상 압축 부호화 장치에 있어서 변환 블럭부(102), 감산기(103), DCT 변환 블럭(104), 양자화기(105), 가변 길이 부호화 블럭(106), 역양자화 블럭(107), 역DCT 블럭(108), 움직임 보상 예측 처리 블럭(109), 모드 판단 블럭(110) 및 가산기 블럭(114)을 포함한다.
입력 화상은, 프레임 변환 블럭(1)에 있어서, 입력 화상을 부호화하는 순서로 정렬 변환하다. 움직임 검출 블럭(5)은 P 픽쳐, B 픽쳐에 대하여, 각각 참조 픽쳐와의 비교에 의하여, 각 매크로 블럭에 대한 움직임 벡터를 산출한다. 이 움직임 벡터는 부호화 프로세서(3)에 전송되어 움직임 보상된 예측 화상의 생성을 위하여 사용된다. 또한, 이 움직임 벡터는 부호화 복잡도 산출 블럭(4)에도 공급된다.
도 4는 부호화 복잡도 산출 블럭(4)의 일실시예의 구성을 도시한 블럭도이다. 부호화 복잡도 산출 블럭(4)은, 예측 오차 화상 생성 블럭(8), DCT 처리 블럭(9), 가변 길이 부호화 블럭(11), 발생 비트수 카운터(12)를 포함한다. 프레임 변환 블럭(1)으로부터의 화상 데이터는, 움직임 벡터 신호와 함께 예측 오차 화상 생성 블럭(8)에 공급된다. 예측 오차 화상 생성 블럭(8)에서는, 입력 화상이 I 픽쳐인 경우에는 그대로 화상을 유지하고, P 픽쳐인 경우에는 움직임 검출 블럭(5)으로부터의 움직임 벡터에 의하여, 예측된 화상과 입력 화상과의 차에 의하여 예측 오차 화상을 생성한다. 마찬가지로 B 픽쳐의 경우에는 상기 예측 결과에 의하여 예측 오차 화상을 생성한다.
그 다음, DCT 처리 블럭(9)에서 블럭마다 화상의 DCT 처리를 하고, 양자화 블럭(10)에서 양자화한 후, 가변 길이 부호화 블럭(11)에서 부호화 처리된다. 이때, 양자화 블럭(10)은 일정한 양자화 파라미터로 부호화 한다. 양자화 파라미터(q_scale)의 값은 임의값으로 설정해도 되지만, 여기에서는 편의상 q_scale=10으로서 양자화 처리된다. 발생 비트수 카운터(12)는, 부호화된 데이터의 비트수를 매크로 블럭마다 검출하여, 고정 q-scale의 값과 곱하여 매크로 블럭마다 부호화의 복잡도를 나타내는 복잡도(complexity)를 산출한다. 그리고, 발생 비트수 카운터(12)는 각 매크로 블럭마다의 복잡도를 합산하여 픽쳐당 복잡도를 양자화기에 공급한다.
한편 입력 화상은 1 프레임 지연 블럭(2)에 있어서 1 픽쳐분 지연된 후, 부호화 프로세서(3)로 공급된다. 기본 부호화 블럭(3)은, 도 1에 도시된 화상 압축 부호화 장치와 같이 양자화기(6)로부터 공급되는 양자화 파라미터에 따라 부호화 처리하고, MPEG 표준에 준거한 비트 스트림을 생성한다.
양자화기 제어 블럭(6)은, 부호화 프로세서(3)로부터의 비트 스트림의 발생 비트수와 부호화 복잡도 산출 블럭(4)으로부터의 복잡도 및 목표 전송율을 기본으로 양자화 파라미터 q_scale을 결정하여, 부호화 프로세서(3)에서의 부호화 때의 양자화 폭을 결정한다.
도 5에는 양자화기 제어 블럭(6)의 한 실시예의 구성을 나타낸 블럭도가 도시되어 있다. 양자화기 제어 블럭(6)은, 부호화 프로세서(3)으로 생성된 1 GOP 분의 비트 스트림의 발생 비트수를 카운트하는 발생 비트 카운터(13), 1 픽쳐분의 비트 발생수를 카운트하는 발생비트 카운터(14), 1 매크로 블럭분의 비트 발생수를 카운트하는 발생 비트 카운터(15), 및 제어 블럭(16)을 포함한다. 제어 블럭(16)은, 발생 비트 카운터(13, 14, 15)에서 구해진 발생 비트수와 목표 전송율, 영상 디코더에 비트 스트림을 전송할 경우의 최대 전송 레이트 Dec_R 및 부호화 복잡도 산출 블럭(4)으로부터 구해진 복잡도에 기초하여 매크로 블럭 타이밍마다 양자화 파라미터 q_scale을 생성한다.
도 6은 제어 블럭(16)으로 구성된 q_scale 산출인 알고리즘(algorithm)의 한 예를 도시한 흐름도이다.
먼저 스탭(S1)에서 시퀀스 부호가 검출되는지에 대한 여부를 판단하여, 검출되지 않으면 스탭(S2)에서는 j번째의 GOP를 부호화하는 경우에 있어서, 먼저 직전의 GOP에서의 발생 비트수 GOP_Bj-1를 발생 비트 카운터(13)에 의하여 판독한다. 다만 최초의 GOP에서는 0으로 한다. 그 후, 스탭(S3)에서 j번째의 GOP를 부호화하기 직전의 발생 비트수와, 전GOP가 같은 비트수를 발생한다고 가정하여 산출할 수 있는 목표 비트수 G와의 오차 DIF-Gj를 하기 식을 기초하여 산출한다.
[수학식 8]
DIF Gj=DIF Gj-1+GOP Bj-1 G
다만, DIF G1=0로 한다. 또한 GOP가 15 프레임의 화상으로 구성되면, 하나의 GOP는 0.5초의 움직임 화상을 나타내게 되므로, 이 경우의 G는 목표 전송율, 즉 1 초당 전송되는 전송율의 1/2이 된다.
그 다음, 스탭(S4)에서 j번째의 GOP를 부호화할 경우의 목표 발생 비트수 R(j)를 하기 식에 기초하여 산출한다.
[수학식 9]
×DIF-Gj
다만, T는 2 이상의 정수이다. 이 식은, 어떤 GOP에서 발생한 발생 비트수와, 미리 설정한 목표 비트수 G와의 오차 DIF-Gj를, 다음 GOP에 대하여 할당하는 목표 비트수에 의해 즉시 흡수하는 것이 아니고, 오차 DIF-Gj의 일부, 즉 1/T만이 흡수되도록 제어하는 것을 의미한다. 후속하는 GOP에 있어서도 차차 부호화되기 때문에, 각각의 GOP의 목표비트 조정 과정에 있어서 오차 성분은 후속하는 GOP의 목표 비트수에 서서히 흡수되게 되어, 급격한 목표 비트수의 증가 또는 감소를 제어할 수 있다. 그런데, T의 값에 관하여는, 2 이상인 수치에서 효과를 기대할 수 있지만, 수 초 간에 걸쳐 목표 비트수가 조정될 경우에는, 하나의 GOP가 15 프레임 정도의 화상으로 구성되는 경우에는 10-30 정도의 값이 적당하다. 물론 수 분 간에 걸쳐 목표 비트수를 조정할 경우라면, 더욱 큰 값을 취하여도 지장없다.
그런데, 하나의 GOP당 목표 발생 비트수가 구해지면, 스탭(S5)에서, 각 픽쳐당 목표 발생 비트수의 잠정치 TTI, TTP, TTB를 하기 식에 기초하여 구한다.
[수학식 10]
[수학식 11]
[수학식 12]
여기에서 XI, XP, XB는 I, P, B 각 픽쳐에서의 복잡도의 예측값이나, 여기에서는 이들 비율이 중요하다. 이 값은 부호화 복잡도 산출 블럭(4)으로부터 얻어진 직전 GOP의 최후의 I, P, B 픽쳐에 있어서 복잡도를 사용해도 되고, 예를 들어 XI : XP : XB = 160 : 60 : 42와 같은 고정값을 사용해도 된다. 또한 NP, NB는 GOP 내에 있는 P 픽쳐 및 B 픽쳐의 수이다. Kp, Kb는 양자화 매트릭스로부터 결정되는 보정용의 정수이며, 여기에서는 Kp=1, 0, Kb=1로 한다.
다음으로 I, P, B 각 픽쳐에 대하여, 스탭(S6)에서 기준이 되는 부호화 복잡도의 기준 복잡도가 되는 CI, CP, CB를 설정한다. 다만, 스탭(S6)은 스탭(S8) 및 스탭(S9)의 판단 루틴의 결과, 이미 기준 복잡도가 판독되어 있고 목표 전송율의 변경이 없었을 경우에는, 스킵(skip)어 직전 값이 그대로 설정값이 된다. 기준 복잡도는 양자화 파라미터 q_scale을 10으로 설정하고, 이 양자화 파라미터로 부호화했을 때에 발생하는 비트수가 목표 발생 비트수의 잠정치 TTI, TTP, TTB 와 동등하게 되는 값을 설정한다.
그 다음, 스탭(S9)에 있어서, 기준 복잡도 CI, CP, CB를, 그 시점에서의 픽쳐의 TTI, TTP 또는 TTB의 발생 비트수가 되도록 부호화할 경우의 평균 양자화 파라미터 q_pic를 설정한다.
그 후, 스탭(S10)에서 부호화할 픽쳐의 목표 발생 비트수 TI, TP, TB를 설정한다. 이는 부호화 복잡도 산출 블럭(4)으로부터 공급되는 복잡도를 사용하여, 설정된 q_pic로 부호화 했을 때에 필요한 비트수를 TI, TP, TB로서 설정한다.
또한 스탭(S11)에서 픽쳐내 양자와 파라미터가 제어되지만 이 스탭의 상세한 내용은 나중에 기술한다.
마지막으로, 스탭(S12)에 있어서 GOP 종료 코드가 검출되었는지에 여부가 판단되고, GOP 종료 코드가 검출되지 않았으면, 스탭(S9)로부터의 처리를 반복하고, GOP 종료 코드가 검출되면 스탭(S1)로 돌아간다.
이러한 잠정 목표 발생 비트수 TTI, TTP, TTB의 결정 스탭(S5)으로부터 목표 발생 비트수 TI, TP, TB의 결정 스탭(S10)까지의 공정을 도 7의 그래프를 참조하여 설명한다.
도 7의 그래프의 가로 축은 부호화의 복잡도이며, 세로 축은 발생 비트수를 나타낸다. q_scale=10으로 양자화 했을 경우의 복잡도와 발생 비트수와의 관계가 선(a)로 표시되어 있다. 최초의 픽쳐에 있어서, 픽쳐당 잠정적인 목표 발생 비트수 TT0와 선(a)로 교차하는 점이 기준 복잡도가 된다. 다음 픽쳐에서의 복잡도가 부호화 복잡도 산출 블럭(4)에 의하여 검출되고, 그 값이 CC0인 경우, 이 픽쳐의 목표 발생 비트수는 도시한 바와 같이 T0로 된다. 픽쳐당 목표 발생 비트수는 부호화 복잡도 산출 블럭(4)으로부터 얻어진 복잡도에 따라 정해지고, 하나의 GOP가 완결되기까지 동일한 작업이 반복된다.
하나의 GOP에 대한 처리가 완료되면, 다음 GOP에 대하여 할당될 목표 발생 비트수 R(j)가 식(9)에 의하여 구해진다. 그러면 새로이 할당된 GOP당 목표 발생 비트수에 따라, 식(10)∼(12)로부터 얻어진 각 픽쳐의 잠정 목표 발생 비트수도 변화한다. 이때, 잠정적인 목표 발생 비트수가 TT1인 경우, TT1과 기준 복잡도의 교점을 통과하는 직선(b)이 새로이 그어진다. 그리고 부호화 복잡도 산출 블럭(4)으로부터 얻어진 복잡도가 CCI인 경우에는, 직선(b)과 CCI의 교점에서의 목표 비트수 TI가, 그 시점의 픽쳐의 목표 비트수가 된다.
또한, 도 7에 있어서 직선은 상한값 및 하한값을 가지고 있다. 상한값은, 재생측의 디코더 버퍼 내의 데이터 잔량을 VBV_fullness로 하여, 초기값을 표준 디코더의 버퍼 용량인 1.8 메가비트, 픽쳐 레이트를 Pic_R로 했을 때,
[수학식 13]
로 구해진다. 단, B_pic는 픽쳐 카운터(14)에서 검출되는, 부호화된 픽쳐의 발생 비트수이며, Dec_R은 디코더에 입력되는 최대 레이트를 나타낸다. 또한 식(10)∼(12)에서 구해진 목표 발생 비트수의 잠정값 TTI, TTP, TTB와 VBV_fullness 중 보다 작은 값이 상한값으로 된다.
한편, q_scale의 직선의 하한값은 경험적으로 전송율이 2Mb/s 이하가 되지 않도록 결정된다.
도 6의 흐름도에서의 스탭(S11)의 픽쳐 내 양자화 파라미터 제어에 의한 매크로 블럭마다의 q_scale 제어를 상세하게 이후 설명한다.
도 8은 픽쳐내 양자화 파라미터 제어 처리를 설명하기 위한 흐름도이다. 여기에서, i 번째의 매크로 블럭에서의 양자화 파라미터 q_scale의 값을 MQUANTi, 양자화기 제어용 가상 버퍼를 정의해두고 i 번째인 매크로 블럭이 부호화 되기 전의 데이터 잔량을 di라고 한다. 단, di의 초기값은
[수학식 14]
로 구해진다. 여기에서, r은 반응 파라미터이며,
[수학식 15]
r=2×(픽쳐의 목표 발생 비트수)
로서 정의된다.
먼저, 스탭(S111)에서 픽쳐 전체의 복잡도 C_pic가 판독된다. 스탭(S112)에 있어서는, 최초의 매크로 블럭인지 아닌지 판단되고, 최초의 매크로블럭이라고 판단되었을 경우에는, 스탭(S113)에 있어서 최초의 매크로 블럭의 양자화 파라미터 q_scale의 값인 MQUANTi가 q_pic로, di=d0로 설정된다.
스탭(S112)의 판단 결과, 최초의 매크로 블럭이 아니라고 판단되었을 경우에는, 그 매크로 블럭을 부호화하기 전의 데이터 잔량 di를 아래 방법에 의하여 구한다.
먼저, 스탭(S114)에서 직전의 매크로 블럭에서의 발생 비트수 B_mb(i-1)을 매크로 블럭(15)으로부터 판독한다. 다음에, 스탭(115)에서 부호화 복잡도 산출 블럭(4)으로부터, 직전 매크로 블럭의 복잡도인 C_mb(i-1)을 구한 후, 직전 매크로 블럭에서 발생된다고 예상된 비트수 T_mb(i-1)을 다음 식으로 구한다.
[수학식 16]
여기에서, T_pic은 1 픽쳐인 경우는 TI 이며, P 픽쳐인 경우에는 TP, B 픽쳐인 경우는 TB 이다. 그리고, 스탭(S116)에서 di는 다음 식에 의하여 구해진다.
[수학식 17]
di = d(i-1)+B_MB(I-1)-T_BM(I-1)
그리고, 스탭(S117)에서 MQUNATi를 다음 식으로 구하여, 부호화 프로세서(3)에 공급한다.
[수학식 18]
이상과 같이, 매크로 블럭마다의 양자화 매트릭스의 설정은, 스탭(S118)의 판단 루틴에 따라 마지막 픽쳐까지 반복된다.
즉, 목표 전송율로부터 산출되는 픽쳐마다 기준이 되는 복잡도에 의하여 잠정 목표발생 비트수 TTI, TTP, TTB가 구해지고, 이 기준 복잡도와 부호화 복잡도 처리 블럭(4)으로부터 얻어지는 그 시점의 픽쳐에서의 복잡도와의 상대관계에서 목표 발생 비트수를 잠정치로부터 수정함으로써, 신 체인지(scene change)나 영상 내에서 동작이 급격한 영역이 있는 경우에 있어서, 부호화의 복잡도가 급격히 증가하는 경우에도 적응적으로 비트수가 할당된다.
또한, 픽쳐마다 부호화 복잡도에 따라 제어된 발생 비트수와, 목표 발생 비트로부터의 오차는 복수의 GOP에 대해 조정됨으로써, 어떤 GOP에 대한 직후의 GOP에 대한 비트 배분의 영향을 작게 할 수 있다.
예를 들면, 도 9는 일정한 복잡도의 화상 중에서, 순간적으로 복잡도가 증가했을 경우의 GOP 단위에서의 발생 비트수의 변화가 모식적으로 도시되어 있다. 도 9(a)에 도시한 바와 같이, 소정 기간은 일정한 복잡도의 화상이 계속되고, 어떤 시점에서 복잡도가 급격하게 증가하고, 후 재차 일정한 복잡도의 화상이 계속되는 예가 도시되어 있다. 종래의 발생 비트수의 할당 방법에서는, 급격하게 복잡도가 변화하여 많은 비트수가 할당된 GOP 직후의 GOP는, 극히 적은 비트수가 할당되어져 있었다. 이에 대하여 본 실시예에서는, 직후의 GOP에서의 목표 발생 비트수의 변화가 적다는 것을 알 수 있다. 즉, 어떤 GOP의 발생 비트수가 2배가 되었다고 할지라도, 그 GOP의 목표 발생 비트수와의 오차 중에서 1/T만이 직후의 GOP의 목표 발생 비트에 영향을 주게된다. 또한, T=20으로 하고 하나의 GOP가 0.5초 간의 화상을 구성한다고 했을 경우, 10초 후에는 거의 전체 전송율은 목표한 전송율로 회복한다.
도 10은, 일정한 복잡도의 화상이 계속된 후, 조금 복잡하고 일정한 복잡도의 화상이 계속되고, 재차 원래의 복잡도의 화상이 계속되었을 경우의 GOP마다의 발생 비트수와, 양자화 폭에 기초하여 화질이 저하되는 상태가 모식적으로 도시되어 있다. 즉, 복잡도가 증가했을 때, GOP의 발생 비트수는 화질을 유지하기 위해 증가하지만, 지수 함수적으로 전송율을 유지하기 위한 발생 비트수로 수정된다. 이때, 화질은 급격하게 저하되지 않고, 수 초 기간에서 연속적으로 저하된다. 그리고, 재차 원래의 복잡도로 되돌아 갔을 때, 그 직후의 GOP에서 발생 비트수는 감소하지만, 이것 또한 지수 함수적으로 원래의 최적의 발생 비트수로 되돌아 간다. 그 때의 화질도, 부호화가 곤란했었을 때의 화질로부터 수 초 동안 연속적으로 회복시킬 수 있다.
또한, 부호화 도중에서 목표 전송율이 변경된 경우에도 연속적으로 화질을 제어할 수 있다. 즉, 목표 전송율이 감소했을 경우에는, 복잡도의 기준 설정값도 같은 비율로 감소한다. 따라서, 거의 목표한 전송율 부호화할 수 있을 경우에는, 다음 픽쳐의 잠정 목표 발생 비트수도, 거의 목표발생비트수에 비례하여 감소하기 때문에, 픽쳐의 평균 양자화 파라미터는 그 대로 목표 발생 비트수가 유지되고 있었던 경우와 거의 같게 되고, 그 후의 픽쳐에서 지수 함수적으로 변화해 간다.
또한, 본 실시예에 따르면, 픽쳐 내의 각 매크로 블럭의 복잡도에 따라 매크로 블럭당의 양자화 폭도 제어되므로, 목표 전송율(25)와의 오차가 적고, 또한 최적의 비트 분배로 픽쳐를 부호화할 수 있다.
도 11은 종래의 방법에 있어서의 양자화 파라미터의 제어와, 본 실시예에 있어서의 양자화 파라미터의 제어와의 비교가 모식적으로 도시되어 있다. 도 11(a)에는 종래의 방법에 따른 실시의 발생 비트수와, 목표 발생 비트수가 도시되어 있고, 도 11(b)에는 본 발명의 방법에 따른 실제의 발생 비트수와, 목표 발생 비트수가 도시되어 있다.
어떤 픽쳐에 있어서의 목표 발생 비트수 T가 설정되면, 종래의 방법에 따르면 각 매크로 블럭 내에서의 발생 비트수를 일정하게 가정하여 실제의 발생 비트수와의 차이를 가상 버퍼의 데이터 잔량으로서 양자화 파라미터를 제어했다. 따라서, 화상의 후반에 복잡도의 피크를 가지는 경우의 화상에서는, 화상의 전반부는 실제 비트 발생량이 적게 되기 때문에 양자화 파라미터는 감소하고, 본래 구하려는 화질보다도 높은 화질로 부호화 된다. 그러나, 화소의 후반부에서는 비트 발생량이 증가하여, 최종적으로 목표한 발생 비트수보다도 많은 비트수가 되어, 버퍼 잔량의 증가 때문에 급격하게 양자화 파라미터가 증가함으로써, 화질 저하를 초래하게 된다.
한편, 본 실시예에 따르면, 목표한 발생 비트수를 복잡도에 따라 각 매크로 블럭에서의 발생 비트수를 상기 수학식 16과 같이 설정하고 있기 때문에, 픽쳐 내의 복잡도의 분포에 가까운 비트 분배가 이루어지고, 화질 및 비트 발생수도 목표한 값에 가깝게 된다.
또한, 상기 실시예서는, GOP 단위로 목표 전송율과 발생 비트수와의 차이를 구하고, 목표한 발생 비트수를 수정하지만, 픽쳐 단위 혹은 다른 단위로 하여도 무방하다. 즉, 본 실시예에 있어서의 부호화의 처리 단위의 최소값인 매크로 블럭을 화상 세그먼트로 정의하고, 화상 세그먼트의 집합체인 슬라이스, 픽쳐, GOP 등을 화상 세그먼트의 그룹으로 정의하면, 임의의 화상 세그먼트의 그룹을 단위로 하여 목표한 발생 비트수를 수정하여도 무방하다.
또한, 부호화의 복잡도의 기준값의 설정에 대해서도, q_scale=10을 이용하여 설정하는 것에 한정되지 않고, 다른 양자화 파라미터를 사용해도 무방하고, 목표한 전송율의 변경이 없을 경우에는, 처음부터 고정된 값을 설정할 수도 있다.
또한 각 파라미터를 구하는 데에 복잡도가 사용 되었는데, 별도의 인덱스를 사용해도 된다. 예를 들면, 각 픽쳐의 액티비티(activity)에 대응하는 평균과 오차의 제곱합을 구하여, 이것을 전술한 각 식에서 복잡도로 치환해도 무방하다. 도 12는 이 액티비티를 이용하여 본 실시예를 구성할 경우에 대한 블럭도이다. 예측 오차 화상 생성 블럭(17)은 도 4에 도시한 구성과 마찬가지로 1 픽쳐는 그대로, P, B 픽쳐는 각각의 예측 오차가 화상을 생성한다. 예산 블럭(18)은 예측 오차 화상 생성 블럭(17)으로부터의 예측 오차 화상으로부터 각 매크로 블럭의 제곱 오차를 구한다. 그리고, 그 합계를 픽쳐 전체의 복잡도의 대용값으로서 사용한다.
또한, 본 실시예에 있어서는, 양자화기 제어 블럭(6)은, 부호화 프로세서(3)와 독립된 구성으로서 설명되어 있지만, 부호화 장치 자체를 DSP(Digital Signal Processor)로 구성할 경우에는, 다른 기능을 가지는 블럭을 겸용할 수도 있다.
다음에, 본 발명의 제 2 실시예에 대하여 설명한다. 도 13은 본 발명의 제 2의 실시예의 구성을 도시한 블럭도이고, 입력 신호는 기본 부호화 처리 블럭(20)에 공급된다. 기본 부호화 처리 블럭(20)은, 양자화 제어 블럭(22)에서 표시된 양자화 폭 q_scale 값에 따라, 각 매크로 블럭을 MPEG-2에 준거한 신호로 부호화하고, 엔코더 송출 버퍼(21) 및 양자화 제어 블럭(22)에 부호화된 신호를 공급한다. 또한, 기본 부호화 처리 블럭(20)은 수신한 GOP 종료 타이밍 신호 및 픽쳐 종료 타이밍 신호를 양자화 제어 블럭(22)에 공급한다. 양자화 제어 블럭(22)은 목표 전송율, 반응계수 T 및 기본 부호화 처리 블럭(20)으로부터 공급되는 부호화 데이타와 타이밍 신호로부터 양자화 폭 q_scale을 결정하고, 양자화 폭 q_scale을 기본 부호화 처리 블럭(20)에 공급하여 발생 비트수 및 화질을 제어한다.
도 14는 도 1에 있어서의 양자화 제어 블럭(22)의 일실시예의 구성을 도시한 블럭도이고, 양자화 제어 블럭(22)은 GOP마다의 발생 비트수를 카운트하는 GOP 비트 카운터(221), 픽쳐마다의 발생 비트수를 카운트하는 픽쳐 카운터, 및 q_scale을 산출하는 제어 블럭(223)을 포함한다. GOP 비트 카운터(221) 및 픽쳐 비트 카운터(222)에는 각각 기본 부호화 처리 블럭(20)으로부터 부호화된 데이타가 공급되어 있고, 각각 발생 비트수를 카운트한다. 제어 블럭(223)은 GOP 종료 타이밍 신호 및 픽쳐 종료 타이밍 신호를 수신할 때마다, GOP마다 혹은 픽쳐마다의 발생 비트수를 검출함도 동시에, 목표 전송율(R), 반응계수(T)로부터 q_scale을 산출한다.
도 15는 양자화 제어 블럭(22)에 의한 q_scale의 산출 방법의 일실시예를 설명하기 위한 흐름도이다.
우선, 초기 처리로서, 스탭(S20)에서, 목표 전송율 R(bps)로부터 산출할 수 있는 GOP당 목표 발생 비트수와 현재의 발생 비트수와의 오차 DIF_Gi, 및 q_scale의 기준값 q_st, 디코더의 가상 버퍼의 점유량 VBV_Buffer_fullness를 설정한다. 또한, 1 픽쳐당의 최저 발생 비트수 D0을 1,000,000 비트/픽쳐 레이트로 하고, 최고 발생 비트수 D1을 8,000,000 비트/픽쳐 레이트로 한다. D0의 설정값은, 부호화 레이트가 1Mbps를 하회하면 화질이 상당히 저하된다고 하는 경험으로부터 설정한 것이다. 한편, 최고값 D1은, 재생 장치에서 디코더에 전송할 수 있는 데이터 전송율에 일치시키거나, 그 전후 및 그 이하의 임의값으로 설정할 수 있다.
다음으로 스탭(S21)에서, 부호화 픽쳐의 q_scale이 하기 식(19)에 의거 산출되어 출력된다.
[수학식 19]
여기서, 직전의 q_scale의 값보다도 2 이상 큰 경우에는, 직전의 q_scale 값보다도 2 큰 값으로 한다. 이 식으로부터 분명한 것은, DIF_Gi가 목표 전송율 R의 T배에 상당할 때, q_scale은 무한대로 발산하게 되어, 사실상 반응계수 T의 값에 의해 오차 DIF_Gi의 상한값이 제한된다. 즉, 반응계수T는 오차 DIF_Gi의 허용 범위를 정하는 파라미터가 된다.
또한, 상기 식으로부터 알 수 있듯이, 어떤 픽쳐를 부호화할 때의 양자화 파라미터는 모드 이전에 발생한 것으로부터 얻을 수 있다. 스탭(S21)에서 구해진 q_scale은, 스탭(S22)에 있어서 기본 부호화 처리 블럭(20)에 공급된다.
다음으로, 스탭(S23)에 있어서 픽쳐 종료 타이밍이 검출된다. 픽쳐 종료 타이밍 신호가 검출되면, 스탭(S24)에서 픽쳐 발생 비트수 PIC_CNT가 검출된다. 검출 결과에 기초하여, 스탭(S25)에서 다음식에 따라 가상 버퍼의 점유량이 구해진다.
[수학식 20]
여기에서, 우변이 가상 버퍼의 용량(fullness_MAX)을 초과할 경우에는,
VBV_Buffer_fullness=fullness_MAX
로 한다.
스탭(S26)에 있어서, VBV_Buffer_fullness가 재생측 디코더에서의 버퍼 점유량의 하한값 D2를 하회하는지에 대한 여부가 판단되고, 하한값 D2를 밑돌 경우에는, 언더플로우(underflow)를 피하기 위해 스탭(S27)에서 픽쳐 스킵 처리 신호가 출력된다.
다음으로 스탭(S27)에 있어서, PIC_CNT가 하한값 D0보다도 작은지 아닌지가 판단되고, PIC_CNT가 하한값 D0보다도 작을 경우에는, 스탭(S28)에서 다음의 픽쳐 이후에서 하한값을 밑돌지 않는 비트수로 하기 위해 q_scale가 감소된다. 도 16은 픽쳐당의 발생 비트수가 하한값 D0을 밑돌 때에, 다음 픽쳐에서 사용되는 q_scale을 설정하는 동작을 설명하기 위한 흐름도이다. 통상적으로는 q_scale을 1씩 감소시키지만, PIC_CNT를 크게 밑돌 경우, 예를 들면 하한값 D0의 1/2를 밑돌 경우에는, 그 때의 q_scale에 따라 감소폭을 변화시킨다. 일반적으로, 어떤 픽쳐에 있어서의 부호화 과정에 있어서, q_scale 값과 발생 비트수와의 적(product), 즉 복잡도는 거의 일정해진다고 한다. 즉, q_scale을 절반으로하면, 발생 비트수는 2배가 된다. 즉, q_scale이 사전에 큰 값을 갖고 있었다고 하면, 그 값을 변화시켜 발생 비트수를 제어하기 위해서는, q_scale이 작은 값일 경우에 비해서, 변화량을 크게 할 필요가 있다고 간주된다.
또한, I, P, B 각 픽쳐에 있어서, 발생 비트수가 하한값 D0을 밑도는 경향이 강한 픽쳐는 B 픽져이고, B 픽쳐의 발생 비트수로부터 양자화 폭을 제어하면, 다른 픽쳐에서의 발생 비트수의 증감이 현져하게 된다. 이 때문에, 하한값 D0과의 오차가 절반 정도 회복할 정도로 q_scale을 설정하고, 여러 픽쳐 동안에 발생 비트수가 하한값에 도달할 정도의 변화량을 설정해둔다. 도 16의 흐름도에 있어서는, 우선 스탭(S281)에서 PIC_CNT가 하한값 D0의 1/2보다도 작은지 어떠지를 판별하고, 작을 경우에는 q_scale을 직전의 값에 대응한 수만큼 감산하다. 즉, 스탭(S282)에서, 직전의 q_scale이 9를 초과할 경우에는 스탭(S283)에서 3이 감산된다. 스탭(S284)에서, 직전의 q_scale이 6 이상 9 이하로 판단된 경우에는 스탭(S285)에서 2가 감산된다. 또한, 그보다도 작은 q_scale의 경우에는, q_scale이 1보다 큰지 여부가 스탭(S286)에서 판단되고, 결과가 참(true)이면 스탭(S287)에서 1이 직전의 q_scale로부터 감산된다.
한편, PIC_CNT가 하한값 D0의 1/2보다도 작지 않을 경우에는, 스탭(S289)에서 직전의 q_scale로부터 1을 감산하는 처리가 행해지지만, 스탭(S289)에서 q_scale이 1이하라고 판단되었을 경우에는, 감산 처리는 행해지지 않는다.
이와 같이 화상 세그먼트의 서브세트로서의 픽쳐의 발생 비트수 PIC_CNT가 소정의 하한값을 하회할 경우에는, 하한값에 대한 차이에 따라 양자화 파라미터가 감소된다.
도 15를 다시 참조하면, PIC_CNT가 상한값 D1을 초과하는지에 대한 여부가 스탭(S29)에서 판단되고, PIC_CNT가 상한값 D1을 초과할 경우에는, 스탭(S30)에서 q_scale을 증가시켜 발생 부호량을 상한값을 초과하지 않도록 제어한다. q_scale의 증가 공정이 도 17에 도시되어 있다. 즉, 스탭(S301)에서 PIC_CNT가 D1의 2배를 초과한다고 판단되었을 경우에는, 스탭(S302)에서, 직전의 q_scale가 9를 초과하는지에 여부가 판단되고, 초과할 경우에는, 스탭(S303)서 직전의 q_scale에 4가 가산된다. 또한 스탭(S302)의 처리에 의해, q_scale이 9보다 작다고 판단되었을 경우에는, 스탭(S304)에서 직전의 q_scale에 2를 가산한다. 한편, 스탭(S301)의 판단 결과 PIC_CNT가 상한값 D1의 2배보다도 작다고 판단되었을 경우에는, 스탭(S305)에서 직전의 q_scale의 값이 31보다 작은지에 대한 판단이 행해진다. 만약 직전의 q_scale가 31보다도 작은 값이면, 스탭(S306)에서 직전의 q_scale에 1이 가산되고, 그렇지 않으면, q_scale 값은 직전의 값 그대로 설정된다. 이와 같이 직전의 q_scale 값에 따라 변화량을 다르게 하는 것은, 양자화폭이 큰 곳에서는 변화량도 크게 할 필요가 있기 때문이다. 또한, I 픽쳐 또는 신 체인지에 있어서는 일시적으로 발생 비트수가 상한값을 초과할 경우도 있으므로, 여러 픽쳐 내에서 발생 비트수가 상한값내에서 정해지도록, q_scale 값이 적응적으로 설정되도록 되어 있다.
이와 같이 화상 세그먼트의 서브세트로서의 픽쳐의 발생 비트수 PIC_CNT가 소정의 상한값보다도 큰 경우에는, 소정의 상한값으로부터의 차이에 따라 양자화 파라미터가 증가하게 된다.
도 15를 다시 참조하면, 스탭(S31)에서 GOP 종료 타이밍인지 아닌지가 판단되고, GOP 종료가 아니면, 발생 비트수를 하한값과 상한값과의 사이로 제어하기 위한 q_scale의 제어 처리는, 각 픽쳐마다 반복된다. 그리고, GOP 종료 타이밍을 수신하면, 스탭(S32)에서 GOP 내에서의 발생 비트수 GOP_CNT가 검출되고, 스탭(S33)에서 현재의 발생 비트수와의 오차 DIF_Gi가 하기 식에 기초하여 산출된다.
[수학식 21]
이 산출 결과를 기초로, GOP의 초기 처리에 되돌아가서, 다음 GOP의 최초 q_scale을 산출한다. 이러한 일련의 스탭을 종료될 때까지 반복된다.
상기에 있어서, 제 1 실시예에 있어서는 부호화될 픽쳐의 복잡도를 부호화 복잡도 산출 처리부(4)에 의해서 검출해야 했는데, 제 2 실시예에 있어서는 q_scale의 변화는, 직전에 부호화된 화상 세그먼트의 서브세트의 발생 비트수와, 상한값 혹은 하한값과의 비교에 의해 정해지므로, 한층 실시간 처리에 적합한 화상 압축 부호화 장치를 제공할 수 있다.
도 14에서의 제어 블럭(223)이 출력하는 픽쳐 스킵 신호는, 가상 버퍼의 언더플로우가 발생할 경우에 이를 방지하기 위해 기본 부호화 처리 블럭(20)에 공급된다. 이 기본 부호화 처리 블럭(20)은 픽쳐 스킵 신호를 수신하면 1픽쳐분의 부호화를 스킵한다.
도 18은 입력되는 화상의 복잡도에 대하여 발생될 비트수 및 화질의 변화를 모식적으로 나타낸 그래프이다. 도 18(a)는 반응계수T에 대하여 충분히 짧은 시간 내에서 발생하는 복잡도의 변화와, 제 1 실시예에 따른 발생 비트수 및 화질의 변화를 도시한 것이다. 즉, 화상의 복잡도가 비교적 짧은 시간 간격으로 변화할 경우에는, 발생 비트수는 화상의 부호화의 복잡도에 따라 할당되고, 화질도 거의 일정하게 유지되는 것을 알 수 있다.
한편 도 18(b)와 같이, 입력 화상의 부호화가 매우 곤란해지고, 또 비교적 오랜 시간 동안 그런 화상이 공급되었을 경우, 제 1 실시예에 따른 목표 비트수의 할당 방법에 따르면, 입력 화상의 복잡도에 따라 비트수가 발생되고, 그 후, 반응계수T를 파라미터로서 지수 함수적으로 비트 발생량이 감소해 간다.
이 때문에, 충분한 화질을 유지하는데 필요한 비트수를 하회할 때까지의 시간이 비교적 짧다. 이 점은, 제 2 실시예에 있어서의 목표 비트수의 할당 방법에 따르면, 최대 비트량을 상향하는 발생 비트를 필요로하는 화상 구간은 최대 비트량보다도 적은 비트수로 순식간에 부호화 되어, 충분한 화질이 오랜 시간 유지될 수 있다.
한편, 도 18(c)는 부호화가 곤란한 화상이 계속된 후, 부호화가 쉬운 화상이 계속 이어질 경우의 발생 비트수와 화질과의 관계를 모식적으로 표현하는 그래프이다. 본 발명의 제 1 실시예에 따르면, 부호화가 쉬운 화상으로 교체된 직후에 발생 비트수가 현저하게 감소하고, 그 후 반응계수 T에 따라 지수 함수적으로 발생 비트수가 증가된다. 단, 화질의 회복에는 반응계수 T에 의해 정해지는 기간을 필요로 한다. 이에 대하여, 본 발명의 제 2 실시예에 따르면, 발생 비트수는 하한값에 순식간에 도달하여, 어느 정도의 화질이 유지된다.
또한, 제 2 실시예에 경우도, GOP 단위로 목표 전송율과의 비트 발생 오차를 산출하고 있지만, GOP 단위가 아니더라도, 여러 픽쳐 단위로 비트 발생 오차를 산출할 수도 있다.
또한, 각 픽쳐당 q_scale의 변화량도, 각 픽쳐당 발생 비트수를 상한값과 하한값의 사이로 제어할 수 있을 정도로 임으로 설정할 수도 있다.
또한, 반응계수 T는 제1 및 제 2의 실시예의 설명에 있어서는 고정된 값으로서 설명했지만, 임의의 값으로 설정해도 된다. 즉, 반응계수 T는 어떤 GOP에서 생성된 발생 비트수와 목표 발생 비트수와의 오차를 후속하는 T개의 GOP에 걸쳐 흡수시키도록 설정되는 것이므로, 이용한 시스템에 따라 바람직한 반응계수 T를 설정하면 된다. 예를들면, 부호화할 총 GOP 수에 따라 반응계수 T를 정하는 것이 바람직하고, 또한 광디스크 등과 같이 재생 시간이 유한적일 경우에는, 시각에 따라 반응계수를 비선형적으로 변화시켜도 된다.
도 19는 시각에 따라 반응계수 T를 가변적으로 제어할 수 있는 실시예의 구성을 도시한 블럭도로서, 반응계수 제어 블럭(23)은, 부호화될 화상의 부호화 시간과, 현재 부호화중인 부분의 부호화를 개시했을 때를 기준으로 한 시각을 입력으로 하여, 반응계수 T를 출력하는 구성을 도시하고 있다. 도 20은 반응계수 제어 블럭(23)의 입출력 특성을 도시한 그래프이다. 본 실시예에서는, 수학식 19에서 알수 있듯이, 비트 발생량의 오차가 전송율의 T배가 되었을 경우에, 양자화 폭이 수식 상에서 무한대로 되기 때문에 비트 발생량의 상한선이 설정되어 있다. 즉, 반응계수 T는 이용할 시스템에 있어서 허용할 수 있는 목표 레이트와의 오차의 상한값을 정하는 파라미터로서 이용된다. 한편, 반응계수 T가 클수록, 신 체인지의 간격 등이 긴 것에 대응할 수 있고, 가능한 한 큰 반응계수를 부여하는 것이, 바람직하게 동작할 수 있다. 예를 들면, 반응계수 T를 부호화의 전반부분에서는 큰 값으로 설정하고, 부호화의 종료시에는 작은 값이 되도록 단계적으로 감소시킨다. 이렇게 함으로써, 최종적인 비트 발생수의 오차는 최종적으로 설정된 T의 값으로 비교적 작게 설정되고, 부호화의 중간 부분에서는, 반응계수 T가 크게 설정되어 시간이 비교적 긴 장면에도 대응할 수 있다. 도 20에는 반응계수 T의 변화를 나타낸 그래프가 도시되어 있다. 여기에서는, 모든 부호화가 완료되는 시간을 C로 했을 때, 중간의 1/3의 시간을 T=180으로 하고, 전반 1/3은, T=20으로부터 서서히 T=180이 되도록 T를 변화시켜, 후반 1/3은 T=180으로부터 서서히 T=20이 되도록 T를 변화시키도록 한다. 이와 같이 하면 부호화의 중간부분에서 반응계수 T를 크게 설정하고 있기 때문에, 비교적 긴 장면에 걸쳐 발생 비트수의 오차를 조정할 수 있고, 최초와 최후의 부분에 있어서는 발생 비트수의 오차를 단시간으로 조정할 수 있다. 이것은, 부호화될 화상의 최초와 최후가, 예를 들면 영화의 타이틀 장면이나 종료 화면과 같이, 부호화가 쉬운 화면이 예상될 경우에 유효하고, 한편, 영화의 본편은 반응계수 T를 크게 설정할 수 있으므로, 화질이 뛰어난 영상 소오스를 제공할 수 있게 된다.
또한, 도 20에서는, 반응계수 T의 감소의 개시 시각을 부호화 시간의 2/3의 시각으로 했지만, 예를 들면, 영화의 종료 화면에서 타이틀명, 배역명 등의 정지 화면과 같은 비교적 부호화가 곤란하지 않은 장면이 예상될 경우에는, 반응계수 T를 감소시키는 시각을 부호화의 종료 직전으로 설정하면, 본편의 거의 전 장면에 걸쳐 반응계수를 크게 설정할 수 있게 되어, 고화질을 실현할 수 있다.
또한, T의 값은 20∼180 사이로 설정하고 있지만 이에 한정되는 것은 아니다. 예를들면, T=5 정도의 값으로도, 종래의 고정 레이트의 부호화에 있어서는 화질이 저하된 장면 변화에 대해서는, 충분한 화질을 유지하는데 효과가 있고, 또한 발생 비트수의 오차가 허용할 수 있는 범위에서 반응 계수를 가능한 한 크게 함으로써 고화질의 부호화가 가능하게 된다.
또한, 제 2 실시예에 있어서는, 픽쳐당의 비트 발생량이 상한값 혹은 하한값을 초과했을 경우의 q_scale의 값의 변화량을 동일한 복잡도를 가지는 화상이 된다고 가정했을 경우에, 여러 프레임 후에 상한값 혹은 하한값의 범위내가 되도록 제어했지만, 예를 들면 발생 비트수가 하한값의 1/2이 되었으면, q_scale도 1/2로 하는 등의 연산에 의해 구해도 되고, 픽쳐당 발생 비트수를 상한값 및 하한값의 사이가 되도록 양자화 폭을 제어하는 한, 그 변화량은 임의적으로 설정해도 무방하다.
따라서, 본 발명에 따르면, GOP 단위 등의 화상 세그먼트의 그룹의 목표 발생 비트수와 발생 비트수와의 오차를, 후속하는 복수의 화상 세그먼트의 그룹에 할당되는 목표 비트수로 서서히 수렴되도록 하여 목표 발생비트 및 양자화 파라미터를 설정하도록 했기 때문에, 급격하게 화상이 변화해도 화질의 급격한 변화를 피할 수 있다.
본 발명에 따르면, 직전의 픽쳐 등의 화상 세그먼트의 서브세트에 있어서의 발생비트수가 상한값 및 하한값으로 정해진 범위를 초과한 경우에, 다음 화상 세그먼트의 서브세트에 있어서의 양자화 파라미터를 변화시키도록 했기 때문에, 화상 유니트의 부호화에 필요한 발생 비트수를 미리 검출하지 않고, 목표한 발생 비트수 및 양자화 파라미터를 제어할 수 있게 된다.
상기에 있어서, 본 발명의 특정한 실시예에 대하여 설명하였는데, 본 특허 명세서에 기재한 특허청구의 범위를 일탈하지 않고 당업자는 다양한 변경을 할 수 있는 것은 물론이다.

Claims (40)

  1. 목표 전송율에 따라 화상을 압축 부호화하는 화상 압축 부호화 장치에 있어서,
    상기 목표 전송율에 대응하는 목표 비트수와, 직전까지의 화상 세그먼트의 그룹을 부호화하는데 필요한 발생 비트수와의 오차를 2 이상의 수로 나눈 결과에 기초하여, 상기 목표 비트수를 조정하고, 조정된 목표 발생 비트의 비트수에 기초하여, 화상 세그먼트의 그룹을 부호화 하기 위한 양자화 파라미터를 제어하는 제어부를 포함하는 것을 특징으로 하는 화상 압축 부호화 장치.
  2. 제 1 항에 있어서,
    상기 양자화 파라미터에 따라, 입력 화상 신호를 MPEG-2에 준거한 화상 신호에 부호화 처리하는 기본 부호화 처리부를 더 포함하는 것을 특징으로 하는 화상 압축 부호화 장치.
  3. 제 1 항에 있어서,
    임의의 화상 세그먼트의 그룹을 부호화하고, 부호화에 필요한 발생 비트수에 따른, 부호화의 복잡도를 나타내는 인덱스를 생성하는 부호화 복잡도 인덱스 검출 수단과,
    각 화상 세그먼트의 그룹마다의 부호화의 복잡도를 나타내는 복잡도 인덱스의 기준값을 설정하고, 목표 전송율로부터 산출되는 현 화상 세그먼트의 그룹을 부호화할 때의 목표 발생 비트수를, 복잡도 인덱스의 기준값의 화상 세그먼트의 그룹을 부호화할 때의 기준 발생 비트수로 하여, 현 화상 세그먼트의 그룹의 부호화시의 목표 발생 비트수와 기준 발생 비트수와의 차이가, 상기 부호화 복잡도 인덱스 검출 수단이 검출한 현재의 화상 세그먼트의 그룹의 복잡도 인덱스의 기준값과의 차이에 상관하도록 현재의 화상 세그먼트의 그룹의 부호화시의 목표 발생 비트수를 설정하고, 상기 목표 발생 비트수에 기초하여 양자화 폭을 산출하는 양자화 폭 산출 수단을 더 포함하는 것을 특징으로 하는 화상 압축 부호화 장치.
  4. 제 1 항에 있어서,
    상기 화상 세그먼트는 매크로 블럭이고, 상기 화상 세그먼트의 그룹은 슬라이스, 픽쳐, 혹은 GOP 중의 적어도 하나인 것을 특징으로 하는 화상 압축 부호화 장치.
  5. 제 4 항에 있어서,
    상기 GOP는, 픽쳐내 부호화 픽쳐(I 픽쳐), 전방향의 예측 부호화 픽쳐(P 픽쳐) 및 양 방향의 예측 부호화 픽쳐(B 픽쳐)를 가지는 것을 특징으로 하는 화상 압축 부호화 장치.
  6. 제 4 항에 있어서,
    상기 제어부는, 상기 픽쳐를 구성하는 매크로 블럭의 각각에 있어서의 부호화의 복잡도를 나타내는 인덱스, 픽쳐 전체에 걸친 부호화의 복잡도를 나타내는 인덱스 및 픽쳐 전체의 목표 비트수를 이용하여, 상기 매트로 블럭의 각각에 목표 발생 비트수를 할당하는 것을 특징으로 하는 화상 압축 부호화 장치.
  7. 목표 전송율에 대응하여, 화상을 압축할 때의 양자화 파라미터를 제어하는 화상 압축 부호화 장치에 있어서,
    목표 전송율, 현재의 화상 세그먼트의 그룹까지의 발생 비트수와의 오차를 2 이상의 수로 나눈 결과에 따라 양자화 파라미터를 제어하는 제어부를 구비하는 것을 특징으로 하는 화상 압축 부호화 장치.
  8. 목표 전송율에 대응하여, 화상을 압축할 때의 양자화 파라미터를 제어하는 화상 압축 부호화 장치로서,
    목표 전송율과, 현재의 화상 세그먼트의 그룹까지의 발생 비트수와의 오차를 2 이상의 수로 나눈 결과에 따라 양자화 파라미터를 제어함과 동시에, 상기 화상 세그먼트의 그룹을 복수로 분할한 화상 세그먼트의 서브세트(subset)마다의 부호화에 필요한 발생 비트수가 소정의 상한값을 상향할 경우, 혹은 소정의 하한값을 하회할 경우에, 후속하는 화상 세그먼트의 서브세트를 부호화할 때에 상기 양자화 파라미터를 변화시키는 것을 특징으로 하는 화상 압축 부호화 장치.
  9. 제 8 항에 있어서,
    상기 제어부가, 상기 직전의 화상 세그먼트의 서브세트를 부호화할 때에 필요한 발생 비트수가 소정의 상한값을 상향할 경우, 상기 양자화 파라미터를 증가시키는 것을 특징으로 하는 화상 압축 부호화 장치.
  10. 제 8 항에 있어서,
    상기 제어부가, 상기 직전의 화상 세그먼트의 서브세트를 부호화할 때에 필요한 발생 비트수가 소정의 하한값을 하회할 경우, 상기 양자화 파라미터를 감소시키는 것을 특징으로 하는 화상 압축 부호화 장치.
  11. 제 9 항에 있어서,
    상기 제어부가, 상기 직전의 화상 세그먼트의 서브세트를 부호화할 때에 필요한 발생 비트수가 소정의 상한값을 상향할 경우, 직전의 서브세트를 부호화할 때에 사용한 양자화 파라미터에 따른 변화량을 증가시키는 것을 특징으로 하는 화상 압축 부호화 장치.
  12. 제 10 항에 있어서,
    상기 제어부가, 상기 직전의 화상 세그먼트의 서브세트를 부호화할 때에 필요한 발생 비트수가 소정의 하한값을 하회할 경우, 직전의 서브세트를 부호화할 때에 사용한 양자화 파라미터에 따른 변화량을 감소시키는 것을 특징으로 하는 화상 압축 부호화 장치.
  13. 제 7 항 또는 제 8 항에 있어서,
    상기 양자화 파라미터에 따라 MPEG-2에 준거한 부호화된 화상을 생성하는 기본 부호화 처리부를 더 구비하는 것을 특징으로 하는 화상 압축 부호화 장치.
  14. 제 8 항에 있어서,
    상기 화상 세그먼트의 그룹이 GOP이고, 상기 화상 세그먼트의 서브세트가 픽쳐인 것을 특징으로 하는 화상 압축 부호화 장치.
  15. 제 1 항 또는 제 7 항에 있어서,
    상기 직전의 화상 세그먼트의 그룹을 부호화할 때에 필요한 발생 비트수와, 목표 전송율에 따른 목표 발생 비트수와의 오차를 나눌 때에 이용하는 수가 20∼180인 것을 특징으로 하는 화상 압축 부호화 장치.
  16. 제 15 항에 있어서,
    상기 나눗셈에 이용하는 수가, 적어도 2 종류 이상의 값을 갖는 것을 특징으로 하는 화상 압축 부호화 장치.
  17. 제 15 항 또는 제 16 항에 있어서,
    상기 나눗셈에 이용하는 수가, 부호화 시간에 따라 변동되는 것을 특징으로 하는 화상 압축 부호화 장치.
  18. 목표 전송율에 따라, 화상을 압축 부호화하는 화상 압축 부호화 방법에 있어서,
    상기 목표 전송율에 대응하는 목표 비트수와, 직전까지의 화상 세그먼트의 그룹을 부호화하는 데에 필요한 발생 비트수와의 오차를 2 이상의 수로 나눈 결과에 따라 상기 목표 비트수를 조정하고, 조정된 목표 발생 비트의 비트수에 따라 화상 세그먼트의 그룹을 부호화하기 위한 양자화 파라미터를 제어하는 제어부를 포함하는 것을 특징으로 하는 화상 압축 부호화 방법.
  19. 제 18 항에 있어서,
    상기 양자화 파라미터에 따라, 입력 화상 신호를 MPEG-2에 준거한 화상 신호에 부호화 처리하는 공정을 더 포함하는 것을 특징으로 하는 화상 압축 부호화 방법.
  20. 제 18 항에 있어서,
    부호화 복잡도 인덱스 검출 수단을 이용하여, 임의의 화상 세그먼트 그룹을 부호화하고, 부호화에 필요한 발생 비트수에 따른, 부호화의 복잡도를 나타내는 인덱스를 생성하고, 양자 화폭 산출 수단을 이용하여 각 화상 세그먼트 마다의 부호화의 복잡도를 나타내는 복잡도 인덱스의 기준값을 설정하고, 목표 전송율로부터 산출되는 현재의 화상 세그먼트의 그룹을 부호화할 때의 목표 발생 비트수를, 복잡도 인덱스의 기준값의 화상 세그먼트의 그룹을 부호화할 때의 기준 발생 비트수로 하여, 현재의 화상 세그먼트의 그룹의 부호화시의 목표 발생 비트수와 기준 발생 비트수와의 차이가, 상기 부호화 복잡도 인덱스 검출수단이 검출한 현재의 화상 세그먼트의 그룹의 복잡도 인덱스의 기준값과의 차이에 상관하도록 현재의 화상 세그먼트의 그룹의 부호화시의 목표 발생 비트수를 설정하고, 상기 목표 발생 비트수에 기초하여 양자화 폭을 산출하는 것을 더 포함하는 것을 특징으로 하는 화상 압축 부호화 방법.
  21. 제 18 항에 있어서,
    상기 화상 세그먼트가 매크로 블럭이고, 상기 화상 세그먼트의 그룹이 슬라이스, 픽쳐 혹은 GOP 중 적어도 하나인 것을 특징으로 하는 화상 압축 부호화 방법.
  22. 제 21 항에 있어서,
    상기 GOP는, 픽쳐내 부호화 픽쳐(I 픽쳐), 전방향의 예측 부호화 픽쳐(P 픽쳐) 및 양방향의 예측 부호화 픽쳐(B 픽쳐)를 가지는 것을 특징으로 하는 화상 압축 부호화 방법.
  23. 제 21 항에 있어서,
    상기 픽쳐를 구성하는 매크로 블럭의 각각에, 상기 매크로 블럭의 각각에 있어서의 복잡도를 나타내는 인덱스, 픽쳐의 복잡도를 나타내는 인덱스 및 픽쳐 전체의 목표 비트수를 이용하여 상기 매크로 블럭의 각각에 목표 비트수를 할당하는 것을 특징으로 하는 화상 압축 부호화 방법.
  24. 목표 전송율에 대응하여, 화상을 압축할 때의 양자화 파라미터를 제어하는 화상 압축 부호화 방법에 있어서,
    목표 전송율과, 현재의 화상 세그먼트의 그룹까지의 발생 비트수와의 오차를 2 이상의 수로 나눈 결과에 따라 양자화 파라미터를 제어하는 것을 특징으로 하는 화상 압축 부호화 방법.
  25. 목표 전송율에 대응시켜서 화상을 압축할 때의 양자화 파라미터를 제어하는 화상 압축 부호화 방법으로서,
    목표 전송율과, 현재의 화상 세그먼트의 그룹까지의 발생 비트수와의 오차를 2 이상의 수로 나눈 결과에 따라 양자화 파라미터를 제어함과 동시에, 상기 화상 세그먼트의 그룹을 복수로 분할한 화상 세그먼트의 서브세트마다의 부호화에 필요한 발생 비트수가 소정의 상한값을 상향할 경우, 혹은 소정의 하한값을 하회할 경우에, 후속하는 화상 세그먼트의 서브세트를 부호화할 때에 상기 양자화 파라미터를 변화시키는 것을 특징으로 하는 화상 압축 부호화 방법.
  26. 제 25 항에 있어서,
    상기 직전의 화상 세그먼트의 서브세트까지 부호화할 때에 필요한 발생 비트수가 소정의 상한값을 상향할 경우, 상기 양자화 파라미터를 증가시키는 것을 특징으로 하는 화상 압축 부호화 방법.
  27. 제 25 항에 있어서,
    상기 직전의 화상 세그먼트의 서브세트까지 부호화할 때에 필요한 발생 비트수가 소정의 소정의 하한값을 하회할 경우, 상기 양자화 파라미터를 감소시키는 것을 특징으로 하는 화상 압축 부호화 방법.
  28. 제 26 항에 있어서,
    상기 직전의 화상 세그먼트의 서브세트까지 부호화할 때에 필요한 발생 비트수가 소정의 상한값을 상향할 경우, 직전의 화상 세그먼트의 서브세트를 부호화할 경우에 사용한 양자화 파라미터에 따라, 양자화 폭을 변화시키는 것을 특징으로 하는 화상 압축 부호화 방법.
  29. 제 27 항에 있어서,
    상기 직전의 화상 세그먼트의 서브세트까지 부호화할 때에 필요한 발생 비트수가 소정의 하한값을 하회할 경우, 직전의 화상 세그먼트의 서브세트를 부호화할 때에 사용한 양자화 파라미터에 따라, 양자화 폭을 변화시키는 것을 특징으로 하는 화상 압축 부호화 방법.
  30. 제 24 항에 있어서,
    상기 양자화 파라미터에 따라 MPEG-2에 준거한 부호화된 화상을 생성하는 것을 특징으로 하는 화상 압축 부호화 방법.
  31. 제 24 항에 있어서,
    상기 화상 세그먼트의 그룹이 GOP이고, 상기 화상 세그먼트의 서브세트가 픽쳐인 것을 특징으로 하는 화상 압축 부호화 방법.
  32. 제 18 항 또는 제 24 항에 있어서,
    상기 나눗셈에 사용하는 수가 20∼180인 것을 특징으로 하는 화상 압축 부호화 방법.
  33. 제 32 항에 있어서,
    상기 나눗셈에 이용하는 수가, 적어도 2 종류 이상의 값을 갖는 것을 특징으로 하는 화상 압축 부호화 방법.
  34. 제 32 항 또는 제 33 항에 있어서,
    상기 나눗셈에 이용하는 수가, 부호화 시간에 따라 변동하는 것을 특징으로 하는 화상 압축 부호화 방법.
  35. 목표 전송율에 따라 화상을 압축 부호화 하는 화상 압축 부호화 장치에 있어서,
    목표 전송율에 대응한 목표 비트수, 직전의 화상 세그먼트의 그룹까지 부호화 하는 데에 필요한 발생 비트수와의 오차, 상기 오차의 허용 범위를 정하는 반응계수 T 및 직전의 화상 세그먼트의 그룹을 부호화 했을 경우의 양자화 파라미터에 기초하여, 양자화 파라미터를 설정하는 제어부를 포함하는 것을 특징으로 하는 화상 압축 부호화 장치.
  36. 제 35 항에 있어서,
    상기 제어부가, 상기 오차가 상기 반응계수 T로 정해지는 오차의 허용 범위의 근방에 있어서, 상기 양자화 파라미터를 최대값으로 하는 것을 특징으로 하는 화상 압축 부호화 장치.
  37. 제 35 항에 있어서,
    상기 제어부가, 상기 오차를 반응계수 T로 나눈 결과를 상기 목표 전송율로 부터 감산한 차와, 목표 전송율과의 비에 따라 양자화 파라미터를 설정하는 것을 특징으로 하는 화상 압축 부호화 장치.
  38. 목표 전송율에 따라 화상을 압축 부호화하는 화상 압축 부호화 방법에 있어서,
    목표 전송율에 대응한 목표 비트수와, 직전의 화상 세그먼트의 그룹까지 부호화 하는 데 필요한 발생 비트수와의 오차, 상기 오차의 허용 범위를 정하는 반응계수 T 및 직전의 화상 세그먼트의 그룹을 부호화했을 경우의 양자화 파라미터에 기초하여, 양자화 파라미터를 설정하는 것을 특징으로 하는 화상 압축 부호화 방법.
  39. 제 35 항에 있어서,
    상기 오차가, 상기 반응계수 T로 정해지는 오차의 허용 범위의 근방에 있어서, 상기 양자화 파라미터를 최대값으로 하는 것을 특징으로 하는 화상 압축 부호화 방법.
  40. 제 35 항에 있어서,
    상기 오차를 반응계수 T로 나눈 결과를 상기 목표 전송율로부터 감산한 차 및 목표 전송율과의 비에 따라, 양자화 파라미터를 설정하는 것을 특징으로 하는 화상 압축 부호화 방법.
KR1019970015492A 1996-04-25 1997-04-25 화상압축부호화장치및방법 KR100471956B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP96-105078 1996-04-25
JP10507896A JP3173369B2 (ja) 1996-04-25 1996-04-25 画像圧縮符号化装置
JP28050196A JP3218994B2 (ja) 1996-10-23 1996-10-23 画像符号化方法および装置
JP96-280501 1996-10-23

Publications (2)

Publication Number Publication Date
KR19980032089A true KR19980032089A (ko) 1998-07-25
KR100471956B1 KR100471956B1 (ko) 2005-05-16

Family

ID=26445427

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970015492A KR100471956B1 (ko) 1996-04-25 1997-04-25 화상압축부호화장치및방법

Country Status (4)

Country Link
US (2) US6115421A (ko)
EP (2) EP1182888A3 (ko)
KR (1) KR100471956B1 (ko)
DE (1) DE69713549T2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100953152B1 (ko) * 2001-12-28 2010-04-19 노키아 코포레이션 비디오 인코더에서 매크로블록 양자화 파라미터들을선택하기 위한 방법 및 장치

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6957350B1 (en) * 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US6633609B1 (en) * 1996-12-24 2003-10-14 Intel Corporation Method and apparatus for bit rate control in a digital video environment for arbitrary bandwidth
JP3104868B2 (ja) * 1997-11-25 2000-10-30 富士ゼロックス株式会社 画像処理装置
GB2337392B (en) * 1997-12-08 2002-04-17 Sony Corp Coding device and method
WO1999030505A1 (en) * 1997-12-08 1999-06-17 Sony Corporation Encoder and encoding method
US6301428B1 (en) * 1997-12-09 2001-10-09 Lsi Logic Corporation Compressed video editor with transition buffer matcher
JP3912633B2 (ja) * 1998-01-23 2007-05-09 ソニー株式会社 画像処理方法および装置
EP0936819A3 (en) * 1998-02-13 2001-06-13 Hitachi, Ltd. Digital recording and reproducing apparatus
DE69815159T2 (de) 1998-03-20 2004-04-08 Stmicroelectronics Asia Pacific Pte Ltd. Kodierung von bewegten bildern mit globaler konstanter bitrate
WO1999063760A1 (en) * 1998-05-30 1999-12-09 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Sequence adaptive bit allocation for pictures encoding
US6963608B1 (en) * 1998-10-02 2005-11-08 General Instrument Corporation Method and apparatus for providing rate control in a video encoder
JP3907875B2 (ja) * 1998-10-23 2007-04-18 パイオニア株式会社 符号化レート制御装置及び情報符号化装置
JP3259702B2 (ja) * 1998-12-24 2002-02-25 日本電気株式会社 動画像可変ビットレート符号化装置および方法
EP1037472B1 (en) * 1999-03-12 2004-09-15 Victor Company Of Japan, Limited Data coding method and apparatus therefor
US6567554B1 (en) 1999-03-12 2003-05-20 Victor Company Of Japan, Limited Data coding method and apparatus therefor
US6535251B1 (en) * 1999-10-26 2003-03-18 Sharplabs Of America, Inc. Video encoder and method for adjusting quantization step in real time
JP3871840B2 (ja) * 1999-12-24 2007-01-24 日本電気株式会社 圧縮動画像再符号化装置
CN1185875C (zh) * 2000-03-21 2005-01-19 皇家菲利浦电子有限公司 可变码率的视频编码方法
US6724817B1 (en) * 2000-06-05 2004-04-20 Amphion Semiconductor Limited Adaptive image data compression
AU2001276876A1 (en) * 2000-07-11 2002-01-21 Mediaflow, Llc Adaptive edge detection and enhancement for image processing
JP2002112257A (ja) * 2000-07-26 2002-04-12 Matsushita Electric Ind Co Ltd 映像圧縮伝送装置および方法
US7418007B1 (en) 2000-09-20 2008-08-26 General Instrument Corporation Method and apparatus for determining a transmission bit rate in a statistical multiplexer
US8369401B1 (en) * 2000-10-06 2013-02-05 Stmicroelectronics Asia Pacific Pte Ltd. System and method of bit allocation in scene change situations
US8374237B2 (en) 2001-03-02 2013-02-12 Dolby Laboratories Licensing Corporation High precision encoding and decoding of video images
US6882753B2 (en) * 2001-06-04 2005-04-19 Silicon Integrated Systems Corp. Adaptive quantization using code length in image compression
US7266150B2 (en) 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
US8111754B1 (en) 2001-07-11 2012-02-07 Dolby Laboratories Licensing Corporation Interpolation of video compression frames
US20030112863A1 (en) 2001-07-12 2003-06-19 Demos Gary A. Method and system for improving compressed image chroma information
JP4447805B2 (ja) 2001-08-09 2010-04-07 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
EP1372113B1 (en) * 2002-06-11 2005-10-19 STMicroelectronics S.r.l. Variable bit rate video encoding method and device
US7251275B2 (en) 2002-06-25 2007-07-31 General Instrument Corporation Methods and apparatus for statistical multiplexing during dual pass encoding
US6961376B2 (en) 2002-06-25 2005-11-01 General Instrument Corporation Methods and apparatus for rate control during dual pass encoding
US7136532B2 (en) * 2002-06-27 2006-11-14 Koninklijke Philips Electronics N.V. FGS decoder based on quality estimated at the decoder
CN1206864C (zh) * 2002-07-22 2005-06-15 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
JP4162454B2 (ja) * 2002-09-10 2008-10-08 三洋電機株式会社 データ処理装置
US7266133B2 (en) 2002-11-13 2007-09-04 General Instrument Corporation Methods and apparatus for statistical multiplexing with distributed multiplexers
KR100950525B1 (ko) * 2002-12-02 2010-03-30 삼성전자주식회사 트랜스코딩 장치 및 방법, 이에 사용되는 타겟비트할당 및픽처 복잡도 예측 장치 및 방법
JP4179917B2 (ja) * 2003-04-22 2008-11-12 株式会社東芝 動画像符号化装置及び方法
US7746928B2 (en) * 2004-12-30 2010-06-29 General Instruments Corporation Method and apparatus for providing rate control
JP4731600B2 (ja) * 2006-03-30 2011-07-27 パイオニア株式会社 コンテンツ送信システムにおけるサーバー装置およびコンテンツ送信方法
KR100790150B1 (ko) * 2006-07-28 2008-01-02 삼성전자주식회사 비디오 부호화기 및 비디오 데이터 프레임 부호화 방법
WO2008079330A1 (en) * 2006-12-22 2008-07-03 Inlet Technologies Video compression with complexity throttling
EP2124455A4 (en) 2007-03-14 2010-08-11 Nippon Telegraph & Telephone METHOD AND DEVICE FOR MOTION VEHICLE SEARCH, PROGRAM THEREFOR AND RECORDING MEDIUM WITH THIS PROGRAM
ES2676119T3 (es) * 2007-03-14 2018-07-16 Nippon Telegraph And Telephone Corporation Método de control de cuantificación, dispositivo, programa y medio de grabación que contiene el programa
CN101632308B (zh) 2007-03-14 2011-08-03 日本电信电话株式会社 编码比特率控制方法和装置
BRPI0808774A2 (pt) 2007-03-14 2014-08-19 Nippon Telegraph & Telephone Método de estimativa de quantidade de código, e aparelho, programa e meio de armazenamento para o mesmo
US20090087114A1 (en) * 2007-09-28 2009-04-02 Advanced Micro Devices Response Time Compression Using a Complexity Value of Image Information
CN101127909B (zh) * 2007-09-29 2010-07-07 华为技术有限公司 一种图像码率控制方法及装置
JP5032936B2 (ja) * 2007-10-04 2012-09-26 キヤノン株式会社 動画像符号化装置及びその制御方法
JP4958713B2 (ja) * 2007-10-04 2012-06-20 キヤノン株式会社 動画像符号化装置及びその制御方法
CN102113326A (zh) 2008-08-04 2011-06-29 杜比实验室特许公司 重叠块差异估计和补偿体系结构
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US9071841B2 (en) * 2011-05-17 2015-06-30 Microsoft Technology Licensing, Llc Video transcoding with dynamically modifiable spatial resolution
US8989256B2 (en) * 2011-05-25 2015-03-24 Google Inc. Method and apparatus for using segmentation-based coding of prediction information
US9247257B1 (en) 2011-11-30 2016-01-26 Google Inc. Segmentation based entropy encoding and decoding
US9094681B1 (en) 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
US9819964B2 (en) * 2012-05-04 2017-11-14 Environmental Systems Research Institute, Inc. Limited error raster compression
US9002126B2 (en) * 2012-05-04 2015-04-07 Environmental Systems Research Institute (ESRI) Limited error raster compression
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
KR102365685B1 (ko) 2015-01-05 2022-02-21 삼성전자주식회사 인코더의 작동 방법과 상기 인코더를 포함하는 장치들
CN110636389B (zh) * 2019-09-19 2021-11-09 深圳市梦网视讯有限公司 一种片源复杂度分析方法和系统
US20220086445A1 (en) * 2020-12-03 2022-03-17 Intel Corporation Methods, apparatus, and articles of manufacture for multi-symbol equiprobable mode entropy coding
CN114513664B (zh) * 2022-04-18 2022-07-22 鹏城实验室 视频帧编码方法、装置、智能终端及计算机可读存储介质
CN117333492B (zh) * 2023-12-01 2024-03-15 深圳菲尔泰光电有限公司 基于图像处理的光学薄膜质量检测方法及相关装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
BR9404929A (pt) * 1993-04-09 1999-07-27 Sony Corp Processo e aparelho para codificação de imagens e suporte de gravação de imagens
JP3224465B2 (ja) * 1993-12-22 2001-10-29 シャープ株式会社 画像符号化装置
US5686963A (en) * 1995-12-26 1997-11-11 C-Cube Microsystems Method for performing rate control in a video encoder which provides a bit budget for each frame while employing virtual buffers and virtual buffer verifiers
US5719632A (en) * 1996-01-25 1998-02-17 Ibm Corporation Motion video compression system with buffer empty/fill look-ahead bit allocation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100953152B1 (ko) * 2001-12-28 2010-04-19 노키아 코포레이션 비디오 인코더에서 매크로블록 양자화 파라미터들을선택하기 위한 방법 및 장치

Also Published As

Publication number Publication date
DE69713549T2 (de) 2003-01-16
DE69713549D1 (de) 2002-08-01
EP1182888A3 (en) 2004-11-03
US6115421A (en) 2000-09-05
EP0804035A2 (en) 1997-10-29
US6173012B1 (en) 2001-01-09
KR100471956B1 (ko) 2005-05-16
EP1182888A2 (en) 2002-02-27
EP0804035A3 (en) 1998-05-20
EP0804035B1 (en) 2002-06-26

Similar Documents

Publication Publication Date Title
KR100471956B1 (ko) 화상압축부호화장치및방법
US7426309B2 (en) Method of controlling encoding rate, method of transmitting video data, encoding rate controller for video encoder, and video data transmission system using the encoding rate controller
KR100610520B1 (ko) 비디오 데이터 부호화 장치, 비디오 데이터 부호화 방법, 비디오데이터 전송 장치 및 비디오 데이터 기록 매체
EP1372113B1 (en) Variable bit rate video encoding method and device
US7653129B2 (en) Method and apparatus for providing intra coding frame bit budget
US6229849B1 (en) Coding device and method
GB2335560A (en) Moving picture encoding system
US6879632B1 (en) Apparatus for and method of variable bit rate video coding
US20100002765A1 (en) Image encoding apparatus and method
KR100588795B1 (ko) 부호화 장치 및 부호화 방법
JP4362795B2 (ja) 動画像符号化装置及びその方法
Ngan et al. Improved single-video-object rate control for MPEG-4
JP3173369B2 (ja) 画像圧縮符号化装置
US9185420B2 (en) Moving image coding apparatus and moving image coding method
JP3218994B2 (ja) 画像符号化方法および装置
JP3812269B2 (ja) 動画像符号化装置及びその方法
JP3151173B2 (ja) 画像圧縮符号化装置及び方法
JP4193080B2 (ja) 符号化装置及び方法
JP4035747B2 (ja) 符号化装置および符号化方法
Meier et al. Improved single VO rate control for constant bit-rate applications using MPEG-4
EP1944980A2 (en) Bit rate control algorithm
JP2002058038A (ja) 画像符号化方法および装置
KR20050083672A (ko) 비디오 시퀀스의 레이트를 제어하는 방법 및 장치, 비디오부호화 장치
GB2367703A (en) Controlling the usable range of a buffer

Legal Events

Date Code Title Description
AMND Amendment
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080122

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee