KR20040093485A - 양자화기 스케일 선택을 사용한 화상 코딩 - Google Patents

양자화기 스케일 선택을 사용한 화상 코딩 Download PDF

Info

Publication number
KR20040093485A
KR20040093485A KR10-2004-7015366A KR20047015366A KR20040093485A KR 20040093485 A KR20040093485 A KR 20040093485A KR 20047015366 A KR20047015366 A KR 20047015366A KR 20040093485 A KR20040093485 A KR 20040093485A
Authority
KR
South Korea
Prior art keywords
quantization scale
blocks
quantization
data stream
video data
Prior art date
Application number
KR10-2004-7015366A
Other languages
English (en)
Inventor
베멜스펠더아만트브이.
티. 엠. 스몰더스아드리아누스씨.
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20040093485A publication Critical patent/KR20040093485A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

비디오 데이터 스트림은 블록들로 분할된다(11). 제 1 양자화 스케일들(Q)은 블록들 중 각각의 한 블록에 대하여 결정되어(17, 19), 양자화 스케일들(Q)이 미리 결정된 압축율을 실현할 정도로 충분히 크게되도록 한다. 다음에, 이 블록들 중 적어도 하나의 블록에 대한 제 1 양자화 스케일(Q)보다 크고, 상기 블록들 중 적어도 하나의 블록에 대한 제 1 양자화 스케일(Q)에 의해 실현되는 왜곡 보다 작거나 실질적으로 같은 블록들 중 적어도 하나의 블록의 왜곡을 발생시키는 제 2 양자화 스케일(Q')이 존재하는지 여부가 결정된다(17, 19). 디지털 데이터 스트림은 상기 제 2 양자화 스케일(Q')이 존재할 때 상기 블록들 중 적어도 하나의 블록에 대한 제 2 양자화 스케일(Q')을 사용하여 인코딩된다(12, 13, 14).

Description

양자화기 스케일 선택을 사용한 화상 코딩{IMAGE CODING USING QUANTIZER SCALE SELECTION}
미국 특허 제 5,754,236호는 MPEG 표준을 따른 비디오 데이터를 인코딩하는 방법을 개시한다. 이와 같은 인코딩은 방송용 또는 전기통신용의 캠코더들, 비디오 기록 장치들, 비디오 전송 장치들과 같은 많은 다양한 장치들에 사용될 수 있다.
MPEG 표준은 양자화를 사용하여 비디오 데이터를 인코딩하는데 필요로 되는 데이터량을 감소시키킨다. MPEG은 예를 들어, 매크로 블록들의 화상 내용의 DCT 계수들을 인코딩하기 위하여 양자화를 사용한다. 양자화를 사용하면, 단지 제한된 수의 신호 값들(Sm)(m=0,1,2 등은 상이한 신호 값들을 인덱스한다) 만이 인코딩된다는 것을 의미한다.
Sm = m*Q + So
각각 다른 신호 값(S')은 제한된 수의 값들(Sm)중 하나로 대체된다. 이를 양자화라 칭한다. 인코딩될 수 있는 연속적인 값들 간의 거리(Q)를 양자화 스케일(Q)이라 칭한다.
양자화 스케일(Q)은 비디오 데이터를 인코딩하는데 필요로 되는 데이터량, 즉 압축율을 제어하는 주 파라미터이다. 양자화 스케일(Q)이 크면 클수록, 적은 데이터가 필요로 된다. 다른 한편으로, 양자화 스케일(Q)은 인코딩에 의해 초래되는 화상 왜곡에 영향을 미친다. 양자화 스케일이 최소 가능값을 갖지 않을 때 인코딩된 화상은 실제 화상으로부터 벗어날 것이다. 일반적으로, 왜곡은 양자화 스케일(Q)이 증가될 때 증가된다.
그러므로, 양자화 스케일(Q)의 선택은 최대 압축율 및 최소 왜곡간의 절충을 토대로 한다. 실제로, 비디오 데이터를 인코딩하는데 사용될 수 있는 최대 데이터량은 이용가능한 대역폭, 저장 공간 등에 의해 결정되는 통상적으로 하드 파라미터(hard parameter)이다. 양자화 스케일은, 데이터의 량이 이 최대값을 초과하지 않도록 적응된다. 종래의 알고리즘은 양자화 스케일(Q)을 최대 데이터량 보다 적게 발생되는 최소값으로 설정한다. 통상적으로, 이 종래 알고리즘을 개선한 것이 사용되는데, 여기서 화상의 상이한 매크로-블록들의 복잡성이 우선 계산되며, 데이터량이 매크로-블록의 복잡성을 토대로 매크로-블록에 할당되고, 각 상이한 매크로-블록의 양자화 스케일들이 할당된 데이터량 보다 적게 발생되는 각 최소 값으로 설정된다.
미국 특허 제 5,754,236 호는 미리 결정된 압축율을 실현하는 제한하에서 데이터량을 최소화하는 상이한 매크로 블록들로 양자화 스케일들(Q)의 세트의 할당을 탐색하도록 탐색 알고리즘을 사용하는 대안을 설명한다. 즉, 이는 양자화 스케일들을 설정하지 않음으로, 각 매크로 블록은 개별적으로 미리 결정된 압축율을 실현하도록 한다. 비소모적인 탐색 알고리즘(non-exhaustive search algorithm)은 계산적으로 가능한 탐색을 보장하도록 사용된다.
US 특허 제 5,754,236 호의 알고리즘은 최적의 양자화 스케일(Q) 할당 단계들을 서술하며, 각 단계는 선택된 매크로-블록에 대한 양자화 스케일을 증가시키는데, 이로 인해 압축율을 최대로 증가시켜 왜곡을 최소로 증가시키는 것을 성취할 수 있다. 이 단계들은 반복되어 상이한 매크로 블록들을 선택하고 미리 결정된 압축율이 실현될 때까지 선택된 블록들에서 양자화 스케일을 증가시킨다.
본 발명은 비디오 데이터를 코딩하는 방법에 관한 것이며, 특히, 비디오 데이터를 코딩하도록 양자화 스케일을 선택하는 것에 관한 것이다. 본 발명은 또한, 이와 같은 방법을 구현하는 장치에 관한 것이다.
도 1은 화상 압축 장치를 도시한 도면.
도 2는 양자화 스케일의 함수로서 압축을 도시한 도면.
도 3은 양자화 스케일의 함수로서 왜곡을 도시한 도면.
도 4는 인코딩 방법의 순서도.
본 발명의 목적은 거의 또는 전혀 왜곡 손실 없이 비디오 데이터를 인코딩하는데 필요로 되는 데이터량을 더욱 감소시키고자 하는 것이다.
본 발명은 청구항 1을 따른 인코딩 방법을 위하여 제공된다. 본 발명은, 왜곡이 양자화 스케일 증가에 따라서 점진적으로 증가하지만 이것이 항상 그렇치 않다는 관찰을 토대로 한 것이다. 양자화 스케일의 함수에 따라서 왜곡이 국부적으로 최소화될 수 있다. 이는 예를 들어, 모든 신호 값들이 동일한 최대 공약수의 곱일 때 그러하다. 따라서, 미리 결정된 압축율을 실현하는데 최소 필요로 되는 것 보다 큰 양자화 스케일을 선택함으로써, 종종 왜곡을 증가시키지 않거나 심지어 왜곡을감소시키면서 압축율을 증가시킬 수 있다. 따라서, 임의의 알고리즘을 사용하여 충분한 압축율을 보장하도록 하는 양자화 스케일들을 선택하도록 한 후, 부가적인 압축은 실질적으로 왜곡을 증가시키지 않는 양자화 스케일을 더욱 감소시킬 가능성을 검사하는 최적화 단계를 적용함으로써 실현될 수 있다.
본 발명은 또한, 상이한 양자화 스케일들로 양자화하는 동안 발생된 에러들을 비교하는 피드백 루프에 의해 최적의 양자화 스케일을 찾으며, 보다 양호한, 즉 보다 적은 에러-발생 양자화 스케일을 찾고, 이와 같이 찾아진 최적의 양자화 스케일을 사용하여 출력 비트스트림을 생성하도록 진행하는 방법에 관한 것이다.
본 발명은 또한, 양자화 스케일의 서술된 최적화를 양자화된 계수들의 공약수를 결정하여 상기 양자화 스케일을 계산된 값과 승산함으로써 성취하는 방법에 관한 것이다. 따라서, 양자화 스케일은 증가되어, 동일하거나 적은 양자화 에러들을 지닌 보다 적은 비트율이 발생시킨다. 계수들의 최대 공약수가 사용되는 것이 바람직하다.
따라서, 본 발명의 인코딩 방법에 따라서 비디오 시퀀스를 인코딩함으로써, 양자화 스케일을 최적화하여 부가적인 화질 손실 없이도 보다 적은 비트들이 사용된다.
본 발명은 또한, 컴퓨터 프로그램이 저장되는 데이터 캐리어 장치, 컴퓨터 프로그램, 데이터 컨테이너 장치 및 시청각 장치에 관한 것이다.
특히 본 발명의 장점들이 종속항들에 서술되어 있다.
본 발명의 부가적인 목적들, 제작들, 수정들, 효과들 및 상세사항들은 도면을 참조하여 설명된 이하의 설명으로부터 명백하게 될 것이다.
도 1은 화상 압축 장치의 구성요소들을 개요적으로 도시한 것이다. 이 장치는 압축되지 않은 비디오 데이터용 입력(10) 및 압축된 비디오 데이터용 출력(15)을 포함한다. 입력(10) 및 출력(15)간에서, 이 장치는 연속적으로, 전처리 장치(11), 양자화기(12), 가변 길이 인코더(13) 및 패키징 장치(14)를 포함한다. 이 장치는 또한, 길이 결정 장치(17) 및 양자화 스케일 제어기(19)를 포함한다. 양자화 스케일 제어기(19)는 필요로 되는 압축율(R)을 나타내는 신호를 수신하는 입력 및 양자화기(12)에 결합되어 사용되어야 하는 양자화 스케일(Q)를 규정하는 양자화 스케일 제어 출력을 갖는다. 가변 길이 인코더(13)의 출력은 길이 결정 장치(17)의 입력에 결합되고 길이 결정 장치(17)의 출력은 양자화 스케일 제어기(19)의 입력에 결합된다.
동작시에, 압축된 비디오 데이터는 입력(10)에 공급된다. 전처리 장치(11)는각종 전처리 동작들을 수행한다. 예를 들어 MPEG 압축의 경우에, 전처리 장치(11)는 비디오 데이터의 프레임들을 매크로 블록들로 분할하고 각 블록에 대한 화상 데이터의 DCT(디지털 코사인 변환) 계수들을 계산한다. 양자화기(12)는 계수들을 수신하고 이들 계수들을 베이스 값(So) 더하기 정수배의 양자화 스케일(Q)과 동일한 양자화된 계수들로 대체한다. 가변 길이 인코더(13)는 비디오 데이터를 인코딩하는데 필요로 되는 비트들의 수를 최소화하도록 선택된 가변 길이 코드를 사용하여 양자화된 계수들을 인코딩한다. 패키징 장치(14)는 인코딩된 계수들을 패키징하고 MPEG 신호를 출력하는데, 이는 전송, 기록 등을 위하여 사용되어 결국 예를 들어 텔레비젼 세트(도시되지 않음)로 디코딩 및 렌더링하는데 사용될 수 있다.
양자화 스케일 제어기(19)는 양자화기(12)에 의해 사용되는 양자화 스케일을 제어한다. 양자화 스케일 제어기(19)는 MPEG 신호가 처리될 수 있는(예를 들어, 주어진 전송 대역폭 또는 메모리 공간 내에서) 비트들 보다 많은 비트들을 포함하지 않는다. 양자화 스케일 제어기(19)는 요청된 압축 팩터에 대한 최소 화상 왜곡 또는 주어진 왜곡에 대한 최대 압축을 실현하고자 하는 것이다.
도 2는 양자화 스케일의 함수로서 화상을 인코딩하는데 필요로 되는 데이터량 "A"을 도시한다. 량(A)은 Q가 증가함에 따라서 감소된다. 압축률은 량(A)과 관련하여 예를 들어 R=U/A로서 규정될 수 있는데, U는 입력(10)에서 화상을 표시하는데 사용되는 압축되지 않은 데이터의 량이다.
도 3은 양자화 스케일(Q)의 함수로서 왜곡 "D"을 도시한 것이다. 왜곡은 어떤 공지되고 간편한 방식, 예를 들어 개별 신호 값들의 편차들의 절대값들의 합 또는 이와 같은 편차들의 제곱들의 합으로서 규정될 수 있다. 2개의 곡선들이 도시되어 있다. 제 1 곡선(30)은 모든 가능한 입력 화상들에 걸쳐서 평균화된 평균 예측된 왜곡을 도시한다. 제 2 곡선(32)은 화상 내의 블록의 각 인스턴스에 대한 왜곡을 도시한다. 제 1 곡선(30)에 도시된 바와 같이, 왜곡(D)은 양자화 스케일(Q)의 함수에 따라서 엄격하게 증가된다. 제 2 곡선(32)에서, 왜곡(D)은 일반적으로, 제 1 곡선(30)의 추세를 따르지만 이는 변동된다. 따라서, 왜곡(D)은 양자화 스케일(Q) 증가에 따라서 국부적으로 감소될 수 있다.
종래 기술의 압축 기술들은 주로, 제 1 곡선(30)을 토대로 한다. 이들은, 최소 양자화 스케일(Q)이 선택되어 인코딩된 데이터(A)를 왜곡이 최소화된 필요로 되는 레벨로 감소시키면, 양자화 스케일(Q)의 어떤 증가는 왜곡(D)을 증가시킬 것이다. 그러나, 이것은 단지 대략적으로 그러하다. 도 3의 제 2 곡선(32)으로 도시된 바와 같이, 각 블록들에 대해서, 왜곡(D)을 증가시킴이 없이 또는 심지어 왜곡(A)을 감소시키면 인코딩된 데이터(A)의 량을 감소시킬 수 있다. 이는 양자화 스케일 제어기에 사용된다.
도 4는 양자화 선택의 순서도를 도시한 것이다. 제 1 단계(41)에서, 이 장치는 비디오 프레임을 수신하여 전처리한다. 제 2 단계(42)에서, 필요로 되는 압축률(R)의 사양(specification)이 수신된다. 제 3 단계(43)에서, 양자화 스케일(Q)의 최소값들(Q0)이 화상내에서 상이한 매크로-블록들에 대하여 결정되어, 적어도 필요로 되는 압축율(R)을 실현하도록 한다.
어떤 방법은 제 3 단계(43)에서 사용될 수 있다. 예를 들어, 상이한 블록들에서 화상 데이터의 복잡도를 측정하여 각 블록의 복잡도를 토대로 한 각 블록에 대한 개개 목표 데이터량(An)을 설정함으로써("n"은 블록들 중 개개 블록들을 표시하는 인덱스이다), 모든 블록들에 대한 총 목표량들(An)이 필요로 되는 압축율(R)을 초과하지 않도록 한다. 다음에, 각 블록에 대한 압축 스케일(Qn)은 최종 데이터량(An')이 목표량(An)을 초과하지 않는다는 것이 측정될 때까지 증가할 수 있다. 또 다른 예로서, 알고리즘이 사용되어, 총 데이터량(A)이 감소되어 필요로 되는 압축율(R)이 실현될 때까지 순차적으로 선택된 블록들의 양자화 스케일들(Qn)을 감소시킨다. 제 3 단계에 따라서, 최소 양자화 스케일 값들(Q)이 선택되어 필요로 되는 압축율(R)로 설정된 레벨보다 아래로 데이터량(A)을 감소시킨다.
제 4 단계(44)에서, 장치는 데이터량(A)의 부가적인 감소가 왜곡(D)을 증가시킴이 없이 가능한지 여부를 검사한다. 즉, 이 장치는 개개 블록들에 대한 왜곡(D)이 왜곡(D)을 국부적으로 감소시키는 곡선(32)에 대응하는지를 검사한다. 만일 그렇다면, 이 장치는 양자화 스케일 값(Qn)(제 3 단계(43)에서 블록에 대하여 선택된다)을 왜곡을 증가시키지 않는 보다 높은 양자화 스케일 값(Qn')로 대체한다.
제 4 단계(44)에서, 어떤 방법은 이와 같은 보다 높은 양자화 스케일 값들(Qn')이 존재하는지 여부를 검사하는데 사용될 수 있다. 일 실시예에서, 왜곡(D')은 모든 보다 높은 양자화 스케일 값들(Qn')를 위하여 계산되고, 왜곡(D')이 원래 선택된 양자화 스케일 값(Qn)에 대한 왜곡(D)보다 실질적으로 높지 않다면 최저 계산된 왜곡(D')으로 유도되는 최고 양자화되는 스케일 값(Qn')이 선택된다.
또 다른 실시예에서, 블록에서 대다수 또는 전체 양자화된 신호 값들이 1 보다 큰 최대 공약수(G)를 공유하는지가 우선 결정된다. 만일 그렇다면, 양자화 스케일 값 Qn'= G*Qn은 새로운 양자화 스케일 값(Qn')으로서 사용될 수 있다. 모든 신호 값들이 공약수(G)를 공유할 때, 이는 Qn이 G*Qn으로 대체된 경우 부가적인 왜곡이 발생되지 않는다는 점을 토대로 한다. 부가 실시예에서, 왜곡(D')은 양자화 스케일 값 G*Qn 및 D'가 증가할 때까지 G*Qn으로부터 증가하는 거리에서 이 값 G*Qn을 포함하는 양자화 스케일 값들을 위하여 계산된다. 이 경우에, 이에 따라서 최소 왜곡이 발견되는 양자화 스케일 값(Qn')이 바람직하게 사용된다.
최대 공약수(G) 대신에, 최대 공약수인지 검사함이 없이, 양자화된 값들의 공약수(G')를 결정하여 사용할 수 있다(이는 반드시 최대 공약수의 적어도 제수이다). 실제 어떤 환경들 하에선, 최대 공약수를 결정하지 않고도 단지 어떤 공약수를 결정하기 위한 계산적인 수고를 감소시킬 수 있다.
제 5 단계(45)에서, 새로운 양자화 스케일 값(Qn')이 발견되지 않는 블록들에 대한 변경되지 않은 양자화 스케일 값들(Qn)과 함께 이 방식으로 발견된 양자화 스케일 값들(Qn')은 양자화기(12)로 출력되어 최종 인코딩된 화상 데이터를 계산한다.
본 발명이 MPEG 인코딩에 대해서 주로 설명되었지만, 이는 MPEG 인코딩으로 제한되지 않는다는 것을 인지할 것이다. 예를 들어, 전기통신 네트워크들을 통해서 화상을 전송하는데 사용되는 바와 같은 양자화를 사용하여 화상 데이터 블록들을 인코딩하는 다른 형태들의 화상 인코딩에 적용될 수 있다.
본 발명은 도 4의 순서도의 제 4 단계를 위한 입력으로서 인코딩되고 압축된화상 데이터를 사용하는 트랜스코딩에 또한 적용될 수 있다. 이 경우에, 원래의 왜곡되지 않은 화상 데이터는 이용될 수 없다. 이 장치는 블록에 대한 인코딩된 신호 값들(S)의 양자화 스케일 값들(Qn)을 대체할 수 있는 보다 높은 양자화 스케일 값들(Qn')이 존재하는지를 검사하여, 양자화된 신호 값들(S)의 변화가 실질적으로 블록에서 발생되지 않도록 한다. 이와 같은 보다 높은 양자화 스케일 값들(Qn')에 대한 한 가지 검사 방법은 모든 또는 실질적으로 모든 양자화된 신호 값들(S)이 최대 공약수(G)를 공유하는지를 테스트하는 것이다. 만일 그렇다면, 보다 높은 양자화 스케일 값 Qn'= G*Qn은 왜곡에 영향을 미침이 없이 사용될 수 있다.
본 발명이 양자화 스케일 제어기(19)와 같은 전용 하드웨어로 구현될 수 있지만, 본 발명은 또한, 컴퓨터 시스템 상에서 실행될 때 본 발명을 따른 방법의 단계들을 수행하거나 범용 컴퓨터 시스템이 본 발명을 따른 컴퓨터 시스템의 기능들을 수행하도록 하는 명령들을 적어도 포함하는, 컴퓨터 시스템 상에서 실행되는 컴퓨터 프로그램을 사용하여 구현될 수 있다는 것을 인지할 것이다. 이와 같은 컴퓨터 프로그램은 컴퓨터 시스템의 메모리에 로딩될 수 있는 데이터가 저장되는 CD-ROM 또는 디스켓과 같은 데이터 캐리어 상에 제공될 수 있는데, 이 데이터는 컴퓨터 프로그램을 표시한다. 데이터 캐리어는 또한, 본 발명을 따른 컴퓨터 프로그램을 표시하는 무선 접속 전송 신호들 또는 전화 케이블과 같은 데이터 접속일 수 있다.

Claims (9)

  1. 화상 데이터의 블록들로 분할되는 압축된 비디오 데이터 스트림을 생성하는 방법으로서,
    - 제 1 양자화 스케일들(Q)이 미리 결정된 압축율을 실현할 정도로 충분히 크도록, 상기 블록들 중 각 블록들에 대한 상기 제 1 양자화 스케일들(Q)을 결정하는 단계와,
    - 상기 블록들 중 적어도 하나의 블록에 대해, 상기 블록들 중 적어도 하나의 블록에 대해 상기 제 1 양자화 스케일(Q) 보다 크고, 상기 블록들 중 적어도 하나의 블록에 대해 상기 제 1 양자화 스케일(Q)로 실현되는 왜곡 보다 작거나 실질적으로 동일한 상기 블록들 중 적어도 하나의 블록의 왜곡을 가져오는 제 2 양자화 스케일(Q')이 존재하는지 여부를 결정하는 단계와,
    - 상기 제 2 양자화 스케일(Q')이 존재할 때, 상기 블록들 중 적어도 하나의 블록에 대한 상기 제 2 양자화 스케일(Q')을 사용하여 디지털 데이터 스트림을 인코딩하는 단계를 포함하는, 압축된 비디오 데이터 스트림 생성 방법.
  2. 제 1 항에 있어서,
    - 상기 블록들 중 적어도 하나의 블록에 대한 양자화된 계수들을 계산하는 단계와,
    - 적어도 대다수의 상기 양자화된 계수들의 공약수를 계산하는 단계와,
    - 상기 제 2 양자화 스케일을 결정하기 위하여 상기 블록들 중 적어도 하나의 블록에 대한 상기 제 1 양자화 스케일과 최대 공약수의 곱을 사용하는 단계를 포함하는, 압축된 비디오 데이터 스트림 생성 방법.
  3. 제 1 항에 있어서,
    상기 공약수를 계산하는 단계는 상기 적어도 대다수의 양자화된 계수들의 최대 공약수를 포함하는, 압축된 비디오 데이터 스트림 생성 방법.
  4. 제 1 항에 있어서,
    - 상기 제 1 양자화 스케일들을 사용하여 상기 블록들을 인코딩하는 입력 비디오 데이터 스트림을 수신하는 단계와,
    - 상기 제 2 양자화 스케일(Q)을 사용하여, 상기 입력 비디오 데이터 스트림으로부터 얻어진 재양자화된 화상 데이터로 상기 인코딩된 비디오 데이터 스트림을 생성시키는 단계를 포함하는, 압축된 비디오 데이터 스트림 생성 방법.
  5. 화상 데이터의 블록들로 분할되는 압축된 비디오 데이터 스트림을 생성하는 장치로서,
    - 양자화 스케일(Q)로 신호 값들을 양자화하는 양자화기와,
    - 필요한 압축율에 따라서 상기 양자화 스케일(Q)를 제어하는 양자화기에 결합되며, 다음의 일련의 단계들에서 상기 양자화 스케일을 결정하는 양자화 스케일제어기를 포함하며, 상기 일련의 단계들은,
    - 제 1 양자화 스케일들(Q)이 상기 압축율을 실현할 정도로 충분히 크도록, 상기 블록들 중 각 블록들에 대해 상기 제 1 양자화 스케일들(Q)을 결정하는 제 1 단계와,
    - 상기 블록들 중 적어도 하나의 블록에 대해, 상기 블록들 중 적어도 하나의 블록에 대해 상기 제 1 양자화 스케일(Q) 보다 크고, 상기 블록들 중 적어도 하나의 블록에 대해 상기 제 1 양자화 스케일(Q)로 실현되는 왜곡보다 작거나 실질적으로 동일한 상기 블록들 중 적어도 하나의 블록의 왜곡을 가져오는 제 2 양자화 스케일(Q')이 존재하는지 여부를 결정하는 제 2 단계를 포함하는, 압축된 비디오 데이터 스트림 생성 장치.
  6. 제 5 항에 있어서,
    상기 제 2 단계는,
    - 상기 블록에 대해 상기 제 1 양자화 스케일(Q)를 사용하여 계산된 적어도 대다수의 양자화된 신호값들의 공약수를 계산하는 단계와,
    - 상기 제 2 양자화 스케일을 결정하기 위하여 상기 블록들 중 적어도 하나의 블록에 대한 상기 제 1 양자화 스케일과 최대 공약수의 곱을 사용하는 단계를 포함하는, 압축된 비디오 데이터 스트림 생성 장치.
  7. 제 5 항에 있어서,
    상기 공약수의 계산은 상기 적어도 대다수의 양자화된 신호 값들의 최대 공약수를 포함하는, 압축된 비디오 데이터 스트림 생성 장치.
  8. 제 5 항에 있어서,
    상기 제 1 단계는 압축된 입력 비디오 데이터 스트림으로부터 상기 제 1 양자화 스케일들(Q)을 추출함으로써 수행되며, 인코딩된 비디오 비디오 데이터 스트림은 상기 제 2 양자화 스케일(Q)를 사용하여 상기 입력 비디오 데이터 스트림으로부터 얻어진 재양자화된 화상 데이터로 생성되는, 압축된 비디오 데이터 스트림 생성 장치.
  9. 제 1 항 내지 제 4 항 중 어느 한 항에 청구된 바와 같은 방법의 단계들을 수행하기 위한 명령들을 포함하는 컴퓨터 프로그램 제품.
KR10-2004-7015366A 2002-03-28 2003-03-27 양자화기 스케일 선택을 사용한 화상 코딩 KR20040093485A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02076263.9 2002-03-28
EP02076263 2002-03-28
PCT/IB2003/001246 WO2003084240A1 (en) 2002-03-28 2003-03-27 Image coding using quantizer scale selection

Publications (1)

Publication Number Publication Date
KR20040093485A true KR20040093485A (ko) 2004-11-05

Family

ID=28459535

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7015366A KR20040093485A (ko) 2002-03-28 2003-03-27 양자화기 스케일 선택을 사용한 화상 코딩

Country Status (7)

Country Link
US (1) US20050175088A1 (ko)
EP (1) EP1493282A1 (ko)
JP (1) JP2005522118A (ko)
KR (1) KR20040093485A (ko)
CN (1) CN1643935A (ko)
AU (1) AU2003215850A1 (ko)
WO (1) WO2003084240A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2889381A1 (fr) * 2005-07-28 2007-02-02 Thomson Licensing Sas Procede et dispositif de determination de parametres de quantification dans une image
CN111726639B (zh) * 2016-11-18 2023-05-30 上海兆芯集成电路有限公司 纹理砖压缩及解压缩方法以及使用该方法的装置
CN114630120B (zh) * 2020-12-14 2024-03-29 瑞昱半导体股份有限公司 基于自适应压缩率的视频压缩方法与电路系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100207638B1 (ko) * 1995-05-29 1999-07-15 윤종용 가변비트율 비디오 부호화방법

Also Published As

Publication number Publication date
WO2003084240A1 (en) 2003-10-09
AU2003215850A1 (en) 2003-10-13
JP2005522118A (ja) 2005-07-21
CN1643935A (zh) 2005-07-20
US20050175088A1 (en) 2005-08-11
EP1493282A1 (en) 2005-01-05

Similar Documents

Publication Publication Date Title
US8509556B2 (en) Image coding apparatus and image coding method to generate a targeted amount of code
CN1078428C (zh) 图象编码方法及装置
US8270744B2 (en) Image processing apparatus and image processing method
KR100610520B1 (ko) 비디오 데이터 부호화 장치, 비디오 데이터 부호화 방법, 비디오데이터 전송 장치 및 비디오 데이터 기록 매체
EP1445958A1 (en) Quantization method and system, for instance for video MPEG applications, and computer program product therefor
US5986710A (en) Image encoding method and apparatus for controlling the number of bits generated using quantization activities
AU697802B2 (en) Device and method for coding video pictures
KR20000023174A (ko) 엔코딩 장치 및 방법
JP2003037843A (ja) 画像処理装置および方法、記録媒体、並びにプログラム
EP1506678A2 (en) Mpeg transcoding system and method using motion information
JP2003032677A (ja) 動画像圧縮符号化装置
US7451080B2 (en) Controlling apparatus and method for bit rate
US7714751B2 (en) Transcoder controlling generated codes of an output stream to a target bit rate
KR20060103424A (ko) 이중 패스 인코딩의 비트 예산 조정의 선택을 위한 방법 및장치
KR20040093481A (ko) 양자화기 스케일의 제한된 변동들을 가진 비디오 부호화
KR20040093485A (ko) 양자화기 스케일 선택을 사용한 화상 코딩
CN100486335C (zh) 比特率自动调整装置
US6657576B2 (en) Quantization unit setting apparatus, quantization unit setting method, coding apparatus, coding method, and information record medium
CA2312138C (en) System and method for inserting information in dct coefficient domain
EP0784407B1 (en) Transform coefficient select method and apparatus for transform coding system
JPH11341520A (ja) ステレオ動画像用符号化装置
KR100220677B1 (ko) 대역 분할 부호화 시스템의 버퍼 제어 장치
KR100335436B1 (ko) 양자화 스텝 사이즈 결정 방법_
JP3014547B2 (ja) 動画像符号化装置
JPH104546A (ja) 画像データ圧縮装置およびその方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid