KR20120083368A - 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치 - Google Patents

비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치 Download PDF

Info

Publication number
KR20120083368A
KR20120083368A KR1020127008303A KR20127008303A KR20120083368A KR 20120083368 A KR20120083368 A KR 20120083368A KR 1020127008303 A KR1020127008303 A KR 1020127008303A KR 20127008303 A KR20127008303 A KR 20127008303A KR 20120083368 A KR20120083368 A KR 20120083368A
Authority
KR
South Korea
Prior art keywords
block
quantization
picture
quantization parameter
reconstructed data
Prior art date
Application number
KR1020127008303A
Other languages
English (en)
Other versions
KR101873356B1 (ko
Inventor
샤오안 루
호엘 솔레
펭 인
키안 수
윤페이 젱
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20120083368A publication Critical patent/KR20120083368A/ko
Application granted granted Critical
Publication of KR101873356B1 publication Critical patent/KR101873356B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치가 제공된다. 장치는 화상에서 적어도 하나의 블록에 대한 화상 데이터를 인코딩하기 위한 인코더(300)를 포함한다. 원래 버전의 블록과 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득된 하나 이상의 변환 계수에 적용된 양자화 파라미터는 적어도 하나의 블록에 대응하는 재구성된 데이터로부터 도출된다.

Description

비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치{METHODS AND APPARATUS FOR EMBEDDED QUANTIZATION PARAMETER ADJUSTMENT IN VIDEO ENCODING AND DECODING}
본 출원은 2009년 10월 5일에 출원된 미국 가특허출원 제61/248,541호(출원인 관리 번호 PU090143호)에 대한 권리를 주장하고, 상기 출원은 본 명세서에서 그 전체가 참조로 통합된다.
본 발명의 원리는 일반적으로 비디오 인코딩 및 디코딩에 관한 것이고, 더 구체적으로, 비디오 인코딩 및 디코딩에서 삽입된(embeded) 양자화 파라미터 조정을 위한 방법 및 장치에 관한 것이다.
대부분의 비디오 애플리케이션은 주어진 세트의 비트 속도 제약에 대해 가능한 가장 높은 지각 품질을 추구한다. 예를 들어, 비디오폰(videophone) 시스템과 같은 낮은 비트 속도의 애플리케이션에서, 비디오 인코더는 시각적으로 더 중요한 관심 영역에서 강한 시각적 아티팩트를 제거함으로써, 더 높은 품질을 제공할 수 있다. 다른 한편으로, 높은 비트 속도의 애플리케이션에서, 시각적으로 손실이 없는 품질이 화상의 어느 곳에나 예상되고, 비디오 인코더는 투명한 시각적 품질을 또한 달성해야 한다. 높은 비트 속도의 애플리케이션에서 투명한 시각적 품질을 획득하는데 있어서 하나의 목표는 특히, 세목의 손실이 사람의 시각 시스템의 텍스처 마스킹(texture masking) 특성에 기인하여 매끄럽지 않은 영역보다 더 잘 보이는, 특히 매끄러운 영역에서 세목을 보호하는 것이다.
비트 속도의 증가는 품질을 개선시키기 위한 가장 간단한 접근법 중 하나이다. 비트 속도가 주어질 때, 인코더는, 가장 시각적인 품질 개선이 획득될 수 있는 이용가능한 비트를 소비하도록, 비트 할당 모듈을 조작한다. DVD 저작(authoring)과 같은 비-실시간 애플리케이션에서, 비디오 인코더는 어려운 및 쉬운 비디오 콘텐츠 모두에 대해, 시간에 걸쳐 일정한 품질을 갖는 비디오를 생성하기 위해 가변 비트 속도(VBR) 설계를 용이하게 할 수 있다. 이러한 애플리케이션에서, 이용가능한 비트는 일정한 품질을 획득하기 위해, 다른 비디오 세그먼트를 통해 적합하게 분배된다. 그에 반해, 일정한 비트 속도(CBR) 시스템은 인코딩의 어려움에도 불구하고, 하나 이상의 화상의 간격에 동일한 수의 비트를 할당하고, 비디오 콘텐츠에 따라 변하는 비디오 품질을 생성한다. VBR 및 CBR 인코딩 시스템 모두에 대해, 인코더는 화상 내에서 지각 모델에 따라 비트를 할당할 수 있다. 사람의 지각의 하나의 특징은 텍스처 마스킹이고, 이는 사람의 눈이 왜 텍스처링된 영역보다 매끄러운 영역에서 품질의 손실에 더 민감한지를 설명한다. 이러한 특성은 높은 시각적 품질을 획득하기 위해, 매끄러운 영역에 할당되는 비트의 개수를 증가시키는데 활용될 수 있다.
비디오 인코더에서의 양자화 처리는 인코딩된 비트의 개수와 품질을 제어한다. 양자화 파라미터(QP)를 조정함으로써 품질을 조정하는 것이 일반적이다. 양자화 파라미터는 양자화 스텝 크기, 라운딩 오프셋(rounding offset) 및 스케일링 매트릭스를 포함할 수 있다. 종래의 기술 및 기존의 표준에서, 양자화 파라미터 값은 비트스트림으로 명백히 전송된다. 인코더는 양자화 파라미터를 조절시키고, 양자화 파리미터를 디코더에 신호 발신하는 유연성을 갖는다. 하지만, 양자화 파라미터의 신호 발신은 단점으로, 과도한 비용을 초래한다.
지각적 품질을 개선시키는데 있어서 하나의 중요한 양상은 필름 그레인(grain) 및 컴퓨터에 의해 생성된 잡음과 같은 미세한 세목을 보호하는 것이다. 이는 미세한 세목의 손실이 매우 눈에 띄는 매끄러운 영역에 대해 특히 중요하다. 기존의 알고리즘에서의 공통 접근법은 미세한 양자화 스텝 크기에서 이들 매끄러운 영역, 또는 매끄러운 영역을 포함하는 비디오 세그먼트를 인코딩하는 것이다. 다수의 표준에 걸쳐 현재 기술에 대해 공통적이지만, 다음의 서술에서, 화상 내의 매끄러운 영역에 대해 높은 품질이 어떻게 획득되는 지를 설명하기 위해, ISO/IEC(International Organization for Standardization/International Electrotechnical Commission) MPEG-2(Moving Picture Experts Group-2) 표준 참조 소프트웨어 테스트 모델, 버전 5(이후에 "TM5"로 언급되는")를 사용한다.
TM5에서, 다음과 같이, 원래의 픽셀 값을 사용하여, 4개의 8x8 휘도 프레임으로 구성된 서브 블록(n=1,...,4) 및 4개의 휘도 필드로 구성된 서브 블록(n=5,..., 8)로부터 매크로블록(MB)(j)에 대해 공간 활성 측정이 계산된다:
Figure pct00001
여기서,
Figure pct00002
Figure pct00003
여기서, Pn k는 n번째의 원래의 8x8 블록에서 샘플 값을 나타낸다. 그러면, actj는 다음과 같이 정규화된다:
Figure pct00004
여기서, avg_act는 이전에 인코딩된 화상의 actj의 평균값이다. 제 1 화상에서, avg_act는 400으로 설정된다. 그런 후에, TM5는 다음과 같이 mquantj를 획득한다:
Figure pct00005
여기서, Qj는 기준 양자화 파리미터이다. mquantj의 최종 값은 범위[1 ... 31]로 제한되고(clipped), 인코딩 동안 양자화 스텝을 가리키기 위해 사용된다.
그러므로, TM5 양자화 방식에서, 작은 분산을 갖는 매끄러운 매크로블록은 작은 값의 공간 활성 측정 값(actj) 및 작은 값의 N_actj 뿐만 아니라, mquantj로 인덱싱된 미세한 양자화 스텝 크기를 갖는다. 매끄러운 매크로블록에 대한 미세한 양자화를 통해, 미세한 세목이 보호될 수 있고, 높은 지각 품질이 획득된다. 인덱스(mquantj)는 비트스트림으로 디코더에 전송된다.
ISO/IEC(International Organization for Standardization/International Electrotechnical Commission) MPEG-4(Moving Picture Experts Group-4) Part 10 AVC(Advanced Video Coding) 표준/ITU-T(International Telecommunication Union, Telecommunication Sector) H.264 권고(이하에 "MPEG-4 AVC 표준")에서의 구문은 또한, 양자화 파라미터가 각 화상 및 매크로블록에 대해 다른 것을 허용한다. 양자화 파라미터의 값은 정수이고, 0 내지 51의 범위 내에 있다. 각 슬라이스에 대한 초기 값은 구문 요소(pin_init_qp_minus26)로부터 도출될 수 있다. 초기 값은 slice_qp_delta의 0이 아닌 값이 디코딩될 때, 슬라이스 계층에서 수정되고, mb_qp_delte의 0이 아닌 값이 매크로블록 계층에서 디코딩될 때, 더 수정된다.
수학적으로, 슬라이스에 대한 초기 양자화 파라미터는 다음과 같이 계산된다:
Figure pct00006
매크로블록 계층에서, 양자화 파라미터의 값은 다음과 같이 도출될 수 있다:
Figure pct00007
여기서, QPY , PREV는 현재 슬라이스의 디코딩 순서에서 이전의 매크로블록의 양자화 파라미터이다.
도 1로 넘어가면, 비디오 인코더에서 지각적 품질을 개선시키기 위한 전형적인 양자화 조정 방법은 일반적으로 참조 번호(100)로 나타난다. 방법(100)은 제어를 기능 블록(110)에 전달하는 시작 블록(105)을 포함한다. 기능 블록(110)은 입력 비디오 콘텐츠를 분석하고, 제어를 루프 제한 블록(115)에 전달한다. 루프 제한 블록(115)은 매크로블록의 1 내지 #의 범위를 갖는 변수(i)를 사용하여 화상에서 각 매크로블록에 대한 루프를 시작하고, 제어를 기능 블록(120)에 전달한다. 기능 블록(120)은 현재 매크로블록(i)에 대한 양자화 파라미터를 조정하고, 제어를 기능 블록(125)에 전달한다. 기능 블록(125)은 양자화 파라미터 및 매크로블록(i)을 인코딩하고, 제어를 루프 제한 블록(130)에 전달한다. 루프 제한 블록(130)은 각 매크로 블록에 대한 루프를 종료시키고, 제어를 종류 블록(199)에 전달한다. 그러므로, 방법(100)에서, 양자화 파라미터 조정은 명백히 신호 발신된다. 기능 블록(120)에 대해, 매크로블록(i)에 대한 양자화 파라미터는 콘텐츠 및/또는 이전의 인코딩 결과를 기초로 조정된다. 예를 들어, 매끄러운 매크로블록은 지각 품질을 개선시키기 위해 양자화 파라미터를 낮출 것이다. 다른 예시에서, 이전의 매크로블록이 할당된 비트보다 많은 비트를 사용한다면, 현재 매크로블록은 원래 할당된 것보다 적은 비트를 소비하기 위해 양자화 파라미터를 증가시킬 것이다. 방법(100)은 화상에서의 모든 매크로블록이 인코딩된 후에 종료한다.
도 2로 넘어가면, 비디오 디코더에서 양자화 파라미터 및 매크로블록을 디코딩하기 위한 전형적인 방법은 일반적으로 참조 번호(200)로 나타난다. 방법(200)은 제어를 루프 제한 블록(210)에 전달하는 시작 블록(205)을 포함한다. 루프 제한 블록(210)은 매크로블록(MB)의 1 내지 #의 범위를 갖는 변수(i)를 사용하여 화상에서 각 매크로블록에 대해 루프를 시작하고, 제어를 기능 블록(215)에 전달한다. 기능 블록(215)은 양자화 파라미터 및 현재 매크로블록(i)을 디코딩하고, 제어를 루프 제한 블록(220)에 전달한다. 루프 제한 블록(220)은 각 매크로블록에 대한 루프를 종료하고, 제어를 종료 블록(299)에 전달한다.
이전에 서술된 요약에서, 기존의 표준은 높은 지각 품질을 달성하기 위해 인코더에서 화상 레벨 및 매크로블록-레벨 양자화 파라미터를 조정하는 것을 지원한다. 양자화 파라미터 값은 절대적으로 또는 상이하게 인코딩되고, 따라서 비트스트림으로 명백히 전송된다. 인코더는 양자화 파라미터를 조절시키고, 디코더에 양자화 파라미터를 신호 발신하기 위한 유연성을 갖는다. 하지만, 명백한 양자화 파라미터의 신호 발신은 단점으로, 과도한 비용을 초래한다.
종래 기술의 이들 및 다른 결점 및 단점은, 비디오 코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치에 대한 본 발명의 원리에 의해 다루어진다.
본 발명의 원리의 일 양상에 따라, 장치가 제공된다. 장치는 화상에서 적어도 하나의 블록에 대한 화상 데이터를 인코딩하기 위한 인코더를 포함한다. 원래의 버전의 블록과, 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득되는 하나 이상의 변환 계수에 적용되는 양자화 파라미터는 적어도 하나의 블록에 대응하는 재구성된 데이터로부터 도출된다.
본 발명의 원리의 다른 양상에 따라, 비디오 인코더에서의 방법이 제공된다. 방법은 화상에서 적어도 하나의 블록에 대한 화상 데이터를 인코딩하는 단계를 포함한다. 원래 버전의 블록과, 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득되는 하나 이상의 변환 계수에 적용되는 양자화 파라미터는 적어도 하나의 블록에 대응하는 재구성된 데이터로부터 도출된다.
본 발명의 원리의 또 다른 양상에 따라, 장치가 제공된다. 장치는 화상에서 적어도 하나의 블록에 대한 화상 데이터를 디코딩하기 위한 디코더를 포함한다. 원래의 버전의 블록과, 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득되는 하나 이상의 변환 계수에 적용되는 양자화 파라미터는 적어도 하나의 블록에 대응하는 재구성된 데이터로부터 도출된다.
본 발명의 원리의 또 다른 양상에 따라, 비디오 디코더에서의 방법이 제공된다. 방법은 화상에서 적어도 하나의 블록에 대한 화상 데이터를 디코딩하는 단계를 포함한다. 원래 버전의 블록과, 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득되는 하나 이상의 변환 계수에 적용되는 양자화 파라미터는 적어도 하나의 블록에 대응하는 재구성된 데이터로부터 도출된다.
첨부 도면에 관련하여 읽혀질 예시적인 실시예의 다음의 상세한 서술로부터 본 발명의 원리의 이들 및 다른 양상, 특징 및 장점이 명백해질 것이다.
본 발명의 원리는 다음의 예시적인 도면에 따라 더 잘 이해될 것이다.
본 발명은 비디오 코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치를 제공하여, 종래의 신호 발신이 과도한 비용을 초래한다는 단점을 극복한다.
도 1은 종래 기술에 따라 비디오 인코더에서 지각 품질을 개선시키기 위한 전형적인 양자화 조정 방법을 도시하는 흐름도.
도 2는 종래 기술에 따라 비디오 디코더에서 양자화 파라미터 및 매크로블록을 디코딩하기 위한 전형적인 방법을 도시하는 흐름도.
도 3은 본 발명의 원리의 일 실시예에 따라 본 발명의 원리가 적용될 수 있는 예시적인 비디오 인코더를 도시하는 블록도.
도 4는 본 발명의 원리의 일 실시예에 따라, 본 발명의 원리가 적용될 수 있는 예시적인 비디오 디코더를 도시하는 블록도.
도 5는 본 발명의 원리의 일 실시예에 따라, 양자화 파라미터 맵을 비트스트림으로 삽입하는 예시적인 방법을 도시하는 흐름도.
도 6은 본 발명의 원리의 일 실시예에 따라, 삽입된 양자화 파라미터 맵을 디코딩하기 위한 예시적인 방법을 도시하는 흐름도.
도 7은 본 발명의 원리의 일 실시예에 따라, 삽입된 양자화 파라미터 맵의 사용과 함께 명백한 양자화 파라미터 조정을 인코딩하기 위한 예시적인 방법을 도시하는 흐름도.
도 8은 본 발명의 원리의 일 실시예에 따라, 삽입된 양자화 파라미터 맵의 사용과 함께, 명백한 양자화 파라미터 조정을 디코딩하기 위한 예시적인 방법을 도시하는 흐름도.
도 9는 본 발명의 원리의 일 실시예에 따라, 비디오 인코더에서 양자화 파라미터를 할당하기 위한 예시적인 방법을 도시하는 흐름도.
도 10은 본 발명의 원리의 일 실시예에 따라, 비디오 디코더에서, 양자화 파라미터를 계산하기 위한 예시적인 방법을 도시하는 흐름도.
도 11은 본 발명의 원리의 일 실시예에 따라, 비디오 인코더에서 양자화 파라미터를 할당하기 위한 예시적인 방법을 도시하는 흐름도.
도 12는 본 발명의 원리의 일 실시예에 따라, 비디오 디코더에서 양자화 파라미터를 계산하기 위한 예시적인 방법을 도시하는 흐름도.
본 발명의 원리는 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치에 관한 것이다.
본 서술은 본 발명의 원리를 설명한다. 따라서, 당업자라면, 본 명세서에서 명백하게 서술되거나 또는 도시되지 않더라도, 본 발명의 원리를 구현하고, 본 발명의 사상 및 범주 내에 포함되는 다양한 장치를 안출할 수 있음이 인식될 것이다.
본 명세서에서 언급되는 모든 예시 및 조건부 언어는 교육적인 목적으로, 독자에게 본 발명의 원리와, 발명자(들)에 의해 기술을 진전시키는데 기여된 개념의 이해를 도우려는 것이고, 이러한 명백하게 언급된 예시 및 조건에 대해 제한 없이 해석되어야 한다.
게다가, 본 발명의 원리의 특정 예시뿐만이 아니라, 명세서에서 본 발명의 원리, 양상 및 본 발명의 원리의 실시예를 언급하는 모든 설명은 이들의 구조적이고 기능적인 등가물을 포함하도록 의도된다. 추가로, 이러한 등가물은 현재 알려진 등가물뿐 아니라 미래에 개발될 등가물, 즉, 구조에 관계없이 동일한 기능을 수행하도록 개발된 임의의 요소 모두를, 포함하는 것으로 의도된다.
따라서, 예를 들어, 당업자라면 본 명세서에 제시된 블록도가 본 발명의 원리를 구현하는 예시적인 회로의 개념적인 도면을 나타낸다는 것이 인식될 것이다. 마찬가지로, 임의의 순서도, 흐름도, 상태천이도, 의사코드 등은 컴퓨터 또는 처리기가 명백히 도시되었는지에 관계없이, 컴퓨터 판독가능 매체에 실질적으로 제공될 수 있어서, 컴퓨터 또는 처리기에 의해 실행될 수 있는 다양한 처리를 나타낸다는 것이 인식될 것이다.
도면에 도시된 다양한 요소의 기능은 적합한 소프트웨어에 관련된 소프트웨어를 실행할 수 있는 하드웨어뿐만이 아니라, 전용 하드웨어의 사용을 통해 제공될 수 있다. 처리기에 의해 기능이 제공될 때, 이 기능은 단일 전용의 처리기에 의해, 단일 공유 처리기에 의해, 또는 일부가 공유될 수 있는 복수의 개별적인 처리기에 의해 제공될 수 있다. 더욱이, 용어 "처리기" 또는 "제어기"의 명시적 사용은 소프트웨어를 실행할 수 있는 하드웨어를 배타적으로 참조하는 것으로 해석이 되지 않아야 하고, 제한 없이, 디지털 신호 처리("DSP") 하드웨어, 소프트웨어를 저장하기 위한 읽기 전용 메모리("ROM"), 랜덤 액세스 메모리("RAM"), 및 비-휘발성 저장 장치를 암묵적으로 포함할 수 있다.
다른 종래의 및/또는 맞춤형(custom) 하드웨어 또한 포함될 수 있다. 마찬가지로, 도면에 도시된 임의의 스위치는 오직 개념적이다. 이들의 기능은 프로그램 로직(logic)의 동작을 통해, 전용 로직을 통해, 프로그램 제어 및 전용 로직의 상호작용을 통해, 또는 심지어 수동으로 수행될 수 있는데, 이러한 특정 기술은 이러한 배경으로부터 더 명확히 이해될 때, 구현자에 의해 선택될 수 있다.
본 명세서의 청구항에서, 특정 기능을 수행하기 위한 수단으로 표현된 임의의 요소는 이 기능을 수행하는 임의의 방식을 포함하도록 의도되는데, 이 기능은 예를 들어, a) 이 기능을 수행하는 회로 요소의 조합, 또는 b) 임의의 형식의, 그러므로, 기능을 수행하기 위해 이 소프트웨어를 실행하는데 적합한 회로와 결합 된 펌웨어(firmware), 마이크로코드 등을 포함하는 소프트웨어를 포함한다. 이러한 청구항에 의해 한정된 본 발명의 원리는 다양하게 언급된 수단에 의해 제공된 기능이, 청구항이 요구하는 방식으로 결합되어, 함께 초래된다는 사실에 존재한다. 따라서, 이들 기능을 제공할 수 있는 임의의 수단이 본 명세서에 나타난 수단과 대등하다고 여겨진다.
명세서에서 본 발명의 원리의 "하나의 실시예" 또는 "일 실시예" 뿐 아니라 이들의 다른 변형에 대한 언급은 실시예와 연관되어 서술된 특정 특징, 구조, 특성 등이 본 발명의 원리의 적어도 하나의 실시예에 포함된다는 것을 의미한다. 따라서, 명세서를 통해 다양한 부분에 출현하는 "하나의 실시예에서" 또는 "일 실시예에서" 라는 구문뿐만이 아니라 다른 변형은 모두 동일한 실시예를 반드시 참조하는 것은 아니다.
다음의 "/", "및/또는", 및 "중 적어도 하나의"의 임의의 사용은, 예를 들어, "A/B", "A 및/또는 B" 및 "A 및 B 중 적어도 하나"의 경우에, 첫 번째로 열거된 옵션(A)만의 선택을, 또는 두 번째로 열거된 옵션만(B)의 선택을, 또는 이 2가지 옵션 모두(A 및 B)의 선택을 포함하는 것으로 의도된다. 추가의 예시로서, "A, B 및/또는 C" 및 "A,B 및 C 중 적어도 하나의"의 경우에서, 이러한 어법은 첫 번째로 열거된 옵션(A)만의 선택을, 또는 두 번째로 열거된 옵션(B)만의 선택을, 또는 세 번째로 열거된 옵션(C)만의 선택을, 또는 첫 번째 및 두 번째로 열거된 옵션(A 및 B)만의 선택을, 또는 첫 번째 및 세 번째로 열거된 옵션(A 및 C)만의 선택을, 또는 두 번째 및 세 번째로 열거된 옵션(B 및 C)만의 선택을, 또는 모든 3가지 옵션(A 및 B 및 C)의 선택을 포함하는 것으로 의도된다. 이는 당업자에게 있어서 자명한 바와 같이, 열거된 다수의 항목으로 확장될 수 있다.
또한, 본 명세서에서 사용된, 단어 "화상" 및 "이미지"는 교환할 수 있게 사용되고, 스틸 이미지 또는 비디오 시퀀스로부터의 화상을 언급한다. 알려진 바와 같이, 화상은 프레임 또는 필드일 수 있다.
게다가, 본 명세서에서 사용되는, 단어 "신호"는 대응하는 디코더로 보내는 어떤 것을 언급한다. 예를 들어, 인코더는 삽입된 양자화 파라미터 맵에서 하나 이상의 양자화 파라미터를 신호 발신할 수 있는데, 이는 디코더로 하여금, 특정 하나 이상의 파라미터 중 인코더 측에서 어느 파라미터가 사용되었는지를 인지하게 한다. 이러한 방식에서, 동일한 양자화 파라미터는 인코더 측 및 디코더 측 모두에서 사용될 수 있다. 따라서, 예를 들어, 인코더가 디코더에 전송된 비트스트림에 양자화 파라미터 맵을 삽입하여, 디코더는 인코더와 동일한 양자화 파라미터(맵으로 규정되는)를 사용할 수 있게 된다. 신호 발신이 다양한 방식으로 달성될 수 있다는 것이 인식될 것이다. 예를 들어, 대응하는 디코더에 정보를 신호 발신하기 위해 하나 이상의 구문 요소, 플래그(flag) 등이 사용될 수 있다.
게다가, 본 명세서에 서술된 양자화 파라미터 조정 처리가 설명의 목적으로 매크로블록에 대해 주로 서술되고, 본 발명의 원리의 양자화 파라미터 조정 처리가 서브-매크로블록, 매크로블록, 매크로블록의 그룹, 임의의 다른 코딩 유닛 중 임의의 하나에 적용될 수 있다는 것이 인식되어야 한다. 따라서, 명세서에서 사용되는, 단어 "블록"은 매크로블록 또는 서브-매크로블록을 언급할 수 있다. 게다가, 양자화 파라미터가 이에 제한되지 않는, 루마(luma) 및/또는 크로마(chroma) 성분을 포함하는 다양한 기준을 기초로 조정될 수 있다.
도 3으로 넘어가면, 본 발명의 원리가 적용될 수 있는 예시적인 비디오 인코더는 일반적으로 참조 번호(300)로 나타난다. 비디오 인코더(300)는 결합기(385)의 비반전 입력과 연결된 출력을 갖는 프레임 순서 버퍼(310)를 포함한다. 결합기(385)의 출력은 트랜스포머 및 양자화기(325)의 제 1 입력과 연결된다. 트랜스포머 및 양자화기(325)의 출력은 엔트로피 코더(345)의 제 1 입력 및 역 트랜스포머 및 역 양자화기(350)의 제 1 입력과 연결된다. 엔트로피 코더(345)의 출력은 결합기(390)의 제 1 비-반전 입력과 연결된다. 결합기(390)의 출력은 출력 버퍼(335)의 제 1 입력과 연결된다.
인코더 제어기(305)의 제 1 출력은 프레임 순서 버퍼(310)의 제 2 입력, 역 트랜스포머 및 역 양자화기(350)의 제 2 입력, 화상-타입 결정 모듈(315)의 입력, 매크로블록 타입(MB-타입) 결정 모듈(320)의 제 1 입력, 인트라(intra) 예측 모듈(360)의 제 2 입력, 블록 제거 필터(365)의 제 2 입력, 움직임 보상기(370)의 제 1 입력, 움직임 추정기(375)의 제 1 입력 및 기준 화상 버퍼(380)의 제 2 입력과 연결된다.
인코더 제어기(305)의 제 2 출력은 부가 향상 정보(SEI, Supplemental Enhancement Information) 삽입기(330)의 제 1 입력, 트랜스포머 및 양자화기(325)의 제 2 입력, 엔트로피 코더(345)의 제 2 입력, 출력 버퍼(335)의 제 2 입력, 시퀀스 파라미터 세트(SPS, Sequence Parameter Set) 및 화상 파라미터 세트(PPS, Picture Parameter Set) 삽입기(340)의 입력과 연결된다.
SEI 삽입기(330)의 출력은 결합기(390)의 제 2 비-반전 입력과 연결된다.
화상-타입 결정 모듈(315)의 제 1 출력은 프레임 순서 버퍼(310)의 제 3 입력과 연결된다. 화상-타입 결정 모듈(315)의 제 2 출력은 매크로블록-타입 결정 모듈(320)의 제 2 입력과 연결된다.
시퀀스 파라미터 세트(SPS) 및 화상 파라미터 세트(PPS) 삽입기(340)의 출력은 결합기(390)의 제 3 비-반전 입력과 연결된다.
역 양자화기 및 역 트랜스포머(350)의 출력은 결합기(319)의 제 1 비-반전 입력과 연결된다. 결합기(319)의 출력은 인트라 예측 모듈(360)의 제 1 입력 및 블록 제거 필터(365)의 제 1 입력과 연결된다. 블록 제거 필터(365)의 출력은 기준 화상 버퍼(380)의 제 1 입력과 연결된다. 기준 화상 버퍼(380)의 출력은 움직임 추정기(375)의 제 2 입력 및 움직임 보상기(370)의 제 3 입력과 연결된다. 움직임 추정기(375)의 제 1 출력은 움직임 보상기(370)의 제 2 입력과 연결된다. 움직임 보상기(375)의 제 2 출력은 엔트로피 코더(345)의 제 3 출력과 연결된다.
움직임 보상기(370)의 출력은 스위치(397)의 제 1 입력과 연결된다. 인트라 예측 모듈(360)의 출력은 스위치(397)의 제 2 입력과 연결된다. 매크로블록 타입 결정 모듈(320)의 출력은 스위치(397)의 제 3 입력과 연결된다. 스위치(397)의 제 3 입력은 스위치의 "데이터" 입력(제어 입력, 즉 제 3 입력과 비교되는)이 움직임 보상기(370) 또는 인트라 예측 모듈(360)에 의해 제공될지를 결정한다. 스위치(397)의 출력은 결합기(319)의 제 2 비-반전 입력 및 결합기(385)의 반전 입력과 연결된다.
프레임 순서 버퍼(310)의 제 1 입력 및 인코더 제어기(305)의 입력은 입력 화상을 수신하기 위한 인코더(100)의 입력으로서 이용가능하다. 게다가, 부가 향상 정보(SEI) 삽입기(330)의 제 2 입력은 메타데이터를 수신하기 위한 인코더(300)의 입력으로서 이용가능하다. 출력 버퍼(335)의 출력은 비트스트림을 출력하기 위한 인코더(300)의 출력으로서 이용가능하다.
도 4로 넘어가면, 본 발명의 원리가 적용될 수 있는 예시적인 비디오 디코더는 일반적으로 참조 번호(400)로 나타난다. 비디오 디코더(400)는 엔트로피 디코더(445)의 제 1 입력과 연결된 출력을 갖는 입력 버퍼(410)를 포함한다. 엔트로피 디코더(445)의 제 1 출력은 역 트랜스포머 및 역 양자화기(450)의 제 1 입력과 연결된다. 역 트랜스포머 및 역 양자화기(450)의 출력은 결합기(425)의 제 2 비-반전 입력과 연결된다. 결합기(425)의 출력은 블록 제거 필터(465)의 제 2 입력 및 인트라 예측 모듈(460)의 제 1 입력과 연결된다. 블록 제거 필터(465)의 제 2 출력은 기준 화상 버퍼(480)의 제 1 입력과 연결된다. 기준 화상 버퍼(480)의 출력은 움직임 보상기(470)의 제 2 입력과 연결된다.
엔트로피 디코더(445)의 제 2 출력은 움직임 보상기(470)의 제 3 입력, 블록 제거 필터(465)의 제 1 입력, 인트라 예측기(460)의 제 3 입력과 연결된다. 엔트로피 디코더(445)의 제 3 출력은 디코더 제어기(405)의 입력과 연결된다. 디코더 제어기(405)의 제 1 출력은 엔트로피 디코더(445)의 제 2 입력과 연결된다. 디코더 제어기(405)의 제 2 출력은 역 트랜스포머 및 역 양자화기(450)의 제 2 입력과 연결된다. 디코더 제어기(405)의 제 3 출력은 블록 제거 필터(465)의 제 3 입력과 연결된다. 디코더 제어기(405)의 제 4 출력은 인트라 예측 모듈(460)의 제 2 입력, 움직임 보상기(470)의 제 1 입력 및 기준 화상 버퍼(480)의 제 2 입력과 연결된다.
움직임 보상기(470)의 출력은 스위치(497)의 제 1 입력과 연결된다. 인트라 예측 모듈(460)의 출력은 스위치(497)의 제 2 입력과 연결된다. 스위치(497)의 출력은 결합기(425)의 제 1 비-반전 입력과 연결된다.
입력 버퍼(410)의 입력은 입력 비트스트림을 수신하기 위한 디코더(400)의 입력으로서 이용가능하다. 블록 제거 필터(465)의 제 1 출력은 출력 화상을 출력하기 위한 디코더(400)의 출력으로서 이용가능하다.
위에 언급된 바와 같이, 본 발명의 원리는 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치에 관한 것이다. 예를 들어, 하나 이상의 실시예에서, 인코더에서 양자화 파라미터를 비트스트림에 삽입하고, 디코더에서 이전에 디코딩된 콘텐츠를 사용하여 양자화 파라미터를 재구성하기 위한 방법 및 장치를 개시한다. 동일한 양자화 파라미터 조정 처리는 양자화 파라미터 정보를 명백히 전송하지 않고 인코더 및 디코더에서 사용된다. 이는 적은 블록 레벨의 양자화 파라미터 오버헤드로, 또는 블록 레벨 양자화 파라미터 오버헤드가 전혀 없이, 재구성된 비디오에서 개선된 지각 품질을 초래한다. 또한, 전술된, 종래 기술에 의해 사용된, 명백한 블록 레벨의 양자화 파라미터에 덧붙여, 본 발명의 원리에 따른 조정된 블록 레벨의 양자화 파라미터를 삽입하는 것은 추가적인 양자화 파라미터 조정 유연성을 제공할 수 있다.
삽입된 양자화 파라미터 조정
이전에 언급된 것처럼, 본 발명의 원리에 따라, 양자화 파라미터 정보를 신호 발신하는 것의 간접 비용을 감소시키기 위해, 양자화 파라미터를 비트스트림에 삽입하는 것을 제안한다. 따라서, 양자화 파라미터가 디코더에 명백히 전달되는 종래의 기술과는 구별되게, 본 발명의 원리에 따른, 양자화 파라미터는 인코더 및 디코더 모두에서 동일한 방법을 사용하여 재구성된 데이터로부터 암묵적으로 도출된다. 게다가, 하나 이상의 실시예에서, 본 발명의 원리에 따라 조정된 및 삽입된 양자화 파라미터는 당업자에게 명백한 다른 장점들 중, 추가적인 유연성을 획득하기 위한, 전술된 종래 기술의 명백하게 신호 발신된 양자화 파라미터와 함께 사용될 수 있다.
실시예 1
지각적 품질을 개선시키기 위해, 양자화 파라미터는 화상의 전역 특성 및 각 블록의 로컬 특성을 기초로 조정될 필요가 있다. 명세서에서 사용되는 어구 "전역 특성"은 화상 내의 모든 블록으로부터 도출되는 특성을 언급한다. 예를 들어, 전역 특성은 화상의 평균 분산 또는 평균 픽셀 값일 수 있으나, 이에 제한되지 않는다. 게다가, 명세서에서 사용되는 어구 "로컬 특성"은 매크로블록의 특성을 언급한다. 예를 들어, 로컬 특성은 매크로블록의 분산 또는 평균 픽셀 값일 수 있으나, 이에 제한되지 않는다. 화상의 전역 특성 및 각 블록의 로컬 특성이 어떻게 계산되는지에 대한 예시가 아래에 서술된다. 다시, 위에 언급된 것처럼, 본 발명의 원리가 명세서에서 매크로블록에 대한 서술적인 목적으로 서술되었지만, 서브-매크로블록, 매크로블록의 그룹 등과 같은 다른 코딩 단위 또한, 본 발명의 원리의 범주를 유지하면서, 본 발명의 원리에 따라 사용될 수 있다. 이롭게, 본 발명의 원리는 품질의 손실이 더 두드러지는 영역의 품질의 개선을 허용하고, 선택적으로 비트를 절약하기 위해 남아있는 영역(또는 이들의 부분)의 품질의 감소를 선택적으로 허용할 수 있다.
도 5로 넘어가면, 비트스트림에 양자화 파라미터 맵을 삽입하기 위한 예시적인 방법은 일반적으로 참조 번호(500)로 나타난다. 방법(500)은 제어를 기능 블록(510)에 전달하는 시작 블록(505)을 포함한다. 기능 블록(510)은 입력 비디오 콘텐츠를 분석하고, 선행하는 분석으로부터 결정된 전역 특성 정보를 전송하고, 제어를 루프 제한 블록(515)에 전달한다. 루프 제한 블록(515)은 매크로블록(MB)의 1부터 #까지의 범위를 갖는 변수(i)를 사용하여 화상에서 각 매크로블록에 대한 루프를 시작하고, 제어를 기능 블록(520)에 전달한다. 기능 블록(520)은 전역 특성 정보를 사용하여 현재 매크로블록(i)에 대한 양자화 파라미터를 도출하고, 제어를 기능 블록(525)에 전달한다. 기능 블록(525)은 도출된 양자화 파라미터를 사용하여 현재 매크로블록(i)을 인코딩하고, 제어를 루프 제한 블록(530)에 전달한다. 기능 블록(530)은 매크로블록 각각에 대한 루프를 종료하고, 제어를 종료 블록(599)에 전달한다.
도 6으로 넘어가면, 삽입된 양자화 파라미터 맵을 디코딩하기 위한 예시적인 방법은 일반적으로 참조 번호(600)로 나타난다. 방법(600)은 제어를 기능 블록(610)에 전달하는 시작 블록(605)을 포함한다. 기능 블록(610)은 수신된 비트스트림으로부터 전역 특성 정보를 디코딩하고, 제어를 루프 제한 블록(615)에 전달한다. 루프 제한 블록(615)은 매크로블록(MB)의 1부터 #까지의 범위를 갖는 변수(i)를 사용하여 화상에서 각 매크로블록에 대한 루프를 시작하고, 제어를 기능 블록(620)에 전달한다. 기능 블록(620)은 현재 매크로블록(i)에 대한 양자화 파라미터를 도출하고, 제어를 기능 블록(625)에 전달한다. 기능 블록(625)은 도출된 양자화 파라미터를 사용하여 현재 매크로블록을 디코딩하고, 제어를 루프 제한 블록(630)에 전달한다. 루프 제한 블록(630)은 각 매크로블록에 대한 루프를 종료하고, 제어를 종료 블록(699)에 전달한다.
실시예 2
양자화 파라미터 조정에서 더 큰 유연성을 제공하기 위해, 삽입된 QP에 덧붙여, 매크로블록 레벨상에서 명백한 양자화 파라미터 조정을 지원하는 실시예가 서술된다.
도 7로 넘어가면, 삽입된 양자화 파라미터 맵의 사용과 함께 명백한 양자화 파라미터 조정을 인코딩하기 위한 예시적인 방법은 일반적으로 참조 번호(700)로 나타난다. 방법(700)은 제어를 기능 블록(710)에 전달하는 시작 블록(705)을 포함한다. 기능 블록(710)은 입력 비디오 콘텐츠를 분석하고, 전역 특성 정보를 전송하고, 제어를 루프 제한 블록(715)에 전달한다. 루프 제한 블록(715)은 매크로블록(MB)의 1부터 #까지의 범위를 갖는 변수(i)를 사용하여 화상에서 각 매크로블록에 대한 루프를 시작하고, 제어를 기능 블록(720)에 전달한다. 기능 블록(720)은 현재 매크로블록(i)에 대한 양자화 파라미터(QP0)를 도출하고, 제어를 기능 블록(725)에 전달한다. 기능 블록(725)은 현재 매크로블록(i)에 대한 양자화 파라미터 오프셋(QPd)을 조정하고, 제어를 기능 블록(730)에 전달한다. 기능 블록(730)은 양자화 파라미터 오프셋(QPd) 및 매크로블록(i)을 인코딩하고, 제어를 루프 제한 블록(735)에 전달한다. 루프 제한 블록(735)은 각 매크로블록에 대한 루프를 종료하고 제어를 종료 블록(799)에 전달한다. 따라서, 방법(700)에 따라, 매크로블록에 대한 양자화 파라미터(QP0)가 기능 블록(720)에 의해 도출된 후에, 기능 블록(725)은 양자화 파라미터 오프셋(QPd)을 통해 매크로블록 레벨의 양자화 파라미터를 더 조절시킬 수 있다. 기능 블록(730)에 대해, 매크로블록은 QP0 + QPd의 양자화 파라미터로 인코딩되고, 오프셋(QPd) 또한 인코딩된다.
도 8로 넘어가면, 삽입된 양자화 파라미터 맵의 사용과 함께 명백한 양자화 파라미터 조정을 디코딩하기 위한 예시적인 방법은 일반적으로 참조 번호(800)로 나타난다. 방법(800)은 제어를 기능 블록(810)에 전달하는 시작 블록(805)을 포함한다. 기능 블록(810)은 전역 특성 정보를 디코딩하고, 제어를 루프 제한 블록(815)에 전달한다. 루프 제한 블록(815)은 매크로블록(MB)의 1부터 #까지의 범위를 갖는 변수(i)를 사용하여 화상에서 각 매크로블록에 대한 루프를 시작하고, 제어를 기능 블록(820)에 전달한다. 기능 블록(820)은 양자화 파라미터 오프셋(QPd)을 디코딩하고, 현재 매크로블록(i)에 대한 양자화 파라미터(QP0)을 도출하고 제어를 기능 블록(825)에 전달한다. 기능 블록(825)은 매크로블록(i)을 디코딩하고, 제어를 루프 제한 블록(830)에 전달한다. 루프 제한 블록(830)은 각 매크로블록에 대한 루프를 종료하고, 제어를 종료 블록(899)에 전달한다.
QP 도출
다음에서, 양자화 파라미터를 도출하기 위한 방법을 서술한다. 특정 방법에 대해, 동일한 방법이 동기화를 위해 인코더 및 디코더 모두에서 사용된다.
관심 영역에서 높은 지각 품질을 제공하는 것은 전체 지각 품질에서 두드러진 영향을 미친다. 그러므로, 양자화 파라미터 조정에 대한 일반적인 가이드라인은 지각 품질을 개선시키기 위해 관심 영역에 낮은 양자화 파라미터를, 그리고 비트의 개수를 감소시키기 위해 다른 영역에 높은 양자화 파라미터를 할당하는 것이다. 특히, 분산으로 측정된 화상의 공간 활성을 사용하여 어떻게 양자화 파라미터를 조정하는지를 설명한다. 각 블록에 대해, 분산은 블록에서의 모든 픽셀 또는 픽셀의 서브셋을 사용하여 계산될 수 있다.
먼저, 화상의 전역 특성을 분석한다. 일 실시예에서, 평균 공간 활성(avg_var)은 화상에서 모든 블록에 대한 분산을 평균 냄으로써 계산된다. avg_var가 클 때, 전체 화상은 텍스처링 되고, 그렇지 않다면 매끄러워진다. 정보(avg_var)가 인코딩되고, 비트스트림으로 전송될 필요가 있다. 간접 비용을 절약하기 위해, avg_var의 축소된 버전이 사용될 수 있다.
각 매크로블록에 대해, avg_var 및 로컬 분산(var)을 기초로 양자화 파라미터를 도출한다. 로컬 분산이 인코더 및 디코더 모두에서 사용되기에, 이전에 재구성된 정보만이 사용될 수 있다. 일 실시예에서, 왼쪽, 상부 및/또는 왼쪽-상부 블록과 같은 이웃 블록의 평균 분산을 사용한다. 다른 실시예에서, 이웃 블록의 최소 분산을 사용한다. 또 다른 실시예에서, 분산의 중간 값을 사용한다.
전역 및 로컬 특성을 획득한 후에, 다음과 같은 양자화 파라미터를 도출한다:
Figure pct00008
여기서, α는 인코더 및 디코더 모두에서 알려져야 하는 파라미터이고, QPpic는 화상에 대한 기본 양자화 파라미터이다. α는 QP 분산이 var과 avg_var, var/avg_var 사이의 비율에 따라 얼마나 강한지를 제어한다. 일 실시예에서, 양자화 파라미터 분산의 동적 범위를 제어하기 위해, 양자화 파라미터를 [QPpic - L, QPpic + U]로 한정하는데, 여기서 L 및 U는 또한, 각각 인코더 및 디코더에서 동일한 것으로 알려져야 하는, 낮은 임계치 및 높은 임계치이다. 수학식 8의 수식은 매끄럽고, 작은 분산을 갖는 매크로블록에 더 작은 양자화 파라미터를 할당한다.
수학식 8의 계산을 간소화시키기 위해, 룩-업 테이블이 사용될 수 있다. 예를 들어, 다음의 의사코드를 사용하여 설명된 것과 같은 양자화 파라미터를 도출한다;
Figure pct00009
여기서 βi 및 △i는 인코더 및 디코더 모두에서 알려져야 하는 파라미터이다. 예시에서, 3개의 다른 양자화 파라미터 레벨을 사용한다. 하지만, 본 발명의 원리는 동일한 것으로 제한되지 않는다는 것, 따라서, 다른 개수의 레벨이 본 발명의 원리의 범주를 유지하면서 방법에 대해 사용될 수 있다는 것이 인식될 것이다.
도 9로 넘어가면, 비디오 인코더에서 양자화 파라미터를 할당하기 위한 예시적인 방법은 일반적으로 참조 번호(900)로 나타난다. 방법(900)은 제어를 기능 블록(910)에 전달하는 시작 블록(905)을 포함한다. 기능 블록(910)은 화상의 전역 특성을 분석하고, 제어를 루프 제한 블록(915)에 전달한다. 루프 제한 블록(915)은 매크로블록(예를 들어, 현재 화상에서)의 1부터 개수(#)까지의 범위를 갖는 변수(i)를 사용하여 루프를 시작하고, 제어를 기능 블록(920)에 전달한다. 기능 블록(920)은 현재 매크로블록의 중요도를 검출하고, 제어를 기능 블록(925)에 전달한다. 기능 블록(925)은 다음과 같이 양자화 파라미터를 할당하고, 제어를 루프 제한 블록(930)에 전달한다: 매크로블록의 중요도가 더 높아질수록, 할당되는 양자화 파라미터는 더 적어지고, 여기서 양자화 파라미터는 양자화 스텝 크기, 라운딩 오프셋 및/또는 스케일링 매트릭스일 수 있다. 루프 제한 블록(930)은 루프를 종료시키고, 제어를 종료 블록(999)에 전달한다.
도 10으로 넘어가면, 비디오 디코더에서 양자화 파라미터를 계산하기 위한 예시적인 방법은 일반적으로 참조 번호(1000)로 나타난다. 방법(1000)은 제어를 기능 블록(1010)에 전달하는 시작 블록(1005)을 포함한다. 기능 블록(1010)은 화상의 전역 특성을 디코딩하고, 제어를 루프 제한 블록(1015)에 전달한다. 루프 제한 블록(1015)은 매크로블록(즉, 현재 화상)의 1부터 번호(#) 까지의 범위를 갖는 변수(i)를 사용하여 루프를 시작하고, 제어를 기능 블록(1020)에 전달한다. 기능 블록(1020)은 현재 매크로블록의 중요도를 검출하고, 제어를 기능 블록(1025)에 전달한다. 기능 블록(1025)은 인코더와 동일한 규칙을 사용하여 양자화 파라미터를 계산하고, 제어를 루프 제한 블록(1030)에 전달한다. 일반적으로, 매크로블록이 더 중요할수록. 양자화 파라미터는 더 적어지고, 양자화 파라미터는 양자화 스텝 크기, 라운딩 오프셋 및/또는 스케일링 매트릭스일 수 있다. 루프 제한 블록(1030)은 루프를 종료시키고, 제어를 종료 블록(1099)에 전달한다.
도 11로 넘어가면, 비디오 인코더에서 양자화 파라미터를 할당하기 위한 예시적인 방법은 일반적으로 참조 번호(1100)로 나타난다. 방법(1100)은 제어를 기능 블록(1110)에 전달하는 시작 블록(1105)을 포함한다. 기능 블록(1110)은 모든 블록을 사용하여 평균 분산(avg_var)을 계산하고, 제어를 루프 제한 블록(1115)에 전달한다. 루프 제한 블록(1115)은 매크로블록(예를 들어, 현재 화상에서)의 1부터 번호(#)까지의 범위를 갖는 변수(i)를 사용하여 루프를 시작하고, 제어를 기능 블록(1120)에 전달한다. 기능 블록(1120)은 이웃 블록으로부터, 이웃 블록의 분산의 평균, 최소, 또는 중간값일 수 있지만, 이에 제한되지 않는 분산을 계산하고, 제어를 기능 블록(1125)에 전달한다. 기능 블록(1125)은 수학식 8 또는 수학식 9를 기초로 양자화 파라미터를 계산하고, 제어를 루프 제한 블록(1130)에 전달한다. 루프 제한 블록(1130)은 루프를 종료시키고, 제어를 종료 블록(1199)에 전달한다.
도 12로 넘어가면, 비디오 디코더에서 양자화 파라미터를 계산하기 위한 예시적인 방법은 일반적으로 참조 번호(1200)로 나타난다. 방법(1200)은 제어를 기능 블록(1210)에 전달하는 시작 블록(1205)을 포함한다. 기능 블록(1210)은 평균 분산(avg_var)을 디코딩하고, 제어를 루프 제한 블록(1215)에 전달한다. 루프 제한 블록(1215)은 매크로블록(예를 들어, 현재 화상에서)의 1부터 번호(#)까지의 범위를 갖는 변수(i)를 사용하여 루프를 시작하고, 제어를 기능 블록(1220)에 전달한다. 기능 블록(1220)은 이웃 블록으로부터, 이웃 블록의 분산의 평균, 최소 또는 중간일 수 있지만, 이에 제한되지 않는 분산을 계산하고, 제어를 기능 블록(1225)에 전달한다. 분산 계산의 인코더에서의 동일한 방법이 사용된다. 기능 블록(1225)은 수학식 8 또는 수학식 9를 기초로 양자화 파라미터를 계산하고, 제어를 루프 제한 블록(1230)에 전달한다. 루프 제한 블록(1230)은 루프를 종료하고, 제어를 종료 블록(1299)에 전달한다.
구문
인코더 및 디코더를 동기화시키기 위해, 도출 처리에서 전역 특성, 수식, 룩업 테이블, 및 관련된 파라미터가 디코더에 알려져야 한다.
예시로서 수학식 9에 서술된 방법을 사용하여, 본 발명의 원리를 적용할 구문을 어떻게 설계하는 지를 서술한다. 구문 요소는 삽입된 양자화 파라미터가 사용되는 지를 규정하기 위해 사용된다. 구문 요소는 화상 레벨 또는 시퀀스 레벨에서 규정될 수 있다. 화상의 전역 특성(avg_var)은 화상 레벨 구문에서 규정되어야 한다. 표 1은 본 발명의 원리의 실시예에 따라 화상 파라미터 세트에서의 구문 요소를 도시한다.
Figure pct00010
표 1에서 일부 구문 요소의 의미는 다음과 같다:
Embedded _ QPmap _ flag가 1이라는 것은 삽입된 양자화 파라미터가 화상 파라미터 세트 내에 존재한다는 것을 나타낸다. Embedded_QPmap_flag가 0이라는 것은 삽입된 양자화 파라미터가 화상 파라미터 세트 내에 존재하지 않는다는 것을 나타낸다.
Avg _ var은 화상에 대한 평균 분산의 값을 나타낸다.
Beta _i는 수학식 9의 파라미터를 나타낸다.
Delta _i는 수학식 9의 QP 오프셋을 나타낸다.
일부가 위에서 언급된, 본 발명의 다수의 부수적인 장점/특징 중 일부에 대한 서술이 이제부터 제공될 것이다. 예를 들어, 하나의 장점/특징은 화상에서 적어도 하나의 블록에 대한 화상 데이터를 인코딩하기 위한 인코더를 갖는 장치이다. 블록의 원래 버전과 적어도 하나의 기준 블록 사이의 차를 변환함으로써 획득되는 하나 이상의 변환 계수에 적용된 양자화 파라미터는 적어도 하나의 블록에 대응하는, 재구성된 데이터로부터 도출된다.
다른 장점/특징은 위에 서술된 인코더를 갖는 장치이고, 재구성된 데이터로부터 양자화 파라미터의 도출은 수식, 룩업 테이블, 화상의 전역 특성 및 블록의 로컬 특성, 분산, 블록 및 화상 중 적어도 하나의 루마 특성 및, 블록 및 화상 중 적어도 하나의 크로마 특성 중 적어도 하나에 응답하여 수행된다.
또 다른 장점/특징은 위에 서술된 인코더를 갖는 장치이고, 재구성된 데이터로부터 양자화 파라미터의 도출은 인코더 및 대응하는 디코더 모두에서 알려지고 활용되는 수식에 응답하여 수행된다.
또 다른 장점/특징은 위에 서술된 인코더를 갖는 장치이고, 재구성된 데이터로부터 양자화 파라미터의 도출은 적어도 하나의 수식에 응답하여 수행되고, 적어도 하나의 수식, 적어도 하나의 수식의 인덱스, 및 인덱스 및 적어도 하나의 수식 중 적어도 하나와 관련된 파라미터는 비트스트림에 명백히 포함된다.
게다가, 다른 장점/특징은 위에 서술된 인코더를 갖는 장치이고, 재구성된 데이터로부터 양자화 파라미터의 도출은 화상의 전역 특성 및 블록의 로컬 특성에 응답하여 수행되고, 화상의 전역 특성은 분산에 기초한다.
게다가, 다른 장점/특징은 위에 서술된 인코더를 갖는 장치이고, 디폴트 양자화 라운딩 오프셋에 덧붙여, 다른 양자화 오프셋은 적어도 하나의 블록을 포함하는 화상에서 블록의 각각에 대해 지원되어, 디폴트 양자화 오프셋은 명백히 신호 발신되고, 다른 양자화 오프셋은 암묵적으로 신호 발신되게 된다.
또한, 다른 장점/특징은 위에 서술된 인코더를 갖는 장치이고, 양자화 미터는 양자화 스텝 크기, 양자화 라운팅 오프셋 및 양자화 스케일링 매트릭스 중 적어도 하나를 포함한다.
본 발명의 원리의 이들 및 다른 특징 및 장점은 본 명세서의 교시를 기초로 당업자에 의해 쉽게 확인될 수 있다. 본 발명의 원리의 교시가 하드웨어, 소프트웨어, 펌웨어, 특수 목적 처리기, 또는 이들의 조합의 다양한 형태로 구현될 수 있다는 것이 이해될 것이다.
더 바람직하게, 본 발명의 원리의 교시는 하드웨어와 소프트웨어의 조합으로 구현된다. 더욱이, 소프트웨어는 프로그램 저장 유닛 상에 명백하게 구현되는 애플리케이션 프로그램으로 구현될 수 있다. 애플리케이션 프로그램은 임의의 적합한 아키텍처를 포함하는 기계에 업로드 될 수 있고, 이 기계에 의해 실행될 수 있다. 바람직하게, 기계는 하나 이상의 중앙 처리 유닛("CPU"), 랜덤 액세스 메모리("RAM") 및 입/출력("I/O") 인터페이스와 같은 하드웨어를 갖는 컴퓨터 플랫폼상에 구현된다. 또한, 이 컴퓨터 플랫폼은 운영체제 및 마이크로지령 코드를 포함할 수 있다. 본 명세서에서 서술된 다양한 처리 및 기능은 CPU에 의해 실행될 수 있는 마이크로 지령코드의 일부, 애플리케이션 프로그램의 일부 또는, 이들의 조합일 수 있다. 게다가, 추가의 데이터 저장 유닛 및 프린터와 같은 다양한 다른 주변 장치가 컴퓨터 플랫폼에 연결될 수 있다.
첨부 도면에 도시된 구성 시스템 요소와 방법 중 일부가 소프트웨어로 바람직하게 구현되기에, 시스템 요소 사이의 또는 처리 기능 블록 사이의 실제 연결이 본 발명의 원리가 프로그래밍되는 방식에 의존하여 상이할 수 있음이 이해되어야 한다. 본 명세서에서 교시가 주어지면, 당업자는 본 발명의 원리의 이들 및 유사한 구현 또는 구성을 고려할 수 있다.
본 명세서에서 첨부 도면을 참조로 예시적인 실시예가 서술되었지만, 본 발명의 원리가 이러한 정밀한 실시예에 제한되지 않고, 다양한 변경 및 수정이 본 발명의 원리의 범주 또는 사상을 벗어나는 것 없이 당업자에 의해 실시될 수 있음이 이해되어야 한다. 이러한 모든 변경 및 수정은 첨부된 청구항으로 한정되는 본 발명의 원리의 범주 내에 포함되는 것으로 의도된다.
300 : 비디오 인코더 305 : 인코더 제어기
310 : 프레임 순서 버퍼 315 : 화상-타입 결정 모듈
320 : MB-타입 결정 모듈 325 : 트랜스포머 및 양자화기
330 : SEI 삽입기 335 : 출력 버퍼
340 : SPS 및 PPS 삽입기 345 : 엔트로피 코더
350, 450 : 역트랜스포머 및 역양자화기
360, 460 : 인트라 예측 모듈 365, 465 : 블록 제거 필터
370, 470 : 움직임 보상기 375 : 움직임 추정기
380, 480 : 기준 화상 버퍼 385, 390, 425 : 결합기
397, 497 : 스위치 400 : 비디오 디코더
405 : 디코더 제어기 410 : 입력 버퍼

Claims (29)

  1. 장치로서,
    화상에서 블록에 대한 화상 데이터를 인코딩하기 위한 인코더(300)를
    포함하고, 원래 버전의 상기 블록과 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득되는 하나 이상의 변환 계수에 적용되는 양자화 파라미터는 상기 블록에 대응하는 재구성된 데이터로부터 도출되는, 장치.
  2. 제1항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은:
    수식,
    룩-업 테이블,
    상기 화상의 전역 특성 및 상기 블록의 로컬 특성,
    분산,
    상기 블록의 루마(luma) 특성,
    상기 화상의 루마 특성,
    상기 블록의 크로마(chroma) 특성, 및
    상기 화상의 크로마 특성으로
    구성되는 그룹으로부터 선택된 적어도 하나에 응답하여 수행되는, 장치.
  3. 제1항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 상기 인코더 및 대응하는 디코더 모두에서 알려지고 활용되는 수식에 응답하여 수행되는, 장치.
  4. 제1항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 적어도 하나의 수식에 응답하여 수행되고, 상기 적어도 하나의 수식, 상기 적어도 하나의 수식의 인덱스(index), 및 상기 인덱스 및 상기 적어도 하나의 수식 중 적어도 하나에 관련된 파라미터는 비트스트림 내에 명백히 포함되는, 장치.
  5. 제1항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 상기 화상의 전역 특성 및 상기 블록의 로컬 특성에 응답하여 수행되고, 상기 화상의 전역 특성은 분산을 기초로 하는, 장치.
  6. 제1항에 있어서, 디폴트 양자화 라운딩 오프셋에 덧붙여, 제 2 양자화 오프셋은 상기 화상에서 복수의 블록에 대해 지원되어, 상기 디폴트 양자화 오프셋이 명백히 신호 발신되고, 상기 제 2 양자화 오프셋이 암묵적으로 신호 발신되게 되는, 장치.
  7. 제1항에 있어서, 상기 양자화 파라미터는 양자화 스텝 크기, 양자화 라운딩 오프셋 및 양자화 스케일링 매트릭스 중 적어도 하나를 포함하는, 장치.
  8. 비디오 인코더에서의 방법으로서,
    화상에서 블록에 대한 화상 데이터를 인코딩하는 단계를
    포함하고, 원래 버전의 상기 블록과 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득되는 하나 이상의 변환 계수에 적용되는 양자화 파라미터는 상기 블록에 대응하는 재구성된 데이터로부터 도출되는(520, 525, 720, 730), 비디오 인코더에서의 방법.
  9. 제8항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은:
    수식,
    룩-업 테이블,
    상기 화상의 전역 특성 및 상기 블록의 로컬 특성,
    분산,
    상기 블록의 루마 특성,
    상기 화상의 루마 특성,
    상기 블록의 크로마 특성, 및
    상기 화상의 크로마 특성으로
    구성되는 그룹으로부터 선택된 적어도 하나에 응답하여 수행되는(520, 720, 1125), 비디오 인코더에서의 방법.
  10. 제8항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 상기 인코더 및 대응하는 디코더 모두에서 알려지고 활용되는 수식에 응답하여 수행되는(1125), 비디오 인코더에서의 방법.
  11. 제8항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 적어도 하나의 수식에 응답하여 수행되고, 상기 적어도 하나의 수식, 상기 적어도 하나의 수식의 인덱스, 및 상기 인덱스 및 상기 적어도 하나의 수식 중 적어도 하나에 관련된 파라미터는 비트스트림 내에 명백히 포함되는(1025), 비디오 인코더에서의 방법.
  12. 제8항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 상기 화상의 전역 특성 및 상기 블록의 로컬 특성에 응답하여 수행되고, 상기 화상의 전역 특성은 분산을 기초로 하는(1120), 비디오 인코더에서의 방법.
  13. 제8항에 있어서, 디폴트 양자화 라운딩 오프셋에 덧붙여, 제 2 양자화 오프셋이 상기 화상에서 복수의 블록에 대해 지원되어, 상기 디폴트 양자화 오프셋이 명백히 신호 발신되고, 상기 제 2 양자화 오프셋이 암묵적으로 신호 발신되게 되는(720, 725), 비디오 인코더에서의 방법.
  14. 제8항에 있어서, 상기 양자화 파라미터는 양자화 스텝 크기, 양자화 라운딩 오프셋 및 양자화 스케일링 매트릭스 중 적어도 하나를 포함하는(925), 비디오 인코더에서의 방법.
  15. 장치로서,
    화상에서 블록에 대한 화상 데이터를 디코딩하기 위한 디코더(400)를
    포함하고, 원래 버전의 상기 블록과 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득되는 하나 이상의 변환 계수에 적용되는 양자화 파라미터는 상기 블록에 대응하는 재구성된 데이터로부터 도출되는, 장치.
  16. 제15항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은:
    수식,
    룩-업 테이블,
    상기 화상의 전역 특성 및 상기 블록의 로컬 특성,
    분산,
    상기 블록의 루마 특성,
    상기 화상의 루마 특성,
    상기 블록의 크로마 특성, 및
    상기 화상의 크로마 특성으로
    구성되는 그룹으로부터 선택된 적어도 하나에 응답하여 수행되는(520, 720, 1125), 장치.
  17. 제15항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 상기 인코더 및 대응하는 디코더 모두에서 알려지고 활용되는 수식에 응답하여 수행되는, 장치.
  18. 제15항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 적어도 하나의 수식에 응답하여 수행되고, 상기 적어도 하나의 수식, 상기 적어도 하나의 수식의 인덱스, 및 상기 인덱스 및 상기 적어도 하나의 수식 중 적어도 하나에 관련된 파라미터는 비트스트림 내에 명백히 포함되는, 장치.
  19. 제15항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 상기 화상의 전역 특성 및 상기 블록의 로컬 특성에 응답하여 수행되고, 상기 화상의 전역 특성은 분산을 기초로 하는, 장치.
  20. 제15항에 있어서, 디폴트 양자화 라운딩 오프셋에 덧붙여, 제 2 양자화 오프셋이 상기 화상에서 복수의 블록에 대해 지원되어, 상기 디폴트 양자화 오프셋이 명백히 신호 발신되고, 상기 제 2 양자화 오프셋이 암묵적으로 신호 발신되게 되는, 장치.
  21. 제15항에 있어서, 상기 양자화 파라미터는 양자화 스텝 크기, 양자화 라운딩 오프셋 및 양자화 스케일링 매트릭스 중 적어도 하나를 포함하는, 장치.
  22. 비디오 디코더에서의 방법으로서,
    화상에서 블록에 대한 화상 데이터를 인코딩하는 단계를
    포함하고, 원래 버전의 상기 블록과 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득되는 하나 이상의 변환 계수에 적용되는 양자화 파라미터는 블록에 대응하는 재구성된 데이터로부터 도출되는(620, 625, 820, 825), 비디오 디코더에서의 방법.
  23. 제22항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은:
    수식,
    룩-업 테이블,
    상기 화상의 전역 특성 및 상기 블록의 로컬 특성,
    분산,
    상기 블록의 루마 특성,
    상기 화상의 루마 특성,
    상기 블록의 크로마 특성, 및
    상기 화상의 크로마 특성으로
    구성되는 그룹으로부터 선택된 적어도 하나에 응답하여 수행되는(620, 820), 비디오 디코더에서의 방법.
  24. 제22항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 상기 인코더 및 대응하는 디코더 모두에서 알려지고 활용되는 수식에 응답하여 수행되는(1225), 비디오 디코더에서의 방법.
  25. 제22항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 적어도 하나의 수식에 응답하여 수행되고, 상기 적어도 하나의 수식, 상기 적어도 하나의 수식의 인덱스, 및 상기 인덱스 및 상기 적어도 하나의 수식 중 적어도 하나에 관련된 파라미터는 비트스트림 내에 명백히 포함되는(1225), 비디오 디코더에서의 방법.
  26. 제22항에 있어서, 상기 재구성된 데이터로부터의 상기 양자화 파라미터의 도출은 상기 화상의 전역 특성 및 상기 블록의 로컬 특성에 응답하여 수행되고, 상기 화상의 전역 특성은 분산을 기초로 하는(1220, 1225), 비디오 디코더에서의 방법.
  27. 제22항에 있어서, 디폴트 양자화 라운딩 오프셋에 덧붙여, 제 2 양자화 오프셋이 상기 화상에서 복수의 블록에 대해 지원되어, 상기 디폴트 양자화 오프셋이 명백히 신호 발신되고, 상기 제 2 양자화 오프셋이 암묵적으로 신호 발신되게 되는(820), 비디오 디코더에서의 방법.
  28. 제22항에 있어서, 상기 양자화 파라미터는 양자화 스텝 크기, 양자화 라운딩 오프셋 및 양자화 스케일링 매트릭스 중 적어도 하나를 포함하는(1025), 비디오 디코더에서의 방법.
  29. 인코딩된 비디오 신호 데이터를 갖는 컴퓨터 판독 가능 저장 매체로서,
    화상에서 블록에 대해 인코딩된 화상 데이터를
    포함하고, 원래 버전의 상기 블록과 적어도 하나의 기준 블록 사이의 차를 변환시킴으로써 획득된 하나 이상의 변환 계수에 적용된 양자화 파라미터는 상기 블록에 대응하는 재구성된 데이터로부터 도출되는, 인코딩된 비디오 신호 데이터를 갖는 컴퓨터 판독 가능 저장 매체.

KR1020127008303A 2009-10-05 2010-09-29 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치 KR101873356B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US24854109P 2009-10-05 2009-10-05
US61/248,541 2009-10-05
PCT/US2010/002630 WO2011043793A1 (en) 2009-10-05 2010-09-29 Methods and apparatus for embedded quantization parameter adjustment in video encoding and decoding

Publications (2)

Publication Number Publication Date
KR20120083368A true KR20120083368A (ko) 2012-07-25
KR101873356B1 KR101873356B1 (ko) 2018-07-02

Family

ID=43416234

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127008303A KR101873356B1 (ko) 2009-10-05 2010-09-29 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치

Country Status (6)

Country Link
US (3) US9819952B2 (ko)
EP (1) EP2486730A1 (ko)
JP (1) JP5806219B2 (ko)
KR (1) KR101873356B1 (ko)
CN (1) CN102577379B (ko)
WO (1) WO2011043793A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170031202A (ko) * 2014-07-24 2017-03-20 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 코딩에서의 적응형 역양자화 방법 및 장치
KR20170040653A (ko) * 2015-10-05 2017-04-13 삼성전자주식회사 양자화 파라미터를 적응적으로 결정하는 인코더 및 이를 포함하는 애플리케이션 프로세서

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101873356B1 (ko) 2009-10-05 2018-07-02 톰슨 라이센싱 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치
US10897625B2 (en) * 2009-11-20 2021-01-19 Texas Instruments Incorporated Block artifact suppression in video coding
US9235774B2 (en) 2010-06-10 2016-01-12 Thomson Licensing Methods and apparatus for determining quantization parameter predictors from a plurality of neighboring quantization parameters
CA2826676C (en) 2011-03-11 2020-12-29 Sony Corporation Image processing apparatus and method
CN108243340A (zh) * 2011-12-13 2018-07-03 Jvc 建伍株式会社 动图像编码装置以及动图像编码方法
US9961340B2 (en) * 2011-12-15 2018-05-01 Thomson Licensing Method and apparatus for video quality measurement
CN107493475B (zh) * 2011-12-15 2019-05-17 寰发股份有限公司 量化电平截取装置及方法
WO2013086724A1 (en) 2011-12-15 2013-06-20 Mediatek Singapore Pte. Ltd. Method of clippling transformed coefficients before de-quantization
CN103975592B (zh) * 2011-12-15 2018-03-06 寰发股份有限公司 反量化变换系数的方法及装置
TWI603611B (zh) * 2011-12-21 2017-10-21 Jvc Kenwood Corp Motion picture encoding apparatus, motion picture encoding method, and recording medium for moving picture encoding program
US9805442B2 (en) 2012-10-03 2017-10-31 Avago Technologies General Ip (Singapore) Pte. Ltd. Fine-grained bit-rate control
US9813711B2 (en) 2012-10-03 2017-11-07 Avago Technologies General Ip (Singapore) Pte. Ltd. Hybrid transform-based compression
US10812829B2 (en) 2012-10-03 2020-10-20 Avago Technologies International Sales Pte. Limited 2D block image encoding
US9883180B2 (en) 2012-10-03 2018-01-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Bounded rate near-lossless and lossless image compression
US9978156B2 (en) 2012-10-03 2018-05-22 Avago Technologies General Ip (Singapore) Pte. Ltd. High-throughput image and video compression
US20140105278A1 (en) * 2012-10-16 2014-04-17 Microsoft Corporation Color adaptation in video coding
US9363517B2 (en) 2013-02-28 2016-06-07 Broadcom Corporation Indexed color history in image coding
US20140269901A1 (en) * 2013-03-13 2014-09-18 Magnum Semiconductor, Inc. Method and apparatus for perceptual macroblock quantization parameter decision to improve subjective visual quality of a video signal
US9204150B2 (en) 2014-02-26 2015-12-01 Intel Corporation Techniques for evaluating compressed motion video quality
KR102365685B1 (ko) * 2015-01-05 2022-02-21 삼성전자주식회사 인코더의 작동 방법과 상기 인코더를 포함하는 장치들
US9979969B2 (en) * 2015-04-24 2018-05-22 Fingram Co., Ltd. Method and system for image compression using image block characteristics
FR3035760B1 (fr) * 2015-04-29 2018-05-11 Digigram Video & Broadcast Systeme et procede d'encodage d'une sequence video
US10715802B2 (en) * 2015-09-29 2020-07-14 Lg Electronics Inc. Method for encoding/decoding video signal by using single optimized graph
EP3407606B1 (en) * 2016-02-11 2023-04-26 Samsung Electronics Co., Ltd. Video encoding method and device and video decoding method and device
EP3649782A4 (en) * 2017-07-05 2021-04-14 Telefonaktiebolaget LM Ericsson (PUBL) DECODING A BLOCK OF VIDEO SAMPLE
US20200322606A1 (en) * 2017-10-24 2020-10-08 Sharp Kabushiki Kaisha Systems and methods for determining quantization parameter predictive values
CN109819253B (zh) 2017-11-21 2022-04-22 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质
US11259035B2 (en) * 2019-03-15 2022-02-22 Ati Technologies Ulc Macroblock coding type prediction
US10924741B2 (en) * 2019-04-15 2021-02-16 Novatek Microelectronics Corp. Method of determining quantization parameters
WO2020244661A1 (en) * 2019-06-06 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Implicit selection of transform candidates
KR102644970B1 (ko) * 2019-06-28 2024-03-08 엘지전자 주식회사 영상 디코딩 방법 및 그 장치
US11509897B2 (en) 2020-08-07 2022-11-22 Samsung Display Co., Ltd. Compression with positive reconstruction error
US11503322B2 (en) 2020-08-07 2022-11-15 Samsung Display Co., Ltd. DPCM codec with higher reconstruction quality on important gray levels
US11683490B2 (en) * 2020-09-10 2023-06-20 Tencent America LLC Context adaptive transform set
US20220201334A1 (en) * 2020-12-23 2022-06-23 Tencent America LLC Method and apparatus for video coding

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5592228A (en) * 1993-03-04 1997-01-07 Kabushiki Kaisha Toshiba Video encoder using global motion estimation and polygonal patch motion estimation
DE69940703D1 (de) * 1998-03-05 2009-05-20 Panasonic Corp Verfahren zur Bildkodierung, Verfahren zur Bildkodierung/-Dekodierung, Bildkodierer, oder Vorrichtung zur Bildaufzeichnung/-Wiedergabe
EP1005233A1 (en) * 1998-10-12 2000-05-31 STMicroelectronics S.r.l. Constant bit-rate coding control in a video coder by way of pre-analysis of the slices of the pictures
US6192080B1 (en) * 1998-12-04 2001-02-20 Mitsubishi Electric Research Laboratories, Inc. Motion compensated digital video signal processing
US6628839B1 (en) * 1999-02-23 2003-09-30 Matsushita Electric Industrial Co., Ltd. Image coding system converting apparatus, image coding system converting method, and recording medium
US6363113B1 (en) * 1999-06-07 2002-03-26 Lucent Technologies Inc. Methods and apparatus for context-based perceptual quantization
JP4385841B2 (ja) 2004-04-22 2009-12-16 ソニー株式会社 画像処理装置
US7894530B2 (en) * 2004-05-07 2011-02-22 Broadcom Corporation Method and system for dynamic selection of transform size in a video decoder based on signal content
US20060056508A1 (en) * 2004-09-03 2006-03-16 Phillippe Lafon Video coding rate control
JP2007081474A (ja) 2005-09-09 2007-03-29 Toshiba Corp 画像符号化装置及び方法
US8199812B2 (en) * 2007-01-09 2012-06-12 Qualcomm Incorporated Adaptive upsampling for scalable video coding
US20080230949A1 (en) 2007-03-23 2008-09-25 Paul Razgunas Injection molding process for forming coated molded parts
FR2914125A1 (fr) 2007-03-23 2008-09-26 Thomson Licensing Sas Procede de traitement d'image et dispositif de codage implementant ledit procede.
US8995522B2 (en) * 2007-04-13 2015-03-31 Apple Inc. Method and system for rate control
US8238428B2 (en) * 2007-04-17 2012-08-07 Qualcomm Incorporated Pixel-by-pixel weighting for intra-frame coding
WO2008139721A1 (ja) * 2007-05-07 2008-11-20 Panasonic Corporation 復号化装置及び復号化方法
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
JP2009111691A (ja) * 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
US9113194B2 (en) * 2007-12-19 2015-08-18 Arris Technology, Inc. Method and system for interleaving video and data for transmission over a network at a selected bit rate
US8542730B2 (en) * 2008-02-22 2013-09-24 Qualcomm, Incorporated Fast macroblock delta QP decision
KR101873356B1 (ko) 2009-10-05 2018-07-02 톰슨 라이센싱 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치
US8630341B2 (en) * 2011-01-14 2014-01-14 Mitsubishi Electric Research Laboratories, Inc. Method for training and utilizing separable transforms for video coding
TWI603611B (zh) * 2011-12-21 2017-10-21 Jvc Kenwood Corp Motion picture encoding apparatus, motion picture encoding method, and recording medium for moving picture encoding program
US9363517B2 (en) * 2013-02-28 2016-06-07 Broadcom Corporation Indexed color history in image coding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170031202A (ko) * 2014-07-24 2017-03-20 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 코딩에서의 적응형 역양자화 방법 및 장치
US10257514B2 (en) 2014-07-24 2019-04-09 Huawei Technologies Co., Ltd. Adaptive dequantization method and apparatus in video coding
KR20170040653A (ko) * 2015-10-05 2017-04-13 삼성전자주식회사 양자화 파라미터를 적응적으로 결정하는 인코더 및 이를 포함하는 애플리케이션 프로세서

Also Published As

Publication number Publication date
US9819952B2 (en) 2017-11-14
JP5806219B2 (ja) 2015-11-10
US20120183053A1 (en) 2012-07-19
US20180091822A1 (en) 2018-03-29
US10194154B2 (en) 2019-01-29
JP2013507086A (ja) 2013-02-28
CN102577379A (zh) 2012-07-11
CN102577379B (zh) 2017-12-19
US20180091817A1 (en) 2018-03-29
WO2011043793A1 (en) 2011-04-14
KR101873356B1 (ko) 2018-07-02
EP2486730A1 (en) 2012-08-15

Similar Documents

Publication Publication Date Title
KR101873356B1 (ko) 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치
US11722669B2 (en) Methods and apparatus for determining quantization parameter predictors from a plurality of neighboring quantization parameters
JP5749710B2 (ja) 映像符号化及び復号化のための、改善された量子化の丸めのオフセットを調節する方法及び装置
US8848788B2 (en) Method and apparatus for joint quantization parameter adjustment
KR101810263B1 (ko) 분류-기반 루프 필터에 대한 방법들 및 장치
US9979972B2 (en) Method and apparatus for rate control accuracy in video encoding and decoding
US20100183070A1 (en) Method and apparatus for improved video encoding using region of interest (roi) information
KR101603747B1 (ko) 비디오 인코딩에서 속도 제어 정확성을 위한 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant