KR20170031202A - 비디오 코딩에서의 적응형 역양자화 방법 및 장치 - Google Patents

비디오 코딩에서의 적응형 역양자화 방법 및 장치 Download PDF

Info

Publication number
KR20170031202A
KR20170031202A KR1020177003914A KR20177003914A KR20170031202A KR 20170031202 A KR20170031202 A KR 20170031202A KR 1020177003914 A KR1020177003914 A KR 1020177003914A KR 20177003914 A KR20177003914 A KR 20177003914A KR 20170031202 A KR20170031202 A KR 20170031202A
Authority
KR
South Korea
Prior art keywords
quantization
transform coefficients
adjustment factor
color space
pixels
Prior art date
Application number
KR1020177003914A
Other languages
English (en)
Other versions
KR101893049B1 (ko
Inventor
인 자오
하이타오 양
줘이 뤼
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20170031202A publication Critical patent/KR20170031202A/ko
Application granted granted Critical
Publication of KR101893049B1 publication Critical patent/KR101893049B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은, 비디오 코딩에서의 적응형 역양자화 방법 및 장치를 개시한다. 본 발명에서 제공하는 방법에 따르면, 현재 변환 블록이 위치하는 배경 영역의 통계적 특징이, 변환 블록의, 공간적 이웃 정보, 또는 시간적 이웃 정보, 또는 공간적 이웃 정보와 시간적 이웃 정보를 사용하여 추정되고, 역양자화를 위한 양자화 조정 인자는 적응적으로 유도되고, 역양자화 처리는 유연하게 조정된다. 양자화 조정 정보가 비트 스트림으로 전송되는 종래 해결 수단과 비교하여, 본 발명에서 제공되는 방법 및 장치에 따르면, 양자화 조정 정보를 전송하기 위해 여분의 비트 오버 헤드가 필요하지 않으므로, 코딩 효율이 더욱 개선된다.

Description

비디오 코딩에서의 적응형 역양자화 방법 및 장치{ADAPTIVE INVERSE-QUANTIZATION METHOD AND APPARATUS IN VIDEO CODING}
본 발명은 데이터 처리 분야에 관한 것으로서, 보다 상세하게는, 비디오 코딩에서의 역양자화 방법 및 장치에 관한 것이다.
현재, H.264/AVC, H.265/HEVC, 및 AVS(Audio Video Coding Standard)과 같은 비디오 코딩 표준과 같이, 다수의 비디오 코딩 기술이 있다. 전술 한 비디오 코딩 표준은 일반적으로 하이브리드 코딩 프레임 워크(hybrid coding framework)를 사용하고, 하이브리드 코딩 프레임 워크는 주로: 예측(prediction), 변환(transform), 양자화(quantization), 엔트로피 코딩(entropy coding) 등과 같은 단계를 포함한다.
예측 단계에서, 코딩된 영역의 재구성 화소(reconstructed pixel)는 현재 코드 블록(code block)에 대응하는 원래 화소(original pixel)에 대한 예측 화소(predicted pixel)를 생성하는데 사용된다. 두 가지 주요 유형의 예측 방식에 인트라 예측(intra prediction) 및 인터 예측(inter prediction)이 포함된다. 인트라 예측을 위해, 현재 코드 이미지 내의 현재 코드 블록의 공간적 이웃(spatial neighborhood)한 재구성 화소는 현재 코드 블록의 예측 화소, 예를 들어, 수평(horizontal), 수직(vertical), 또는 다른 H.264/AVC 에서의 다방향 예측(multi-directional prediction), 템플릿 매칭(template matching) 및 인트라 모션 보상(intra motion compensation)에 기반을 둔 예측 방식의 예측 화소를 생성하는 데 사용된다. 인터 예측을 위해, 하나 이상의 코딩 된 이미지에서, 현재 코드 블록에 대응하는 재구성 화소는 현재 코드 블록의 예측 된 화소, 예를 들어, 모션 보상(motion compensation)에 기초한 예측 방식으로 예측된 화소로서 사용된다. 인터 예측은 단방향 예측(unidirectional prediction)과 양방향 예측(bidirectional prediction)의 두 가지 형식을 포함한다. 단방향 예측을 위해, 하나의 코딩 된 이미지의 재구성 화소는 현재 코드 블록의 예측 화소를 생성하기 위해 사용되고, 양방향 예측을 위해 두 개의 코딩 된 이미지에서, 재구성 화소는 현재 코드 블록의 예측 화소를 생성하는 데 사용된다.
원래 화소와 예측 화소의 화소 값 차를 레지듀얼(residual)이라 한다. 레지듀얼의 코딩 효율을 향상시키기 위해, 일반적으로 레지듀얼은 먼저, 변형 및 변환되어 변환 계수(transform coefficient)로 변환된다. 공통 변환은 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), 웨이블릿 변환(wavelet transform) 등을 포함한다. 다음으로, 예를 들면 벡터 양자화(vector quantization) 또는 스칼라 양자화(scalar quantization)에 의해 양자화 처리가 변환 계수에 대해 수행된다. 그런 다음, 양자화된 변환 계수 및 인코딩 모드 정보(예를 들어, 코드 블록 크기, 예측 모드, 및 모션 벡터)가 엔트로피 코딩 처리에 의해 비트 스트림으로 변환된다. 일반적인 엔트로피 부호화 방법은 산술 코딩(arithmetic coding), VLC(variable length coding), 고정 길이 코딩(fixed length coding), 런 랭스 코딩(run-length coding) 등을 포함한다.
변환 계수는 스칼라 양자화 방식(scalar quantization manner)으로 양자화될 수 있다. 현재 코드 블록의 레지듀얼의 N 개의 변환 계수 중 i번째 변환 계수를
Figure pct00001
(1≤
Figure pct00002
≤ N, N은 변환 블록 사이즈와 관련되고, 통상 16, 64, 1024 등)으로 표시하면, 양자화 변환 계수
Figure pct00003
는,
Figure pct00004
이고, 여기에서,
Figure pct00005
Figure pct00006
의 심볼, 즉,
Figure pct00007
이고,
Figure pct00008
는 라운딩 연산(rounding operation)이며 일반적으로 라운딩 다운(rounding down), 라운딩 오프(rounding off), 및 라운딩 업(rounding up) 중 하나 일 수 있다.
Figure pct00009
Figure pct00010
의 절대값 또는
Figure pct00011
의 진폭을 나타낸다.
Figure pct00012
는 변환 계수
Figure pct00013
에 대응하는 양자화 스텝(quantization step)을 나타내고,
Figure pct00014
은 라운딩 오프셋(rounding offset)이다.
비디오 디코딩은 비트 스트림을 비디오 이미지로 변환하는 프로세스이며, 엔트로피 디코딩(entropy decoding), 예측, 역양자화(dequantization) 및 역변환(inverse transform)과 같은 몇 가지 주요 단계를 포함합니다. 우선, 비트 스트림은 엔트로피 디코딩 처리에 의해 파싱(parsing)되어 인코딩 모드 정보 및 양자화된 변환 계수를 얻는다. 다음으로, 한편으로는, 인코딩 모드 정보 및 디코딩된 재구성 화소를 사용하여 예측 화소가 획득되고, 한편으로, 역양자화가 양자화된 변환 계수에 대해 수행되어 재구성된 변환 계수를 획득하고, 역변환이 재구성된 변환 계수에 대해 수행되어 재구성된 레지듀얼 정보를 획득한다. 그 후, 비디오 이미지를 복원하기 위해, 재구성된 레지듀얼 정보가 예측 화소에 가산된다.
역양자화는 양자화된 변환 계수
Figure pct00015
에 대해 수행되어 재구성된 변환 계수
Figure pct00016
를 획득하는데, 이는 다음의 수학식 1
Figure pct00017
여기에서,
Figure pct00018
는 플로팅 포인트 번호(floating-point number)일 수 있고,
Figure pct00019
은 라운딩 오프셋(rounding offset)이다. 일반적으로 플로팅 포인트 연산을 사용하지 않으려면, 플로팅 포인트 곱셈을 정수 가산 및 이동 방식으로 대체한다. 예를 들어, H.265/HEVC에서, 수학식 1에 설명된 역양자화 프로세스는 다음 수학식 2:
Figure pct00020
여기에서,
Figure pct00021
는 시프팅 파라미터(shifting parameter)이고,
Figure pct00022
는 정수이며,
Figure pct00023
는 수학식 1의 양자화 스텝
Figure pct00024
에 근사화된다. 이런 방식으로,
Figure pct00025
=0.5이며, 라운딩 방식은 라운딩 다운이다.
Figure pct00026
는 이하의 수학식 3과 같이, 레벨 스케일(levelScale)
Figure pct00027
및 스케일링 인자(scaling factor)
Figure pct00028
에 의해 공통으로 결정된다.
Figure pct00029
Figure pct00030
는 양자화 파라미터(QP:Quantization Parameter)즉,
Figure pct00031
이고, 여기에서, 레벨 스케일링 리스트(level scaling list)
Figure pct00032
이고, k=0, 1,…., 5이며,
Figure pct00033
Figure pct00034
가 6으로 나누어진 후의 라운딩(rounding)이고,
Figure pct00035
는 REM 연산이다.
일반적으로, 역양자화는 양자화 스텝과 직접 관련되며, 양자화 스텝은 QP, 스케일링 인자, 및 레벨 스케일링리스트의 영향을 받는다. 양자화 스텝은 여러 방식으로 조정될 수 있다. 예를 들어, 스케일링 인자 및 레벨 스케일링 리스트가 고정되어있는 경우, 양자화 파라미터의 각 레벨은 양자화 스텝에 대응한다. H.264/AVC 및 H.265/HEVC는 52레벨의 양자화 파라미터를 규정한다. 따라서, 양자화 스텝은 양자화 파라미터를 변경함으로써 조정될 수 있다. 다른 예로서, 양자화 스텝은 스케일링 인자를 조정하여 변경될 수 있다. 전형적으로, 스케일링 인자를 결정하기 위해, 양자화 행렬이라고도 하는 다중 스케일링 인자 행렬 중 하나가 선택될 수 있다. 전술한 두 가지 예에서 상이한 데이터가 변경되었지만, 양자화 스텝은 본질적으로 조정된다.
손실 인코딩의 경우, 재구성 화소와 원래 화소는 다를 수 있으며, 이 둘의 차이를 왜곡이라 한다. 휘도 마스킹 효과(luminance masking effect) 및 콘트라스트 마스킹 효과(contrast masking effect)와 같은 다수의 시각적 마스킹 효과(visual masking effect)로 인해, 인간의 눈에 의해 관찰되는 왜곡 강도는 왜곡이 위치하는 배경의 특징과 밀접하게 관련된다. 즉, 인간의 눈의 왜곡에 대한 민감도는 배경 휘도 및 왜곡 위치의 배경 콘트라스트와 관련된다. 일반적으로, 왜곡 감도와 배경 휘도는 U 자형의 곡선 관계를 나타내고, 왜곡 감도와 배경의 분산(variance) 또는 표준 편차(standard deviation)는 단조 감소 관계(monotonically decreasing relationship)를 나타낸다. 비디오 코딩에서의, 전술 한 시각적 특징을 참조하면, 왜곡에 대한 시각적 민감도의 영역(즉, 상대적으로 작은 왜곡 민감도의 영역)에서 이러한 양자화 스텝은 증가하고, 양자화 스텝은 왜곡에 대한 시각적 민감도의 영역에서 감소 된다. 따라서, 균일한 양자화 스텝과 비교하여, 코딩 왜곡 할당은 인간의 눈에 대한 시각적 인식에 더욱 적합할 수 있고, 주관적 품질은 동일한 비트 레이트에서 개선, 즉 코딩 효율이 개선된다.
종래 기술에서 제공되는 양자화 스텝을 조정하는 방법은 다음과 같다.
인코더에서, 비디오 시퀀스가 분석되고, 각 코드 블록의 변환 계수에 대응하는 양자화 파라미터 QP(quantization parameter)가 결정되고, 양자화 파라미터 또는 슬라이스 양자화 파라미터(slice QP)에 대한 양자화 파라미터의 오프셋(delta QP)이 비트 스트림에 기록된다. 디코더에서, 각 코드 블록의 양자화 스텝은 파싱방식으로 획득된 양자화 파라미터에 따라 조정된다.
전술 한 기존의 기술적 해결 수단에서, 인코더에서 양자화 파라미터가 결정되고, 비트 스트림에서 양자화 파라미터 정보가 전송되어, 디코더는 각 코드 블록의 양자화 스텝 조정 값을 학습하여 적응 양자화 스텝 조정을 구현한다. 그러나 양자화 파라미터에 대응하는 부가 정보(side information)는 코딩 효율의 향상을 어느 정도 제한한다.
본 발명은 비디오 코딩에서의 적응형 역양자화 방법 및 장치를 제공한다. 본 발명이 제공하는 방법 및 장치에 따르면, 양자화 파라미터에 대응하는 부가 정보가 코딩 효율 개선을 어느 정도 제한한다는 종래 기술의 문제점이 해소된다.
제1 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 방법이 제공되고, 이러한 방법은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -; 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하는 단계; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면을 참조하면, 구현 가능한 제1 방식에서, 구현 가능한 제2 방식에서, 상기 디코딩된 화소 정보는, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 이미지 영역의 화소 정보를 더 포함한다.
제1 측면 또는 구현 가능한 제1 방식을 참조하면, 제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 화소 분산(pixel variance:
Figure pct00036
)의 제2 함수
Figure pct00037
에 따라 상기 양자화 조정 인자를 계산하는 단계를 포함하고, 상기 화소 분산
Figure pct00038
는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 화소 분산
Figure pct00039
및 화소 평균
Figure pct00040
의 결합 함수
Figure pct00041
에 따라, 상기 양자와 조정 인자를 계산하는 단계를 포함하고, 상기 화소 평균
Figure pct00042
는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산
Figure pct00043
는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 최대 화소 값(maximum pixel value:
Figure pct00044
) 및 최소 화소 값(minimum pixel value:
Figure pct00045
) 간 차의 제3 함수
Figure pct00046
에 따라 상기 양자화 조정 인자를 계산하는 단계를 포함하고, 상기 최대 화소 값
Figure pct00047
는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제7 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 간 대응 관계임-; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제8 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하는 단계; 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제9 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하고, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제10 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고, 제3 변환 계수 세트 내의 계수를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하는 단계를 포함한다.
제2 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 방법을 제공하고, 이러한 방법은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역 X를 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역 X의 시간적 이웃 화소 정보(temporal neighborhood pixel information)를 획득하는 단계; 제1 평균
Figure pct00048
및 제1 분산에 따라, 양자화 조정 인자를 계산하는 단계; - 상기 제1 평균
Figure pct00049
는, 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 제1 분산에
Figure pct00050
는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분임 -; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제2 측면을 참조하면, 구현 가능한 제1 방식에서, 상기 제1 평균
Figure pct00051
및 제1 분산
Figure pct00052
에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제1 평균
Figure pct00053
및 제1 분산
Figure pct00054
의 결합 함수
Figure pct00055
에 따라, 상기 양자화 조정 인자를 계산하는 단계를 포함한다.
제2 측면 또는 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 사이의 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터를 획득하는 단계; 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라, 레벨 스케일(level scale)을 결정하고, 상기 레벨 스케일을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링을 수행하고 제2 양자화 스텝을 획득하며, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수에 역양자화를 수행하는 단계를 포함한다.
제2 측면, 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 상기 제1 양자화 스텝을 사용하여 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고 제3 변환 계수 세트를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여 상기 제3 변환 계수 세트 내의 계수에 스케일링을 수행하는 단계를 포함한다.
제3 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 장치가 제공되고, 이러한 장치는, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하도록 구성된 결정 유닛 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성된 획득 유닛 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -; 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하도록 구성된 계산 유닛; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된 역양자화 유닛을 포함한다.
제3 측면을 참조하면, 구현 가능한 제1 방식에서, 상기 획득 유닛은 추가로, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 디코딩된 화소 정보로부터 상기 이미지 영역의 화소 정보를 획득하도록 구성된다. 제3 측면 또는 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 화소 평균
Figure pct00056
의 제1 함수
Figure pct00057
에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 화소 평균
Figure pct00058
은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분(color space component)의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 상기 계산 유닛은 구체적으로, 화소 평균
Figure pct00059
의 제1 함수
Figure pct00060
에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 화소 평균
Figure pct00061
은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분(color space component)의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 계산 유닛은 구체적으로, 화소 분산(pixel variance:
Figure pct00062
)의 제2 함수
Figure pct00063
에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 화소 분산
Figure pct00064
는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응한다.
제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 계산 유닛은 구체적으로, 화소 분산
Figure pct00065
및 화소 평균
Figure pct00066
의 결합 함수
Figure pct00067
에 따라, 상기 양자와 조정 인자를 계산하도록 구성되고, 상기 화소 평균
Figure pct00068
는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산
Figure pct00069
는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 계산 유닛은 구체적으로, 최대 화소 값(maximum pixel value:
Figure pct00070
) 및 최소 화소 값(minimum pixel value:
Figure pct00071
) 간 차의 제3 함수
Figure pct00072
에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 최대 화소 값
Figure pct00073
는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 역양자화 유닛은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하고, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되며, 상기 제1 대응 관계는, 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계이다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제7 방식에서, 상기 역양자화 유닛은 구체적으로, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 상기 제2 대응 관계는, 양자화 조정 인자와 양자화 행렬 간 대응 관계이다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제8 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고, 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제9 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제10 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된다.
제4 측면에 따르면, 비디오 코딩에서의 적응형 역양자 장치를 제공하고 이러한 장치는, 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역(X)을 결정하도록 구성된 결정 유닛 - 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수임 -; 이미지 영역(X)의 시간적 이웃 화소 정보를 획득하도록 구성된 제1 획득 유닛; 제1 평균
Figure pct00074
및 제1 분산
Figure pct00075
에 따라, 양자화 조정 인자를 계산하도록 구성된 계산유닛 - 제1 평균
Figure pct00076
은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 색 공간 성분의 평균이며, 제1 분산
Figure pct00077
는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분 임 -; 및 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행하도록 구성된; 제1 역양자화 유닛을 포함한다.
제2 측면을 참조하면, 구현 가능한 제1 방식에서, 계산 유닛은 구체적으로, 화소 평균
Figure pct00078
및 화소 분산
Figure pct00079
의 결합 함수
Figure pct00080
에 따라 계산하도록 구성되며, 화소 평균
Figure pct00081
은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 컬러 공간 성분의 평균이고, 화소 분산
Figure pct00082
는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 컬러 공간 성분의 분산이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 제1 역양자화 유닛은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트를 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 제1 역양자화 유닛은 구체적으로 미리 설정된 제2 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 양자화 행렬에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이다.
제4 측면 또는 제4 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고, 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제4 측면, 또는 제4 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된다.
전술한 기술적 해결 수단의 하나 또는 둘은 적어도 이하의 기술적 효과를 가진다.
본 발명의 실시 예들에서 제공되는 기술적 해결수단에 따르면, 변환 블록의 공간적 인접 정보를 이용하여 현재 변환 블록이 위치하는 배경 영역의 통계적 특징을 추정하고, 역 양자화를 위한 양자화 조정 인자를 적응적으로 도출하며, 역양자화 처리가 유연하게 조정된다. 본 발명의 실시예에서 제공되는 기술적 해결 수단에서의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도가 인간 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다.
도 1은 본 발명의 일 실시예에 따른 비디오 코딩에서의 적응형 역양자화 방법의 개략적 흐름도이다.
도 2는 본 발명의 실시예에 따른 이미지 영역의 제1 공간적 이웃 화소의 개략도이다.
도 3은 본 발명의 일 실시예에 따른 이미지 영역의 제2 공간적 이웃 화소의 개략도이다.
도 4는 본 발명의 다른 실시예에 따른 비디오 코딩에서의 적응형 역양자화 방법의 개략적 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 비디오 코딩에서의 적응형 역양자화 장치의 개략적 구조도이다.
종래 기술에서, 양자화 파라미터는 인코더에서 결정되고 양자화 파라미터 정보를 비트 스트림으로 전송하여 각 코드 블록의 양자화 스텝 조정 값을 학습하여 적응형 양자화 스텝 조정을 구현하였다. 그러나 양자화 파라미터에 대응하는 부가 정보는 코딩 효율의 향상을 어느 정도 제한한다. 따라서, 종래 기술의 문제점을 해결하기 위하여, 본 발명의 실시예는 비디오 코딩에서의 적응형 역양자화 방법을 제공하며, 이하의 단계를 포함한다.
현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하는 단계 - 제1 변환 계수 세트는 N 개의 변화 계수를 포함하고, 변환 계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이며, N은 양의 정수임 -;
이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 디코딩된 화소 정보는 이미지 영역의 공간적 이웃 화소 정보를 포함함 -;
디코딩된 화소 정보에 따라 양자화 조정 인자를 계산하는 단계; 및
제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함한다.
본 발명의 본 실시예에서 제공하는 해결 수단에 따르면, 변환 블록의 공간적 이웃 정보를 이용하여 현재의 변환 블록이 위치하는 배경 영역의 통계적 특징을 추정하고, 양자화 조정 인자를 적응적으로 도출하며, 역양자화 처리를 유연하게 조정한다. 한편으로, 본 발명의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도는 인간의 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다.
한편, 비트 스트림에서 양자화 조정 정보가 전송되는 기존의 해결수단과 비교하여, 본 발명의 실시예에서 제공되는 해결수단에 따르면, 엑스트라 비트 오버 헤드(extra bit overhead)가 양자화 조정 정보를 전송할 필요가 없기 때문에 코딩 효율을 더 향상시킨다.
본 발명의 실시예의 목적, 기술적 해결 수단, 및 장점을 보다 명확하게 하기 위해, 본 발명의 실시예에서 첨부된 도면들을 참조하여 본 발명의 실시예의 기술적 해결수단을 다음과 같이 명확하고 완전하게 설명한다. 명백하게, 기술된 실시예는 본 발명의 일부 실시예에 불과하지며 전부는 아니다. 창의적인 노력 없이 본 발명의 실시예에 기초하여 당업자에 의해 획득된 다른 모든 실시예는 본 발명의 보호 범위 내에 있다.
실시예
도 1에 도시된 바와 같이, 본 발명의 일 실시예는 비디오 코딩에서의 적응형 역양자화 방법을 제공하며, 이러한 방법은 다음 단계를 포함한다.
단계 101: 현재 디코딩된 이미지에서 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환 계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수이다.
본 발명의 본 실시예에서, 제1 변환 계수 세트는 N 개의 변환 계수
Figure pct00083
를 포함할 수 있고, N은 양의 정수, 예를 들어 N = 1, 2, 4, 16, 32, 50, 64, 81, 128, 256, 512 또는 1024이다. 변환 계수
Figure pct00084
는 현재 디코딩된 이미지에서 임의의 색 공간 성분의 변환 계수, 예를 들면 휘도 성분의 변환 계수, 색차 성분(chrominance component)의 변환 계수, 및 RGB 성분 중 어느 하나(예를 들면, R 성분)의 변환 계수이다.
현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역은 제1 변환 계수 세트에 대응하는 영역이다. 예를 들어, H.264/AVC 또는 H.265/HEVC 표준에 대응하는 하이브리드 코딩 프레임 워크(hybrid coding framework)에서, 제1 변환 계수 세트에 대응하는 이미지 영역은, 제1 변환 계수 세트에 대응하는, 변환 블록(transform block) 또는 변환 유닛(transform unit)에 의해 커버 되는 이미지 영역이다. 본 발명의 실시예에서, 제1 변환 계수 세트는 하나의 변환 블록의 모든 변환 계수 또는 하나의 변환 블록의 일부 변환 계수, 예를 들어, 다이렉트 현재 계수(direct current coefficient) 또는 저주파 계수의 그룹, 또는 고주파 계수의 그룹, 또는 다이렉트 현재 계수와 고주파 계수의 그룹을 포함할 수 있거나, 또는 하나의 변환 블록 내의 구체적 계수 스캐닝 시퀀스(coefficient scanning sequence)에서의 처음 몇몇 계수들을 포함 할 수있다.
단계 102: 이미지 영역의 디코딩된 화소 정보를 획득하고, 디코딩된 화소 정보는, 이미지 영역의 공간적 이웃 화소 정보를 포함한다.
본 발명의 실시예에서, 공간적 이웃 화소 정보는, 이미지 영역과 동일한 디코딩된 이미지의 프레임 내의 화소 정보에 관한 것이고, 서로 다른 디코딩 조건에 따라 인접 화소의 위치 및 범위를 적응적으로 조정된다.
공간적 이웃 화소 정보는 이미지 영역(X)의 공간적으로 인접한 적어도 하나의 화소의 재구성 값 및/또는 이미지 영역(X)의 공간적으로 인접한 화소 정보에 따라 생성된 적어도 하나의 인트라 예측 화소의값를 포함할 수 있다.
디코딩된 화소 정보가 공간적 이웃 화소 정보인 경우, 공간적 이웃 화소 정보는 M 개의 화소를 포함할 수 있고, M은 양의 정수이며, 공간적 이웃 화소 정보는 다음 화소 정보 중 적어도 하나를 포함한다.
(1) 이미지 영역(X)의 공간적 이웃 영역(Y1)(공간적 이웃 영역(Y1)의 몇몇 선택적인 예가 도 2에 도시됨)의 화소 정보는 공간적 이웃 영역(Y1)에서의 적어도 하나의 화소의 재구성 값을 포함하고, 공간적 이웃 영역(Y1)의 특정 경우는 다음과 같을 수 있다
공간적 이웃 영역(Y1)은 X의, 상부, 하부, 좌측, 또는 우측 경계의 적어도 하나의 경계에 인접한 영역, 예를 들어, X의, 좌측 경계와 상부 경계 양쪽에 인접한 L- 모양 영역(도 2에 도시된, 실시예 a 및 b), 또는 영역(X)의 상부 경계, 좌측 경계, 또는 우측 경계 중 어느 하나에 인접한 직사각형 영역(도 2에 도시된, 실시 예 c, 실시 예 d, 및 실시예 e), 또는 영역(X)을 포함하는 직사각형 영역에서 X가 제거된 영역(도 2의 실시예 f)와 같을 수 있다.
(2) 이미지 영역(X)의 공간적 이웃 영역 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 적어도 하나의 인트라 예측 화소는, 구체적으로 이하:
인트라 예측 방식으로, 이미지 영역(X)의 공간적 이웃 영역(Y2) 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 예측 화소 정보 (이미지 영역(X)의 공간적 이웃 영역(Y2)의 몇 가지 선택적 예가 도 3에 도시됨)를 포함한다.
인트라 예측 방식은, 예를 들면, H.265/HEVC에서의, 방향 기반 인트라 예측 모드(direction-based intra-prediction mode), DC 예측 모드, 및 평면 예측 모드이며, 다른 예로서, 템플릿 매칭(template matching) 방법 또는 인트라 움직임 보상(Intra Motion Compensation)을 포함 할 수 있다.
이미지 영역(X)의 예측 화소 정보는, 적어도 1개의, 이미지 영역(X)의 인트라 예측 화소를 포함하고, 공간적 이웃 영역(Y2)은 공간적 이웃 영역(Y1)이거나 또는, 공간적 이웃 영역(Y1)을 제외한 영역, 예를 들어, 공간적 이웃 영역(Y2)은 X의 좌측 경계선 및 상부 경계선에 인접한 L 자형 영역(도 3의 실시예 a 및 b 도시됨)이거나, (도 3의 실시예 c 및 d와 같이) X의, 좌측 또는 상부 영역에서 X와 동일 크기를 가진 직사각형 영역, 또는 X를 포함하는 직사각형 영역에서 X가 제거된 후 획득된 영역의 일부(도 3의 실시예 e)를 포함할 수 있다.
단계 103: 디코딩된 화소 정보에 따라 양자화 조정 인자를 계산한다.
본 발명의 실시예에서, 역양자화 동안, 적응성 역양자화 효과를 달성하기 위해, 양자화 조정 인자는 디코딩된 화소 정보의 일부 특징을 반영할 수 있는 파라미터를 사용함으로써 계산된다. 본 발명의 실시 예에서, 양자화 조정 인자는 디코딩된 화소의 통계적 특징을 반영하는 파라미터를 사용하여 계산될 수 있는데, 이는 구체적으로 다음을 포함한다.
디코딩된 화소 정보의 통계적 특징은, 디코딩된 화소 정보에서 복수의 화소의 화소 값과 통계적으로 분석된 후 얻어지는 값 결과를 의미하며, 통계적 특징을 갖는 파라미터는 화소 평균
Figure pct00085
, 화소 분산(pixel variance)
Figure pct00086
, 최대 화소 값
Figure pct00087
, 또는 최소 화소 값
Figure pct00088
을 포함할 수 있다.
단계 104: 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다.
더욱 정확하고 안정된 통계적 특징 계산을 위해, 더 많은 디코딩된 화소 정보를 얻기 위해, 본 발명의 실시 예에서 디코딩된 화소 정보는, 이미지 영역(X)의 시간적 이웃 화소 정보를 더 포함할 수 있다. 시간적 이웃 화소 정보는, 현재 디코딩된 이미지가 위치하는 이미지의 앞 또는 뒤의 코딩 된 이미지의 하나 이상의 프레임을 포함하고, 시간적 이웃 화소 정보는 이하의 2 개:
(1) 코딩된 다른 이미지 내의 이미지 영역(X)의 대응하는 영역에서 적어도 하나의 화소의 재구성 값 또는 보간 필터링(interpolation filtering)에 의해 획득된 부화소 정확도(sub-pixel accuracy)의 재구성 된값
대응하는 영역은 이미지 영역(X)의 모션 벡터(motion vector)에 따라, 그리고 공통 모션 보상 프로세싱(common motion compensation processing)에 의해 획득될 수 있다. 특히, 이미지 영역(X)의 모션 벡터가 부화소 정확도 일 때, 모션 벡터를 정수값으로 반올림 한다음 움직임 보상을 하여 대응하는 영역을 구할 수 있다.
(2) 이미지 영역(X)에 대응하는, 적어도 2개의 코딩 된 이미지에서 대응하는 영역의 적어도 하나의 위치에서 화소의 재구성값의 가중 평균
을 포함한다.
예를 들어, 2개의 코딩된 이미지가 사용될 때, 2개의 코딩된 이미지 내에서 대응하는 영역은, 이미지 영역(X)의 모션 벡터를 사용하여 개별적으로 발견된다. 2개의 대응하는 영역 내의 동일한 위치에 있는 화소는 대응하는 화소이고, 대응하는 화소 그룹의 가중 평균은 시간적 이웃 화소 정보에서 화소로서 사용되며, 동일한 위치는, 정수 화소 위치 또는 서브 화소일 수 있다.
본 발명의 본 실시예에서, 디코더에서, 재구성된 공간적 이웃 화소 정보, 또는 재구성된 공간적 이웃 화소 정보와 재구성된 시간적 이웃 화소 정보의 조합은 현재 디코딩 블록에 대응하는 원래 화소 정보를 근사(approximate)하는데 사용되고, 양자화 조정 인자가 유도된다. 따라서, 이미지의 다른 영역의 레지듀얼 변환 계수를 적응적으로 변환하고 코딩 성능을 향상시킨다.
본 발명의 실시예에서 제공되는 기술적 해결수단에 따르면, 양자화 조정과 관련된 파라미터 정보가 비트 스트림으로 전송될 필요가 없다. 따라서 비트 레이트가 감소한다. 또한, 본 발명의 실시 예에서, 양자화 조정 인자는, 공간적 이웃 화소 정보만 사용하여 도출되며, 이것은 인트라 프레임 이미지 코딩에 적용될 수 있다. 본 발명의 실시 예에서 제공되는 방법 또한 프레임 간 이미지 코딩에도 적용 가능하다.
본 발명의 본 실시예에서의 디코딩된 화소 정보는 이미지 영역(X)의 공간적 이웃 화소 정보, 또는 시간적 이웃 화소 정보와 이미지 영역(X)의 공간적 이웃 화소 정보의 조합일 수 있고, 디코딩된 화소 정보는 상이한 콘텐츠를 포함할 수 있다. 따라서, 본 발명의 실시예에서, 양자화 조정 인자는 다양한 방식으로 디코딩된 화소 정보에 따라 계산될 수 있다. 구체적 구현은 이하를 포함한다.
첫째, 본 발명의 본 실시예에서, 양자화 조정 인자는, 디코딩된 화소 정보에 대응하는 파라미터: 화소 평균
Figure pct00089
, 화소 분산(pixel variance)
Figure pct00090
, 최대 화소 값
Figure pct00091
, 또는 최소 화소 값
Figure pct00092
에 따라 계산될 수 있다.
전술한 파라미터(화소 평균
Figure pct00093
, 화소 분산
Figure pct00094
, 최대 화소 값
Figure pct00095
, 또는 최소 화소 값
Figure pct00096
_)에 기초하여, 양자화 조정 인자
Figure pct00097
를 계산하는 구체적 방법은 이하의 방식 중 어느 하나가 사용될 수 있다.
방식 1: 양자화 조정 인자는, 화소 평균
Figure pct00098
의 제1 함수
Figure pct00099
에 따라 계산되고, 화소 평균
Figure pct00100
은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 색 공간 성분의 평균이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
디코딩된 화소가 공간적 이웃 화소 정보만 포함하는 경우, 화소 평균
Figure pct00101
은 구체적으로 이하이다.
화소 평균
Figure pct00102
은, 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 평균이거나, 공간적 이웃 화소 정보에서 복수의 화소의 동일한 신호 성분의 평균이며, 신소 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
디코딩된 화소가 공간적 이웃 화소 정보와 시간적 이웃 화소 정보의 조합인 경우, 화소 평균
Figure pct00103
은 구체적으로 이하와 같다.
화소 평균
Figure pct00104
은, 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보에서 복수의 화소의 휘도 성분의 평균, 또는 공간적 이웃 호소 정보 및 시간적 이웃 화소 정보 내에서 복수의 화소의 동일한 신호 성분의 평균이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
구체적 실시예에서, 제1 함수는,
Figure pct00105
일 수 있고, 예를 들어
Figure pct00106
=1 또는 0.5인,
Figure pct00107
이며,
Figure pct00108
Figure pct00109
에 대한 U자 모양의 함수일 수 있다.
Figure pct00110
에 대해,
Figure pct00111
가 임계치 T1보다 작으면,
Figure pct00112
의 1차 미분은 0보다 작고,
Figure pct00113
가 임계치 T2보다 크면,
Figure pct00114
의 1차 미분은 0보다 크며,
Figure pct00115
가 임계치 T1과 임계치 T2 사이에 있으면,
Figure pct00116
는 상수 C0와 같고, T1≥0, T2≥0, 및 T2=T1이며, T1은 0, 64, 또는 128일 수 있고, T2는 0, 80, 또는 170일 수 있으며, C0는 0.5, 0.75, 1, 1.5, 8, 16, 256, 또는 1024인 양의 실수일 수 있다. 더욱 구체적으로 함수
Figure pct00117
는 이하:
Figure pct00118
일 수 있고,
Figure pct00119
Figure pct00120
=150 또는 200.8인 양의 실수이고,
Figure pct00121
Figure pct00122
=425 또는 485.5와 같은 양의 실수일 수 있다. 다른 예를 들어, 함수
Figure pct00123
는 이하:
Figure pct00124
일 수 있고,
Figure pct00125
은 예를 들어,
Figure pct00126
=10240 또는 8135.6인 양의 정수이며,
Figure pct00127
Figure pct00128
=256 또는 135.1과 같은 양의 정수일 수 있다.
방식 2: 양자화 조정 인자는, 화소 분산
Figure pct00129
의 함수
Figure pct00130
에 따라 계산되고, 화소 분산
Figure pct00131
는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
디코딩된 호소가 공간적 이웃 화소 정만 포함하는 경우, 화소 분산
Figure pct00132
는 구체적으로 이하와 같다.
화소 분산
Figure pct00133
는, 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 분산 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 분산이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
디코딩된 화소가 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보의 조합이면, 화소 분산
Figure pct00134
는 구체적으로 이하와 같다.
화소 분산
Figure pct00135
는, 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분 분산, 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 분산이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
구체적 실시예에서, 양자화 조정 인자
Figure pct00136
는 화소 분산
Figure pct00137
의 제2 함수
Figure pct00138
에 따라 계산되고,
Figure pct00139
이며,
Figure pct00140
는 예를 들어 1 또는 0.8일 수 있고,
Figure pct00141
Figure pct00142
에 대한 모노톤 함수(monotone function)일 수 있다.
Figure pct00143
에 대해,
Figure pct00144
가 임계치 T3보다 적으면,
Figure pct00145
는 상수 C3이고,
Figure pct00146
가 임계치 T3와 같거나 그보다 크면,
Figure pct00147
의 1차 미분은 0보다 크며, T3≥0이고, T3는 예를 들어, 0, 3, 5, 또는 10일 수 있으며, 예를 들어,
Figure pct00148
=1/2 또는 1인
Figure pct00149
>0이고, C3는 예를 들어, 0.5, 0.8, 1, 16, 32, 또는 256인 양의 실수 일수 있다. 더욱 구체적으로, 함수
Figure pct00150
는 이하:
Figure pct00151
일수 있고,
Figure pct00152
는 양의 실수, 예를 들어,
Figure pct00153
=10, 20, 253, 80, 또는 100일 수 있다.
방식 3: 양자화 조정 인자는 최대 화소 값
Figure pct00154
과 최소 화소 값
Figure pct00155
사이의 차인, 제3 함수
Figure pct00156
에 따라 계산되고, 최대 화소 값
Figure pct00157
은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 색 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
양자화 조정 인자
Figure pct00158
는 화소 평균
Figure pct00159
의 제1 함수
Figure pct00160
및 화소 분산
Figure pct00161
의 제2 함수
Figure pct00162
의 결합 함수
Figure pct00163
에 의해 계산되고,
Figure pct00164
, 예를 들어,
Figure pct00165
=1 및
Figure pct00166
=1, 또는
Figure pct00167
=0.5 및
Figure pct00168
=1.5, 또는
Figure pct00169
=2 및
Figure pct00170
=1이다.
방식 4: 양자화 조정 인자는 최대 화소 값
Figure pct00171
과 최소 화소 값
Figure pct00172
사이의 차인, 함수
Figure pct00173
에 의해 계산되고, 최대 화소 값
Figure pct00174
는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 색 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값 또는 복수의 화소의 동일한 색 공간 성분의 최소값이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
디코딩된 화소가 공간적 이웃 화소만 포함하는 경우, 최대 화소 값
Figure pct00175
과 최소 화소 값
Figure pct00176
은 구체적으로 이하와 같다.
최대 화소 값
Figure pct00177
은 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최대값 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최대값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
최소 화소 값
Figure pct00178
은 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최소값 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최소값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
디코딩된 화소가 공간적 이웃 화소 및 시간적 이웃 화소 정보의 조합인 경우, 최대 화소 값
Figure pct00179
과 최소 화소 값
Figure pct00180
은 구체적으로 이하와 같다.
최대 화소 값
Figure pct00181
은 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최대값 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최대값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
최소 화소 값
Figure pct00182
은 공간적 이웃 화소 정보 내 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최소값 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최소값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
구체적 실시예에서, 양자화 조정 인자
Figure pct00183
는 양자화 조정 인자는 최대 화소 값
Figure pct00184
과 최소 화소 값
Figure pct00185
사이의 차인, 함수
Figure pct00186
에 의해 계산된다. 제3 함수는 단조 증가 함수(monotonically increasing function)일 수 있고, 예를 들어 이하:
Figure pct00187
이고, C4는 양의 실수, 예를 들어, 0.5, 1, 16, 32, 또는 256일 수 있고,
Figure pct00188
는 양의 실수, 예를 들어,
Figure pct00189
=1 또는 1/2이며,
Figure pct00190
는 양의 실수, 예를 들어,
Figure pct00191
=20 또는
Figure pct00192
=C4/2이다.
전술한 4개의 방식 중 어느 하나에 따라, 양자화 조정 인자
Figure pct00193
가 획득된 후, 선택적으로, 값 제한 처리가 추가로 양자화 조정 인자
Figure pct00194
에 수행될 수 있고,
Figure pct00195
는 미리 설정된 값 범위에 대응한다. 예를 들어,
Figure pct00196
는 미리 설정된 값 범위 즉, 이하:
Figure pct00197
로 제한된다.
Figure pct00198
Figure pct00199
는 양의 실수, 예를 들어,
Figure pct00200
=0.5이고
Figure pct00201
=2 또는
Figure pct00202
=0.6이고
Figure pct00203
=1.5이다.
다른 실시예에서,
Figure pct00204
는, 매핑 함수를 사용하여 값 범위로 매핑되고, 이러한 매핑 함수는 예를 들어 이하:
Figure pct00205
이고,
Figure pct00206
,
Figure pct00207
,
Figure pct00208
, 및
Figure pct00209
은 실수, 예를 들어,
Figure pct00210
=1.0 ,
Figure pct00211
=0.5,
Figure pct00212
=1.5, 및
Figure pct00213
=1.0, 또는
Figure pct00214
=1.1 ,
Figure pct00215
=0.4,
Figure pct00216
=1.2, 및
Figure pct00217
=1.15이다.
전술한 파라미터, T1, T2, T3, C0, C3, C4,
Figure pct00218
,
Figure pct00219
,
Figure pct00220
,
Figure pct00221
,
Figure pct00222
,
Figure pct00223
,
Figure pct00224
,
Figure pct00225
,
Figure pct00226
,
Figure pct00227
, 및
Figure pct00228
은 미리 설정된 상수 또는 비디오 화상의 통계적 특징에 따른 계산의 방식으로 획득되거나 또는 비디오 비트스트림으로부터 추출될 수 있다.
본 발명의 본 실시예에서, 단계 104에서 역양자화 처리는 다양한 방식으로 구현될 수 있다. 이하에서 가능한 몇가지 방법을 제공한다.
방식 1: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 스케일링은, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 수행되어 제2 양자화 스텝을 획득하고, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 제2 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행된다. 구체적 구현 방식은 이하:
현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝
Figure pct00229
를 획득하는 단계; 및
Figure pct00230
를 획득하기 위해, 양자화 조정 인자에 따라 제1 양자화 스텝
Figure pct00231
에 스케일링을 수행하고, 제2 변환 계수 세트에서 변환 계수
Figure pct00232
를 획득하기 위해, 제1 변환 계수 세트 내의 변환 계수
Figure pct00233
에 역양자화를 수행하는 단계
와 같을 수 있다.
여기에서,
Figure pct00234
이고,
Figure pct00235
는 라운딩 상수(rounding constant), 예를 들어,
Figure pct00236
=0.5이다. 역양자화가 정수의 가산 및 이동에 의해 구현될 때, 이하의 수식:
Figure pct00237
이 사용될 수 있고,
Figure pct00238
는 제1 양자화 스텝의 정수 결과이고,
Figure pct00239
는 현재 디코딩된 이미지에 대응하는 신호 내에서 시프팅 비트(shifting bit) 수이며,
Figure pct00240
Figure pct00241
의 정수 결과(integer result), 예를 들어,
Figure pct00242
는 2의 정수 배수로
Figure pct00243
를 곱한 후 라운딩 방식(means of rounding)으로 획득되거나, 또는
Figure pct00244
Figure pct00245
를 직접 라운딩하여 획득되거나, 또는
Figure pct00246
의 정수 결과는, 화소 평균 및 화소 분산에 따라 테이블을 참조하여 획득될 수 있고,
Figure pct00247
는 시프팅 비트에 필요한 추가 수량이다.
방식 2: 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)가 미리 설정된 제1 대응 관계에 따라 결정되고, 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 역양자화가 제1 변환 계수 세트에 수행된다.
본 발명의 본 실시예에서, 양자화 조정 인자
Figure pct00248
와 복수의 레벨 스케일링 리스트 사이의 제1 대응 관계는 미리 설정될 수 있다.
더욱 구체적으로, QC의 값 범위는 미리 H1(H1은 1보다 큰 양의 정수, 예를 들어 H1 = 3, 5 또는 6) 간격으로 나누어지고, 각 간격은 미리 설정된 레벨 스케일링 리스트에 대응한다. 계산 방식에 의해 얻어진 양자화 조정 계수 QC가 속하는 값 간격(value interval)이 검색되고, 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서, 양자화 조정 인자(QC)가 속하는 값 간격에 대응하는 레벨 스케일링리스트가 선택된다.
예를 들어, QC와 레벨 스케일링리스트 간의 매핑 관계 테이블 (표 1) 은, 각각 6개의 엘리먼트를 포함하는 레벨 스케일링리스트에 대해, QC에 따라 하나의 레벨 스케일링리스트가 선택되는 예를 제공한다.
레벨 스케일링 리스트
QC≥1.5 {60,68,77,86,96,108}
1.2<QC<1.5 {54,61,69,77,86,97}
0.8≤QC≤1.2 {40,45,51,57,64,72}
0.6<QC<0.8 {28,32,36,40,45,50}
QC≤0.6 {24,27,31,34,38,43}
표 1에 주어진 예에 따르면, QC가 0.9일 때, QC가 속하는 값 범위는 0.8≤QC≤1.2로 검색되고, 값 범위 0.8≤QC≤1.2에 대응하는 레벨 스케일링 리스트{40, 45, 51, 57, 64, 72} 는 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서 선택된다.
방식 3: 양자화 조정 인자에 대응하는 타깃 양자화 행렬은, 미리 설정된 제2 대응 관계에 따라 결정되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 타깃 양자화 행렬에 따라 제1 변환 계수 세트에 수행된다.
QC의 값 범위는 미리 H2(H2는 1보다 큰 양의 정수, 예를 들어 H2 = 3, 5 또는 6) 간격으로 분할되고, 각 간격은 미리 설정된 양자화 행렬에 대응한다. QC가 속하는 값 간격이 검색되고, 대응하는 양자화 행렬이, 제1 변환 계수 세트에 역양자화가 수행되는 양자화 행렬로서 선택된다. 예를 들어, 표 2는
Figure pct00249
변환 블록을 제공한다.
QC<16 16≤QC≤64 QC>64
Figure pct00250
양자화 행렬
16,13,14,14,
13,14,16,16,
14,16,16,16,
14,16,16,16
16,16,16,16,
16,16,16,16,
16,16,16,16,
16,16,16,16
18,18,16,16,
18,18,20,16,
16,20,20,22,
16,16,22,16
표 2의 예에 따르면, 계산방식으로 얻어진 QC값이 18이고, QC가 속하는 값 범위가 표 2에 주어진 파라미터로부터 16≤QC≤64로 결정될 수 있다면, 제1 변환 계수 세트에 역양자화가 수행되는, 대응하는 4×4 양자화 행렬은 표 2의 제3행의 양자화 행렬이다.
방식 4: 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터는 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 타깃 양자화 파라미터 오프셋은 양자화 조정 인자에 따라 결정되며, 타깃 양자화 파라미터 오프셋은 제1 양자화 파라미터에 추가되어 제2 양자화 파라미터를 획득되고, 레벨 스케일은 제2 양자화 파라미터에 따라 결정되고, 제2 변환 계수 세트를 획득하기 위해, 레벨 스케일을 사용하여 제1 변환 계수 세트에 역양자화가 수행된다.
레벨 스케일
Figure pct00251
을 이용하여 설정되는 제1 변환 파라미터에 대한 역양자화는 구체적 이하의 식:
Figure pct00252
,
Figure pct00253
, 및
Figure pct00254
을 사용하여 구현될 수 있고,
Figure pct00255
는 라운딩 오프셋(rounding offset)이다.
방식 5: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은, 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 역양자화가 1 양자화 스텝을 사용하여, 제1 변환 계수 세트 내의 계수에 수행되어 제3 변환 계수 세트 내의 계수를 획득하고, 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 양자화 조정 인자를 사용하여, 스케일링은 제3 변환 계수 세트 내의 계수에 수행된다.
구체적 구현은 이하:
먼저, 제1 양자화 스텝
Figure pct00256
를 사용하여 제1 변환 계수 세트에 역양자화를 수행하여 제3 변환 계수 세트
Figure pct00257
, 즉,
Figure pct00258
를 획득한 다음,
Figure pct00259
에 스케일링 및 라운딩을 수행하여 제2 변환 계수
Figure pct00260
즉,
Figure pct00261
를 획득하고,
Figure pct00262
Figure pct00263
는 라운딩 오프셋이다.
제1 양자화 파라미터
Figure pct00264
는, 제1 변환 계수 세트가 위치하는 변환 블록의,
고, 현재 디코딩된 이미지, 예를 들어, 프레임 레벨 양자화 파라미터에 대응하는 신호에 의해 지시되는 디폴트 양자화 파라미터이다.
본 발명의 본 실시예에서 제공되는 해결수단에 따르면, 디코더에서, 재구성 된 공간적 이웃 화소 정보, 또는 재구성된 공간적 이웃 화소 정보와 재구성된 시간적 이웃 화소 정보의 조합은, 현재의 디코딩 블록에 대응하는 원래 화소 정보에 근사하기 위해 사용되며, 양자화 조정 인자가 유도됨으로써, 이미지의 상이한 영역의 레지듀얼 변환 계수의 양자화 스텝이 적응적으로 조정되며, 코딩 성능이 향상된다.
실시예
도 4에 도시된 바와 같이, 본 발명의 다른 실시예는 추가로, 비디오 코딩에서의 적응형 역양자화 방법을 제공하고, 이러한 방법은 이하를 포함한다.
단계 401: 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역(X)을 결정하고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수이다.
본 실시예에서, 제1 변환 계수 세트는 휘도 성분 변환 블록의 모든 교류 계수(alternating current coefficient) 또는 휘도 성분 변환 블록의 모든 계수를 포함할 수 있다.
단계 402: 이미지 영역(X)의 시간적 이웃 화소 정보를 획득한다.
시간적 이웃 화소 정보는, 코딩된 다른 이미지의 이미지 영역(X)의 대응하는 영역 내의 적어도 하나의 화소의 재구성 값 또는 보간 필터링에 의해 획득된 부화소 정확도 재구성 값, 및/또는 이미지 영역(X)에 대응하는, 적어도 2개의 디코딩 된 이미지에서 대응하는 영역 내의 적어도 하나의 위치에서, 화소의 재구성 값의 가중 평균을 계산한다.
코딩된 다른 이미지에서, 이미지 영역(X)의 대응하는 영역이 부화소 위치인 경우, 시간적 이웃 화소 정보는, 부화소 위치에서, 보간 필터링 방식으로 획득된 부화소 정확도 재구성값이다.
단계 403: 제1 평균
Figure pct00265
및 제1 분산
Figure pct00266
에 따라, 양자화 조정 인자를 계산하고, 제1 평균
Figure pct00267
은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 색 공간 성분의 평균이며, 제1 분산
Figure pct00268
는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
양자화 조정 인자
Figure pct00269
는, 제1 평균
Figure pct00270
의 제1 함수
Figure pct00271
와 제1 분산
Figure pct00272
의 제2 함수
Figure pct00273
의 결합 함수
Figure pct00274
에 의해 계산되고, 예를 들어,
Figure pct00275
=0.4 및
Figure pct00276
=0.6, 또는
Figure pct00277
=0.5 및
Figure pct00278
=0.5이다.
제1 함수는 예를 들어 이하:
Figure pct00279
와 같고,
제2 함수는 예를 들어 이하:
Figure pct00280
와 같다.
본 발명의 본 실시예에서, 제1 및 제2 함수를 사용하여, 양자화 조정 인자가 계산된 후, 선택적으로, 양자화 조정 인자
Figure pct00281
는 추가로 이하를 포함할 수 있다.
양자화 조정 인자
Figure pct00282
에 제한 값 제한 처리를 수행하고,
Figure pct00283
는 미리 설정된 값 범위에 대응한다.
값 제한 처리를 위한 구체적 구현의 선택적 방식은, 미리 설정된
Figure pct00284
값 범위(value range)로
Figure pct00285
를 제안하는 단계 또는
Figure pct00286
를 매핑 함수를 사용하여 값 범위로 매핑하는 단계를 포함할 수 있다.
단계 404: 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행한다.
본 발명의 본 실시예에서, 제1 변환 계수 세트의 역양자화 변환은 다양한 방식으로 구현될 수 있다. 이하에서 실현 가능한 몇몇 방식을 제공한다.
방식 1: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 스케일링은, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 수행되어 제1 양자화 스텝이 획득되고, 제2 변환 계수 세트를 획득하기 위해, 제2 양자화 스텝을 사용하여 제1 양자화 스텝에 역양자화가 수행된다. 구체적 구현은 이하와 같을 수 있다.
현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝
Figure pct00287
를 획득하는 단계; 및
양자화 조정 인자에 따라, 제1 양자화 스텝
Figure pct00288
에 스케일링을 수행하여
Figure pct00289
를 획득하고, 제2 변환 계수 세트 내의 변환 계수
Figure pct00290
를 획득하기 위해, 제1 변환 계수 세트 내의 변환 계수
Figure pct00291
에 역양자화를 수행하는 단계
를 포함하고,
Figure pct00292
이고,
Figure pct00293
는 라운딩 상수, 예를 들어,
Figure pct00294
=0.5이다. 역양자화가 정수의 가산 및 시프팅에 의해 구현되는 경우, 이하의 수식:
Figure pct00295
이 사용될 수 있고,
Figure pct00296
Figure pct00297
의 정수 결과(integer result), 예를 들어,
Figure pct00298
는 2의 정수 배수로
Figure pct00299
를 곱한 후 라운딩 방식(means of rounding)으로 획득되거나, 또는
Figure pct00300
Figure pct00301
를 직접 라운딩하여 획득되거나, 또는
Figure pct00302
의 정수 결과는, 화소 평균 및 화소 분산에 따라 테이블을 참조하여 획득될 수 있고,
Figure pct00303
는 시프팅 비트에 필요한 추가 수량이다.
방식 2: 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)가 미리 설정된 제1 대응 관계에 따라 결정되고, 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 역양자화가 제1 변환 계수 세트에 수행된다.
본 발명의 본 실시예에서, 양자화 조정 인자
Figure pct00304
와 복수의 레벨 스케일링 리스트 사이의 제1 대응 관계는 미리 설정될 수 있다.
더욱 구체적으로, QC의 값 범위는 미리 H1(H1은 1보다 큰 양의 정수, 예를 들어 H1 = 3, 5 또는 6) 간격으로 나누어지고, 각 간격은 미리 설정된 레벨 스케일링 리스트에 대응한다. 계산 방식에 의해 얻어진 양자화 조정 계수 QC가 속하는 값 간격(value interval)이 검색되고, 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서, 양자화 조정 인자(QC)가 속하는 값 간격에 대응하는 레벨 스케일링리스트가 선택된다.
예를 들어, QC와 레벨 스케일링리스트 간의 매핑 관계 표 3은, 각각 6개의 엘리먼트를 포함하는 레벨 스케일링리스트에 대해, QC에 따라 하나의 레벨 스케일링리스트가 선택되는 예를 제공한다.
레벨 스케일링 리스트
QC≥1.5 {60,68,77,86,96,108}
1.2<QC<1.5 {54,61,69,77,86,97}
0.8≤QC≤1.2 {40,45,51,57,64,72}
0.6<QC<0.8 {28,32,36,40,45,50}
QC≤0.6 {24,27,31,34,38,43}
표 3에 주어진 예에 따르면, QC가 0.9일 때, QC가 속하는 값 범위는 0.8≤QC≤1.2로 검색되고, 값 범위 0.8≤QC≤1.2에 대응하는 레벨 스케일링 리스트{40, 45, 51, 57, 64, 72} 는 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서 선택된다.
방식 3: 양자화 조정 인자에 대응하는 타깃 양자화 행렬은, 미리 설정된 제2 대응 관계에 따라 결정되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 타깃 양자화 행렬에 따라 제1 변환 계수 세트에 수행된다.
QC의 값 범위는 미리 H2(H2는 1보다 큰 양의 정수, 예를 들어 H2 = 3, 5 또는 6) 간격으로 분할되고, 각 간격은 미리 설정된 양자화 행렬에 대응한다. QC가 속하는 값 간격이 검색되고, 대응하는 양자화 행렬이, 제1 변환 계수 세트에 역양자화가 수행되는 양자화 행렬로서 선택된다. 예를 들어, 표 4는
Figure pct00305
변환 블록을 제공한다.
QC<16 16≤QC≤64 QC>64
Figure pct00306
양자화 행렬
16,13,14,14,
13,14,16,16,
14,16,16,16,
14,16,16,16
16,16,16,16,
16,16,16,16,
16,16,16,16,
16,16,16,16
18,18,16,16,
18,18,20,16,
16,20,20,22,
16,16,22,16
표 4의 예에 따르면, 계산방식으로 얻어진 QC값이 18이고, QC가 속하는 값 범위가 표 4에 주어진 파라미터로부터 16≤QC≤64로 결정될 수 있다면, 제1 변환 계수 세트에 역양자화가 수행되는, 대응하는 4×4 양자화 행렬은 표 4의 제3행의 양자화 행렬이다.
방식 4: 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터는 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 타깃 양자화 파라미터 오프셋은 양자화 조정 인자에 따라 결정되며, 타깃 양자화 파라미터 오프셋은 제1 양자화 파라미터에 추가되어 제2 양자화 파라미터를 획득되고, 레벨 스케일은 제2 양자화 파라미터에 따라 결정되고, 제2 변환 계수 세트를 획득하기 위해, 레벨 스케일을 사용하여 제1 변환 계수 세트에 역양자화가 수행된다.
레벨 스케일
Figure pct00307
을 이용하여 설정되는 제1 변환 파라미터에 대한 역양자화는 구체적 이하의 식:
Figure pct00308
,
Figure pct00309
, 및
Figure pct00310
을 사용하여 구현될 수 있고,
Figure pct00311
는 라운딩 오프셋(rounding offset)이다.
방식 5: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은, 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 역양자화가 1 양자화 스텝을 사용하여, 제1 변환 계수 세트 내의 계수에 수행되어 제3 변환 계수 세트 내의 계수를 획득하고, 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 양자화 조정 인자를 사용하여, 스케일링은 제3 변환 계수 세트 내의 계수에 수행된다.
구체적 구현은 이하:
먼저, 제1 양자화 스텝
Figure pct00312
를 사용하여 제1 변환 계수 세트에 역양자화를 수행하여 제3 변환 계수 세트
Figure pct00313
, 즉,
Figure pct00314
를 획득한 다음,
Figure pct00315
에 스케일링 및 라운딩을 수행하여 제2 변환 계수
Figure pct00316
즉,
Figure pct00317
를 획득하고,
Figure pct00318
Figure pct00319
는 라운딩 오프셋이다.
제1 양자화 파라미터
Figure pct00320
는, 제1 변환 계수 세트가 위치하는 변환 블록의,
고, 현재 디코딩된 이미지, 예를 들어, 프레임 레벨 양자화 파라미터에 대응하는 신호에 의해 지시되는 디폴트 양자화 파라미터이다.
실시예
이하에서는, 구체적 파라미터를 참조하여, 본 발명의 실시예에서의 기술적 해결 수단을 설명하고, 구체적 구현은 이하를 포함한다.
제1 변환 계수 세트는 휘도 성분 변환 블록의 모든 계수를 포함한다. 이미지 영역(X)은
Figure pct00321
영역(즉, 화소의 8개의 행과 8개의 열을 포함하는 직사각형 영역)이다. 이미지 영역(X)의 좌측 위 화소의 좌표는
Figure pct00322
로 표시된다. 일반적으로, 이미지의 좌표계에서, 좌우에서 우 방향은
Figure pct00323
방향으로 정의되고, 상에서 하 방향은
Figure pct00324
방향으로 정의된다.
공간적 인접 화소 정보는 이하의 두 단계를 포함한다.
(1) 이미지 영역(X)의 공간적 이웃 영역(Y1)에서 화소 정보, 및 공간적 이웃 화소 정보는 공간적 이웃 영역(Y1) 내의 적어도 하나의 화소의 재구성 값을 포함한다. 공간적 이웃 영역(Y1)에 포함된 화소 좌표
Figure pct00325
는 이하의 조건:
Figure pct00326
, 또는
Figure pct00327
을 만족하는 것으로 가정하고, J1 내지 J8은 양의 정수, 예를 들어, J1=J2=J3=J5=J6=J7=8 및 J4=J8=1, 또는 J1=J3=12, J2=4, J4=1, J5=J7=12, J6=4, 및 J8=1, 또는 J1=5, J2=8, J3=6, J4=2, J5=10, J6=11, J7=12, 및 J8=1이다.
(2) 인트라 예측 방식으로, 이미지 영역(X)의 공간적 이웃 영역(Y2) 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 예측 화소 정보. 호소 정보는 이미지 영역(X)의 적어도 하나의 인트라 예측 픽셀을 포함한다. 공간적 이웃 영역(Y2)에 포함된 화소 좌표
Figure pct00328
는 이하의 조건:
Figure pct00329
; 또는
Figure pct00330
을 만족하고, S1 및 S2는 양의 정수, 예를 들어, S1=S2=15, 또는 S1=7 및 S2=15이다. 인트라 예측 방식은 H.265/HEVC에서의 33방향 인트라 예측 모드, DC 예측 모드, 또는 평면 예측 모드 중 하나 일 수 있다.
양자화 조정 인자
Figure pct00331
는, 화소 평균
Figure pct00332
의 제1 함수
Figure pct00333
및 화소 분산
Figure pct00334
에 대한 제2 함수
Figure pct00335
에 의해 함께 결정되고,
Figure pct00336
가 사용된다. 휘도 성분의 평균
Figure pct00337
및 휘도 성분의 분산
Figure pct00338
는 공간적 이웃 화소 정보 내의 모든 화소의 평균 및 분산이다. 제1 함수 및 제2 함수는 구체적으로 이하:
Figure pct00339
; 및
Figure pct00340
이다.
제1 변환 계수 세트의 변환 계수의 역양자화는, 양자화 조정 인자에 따라 조정되고, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 제1 변환 계수 세트에 수행된다. 제1 변환 계수 세트의 변환 계수의 역양자화를 조정하는 방법은 이하: 양자화 조정 인자에 따라, 제1 변환 계수 세트의 원래 양자화 스텝
Figure pct00341
에 스케일링을 수행하는 단계: 및 스케일링 된 양자화 스텝을, 역양자화가 제1 변환 계수 세트에 수행되는 양자화 스텝로서 사용하는 단계를 포함한다.
실시예
도 5에 도시된 바와 같이, 본 발명의 실시예는 비디오 코딩에서의 적응형 역양자화 장치를 제공하고, 이러한 장치는 결정 유닛(501), 획득 유닛(502), 계산 유닛(503), 및 역양자화 유닛(504)를 포함한다.
결정 유닛(501)은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하도록 구성되고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 변환 계수는 현재 디코딩된 이미지에서 임의의 컬러 공간 성분의 변환 계수이며, N은 양의 정수이다.
획득 유닛(502)은, 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성되고, 디코딩된 화소 정보는 이미지 영역의 공간적 이웃 화소정보를 포함한다.
본 발명의 본 실시예에서, 획득 유닛(502)은 추가로, 이미지 영역의 시간적 이웃 화소 정보 및/또는 디코딩된 화소 정보로부터 이미지 영역의 화소 정보를 획득하도록 구성된다.
계산 유닛(503)은 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하도록 구성된다.
역양자화 유닛(504)은 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다.
본 발명의 본 실시예에서, 계산 유닛(503)은, 다양한 구체적 구현 방식에서, 디코딩된 확소 정보에 따라, 양자화 조정인자를 계산한다.
방식 1: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 평균
Figure pct00342
에 따라 계산되고, 계산 유닛(503)은 구체적으로, 화소 평균
Figure pct00343
의 제1 함수
Figure pct00344
에 따라 양자화 조정 인자를 계산하도록 구성되고, 화소 평균
Figure pct00345
은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 컬러 공간 성분의 평균이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
방식 2: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 분산
Figure pct00346
에 따라 계산되고, 계산 유닛(503)은 구체적으로, 화소 분산
Figure pct00347
의 제2 함수
Figure pct00348
에 따라 양자화 조정 인자를 계산하도록 구성되며, 화소 분산
Figure pct00349
는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 컬러 공간 성분의 분산이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
방식 3: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 평균
Figure pct00350
및 화소 분산
Figure pct00351
에 따라 계산되고, 계산 유닛(503)은 구체적으로, 의 화소 평균
Figure pct00352
및 화소 분산
Figure pct00353
의 결합 함수
Figure pct00354
에 따라 계산하도록 구성되며, 화소 평균
Figure pct00355
은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 컬러 공간 성분의 평균이고, 화소 분산
Figure pct00356
는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 컬러 공간 성분의 분산이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
방식 4: 양자화 조정 인자는, 디코딩된 화소 정보의, 최대 화소 값
Figure pct00357
및 최소 화소 값
Figure pct00358
에 따라 계산되고, 계산 유닛(503)은 구체적으로, 최대 화소 값
Figure pct00359
과 최소 화소 값
Figure pct00360
사이의 차인, 함수
Figure pct00361
에 의해 양자화 조정 인자를 계산하도록 구성되고, 최대 화소 값
Figure pct00362
는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 컬러 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값 또는 복수의 화소의 동일한 공간 성분의 최소값이며, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
본 발명의 본 실시예에서, 역양자화 유닛(504)은, 다양한 구체적 구현 방식에서, 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다. 이하에서 실행 가능한 몇몇 방식을 제공한다.
방식 1: 역양자화는, 레벨 스케일링 리스트를 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트를 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
방식 2: 역양자화는, 양자화 행렬 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 미리 설정된 제2 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 양자화 행렬에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이다.
방식 3: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 파라미터와 계산 방식으로 획득된 적응형 양자화 파라미터 사이의 차를 사용하여, 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터를 획득하고, 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋을 결정하고, 타깃 양자화 파라미터 오프셋을 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하고, 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 레벨 스케일을 사용하여 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
방식 4: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 스케일을 수행하고 제2 양자화 스텝을 획득하며, 제2 변환 계수 세트를 획득하기 위해, 제2 양자화 스텝을 사용하여, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
방식 5: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 제1 양자화 스텝을 사용하여, 제1 변환 계수 세트 내의 계수에 역양자화를 수행하고 제3 변환 계수 세트 내의 계수를 획득하며, 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 양자화 조정 인자를 사용하여 제3 변환 계수 세트 내의 계수에 스케일링을 수행하도록 구성된다.
전술한 본 출원의 실시예에서의 하나 이상의 기술적 해결수단은 적어도 다음의 기술적 효과들을 갖는다.
본 발명의 실시 예에서 제공되는 해결 수단에 따르면, 현재의 변환 블록이 위치하는 배경 영역의 통계적 특징은, 변환 블록의, 공간적 이웃 정보, 또는 시간적 이웃 정보, 또는 공간적 이웃 정보 및 시간적 이웃 정보를 사용하여 추정되고, 역양자화를 위한 양자화 조정 인자가 적응적으로 도출되며, 역양자화 처리가 유연하게 조정된다. 한편으로, 본 발명의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도는, 인간의 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다. 한편, 양자화 조정 정보가 비트 스트림으로 전송되는 종래 해결 수단과 비교하여, 본 발명에 따르면, 양자화 조정 정보를 전송하기 위한 여분의 비트 오버 헤드가 필요하지 않으므로, 코딩 효율을 더욱 향상시킬 수 있다. 또한, 본 발명은 인트라 프레임(I-프레임) 이미지 및 인터 프레임(P-프레임 또는 B-프레임) 이미지의 코딩에 적용 가능하다. 따라서, 본 발명의 실시예에서 제공되는 기술적 해결 수단은 비교적 넓은 적용 범위를 갖는다.
본 발명에서 기술된 방법은 특정 구현 방식의 실시예에 한정되는 것은 아니며, 본 발명의 기술적 해결 수단에 따라 당업자가 얻은 다른 구현 방식 또한 본 발명의 기술적 혁신 범위 내에 있다.
본 발명의 사상 및 범위를 벗어나지 않고, 당업자는 본 발명에 다양한 수정 및 변형을 가할 수 있음은 자명하다. 또한, 이들 변형 예가 본 발명의 특허 청구 범위 및 그와 동등한 기술 범위에 있는 한, 본 발명은 이들 변형 예를 포함하는 것으로 의도된다.

Claims (29)

  1. 비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 방법에 있어서,
    현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
    상기 이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -;
    상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하는 단계; 및
    제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함하는 적응형 역양자화 방법.
  2. 제1항에 있어서,
    상기 디코딩된 화소 정보는, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 이미지 영역의 화소 정보를 더 포함하는 적응형 역양자화 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
    화소 평균
    Figure pct00363
    의 제1 함수
    Figure pct00364
    에 따라 상기 양자화 조정 인자를 계산하는 단계
    를 포함하고,
    상기 화소 평균
    Figure pct00365
    은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인,적응형 역양자화 방법.
  4. 제1항 또는 제2항에 있어서,
    상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
    화소 분산(pixel variance:
    Figure pct00366
    )의 제2 함수
    Figure pct00367
    에 따라 상기 양자화 조정 인자를 계산하는 단계를 포함하고,
    상기 화소 분산
    Figure pct00368
    는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는, 적응형 역양자화 방법.
  5. 제1항 또는 제2항에 있어서,
    상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
    화소 분산
    Figure pct00369
    및 화소 평균
    Figure pct00370
    의 결합 함수
    Figure pct00371
    에 따라, 상기 양자와 조정 인자를 계산하는 단계
    를 포함하고,
    상기 화소 평균
    Figure pct00372
    는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산
    Figure pct00373
    는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 방법.
  6. 제1항 또는 제2항에 있어서,
    상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
    최대 화소 값(maximum pixel value:
    Figure pct00374
    ) 및 최소 화소 값(minimum pixel value:
    Figure pct00375
    ) 간 차의 제3 함수
    Figure pct00376
    에 따라 상기 양자화 조정 인자를 계산하는 단계
    를 포함하고,
    상기 최대 화소 값
    Figure pct00377
    는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계임 -; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 간 대응 관계임-; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  9. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하는 단계;
    상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하는 단계; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  10. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하고, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  11. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계;
    상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고, 제3 변환 계수 세트 내의 계수를 획득하는 단계; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  12. 비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 방법에 있어서,
    현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역 X를 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
    상기 이미지 영역 X의 시간적 이웃 화소 정보(temporal neighborhood pixel information)를 획득하는 단계;
    제1 평균
    Figure pct00378
    및 제1 분산에 따라, 양자화 조정 인자를 계산하는 단계; - 상기 제1 평균
    Figure pct00379
    는, 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 제1 분산에
    Figure pct00380
    는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분임 -; 및
    제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
    를 포함하는 적응형 역양자화 방법.
  13. 제12항에 있어서,
    상기 제1 평균
    Figure pct00381
    및 제1 분산
    Figure pct00382
    에 따라, 양자화 조정 인자를 계산하는 단계는,
    상기 제1 평균
    Figure pct00383
    및 제1 분산
    Figure pct00384
    의 결합 함수
    Figure pct00385
    에 따라, 상기 양자화 조정 인자를 계산하는 단계
    를 포함하는, 적응형 역양자화 방법.
  14. 제12항 또는 제13항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 사이의 대응 관계임 -; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  15. 제13항 또는 제13항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계임 -; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  16. 제13항 또는 제13항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환
    계수 세트에 대응하는 제1 양자화 파라미터를 획득하는 단계;
    상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하는 단계; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라, 레벨 스케일(level scale)을 결정하고, 상기 레벨 스케일을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  17. 제13항 또는 제13항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링을 수행하고 제2 양자화 스텝을 획득하며, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수에 역양자화를 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  18. 제13항 또는 제13항에 있어서,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계;
    상기 제1 양자화 스텝을 사용하여 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고 제3 변환 계수 세트를 획득하는 단계; 및
    상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여 상기 제3 변환 계수 세트 내의 계수에 스케일링을 수행하는 단계
    를 포함하는, 적응형 역양자화 방법.
  19. 비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 장치로서,
    현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하도록 구성된 결정 유닛 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
    상기 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성된 획득 유닛 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -;
    상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하도록 구성된 계산 유닛; 및
    제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된 역양자화 유닛
    을 포함하는 적응형 역양자화 장치.
  20. 제19항에 있어서,
    상기 획득 유닛은 추가로,
    상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 디코딩된 화소 정보로부터 상기 이미지 영역의 화소 정보를 획득하도록 구성된, 적응형 역양자화 장치.
  21. 제19항 또는 제20항에 있어서,
    상기 계산 유닛은 구체적으로,
    화소 평균
    Figure pct00386
    의 제1 함수
    Figure pct00387
    에 따라 상기 양자화 조정 인자를 계산하도록 구성되고,
    상기 화소 평균
    Figure pct00388
    은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분(color space component)의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 장치.
  22. 제19항 또는 제20항에 있어서,
    상기 계산 유닛은 구체적으로,
    화소 분산(pixel variance:
    Figure pct00389
    )의 제2 함수
    Figure pct00390
    에 따라 상기 양자화 조정 인자를 계산하도록 구성되고,
    상기 화소 분산
    Figure pct00391
    는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는, 적응형 역양자화 장치.
  23. 제19항 또는 제20항에 있어서,
    상기 계산 유닛은 구체적으로,
    화소 분산
    Figure pct00392
    및 화소 평균
    Figure pct00393
    의 결합 함수
    Figure pct00394
    에 따라, 상기 양자와 조정 인자를 계산하도록 구성되고,
    상기 화소 평균
    Figure pct00395
    는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산
    Figure pct00396
    는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 장치.
  24. 제19항 또는 제20항에 있어서,
    상기 계산 유닛은 구체적으로,
    최대 화소 값(maximum pixel value:
    Figure pct00397
    ) 및 최소 화소 값(minimum pixel value:
    Figure pct00398
    ) 간 차의 제3 함수
    Figure pct00399
    에 따라 상기 양자화 조정 인자를 계산하도록 구성되고,
    상기 최대 화소 값
    Figure pct00400
    는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 장치.
  25. 제19항 내지 제24항 중 어느 한 항에 있어서,
    상기 역양자화 유닛은 구체적으로,
    미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하고,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되며,
    상기 제1 대응 관계는, 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계인, 적응형 역양자화 장치.
  26. 제19항 내지 제24항 중 어느 한 항에 있어서,
    상기 역양자화 유닛은 구체적으로,
    미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고,
    상기 제2 대응 관계는, 양자화 조정 인자와 양자화 행렬 간 대응 관계인, 적응형 역양자화 장치.
  27. 제19항 내지 제24항 중 어느 한 항에 있어서,
    상기 역양자화 유닛은 구체적으로,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고,
    상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된, 적응형 역양자화 장치.
  28. 제19항 내지 제24항 중 어느 한 항에 있어서,
    상기 역양자화 유닛은 구체적으로,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고,
    상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며,
    상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된, 적응형 역양자화 장치.
  29. 제19항 내지 제24항 중 어느 한 항에 있어서,
    상기 역양자화 유닛은 구체적으로,
    상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고,
    상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며,
    상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된, 적응형 역양자화 장치.
KR1020177003914A 2014-07-24 2015-01-16 비디오 코딩에서의 적응형 역양자화 방법 및 장치 KR101893049B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410355790.5 2014-07-24
CN201410355790.5A CN105338352B (zh) 2014-07-24 2014-07-24 一种视频编码中自适应反量化方法及装置
PCT/CN2015/070905 WO2016011796A1 (zh) 2014-07-24 2015-01-16 一种视频编码中自适应反量化方法及装置

Publications (2)

Publication Number Publication Date
KR20170031202A true KR20170031202A (ko) 2017-03-20
KR101893049B1 KR101893049B1 (ko) 2018-08-29

Family

ID=55162477

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177003914A KR101893049B1 (ko) 2014-07-24 2015-01-16 비디오 코딩에서의 적응형 역양자화 방법 및 장치

Country Status (6)

Country Link
US (1) US10257514B2 (ko)
EP (1) EP3163875B1 (ko)
JP (1) JP6388355B2 (ko)
KR (1) KR101893049B1 (ko)
CN (1) CN105338352B (ko)
WO (1) WO2016011796A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018221946A1 (ko) * 2017-05-30 2018-12-06 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2019009600A1 (ko) * 2017-07-04 2019-01-10 엘지전자 주식회사 360도 비디오에 대한 영상 코딩 시스템에서 프로젝션 타입 기반 양자화 파라미터를 사용한 영상 디코딩 방법 및 장치

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11206401B2 (en) 2016-02-11 2021-12-21 Samsung Electronics Co., Ltd. Video encoding method and device and video decoding method and device
CN107094251B (zh) * 2017-03-31 2021-07-23 浙江大学 一种基于空间位置自适应质量调整的视频、图像编解码方法及装置
US10652539B1 (en) * 2017-07-31 2020-05-12 Facebook Technologies, Llc In-band signaling for display luminance control
US11095896B2 (en) * 2017-10-12 2021-08-17 Qualcomm Incorporated Video coding with content adaptive spatially varying quantization
CN109756733B (zh) * 2017-11-06 2022-04-12 华为技术有限公司 视频数据解码方法及装置
CN110536133B (zh) * 2018-05-24 2021-11-19 华为技术有限公司 视频数据解码方法及装置
US11451840B2 (en) * 2018-06-18 2022-09-20 Qualcomm Incorporated Trellis coded quantization coefficient coding
WO2020007848A1 (en) * 2018-07-02 2020-01-09 Telefonaktiebolaget Lm Ericsson (Publ) Bilateral high frequency boost
CA3111118A1 (en) * 2018-09-21 2020-03-26 Huawei Technologies Co., Ltd. Apparatus and method for inverse quantization
EP3981156A4 (en) * 2019-06-24 2023-02-01 Huawei Technologies Co., Ltd. PROCEDURE FOR CALCULATION OF POSITION OF AN INTEGER GRIDING REFERENCE SAMPLE FOR CALCULATION OF BOUNDARY SAMPLE GRADIENTS AT BLOCK LEVEL IN BI-PREDICTIONAL OPTICAL FLOW CALCULATION AND BI-PREDICTIONAL CORRECTION
US11616983B2 (en) * 2020-05-05 2023-03-28 Tencent America LLC Joint component secondary transform
US11748914B2 (en) * 2020-08-26 2023-09-05 Meta Platforms Technologies, Llc Rate controlled image and texture data compression
US11871003B2 (en) * 2021-09-13 2024-01-09 Apple Inc. Systems and methods of rate control for multiple pass video encoding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2317769A1 (en) * 2009-11-02 2011-05-04 Panasonic Corporation Luminance dependent quantization
KR20120083368A (ko) * 2009-10-05 2012-07-25 톰슨 라이센싱 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6937659B1 (en) * 1997-11-14 2005-08-30 Ac Capital Management, Inc. Apparatus and method for compressing video information
US6363113B1 (en) * 1999-06-07 2002-03-26 Lucent Technologies Inc. Methods and apparatus for context-based perceptual quantization
US6597739B1 (en) * 2000-06-20 2003-07-22 Microsoft Corporation Three-dimensional shape-adaptive wavelet transform for efficient object-based video coding
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
JP2007535191A (ja) * 2004-01-30 2007-11-29 松下電器産業株式会社 画像符号化方法、画像復号化方法、画像符号化装置、画像復号化装置およびプログラム
CN101103632A (zh) * 2005-01-07 2008-01-09 皇家飞利浦电子股份有限公司 利用动态地基于法向流的量化步长来处理视频信号的方法
US20060274962A1 (en) * 2005-06-03 2006-12-07 Yi-Jen Chiu Systems and methods for improved Gaussian noise filtering
CN102611892B (zh) * 2006-03-16 2014-10-08 华为技术有限公司 在编码过程中实现自适应量化的方法及装置
EP1995971B1 (en) 2006-03-16 2016-11-16 Huawei Technologies Co., Ltd. A method and device for realizing quantization in coding-decoding
CN101039421A (zh) 2006-03-16 2007-09-19 华为技术有限公司 在编解码中的实现量化的方法和装置
JP5330246B2 (ja) * 2006-09-29 2013-10-30 トムソン ライセンシング 適応ピクセルベースのフィルタリングのための自動パラメータ推定
CN101325714B (zh) * 2007-06-13 2010-10-27 华为技术有限公司 变换数据处理方法和装置以及编码、解码方法和装置
CN101888556B (zh) 2008-03-19 2012-04-25 华为技术有限公司 编码、解码方法和编码、解码装置
US8369638B2 (en) * 2008-05-27 2013-02-05 Microsoft Corporation Reducing DC leakage in HD photo transform
CN101677398A (zh) * 2008-09-19 2010-03-24 三星电子株式会社 场景切换码率控制方法
KR101511230B1 (ko) * 2008-09-26 2015-04-13 성균관대학교산학협력단 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법
CN101771868B (zh) 2008-12-31 2016-03-02 华为技术有限公司 对图像的量化处理方法及装置
CN102223527B (zh) 2010-04-13 2013-04-17 华为技术有限公司 频带加权量化编解码方法和装置
MX339436B (es) * 2011-03-09 2016-05-26 Nec Corp Dispositivo de codificacion de video, dispositivo de decodificacion de video, metodo de codificacion de video, y metodo de decodificacion de video.
KR101442127B1 (ko) * 2011-06-21 2014-09-25 인텔렉추얼디스커버리 주식회사 쿼드트리 구조 기반의 적응적 양자화 파라미터 부호화 및 복호화 방법 및 장치
US9740886B2 (en) * 2013-03-15 2017-08-22 Sony Interactive Entertainment Inc. Enhanced security for hardware decoder accelerator

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120083368A (ko) * 2009-10-05 2012-07-25 톰슨 라이센싱 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치
EP2317769A1 (en) * 2009-11-02 2011-05-04 Panasonic Corporation Luminance dependent quantization

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018221946A1 (ko) * 2017-05-30 2018-12-06 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2019009600A1 (ko) * 2017-07-04 2019-01-10 엘지전자 주식회사 360도 비디오에 대한 영상 코딩 시스템에서 프로젝션 타입 기반 양자화 파라미터를 사용한 영상 디코딩 방법 및 장치
US11051020B2 (en) 2017-07-04 2021-06-29 Lg Electronics Inc. Image decoding method and apparatus using projection-type based quantisation parameters in image coding system for 360-degree video

Also Published As

Publication number Publication date
JP2017527181A (ja) 2017-09-14
US10257514B2 (en) 2019-04-09
CN105338352A (zh) 2016-02-17
KR101893049B1 (ko) 2018-08-29
CN105338352B (zh) 2019-04-19
US20170127062A1 (en) 2017-05-04
EP3163875A1 (en) 2017-05-03
EP3163875A4 (en) 2017-09-27
WO2016011796A1 (zh) 2016-01-28
EP3163875B1 (en) 2020-11-25
JP6388355B2 (ja) 2018-09-12

Similar Documents

Publication Publication Date Title
KR101893049B1 (ko) 비디오 코딩에서의 적응형 역양자화 방법 및 장치
JP6863669B2 (ja) 画像符号化装置、画像符号化方法、画像復号装置および画像復号方法
CN111819853B (zh) 图像块编码装置和图像块编码方法
JP2020065277A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法及び符号化ビットストリームを記録した記録媒体
US20180343452A1 (en) Encoding/decoding apparatus and method using flexible deblocking filtering
US11277615B2 (en) Intra-prediction method for reducing intra-prediction errors and device for same
KR20190016983A (ko) 인트라 예측 정보 부호화 방법 및 장치
US20150016526A1 (en) Image encoding/decoding method and device
TW202341742A (zh) 圖像編碼方法及圖像解碼方法
TR201802460T4 (tr) Renkli görüntüde kod çözme için yöntem.
KR20110091000A (ko) 화상 부호화 장치 및 화상 복호 장치
CN103621082A (zh) 视频译码中的量化
KR100846774B1 (ko) 블록킹 효과를 제거하기 위한 필터링 방법 및 그 장치
WO2019104635A1 (en) System and method for controlling video coding at frame level
TW201644277A (zh) 用於調色盤模式寫碼之寫碼逃脫像素
US20190335173A1 (en) Image encoding method/device, image decoding method/device and recording medium having bitstream stored therein
WO2019104611A1 (en) System and method for controlling video coding within image frame
KR101873050B1 (ko) 화상 시퀀스 코딩 방법, 그 대응 재구성 방법, 및 이 화상 시퀀스를 대표하는 코딩된 데이터 스트림
KR20190062284A (ko) 인지 특성에 기반한 영상 처리 방법 및 장치
CN113347425B (zh) 信息处理方法及装置、设备、存储介质
JP2014090327A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
JP2014090326A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
WO2015045301A1 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
CN113225556A (zh) 视频编码方法
JP2019004304A (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant