KR20170031202A

KR20170031202A - 비디오 코딩에서의 적응형 역양자화 방법 및 장치

Info

Publication number: KR20170031202A
Application number: KR1020177003914A
Authority: KR
Inventors: 인 자오; 하이타오 양; 줘이 뤼
Original assignee: 후아웨이 테크놀러지 컴퍼니 리미티드
Priority date: 2014-07-24
Filing date: 2015-01-16
Publication date: 2017-03-20
Also published as: JP2017527181A; US10257514B2; CN105338352A; KR101893049B1; CN105338352B; US20170127062A1; EP3163875A1; EP3163875A4; WO2016011796A1; EP3163875B1; JP6388355B2

Abstract

본 발명은, 비디오 코딩에서의 적응형 역양자화 방법 및 장치를 개시한다. 본 발명에서 제공하는 방법에 따르면, 현재 변환 블록이 위치하는 배경 영역의 통계적 특징이, 변환 블록의, 공간적 이웃 정보, 또는 시간적 이웃 정보, 또는 공간적 이웃 정보와 시간적 이웃 정보를 사용하여 추정되고, 역양자화를 위한 양자화 조정 인자는 적응적으로 유도되고, 역양자화 처리는 유연하게 조정된다. 양자화 조정 정보가 비트 스트림으로 전송되는 종래 해결 수단과 비교하여, 본 발명에서 제공되는 방법 및 장치에 따르면, 양자화 조정 정보를 전송하기 위해 여분의 비트 오버 헤드가 필요하지 않으므로, 코딩 효율이 더욱 개선된다.

Description

비디오 코딩에서의 적응형 역양자화 방법 및 장치{ADAPTIVE INVERSE-QUANTIZATION METHOD AND APPARATUS IN VIDEO CODING}

본 발명은 데이터 처리 분야에 관한 것으로서, 보다 상세하게는, 비디오 코딩에서의 역양자화 방법 및 장치에 관한 것이다.

현재, H.264/AVC, H.265/HEVC, 및 AVS(Audio Video Coding Standard)과 같은 비디오 코딩 표준과 같이, 다수의 비디오 코딩 기술이 있다. 전술 한 비디오 코딩 표준은 일반적으로 하이브리드 코딩 프레임 워크(hybrid coding framework)를 사용하고, 하이브리드 코딩 프레임 워크는 주로: 예측(prediction), 변환(transform), 양자화(quantization), 엔트로피 코딩(entropy coding) 등과 같은 단계를 포함한다.

예측 단계에서, 코딩된 영역의 재구성 화소(reconstructed pixel)는 현재 코드 블록(code block)에 대응하는 원래 화소(original pixel)에 대한 예측 화소(predicted pixel)를 생성하는데 사용된다. 두 가지 주요 유형의 예측 방식에 인트라 예측(intra prediction) 및 인터 예측(inter prediction)이 포함된다. 인트라 예측을 위해, 현재 코드 이미지 내의 현재 코드 블록의 공간적 이웃(spatial neighborhood)한 재구성 화소는 현재 코드 블록의 예측 화소, 예를 들어, 수평(horizontal), 수직(vertical), 또는 다른 H.264/AVC 에서의 다방향 예측(multi-directional prediction), 템플릿 매칭(template matching) 및 인트라 모션 보상(intra motion compensation)에 기반을 둔 예측 방식의 예측 화소를 생성하는 데 사용된다. 인터 예측을 위해, 하나 이상의 코딩 된 이미지에서, 현재 코드 블록에 대응하는 재구성 화소는 현재 코드 블록의 예측 된 화소, 예를 들어, 모션 보상(motion compensation)에 기초한 예측 방식으로 예측된 화소로서 사용된다. 인터 예측은 단방향 예측(unidirectional prediction)과 양방향 예측(bidirectional prediction)의 두 가지 형식을 포함한다. 단방향 예측을 위해, 하나의 코딩 된 이미지의 재구성 화소는 현재 코드 블록의 예측 화소를 생성하기 위해 사용되고, 양방향 예측을 위해 두 개의 코딩 된 이미지에서, 재구성 화소는 현재 코드 블록의 예측 화소를 생성하는 데 사용된다.

원래 화소와 예측 화소의 화소 값 차를 레지듀얼(residual)이라 한다. 레지듀얼의 코딩 효율을 향상시키기 위해, 일반적으로 레지듀얼은 먼저, 변형 및 변환되어 변환 계수(transform coefficient)로 변환된다. 공통 변환은 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), 웨이블릿 변환(wavelet transform) 등을 포함한다. 다음으로, 예를 들면 벡터 양자화(vector quantization) 또는 스칼라 양자화(scalar quantization)에 의해 양자화 처리가 변환 계수에 대해 수행된다. 그런 다음, 양자화된 변환 계수 및 인코딩 모드 정보(예를 들어, 코드 블록 크기, 예측 모드, 및 모션 벡터)가 엔트로피 코딩 처리에 의해 비트 스트림으로 변환된다. 일반적인 엔트로피 부호화 방법은 산술 코딩(arithmetic coding), VLC(variable length coding), 고정 길이 코딩(fixed length coding), 런 랭스 코딩(run-length coding) 등을 포함한다.

변환 계수는 스칼라 양자화 방식(scalar quantization manner)으로 양자화될 수 있다. 현재 코드 블록의 레지듀얼의 N 개의 변환 계수 중 i번째 변환 계수를

(1≤

≤ N, N은 변환 블록 사이즈와 관련되고, 통상 16, 64, 1024 등)으로 표시하면, 양자화 변환 계수

는,

이고, 여기에서,

는

의 심볼, 즉,

이고,

는 라운딩 연산(rounding operation)이며 일반적으로 라운딩 다운(rounding down), 라운딩 오프(rounding off), 및 라운딩 업(rounding up) 중 하나 일 수 있다.

는

의 절대값 또는

의 진폭을 나타낸다.

는 변환 계수

에 대응하는 양자화 스텝(quantization step)을 나타내고,

은 라운딩 오프셋(rounding offset)이다.

비디오 디코딩은 비트 스트림을 비디오 이미지로 변환하는 프로세스이며, 엔트로피 디코딩(entropy decoding), 예측, 역양자화(dequantization) 및 역변환(inverse transform)과 같은 몇 가지 주요 단계를 포함합니다. 우선, 비트 스트림은 엔트로피 디코딩 처리에 의해 파싱(parsing)되어 인코딩 모드 정보 및 양자화된 변환 계수를 얻는다. 다음으로, 한편으로는, 인코딩 모드 정보 및 디코딩된 재구성 화소를 사용하여 예측 화소가 획득되고, 한편으로, 역양자화가 양자화된 변환 계수에 대해 수행되어 재구성된 변환 계수를 획득하고, 역변환이 재구성된 변환 계수에 대해 수행되어 재구성된 레지듀얼 정보를 획득한다. 그 후, 비디오 이미지를 복원하기 위해, 재구성된 레지듀얼 정보가 예측 화소에 가산된다.

역양자화는 양자화된 변환 계수

에 대해 수행되어 재구성된 변환 계수

를 획득하는데, 이는 다음의 수학식 1

여기에서,

는 플로팅 포인트 번호(floating-point number)일 수 있고,

은 라운딩 오프셋(rounding offset)이다. 일반적으로 플로팅 포인트 연산을 사용하지 않으려면, 플로팅 포인트 곱셈을 정수 가산 및 이동 방식으로 대체한다. 예를 들어, H.265/HEVC에서, 수학식 1에 설명된 역양자화 프로세스는 다음 수학식 2:

여기에서,

는 시프팅 파라미터(shifting parameter)이고,

는 정수이며,

는 수학식 1의 양자화 스텝

에 근사화된다. 이런 방식으로,

=0.5이며, 라운딩 방식은 라운딩 다운이다.

는 이하의 수학식 3과 같이, 레벨 스케일(levelScale)

및 스케일링 인자(scaling factor)

에 의해 공통으로 결정된다.

는 양자화 파라미터(QP:Quantization Parameter)즉,

이고, 여기에서, 레벨 스케일링 리스트(level scaling list)

이고, k=0, 1,…., 5이며,

는

가 6으로 나누어진 후의 라운딩(rounding)이고,

는 REM 연산이다.

일반적으로, 역양자화는 양자화 스텝과 직접 관련되며, 양자화 스텝은 QP, 스케일링 인자, 및 레벨 스케일링리스트의 영향을 받는다. 양자화 스텝은 여러 방식으로 조정될 수 있다. 예를 들어, 스케일링 인자 및 레벨 스케일링 리스트가 고정되어있는 경우, 양자화 파라미터의 각 레벨은 양자화 스텝에 대응한다. H.264/AVC 및 H.265/HEVC는 52레벨의 양자화 파라미터를 규정한다. 따라서, 양자화 스텝은 양자화 파라미터를 변경함으로써 조정될 수 있다. 다른 예로서, 양자화 스텝은 스케일링 인자를 조정하여 변경될 수 있다. 전형적으로, 스케일링 인자를 결정하기 위해, 양자화 행렬이라고도 하는 다중 스케일링 인자 행렬 중 하나가 선택될 수 있다. 전술한 두 가지 예에서 상이한 데이터가 변경되었지만, 양자화 스텝은 본질적으로 조정된다.

손실 인코딩의 경우, 재구성 화소와 원래 화소는 다를 수 있으며, 이 둘의 차이를 왜곡이라 한다. 휘도 마스킹 효과(luminance masking effect) 및 콘트라스트 마스킹 효과(contrast masking effect)와 같은 다수의 시각적 마스킹 효과(visual masking effect)로 인해, 인간의 눈에 의해 관찰되는 왜곡 강도는 왜곡이 위치하는 배경의 특징과 밀접하게 관련된다. 즉, 인간의 눈의 왜곡에 대한 민감도는 배경 휘도 및 왜곡 위치의 배경 콘트라스트와 관련된다. 일반적으로, 왜곡 감도와 배경 휘도는 U 자형의 곡선 관계를 나타내고, 왜곡 감도와 배경의 분산(variance) 또는 표준 편차(standard deviation)는 단조 감소 관계(monotonically decreasing relationship)를 나타낸다. 비디오 코딩에서의, 전술 한 시각적 특징을 참조하면, 왜곡에 대한 시각적 민감도의 영역(즉, 상대적으로 작은 왜곡 민감도의 영역)에서 이러한 양자화 스텝은 증가하고, 양자화 스텝은 왜곡에 대한 시각적 민감도의 영역에서 감소 된다. 따라서, 균일한 양자화 스텝과 비교하여, 코딩 왜곡 할당은 인간의 눈에 대한 시각적 인식에 더욱 적합할 수 있고, 주관적 품질은 동일한 비트 레이트에서 개선, 즉 코딩 효율이 개선된다.

종래 기술에서 제공되는 양자화 스텝을 조정하는 방법은 다음과 같다.

인코더에서, 비디오 시퀀스가 분석되고, 각 코드 블록의 변환 계수에 대응하는 양자화 파라미터 QP(quantization parameter)가 결정되고, 양자화 파라미터 또는 슬라이스 양자화 파라미터(slice QP)에 대한 양자화 파라미터의 오프셋(delta QP)이 비트 스트림에 기록된다. 디코더에서, 각 코드 블록의 양자화 스텝은 파싱방식으로 획득된 양자화 파라미터에 따라 조정된다.

전술 한 기존의 기술적 해결 수단에서, 인코더에서 양자화 파라미터가 결정되고, 비트 스트림에서 양자화 파라미터 정보가 전송되어, 디코더는 각 코드 블록의 양자화 스텝 조정 값을 학습하여 적응 양자화 스텝 조정을 구현한다. 그러나 양자화 파라미터에 대응하는 부가 정보(side information)는 코딩 효율의 향상을 어느 정도 제한한다.

본 발명은 비디오 코딩에서의 적응형 역양자화 방법 및 장치를 제공한다. 본 발명이 제공하는 방법 및 장치에 따르면, 양자화 파라미터에 대응하는 부가 정보가 코딩 효율 개선을 어느 정도 제한한다는 종래 기술의 문제점이 해소된다.

제1 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 방법이 제공되고, 이러한 방법은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -; 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하는 단계; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제1 측면을 참조하면, 구현 가능한 제1 방식에서, 구현 가능한 제2 방식에서, 상기 디코딩된 화소 정보는, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 이미지 영역의 화소 정보를 더 포함한다.

제1 측면 또는 구현 가능한 제1 방식을 참조하면, 제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 화소 분산(pixel variance:

)의 제2 함수

에 따라 상기 양자화 조정 인자를 계산하는 단계를 포함하고, 상기 화소 분산

는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 화소 분산

및 화소 평균

의 결합 함수

에 따라, 상기 양자와 조정 인자를 계산하는 단계를 포함하고, 상기 화소 평균

는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산

는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 최대 화소 값(maximum pixel value:

) 및 최소 화소 값(minimum pixel value:

) 간 차의 제3 함수

에 따라 상기 양자화 조정 인자를 계산하는 단계를 포함하고, 상기 최대 화소 값

는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제7 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 간 대응 관계임-; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제8 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하는 단계; 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제9 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하고, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제10 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고, 제3 변환 계수 세트 내의 계수를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하는 단계를 포함한다.

제2 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 방법을 제공하고, 이러한 방법은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역 X를 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역 X의 시간적 이웃 화소 정보(temporal neighborhood pixel information)를 획득하는 단계; 제1 평균

및 제1 분산에 따라, 양자화 조정 인자를 계산하는 단계; - 상기 제1 평균

는, 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 제1 분산에

는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분임 -; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제2 측면을 참조하면, 구현 가능한 제1 방식에서, 상기 제1 평균

및 제1 분산

에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제1 평균

및 제1 분산

의 결합 함수

에 따라, 상기 양자화 조정 인자를 계산하는 단계를 포함한다.

제2 측면 또는 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 사이의 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터를 획득하는 단계; 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라, 레벨 스케일(level scale)을 결정하고, 상기 레벨 스케일을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.

제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링을 수행하고 제2 양자화 스텝을 획득하며, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수에 역양자화를 수행하는 단계를 포함한다.

제2 측면, 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 상기 제1 양자화 스텝을 사용하여 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고 제3 변환 계수 세트를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여 상기 제3 변환 계수 세트 내의 계수에 스케일링을 수행하는 단계를 포함한다.

제3 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 장치가 제공되고, 이러한 장치는, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하도록 구성된 결정 유닛 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성된 획득 유닛 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -; 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하도록 구성된 계산 유닛; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된 역양자화 유닛을 포함한다.

제3 측면을 참조하면, 구현 가능한 제1 방식에서, 상기 획득 유닛은 추가로, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 디코딩된 화소 정보로부터 상기 이미지 영역의 화소 정보를 획득하도록 구성된다. 제3 측면 또는 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 화소 평균

의 제1 함수

에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 화소 평균

은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분(color space component)의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 상기 계산 유닛은 구체적으로, 화소 평균

의 제1 함수

제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 계산 유닛은 구체적으로, 화소 분산(pixel variance:

)의 제2 함수

에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 화소 분산

는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응한다.

제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 계산 유닛은 구체적으로, 화소 분산

및 화소 평균

의 결합 함수

에 따라, 상기 양자와 조정 인자를 계산하도록 구성되고, 상기 화소 평균

제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 계산 유닛은 구체적으로, 최대 화소 값(maximum pixel value:

) 및 최소 화소 값(minimum pixel value:

) 간 차의 제3 함수

에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 최대 화소 값

제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 역양자화 유닛은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하고, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되며, 상기 제1 대응 관계는, 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계이다.

제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제7 방식에서, 상기 역양자화 유닛은 구체적으로, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 상기 제2 대응 관계는, 양자화 조정 인자와 양자화 행렬 간 대응 관계이다.

제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제8 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고, 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.

제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제9 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.

제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제10 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된다.

제4 측면에 따르면, 비디오 코딩에서의 적응형 역양자 장치를 제공하고 이러한 장치는, 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역(X)을 결정하도록 구성된 결정 유닛 - 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수임 -; 이미지 영역(X)의 시간적 이웃 화소 정보를 획득하도록 구성된 제1 획득 유닛; 제1 평균

및 제1 분산

에 따라, 양자화 조정 인자를 계산하도록 구성된 계산유닛 - 제1 평균

은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 색 공간 성분의 평균이며, 제1 분산

는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분 임 -; 및 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행하도록 구성된; 제1 역양자화 유닛을 포함한다.

제2 측면을 참조하면, 구현 가능한 제1 방식에서, 계산 유닛은 구체적으로, 화소 평균

및 화소 분산

의 결합 함수

에 따라 계산하도록 구성되며, 화소 평균

은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 컬러 공간 성분의 평균이고, 화소 분산

는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 컬러 공간 성분의 분산이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.

제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 제1 역양자화 유닛은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트를 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.

제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 제1 역양자화 유닛은 구체적으로 미리 설정된 제2 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 양자화 행렬에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이다.

제4 측면 또는 제4 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고, 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.

제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.

제4 측면, 또는 제4 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된다.

전술한 기술적 해결 수단의 하나 또는 둘은 적어도 이하의 기술적 효과를 가진다.

본 발명의 실시 예들에서 제공되는 기술적 해결수단에 따르면, 변환 블록의 공간적 인접 정보를 이용하여 현재 변환 블록이 위치하는 배경 영역의 통계적 특징을 추정하고, 역 양자화를 위한 양자화 조정 인자를 적응적으로 도출하며, 역양자화 처리가 유연하게 조정된다. 본 발명의 실시예에서 제공되는 기술적 해결 수단에서의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도가 인간 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다.

도 1은 본 발명의 일 실시예에 따른 비디오 코딩에서의 적응형 역양자화 방법의 개략적 흐름도이다.
도 2는 본 발명의 실시예에 따른 이미지 영역의 제1 공간적 이웃 화소의 개략도이다.
도 3은 본 발명의 일 실시예에 따른 이미지 영역의 제2 공간적 이웃 화소의 개략도이다.
도 4는 본 발명의 다른 실시예에 따른 비디오 코딩에서의 적응형 역양자화 방법의 개략적 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 비디오 코딩에서의 적응형 역양자화 장치의 개략적 구조도이다.

종래 기술에서, 양자화 파라미터는 인코더에서 결정되고 양자화 파라미터 정보를 비트 스트림으로 전송하여 각 코드 블록의 양자화 스텝 조정 값을 학습하여 적응형 양자화 스텝 조정을 구현하였다. 그러나 양자화 파라미터에 대응하는 부가 정보는 코딩 효율의 향상을 어느 정도 제한한다. 따라서, 종래 기술의 문제점을 해결하기 위하여, 본 발명의 실시예는 비디오 코딩에서의 적응형 역양자화 방법을 제공하며, 이하의 단계를 포함한다.

현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하는 단계 - 제1 변환 계수 세트는 N 개의 변화 계수를 포함하고, 변환 계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이며, N은 양의 정수임 -;

이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 디코딩된 화소 정보는 이미지 영역의 공간적 이웃 화소 정보를 포함함 -;

디코딩된 화소 정보에 따라 양자화 조정 인자를 계산하는 단계; 및

제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행하는 단계

를 포함한다.

본 발명의 본 실시예에서 제공하는 해결 수단에 따르면, 변환 블록의 공간적 이웃 정보를 이용하여 현재의 변환 블록이 위치하는 배경 영역의 통계적 특징을 추정하고, 양자화 조정 인자를 적응적으로 도출하며, 역양자화 처리를 유연하게 조정한다. 한편으로, 본 발명의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도는 인간의 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다.

한편, 비트 스트림에서 양자화 조정 정보가 전송되는 기존의 해결수단과 비교하여, 본 발명의 실시예에서 제공되는 해결수단에 따르면, 엑스트라 비트 오버 헤드(extra bit overhead)가 양자화 조정 정보를 전송할 필요가 없기 때문에 코딩 효율을 더 향상시킨다.

본 발명의 실시예의 목적, 기술적 해결 수단, 및 장점을 보다 명확하게 하기 위해, 본 발명의 실시예에서 첨부된 도면들을 참조하여 본 발명의 실시예의 기술적 해결수단을 다음과 같이 명확하고 완전하게 설명한다. 명백하게, 기술된 실시예는 본 발명의 일부 실시예에 불과하지며 전부는 아니다. 창의적인 노력 없이 본 발명의 실시예에 기초하여 당업자에 의해 획득된 다른 모든 실시예는 본 발명의 보호 범위 내에 있다.

실시예

도 1에 도시된 바와 같이, 본 발명의 일 실시예는 비디오 코딩에서의 적응형 역양자화 방법을 제공하며, 이러한 방법은 다음 단계를 포함한다.

단계 101: 현재 디코딩된 이미지에서 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환 계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수이다.

본 발명의 본 실시예에서, 제1 변환 계수 세트는 N 개의 변환 계수

를 포함할 수 있고, N은 양의 정수, 예를 들어 N = 1, 2, 4, 16, 32, 50, 64, 81, 128, 256, 512 또는 1024이다. 변환 계수

는 현재 디코딩된 이미지에서 임의의 색 공간 성분의 변환 계수, 예를 들면 휘도 성분의 변환 계수, 색차 성분(chrominance component)의 변환 계수, 및 RGB 성분 중 어느 하나(예를 들면, R 성분)의 변환 계수이다.

현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역은 제1 변환 계수 세트에 대응하는 영역이다. 예를 들어, H.264/AVC 또는 H.265/HEVC 표준에 대응하는 하이브리드 코딩 프레임 워크(hybrid coding framework)에서, 제1 변환 계수 세트에 대응하는 이미지 영역은, 제1 변환 계수 세트에 대응하는, 변환 블록(transform block) 또는 변환 유닛(transform unit)에 의해 커버 되는 이미지 영역이다. 본 발명의 실시예에서, 제1 변환 계수 세트는 하나의 변환 블록의 모든 변환 계수 또는 하나의 변환 블록의 일부 변환 계수, 예를 들어, 다이렉트 현재 계수(direct current coefficient) 또는 저주파 계수의 그룹, 또는 고주파 계수의 그룹, 또는 다이렉트 현재 계수와 고주파 계수의 그룹을 포함할 수 있거나, 또는 하나의 변환 블록 내의 구체적 계수 스캐닝 시퀀스(coefficient scanning sequence)에서의 처음 몇몇 계수들을 포함 할 수있다.

단계 102: 이미지 영역의 디코딩된 화소 정보를 획득하고, 디코딩된 화소 정보는, 이미지 영역의 공간적 이웃 화소 정보를 포함한다.

본 발명의 실시예에서, 공간적 이웃 화소 정보는, 이미지 영역과 동일한 디코딩된 이미지의 프레임 내의 화소 정보에 관한 것이고, 서로 다른 디코딩 조건에 따라 인접 화소의 위치 및 범위를 적응적으로 조정된다.

공간적 이웃 화소 정보는 이미지 영역(X)의 공간적으로 인접한 적어도 하나의 화소의 재구성 값 및/또는 이미지 영역(X)의 공간적으로 인접한 화소 정보에 따라 생성된 적어도 하나의 인트라 예측 화소의값를 포함할 수 있다.

디코딩된 화소 정보가 공간적 이웃 화소 정보인 경우, 공간적 이웃 화소 정보는 M 개의 화소를 포함할 수 있고, M은 양의 정수이며, 공간적 이웃 화소 정보는 다음 화소 정보 중 적어도 하나를 포함한다.

(1) 이미지 영역(X)의 공간적 이웃 영역(Y1)(공간적 이웃 영역(Y1)의 몇몇 선택적인 예가 도 2에 도시됨)의 화소 정보는 공간적 이웃 영역(Y1)에서의 적어도 하나의 화소의 재구성 값을 포함하고, 공간적 이웃 영역(Y1)의 특정 경우는 다음과 같을 수 있다

공간적 이웃 영역(Y1)은 X의, 상부, 하부, 좌측, 또는 우측 경계의 적어도 하나의 경계에 인접한 영역, 예를 들어, X의, 좌측 경계와 상부 경계 양쪽에 인접한 L- 모양 영역(도 2에 도시된, 실시예 a 및 b), 또는 영역(X)의 상부 경계, 좌측 경계, 또는 우측 경계 중 어느 하나에 인접한 직사각형 영역(도 2에 도시된, 실시 예 c, 실시 예 d, 및 실시예 e), 또는 영역(X)을 포함하는 직사각형 영역에서 X가 제거된 영역(도 2의 실시예 f)와 같을 수 있다.

(2) 이미지 영역(X)의 공간적 이웃 영역 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 적어도 하나의 인트라 예측 화소는, 구체적으로 이하:

인트라 예측 방식으로, 이미지 영역(X)의 공간적 이웃 영역(Y2) 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 예측 화소 정보 (이미지 영역(X)의 공간적 이웃 영역(Y2)의 몇 가지 선택적 예가 도 3에 도시됨)를 포함한다.

인트라 예측 방식은, 예를 들면, H.265/HEVC에서의, 방향 기반 인트라 예측 모드(direction-based intra-prediction mode), DC 예측 모드, 및 평면 예측 모드이며, 다른 예로서, 템플릿 매칭(template matching) 방법 또는 인트라 움직임 보상(Intra Motion Compensation)을 포함 할 수 있다.

이미지 영역(X)의 예측 화소 정보는, 적어도 1개의, 이미지 영역(X)의 인트라 예측 화소를 포함하고, 공간적 이웃 영역(Y2)은 공간적 이웃 영역(Y1)이거나 또는, 공간적 이웃 영역(Y1)을 제외한 영역, 예를 들어, 공간적 이웃 영역(Y2)은 X의 좌측 경계선 및 상부 경계선에 인접한 L 자형 영역(도 3의 실시예 a 및 b 도시됨)이거나, (도 3의 실시예 c 및 d와 같이) X의, 좌측 또는 상부 영역에서 X와 동일 크기를 가진 직사각형 영역, 또는 X를 포함하는 직사각형 영역에서 X가 제거된 후 획득된 영역의 일부(도 3의 실시예 e)를 포함할 수 있다.

단계 103: 디코딩된 화소 정보에 따라 양자화 조정 인자를 계산한다.

본 발명의 실시예에서, 역양자화 동안, 적응성 역양자화 효과를 달성하기 위해, 양자화 조정 인자는 디코딩된 화소 정보의 일부 특징을 반영할 수 있는 파라미터를 사용함으로써 계산된다. 본 발명의 실시 예에서, 양자화 조정 인자는 디코딩된 화소의 통계적 특징을 반영하는 파라미터를 사용하여 계산될 수 있는데, 이는 구체적으로 다음을 포함한다.

디코딩된 화소 정보의 통계적 특징은, 디코딩된 화소 정보에서 복수의 화소의 화소 값과 통계적으로 분석된 후 얻어지는 값 결과를 의미하며, 통계적 특징을 갖는 파라미터는 화소 평균

, 화소 분산(pixel variance)

, 최대 화소 값

, 또는 최소 화소 값

을 포함할 수 있다.

단계 104: 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다.

더욱 정확하고 안정된 통계적 특징 계산을 위해, 더 많은 디코딩된 화소 정보를 얻기 위해, 본 발명의 실시 예에서 디코딩된 화소 정보는, 이미지 영역(X)의 시간적 이웃 화소 정보를 더 포함할 수 있다. 시간적 이웃 화소 정보는, 현재 디코딩된 이미지가 위치하는 이미지의 앞 또는 뒤의 코딩 된 이미지의 하나 이상의 프레임을 포함하고, 시간적 이웃 화소 정보는 이하의 2 개:

(1) 코딩된 다른 이미지 내의 이미지 영역(X)의 대응하는 영역에서 적어도 하나의 화소의 재구성 값 또는 보간 필터링(interpolation filtering)에 의해 획득된 부화소 정확도(sub-pixel accuracy)의 재구성 된값

대응하는 영역은 이미지 영역(X)의 모션 벡터(motion vector)에 따라, 그리고 공통 모션 보상 프로세싱(common motion compensation processing)에 의해 획득될 수 있다. 특히, 이미지 영역(X)의 모션 벡터가 부화소 정확도 일 때, 모션 벡터를 정수값으로 반올림 한다음 움직임 보상을 하여 대응하는 영역을 구할 수 있다.

(2) 이미지 영역(X)에 대응하는, 적어도 2개의 코딩 된 이미지에서 대응하는 영역의 적어도 하나의 위치에서 화소의 재구성값의 가중 평균

을 포함한다.

예를 들어, 2개의 코딩된 이미지가 사용될 때, 2개의 코딩된 이미지 내에서 대응하는 영역은, 이미지 영역(X)의 모션 벡터를 사용하여 개별적으로 발견된다. 2개의 대응하는 영역 내의 동일한 위치에 있는 화소는 대응하는 화소이고, 대응하는 화소 그룹의 가중 평균은 시간적 이웃 화소 정보에서 화소로서 사용되며, 동일한 위치는, 정수 화소 위치 또는 서브 화소일 수 있다.

본 발명의 본 실시예에서, 디코더에서, 재구성된 공간적 이웃 화소 정보, 또는 재구성된 공간적 이웃 화소 정보와 재구성된 시간적 이웃 화소 정보의 조합은 현재 디코딩 블록에 대응하는 원래 화소 정보를 근사(approximate)하는데 사용되고, 양자화 조정 인자가 유도된다. 따라서, 이미지의 다른 영역의 레지듀얼 변환 계수를 적응적으로 변환하고 코딩 성능을 향상시킨다.

본 발명의 실시예에서 제공되는 기술적 해결수단에 따르면, 양자화 조정과 관련된 파라미터 정보가 비트 스트림으로 전송될 필요가 없다. 따라서 비트 레이트가 감소한다. 또한, 본 발명의 실시 예에서, 양자화 조정 인자는, 공간적 이웃 화소 정보만 사용하여 도출되며, 이것은 인트라 프레임 이미지 코딩에 적용될 수 있다. 본 발명의 실시 예에서 제공되는 방법 또한 프레임 간 이미지 코딩에도 적용 가능하다.

본 발명의 본 실시예에서의 디코딩된 화소 정보는 이미지 영역(X)의 공간적 이웃 화소 정보, 또는 시간적 이웃 화소 정보와 이미지 영역(X)의 공간적 이웃 화소 정보의 조합일 수 있고, 디코딩된 화소 정보는 상이한 콘텐츠를 포함할 수 있다. 따라서, 본 발명의 실시예에서, 양자화 조정 인자는 다양한 방식으로 디코딩된 화소 정보에 따라 계산될 수 있다. 구체적 구현은 이하를 포함한다.

첫째, 본 발명의 본 실시예에서, 양자화 조정 인자는, 디코딩된 화소 정보에 대응하는 파라미터: 화소 평균

, 화소 분산(pixel variance)

, 최대 화소 값

, 또는 최소 화소 값

에 따라 계산될 수 있다.

전술한 파라미터(화소 평균

, 화소 분산

, 최대 화소 값

, 또는 최소 화소 값

_)에 기초하여, 양자화 조정 인자

를 계산하는 구체적 방법은 이하의 방식 중 어느 하나가 사용될 수 있다.

방식 1: 양자화 조정 인자는, 화소 평균

의 제1 함수

에 따라 계산되고, 화소 평균

은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 색 공간 성분의 평균이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

디코딩된 화소가 공간적 이웃 화소 정보만 포함하는 경우, 화소 평균

은 구체적으로 이하이다.

화소 평균

은, 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 평균이거나, 공간적 이웃 화소 정보에서 복수의 화소의 동일한 신호 성분의 평균이며, 신소 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.

디코딩된 화소가 공간적 이웃 화소 정보와 시간적 이웃 화소 정보의 조합인 경우, 화소 평균

은 구체적으로 이하와 같다.

화소 평균

은, 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보에서 복수의 화소의 휘도 성분의 평균, 또는 공간적 이웃 호소 정보 및 시간적 이웃 화소 정보 내에서 복수의 화소의 동일한 신호 성분의 평균이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.

구체적 실시예에서, 제1 함수는,

일 수 있고, 예를 들어

=1 또는 0.5인,

이며,

는

에 대한 U자 모양의 함수일 수 있다.

에 대해,

가 임계치 T1보다 작으면,

의 1차 미분은 0보다 작고,

가 임계치 T2보다 크면,

의 1차 미분은 0보다 크며,

가 임계치 T1과 임계치 T2 사이에 있으면,

는 상수 C0와 같고, T1≥0, T2≥0, 및 T2=T1이며, T1은 0, 64, 또는 128일 수 있고, T2는 0, 80, 또는 170일 수 있으며, C0는 0.5, 0.75, 1, 1.5, 8, 16, 256, 또는 1024인 양의 실수일 수 있다. 더욱 구체적으로 함수

는 이하:

일 수 있고,

는

=150 또는 200.8인 양의 실수이고,

는

=425 또는 485.5와 같은 양의 실수일 수 있다. 다른 예를 들어, 함수

는 이하:

일 수 있고,

은 예를 들어,

=10240 또는 8135.6인 양의 정수이며,

는

=256 또는 135.1과 같은 양의 정수일 수 있다.

방식 2: 양자화 조정 인자는, 화소 분산

의 함수

에 따라 계산되고, 화소 분산

는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

디코딩된 호소가 공간적 이웃 화소 정만 포함하는 경우, 화소 분산

는 구체적으로 이하와 같다.

화소 분산

는, 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 분산 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 분산이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.

디코딩된 화소가 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보의 조합이면, 화소 분산

는 구체적으로 이하와 같다.

화소 분산

는, 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분 분산, 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 분산이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.

구체적 실시예에서, 양자화 조정 인자

는 화소 분산

의 제2 함수

에 따라 계산되고,

이며,

는 예를 들어 1 또는 0.8일 수 있고,

는

에 대한 모노톤 함수(monotone function)일 수 있다.

에 대해,

가 임계치 T3보다 적으면,

는 상수 C3이고,

가 임계치 T3와 같거나 그보다 크면,

의 1차 미분은 0보다 크며, T3≥0이고, T3는 예를 들어, 0, 3, 5, 또는 10일 수 있으며, 예를 들어,

=1/2 또는 1인

>0이고, C3는 예를 들어, 0.5, 0.8, 1, 16, 32, 또는 256인 양의 실수 일수 있다. 더욱 구체적으로, 함수

는 이하:

일수 있고,

는 양의 실수, 예를 들어,

=10, 20, 253, 80, 또는 100일 수 있다.

방식 3: 양자화 조정 인자는 최대 화소 값

과 최소 화소 값

사이의 차인, 제3 함수

에 따라 계산되고, 최대 화소 값

은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 색 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

양자화 조정 인자

는 화소 평균

의 제1 함수

및 화소 분산

의 제2 함수

의 결합 함수

에 의해 계산되고,

, 예를 들어,

=1 및

=1, 또는

=0.5 및

=1.5, 또는

=2 및

=1이다.

방식 4: 양자화 조정 인자는 최대 화소 값

과 최소 화소 값

사이의 차인, 함수

에 의해 계산되고, 최대 화소 값

는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 색 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값 또는 복수의 화소의 동일한 색 공간 성분의 최소값이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

디코딩된 화소가 공간적 이웃 화소만 포함하는 경우, 최대 화소 값

과 최소 화소 값

은 구체적으로 이하와 같다.

최대 화소 값

은 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최대값 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최대값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.

최소 화소 값

은 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최소값 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최소값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.

디코딩된 화소가 공간적 이웃 화소 및 시간적 이웃 화소 정보의 조합인 경우, 최대 화소 값

과 최소 화소 값

은 구체적으로 이하와 같다.

최대 화소 값

은 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최대값 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최대값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.

최소 화소 값

은 공간적 이웃 화소 정보 내 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최소값 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최소값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.

구체적 실시예에서, 양자화 조정 인자

는 양자화 조정 인자는 최대 화소 값

과 최소 화소 값

사이의 차인, 함수

에 의해 계산된다. 제3 함수는 단조 증가 함수(monotonically increasing function)일 수 있고, 예를 들어 이하:

이고, C4는 양의 실수, 예를 들어, 0.5, 1, 16, 32, 또는 256일 수 있고,

는 양의 실수, 예를 들어,

=1 또는 1/2이며,

는 양의 실수, 예를 들어,

=20 또는

=C4/2이다.

전술한 4개의 방식 중 어느 하나에 따라, 양자화 조정 인자

가 획득된 후, 선택적으로, 값 제한 처리가 추가로 양자화 조정 인자

에 수행될 수 있고,

는 미리 설정된 값 범위에 대응한다. 예를 들어,

는 미리 설정된 값 범위 즉, 이하:

로 제한된다.

및

는 양의 실수, 예를 들어,

=0.5이고

=2 또는

=0.6이고

=1.5이다.

다른 실시예에서,

는, 매핑 함수를 사용하여 값 범위로 매핑되고, 이러한 매핑 함수는 예를 들어 이하:

이고,

,

, 및

은 실수, 예를 들어,

=1.0 ,

=0.5,

=1.5, 및

=1.0, 또는

=1.1 ,

=0.4,

=1.2, 및

=1.15이다.

전술한 파라미터, T1, T2, T3, C0, C3, C4,

,

, 및

은 미리 설정된 상수 또는 비디오 화상의 통계적 특징에 따른 계산의 방식으로 획득되거나 또는 비디오 비트스트림으로부터 추출될 수 있다.

본 발명의 본 실시예에서, 단계 104에서 역양자화 처리는 다양한 방식으로 구현될 수 있다. 이하에서 가능한 몇가지 방법을 제공한다.

방식 1: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 스케일링은, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 수행되어 제2 양자화 스텝을 획득하고, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 제2 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행된다. 구체적 구현 방식은 이하:

현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝

를 획득하는 단계; 및

를 획득하기 위해, 양자화 조정 인자에 따라 제1 양자화 스텝

에 스케일링을 수행하고, 제2 변환 계수 세트에서 변환 계수

를 획득하기 위해, 제1 변환 계수 세트 내의 변환 계수

에 역양자화를 수행하는 단계

와 같을 수 있다.

여기에서,

이고,

는 라운딩 상수(rounding constant), 예를 들어,

=0.5이다. 역양자화가 정수의 가산 및 이동에 의해 구현될 때, 이하의 수식:

이 사용될 수 있고,

는 제1 양자화 스텝의 정수 결과이고,

는 현재 디코딩된 이미지에 대응하는 신호 내에서 시프팅 비트(shifting bit) 수이며,

는

의 정수 결과(integer result), 예를 들어,

는 2의 정수 배수로

를 곱한 후 라운딩 방식(means of rounding)으로 획득되거나, 또는

는

를 직접 라운딩하여 획득되거나, 또는

의 정수 결과는, 화소 평균 및 화소 분산에 따라 테이블을 참조하여 획득될 수 있고,

는 시프팅 비트에 필요한 추가 수량이다.

방식 2: 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)가 미리 설정된 제1 대응 관계에 따라 결정되고, 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 역양자화가 제1 변환 계수 세트에 수행된다.

본 발명의 본 실시예에서, 양자화 조정 인자

와 복수의 레벨 스케일링 리스트 사이의 제1 대응 관계는 미리 설정될 수 있다.

더욱 구체적으로, QC의 값 범위는 미리 H1(H1은 1보다 큰 양의 정수, 예를 들어 H1 = 3, 5 또는 6) 간격으로 나누어지고, 각 간격은 미리 설정된 레벨 스케일링 리스트에 대응한다. 계산 방식에 의해 얻어진 양자화 조정 계수 QC가 속하는 값 간격(value interval)이 검색되고, 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서, 양자화 조정 인자(QC)가 속하는 값 간격에 대응하는 레벨 스케일링리스트가 선택된다.

예를 들어, QC와 레벨 스케일링리스트 간의 매핑 관계 테이블 (표 1) 은, 각각 6개의 엘리먼트를 포함하는 레벨 스케일링리스트에 대해, QC에 따라 하나의 레벨 스케일링리스트가 선택되는 예를 제공한다.

	레벨 스케일링 리스트
QC≥1.5	{60,68,77,86,96,108}
1.2<QC<1.5	{54,61,69,77,86,97}
0.8≤QC≤1.2	{40,45,51,57,64,72}
0.6<QC<0.8	{28,32,36,40,45,50}
QC≤0.6	{24,27,31,34,38,43}

표 1에 주어진 예에 따르면, QC가 0.9일 때, QC가 속하는 값 범위는 0.8≤QC≤1.2로 검색되고, 값 범위 0.8≤QC≤1.2에 대응하는 레벨 스케일링 리스트{40, 45, 51, 57, 64, 72} 는 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서 선택된다.

방식 3: 양자화 조정 인자에 대응하는 타깃 양자화 행렬은, 미리 설정된 제2 대응 관계에 따라 결정되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 타깃 양자화 행렬에 따라 제1 변환 계수 세트에 수행된다.

QC의 값 범위는 미리 H2(H2는 1보다 큰 양의 정수, 예를 들어 H2 = 3, 5 또는 6) 간격으로 분할되고, 각 간격은 미리 설정된 양자화 행렬에 대응한다. QC가 속하는 값 간격이 검색되고, 대응하는 양자화 행렬이, 제1 변환 계수 세트에 역양자화가 수행되는 양자화 행렬로서 선택된다. 예를 들어, 표 2는

변환 블록을 제공한다.

	QC<16	16≤QC≤64	QC>64
양자화 행렬	16,13,14,14, 13,14,16,16, 14,16,16,16, 14,16,16,16	16,16,16,16, 16,16,16,16, 16,16,16,16, 16,16,16,16	18,18,16,16, 18,18,20,16, 16,20,20,22, 16,16,22,16

표 2의 예에 따르면, 계산방식으로 얻어진 QC값이 18이고, QC가 속하는 값 범위가 표 2에 주어진 파라미터로부터 16≤QC≤64로 결정될 수 있다면, 제1 변환 계수 세트에 역양자화가 수행되는, 대응하는 4×4 양자화 행렬은 표 2의 제3행의 양자화 행렬이다.

방식 4: 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터는 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 타깃 양자화 파라미터 오프셋은 양자화 조정 인자에 따라 결정되며, 타깃 양자화 파라미터 오프셋은 제1 양자화 파라미터에 추가되어 제2 양자화 파라미터를 획득되고, 레벨 스케일은 제2 양자화 파라미터에 따라 결정되고, 제2 변환 계수 세트를 획득하기 위해, 레벨 스케일을 사용하여 제1 변환 계수 세트에 역양자화가 수행된다.

레벨 스케일

을 이용하여 설정되는 제1 변환 파라미터에 대한 역양자화는 구체적 이하의 식:

,

, 및

을 사용하여 구현될 수 있고,

는 라운딩 오프셋(rounding offset)이다.

방식 5: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은, 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 역양자화가 1 양자화 스텝을 사용하여, 제1 변환 계수 세트 내의 계수에 수행되어 제3 변환 계수 세트 내의 계수를 획득하고, 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 양자화 조정 인자를 사용하여, 스케일링은 제3 변환 계수 세트 내의 계수에 수행된다.

구체적 구현은 이하:

먼저, 제1 양자화 스텝

를 사용하여 제1 변환 계수 세트에 역양자화를 수행하여 제3 변환 계수 세트

, 즉,

를 획득한 다음,

에 스케일링 및 라운딩을 수행하여 제2 변환 계수

즉,

를 획득하고,

및

는 라운딩 오프셋이다.

제1 양자화 파라미터

는, 제1 변환 계수 세트가 위치하는 변환 블록의,

고, 현재 디코딩된 이미지, 예를 들어, 프레임 레벨 양자화 파라미터에 대응하는 신호에 의해 지시되는 디폴트 양자화 파라미터이다.

본 발명의 본 실시예에서 제공되는 해결수단에 따르면, 디코더에서, 재구성 된 공간적 이웃 화소 정보, 또는 재구성된 공간적 이웃 화소 정보와 재구성된 시간적 이웃 화소 정보의 조합은, 현재의 디코딩 블록에 대응하는 원래 화소 정보에 근사하기 위해 사용되며, 양자화 조정 인자가 유도됨으로써, 이미지의 상이한 영역의 레지듀얼 변환 계수의 양자화 스텝이 적응적으로 조정되며, 코딩 성능이 향상된다.

실시예

도 4에 도시된 바와 같이, 본 발명의 다른 실시예는 추가로, 비디오 코딩에서의 적응형 역양자화 방법을 제공하고, 이러한 방법은 이하를 포함한다.

단계 401: 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역(X)을 결정하고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수이다.

본 실시예에서, 제1 변환 계수 세트는 휘도 성분 변환 블록의 모든 교류 계수(alternating current coefficient) 또는 휘도 성분 변환 블록의 모든 계수를 포함할 수 있다.

단계 402: 이미지 영역(X)의 시간적 이웃 화소 정보를 획득한다.

시간적 이웃 화소 정보는, 코딩된 다른 이미지의 이미지 영역(X)의 대응하는 영역 내의 적어도 하나의 화소의 재구성 값 또는 보간 필터링에 의해 획득된 부화소 정확도 재구성 값, 및/또는 이미지 영역(X)에 대응하는, 적어도 2개의 디코딩 된 이미지에서 대응하는 영역 내의 적어도 하나의 위치에서, 화소의 재구성 값의 가중 평균을 계산한다.

코딩된 다른 이미지에서, 이미지 영역(X)의 대응하는 영역이 부화소 위치인 경우, 시간적 이웃 화소 정보는, 부화소 위치에서, 보간 필터링 방식으로 획득된 부화소 정확도 재구성값이다.

단계 403: 제1 평균

및 제1 분산

에 따라, 양자화 조정 인자를 계산하고, 제1 평균

는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.

양자화 조정 인자

는, 제1 평균

의 제1 함수

와 제1 분산

의 제2 함수

의 결합 함수

에 의해 계산되고, 예를 들어,

=0.4 및

=0.6, 또는

=0.5 및

=0.5이다.

제1 함수는 예를 들어 이하:

와 같고,

제2 함수는 예를 들어 이하:

와 같다.

본 발명의 본 실시예에서, 제1 및 제2 함수를 사용하여, 양자화 조정 인자가 계산된 후, 선택적으로, 양자화 조정 인자

는 추가로 이하를 포함할 수 있다.

양자화 조정 인자

에 제한 값 제한 처리를 수행하고,

는 미리 설정된 값 범위에 대응한다.

값 제한 처리를 위한 구체적 구현의 선택적 방식은, 미리 설정된

값 범위(value range)로

를 제안하는 단계 또는

를 매핑 함수를 사용하여 값 범위로 매핑하는 단계를 포함할 수 있다.

단계 404: 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행한다.

본 발명의 본 실시예에서, 제1 변환 계수 세트의 역양자화 변환은 다양한 방식으로 구현될 수 있다. 이하에서 실현 가능한 몇몇 방식을 제공한다.

방식 1: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 스케일링은, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 수행되어 제1 양자화 스텝이 획득되고, 제2 변환 계수 세트를 획득하기 위해, 제2 양자화 스텝을 사용하여 제1 양자화 스텝에 역양자화가 수행된다. 구체적 구현은 이하와 같을 수 있다.

를 획득하는 단계; 및

양자화 조정 인자에 따라, 제1 양자화 스텝

에 스케일링을 수행하여

를 획득하고, 제2 변환 계수 세트 내의 변환 계수

를 획득하기 위해, 제1 변환 계수 세트 내의 변환 계수

에 역양자화를 수행하는 단계

를 포함하고,

이고,

는 라운딩 상수, 예를 들어,

=0.5이다. 역양자화가 정수의 가산 및 시프팅에 의해 구현되는 경우, 이하의 수식:

이 사용될 수 있고,

는

의 정수 결과(integer result), 예를 들어,

는 2의 정수 배수로

는

를 직접 라운딩하여 획득되거나, 또는

는 시프팅 비트에 필요한 추가 수량이다.

본 발명의 본 실시예에서, 양자화 조정 인자

예를 들어, QC와 레벨 스케일링리스트 간의 매핑 관계 표 3은, 각각 6개의 엘리먼트를 포함하는 레벨 스케일링리스트에 대해, QC에 따라 하나의 레벨 스케일링리스트가 선택되는 예를 제공한다.

표 3에 주어진 예에 따르면, QC가 0.9일 때, QC가 속하는 값 범위는 0.8≤QC≤1.2로 검색되고, 값 범위 0.8≤QC≤1.2에 대응하는 레벨 스케일링 리스트{40, 45, 51, 57, 64, 72} 는 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서 선택된다.

QC의 값 범위는 미리 H2(H2는 1보다 큰 양의 정수, 예를 들어 H2 = 3, 5 또는 6) 간격으로 분할되고, 각 간격은 미리 설정된 양자화 행렬에 대응한다. QC가 속하는 값 간격이 검색되고, 대응하는 양자화 행렬이, 제1 변환 계수 세트에 역양자화가 수행되는 양자화 행렬로서 선택된다. 예를 들어, 표 4는

변환 블록을 제공한다.

표 4의 예에 따르면, 계산방식으로 얻어진 QC값이 18이고, QC가 속하는 값 범위가 표 4에 주어진 파라미터로부터 16≤QC≤64로 결정될 수 있다면, 제1 변환 계수 세트에 역양자화가 수행되는, 대응하는 4×4 양자화 행렬은 표 4의 제3행의 양자화 행렬이다.

레벨 스케일

,

, 및

을 사용하여 구현될 수 있고,

는 라운딩 오프셋(rounding offset)이다.

구체적 구현은 이하:

먼저, 제1 양자화 스텝

, 즉,

를 획득한 다음,

에 스케일링 및 라운딩을 수행하여 제2 변환 계수

즉,

를 획득하고,

및

는 라운딩 오프셋이다.

제1 양자화 파라미터

는, 제1 변환 계수 세트가 위치하는 변환 블록의,

실시예

이하에서는, 구체적 파라미터를 참조하여, 본 발명의 실시예에서의 기술적 해결 수단을 설명하고, 구체적 구현은 이하를 포함한다.

제1 변환 계수 세트는 휘도 성분 변환 블록의 모든 계수를 포함한다. 이미지 영역(X)은

영역(즉, 화소의 8개의 행과 8개의 열을 포함하는 직사각형 영역)이다. 이미지 영역(X)의 좌측 위 화소의 좌표는

로 표시된다. 일반적으로, 이미지의 좌표계에서, 좌우에서 우 방향은

방향으로 정의되고, 상에서 하 방향은

방향으로 정의된다.

공간적 인접 화소 정보는 이하의 두 단계를 포함한다.

(1) 이미지 영역(X)의 공간적 이웃 영역(Y1)에서 화소 정보, 및 공간적 이웃 화소 정보는 공간적 이웃 영역(Y1) 내의 적어도 하나의 화소의 재구성 값을 포함한다. 공간적 이웃 영역(Y1)에 포함된 화소 좌표

는 이하의 조건:

, 또는

을 만족하는 것으로 가정하고, J1 내지 J8은 양의 정수, 예를 들어, J1=J2=J3=J5=J6=J7=8 및 J4=J8=1, 또는 J1=J3=12, J2=4, J4=1, J5=J7=12, J6=4, 및 J8=1, 또는 J1=5, J2=8, J3=6, J4=2, J5=10, J6=11, J7=12, 및 J8=1이다.

(2) 인트라 예측 방식으로, 이미지 영역(X)의 공간적 이웃 영역(Y2) 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 예측 화소 정보. 호소 정보는 이미지 영역(X)의 적어도 하나의 인트라 예측 픽셀을 포함한다. 공간적 이웃 영역(Y2)에 포함된 화소 좌표

는 이하의 조건:

; 또는

을 만족하고, S1 및 S2는 양의 정수, 예를 들어, S1=S2=15, 또는 S1=7 및 S2=15이다. 인트라 예측 방식은 H.265/HEVC에서의 33방향 인트라 예측 모드, DC 예측 모드, 또는 평면 예측 모드 중 하나 일 수 있다.

양자화 조정 인자

는, 화소 평균

의 제1 함수

및 화소 분산

에 대한 제2 함수

에 의해 함께 결정되고,

가 사용된다. 휘도 성분의 평균

및 휘도 성분의 분산

는 공간적 이웃 화소 정보 내의 모든 화소의 평균 및 분산이다. 제1 함수 및 제2 함수는 구체적으로 이하:

; 및

이다.

제1 변환 계수 세트의 변환 계수의 역양자화는, 양자화 조정 인자에 따라 조정되고, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 제1 변환 계수 세트에 수행된다. 제1 변환 계수 세트의 변환 계수의 역양자화를 조정하는 방법은 이하: 양자화 조정 인자에 따라, 제1 변환 계수 세트의 원래 양자화 스텝

에 스케일링을 수행하는 단계: 및 스케일링 된 양자화 스텝을, 역양자화가 제1 변환 계수 세트에 수행되는 양자화 스텝로서 사용하는 단계를 포함한다.

실시예

도 5에 도시된 바와 같이, 본 발명의 실시예는 비디오 코딩에서의 적응형 역양자화 장치를 제공하고, 이러한 장치는 결정 유닛(501), 획득 유닛(502), 계산 유닛(503), 및 역양자화 유닛(504)를 포함한다.

결정 유닛(501)은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하도록 구성되고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 변환 계수는 현재 디코딩된 이미지에서 임의의 컬러 공간 성분의 변환 계수이며, N은 양의 정수이다.

획득 유닛(502)은, 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성되고, 디코딩된 화소 정보는 이미지 영역의 공간적 이웃 화소정보를 포함한다.

본 발명의 본 실시예에서, 획득 유닛(502)은 추가로, 이미지 영역의 시간적 이웃 화소 정보 및/또는 디코딩된 화소 정보로부터 이미지 영역의 화소 정보를 획득하도록 구성된다.

계산 유닛(503)은 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하도록 구성된다.

역양자화 유닛(504)은 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다.

본 발명의 본 실시예에서, 계산 유닛(503)은, 다양한 구체적 구현 방식에서, 디코딩된 확소 정보에 따라, 양자화 조정인자를 계산한다.

방식 1: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 평균

에 따라 계산되고, 계산 유닛(503)은 구체적으로, 화소 평균

의 제1 함수

에 따라 양자화 조정 인자를 계산하도록 구성되고, 화소 평균

은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 컬러 공간 성분의 평균이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.

방식 2: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 분산

에 따라 계산되고, 계산 유닛(503)은 구체적으로, 화소 분산

의 제2 함수

에 따라 양자화 조정 인자를 계산하도록 구성되며, 화소 분산

는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 컬러 공간 성분의 분산이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.

방식 3: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 평균

및 화소 분산

에 따라 계산되고, 계산 유닛(503)은 구체적으로, 의 화소 평균

및 화소 분산

의 결합 함수

에 따라 계산하도록 구성되며, 화소 평균

방식 4: 양자화 조정 인자는, 디코딩된 화소 정보의, 최대 화소 값

및 최소 화소 값

에 따라 계산되고, 계산 유닛(503)은 구체적으로, 최대 화소 값

과 최소 화소 값

사이의 차인, 함수

에 의해 양자화 조정 인자를 계산하도록 구성되고, 최대 화소 값

는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 컬러 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값 또는 복수의 화소의 동일한 공간 성분의 최소값이며, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.

본 발명의 본 실시예에서, 역양자화 유닛(504)은, 다양한 구체적 구현 방식에서, 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다. 이하에서 실행 가능한 몇몇 방식을 제공한다.

방식 1: 역양자화는, 레벨 스케일링 리스트를 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트를 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.

방식 2: 역양자화는, 양자화 행렬 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 미리 설정된 제2 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 양자화 행렬에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이다.

방식 3: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 파라미터와 계산 방식으로 획득된 적응형 양자화 파라미터 사이의 차를 사용하여, 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터를 획득하고, 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋을 결정하고, 타깃 양자화 파라미터 오프셋을 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하고, 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 레벨 스케일을 사용하여 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.

방식 4: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 스케일을 수행하고 제2 양자화 스텝을 획득하며, 제2 변환 계수 세트를 획득하기 위해, 제2 양자화 스텝을 사용하여, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.

방식 5: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 제1 양자화 스텝을 사용하여, 제1 변환 계수 세트 내의 계수에 역양자화를 수행하고 제3 변환 계수 세트 내의 계수를 획득하며, 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 양자화 조정 인자를 사용하여 제3 변환 계수 세트 내의 계수에 스케일링을 수행하도록 구성된다.

전술한 본 출원의 실시예에서의 하나 이상의 기술적 해결수단은 적어도 다음의 기술적 효과들을 갖는다.

본 발명의 실시 예에서 제공되는 해결 수단에 따르면, 현재의 변환 블록이 위치하는 배경 영역의 통계적 특징은, 변환 블록의, 공간적 이웃 정보, 또는 시간적 이웃 정보, 또는 공간적 이웃 정보 및 시간적 이웃 정보를 사용하여 추정되고, 역양자화를 위한 양자화 조정 인자가 적응적으로 도출되며, 역양자화 처리가 유연하게 조정된다. 한편으로, 본 발명의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도는, 인간의 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다. 한편, 양자화 조정 정보가 비트 스트림으로 전송되는 종래 해결 수단과 비교하여, 본 발명에 따르면, 양자화 조정 정보를 전송하기 위한 여분의 비트 오버 헤드가 필요하지 않으므로, 코딩 효율을 더욱 향상시킬 수 있다. 또한, 본 발명은 인트라 프레임(I-프레임) 이미지 및 인터 프레임(P-프레임 또는 B-프레임) 이미지의 코딩에 적용 가능하다. 따라서, 본 발명의 실시예에서 제공되는 기술적 해결 수단은 비교적 넓은 적용 범위를 갖는다.

본 발명에서 기술된 방법은 특정 구현 방식의 실시예에 한정되는 것은 아니며, 본 발명의 기술적 해결 수단에 따라 당업자가 얻은 다른 구현 방식 또한 본 발명의 기술적 혁신 범위 내에 있다.

본 발명의 사상 및 범위를 벗어나지 않고, 당업자는 본 발명에 다양한 수정 및 변형을 가할 수 있음은 자명하다. 또한, 이들 변형 예가 본 발명의 특허 청구 범위 및 그와 동등한 기술 범위에 있는 한, 본 발명은 이들 변형 예를 포함하는 것으로 의도된다.

Claims

비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 방법에 있어서,
현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
상기 이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -;
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하는 단계; 및
제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함하는 적응형 역양자화 방법.
제1항에 있어서,
상기 디코딩된 화소 정보는, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 이미지 영역의 화소 정보를 더 포함하는 적응형 역양자화 방법.
제1항 또는 제2항에 있어서,
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
화소 평균
의 제1 함수
에 따라 상기 양자화 조정 인자를 계산하는 단계
를 포함하고,
상기 화소 평균
은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인,적응형 역양자화 방법.
제1항 또는 제2항에 있어서,
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
화소 분산(pixel variance:
)의 제2 함수
에 따라 상기 양자화 조정 인자를 계산하는 단계를 포함하고,
상기 화소 분산
는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는, 적응형 역양자화 방법.
제1항 또는 제2항에 있어서,
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
화소 분산
및 화소 평균
의 결합 함수
에 따라, 상기 양자와 조정 인자를 계산하는 단계
를 포함하고,
상기 화소 평균
는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산
는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 방법.
제1항 또는 제2항에 있어서,
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
최대 화소 값(maximum pixel value:
) 및 최소 화소 값(minimum pixel value:
) 간 차의 제3 함수
에 따라 상기 양자화 조정 인자를 계산하는 단계
를 포함하고,
상기 최대 화소 값
는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 방법.
제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계임 -; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 간 대응 관계임-; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하는 단계;
상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하고, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계;
상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고, 제3 변환 계수 세트 내의 계수를 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 방법에 있어서,
현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역 X를 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
상기 이미지 영역 X의 시간적 이웃 화소 정보(temporal neighborhood pixel information)를 획득하는 단계;
제1 평균
및 제1 분산에 따라, 양자화 조정 인자를 계산하는 단계; - 상기 제1 평균
는, 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 제1 분산에
는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분임 -; 및
제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는 적응형 역양자화 방법.
제12항에 있어서,
상기 제1 평균
및 제1 분산
에 따라, 양자화 조정 인자를 계산하는 단계는,
상기 제1 평균
및 제1 분산
의 결합 함수
에 따라, 상기 양자화 조정 인자를 계산하는 단계
를 포함하는, 적응형 역양자화 방법.
제12항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 사이의 대응 관계임 -; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
제13항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계임 -; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
제13항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환
계수 세트에 대응하는 제1 양자화 파라미터를 획득하는 단계;
상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라, 레벨 스케일(level scale)을 결정하고, 상기 레벨 스케일을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
제13항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링을 수행하고 제2 양자화 스텝을 획득하며, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
제13항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계;
상기 제1 양자화 스텝을 사용하여 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고 제3 변환 계수 세트를 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여 상기 제3 변환 계수 세트 내의 계수에 스케일링을 수행하는 단계
를 포함하는, 적응형 역양자화 방법.
비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 장치로서,
현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하도록 구성된 결정 유닛 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
상기 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성된 획득 유닛 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -;
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하도록 구성된 계산 유닛; 및
제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된 역양자화 유닛
을 포함하는 적응형 역양자화 장치.
제19항에 있어서,
상기 획득 유닛은 추가로,
상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 디코딩된 화소 정보로부터 상기 이미지 영역의 화소 정보를 획득하도록 구성된, 적응형 역양자화 장치.
제19항 또는 제20항에 있어서,
상기 계산 유닛은 구체적으로,
화소 평균
의 제1 함수
에 따라 상기 양자화 조정 인자를 계산하도록 구성되고,
상기 화소 평균
은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분(color space component)의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 장치.
제19항 또는 제20항에 있어서,
상기 계산 유닛은 구체적으로,
화소 분산(pixel variance:
)의 제2 함수
에 따라 상기 양자화 조정 인자를 계산하도록 구성되고,
상기 화소 분산
는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는, 적응형 역양자화 장치.
제19항 또는 제20항에 있어서,
상기 계산 유닛은 구체적으로,
화소 분산
및 화소 평균
의 결합 함수
에 따라, 상기 양자와 조정 인자를 계산하도록 구성되고,
상기 화소 평균
는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산
는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 장치.
제19항 또는 제20항에 있어서,
상기 계산 유닛은 구체적으로,
최대 화소 값(maximum pixel value:
) 및 최소 화소 값(minimum pixel value:
) 간 차의 제3 함수
에 따라 상기 양자화 조정 인자를 계산하도록 구성되고,
상기 최대 화소 값
는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 장치.
제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하고,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되며,
상기 제1 대응 관계는, 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계인, 적응형 역양자화 장치.
제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고,
상기 제2 대응 관계는, 양자화 조정 인자와 양자화 행렬 간 대응 관계인, 적응형 역양자화 장치.
제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고,
상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된, 적응형 역양자화 장치.
제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고,
상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된, 적응형 역양자화 장치.
제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고,
상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며,
상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된, 적응형 역양자화 장치.