KR20170031202A - 비디오 코딩에서의 적응형 역양자화 방법 및 장치 - Google Patents
비디오 코딩에서의 적응형 역양자화 방법 및 장치 Download PDFInfo
- Publication number
- KR20170031202A KR20170031202A KR1020177003914A KR20177003914A KR20170031202A KR 20170031202 A KR20170031202 A KR 20170031202A KR 1020177003914 A KR1020177003914 A KR 1020177003914A KR 20177003914 A KR20177003914 A KR 20177003914A KR 20170031202 A KR20170031202 A KR 20170031202A
- Authority
- KR
- South Korea
- Prior art keywords
- quantization
- transform coefficients
- adjustment factor
- color space
- pixels
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은, 비디오 코딩에서의 적응형 역양자화 방법 및 장치를 개시한다. 본 발명에서 제공하는 방법에 따르면, 현재 변환 블록이 위치하는 배경 영역의 통계적 특징이, 변환 블록의, 공간적 이웃 정보, 또는 시간적 이웃 정보, 또는 공간적 이웃 정보와 시간적 이웃 정보를 사용하여 추정되고, 역양자화를 위한 양자화 조정 인자는 적응적으로 유도되고, 역양자화 처리는 유연하게 조정된다. 양자화 조정 정보가 비트 스트림으로 전송되는 종래 해결 수단과 비교하여, 본 발명에서 제공되는 방법 및 장치에 따르면, 양자화 조정 정보를 전송하기 위해 여분의 비트 오버 헤드가 필요하지 않으므로, 코딩 효율이 더욱 개선된다.
Description
본 발명은 데이터 처리 분야에 관한 것으로서, 보다 상세하게는, 비디오 코딩에서의 역양자화 방법 및 장치에 관한 것이다.
현재, H.264/AVC, H.265/HEVC, 및 AVS(Audio Video Coding Standard)과 같은 비디오 코딩 표준과 같이, 다수의 비디오 코딩 기술이 있다. 전술 한 비디오 코딩 표준은 일반적으로 하이브리드 코딩 프레임 워크(hybrid coding framework)를 사용하고, 하이브리드 코딩 프레임 워크는 주로: 예측(prediction), 변환(transform), 양자화(quantization), 엔트로피 코딩(entropy coding) 등과 같은 단계를 포함한다.
예측 단계에서, 코딩된 영역의 재구성 화소(reconstructed pixel)는 현재 코드 블록(code block)에 대응하는 원래 화소(original pixel)에 대한 예측 화소(predicted pixel)를 생성하는데 사용된다. 두 가지 주요 유형의 예측 방식에 인트라 예측(intra prediction) 및 인터 예측(inter prediction)이 포함된다. 인트라 예측을 위해, 현재 코드 이미지 내의 현재 코드 블록의 공간적 이웃(spatial neighborhood)한 재구성 화소는 현재 코드 블록의 예측 화소, 예를 들어, 수평(horizontal), 수직(vertical), 또는 다른 H.264/AVC 에서의 다방향 예측(multi-directional prediction), 템플릿 매칭(template matching) 및 인트라 모션 보상(intra motion compensation)에 기반을 둔 예측 방식의 예측 화소를 생성하는 데 사용된다. 인터 예측을 위해, 하나 이상의 코딩 된 이미지에서, 현재 코드 블록에 대응하는 재구성 화소는 현재 코드 블록의 예측 된 화소, 예를 들어, 모션 보상(motion compensation)에 기초한 예측 방식으로 예측된 화소로서 사용된다. 인터 예측은 단방향 예측(unidirectional prediction)과 양방향 예측(bidirectional prediction)의 두 가지 형식을 포함한다. 단방향 예측을 위해, 하나의 코딩 된 이미지의 재구성 화소는 현재 코드 블록의 예측 화소를 생성하기 위해 사용되고, 양방향 예측을 위해 두 개의 코딩 된 이미지에서, 재구성 화소는 현재 코드 블록의 예측 화소를 생성하는 데 사용된다.
원래 화소와 예측 화소의 화소 값 차를 레지듀얼(residual)이라 한다. 레지듀얼의 코딩 효율을 향상시키기 위해, 일반적으로 레지듀얼은 먼저, 변형 및 변환되어 변환 계수(transform coefficient)로 변환된다. 공통 변환은 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), 웨이블릿 변환(wavelet transform) 등을 포함한다. 다음으로, 예를 들면 벡터 양자화(vector quantization) 또는 스칼라 양자화(scalar quantization)에 의해 양자화 처리가 변환 계수에 대해 수행된다. 그런 다음, 양자화된 변환 계수 및 인코딩 모드 정보(예를 들어, 코드 블록 크기, 예측 모드, 및 모션 벡터)가 엔트로피 코딩 처리에 의해 비트 스트림으로 변환된다. 일반적인 엔트로피 부호화 방법은 산술 코딩(arithmetic coding), VLC(variable length coding), 고정 길이 코딩(fixed length coding), 런 랭스 코딩(run-length coding) 등을 포함한다.
변환 계수는 스칼라 양자화 방식(scalar quantization manner)으로 양자화될 수 있다. 현재 코드 블록의 레지듀얼의 N 개의 변환 계수 중 i번째 변환 계수를(1≤≤ N, N은 변환 블록 사이즈와 관련되고, 통상 16, 64, 1024 등)으로 표시하면, 양자화 변환 계수 는, 이고, 여기에서, 는 의 심볼, 즉, 이고, 는 라운딩 연산(rounding operation)이며 일반적으로 라운딩 다운(rounding down), 라운딩 오프(rounding off), 및 라운딩 업(rounding up) 중 하나 일 수 있다. 는 의 절대값 또는 의 진폭을 나타낸다. 는 변환 계수 에 대응하는 양자화 스텝(quantization step)을 나타내고, 은 라운딩 오프셋(rounding offset)이다.
비디오 디코딩은 비트 스트림을 비디오 이미지로 변환하는 프로세스이며, 엔트로피 디코딩(entropy decoding), 예측, 역양자화(dequantization) 및 역변환(inverse transform)과 같은 몇 가지 주요 단계를 포함합니다. 우선, 비트 스트림은 엔트로피 디코딩 처리에 의해 파싱(parsing)되어 인코딩 모드 정보 및 양자화된 변환 계수를 얻는다. 다음으로, 한편으로는, 인코딩 모드 정보 및 디코딩된 재구성 화소를 사용하여 예측 화소가 획득되고, 한편으로, 역양자화가 양자화된 변환 계수에 대해 수행되어 재구성된 변환 계수를 획득하고, 역변환이 재구성된 변환 계수에 대해 수행되어 재구성된 레지듀얼 정보를 획득한다. 그 후, 비디오 이미지를 복원하기 위해, 재구성된 레지듀얼 정보가 예측 화소에 가산된다.
여기에서, 는 플로팅 포인트 번호(floating-point number)일 수 있고, 은 라운딩 오프셋(rounding offset)이다. 일반적으로 플로팅 포인트 연산을 사용하지 않으려면, 플로팅 포인트 곱셈을 정수 가산 및 이동 방식으로 대체한다. 예를 들어, H.265/HEVC에서, 수학식 1에 설명된 역양자화 프로세스는 다음 수학식 2:
여기에서, 는 시프팅 파라미터(shifting parameter)이고, 는 정수이며, 는 수학식 1의 양자화 스텝 에 근사화된다. 이런 방식으로, =0.5이며, 라운딩 방식은 라운딩 다운이다. 는 이하의 수학식 3과 같이, 레벨 스케일(levelScale) 및 스케일링 인자(scaling factor)에 의해 공통으로 결정된다.
이고, 여기에서, 레벨 스케일링 리스트(level scaling list) 이고, k=0, 1,…., 5이며, 는 가 6으로 나누어진 후의 라운딩(rounding)이고, 는 REM 연산이다.
일반적으로, 역양자화는 양자화 스텝과 직접 관련되며, 양자화 스텝은 QP, 스케일링 인자, 및 레벨 스케일링리스트의 영향을 받는다. 양자화 스텝은 여러 방식으로 조정될 수 있다. 예를 들어, 스케일링 인자 및 레벨 스케일링 리스트가 고정되어있는 경우, 양자화 파라미터의 각 레벨은 양자화 스텝에 대응한다. H.264/AVC 및 H.265/HEVC는 52레벨의 양자화 파라미터를 규정한다. 따라서, 양자화 스텝은 양자화 파라미터를 변경함으로써 조정될 수 있다. 다른 예로서, 양자화 스텝은 스케일링 인자를 조정하여 변경될 수 있다. 전형적으로, 스케일링 인자를 결정하기 위해, 양자화 행렬이라고도 하는 다중 스케일링 인자 행렬 중 하나가 선택될 수 있다. 전술한 두 가지 예에서 상이한 데이터가 변경되었지만, 양자화 스텝은 본질적으로 조정된다.
손실 인코딩의 경우, 재구성 화소와 원래 화소는 다를 수 있으며, 이 둘의 차이를 왜곡이라 한다. 휘도 마스킹 효과(luminance masking effect) 및 콘트라스트 마스킹 효과(contrast masking effect)와 같은 다수의 시각적 마스킹 효과(visual masking effect)로 인해, 인간의 눈에 의해 관찰되는 왜곡 강도는 왜곡이 위치하는 배경의 특징과 밀접하게 관련된다. 즉, 인간의 눈의 왜곡에 대한 민감도는 배경 휘도 및 왜곡 위치의 배경 콘트라스트와 관련된다. 일반적으로, 왜곡 감도와 배경 휘도는 U 자형의 곡선 관계를 나타내고, 왜곡 감도와 배경의 분산(variance) 또는 표준 편차(standard deviation)는 단조 감소 관계(monotonically decreasing relationship)를 나타낸다. 비디오 코딩에서의, 전술 한 시각적 특징을 참조하면, 왜곡에 대한 시각적 민감도의 영역(즉, 상대적으로 작은 왜곡 민감도의 영역)에서 이러한 양자화 스텝은 증가하고, 양자화 스텝은 왜곡에 대한 시각적 민감도의 영역에서 감소 된다. 따라서, 균일한 양자화 스텝과 비교하여, 코딩 왜곡 할당은 인간의 눈에 대한 시각적 인식에 더욱 적합할 수 있고, 주관적 품질은 동일한 비트 레이트에서 개선, 즉 코딩 효율이 개선된다.
종래 기술에서 제공되는 양자화 스텝을 조정하는 방법은 다음과 같다.
인코더에서, 비디오 시퀀스가 분석되고, 각 코드 블록의 변환 계수에 대응하는 양자화 파라미터 QP(quantization parameter)가 결정되고, 양자화 파라미터 또는 슬라이스 양자화 파라미터(slice QP)에 대한 양자화 파라미터의 오프셋(delta QP)이 비트 스트림에 기록된다. 디코더에서, 각 코드 블록의 양자화 스텝은 파싱방식으로 획득된 양자화 파라미터에 따라 조정된다.
전술 한 기존의 기술적 해결 수단에서, 인코더에서 양자화 파라미터가 결정되고, 비트 스트림에서 양자화 파라미터 정보가 전송되어, 디코더는 각 코드 블록의 양자화 스텝 조정 값을 학습하여 적응 양자화 스텝 조정을 구현한다. 그러나 양자화 파라미터에 대응하는 부가 정보(side information)는 코딩 효율의 향상을 어느 정도 제한한다.
본 발명은 비디오 코딩에서의 적응형 역양자화 방법 및 장치를 제공한다. 본 발명이 제공하는 방법 및 장치에 따르면, 양자화 파라미터에 대응하는 부가 정보가 코딩 효율 개선을 어느 정도 제한한다는 종래 기술의 문제점이 해소된다.
제1 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 방법이 제공되고, 이러한 방법은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -; 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하는 단계; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면을 참조하면, 구현 가능한 제1 방식에서, 구현 가능한 제2 방식에서, 상기 디코딩된 화소 정보는, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 이미지 영역의 화소 정보를 더 포함한다.
제1 측면 또는 구현 가능한 제1 방식을 참조하면, 제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 화소 분산(pixel variance: )의 제2 함수 에 따라 상기 양자화 조정 인자를 계산하는 단계를 포함하고, 상기 화소 분산 는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 화소 분산 및 화소 평균 의 결합 함수 에 따라, 상기 양자와 조정 인자를 계산하는 단계를 포함하고, 상기 화소 평균 는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산 는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제1 측면 또는 제1 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 최대 화소 값(maximum pixel value:) 및 최소 화소 값(minimum pixel value:) 간 차의 제3 함수 에 따라 상기 양자화 조정 인자를 계산하는 단계를 포함하고, 상기 최대 화소 값 는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제7 방식에서, 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 간 대응 관계임-; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제8 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하는 단계; 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제9 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하고, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제1 측면, 또는 제1 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제10 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고, 제3 변환 계수 세트 내의 계수를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하는 단계를 포함한다.
제2 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 방법을 제공하고, 이러한 방법은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역 X를 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역 X의 시간적 이웃 화소 정보(temporal neighborhood pixel information)를 획득하는 단계; 제1 평균 및 제1 분산에 따라, 양자화 조정 인자를 계산하는 단계; - 상기 제1 평균 는, 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 제1 분산에 는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분임 -; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제2 측면을 참조하면, 구현 가능한 제1 방식에서, 상기 제1 평균 및 제1 분산 에 따라, 양자화 조정 인자를 계산하는 단계는, 상기 제1 평균 및 제1 분산 의 결합 함수 에 따라, 상기 양자화 조정 인자를 계산하는 단계를 포함한다.
제2 측면 또는 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 사이의 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계임 -; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터를 획득하는 단계; 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라, 레벨 스케일(level scale)을 결정하고, 상기 레벨 스케일을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함한다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링을 수행하고 제2 양자화 스텝을 획득하며, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수에 역양자화를 수행하는 단계를 포함한다.
제2 측면, 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 상기 제1 양자화 스텝을 사용하여 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고 제3 변환 계수 세트를 획득하는 단계; 및 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여 상기 제3 변환 계수 세트 내의 계수에 스케일링을 수행하는 단계를 포함한다.
제3 측면에 따르면, 비디오 코딩에서의 적응형 역양자화 장치가 제공되고, 이러한 장치는, 현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하도록 구성된 결정 유닛 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -; 상기 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성된 획득 유닛 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -; 상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하도록 구성된 계산 유닛; 및 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된 역양자화 유닛을 포함한다.
제3 측면을 참조하면, 구현 가능한 제1 방식에서, 상기 획득 유닛은 추가로, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 디코딩된 화소 정보로부터 상기 이미지 영역의 화소 정보를 획득하도록 구성된다. 제3 측면 또는 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 화소 평균의 제1 함수 에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 화소 평균은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분(color space component)의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 상기 계산 유닛은 구체적으로, 화소 평균의 제1 함수 에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 화소 평균은, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분(color space component)의 평균이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 상기 계산 유닛은 구체적으로, 화소 분산(pixel variance: )의 제2 함수 에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 화소 분산 는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이고, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응한다.
제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 계산 유닛은 구체적으로, 화소 분산 및 화소 평균 의 결합 함수 에 따라, 상기 양자와 조정 인자를 계산하도록 구성되고, 상기 화소 평균 는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산 는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제3 측면 또는 제3 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 계산 유닛은 구체적으로, 최대 화소 값(maximum pixel value:) 및 최소 화소 값(minimum pixel value:) 간 차의 제3 함수 에 따라 상기 양자화 조정 인자를 계산하도록 구성되고, 상기 최대 화소 값 는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 역양자화 유닛은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하고, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되며, 상기 제1 대응 관계는, 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계이다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제7 방식에서, 상기 역양자화 유닛은 구체적으로, 미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 상기 제2 대응 관계는, 양자화 조정 인자와 양자화 행렬 간 대응 관계이다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제8 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고, 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제9 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제3 측면, 또는 제3 측면의 구현 가능한 제1 내지 제5 방식을 참조하면, 구현 가능한 제10 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된다.
제4 측면에 따르면, 비디오 코딩에서의 적응형 역양자 장치를 제공하고 이러한 장치는, 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역(X)을 결정하도록 구성된 결정 유닛 - 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수임 -; 이미지 영역(X)의 시간적 이웃 화소 정보를 획득하도록 구성된 제1 획득 유닛; 제1 평균 및 제1 분산 에 따라, 양자화 조정 인자를 계산하도록 구성된 계산유닛 - 제1 평균 은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 색 공간 성분의 평균이며, 제1 분산 는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분 임 -; 및 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행하도록 구성된; 제1 역양자화 유닛을 포함한다.
제2 측면을 참조하면, 구현 가능한 제1 방식에서, 계산 유닛은 구체적으로, 화소 평균 및 화소 분산 의 결합 함수 에 따라 계산하도록 구성되며, 화소 평균은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 컬러 공간 성분의 평균이고, 화소 분산 는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 컬러 공간 성분의 분산이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제2 방식에서, 제1 역양자화 유닛은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트를 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제3 방식에서, 제1 역양자화 유닛은 구체적으로 미리 설정된 제2 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 양자화 행렬에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이다.
제4 측면 또는 제4 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제4 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고, 상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제2 측면 또는 제2 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제5 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
제4 측면, 또는 제4 측면의 구현 가능한 제1 방식을 참조하면, 구현 가능한 제6 방식에서, 상기 역양자화 유닛은 구체적으로, 상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며, 상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된다.
전술한 기술적 해결 수단의 하나 또는 둘은 적어도 이하의 기술적 효과를 가진다.
본 발명의 실시 예들에서 제공되는 기술적 해결수단에 따르면, 변환 블록의 공간적 인접 정보를 이용하여 현재 변환 블록이 위치하는 배경 영역의 통계적 특징을 추정하고, 역 양자화를 위한 양자화 조정 인자를 적응적으로 도출하며, 역양자화 처리가 유연하게 조정된다. 본 발명의 실시예에서 제공되는 기술적 해결 수단에서의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도가 인간 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다.
도 1은 본 발명의 일 실시예에 따른 비디오 코딩에서의 적응형 역양자화 방법의 개략적 흐름도이다.
도 2는 본 발명의 실시예에 따른 이미지 영역의 제1 공간적 이웃 화소의 개략도이다.
도 3은 본 발명의 일 실시예에 따른 이미지 영역의 제2 공간적 이웃 화소의 개략도이다.
도 4는 본 발명의 다른 실시예에 따른 비디오 코딩에서의 적응형 역양자화 방법의 개략적 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 비디오 코딩에서의 적응형 역양자화 장치의 개략적 구조도이다.
도 2는 본 발명의 실시예에 따른 이미지 영역의 제1 공간적 이웃 화소의 개략도이다.
도 3은 본 발명의 일 실시예에 따른 이미지 영역의 제2 공간적 이웃 화소의 개략도이다.
도 4는 본 발명의 다른 실시예에 따른 비디오 코딩에서의 적응형 역양자화 방법의 개략적 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 비디오 코딩에서의 적응형 역양자화 장치의 개략적 구조도이다.
종래 기술에서, 양자화 파라미터는 인코더에서 결정되고 양자화 파라미터 정보를 비트 스트림으로 전송하여 각 코드 블록의 양자화 스텝 조정 값을 학습하여 적응형 양자화 스텝 조정을 구현하였다. 그러나 양자화 파라미터에 대응하는 부가 정보는 코딩 효율의 향상을 어느 정도 제한한다. 따라서, 종래 기술의 문제점을 해결하기 위하여, 본 발명의 실시예는 비디오 코딩에서의 적응형 역양자화 방법을 제공하며, 이하의 단계를 포함한다.
현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하는 단계 - 제1 변환 계수 세트는 N 개의 변화 계수를 포함하고, 변환 계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이며, N은 양의 정수임 -;
이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 디코딩된 화소 정보는 이미지 영역의 공간적 이웃 화소 정보를 포함함 -;
디코딩된 화소 정보에 따라 양자화 조정 인자를 계산하는 단계; 및
제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함한다.
본 발명의 본 실시예에서 제공하는 해결 수단에 따르면, 변환 블록의 공간적 이웃 정보를 이용하여 현재의 변환 블록이 위치하는 배경 영역의 통계적 특징을 추정하고, 양자화 조정 인자를 적응적으로 도출하며, 역양자화 처리를 유연하게 조정한다. 한편으로, 본 발명의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도는 인간의 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다.
한편, 비트 스트림에서 양자화 조정 정보가 전송되는 기존의 해결수단과 비교하여, 본 발명의 실시예에서 제공되는 해결수단에 따르면, 엑스트라 비트 오버 헤드(extra bit overhead)가 양자화 조정 정보를 전송할 필요가 없기 때문에 코딩 효율을 더 향상시킨다.
본 발명의 실시예의 목적, 기술적 해결 수단, 및 장점을 보다 명확하게 하기 위해, 본 발명의 실시예에서 첨부된 도면들을 참조하여 본 발명의 실시예의 기술적 해결수단을 다음과 같이 명확하고 완전하게 설명한다. 명백하게, 기술된 실시예는 본 발명의 일부 실시예에 불과하지며 전부는 아니다. 창의적인 노력 없이 본 발명의 실시예에 기초하여 당업자에 의해 획득된 다른 모든 실시예는 본 발명의 보호 범위 내에 있다.
실시예
도 1에 도시된 바와 같이, 본 발명의 일 실시예는 비디오 코딩에서의 적응형 역양자화 방법을 제공하며, 이러한 방법은 다음 단계를 포함한다.
단계 101: 현재 디코딩된 이미지에서 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환 계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수이다.
본 발명의 본 실시예에서, 제1 변환 계수 세트는 N 개의 변환 계수 를 포함할 수 있고, N은 양의 정수, 예를 들어 N = 1, 2, 4, 16, 32, 50, 64, 81, 128, 256, 512 또는 1024이다. 변환 계수 는 현재 디코딩된 이미지에서 임의의 색 공간 성분의 변환 계수, 예를 들면 휘도 성분의 변환 계수, 색차 성분(chrominance component)의 변환 계수, 및 RGB 성분 중 어느 하나(예를 들면, R 성분)의 변환 계수이다.
현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역은 제1 변환 계수 세트에 대응하는 영역이다. 예를 들어, H.264/AVC 또는 H.265/HEVC 표준에 대응하는 하이브리드 코딩 프레임 워크(hybrid coding framework)에서, 제1 변환 계수 세트에 대응하는 이미지 영역은, 제1 변환 계수 세트에 대응하는, 변환 블록(transform block) 또는 변환 유닛(transform unit)에 의해 커버 되는 이미지 영역이다. 본 발명의 실시예에서, 제1 변환 계수 세트는 하나의 변환 블록의 모든 변환 계수 또는 하나의 변환 블록의 일부 변환 계수, 예를 들어, 다이렉트 현재 계수(direct current coefficient) 또는 저주파 계수의 그룹, 또는 고주파 계수의 그룹, 또는 다이렉트 현재 계수와 고주파 계수의 그룹을 포함할 수 있거나, 또는 하나의 변환 블록 내의 구체적 계수 스캐닝 시퀀스(coefficient scanning sequence)에서의 처음 몇몇 계수들을 포함 할 수있다.
단계 102: 이미지 영역의 디코딩된 화소 정보를 획득하고, 디코딩된 화소 정보는, 이미지 영역의 공간적 이웃 화소 정보를 포함한다.
본 발명의 실시예에서, 공간적 이웃 화소 정보는, 이미지 영역과 동일한 디코딩된 이미지의 프레임 내의 화소 정보에 관한 것이고, 서로 다른 디코딩 조건에 따라 인접 화소의 위치 및 범위를 적응적으로 조정된다.
공간적 이웃 화소 정보는 이미지 영역(X)의 공간적으로 인접한 적어도 하나의 화소의 재구성 값 및/또는 이미지 영역(X)의 공간적으로 인접한 화소 정보에 따라 생성된 적어도 하나의 인트라 예측 화소의값를 포함할 수 있다.
디코딩된 화소 정보가 공간적 이웃 화소 정보인 경우, 공간적 이웃 화소 정보는 M 개의 화소를 포함할 수 있고, M은 양의 정수이며, 공간적 이웃 화소 정보는 다음 화소 정보 중 적어도 하나를 포함한다.
(1) 이미지 영역(X)의 공간적 이웃 영역(Y1)(공간적 이웃 영역(Y1)의 몇몇 선택적인 예가 도 2에 도시됨)의 화소 정보는 공간적 이웃 영역(Y1)에서의 적어도 하나의 화소의 재구성 값을 포함하고, 공간적 이웃 영역(Y1)의 특정 경우는 다음과 같을 수 있다
공간적 이웃 영역(Y1)은 X의, 상부, 하부, 좌측, 또는 우측 경계의 적어도 하나의 경계에 인접한 영역, 예를 들어, X의, 좌측 경계와 상부 경계 양쪽에 인접한 L- 모양 영역(도 2에 도시된, 실시예 a 및 b), 또는 영역(X)의 상부 경계, 좌측 경계, 또는 우측 경계 중 어느 하나에 인접한 직사각형 영역(도 2에 도시된, 실시 예 c, 실시 예 d, 및 실시예 e), 또는 영역(X)을 포함하는 직사각형 영역에서 X가 제거된 영역(도 2의 실시예 f)와 같을 수 있다.
(2) 이미지 영역(X)의 공간적 이웃 영역 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 적어도 하나의 인트라 예측 화소는, 구체적으로 이하:
인트라 예측 방식으로, 이미지 영역(X)의 공간적 이웃 영역(Y2) 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 예측 화소 정보 (이미지 영역(X)의 공간적 이웃 영역(Y2)의 몇 가지 선택적 예가 도 3에 도시됨)를 포함한다.
인트라 예측 방식은, 예를 들면, H.265/HEVC에서의, 방향 기반 인트라 예측 모드(direction-based intra-prediction mode), DC 예측 모드, 및 평면 예측 모드이며, 다른 예로서, 템플릿 매칭(template matching) 방법 또는 인트라 움직임 보상(Intra Motion Compensation)을 포함 할 수 있다.
이미지 영역(X)의 예측 화소 정보는, 적어도 1개의, 이미지 영역(X)의 인트라 예측 화소를 포함하고, 공간적 이웃 영역(Y2)은 공간적 이웃 영역(Y1)이거나 또는, 공간적 이웃 영역(Y1)을 제외한 영역, 예를 들어, 공간적 이웃 영역(Y2)은 X의 좌측 경계선 및 상부 경계선에 인접한 L 자형 영역(도 3의 실시예 a 및 b 도시됨)이거나, (도 3의 실시예 c 및 d와 같이) X의, 좌측 또는 상부 영역에서 X와 동일 크기를 가진 직사각형 영역, 또는 X를 포함하는 직사각형 영역에서 X가 제거된 후 획득된 영역의 일부(도 3의 실시예 e)를 포함할 수 있다.
단계 103: 디코딩된 화소 정보에 따라 양자화 조정 인자를 계산한다.
본 발명의 실시예에서, 역양자화 동안, 적응성 역양자화 효과를 달성하기 위해, 양자화 조정 인자는 디코딩된 화소 정보의 일부 특징을 반영할 수 있는 파라미터를 사용함으로써 계산된다. 본 발명의 실시 예에서, 양자화 조정 인자는 디코딩된 화소의 통계적 특징을 반영하는 파라미터를 사용하여 계산될 수 있는데, 이는 구체적으로 다음을 포함한다.
디코딩된 화소 정보의 통계적 특징은, 디코딩된 화소 정보에서 복수의 화소의 화소 값과 통계적으로 분석된 후 얻어지는 값 결과를 의미하며, 통계적 특징을 갖는 파라미터는 화소 평균 , 화소 분산(pixel variance), 최대 화소 값 , 또는 최소 화소 값 을 포함할 수 있다.
단계 104: 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다.
더욱 정확하고 안정된 통계적 특징 계산을 위해, 더 많은 디코딩된 화소 정보를 얻기 위해, 본 발명의 실시 예에서 디코딩된 화소 정보는, 이미지 영역(X)의 시간적 이웃 화소 정보를 더 포함할 수 있다. 시간적 이웃 화소 정보는, 현재 디코딩된 이미지가 위치하는 이미지의 앞 또는 뒤의 코딩 된 이미지의 하나 이상의 프레임을 포함하고, 시간적 이웃 화소 정보는 이하의 2 개:
(1) 코딩된 다른 이미지 내의 이미지 영역(X)의 대응하는 영역에서 적어도 하나의 화소의 재구성 값 또는 보간 필터링(interpolation filtering)에 의해 획득된 부화소 정확도(sub-pixel accuracy)의 재구성 된값
대응하는 영역은 이미지 영역(X)의 모션 벡터(motion vector)에 따라, 그리고 공통 모션 보상 프로세싱(common motion compensation processing)에 의해 획득될 수 있다. 특히, 이미지 영역(X)의 모션 벡터가 부화소 정확도 일 때, 모션 벡터를 정수값으로 반올림 한다음 움직임 보상을 하여 대응하는 영역을 구할 수 있다.
(2) 이미지 영역(X)에 대응하는, 적어도 2개의 코딩 된 이미지에서 대응하는 영역의 적어도 하나의 위치에서 화소의 재구성값의 가중 평균
을 포함한다.
예를 들어, 2개의 코딩된 이미지가 사용될 때, 2개의 코딩된 이미지 내에서 대응하는 영역은, 이미지 영역(X)의 모션 벡터를 사용하여 개별적으로 발견된다. 2개의 대응하는 영역 내의 동일한 위치에 있는 화소는 대응하는 화소이고, 대응하는 화소 그룹의 가중 평균은 시간적 이웃 화소 정보에서 화소로서 사용되며, 동일한 위치는, 정수 화소 위치 또는 서브 화소일 수 있다.
본 발명의 본 실시예에서, 디코더에서, 재구성된 공간적 이웃 화소 정보, 또는 재구성된 공간적 이웃 화소 정보와 재구성된 시간적 이웃 화소 정보의 조합은 현재 디코딩 블록에 대응하는 원래 화소 정보를 근사(approximate)하는데 사용되고, 양자화 조정 인자가 유도된다. 따라서, 이미지의 다른 영역의 레지듀얼 변환 계수를 적응적으로 변환하고 코딩 성능을 향상시킨다.
본 발명의 실시예에서 제공되는 기술적 해결수단에 따르면, 양자화 조정과 관련된 파라미터 정보가 비트 스트림으로 전송될 필요가 없다. 따라서 비트 레이트가 감소한다. 또한, 본 발명의 실시 예에서, 양자화 조정 인자는, 공간적 이웃 화소 정보만 사용하여 도출되며, 이것은 인트라 프레임 이미지 코딩에 적용될 수 있다. 본 발명의 실시 예에서 제공되는 방법 또한 프레임 간 이미지 코딩에도 적용 가능하다.
본 발명의 본 실시예에서의 디코딩된 화소 정보는 이미지 영역(X)의 공간적 이웃 화소 정보, 또는 시간적 이웃 화소 정보와 이미지 영역(X)의 공간적 이웃 화소 정보의 조합일 수 있고, 디코딩된 화소 정보는 상이한 콘텐츠를 포함할 수 있다. 따라서, 본 발명의 실시예에서, 양자화 조정 인자는 다양한 방식으로 디코딩된 화소 정보에 따라 계산될 수 있다. 구체적 구현은 이하를 포함한다.
첫째, 본 발명의 본 실시예에서, 양자화 조정 인자는, 디코딩된 화소 정보에 대응하는 파라미터: 화소 평균 , 화소 분산(pixel variance), 최대 화소 값 , 또는 최소 화소 값 에 따라 계산될 수 있다.
전술한 파라미터(화소 평균 , 화소 분산, 최대 화소 값 , 또는 최소 화소 값 _)에 기초하여, 양자화 조정 인자 를 계산하는 구체적 방법은 이하의 방식 중 어느 하나가 사용될 수 있다.
방식 1: 양자화 조정 인자는, 화소 평균의 제1 함수 에 따라 계산되고, 화소 평균 은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 색 공간 성분의 평균이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
화소 평균은, 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 평균이거나, 공간적 이웃 화소 정보에서 복수의 화소의 동일한 신호 성분의 평균이며, 신소 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
화소 평균은, 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보에서 복수의 화소의 휘도 성분의 평균, 또는 공간적 이웃 호소 정보 및 시간적 이웃 화소 정보 내에서 복수의 화소의 동일한 신호 성분의 평균이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
구체적 실시예에서, 제1 함수는, 일 수 있고, 예를 들어 =1 또는 0.5인,이며, 는 에 대한 U자 모양의 함수일 수 있다. 에 대해, 가 임계치 T1보다 작으면, 의 1차 미분은 0보다 작고, 가 임계치 T2보다 크면, 의 1차 미분은 0보다 크며, 가 임계치 T1과 임계치 T2 사이에 있으면, 는 상수 C0와 같고, T1≥0, T2≥0, 및 T2=T1이며, T1은 0, 64, 또는 128일 수 있고, T2는 0, 80, 또는 170일 수 있으며, C0는 0.5, 0.75, 1, 1.5, 8, 16, 256, 또는 1024인 양의 실수일 수 있다. 더욱 구체적으로 함수 는 이하:
방식 2: 양자화 조정 인자는, 화소 분산 의 함수 에 따라 계산되고, 화소 분산 는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
화소 분산 는, 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 분산 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 분산이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
화소 분산 는, 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분 분산, 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 분산이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
구체적 실시예에서, 양자화 조정 인자 는 화소 분산 의 제2 함수에 따라 계산되고,이며, 는 예를 들어 1 또는 0.8일 수 있고, 는 에 대한 모노톤 함수(monotone function)일 수 있다. 에 대해, 가 임계치 T3보다 적으면, 는 상수 C3이고, 가 임계치 T3와 같거나 그보다 크면, 의 1차 미분은 0보다 크며, T3≥0이고, T3는 예를 들어, 0, 3, 5, 또는 10일 수 있으며, 예를 들어, =1/2 또는 1인 >0이고, C3는 예를 들어, 0.5, 0.8, 1, 16, 32, 또는 256인 양의 실수 일수 있다. 더욱 구체적으로, 함수 는 이하:
방식 3: 양자화 조정 인자는 최대 화소 값 과 최소 화소 값 사이의 차인, 제3 함수 에 따라 계산되고, 최대 화소 값은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 색 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
양자화 조정 인자 는 화소 평균의 제1 함수 및 화소 분산의 제2 함수 의 결합 함수 에 의해 계산되고, , 예를 들어, =1 및 =1, 또는 =0.5 및 =1.5, 또는 =2 및 =1이다.
방식 4: 양자화 조정 인자는 최대 화소 값 과 최소 화소 값 사이의 차인, 함수 에 의해 계산되고, 최대 화소 값 는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 색 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값 또는 복수의 화소의 동일한 색 공간 성분의 최소값이며, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
최대 화소 값 은 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최대값 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최대값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
최소 화소 값 은 공간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최소값 또는 공간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최소값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
최대 화소 값 은 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최대값 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최대값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
최소 화소 값 은 공간적 이웃 화소 정보 내 및 시간적 이웃 화소 정보 내의 복수의 화소의 휘도 성분의 최소값 또는 공간적 이웃 화소 정보 및 시간적 이웃 화소 정보 내의 복수의 화소의 동일한 신호 성분의 최소값이고, 신호 성분은 제1 변환 계수 세트에 대응하는 신호 성분이다.
구체적 실시예에서, 양자화 조정 인자 는 양자화 조정 인자는 최대 화소 값 과 최소 화소 값 사이의 차인, 함수 에 의해 계산된다. 제3 함수는 단조 증가 함수(monotonically increasing function)일 수 있고, 예를 들어 이하:
이고, C4는 양의 실수, 예를 들어, 0.5, 1, 16, 32, 또는 256일 수 있고, 는 양의 실수, 예를 들어, =1 또는 1/2이며, 는 양의 실수, 예를 들어, =20 또는 =C4/2이다.
전술한 4개의 방식 중 어느 하나에 따라, 양자화 조정 인자 가 획득된 후, 선택적으로, 값 제한 처리가 추가로 양자화 조정 인자 에 수행될 수 있고, 는 미리 설정된 값 범위에 대응한다. 예를 들어, 는 미리 설정된 값 범위 즉, 이하:
전술한 파라미터, T1, T2, T3, C0, C3, C4, , , , , , , , ,,, 및 은 미리 설정된 상수 또는 비디오 화상의 통계적 특징에 따른 계산의 방식으로 획득되거나 또는 비디오 비트스트림으로부터 추출될 수 있다.
본 발명의 본 실시예에서, 단계 104에서 역양자화 처리는 다양한 방식으로 구현될 수 있다. 이하에서 가능한 몇가지 방법을 제공한다.
방식 1: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 스케일링은, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 수행되어 제2 양자화 스텝을 획득하고, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 제2 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행된다. 구체적 구현 방식은 이하:
를 획득하기 위해, 양자화 조정 인자에 따라 제1 양자화 스텝에 스케일링을 수행하고, 제2 변환 계수 세트에서 변환 계수 를 획득하기 위해, 제1 변환 계수 세트 내의 변환 계수 에 역양자화를 수행하는 단계
와 같을 수 있다.
이 사용될 수 있고, 는 제1 양자화 스텝의 정수 결과이고, 는 현재 디코딩된 이미지에 대응하는 신호 내에서 시프팅 비트(shifting bit) 수이며, 는 의 정수 결과(integer result), 예를 들어, 는 2의 정수 배수로 를 곱한 후 라운딩 방식(means of rounding)으로 획득되거나, 또는 는 를 직접 라운딩하여 획득되거나, 또는 의 정수 결과는, 화소 평균 및 화소 분산에 따라 테이블을 참조하여 획득될 수 있고, 는 시프팅 비트에 필요한 추가 수량이다.
방식 2: 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)가 미리 설정된 제1 대응 관계에 따라 결정되고, 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 역양자화가 제1 변환 계수 세트에 수행된다.
더욱 구체적으로, QC의 값 범위는 미리 H1(H1은 1보다 큰 양의 정수, 예를 들어 H1 = 3, 5 또는 6) 간격으로 나누어지고, 각 간격은 미리 설정된 레벨 스케일링 리스트에 대응한다. 계산 방식에 의해 얻어진 양자화 조정 계수 QC가 속하는 값 간격(value interval)이 검색되고, 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서, 양자화 조정 인자(QC)가 속하는 값 간격에 대응하는 레벨 스케일링리스트가 선택된다.
예를 들어, QC와 레벨 스케일링리스트 간의 매핑 관계 테이블 (표 1) 은, 각각 6개의 엘리먼트를 포함하는 레벨 스케일링리스트에 대해, QC에 따라 하나의 레벨 스케일링리스트가 선택되는 예를 제공한다.
레벨 스케일링 리스트 | |
QC≥1.5 | {60,68,77,86,96,108} |
1.2<QC<1.5 | {54,61,69,77,86,97} |
0.8≤QC≤1.2 | {40,45,51,57,64,72} |
0.6<QC<0.8 | {28,32,36,40,45,50} |
QC≤0.6 | {24,27,31,34,38,43} |
표 1에 주어진 예에 따르면, QC가 0.9일 때, QC가 속하는 값 범위는 0.8≤QC≤1.2로 검색되고, 값 범위 0.8≤QC≤1.2에 대응하는 레벨 스케일링 리스트{40, 45, 51, 57, 64, 72} 는 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서 선택된다.
방식 3: 양자화 조정 인자에 대응하는 타깃 양자화 행렬은, 미리 설정된 제2 대응 관계에 따라 결정되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 타깃 양자화 행렬에 따라 제1 변환 계수 세트에 수행된다.
QC의 값 범위는 미리 H2(H2는 1보다 큰 양의 정수, 예를 들어 H2 = 3, 5 또는 6) 간격으로 분할되고, 각 간격은 미리 설정된 양자화 행렬에 대응한다. QC가 속하는 값 간격이 검색되고, 대응하는 양자화 행렬이, 제1 변환 계수 세트에 역양자화가 수행되는 양자화 행렬로서 선택된다. 예를 들어, 표 2는 변환 블록을 제공한다.
QC<16 | 16≤QC≤64 | QC>64 | |
양자화 행렬 |
16,13,14,14, 13,14,16,16, 14,16,16,16, 14,16,16,16 |
16,16,16,16, 16,16,16,16, 16,16,16,16, 16,16,16,16 |
18,18,16,16, 18,18,20,16, 16,20,20,22, 16,16,22,16 |
표 2의 예에 따르면, 계산방식으로 얻어진 QC값이 18이고, QC가 속하는 값 범위가 표 2에 주어진 파라미터로부터 16≤QC≤64로 결정될 수 있다면, 제1 변환 계수 세트에 역양자화가 수행되는, 대응하는 4×4 양자화 행렬은 표 2의 제3행의 양자화 행렬이다.
방식 4: 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터는 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 타깃 양자화 파라미터 오프셋은 양자화 조정 인자에 따라 결정되며, 타깃 양자화 파라미터 오프셋은 제1 양자화 파라미터에 추가되어 제2 양자화 파라미터를 획득되고, 레벨 스케일은 제2 양자화 파라미터에 따라 결정되고, 제2 변환 계수 세트를 획득하기 위해, 레벨 스케일을 사용하여 제1 변환 계수 세트에 역양자화가 수행된다.
방식 5: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은, 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 역양자화가 1 양자화 스텝을 사용하여, 제1 변환 계수 세트 내의 계수에 수행되어 제3 변환 계수 세트 내의 계수를 획득하고, 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 양자화 조정 인자를 사용하여, 스케일링은 제3 변환 계수 세트 내의 계수에 수행된다.
구체적 구현은 이하:
먼저, 제1 양자화 스텝를 사용하여 제1 변환 계수 세트에 역양자화를 수행하여 제3 변환 계수 세트, 즉, 를 획득한 다음, 에 스케일링 및 라운딩을 수행하여 제2 변환 계수 즉, 를 획득하고, 및 는 라운딩 오프셋이다.
고, 현재 디코딩된 이미지, 예를 들어, 프레임 레벨 양자화 파라미터에 대응하는 신호에 의해 지시되는 디폴트 양자화 파라미터이다.
본 발명의 본 실시예에서 제공되는 해결수단에 따르면, 디코더에서, 재구성 된 공간적 이웃 화소 정보, 또는 재구성된 공간적 이웃 화소 정보와 재구성된 시간적 이웃 화소 정보의 조합은, 현재의 디코딩 블록에 대응하는 원래 화소 정보에 근사하기 위해 사용되며, 양자화 조정 인자가 유도됨으로써, 이미지의 상이한 영역의 레지듀얼 변환 계수의 양자화 스텝이 적응적으로 조정되며, 코딩 성능이 향상된다.
실시예
도 4에 도시된 바와 같이, 본 발명의 다른 실시예는 추가로, 비디오 코딩에서의 적응형 역양자화 방법을 제공하고, 이러한 방법은 이하를 포함한다.
단계 401: 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역(X)을 결정하고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하며, 변환계수는 현재 디코딩된 이미지 내의 임의의 색 공간 성분의 변환 계수이고, N은 양의 정수이다.
본 실시예에서, 제1 변환 계수 세트는 휘도 성분 변환 블록의 모든 교류 계수(alternating current coefficient) 또는 휘도 성분 변환 블록의 모든 계수를 포함할 수 있다.
단계 402: 이미지 영역(X)의 시간적 이웃 화소 정보를 획득한다.
시간적 이웃 화소 정보는, 코딩된 다른 이미지의 이미지 영역(X)의 대응하는 영역 내의 적어도 하나의 화소의 재구성 값 또는 보간 필터링에 의해 획득된 부화소 정확도 재구성 값, 및/또는 이미지 영역(X)에 대응하는, 적어도 2개의 디코딩 된 이미지에서 대응하는 영역 내의 적어도 하나의 위치에서, 화소의 재구성 값의 가중 평균을 계산한다.
코딩된 다른 이미지에서, 이미지 영역(X)의 대응하는 영역이 부화소 위치인 경우, 시간적 이웃 화소 정보는, 부화소 위치에서, 보간 필터링 방식으로 획득된 부화소 정확도 재구성값이다.
단계 403: 제1 평균 및 제1 분산 에 따라, 양자화 조정 인자를 계산하고, 제1 평균 은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 색 공간 성분의 평균이며, 제1 분산 는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 색 공간 성분의 분산이고, 색 공간 성분은 제1 변환 계수 세트에 대응하는 색 공간 성분이다.
제1 함수는 예를 들어 이하:
제2 함수는 예를 들어 이하:
값 제한 처리를 위한 구체적 구현의 선택적 방식은, 미리 설정된 값 범위(value range)로 를 제안하는 단계 또는 를 매핑 함수를 사용하여 값 범위로 매핑하는 단계를 포함할 수 있다.
단계 404: 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라 제1 변환 계수 세트에 역양자화를 수행한다.
본 발명의 본 실시예에서, 제1 변환 계수 세트의 역양자화 변환은 다양한 방식으로 구현될 수 있다. 이하에서 실현 가능한 몇몇 방식을 제공한다.
방식 1: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 스케일링은, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 수행되어 제1 양자화 스텝이 획득되고, 제2 변환 계수 세트를 획득하기 위해, 제2 양자화 스텝을 사용하여 제1 양자화 스텝에 역양자화가 수행된다. 구체적 구현은 이하와 같을 수 있다.
양자화 조정 인자에 따라, 제1 양자화 스텝 에 스케일링을 수행하여 를 획득하고, 제2 변환 계수 세트 내의 변환 계수 를 획득하기 위해, 제1 변환 계수 세트 내의 변환 계수 에 역양자화를 수행하는 단계
를 포함하고,
이 사용될 수 있고, 는 의 정수 결과(integer result), 예를 들어, 는 2의 정수 배수로 를 곱한 후 라운딩 방식(means of rounding)으로 획득되거나, 또는 는 를 직접 라운딩하여 획득되거나, 또는 의 정수 결과는, 화소 평균 및 화소 분산에 따라 테이블을 참조하여 획득될 수 있고, 는 시프팅 비트에 필요한 추가 수량이다.
방식 2: 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)가 미리 설정된 제1 대응 관계에 따라 결정되고, 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 역양자화가 제1 변환 계수 세트에 수행된다.
더욱 구체적으로, QC의 값 범위는 미리 H1(H1은 1보다 큰 양의 정수, 예를 들어 H1 = 3, 5 또는 6) 간격으로 나누어지고, 각 간격은 미리 설정된 레벨 스케일링 리스트에 대응한다. 계산 방식에 의해 얻어진 양자화 조정 계수 QC가 속하는 값 간격(value interval)이 검색되고, 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서, 양자화 조정 인자(QC)가 속하는 값 간격에 대응하는 레벨 스케일링리스트가 선택된다.
예를 들어, QC와 레벨 스케일링리스트 간의 매핑 관계 표 3은, 각각 6개의 엘리먼트를 포함하는 레벨 스케일링리스트에 대해, QC에 따라 하나의 레벨 스케일링리스트가 선택되는 예를 제공한다.
레벨 스케일링 리스트 | |
QC≥1.5 | {60,68,77,86,96,108} |
1.2<QC<1.5 | {54,61,69,77,86,97} |
0.8≤QC≤1.2 | {40,45,51,57,64,72} |
0.6<QC<0.8 | {28,32,36,40,45,50} |
QC≤0.6 | {24,27,31,34,38,43} |
표 3에 주어진 예에 따르면, QC가 0.9일 때, QC가 속하는 값 범위는 0.8≤QC≤1.2로 검색되고, 값 범위 0.8≤QC≤1.2에 대응하는 레벨 스케일링 리스트{40, 45, 51, 57, 64, 72} 는 제1 변환 계수 세트에 역양자화가 수행되는 레벨 스케일링 리스트로서 선택된다.
방식 3: 양자화 조정 인자에 대응하는 타깃 양자화 행렬은, 미리 설정된 제2 대응 관계에 따라 결정되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이며, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 타깃 양자화 행렬에 따라 제1 변환 계수 세트에 수행된다.
QC의 값 범위는 미리 H2(H2는 1보다 큰 양의 정수, 예를 들어 H2 = 3, 5 또는 6) 간격으로 분할되고, 각 간격은 미리 설정된 양자화 행렬에 대응한다. QC가 속하는 값 간격이 검색되고, 대응하는 양자화 행렬이, 제1 변환 계수 세트에 역양자화가 수행되는 양자화 행렬로서 선택된다. 예를 들어, 표 4는 변환 블록을 제공한다.
QC<16 | 16≤QC≤64 | QC>64 | |
양자화 행렬 |
16,13,14,14, 13,14,16,16, 14,16,16,16, 14,16,16,16 |
16,16,16,16, 16,16,16,16, 16,16,16,16, 16,16,16,16 |
18,18,16,16, 18,18,20,16, 16,20,20,22, 16,16,22,16 |
표 4의 예에 따르면, 계산방식으로 얻어진 QC값이 18이고, QC가 속하는 값 범위가 표 4에 주어진 파라미터로부터 16≤QC≤64로 결정될 수 있다면, 제1 변환 계수 세트에 역양자화가 수행되는, 대응하는 4×4 양자화 행렬은 표 4의 제3행의 양자화 행렬이다.
방식 4: 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터는 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 타깃 양자화 파라미터 오프셋은 양자화 조정 인자에 따라 결정되며, 타깃 양자화 파라미터 오프셋은 제1 양자화 파라미터에 추가되어 제2 양자화 파라미터를 획득되고, 레벨 스케일은 제2 양자화 파라미터에 따라 결정되고, 제2 변환 계수 세트를 획득하기 위해, 레벨 스케일을 사용하여 제1 변환 계수 세트에 역양자화가 수행된다.
방식 5: 제1 변환 계수 세트에 대응하는 제1 양자화 스텝은, 현재 디코딩된 이미지에 대응하는 신호로부터 획득되고, 역양자화가 1 양자화 스텝을 사용하여, 제1 변환 계수 세트 내의 계수에 수행되어 제3 변환 계수 세트 내의 계수를 획득하고, 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 양자화 조정 인자를 사용하여, 스케일링은 제3 변환 계수 세트 내의 계수에 수행된다.
구체적 구현은 이하:
먼저, 제1 양자화 스텝를 사용하여 제1 변환 계수 세트에 역양자화를 수행하여 제3 변환 계수 세트, 즉, 를 획득한 다음, 에 스케일링 및 라운딩을 수행하여 제2 변환 계수 즉, 를 획득하고, 및 는 라운딩 오프셋이다.
고, 현재 디코딩된 이미지, 예를 들어, 프레임 레벨 양자화 파라미터에 대응하는 신호에 의해 지시되는 디폴트 양자화 파라미터이다.
실시예
이하에서는, 구체적 파라미터를 참조하여, 본 발명의 실시예에서의 기술적 해결 수단을 설명하고, 구체적 구현은 이하를 포함한다.
제1 변환 계수 세트는 휘도 성분 변환 블록의 모든 계수를 포함한다. 이미지 영역(X)은 영역(즉, 화소의 8개의 행과 8개의 열을 포함하는 직사각형 영역)이다. 이미지 영역(X)의 좌측 위 화소의 좌표는 로 표시된다. 일반적으로, 이미지의 좌표계에서, 좌우에서 우 방향은 방향으로 정의되고, 상에서 하 방향은 방향으로 정의된다.
공간적 인접 화소 정보는 이하의 두 단계를 포함한다.
(1) 이미지 영역(X)의 공간적 이웃 영역(Y1)에서 화소 정보, 및 공간적 이웃 화소 정보는 공간적 이웃 영역(Y1) 내의 적어도 하나의 화소의 재구성 값을 포함한다. 공간적 이웃 영역(Y1)에 포함된 화소 좌표 는 이하의 조건:
을 만족하는 것으로 가정하고, J1 내지 J8은 양의 정수, 예를 들어, J1=J2=J3=J5=J6=J7=8 및 J4=J8=1, 또는 J1=J3=12, J2=4, J4=1, J5=J7=12, J6=4, 및 J8=1, 또는 J1=5, J2=8, J3=6, J4=2, J5=10, J6=11, J7=12, 및 J8=1이다.
(2) 인트라 예측 방식으로, 이미지 영역(X)의 공간적 이웃 영역(Y2) 내의 화소 정보에 따라 생성된, 이미지 영역(X)의 예측 화소 정보. 호소 정보는 이미지 영역(X)의 적어도 하나의 인트라 예측 픽셀을 포함한다. 공간적 이웃 영역(Y2)에 포함된 화소 좌표는 이하의 조건:
을 만족하고, S1 및 S2는 양의 정수, 예를 들어, S1=S2=15, 또는 S1=7 및 S2=15이다. 인트라 예측 방식은 H.265/HEVC에서의 33방향 인트라 예측 모드, DC 예측 모드, 또는 평면 예측 모드 중 하나 일 수 있다.
양자화 조정 인자 는, 화소 평균의 제1 함수 및 화소 분산에 대한 제2 함수 에 의해 함께 결정되고, 가 사용된다. 휘도 성분의 평균 및 휘도 성분의 분산는 공간적 이웃 화소 정보 내의 모든 화소의 평균 및 분산이다. 제1 함수 및 제2 함수는 구체적으로 이하:
제1 변환 계수 세트의 변환 계수의 역양자화는, 양자화 조정 인자에 따라 조정되고, 제2 변환 계수 세트를 획득하기 위해, 역양자화는 제1 변환 계수 세트에 수행된다. 제1 변환 계수 세트의 변환 계수의 역양자화를 조정하는 방법은 이하: 양자화 조정 인자에 따라, 제1 변환 계수 세트의 원래 양자화 스텝 에 스케일링을 수행하는 단계: 및 스케일링 된 양자화 스텝을, 역양자화가 제1 변환 계수 세트에 수행되는 양자화 스텝로서 사용하는 단계를 포함한다.
실시예
도 5에 도시된 바와 같이, 본 발명의 실시예는 비디오 코딩에서의 적응형 역양자화 장치를 제공하고, 이러한 장치는 결정 유닛(501), 획득 유닛(502), 계산 유닛(503), 및 역양자화 유닛(504)를 포함한다.
결정 유닛(501)은, 현재 디코딩된 이미지에서, 제1 변환 계수 세트에 대응하는 이미지 영역을 결정하도록 구성되고, 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 변환 계수는 현재 디코딩된 이미지에서 임의의 컬러 공간 성분의 변환 계수이며, N은 양의 정수이다.
획득 유닛(502)은, 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성되고, 디코딩된 화소 정보는 이미지 영역의 공간적 이웃 화소정보를 포함한다.
본 발명의 본 실시예에서, 획득 유닛(502)은 추가로, 이미지 영역의 시간적 이웃 화소 정보 및/또는 디코딩된 화소 정보로부터 이미지 영역의 화소 정보를 획득하도록 구성된다.
계산 유닛(503)은 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하도록 구성된다.
역양자화 유닛(504)은 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다.
본 발명의 본 실시예에서, 계산 유닛(503)은, 다양한 구체적 구현 방식에서, 디코딩된 확소 정보에 따라, 양자화 조정인자를 계산한다.
방식 1: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 평균에 따라 계산되고, 계산 유닛(503)은 구체적으로, 화소 평균의 제1 함수 에 따라 양자화 조정 인자를 계산하도록 구성되고, 화소 평균은 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 평균 또는 복수의 화소의 동일한 컬러 공간 성분의 평균이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
방식 2: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 분산 에 따라 계산되고, 계산 유닛(503)은 구체적으로, 화소 분산 의 제2 함수 에 따라 양자화 조정 인자를 계산하도록 구성되며, 화소 분산 는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 컬러 공간 성분의 분산이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
방식 3: 양자화 조정 인자는, 디코딩된 화소 정보의 화소 평균 및 화소 분산 에 따라 계산되고, 계산 유닛(503)은 구체적으로, 의 화소 평균 및 화소 분산 의 결합 함수 에 따라 계산하도록 구성되며, 화소 평균은 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 컬러 공간 성분의 평균이고, 화소 분산 는 복수의 화소의 휘도 성분의 분산 또는 복수의 화소의 동일한 컬러 공간 성분의 분산이고, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
방식 4: 양자화 조정 인자는, 디코딩된 화소 정보의, 최대 화소 값 및 최소 화소 값에 따라 계산되고, 계산 유닛(503)은 구체적으로, 최대 화소 값 과 최소 화소 값 사이의 차인, 함수 에 의해 양자화 조정 인자를 계산하도록 구성되고, 최대 화소 값 는 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 복수의 화소의 동일한 컬러 공간 성분의 최대값이고, 최소 화소 값은 복수의 화소의 휘도 성분의 최소값 또는 복수의 화소의 동일한 공간 성분의 최소값이며, 컬러 공간 성분은 제1 변환 계수 세트에 대응하는 컬러 공간 성분이다.
본 발명의 본 실시예에서, 역양자화 유닛(504)은, 다양한 구체적 구현 방식에서, 제2 변환 계수 세트를 획득하기 위해, 양자화 조정 인자에 따라, 제1 변환 계수 세트에 역양자화를 수행한다. 이하에서 실행 가능한 몇몇 방식을 제공한다.
방식 1: 역양자화는, 레벨 스케일링 리스트를 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 미리 설정된 제1 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트를 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 레벨 스케일링 리스트에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
방식 2: 역양자화는, 양자화 행렬 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 미리 설정된 제2 대응 관계에 따라, 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 타깃 양자화 행렬에 따라, 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고, 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계이다.
방식 3: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 파라미터와 계산 방식으로 획득된 적응형 양자화 파라미터 사이의 차를 사용하여, 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터를 획득하고, 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋을 결정하고, 타깃 양자화 파라미터 오프셋을 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하고, 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 제2 변환 계수 세트를 획득하기 위해, 레벨 스케일을 사용하여 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
방식 4: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 양자화 조정 인자를 사용하여 제1 양자화 스텝에 스케일을 수행하고 제2 양자화 스텝을 획득하며, 제2 변환 계수 세트를 획득하기 위해, 제2 양자화 스텝을 사용하여, 제1 변환 계수 세트에 역양자화를 수행하도록 구성된다.
방식 5: 역양자화는, 현재 디코딩된 이미지에 대응하는 신호에 포함된 양자화 스텝을 사용하여 제1 변환 계수 세트에 수행되고, 역양자화 유닛(504)은 구체적으로, 현재 디코딩된 이미지에 대응하는 신호로부터, 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고, 제1 양자화 스텝을 사용하여, 제1 변환 계수 세트 내의 계수에 역양자화를 수행하고 제3 변환 계수 세트 내의 계수를 획득하며, 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 양자화 조정 인자를 사용하여 제3 변환 계수 세트 내의 계수에 스케일링을 수행하도록 구성된다.
전술한 본 출원의 실시예에서의 하나 이상의 기술적 해결수단은 적어도 다음의 기술적 효과들을 갖는다.
본 발명의 실시 예에서 제공되는 해결 수단에 따르면, 현재의 변환 블록이 위치하는 배경 영역의 통계적 특징은, 변환 블록의, 공간적 이웃 정보, 또는 시간적 이웃 정보, 또는 공간적 이웃 정보 및 시간적 이웃 정보를 사용하여 추정되고, 역양자화를 위한 양자화 조정 인자가 적응적으로 도출되며, 역양자화 처리가 유연하게 조정된다. 한편으로, 본 발명의 적응형 양자화 방법에 따르면, 양자화 왜곡 강도는, 인간의 눈의 시각적 인식에 더욱 적합할 수 있어, 코딩 효율을 향상시킨다. 한편, 양자화 조정 정보가 비트 스트림으로 전송되는 종래 해결 수단과 비교하여, 본 발명에 따르면, 양자화 조정 정보를 전송하기 위한 여분의 비트 오버 헤드가 필요하지 않으므로, 코딩 효율을 더욱 향상시킬 수 있다. 또한, 본 발명은 인트라 프레임(I-프레임) 이미지 및 인터 프레임(P-프레임 또는 B-프레임) 이미지의 코딩에 적용 가능하다. 따라서, 본 발명의 실시예에서 제공되는 기술적 해결 수단은 비교적 넓은 적용 범위를 갖는다.
본 발명에서 기술된 방법은 특정 구현 방식의 실시예에 한정되는 것은 아니며, 본 발명의 기술적 해결 수단에 따라 당업자가 얻은 다른 구현 방식 또한 본 발명의 기술적 혁신 범위 내에 있다.
본 발명의 사상 및 범위를 벗어나지 않고, 당업자는 본 발명에 다양한 수정 및 변형을 가할 수 있음은 자명하다. 또한, 이들 변형 예가 본 발명의 특허 청구 범위 및 그와 동등한 기술 범위에 있는 한, 본 발명은 이들 변형 예를 포함하는 것으로 의도된다.
Claims (29)
- 비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 방법에 있어서,
현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
상기 이미지 영역의 디코딩된 화소 정보를 획득하는 단계 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -;
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하는 단계; 및
제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계를 포함하는 적응형 역양자화 방법. - 제1항에 있어서,
상기 디코딩된 화소 정보는, 상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 이미지 영역의 화소 정보를 더 포함하는 적응형 역양자화 방법. - 제1항 또는 제2항에 있어서,
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
화소 분산 및 화소 평균 의 결합 함수 에 따라, 상기 양자와 조정 인자를 계산하는 단계
를 포함하고,
상기 화소 평균 는 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 화소 분산 는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 방법. - 제1항 또는 제2항에 있어서,
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자를 계산하는 단계는,
최대 화소 값(maximum pixel value:) 및 최소 화소 값(minimum pixel value:) 간 차의 제3 함수 에 따라 상기 양자화 조정 인자를 계산하는 단계
를 포함하고,
상기 최대 화소 값 는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계임 -; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 간 대응 관계임-; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하는 단계;
상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하고, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계;
상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고, 제3 변환 계수 세트 내의 계수를 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 방법에 있어서,
현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역 X를 결정하는 단계 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
상기 이미지 영역 X의 시간적 이웃 화소 정보(temporal neighborhood pixel information)를 획득하는 단계;
제1 평균 및 제1 분산에 따라, 양자화 조정 인자를 계산하는 단계; - 상기 제1 평균 는, 상기 디코딩된 화소 정보 내의 복수의 화소의 휘도 성분(luminance component)의 평균 또는 상기 복수의 화소의 동일한 색 공간 성분의 평균이고, 상기 제1 분산에 는 상기 복수의 화소의 휘도 성분의 분산 또는 상기 복수의 화소의 동일한 색 공간 성분의 분산이며, 상기 색 공간 성분은 상기 제1 변환 계수 세트에 대응하는 색 공간 성분임 -; 및
제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는 적응형 역양자화 방법. - 제12항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하는 단계 - 상기 제1 대응 관계는 양자화 조정 인자와 레벨 스케일링 리스트 사이의 대응 관계임 -; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 제13항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하는 단계 - 상기 제2 대응 관계는 양자화 조정 인자와 양자화 행렬 사이의 대응 관계임 -; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 제13항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환
계수 세트에 대응하는 제1 양자화 파라미터를 획득하는 단계;
상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하고, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 제2 양자화 파라미터를 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라, 레벨 스케일(level scale)을 결정하고, 상기 레벨 스케일을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 제13항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자를 사용하여 상기 제1 양자화 스텝에 스케일링을 수행하고 제2 양자화 스텝을 획득하며, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수에 역양자화를 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 제13항 또는 제13항에 있어서,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하는 단계는,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하는 단계;
상기 제1 양자화 스텝을 사용하여 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하고 제3 변환 계수 세트를 획득하는 단계; 및
상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여 상기 제3 변환 계수 세트 내의 계수에 스케일링을 수행하는 단계
를 포함하는, 적응형 역양자화 방법. - 비디오 코딩에서의 적응형 역양자화(adaptive dequantization) 장치로서,
현재 디코딩된 이미지에서, 제1 변환 계수 세트(transform coefficient set)에 대응하는 이미지 영역을 결정하도록 구성된 결정 유닛 - 상기 제1 변환 계수 세트는 N 개의 변환 계수를 포함하고, 상기 변환 계수는 상기 현재 디코딩된 이미지에서 임의의 색 공간 성분(color space component)의 변환 계수이며, N은 양의 정수임 -;
상기 이미지 영역의 디코딩된 화소 정보를 획득하도록 구성된 획득 유닛 - 상기 디코딩된 화소 정보는 상기 이미지 영역의 공간적 이웃 화소 정보(spatial neighborhood pixel information)를 포함함 -;
상기 디코딩된 화소 정보에 따라, 양자화 조정 인자(quantization adjustment factor)를 계산하도록 구성된 계산 유닛; 및
제2 변환 계수 세트를 획득하기 위해, 상기 양자화 조정 인자에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된 역양자화 유닛
을 포함하는 적응형 역양자화 장치. - 제19항에 있어서,
상기 획득 유닛은 추가로,
상기 이미지 영역의 시간적 이웃 화소 정보(temporal neighborhood pixel information) 및/또는 상기 디코딩된 화소 정보로부터 상기 이미지 영역의 화소 정보를 획득하도록 구성된, 적응형 역양자화 장치. - 제19항 또는 제20항에 있어서,
상기 계산 유닛은 구체적으로,
최대 화소 값(maximum pixel value:) 및 최소 화소 값(minimum pixel value:) 간 차의 제3 함수 에 따라 상기 양자화 조정 인자를 계산하도록 구성되고,
상기 최대 화소 값 는, 상기 디코딩된 화소 정보에 대응하는 복수의 화소의 휘도 성분의 최대값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최대값이고, 상기 최소 화소 값은, 상기 복수의 화소의 휘도 성분의 최소값 또는 상기 복수의 화소의 동일한 색 공간 성분의 최소값이며, 상기 색 공간 성분은, 상기 제1 변환 계수 세트에 대응하는 색 공간 성분인, 적응형 역양자화 장치. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
미리 설정된 제1 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 레벨 스케일링 리스트(target level scaling list)를 결정하고,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 레벨 스케일링 리스트에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되며,
상기 제1 대응 관계는, 양자화 조정 인자와 레벨 스케일링 리스트 간 대응 관계인, 적응형 역양자화 장치. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
미리 설정된 제2 대응 관계에 따라, 상기 양자화 조정 인자에 대응하는 타깃 양자화 행렬을 결정하고,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 타깃 양자화 행렬에 따라, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성되고,
상기 제2 대응 관계는, 양자화 조정 인자와 양자화 행렬 간 대응 관계인, 적응형 역양자화 장치. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 파라미터(quantization parameter)를 획득하고,
상기 양자화 조정 인자에 따라, 타깃 양자화 파라미터 오프셋(target quantization parameter offset)을 결정하며, 상기 타깃 양자화 파라미터 오프셋을 상기 제1 양자화 파라미터에 추가하여 상기 제2 양자화 파라미터를 획득하며,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 파라미터에 따라 레벨 스케일을 결정하고, 상기 레벨 스케일을 사용하여 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된, 적응형 역양자화 장치. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고,
상기 양자화 조정 인자를 사용하여, 상기 제1 양자화 스텝에 스케일링(scaling)을 수행하여 제2 양자화 스텝을 획득하며,
상기 제2 변환 계수 세트를 획득하기 위해, 상기 제2 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트에 역양자화를 수행하도록 구성된, 적응형 역양자화 장치. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 역양자화 유닛은 구체적으로,
상기 현재 디코딩된 이미지에 대응하는 신호로부터, 상기 제1 변환 계수 세트에 대응하는 제1 양자화 스텝을 획득하고,
상기 제1 양자화 스텝을 사용하여, 상기 제1 변환 계수 세트 내의 상기 계수에 역양자화를 수행하여 제3 변환 계수 세트 내의 계수를 획득하며,
상기 제2 변환 계수 세트를 획득하기 위해, 계산 방식으로 획득된 상기 양자화 조정 인자를 사용하여, 상기 제3 변환 계수 세트 내의 상기 계수에 스케일링을 수행하도록 구성된, 적응형 역양자화 장치.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410355790.5 | 2014-07-24 | ||
CN201410355790.5A CN105338352B (zh) | 2014-07-24 | 2014-07-24 | 一种视频编码中自适应反量化方法及装置 |
PCT/CN2015/070905 WO2016011796A1 (zh) | 2014-07-24 | 2015-01-16 | 一种视频编码中自适应反量化方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170031202A true KR20170031202A (ko) | 2017-03-20 |
KR101893049B1 KR101893049B1 (ko) | 2018-08-29 |
Family
ID=55162477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177003914A KR101893049B1 (ko) | 2014-07-24 | 2015-01-16 | 비디오 코딩에서의 적응형 역양자화 방법 및 장치 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10257514B2 (ko) |
EP (1) | EP3163875B1 (ko) |
JP (1) | JP6388355B2 (ko) |
KR (1) | KR101893049B1 (ko) |
CN (1) | CN105338352B (ko) |
WO (1) | WO2016011796A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018221946A1 (ko) * | 2017-05-30 | 2018-12-06 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
WO2019009600A1 (ko) * | 2017-07-04 | 2019-01-10 | 엘지전자 주식회사 | 360도 비디오에 대한 영상 코딩 시스템에서 프로젝션 타입 기반 양자화 파라미터를 사용한 영상 디코딩 방법 및 장치 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11206401B2 (en) | 2016-02-11 | 2021-12-21 | Samsung Electronics Co., Ltd. | Video encoding method and device and video decoding method and device |
CN107094251B (zh) * | 2017-03-31 | 2021-07-23 | 浙江大学 | 一种基于空间位置自适应质量调整的视频、图像编解码方法及装置 |
US10652539B1 (en) * | 2017-07-31 | 2020-05-12 | Facebook Technologies, Llc | In-band signaling for display luminance control |
US11095896B2 (en) * | 2017-10-12 | 2021-08-17 | Qualcomm Incorporated | Video coding with content adaptive spatially varying quantization |
CN109756733B (zh) * | 2017-11-06 | 2022-04-12 | 华为技术有限公司 | 视频数据解码方法及装置 |
CN110536133B (zh) * | 2018-05-24 | 2021-11-19 | 华为技术有限公司 | 视频数据解码方法及装置 |
US11451840B2 (en) * | 2018-06-18 | 2022-09-20 | Qualcomm Incorporated | Trellis coded quantization coefficient coding |
WO2020007848A1 (en) * | 2018-07-02 | 2020-01-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Bilateral high frequency boost |
CA3111118A1 (en) * | 2018-09-21 | 2020-03-26 | Huawei Technologies Co., Ltd. | Apparatus and method for inverse quantization |
EP3981156A4 (en) * | 2019-06-24 | 2023-02-01 | Huawei Technologies Co., Ltd. | PROCEDURE FOR CALCULATION OF POSITION OF AN INTEGER GRIDING REFERENCE SAMPLE FOR CALCULATION OF BOUNDARY SAMPLE GRADIENTS AT BLOCK LEVEL IN BI-PREDICTIONAL OPTICAL FLOW CALCULATION AND BI-PREDICTIONAL CORRECTION |
US11616983B2 (en) * | 2020-05-05 | 2023-03-28 | Tencent America LLC | Joint component secondary transform |
US11748914B2 (en) * | 2020-08-26 | 2023-09-05 | Meta Platforms Technologies, Llc | Rate controlled image and texture data compression |
US11871003B2 (en) * | 2021-09-13 | 2024-01-09 | Apple Inc. | Systems and methods of rate control for multiple pass video encoding |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2317769A1 (en) * | 2009-11-02 | 2011-05-04 | Panasonic Corporation | Luminance dependent quantization |
KR20120083368A (ko) * | 2009-10-05 | 2012-07-25 | 톰슨 라이센싱 | 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6937659B1 (en) * | 1997-11-14 | 2005-08-30 | Ac Capital Management, Inc. | Apparatus and method for compressing video information |
US6363113B1 (en) * | 1999-06-07 | 2002-03-26 | Lucent Technologies Inc. | Methods and apparatus for context-based perceptual quantization |
US6597739B1 (en) * | 2000-06-20 | 2003-07-22 | Microsoft Corporation | Three-dimensional shape-adaptive wavelet transform for efficient object-based video coding |
HUP0301368A3 (en) * | 2003-05-20 | 2005-09-28 | Amt Advanced Multimedia Techno | Method and equipment for compressing motion picture data |
JP2007535191A (ja) * | 2004-01-30 | 2007-11-29 | 松下電器産業株式会社 | 画像符号化方法、画像復号化方法、画像符号化装置、画像復号化装置およびプログラム |
CN101103632A (zh) * | 2005-01-07 | 2008-01-09 | 皇家飞利浦电子股份有限公司 | 利用动态地基于法向流的量化步长来处理视频信号的方法 |
US20060274962A1 (en) * | 2005-06-03 | 2006-12-07 | Yi-Jen Chiu | Systems and methods for improved Gaussian noise filtering |
CN102611892B (zh) * | 2006-03-16 | 2014-10-08 | 华为技术有限公司 | 在编码过程中实现自适应量化的方法及装置 |
EP1995971B1 (en) | 2006-03-16 | 2016-11-16 | Huawei Technologies Co., Ltd. | A method and device for realizing quantization in coding-decoding |
CN101039421A (zh) | 2006-03-16 | 2007-09-19 | 华为技术有限公司 | 在编解码中的实现量化的方法和装置 |
JP5330246B2 (ja) * | 2006-09-29 | 2013-10-30 | トムソン ライセンシング | 適応ピクセルベースのフィルタリングのための自動パラメータ推定 |
CN101325714B (zh) * | 2007-06-13 | 2010-10-27 | 华为技术有限公司 | 变换数据处理方法和装置以及编码、解码方法和装置 |
CN101888556B (zh) | 2008-03-19 | 2012-04-25 | 华为技术有限公司 | 编码、解码方法和编码、解码装置 |
US8369638B2 (en) * | 2008-05-27 | 2013-02-05 | Microsoft Corporation | Reducing DC leakage in HD photo transform |
CN101677398A (zh) * | 2008-09-19 | 2010-03-24 | 三星电子株式会社 | 场景切换码率控制方法 |
KR101511230B1 (ko) * | 2008-09-26 | 2015-04-13 | 성균관대학교산학협력단 | 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법 |
CN101771868B (zh) | 2008-12-31 | 2016-03-02 | 华为技术有限公司 | 对图像的量化处理方法及装置 |
CN102223527B (zh) | 2010-04-13 | 2013-04-17 | 华为技术有限公司 | 频带加权量化编解码方法和装置 |
MX339436B (es) * | 2011-03-09 | 2016-05-26 | Nec Corp | Dispositivo de codificacion de video, dispositivo de decodificacion de video, metodo de codificacion de video, y metodo de decodificacion de video. |
KR101442127B1 (ko) * | 2011-06-21 | 2014-09-25 | 인텔렉추얼디스커버리 주식회사 | 쿼드트리 구조 기반의 적응적 양자화 파라미터 부호화 및 복호화 방법 및 장치 |
US9740886B2 (en) * | 2013-03-15 | 2017-08-22 | Sony Interactive Entertainment Inc. | Enhanced security for hardware decoder accelerator |
-
2014
- 2014-07-24 CN CN201410355790.5A patent/CN105338352B/zh active Active
-
2015
- 2015-01-16 KR KR1020177003914A patent/KR101893049B1/ko active IP Right Grant
- 2015-01-16 EP EP15824496.2A patent/EP3163875B1/en active Active
- 2015-01-16 WO PCT/CN2015/070905 patent/WO2016011796A1/zh active Application Filing
- 2015-01-16 JP JP2017503878A patent/JP6388355B2/ja active Active
-
2017
- 2017-01-18 US US15/408,585 patent/US10257514B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120083368A (ko) * | 2009-10-05 | 2012-07-25 | 톰슨 라이센싱 | 비디오 인코딩 및 디코딩에서 삽입된 양자화 파라미터 조정을 위한 방법 및 장치 |
EP2317769A1 (en) * | 2009-11-02 | 2011-05-04 | Panasonic Corporation | Luminance dependent quantization |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018221946A1 (ko) * | 2017-05-30 | 2018-12-06 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
WO2019009600A1 (ko) * | 2017-07-04 | 2019-01-10 | 엘지전자 주식회사 | 360도 비디오에 대한 영상 코딩 시스템에서 프로젝션 타입 기반 양자화 파라미터를 사용한 영상 디코딩 방법 및 장치 |
US11051020B2 (en) | 2017-07-04 | 2021-06-29 | Lg Electronics Inc. | Image decoding method and apparatus using projection-type based quantisation parameters in image coding system for 360-degree video |
Also Published As
Publication number | Publication date |
---|---|
JP2017527181A (ja) | 2017-09-14 |
US10257514B2 (en) | 2019-04-09 |
CN105338352A (zh) | 2016-02-17 |
KR101893049B1 (ko) | 2018-08-29 |
CN105338352B (zh) | 2019-04-19 |
US20170127062A1 (en) | 2017-05-04 |
EP3163875A1 (en) | 2017-05-03 |
EP3163875A4 (en) | 2017-09-27 |
WO2016011796A1 (zh) | 2016-01-28 |
EP3163875B1 (en) | 2020-11-25 |
JP6388355B2 (ja) | 2018-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101893049B1 (ko) | 비디오 코딩에서의 적응형 역양자화 방법 및 장치 | |
JP6863669B2 (ja) | 画像符号化装置、画像符号化方法、画像復号装置および画像復号方法 | |
CN111819853B (zh) | 图像块编码装置和图像块编码方法 | |
JP2020065277A (ja) | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法及び符号化ビットストリームを記録した記録媒体 | |
US20180343452A1 (en) | Encoding/decoding apparatus and method using flexible deblocking filtering | |
US11277615B2 (en) | Intra-prediction method for reducing intra-prediction errors and device for same | |
KR20190016983A (ko) | 인트라 예측 정보 부호화 방법 및 장치 | |
US20150016526A1 (en) | Image encoding/decoding method and device | |
TW202341742A (zh) | 圖像編碼方法及圖像解碼方法 | |
TR201802460T4 (tr) | Renkli görüntüde kod çözme için yöntem. | |
KR20110091000A (ko) | 화상 부호화 장치 및 화상 복호 장치 | |
CN103621082A (zh) | 视频译码中的量化 | |
KR100846774B1 (ko) | 블록킹 효과를 제거하기 위한 필터링 방법 및 그 장치 | |
WO2019104635A1 (en) | System and method for controlling video coding at frame level | |
TW201644277A (zh) | 用於調色盤模式寫碼之寫碼逃脫像素 | |
US20190335173A1 (en) | Image encoding method/device, image decoding method/device and recording medium having bitstream stored therein | |
WO2019104611A1 (en) | System and method for controlling video coding within image frame | |
KR101873050B1 (ko) | 화상 시퀀스 코딩 방법, 그 대응 재구성 방법, 및 이 화상 시퀀스를 대표하는 코딩된 데이터 스트림 | |
KR20190062284A (ko) | 인지 특성에 기반한 영상 처리 방법 및 장치 | |
CN113347425B (zh) | 信息处理方法及装置、设备、存储介质 | |
JP2014090327A (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
JP2014090326A (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
WO2015045301A1 (ja) | 映像符号化装置、映像符号化方法および映像符号化プログラム | |
CN113225556A (zh) | 视频编码方法 | |
JP2019004304A (ja) | 画像符号化装置、画像符号化方法、及び画像符号化プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |