KR101481642B1 - 비디오를 인코딩하고 디코딩하기 위한 방법 및 장치 - Google Patents

비디오를 인코딩하고 디코딩하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR101481642B1
KR101481642B1 KR1020127011936A KR20127011936A KR101481642B1 KR 101481642 B1 KR101481642 B1 KR 101481642B1 KR 1020127011936 A KR1020127011936 A KR 1020127011936A KR 20127011936 A KR20127011936 A KR 20127011936A KR 101481642 B1 KR101481642 B1 KR 101481642B1
Authority
KR
South Korea
Prior art keywords
transform
transformation
index information
matrices
encoding
Prior art date
Application number
KR1020127011936A
Other languages
English (en)
Other versions
KR20120060914A (ko
Inventor
밍유안 양
동 왕
량후안 시옹
신 자오
리 장
시웨이 마
웬 가오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20120060914A publication Critical patent/KR20120060914A/ko
Application granted granted Critical
Publication of KR101481642B1 publication Critical patent/KR101481642B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type

Abstract

본 발명의 구현예는 비디오를 인코딩하고 디코딩하기 위한 방법 및 장치를 제공하며, 통신 분야에 관련되어 있다. 변환을 위하여 각각의 레지듀얼(residual) 블록의 특징에 대응하는 효율적인 변환 행렬이 선택되어, 인코딩 효율을 향상시킨다. 본 발명의 일 구현예에 제공된 해결 방안은, 입력 비디오 데이터에 따라 예측 레지듀얼(residual)을 생성하는 단계; 인트라-프레임(intra-frame) 예측 모드 및 레이트-왜곡(rate-distortion) 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트(set)를 선택하여 예측 레지듀얼에 대한 변환-코딩(transform-coding)을 수행하여 변환 결과를 획득하는 단계; 및 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성하는 단계이다.

Description

비디오를 인코딩하고 디코딩하기 위한 방법 및 장치{METHOD AND DEVICE FOR ENCODING AND DECODING VIDEO}
본 발명은 통신 분야, 구체적으로는, 비디오를 인코딩하고 디코딩하기 위한 방법 및 장치에 관한 것이다.
삭제
비디오를 인코딩하고 디코딩하기 위한 전체 시스템은 인코더부 및 디코더부를 포함한다. 일반적으로, 하이브리드 인코딩 프레임워크(hybrid encoding framework) 하의 인코더 측에서, 비디오 신호는 먼저 예측 모듈을 통과한다. 인코더는 일정한 최적화 기준에 따라 여러 예측 모드 중에서 최선의 모드를 선택한 후, 레지듀얼(residual) 신호를 생성한다. 레지듀얼 신호는 변환되고 양자화된 후, 엔트로피 인코딩 모듈로 송신되어, 출력 스트림을 결국 형성한다. 디코더 측에서는, 이 출력 스트림이 해독되어 예측 모드 정보가 획득되며, 인코더 상의 신호와 완전히 동일한 예측된 신호가 생성된다. 그 후, 해독된 스트림으로부터 양자화된 변환 계수값(quantized transformation coefficient value)이 획득되고, 재구성된 레지듀얼 신호를 생성하기 위하여 역양자화 및 역변환이 수행된다. 마지막으로, 예측된 신호 및 재구성된 레지듀얼 신호가 결합되어 재구성된 비디오 신호를 형성한다.
하이브리드 인코딩 프레임워크 하에서, 인코딩 프로세스에서의 핵심 기술은 변환이다. 변환 기능은: 레지듀얼 블록에 대한 선형 연산을 통하여 레지듀얼을 다른 표현으로 변환하는 것이며, 그러한 표현 하에서, 데이터의 에너지는 소수의 변환 계수들에게 집중되고, 대부분의 다른 계수들의 에너지는 매우 낮거나 심지어는 0이 된다. 이러한 변환을 통하여, 그 후의 엔트로피 인코딩이 효율적으로 수행될 수 있다. 비디오 인코딩에서, 레지듀얼 블록 X에 대해, 만일 X가 행렬로 간주된다면, 변환은 실제로는 행렬의 곱셈이 된다. 곱셈의 일 형태는 F = C·X·R로서, C 및 R은 차원(dimension)이 X의 차원과 동일한 변환 행렬이고, F는 변환의 결과로서의 변환 계수 행렬이다. 종래 기술에서의 다른 유형의 변환과 비교할 때, 이산 코사인 변환(Discrete Cosine Transform, DCT)은 복잡도와 성능 사이의 더 나은 트레이드오프(tradeoff)이므로, 광범위하게 적용된다.
비디오 인코딩 기술에는, MDDT(Mode Dependent Directional Transform) 기술이 채택되어 있다. MDDT의 본질은 다음과 같다. (1) 상이한 인트라-프레임(intra-frame) 예측 모드를 통하여 획득된 레지듀얼은 상이한 통계적 특징을 가져온다. 따라서, 압축 인코딩 효율을 증가시키기 위해서는, 상이한 예측 방향에 따라, 상이한 변환 행렬이 사용되어야 한다. 그리고 (2) 변환의 복잡도를 감소시키기 위해서, MDDT는 열(column)에서 행(row)을 분리하여, 한 쌍의 변환 행렬, 즉, 열 변환 행렬 Ci 및 행 변환 행렬 Ri를 생성한다. 따라서, 변환 프로세스는 Fi = Ci·X·Ri가 되며, i는 대응하는 인트라-프레임 예측 모드를, X는 예측 레지듀얼을, 그리고 Fi는 변환된 예측 레지듀얼을 나타낸다. Ci 및 Ri는 수평 변환이 Ci 행렬 및 Ri 행렬에 의한 수직 변환으로부터 분리되어 있음을 보여주며, 이는 행으로부터 분리된 열을 사용한 변환으로 알려져 있다.
상기 변환을 구현하는 과정에서, 종래 기술에서 적어도 다음의 문제점이 발견되었다.
MDDT 기술은 변환 행렬의 상이한 세트(set)를 인트라-프레임 인코딩을 위한 상이한 예측 방향에 적용할 수 있음에도 불구하고, 실제 인코딩 프로세스에서, 인트라-프레임 예측 모드가 동일하다고 하더라도, 명백하게도 레지듀얼 데이터의 통계적 특징은 여전히 상이하다. 따라서, 변환 행렬의 세트에 대응하는 하나의 인트라-프레임 예측 모드에서의, 상기 방법은, 아직 충분히 정확하지 않으며, 그 후의 인코딩의 낮은 효율을 초래한다.
본 발명의 일 구현예는, 변환을 위하여 각 레지듀얼 블록의 특징에 대응하는 효율적인 변환 행렬이 선택되어 인코딩 효율을 향상시키는, 비디오를 인코딩하고 디코딩하기 위한 방법 및 장치를 제공한다.
상기 목적을 달성하기 위하여, 본 발명의 구현예는 다음의 기술적 해결 방안들을 제공한다.
본 발명의 일 구현예는, 입력 비디오 데이터에 따라 예측 레지듀얼(residual)을 생성하는 단계; 인트라-프레임(intra-frame) 예측 모드 및 레이트-왜곡(rate-distortion) 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트(set)를 선택하여 예측 레지듀얼에 대한 변환-코딩(transform-coding)을 수행하여 변환 결과를 획득하는 단계; 및 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성하는 단계를 포함하는 비디오 데이터를 인코딩하기 위한 방법을 제공한다.
본 발명의 일 구현예는, 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하도록 구성된 레지듀얼 생성 유닛; 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하도록 구성된 변환 유닛; 및 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성하도록 구성된 스트림 생성 유닛을 포함하는 비디오 데이터 인코더를 제공한다.
본 발명의 일 구현예는, 인코딩된 비디오 스트림을 해독하여 계산 결과를 획득하고, 변환 계수 행렬 인덱스 정보를 인코딩하는 단계; 및 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 계수 행렬을 결정하고, 변환 계수 행렬을 사용하여 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성하는 단계를 포함하는 비디오 데이터를 디코딩하기 위한 방법을 제공한다.
본 발명의 일 구현예는, 비디오 스트림을 해독하여 계산 결과를 획득하고, 변환 계수 행렬 인덱스 정보를 인코딩하도록 구성된 해독 유닛; 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 계수 행렬을 결정하도록 구성된 결정 유닛; 및 변환 계수 행렬을 사용하여 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성하도록 구성된 재구성 유닛을 포함하는 비디오 디코더를 제공한다.
본 발명의 일 구현예는, 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하는 단계; 인트라-프레임 예측 모드 및 최적화(optimization) 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하는 단계; 및 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성하는 단계를 포함하는 비디오 데이터를 인코딩하기 위한 방법을 제공한다.
본 발명의 일 구현예는, 인코딩된 비디오 스트림을 해독하여 변환 결과 및 변환 행렬 인덱스 정보를 획득하는 단계; 및 변환 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬의 세트를 결정하고, 변환 행렬의 세트를 사용하여 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성하는 단계를 포함하는 비디오 디코딩 방법을 제공한다.
본 발명의 일 구현예는, 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하는 단계; 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하는 단계; 및 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성하는 단계를 포함하는 비디오 데이터를 인코딩하기 위한 방법을 제공한다.
본 발명의 일 구현예는, 인코딩된 비디오 스트림을 해독하여 변환 결과를 획득하고, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하는 단계; 및 변환 행렬 인덱스 정보에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하고, 결정된 변환 행렬을 사용하여 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성하는 단계를 포함하는 비디오 디코딩 방법을 제공한다.
본 발명의 일 구현예는, 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하도록 구성된 레지듀얼 생성 유닛; 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하도록 구성된 변환 유닛; 및 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성하도록 구성된 스트림 생성 유닛을 포함하는 비디오 데이터 인코더를 제공한다.
본 발명의 일 구현예는, 인코딩된 비디오 스트림을 해독하여 변환 결과를 획득하고, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하도록 구성된 해독 유닛; 및 변환 행렬 인덱스 정보에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하도록 구성된 결정 유닛; 및 결정된 변환 행렬을 사용하여 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성하도록 구성된 재구성 유닛을 포함하는 비디오 디코더를 제공한다.
본 발명의 구현예인 비디오를 인코딩하고 디코딩하기 위한 방법 및 장치는 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하기 위하여 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택한다. 인코딩을 위한 이런 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 이는 인코딩 효율을 향상시킨다. 또한, 변환 계수 행렬은 변환 계수 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 복수 개의 후보 변환 행렬 중에서 선택되고, 레지듀얼 데이터를 획득하기 위해 변환 계수 행렬을 사용함으로써 역변환이 수행되며, 레지듀얼 데이터에 따라 비디오 데이터가 재구성된다.
본 발명의 기술적 해결 방안을 보다 명확하게 설명하기 위하여, 본 발명 또는 종래 기술의 구현예에 대한 설명에 관련된 첨부된 도면이 아래에 간단하게 설명되어 있다. 명백하게, 첨부된 도면은 예시적인 것이며, 해당 기술 분야의 통상의 기술자는 창조적 노력 없이 이들 도면으로부터 다른 도면을 도출할 수 있다.
도 1은 본 발명의 일 구현예에 따른 비디오 인코딩 방법의 블록 흐름도이다.
도 2는 본 발명의 일 구현예에 따른 비디오 디코딩 방법의 블록 흐름도이다.
도 3은 본 발명의 일 구현예에 따른 비디오 인코딩 방법에서의 레지듀얼(residual) 변환의 개략도이다.
도 4는 본 발명의 일 구현예에 따른 비디오 인코더 구조의 블록 흐름도이다.
도 5는 본 발명의 다른 구현예에 따른 비디오 인코더 구조의 블록 흐름도이다.
도 6은 본 발명의 일 구현예에 따른 비디오 디코더 구조의 블록 흐름도이다.
도 7는 본 발명의 다른 구현예에 따른 비디오 디코더 구조의 블록 흐름도이다.
도 8은 본 발명의 일 구현예에 따른 다른 비디오 인코딩 방법의 블록 흐름도이다.
도 9는 본 발명의 일 구현예에 따른 다른 비디오 디코딩 방법의 블록 흐름도이다.
도 10은 본 발명의 일 구현예에 따른 다른 비디오 인코딩 방법의 블록 흐름도이다.
도 11은 본 발명의 일 구현예에 따른 다른 비디오 디코딩 방법의 블록 흐름도이다.
도 12는 본 발명의 일 구현예에 따른 다른 비디오 인코더 구조의 블록 흐름도이다.
도 13은 본 발명의 일 구현예에 따른 다른 비디오 인코더 구조의 블록 흐름도이다.
도 14는 본 발명의 일 구현예에 따른 다른 비디오 디코더 구조의 블록 흐름도이다.
도 15은 본 발명의 일 구현예에 따른 다른 비디오 디코더 구조의 블록 흐름도이다.
다음의 상세한 설명은 본 발명을 명확하고 완벽하게 이해하기 위하여 첨부된 도면과 함께 제공된다. 분명히, 도면 및 상세한 설명은 단지 본 발명의 특정 구현예를 나타내는 것일 뿐 모든 구현예를 나타내는 것은 아니다. 해당 기술 분야의 당업자에 의하여 아무런 창조적 노력이 없이 여기에 제시된 구현예로부터 도출될 수 있는 모든 다른 구현예는 본 발명의 보호 범위 내에 있다.
도 1에 나타난 바와 같이, 본 발명의 일 구현예에 따른 비디오 데이터를 인코딩하는 방법은 다음 단계들을 포함한다.
단계 S101: 입력 비디오 데이터에 따라 예측 레지듀얼(residual)을 생성한다.
단계 S102: 인트라-프레임(intra-frame) 예측 모드 및 레이트-왜곡(rate-distortion) 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트(set)를 선택하고 예측 레지듀얼에 대한 변환-코딩(transform-coding)을 수행하여 변환 결과를 획득한다.
변환 프로세스에서, 행(row)으로부터 열(column)을 분리시키는 모드가 적용될 수 있다. 즉, 인트라-프레임 예측 모드에 따라, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합을 트래버싱(traversing)하고, 변환 계수 행렬로서 행렬 곱셈 후에 최소의 레이트-왜곡 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득한다.
단계 S103: 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성한다.
또한, 상기 방법은, 변환된 계수를 스캔하기 위하여 인트라-프레임 예측 모드 및 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하는, 계수 스캐닝 프로세스를 포함할 수 있다.
그 후, 변환 후에 최소의 레이트-왜곡 비용을 가지는 것이 최선의 인트라-프레임 예측 모드로서 선택되고, 그것의 결과는 양자화된 후 엔트로피 인코딩이 된다.
또한, 변환 계수 행렬 인덱스 정보는 인코딩된 데이터에 기록될 수 있다.
본 발명에 제공되는 비디오 인코딩 방법에 따르면, 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트가 선택되어 예측 레지듀얼에 대한 변환-코딩을 수행할 수 있고, 변환 결과가 획득된다. 인코딩을 위한 이런 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
다음은 도 1을 참조하여 본 발명의 일 구현예에 제공되는 비디오 데이터 인코딩 방법에 관한 더욱 상세한 설명을 제공한다.
단계 S101: 입력 비디오 데이터에 따라 예측 레지듀얼을 생성한다.
단계 S102: 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득한다.
본 구현예에서, 선택된 최선의 변환 행렬의 세트는 비분리(non-separate) 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
본 구현예에서, 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하기 위하여 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트가 선택된다. 다시 말해서, 인트라-프레임 예측 모드에 따라, 복수 개의 후보 변환 행렬을 사용함으로써 예측 레지듀얼에 대해 변환-코딩이 수행되고, 최선의 변환 행렬의 세트가 레이트-왜곡 기준에 따라 선택되며, 최선의 변환 행렬의 세트에 대응하는 변환 결과는 선택된 변환 행렬 인덱스 정보와 함께 나중에 사용되어, 인코딩된 스트림을 생성한다.
변환 프로세스에서, 행으로부터 열을 분리시키는 모드가 적용될 수 있다. 즉, 인트라-프레임 예측 모드에 따라, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합을 트래버싱하고, 변환 계수 행렬로서 행렬 곱셈 후에 최소의 레이트-왜곡 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득한다. 다시 말해서, 이 모드의 상세한 내용은 다음과 같다. 인트라-프레임 예측 모드에 따라, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합을 트래버싱하고, 최선의 변환 행렬로서 레지듀얼 변환-코딩 후에 최소의 레이트-왜곡 비용을 가지는 변환 조합을 선택하고, 최선의 변환 행렬의 세트에 대응하는 변환 결과를 선택된 변환 행렬 인덱스 정보와 함께 나중에 사용하여 인코딩된 스트림을 생성한다.
단계 S103: 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성한다.
또한, 본 구현예는 또한, 변환된 계수를 스캔하기 위하여 인트라-프레임 예측 모드 및 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하는, 계수 스캐닝 프로세스를 포함할 수 있다.
그 후, 변환 후에 최소의 레이트-왜곡 비용을 가지는 것이 최선의 인트라-프레임 예측 모드로서 선택되고, 그것의 결과는 양자화된 후 엔트로피 인코딩이 된다. 즉, 예측 레지듀얼은 다양한 인코딩 모드로 인코딩되고, 최소의 레이트-왜곡 비용을 가지는 모드가 인트라-프레임 예측 모드로서 선택되어, 인코딩 결과가 획득된다.
본 구현예에서, 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성하는 단계는 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하는 단계를 포함한다.
최선의 변환 행렬의 세트가 한 쌍의 변환 행렬인 경우, 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하는 단계는, 한 쌍의 변환 행렬의 인덱스 정보를 공동으로 인코딩하거나 한 쌍의 변환 행렬의 인덱스 정보를 별개로 인코딩하는 단계; 및 인덱스 정보의 인코딩 결과를 인코딩된 데이터에 기록하는 단계를 포함한다.
공동 인코딩(joint encoding)은 열 변환 행렬 및 행 변환 행렬이 쌍으로 나타나서, 각각의 행 변환 행렬이 열 변환 행렬에 대응하는 것을 지시한다. 반면, 별개 인코딩(separate incoding)은 열 변환 행렬이 반드시 행 변환 행렬과 대응할 필요는 없는 것을 지시한다. 예를 들어, 행 변환 행렬은 임의의 열 변환 행렬에 대응할 수 있어, 변환 행렬의 저장 공간을 절약할 수 있다.
본 발명의 비디오 인코딩 방법은 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하여 예측 레지듀얼에 대한 변환-코딩을 수행하고, 변환 결과를 획득할 수 있다. 인코딩을 위한 이런 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
도 2에 나타난 바와 같이, 본 발명의 일 구현예에 제공되는 비디오 디코딩 방법은 다음 단계들을 포함한다.
단계 S201: 인코딩된 비디오 스트림을 해독하여 계산 결과를 획득하고, 변환 계수 행렬 인덱스 정보를 인코딩한다.
또한, 상기 방법은 또한, 변환된 계수에 대해 역 계수 스캔을 수행하기 위하여 인트라-프레임 예측 모드 및 변환 계수 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하는, 역 계수 스캐닝 프로세스를 포함할 수 있다.
단계 S202: 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 계수 행렬을 결정하고, 변환 계수 행렬을 사용하여 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성한다.
구체적으로, 만일 개별적인 변환이 인코딩 변환 프로세스에 적용된다면, 단계 S202의 변환 계수 행렬은 인덱스 정보의 행 변환 계수 행렬 인덱스 정보 및 열 변환 계수 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 후보 행 변환 행렬 및 열 변환 행렬의 세트 중에서 결정될 수 있다.
본 구현예에 제공된 비디오 디코딩 방법에 따라, 인코딩된 비디오 스트림은 해독되어 계산 결과를 획득할 수 있고, 변환 계수 행렬 인덱스 정보를 인코딩한다. 그리고 변환 계수 행렬은 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 결정되고, 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하기 위하여 변환 계수 행렬이 사용되고, 비디오 데이터는 레지듀얼 데이터에 따라 재구성된다. 이러한 방법으로, 복잡도를 증가시키지 않고 디코딩이 수행된다. 인코딩은 앞선 구현예에 제공된 방법에 기초하고 있으므로, 최선의 변환 행렬이 레지듀얼 특징에 대하여 선택될 수 있고, 엔트로피 인코딩 효율이 향상된다. 또한, 본 구현예에 제공된 디코딩 방법을 통하여, 비디오를 인코딩하고 디코딩하는 효율이 전체적으로 향상될 수 있다.
다음은 도 2를 참조하여 본 발명의 일 구현예에 제공되는 비디오 디코딩 방법에 관한 더욱 상세한 설명을 제공한다.
단계 S201: 인코딩된 비디오 스트림을 해독하여 계산 결과 및 변환 행렬 인덱스 정보를 획득한다.
본 구현예에서, 해독 이후에 획득되는 결과는 변환 결과를 포함한다. 즉, 본 구현예에 사용되는 계산 결과는 변환 결과이다. 변환 결과는 변환 후에 획득된 변환 계수 행렬을 포함할 수 있다.
또한, 본 구현예는 또한, 변환된 계수에 대해 역 계수 스캔을 수행하기 위하여 인트라-프레임 예측 모드 및 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하는, 역 계수 스캐닝 프로세스를 포함할 수 있다.
단계 S202: 변환 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하고, 결정된 변환 행렬을 사용하여 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성한다.
본 구현예에서, 결정된 변환 행렬은 변환 행렬의 세트이며, 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
구체적으로, 만일 개별적인 변환이 인코딩 변환 프로세스에 적용된다면, 단계 S202의 변환 계수 행렬은 인덱스 정보의 행 변환 행렬 인덱스 정보 및 열 변환 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 후보 행 변환 행렬 및 열 변환 행렬의 세트 중에서 결정될 수 있다. 여기에서의 후보 행 변환 행렬 및 열 변환 행렬의 세트는 다수 개의 행 변환 행렬 및 열 변환 행렬을 포함한다.
본 구현예에 제공된 비디오 디코딩 방법에 따라, 인코딩된 비디오 스트림은 해독되어 계산 결과 및 변환 행렬 인덱스 정보를 획득할 수 있다. 그리고 변환 행렬은 변환 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 결정되고, 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하기 위하여 변환 계수 행렬이 사용되고, 비디오 데이터는 레지듀얼 데이터에 따라 재구성된다. 이러한 방법으로, 복잡도를 증가시키지 않고 디코딩이 수행된다. 인코딩은 앞선 구현예에 제공된 방법에 기초하고 있으므로, 최선의 변환 행렬이 레지듀얼 특징에 대하여 선택될 수 있고, 따라서 엔트로피 인코딩 효율이 향상된다. 또한, 본 구현예에 제공된 디코딩 방법을 통하여, 비디오를 인코딩하고 디코딩하는 효율이 전체적으로 향상될 수 있다.
본 구현예에 제공된 비디오 데이터 인코딩 방법을 설명하기 위하여 H.264/AVC의 인트라-프레임 인코딩을 예로 들자.
단계 1: H.264/AVC의 인트라-프레임 인코딩에서, 각각의 매크로 블록(macro block)에 대해, 매크로 블록은 처음에는 기존의 I4MB 모드, I16MB 모드 및 I8MB 모드를 통하여 인코딩되고, 각 모드의 비트 레이트(bit rate)는 각각 R_I4MB, R_I16MB 및 R_I8MB로 레코딩되며, 왜곡은 각각 D_I4MB, D_I16MB 및 D_I8MB로 레코딩된다. 그 후, λ를 인코딩 프로세스에서의 특정 상수라고 할 때, 레이트 왜곡 비용은 RDcost_I4MB = D_I4MB + λ*R_I4MB, RDcost_I16MB = D_I16MB + λ*R_I16MB, 및 RDcost_I8MB = D_I16MB + λ*R_I8MB로 각각 계산된다. 그 후, 새로운 매크로 블록 인코딩 모드, 즉, 본 구현예에 제공된 방법이 적용된다. 매크로 블록이 I4MB_RDOT 모드, I16MB_RDOT 모드 및 I8MB_RDOT 모드로 인코딩된 것으로 가정하면, 그에 대응하는 레이트-왜곡 비용, 즉, RDcost_I4MB_RDOT, RDcost_I16MB_RDOT, 및 RDcost_I8MB_RDOT가 계산된다.
I4MB_RDOT, I16MB_RDOT, 및 I8MB_RDOT의 인코딩 프로세스는 아래에 설명되어 있다.
(a) I4MB 코딩 프로세스에서와 같이, 매크로 블록이 I4MB_RDOT 모드로 인코딩 된 경우, 16×16 매크로 블록은 16개의 겹치지 않는(non-overlapping) 4×4 크기의 하위블록으로 분할된다. 그 후, 최선의 예측 방향이 각 하위블록에 대해 선택된다. 이러한 단계는 다음과 같은 점에서 I4MB 인코딩 프로세스와 상이하다. 레지듀얼을 변환하는 시점에, 현재의 인트라-프레임 예측 모드에 따라 후보 변환 행렬의 다수 개의 세트가 선택되고, 레지듀얼에 대하여 변환-코딩이 수행된다. 상이한 변환 행렬 조합에 대응하는 비트 레이트 R 및 왜곡 D가 레코딩되고, 레이트 왜곡 비용이 계산된다. 그리고 최소의 레이트-왜곡 비용을 가지는 변환 행렬 조합이 최선의 조합으로 선택되고, 레지듀얼 데이터를 실제로 인코딩하기 위하여 사용된다. 레지듀얼 변환 프로세스에 대해서는, 도 3을 참고하라. 여기서, X는 예측 레지듀얼이고, T(X)는 변환된 예측 레지듀얼이며, Ci 0 …K-1 및 Ri 0 …K- 1는 예측 방향에 대응하는 후보 변환 행렬이다.
(b) I8MB 코딩 프로세스에서와 같이, 매크로 블록이 I8MB_RDOT 모드로 인코딩 된 경우, 16×16 매크로 블록은 4개의 겹치지 않는 8×8 크기의 하위블록으로 분할된다. 그 후, 최선의 예측 방향이 각 하위블록에 대해 선택된다. 이러한 단계는 다음과 같은 점에서 I8MB 인코딩 프로세스와 상이하다. 레지듀얼을 변환하는 시점에, 현재의 인트라-프레임 예측 모드에 따라 후보 변환 행렬의 다수 개의 세트가 선택되고, 레지듀얼에 대하여 변환-코딩이 수행된다. 상이한 변환 행렬 조합에 대응하는 비트 레이트 R 및 왜곡 D가 레코딩되고, 레이트 왜곡 비용이 계산된다. 그리고 최소의 레이트-왜곡 비용을 가지는 변환 행렬 조합이 최선의 조합으로 선택되고, 레지듀얼 데이터를 실제로 인코딩하기 위하여 사용된다. 레지듀얼 변환 프로세스에 대해서는, 도 6을 참고하라. 여기서, X는 예측 레지듀얼이고, T(X)는 변환된 예측 레지듀얼이며, Ci 0 …K-1 및 Ri 0 …K- 1는 예측 방향에 대응하는 후보 변환 행렬이다.
(c) I16MB 인코딩 프로세스에서와 같이, 매크로 블록을 I8MB_RDOT 모드로 인코딩하는 시점에, 최선의 예측 방향이 각각의 16×16 블록에 대해 선택된다. 이러한 단계는 다음과 같은 점에서 I16MB 인코딩 프로세스와 상이하다. 레지듀얼을 변환하는 시점에, 예측 방향에 따라 후보 변환 행렬의 주어진 세트가 선택되고, 후보 변환 행렬의 세트의 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합이 트래버싱된다. 상이한 변환 행렬 조합에 대응하는 비트 레이트 R 및 왜곡 D가 각각 레코딩되고, 레이트 왜곡 비용이 계산된다. 그리고 최소의 레이트-왜곡 비용을 가지는 변환 행렬 조합이 최선의 조합으로 선택되고, 레지듀얼 데이터를 실제로 인코딩하기 위하여 사용된다.
단계 2: 매크로 블록 인코딩 모드가 I4MB_RDOT, I16MB_RDOT 또는 I8MB_RDOT인 경우, 인트라-프레임 예측 모드 및 변환 행렬에 따라 각각의 하위블록의 변환된 레지듀얼에 대하여 대응하는 계수 스캔 순서가 선택된다.
단계 3: 단계 1에서 획득한 네 개의 인트라-프레임 매크로 블록 인코딩 모드 I4MB, I16MB, I8MB, I4MB_RDOT, I16MB_RDOT 및 I8MB_RDOT 에 대응하는 레이트-왜곡 비용에 따라 최선의 매크로 블록 인코딩 모드로 최소의 레이트-왜곡 비용을 가지는 모드가 선택된다. 만일 최선의 매크로 블록 인코딩 모드가 I4MB, I16MB 또는 I8MB이면, 매크로 블록 헤더 정보에 대한 엔트로피 인코딩에서, 구문 요소 CBP 다음에 구문 요소 RDOT_ON이 기록되고, 구문 요소 RDOT_ON에 할당된 값은 0이며, 이는 제안된(put forward) 기술이 사용되지 않음을 지시한다. 만일 최선의 매크로 블록 인코딩 모드가 I4MB_RDOT, I16MB_RDOT 또는 I8MB_RDOT면, 매크로 블록 헤더 정보에 대한 엔트로피 인코딩에서, 구문 요소 CBP 다음에 구문 요소 RDOT_ON이 기록되고, 구문 요소 RDOT_ON에 할당된 값은 1이며, 이는 제안된 기술이 사용됨을 지시한다. 또한, 현재 매크로 블록의 각각의 블록에 의하여 사용되는 변환 행렬 인덱스 번호가 엔트로피 인코딩을 통해서 연속적으로 구문 요소 RDOT_ON 다음에 기록된다.
구체적으로, H.264 비디오 인코딩 표준에 대하여 본 구현예에 의해 이루어진 구문 변경이 표 1에 나타나 있다. 각각의 매크로 블록 헤더에서, 구문 요소 RDOT_ON은 기존의 구문 요소 CBP 뒤에 기록된다. 만일 매크로 블록 모드가 I4MB, I16MB 또는 I8MB이면 RDOT_ON의 값은 0이고, 또는, 만일 매크로 블록 모드가 I4MB_RDOT, I16MB_RDOT 또는 I8MB_RDOT이면 RDOT_ON의 값은 1이다. 만일 RDOT_ON의 값이 1, 즉, 매크로 블록 모드가 I4MB_RDOT, I16MB_RDOT 또는 I8MB_RDOT이면, 구문 요소 Transform_matrix_index(변환 행렬 인덱스)가 구문 요소 RDOT_ON 다음에 기록되고, 구문 요소 Transform_matrix_index는 매크로 블록의 각각의 블록에 의하여 선택된 변환 행렬의 인덱스 번호를 포함한다.
[표 1] I4MB, I8MB 및 I16MB 모드의 구문 요소
Figure 112012036793296-pct00001
Figure 112012036793296-pct00002
마지막으로, 플랫폼(platform)으로 KTA2.4가 사용되고, 다음의 설정: 풀 아이-프레임 인코딩(full I-frame encoding), CABAC 및 22, 27, 32 및 37이 되는 시퀀스 각각에 대하여 테스트가 된 4개의 QP 포인트가 적용된다. 본 발명의 본 구현예에 제공되는 방법에 기초한 인코딩 성능은 종래 기술의 MDDT를 기초로 한 인코딩 성능과 비교되고, 평균 ΔPSNR이 계산된다.
표 2는 QCIF 시퀀스(sequence)의 측정 결과를 나타낸다.
[표 2] QCIF 시퀀스의 측정 결과
Figure 112012036793296-pct00003
표 3은 CIF 시퀀스의 측정 결과를 나타낸다.
[표 3] CIF 시퀀스의 측정 결과
Figure 112012036793296-pct00004
앞의 표는 본 구현예에서 제공되는 방법이, MDDT 전송 방법과 비교하여, 성능을 분명하게 향상시킴을 보여준다.
다음은 본 구현예에 제공된 방법의 복잡도를 분석한 것이다.
다음은 루미넌스(luminance)를 비교한 것이다.
디코더 측 상에, 본 구현예에 개시된 방법의 복잡도는 다음의 두 가지 면에서 MDDT 변환 방법의 복잡도와 차이가 있다.
(1) 본 구현예에 제공된 방법에 관하여, 디코더는 각각의 매크로 블록 헤더에 새로이 추가된 구문 요소 RDOT_ON에 대하여 엔트로피 디코딩을 수행할 필요가 있다. 만일 RDOT_ON = 1이면, 디코더는 매크로 블록의 각각의 블록에 의하여 사용되는 변환 행렬의 인덱스 번호를 획득하기 위하여 매크로 블록 헤더를 더 디코딩할 필요가 있다.
MDDT 기술과 비교하여, 이 동작의 일부는 두 개의 새로이 추가된 구문 요소: RDOT_ON 플래그(flag) 및 변환 행렬 인덱스 번호에 대한 엔트로피 디코딩의 복잡도를 증가시킨다. 그러나, 이 부분의 복잡도는 전체 디코딩 프로세스의 복잡도에 비하여 무시할 만 하다.
(2) 본 구현예에 제공된 방법이 적용되는 매크로 블록(RDOT_ON=1)에 대해서, 디코더는 디코딩을 통하여 획득된 변환 행렬 인덱스 번호에 따라 대응하는 계수 스캔 순서 및 변환 행렬을 선택할 필요가 있다.
이 동작의 일부는 MDDT 기술만큼이나 복잡하지만, 후보 변환 행렬 및 계수 스캔 순서를 저장하기 위한 추가적인 저장 공간을 필요로 한다. I4MB 모드는 9개의 예측 방향을 가지므로, 만일 2개의 후보 행 변환 행렬 및 2개의 후보 열 변환 행렬이 각 방향에 존재하고 변환 행렬의 모든 요소가 0에서 128 사이의 정수이면, 필요한 총 저장 공간은 9 × (2+2) × 16 × 7 = 4032 비트가 된다. I8MB 모드는 9개의 예측 방향을 가지므로, 만일 4개의 후보 행 변환 행렬 및 4개의 후보 열 변환 행렬이 각 방향에 존재하고 변환 행렬의 모든 요소가 0에서 128 사이의 정수이면, 필요한 총 저장 공간은 9 × (4+4) × 64 × 7 = 32256 비트가 된다. 마찬가지로, I16MB 모드는 4개의 예측 방향을 가지므로, 만일 8개의 후보 행 변환 행렬 및 8개의 후보 열 변환 행렬이 각 방향에 존재하면, 필요한 총 저장 공간은 4 × (8+8) × 256 × 7 = 114688 비트가 된다. 따라서, by I4MB, I16MB 및 I8MB에 의하여 필요한 총 저장 공간은 150976 비트, 즉, 18.42 KB가 된다. 또한, 계수 스캔 순서를 레코딩하는 배열이 차지하는 공간은 변환 행렬이 차지하는 공간보다 매우 적어서, 여기서는 더 분석되지 않는다.
디코더 측 상에, 본 구현예에 개시된 방법의 복잡도는 다음의 세 가지 면에서 MDDT 변환 방법의 복잡도와 차이가 있다.
(1) 본 구현예에 제공된 방법에 관하여, 인코더는 새로이 추가된 구문 요소 RDOT_ON을 엔트로피 인코딩을 통하여 각각의 매크로 블록의 매크로 블록 헤더 정보에 기록할 필요가 있다. 만일 RDOT_ON = 1이면, 인코더는 매크로 블록의 각각의 블록에 의하여 사용되는 변환 행렬의 인덱스 번호에 대해 엔트로피 인코딩을 더 수행하고 그 인덱스 번호를 매크로 블록 헤더 정보에 기록할 필요가 있다. MDDT 기술과 비교하여, 이 동작의 일부는 두 개의 새로이 추가된 구문 요소: RDOT_ON 플래그 및 변환 행렬 인덱스 번호에 대한 엔트로피 인코딩의 복잡도를 증가시킨다. 이 부분에 의해 추가된 복잡도는 전체 인코딩 프로세스의 복잡도에 비하여 무시할 만 하다.
(2) 본 발명의 본 구현예에 개시된 방법에 관하여, 인코더는 후보 변환 행렬 및 계수 스캔 순서를 저장하기 위한 추가적인 저장 공간을 필요로 한다. 필요한 저장 공간은 디코더의 경우와 동일하여, 18.42 KB가 된다.
인트라-프레임 인코딩에 대하여, 본 구현예에 개시된 방법은 기존의 매크로 블록 인코딩 모드: I4MB, I16MB 및 I8MB를 보존하고, 두 매크로 블록 인코딩 모드: I4MB_RDOT, I16MB_RDOT 및 I8MB_RDOT를 추가한다. 두 개의 새로이 추가된 매크로 블록 인코딩 모드에 대해, 인코더는 각각의 레지듀얼 블록에 대한 최선의 변환 행렬을 선택할 필요가 있다.
본 발명의 비디오 인코딩 방법은 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하여 예측 레지듀얼에 대한 변환-코딩을 수행하고, 변환 결과를 획득할 수 있다. 인코딩을 위한 이런 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
도 4에 나타난 바와 같이, 본 발명의 일 구현예에 제공되는 비디오 데이터 인코더는, 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하도록 구성된 레지듀얼 생성 유닛(401); 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하도록 구성된 변환 유닛(402); 및 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성하도록 구성된 스트림 생성 유닛(403)을 포함한다.
변환 유닛(402)는 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 조합을 트래버싱하고, 최선의 변환 행렬로서 행렬 곱셈 후에 최소의 레이트-왜곡 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득하도록 구성된다.
또한, 도 5에 나타난 바와 같이, 비디오 데이터 인코더는, 인트라-프레임 예측 모드 및 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하고 변환된 계수를 스캔하도록 구성된 계수 스캐닝 유닛(501); 다양한 인코딩 모드에서 예측 레지듀얼이 인코딩된 후에 인트라-프레임 예측 모드로서 최소의 레이트-왜곡 비용을 가지는 모드를 선택하여, 결과를 획득하도록 구성된 판단 유닛(502); 및 변환 계수 행렬 인덱스 정보를 인코딩된 데이터에 기록하도록 구성된 인덱스 인코딩 유닛(503)을 더 포함한다.
본 발명의 비디오 인코딩 방법은 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하여 예측 레지듀얼에 대한 변환-코딩을 수행하고, 변환 결과를 획득할 수 있다. 인코딩을 위한 이런 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
다음은 도 4 및 도 5를 참조하여 본 발명의 일 구현예에 제공되는 비디오 디코딩 방법에 관한 더욱 상세한 설명을 제공한다.
도 4에 나타난 바와 같이, 본 발명의 일 구현예에 제공되는 비디오 데이터 인코더는, 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하도록 구성된 레지듀얼 생성 유닛(401); 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하도록 구성된 변환 유닛(402); 및 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성하도록 구성된 스트림 생성 유닛(403)을 포함한다.
본 구현예에서, 선택된 최선의 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
본 구현예에서, 변환 유닛(402)은 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하기 위하여 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택한다. 다시 말해서, 인트라-프레임 예측 모드에 따라, 복수 개의 후보 변환 행렬을 사용함으로써 예측 레지듀얼에 대해 변환-코딩이 수행되고, 최선의 변환 행렬의 세트가 레이트-왜곡 기준에 따라 선택되며, 최선의 변환 행렬의 세트에 대응하는 변환 결과는 선택된 변환 행렬 인덱스 정보와 함께 나중에 사용되어, 인코딩된 스트림을 생성한다.
변환 유닛(402)은, 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 조합을 트래버싱하고, 최선의 변환 행렬로서 행렬 곱셈 후에 최소의 레이트-왜곡 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득하도록 구성된다. 다시 말해서, 이 모드의 상세한 내용은 다음과 같다. 인트라-프레임 예측 모드에 따라, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합을 트래버싱하고, 최선의 변환 행렬로서 레지듀얼 변환-코딩 후에 최소의 레이트-왜곡 비용을 가지는 변환 조합을 선택하고, 최선의 변환 행렬의 세트에 대응하는 변환 결과를 선택된 변환 행렬 인덱스 정보와 함께 나중에 사용하여 인코딩된 스트림을 생성한다.
또한, 도 5에 나타난 바와 같이, 비디오 데이터 인코더는, 변환된 계수를 스캔하기 위하여 인트라-프레임 예측 모드 및 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하도록 구성된 계수 스캐닝 유닛(501); 다양한 인코딩 모드에서 예측 레지듀얼이 인코딩된 후에 인트라-프레임 예측 모드로서 최소의 레이트-왜곡 비용을 가지는 모드를 선택하여, 결과를 획득하도록 구성된 판단 유닛(502); 및 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하도록 구성된 인덱스 인코딩 유닛(503)을 더 포함한다.
최선의 변환 행렬의 세트가 한 쌍의 변환 행렬인 경우, 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하는 단계는, 한 쌍의 변환 행렬의 인덱스 정보를 공동으로 인코딩하거나 한 쌍의 변환 행렬의 인덱스 정보를 별개로 인코딩하는 단계; 및 인덱스 정보의 인코딩 결과를 인코딩된 데이터에 기록하는 단계를 포함한다.
공동 인코딩은 열 변환 행렬 및 행 변환 행렬이 쌍으로 나타나서, 각각의 행 변환 행렬이 열 변환 행렬에 대응하는 것을 지시한다. 반면, 별개 인코딩은 열 변환 행렬이 반드시 행 변환 행렬과 대응할 필요는 없는 것을 지시한다. 예를 들어, 행 변환 행렬은 임의의 열 변환 행렬에 대응할 수 있어, 변환 행렬의 저장 공간을 절약할 수 있다.
본 발명의 비디오 인코딩 방법은 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하여 예측 레지듀얼에 대한 변환-코딩을 수행하고, 변환 결과를 획득할 수 있다. 이런 인코딩 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
도 6에 나타난 바와 같이, 본 발명의 일 구현예에 제공된 비디오 디코더는, 비디오 스트림을 해독하여 계산 결과를 획득하고, 변환 계수 행렬 인덱스 정보를 인코딩하도록 구성된 해독 유닛(601); 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 계수 행렬을 결정하도록 구성된 결정 유닛(602); 및 변환 계수 행렬을 사용하여 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성하도록 구성된 재구성 유닛(603)을 포함한다.
또한, 도 7에 나타난 바와 같이, 비디오 디코더는, 인트라-프레임 예측 모드 및 변환 계수 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하고 변환된 계수에 대해 역 계수 스캔을 수행하도록 구성된 역 계수 스캐닝 유닛(701)을 또한 포함한다.
본 구현예에 제공된 비디오 디코더는 인코딩된 비디오 스트림을 해독하여 계산 결과를 획득하고, 변환 계수 행렬 인덱스 정보를 인코딩하고, 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 계수 행렬을 결정하며, 변환 계수 행렬을 사용하여 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성한다. 이러한 방법으로, 복잡도를 증가시키지 않고 디코딩이 수행된다. 인코딩은 앞선 구현예에 제공된 방법에 기초하고 있으므로, 최선의 변환 행렬이 레지듀얼 특징에 대하여 선택될 수 있고, 따라서 엔트로피 인코딩 효율이 향상된다. 또한, 본 구현예에 제공된 디코딩 방법을 통하여, 비디오를 인코딩하고 디코딩하는 효율이 전체적으로 향상될 수 있다.
다음은 도 6 및 도 7을 참조하여 본 발명의 일 구현예에 제공되는 비디오 디코딩 방법에 관한 더욱 상세한 설명을 제공한다.
도 6에 나타난 바와 같이, 본 발명의 일 구현예에 제공된 비디오 디코더는, 비디오 스트림을 해독하여 계산 결과 및 변환 행렬 인덱스 정보를 획득하도록 구성된 해독 유닛(601); 변환 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하도록 구성된 결정 유닛(602); 및 결정된 변환 행렬을 사용하여 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성하도록 구성된 재구성 유닛(603)을 포함한다.
본 구현예에서, 해독 유닛(601)의 해독 후에 획득된 결과는 변환 결과를 포함한다. 즉, 본 구현예에서 사용된 계산 결과는 변환 결과이다. 변환 결과는 변환 후에 획득된 변환 계수 행렬을 포함할 수 있다.
본 구현예에서, 결정된 변환 행렬은 변환 행렬의 세트이며, 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
만일 개별적인 변환이 인코딩 변환 프로세스에 적용된다면, 결정 유닛(602)는 인덱스 정보의 행 변환 계수 행렬 인덱스 정보 및 열 변환 계수 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 후보 행 변환 행렬 및 열 변환 행렬의 세트 중에서 변환 행렬을 결정하도록 구성된다. 여기에서 후보 행 변환 행렬 및 열 변환 행렬의 세트는 다수 개의 행 변환 행렬 및 열 변환 행렬을 포함할 수 있다. 재구성 유닛(603)은 행 변환 행렬 및 열 변환 행렬을 사용하여 계산 결과에 대해 역변환을 수행하여 레지듀얼 데이터를 획득하며, 레지듀얼 데이터에 따라 비디오 데이터를 재구성한다.
또한, 도 7에 나타난 바와 같이, 비디오 디코더는, 변환된 계수에 대해 역 계수 스캔을 수행하기 위하여 인트라-프레임 예측 모드 및 변환 계수 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하도록 구성된 역 계수 스캐닝 유닛(701)을 포함한다.
본 구현예에 제공된 비디오 디코더는 인코딩된 비디오 스트림을 해독하여 계산 결과 및 변환 행렬 인덱스 정보를 획득하고, 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하며, 변환 계수 행렬을 사용하여 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성한다. 이러한 방법으로, 복잡도를 증가시키지 않고 디코딩이 수행된다. 인코딩은 앞선 구현예에 제공된 방법에 기초하고 있으므로, 최선의 변환 행렬이 레지듀얼 특징에 대하여 선택될 수 있고, 따라서 엔트로피 인코딩 효율이 향상된다. 또한, 본 구현예에 제공된 디코딩 방법을 통하여, 비디오를 인코딩하고 디코딩하는 효율이 전체적으로 향상될 수 있다.
본 발명의 일 구현예에서 비디오 데이터를 인코딩하기 위한 다른 방법이 제공된다. 도 8에 나타난 바와 같이, 상기 방법은 다음 단계를 포함한다.
단계 S801: 입력 비디오 데이터에 따라 예측 레지듀얼을 생성한다.
단계 S802: 인트라-프레임 예측 모드 및 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득한다.
본 구현예에서, 선택된 최선의 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
최적화 기준은 레이트-왜곡 기준, 절대 오차의 합(sum of absolute difference, SAD), 코드 비트 또는 왜곡일 수 있다. 최적화 기준에 따른 선택은, 예를 들어, 최소의 레이트-왜곡 비용을 가지는 것을 선택, 최소의 SAD를 가지는 것을 선택, 최소의 코드 비트를 가지는 것을 선택, 또는 최소의왜곡이 있는 것을 선택하는 것과 같은, 다수의 방법을 포함할 수 있다.
본 구현예에서, 인트라-프레임 예측 모드 및 최적화 기준에 따라 최선의 변환 행렬의 세트가 다수 개의 후보 변환 행렬 중에서 선택되어, 예측 레지듀얼에 대해 변환-코딩을 수행하여 변환 결과를 획득한다. 다시 말해서, 인트라-프레임 예측 모드에 따라, 복수 개의 후보 변환 행렬을 사용함으로써 예측 레지듀얼에 대해 변환-코딩이 수행되고, 최선의 변환 행렬의 세트가 레이트-왜곡 기준에 따라 선택되며, 최선의 변환 행렬의 세트에 대응하는 변환 결과는 선택된 변환 행렬 인덱스 정보와 함께 나중에 사용되어, 인코딩된 스트림을 생성한다.
특정 구현 모드의, 변환 프로세스에서, 행으로부터 열을 분리시키는 모드가 적용될 수 있다. 즉, 인트라-프레임 예측 모드에 따라, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합을 트래버싱하고, 최선의 변환 계수 행렬로서 레지듀얼 변환-코딩 후에 최소의 최적화 기준 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득한다. 다시 말해서, 상세한 내용은 다음과 같다. 인트라-프레임 예측 모드에 따라, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합을 트래버싱하고, 최선의 변환 행렬로서 레지듀얼 변환-코딩 후에 최소의 최적화 기준 비용을 가지는 변환 조합을 선택하고, 최선의 변환 행렬의 세트에 대응하는 변환 결과를 선택된 변환 행렬 인덱스 정보와 함께 나중에 사용하여 인코딩된 스트림을 생성한다.
단계 S803: 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성한다.
또한, 본 구현예는 또한, 변환된 계수를 스캔하기 위하여 인트라-프레임 예측 모드 및 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하는, 계수 스캐닝 프로세스를 포함할 수 있다.
그 후, 변환 후에 최소의 최적화 기준 비용을 가지는 것이 최선의 인트라-프레임 예측 모드로서 선택되고, 그것의 결과는 양자화된 후 엔트로피 인코딩이 된다. 즉, 예측 레지듀얼은 다양한 인코딩 모드로 인코딩되고, 최소의 최적화 기준 비용을 가지는 모드가 인트라-프레임 예측 모드로서 선택되어, 인코딩 결과가 획득된다.
본 구현예에서, 변환 결과 및 선택된 변환 행렬 인덱스 정보에 따라 인코딩된 스트림을 생성하는 단계는 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하는 단계를 포함한다.
최선의 변환 행렬의 세트가 한 쌍의 변환 행렬인 경우, 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하는 단계는, 한 쌍의 변환 행렬의 인덱스 정보를 공동으로 인코딩하거나 한 쌍의 변환 행렬의 인덱스 정보를 별개로 인코딩하는 단계; 및 인덱스 정보의 인코딩 결과를 인코딩된 데이터에 기록하는 단계를 포함한다.
공동 인코딩은 열 변환 행렬 및 행 변환 행렬이 쌍으로 나타나서, 각각의 행 변환 행렬이 열 변환 행렬에 대응하는 것을 지시한다. 반면, 별개 인코딩은 열 변환 행렬이 반드시 행 변환 행렬과 대응할 필요는 없는 것을 지시한다. 예를 들어, 행 변환 행렬은 임의의 열 변환 행렬에 대응할 수 있어, 변환 행렬의 저장 공간을 절약할 수 있다.
본 구현에의 비디오 인코딩 방법에 따라, 최선의 변환 행렬의 세트는 인트라-프레임 예측 모드 및 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 선택되어, 예측 레지듀얼에 대한 변환-코딩을 수행하고, 변환 결과를 획득할 수 있다. 이런 인코딩 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
본 발명의 일 구현예에서 다른 비디오 디코딩 방법이 제공된다. 도 9에 나타난 바와 같이, 상기 방법은 다음 단계를 포함한다.
단계 S901: 인코딩된 비디오 스트림을 해독하여 변환 결과 및 변환 행렬 인덱스 정보를 획득한다.
또한, 본 구현예는 또한, 변환된 계수에 대해 역 계수 스캔을 수행하기 위하여 인트라-프레임 예측 모드 및 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하는, 역 계수 스캐닝 프로세스를 포함할 수 있다.
단계 S902: 변환 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬의 세트를 결정하고, 변환 행렬의 세트를 사용하여 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성한다.
본 구현예에서, 결정된 최선의 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
본 구현예에서, 해독 후에 획득된 결과는 변환 결과를 포함한다. 즉, 본 구현예에서 사용된 변환 결과는 계산 결과이다. 변환 결과는 변환 후에 획득된 변환 계수 행렬을 포함할 수 있다.
구체적으로, 만일 개별적인 변환이 인코딩 변환 프로세스에 적용된다면, 단계 S902에서의 변환 행렬의 세트는 변환 행렬 인덱스 정보의 행 변환 계수 행렬 인덱스 정보 및 열 변환 계수 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 행 변환 행렬 및 열 변환 행렬 중에서 결정될 수 있다.
본 구현예에 제공된 비디오 디코딩 방법에 따라, 인코딩된 비디오 스트림이 해독되어 계산 결과 및 변환 행렬 인덱스 정보를 획득할 수 있고, 변환 행렬의 세트가 변환 행렬 인덱스 정보 및 인트라-프레임 예측 모드에 따라 다수 개의 후보 변환 행렬 중에서 결정되며, 변환 행렬이 사용되어 계산 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터가 재구성된다. 이러한 방법으로, 복잡도를 증가시키지 않고 디코딩이 수행된다. 인코딩은 앞선 구현예에 제공된 방법에 기초하고 있으므로, 최선의 변환 행렬이 레지듀얼 특징에 대하여 선택될 수 있고, 따라서 엔트로피 인코딩 효율이 향상된다. 또한, 본 구현예에 제공된 디코딩 방법을 통하여, 비디오를 인코딩하고 디코딩하는 효율이 전체적으로 향상될 수 있다.
도 10에 나타난 바와 같이, 본 발명의 일 구현예게서 비디오 데이터를 인코딩하기 위한 방법은 다음 단계들을 포함한다.
단계 S1001: 입력 비디오 데이터에 따라 예측 레지듀얼을 생성한다.
단계 S1002: 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득한다.
본 구현예에서, 선택된 최선의 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
최적화 기준은 레이트-왜곡 기준, 절대 오차의 합(SAD), 코드 비트 또는 왜곡일 수 있다. 최적화 기준에 따른 선택은, 예를 들어, 최소의 레이트-왜곡 비용을 가지는 것을 선택, 최소의 SAD를 가지는 것을 선택, 최소의 코드 비트를 가지는 것을 선택, 또는 최소의왜곡이 있는 것을 선택하는 것과 같은, 다수의 방법을 포함할 수 있다.
본 구현예에서, 최적화 기준에 따라 최선의 변환 행렬의 세트가 다수 개의 후보 변환 행렬 중에서 선택되어, 예측 레지듀얼에 대해 변환-코딩을 수행하여 변환 결과를 획득한다. 다시 말해서, 인트라-프레임 예측 모드에 따라, 복수 개의 후보 변환 행렬을 사용함으로써 예측 레지듀얼에 대해 변환-코딩이 수행되고, 최선의 변환 행렬의 세트가 레이트-왜곡 기준에 따라 선택되며, 최선의 변환 행렬의 세트에 대응하는 변환 결과는 선택된 변환 행렬 인덱스 정보와 함께 나중에 사용되어, 인코딩된 스트림을 생성한다.
특정 구현 모드의, 변환 프로세스에서, 행으로부터 열을 분리시키는 모드가 적용될 수 있다. 즉, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합을 트래버싱하고, 최선의 변환 계수 행렬로서 레지듀얼 변환-코딩 후에 최소의 최적화 기준 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득한다. 다시 말해서, 상세한 내용은 다음과 같다. 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 가능한 조합을 트래버싱하고, 최선의 변환 행렬로서 레지듀얼 변환-코딩 후에 최소의 최적화 기준 비용을 가지는 변환 조합을 선택하고, 최선의 변환 행렬의 세트에 대응하는 변환 결과를 선택된 변환 행렬 인덱스 정보와 함께 나중에 사용하여 인코딩된 스트림을 생성한다.
단계 S1003: 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성한다.
또한, 본 구현예는 또한, 변환된 계수를 스캔하기 위하여 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하는, 계수 스캐닝 프로세스를 포함할 수 있다.
그 후, 변환 후에 최소의 최적화 기준 비용을 가지는 것이 최선의 인트라-프레임 예측 모드로서 선택되고, 그것의 결과는 양자화된 후 엔트로피 인코딩이 된다. 즉, 예측 레지듀얼은 다양한 인코딩 모드로 인코딩되고, 최소의 최적화 기준 비용을 가지는 모드가 인트라-프레임 예측 모드로서 선택되어, 인코딩 결과가 획득된다.
본 구현예에서, 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성하는 단계는, 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하기 위하여, 선택된 인트라-프레임 예측 모드에 따라, 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하는 단계를 포함한다. 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하기 위하여, 상이한 인트라-프레임 예측 모드에 대해, 변환 행렬 인덱스 정보를 인코딩하기 위한 다른 방법이 선택될 수 있다. 최선의 변환 행렬의 세트가 한 쌍의 변환 행렬인 경우, 변환 행렬 인덱스 정보를 인코딩된 데이터에 기록하는 단계는, 한 쌍의 변환 행렬의 인덱스 정보를 공동으로 인코딩하거나 한 쌍의 변환 행렬의 인덱스 정보를 별개로 인코딩하는 단계; 및 인덱스 정보의 인코딩 결과를 인코딩된 데이터에 기록하는 단계를 포함한다.
공동 인코딩은 열 변환 행렬 및 행 변환 행렬이 쌍으로 나타나서, 각각의 행 변환 행렬이 열 변환 행렬에 대응하는 것을 지시한다. 반면, 별개 인코딩은 열 변환 행렬이 반드시 행 변환 행렬과 대응할 필요는 없는 것을 지시한다. 예를 들어, 행 변환 행렬은 임의의 열 변환 행렬에 대응할 수 있어, 변환 행렬의 저장 공간을 절약할 수 있다.
본 구현에에 제공된 비디오 인코딩 방법에 따라, 최선의 변환 행렬의 세트가 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 선택되어 예측 레지듀얼에 대한 변환-코딩을 수행하고, 변환 결과를 획득할 수 있다. 인코딩을 위한 이런 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
도 11에 나타난 바와 같이, 본 발명의 일 구현예에서 제공되는 비디오 디코딩 방법은 다음 단계들을 포함한다.
단계 S1101: 인코딩된 비디오 스트림을 해독하여 변환 결과를 획득하고, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득한다.
본 구현예에서, 해독 후에 획득된 결과는 변환 결과를 포함한다. 즉, 본 구현예에서 사용된 변환 결과는 계산 결과이다. 변환 결과는 변환 후에 획득된 변환 계수 행렬을 포함할 수 있다. 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하는 단계는, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 디코딩하기 위한 방법을 선택하고, 디코딩을 통하여 변환 행렬 인덱스 정보를 획득하는 단계를 포함한다. 상이한 인트라-프레임 예측 모드에 대하여, 비디오 스트림을 해독하여 변환 행렬 인덱스 정보를 획득하기 위하여 상이한 해독 방법이 적용될 수 있다.
또한, 본 구현예는 또한, 변환된 계수에 대해 역 계수 스캔을 수행하기 위하여 인트라-프레임 예측 모드 및 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하는, 역 계수 스캐닝 프로세스를 포함할 수 있다.
단계 S1102: 변환 행렬 인덱스 정보에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하고, 결정된 변환 행렬을 사용하여 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성한다.
본 구현예에서, 결정된 변환 행렬은 변환 행렬의 집합일 수 있으며, 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
구체적으로, 만일 개별적인 변환이 인코딩 변환 프로세스에 적용된다면, 단계 S1102에선의 변환 행렬은 변환 행렬 인덱스 정보의 행 변환 계수 행렬 인덱스 정보 및 열 변환 계수 행렬 인덱스 정보에 따라 후보 행 변환 행렬 및 열 변환 행렬의 세트 중에서 결정될 수 있다. 여기에서의 후보 행 변환 행렬 및 열 변환 행렬의 세트는 다수 개의 행 변환 행렬 및 열 변환 행렬을 포함한다.
본 구현예에 제공된 비디오 디코딩 방법에 따라, 인코딩된 비디오 스트림이 해독되어 변환 결과를 획득하고, 인트라-프레임 예측 모드에 따른 해독에 의하여 변환 행렬 인덱스 정보가 획득될 수 있고; 변환 행렬이 변환 행렬 인덱스 정보에 따라 다수 개의 후보 변환 행렬 중에서 결정되고, 결정된 변환 행렬이 사용되어 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성한다. 이러한 방법으로, 복잡도를 증가시키지 않고 디코딩이 수행된다. 인코딩은 앞선 구현예에 제공된 방법에 기초하고 있으므로, 최선의 변환 행렬이 레지듀얼 특징에 대하여 선택될 수 있고, 따라서 엔트로피 인코딩 효율이 향상된다. 또한, 본 구현예에 제공된 디코딩 방법을 통하여, 비디오를 인코딩하고 디코딩하는 효율이 전체적으로 향상될 수 있다.
도 12에 나타난 바와 같이, 본 발명의 일 구현예에 제공된 비디오 데이터 인코더는, 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하도록 구성된 레지듀얼 생성 유닛(1201); 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하도록 구성된 변환 유닛(1202); 및 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성하도록 구성된 스트림 생성 유닛(1203)을 포함한다.
본 구현예에서, 선택된 최선의 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다. 최적화 기준은 레이트-왜곡 기준, 절대 오차의 합(SAD), 코드 비트 또는 왜곡을 포함한다.
본 구현예에서, 변환 유닛(1202)은, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 조합을 트래버싱하고, 최선의 변환 행렬로서 레지듀얼 변환-코딩 후에 최소의 최적화 기준 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득하도록 구성된다.
본 구현예에서, 스트림 생성 유닛(1203)이 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성하는 단계는, 선택된 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하고 상기 변환 행렬 인덱스 정보를 상기 인코딩된 데이터에 기록하는 단계를 포함한다.
또한, 도 13에 나타난 바와 같이, 비디오 데이터 인코더는, 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하고 변환된 계수를 스캔하도록 구성된 구성된 계수 스캐닝 유닛(1301); 다양한 인코딩 모드에서 예측 레지듀얼이 인코딩된 후에 인트라-프레임 예측 모드로서 최소의 최적화 기준 비용을 가지는 모드를 선택하여, 결과를 획득하도록 구성된 판단 유닛(1302); 및 선택된 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하고 상기 변환 행렬 인덱스 정보를 상기 인코딩된 데이터에 기록하도록 구성된 인덱스 인코딩 유닛(1303)을 더 포함한다.
만일 최선의 변환 행렬의 세트가 한 쌍의 변환 행렬인 경우, 선택된 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하고 상기 변환 행렬 인덱스 정보를 상기 인코딩된 데이터에 기록하는 단계는, 한 쌍의 변환 행렬의 인덱스 정보를 공동으로 인코딩하거나 한 쌍의 변환 행렬의 인덱스 정보를 별개로 인코딩하는 단계; 및 선택된 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하고 상기 변환 행렬 인덱스 정보를 상기 인코딩된 데이터에 기록하는 단계를 포함한다.
공동 인코딩은 열 변환 행렬 및 행 변환 행렬이 쌍으로 나타나서, 각각의 행 변환 행렬이 열 변환 행렬에 대응하는 것을 지시한다. 반면, 별개 인코딩은 열 변환 행렬이 반드시 행 변환 행렬과 대응할 필요는 없는 것을 지시한다. 예를 들어, 행 변환 행렬은 임의의 열 변환 행렬에 대응할 수 있어, 변환 행렬의 저장 공간을 절약할 수 있다.
본 발명의 비디오 인코딩 방법은 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하여 예측 레지듀얼에 대한 변환-코딩을 수행하고, 변환 결과를 획득할 수 있다. 인코딩을 위한 이런 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
본 발명의 비디오 인코딩 방법은 인트라-프레임 예측 모드 및 레이트-왜곡 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하여 예측 레지듀얼에 대한 변환-코딩을 수행하고, 변환 결과를 획득할 수 있다. 인코딩을 위한 이런 모드를 통하여, 각각의 레지듀얼 블록의 특징에 대응하는 가장 효율적인 변환 행렬이 변환을 위하여 선택되며, 따라서 이는 인코딩 효율을 향상시킨다.
도 14에 나타난 바와 같이, 본 발명의 일 구현예에 제공된 비디오 디코더는, 인코딩된 비디오 스트림을 해독하여 변환 결과를 획득하고, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하도록 구성된 해독 유닛(1401); 및 변환 행렬 인덱스 정보에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하도록 구성된 결정 유닛(1402); 및 결정된 변환 행렬을 사용하여 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성하도록 구성된 재구성 유닛(1403)을 포함한다.
본 구현예에서, 선택된 최선의 변환 행렬의 세트는 비분리 변환 행렬일 수 있고, 또는 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬일 수 있다.
본 구현예에서, 해독 후에 획득된 결과는 변환 결과를 포함한다. 즉, 본 구현예에서 사용된 변환 결과는 계산 결과이다. 변환 결과는 변환 후에 획득된 변환 계수 행렬을 포함할 수 있다.
해독 유닛(1401)이 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하는 단계는, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 디코딩하기 위한 방법을 선택하고, 디코딩을 통하여 변환 행렬 인덱스 정보를 획득하는 단계를 포함한다.
또한, 도 15에 나타난 바와 같이, 비디오 디코더는, 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하고 변환된 계수에 대해 역 계수 스캔을 수행하도록 구성된 역 계수 스캐닝 유닛(1501)을 포함한다.
본 구현예에 제공된 비디오 디코더는, 인코딩된 비디오 스트림을 해독하여 변환 결과를 획득하고, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하고; 변환 행렬 인덱스 정보에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하며; 결정된 변환 행렬을 사용하여 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 레지듀얼 데이터에 따라 비디오 데이터를 재구성할 수 있다. 이러한 방법으로, 복잡도를 증가시키지 않고 디코딩이 수행된다. 인코딩은 앞선 구현예에 제공된 방법에 기초하고 있으므로, 최선의 변환 행렬이 레지듀얼 특징에 대하여 선택될 수 있고, 따라서 엔트로피 인코딩 효율이 향상된다. 또한, 본 구현예에 제공된 디코딩 방법을 통하여, 비디오를 인코딩하고 디코딩하는 효율이 전체적으로 향상될 수 있다.
해당 기술 분야의 통상의 기술자는 본 발명의 구현예에 따른 방법의 단계 중 일부 또는 전부가 관련된 하드웨어를 명령하는 프로그램에 의하여 구현될 수 있음을 이해할 것이다. 상기 프로그램은 컴퓨터가 판독 가능한 저장 매체에 저장될 수 있다. 프로그램이 실행될 때, 상기 프로그램은 본 발명의 앞선 구현예에 명세된 방법의 단계들을 실행한다. 저장 매체는 ROM, RAM, 자기 디스크 또는 광학 디스크와 같은, 프로그램 코드를 저장할 수 있는 임의의 매체일 수 있다.
위의 설명은 단지 본 발명의 바람직한 구현예에 불과하며, 본 발명의 보호 범위를 제한하기 위한 것이 아니다. 본 발명의 사상을 벗어나지 않으면서 통상의 기술자에 의하여 용이하게 도출될 수 있는 임의의 수정, 변형 또는 대체는 본 발명의 보호 범위 안에 있다. 따라서, 본 발명의 보호 범위는 첨부된 청구범위에 의해 정해진다.
401: 레지듀얼 생성 유닛 402: 변환 유닛
403: 스트림 생성 유닛
501: 계수 스캐닝 유닛 502: 판단 유닛
503: 인덱스 인코딩 유닛
601: 해독 유닛 602: 결정 유닛
603: 재구성 유닛
701: 역 계수 스캐닝 유닛
1201: 레지듀얼 생성 유닛 1202: 변환 유닛
1203: 스트림 생성 유닛
1301: 계수 스캐닝 유닛 1302: 판단 유닛
1303: 인덱스 인코딩 유닛
1401: 해독 유닛 1402: 결정 유닛
1403: 재구성 유닛
1501: 역 계수 스캐닝 유닛

Claims (54)

  1. 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하는 단계;
    최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 상기 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하는 단계; 및
    상기 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성하는 단계
    를 포함하고,
    상기 최적화 기준은 레이트-왜곡 기준, 절대 오차의 합(SAD), 코드 비트 또는 왜곡을 포함하며,
    상기 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하는 것은, 최소 레이트-왜곡 비용을 가지는 것을 선택하는 것, 최소 SAD를 가지는 것을 선택하는 것, 최소 코드 비트를 가지는 것을 선택하는 것, 또는 최소 왜곡을 가지는 것을 선택하는 것을 포함하고,
    최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 상기 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하는 단계는, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 조합을 트래버싱하고, 최선의 변환 행렬로서 레지듀얼 변환-코딩 후에 최소의 최적화 기준 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득하는 단계를 포함하는,
    비디오 데이터를 인코딩하기 위한 방법.
  2. 제1항에 있어서,
    상기 최선의 변환 행렬의 세트는, 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬인,
    비디오 데이터를 인코딩하기 위한 방법.
  3. 제1항에 있어서,
    상기 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하고 변환된 계수를 스캔하는 단계
    를 더 포함하는
    비디오 데이터를 인코딩하기 위한 방법.
  4. 제1항에 있어서,
    다양한 인코딩 모드에서 상기 예측 레지듀얼을 인코딩하고, 상기 인트라-프레임 예측 모드로서 최소의 최적화 기준 비용을 가지는 모드를 선택하여, 인코딩 결과를 획득하는 단계
    를 더 포함하는
    비디오 데이터를 인코딩하기 위한 방법.
  5. 제1항에 있어서,
    상기 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성하는 단계는
    선택된 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하고 상기 변환 행렬 인덱스 정보를 상기 인코딩된 스트림에 기록하는 단계
    를 포함하는,
    비디오 데이터를 인코딩하기 위한 방법.
  6. 제5항에 있어서,
    상기 최선의 변환 행렬의 세트가 한 쌍의 변환 행렬인 경우, 상기 선택된 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하고 상기 변환 행렬 인덱스 정보를 상기 인코딩된 스트림에 기록하는 단계는,
    한 쌍의 변환 행렬의 인덱스 정보를 공동으로 인코딩하거나 한 쌍의 변환 행렬의 인덱스 정보를 별개로 인코딩하는 단계; 및
    선택된 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하고 상기 변환 행렬 인덱스 정보를 상기 인코딩된 스트림에 기록하는 단계
    를 포함하는,
    비디오 데이터를 인코딩하기 위한 방법.
  7. 인코딩된 비디오 스트림을 해독하여 변환 결과를 획득하고, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하는 단계; 및
    상기 변환 행렬 인덱스 정보에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하고, 상기 결정된 변환 행렬을 사용하여 상기 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 상기 레지듀얼 데이터에 따라 비디오 데이터를 재구성하는 단계
    를 포함하고,
    상기 변환 행렬은, 상기 변환 행렬 인덱스 정보의 행 변환 계수 행렬 인덱스 정보 및 열 변환 계수 행렬 인덱스 정보에 따라, 후보 행 변환 행렬 및 열 변환 행렬의 세트 중에서 결정되는,
    비디오 디코딩 방법.
  8. 제7항에 있어서,
    상기 결정된 변환 행렬은, 열 변환 행렬 및 행 변환 행렬을 포함하는 한 쌍의 변환 행렬인,
    비디오 디코딩 방법.
  9. 제7항에 있어서,
    상기 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하는 단계는,
    상기 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 디코딩하기 위한 방법을 선택하여 상기 변환 행렬 인덱스 정보를 획득하는 단계
    를 포함하는,
    비디오 디코딩 방법.
  10. 제7항에 있어서,
    상기 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하고 변환된 계수에 대해 역 계수 스캔을 수행하는 단계
    를 더 포함하는
    비디오 디코딩 방법.
  11. 입력 비디오 데이터에 따라 예측 레지듀얼을 생성하도록 구성된 레지듀얼 생성 유닛;
    최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하고 상기 예측 레지듀얼에 대한 변환-코딩을 수행하여 변환 결과를 획득하도록 구성된 변환 유닛; 및
    상기 변환 결과 및 인트라-프레임 예측 모드에 따라 선택된 변환 행렬 인덱스 정보를 인코딩하여 인코딩된 스트림을 생성하도록 구성된 스트림 생성 유닛
    을 포함하고,
    상기 변환 유닛은 구체적으로, 다수 개의 후보 변환 행렬에서 열 변환 행렬 및 행 변환 행렬의 모든 조합을 트래버싱하고, 최선의 변환 행렬로서 레지듀얼 변환-코딩 후에 최소의 최적화 기준 비용을 가지는 변환 조합을 선택하여, 변환 결과를 획득하도록 구성되고,
    상기 최적화 기준은 레이트-왜곡 기준, 절대 오차의 합(SAD), 코드 비트 또는 왜곡을 포함하며,
    상기 최적화 기준에 따라 다수 개의 후보 변환 행렬 중에서 최선의 변환 행렬의 세트를 선택하는 것은, 최소 레이트-왜곡 비용을 가지는 것을 선택하는 것, 최소 SAD를 가지는 것을 선택하는 것, 최소 코드 비트를 가지는 것을 선택하는 것, 또는 최소 왜곡을 가지는 것을 선택하는 것을 포함하는,
    비디오 데이터 인코더.
  12. 제11항에 있어서,
    상기 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하고 변환된 계수를 스캔하도록 구성된 계수 스캐닝 유닛
    을 더 포함하는
    비디오 데이터 인코더.
  13. 제11항에 있어서,
    다양한 인코딩 모드에서 상기 예측 레지듀얼이 인코딩된 후에 인트라-프레임 예측 모드로서 최소의 최적화 기준 비용을 가지는 모드를 선택하여, 결과를 획득하도록 구성된 판단 유닛
    을 더 포함하는
    비디오 데이터 인코더.
  14. 제11항에 있어서,
    선택된 인트라-프레임 예측 모드에 따라 상기 변환 행렬 인덱스 정보를 인코딩하기 위한 방법을 선택하고 상기 변환 행렬 인덱스 정보를 상기 인코딩된 스트림에 기록하도록 구성된 인덱스 인코딩 유닛
    을 더 포함하는
    비디오 데이터 인코더.
  15. 인코딩된 비디오 스트림을 해독하여 변환 결과를 획득하고, 인트라-프레임 예측 모드에 따라 변환 행렬 인덱스 정보를 획득하도록 구성된 해독 유닛; 및
    상기 변환 행렬 인덱스 정보에 따라 다수 개의 후보 변환 행렬 중에서 변환 행렬을 결정하도록 구성된 결정 유닛; 및
    상기 결정된 변환 행렬을 사용하여 상기 변환 결과에 대하여 역변환을 수행하여 레지듀얼 데이터를 획득하고, 상기 레지듀얼 데이터에 따라 비디오 데이터를 재구성하도록 구성된 재구성 유닛
    을 포함하고,
    상기 결정 유닛은 구체적으로, 상기 변환 행렬 인덱스 정보의 행 변환 행렬 인덱스 정보 및 열 변환 행렬 인덱스 정보에 따라, 후보 행 변환 행렬 및 열 변환 행렬의 세트 중에서 변환 행렬을 결정하도록 구성된,
    비디오 디코더.
  16. 제15항에 있어서,
    상기 변환 행렬 인덱스 정보에 따라 한 세트의 계수의 스캔 순서를 선택하고 변환된 계수에 대해 역 계수 스캔을 수행하도록 구성된 역 계수 스캐닝 유닛
    을 더 포함하는
    비디오 디코더.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
KR1020127011936A 2009-10-23 2010-08-30 비디오를 인코딩하고 디코딩하기 위한 방법 및 장치 KR101481642B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
CN200910209013.9 2009-10-23
CN200910209013 2009-10-23
CN201010147581 2010-04-09
CN201010147581.3 2010-04-09
CN2010102137918A CN102045560B (zh) 2009-10-23 2010-06-17 一种视频编解码方法及设备
CN201010213791.8 2010-06-17
PCT/CN2010/076464 WO2011047579A1 (zh) 2009-10-23 2010-08-30 一种视频编解码方法及设备

Publications (2)

Publication Number Publication Date
KR20120060914A KR20120060914A (ko) 2012-06-12
KR101481642B1 true KR101481642B1 (ko) 2015-01-22

Family

ID=43899810

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127011936A KR101481642B1 (ko) 2009-10-23 2010-08-30 비디오를 인코딩하고 디코딩하기 위한 방법 및 장치

Country Status (7)

Country Link
US (1) US9723313B2 (ko)
EP (1) EP2493197A4 (ko)
KR (1) KR101481642B1 (ko)
CN (1) CN102045560B (ko)
AU (1) AU2010310286B2 (ko)
BR (1) BR112012011325B1 (ko)
WO (1) WO2011047579A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016167538A1 (ko) * 2015-04-12 2016-10-20 엘지전자(주) 비디오 신호의 인코딩, 디코딩 방법 및 그 장치

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045560B (zh) 2009-10-23 2013-08-07 华为技术有限公司 一种视频编解码方法及设备
US8792740B2 (en) * 2010-02-02 2014-07-29 Humax Holdings Co., Ltd. Image encoding/decoding method for rate-distortion optimization and apparatus for performing same
CN102281435B (zh) * 2010-06-11 2013-10-02 华为技术有限公司 编码方法、解码方法、编码装置、解码装置及编解码系统
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US9049444B2 (en) * 2010-12-22 2015-06-02 Qualcomm Incorporated Mode dependent scanning of coefficients of a block of video data
ES2657197T3 (es) 2011-06-28 2018-03-01 Samsung Electronics Co., Ltd. Aparato de decodificación de video con intra predicción
CN102857755B (zh) * 2011-07-01 2016-12-14 华为技术有限公司 确定变换块尺寸的方法和设备
KR101641863B1 (ko) 2011-10-19 2016-07-22 주식회사 케이티 영상 부호화/복호화 방법 및 그 장치
KR20130049522A (ko) * 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 방법
CN103096053B (zh) 2011-11-04 2015-10-07 华为技术有限公司 一种变换模式的编解码方法和装置
WO2013109066A1 (ko) * 2012-01-20 2013-07-25 주식회사 팬택 화면 내 예측 모드 매핑 방법 및 이러한 방법을 사용하는 장치
CN103533324B (zh) * 2012-07-03 2017-04-05 乐金电子(中国)研究开发中心有限公司 一种深度图像帧内编码方法、装置及编码器
KR101431463B1 (ko) * 2012-07-11 2014-08-22 세종대학교산학협력단 무손실 비디오 부호화/복호화 방법 및 장치
US10230956B2 (en) 2012-09-26 2019-03-12 Integrated Device Technology, Inc. Apparatuses and methods for optimizing rate-distortion of syntax elements
CN108200439B (zh) * 2013-06-14 2020-08-21 浙江大学 提高数字信号变换性能的方法及数字信号变换方法和装置
CN104853196B (zh) * 2014-02-18 2018-10-19 华为技术有限公司 编解码方法和装置
US20170280140A1 (en) * 2014-09-19 2017-09-28 Lg Electronics Inc. Method and apparatus for adaptively encoding, decoding a video signal based on separable transform
FR3035761A1 (fr) * 2015-04-30 2016-11-04 Orange Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants
FR3038196A1 (fr) * 2015-06-29 2016-12-30 B<>Com Procede de codage d'une image numerique, procede de decodage, dispositifs et programmes d'ordinateurs associes
EP3334163A4 (en) * 2015-08-06 2019-04-17 LG Electronics Inc. DEVICE AND METHOD FOR PERFORMING TRANSFORMATION USING SINGLETON COEFFICIENT UPDATE
CN108353193B (zh) * 2015-08-19 2022-07-15 Lg 电子株式会社 基于多个基于图的模型处理视频数据的方法和设备
EP4106333A1 (en) * 2016-02-12 2022-12-21 Samsung Electronics Co., Ltd. Image encoding method and apparatus, and image decoding method and apparatus
US10390048B2 (en) * 2016-02-15 2019-08-20 Qualcomm Incorporated Efficient transform coding using optimized compact multi-pass transforms
CN105791867B (zh) * 2016-03-23 2019-02-22 北京大学 基于边界自适应变换的优化视频数据编码方法
EP3485637A1 (en) * 2016-07-14 2019-05-22 Fraunhofer Gesellschaft zur Förderung der Angewand Predictive picture coding using transform-based residual coding
CN107920247A (zh) * 2016-10-07 2018-04-17 财团法人工业技术研究院 选择画面内预测模式的方法、视频编码装置及处理设备
EP3586511B1 (en) * 2017-03-16 2022-01-05 MediaTek Inc. Method and apparatus of enhanced multiple transforms and non-separable secondary transform for video coding
US10574959B2 (en) * 2017-07-05 2020-02-25 Qualcomm Incorporated Color remapping for non-4:4:4 format video content
CN109922348B (zh) * 2017-12-13 2020-09-18 华为技术有限公司 图像编解码方法和装置
WO2019194420A1 (ko) * 2018-04-01 2019-10-10 엘지전자 주식회사 변환 인디케이터에 기반한 영상 코딩 방법 및 그 장치
KR102636267B1 (ko) 2018-08-16 2024-02-14 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 변형 행렬 선택의 계수에 따른 코딩
CN114928745B (zh) * 2018-09-02 2024-04-19 Lg电子株式会社 信号编解码方法、计算机可读存储介质和数据传输方法
CN111758261B (zh) * 2018-09-02 2022-06-10 Lg电子株式会社 用于处理图像信号的方法和设备
CN110944177B (zh) * 2018-09-21 2024-03-01 华为技术有限公司 视频解码方法及视频解码器,视频编码方法及视频编码器
CN111225206B (zh) * 2018-11-23 2021-10-26 华为技术有限公司 视频解码方法和视频解码器
CN111277840B (zh) * 2018-12-04 2022-02-08 华为技术有限公司 变换方法、反变换方法以及视频编码器和视频解码器
FI3879835T3 (fi) 2018-12-19 2023-09-01 Lg Electronics Inc Sekundääriseen muunnokseen perustuva videonkoodausmenetelmä sekä sitä varten tarkoitettu laite
KR20210098967A (ko) 2019-01-01 2021-08-11 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
CN109819250B (zh) * 2019-01-15 2020-09-25 北京大学 一种多核全组合方式的变换方法和系统
CN109788286B (zh) * 2019-02-01 2021-06-18 北京大学深圳研究生院 一种编码、解码变换方法、系统、设备及计算机可读介质
KR20220084194A (ko) 2019-03-26 2022-06-21 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
EP3939269A4 (en) * 2019-04-10 2022-06-15 Beijing Dajia Internet Information Technology Co., Ltd. METHOD AND APPARATUS FOR VIDEO CODING USING AN IMPROVED MATRIX-BASED INTRA PREDICTION CODING MODE
SG11202110936PA (en) 2019-04-12 2021-11-29 Beijing Bytedance Network Technology Co Ltd Chroma coding mode determination based on matrix-based intra prediction
JP7403555B2 (ja) 2019-04-16 2023-12-22 北京字節跳動網絡技術有限公司 イントラコーディングモードにおけるマトリクスの導出
CN113812150B (zh) 2019-05-01 2023-11-28 北京字节跳动网络技术有限公司 使用滤波的基于矩阵的帧内预测
CN117097912A (zh) 2019-05-01 2023-11-21 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
BR112021022868A2 (pt) 2019-05-22 2022-01-04 Beijing Bytedance Network Tech Co Ltd Método de processamento de vídeos, aparelho para processar dados de vídeo e meios de armazenamento e gravação não transitórios legíveis por computador
CN113924775B (zh) 2019-05-31 2023-11-14 北京字节跳动网络技术有限公司 基于矩阵的帧内预测中的限制的上采样
WO2020244610A1 (en) 2019-06-05 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Context determination for matrix-based intra prediction
EP4032274A4 (en) * 2019-09-19 2023-11-01 Telefonaktiebolaget Lm Ericsson (Publ) METHOD ALLOWING AN INTRA PREDICTION BLOCK BASED ON A MATRIX TO COMPRISE MULTIPLE TRANSFORMATION BLOCKS
EP4042689A4 (en) 2019-10-28 2023-06-07 Beijing Bytedance Network Technology Co., Ltd. SIGNALING AND SYNTAX ANALYSIS BASED ON A COLOR COMPONENT
CN112565751B (zh) * 2020-09-27 2021-09-10 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备
US20230078100A1 (en) * 2021-08-30 2023-03-16 Tencent America LLC Scan order of secondary transform coefficients
CN117831545A (zh) * 2022-09-29 2024-04-05 抖音视界有限公司 编码、解码方法、编码器、解码器、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008132890A1 (ja) 2007-04-16 2008-11-06 Kabushiki Kaisha Toshiba 画像符号化と画像復号化の方法及び装置
WO2008157360A2 (en) 2007-06-15 2008-12-24 Qualcomm Incorporated Adaptive transformation of residual blocks depending on the intra prediction mode
CN100564602C (zh) * 2006-07-05 2009-12-02 中国石油化工股份有限公司 一种氯铑酸的制备方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3887178B2 (ja) 2001-04-09 2007-02-28 株式会社エヌ・ティ・ティ・ドコモ 信号符号化方法及び装置並びに復号方法及び装置
JP4447197B2 (ja) 2002-01-07 2010-04-07 三菱電機株式会社 動画像符号化装置および動画像復号装置
US20050213835A1 (en) * 2004-03-18 2005-09-29 Huazhong University Of Science & Technology And Samsung Electronics Co., Ltd. Integer transform matrix selection method in video coding and related integer transform method
CN100433837C (zh) * 2004-03-18 2008-11-12 华中科技大学 视频编码的整数变换方法
WO2006028088A1 (ja) * 2004-09-08 2006-03-16 Matsushita Electric Industrial Co., Ltd. 動画像符号化方法および動画像復号化方法
US7953155B2 (en) * 2004-12-16 2011-05-31 Tut Systems, Inc. Methods of selecting an encoding mode
US8488672B2 (en) 2007-04-17 2013-07-16 Qualcomm Incorporated Mode uniformity signaling for intra-coding
CN101489134B (zh) * 2009-01-16 2010-06-16 华中科技大学 用于视频帧内编码的klt矩阵训练方法
CN102045560B (zh) 2009-10-23 2013-08-07 华为技术有限公司 一种视频编解码方法及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100564602C (zh) * 2006-07-05 2009-12-02 中国石油化工股份有限公司 一种氯铑酸的制备方法
WO2008132890A1 (ja) 2007-04-16 2008-11-06 Kabushiki Kaisha Toshiba 画像符号化と画像復号化の方法及び装置
WO2008157360A2 (en) 2007-06-15 2008-12-24 Qualcomm Incorporated Adaptive transformation of residual blocks depending on the intra prediction mode

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
B. Zeng, et al. Directional Discrete Cosine Transforms for Image Coding. Proc. of 2006 IEEE Int'l Conf. on Multimedia and Expo, Jul. 9-12, 2006, pp.721-724 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016167538A1 (ko) * 2015-04-12 2016-10-20 엘지전자(주) 비디오 신호의 인코딩, 디코딩 방법 및 그 장치

Also Published As

Publication number Publication date
EP2493197A1 (en) 2012-08-29
US20120201303A1 (en) 2012-08-09
KR20120060914A (ko) 2012-06-12
BR112012011325A2 (pt) 2016-04-19
AU2010310286B2 (en) 2014-05-01
AU2010310286A1 (en) 2012-06-14
CN102045560B (zh) 2013-08-07
US9723313B2 (en) 2017-08-01
WO2011047579A1 (zh) 2011-04-28
EP2493197A4 (en) 2014-07-16
CN102045560A (zh) 2011-05-04
BR112012011325B1 (pt) 2019-04-30

Similar Documents

Publication Publication Date Title
KR101481642B1 (ko) 비디오를 인코딩하고 디코딩하기 위한 방법 및 장치
KR101697153B1 (ko) 수퍼 매크로 블록 기반의 인트라 부호화 방법 및 장치
JP5832683B2 (ja) ビデオ復号化方法及びビデオ復号化装置
KR101675118B1 (ko) 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
JP5824148B2 (ja) 単一化された参照可能性確認過程を介してイントラ予測を伴うビデオ符号化方法及びその装置、ビデオ復号化方法及びその装置
JP2018014726A (ja) 大型マクロ・ブロックを用いたビデオ・コーディング
EP2252060A2 (en) Image encoding device and image decoding device
KR20110116025A (ko) 저복잡도 주파수 변환을 이용한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR20110083367A (ko) 계층적 데이터 단위의 패턴 정보를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR20110063858A (ko) 큰 매크로블록들을 이용한 비디오 코딩
KR20090103674A (ko) 영상의 인트라 예측 부호화/복호화 방법 및 그 장치
KR20110010324A (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR20110017720A (ko) 적응적인 루프 필터링을 이용한 비디오의 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR20090103675A (ko) 영상의 인트라 예측 모드 부호화/복호화 방법 및 장치
CN112135147B (zh) 编码方法、解码方法及装置
Sun et al. Rate-distortion optimized mode selection method for multiple description video coding
EP2008464A1 (en) Method and apparatus for decoding/encoding of a scalable video signal
KR101052390B1 (ko) H.264 표준의 영상 프레임에서 섬네일 이미지를 생성하는 방법
KR20070100083A (ko) 영상 데이터를 코딩/디코딩하기 위한 기준값들을 제공하는방법 및 장치
KR20120043639A (ko) 부호화/복호화 장치 및 그 방법과 이를 구현하기 위한 프로그램이 기록된 기록매체

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171219

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181219

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191217

Year of fee payment: 6