KR20130136525A - 복잡도가 감소된 변환 단위 파티션의 방법 및 장치 - Google Patents
복잡도가 감소된 변환 단위 파티션의 방법 및 장치 Download PDFInfo
- Publication number
- KR20130136525A KR20130136525A KR1020137026588A KR20137026588A KR20130136525A KR 20130136525 A KR20130136525 A KR 20130136525A KR 1020137026588 A KR1020137026588 A KR 1020137026588A KR 20137026588 A KR20137026588 A KR 20137026588A KR 20130136525 A KR20130136525 A KR 20130136525A
- Authority
- KR
- South Korea
- Prior art keywords
- 2nx2n
- size
- coding unit
- height
- width
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
HEVC에는 3가지의 블록 개념: 코딩 단위(codiing unit: CU), 예측 단위(prediction unit: PU), 및 변환 단위(Transform unit: TU)이 도입된다. 전체적인 코딩 단위는 회귀 방식(recursive fashion)으로 다양한 크기의 CU, PU, 및 TU를 특징으로 한다. 현재의 HEVC에서의 변환 프로세싱에 있어서, 계층 잔차 쿼드트리(Residual Quad Tree: RQT)가 사용되고, TU 크기는 CU 크기와 관련되어 있지만, PU 크기와는 무관하다. 이로 인해 인코딩 복잡도가 높아지고 또한 잔차 쿼드트리 구문을 처리하는 데 걸리는 프로세싱 시간이 늘어난다. 따라서, 감소된 복잡도를 가지는 수정된 변환 단위 파티션에 대해 설명한다. 실시예에 따르면, TU 크기는, 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외한, PU 폭 및 높이로 제한될 수 있다. 다른 실시예에 따르면, 최대 TU 크기는, 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외하여, PU 폭 및 높이의 최댓값과 동일하고, 최소 TU 크기는 PU 폭 및 높이의 최솟값과 동일하다. 또 다른 실시예에 따르면, TU 크기는 2Nx2N, 2NxN, Nx2N, 및 NxN 파티션 타입에 대해 2Nx2N 및 NxN 중에서 선택된다. 구문 요소, split_transform_flag를 사용하여, 필요 시에 TU 크기를 2Nx2N 또는 NxN 중에서 선택하는 것을 나타낸다. 또한, 2Nx2N CU 병합 모드에 대한 최선의 병합 모드를 감소된 복잡도로 선택하는 방법에 대해 개시한다. 이 방법은 병합 후보의 모션 벡터와 연관된 R-D 비용에 의존하여 필요한 계산을 감소한다.
Description
본 발명은 2011년 3월 9일 출원되고 발명의 명칭이 "Syntax for transform unit in HEVC"인 미국 가특허출원 No. 61/450,720, 2011년 3월 14일 출원되고 발명의 명칭이 "Optimization for Merge Mode Decision"인 미국 가특허출원 No. 61/452,457, 및 2011년 6월 9일 출원되고 발명의 명칭이 "Method and Apparatus of Transform Unit Partition with Reduced Complexity"인 미국 가특허출원 No. 13/156,552에 대한 우선권을 주장하는 바이다. 이러한 미국 가특허출원의 내용은 본 명세서에 원용되어 포함된다.
본 발명은 비디오 코딩에 관한 것이다. 특히, 본 발명은 변환 단위 파티션 및 병합 모드 결정의 최적화에 관한 코딩 기술에 관한 것이다.
고효율 비디오 코딩(High Efficiency Video Coding: HEVC)은 기존의 H.264/AVC 표준보다 비트 레이트 감소율을 50% 더 달성하는 것을 목표로 개발 중인 비디오 코딩 표준이다. HEVC는 블록 구조가 매우 유연성이 있는 블록 기반의 하이브리드 비디오 코딩이다. 이러한 HEVC에는 3가지의 블록 개념: 코딩 단위(codiing unit: CU), 예측 단위(prediction unit: PU), 및 변환 단위(Transform unit: TU)이 도입되었다. 전체적인 코딩 단위는 회귀 방식(recursive fashion)으로 다양한 크기의 CU, PU, 및 TU를 특징으로 하며, 여기서 각각의 픽처는 64x64 픽셀로 이루어진 최대 CU(LCU)로 분할된다. 그런 다음 각각의 LCU는 리프(leaf) CU 또는 최소 CU에 도달할 때까지 더 작은 CU로 회귀적으로 분할된다. 일단 CU 계층 트리가 수행되면, 각각의 리프 CU는 파티션 타입에 따라 예측 단위(PU)로 추가로 분할된다. 또한, TU에 변환이 적용되어 공간 데이터를 콤팩트 데이터 표시를 위한 변환 계수로 변환한다.
현재의 HEVC에서의 변환 프로세싱에 있어서, 계층 잔차 쿼드트리(Residual Quad Tree: RQT)가 사용된다. TU 크기는 CU 크기와 관련되어 있지만, PU 크기와는 무관하다. TU 파티션은 PU 파티션과는 무관하고 최대 허용 TU 깊이, 즉 max RQT depth는 3이기 때문에, 잔차 쿼드트리에 대한 현재 구문 transform _ tree()는 매우 복잡하다. 이로 인해 인코딩 복잡도가 높아지고 또한 잔차 쿼드트리 구문을 처리하는 걸리는 시간이 늘어난다. 또한, INTER 모드에 대한 max RQT depth, INTRA 모드에 대한 max RQT depth, max TU size 및 min TU size와 같은 변환 트리와 관련된 일부의 구문 요소를 시퀀스-레벨(SPS) 헤더에 송신하여야 한다. 따라서, 복잡도를 감소시킬 수 있는 TU 표현 방식을 개발하는 것이 바람직하다. 또한, 2Nx2N CU 병합 모드에 대한 최선의 병합 후보를 선택하는 것과 관련된 현재의 계산이 상당히 집중된다. 그러므로 2Nx2N CU 병합 모드에 대한 최상의 병합 후보를 선택하기 위해 계산의 복잡도를 감소시키는 것이 바람직하다.
비디오 데이터의 변환 단위를 프로세싱하는 방법 및 장치에 대해 설명한다. 본 발명에 따르면, 비디오 데이터의 변환 단위를 프로세싱하는 방법 및 장치는, 비디오 데이터의 코딩 단위를 수신하는 단계, 상기 코딩 단위를 2Nx2N, 2NxN, Nx2N, 또는 NxN 파티션 타입에 따라 하나 이상의 예측 단위(prediction unit: PU)로 파티셔닝하는 단계, 및 상기 코딩 단위를, 상기 코딩 단위의 크기 및 상기 하나 이상의 예측 단위의 크기에 의존하는 하나 이상의 변환 단위로 파티셔닝하는 단계를 포함한다. 본 발명의 실시예에 따른 일실시예에서는, 상기 변환 단위의 크기는, 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외한, PU 폭 및 PU 높이의 최솟값과 동일하고; 상기 2Nx2N 파티션 타입에 대한 변환 단위의 크기는 2Nx2N 및 NxN 중에서 선택된다. 본 발명의 실시예에 따른 다른 실시예에서는, 변환 단위의 최대 크기는, 상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외하여, PU 폭 및 PU 높이의 최댓값과 동일하고, 상기 변환 단위의 최소 크기는 PU 폭 및 PU 높이의 최솟값과 동일하며, 상기 2Nx2N 파티션 타입에 대한 변환 단위의 크기는 2Nx2N 및 NxN 중에서 선택된다. 본 발명의 실시예에 따른 또 다른 실시예에서는, 상기 하나 이상의 변환 단위의 크기는, 2Nx2N, 2NxN, Nx2N, 또는 NxN 파티션 타입에 대해 2Nx2N 및 NxN 중에서 선택된다. 일부의 상황에 있어서는 split_transform_flag 구문 요소를 통합하여 변환 단위가 2Nx2N를 사용하는지 또는 NxN를 사용하는지를 나타낸다.
변환 단위 크기가 예측 단위 크기에 의존하는 비디오 비트스트림의 디코딩 방법 및 장치에 대해 개시한다. 본 발명에 따르면, 변환 단위 크기가 예측 단위 크기에 의존하는 비디오 비트스트림의 디코딩 방법 및 장치는, 비디오 비트스트림 내의 코딩 단위와 연관된 코딩된 데이터를 수신하는 단계, 상기 코딩 단위와 연관된 상기 코딩된 데이터로부터 상기 코딩 단위의 크기를 확정하는 단계, 상기 코딩 단위와 연관된 2Nx2N, 2NxN, Nx2N, 및 NxN 파티션 타입 중에서 예측 단위(prediction unit: PU) 파티션을 확정하는 단계, 상기 코딩 단위의 크기 및 상기 파티션 타입에 따라 상기 코딩된 데이터에, split_transform_flag 구문 요소가 존재하는지를 판단하는 단계, 상기 split_transform_flag 구문 요소가 존재하면, 상기 split_transform_flag의 값을 확정하는 단계, 및 상기 코딩 단위의 크기, 상기 파티션 타입, 및 상기 split_transform_flag의 값에 따라, 상기 코딩 단위와 연관된 상기 변환 단위 파티션을 확정하는 단계를 포함한다. 본 발명에 따른 일실시예에서, 상기 코딩 단위의 크기가 2Nx2N이고 상기 2Nx2N 파티션 타입이 사용되면 상기 split_transform_flag가 존재한다. 본 발명에 따른 또 일실시예에서, 상기 코딩 단위의 크기가 2Nx2N이고 상기 2Nx2N, 2NxN 또는 NxN 파티션 타입이 사용되면 상기 split_transform_flag가 존재한다. 본 발명에 따른 또 일실시예에서, 상기 코딩 단위의 크기가 2Nx2N이고 상기 2Nx2N, 2NxN, 본 발명에 따른 또 일실시예에서, 상기 코딩 단위의 크기가 2Nx2N이고 상기 2Nx2N, 2NxN, 2NxN, 또는 NxN이면 상기 split_transform_flag가 존재한다. 상기 split_transform_flag는 상기 변환 단위 파티션이 2Nx2N인지 또는 NxN인지를 나타낸다.
감소된 인코딩 계산 복잡도를 사용해서 2Nx2N 코딩 단위에 대한 병합 후보를 확정하는 방법 및 장치에 대해 개시한다. 본 발명에 따르면, 감소된 인코딩 계산 복잡도를 사용해서 2Nx2N 코딩 단위에 대한 병합 후보를 확정하는 방법 및 장치는, 2Nx2N 코딩 단위와 연관된 각각의 병합 후보에 대한 모션 벡터를 수신하는 단계, 상기 모션 벡터를 사용해서 상기 각각의 병합 후보에 대한 모션 보상을 수행하여 상기 각각의 병합 후보에 대한 잔차 신호(residual signal)를 유도하는 단계, 상기 잔차 신호 및 모션 벡터와 연관된 모션 추정 비용을 계산하는 단계, 및 상기 병합 후보 중에서 최소의 모션 추정 비용을 발생시키는 최선의 병합 후보를 확정하는 단계를 포함한다.
본 발명에 따른 일실시예에서, 상기 방법 및 장치는 상기 최선의 병합 후보를 잔차 쿼드트리를 사용해서 하나 이상의 변환 단위로 파티셔닝하는 단계, 상기 하나 이상의 변환 단위의 계수를 스캔 패턴에 따라 인코딩하는 단계, 상기 최선의 병합 후보에 대해 인코딩된 계수와 연관된 왜곡 및 비트 레이트에 관련된 병합(MERGE) 모드에 대응하는 제1 R-D 비용을 계산하는 단계, 및 상기 제1 R-D 비용 및 다른 모드와 연관된 다른 R-D 비용 중에서 최소의 R-D 비용을 선택함으로써 상기 인코딩 단위에 대한 모드를 확정하는 단계를 더 포함한다.
도 1은 2Nx2N 코딩 단위를 하나 이상의 예측 단위로 파티셔닝하기 위한 다양한 파티션 타입에 대한 도면이다.
도 2a - 도 2b는 고효율 비디오 코딩(High Efficiency Video Coding: HEVC)의 종래 방법에 따라, 잔차 쿼드트리(RQT) 파티셔닝, transform_tree()에 대한 구문을 도시하는 도면이다.
도 3a - 도 3b는 본 발명의 일실시예에 따라, 잔차 쿼드트리(RQT) 파티셔닝, transform_tree()에 대한 구문을 도시하는 도면이다.
도 4는 도 본 발명의 다른 실시예에 따라, 잔차 쿼드트리(RQT) 파티셔닝, transform_tree()에 대한 구문을 도시하는 도면이다.
도 2a - 도 2b는 고효율 비디오 코딩(High Efficiency Video Coding: HEVC)의 종래 방법에 따라, 잔차 쿼드트리(RQT) 파티셔닝, transform_tree()에 대한 구문을 도시하는 도면이다.
도 3a - 도 3b는 본 발명의 일실시예에 따라, 잔차 쿼드트리(RQT) 파티셔닝, transform_tree()에 대한 구문을 도시하는 도면이다.
도 4는 도 본 발명의 다른 실시예에 따라, 잔차 쿼드트리(RQT) 파티셔닝, transform_tree()에 대한 구문을 도시하는 도면이다.
고효율 비디오 코딩(High Efficiency Video Coding: HEVC)은 기존의 H.264/AVC 표준보다 비트 레이트 감소율을 50% 더 달성하는 것을 목표로 개발 중인 비디오 코딩 표준이다. HEVC는 블록 구조가 매우 유연성이 있는 블록 기반의 하이브리드 비디오 코딩이다. 이러한 HEVC에는 3가지의 블록 개념: 코딩 단위(codiing unit: CU), 예측 단위(prediction unit: PU), 및 변환 단위(Transform unit: TU)이 도입되었다. 전체적인 코딩 단위는 회귀 방식(recursive fashion)으로 다양한 크기의 CU, PU, 및 TU를 특징으로 하며, 여기서 각각의 픽처는 64x64 픽셀로 이루어진 최대 CU(LCU)로 분할된다. 그런 다음 각각의 LCU는 리프(leaf) CU 또는 최소 CU에 도달할 때까지 더 작은 CU로 회귀적으로 분할된다. 일단 CU 계층 트리가 수행되면, 각각의 리프 CU는 파티션 타입에 따라 예측 단위(PU)로 추가로 분할된다. 또한, TU에 변환이 적용되어 공간 데이터를 콤팩트 데이터 표시를 위한 변환 계수로 변환한다.
HEVC 개발 중에, 개발자들은 HEVC 공통 테스트 모델(HM)을 사용하여 어떤 제안된 알고리즘의 성능을 평가한다. HM 버전 1.0까지는, 도 1에 도시된 바와 같이, 2Nx2N CU는 INTRA 코딩된 프레임 또는 슬라이스에 대해 파티션 크기 2Nx2N 및 NxN을 가지는 PU를 가질 수 있고, 2Nx2N CU는 INTRA 코딩된 프레임 또는 슬라이스에 대해 파티션 크기 2Nx2N, Nx2N, 2NxN 및 NxN을 가지는 PU를 가질 수 있다. 대한민국 대구에서 열린 제4회 비디오 코딩에 관한 합동 공동제작 팀 JCT-VC(Joint Collaborative Team on Video Coding)에서, INTER 및 INTRA 코딩된 프레임 및 슬라이스에 있어서 최소 CU보다 큰 모든 CU로부터 NxN 파티션 타입을 제거하기로 결정하였다.
현재의 HEVC에서의 변환 프로세싱에 있어서, 계층 잔차 쿼드트리(Residual Quad Tree: RQT)가 사용되고, TU 크기는 CU 크기, max RQT depth, max TU 및 min TU size와 관련되어 있다. TU 크기는 PU 크기와는 무관하다. 최대 TU 크기는 32x32로 제약되고, 최소 TU 크기는 4x4로 제약된다. 또한, TU는 변환이 적용될 CU보다 클 수 없다. 그렇지만, TU는 PU를 아우를 수 있다. 예를 들어, 32x32 CU에 있어서, TU는 PU 파티션 타입에 관계없이, 32x32, 16x16, 8x8일 수 있다. HEVC에서의 잔차 쿼드트리(Residual Quad Tree: RQT)의 현재의 TU 구문, transform_tree()가 도 2a - 도 2b에 도시되어 있다. HM 버전 2.0에 허용된 max RQT depth가 표 1에 나타나 있다.
(표 1)
TU 파티션은 PU 파티션과는 무관하고, 허용된 최대 깊이, 즉 max RQT depth는 3이기 때문에, 잔차 쿼드트리의 현재 구문, transform_tree()는 너무 복잡하다.
이로 인해 인코딩 복잡도가 높아지고 또한 잔차 쿼드트리의 구문을 처리하는 걸리는 시간이 늘어난다. 또한, INTER 모드에 대한 max RQT depth, INTRA 모드에 대한 max RQT depth, max TU size 및 min TU size와 같은 변환 트리와 관련된 일부의 구문 요소는 표 2에 나타난 바와 같이 시퀀스-레벨(SPS) 헤더에 송신되어야 한다. 따라서, 복잡도를 감소시킬 수 있는 TU 표현 방식을 개발하는 것이 바람직하다.
(표 2)
본 발명에 따른 제1 실시예에서, TU의 최대 폭 및 높이는 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외한 최솟값 (PU _ width , PU _ height)과 동일하다. TU는 항상 정방형이기 때문에, TU의 최대 폭 및 최대 높이는 동일하다. 이러한 TU 표현 방식에 따르면, 2Nx2N CU 및 Nx2N, 2NxN 또는 NxN의 PU 파티션 타입에 있어서, CU를 변환하는 데 사용되는 TU는 NxN일 것이다. 2Nx2N CU에 있어서, TU 크기는 2Nx2N 또는 NxN이 될 수 있으며, "split _ transform _ flag"에 의해 선택이 나타내어질 수 있다. 본 발명을 통합하기 위해, 변환 트리 구문이 수정되어야 한다. 본 발명을 구현하는 변환 트리 구문의 예가 도 3a - 도 3b에 도시되어 있다. 도 3a에서, 도 2a의 원래의 구문 내의 구문 섹션과 동일하게 남아 있는 구문 섹션(310)은 도 3a에서는 생략되어 있다. resiaualDataPresentFlag가 잔차 데이터의 존재를 나타내면, split _ transform _ flag는 1에 설정된다. 변환 트리 처리는 계속해서, 도 3a의 구문 섹션(320)에 도시된 바와 같이, 변환 깊이 trafoDepth가 0인지 그리고 PU 파티션 모드 PartMode가 PART_2Nx2N인지를 검사한다. 두 조건이 참이면, 구문 요소 split _ transform _ flag가 통합된다. 두 조건 중 하나가 거짓이면, 프로세스는 trafoDepth가 0인지 그리고 split _ transform _ flag가 도 3a의 구문 섹션(330)에 도시된 바와 같이 설정되어 있는지에 관한 제2 세트의 조건을 검사한다.
본 발명에 따른 수정된 TU 표현 방식을 구현하는 시스템의 코딩 성능은 참조 테스트 모델 HM 버전 2.0과 비교된다. YUV 컴포넌트에 대한 BD-레이트와 관련한 성능은, 한 세트의 표준 테스트 데이터에 기초한 시뮬레이션, 즉 INTRA 예측에 있어서는 표3a에, 랜덤 액세스 설정에 있어서는 표 3b에, 낮은 지연 설정에 있어서는 표 3c에 나타난 바와 같은 클래스 A 내지 클래스 E를 사용해서 비교된다. 또한, 성능을 비교하는 데 사용되는 시뮬레이션 시스템은 고효율(HE) 동작에 대해 구성된다. 표에서, 포지티브 R-D 값은 코딩 효율의 손실을 나타낸다.
(표 3a)
(표 3b)
(표 3c)
표 3a - 표 3c에 도시된 RD-레이트는 수정된 TU 표현 방식에 의해 야기되는 코딩 효율의 작은 손실을 나타낸다. 그렇지만, 이러한 수정된 TU 표현 방식에 의해 인코딩 시간이 현저하게 감소될 수 있다. 그러므로 이러한 수정된 TU 표현 방식은 성능-복잡도의 양호한 상쇄를 나타낸다.
본 발명에 따른 제2 실시예에서, 2Nx2N, Nx2N 또는 2NxN 파티션 타입을 가지는 2Nx2N CU를 제외하여, TU의 최대 폭 및 높이는 최댓값 (PU _ width , PU _ height)과 동일하고, TU의 최소 폭 및 높이는 최솟값 (PU _ width , PU _ height)과 동일하다. 2Nx2N, Nx2N 또는 2NxN 파티션 타입을 가지는 2Nx2N CU에 있어서, TU는 2Nx2N 또는 NxN이 될 수 있으며, TU 크기의 선택은 "split _ transform _ flag"에 의해 나타내어질 수 있다. NxN PU 크기가 허용되고 선택되면, split _ transform _ flag가 송신되지 않아도 된다. 본 발명을 통합하기 위해, 변환 트리 구문이 수정되어야 한다. 본 발명을 구현하는 변환 트리 구문의 예가 도 4에 도시되어 있다. 도 2a - 도 2b의 원래의 구문 섹션과 동일하게 남아 있는 구문 섹션은 도 3a에서는 생략되어 있다. 도 4의 구문 섹션(410)에 도시된 바와 같이, resiaualDataPresentFlag가 잔차 데이터의 존재를 나타내면, split _ transform _ flag는 1에 설정된다. 구문 섹션(420)에 도신된 바와 같이, 변환 깊이가 0인지 그리고 PU 파티션 모드가 NxN이 아닌지에 관한 조건이 검사된다.
본 발명에 따른 수정된 TU 표현 방식을 구현하는 시스템의 코딩 성능 역시 참조 테스트 모델 HM 버전 2.0과 비교된다. YUV 컴포넌트에 대한 BD-레이트와 관련한 성능은, 한 세트의 표준 테스트 데이터에 기초한 시뮬레이션, 즉 INTRA 예측에 있어서는 표 4a에, 랜덤 액세스 설정에 있어서는 표 4b에, 낮은 지연 설정에 있어서는 표 4c에 나타난 바와 같은 클래스 A 내지 클래스 E를 사용해서 비교된다. 또한, 성능을 비교하는 데 사용되는 시뮬레이션 시스템은 고효율 동작에 대해 구성된다. 표에서, 포지티브 R-D 값은 코딩 효율의 손실을 나타낸다.
(표 4a)
(표 4b)
(표 4c)
표 4a - 표 4c에 도시된 RD-레이트는 수정된 TU 표현 방식에 의해 야기되는 코딩 효율의 작은 손실을 나타낸다. 그렇지만, 이러한 수정된 TU 표현 방식에 의해 인코딩 시간이 현저하게 감소될 수 있다. 그러므로 이러한 수정된 TU 표현 방식은 성능-복잡도의 양호한 상쇄를 나타낸다.
본 발명에 따른 제3 실시예에서, TU 깊이는 INTER 및 INTRA 예측 모드 모두에 있어서 허용된 최대 깊이보다 낮다. 예를 들어, HM 버전 2.0에서는 허용된 최대 TU 깊이는 3이지만, 본 발명에 따른 실시예에서는 TU 깊이가 2로 제한될 수 있다. TU 깊이가 2로 제한되는 경우에는, 변환 크기는 최대 TU 크기 32x32의 제약을 가지는 2Nx2N 또는 NxN이 될 수 있다.
수정된 TU 표현 방식의 제3 실시예와 통합되는 시스템의 코딩 성능 역시 참조 테스트 모델 HM 버전 2.0과 비교된다. YUV 컴포넌트에 대한 BD-레이트와 관련한 성능은, 한 세트의 표준 테스트 데이터에 기초한 시뮬레이션, 즉 INTRA 예측에 있어서는 표 5a에, 랜덤 액세스 설정에 있어서는 표 5b에, 낮은 지연 설정에 있어서는 표 5c에 나타난 바와 같은 클래스 A 내지 클래스 E를 사용해서 비교된다. 또한, 성능을 비교하는 데 사용되는 시뮬레이션 시스템은 고효율 동작에 대해 구성된다. 표에서, 포지티브 R-D 값은 코딩 효율의 손실을 나타낸다.
(표 5a)
(표 5b)
(표 5c)
표 5a - 표 5c에 도시된 RD-레이트는 수정된 TU 표현 방식에 의해 야기되는 코딩 효율의 작은 손실을 나타낸다. 그렇지만, 이러한 수정된 TU 표현 방식에 의해 인코딩 시간이 현저하게 감소될 수 있다. 그러므로 이러한 수정된 TU 표현 방식은 성능-복잡도의 양호한 상쇄를 나타낸다.
HEVC에 대한 HM 버전 2.0에서, 고 복잡도 레이트-왜곡 최적화(Rate-Distortion Optimization: RDO)를 2Nx2N CU 병합 모드에 대한 모드 결정에 사용한다. RDO 프로세스는 이하의 단계로 이루어져 있다.
1. 병합 후보의 모션 벡터를 사용하여 모션 보상을 수행한다;
2. 잔차 쿼드트리(RQT)를 사용하여 계층 변환을 수행한다;
3. 계수를 스캔 및 인코딩한다;
4. 비트-레이트 및 왜곡을 사용하여 R-D 비용을 계산한다:
Jmode = SSD(MV) + λmode*(R(MV)),
단, MV는 병합 후보에 대한 모션 벡터이고,
R은 병합 후보를 사용하여 2Nx2N CU를 코딩하는 비트-레이트이며; 그리고
SSD(Sum of Squared Differnece)는 왜곡 측정이다.
5. 최저 R-D 비용을 가지는 최선의 병합 후보를 선택한다;
6. R-D 비용을 다른 모드(SKIP, INTER 및 INTRA)와 비교하고 최저 R-D 비용을 가지는 최선의 모드를 선택한다.
병합 후보의 수는 현재의 HEVC 소프트웨어, HM 버전 2.0에서는 5까지이다. 2Nx2N CU 병합에 있어서, 모든 병합 후보에 대한 R-D 비용은 완전히 계산되어(즉, 레이트 및 왜곡은 변환, 양자화 및 엔트로피 코딩을 포함하는 인코딩 프로세스를 수행함으로써 계산된다), 최선의 병합 후보(병합 인덱스)를 확정한다. 2Nx2N CU 또는 2NxN CU에 있어서는, 고속 추정법을 사용하여 병합 인덱스를 결정하는데, 여기서 (완전 인코딩으로부터) 실제의 R-D 비용은 그 선택된 병합 후보에 대해 단지 1회만 계산된다.
본 발명에 따른 제4 실시예에서, R-D 최적화를 간소함으로써 인코딩의 계산 상의 복잡도를 감소시키는 방법을 제공한다. 본 발명의 제4 실시예에 따르면, 2Nx2N CU 병합 모드에 대한 최선의 병합 후보를 선택하기 위한 RD-최적화와 연관된 비용 계산은 추정법에 기초를 두고 있다. 간소화된 R-D 최적화 방법을 실행하는 예가 이하의 단계에 나타나 있다:
1. 각각의 병합 후보에 대한 병합 후보의 모션 벡터를 사용하여 모션 보상을 수행한다;
2. 모션 추정 비용을 계산한다;
Jmotion = SAD(MV) + λmotion*(R(MV)),
단, MV는 병합 후보에 대한 모션 벡터이고,
R은 병합 후보를 사용하여 MV를 코딩하는 비트-레이트이며; 그리고
SAD(Sum of Absolute Difference)는 왜곡 측정이다.
3. 최저 모션 추정 비용을 가지는 최선의 병합 후보를 선택한다;
4. 최선의 병합 후보에 대한 RQT를 사용해서 계층 변환을 수행한다;
5. 최선의 병합 후보에 대한 계수를 스캔 및 인코딩한다;
6. 최선의 병합 후보에 대한 비트-레이트 및 왜곡을 계산한다; 그리고
7. R-D 비용을 다른 모드(SKIP, INTER 및 INTRA)와 비교하고 최저 R-D 비용을 가지는 최선의 모드를 선택한다.
전술한 단계에 나타난 바와 같이, 종래의 방법에서와 같은 R-D 비용 대신, 각각의 병합 후보의 모션 벡터와 연관된 모션 추정 비용을 계산한다. 모션 추정 비용을 사용하여 최선의 병합 후보를 선택하고 이 최선의 병합 후보에 대해서만 완전한 R-D 비용을 수행한다. 모션 추정 비용에 대한 계산은 R-D 비용에 대한 계산보다 훨씬 낮다. 결과적으로, 제4 실시예에 따라 최선의 병합 후보를 선택하는 계산 상의 복잡도가 감소한다.
간소화된 R-D 최적화의 실시예를 통합하는 시스템의 코딩 성능은 참조 테스트 모델 HM 2.0과 비교된다.
YUV 컴포넌트에 대한 BD-레이트와 관련한 성능은, 한 세트의 표준 테스트 데이터에 기초한 시뮬레이션, 즉 랜덤 액세스 설정에 있어서는 표 6a에, 그리고 낮은 지연 설정에 있어서는 표 6b에 나타난 바와 같은 클래스 A 내지 클래스 E를 사용해서 비교된다. 또한, 성능을 비교하는 데 사용되는 시뮬레이션 시스템은 고효율 동작에 대해 구성된다. 표에서, 포지티브 R-D 값은 코딩 효율의 손실을 나타낸다. 표 6a - 표 6b에 도시된 바와 같이, 전체적인 인코딩 시간을 절감하는 평균은, 고효율에 대해 구성된 HEVC HM 버전 2.0에 비해 BD-레이트가 0.2-0.3%인 약 6-7% 증가이다.
(표 6a)
(표 6b)
본 발명의 제1, 제2 및 제3 실시예를 실행하기 위해, 코딩된 비디오 비트스트림에 구문 요소, split _ transform _ flag를 통합함으로써, 본 발명을 구현하는 디코더는 비디오 비트스트림을 적절하게 디코딩할 수 있다. 예를 들어, 디코더는 코딩 단위에 대한 코딩된 비디오 데이터로부터 코딩 단위의 크기 및 파티션 타입을 유도할 수 있다. 코딩 단위의 크기 및 파티션 타입에 기초해서, 디코더는 split_transform_flag가 존재하는지를 판단할 수 있다. split _ transform _ flag가 존재하면, split _ transform _ flag를 사용하여 변환 단위 파티션을 확정한다. 그렇지 않으면, 변환 단위 파티션은 다양한 실시예의 각각의 규칙에 따라 확정된다. 또한, 본 발명의 제1, 제2, 및 제3 실시예에서는, 시퀀스-레벨(SPS) 헤더 내의 INTER 모드에 대한 max RQT depth, INTRA 모드에 대한 max RQT depth, max TU size 및 min TU size를 포함하는 구문 요소와 관련된 일부의 변환 트리를 통합하지 않아도 된다. 본 발명에 따른 제4 실시예에 관련해서, 인코더에서 최선의 병합 후보를 선택하는 프로세스에만 영향을 줄 뿐이다.
본 개시에서는, 계산 상의 복잡도가 감소된 수정된 TU 표시 방식에 대한 몇 가지 실시예에 대해 설명하였으며, TU 크기는 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외한 PU 크기와 관련되어 있다. 본 발명의 제1 실시예에 따르면, 변환 단위의 크기는 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외한 최솟값 (PU_width, PU _ height)과 동일하다. 본 발명에 따른 제2 실시예에 따르면, 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외하여, 변환 단위의 최대 크기는 최댓값 (PU _ width , PU _ height)과 동일하고, 변환 단위의 최소 크기는 최솟값 (PU_width, PU _ height)과 동일하다. 본 발명에 따른 제3 실시예에 따르면, 변환 단위의 크기는 2Nx2N, Nx2N, 2NxN 및 NxN 파티션 타입에 대해 2Nx2N 및 NxN 중에서 선택된다. 본 발명의 제4 실시예에 따르면, R-D 최적화를 간소화함으로써 인코딩의 계산 상의 복잡도를 감소시키는 방법에 대해 개시한다. 전술한 바와 같이 본 발명에 따라 계산 상의 복잡도가 감소된 수정된 TU 표현 방법의 인코딩 또는 디코딩을 통합하는 비디오 시스템의 실시예는 다양한 하드웨어, 소프트웨어 코드, 또는 양자의 조합으로 실행될 수 있다. 예를 들어, 본 발명의 실시예는 여기서 설명된 프로세싱을 수행할 수 있도록 비디오 압축 칩에 통합된 회로 또는 비디오 압축 소프트웨어에 통합된 프로그램 코드일 수 있다. 본 발명의 실시예는 또한 여기서 설명된 프로세싱을 수행할 수 있도록 디지털 신호 프로세서(DSP)에서 실행되는 프로그램 코드일 수 있다. 본 발명은 또한 컴퓨터 프로세서, 디지털 신호 프로세서, 마이크로프로세서, 또는 필드 프로그래머블 게이트 어레이(FPGA)에 의해 수행되는 일련의 기능을 포함할 수도 있다. 이러한 프로세서는 본 발명에 의해 구현되는 특정한 방법을 규정하는 기계 판독 가능형 소프트웨어 코드 또는 펌웨어 코드를 실행함으로써, 본 발명에 따른 특정한 작업을 수행하도록 구성될 수 있다. 소프트웨어 코드 또는 펌웨어 코드는 다른 프로그래밍 언어 및 다른 포맷 또는 스타일로 개발될 수도 있다. 소프트웨어 코드는 또한 다른 목표 플랫폼에 컴파일될 수도 있다. 그렇지만, 소프트웨어 코드의 다른 코드 포맷, 스타일 및 언어, 및 본 발명에 따른 작업을 수행하는 코드를 구성하는 다른 수단은 본 발명의 정신 및 범위를 벗어나지 않는다.
본 발명은 그 정신 및 본질적인 특성을 벗어남이 없이 다른 특정한 형태로 구현될 수 있다. 전술한 예는 모든 관점에서 단지 설명을 위한 것이고 제한하는 것이 아닌 것으로 고려되어야 한다. 그러므로 본 발명의 범위는 전술한 설명에 의해서가 아닌 첨부된 청구의 범위에 의해 표시된다. 청구의 범위의 의미 및 등가의 범위에 부합하는 모든 변화는 그 범위 내에서 망라되어야 한다.
Claims (32)
- 비디오 데이터의 변환 단위를 프로세싱하는 방법에 있어서,
비디오 데이터의 코딩 단위를 수신하는 단계;
상기 코딩 단위를 2Nx2N, 2NxN, Nx2N, 또는 NxN 파티션 타입에 따라 하나 이상의 예측 단위(prediction unit: PU)로 파티셔닝하는 단계; 및
상기 코딩 단위를 하나 이상의 변환 단위로 파티셔닝하는 단계
를 포함하며,
상기 하나 이상의 예측 단위의 예측 프로세싱을 위한 예측 모드는 상기 하나 이상의 예측 단위 각각에 대해 확정되며,
상기 하나 이상의 변환 단위의 크기는 상기 코딩 단위의 크기 및 상기 하나 이상의 예측 단위의 크기와 관련되어 있는, 프로세싱 방법. - 제1항에 있어서,
상기 하나 이상의 변환 단위의 폭 및 높이는, 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외한, PU 폭 및 PU 높이의 최솟값과 동일한, 프로세싱 방법. - 제2항에 있어서,
상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위에 대해 구문 요소를 사용하여, 상기 하나 이상의 변환 단위의 폭 및 높이에 대해 2Nx2N 및 NxN 중에서의 선택을 나타내는, 프로세싱 방법. - 제2항에 있어서,
상기 2NxN, Nx2N, 및 NxN 파티션 타입에 대해 구문 요소를 생략하며, 상기 하나 이상의 변환 단위의 폭 및 높이를 NxN인 것으로 추정하는, 프로세싱 방법. - 제1항에 있어서,
상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외하여, 상기 하나 이상의 변환 단위의 최대 폭 및 높이는 PU 폭 및 PU 높이의 최댓값과 동일하고, 상기 하나 이상의 변환 단위의 최소 폭 및 높이는 PU 폭 및 PU 높이의 최솟값과 동일한, 프로세싱 방법. - 제5항에 있어서,
상기 2Nx2N, 2NxN 및 Nx2N 파티션 타입에 대해 구문 요소를 사용하여, 상기 하나 이상의 변환 단위의 폭 및 높이에 대해 2Nx2N 및 NxN 중에서의 선택을 나타내는, 프로세싱 방법. - 제5항에 있어서,
상기 NxN 파티션 타입에 대해 구문 요소를 생략하며, 상기 하나 이상의 변환 단위의 폭 및 높이를 NxN인 것으로 추정하는, 프로세싱 방법. - 제1항에 있어서,
상기 하나 이상의 변환 단위의 크기는, 2Nx2N, 2NxN, Nx2N, 및 NxN 파티션 타입에 대해 2Nx2N 및 NxN 중에서 선택되는, 프로세싱 방법. - 제8항에 있어서,
상기 하나 이상의 변환 단위의 선택된 크기를 구문 요소를 사용하여 나타내는, 프로세싱 방법. - 변환 단위 크기가 예측 단위 크기에 의존하는 비디오 비트스트림의 디코딩 방법에 있어서,
비디오 비트스트림 내의 코딩 단위와 연관된 코딩된 데이터를 수신하는 단계;
상기 코딩 단위와 연관된 상기 코딩된 데이터로부터 상기 코딩 단위의 크기를 확정하는 단계;
상기 코딩 단위와 연관된 2Nx2N, 2NxN, Nx2N, 및 NxN 파티션 타입 중에서 예측 단위(prediction unit: PU) 파티션을 확정하는 단계;
상기 코딩 단위의 크기 및 상기 파티션 타입에 따라 상기 코딩된 데이터에, 변환 단위 파티션을 선택하는 데 사용되는 구문 요소가 존재하는지를 판단하는 단계;
상기 구문 요소가 존재하면, 상기 구문 요소의 값을 확정하는 단계; 및
상기 코딩 단위의 크기, 상기 파티션 타입, 및 상기 구문 요소의 값에 따라, 상기 코딩 단위와 연관된 상기 변환 단위 파티션을 확정하는 단계
를 포함하는 디코딩 방법. - 제10항에 있어서,
상기 코딩 단위의 크기가 2Nx2N이고 2Nx2N 파티션 타입이 사용되면 상기 구문 요소가 존재하며,
상기 구문 요소는 상기 변환 단위 파티션이 2Nx2N인지 또는 NxN인지를 나타내는, 디코딩 방법. - 제11항에 있어서,
상기 변환 단위 파티션은, 상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위는 제외하여, 하나 이상의 변환 단위가 PU 폭 및 PU 높이의 최솟값과 동일한 폭 및 높이를 가지게 하는, 디코딩 방법. - 제10항에 있어서,
상기 코딩 단위의 크기가 2Nx2N이고 2Nx2N, 2NxN 또는 NxN 파티션 타입이 사용되면 상기 구문 요소가 존재하며,
상기 구문 요소는 상기 변환 단위 파티션이 2Nx2N인지 또는 NxN인지를 나타내는, 디코딩 방법. - 제13항에 있어서,
상기 변환 단위 파티션은, 상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위는 제외하여, 하나 이상의 변환 단위가 PU 폭 및 PU 높이의 최댓값과 동일한 최대 폭 및 높이를 가지게 하고 PU 폭 및 PU 높이의 최솟값과 동일한 최소 폭 및 높이를 가지게 하는, 디코딩 방법. - 제10항에 있어서,
상기 코딩 단위의 크기가 2Nx2N이고 상기 파티션 타입이 2Nx2N, 2NxN, Nx2N 또는 NxN이면 상기 구문 요소가 존재하며,
상기 구문 요소는 상기 변환 단위 파티션이 2Nx2N인지 또는 NxN인지를 나타내는, 디코딩 방법. - 비디오 데이터의 변환 단위를 프로세싱하는 장치에 있어서,
비디오 데이터의 코딩 단위를 수신하는 수단;
상기 코딩 단위를 2Nx2N, 2NxN, Nx2N, 또는 NxN 파티션 타입에 따라 하나 이상의 예측 단위(PU)로 파티셔닝하는 수단; 및
상기 코딩 단위를 하나 이상의 변환 단위로 파티셔닝하는 수단
을 포함하며,
상기 하나 이상의 예측 단위의 예측 프로세싱을 위한 예측 모드는 상기 하나 이상의 예측 단위 각각에 대해 확정되며,
상기 하나 이상의 변환 단위의 크기는 상기 코딩 단위의 크기 및 상기 하나 이상의 예측 단위의 크기와 관련되어 있는, 프로세싱 장치. - 제16항에 있어서,
상기 하나 이상의 변환 단위의 폭 및 높이는, 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외한, PU 폭 및 PU 높이의 최솟값과 동일한, 프로세싱 장치. - 제17항에 있어서,
상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위에 대해 구문 요소를 사용하여, 상기 하나 이상의 변환 단위의 폭 및 높이에 대해 2Nx2N 및 NxN 중에서의 선택을 나타내는, 프로세싱 장치. - 제16항에 있어서,
상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위를 제외하여, 상기 하나 이상의 변환 단위의 최대 폭 및 높이는 PU 폭 및 PU 높이의 최댓값과 동일하고, 상기 하나 이상의 변환 단위의 최소 폭 및 높이는 PU 폭 및 PU 높이의 최솟값과 동일한, 프로세싱 장치. - 제19항에 있어서,
상기 2Nx2N, 2NxN 및 Nx2N 파티션 타입에 대해 구문 요소를 사용하여, 상기 하나 이상의 변환 단위의 폭 및 높이에 대해 2Nx2N 및 NxN 중에서의 선택을 나타내는, 프로세싱 장치. - 제16항에 있어서,
상기 하나 이상의 변환 단위의 크기는, 2Nx2N, 2NxN, Nx2N, 및 NxN 파티션 타입에 대해 2Nx2N 및 NxN 중에서 선택되는, 프로세싱 장치. - 제21항에 있어서,
상기 하나 이상의 변환 단위의 선택된 크기를 구문 요소를 사용하여 나타내는, 프로세싱 장치. - 변환 단위 크기가 예측 단위 크기에 의존하는 비디오 비트스트림의 디코딩 장치에 있어서,
비디오 비트스트림 내의 코딩 단위와 연관된 코딩된 데이터를 수신하는 수단;
상기 코딩 단위와 연관된 상기 코딩된 데이터로부터 상기 코딩 단위의 크기를 확정하는 수단;
상기 코딩 단위와 연관된 2Nx2N, 2NxN, Nx2N, 및 NxN 파티션 타입 중에서 예측 단위(PU) 파티션을 확정하는 수단;
상기 코딩 단위의 크기 및 상기 파티션 타입에 따라 상기 코딩된 데이터에, 변환 단위 파티션을 선택하는 데 사용되는 구문 요소가 존재하는지를 판단하는 수단;
상기 구문 요소가 존재하면, 상기 구문 요소의 값을 확정하는 수단; 및
상기 코딩 단위의 크기, 상기 파티션 타입, 및 상기 구문 요소의 값에 따라, 상기 코딩 단위와 연관된 상기 변환 단위 파티션을 확정하는 수단
을 포함하는 디코딩 장치. - 제23항에 있어서,
상기 코딩 단위의 크기가 2Nx2N이고 2Nx2N 파티션 타입이 사용되면 상기 구문 요소가 존재하며,
상기 구문 요소는 상기 변환 단위 파티션이 2Nx2N인지 또는 NxN인지를 나타내는, 디코딩 장치. - 제24항에 있어서,
상기 변환 단위 파티션은, 상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위는 제외하여, 하나 이상의 변환 단위가 PU 폭 및 PU 높이의 최솟값과 동일한 폭 및 높이를 가지게 하는, 디코딩 장치. - 제23항에 있어서,
상기 코딩 단위의 크기가 2Nx2N이고 2Nx2N, 2NxN 또는 NxN 파티션 타입이 사용되면 상기 구문 요소가 존재하며,
상기 구문 요소는 상기 변환 단위 파티션이 2Nx2N인지 또는 NxN인지를 나타내는, 디코딩 장치. - 제26항에 있어서,
상기 변환 단위 파티션은, 상기 2Nx2N 파티션 타입을 가지는 2Nx2N 코딩 단위는 제외하여, 하나 이상의 변환 단위가 PU 폭 및 PU 높이의 최댓값과 동일한 최대 폭 및 높이를 가지게 하고 PU 폭 및 PU 높이의 최솟값과 동일한 최소 폭 및 높이를 가지게 하는, 디코딩 장치. - 제23항에 있어서,
상기 코딩 단위의 크기가 2Nx2N이고 상기 파티션 타입이 2Nx2N, 2NxN, Nx2N 또는 NxN이면 상기 구문 요소가 존재하며,
상기 구문 요소는 상기 변환 단위 파티션이 2Nx2N인지 또는 NxN인지를 나타내는, 디코딩 장치. - 감소된 인코딩 계산 복잡도를 사용해서 2Nx2N 코딩 단위에 대한 병합 후보를 확정하는 방법에 있어서,
2Nx2N 코딩 단위와 연관된 각각의 병합 후보에 대한 모션 벡터를 수신하는 단계;
상기 모션 벡터를 사용해서 상기 각각의 병합 후보에 대한 모션 보상을 수행하여 상기 각각의 병합 후보에 대한 잔차 신호(residual signal)를 유도하는 단계;
상기 각각의 병합 후보에 대한 잔차 신호 및 모션 벡터와 연관된 모션 추정 비용을 계산하는 단계; 및
상기 병합 후보 중에서 최소의 모션 추정 비용을 발생시키는 최선의 병합 후보를 확정하는 단계
를 포함하는 병합 후보 확정 방법. - 제29항에 있어서,
상기 최선의 병합 후보를 잔차 쿼드트리(residual quad tree)를 사용해서 하나 이상의 변환 단위로 파티셔닝하는 단계;
상기 하나 이상의 변환 단위의 계수를 스캔 패턴에 따라 인코딩하는 단계;
상기 최선의 병합 후보에 대해 인코딩된 계수와 연관된 왜곡 및 비트 레이트에 관련된 병합(MERGE) 모드에 대응하는 제1 R-D 비용을 계산하는 단계; 및
상기 제1 R-D 비용 및 다른 모드와 연관된 다른 R-D 비용 중에서 최소의 R-D 비용을 선택함으로써 상기 코딩 단위에 대한 모드를 확정하는 단계
를 더 포함하는 병합 후보 확정 방법. - 감소된 인코딩 계산 복잡도를 사용해서 2Nx2N 코딩 단위에 대한 병합 후보를 확정하는 장치에 있어서,
2Nx2N 코딩 단위와 연관된 각각의 병합 후보에 대한 모션 벡터를 수신하는 수단;
상기 모션 벡터를 사용해서 상기 각각의 병합 후보에 대한 모션 보상을 수행하여 상기 각각의 병합 후보에 대한 잔차 신호를 유도하는 수단;
상기 각각의 병합 후보에 대한 잔차 신호 및 모션 벡터와 연관된 모션 추정 비용을 계산하는 수단; 및
상기 병합 후보 중에서 최소의 모션 추정 비용을 발생시키는 최선의 병합 후보를 확정하는 수단
을 포함하는 병합 후보 확정 장치. - 제31항에 있어서,
상기 최선의 병합 후보를 잔차 쿼드트리를 사용해서 하나 이상의 변환 단위로 파티셔닝하는 수단;
상기 하나 이상의 변환 단위의 계수를 스캔 패턴에 따라 인코딩하는 수단;
상기 최선의 병합 후보에 대해 인코딩된 계수와 연관된 왜곡 및 비트 레이트에 관련된 MERGE 모드에 대응하는 제1 R-D 비용을 계산하는 수단; 및
상기 제1 R-D 비용 및 다른 모드와 연관된 다른 R-D 비용 중에서 최소의 R-D 비용을 선택함으로써 상기 코딩 단위에 대한 모드를 확정하는 수단
을 더 포함하는 병합 후보 확정 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161450720P | 2011-03-09 | 2011-03-09 | |
US61/450,720 | 2011-03-09 | ||
US201161452547P | 2011-03-14 | 2011-03-14 | |
US61/452,547 | 2011-03-14 | ||
US13/156,552 US9788019B2 (en) | 2011-03-09 | 2011-06-09 | Method and apparatus of transform unit partition with reduced complexity |
US13/156,552 | 2011-06-09 | ||
PCT/CN2011/078149 WO2012119376A1 (en) | 2011-03-09 | 2011-08-09 | Method and apparatus of transform unit partition with reduced complexity |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130136525A true KR20130136525A (ko) | 2013-12-12 |
KR101621330B1 KR101621330B1 (ko) | 2016-05-16 |
Family
ID=46795576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137026588A KR101621330B1 (ko) | 2011-03-09 | 2011-08-09 | 복잡도가 감소된 변환 단위 파티션의 방법 및 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9788019B2 (ko) |
KR (1) | KR101621330B1 (ko) |
CN (1) | CN103348651B (ko) |
AU (1) | AU2011361445B2 (ko) |
WO (1) | WO2012119376A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015099506A1 (ko) * | 2013-12-26 | 2015-07-02 | 삼성전자 주식회사 | 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치 |
Families Citing this family (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5982734B2 (ja) | 2011-03-11 | 2016-08-31 | ソニー株式会社 | 画像処理装置および方法 |
US9247266B2 (en) * | 2011-04-18 | 2016-01-26 | Texas Instruments Incorporated | Temporal motion data candidate derivation in video coding |
PL2725791T3 (pl) * | 2011-06-23 | 2024-02-26 | Sun Patent Trust | Sposób dekodowania obrazów, sposób kodowania obrazów |
USRE47366E1 (en) | 2011-06-23 | 2019-04-23 | Sun Patent Trust | Image decoding method and apparatus based on a signal type of the control parameter of the current block |
WO2012176464A1 (ja) | 2011-06-24 | 2012-12-27 | パナソニック株式会社 | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置 |
HUE046468T2 (hu) | 2011-06-24 | 2020-03-30 | Sun Patent Trust | Kódoló eljárás és kódoló berendezés |
MX2013013483A (es) | 2011-06-27 | 2014-02-27 | Panasonic Corp | Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes. |
MY165469A (en) | 2011-06-28 | 2018-03-23 | Sun Patent Trust | Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus |
MX2013010892A (es) | 2011-06-29 | 2013-12-06 | Panasonic Corp | Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes. |
ES2908152T3 (es) | 2011-06-30 | 2022-04-27 | Sun Patent Trust | Procedimiento de decodificación de imágenes |
KR102060619B1 (ko) * | 2011-06-30 | 2019-12-30 | 선 페이턴트 트러스트 | 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치 |
CN102857755B (zh) * | 2011-07-01 | 2016-12-14 | 华为技术有限公司 | 确定变换块尺寸的方法和设备 |
US8929455B2 (en) * | 2011-07-01 | 2015-01-06 | Mitsubishi Electric Research Laboratories, Inc. | Method for selecting transform types from mapping table for prediction modes |
KR102271116B1 (ko) | 2011-07-11 | 2021-06-29 | 선 페이턴트 트러스트 | 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치 |
US8804816B2 (en) * | 2011-08-30 | 2014-08-12 | Microsoft Corporation | Video encoding enhancements |
US20130070855A1 (en) * | 2011-09-17 | 2013-03-21 | Qualcomm Incorporated | Hybrid motion vector coding modes for video coding |
US9699457B2 (en) | 2011-10-11 | 2017-07-04 | Qualcomm Incorporated | Most probable transform for intra prediction coding |
KR20130050403A (ko) | 2011-11-07 | 2013-05-16 | 오수미 | 인터 모드에서의 복원 블록 생성 방법 |
US9467701B2 (en) * | 2012-04-05 | 2016-10-11 | Qualcomm Incorporated | Coded block flag coding |
EP2941864B1 (en) | 2013-01-07 | 2016-12-07 | Telefonaktiebolaget LM Ericsson (publ) | Limiting use of largest transform unit size for intra coding units in inter coded slices of encoded video |
US9967559B1 (en) * | 2013-02-11 | 2018-05-08 | Google Llc | Motion vector dependent spatial transformation in video coding |
US9544597B1 (en) | 2013-02-11 | 2017-01-10 | Google Inc. | Hybrid transform in video encoding and decoding |
US9948915B2 (en) | 2013-07-24 | 2018-04-17 | Qualcomm Incorporated | Sub-PU motion prediction for texture and depth coding |
ES2906238T3 (es) | 2013-07-24 | 2022-04-13 | Qualcomm Inc | Predicción de movimiento avanzada simplificada para 3D-HEVC |
CN105284110B (zh) * | 2013-07-31 | 2019-04-23 | 太阳专利托管公司 | 图像编码方法及图像编码装置 |
EP3053337B1 (en) | 2013-10-01 | 2020-07-29 | Telefonaktiebolaget LM Ericsson (publ) | Encoder and method for video processing |
US9300977B2 (en) * | 2013-10-02 | 2016-03-29 | Amlogic Co., Ltd. | Methods for encoding motion vectors |
EP3058736B1 (en) | 2013-10-14 | 2019-02-27 | Microsoft Technology Licensing, LLC | Encoder-side options for intra block copy prediction mode for video and image coding |
BR112016007151A2 (pt) * | 2013-10-14 | 2017-09-12 | Microsoft Tech Licensing | recursos de modo de predição de cópia intrabloco para codificação e decodificação de vídeo e de imagem |
WO2015100726A1 (en) | 2014-01-03 | 2015-07-09 | Microsoft Corporation | Block vector prediction in video and image coding/decoding |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
WO2015113245A1 (en) * | 2014-01-29 | 2015-08-06 | Mediatek Singapore Pte. Ltd. | Methods for merging candidates list construction |
US10567799B2 (en) | 2014-03-07 | 2020-02-18 | Qualcomm Incorporated | Simplified sub-prediction unit (sub-PU) motion parameter inheritance (MPI) |
KR20160132891A (ko) * | 2014-03-13 | 2016-11-21 | 퀄컴 인코포레이티드 | 3d 비디오 코딩에 대한 제약된 깊이 인트라 모드 코딩 |
CN105493505B (zh) | 2014-06-19 | 2019-08-06 | 微软技术许可有限责任公司 | 统一的帧内块复制和帧间预测模式 |
CN104023234B (zh) * | 2014-06-24 | 2017-02-22 | 华侨大学 | 一种适用于hevc的快速帧间预测方法 |
CN104202605B (zh) * | 2014-08-18 | 2017-11-14 | 山东大学 | 一种通过降低分辨率预测高清图像编码单元cu的划分方式的方法及其实现装置 |
RU2679201C2 (ru) | 2014-09-30 | 2019-02-06 | МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи | Правила для режимов внутрикадрового прогнозирования, когда активируется волновая параллельная обработка данных |
CN104363452B (zh) * | 2014-10-17 | 2018-02-09 | 深圳市云宙多媒体技术有限公司 | 一种视频块划分方法及系统 |
US9706210B2 (en) | 2014-11-07 | 2017-07-11 | Qualcomm Incorporated | Low complexity coding based on dynamic mode decision branching for largest coding units |
CN107637078B (zh) | 2015-03-31 | 2020-05-26 | 瑞尔数码有限公司 | 整数变换系数的视频译码系统和方法 |
US9769499B2 (en) | 2015-08-11 | 2017-09-19 | Google Inc. | Super-transform video coding |
US10277905B2 (en) | 2015-09-14 | 2019-04-30 | Google Llc | Transform selection for non-baseband signal coding |
US10602187B2 (en) | 2015-11-30 | 2020-03-24 | Intel Corporation | Efficient, compatible, and scalable intra video/image coding using wavelets and HEVC coding |
US9955176B2 (en) | 2015-11-30 | 2018-04-24 | Intel Corporation | Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding |
US20170155905A1 (en) * | 2015-11-30 | 2017-06-01 | Intel Corporation | Efficient intra video/image coding using wavelets and variable size transform coding |
KR102584460B1 (ko) | 2016-01-21 | 2023-10-05 | 삼성전자주식회사 | 출몰 가능한 디스플레이부를 구비한 영상음향장치 |
US9942548B2 (en) | 2016-02-16 | 2018-04-10 | Google Llc | Entropy coding transform partitioning information |
US10715818B2 (en) * | 2016-08-04 | 2020-07-14 | Intel Corporation | Techniques for hardware video encoding |
CN107820077B (zh) * | 2016-09-14 | 2019-06-28 | 北京金山云网络技术有限公司 | 一种最大可用编码单元尺寸确定方法及装置 |
US20190379890A1 (en) * | 2017-02-23 | 2019-12-12 | Realnetworks, Inc. | Residual transformation and inverse transformation in video coding systems and methods |
EP3383045A1 (en) * | 2017-03-27 | 2018-10-03 | Thomson Licensing | Multiple splits prioritizing for fast encoding |
US10623738B2 (en) | 2017-04-06 | 2020-04-14 | Futurewei Technologies, Inc. | Noise suppression filter |
US10582195B2 (en) | 2017-06-02 | 2020-03-03 | Futurewei Technologies, Inc. | Intra prediction using unequal weight planar prediction |
US11272207B2 (en) | 2017-06-12 | 2022-03-08 | Futurewei Technologies, Inc. | Selection and signaling of motion vector (MV) precisions |
US10477237B2 (en) | 2017-06-28 | 2019-11-12 | Futurewei Technologies, Inc. | Decoder side motion vector refinement in video coding |
US11019339B2 (en) | 2017-07-12 | 2021-05-25 | Futurewei Technologies, Inc. | Fractional quantization parameter offset in video compression |
US10666943B2 (en) | 2017-09-15 | 2020-05-26 | Futurewei Technologies, Inc. | Block partition structure in video compression |
US10841794B2 (en) | 2017-09-18 | 2020-11-17 | Futurewei Technologies, Inc. | Adaptive motion vector resolution |
US10595019B2 (en) | 2017-09-20 | 2020-03-17 | Futurewei Technologies, Inc. | Noise suppression filter parameter estimation for video coding |
US10609384B2 (en) | 2017-09-21 | 2020-03-31 | Futurewei Technologies, Inc. | Restriction on sub-block size derivation for affine inter prediction |
WO2019076290A1 (en) | 2017-10-16 | 2019-04-25 | Huawei Technologies Co., Ltd. | VARIANT TRANSFORMERS IN SPACE FOR VIDEO CODING |
US11729416B2 (en) * | 2017-12-29 | 2023-08-15 | Intel Corporation | Modular motion estimation engine for tree-based video |
KR102524628B1 (ko) | 2018-01-05 | 2023-04-21 | 에스케이텔레콤 주식회사 | 영상을 부호화 또는 복호화하는 방법 및 장치 |
CN115002460A (zh) | 2018-01-05 | 2022-09-02 | Sk电信有限公司 | 视频解码设备、视频编码设备和非暂时性计算机可读介质 |
US10812797B2 (en) | 2018-02-05 | 2020-10-20 | Tencent America LLC | Method, apparatus and medium for decoding or encoding using a low-complexity transform |
WO2019204212A1 (en) | 2018-04-18 | 2019-10-24 | Futurewei Technologies, Inc. | Block partitioning in video coding |
US10609402B2 (en) | 2018-05-02 | 2020-03-31 | Tencent America LLC | Method and apparatus for prediction and transform for small blocks |
US10536720B2 (en) | 2018-05-07 | 2020-01-14 | Tencent America LLC | Method, apparatus and medium for decoding or encoding |
US10645396B2 (en) | 2018-06-04 | 2020-05-05 | Tencent America LLC | Method and apparatus for implicit transform splitting |
WO2020003183A1 (en) * | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Partitioning of zero unit |
TWI714153B (zh) * | 2018-06-29 | 2020-12-21 | 大陸商北京字節跳動網絡技術有限公司 | 零單元的定義 |
CN116320489A (zh) * | 2018-06-29 | 2023-06-23 | 北京字节跳动网络技术有限公司 | 视频处理方法、编码装置和解码装置 |
US11159795B2 (en) * | 2019-03-04 | 2021-10-26 | Tencent America LLC | Max transform size control |
JP7279189B2 (ja) * | 2019-03-22 | 2023-05-22 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | ビデオコーディングのための変換ユニット区分方法 |
CN110139106B (zh) * | 2019-04-04 | 2023-01-17 | 中南大学 | 一种视频编码单元分割方法及其系统、装置、存储介质 |
US10887589B2 (en) | 2019-04-12 | 2021-01-05 | Realnetworks, Inc. | Block size determination for video coding systems and methods |
US11122297B2 (en) | 2019-05-03 | 2021-09-14 | Google Llc | Using border-aligned block functions for image compression |
US11134275B2 (en) | 2019-06-04 | 2021-09-28 | Tencent America LLC | Method and apparatus for performing primary transform based on filtering of blocks |
US11212545B2 (en) | 2019-06-07 | 2021-12-28 | Tencent America LLC | Method and apparatus for improved implicit transform selection |
CN112118450B (zh) * | 2019-06-21 | 2022-03-29 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN110913232B (zh) * | 2019-11-29 | 2021-09-14 | 北京数码视讯软件技术发展有限公司 | 一种tu划分模式的选择方法及装置、可读存储介质 |
CN111182298B (zh) * | 2020-03-18 | 2022-04-12 | 广州市百果园信息技术有限公司 | 一种编码模式的确定方法、装置、设备和存储介质 |
US11432018B2 (en) | 2020-05-11 | 2022-08-30 | Tencent America LLC | Semi-decoupled partitioning for video coding |
US11388401B2 (en) * | 2020-06-26 | 2022-07-12 | Google Llc | Extended transform partitions for video compression |
US11259055B2 (en) | 2020-07-10 | 2022-02-22 | Tencent America LLC | Extended maximum coding unit size |
US11206428B1 (en) | 2020-07-14 | 2021-12-21 | Tencent America LLC | Method and apparatus for frequency-dependent joint component secondary transform |
US11575937B2 (en) | 2020-07-24 | 2023-02-07 | Tencent America LLC | Methods for efficient application of LGT |
US11310504B2 (en) | 2020-07-30 | 2022-04-19 | Tencent America LLC | Complexity reduction for 32-p and 64-p LGT |
TWI743919B (zh) * | 2020-08-03 | 2021-10-21 | 緯創資通股份有限公司 | 視訊處理裝置及視訊串流的處理方法 |
US11683490B2 (en) | 2020-09-10 | 2023-06-20 | Tencent America LLC | Context adaptive transform set |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6031872A (en) | 1998-06-16 | 2000-02-29 | Daewoo Electronics Co., Ltd. | Method and apparatus for encoding a video signal |
CN101448162B (zh) | 2001-12-17 | 2013-01-02 | 微软公司 | 处理视频图像的方法 |
KR101042623B1 (ko) | 2004-11-17 | 2011-06-20 | 삼성전자주식회사 | 필드 가변분할방식을 이용한 디인터레이싱방법 및 장치 |
JP4937224B2 (ja) * | 2008-09-30 | 2012-05-23 | 株式会社東芝 | 画像符号化装置 |
KR101247923B1 (ko) | 2008-10-03 | 2013-03-26 | 퀄컴 인코포레이티드 | 4×4 및 8×8 보다 큰 변환을 이용한 비디오 코딩 |
US8483285B2 (en) * | 2008-10-03 | 2013-07-09 | Qualcomm Incorporated | Video coding using transforms bigger than 4×4 and 8×8 |
KR102505806B1 (ko) * | 2009-07-01 | 2023-03-06 | 인터디지털 브이씨 홀딩스 인코포레이티드 | 비디오 인코더 및 디코더용 대형 블록에 대한 인트라 예측을 시그널링하기 위한 방법 및 장치 |
KR101452713B1 (ko) * | 2009-10-30 | 2014-10-21 | 삼성전자주식회사 | 픽처 경계의 부호화 단위를 부호화, 복호화 하는 방법 및 장치 |
US20110249743A1 (en) * | 2010-04-09 | 2011-10-13 | Jie Zhao | Super-block for high performance video coding |
-
2011
- 2011-06-09 US US13/156,552 patent/US9788019B2/en active Active
- 2011-08-09 AU AU2011361445A patent/AU2011361445B2/en active Active
- 2011-08-09 WO PCT/CN2011/078149 patent/WO2012119376A1/en active Application Filing
- 2011-08-09 KR KR1020137026588A patent/KR101621330B1/ko active IP Right Grant
- 2011-08-09 CN CN201180064435.7A patent/CN103348651B/zh active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015099506A1 (ko) * | 2013-12-26 | 2015-07-02 | 삼성전자 주식회사 | 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치 |
US10567773B2 (en) | 2013-12-26 | 2020-02-18 | Samsung Electronics Co., Ltd. | Inter-layer video decoding method for performing subblock-based prediction and apparatus therefor, and inter-layer video encoding method for performing subblock-based prediction and apparatus therefor |
Also Published As
Publication number | Publication date |
---|---|
AU2011361445A1 (en) | 2013-07-18 |
AU2011361445B2 (en) | 2015-01-22 |
RU2013145079A (ru) | 2015-04-20 |
CN103348651B (zh) | 2017-06-09 |
KR101621330B1 (ko) | 2016-05-16 |
US20120230411A1 (en) | 2012-09-13 |
WO2012119376A1 (en) | 2012-09-13 |
CN103348651A (zh) | 2013-10-09 |
US9788019B2 (en) | 2017-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101621330B1 (ko) | 복잡도가 감소된 변환 단위 파티션의 방법 및 장치 | |
CN109804626B (zh) | 用于对图像进行编码和解码的方法和设备以及用于存储比特流的记录介质 | |
KR101972030B1 (ko) | 오류 내성을 향상시킨 비디오 인코딩 및 디코딩 | |
KR102006443B1 (ko) | 오차 보상을 이용한 영상 부호화/복호화 방법 및 장치 | |
KR20100136962A (ko) | 비디오 인코딩 및 디코딩시 묵시적 블록 분할을 위한 방법 및 장치 | |
TW201511525A (zh) | 用於編碼單元的視訊編碼的局部多重假設預測的執行方法及裝置 | |
CN109845256A (zh) | 影像编码方法/装置、影像解码方法/装置以及保存有比特流的记录介质 | |
US10652549B2 (en) | Video coding device, video coding method, video decoding device, and video decoding method | |
JP6528635B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
RU2574839C2 (ru) | Способ и устройство сегментирования на единицы преобразования с меньшей сложностью |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190425 Year of fee payment: 4 |