KR20180111839A - 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 인코딩/디코딩하기 위한 방법 및 디바이스 - Google Patents

휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 인코딩/디코딩하기 위한 방법 및 디바이스 Download PDF

Info

Publication number
KR20180111839A
KR20180111839A KR1020187022905A KR20187022905A KR20180111839A KR 20180111839 A KR20180111839 A KR 20180111839A KR 1020187022905 A KR1020187022905 A KR 1020187022905A KR 20187022905 A KR20187022905 A KR 20187022905A KR 20180111839 A KR20180111839 A KR 20180111839A
Authority
KR
South Korea
Prior art keywords
coding tree
chroma
unit
chroma coding
image
Prior art date
Application number
KR1020187022905A
Other languages
English (en)
Inventor
파브리스 위르방
프랑크 갈팡
땅기 푸아리에
파브리쓰 르레아넥
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20180111839A publication Critical patent/KR20180111839A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)

Abstract

본 원리들은 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현된 이미지 데이터를 포함하는 이미지 유닛을 인코딩하기 위한 방법에 관한 것으로, 방법은 상기 이미지 유닛의 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리를 획득하는 단계, 및 상기 이미지 유닛의 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리를 획득하는 단계를 포함한다. 방법은 상기 크로마 코딩 트리를 획득하는 단계가: - 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 결정하는 단계; 및 - 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 시그널링하는 단계를 포함하는 것을 특징으로 한다.

Description

휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 인코딩/디코딩하기 위한 방법 및 디바이스
본 원리들은 일반적으로 이미지/비디오 인코딩 및 디코딩에 관한 것이다.
본 섹션은 이하에서 설명 및/또는 청구되는 본 원리들의 다양한 양태들과 관련될 수 있는 다양한 양태들의 기술을 독자에게 소개하고자 한다. 이 논의는 본 원리들의 다양한 양태들을 보다 잘 이해할 수 있도록 배경 정보를 독자에게 제공하는 데 도움이 될 것으로 여겨진다. 따라서, 이러한 서술들은 선행 기술의 용인이 아니라 이러한 견지에서 읽혀져야 함을 이해해야 한다.
이하에서, 이미지 데이터는, 예를 들어, 이미지(또는 비디오)의 픽셀 값들에 관한 모든 정보 및 이미지(또는 비디오)를 시각화 및/또는 디코딩하기 위해 디스플레이 및/또는 임의의 다른 디바이스에 의해 이용될 수 있는 모든 정보를 특정하는 특정 이미지/비디오 포맷으로 샘플들(픽셀 데이터)의 하나 또는 몇몇 어레이를 포함한다.
이미지 데이터는 샘플들의 제1 어레이의 형상이며 통상적으로 루마(luma)(또는 휘도(luminance)) 컴포넌트인 적어도 하나의 컴포넌트, 및, 가능하게는, 샘플들의 적어도 하나의 다른 어레이의 형상이며 통상적으로 컬러 컴포넌트인 적어도 하나의 다른 컴포넌트를 포함한다. 또는, 등가적으로, 동일한 이미지 데이터는, 전통적인 3색 RGB 표현과 같은, 컬러 샘플들의 어레이들의 세트에 의해 또한 표현될 수 있다.
픽셀에 관한 픽셀 데이터는 C개 값들의 벡터로 표현되며, 여기서 C는 컴포넌트들의 개수이다. 벡터의 각각의 값은 픽셀 값들의 최대 동적 범위를 정의하는 다수의 비트들로 표현된다.
이미지 유닛은 휘도 채널 및 적어도 하나의 색차(chrominance) 채널에 의해 표현되는 이미지 데이터를 포함한다. 전형적으로, 이미지 데이터는 널리 공지된 YCbCr, YUV, RGB 색 공간들로 표현될 수 있지만, 본 원리들은 특정 컬러 공간으로 제한되지 않는다. 따라서, 이미지 유닛은 이미지 유닛의 휘도 채널을 표현하는 루마 유닛, 및 이미지 유닛의 색차 채널을 표현하는 적어도 하나의 크로마(chroma) 유닛을 포함한다.
이미지 유닛의 비-제한적 예는 HEVC에 정의된 코딩 유닛 또는 변환 유닛, 또는 대부분의 MPEG 표준에 정의된 블록 또는 매크로블록이다. 이미지 유닛은 이미지의 임의의 정사각형 또는 직사각형 부분일 수 있다.
H.265/HEVC(고효율 비디오 코딩(HEVC), 권고안 ITU-T H.265 | 국제 표준 ISO/IEC 23008-2, 10/2014)와 같은 일부 비디오 압축 표준에서, 이미지의 시퀀스(비디오)의 이미지는, 전형적으로 64x64, 128x128, 또는 256x256 픽셀 크기인, 소위 코딩 트리 유닛(Coding-tree Units; CTU)으로 나뉘어진다.
도 1에 도시된 바와 같이 각각의 CTU는 압축된 도메인에서 코딩 트리에 의해 표현된다. 예시된 바와 같이, 이는 CTU의 쿼드 트리 파티셔닝(quad-tree partitioning)(분할(division), 분할(splitting))일 수 있으며, 각각의 리프(leaf)는 코딩 유닛(CU)이라 불린다. 코딩 유닛(CU)은 이미지 유닛을 코딩하기 위한 주요 정보를 포함하며, 예측 유닛(Prediction Units; PU)과 변환 유닛(Transform Units; TU)으로 더 분할될 수 있다. 예측 유닛(PU)은 이미지 유닛 내의 픽셀 값들을 예측하기 위한 정보를 포함하고, 변환 유닛(TU)은 변환이 적용되는 이미지 유닛의 픽셀들을 표현하므로 인코딩 프로세스의 나머지 부분을 표현한다.
HEVC 표준에서, 두 가지 기하학들, 즉 예측 파티셔닝 및 변환 파티셔닝이 공존하며, 두 가지 주요 경우들이 인트라 예측에서 발생한다:
1) 현재의 변환 유닛(TU)과 예측 유닛(PU)은 같은 크기이다.
2) 예측 유닛(PU)은 네 개의 변환 유닛(TU)들로 구성되며, 각각의 변환 유닛(TU)은 분할될 수 있다.
두 번째 경우, (YUV 비디오의 경우에) 루마 및 크로마 채널은 (크로마 TU들이 분할될 수 없는 4:2:0 또는 4:2:2 샘플링의 작은 블록들을 제외하고는) 동일한 파티셔닝(쿼드 트리)을 따른다.
예측은 동일 또는 다른 이미지로부터 이전에 디코딩된 픽셀들에 의존하고, 그 다음에 나머지는 변환 유닛 TU 쿼드 트리를 따라 변환된다. PU는 쿼드 트리 방식으로 더 작은 TU들로 더 분할될 수 있는 여러 개의 더 작은 TU들을 포함될 수 있다. 이 경우에, 크로마 TU들은 루마 TU 쿼드 트리를 따른다. 작은 블록들에 대해서는, 4:4:4 샘플링이 아닌 경우, 크로마 TU들은 분할될 수 없다.
도 2는 쿼드 트리(잔여 쿼드 트리(Residual Quad-Tree; RQT))를 이용하여 TU들로 세그먼트화한 예를 보여준다. TU들로의 파티셔닝이 시그널링되고, 최대 및 최소 변환 크기들이 슬라이스 헤더에 시그널링된다. 이들 경계들 사이의 쿼드 트리 노드들의 경우, 서브분할 플래그들(subdivision flags)이 코딩된다. 동일한 RQT가 각각의 CU의 루마 및 크로마 컴포넌트 모두에 대해 이용된다.
H.265/HEVC에서는, 각각의 CU의 루마 및 크로마 컴포넌트 모두에 대해 오직 하나의 RQT만이 전송된다. TU 코딩 트리가 깊을 때, 이것은 코딩된 계수로 유리하게 대체될 수 있는 크로마 유닛에 대한 시그널링 비용을 생성한다.
이와 반대로, 크로마 및 루마 컴포넌트의 파티셔닝을 분리하는 것이 MediaTek Inc의 "차세대 비디오 코딩을 위한 블록 파티셔닝 구조", ITU-T SG16, COM 16-C 966 R3-E, 제네바, 2015년 10월)에서 제안되었으며, 여기서 각각의 이미지 유닛에 대해 두 개의 별개의 코딩 트리들이 정의되는데, 하나는 루마(Luma)에 대한 것이고 다른 하나는 크로마(Chroma)에 대한 것이다. 코딩 트리는 비-제한적 예들에 따라 이미지 유닛을 코딩하는 데 이용되는 쿼드 트리, 바이너리 트리, 또는 트리플 트리일 수 있다.
이 솔루션은, 이미지 유닛과 관련된 루마 유닛 및 크로마 유닛을 분할함으로써 각각 획득된, 완전히 분리된 루마 및 크로마 코딩 트리를 생성하지만, 추가 시그널링 비용을 야기한다.
분리된 코딩 트리들이 상기 이미지 유닛과 관련된 루마 및 크로마 유닛을 코딩하는 데 이용될 때, 본 원리들에 의해 해결되는 문제점은 이미지 유닛의 코딩 효율을 향상시키는 것이다.
더 일반적으로, 해결되어야 할 문제점은 다중 채널들에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 효율적으로 압축하는 방법이다.
다음은 본 원리들의 일부 양태들의 기본적인 이해를 제공하기 위해 본 원리들의 간략화된 요약을 제시한다. 이러한 요약은 본 원리들의 광범위한 개요는 아니다. 이는 본 원리들의 핵심 또는 중요 요소들을 식별하도록 의도되지 않는다. 후속하는 요약은 단지 하기에 제공된 보다 상세한 설명에 대한 서문으로서 간략화된 형태로 본 원리들의 일부 양태들을 제시한다.
본 원리들은 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현된 이미지 데이터를 포함하는 이미지 유닛을 인코딩하기 위한 방법을 이용하여 선행 기술의 단점들 중 적어도 하나를 개선하기 위해 착수되었다. 방법은 상기 이미지 유닛의 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리를 획득하는 단계, 및 상기 이미지 유닛의 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리를 획득하는 단계를 포함한다. 본 원리들에 따르면, 상기 크로마 코딩 트리를 획득하는 단계는:
- 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 결정하는 단계; 및
- 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 시그널링하는 단계
를 포함한다.
또 다른 양태들에 따르면, 본 원리들은 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 디코딩하기 위한 방법에 관한 것이다. 방법은 상기 이미지 유닛의 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리를 획득하는 단계, 및 상기 이미지 유닛의 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리를 획득하는 단계를 포함한다. 본 원리들에 따르면, 상기 크로마 코딩 트리를 획득하는 단계는:
- 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 결정하는 단계; 및
- 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 시그널링하는 단계
를 포함한다.
다른 양태들에 따르면, 본 원리들은, 상기 방법들을 구현하도록 구성된 프로세서를 포함하는 디바이스, 픽처 데이터를 포함하는 이미지 유닛과 관련된 신택스 요소(syntax element)를 갖는 신호, 프로그램이 컴퓨터 상에서 실행될 때 상기 방법의 단계들을 실행하기 위한 프로그램 코드 명령어들을 포함하는 컴퓨터 프로그램 제품, 및 상기 프로그램이 컴퓨팅 디바이스 상에서 실행될 때 상기 방법의 단계들을 실행하기 위한 프로그램 코드의 명령어들을 운반하는 비일시적 저장 매체에 관한 것이다.
본 원리들의 특정 본질뿐만 아니라 본 원리들의 다른 목적들, 이점들, 특징들 및 용도들은 첨부 도면들과 함께 취해지는 다음의 설명으로부터 명백해질 것이다.
도면들에서, 본 원리들의 예들이 예시된다.
도 1은 예측 및 변환 파티셔닝의 전체 비디오 구조를 예시한다.
도 2는 쿼드 트리를 이용한 TU들로의 세그먼트화의 예를 도시한다.
도 3은 본 원리들의 예에 따른 independantChromaTuFlag 신택스 요소에 의존하는 루마 및 크로마 코딩 트리 분할의 예를 도시한다.
도 4는 본 원리들의 예에 따른 변환 트리의 신택스의 예를 도시한다.
도 5는 본 원리들의 예에 따른 변환 유닛의 신택스의 예를 도시한다.
도 6은 본 원리들의 예에 따른 independantChromaTuFlag 신택스 요소에 의존하는 루마 및 크로마 코딩 트리 분할의 또 다른 예를 도시한다.
도 7은 본 원리들의 예에 따른 디바이스의 아키텍처의 예를 도시한다.
도 8은 본 원리들의 예에 따른 통신 네트워크를 통해 통신하는 두 개의 원격 디바이스들을 도시한다.
도 9는 본 원리들의 예에 따른 신호의 신택스를 도시한다.
유사한 또는 동일한 요소들은 동일한 참조 번호로 참조된다.
본 원리들은 본 원리들의 예들이 도시된 첨부 도면들을 참조하여 하기에 더 완전히 설명될 것이다. 그러나, 본 원리들은 많은 대안적인 형태들로 구현될 수 있으며, 본 명세서에서 설명되는 예들에 제한되는 것으로서 해석되지 않아야 한다. 따라서, 본 원리들이 다양한 수정들 및 대안적인 형태들에 대해 용이하지만, 본 원리들의 특정 예들이 도면들에 예로서 도시되며, 본 명세서에서 상세히 기술될 것이다. 그러나, 본 원리들을 개시된 특정 형태들로 제한하려는 의도는 존재하지 않지만, 반면 본 개시내용이 청구 범위에 의해 정의된 바와 같은 본 원리들의 사상 및 범위 내에 드는 모든 수정들, 등가물들, 및 대안들을 커버할 것임이 이해되어야 한다.
본 명세서에서 이용되는 용어는 오직 특정 예들을 설명할 목적이며, 본 원리들의 제한인 것으로 의도되지 않는다. 본 명세서에서 이용되는 바와 같이, 단수 형태들("a", "an" 및 "the")은, 맥락이 다른 방식으로 명료하게 표시하지 않는 한, 역시 복수 형태들을 포함하도록 의도된다. 용어들 "포함한다(comprises)", "포함하는(comprising)", "포함한다(includes)" 및/또는 "포함하는(including)"은, 본 명세서에서 이용될 때, 언급된 특징들, 정수들, 단계들, 동작들, 요소들, 및/또는 컴포넌트들의 존재를 특정하지만, 하나 이상의 다른 특징들, 정수들, 단계들, 동작들, 요소들, 컴포넌트들, 및/또는 이들의 그룹들의 존재 또는 추가를 불가능하게 하지 않는다는 것이 추가로 이해될 것이다. 또한, 요소가 다른 요소에 "응답하는(responsive)" 또는 "접속되는(connected)" 것으로서 지칭될 때, 그것은 다른 요소에 직접 응답하거나 접속될 수 있거나, 또는 중재 요소들이 존재할 수 있다. 반면, 요소가 다른 요소에 "직접 응답하는" 또는 "직접 접속되는" 것으로서 지칭될 때, 중재 요소들이 존재하지 않는다. 본 명세서에서 이용되는 바와 같이, 용어 "및/또는"은 연관된 열거된 항목들 중 임의의 것 및 이들 중 하나 이상의 모든 조합들을 포함하며, "/"로서 축약될 수 있다.
용어들 제1, 제2 등이 다양한 요소들을 설명하기 위해 본 명세서에서 이용될 수 있지만, 이러한 요소들이 이러한 용어들에 의해 제한되지 않아야 한다는 것이 이해될 것이다. 이러한 용어들은 하나의 요소를 다른 요소와 단지 구별하기 위해 이용된다. 예를 들어, 본 원리들의 교시들로부터 벗어나지 않고, 제1 요소는 제2 요소라 지칭될 수 있고, 유사하게, 제2 요소는 제1 요소라 지칭될 수 있다.
도면들 중 일부가 주요 통신 방향을 도시하기 위한 통신 경로들 상의 화살표들을 포함하지만, 통신이 도시된 화살표들에 대해 반대 방향으로 발생할 수 있음이 이해되어야 한다.
일부 예들은, 각각의 블록이, 회로 요소, 모듈, 또는 특정된 논리 함수(들)를 구현하기 위한 하나 이상의 실행 가능한 명령어를 포함하는 코드의 일부를 나타내는 블록도들 및 동작 흐름도들에 관해 설명된다. 다른 구현예들에서, 블록들에서 언급된 기능(들)이 언급된 순서를 벗어나 발생할 수 있다는 것에 또한 유의해야 한다. 예를 들어, 수반되는 기능성에 따라, 연속적으로 도시되는 두 개의 블록들이 실제로 실질적으로 동시에 실행될 수 있거나, 또는 블록들이 때때로 역순서로 실행될 수 있다.
본 명세서에서의 "예에 따라" 또는 "예에서"에 대한 언급은, 예와 관련하여 설명되는 특정 특징, 구조, 또는 특성이 본 원리들의 적어도 하나의 구현예에 포함될 수 있음을 의미한다. 본 명세서 내의 다양한 곳들에서의 구문 "예에 따라" 또는 "예에서"의 출현은 반드시 모두가 동일한 예를 지칭하지는 않으며, 다른 예들에 대해 반드시 상호 배타적인 별도의 또는 대안적인 예들도 아니다.
청구 범위에 나타나는 참조 번호들은 단지 예시를 위한 것이며, 청구 범위의 범위에 대한 제한적인 효력을 갖지 않는다.
명시적으로 기술되지는 않았지만, 본 예들 및 변형예들은 임의의 조합 또는 서브조합으로 이용될 수 있다.
본 원리들은 이미지의 이미지 유닛을 인코딩/디코딩하는 것에 대해 설명되지만, 시퀀스의 각각의 이미지의 각각의 이미지 유닛이 하기에 설명되는 바와 같이 순차적으로 인코딩/디코딩되기 때문에, 이미지들의 시퀀스(비디오)의 이미지 유닛들을 인코딩/디코딩하는 것으로 확장한다.
본 원리들은 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 인코딩하기 위한 방법에 관한 것이다.
방법은 상기 이미지 유닛의 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리(LUMAQ)를 획득하고, 상기 이미지 유닛의 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리(CHROQ)를 획득한다.
상기 크로마 코딩 트리(CHROQ)를 획득하는 단계는 상기 크로마 코딩 트리(CHROQ) 및 상기 루마 코딩 트리(LUMAQ)가 동일한지 여부를 결정하는 단계, 및 신호(S)에서 상기 크로마 코딩 트리(CHROQ) 및 상기 루마 코딩 트리(LUMAQ)가 동일한지 여부를 표시하는 정보 데이터(INFO)를 시그널링하는 단계를 포함한다.
이는 크로마 및 루마 코딩 트리를 인코딩하는 데 이용되는 추가적인 신택스가 이들 두 개의 코딩 트리들의 개별 코딩과 비교하여 제한되기 때문에 선행 기술에 비해 코딩 효율성을 향상시킨다.
실시예에 따르면, 정보 데이터(INFO)는 크로마 코딩 트리(CHROQ) 및 루마 코딩 트리(LUMAQ)가 동일한 경우 제1 값이고, 그렇지 않으면 제2 값인 플래그이다.
실시예에 따르면, 정보 데이터(INFO)가 상기 제2 값과 동일한 경우, 정보 데이터(INFO)는 색차 유닛이 분할되지 않음을 더 표시한다.
도 3은 이미지 유닛이 HEVC에서 정의된 잔여 변환 유닛(TU)이고 정보 데이터(INFO)가 independantChromaTuFlag로 표시된 플래그인 경우의 루마 및 크로마 코딩 트리의 예를 도시한다.
independantChromaTuFlag=0인 경우, 루마 및 크로마 코딩 트리는 동일하고(도 3의 하단 부분), independantChromaTuFlag=1인 경우, 루마 및 크로마 코딩 트리는 동일하지 않다(도 3의 상단 부분).
변형예에 따르면, 플래그 independantChromaTuFlag는 도 4에 도시된 바와 같이 HEVC 사양의 "transform_tree" 신택스 요소에 포함된 추가 신택스 요소로서 코딩된다(HEVC, 섹션 7.3.8.8 변형 트리 신택스).
도 5는 변환 유닛의 신택스의 예를 도시한다.
도 3에 예시된 실시예에 따르면, 상기 크로마 및 루마 코딩 트리가 동일하지 않은 것으로 결정된 경우, 만약 상기 크로마 코딩 트리(CHROQ)의 적어도 하나의 리프(L)의 크기가 최대 크기(MS)(예를 들어, MS는 인코딩될 이미지 유닛의 크기와 동일함)보다 크다면, 상기 적어도 하나의 리프(L)는 상기 크로마 코딩 트리(CHROQ)의 리프들의 크기들이 상기 최대 크기(MS)에 도달할 때까지 재귀적으로(recursively) 분할된다.
도 3에서, 크로마 코딩 트리(CHROQ)의 리프들은(도 3의 상단) 현재 리프들의 크기가 TU 크기의 최대 크기(MS)와 동일하기 때문에 분할되지 않다.
그 결과 크로마 코딩 트리(CHROQ)의 리프들의 크기는 (주어진 최대 크기(MS)의 제한 내에서) 가능한 한 크다.
분할 전략은 크로마 코딩 트리(CHROQ)의 현재 리프들의 크기를 가능한 크게 유지할지 아니면 그것들을 분할할지를 비율/왜곡 최적화에 의해 최적으로 결정할 수 있다. 예로서, 인코딩될 각각의 이미지 유닛에 대해, 코딩은 independantChromaTuFlag=0인 경우와 independantChromaTuFlag=1인 경우, 즉, 루마 코딩 트리(LUMAQ)에 따라 색차 채널을 분할하거나 분할하지 않는 경우에 대해 수행되며, 왜곡 및 비트율(bit-rate)은 두 경우 모두에 대해 계산되고 최적의 비율/왜곡 절충안이 유지, 즉 플래그 값이 최저의 비율/왜곡 J=D + lambda * rateCost로 이어지며, 여기서 D는 소스(원본 이미지 유닛)와 재구성된 블록(디코딩된 이미지 유닛) 사이의 L2 표준(norm)이고, rateCost는 코딩된 비트 스트림 조각의 비트 카운트이며, lambda는 코딩 파라미터이다. 이 기술은 널리 공지되어 있으며, MPEG/ITU H.264/AVC의 Joint Model, H.265/HEVC의 참조 소프트웨어, 및 Joint Exploration Model 인코딩 방법들 "고효율 비디오 코딩(HEVC) 테스트 모델 16(HM 16) 인코더 설명, JCTVC-R1002, 일본 삿포로, 2014년 6월 30일 - 7월 7일"에서 사용된다.
실시예에 따르면, 크로마 및 루마 코딩 트리는 주어진 분해 레벨까지 동일하고, 더 높은 분해 레벨들을 위해 크로마 코딩 트리(CHROQ)의 리프들의 분할을 중지한다.
실시예에 따르면, 크로마 코딩 트리(CHROQ)의 적어도 하나의 분해 레벨이 분할될 때 정보 데이터(INFO)는 상기 적어도 하나의 분해 레벨에 대해 시그널링되고, 상기 정보 데이터(INFO)는 크로마 코딩 트리의 상기 적어도 하나의 분해 레벨이 루마 코딩 트리의 동일한 레벨의 분할을 따르는지 여부를 표시한다.
변형예에 따르면, 상기 정보 데이터(INFO)는 크로마 코딩 트리(CHROQ)의 리프의 분할을 중지할 때를 추가로 표시한다.
도 6은 본 원리들의 예에 따라 채널 유형마다 또는 컴포넌트마다 별도의 CU 코딩 트리의 예를 도시한다.
여기서, 예를 들어, 이미지 유닛이 HEVC에서 정의된 잔여 변환 유닛(TU)이고 정보 데이터(INFO)가 independantChromaTuFlag로 표시된 플래그일 때, 최적의 루마 및 크로마 코딩 트리가 획득된다.
상기 최적 분할에 이어서, CTU의 CU의 제1 분해 레벨에서, 상기 CU에 관하여, 색차 유닛은 네 개의 서브유닛들(1 내지 4)로 분할된다. 제2 분해 레벨에서, 크로마 서브유닛들(1 내지 3)은 더 이상 분할되지 않고, independantChromaTuFlag=1이 상기 크로마 하위유닛(1)에 대해 시그널링된다. (대응되는 루마 서브유닛들이 분할되지 않기 때문에) independantChromaTuFlag는 서브유닛(2 및 3)에 대해 전송되지 않는다. 크로마 서브유닛(4)은 네 개의 다른 서브유닛(41 내지 44)으로 더 분할되고, independantChromaTuFlag=0은 상기 서브유닛(4)에 대해 시그널링된다. 마지막으로, 서브유닛(41 내지 44)는 더 이상 분할되지 않고, independantChromaTuFlag=1은 상기 크로마 서브유닛(41)에 대해 시그널링된다(independantChromaTuFlag는 서브유닛들(2 내지 4)에 대해 전송되지 않는다).
이는 위의 실시예보다 더 많은 전송될 신택스를 초래하지만, 동일한 분해 레벨에서 최대 크기(MS)와 루마 코딩 트리(LUMAQ)의 리프들의 크기 사이에서, 크로마 코딩 트리의 리프들에 대한 최적 크기를 결정할 수 있게 한다.
실시예들 및 변형예들 각각은 크로마 채널마다 수행될 수 있음, 즉, 크로마 코딩 트리가 각각의 색차 채널에 대해 계산됨에 주목해야 한다. 다음으로, 정보 데이터(INFO)는 각각의 색차 채널에 대해 시그널링된다.
본 원리들은 또한 이미지를 인코딩하기 위한 방법에 관한 것으로, 상기 이미지는 본 원리들에 따라 위에 설명된 인코딩 방법에 따라 인코딩된 적어도 하나의 이미지 유닛을 포함한다.
본 원리들은 또한 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현된 이미지 데이터를 포함하는 이미지 유닛을 디코딩하기 위한 방법에 관한 것이다. 방법은 상기 이미지 유닛의 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리를 획득하고, 상기 이미지 유닛의 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리를 획득한다.
상기 크로마 코딩 트리를 획득하는 단계는 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 결정하는 단계를 포함한다. 방법은 또한 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 시그널링한다.
디코딩 방법의 다양한 실시예들 및 변형예들은 인코딩 방법의 위의 설명으로부터, 특히 도 1 내지 도 6의 설명으로부터 용이하게 추론될 수 있다.
예를 들어, 디코딩 방법은, 신호 또는 메모리로부터, 크로마 코딩 트리(CHROQ) 및 루마 코딩 트리(LUMQ)가 동일한지 여부를 표시하는 정보 데이터(INFO)를 획득하는 단계를 포함한다. 상기 정보 데이터(INFO)는 크로마 코딩 트리 및 루마 코딩 트리가 동일한 경우 제1 값과 동일하고, 그렇지 않은 경우 제2 값과 동일한 플래그일 수 있다. 상기 정보 데이터(INFO)는, 상기 제2 값과 동일할 때(즉, 크로마 코딩 트리 및 루마 코딩 트리가 동일하지 않을 때), 또한 색차 유닛이 분할되지 않음을 표시할 수 있다.
또한, 본 원리들은 이미지를 디코딩하기 위한 방법에 관한 것으로, 상기 이미지는 본 원리들에 따라 위에 설명된 인코딩 방법에 따라 인코딩된 적어도 하나의 이미지 유닛을 포함한다.
도 1 내지 도 6에서, 모듈들은 구별 가능한 물리적 유닛들과 관련될 수 있거나 그렇지 않을 수 있는 기능 유닛들이다. 예를 들어, 이러한 모듈들 또는 이들 중 일부는 고유한 컴포넌트 또는 회로 내에 함께 올 수 있거나, 또는 소프트웨어의 기능성들에 기여한다. 그에 반해, 일부 모듈들은 잠재적으로 별도의 물리적 엔티티들로 구성될 수 있다. 본 원리들과 호환 가능한 장치는 순수 하드웨어를 이용하여, 예를 들어, 각각 ≪주문형 집적 회로(Application Specific Integrated Circuit)≫, ≪필드 프로그래머블 게이트 어레이(Field-Programmable Gate Array)≫, ≪초고밀도 집적 회로(Very Large Scale Integration)≫인 ASIC 또는 FPGA 또는 VLSI와 같은 전용 하드웨어를 이용하여, 또는 디바이스 내에 내장된 몇몇 집적 전자 컴포넌트들로부터 또는 하드웨어 및 소프트웨어 컴포넌트들의 혼합으로부터 구현된다.
도 7은 도 1 내지 도 6와 관련하여 설명되는 방법을 구현하도록 구성될 수 있는 디바이스(120)의 예시적인 아키텍처를 나타낸다.
디바이스(120)는 데이터 및 어드레스 버스(121)에 의해 함께 링크되는 다음 요소들을 포함한다:
- 예를 들어, DSP(또는 디지털 신호 프로세서)인 마이크로프로세서(122)(또는 CPU);
- ROM(또는 판독 전용 메모리)(123);
- RAM(또는 랜덤 액세스 메모리)(124);
- 애플리케이션으로부터, 전송할 데이터를 수신하기 위한 I/O 인터페이스(125); 및
- 배터리(126).
예에 따르면, 배터리(126)는 디바이스에 대해 외부에 있다. 언급된 메모리 각각에서, 명세서에서 이용되는 단어 ≪레지스터(register)≫는 작은 용량(일부 비트들)의 영역 또는 매우 큰 영역(예를 들어, 전체 프로그램 또는 대량의 수신된 또는 디코딩된 데이터)에 대응할 수 있다. ROM(123)은 적어도 프로그램 및 파라미터들을 포함한다. ROM(123)은 본 원리들에 따라 기술들을 수행하기 위한 알고리즘들 및 명령어들을 저장할 수 있다. 전원이 켜지면, CPU(122)는 RAM에 프로그램을 업로드하고 대응하는 명령어들을 실행한다.
RAM(124)은, 레지스터 내에, CPU(122)에 의해 실행되고 디바이스(120)의 전원이 켜진 후에 업로드되는 프로그램, 레지스터 내의 입력 데이터, 레지스터 내의 방법의 상이한 상태들의 중간 데이터, 및 레지스터 내의 방법의 실행에 이용된 다른 변수들을 포함한다.
본 명세서에 설명된 구현예들은, 예를 들어, 방법 또는 프로세스, 장치, 소프트웨어 프로그램, 데이터 스트림, 또는 신호로 구현될 수 있다. 단일 형태의 구현예의 맥락에서만 논의되더라도(예를 들어, 방법 또는 디바이스로서만 논의되더라도), 논의되는 특징들의 구현예는 또한 다른 형태들(예를 들어, 프로그램)로 구현될 수 있다. 장치는, 예를 들어, 적절한 하드웨어, 소프트웨어, 및 펌웨어로 구현될 수 있다. 예를 들어, 방법들은, 예를 들어 컴퓨터, 마이크로프로세서, 집적회로, 또는 프로그래밍 가능한 로직 디바이스를 포함하는, 일반적으로 처리 디바이스들이라 지칭되는, 예를 들어 프로세서와 같은 장치에서 구현될 수 있다. 프로세서들은 또한, 예를 들어, 컴퓨터들, 셀 폰들, 휴대용/개인용 디지털 정보 단말기("PDA")들, 및 최종 사용자들 간의 정보의 통신을 용이하게 하는 다른 디바이스들과 같은 통신 디바이스들을 포함한다.
인코딩 또는 인코더의 예에 따르면, 이미지 유닛을 포함하는 이미지 또는 인코딩될 이미지 유닛은 소스로부터 획득된다. 예를 들어, 소스는:
- 로컬 메모리(123 또는 124), 예를 들어, 비디오 메모리 또는 RAM(또는 랜덤 액세스 메모리), 플래시 메모리, ROM(또는 판독 전용 메모리), 하드 디스크;
- 저장 인터페이스(125), 예를 들어, 대용량 저장소, RAM, 플래시 메모리, ROM, 광학 디스크 또는 자기 지원과의 인터페이스;
- 통신 인터페이스(125), 예를 들어, 유선 인터페이스(예를 들어, 버스 인터페이스, 광역 네트워크 인터페이스, 로컬 영역 네트워크 인터페이스) 또는 무선 인터페이스(예컨대, IEEE 802.11 인터페이스 또는 Bluetooth® 인터페이스); 및
- 이미지 캡쳐 회로(예를 들어, CCD(또는 전하 결합 소자(Charge-Coupled Device)) 또는 CMOS(또는 상보성 금속-산화물 반도체(Complementary Metal-Oxide-Semiconductor))와 같은 센서)
를 포함하는 세트에 속한다.
디코딩 또는 디코더의 예에 따르면, 디코딩된 이미지 유닛 또는 디코딩된 이미지 유닛을 포함하는 디코딩된 이미지는 목적지로 송신되며; 구체적으로, 목적지는:
- 로컬 메모리(123 또는 124), 예를 들어, 비디오 메모리 또는 RAM, 플래시 메모리, 하드 디스크;
- 저장 인터페이스(125), 예를 들어, 대용량 저장소, RAM, 플래시 메모리, ROM, 광학 디스크 또는 자기 지원과의 인터페이스;
- 통신 인터페이스(125), 예를 들어, 유선 인터페이스(예를 들어, 버스 인터페이스(예를 들어, USB(또는 범용 직렬 버스)), 광역 네트워크 인터페이스, 로컬 영역 네트워크 인터페이스, HDMI(고화질 멀티미디어 인터페이스) 인터페이스) 또는 무선 인터페이스(예컨대, IEEE 802.11 인터페이스, WiFi® 또는 Bluetooth® 인터페이스); 및
- 디스플레이
를 포함하는 세트에 속한다.
인코딩 또는 인코더의 예들에 따라, 신호(S)가 생성된다.
신호(S)는 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현된 픽처 데이터를 포함하는 이미지 유닛과 관련된 신택스 요소를 갖는다. 상기 신택스 요소는 상기 이미지 유닛의 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 획득된 루마 코딩 트리 및 상기 이미지 유닛의 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 획득된 크로마 코딩 트리를 정의한다. 신호는 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터(INFO)를 포함하도록 포맷되고, 상기 정보 데이터(INFO)는 상기 크로마 및 루마 코딩 트리들이 동일하지 않은 경우 색차 유닛이 분할되지 않음을 추가로 표시한다.
변형예에 따르면, 상기 정보 데이터는 크로마 코딩 트리의 상기 적어도 하나의 분해 레벨이 루마 코딩 트리의 동일한 레벨의 분할을 따르는지 여부를 추가로 표시한다.
신호(S)는 목적지로 송신된다. 예를 들어, 신호(S)는 로컬 또는 원격 메모리, 예를 들어, 비디오 메모리(124) 또는 RAM(124), 하드 디스크(123)에 저장된다. 변형예에서, 신호(S)는 저장 인터페이스(125), 예를 들어, 대용량 저장소, 플래시 메모리, ROM, 광학 디스크 또는 자기 지원과의 인터페이스로 송신되고/되거나, 통신 인터페이스(125), 예를 들어, 점 대 점 링크, 통신 버스, 점 대 다점 링크 또는 방송 네트워크에 대한 인터페이스를 통해 전송된다.
디코딩 또는 디코더의 예들에 따르면, 신호(S)는 소스로부터 획득된다. 예시적으로, 신호(S)는 로컬 메모리, 예를 들어, 비디오 메모리(124), RAM(124), ROM(123), 플래시 메모리(123) 또는 하드 디스크(123)로부터 판독된다. 변형예에서, 비트스트림은 저장 인터페이스(125), 예를 들어, 대용량 저장소, RAM, ROM, 플래시 메모리, 광학 디스크 또는 자기 지원과의 인터페이스로부터 수신되고/거나 통신 인터페이스(125), 예를 들어, 점 대 점 링크, 버스, 점 대 다점 링크 또는 방송 네트워크에 대한 인터페이스로부터 수신된다.
예들에 따르면, 도 1 내지 도 6과 관련하여 설명된 인코딩 방법을 구현하도록 구성된 디바이스(120)는:
- 모바일 디바이스;
- 통신 디바이스;
- 게임 디바이스;
- 태블릿(또는 태블릿 컴퓨터);
- 랩톱;
- 정지 이미지 카메라;
- 비디오 카메라;
- 인코딩 칩;
- 정지 이미지 서버; 및
- 비디오 서버(예를 들어, 방송 서버, 주문형 비디오(video-on-demand) 서버 또는 웹 서버)
를 포함하는 세트에 속한다.
예들에 따르면, 상술한 디코딩 방법을 구현하도록 구성된 디바이스(120)는:
- 모바일 디바이스;
- 통신 디바이스;
- 게임 디바이스;
- 셋톱 박스;
- TV 세트;
- 태블릿(또는 태블릿 컴퓨터);
- 랩톱;
- 디스플레이; 및
- 디코딩 칩
을 포함하는 세트에 속한다.
도 8에 예시된 본 원리들의 예에 따르면, 통신 네트워크 NET를 통한 두 개의 원격 디바이스들(A 및 B) 사이의 전송 맥락에서, 디바이스(A)는 상술한 바와 같이 이미지 유닛 또는 적어도 하나의 이미지 유닛을 포함하는 이미지를 인코딩하기 위한 방법을 구현하도록 구성된 메모리 RAM 및 ROM과 관련된 프로세서를 포함하고, 디바이스(B)는 상술한 바와 같이 디코딩하기 위한 방법을 구현하도록 구성된 메모리 RAM 및 ROM과 관련된 프로세서를 포함한다.
예에 따르면, 네트워크는, 디바이스(A)로부터의 정지 이미지들 또는 비디오 이미지들을 디바이스(B)를 포함하는 디코딩 디바이스들에 방송하도록 적응되는 방송 네트워크이다.
신호(S)는 디바이스(A)에 의해 전송되고 디바이스(B)에 의해 수신되도록 의도된다.
도 9는 데이터가 패킷-기반 전송 프로토콜을 통해 전송될 때의 이러한 신호의 신택스의 예를 도시한다. 각각의 전송되는 패킷(P)은 헤더(H) 및 페이로드(PAYLOAD)를 포함한다. 헤더(H)의 비트는, 예를 들어, 신호(S)에 의해 운송된 정보 데이터를 나타내는 데 전용된다. 변형예에서, 다중 플래그들은 상술한 바와 같은 정보 데이터(INFO)를 나타내는 데 사용될 수 있고, 신호(S)에 의해 운송될 수 있다.
본 명세서에서 설명되는 다양한 프로세스들 및 특징들의 구현예들은 다양한 상이한 장비 또는 애플리케이션들로 구현될 수 있다. 이러한 장비의 예들은 인코더, 디코더, 디코더로부터의 출력을 처리하는 포스트-프로세서(post-processor), 인코더에 입력을 제공하는 프리-프로세서(pre-processor), 비디오 코더, 비디오 디코더, 비디오 코덱, 웹 서버, 셋톱 박스, 랩톱, 개인용 컴퓨터, 셀 폰, PDA, 및 이미지 또는 비디오를 처리하기 위한 임의의 다른 디바이스, 또는 다른 통신 디바이스들을 포함한다. 명백한 바와 같이, 장비는 이동형일 수 있고, 이동 차량(mobile vehicle)에 설치될 수도 있다.
추가로, 방법들은 프로세서에 의해 수행되는 명령어들에 의해 구현될 수 있고, 이러한 명령어들(및/또는 구현예에 의해 생성되는 데이터 값들)은 컴퓨터 판독가능 저장 매체 상에 저장될 수 있다. 컴퓨터 판독가능 저장 매체는 하나 이상의 컴퓨터 판독가능 매체(들)에서 구현되며 컴퓨터에 의해 실행가능한 컴퓨터 판독가능 프로그램 코드가 내장된 컴퓨터 판독가능 프로그램 제품의 형태를 취할 수 있다. 본 명세서에서 이용되는 바와 같은 컴퓨터 판독가능 저장 매체는 그 안에 정보를 저장하기 위한 내재적인 능력뿐만 아니라 그로부터 정보의 검색을 제공하기 위한 내재적인 능력이 주어진 비일시적 저장 매체로 간주된다. 컴퓨터 판독가능 저장 매체는, 예를 들어, 전자, 자기, 광학, 전자기, 적외선, 또는 반도체 시스템, 장치, 또는 디바이스, 또는 이들의 임의의 적절한 조합일 수 있지만, 이에 제한되지 않는다. 다음은, 본 기술분야의 통상의 기술자에 의해 쉽게 이해되는 바와 같이, 본 원리들이 적용될 수 있는 컴퓨터 판독가능 저장 매체들의 더욱 구체적인 예들을 제공하지만, 단지 예시적이며, 완벽한 열거가 아니라는 것이 이해되어야 한다: 휴대용 컴퓨터 디스켓; 하드 디스크; 판독-전용 메모리(ROM); 소거 가능한 프로그래밍 가능한 판독-전용 메모리(EPROM 또는 플래시 메모리); 휴대용 컴팩트 디스크 판독-전용 메모리(CD-ROM); 광학 저장 디바이스; 자기 저장 디바이스; 또는 이들의 임의의 적절한 조합.
명령어들은 프로세서 판독가능 매체 상에 유형적으로 구현되는 애플리케이션 프로그램을 형성할 수 있다.
명령어들은, 예를 들어, 하드웨어, 펌웨어, 소프트웨어, 또는 그 조합에 존재할 수 있다. 명령어들은, 예를 들어, 운영 체제, 별도의 애플리케이션, 또는 이 둘의 조합에서 발견될 수 있다. 따라서, 프로세서는, 예를 들어, 프로세스를 실행하도록 구성되는 디바이스, 및 프로세스를 수행하기 위한 명령어들을 갖는 프로세서 판독가능 매체(예컨대, 저장 디바이스)를 포함하는 디바이스 모두로서 특성화될 수 있다. 또한, 프로세서 판독가능 매체는, 명령어들에 더하여 또는 명령어들 대신에, 구현예에 의해 생성되는 데이터 값들을 저장할 수 있다.
본 기술분야의 통상의 기술자에게 명백할 바와 같이, 구현예들은, 예를 들어, 저장되거나 전송될 수 있는 정보를 운송하도록 포맷팅된 다양한 신호들을 생성할 수 있다. 정보는 예를 들어, 방법을 수행하기 위한 명령어들, 또는 설명된 구현예들 중 하나에 의해 생성되는 데이터를 포함할 수 있다. 예를 들어, 신호는, 본 원리들의 설명된 예의 신택스를 기입하거나 판독하기 위한 규칙들을 데이터로서 운송하도록, 또는 본 원리들의 설명된 예에 의해 기입되는 실제 신택스-값들을 데이터로서 운송하도록 포맷팅될 수 있다. 예를 들어, 이러한 신호는 (예를 들어, 스펙트럼의 무선 주파수 부분을 이용하여) 전자기파로서, 또는 베이스밴드 신호로서 포맷팅될 수 있다. 포맷팅은, 예를 들어, 데이터 스트림을 인코딩하는 것, 및 인코딩된 데이터 스트림을 이용하여 캐리어를 변조하는 것을 포함할 수 있다. 신호가 운송하는 정보는, 예를 들어, 아날로그 또는 디지털 정보일 수 있다. 공지된 바와 같이, 신호는 다양한 상이한 유선 또는 무선 링크들을 통해 전송될 수 있다. 신호는 프로세서 판독가능 매체 상에 저장될 수 있다.
다수의 구현예들이 설명되었다. 그럼에도 불구하고, 다양한 수정들이 이루어질 수 있다는 것이 이해될 것이다. 예를 들어, 다른 구현예들을 생성하기 위해 상이한 구현예들의 요소들이 조합, 보충, 수정, 또는 제거될 수 있다. 게다가, 통상의 기술자는 다른 구조들 및 프로세스들이 개시된 것들을 대체할 수 있고, 결과적인 구현예들이 적어도 실질적으로 동일한 기능(들)을 적어도 실질적으로 동일한 방식(들)으로 수행하여, 개시된 구현예들과 적어도 실질적으로 동일한 결과(들)를 달성할 것임을 이해할 것이다. 따라서, 이러한 구현예들 및 다른 구현예들이 이 출원에 의해 고려된다.

Claims (15)

  1. 휘도 채널(luminance channel) 및 적어도 하나의 색차 채널(chrominance channel)에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 인코딩하기 위한 방법으로서,
    상기 이미지 유닛의 상기 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리(luma coding-tree)를 획득하는 단계; 및
    상기 이미지 유닛의 상기 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리(chroma coding-tree)를 획득하는 단계
    를 포함하고, 상기 크로마 코딩 트리를 획득하는 단계는:
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 결정하는 단계; 및
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 시그널링하는 단계
    를 포함하는 것을 특징으로 하는, 방법.
  2. 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 디코딩하기 위한 방법으로서,
    상기 이미지 유닛의 상기 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리를 획득하는 단계; 및
    상기 이미지 유닛의 상기 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리를 획득하는 단계
    를 포함하고, 상기 크로마 코딩 트리를 획득하는 단계는:
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 결정하는 단계; 및
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 시그널링하는 단계
    를 포함하는 것을 특징으로 하는, 방법.
  3. 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 인코딩하기 위한 디바이스로서,
    상기 이미지 유닛의 상기 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리를 획득하기 위한 수단; 및
    상기 이미지 유닛의 상기 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리를 획득하기 위한 수단
    을 포함하고, 상기 크로마 코딩 트리를 획득하기 위한 수단은:
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 결정하고;
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 시그널링
    하도록 더 구성된 것을 특징으로 하는, 디바이스.
  4. 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 디코딩하기 위한 디바이스로서,
    상기 이미지 유닛의 상기 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 루마 코딩 트리를 획득하기 위한 수단; 및
    상기 이미지 유닛의 상기 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 크로마 코딩 트리를 획득하기 위한 수단
    을 포함하고, 상기 크로마 코딩 트리를 획득하기 위한 수단은:
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 결정하고;
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 시그널링
    하도록 더 구성된 것을 특징으로 하는, 디바이스.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 정보 데이터는, 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한 경우 제1 값과 동일하고, 그렇지 않으면 제2 값인 플래그인, 방법 또는 디바이스.
  6. 제5항에 있어서,
    상기 정보 데이터가 상기 제2 값과 동일할 때, 상기 정보 데이터는 상기 색차 유닛이 분할되지 않음을 더 표시하는, 방법 또는 디바이스.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 크로마 코딩 트리 및 상기 루마 코딩 트리는 동일하지 않은 것으로 결정되며, 상기 크로마 코딩 트리의 적어도 하나의 리프(leaf)의 크기가 최대 크기보다 큰 경우, 상기 적어도 하나의 리프는 상기 크로마 코딩 트리의 리프들의 크기들이 상기 최대 크기에 도달할 때까지 재귀적으로(recursively) 분할되는, 방법 또는 디바이스.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    상기 크로마 코딩 트리 및 상기 루마 코딩 트리는 주어진 분해 레벨(decomposition level)까지 동일하고, 상기 방법은 더 높은 분해 레벨들에 대해 상기 크로마 코딩 트리(CHROQ)의 리프들의 분할을 중지하는, 방법 또는 디바이스.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 적어도 하나의 분해 레벨이 분할될 때 상기 정보 데이터는 상기 크로마 코딩 트리의 적어도 하나의 분해 레벨에 대해 시그널링되고, 상기 정보 데이터는 상기 크로마 코딩 트리의 상기 적어도 하나의 분해 레벨이 상기 루마 코딩 트리의 동일한 레벨의 분할을 따르는지 여부를 표시하는, 방법 및 디바이스.
  10. 적어도 하나의 이미지 유닛을 포함하는 이미지를 인코딩하기 위한 방법으로서,
    상기 적어도 하나의 이미지 유닛은 제1항, 제5항 내지 제9항 중 어느 한 항의 방법에 따라 코딩되는 것을 특징으로 하는, 방법.
  11. 적어도 하나의 이미지 유닛을 포함하는 이미지를 디코딩하기 위한 방법으로서,
    상기 적어도 하나의 이미지 유닛은 제2항, 제5항 내지 제9항 중 어느 한 항의 방법에 따라 디코딩되는 것을 특징으로 하는, 방법.
  12. 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 픽처 데이터를 포함하는 이미지 유닛과 관련된 신택스 요소를 갖는 신호(S)로서,
    상기 신택스 요소는 상기 이미지 유닛의 상기 휘도 채널을 나타내는 휘도 유닛을 분할함으로써 획득된 루마 코딩 트리 및 상기 이미지 유닛의 상기 적어도 하나의 색차 채널을 나타내는 색차 유닛을 분할함으로써 획득된 크로마 코딩 트리를 정의하며, 상기 신호는 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일한지 여부를 표시하는 정보 데이터를 포함하기 위해 포맷되고, 상기 정보 데이터는 상기 크로마 코딩 트리 및 상기 루마 코딩 트리가 동일하지 않을 때 상기 색차 유닛이 분할되지 않음을 더 표시하는 것을 특징으로 하는, 신호.
  13. 제12항에 있어서,
    상기 정보 데이터는 상기 크로마 코딩 트리의 상기 적어도 하나의 분해 레벨이 상기 루마 코딩 트리의 동일한 레벨의 분할을 따르는지 여부를 더 표시하는, 신호.
  14. 컴퓨터 프로그램 제품으로서,
    프로그램이 컴퓨터 상에서 실행될 때, 제1항, 제2항, 제5항 내지 제9항 중 어느 한 항의 방법의 단계들을 실행하기 위한 프로그램 코드 명령어들을 포함하는 컴퓨터 프로그램 제품.
  15. 비일시적 저장 매체로서,
    프로그램이 컴퓨팅 디바이스 상에서 실행될 때, 제1항, 제2항, 제5항 내지 제9항 중 어느 한 항의 방법의 단계들을 실행하기 위한 프로그램 코드의 명령어들을 운반하는 비일시적인 저장 매체.
KR1020187022905A 2016-02-11 2017-02-03 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 인코딩/디코딩하기 위한 방법 및 디바이스 KR20180111839A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16305153 2016-02-11
EP16305153.5 2016-02-11
PCT/EP2017/052316 WO2017137311A1 (en) 2016-02-11 2017-02-03 Method and device for encoding/decoding an image unit comprising image data represented by a luminance channel and at least one chrominance channel

Publications (1)

Publication Number Publication Date
KR20180111839A true KR20180111839A (ko) 2018-10-11

Family

ID=55404663

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187022905A KR20180111839A (ko) 2016-02-11 2017-02-03 휘도 채널 및 적어도 하나의 색차 채널에 의해 표현되는 이미지 데이터를 포함하는 이미지 유닛을 인코딩/디코딩하기 위한 방법 및 디바이스

Country Status (12)

Country Link
US (2) US11109045B2 (ko)
EP (3) EP3414903B1 (ko)
JP (2) JP7100582B2 (ko)
KR (1) KR20180111839A (ko)
CN (3) CN115052153A (ko)
BR (1) BR112018015558A2 (ko)
CA (1) CA3014332A1 (ko)
MX (1) MX2018009737A (ko)
MY (1) MY189780A (ko)
RU (2) RU2739251C2 (ko)
TW (1) TWI795352B (ko)
WO (1) WO2017137311A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020141904A1 (ko) * 2019-01-02 2020-07-09 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY189780A (en) * 2016-02-11 2022-03-07 Thomson Licensing Method and device for encoding/decoding an image unit comprising image data represented by a luminance channel and at least one chrominance channel
MX2020001290A (es) * 2017-08-03 2020-03-12 Sharp Kk Sistemas y metodos para particionar bloques de video en un corte de interprediccion de datos de video.
US10897269B2 (en) 2017-09-14 2021-01-19 Apple Inc. Hierarchical point cloud compression
US11818401B2 (en) 2017-09-14 2023-11-14 Apple Inc. Point cloud geometry compression using octrees and binary arithmetic encoding with adaptive look-up tables
US10861196B2 (en) 2017-09-14 2020-12-08 Apple Inc. Point cloud compression
US10909725B2 (en) 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
KR20200044967A (ko) * 2017-09-18 2020-04-29 인텔렉추얼디스커버리 주식회사 블록 분할에 따른 병합 후보 리스트를 사용하는 비디오 코딩 방법 및 장치
US11113845B2 (en) 2017-09-18 2021-09-07 Apple Inc. Point cloud compression using non-cubic projections and masks
JP2021010046A (ja) 2017-10-06 2021-01-28 シャープ株式会社 画像符号化装置及び画像復号装置
US10699444B2 (en) 2017-11-22 2020-06-30 Apple Inc Point cloud occupancy map compression
US10607373B2 (en) 2017-11-22 2020-03-31 Apple Inc. Point cloud compression with closed-loop color conversion
WO2019135629A1 (ko) * 2018-01-05 2019-07-11 에스케이텔레콤 주식회사 크로마 블록의 복원 방법 및 이를 이용한 영상 복호화 장치
US20190246122A1 (en) * 2018-02-08 2019-08-08 Qualcomm Incorporated Palette coding for video coding
US10909727B2 (en) 2018-04-10 2021-02-02 Apple Inc. Hierarchical point cloud compression with smoothing
US10909726B2 (en) 2018-04-10 2021-02-02 Apple Inc. Point cloud compression
US10939129B2 (en) 2018-04-10 2021-03-02 Apple Inc. Point cloud compression
US11010928B2 (en) 2018-04-10 2021-05-18 Apple Inc. Adaptive distance based point cloud compression
US11756234B2 (en) * 2018-04-11 2023-09-12 Interdigital Vc Holdings, Inc. Method for encoding depth values of a set of 3D points once orthogonally projected into at least one image region of a projection plane
JP7279074B2 (ja) * 2018-04-19 2023-05-22 華為技術有限公司 ルマおよびクロマブロックパーティショニング
JP2021525468A (ja) * 2018-05-29 2021-09-24 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置
WO2019230670A1 (en) * 2018-05-31 2019-12-05 Sharp Kabushiki Kaisha Systems and methods for partitioning video blocks in an inter prediction slice of video data
US11017566B1 (en) 2018-07-02 2021-05-25 Apple Inc. Point cloud compression with adaptive filtering
US11202098B2 (en) 2018-07-05 2021-12-14 Apple Inc. Point cloud compression with multi-resolution video encoding
US11012713B2 (en) 2018-07-12 2021-05-18 Apple Inc. Bit stream structure for compressed point cloud data
US11025905B2 (en) * 2018-09-14 2021-06-01 Tencent America LLC Method and device for decoding with palette mode
AU2018233042B2 (en) * 2018-09-21 2024-06-13 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a tree of blocks of video samples
US11386524B2 (en) 2018-09-28 2022-07-12 Apple Inc. Point cloud compression image padding
US11367224B2 (en) 2018-10-02 2022-06-21 Apple Inc. Occupancy map block-to-patch information compression
US11430155B2 (en) 2018-10-05 2022-08-30 Apple Inc. Quantized depths for projection point cloud compression
CN112997481B (zh) * 2018-11-16 2024-01-12 寰发股份有限公司 带有约束的亮度-色度单独的编码树编解码的方法和设备
AU2019201649A1 (en) 2019-03-11 2020-10-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a tree of blocks of video samples
US11057564B2 (en) 2019-03-28 2021-07-06 Apple Inc. Multiple layer flexure for supporting a moving image sensor
US11606563B2 (en) * 2019-09-24 2023-03-14 Tencent America LLC CTU size signaling
WO2021056211A1 (zh) * 2019-09-24 2021-04-01 富士通株式会社 视频编码、解码方法及装置、电子设备
US11562507B2 (en) 2019-09-27 2023-01-24 Apple Inc. Point cloud compression using video encoding with time consistent patches
US11627314B2 (en) 2019-09-27 2023-04-11 Apple Inc. Video-based point cloud compression with non-normative smoothing
US11538196B2 (en) 2019-10-02 2022-12-27 Apple Inc. Predictive coding for point cloud compression
US11895307B2 (en) 2019-10-04 2024-02-06 Apple Inc. Block-based predictive coding for point cloud compression
CN110913215B (zh) * 2019-12-03 2022-04-12 北京数码视讯软件技术发展有限公司 一种预测模式的选择方法及装置、可读存储介质
US11798196B2 (en) 2020-01-08 2023-10-24 Apple Inc. Video-based point cloud compression with predicted patches
US11625866B2 (en) 2020-01-09 2023-04-11 Apple Inc. Geometry encoding using octrees and predictive trees
US11620768B2 (en) 2020-06-24 2023-04-04 Apple Inc. Point cloud geometry compression using octrees with multiple scan orders
US11615557B2 (en) 2020-06-24 2023-03-28 Apple Inc. Point cloud compression using octrees with slicing
US20220286675A1 (en) 2021-03-05 2022-09-08 Tencent America LLC Decoupled transform partitioning
US11948338B1 (en) 2021-03-29 2024-04-02 Apple Inc. 3D volumetric content encoding using 2D videos and simplified 3D meshes

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101888679B1 (ko) 2009-08-12 2018-08-16 톰슨 라이센싱 개선된 인트라 색차 엔코딩 및 디코딩을 위한 방법 및 장치
US10397577B2 (en) 2011-03-08 2019-08-27 Velos Media, Llc Inverse scan order for significance map coding of transform coefficients in video coding
US9848197B2 (en) 2011-03-10 2017-12-19 Qualcomm Incorporated Transforms in video coding
US9807401B2 (en) 2011-11-01 2017-10-31 Qualcomm Incorporated Transform unit partitioning for chroma components in video coding
US20130128971A1 (en) * 2011-11-23 2013-05-23 Qualcomm Incorporated Transforms in video coding
WO2013102299A1 (en) * 2012-01-04 2013-07-11 Mediatek Singapore Pte. Ltd. Residue quad tree depth for chroma components
WO2013107027A1 (en) 2012-01-19 2013-07-25 Mediatek Singapore Pte. Ltd. Methods and apparatuses of cbf coding in hevc
US9462275B2 (en) * 2012-01-30 2016-10-04 Qualcomm Incorporated Residual quad tree (RQT) coding for video coding
US9467701B2 (en) * 2012-04-05 2016-10-11 Qualcomm Incorporated Coded block flag coding
EP2837186B1 (en) * 2012-04-12 2018-08-22 HFI Innovation Inc. Method and apparatus for block partition of chroma subsampling formats
AU2012261713A1 (en) * 2012-12-07 2014-06-26 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a residual quad tree
US9743091B2 (en) * 2012-12-17 2017-08-22 Lg Electronics Inc. Method for encoding/decoding image, and device using same
US9648330B2 (en) * 2013-07-15 2017-05-09 Qualcomm Incorporated Inter-color component residual prediction
CN106256125B (zh) 2014-05-05 2019-11-19 联发科技(新加坡)私人有限公司 确定残余转换树表达的方法及装置
US20150373327A1 (en) * 2014-06-20 2015-12-24 Qualcomm Incorporated Block adaptive color-space conversion coding
MY189780A (en) * 2016-02-11 2022-03-07 Thomson Licensing Method and device for encoding/decoding an image unit comprising image data represented by a luminance channel and at least one chrominance channel
CN110326294A (zh) * 2017-01-03 2019-10-11 Lg电子株式会社 使用二次变换编码/解码视频信号的方法和设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020141904A1 (ko) * 2019-01-02 2020-07-09 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
CN112236998A (zh) * 2019-01-02 2021-01-15 株式会社 Xris 用于对视频信号进行编码/解码的方法及其装置
US11012691B2 (en) 2019-01-02 2021-05-18 Xris Corporation Image signal encoding/decoding method and device for same
US11601646B2 (en) 2019-01-02 2023-03-07 Apple Inc. Image signal encoding/decoding method and device for same
US11997272B2 (en) 2019-01-02 2024-05-28 Apple Inc. Image signal encoding/decoding method and device for same

Also Published As

Publication number Publication date
EP3414903A1 (en) 2018-12-19
JP7100582B2 (ja) 2022-07-13
US20210006805A1 (en) 2021-01-07
CN115052153A (zh) 2022-09-13
RU2018130816A (ru) 2020-03-11
MX2018009737A (es) 2018-11-29
JP2019509662A (ja) 2019-04-04
CN108605134A (zh) 2018-09-28
JP2022137130A (ja) 2022-09-21
EP4040789B1 (en) 2023-10-18
RU2766561C2 (ru) 2022-03-15
RU2739251C2 (ru) 2020-12-22
EP4266684A3 (en) 2024-01-24
BR112018015558A2 (pt) 2018-12-26
CA3014332A1 (en) 2017-08-17
US11109045B2 (en) 2021-08-31
TWI795352B (zh) 2023-03-11
CN108605134B (zh) 2022-07-15
RU2020141190A3 (ko) 2021-12-07
MY189780A (en) 2022-03-07
WO2017137311A1 (en) 2017-08-17
CN115052152A (zh) 2022-09-13
RU2020141190A (ru) 2021-04-01
EP4266684A2 (en) 2023-10-25
TW201729596A (zh) 2017-08-16
RU2018130816A3 (ko) 2020-06-01
EP4040789A1 (en) 2022-08-10
US20210385466A1 (en) 2021-12-09
EP3414903B1 (en) 2022-04-06

Similar Documents

Publication Publication Date Title
US20210385466A1 (en) Method and device for encoding/decoding an image unit comprising image data represented by a luminance channel and at least one chrominance channel
CN113115047B (zh) 视频编解码方法和设备
US20230412810A1 (en) Method and device for intra-predictive encoding/decoding a coding unit comprising picture data, said intra-predictive encoding depending on a prediction tree and a transform tree
TW202115977A (zh) 用於視訊編碼的跨分量自我調整迴路濾波
CN111327904B (zh) 图像重建方法和装置
TW202106005A (zh) 視訊寫碼中之簡化色度內模式寫碼
WO2020125595A1 (zh) 视频译码器及相应方法
TW202046740A (zh) 適應性迴路濾波器組之索引發信
US20210092434A1 (en) Adaptive motion vector resolution for affine motion model in video coding
WO2018130477A1 (en) Method and apparatus for selecting a coding mode used for encoding/decoding a residual block
TW202112135A (zh) 用於視訊寫碼之色度內預測單元
TW202119820A (zh) 視訊寫碼中之色度差量量化參數
TW202112133A (zh) 調色板及預測模式信令發送
US11785236B2 (en) Parameter grouping among plural coding units for video encoding and decoding
US20240205412A1 (en) Spatial illumination compensation on large areas