KR102051193B1 - 비디오 코딩을 위한 성분간 탈상관 - Google Patents
비디오 코딩을 위한 성분간 탈상관 Download PDFInfo
- Publication number
- KR102051193B1 KR102051193B1 KR1020177009983A KR20177009983A KR102051193B1 KR 102051193 B1 KR102051193 B1 KR 102051193B1 KR 1020177009983 A KR1020177009983 A KR 1020177009983A KR 20177009983 A KR20177009983 A KR 20177009983A KR 102051193 B1 KR102051193 B1 KR 102051193B1
- Authority
- KR
- South Korea
- Prior art keywords
- act
- bit depth
- inverse
- component
- original
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/43—Hardware specially adapted for motion estimation or compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
비디오 코딩 시스템에서 CCP(cross-component prediction)와 ACT(adaptive color transform)가 동시에 수행될 수 있다. CU에 대한 ACT 인에이블 지시자와 같은 비트스트림에서 시그널링되는 지시자를 통해, CCP와 ACT가 동일한 레벨에서(예컨대, 변환 단위 레벨) 인에이블/디스에이블될 수 있다. 역 CCP 및 ACT가 동일한 레벨에서(예컨대, 변환 단위 레벨에서) 연산될 수 있다. 예측 단위 또는 코딩 단위 전체의 루마 및 크로마 잔차들의 재구성을 기다리지 않고, 예측 잔차들이 원래의 색 공간으로 변환될 수 있다. 인코딩/코딩 지연시간을 감소시키기 위해 CCP와 ACT 변환들이 하나의 프로세스로 결합될 수 있다. 색 성분들의 동적 범위들의 차이들이 가변적인 동적 범위 조절들에 의해 보상될 수 있다. ACT 코딩 도구를 선택적으로 디스에이블시키는 것, CCP의 성분 출력을 스케일링하는 것, 양자화 파라미터(QP)들을 조절하는 것 및/또는 비디오 코딩 시스템의 역변환의 성분 출력을 시프트시키는 것에 의해 루마와 크로마 성분들 사이의 비트 깊이들의 차이들이 보상될 수 있다.
Description
관련 출원의 상호 참조
본 출원은 2014년 9월 12일에 출원된 미국 가특허 출원 제62/049,843호 및 2015년 6월 5일에 출원된 미국 가특허 출원 제62/171,542호를 우선권 주장하며, 이 미국 출원들의 내용은 이로써 본원에 참고로 포함된다.
비디오 코딩 시스템들이 저장 요구사항들 및/또는 전송 대역폭을 감소시키기 위해 디지털 비디오 신호들을 압축하는 데 널리 사용되고 있다. 상이한 유형들의 비디오 코딩 시스템들은 블록 기반, 웨이블릿 기반, 객체 기반 및 블록 기반 하이브리드 비디오 코딩 시스템들을 포함한다. 블록 기반 비디오 코딩 시스템들은, MPEG1/2/4 part 2, H.264/MPEG-4 AVC(MPEG-4 part 10 Advanced Video Coding), VC-1 및 HEVC(High Efficiency Video Coding)/H.265 표준들과 같은, 국제 비디오 코딩 표준들에 기초할 수 있다. 일부 블록 기반 비디오 코딩 시스템들은 복잡하고 그리고/또는 비효율적인 아키텍처 및 동작 구현들을 가질 수 있고 차선적 코딩을 발생시킬 수 있다.
비디오 코딩 시스템, 예컨대, HEVC에서 CCP(cross-component prediction)와 ACT(adaptive color transform) 코딩이 동시에 수행될 수 있다. ACT는 TU(transform unit) 레벨에서 적응적으로 인에이블 및/또는 디스에이블될 수 있다. CU(coding unit) 내의 TU들의 잔차들을 코딩하기 위해 다수의 색 공간들이 사용될 수 있다. 예를 들어, CU 내의 일부 TU들은 원래의 색 공간에서 코딩될 수 있고, CU 내의 일부 TU들은 변환된 색 공간에서 코딩될 수 있다.
디코더와 같은, 비디오 코딩 디바이스는 특정의 TU에 대해 역 ACT(inverse ACT)를 수행할지를 결정할 수 있다. 그 결정은 ACT가 TU에 대해 인에이블되어 있는지에 기초할 수 있다. ACT가 TU에 대해 인에이블되어 있으면, 디코더는 TU에 대해 역 ACT를 적용할 수 있다.
ACT가 TU에 대해 인에이블되어 있는지는 TU 레벨 시그널링에 기초하여 결정될 수 있다. 예를 들어, ACT가 특정의 TU에 대해 인에이블되어 있는지는, TU를 포함하는 CU 또는 PU(prediction unit)와 연관된 예측 모드(prediction mode), 파티션 모드(partition mode) 및 인트라 예측 모드(intra prediction mode)와 같은, 하나 이상의 조건들에 기초하여 결정될 수 있다. 예를 들어, TU 레벨 시그널링은 역 ACT가 제1 TU에 대해 수행되어야 하는지를 표시할 수 있고, 역 ACT가 제2 TU에 대해 수행되어야 하는지를 별도로 표시한다. TU를 포함하는 CU와 연관된 예측 모드가 인터 예측(inter-prediction)이라는 조건 하에서 ACT가 TU에 대해 인에이블/디스에이블될 수 있다고 결정될 수 있다. 파티션 모드가 2Nx2N이고 TU를 포함하는 CU와 연관된 인트라 크로마 예측 모드(intra chroma prediction mode)가, 4와 같은, 미리 결정된 값이라는 조건 하에서 ACT가 TU에 대해 인에이블/디스에이블될 수 있다고 결정될 수 있다. 파티션 모드가 NxN이고 TU와 연관된 CU를 포함하는 PU들에 대한 인트라 크로마 예측 모드들이, 4와 같은, 미리 결정된 값이라는 조건 하에서 ACT가 TU에 대해 인에이블/디스에이블될 수 있다고 결정될 수 있다. 다른 경우들에 대해, ACT가 디스에이블되어 있다고 결정될 수 있다.
ACT가 TU에 대해 인에이블되어 있다고 결정할 시에, 디코더는 TU의 잔차들을 디코딩하기 위한 색 공간을 식별할 수 있다. 이 식별은 TU와 연관된 TU 색 공간 지시자에 기초할 수 있다. 디코더는, TU와 연관된 TU 색 공간 지시자에 기초하여, TU의 잔차들이 변환된 색 공간 또는 원래의 색 공간에서 코딩되어 있는지를 결정하고, 식별된 색 공간에 기초하여 TU의 잔차들을 디코딩할 수 있다. 디코더는 ACT가 인에이블되어 있는 CU 내의 각각의 개별 TU에 대한 TU 잔차들을 디코딩하기 위해 사용되는 색 공간을 식별할 수 있다.
역양자화(de-quantization) 동안, 다수의 TU들이 독립적인 병렬 처리 경로들을 통해 처리될 수 있다. 예를 들어, 제1 병렬 처리 경로는 역양자화, 역변환(inverse transform), 역 CCP(inverse CCP) 그리고, 제1 TU에 대한 TU 레벨 시그널링에 의해 표시되어 있으면, 제1 TU에 대한 역 ACT(inverse ACT)를 수행할 수 있다. 제2 독립적인 병렬 처리 경로는 역양자화, 역변환, 역 CCP 그리고, 제2 TU에 대한 TU 레벨 시그널링에 의해 표시되어 있으면, 제2 TU에 대한 역 ACT를 수행할 수 있다. 2개의 처리 경로들이 서로 독립적일 수 있고, 병렬로 수행될 수 있다.
CCP 및 ACT 코딩 도구들은 손실 및 무손실 코딩을 위해 동일한 레벨에서 인에이블 및 디스에이블될 수 있다. ACT 인에이블/디스에이블이 TU 레벨에서 일어나는지에 관계없이, 역 CCP 및 역 ACT가 TU 레벨에서 연산될 수 있다. PU 또는 CU 전체의 루마(luma) 및 크로마 잔차들의 재구성을 기다리지 않고, TU의 예측 잔차들이 원래의 색 공간으로 변환될 수 있다. 역 CCP 및 역 ACT 변환이 결합된 디코딩 프로세스에서 수행될 수 있다. TU 레벨 ACT 인에이블/디스에이블을 사용하여 또는 TU 레벨 ACT 인에이블/디스에이블을 사용함이 없이 TU 레벨에서의 역 ACT 그리고 결합된 CCP 및 ACT 디코딩 프로세스를 수행하는 것이 적용될 수 있다.
적응적 CCP에 대한 가중 파라미터들의 허용된 범위들이 동적으로 조절될 수 있다. 예를 들어, CCP가 ACT와 함께 인에이블되어 있을 때, 가중 파라미터 α의 허용된 범위들이 2개의 크로마 성분들에 대해 개별적으로 조절될 수 있다. αCg 및 αCo의 허용된 범위들이 상이한 범위들을 갖도록 조절될 수 있다.
YCgCo 영역(YCgCo domain)에서 사용되는 양자화 파라미터(QP) 값들이 선택된 CCP 파라미터들에 기초하여 조절될 수 있다. 역 CCP 및 역 색 공간 변환 이후의 잔차 신호의 왜곡이 YCgCo 공간에서의 잔차 신호의 왜곡과 유사하도록 조절들이 행해질 수 있다.
루마 성분과 크로마 성분들의 비트 깊이들이 상이할 때 ACT가 선택적으로 디스에이블될 수 있다. CCP의 성분 출력에 비트 시프트(bit shift)를 적용하는 것과 같이, 잔차 신호의 성분을 스케일링하는 것에 의해, 잔차 신호에서의 루마 및 크로마 성분들의 비트 깊이들이 정렬될 수 있다. 예컨대, 보다 작은/보다 낮은 비트 깊이를 갖는 성분을 역 색 변환 이전에 왼쪽 비트 시프트(left bit shift)를 통해 다른 성분의 비트 깊이와 매칭시키도록 스케일링하는 것에 의해 루마 성분과 크로마 성분들의 비트 깊이들이 정렬될 수 있다. 예를 들어, 루마 성분의 비트 깊이가 루마 성분과 크로마 성분들의 비트 깊이들 사이의 비트 깊이 차이에 기초하여 조절될 수 있다. 예를 들어, 크로마 성분의 비트 깊이가 루마 성분과 크로마 성분들의 비트 깊이들 사이의 비트 깊이 차이에 기초하여 조절될 수 있다. 스케일링된 성분이 역 색 변환 이후에 오른쪽 비트 시프트(right bit shift)를 통해 그의 원래의 비트 깊이로 재조절 및/또는 재스케일링될 수 있다.
잔차 신호의 성분의 QP가 조절될 수 있다. 스케일링된 성분이 출력 이전에 재조절 및/또는 재스케일링될 수 있ㄷ. 예를 들어, 비트 시프트가 비디오 코딩 시스템의 역 색 변환의 성분 출력에 적용될 수 있다.
인코더는 주어진 CU에 대해 TU 레벨에서 ACT를 인에이블시킬지를 결정할 수 있다. 그 결정은 CU 내의 TU들의 잔차들이 아주 상이한 통계적 특성들을 가지는지 및/또는 상위도(degree of difference)에 기초할 수 있다. TU 레벨에서 ACT를 인에이블 및/또는 디스에이블시키기로 결정할 시에, 인코더는 현재 CU의 잔차들이 다수의 색 공간들에서 코딩될 수 있다는 것을 표시하도록 ACT 인에이블 지시자(ACT enable indicator)의 값을 설정할 수 있다. 인코더는 TU의 잔차들을 코딩할 색 공간을 결정할 수 있다. 예를 들어, 인코더는 CU 내의 각각의 TU에 대한 색 공간을 선택할 수 있다. 인코더는 선택된 색 공간을 표시하도록 TU 색 공간 지시자를 설정할 수 있고, 선택된 색 공간에서의 TU의 잔차들을 인코딩할 수 있다.
디코더는, 비트스트림에서 시그널링된 지시자에 기초하여, ACT가 CU에 대한 TU 레벨에서 인에이블 및/또는 디스에이블되어 있는지를 결정할 수 있다. 지시자는 CU에 대한 ACT 인에이블 지시자를 포함할 수 있다. ACT가 TU 레벨에서 디스에이블되어 있다고 결정할 시에, 디코더는, CU와 연관된 CU 색 공간 지시자에 기초하여, CU에서의 TU들의 잔차들을 디코딩하기 위한 색 공간을 식별할 수 있다.
이들 및 다른 기법들이 프로세서 및 컴퓨터 판독가능 저장 매체를 포함할 수 있는 디바이스, 예컨대, 인코더, 디코더에 의해 하드웨어, 소프트웨어 및/또는 펌웨어로 구현될 수 있다.
도 1은 예시적인 블록 기반 하이브리드 비디오 인코딩 시스템을 나타낸 도면.
도 2는 예시적인 블록 기반 비디오 디코더를 나타낸 도면.
도 3은 역 CCP 및 역 ACT를 갖는 예시적인 블록 기반 비디오 디코더를 나타낸 도면.
도 4는 CCP 파라미터들의 예시적인 비균일 양자화(non-uniform quantization)를 나타낸 도면.
도 5a는 TU 레벨에서 역 CCP를 적용하고 CU 레벨에서 역 ACT를 적용하는 예시적인 디코딩 프로세스의 타이밍도.
도 5b는 TU 레벨에서 역 CCP 및 역 ACT 둘 다를 적용하는 예시적인 잔차 디코딩 프로세스의 타이밍도.
도 6a는 CCP 및 ACT 동작들의 예시적인 연결(concatenation)을 나타낸 도면.
도 6b는 TU 레벨에서 역 CCP와 역 ACT를 결합하는 예시적인 잔차 디코딩 프로세스를 나타낸 도면.
도 7은 손실 코딩에서의 Co 성분에 대한 CCP 파라미터들의 예시적인 인코더측 양자화를 나타낸 도면.
도 8a는 무손실 코딩에서의 Cg 성분에 대한 CCP 파라미터들의 예시적인 인코더측 양자화를 나타낸 도면.
도 8b는 무손실 코딩에서의 Co 성분에 대한 CCP 파라미터들의 예시적인 인코더측 양자화를 나타낸 도면.
도 9는 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 비트 깊이 정렬을 사용해 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타낸 도면.
도 10은 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 양자화 파라미터(QP) 조절을 사용해 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타낸 도면.
도 11은 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 크로마 역변환 이후에 왼쪽 비트 시프트들을 사용해 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타낸 도면.
도 12는 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 결합된 역 CCP 및 역 ACT에서의 예시적인 디코딩 프로세스를 나타낸 도면.
도 13a는 하나 이상의 개시된 실시예들이 구현될 수 있는 예시적인 통신 시스템의 시스템도.
도 13b는 도 13a에 예시된 통신 시스템 내에서 사용될 수 있는 예시적인 WTRU(wireless transmit/receive unit)의 시스템도.
도 13c는 도 13a에 예시된 통신 시스템 내에서 사용될 수 있는 예시적인 무선 액세스 네트워크 및 예시적인 코어 네트워크의 시스템도.
도 13d는 도 13a에 예시된 통신 시스템 내에서 사용될 수 있는 다른 예시적인 무선 액세스 네트워크 및 예시적인 코어 네트워크의 시스템도.
도 13e는 도 13a에 예시된 통신 시스템 내에서 사용될 수 있는 다른 예시적인 무선 액세스 네트워크 및 예시적인 코어 네트워크의 시스템도.
도 2는 예시적인 블록 기반 비디오 디코더를 나타낸 도면.
도 3은 역 CCP 및 역 ACT를 갖는 예시적인 블록 기반 비디오 디코더를 나타낸 도면.
도 4는 CCP 파라미터들의 예시적인 비균일 양자화(non-uniform quantization)를 나타낸 도면.
도 5a는 TU 레벨에서 역 CCP를 적용하고 CU 레벨에서 역 ACT를 적용하는 예시적인 디코딩 프로세스의 타이밍도.
도 5b는 TU 레벨에서 역 CCP 및 역 ACT 둘 다를 적용하는 예시적인 잔차 디코딩 프로세스의 타이밍도.
도 6a는 CCP 및 ACT 동작들의 예시적인 연결(concatenation)을 나타낸 도면.
도 6b는 TU 레벨에서 역 CCP와 역 ACT를 결합하는 예시적인 잔차 디코딩 프로세스를 나타낸 도면.
도 7은 손실 코딩에서의 Co 성분에 대한 CCP 파라미터들의 예시적인 인코더측 양자화를 나타낸 도면.
도 8a는 무손실 코딩에서의 Cg 성분에 대한 CCP 파라미터들의 예시적인 인코더측 양자화를 나타낸 도면.
도 8b는 무손실 코딩에서의 Co 성분에 대한 CCP 파라미터들의 예시적인 인코더측 양자화를 나타낸 도면.
도 9는 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 비트 깊이 정렬을 사용해 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타낸 도면.
도 10은 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 양자화 파라미터(QP) 조절을 사용해 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타낸 도면.
도 11은 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 크로마 역변환 이후에 왼쪽 비트 시프트들을 사용해 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타낸 도면.
도 12는 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 결합된 역 CCP 및 역 ACT에서의 예시적인 디코딩 프로세스를 나타낸 도면.
도 13a는 하나 이상의 개시된 실시예들이 구현될 수 있는 예시적인 통신 시스템의 시스템도.
도 13b는 도 13a에 예시된 통신 시스템 내에서 사용될 수 있는 예시적인 WTRU(wireless transmit/receive unit)의 시스템도.
도 13c는 도 13a에 예시된 통신 시스템 내에서 사용될 수 있는 예시적인 무선 액세스 네트워크 및 예시적인 코어 네트워크의 시스템도.
도 13d는 도 13a에 예시된 통신 시스템 내에서 사용될 수 있는 다른 예시적인 무선 액세스 네트워크 및 예시적인 코어 네트워크의 시스템도.
도 13e는 도 13a에 예시된 통신 시스템 내에서 사용될 수 있는 다른 예시적인 무선 액세스 네트워크 및 예시적인 코어 네트워크의 시스템도.
예시적인 실시예들에 대한 상세한 설명이 다양한 도면들을 참조하여 이제부터 기술될 것이다. 이 설명이 가능한 구현들의 상세한 예를 제공하지만, 상세들이 예시적인 것이고 결코 출원의 범주를 제한하려는 것으로 의도되어 있지 않다는 것에 유의해야 한다.
도 1은 예시적인 블록 기반 하이브리드 비디오 인코딩 시스템을 나타내고 있다. 도시된 바와 같이, 입력 비디오 신호(2)가 블록 단위로 처리될 수 있다. 블록들은 매크로블록(MB)들이라고 지칭될 수 있다. HEVC(High Efficiency Video Coding)에서, 고 해상도, 예컨대, 1080p 및 더 높은 해상도를 갖는 비디오 신호들을 압축하기 위해, 코딩 단위(CU)들이라고 지칭되는, 확장된 블록 크기들이 사용될 수 있다. CU는, 예를 들어, 64x64 픽셀일 수 있다. CU는 예측 단위(PU)들 - 이들에 대해 개별적인 예측 방법들이 적용됨 - 로 추가로 파티셔닝될 수 있다.
도 1에 도시된 바와 같이, 입력 비디오 블록(예컨대, MB 및/또는 CU)이 공간 예측(60) 및/또는 움직임/시간 예측(62)에 의해 분석될 수 있다. 공간 예측은 입력 비디오 신호(2)에 내재하는 공간 중복성(spatial redundancy)을 감소시킬 수 있다. 시간 예측은 입력 비디오 신호(2)에 내재하는 시간 중복성(temporal redundancy)을 감소시킬 수 있다. 인트라 예측이라고 지칭되는, 공간 예측은, 현재 비디오 블록을 예측하기 위해, 예컨대, 참조 픽처 저장소(64)로부터의, 동일한 비디오 픽처/슬라이스 내의 이미 코딩된 이웃 블록들로부터의 픽셀들을 사용한다. 인터 예측 또는 움직임 보상 예측(motion compensated prediction)이라고 지칭되는, 시간 예측은, 현재 비디오 블록을 예측하기 위해, 예컨대, 참조 픽처 저장소(64)로부터의, 이미 코딩된 비디오 픽처들로부터의 픽셀들을 사용할 수 있다.
주어진 비디오 블록에 대한 시간 예측은 하나 이상의 움직임 벡터들에 의해 시그널링될 수 있다. 움직임 벡터들은 현재 블록과 그의 참조 블록 사이의 움직임의 크기/양 및 방향을 표시할 수 있다. MPEG-4 AVC 또는 HEVC에서와 같이, 다수의 참조 픽처들/블록들이 지원될 때, 예컨대, 참조 픽처 저장소(64)에서의 어느 참조 픽처가 시간 예측을 하는 데 사용되었는지를 식별해주기 위해 비디오 블록에 대한 참조 픽처 인덱스(reference picture index)가 제공될 수 있다.
모드 결정 블록(80)은 추가 처리에서 사용되는 예측 블록을 결정하기 위해 예측 모드(공간 또는 시간 등)를 선택할 수 있다. 예를 들어, 레이트 왜곡 최적화(rate-distortion optimization)에 기초하여 최상의 예측 모드가 선택될 수 있다. 현재 비디오 블록으로부터 예측 블록을 감산(16)하는 것에 의해 차이 또는 잔차가 발생될 수 있다. 목표 비트 레이트를 달성하기 위해, 예측 잔차가 변환(4)에 의해 탈상관되고 양자화(6)에 의해 양자화될 수 있다. 재구성된 잔차를 발생시키기 위해, 양자화된 잔차 계수 블록들이 역양자화(10)되고 역변환(12)될 수 있다. 재구성된 비디오 블록을 형성하기 위해, 재구성된 잔차가 예측 블록에 가산(26)될 수 있다. 루프 필터(66), 예컨대, 디블록킹 필터(deblocking filter) 및 적응적 루프 필터(Adaptive Loop Filter)(ALF)들이 재구성된 비디오 블록에 적용될 수 있다. 참조 픽처 저장소(64)는, 장래의 비디오 블록들을 코딩하는 데 사용될 수 있는, 필터링된(또는 필터링되지 않은) 재구성된 비디오 블록을 저장할 수 있다.
코딩 모드(인터 또는 인트라), 예측 모드 정보, 움직임 정보 및 양자화된 잔차 계수 블록들이 엔트로피 코딩 유닛(8)에 제공될 수 있다. 엔트로피 코딩 유닛(8)은 출력 비디오 비트스트림(20)을 발생시키기 위해 부가의 압축을 제공할 수 있다.
도 2는 예시적인 블록 기반 비디오 디코더를 나타내고 있다. 디코딩 유닛(208)은 비디오 비트스트림(202)을 수신하고, 언패킹(unpack)하며, 엔트로피 디코딩할 수 있다. 디코딩 유닛(208)은 잔차 계수들을 발생시킬 수 있다. 예측 블록(255)은 비트스트림(202)의 인코딩에 기초하여 발생될 수 있다. 비트스트림(202)이 인트라 코딩되어 있는 경우, 코딩 모드 및 예측 정보가 공간 예측 유닛(260)에 제공될 수 있다. 비트스트림(202)이 인터 코딩되어 있는 경우, 코딩 모드 및 예측 정보가 시간 예측 유닛(262)에 제공될 수 있다. 잔차 블록을 재구성하기 위해, 잔차 변환 계수들이 역양자화 유닛(210) 및 역변환 유닛(212)에 제공될 수 있다. 예측 블록(255)을 잔차 블록에 가산(226)하는 것에 의해, 재구성된 블록이 발생될 수 있다. 재구성된 블록이 루프 필터(266)에 의해 필터링될 수 있다. 필터링된(또는 필터링되지 않은) 재구성된 블록이 참조 픽처 저장소(264)에 저장될 수 있다. 예측 블록들(255)을 발생시키기 위해, 참조 픽처 저장소(264)에 있는 재구성된 비디오가 공간 예측(260) 및 움직임 보상 예측(262)에 의해 이용될 수 있다. 참조 픽처 저장소(264)에 있는 재구성된 비디오가 디스플레이 디바이스에 제공될 수 있다.
HEVC 및 다른 블록 기반 비디오 코딩 시스템들에 의해 제공되는 코딩/디코딩의 효율 및 품질이 콘텐츠에 따라 변할 수 있다. 예컨대, 카메라들에 의해 포착되는, 자연스러운 비디오가 컴퓨터에 의해 발생된 또는 화면 콘텐츠와 실질적으로 상이한 특성들을 가질 수 있다. 자연스러운 비디오에 대한 HEVC의 코딩 효율이, 텍스트 및 그래픽과 같은, 전형적으로 컴퓨터에 의해 발생된 콘텐츠로 이루어져 있는, 화면 콘텐츠 비디오에 대한 코딩 효율보다 실질적으로 더 낫다.
화면 콘텐츠 비디오들이 4:4:4 크로마 포맷으로 포착될 수 있고, 여기서 3개의 색 성분들(루마 성분 및 양 크로마 성분들 등)은 동일한 해상도를 갖는다. 4:4:4 크로마 포맷이, 4:2:0 크로마 포맷 및 4:2:2 크로마 포맷보다 더 많은 중복성들을 가져오기 때문에, 덜 효율적이지만, 4:4:4 크로마 포맷이, 디코딩된 화면 콘텐츠 비디오에서의, 선명한 에지들과 같은, 색 정보를 보존하기 위해 고 충실도(high fidelity)가 바람직할 수 있는, 일부 화면 콘텐츠 응용들에 의해 선호될 수 있다.
예를 들어, 4:4:4 크로마 포맷 비디오의 3개의 색 성분들, 예컨대, YCbCr 영역(YCbCr domain)에서의 Y, Cb 및 Cr, 그리고 RGB 영역(RGB domain)에서의 G, B 및 R 사이의 상관들이 이용될 수 있다.
HEVC에서의 화면 콘텐츠 코딩과 관련하여, 4:4:4 크로마 포맷 비디오에서의 3개의 색 성분들 사이의 상관을 이용하기 위해, CCP(cross-component prediction) 및 ACT(adaptive color transform)와 같은, 코딩 도구들이 이용될 수 있다. 예를 들어, ACT 및 CCP 둘 다가 잔차 영역(residual domain)에서 동작할 수 있다. 루마 잔차들로부터 크로마 잔차들을 예측하기 위해 CCP가 사용될 수 있다. RGB 공간에서는, B와 R의 잔차들을 예측하기 위해 G 성분의 잔차가 사용될 수 있고, YCbCr 공간에서는, Cb와 Cr 성분의 잔차들을 예측하기 위해 Y 성분의 잔차가 사용될 수 있다. ACT에서, 3개의 성분들 사이의 상관(예컨대, 중복성)을 감소시키기 위해, 3개의 성분들의 잔차들이 하나의 색 공간으로부터 다른 색 공간으로 변환될 수 있다.
도 3은 역 CCP 및 역 ACT를 갖는 예시적인 블록 기반 비디오 디코더를 나타내고 있다. 디코딩에서의 교차 성분 탈상관(cross-component de-correlation)은 4:4:4 크로마 포맷 비디오의 3개의 색 성분들 사이의 중복성들을 제거할 수 있다. 도 3에 도시된 바와 같이, 잔차 디코딩 프로세스는 역 CCP(350) 및 역 색 변환(355), 예컨대, 역 ACT를 포함할 수 있다. 비트스트림(302)은 엔트로피 디코딩(308)에서 디코딩될 수 있다. 역 CCP 및/또는 역 ACT 변환들을 적용할 역 CCP(350) 및/또는 역 색 변환(355)을 선택하기 위해 제어 신호들, 예컨대, 역 CCP 제어 및 역 색 변환 제어가 제공될 수 있다.
잔차 블록을 재구성하기 위해, 엔트로피 디코딩(308)에 의해 제공되는 잔차 계수들(330)이 역양자화(310) 및 역변환(312)에 의해 처리될 수 있다. 제어 신호들에 따라, 역 CCP(350) 및/또는 역 색 변환(355)이 잔차 블록의 TU(transform unit)에 적용될 수 있다. 역 CCP가 선택되면, TU의 잔차 계수들(330)이 역 CCP(350)에 제공될 수 있다. 하나의 크로마 성분(GBR 비디오 포맷에서 B 성분 및 R 성분)의 잔차들이 루마 성분(GBR 비디오 포맷에서 G 성분)의 잔차들로부터 예측될 수 있다. CU 또는 PU에 대해 역 ACT가 선택되면, CU 또는 PU의 잔차 계수들(330)이 역 색 변환(355)에 의해 다시 원래의 색 공간으로 변환될 수 있다.
재구성된 블록이 루프 필터(366)에 의해 필터링될 수 있다. 필터링된(또는 필터링되지 않은) 재구성된 블록이 참조 픽처 저장소(364)에 저장될 수 있다. 예측 블록들(340)을 발생시키기 위해, 참조 픽처 저장소(364)에 있는 재구성된 비디오가 공간 예측(362) 및/또는 시간 예측(360)에 의해 이용될 수 있다. 참조 픽처 저장소(364)에 있는 재구성된 비디오가 디스플레이 디바이스에 제공될 수 있다.
역 CCP(350) 및 역 색 변환(355)은 상이한 레벨들에서 연산되는 2개의 개별적인 디코딩 프로세스들일 수 있다. 예를 들어, 역 CCP(350)는 TU 레벨에서 동작할 수 있고, 역 색 변환(355)은 CU 레벨에서 또는 PU 레벨에서 동작할 수 있다. 예를 들어, 역 CCP(350)는 TU 레벨 동작일 수 있고, 역 색 변환은 CU 레벨/PU 레벨 동작일 수 있다.
본원에서 실시예들을 기술하기 위해 4:4:4 비디오의 코딩이 일 예로서 사용될 수 있지만, 본원에 기술되는 기법들이 각종의 포맷들에 대해 동작가능한 각종의 코딩 기법들에 적용가능하다.
적응적 교차 성분 예측(adaptive cross-component prediction)이 하나 이상의 블록 기반 코딩 시스템들, 예컨대, HEVC에 적용가능할 수 있다. 루마 잔차 및/또는 크로마 잔차 간에 예측이 수행될 수 있다. 곱셈 및 비트 시프트를 비롯한 간단한 연산들을 사용하여 예측자가 발생될 수 있다. 수학식 1에 따라 인코더측에서 루마 잔차를 사용하여 크로마 잔차가 예측될 수 있다.
디코더측에서, 수학식 2에 따라 크로마 잔차가 루마 잔차로부터 보상될 수 있다.
수학식 1 및 수학식 2에서, rc는 위치 (x, y)에서의 원래의 크로마 잔차 샘플을 나타내고; rL'은 루마 성분의 재구성된 잔차 샘플을 나타내며;ΔrC는 예측 이후의 예측된 신호를 나타내고;Δr'C는 코딩 및 디코딩(예컨대, 변환 및/또는 양자화 그리고 그에 뒤이은 역변환 및/또는 역양자화) 이후의 재구성된 크로마 잔차를 나타내며; r'C는 재구성된 크로마 잔차 신호를 나타내고; α는 실수값 숫자인 가중 파라미터이다.
α가 부동 소수점 정밀도를 갖는 계수로서 도출될 수 있다면, α는 인코더로부터 디코더로의 전송 이전에 양자화될 수 있다. 예시적인 CCP 인코더에서, α의 절댓값을 양자화하기 위해 비균일 양자화 방법이 이용될 수 있다.
도 4는 CCP 파라미터(들)의 예시적인 비균일 양자화를 나타내고 있다. 도 4에 도시된 바와 같이, α의 절댓값(α는 양(positive) 또는 음(negative)일 수 있음)이 미리 정의된 값들의 세트{0, 1/8, 1/4, 1/2, 1}로 양자화된다.
표 1은 원래의 α 값들과 예시적인 양자화 프로세스를 사용하여 재구성된 값 사이의 예시적인 매핑을 나타내고 있다.
[표 1] 원래의 α 값의 예시적인 양자화 프로세스에 대한 재구성 값으로의 매핑
정수 산술을 사용할 때, 미리 정의된 실수 값들은 정수 스케일링(integer scaling) β를 곱하는 것 및 3-비트 오른쪽 시프트에 의해 근사화될 수 있다. 그에 대응하여, 수학식 1 및 수학식 2는, 각각, 수학식 3 및 수학식 4로 될 수 있다.
수학식 3 및 수학식 4에서, β는 {-8, -4, -2, -1, 0, 1, 2, 4, 8}로부터 선택된다. 루마 성분과 크로마 성분의 비트 깊이들이 상이하면, 루마 잔차의 크기가 예측자로서 사용되기 전에 크로마 잔차의 크기와 매칭시키도록 스케일링될 수 있다.
3개의 색 성분들 사이의 상관(예컨대, 중복성)이 감소될 수 있도록 잔차들을 하나의 색 공간으로부터 YCgCo 공간으로 적응적으로 변환하기 위해, 루프내 적응적 색 공간 변환(in-loop adaptive color space transform)이 수행될 수 있다. YCgCo로의 색 공간 변환은 CU 레벨에서 적응적으로 적용될 수 있다. CU가 무손실 모드에서 또는 손실 모드에서 코딩되는지에 따라 상이한 색 공간 변환들이 적용될 수 있다. 예를 들어, 손실 모드에 대한 순 및 역 색 공간 변환(forward and inverse color space transform)들은 수학식 5에 따른 YCgCo 변환의 비가역적 버전일 수 있다.
무손실 모드에 대해서는, YCgCo 변환들의 가역적 버전이 수행될 수 있다. 변환들이 이하에서 수학식 6에 나타낸 바와 같은 상승 연산(lifting operation)들에 기초하여 구현될 수 있다.
수학식 5에 나타낸 바와 같이, 손실 모드에서 사용되는 순 및 역 색 변환 행렬(forward and inverse color transform matrix)들은 정규화되지 않을 수 있다. YCgCo 신호의 크기는 색 변환이 적용된 후의 원래의 신호의 크기와 비교하여 더 작을 수 있다. 순방향 색 변환에 의해 야기된 크기의 감소를 보상하기 위해, 조절된 양자화 파라미터가 YCgCo 영역에서의 잔차들에 적용될 수 있다. 예를 들어, QP 값들 QPY, QPCg 및 QPCo가 YCgCo 영역 잔차들을 양자화하는 데 사용될 수 있다. 색 공간 변환이 적용될 때, QP 값들 QPY, QPCg 및 QPCo가, 각각, QP - 5, QP - 5 및 QP - 3으로 설정될 수 있다. QP는 원래의 색 공간에서 사용되는 양자화 파라미터일 수 있다.
ACT와 CCP가 상이한 레벨들에서 인에이블되거나 디스에이블될 수 있다. ACT 도구가 CU 레벨에서 인에이블/디스에이블되고, 예측 잔차들의 변환 코딩이 TU 레벨에서 적용될 수 있다고 가정하자. 하나의 CU의 잔차들이 쿼드 트리 구조(quad-tree structure)에 기초하여 다수의 TU들로 파티셔닝될 수 있을 것이다. TU의 잔차들이 동일한 CU 내의 이웃하는 TU들의 잔차들과 상이한 특성들을 가질 수 있을 것이다. CU 내의 TU들은 (예컨대, CU 레벨에서 인에이블 또는 디스에이블하기 위해) 동일한 ACT 결정을 사용할 수 있다.
ACT와 CCP가 동일한 레벨에서 인에이블되거나 디스에이블될 수 있다. 예를 들어, ACT의 인에이블/디스에이블이 TU 레벨에서 있을 수 있다.
ACT 시그널링 플래그, 예컨대, cu_ycgco_coding_flag는 색 공간 변환이 적용되는지를 나타낼 수 있다. 색 공간 변환이, 현재 CU와 같은, 대응하는 CU에 적용되는지를 표시하기 위해, ACT 시그널링 플래그가 CU 레벨에서 시그널링될 수 있다. 예를 들어, 1의 값을 가지는 cu_ycgco_coding_flag는 대응하는 CU의 잔차들이 YCgCo 공간에서 인코딩/디코딩된다는 것을 나타낼 수 있다. 0의 값을 가지는 cu_ycgco_coding_flag는 CU의 잔차들이 원래의 색 공간에서 인코딩/디코딩된다는 것을 나타낼 수 있다. 인트라 블록 복사(intra block copy)(IBC) 모드 및 인터 모드에 대해, 현재 CU에 적어도 하나의 영이 아닌 계수가 있을 때 이러한 플래그가 시그널링될 수 있다.
예측 잔차의 변환 코딩에서, 잔차 블록이 다수의 정사각형 TU들로 파티셔닝될 수 있다. 가능한 TU 크기들은 4x4, 8x8, 16x16 및 32x32를 포함할 수 있다. 비디오 특성들 및 선택된 코딩 모드들에 따라, CU에서의 이웃하는 TU들은 어쩌면 아주 상이한 통계적 특성들을 갖는 잔차 신호들을 가질 수 있을 것이다. ACT는 TU 레벨에서 적응적으로 인에이블 및/또는 디스에이블될 수 있다. CU 내의 TU들의 잔차들을 코딩하기 위해 다수의 색 공간들이 사용될 수 있다. CU 내의 상이한 TU들은 상이한 색 공간들에서 코딩될 수 있다.
인코더는 CU에 대해 TU 레벨에서 ACT를 인에이블 및/또는 디스에이블시킬지를 결정할 수 있다. 그 결정은 CU 내의 TU들의 잔차들이 아주 상이한 통계적 특성들을 가지는지에 기초할 수 있다(예컨대, 상위도에 기초할 수 있음). TU 레벨에서 ACT를 인에이블시키기로 결정할 시에, 인코더는 현재 CU(예컨대, 현재 CU의 잔차들)가 다수의 색 공간들에서 코딩될 수 있다는 것을 표시하도록 ACT 인에이블 지시자의 값을 설정할 수 있다. TU 레벨에서 ACT를 디스에이블시키기로 결정할 시에, 인코더는 현재 CU가 단일의 색 공간에서 코딩된다는 것을 표시하도록 ACT 인에이블 지시자의 값을 설정할 수 있고, 색 공간을 표시하도록 지시자를 설정할 수 있다. 디코더는 CU에 대해 TU 레벨에서 ACT가 인에이블 및/또는 디스에이블되는지를 결정할 수 있다. 그 결정은 CU에 대한 ACT 인에이블 지시자와 같은 시그널링된 지시자에 기초할 수 있다. ACT가 TU 레벨에서 디스에이블되어 있다고 결정할 시에, 디코더는, CU와 연관된 CU 색 공간 지시자에 기초하여, CU에서의 TU들의 잔차들을 디코딩하기 위한 색 공간을 식별할 수 있다.
표 2는 코딩 단위 구문(coding unit syntax)의 비제한적인 예를 나타내고 있다. 표 2에 나타낸 바와 같이, ACT 인에이블 지시자와 같은, 지시자가 CU 레벨에서 시그널링될 수 있다. 지시자는 대응하는 CU 내의 TU들에 대해 색 공간들 사이에서의(또는 다수의 색 공간들 중에서의) 선택이 수행될 수 있는지를 나타낼 수 있다. 지시자는 tu_act_enabled_flag를 포함할 수 있다. 예를 들어, tu_act_enabled_flag가 0으로 설정되어 있으면, 이는 현재 CU의 잔차들이 하나의 색 공간에서 코딩되어 있다는 것을 나타낼 수 있다. 색 공간은 표 2에 나타낸 cu_ycgco_coding_flag와 같은 CU 색 공간 지시자를 통해 표시될 수 있다. tu_act_enabled_flag가 1로 설정되어 있으면, 이는 현재 CU 내의 TU들이 그 자신의 잔차들을 코딩하기 위해 2개의 색 공간들 사이에서(또는 원래의 색 공간 및 변환된 색 공간과 같은 다수의 색 공간들 중에서) 선택하는 유연성을 가질 수 있다는 것을 나타낼 수 있다.
[표 2] 코딩 단위 구문
예를 들어, tu_act_enabled_flag = 1은 현재 CU 내의 TU들의 잔차들이 상이한 색 공간들에서 코딩될 수 있다는 것을 나타낼 수 있다. tu_act_enabled_flag = 0일 때, 이는, cu_ycgco_residual_flag에 의해 명시된 바와 같이, 코딩 단위의 잔차가 하나의 색 공간에서 코딩되어 있다는 것을 나타낼 수 있다.
예를 들어, cu_ycgco_residual_flag = 1은 CU의 잔차들이 YCgCo 색 공간에서 코딩되어 있을 수 있다는 것을 나타낼 수 있다. cu_ycgco_residual_flag = 0일 때, 이는 코딩 단위의 잔차들이 원래의 색 공간에서 코딩되어 있을 수 있다는 것을 나타낼 수 있다.
sps_ residual_act_flag = 0이면, cu_ycgco_residual_flag가 존재하지 않을 수 있다. 디코더는 sps_ residual_act_flag의 값이 0이라고 추론할 수 있다. sps_ residual_act_flag = 1인 경우 그리고 tu_act_enabled_flag = 1인 경우, cu_ycgco_residual_flag가 존재하지 않을 수 있다. 잔차들이 코딩되어 있는 색 공간이 cu_ycgco_residual_flag에 의해 명시되지 않을 수 있다. 잔차들이 코딩되어 있는 색 공간이 tu_ycgco_residual_flag에 의해 명시될 수 있다.
TU 레벨에서 ACT를 인에이블시키기로 결정할 시에, 인코더는 TU의 잔차들을 코딩할 색 공간을 결정할 수 있다. 예를 들어, 인코더는 CU 내의 각각의 TU에 대한 색 공간을 선택할 수 있다. 인코더는 TU 색 공간 지시자를 선택된 색 공간을 표시하도록 설정할 수 있고, 선택된 색 공간에서 TU의 잔차들을 인코딩할 수 있다.
ACT가 TU 레벨에서 인에이블되어 있다고 결정할 시에, 디코더는, TU와 연관된 TU 색 공간 지시자에 기초하여, CU에서의 TU의 잔차들을 디코딩하기 위한 색 공간을 식별할 수 있다. 일 실시예에서, 디코더는 CU 내의 각각의 개별 TU에 대한 TU 잔차들을 인코딩하는 데 사용된 색 공간을 식별할 수 있다. 디코더는 그 TU에 대한 식별된 색 공간에 기초하여 TU의 잔차들을 디코딩할 수 있다.
표 3은 변환 단위 구문(transform unit syntax)의 비제한적인 예를 나타내고 있다. 표 3에 나타낸 바와 같이, 대응하는 TU에 대해 선택된 색 공간을 명시하기 위해 tu_ycgco_coding_flag와 같은 플래그가 transform_unit()에 포함될 수 있다. 그 TU에 대해 적어도 하나의 영이 아닌 계수가 있을 때 플래그가 비트 스트림에서 시그널링될 수 있다. 일 실시예에서, TU에 대한 계수(들)가 0일 때 플래그가 비트 스트림에서 생략될 수 있다.
[표 3] 변환 단위 구문
표 3에 나타낸 바와 같이, tu_ycgco_residual_flag와 같은, 지시자는 변환의 잔차들이 YCgCo 색 공간에서 코딩되어 있는지를 나타낼 수 있다. 예를 들어, tu_ycgco_residual_flag = 1은 변환 단위의 잔차들이 YCgCo 색 공간에서 코딩되어 있다는 것을 나타낼 수 있다. tu_ycgco_residual_flag = 0일 때, 이는 변환 단위의 잔차들이 원래의 색 공간에서 코딩되어 있다는 것을 나타낼 수 있다. tu_ycgco_residual_flag가 존재하지 않을 때, 이는 0인 것으로 추론될 수 있다.
ACT가 인에이블 또는 디스에이블되어 있는지를 나타내기 위해, 플래그 tu_act_enabled_flag와 같은, 지시자가 시그널링될 수 있다. 지시자는 CU 레벨, TU 레벨, 및/또는 다른 레벨에서 시그널링될 수 있다. 예를 들어, 지시자가 ACT가 TU 레벨에서 디스에이블되어 있다는 것을 나타내면(예컨대, 플래그가 0이면), 현재 CU의 잔차들이 (예컨대, 플래그 cu_ycgco_residual_flag에 의해 나타낸 바와 같이) 동일한 색 공간에서 코딩되어 있을 수 있다. 지시자가 ACT가 TU 레벨에서 인에이블되어 있다고 나타내면(예컨대, 플래그가 1이면), CU 내의 개개의 TU는 잔차들을 코딩하기 위한 그 자신의 색 공간을 선택하도록 허용될 수 있다. 동일한 CU 내의 TU들의 잔차들이 상이한 색 공간들에서 코딩될 수 있다.
ACT가 TU에 대해 인에이블되어 있는지는 TU 레벨 시그널링에 기초하여 결정될 수 있다. TU 레벨 시그널링은 역 ACT가 제1 TU에 대해 수행되어야 하는지를 표시할 수 있고, 역 ACT가 제2 TU에 대해 수행되어야 하는지를 별도로 나타낸다. 예를 들어, ACT가 특정의 TU에 대해 인에이블되어 있는지는, TU를 포함하는 CU 또는 PU(prediction unit)와 연관된 예측 모드, 파티션 모드 및 인트라 예측 모드와 같은, 하나 이상의 조건들에 기초하여 결정될 수 있다. 표 3-1은 비제한적인 예시적인 변환 단위 구문 테이블을 나타내고 있다.
표 3-1에 나타낸 바와 같이, TU를 포함하는 CU와 연관된 예측 모드가 인터 예측이라는 조건 하에서 ACT가 TU에 대해 인에이블/디스에이블될 수 있다고 결정될 수 있다. 파티션 모드가 2Nx2N이고 TU를 포함하는 CU와 연관된 인트라 크로마 예측 모드가, 4와 같은, 미리 결정된 값이라는 조건 하에서 ACT가 TU에 대해 인에이블/디스에이블될 수 있다고 결정될 수 있다. 파티션 모드가 NxN이고 TU와 연관된 CU를 포함하는 PU들에 대한 인트라 크로마 예측 모드들이, 4와 같은, 미리 결정된 값이라는 조건 하에서 ACT가 TU에 대해 인에이블/디스에이블될 수 있다고 결정될 수 있다. 일 실시예에서, 다른 경우들에 대해, ACT가 디스에이블되어 있다고 결정될 수 있다.
[표 3-1] 제안된 TU 레벨 ACT 플래그를 사용하는 변환 단위 구문
ACT가 TU에 대해 인에이블되어 있다고 결정할 시에, 디코더는 TU의 잔차들을 디코딩하기 위한 색 공간을 식별할 수 있다. 이 식별은 TU와 연관된 TU 색 공간 지시자에 기초할 수 있다. 디코더는, TU와 연관된 TU 색 공간 지시자에 기초하여, TU의 잔차들이 변환된 색 공간 또는 원래의 색 공간에서 코딩되어 있는지를 결정하고, 식별된 색 공간에 기초하여 TU의 잔차들을 디코딩할 수 있다. 디코더는 ACT가 인에이블되어 있는 CU 내의 각각의 개별 TU에 대한 TU 잔차들을 디코딩하기 위해 사용되는 색 공간을 식별할 수 있다.
표 3-1에 나타낸 바와 같이, tu_ycgco_residual_flag와 같은, 지시자는 변환의 잔차들이 YCgCo 색 공간에서 코딩되어 있는지를 나타낼 수 있다. 예를 들어, tu_ycgco_residual_flag = 1은 TU의 잔차들이 YCgCo 색 공간에서 코딩되어 있다는 것을 나타낼 수 있다. 일 실시예에서, 지시자 tu_ycgco_residual_flag = 1은 ACT가 TU에 대해 인에이블되거나 디스에이블될 수 있다는 것을 나타낼 수 있다. tu_ycgco_residual_flag = 0일 때, 이는 TU의 잔차들이 원래의 색 공간에서 코딩되어 있다는 것을 나타낼 수 있다. tu_ycgco_residual_flag가 존재하지 않을 때, 이는 0인 것으로 추론될 수 있다.
예를 들어, 플래그 tu_ycgco_coding_flag와 같은, 지시자는, 색 공간들이 TU들에 대해 적응적으로 선택될 수 있도록 변환 단위 구문 테이블로 시그널링될 수 있다. 예를 들어, 각각의 TU에 대해 색 공간이 선택될 수 있다. 플래그가 시그널링될 수 있다. CBF(coded block flag)가 하나의 TU 내의 계수들이 0이거나 DM 모드를 사용하지 않는 하나의 인트라 코딩된 CU 내에 하나 이상의 PU들이 있다는 것을 나타낼 때, 플래그가 생략될 수 있다.
CU에 대해 색 공간이 선택될 수 있다. 예를 들어, TU 레벨에서 ACT를 디스에이블시키기로 결정할 시에, 인코더는 변환된 색 공간 및 원래의 색 공간의 레이트 왜곡(rate-distortion)(R-D) 성능에 기초하여 색 공간을 선택할 수 있다. 인코더는 변환된 색 공간 및 원래의 색 공간의 레이트 왜곡(R-D) 성능을 테스트할 수 있다. 일부 코딩 사례들에 대해 테스트된 색 공간들의 개수를 감소시키기 위해 하나 이상의 인코딩 가속 프로세스들이 적용될 수 있다. 예를 들어, CU 내의 TU들의 잔차들이 변환된 색 공간 또는 원래의 색 공간에서 코딩되어 있을 수 있는지가 CU 레벨에서 결정될 수 있다. CU 내의 TU들의 잔차들을 코딩하기 위해 상이한 색 공간들을 사용하는 것에 의해 R-D 성능이 테스트될 수 있다.
예시를 위해, 용어 "CU 레벨 ACT 온(CU-level ACT on)" 및 "CU 레벨 ACT 오프(CU-level ACT off)"는, 각각, CU 내의 TU들의 잔차들을 변환된 색 공간에서(예컨대, ACT를 인에이블시킴) 그리고 원래의 색 공간에서(예컨대, ACT를 디스에이블시킴) 코딩하는 것을 지칭할 수 있고; 용어 "TU 레벨 ACT"는 TU들의 잔차들을 개별적으로 코딩하기 위한 색 공간(들)을 선택하는 것을 지칭할 수 있으며(예컨대, CU 내의 각각의 TU가 그 자신의 색 공간을 선택할 자유를 가짐); 그에 부가하여, "CU 레벨 ACT"는, 본원에서, "CU 레벨 ACT 온" 또는 "CU 레벨 ACT 오프"를 지칭한다.
예를 들어, TU 레벨 ACT의 R-D 비용이 결정될 수 있다. 예를 들어, CU 레벨 ACT의 R-D 비용이 계산될 수 있다. 비제한적인 예에서, CU 레벨 ACT의 R-D 비용이 검사되기 전에, TU 레벨 ACT의 R-D 비용이 검사될 수 있다. CU 레벨 ACT에 대해 테스트될 색 공간의 선택은 입력 비디오의 색 포맷에 의존할 수 있다. RGB 시퀀스들에 대해서는, CU 레벨 온이 테스트될 수 있다. YUV 시퀀스들에 대해서는, CU 레벨 오프가 테스트될 수 있다. TU 레벨 ACT에 대해 적어도 하나의 영이 아닌 계수가 있다는 조건 하에서 CU 레벨 ACT의 R-D 성능 검사가 수행될 수 있다.
코딩 파라미터들이 결정될 수 있다. 일 실시예에서, TU 레벨 ACT, CU 레벨 ACT 및/또는 다른 레벨에서의 ACT에 대해 동일한 코딩 파라미터들이 사용될 수 있다. 예를 들어, 인트라 모드의 경우, 루마 및 크로마 성분들의 인트라 예측 방향들이 TU 레벨 ACT와 CU 레벨 ACT에 의해 공유될 수 있다. 예를 들어, 인터 모드의 경우, 움직임 정보(예컨대, 움직임 벡터, 참조 픽처 인덱스 및 움직임 벡터 예측자)가 TU 레벨 ACT와 CU 레벨 ACT에 의해 공유될 수 있다.
잔차 코딩을 위해 하나의 특정 색 공간을 선택할 가능성이 보다 많은 픽처에서 평탄한 영역들을 코딩하기 위해 큰 크기(예컨대, 64x64 및 32x32)를 갖는 CU들이 종종 선택될 수 있다. 작은 CU들에 의해 커버되는 영역들은 다양한 특성들을 가질 수 있는 풍부한 텍스처들을 포함할 가능성이 보다 많다. 인트라 모드의 경우, RGB 시퀀스들의 8x8 CU들과 YUV 시퀀스들의 16x16 및 8x8 CU들에 대해 TU 레벨 ACT가 조사될 수 있다. 일 실시예에서, 인트라 모드의 경우 RGB 시퀀스들의 8x8 CU들과 YUV 시퀀스들의 16x16 및 8x8 CU들에 대해 TU 레벨 ACT만이 조사될 수 있다. IBC 모드의 경우, 16x16 및 8x8 CU들에 대해 TU 레벨 ACT가 조사될 수 있다. 일 실시예에서, IBC 모드의 경우 16x16 및 8x8 CU들에 대해 TU 레벨 ACT만이 조사될 수 있다. 인터 모드의 경우, 8x8 CU들에 대해 TU 레벨 ACT가 조사될 수 있다. 일 실시예에서, 인터 모드의 경우 8x8 CU들에 대해 TU 레벨 ACT만이 조사될 수 있다.
자식 TU에 대한 색 공간이 그의 부모 TU의 색 공간에 기초하여 선택될 수 있다. 예를 들어, 자식 TU에 대한 색 공간이 그의 부모 TU의 색 공간으로부터 도출될 수 있다. RGB 시퀀스들의 경우, TU에 대해, 그의 부모 TU의 잔차들이 YUV 공간에서 코딩되어 있는 경우, RGB 영역에서의 R-D 비용의 계산이 생략될 수 있다. YUV 시퀀스들의 경우, TU에 대해, 그의 부모 TU의 잔차들이 RGB 공간에서 코딩되어 있는 조건 하에서, YUV 영역에서의 R-D 비용의 계산이 생략될 수 있다.
코딩된 픽처들이 상이한 시간 계층(temporal layer)(TL)들로 분류될 수 있다. 하위 TL들에 있는 픽처들은 보다 나은 비디오 품질로 코딩될 수 있다. 상위 TL들에 있는 픽처들은 하위 TL들에 있는 픽처들보다 비디오 시퀀스 전체의 보다 많은 비율을 차지할 수 있다. 인코딩 구성 및/또는 코딩된 픽처의 TL 레벨에 따라, TU 레벨 ACT의 R-D 프로세스가 생략될 수 있다. 예를 들어, RA(random access) 구성의 경우, RGB 시퀀스들에 대한 TL-3 픽처들에 대해 인트라 모드 및 IBC 모드에 대한 TU 레벨 ACT가 조사되지 않을 수 있다. 예를 들어, RGB 및 YUV 시퀀스들에 대한 TL-0 픽처들에 대해 인터 모드에 대한 TU 레벨 ACT의 조사가 생략될 수 있다. 예를 들어, LD(low delay) 구성의 경우, RGB 시퀀스들에 대한 TL-0 및 TL-1 픽처들에 대해 인트라 모드 및 IBC 모드에 대한 TU 레벨 ACT의 조사가 생략될 수 있다. 예를 들어, RGB 시퀀스들에 대한 TL-0 픽처들 및 YUV 시퀀스들에 대한 TL-0 및 TL-2 픽처들에 대해 인터 모드에 대한 TU 레벨 ACT의 조사가 생략될 수 있다. 예를 들어, 무손실 코딩이 적용될 때, 인트라 및 IBC 모드에 대해 TU 레벨 ACT가 디스에이블될 수 있다.
역 CCP 및 역 ACT가 상이한 레벨들에서 수행될 수 있다. ACT 디코딩 프로세스가, CU가 인트라 모드, IBC 모드 또는 인터 모드에서 코딩되어 있는지에 따라, 상이한 레벨들에서 수행될 수 있다. 인트라 모드 및 IBC 모드로 코딩된 CU들에 대해, 색 공간 변환이 PU 레벨에서 수행될 수 있다. 인터 모드로 코딩된 CU들에 대해, 색 공간 변환이 CU 레벨에서 수행될 수 있다. 그 결과, 하나의 PU 또는 CU 내의 TU들의 잔차들이 재구성될 때까지 역 색 변환이 실시되지 않을 수 있다.
역 CCP 및 역 ACT가 TU 레벨에서 수행될 수 있다. PU 또는 CU 전체의 루마 및 크로마 잔차들의 재구성을 기다리지 않고, TU의 예측 잔차들이 원래의 색 공간으로 변환될 수 있다. 예를 들어, 역양자화에서, 다수의 TU들이 독립적인 병렬 처리 경로들을 통해 처리될 수 있다. 제1 병렬 처리 경로는 역양자화, 역변환, 역 CCP 그리고, 제1 TU에 대한 TU 레벨 시그널링에 의해 표시되어 있으면, 제1 TU에 대한 역 ACT를 수행할 수 있다. 제2 독립적인 병렬 처리 경로는 역양자화, 역변환, 역 CCP 그리고, 제2 TU에 대한 TU 레벨 시그널링에 의해 표시되어 있으면, 제2 TU에 대한 역 ACT를 수행할 수 있다. 2개의 처리 경로들이 서로 독립적일 수 있고, 병렬로 수행될 수 있다.
역 CCP 및 역 ACT 모듈들이 2개의 개별적인 디코딩 프로세스들로서 정의될 수 있다. 역 CCP 및 역 ACT 변환이 결합된 디코딩 프로세스에서 수행될 수 있다. TU 레벨 ACT 인에이블/디스에이블을 사용하여 또는 TU 레벨 ACT 인에이블/디스에이블을 사용함이 없이 TU 레벨에서의 역 ACT 그리고 결합된 CCP+ACT 디코딩 프로세스를 수행하는 것이 적용될 수 있다.
TU 기반 역 색 변환이 수행될 수 있다. 역 색 변환이 상이한 레벨들에서 수행될 수 있다. 인트라 모드 및 IBC 모드로 코딩된 CU들에 대해, 역 색 변환이 PU 레벨에서 수행될 수 있다. 인터 모드로 코딩된 CU들에 대해, 색 공간 변환이 CU 레벨에서 수행될 수 있다. 역 CCP가 TU 레벨 동작으로서 수행될 수 있다.
도 5a 및 도 5b는 역 색 변환을 상이한 레벨들에서 실행하는 병렬 코딩에 대한 영향을 시각적으로 설명한다. 도 5a는 TU 레벨에서 역 CCP를 적용하고 CU 레벨에서 역 ACT를 적용하는 예시적인 디코딩 프로세스의 타이밍도이다. 도 5a는 CCP와 ACT 둘 다가 적용될 때 하나의 CU에서의 잔차 신호의 디코딩 프로세스를 나타내고 있다. 간략화된 설명을 위해, CU가 4개의 TU들, 즉 TU0, TU1, TU2 및 TU3 - 각각이 동일한 크기를 가짐 - 으로 파티셔닝되는 것으로 가정한다. 또한, 역 CCP가 TU0 및 TU2에는 적용되지만 TU1 및 TU3에는 적용되지 않는 것으로 가정한다.
도 5a에서, 블록들은 역양자화 및 역변환, 역 CCP 및 역 색 변환의 디코딩 시간을 나타낸다. 변수들 ti inv-transquant 및 ti iinv-ccp는, 각각, 제i TU에 대한 역양자화 및 역변환 모듈 및 역 CCP 모듈의 디코딩 시간이고, tcu inv-act는 CU 전체의 역 색 변환에 대한 디코딩 시간이다. 역 CCP 및 역 색 변환 둘 다가 픽셀 단위 연산(pixel-wise operation)이기 때문에, 대응하는 디코딩 시간은 그 TU 내의 픽셀들의 개수에 대략 비례한다.
도 5a에 도시된 바와 같이, 역 CCP 및 역 색 변환이 상이한 레벨들에서 연산되기 때문에, CCP가 인에이블된 상태에서의 TU들의 역 CCP가 끝난 후에 역 색 변환이 시작된다. 예를 들어, TU1이 가장 작은 잔차 재구성 시간을 갖지만, 그의 잔차들은, TU2의 잔차들이 재구성되기 전에, 다시 원래의 색 공간으로 변환되지 않을 수 있다. 도 5a에서 CU의 잔차 디코딩을 위한 총 시간은 수학식 7과 같다.
역 색 변환이 TU 레벨에서 수행될 수 있다. CU 전체의 루마 및 크로마 잔차들의 재구성을 기다리지 않고, TU의 예측 잔차들이 다시 원래의 색 공간으로 변환될 수 있다.
도 5b는 TU 레벨에서 역 CCP 및 역 ACT 둘 다를 적용하는 예시적인 잔차 디코딩 프로세스의 타이밍도이다. 도 5b는 CCP와 ACT 둘 다가 적용될 때 하나의 CU에서의 잔차 신호의 디코딩 프로세스를 나타내고 있다. 도 5a에 대한 동일한 가정들이 도 5b에 적용가능하다. 도 5b에서, 블록들은 역양자화 및 역변환, 역 CCP 및 역 색 변환의 디코딩 시간을 나타내고, 여기서 ti inv-act는 제i TU에 대한 역 색 변환의 디코딩 시간이다. 도면에서의 각각의 TU가 CU의 크기의 1/4이라면 ti inv-act는 대략 tcu inv-act /4와 같다.
도 5b에 예시된 바와 같이, 역 CCP 직후에 TU의 잔차들이 YCgCo 공간으로부터 원래의 색 공간으로 변환될 수 있다. 잔차 디코딩의 대응하는 총 시간은 수학식 8에 따라 계산될 수 있다.
역 CCP 및 역 ACT 변환이 결합된 디코딩 프로세스로서 수행될 수 있다. 예를 들어, ACT와 CCP가 잔차 영역에서 수행될 수 있고, 결합된 디코딩 모듈에 의해 수행될 수 있다.
수학식 4에 나타낸 바와 같이, 역 CCP는 선형 연산으로서 쓰여질 수 있고, 이는 수학식 9에서와 같이, 행렬 곱셈으로 변환될 수 있다.
수학식 9에서, Y', C'g 및 C'o는 역 CCP 이전의 Y, Cg 및 Co의 잔차 신호일 수 있다. Y, Cg 및 Co는 역 CCP 이후의 Y, Cg 및 Co의 잔차 신호일 수 있다. βCg 및 βCo는, 각각, Cg 및 Co의 CCP 파라미터들일 수 있다.
손실 코딩의 경우, 수학식 9에서의 역 CCP와 수학식 5에서의 역 ACT 둘 다가 선형 연산이라면, 역 CCP와 역 ACT 프로세스들이, 수학식 10에 나타낸 바와 같이, 곱셈에 의해 결합될 수 있다.
무손실 코딩의 경우, 수학식 6에서의 상승 기반(lifting based) 역 ACT를 고려하여, 도 6a에 나타낸 바와 같이, 2개의 연산들을 연결시키는 것에 의해, CCP와 ACT의 결합된 디코딩 프로세스가 도출될 수 있다.
도 6b는 TU 레벨에서 역 CCP와 역 ACT를 결합하는 예시적인 잔차 디코딩 프로세스를 나타내고 있다. 도 6b는, 역 CCP와 역 ACT가 하나의 결합된 디코딩 모듈로 결합되어 있는, 도 5b에 나타낸 디코딩 프로세스를 나타내고 있다. 도 6b에 도시된 바와 같이, TU에 대한 디코딩 프로세스는 역양자화 및 역변환 프로세스 그리고 결합된 역 CCP 및 ACT 프로세스를 포함할 수 있다. 도시된 바와 같이, TU0에 대해, 역양자화 및 역변환 프로세스를 수행하는 데 t0 inv-transquant가 걸릴 수 있고, 결합된 역 CCP 및 ACT 프로세스를 수행하는 데 t0 combined가 걸릴 수 있다. TU2에 대해, 역양자화 및 역변환 프로세스를 수행하는 데 t2 inv-transquant가 걸릴 수 있고, 결합된 역 CCP 및 ACT 프로세스를 수행하는 데 t2 combined가 걸릴 수 있다. 도 5b에 도시된 3개의 모듈들을 사용하는 예시적인 잔차 디코딩 프로세스와 비교하여 디코딩 지연시간이 감소될 수 있다.
역 CCP와 ACT의 결합된 모듈은 역 CCP가 턴오프된 상태에서 역 ACT를 수행할 수 있다. 예를 들어, 도 5b에 도시된 바와 같이, TU1 및 TU3은 역 ACT는 이용하지만, 역 CCP는 이용하지 않는다. 디코딩 프로세스는, 수학식 10에서의 대응하는 CCP 파라미터들 βCg 및 βCo를 0으로 설정함으로써, 결합된 모듈을 사용하여 구현될 수 있다. 결합된 모듈이 역 ACT 단독은 물론, CCP와 결합된 역 ACT를 달성하기 위해 이용될 수 있다면, 디코더는, 개별적인 역 ACT 전용 모듈을 구현함이 없이, 결합된 모듈을 포함할 수 있다.
색 공간 변환 이후에 3개의 색 성분들의 상이한 동적 범위들이 있을 수 있다. 색 공간 변환 이후에 3개의 색 성분들의 동적 범위들이 더 이상 동일하지 않을 수 있다. 수학식 1 및 수학식 2와 표 1에 나타낸 바와 같이, α의 값은 범위 [-1, 1]로 제한된다. 루마 성분과 크로마 성분들이 동일한 동적 범위를 가질 수 있거나 그렇지 않을 수 있다. 수학식 5 및 수학식 6에 나타낸 바와 같이, 손실 코딩 및 무손실 코딩에서 사용되는 순방향 색 변환들이 정규화되지 않을 수 있다. 3개의 성분들(Y, Cg 및 Co)의 크기들이 상이한 스케일링 인자들에 의해 변경될 수 있다.
적응적 교차 성분 예측에 대한 가중 파라미터들의 허용된 범위들이 동적으로 조절될 수 있다. CCP가 ACT와 함께 인에이블되어 있을 때, α의 허용된 범위들이 2개의 크로마 성분들에 대해 개별적으로 조절될 수 있다. αCg 및 αCo의 허용된 범위들이 상이한 범위들을 가질 수 있도록 조절될 수 있다.
예를 들어, CCP가 ACT와 함께 인에이블되어 있을 때, 수학식 1 및 수학식 2에서의 파라미터 α의 허용된 범위들이 2개의 크로마 성분들에 대해 개별적으로 조절될 수 있다. Cg 성분에 대한 가중 파라미터 αCg의 허용된 범위들 및 Co에 대한 가중 파라미터 αCo의 허용된 범위들이 조절될 수 있다. Cg 및 Co 성분들에 대한 가중 파라미터들이 상이한 범위들을 가질 수 있다.
수학식 1 및 수학식 2에 나타낸 바와 같이, α의 값은 범위 [-1, 1]로 제한될 수 있다. 루마 성분과 크로마 성분들이 동일한 동적 범위를 갖는다. 수학식 5에서의 순방향 색 변환 행렬의 행들은 상이한 노름(norm)들을 나타낼 수 있고, yCgCo 공간에서 도출되는 α의 동적 범위는 원래의 색 공간의 것과 상이하게 될 수 있다. yCgCo 색 공간에서 Cg 및 Co 성분들의 α 값들의 허용된 범위들이 성분들 사이의 동적 범위 차이들에 기초하여 조절될 수 있다.
수학식 5에 나타낸 바와 같이, 손실 코딩의 경우, 순방향 색 변환 행렬에서의 3개의 행들의 노름들은 수학식 11에 의해 주어질 수 있다.
수학식 11을 고려하면, yCgCo 공간에서의 각각의 크로마 성분과 루마 성분 사이의 크기 비는 수학식 12에 나타낸 바와 같이 도출될 수 있다.
Cg와 Y 사이의 상대 크기 비가 1이라면, Cg 성분에 대한 α 값들을 제한하기 위해 범위 [-1, 1]이 사용될 수 있다. Co 성분에 대해, 그의 신호의 크기가 ACT 이후의 Y 성분의 크기보다 더 클 수 있다면, 그의 α 값들의 범위는 [- 1.15, 1.15]로 조절될 수 있다. 허용된 범위는 (예컨대, 수학식 12에 나타낸 바와 같이) Co 성분과 Y 성분 사이의 상대 크기 비에 기초하여 결정될 수 있다.
인코더는 범위 조절의 적용 이후에 Co 성분의 α 값들을 양자화할 수 있다. 도 7은 손실 코딩에서의 Co 성분의 예시적인 인코더측 양자화를 나타내고 있다. 표 4는 도 7에 나타낸 양자화 예를 사용하여 Co 성분에 대한 원래의 α 값들과 재구성 값들 사이의 비제한적인 예시적인 매핑을 나타낸다.
[표 4] 손실 코딩에서 Co 성분에 대한 원래의 α 값들과 재구성 α 값들 간의 매핑
순 및 역 CCP(forward and inverse CCP)와 관련하여, 실제 α 값들 -1.15 및 1.15는 정수 스케일링을 곱하는 것 및 오른쪽 시프트에 의해 근사화될 수 있다. 예를 들어, 5-비트 고정 소수점 근사화를 사용하여, α가 -1.15 또는 1.15일 때, 수학식 3 및 수학식 4는 수학식 13 및 수학식 14로 된다.
일 예에서, 고정 소수점 근사화의 3-비트 정밀도에 따라, 실제 α 값들 - 1.15 및 1.15는, 수학식 15 및 수학식 16에 주어진 바와 같이, 9의 스케일링을 곱하는 것 및 그에 뒤이은 3-비트 오른쪽 시프트에 의해 근사화될 수 있다.
무손실 코딩의 경우, 수학식 6에서의 순방향 색 변환의 상승 연산을 행렬 연산으로 변환한 후에, yCgCo 공간에서의 크로마 성분들과 루마 성분 사이의 크기 비들은 수학식 17에 나타낸 바와 같이 도출될 수 있다.
손실 코딩에서의 Co 성분에 대해, Cg 및 Co 성분들에 대한 α 값들의 허용된 범위들은, 각각, 무손실 코딩에서 [-2, 2] 및 [-2.3, 2.3]으로 조절될 수 있다.
도 8a 및 도 8b는 범위 조절을 갖는 Cg 및 Co 성분들의 α 값들을 양자화하는 데 사용되는 예시적인 인코더측 양자화를 나타내고 있다. 도 8a는 무손실 코딩에서의 Cg 성분의 예시적인 양자화를 나타내고 있다. 도 8b는 무손실 코딩에서의 Co 성분의 예시적인 양자화를 나타내고 있다.
표 5는 무손실 코딩에 대한 도 8a에서의 양자화 방법들을 사용하여 Cg 성분에 대한 원래의 α 값들과 재구성 값들 사이의 비제한적인 예시적인 매핑을 나타낸다.
[표 5] 무손실 코딩에서 Cg 성분에 대한 원래의 α 값들과 재구성 α 값들 간의 매핑
표 6은 무손실 코딩에 대한 도 8b에 나타낸 양자화를 사용하여 Co 성분에 대한 원래의 α 값들과 재구성 값들 사이의 비제한적인 예시적인 매핑을 나타낸다.
[표 6] 무손실 코딩에서 Co 성분에 대한 원래의 α 값들과 재구성 α 값들 간의 매핑
도 8a 및 도 8b와 표 5 및 표 6에 나타낸 무손실 코딩 예에 따르면, 표 5에서의 범위 한계 [-2, 2] 및 양자화 프로세스는 Cg 성분의 α 값들에 적용될 수 있는 반면, 표 6에서의 범위 한계 [-2.3, 2.3] 및 양자화 프로세스는 Co 성분의 α 값들에 적용될 수 있다.
무손실 코딩 예에서, 표 5에서의 범위 한계 [-2, 2] 및 양자화 프로세스는 Cg 성분 및 Co 성분 둘 다의 α 값들에 적용될 수 있다.
손실 코딩에 대해 그리고 무손실 코딩에 대해, 크로마 성분들에 대한 α 값들의 범위가 조절될 수 있다. 원래의 재구성 값들 -1 및 1이 조절된 범위의 경계 값들로 대체될 수 있다. 예를 들어, 원래의 재구성 값들 -1/1이 표 4에서의 -1.15/1.15에 의해, 표 5에서의 -2/2에 의해, 그리고/또는 표 6에서의 -2.3/2.3에 의해 대체될 수 있다.
조절된 범위의 경계 값들을 CCP에 대한 재구성 값들의 목록에 부가의 요소들로서 추가하는 것에 의해 α 값들의 범위가 조절될 수 있다. 무손실 코딩에서의 Cg 성분의 CCP를 일 예로서 사용하여, 표 7은 원래의 α 값과 재구성 값 사이의 매핑이 증가된 수의 재구성 값들을 가지는 것을 나타내고 있다.
[표 7] 무손실 코딩에서 Cg 성분에 대한 증가된 수의 원래의 α 값들과 재구성 α 값들 간의 매핑
표 5와 표 7의 비교는 증가된 수의 재구성 값들을 보여준다. 표 5에서는, 9개의 재구성 값들이 있다. 표 7에서는, 11개의 재구성 값들이 있다. 표 7은 조절된 경계 값들 -2 및 2를 범위 조절 이전의 재구성 값들 {1, -1/2, -1/4, -1/8, 0, 1/8, 1/4, 1/2, 1}에 추가하는 것에 의해 재구성 값 목록의 크기를 11로 증가시킨다. ACT가 적용될 때 무손실 코딩에서 Cg 및 Co 성분들 둘 다에 대해 증가된 값 매핑에 의한 범위 조절이 사용될 수 있다.
예컨대, YCgCo 공간에서의 양자화 오차들을 원래의 색 공간에서의 양자화 오차들과 비슷하게 유지하기 위해, YCgCo 영역에서 사용되는 양자화 파라미터(QP) 값들이 원래의 색 공간에서 사용되는 것들과 상이하게 설정될 수 있다. CCP 프로세스는 신호 크기를 변화시킬 수 있다.
YCgCo 공간에서 사용되는 QP 값들이 선택된 CCP 파라미터들에 기초하여 조절될 수 있다. 역 CCP 및 역 색 공간 변환 이후의 잔차 신호의 왜곡이 YCgCo 공간에서의 잔차 신호의 왜곡과 유사하도록 조절들이 행해질 수 있다.
수학식 9에 나타낸 바와 같이, CCP와 ACT가 적용될 때, 결합된 행렬의 노름은 1이 아닐 수 있다. YCgCo 색 공간에 적용되는 QP는 원래의 색 공간에서 적용되는 QP와 상이할 수 있다. CCP와 ACT가 적용될 때, CCP 프로세스에 의해 야기되는 신호 크기 변화를 고려하기 위해 QP 조절 값들이 조절될 수 있다.
예를 들어, YCgCo 공간에서 사용되는 QP 값들이 선택된 CCP 파라미터들을 고려하여 조절될 수 있다. 결합된 행렬의 노름들이 수학식 18에 나타낸 바와 같이 도출될 수 있다.
양자화 스텝 크기는 수학식 19에 의해 주어진다.
양자화 오차는 Q2 step에 관련되어 있다. (예컨대, YCgCo 공간으로부터의 다시 변환된 이후에) 원래의 색 공간에서의 신호의 왜곡이 YCgCo 신호에서와 동일한 레벨에 있을 수 있다. QP 조절 값들이 수학식 20에 의해 주어질 수 있다.
수학식 20에서, QP0, QP1 및 QP2는 원래의 색 공간에서의 3개의 성분들에 적용된 QP들일 수 있다. 수학식 21은 수학식 22에 나타낸 바와 같이 재구성될 수 있다.
손실 코딩에서 Co 성분에 대한 원래의 값들과 재구성 값들 간에 매핑하는 QP 조절의 일 예가, 표 4에 나타낸 이전의 예를 참조하여, 제공된다. 이전의 예에서, 범위 한계들 [-1, 1] 및 [-1.15, 1.15]가, 각각, Cg 및 Co 성분들의 CCP 파라미터들에 적용될 수 있는 CCP 범위 조절. 표 8은 CCP 파라미터 범위 조절을 갖는 βCo의 값들에 따라 Y 성분에 대한 대응하는 QP 조절 ΔQPY를 나타내고 있다. βCo는 Co 성분의 CCP 파라미터를 나타낼 수 있다. βCg는 Cg 성분의 CCP 파라미터를 나타낼 수 있다.
[표 8] Co 성분에 적용되는 CCP 파라미터들의 범위 조절에 의한 상이한 CCP 파라미터들 βCo를 사용하는 YCgCo 색 공간에서의 루마 QP 조절 ΔQPY
CCP가 범위 조절 없이 적용될 수 있다. 예를 들어, Cg 성분에 대한 CCP 파라미터가 조절되지 않고 [-1, 1]에 머물러 있을 수 있고, 그리고/또는 범위 조절 프로세스가 적용되지 않을 수 있다. 표 9는 CCP의 범위 조절의 적용 없이 상이한 CCP 파라미터들 βCg 및 βCo를 사용하여 YCgCo 색 공간에서 예시적인 루마 QP 조절 ΔQPY를 제시하고 있다. βCg 및 βCo 둘 다의 값들이 {-8, -4, -2, -1, 0, 1, 2, 4, 8}로부터 선택될 수 있다. 표 9는 βCg 및 βCo의 값들에 기초하여 Y 성분에 대한 대응하는 QP 조절 ΔQPY를 나타내고 있다.
[표 9] CCP의 범위 조절의 적용 없이 상이한 CCP 파라미터들 βCg 및 βCo를 사용하여 YCgCo 색 공간에서의 루마 QP 조절 ΔQPY
표 8 및 표 9에 열거된 QP 조절 값들이 손실 코딩에 적용가능할 수 있다. 양자화가 적용되지 않는 경우 무손실 코딩에 대해 QP 조절이 생략될 수 있다.
ACT에서, 크로마 성분들의 비트 깊이들이 루마 성분들의 비트 깊이(들)과 상이할 수 있다. 크로마 성분의 비트 깊이는 BitDepthC로서 표기될 수 있다. 루마 성분의 비트 깊이는 본원에서 BitDepthY로서 표기될 수 있다.
BitDepthY와 BitDepthC가 상이할 때 ACT가 생략될 수 있다. ACT 도구가, 예컨대, 상위 레벨 시그널링에 의해, 디스에이블되도록 구성될 수 있다. 예를 들어, 플래그 residual_adaptive_colour_transform_enabled_flag는, BitDepthY와 BitDepthC가 상이할 때, SPS(sequence parameter set)에서 0으로 설정될 수 있다.
예컨대, 보다 작은/보다 낮은 비트 깊이를 갖는 성분을 역 색 변환 이전에 왼쪽 비트 시프트(left bit shift)를 통해 다른 성분의 비트 깊이와 매칭시키도록 스케일링하는 것에 의해 루마 성분과 크로마 성분들의 비트 깊이들이 정렬될 수 있다. 예를 들어, 루마 성분의 비트 깊이가 루마 성분과 크로마 성분들의 비트 깊이들 사이의 비트 깊이 차이에 기초하여 조절될 수 있다. 예를 들어, 크로마 성분의 비트 깊이가 루마 성분과 크로마 성분들의 비트 깊이들 사이의 비트 깊이 차이에 기초하여 조절될 수 있다. 스케일링된 성분이 역 색 변환 이후에 오른쪽 비트 시프트를 통해 그의 원래의 비트 깊이로 재조절 및/또는 재스케일링될 수 있다.
도 9는 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 비트 깊이 정렬을 사용해 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타내고 있다. 도 9에 도시된 바와 같이, 역양자화(910) 및 역변환(912)이 루마 성분 Y와 크로마 성분들 Cg 및 Co와 같은, 잔차 계수들에 대해, 각각, 수행될 수 있다. 잔차 계수들이 역 CCP(950)에 제공될 수 있다. 역 교차 성분 예측이 수행된 후에, 루마 성분과 크로마 성분들의 비트 깊이들이 953에서 정렬될 수 있다.
루마와 크로마 성분들의 비트 깊이들이 상이한지가 결정될 수 있다. 루마와 크로마 성분들의 비트 깊이들이 상이하다는 조건 하에서, 비트 깊이 정렬 연산이 수행될 수 있다. 루마 성분과 크로마 성분들의 비트 깊이들 사이의 비트 깊이 차이가 결정될 수 있다. 비트 깊이 차이만큼 보다 낮은 비트 깊이를 갖는 하나 이상의 성분들에 왼쪽 비트 시프트(들)가 적용될 수 있다. 예를 들어, 변수 델타 비트 깊이는 깊이 차이를 나타낼 수 있다. BitDepthY가 BitDepthC보다 더 클 때, 델타 비트 깊이 변수는 ΔB = BitDepthY - BitDepthC로서 설정될 수 있다. 크로마 성분들에 대한 계수들이 델타 비트 깊이의 값만큼 왼쪽으로 시프트될 수 있다. BitDepthY가 BitDepthC보다 더 작을 때, 델타 비트 깊이 변수는 ΔB = BitDepthC - BitDepthY로서 설정될 수 있다. 루마 성분에 대한 계수들이 델타 비트 깊이의 값만큼 왼쪽으로 시프트될 수 있다.
도 9에 도시된 바와 같이, ΔB만큼 왼쪽 비트 시프트들이 크로마 성분들에 적용될 수 있다. 잔차 계수들이 역 색 변환 연산들(955)에 의해 다시 원래의 색 공간으로 변환될 수 있다. 960에서, 크로마 성분들과 같은 스케일링된 성분들이, 도 9에 나타낸 바와 같이, 오른쪽 비트 시프트를 통해 그들의 원래의 비트 깊이로 재조절 및/또는 재스케일링될 수 있다.
비트 깊이 정렬은 비트 시프트를 포함할 수 있다. 도 9에 도시된 바와 같이, 왼쪽 비트 시프트들이 크로마 성분들에 적용될 수 있다. 다른 예들에서, 왼쪽 비트 시프트들이 루마 성분에 적용될 수 있다(예컨대, BitDepthY가 BitDepthC보다 작을 때). 크로마 성분들의 역변환 및/또는 역 CCP와 같은 디코딩 프로세스들이 BitDepthC와 같은 원래의 내부 비트 깊이에서 동작할 수 있다.
수학식 23은 비트 깊이를 정렬하기 위해 행렬 곱셈들에 의한 비트 시프트 연산들을 갖는 예시적인 역 색 변환을 나타내고 있다.
크로마 성분들의 QP를 조절하기 위해 루마와 크로마 성분들 사이의 비트 깊이 차이가 보상될 수 있다. 예를 들어, 양자화 스텝 크기가 QP의 각각의 증분에 따라 21/6 배 증가하고 매 6개 증분들마다 2배로 되면, QP를 6ΔB만큼 증가시키는 것은 ΔB 비트만큼 오른쪽 시프트하는 것에 의해 신호의 크기를 스케일링하는 것과 동등할 수 있다. 6ΔB의 QP 조절이 크로마 성분들에 적용될 수 있다. 역 색 변환에의 입력 신호는 그의 루마 및 크로마 성분들에 대해 동일한 비트 깊이를 가질 수 있다.
예를 들어, 손실 코딩에서 루마와 크로마에 대한 비트 깊이들이 상이할 때, 루마 및/또는 크로마 성분들의 QP가 비트 깊이 차이에 기초하여 조절될 수 있다. 도 10은 QP 조절을 갖는 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타내고 있다. 1010에서, 역 CCP(1050)에의 입력 신호가 그의 루마 및 크로마 성분들에 대해 동일한 비트 깊이를 가질 수 있도록 크로마 성분들의 QP가 조절될 수 있다. 루마 성분의 비트 깊이가 크로마 성분(들)의 비트 깊이들보다 더 높을 때, 크로마 역변환 및 역 색 변환이 루마 비트 깊이에서 연산될 수 있다. 루마 성분의 비트 깊이가 크로마 성분(들)보다 더 낮을 때, 크로마 역변환 및 역 색 변환이 그들의 원래의 비트 깊이에서 연산될 수 있다. 도 10에 도시된 바와 같이, 잔차 계수들에 대해 역변환(1012)이 수행될 수 있다. 잔차 계수들이 역 CCP(1050)에 제공될 수 있다. 잔차 계수들이 역 색 변환 연산들(1055)에 의해 다시 원래의 색 공간으로 변환될 수 있다. 1060에서, 크로마 성분들과 같은 스케일링된 성분들이, 도 10에 나타낸 바와 같이, 오른쪽 비트 시프트를 통해 그들의 원래의 비트 깊이로 재조절 및/또는 재스케일링될 수 있다.
도 11은 손실 코딩에서 루마와 크로마의 비트 깊이들이 상이할 때 크로마 역변환 이후에 왼쪽 비트 시프트들을 사용해 역 ACT를 적용하는 예시적인 디코딩 프로세스를 나타내고 있다. 크로마 성분들의 역변환은 원래의 보다 낮은 비트 깊이를 사용할 수 있다. QP 조절들이 생략될 수 있다.
도 11에 도시된 바와 같이, 역양자화(1110) 및 역변환(1112)이 루마 성분 Y와 크로마 성분들 Cg 및 Co와 같은, 잔차 계수들에 대해, 각각, 수행될 수 있다. 역 교차 성분 예측(1153)이 수행되기 전에, 루마 성분과 크로마 성분들의 비트 깊이들이 1150에서 정렬될 수 있다. 비트 깊이들이 정렬된 후에, 잔차 계수들에 대해 역 CCP(1153)가 수행될 수 있다. 잔차 계수들이 역 색 변환 연산들(1155)에 의해 다시 원래의 색 공간으로 변환될 수 있다. 1160에서, 크로마 성분들과 같은 스케일링된 성분들이, 도 11에 나타낸 바와 같이, 오른쪽 비트 시프트를 통해 그들의 원래의 비트 깊이로 재조절 및/또는 재스케일링될 수 있다.
본원에 기술되는 기법들이 임의의 생각가능한 조합으로 결합될 수 있다. 그들이 또한 임의의 생각가능한 조합으로 결합될 수 있다. 예를 들어, 결합된 역 CCP와 ACT, CCP 파라미터들의 범위 조절, 루마 QP 조절 및 크로마 성분 QP 조절 기법들이 역 CCP와 역 색 변환 둘 다가 동일한 비트 깊이에서 연산된다는 가정에 기초할 수 있다. 이 조합에서, 역 CCP와 역 색 변환은 루마와 크로마 성분들의 보다 높은 비트 깊이, 예컨대, max(BitDepthY, BitDepthC)에서 수행될 수 있다.
도 12는 결합된 역 CCP 및 역 ACT에서 예시적인 디코딩 프로세스를 나타내고 있다. 도시된 바와 같이, 디코딩 프로세스는 결합된 역 CCP와 ACT, CCP 파라미터들의 범위 조절, 루마 QP 조절 및 크로마 성분 QP 조절을 포함할 수 있다. 치환들 및 다른 조합들이 생각되고 있다. 예를 들어, 비록 예시되어 있지는 않지만, ΔB 비트의 왼쪽 비트 시프트가 크로마 성분에 대한 역변환의 출력에 적용될 수 있다.
도 12에 도시된 바와 같이, 역양자화(1210)가 루마 성분 Y와 크로마 성분들 Cg 및 Co와 같은, 잔차 계수들에 대해, 각각, 수행될 수 있다. 루마 QP 조절 및 크로마 성분 QP 조절이 역양자화(1210)의 일부로서 수행될 수 있다. ΔQY는 YCgCo 공간에서 루마 성분의 양자화에 적용되는 델타 QP를 나타낼 수 있다. 이것은 CCP 파라미터들의 범위 조절에 기초하여 표 8 또는 표 9를 사용하여 도출될 수 있다. 잔차 계수들에 대해 역변환(1212)이 수행될 수 있다. 결합된 역 CCP 및 역 ACT(1254)가 수행될 수 있다. 잔차 계수들이 다시 원래의 색 공간으로 변환될 수 있다. 1260에서, 크로마 성분들과 같은 스케일링된 성분들이, 도 12에 나타낸 바와 같이, 오른쪽 비트 시프트를 통해 그들의 원래의 비트 깊이로 재조절 및/또는 재스케일링될 수 있다.
도 13a는 하나 이상의 개시된 실시예들이 구현될 수 있는 예시적인 통신 시스템(100)의 도면이다. 통신 시스템(100)은 음성, 데이터, 비디오, 메시징, 방송 등과 같은 콘텐츠를 다수의 무선 사용자들에게 제공하는 다중 접속 시스템일 수 있다. 통신 시스템(100)은 다수의 무선 사용자들이, 무선 대역폭을 비롯한, 시스템 자원들의 공유를 통해 이러한 콘텐츠에 액세스할 수 있게 할 수 있다. 예를 들어, 통신 시스템(100)은 CDMA(code division multiple access), TDMA(time division multiple access), FDMA(frequency division multiple access), OFDMA(orthogonal FDMA), SC-FDMA(single-carrier FDMA) 등과 같은, 하나 이상의 채널 액세스 방법들을 이용할 수 있다.
도 13a에 도시된 바와 같이, 통신 시스템(100)은 WTRU(wireless transmit/receive unit)(102a, 102b, 102c, 및/또는 102d)(이들은 전체적으로 또는 모두 합하여 WTRU(102)라고 할 수 있음), RAN(radio access network)(103/104/105), 코어 네트워크(106/107/109), PSTN(public switched telephone network)(108), 인터넷(110), 및 다른 네트워크들(112)을 포함할 수 있지만, 개시된 실시예들이 임의의 수의 WTRU들, 기지국들, 네트워크들 및/또는 네트워크 요소들을 생각하고 있다는 것을 잘 알 것이다. WTRU들(102a, 102b, 102c, 102d) 각각은 무선 환경에서 동작하고 그리고/또는 통신하도록 구성된 임의의 유형의 디바이스일 수 있다. 예로서, WTRU들(102a, 102b, 102c, 102d)은 무선 신호들을 전송 및/또는 수신하도록 구성될 수 있고, UE(user equipment), 이동국(mobile station), 고정 또는 이동 가입자 유닛(fixed or mobile subscriber unit), 페이저(pager), 휴대폰(cellular telephone), PDA(personal digital assistant), 스마트폰, 랩톱, 넷북, 개인용 컴퓨터, 무선 센서, 가전 제품 등을 포함할 수 있다.
통신 시스템(100)은 또한 기지국(114a) 및 기지국(114b)을 포함할 수 있다. 기지국들(114a, 114b) 각각은, 코어 네트워크(106/107/109), 인터넷(110) 및/또는 네트워크들(112)과 같은, 하나 이상의 통신 네트워크들에의 액세스를 용이하게 하기 위해 WTRU들(102a, 102b, 102c, 102d) 중 적어도 하나와 무선으로 인터페이싱하도록 구성되어 있는 임의의 유형의 디바이스일 수 있다. 예로서, 기지국들(114a, 114b)은 BTS(base transceiver station), Node-B, eNode B, Home Node B, Home eNode B, 사이트 제어기(site controller), AP(access point), 무선 라우터(wireless router) 등일 수 있다. 기지국들(114a, 114b)은 각각이 단일 요소로서 도시되어 있지만, 기지국들(114a, 114b)이 임의의 수의 상호연결된 기지국들 및/또는 네트워크 요소들을 포함할 수 있다는 것을 잘 알 것이다.
기지국(114a)은, 다른 기지국들 및/또는, BSC(base station controller), RNC(radio network controller), 릴레이 노드(relay node)들 등과 같은, 네트워크 요소들(도시 생략)도 포함할 수 있는, RAN(103/104/105)의 일부일 수 있다. 기지국(114a) 및/또는 기지국(114b)은, 셀(cell)(도시되지 않음)이라고 지칭될 수 있는, 특정의 지리적 영역 내에서 무선 신호를 전송 및/또는 수신하도록 구성될 수 있다. 셀은 셀 섹터(cell sector)들로 추가로 나누어질 수 있다. 예를 들어, 기지국(114a)과 연관된 셀이 3개의 섹터들로 나누어질 수 있다. 따라서, 일 실시예에서, 기지국(114a)은 3개의 송수신기들(즉, 셀의 각각의 섹터마다 하나씩)를 포함할 수 있다. 일 실시예에서, 기지국(114a)은 MIMO(multiple-input multiple-output) 기술을 이용할 수 있고, 따라서, 셀의 각각의 섹터에 대해 다수의 송수신기들을 이용할 수 있다.
기지국들(114a, 114b)은 임의의 적당한 무선 통신 링크(예컨대, RF(radio frequency), 마이크로파, IR(infrared), UV(ultraviolet), 가시광 등)일 수 있는, 공중 인터페이스(air interface)(115/116/117)를 통해 WTRU들(102a, 102b, 102c, 102d) 중 하나 이상과 통신할 수 있다. 공중 인터페이스(115/116/117)가 임의의 적당한 RAT(radio access technology)를 사용하여 설정될 수 있다.
보다 구체적으로는, 앞서 살펴본 바와 같이, 통신 시스템(100)은 다중 접속 시스템일 수 있고, CDMA, TDMA, FDMA, OFDMA, SC-FDMA 등과 같은, 하나 이상의 채널 액세스 방식들을 이용할 수 있다. 예를 들어, RAN(103/104/105) 내의 기지국(114a)과 WTRU들(102a, 102b, 102c)은 WCDMA(wideband CDMA)를 사용하여 공중 인터페이스(115/116/117)를 구축할 수 있는, UTRA(UMTS(Universal Mobile Telecommunications System) Terrestrial Radio Access)와 같은 무선 기술을 구현할 수 있다. WCDMA는 HSPA(High-Speed Packet Access) 및/또는 HSPA+(Evolved HSPA)와 같은 통신 프로토콜들을 포함할 수 있다. HSPA는 HSDPA(High-Speed Downlink Packet Access) 및/또는 HSUPA(High-Speed Uplink Packet Access)를 포함할 수 있다.
일 실시예에서, 기지국(114a)과 WTRU들(102a, 102b, 102c)은 LTE(Long Term Evolution) 및/또는 LTE-A(LTE-Advanced)를 사용하여 공중 인터페이스(115/116/117)를 구축할 수 있는, E-UTRA(Evolved UMTS Terrestrial Radio Access)와 같은 무선 기술을 구현할 수 있다.
다른 실시예들에서, 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 IEEE 802.16(예컨대, WiMAX(Worldwide Interoperability for Microwave Access)), CDMA2000, CDMA2000 1X, CDMA2000 EV-DO, IS-2000(Interim Standard 2000), IS-95(Interim Standard 95), IS-856(Interim Standard 856), GSM(Global System for Mobile communications), EDGE(Enhanced Data rates for GSM Evolution), GSM EDGE(GERAN) 등과 같은 무선 기술들을 구현할 수 있다.
도 13a의 기지국(114b)은, 예를 들어, 무선 라우터, Home Node B, Home eNode B, 또는 액세스 포인트일 수 있고, 사업장, 가정, 차량, 캠퍼스 등과 같은 국소화된 영역에서의 무선 연결을 용이하게 하기 위해 임의의 적당한 RAT를 이용할 수 있다. 일 실시예에서, 기지국(114b)과 WTRU들(102c, 102d)은 WLAN(wireless local area network)을 구축하기 위해 IEEE 802.11과 같은 무선 기술을 구현할 수 있다. 일 실시예에서, 기지국(114b)과 WTRU들(102c, 102d)은 WPAN(wireless personal area network)을 구축하기 위해 IEEE 802.15와 같은 무선 기술을 구현할 수 있다. 또 다른 실시예에서, 기지국(114b)과 WTRU들(102c, 102d)은 피코셀(picocell) 또는 펨토셀(femtocell)을 구축하기 위해 셀룰러 기반 RAT(예컨대, WCDMA, CDMA2000, GSM, LTE, LTE-A 등)를 이용할 수 있다. 도 13a에 도시된 바와 같이, 기지국(114b)은 인터넷(110)에의 직접 연결(direct connection)을 가질 수 있다. 따라서, 기지국(114b)은 코어 네트워크(106/107/109)를 통해 인터넷(110)에 액세스할 필요가 없을 수 있다.
RAN(103/104/105)은 음성, 데이터, 애플리케이션, 및 VoIP(voice over internet protocol) 서비스를 WTRU들(102a, 102b, 102c, 102d) 중 하나 이상의 WTRU들에 제공하도록 구성된 임의의 유형의 네트워크일 수 있는 코어 네트워크(106/107/109)와 통신할 수 있다. 예를 들어, 코어 네트워크(106/107/109)는 호 제어(call control), 과금 서비스(billing service), 모바일 위치 기반 서비스, 선불 전화(pre-paid calling), 인터넷 연결, 비디오 배포(video distribution) 등을 제공할 수 있고, 그리고/또는 사용자 인증과 같은 고수준 보안 기능들을 수행할 수 있다. 비록 도 13a에 도시되어 있지는 않지만, RAN(103/104/105) 및/또는 코어 네트워크(106/107/109)가 RAN(103/104/105)과 동일한 RAT 또는 상이한 RAT를 이용하는 다른 RAN들과 직접 또는 간접 통신을 하고 있을 수 있다는 것을 잘 알 것이다. 예를 들어, E-UTRA 무선 기술을 이용하고 있을 수 있는 RAN(103/104/105)에 연결되는 것에 부가하여, 코어 네트워크(106/107/109)는 또한 GSM 무선 기술을 이용하는 다른 RAN(도시 생략)과 통신할 수 있다.
코어 네트워크(106/107/109)는 또한 WTRU들(102a, 102b, 102c, 102d)이 PSTN(108), 인터넷(110) 및/또는 다른 네트워크들(112)에 액세스하기 위한 게이트웨이로서 역할할 수 있다. PSTN(108)은 POTS(plain old telephone service)를 제공하는 회선 교환 전화 네트워크를 포함할 수 있다. 인터넷(110)은 TCP/IP 인터넷 프로토콜군(internet protocol suite) 내의 TCP(transmission control protocol), UDP(user datagram protocol) 및 IP(internet protocol)와 같은, 공통의 통신 프로토콜들을 사용하는 상호연결된 컴퓨터 네트워크들 및 디바이스들의 전세계 시스템(global system)을 포함할 수 있다. 네트워크들(112)은 다른 서비스 공급자들이 소유하고 그리고/또는 운영하는 유선 또는 무선 통신 네트워크들을 포함할 수 있다. 예를 들어, 네트워크들(112)은 RAN(103/104/105)과 동일한 RAT 또는 상이한 RAT를 이용할 수 있는 하나 이상의 RAN들에 연결된 다른 코어 네트워크를 포함할 수 있다.
통신 시스템(100) 내의 WTRU들(102a, 102b, 102c, 102d) 중 일부 또는 전부는 다중-모드 능력(multi-mode capabilities)을 포함할 수 있다 - 예컨대, WTRU들(102a, 102b, 102c, 102d)이 상이한 무선 링크들을 통해 상이한 무선 네트워크들과 통신하기 위해 다수의 송수신기들을 포함할 수 있다 -. 예를 들어, 도 13a에 도시된 WTRU(102c)는 셀룰러 기반 무선 기술을 이용할 수 있는 기지국(114a)과 통신하도록, 그리고 IEEE 802 무선 기술을 이용할 수 있는 기지국(114b)과 통신하도록 구성될 수 있다.
도 13b는 예시적인 WTRU(102)의 시스템도이다. 도 13b에 도시된 바와 같이, WTRU(102)는 프로세서(118), 송수신기(120), 송수신 요소(transmit/receive element)(122), 스피커/마이크로폰(124), 키패드(126), 디스플레이/터치패드(128), 비이동식 메모리(130), 이동식 메모리(132), 전원(134), GPS(global positioning system) 칩셋(136), 및 다른 주변기기들(138)을 포함할 수 있다. 일 실시예와 부합한 채로 있으면서 WTRU(102)가 상기한 요소들의 임의의 서브컴비네이션(subcombination)을 포함할 수 있다는 것을 잘 알 것이다. 또한, 실시예들은, 그 중에서도 특히, BTS(transceiver station), Node-B, 사이트 제어기, AP(access point), 홈 노드-B(home node-B), eNodeB(evolved home node-B), HeNB(home evolved node-B), HeNB(home evolved node-B) 게이트웨이, 및 프록시 노드들 등(이들로 제한되지 않음)과 같은, 기지국들(114a 및 114b), 및/또는 기지국들(114a 및 114b)이 나타낼 수 있는 노드들이 도 13b에 도시되고 본원에 기술되는 요소들 중 일부 또는 전부를 포함할 수 있다는 것을 생각하고 있다.
프로세서(118)는 범용 프로세서, 특수 목적 프로세서, 종래의 프로세서, DSP(digital signal processor), 복수의 마이크로프로세서들, DSP 코어와 연관된 하나 이상의 마이크로프로세서들, 제어기, 마이크로제어기, ASIC(Application Specific Integrated Circuit)들, FPGA(Field Programmable Gate Array) 회로들, 임의의 다른 유형의 IC(integrated circuit), 상태 머신(state machine) 등일 수 있다. 프로세서(118)는 WTRU(102)가 무선 환경에서 동작할 수 있게 하는 신호 코딩, 데이터 처리, 전력 제어, 입출력 처리, 및/또는 임의의 다른 기능을 수행할 수 있다. 프로세서(118)는 송수신기(120)에 결합될 수 있고, 송수신기(120)는 송수신 요소(122)에 결합될 수 있다. 도 13b가 프로세서(118) 및 송수신기(120)를 개별 컴포넌트들로서 나타내고 있지만, 프로세서(118) 및 송수신기(120)가 전자 패키지 또는 칩에 함께 통합되어 있을 수 있다는 것을 잘 알 것이다.
송수신 요소(122)는 공중 인터페이스(115/116/117)를 통해 기지국(예컨대, 기지국(114a))으로 신호들을 전송하거나 기지국으로부터 신호들을 수신하도록 구성될 수 있다. 예를 들어, 일 실시예에서, 송수신 요소(122)는 RF 신호들을 전송 및/또는 수신하도록 구성된 안테나일 수 있다. 일 실시예에서, 송수신 요소(122)는, 예를 들어, IR, UV 또는 가시광 신호들을 전송 및/또는 수신하도록 구성된 방출기/검출기(emitter/detector)일 수 있다. 또 다른 실시예에서, 송수신 요소(122)는 RF 및 광 신호들 둘 다를 전송 및 수신하도록 구성될 수 있다. 송수신 요소(122)가 무선 신호들의 임의의 조합을 전송 및/또는 수신하도록 구성될 수 있다는 것을 잘 알 것이다.
그에 부가하여, 송수신 요소(122)가 도 13b에 단일 요소로서 나타내어져 있지만, WTRU(102)는 임의의 수의 송수신 요소들(122)을 포함할 수 있다. 보다 구체적으로는, WTRU(102)는 MIMO 기술을 이용할 수 있다. 따라서, 일 실시예에서, WTRU(102)는 공중 인터페이스(115/116/117)를 통해 무선 신호들을 전송 및 수신하기 위한 2개 이상의 송수신 요소들(122)(예컨대, 다수의 안테나들)을 포함할 수 있다.
송수신기(120)는 송수신 요소(122)에 의해 전송되어야 하는 신호들을 변조하도록 그리고 송수신 요소(122)에 의해 수신되는 신호들을 복조하도록 구성될 수 있다. 앞서 살펴본 바와 같이, WTRU(102)는 다중-모드 능력을 가질 수 있다. 따라서, 송수신기(120)는 WTRU(102)가, 예를 들어, UTRA 및 IEEE 802.11과 같은, 다수의 RAT들을 통해 통신할 수 있게 하기 위해 다수의 송수신기들을 포함할 수 있다.
WTRU(102)의 프로세서(118)는 스피커/마이크로폰(124), 키패드(126), 및/또는 디스플레이/터치패드(128)(예컨대, LCD(liquid crystal display) 디스플레이 유닛 또는 OLED(organic light emitting diode) 디스플레이 유닛)에 결합될 수 있고 그로부터 사용자 입력 데이터를 수신할 수 있다. 프로세서(118)는 또한 사용자 데이터를 스피커/마이크로폰(124), 키패드(126) 및/또는 디스플레이/터치패드(128)로 출력할 수 있다. 그에 부가하여, 프로세서(118)는 비이동식 메모리(130) 및/또는 이동식 메모리(132)와 같은, 임의의 유형의 적당한 메모리로부터의 정보에 액세스하고 그 메모리에 데이터를 저장할 수 있다. 비이동식 메모리(130)는 RAM(random access memory), ROM(read only memory), 하드 디스크, 또는 임의의 다른 유형의 메모리 저장 디바이스를 포함할 수 있다. 이동식 메모리(132)는 SIM(subscriber identity module) 카드, 메모리 스틱(memory stick), SD(secure digital) 메모리 카드 등을 포함할 수 있다. 다른 실시예에서, 프로세서(118)는 WTRU(102) 상에 물리적으로 위치되지 않은(예컨대, 서버 또는 홈 컴퓨터(도시되지 않음) 상의) 메모리로부터의 정보에 액세스하고 그 메모리에 데이터를 저장할 수 있다.
프로세서(118)는 전원(134)으로부터 전력을 받을 수 있고, WTRU(102) 내의 다른 컴포넌트들로 전력을 분배하고 그리고/또는 전력을 제어하도록 구성될 수 있다. 전원(134)은 WTRU(102)에 전력을 공급하기 위한 임의의 적당한 디바이스일 수 있다. 예를 들어, 전원(134)은 하나 이상의 건전지(예컨대, 니켈 카드뮴(NiCd), 니켈 아연(NiZn), 니켈 금속 수소화물(NiMH), 리튬 이온(Li-ion) 등), 태양 전지(solar cell), 연료 전지(fuel cell) 등을 포함할 수 있다.
프로세서(118)는 또한 WTRU(102)의 현재 위치에 관한 위치 정보(예컨대, 경도 및 위도)를 제공하도록 구성될 수 있는 GPS 칩셋(136)에 결합될 수 있다. GPS 칩셋(136)으로부터의 정보에 부가하여 또는 그 대신에, WTRU(102)는 기지국(예컨대, 기지국들(114a, 114b))으로부터 공중 인터페이스(115/116/117)를 통해 위치 정보를 수신하고 그리고/또는 2개 이상의 근방의 기지국들로부터 수신되는 신호들의 타이밍에 기초하여 그의 위치를 결정할 수 있다. WTRU(102)가 일 실시예와 부합한 채로 있으면서 임의의 적당한 위치 결정 방법에 의해 위치 정보를 획득할 수 있다는 것을 잘 알 것이다.
프로세서(118)는 또한 부가의 특징, 기능 및/또는 유선 또는 무선 연결을 제공하는 하나 이상의 소프트웨어 및/또는 하드웨어 모듈들을 포함할 수 있는 다른 주변기기들(138)에 결합될 수 있다. 예를 들어, 주변기기들(138)은 가속도계, 전자 나침반(e-compass), 위성 송수신기, 디지털 카메라(사진 또는 비디오용), USB(universal serial bus) 포트, 진동 디바이스, 텔레비전 송수신기, 핸즈프리 헤드셋, 블루투스® 모듈, FM(frequency modulated) 라디오 유닛, 디지털 음악 플레이어, 미디어 플레이어, 비디오 게임 플레이어 모듈, 인터넷 브라우저 등을 포함할 수 있다.
도 13c는 일 실시예에 따른, RAN(103) 및 코어 네트워크(106)의 시스템도이다. 앞서 살펴본 바와 같이, RAN(103)은 공중 인터페이스(115)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 UTRA 무선 기술을 이용할 수 있다. RAN(103)은 또한 코어 네트워크(106)와 통신하고 있을 수 있다. 도 13c에 도시된 바와 같이, RAN(103)은, 각각이 공중 인터페이스(115)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위한 하나 이상의 송수신기들을 포함할 수 있는, Node-B들(140a, 140b, 140c)을 포함할 수 있다. Node-B들(140a, 140b, 140c)은 각각이 RAN(103) 내의 특정의 셀(도시되지 않음)과 연관되어 있을 수 있다. RAN(103)은 또한 RNC들(142a, 142b)도 포함할 수 있다. RAN(103)이 일 실시예와 부합한 채로 있으면서 임의의 수의 Node-B들 및 RNC들을 포함할 수 있다는 것을 잘 알 것이다.
도 13c에 도시된 바와 같이, Node-B들(140a, 140b)은 RNC(142a)와 통신하고 있을 수 있다. 그에 부가하여, Node-B(140c)는 RNC(142b)와 통신하고 있을 수 있다. Node-B들(140a, 140b, 140c)은 Iub 인터페이스를 통해 각자의 RNC들(142a, 142b)과 통신할 수 있다. RNC들(142a, 142b)은 Iur 인터페이스를 통해 서로 통신할 수 있다. RNC들(142a, 142b) 각각은 그에 연결되어 있는 각자의 Node-B들(140a, 140b, 140c)를 제어하도록 구성될 수 있다. 그에 부가하여, RNC들(142a, 142b) 각각은 외부 루프 전력 제어(outer loop power control), 부하 제어, 허가 제어(admission control), 패킷 스케줄링, 핸드오버 제어, 매크로다이버시티(macrodiversity), 보안 기능, 데이터 암호화 등과 같은 다른 기능을 수행하거나 지원하도록 구성될 수 있다.
도 13c에 도시된 코어 네트워크(106)는 MGW(media gateway)(144), MSC(mobile switching center)(146), SGSN(serving GPRS support node)(148), 및/또는 GGSN(gateway GPRS support node)(150)을 포함할 수 있다. 상기 요소들 각각이 코어 네트워크(106)의 일부로서 나타내어져 있지만, 이들 요소 중 임의의 것이 코어 네트워크 운영자 이외의 엔티티에 의해 소유되고 및/또는 운영될 수 있다는 것을 잘 알 것이다.
RAN(103) 내의 RNC(142a)는 IuCS 인터페이스를 통해 코어 네트워크(106) 내의 MSC(146)에 연결될 수 있다. MSC(146)는 MGW(144)에 연결될 수 있다. MSC(146) 및 MGW(144)는, WTRU들(102a, 102b, 102c)과 종래의 지상선(land-line) 통신 디바이스들 사이의 통신을 용이하게 하기 위해, PSTN(108)과 같은 회선 교환 네트워크들에의 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다.
RAN(103) 내의 RNC(142a)는 또한 IuPS 인터페이스를 통해 코어 네트워크(106) 내의 SGSN(148)에 연결될 수 있다. SGSN(148)은 GGSN(150)에 연결될 수 있다. SGSN(148) 및 GGSN(150)은, WTRU들(102a, 102b, 102c)와 IP 기반 디바이스(IP-enabled device)들 사이의 통신을 용이하게 하기 위해, 인터넷(110)과 같은 패킷 교환 네트워크들에의 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다.
앞서 살펴본 바와 같이, 코어 네트워크(106)는 또한 다른 서비스 공급자들에 의해 소유되고 그리고/또는 운영되는 다른 유선 또는 무선 네트워크들을 포함할 수 있는 네트워크들(112)에 연결될 수 있다.
도 13d는 일 실시예에 따른, RAN(104) 및 코어 네트워크(107)의 시스템도이다. 앞서 살펴본 바와 같이, RAN(104)은 공중 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 E-UTRA 무선 기술을 이용할 수 있다. RAN(104)은 또한 코어 네트워크(107)와 통신할 수 있다.
RAN(104)은 eNode-B들(160a, 160b, 160c)을 포함할 수 있지만, RAN(104)이 일 실시예와 부합한 채로 있으면서 임의의 수의 eNode-B들을 포함할 수 있다는 것을 잘 알 것이다. eNode-B들(160a, 160b, 160c)은 각각이 공중 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 하나 이상의 송수신기들을 포함할 수 있다. 일 실시예에서, eNode-B들(160a, 160b, 160c)은 MIMO 기술을 구현할 수 있다. 따라서, 예를 들어, eNode B(160a)는 WTRU(102a)로 무선 신호들을 전송하고 그로부터 무선 신호들을 수신하기 위해 다수의 안테나들을 사용할 수 있다.
eNode-B들(160a, 160b, 160c) 각각은 특정의 셀(도시 생략)과 연관되어 있을 수 있고, 무선 자원 관리 결정, 핸드오버 결정, 상향링크 및/또는 하향링크에서의 사용자의 스케줄링 등을 처리하도록 구성되어 있을 수 있다. 도 13d에 도시된 바와 같이, eNode B들(160a, 160b, 160c)은 X2 인터페이스를 통해 서로 통신할 수 있다.
도 13d에 도시된 코어 네트워크(107)는 MME(mobility management gateway)(162), SGW(serving gateway)(164), 및/또는 PDN(packet data network) 게이트웨이(166)를 포함할 수 있다. 상기 요소들 각각이 코어 네트워크(107)의 일부로서 나타내어져 있지만, 이 요소들 중 임의의 것이 코어 네트워크 운영자 이외의 엔티티에 의해 소유되고 및/또는 운영될 수 있다는 것을 잘 알 것이다.
MME(162)는 S1 인터페이스를 통해 RAN(104) 내의 eNode-B들(160a, 160b, 160c) 각각에 연결되어 있을 수 있고, 제어 노드로서 역할할 수 있다. 예를 들어, MME(162)는 WTRU들(102a, 102b, 102c)의 사용자들을 인증하는 것, 베어러 활성화/비활성화, WTRU들(102a, 102b, 102c)의 초기 접속(initial attach) 동안 특정의 서빙 게이트웨이를 선택하는 것 등을 책임지고 있을 수 있다. MME(162)는 또한 RAN(104)과 GSM 또는 WCDMA와 같은 다른 무선 기술들을 이용하는 다른 RAN들(도시 생략) 간에 전환하는 제어 평면 기능(control plane function)을 제공할 수 있다.
서빙 게이트웨이(164)는 S1 인터페이스를 통해 RAN(104) 내의 eNode B들(160a, 160b, 160c) 각각에 연결될 수 있다. 서빙 게이트웨이(164)는 일반적으로 WTRU들(102a, 102b, 102c)로/로부터 사용자 데이터 패킷을 라우팅하고 포워딩(forward)할 수 있다. 서빙 게이트웨이(164)는 또한 eNode B간 핸드오버(inter-eNode B handover) 동안 사용자 평면을 앵커링(anchoring)하는 것, WTRU들(102a, 102b, 102c)에 대해 하향링크 데이터가 이용가능할 때 페이징(paging)을 트리거하는 것, WTRU들(102a, 102b, 102c)의 컨텍스트를 관리하고 저장하는 것 등과 같은 다른 기능들을 수행할 수 있다.
서빙 게이트웨이(164)는 또한, WTRU들(102a, 102b, 102c)과 IP 기반 디바이스들 사이의 통신을 용이하게 하기 위해, 인터넷(110)과 같은, 패킷 교환 네트워크들에의 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있는 PDN 게이트웨이(166)에 연결될 수 있다.
코어 네트워크(107)는 다른 네트워크들과의 통신을 용이하게 할 수 있다. 예를 들어, 코어 네트워크(107)는, WTRU들(102a, 102b, 102c)과 종래의 지상선 통신 디바이스들 사이의 통신을 용이하게 하기 위해, PSTN(108)과 같은 회선 교환 네트워크들에의 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다. 예를 들어, 코어 네트워크(107)는 코어 네트워크(107)와 PSTN(108) 사이의 인터페이스로서 역할하는 IP 게이트웨이(예컨대, IMS(IP multimedia subsystem) 서버)를 포함할 수 있거나 그와 통신할 수 있다. 그에 부가하여, 코어 네트워크(107)는 다른 서비스 공급자들에 의해 소유되고 그리고/또는 운영되는 다른 유선 또는 무선 네트워크들을 포함할 수 있는 네트워크들(112)에의 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다.
도 13e는 일 실시예에 따른, RAN(105) 및 코어 네트워크(109)의 시스템도이다. RAN(105)은 공중 인터페이스(117)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 IEEE 802.16 무선 기술을 이용하는 ASN(access service network)일 수 있다. 이하에서 더 논의될 것인 바와 같이, WTRU들(102a, 102b, 102c), RAN(105), 및 코어 네트워크(109)의 상이한 기능 엔티티들 간의 통신 링크들이 참조점(reference point)들로서 정의될 수 있다.
도 13e에 도시된 바와 같이, RAN(105)은 기지국들(180a, 180b, 180c) 및 ASN 게이트웨이(182)를 포함할 수 있지만, RAN(105)이 일 실시예와 부합한 채로 있으면서 임의의 수의 기지국들 및 ASN 게이트웨이들을 포함할 수 있다는 것을 잘 알 것이다. 기지국들(180a, 180b, 180c)은 각각이 RAN(105) 내의 특정의 셀(도시되지 않음)과 연관될 수 있고, 각각이 공중 인터페이스(117)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 하나 이상의 송수신기들을 포함할 수 있다. 일 실시예에서, 기지국들(180a, 180b, 180c)은 MIMO 기술을 구현할 수 있다. 따라서, 예를 들어, 기지국(180a)은 WTRU(102a)로 무선 신호들을 전송하고 그로부터 무선 신호들을 수신하기 위해 다수의 안테나들을 사용할 수 있다. 기지국들(180a, 180b, 180c)은 또한 핸드오프 트리거링(handoff triggering), 터널 구축(tunnel establishment), 무선 자원 관리, 트래픽 분류, QoS(quality of service) 정책 시행 등과 같은 이동성 관리 기능들을 제공할 수 있다. ASN 게이트웨이(182)는 트래픽 집계 지점(traffic aggregation point)으로서 역할할 수 있고, 페이징, 가입자 프로필의 캐싱, 코어 네트워크(109)로의 라우팅 등을 책임지고 있을 수 있다.
WTRU들(102a, 102b, 102c)과 RAN(105) 사이의 공중 인터페이스(117)는 IEEE 802.16 규격을 구현하는 R1 참조점으로서 정의될 수 있다. 그에 부가하여, WTRU들(102a, 102b, 102c) 각각은 코어 네트워크(109)와 논리적 인터페이스(logical interface)(도시되지 않음)를 구축할 수 있다. WTRU들(102a, 102b, 102c)과 코어 네트워크(109) 사이의 논리적 인터페이스는 인증, 권한 부여(authorization), IP 호스트 구성 관리, 및/또는 이동성 관리를 위해 사용될 수 있는 R2 참조점으로서 정의될 수 있다.
기지국들(180a, 180b, 180c) 각각 사이의 통신 링크는 기지국들 사이의 WTRU 핸드오버 및 데이터 전송을 용이하게 하기 위한 프로토콜들을 포함하는 R8 참조점으로서 정의될 수 있다. 기지국들(180a, 180b, 180c)과 ASN 게이트웨이(182) 사이의 통신 링크는 R6 참조점으로서 정의될 수 있다. R6 참조점은 WTRU들(102a, 102b, 102c) 각각과 연관된 이동성 이벤트에 기초하여 이동성 관리를 용이하게 하기 위한 프로토콜들을 포함할 수 있다.
도 13e에 도시된 바와 같이, RAN(105)은 코어 네트워크(109)에 연결될 수 있다. RAN(105)과 코어 네트워크(109) 사이의 통신 링크는, 예를 들어, 데이터 전송 및 이동성 관리 능력을 용이하게 하기 위한 프로토콜들을 포함하는 R3 참조점으로서 정의될 수 있다. 코어 네트워크(109)는 MIP-HA(mobile IP home agent)(184), AAA(authentication, authorization, accounting) 서버(186), 및 게이트웨이(188)를 포함할 수 있다. 상기 요소들 각각이 코어 네트워크(109)의 일부로서 나타내어져 있지만, 이 요소들 중 임의의 것이 코어 네트워크 운영자 이외의 엔티티에 의해 소유되고 및/또는 운영될 수 있다는 것을 잘 알 것이다.
MIP-HA는 IP 주소 관리를 책임지고 있을 수 있고, WTRU들(102a, 102b, 102c)이 상이한 ASN들 및/또는 상이한 코어 네트워크들 사이에서 로밍할 수 있게 해줄 수 있다. MIP-HA(184)는, WTRU들(102a, 102b, 102c)과 IP 기반 디바이스들 사이의 통신을 용이하게 하기 위해, 인터넷(110)과 같은, 패킷 교환 네트워크들에의 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다. AAA 서버(186)는 사용자 인증 및 사용자 서비스를 지원하는 것을 책임지고 있을 수 있다. 게이트웨이(188)는 다른 네트워크들과의 연동(interworking)을 용이하게 할 수 있다. 예를 들어, 게이트웨이(188)는, WTRU들(102a, 102b, 102c)과 종래의 지상선(land-line) 통신 디바이스들 사이의 통신을 용이하게 해주기 위해, PSTN(108)과 같은 회선 교환 네트워크들에의 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다. 그에 부가하여, 게이트웨이(188)는 다른 서비스 공급자들에 의해 소유되고 그리고/또는 운영되는 다른 유선 또는 무선 네트워크들을 포함할 수 있는 네트워크들(112)에의 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다.
도 13e에 도시되어 있지는 않지만, RAN(105)이 다른 ASN들에 연결될 수 있다는 것과 코어 네트워크(109)가 다른 코어 네트워크들에 연결될 수 있다는 것을 잘 알 것이다. RAN(105)과 다른 ASN들 사이의 통신 링크가 RAN(105)과 다른 ASN들 사이의 WTRU들(102a, 102b, 102c)의 이동성을 조정하기 위한 프로토콜들을 포함할 수 있는 R4 참조점으로서 정의될 수 있다. 코어 네트워크(109)와 다른 코어 네트워크들 사이의 통신 링크가 홈 코어 네트워크(home core network)들과 방문 코어 네트워크(visited core network)들 사이의 연동을 용이하게 하기 위한 프로토콜들을 포함할 수 있는 R5 참조점으로서 정의될 수 있다.
특징들 및 요소들이 특정의 조합들로 앞서 기술되어 있지만, 본 기술 분야의 당업자라면 각각의 특징 또는 요소가 단독으로 또는 다른 특징들 및 요소들과 임의의 조합으로 사용될 수 있다는 것을 잘 알 것이다. 그에 부가하여, 본원에 기술되는 방법들이 컴퓨터 또는 프로세서에 의한 실행을 위해 컴퓨터 판독가능 매체에 포함되어 있는 컴퓨터 프로그램, 소프트웨어, 또는 펌웨어로 구현될 수 있다. 컴퓨터 판독가능 매체의 예들은 전자 신호들(유선 또는 무선 연결들을 통해 전송됨) 및 컴퓨터 판독가능 저장 매체를 포함한다. 컴퓨터 판독가능 저장 매체의 예들은 ROM(read only memory), RAM(random access memory), 레지스터, 캐시 메모리, 반도체 메모리 디바이스, 내장형 하드 디스크 및 이동식 디스크와 같은 자기 매체, 광자기 매체, 그리고 CD-ROM 디스크 및 DVD(digital versatile disk)와 같은 광학 매체를 포함하지만, 이들로 제한되지 않는다. 프로세서는 소프트웨어와 함께 WTRU, UE, 단말, 기지국, RNC, 또는 임의의 호스트 컴퓨터에서 사용하기 위한 무선 주파수 송수신기를 구현하는 데 사용될 수 있다.
Claims (26)
- 비디오 코딩 디바이스에 있어서,
프로세서를 포함하고,
상기 프로세서는,
제1 TU(transform unit)와 제2 TU를 포함하는 CU(coding unit)를 수신하고;
역 ACT(inverse adaptive color transform)가 상기 제1 TU에 대해 인에이블(enable)되는 것을 결정하고 - 상기 제1 TU는 원래의 루마 성분 비트 깊이(original luma component bit depth)를 가지는 루마 성분과, 원래의 크로마 성분 비트 깊이(original chroma component bit depth)를 가지는 제1 크로마 성분 및 제2 크로마 성분을 포함함 -;
상기 루마 성분과 상기 제1 및 제2 크로마 성분들이 정렬된(aligned) 비트 깊이를 가지도록 상기 루마 성분과 상기 제1 및 제2 크로마 성분들에 대해 비트 깊이 정렬(alignment)을 수행하고;
상기 정렬된 비트 깊이를 가지는 상기 루마 성분과 상기 제1 및 제2 크로마 성분들에 기초하여 상기 제1 TU에 대해 역 ACT를 수행하도록
구성되는 것인, 비디오 코딩 디바이스. - 제1항에 있어서,
상기 프로세서는 또한,
상기 역 ACT 이후에, 상기 루마 성분을 상기 원래의 루마 성분 비트 깊이로 되돌리거나(revert), 상기 제1 및 제2 크로마 성분들을 상기 원래의 크로마 성분 비트 깊이로 되돌리도록 구성되는 것인, 비디오 코딩 디바이스. - 제1항에 있어서,
상기 프로세서는 또한,
상기 원래의 루마 성분 비트 깊이 및 상기 원래의 크로마 성분 비트 깊이 사이의 비트 깊이 차이를 결정하고;
더 낮은 원래의 비트 깊이를 가지는 성분의 계수들을 상기 비트 깊이 차이 만큼 왼쪽 시프트(left-shift)하도록 구성되는 것인, 비디오 코딩 디바이스. - 제3항에 있어서,
상기 프로세서는 또한,
상기 역 ACT 이후에, 상기 더 낮은 원래의 비트 깊이를 가지는 상기 성분의 상기 계수들을 상기 비트 깊이 차이 만큼 오른쪽 시프트(right-shift)하도록 구성되는 것인, 비디오 코딩 디바이스. - 제1항에 있어서,
상기 프로세서는 또한,
제1 병렬 처리 경로를 통해 상기 제1 TU에 대한 역양자화, 역변환, 역 CCP(cross-component prediction), 및 역 ACT를 적용하고;
제2 병렬 처리 경로 - 상기 제2 병렬 처리 경로는 상기 제1 병렬 처리 경로와 독립적임 - 를 통해 역양자화, 역변환 및 역 CCP를 적용하도록 구성되는 것인, 비디오 코딩 디바이스. - 제1항에 있어서,
상기 정렬된 비트 깊이는 상기 원래의 루마 성분 비트 깊이 및 상기 원래의 크로마 성분 비트 깊이 중에서 더 높은 비트 깊이이고, 상기 프로세서는 또한,
상기 정렬된 비트 깊이에 매칭(match)시키기 위해, 더 낮은 비트 깊이를 가지는 성분을 스케일링하도록 구성되는 것인, 비디오 코딩 디바이스. - 제1항에 있어서,
상기 프로세서는 또한, 상기 제1 TU와 연관된 TU 색 공간 지시자에 기초하여, 상기 제1 TU의 잔차들이 변환된 색 공간에서 코딩되는지 또는 원래의 색 공간에서 코딩되는지 여부를 결정하도록 구성되는 것인, 비디오 코딩 디바이스. - 비디오 코딩 방법에 있어서,
제1 TU(transform unit)와 제2 TU를 포함하는 CU(coding unit)를 수신하는 단계;
역 ACT(inverse adaptive color transform)가 상기 제1 TU에 대해 인에이블되는 것을 결정하는 단계 - 상기 제1 TU는 원래의 루마 성분 비트 깊이(original luma component bit depth)를 가지는 루마 성분과, 원래의 크로마 성분 비트 깊이(original chroma component bit depth)를 가지는 제1 크로마 성분 및 제2 크로마 성분을 포함함 -;
상기 루마 성분과 상기 제1 및 제2 크로마 성분들이 정렬된(aligned) 비트 깊이를 가지도록 상기 루마 성분과 상기 제1 및 제2 크로마 성분들에 대해 비트 깊이 정렬(alignment)을 수행하는 단계; 및
상기 정렬된 비트 깊이를 가지는 상기 루마 성분과 상기 제1 및 제2 크로마 성분들에 기초하여 상기 제1 TU에 대해 역 ACT를 수행하는 단계
를 포함하는, 비디오 코딩 방법. - 제8항에 있어서,
역 ACT가 상기 제1 TU에 대해 인에이블되는 것은, 상기 제1 TU를 포함하는 상기 CU와 연관된 예측 모드, 파티션 모드 또는 인트라 예측 모드 중 적어도 하나에 기초하여 결정되는 것인, 비디오 코딩 방법. - 제8항에 있어서,
상기 제1 TU와 연관된 제1 TU 역 ACT 인에이블 지시자에 기초하여 역 ACT가 상기 제1 TU에 대해 인에이블되는지 여부, 및 상기 제2 TU와 연관된 제2 TU 역 ACT 인에이블 지시자에 기초하여 역 ACT가 상기 제2 TU에 대해 인에이블되는지 여부를 결정하는 단계를 더 포함하는, 비디오 코딩 방법. - 제8항에 있어서,
역 ACT가 상기 제1 TU에 대해 인에이블되는 것은, 상기 제1 TU를 포함하는 상기 CU와 연관된 CU 레벨 TU 역 ACT 인에이블 지시자에 적어도 부분적으로 기초하여 결정되는 것인, 비디오 코딩 방법. - 제8항에 있어서,
제1 병렬 처리 경로를 통해 상기 제1 TU에 대한 역양자화, 역변환, 역 CCP(cross-component prediction), 및 역 ACT를 적용하는 단계; 및
제2 병렬 처리 경로 - 상기 제2 병렬 처리 경로는 상기 제1 병렬 처리 경로와 독립적임 - 를 통해 역양자화, 역변환 및 역 CCP를 적용하는 단계
를 더 포함하는, 비디오 코딩 방법. - 제8항에 있어서,
상기 역 ACT 이후에, 상기 루마 성분을 상기 원래의 루마 성분 비트 깊이로 되돌리거나(revert), 상기 제1 및 제2 크로마 성분들을 상기 원래의 크로마 성분 비트 깊이로 되돌리는 단계를 더 포함하는, 비디오 코딩 방법. - 제8항에 있어서,
상기 제1 TU와 연관된 TU 색 공간 지시자에 기초하여, 상기 제1 TU의 잔차들이 변환된 색 공간에서 코딩되는지 또는 원래의 색 공간에서 코딩되는지 여부를 결정하는 단계를 더 포함하는, 비디오 코딩 방법. - 제1항에 있어서,
상기 루마 성분과 상기 제1 및 제2 크로마 성분들은 잔차 변환 블록과 연관되는 것인, 비디오 코딩 디바이스. - 제8항에 있어서,
상기 정렬된 비트 깊이는 상기 원래의 루마 성분 비트 깊이 및 상기 원래의 크로마 성분 비트 깊이 중에서 더 높은 비트 깊이이고, 상기 방법은,
상기 정렬된 비트 깊이에 매칭(match)시키기 위해, 더 낮은 비트 깊이를 가지는 성분을 스케일링하는 단계를 더 포함하는, 비디오 코딩 방법. - 제8항에 있어서,
비트 깊이 정렬을 수행하는 단계는,
상기 원래의 루마 성분 비트 깊이 및 상기 원래의 크로마 성분 비트 깊이 사이의 비트 깊이 차이를 결정하는 단계; 및
더 낮은 원래의 비트 깊이를 가지는 성분의 계수들을 상기 비트 깊이 차이 만큼 왼쪽 시프트(left-shift)하는 단계를 더 포함하는, 비디오 코딩 방법. - 제17항에 있어서,
상기 역 ACT 이후에, 상기 더 낮은 원래의 비트 깊이를 가지는 상기 성분의 상기 계수들을 상기 비트 깊이 차이 만큼 오른쪽 시프트(right-shift)하는 단계를 더 포함하는, 비디오 코딩 방법. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462049843P | 2014-09-12 | 2014-09-12 | |
US62/049,843 | 2014-09-12 | ||
US201562171542P | 2015-06-05 | 2015-06-05 | |
US62/171,542 | 2015-06-05 | ||
PCT/US2015/049784 WO2016040865A1 (en) | 2014-09-12 | 2015-09-11 | Inter-component de-correlation for video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170056626A KR20170056626A (ko) | 2017-05-23 |
KR102051193B1 true KR102051193B1 (ko) | 2019-12-02 |
Family
ID=54238556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177009983A KR102051193B1 (ko) | 2014-09-12 | 2015-09-11 | 비디오 코딩을 위한 성분간 탈상관 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10469847B2 (ko) |
EP (2) | EP3544298A1 (ko) |
JP (3) | JP2017531382A (ko) |
KR (1) | KR102051193B1 (ko) |
CN (1) | CN107079157B (ko) |
BR (1) | BR112017004886A2 (ko) |
RU (1) | RU2017112309A (ko) |
TW (1) | TWI722996B (ko) |
WO (1) | WO2016040865A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12075047B2 (en) | 2020-06-12 | 2024-08-27 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and apparatus of video coding in 4:4:4 color format |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105874793B (zh) * | 2013-10-07 | 2019-10-11 | Vid拓展公司 | 用于多层视频编码的组合可分级性处理的方法和设备 |
US11070810B2 (en) * | 2014-03-14 | 2021-07-20 | Qualcomm Incorporated | Modifying bit depths in color-space transform coding |
JP6302600B2 (ja) * | 2014-09-26 | 2018-03-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 知覚的量子化されたビデオコンテンツの符号化および復号化 |
US9838662B2 (en) * | 2014-10-10 | 2017-12-05 | Qualcomm Incorporated | Harmonization of cross-component prediction and adaptive color transform in video coding |
US20160360205A1 (en) * | 2015-06-08 | 2016-12-08 | Industrial Technology Research Institute | Video encoding methods and systems using adaptive color transform |
US10390020B2 (en) * | 2015-06-08 | 2019-08-20 | Industrial Technology Research Institute | Video encoding methods and systems using adaptive color transform |
JP2018056685A (ja) * | 2016-09-27 | 2018-04-05 | 株式会社ドワンゴ | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム |
TWI683573B (zh) * | 2017-03-10 | 2020-01-21 | 聯發科技股份有限公司 | 用於視訊編解碼中具有畫面內方向預測模式之內含畫面內編解碼工具設定的方法和裝置 |
DE102017204946A1 (de) * | 2017-03-23 | 2018-09-27 | Volkswagen Aktiengesellschaft | Verfahren zur Bestimmung eines Wertes einer Integer-Skalierung in einer Verknüpfung von Eingangsmengen zu Ausgangsmengen und Computerprogrammprodukt |
US10778978B2 (en) * | 2017-08-21 | 2020-09-15 | Qualcomm Incorporated | System and method of cross-component dynamic range adjustment (CC-DRA) in video coding |
EP3684055A1 (en) | 2017-09-15 | 2020-07-22 | Sony Corporation | Image processing device and method |
US10681358B2 (en) * | 2017-12-19 | 2020-06-09 | Qualcomm Incorporated | Quantization parameter control for video coding with joined pixel/transform based quantization |
WO2019148977A1 (en) * | 2018-02-01 | 2019-08-08 | Mediatek Inc. | Methods and apparatuses of video encoding or decoding with adaptive quantization of video data |
GB2571313B (en) * | 2018-02-23 | 2022-09-21 | Canon Kk | New sample sets and new down-sampling schemes for linear component sample prediction |
CN112204966B (zh) * | 2018-03-27 | 2024-10-18 | 株式会社Kt | 对图像进行解码、编码的方法和用于传送比特流的装置 |
WO2019229683A1 (en) | 2018-05-31 | 2019-12-05 | Beijing Bytedance Network Technology Co., Ltd. | Concept of interweaved prediction |
WO2020016748A1 (en) | 2018-07-15 | 2020-01-23 | Beijing Bytedance Network Technology Co., Ltd. | Cross-component motion information derivation |
TWI814890B (zh) | 2018-08-17 | 2023-09-11 | 大陸商北京字節跳動網絡技術有限公司 | 簡化的跨分量預測 |
CN114928745B (zh) * | 2018-09-02 | 2024-04-19 | Lg电子株式会社 | 信号编解码方法、计算机可读存储介质和数据传输方法 |
WO2020053804A1 (en) | 2018-09-12 | 2020-03-19 | Beijing Bytedance Network Technology Co., Ltd. | Downsampling in cross-component linear modeling |
TWI833807B (zh) | 2018-09-19 | 2024-03-01 | 大陸商北京字節跳動網絡技術有限公司 | 用於幀內塊複製的基於歷史的運動矢量預測值 |
WO2020106564A2 (en) * | 2018-11-21 | 2020-05-28 | Interdigital Vc Holdings, Inc. | Method and device for picture encoding and decoding |
CN113056920B (zh) | 2018-11-22 | 2024-05-24 | 北京字节跳动网络技术有限公司 | 基于子块的帧间预测的协调方法 |
WO2020125796A1 (en) | 2018-12-22 | 2020-06-25 | Beijing Bytedance Network Technology Co., Ltd. | Two step cross-component prediction mode based on multiple parameter |
WO2020140948A1 (en) | 2019-01-02 | 2020-07-09 | Beijing Bytedance Network Technology Co., Ltd. | Motion vector derivation between dividing patterns |
CN117793346A (zh) | 2019-01-31 | 2024-03-29 | 北京字节跳动网络技术有限公司 | 视频编解码中的细化量化步骤 |
CN113383547A (zh) * | 2019-02-01 | 2021-09-10 | 北京字节跳动网络技术有限公司 | 环路整形和帧间编解码工具之间的相互作用 |
WO2020156538A1 (en) | 2019-02-03 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between mv precisions and mv difference coding |
CN113424533B (zh) | 2019-02-14 | 2024-09-10 | 北京字节跳动网络技术有限公司 | 复杂度降低的解码器侧运动推导 |
EP3932063A1 (en) * | 2019-02-28 | 2022-01-05 | InterDigital VC Holdings, Inc. | Method and device for picture encoding and decoding |
WO2020180737A1 (en) * | 2019-03-04 | 2020-09-10 | Alibaba Group Holding Limited | Method and system for processing video content |
EP3918800A4 (en) | 2019-03-08 | 2022-07-06 | Beijing Bytedance Network Technology Co., Ltd. | SIGNALING TRANSFORMATION INFORMATION IN VIDEO PROCESSING |
JP7390395B2 (ja) * | 2019-03-12 | 2023-12-01 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 画像及びビデオコード化のための選択的成分間変換(ict) |
TWI752438B (zh) * | 2019-03-15 | 2022-01-11 | 聯發科技股份有限公司 | 色度殘差縮放之延遲降低方法和裝置 |
JP7480170B2 (ja) * | 2019-03-25 | 2024-05-09 | オッポ広東移動通信有限公司 | 画像予測方法、エンコーダー、デコーダー及び記憶媒体 |
BR112021019564A2 (pt) * | 2019-04-18 | 2021-12-07 | Beijing Bytedance Network Tech Co Ltd | Método para processamento de mídia visual, aparelho codificador de vídeo, aparelho decodificador de vídeo, e, mídia legível por computador |
CN113711612B (zh) * | 2019-04-20 | 2023-05-26 | 北京字节跳动网络技术有限公司 | 视频编解码中的色度语法元素的信令 |
AU2020263199B2 (en) | 2019-04-23 | 2023-10-19 | Beijing Bytedance Network Technology Co., Ltd. | Methods for cross component dependency reduction |
CN117221558A (zh) | 2019-05-08 | 2023-12-12 | 北京字节跳动网络技术有限公司 | 跨分量编解码的适用性条件 |
KR102627834B1 (ko) | 2019-05-11 | 2024-01-23 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 프로세싱에서의 코딩 툴들의 선택적 사용 |
CN115567707A (zh) | 2019-05-30 | 2023-01-03 | 抖音视界有限公司 | 色度分量的自适应环路滤波 |
KR102627821B1 (ko) | 2019-06-04 | 2024-01-23 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 이웃 블록 정보를 사용한 모션 후보 리스트 구성 |
EP3963889A4 (en) | 2019-06-04 | 2023-01-25 | Beijing Bytedance Network Technology Co., Ltd. | CONDITIONAL IMPLEMENTATION OF A MOVEMENT CANDIDATE LIST CONSTRUCTION PROCESS |
CN117354521A (zh) | 2019-06-07 | 2024-01-05 | 北京字节跳动网络技术有限公司 | 视频比特流中的简化二次变换的有条件信令 |
EP3987793A4 (en) | 2019-06-21 | 2023-07-19 | Beijing Dajia Internet Information Technology Co., Ltd. | PREDICTION DEPENDENT RESIDUAL SCALING METHODS AND DEVICES FOR VIDEO CODING |
CN117579830A (zh) | 2019-06-21 | 2024-02-20 | 北京字节跳动网络技术有限公司 | 自适应环内颜色空间转换和其他编解码工具的选择性使用 |
EP3973707A4 (en) | 2019-06-22 | 2022-08-31 | Beijing Bytedance Network Technology Co., Ltd. | CHROMA REST SCALE SYNTAX ELEMENT |
JP7460748B2 (ja) | 2019-07-07 | 2024-04-02 | 北京字節跳動網絡技術有限公司 | クロマ残差スケーリングのシグナリング |
CN114175636B (zh) | 2019-07-14 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 自适应参数集中的自适应环路滤波的指示 |
EP3984227A4 (en) | 2019-07-27 | 2022-08-17 | Beijing Bytedance Network Technology Co., Ltd. | TOOL USE RESTRICTIONS BASED ON TYPES OF REFERENCE IMAGES |
WO2021023151A1 (en) | 2019-08-03 | 2021-02-11 | Beijing Bytedance Network Technology Co., Ltd. | Position based mode derivation in reduced secondary transforms for video |
EP4000258A4 (en) | 2019-08-20 | 2023-03-15 | Beijing Bytedance Network Technology Co., Ltd. | SCALING POSITION-BASED COEFFICIENTS |
KR20220058534A (ko) | 2019-09-14 | 2022-05-09 | 바이트댄스 아이엔씨 | 크로마 디블로킹 필터링을 위한 양자화 파라미터 |
KR20220065758A (ko) * | 2019-09-20 | 2022-05-20 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 코딩 블록의 스케일링 프로세스 |
CN114424560A (zh) * | 2019-09-20 | 2022-04-29 | 北京字节跳动网络技术有限公司 | 用于屏幕内容的自适应分辨率变化和可缩放编解码 |
KR102695020B1 (ko) * | 2019-09-23 | 2024-08-12 | 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 | 4:4:4 크로마 포맷의 비디오 코딩 방법 및 장치 |
WO2021057996A1 (en) | 2019-09-28 | 2021-04-01 | Beijing Bytedance Network Technology Co., Ltd. | Geometric partitioning mode in video coding |
WO2021068954A1 (en) | 2019-10-12 | 2021-04-15 | Beijing Bytedance Network Technology Co., Ltd. | High level syntax for video coding tools |
EP4029264A4 (en) * | 2019-10-14 | 2022-11-23 | ByteDance Inc. | JOINT CODING OF CHROMINANCE RESIDUE AND FILTERING IN VIDEO PROCESSING |
JP7485761B2 (ja) | 2019-10-29 | 2024-05-16 | 北京字節跳動網絡技術有限公司 | クロスコンポーネント適応ループフィルタの信号通知 |
WO2021088951A1 (en) * | 2019-11-07 | 2021-05-14 | Beijing Bytedance Network Technology Co., Ltd. | Quantization properties of adaptive in-loop color-space transform for video coding |
CN116260981B (zh) * | 2019-12-05 | 2024-01-30 | 阿里巴巴(中国)有限公司 | 用于色度采样的方法和装置 |
WO2021119337A1 (en) * | 2019-12-10 | 2021-06-17 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and apparatus of video coding in 4:4:4 chroma format |
MX2022006734A (es) | 2019-12-11 | 2022-06-09 | Beijing Bytedance Network Tech Co Ltd | Relleno de muestra para filtrado de circuito adaptivo de componente cruzado. |
WO2021121418A1 (en) * | 2019-12-19 | 2021-06-24 | Beijing Bytedance Network Technology Co., Ltd. | Joint use of adaptive colour transform and differential coding of video |
WO2021128281A1 (zh) * | 2019-12-27 | 2021-07-01 | 富士通株式会社 | 自适应颜色变换的编解码方法、装置以及视频编解码设备 |
CN114846807A (zh) * | 2019-12-30 | 2022-08-02 | 北京达佳互联信息技术有限公司 | 色度残差的编解码 |
CN117939152A (zh) * | 2020-01-05 | 2024-04-26 | 北京达佳互联信息技术有限公司 | 一种视频编码的方法、装置和介质 |
JP7436680B2 (ja) | 2020-01-05 | 2024-02-22 | 北京字節跳動網絡技術有限公司 | 映像コーディングのための一般制約情報 |
CN115176470A (zh) | 2020-01-18 | 2022-10-11 | 抖音视界有限公司 | 图像/视频编解码中的自适应颜色变换 |
WO2021150084A1 (ko) * | 2020-01-25 | 2021-07-29 | 엘지전자 주식회사 | 색상 공간 변환 기반 영상 또는 비디오 코딩 |
US12101493B2 (en) | 2020-01-25 | 2024-09-24 | Lg Electronics Inc. | Act residual-based image or video coding |
WO2021150085A1 (ko) * | 2020-01-25 | 2021-07-29 | 엘지전자 주식회사 | 색상 공간 변환을 사용하는 레지듀얼을 위한 영상 또는 비디오 코딩 |
CN113395524B (zh) * | 2020-03-11 | 2023-04-28 | 腾讯美国有限责任公司 | 视频解码方法、装置和电子设备 |
US11146806B2 (en) * | 2020-03-11 | 2021-10-12 | Tencent America LLC | Coding unit level transform size restriction for adaptive color transform |
US11445206B2 (en) * | 2020-04-16 | 2022-09-13 | Tencent America LLC | Method and apparatus for video coding |
CN116325728A (zh) | 2020-06-30 | 2023-06-23 | 抖音视界有限公司 | 自适应环路滤波的边界位置 |
US11831921B2 (en) | 2020-09-17 | 2023-11-28 | Lemon Inc. | Video operating points record syntax and semantics |
US11645812B2 (en) * | 2020-10-06 | 2023-05-09 | Qualcomm Incorporated | Inter-component residual prediction for color attributes in geometry point cloud compression coding |
US11651551B2 (en) * | 2020-10-06 | 2023-05-16 | Qualcomm Incorporated | Coding of component of color attributes in geometry-based point cloud compression (G-PCC) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762441B2 (en) * | 2009-06-05 | 2014-06-24 | Qualcomm Incorporated | 4X4 transform for media coding |
US8885701B2 (en) * | 2010-09-08 | 2014-11-11 | Samsung Electronics Co., Ltd. | Low complexity transform coding using adaptive DCT/DST for intra-prediction |
US9824066B2 (en) * | 2011-01-10 | 2017-11-21 | Qualcomm Incorporated | 32-point transform for media data coding |
US9495162B2 (en) * | 2011-12-23 | 2016-11-15 | Intel Corporation | Apparatus and method for performing a permute operation |
JP2014116733A (ja) * | 2012-12-07 | 2014-06-26 | Canon Inc | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
US9648330B2 (en) * | 2013-07-15 | 2017-05-09 | Qualcomm Incorporated | Inter-color component residual prediction |
CN105874793B (zh) * | 2013-10-07 | 2019-10-11 | Vid拓展公司 | 用于多层视频编码的组合可分级性处理的方法和设备 |
CN103796033B (zh) * | 2014-01-24 | 2017-05-24 | 同济大学 | 一种高效视频编码零系数提前检测方法 |
US11070810B2 (en) * | 2014-03-14 | 2021-07-20 | Qualcomm Incorporated | Modifying bit depths in color-space transform coding |
US10200700B2 (en) * | 2014-06-20 | 2019-02-05 | Qualcomm Incorporated | Cross-component prediction in video coding |
-
2015
- 2015-09-11 CN CN201580048952.3A patent/CN107079157B/zh active Active
- 2015-09-11 EP EP19173041.5A patent/EP3544298A1/en not_active Ceased
- 2015-09-11 EP EP15772099.6A patent/EP3192261A1/en not_active Withdrawn
- 2015-09-11 JP JP2017514297A patent/JP2017531382A/ja active Pending
- 2015-09-11 BR BR112017004886A patent/BR112017004886A2/pt not_active Application Discontinuation
- 2015-09-11 RU RU2017112309A patent/RU2017112309A/ru not_active Application Discontinuation
- 2015-09-11 WO PCT/US2015/049784 patent/WO2016040865A1/en active Application Filing
- 2015-09-11 US US14/852,260 patent/US10469847B2/en active Active
- 2015-09-11 KR KR1020177009983A patent/KR102051193B1/ko active IP Right Grant
- 2015-09-14 TW TW104130284A patent/TWI722996B/zh active
-
2018
- 2018-05-28 JP JP2018101439A patent/JP6709823B2/ja active Active
-
2020
- 2020-05-25 JP JP2020090660A patent/JP2020129845A/ja not_active Withdrawn
Non-Patent Citations (1)
Title |
---|
Joshi R et al: "HEVC Screen Content Coding Draft Text 1", JCTVC-R1005-v2, 23 August 2014.* |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12075047B2 (en) | 2020-06-12 | 2024-08-27 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and apparatus of video coding in 4:4:4 color format |
Also Published As
Publication number | Publication date |
---|---|
JP2018160911A (ja) | 2018-10-11 |
EP3544298A1 (en) | 2019-09-25 |
TWI722996B (zh) | 2021-04-01 |
JP2020129845A (ja) | 2020-08-27 |
JP2017531382A (ja) | 2017-10-19 |
BR112017004886A2 (pt) | 2017-12-05 |
RU2017112309A3 (ko) | 2018-10-12 |
US10469847B2 (en) | 2019-11-05 |
JP6709823B2 (ja) | 2020-06-17 |
US20160080751A1 (en) | 2016-03-17 |
KR20170056626A (ko) | 2017-05-23 |
CN107079157A (zh) | 2017-08-18 |
WO2016040865A1 (en) | 2016-03-17 |
CN107079157B (zh) | 2020-12-22 |
RU2017112309A (ru) | 2018-10-12 |
TW201613352A (en) | 2016-04-01 |
EP3192261A1 (en) | 2017-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102051193B1 (ko) | 비디오 코딩을 위한 성분간 탈상관 | |
JP7485645B2 (ja) | Rgbビデオコーディングエンハンスメントのためのシステムおよび方法 | |
JP7433019B2 (ja) | ビデオコーディングにおけるクロマ信号強調のためのクロスプレーンフィルタリング | |
US20220329831A1 (en) | Enhanced chroma coding using cross plane filtering | |
KR102051723B1 (ko) | 팔레트 코딩 모드를 위한 이스케이프 컬러 코딩 | |
US10972731B2 (en) | Systems and methods for coding in super-block based video coding framework | |
JP6397902B2 (ja) | スケーラブルビデオ符号化のためのレイヤ間予測 | |
EP3222044A1 (en) | One-dimensional transform modes and coefficient scan order |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |