KR101919394B1

KR101919394B1 - 무손실 인트라 ｈｅｖｃ 코딩을 위한 지수-골룸 이진화에 대한 파라미터 결정

Info

Publication number: KR101919394B1
Application number: KR1020147031832A
Authority: KR
Inventors: 웬 가오; 밍치앙 쟝; 하오핑 유
Original assignee: 후아웨이 테크놀러지 컴퍼니 리미티드
Priority date: 2012-04-20
Filing date: 2013-04-22
Publication date: 2018-11-16
Also published as: US9930362B2; JP5944045B2; CN104185989A; CN104185989B; KR20150006440A; WO2013159119A1; KR20150008405A; KR101628797B1; EP2829064B1; US20130279583A1; JP5944044B2; EP2829064A1; EP2839651A1; CN104205843A; WO2013158998A1; JP2015515226A; JP2015517285A

Abstract

적어도 하나의 인코딩된 예측 잔여 값의 값에 따라 지수-골룸(Exopnential-Golomb: EG) 파라미터의 값을 적응적으로 갱신하는 단계, 및 상기 EG 파라미터의 값을 사용하는 EG 코드를 사용해서 무손실 모드에서 예측 잔여 값을 인코딩하는 단계를 포함하는 방법.

Description

무손실 인트라 ＨＥＶＣ 코딩을 위한 지수-골룸 이진화에 대한 파라미터 결정{PARAMETER DETERMINATION FOR EXP-GOLOMB RESIDUALS BINARIZATION FOR LOSSLESS INTRA HEVC CODING}

본 출원은 Wen Gao 등이 2012년 4월 20일에 출원하고 발명의 명칭이 "Binarization Scheme for Intra Prediction Residuals and Improved Intra Prediction in Lossless Coding in HEVC"인 미국 예비 특허출원 No. 61/636,409에 대한 우선권을 주장하는 바이며, 상기 문헌의 내용은 본 명세서에 원용되어 병합되고, 아울러 Wen Gao 등이 2013년 4월 19일에 출원하고 발명의 명칭이 "Improved Intra Predictioin in Lossless Coding in HEVC"인 미국특허출원 No. 13/866,468의 부분-연속이며, 상기 문헌의 내용은 본 명세서에 원용되어 병합된다.

비교적 단편 영화조차도 묘사하는 데 필요한 데이터량은 상당할 수 있는데, 이것은 데이터를 스트리밍할 때나 제한된 대역폭 용량으로 통신망을 통해 통신할 때 곤란할 수 있다. 그러므로 현대의 통신망을 통해 통신하기 전에 통상적으로 비디오 데이터를 압축한다. 비디오가 저장 장치에 저장되어 있을 때는 메모리 자원이 한정되어 있으므로 비디오의 크기도 문제가 될 수 있다. 비디오 압축 장치는 전송 또는 저장 전에 소프트웨어 및/또는 하드웨어를 사용하여 비디오 데이터를 소스에서 코딩하고, 이에 의해 디지털 비디오 이미지를 나타내는 데 필요한 데이터량을 감소시킨다. 그런 다음 압축된 데이터는 비디오 압축해제 장치에 의해 목적지에 수신되고 이 비디오 압축해제 장치는 비디오 데이터를 디코딩한다. 네트워크 자원은 제한되어 있고 높은 비디오 품질에 대한 수요는 계속 증가하고 있으므로, 이미지 품질의 희생이 거의 없거나 전혀 없이 압축비를 향상시키는 개선된 압축 및 압축해제 기술이 요망된다.

예를 들어, 비디오 압축은 동일한 비디오 프레임 또는 슬라이스 내의 기준 픽셀로부터 픽셀을 예측할 수 있는 인트라-프레임 예측을 사용할 수 있다. 손실 모드에서 인트라 예측을 사용하면, 변환 및 양자화 동작이 블록 단위로 일어날 수 있으며, 이것은 주어진 블록에 대한 예측을 이 주어진 블록 내의 픽셀의 예측을 위해 인접 블록 내의 기준 샘플의 사용으로 제한할 수 있다. 그렇지만, 국제전기통신연합(International Telecommunication Union Telecommunications: ITU-T) 표준화 분과(Standarization Sector) 내의 비디오 코딩에 관한 합동 팀(Joint Collaborative Team on Video Coding: JCT-VC)은 차세대 비디오 코딩 표준을 담당하고, 이 차세대 표준을 고효율 비디오 코딩(High Efficiency Video Coding: HEVC)이라 하며, 인트라 예측 모드에서 무손실 코딩을 위한 블록 내의 인접 픽셀에 기반한 예측을 고려하였다. 이러한 예측 기법을 픽셀 단위, 샘플 단위, 또는 픽셀 기반 인트라 예측이라고도 할 수 있다. 그렇지만, 블록의 특정한 경계를 따르는 픽셀에 대한 픽셀 단위 인트라 예측은 그 특정한 경계를 따르는 경계 픽셀의 예측에 사용되는 인접 픽셀을 이용하지 못한 채 예측되는 문제가 있다.

또한, HEVC의 무손실 코딩을 위한 엔트로피 인코딩은 손실 코딩 모드를 위해 설계되어 왔을 수도 있다. 그렇지만, 무손실 코딩 모드에서의 예측 잔여에 대한 통계는 손실 코딩 모드에서의 통계와는 많이 다를 수 있다. 통계의 다름으로 인해, 무손실 코딩 모드에서의 예측 잔여에 대한 통계를 고려하도록 무손실 코딩에서의 엔트로피 인코딩을 개선할 여지가 있을 수 있다.

일실시예에서, 본 발명은 방법을 포함하며, 상기 방법은, 적어도 하나의 인코딩된 예측 잔여 값의 값에 따라 지수-골룸(Exopnential-Golomb: EG) 파라미터의 값을 적응적으로 갱신하는 단계, 및 상기 EG 파라미터의 값을 사용하는 EG 코드를 사용해서 무손실 모드에서 예측 잔여 값을 인코딩하는 단계를 포함한다.

다른 실시예에서, 본 발명은 장치를 포함하며, 상기 장치는 프로세서를 포함하며, 상기 프로세서는, 적어도 하나의 인코딩된 예측 잔여 값의 값에 따라 지수-골룸(Exopnential-Golomb: EG) 파라미터를 적응적으로 갱신하며, 그리고 상기 EG 파라미터로 가지는 EG 코드를 사용해서 무손실 모드에서 예측 잔여 값을 인코딩하도록 구성되어 있다.

또 다른 실시예에서, 본 발명은 방법을 포함하며, 상기 방법은, 비트스트림 내의 적어도 하나의 이진 문자열(binary string)의 값에 따라 지수-골룸(Exopnential-Golomb: EG) 파라미터를 적응적으로 인코딩하는 단계, 및 상기 EG 파라미터를 가지는 지수-골룸 코드를 사용해서 무손실 모드에서 이진 문자열을 디코딩하는 단계를 포함한다.

이러한 특징 및 다른 특징은 첨부된 도면 및 특허청구범위와 결합하는 이하의 상세한 설명으로부터 더 명확하게 이해할 수 있을 것이다.

본 개시를 더 완전하게 이해할 수 있기 위해, 첨부된 도면 및 상세한 설명과 연관하여, 이하에 도면에 대한 설명을 참조하며, 도면 중 유사한 도면은 유사한 부분을 나타낸다.
도 1은 비디오 인코더의 실시예의 기능도이다.
도 2a는 수직 SAP의 수평 스캐닝 처리 순서를 나타내는 도면이고, 도 2b는 수평 SAP의 수직 스캐닝 처리 순서를 나타내는 도면이다.
도 3a는 양의 각을 가지는 수직 SAP를 나타내는 도면이고, 도 3b는 양의 각을 가지는 수평 SAP를 나타내는 도면이다.
도 4는 4x4 PU의 실시예를 나타내는 도면이다.
도 5는 PU에 대한 샘플 행렬의 실시예를 나타내는 도면이다.
도 6은 픽셀 기반 예측 방식에서의 샘플 간 관계를 나타내는 도면이다.
도 7a는 α로 표시된 양의 각을 사용하는 수직 SAP를 나타내는 도면이고, 도 7b는 양의 각을 사용하는 수평 SAP를 나타내는 도면이다.
도 8은 무손실 모드에서 PU를 인코딩하는 방법의 실시예에 대한 흐름도이다.
도 9는 무손실 디코딩 모드에서 디코딩 방법의 실시예에 대한 흐름도이다.
도 10은 비디오 코덱에서 실행되는 이진화 방식에 대한 실시예를 나타내는 도면이다.
도 11은 무손실 코딩에서 인트라 예측 잔여에 대한 히스토그램이다.
도 12는 양자화되고 변환된 인트라 예측 잔여에 대한 히스토그램이다.
도 13은 비디오 코덱에서 실행되는 이진화 방식에 대한 실시예를 나타내는 도면이다.
도 14는 무손실 인코딩 모드에서 이진화를 위한 방법의 실시예에 대한 흐름도이다.
도 15는 비트스트림 디코딩 방법의 실시예에 대한 흐름도이다.
도 16은 네트워크 노드의 실시예에 대한 개략도이다.

하나 이상의 실시예의 도해적 실행을 이하에 제공하지만, 개시된 시스템 및/또는 방법은 현재 알려져 있든 존재하고 있든 간에, 임의의 수의 기술을 사용해서 실현될 수 있다는 것을 이해해야 한다. 본 개시는 여기에 도해되고 설명된 예시적 설계 및 실행을 포함한, 이하에 설명되는 도해적 실행, 도면, 및 기술에 제한되지 않으며, 등가의 전체 범위와 함께 첨부된 특허청구범위의 범위 내에서 변형될 수 있다.

컬러 공간은 휘도(luma 또는 Y) 요소 및 2개의 색차(chroma) 요소를 포함하는 3개의 요소로 표현될 수 있으며 Cb 및 Cr(때로는 U 및 V)로 표시된다. 휘도 또는 채도 정수 값은 통상적으로 비트를 사용해서 이진수 형태로 저장되고 처리된다. YUV 또는 YCbCr 컬러 공간에서, 각각의 휘도(Y) 블록은 Cb 블록 및 Cr 블록을 포함하는 2개의 색차 블록에 대응한다. Cb 블록 및 Cr 블록도 또한 서로 대응한다. 색차 블록 및 이에 대응하는 휘도 블록은 비디오 프레임, 슬라이스, 또는 영역의 동일한 상대적 위치에 위치할 수 있다. 논의된 방식은 RGB, YCoCg 등과 같은 임의의 다른 컬러 공간 내의 비디오에도 적용 가능하다.

비디오 코딩에서는, 다양한 샘플링 레이트를 사용하여 YCbCr 요소를 코딩할 수 있다. Cb 블록의 크기, 그 대응하는 Cr 블록, 및/또는 그 대응하는 Y 블록은 샘플링 레이트에 따라 동일할 수도 있고 다를 수도 있다. 예를 들어, 4:2:0 샘플링 레이트에서, 각각의 NxN 색차(Cb 또는 Cr) 블록은 2Nx2N 휘도 블록에 대응할 수 있다. 이 경우, 색차 블록의 폭 또는 높이는 대응하는 휘도 블록의 폭 또는 높이의 절반이다. 색차 요소는 다운샘플링되거나 서브샘플링되는데, 이는 사람의 눈이 휘도 요소보다는 색차 요소에 덜 민감하기 때문이다. 다른 예에서, 4:4:4 샘플링 레이트에서, 각각의 NxN 색차(Cb 또는 Cr) 블록은 NxN 휘도 블록에 대응할 수 있다. 이 경우, 높은 비디오 선명도가 유지될 수 있으나, 더 많은 데이터를 코딩해야 한다. 다른 샘플링 레이트, 예를 들어 4:2:2, 4:2:1 등도 사용 가능하다.

HEVC에서는, 새로운 블록 개념이 도입되었다. 예를 들어, 코딩 유닛(coding unit: CU)이란 비디오 프레임을 동일한 크기 또는 가변 크기의 사각형 블록으로 하위분할하는 것으로 말할 수 있다. HEVC에서, CU는 이전 표준의 매크로블록 구조를 대체할 수 있다. 인터 예측 또는 인트라 예측의 모드에 따라, CU는 하나 이상의 예측 유닛(prediction unit: PU)을 포함할 수 있으며, 각각의 예측 유닛은 예측의 기본 유닛으로서의 역할을 할 수 있다. 예를 들어, 인트라 예측에서, 64x64 CU는 4개의 32x32 PU로 대칭적으로 분할될 수 있다. 다른 예에서, 인터 예측에서, 64x64 CU는 16x64 PU 및 48x64 PU로 비대칭적으로 분할될 수 있다.

HEVC는 아직 위원회 초안 단계에 있으며 주요 프로필은 4:2:0 포맷을 가지는 비디오 시퀀스에 대해 정의되어 있다. HEVC 주요 프로필에서, 무손실 코딩 모드는 변환 모듈, 양자화 모듈 및 루프내 필터(in-loop filter)(즉, 디블록킹 필터, 샘플 적응형 오프셋(SAO) 및 적응형 루프 필터(ALF))를 간단히 우회함으로써 달성될 수 있다. 이러한 설계는 HEVC Main Profile 인코더 및 디코더 실행에 부담을 주지 않는 무손실 코딩을 제공하는 것을 목적으로 한다. HEVC에서 손실 코딩에 반대인 무손실 코딩에 대해 이하에 설명한다.

도 1은 비디오 인코더(100)의 실시예의 기능도이다. 인코더(100)는 HEVC에서 사용될 수 있다. 인코더(100)에 입력 블록을 포함하는 비디오 프레임 또는 픽처가 공급될 수 있다. 입력 블록을 인코딩하기 위해, 이전에 코딩된 하나 이상의 기준 블록에 기초해서 예측 블록을 생성할 수 있다. 입력 블록은 휘도(CU) 또는 색차(PU)일 수 있다. 예측 블록은 입력 블록의 추정된 버전일 수 있다. 도시된 바와 같이 입력 블록으로부터 예측 블록을 차감하여 (또는 역으로 차감하여) 잔여 블록을 생성할 수 있다. 이 잔여 블록은 입력 블록과 예측 블록 간의 차이를 나타낼 수 있는데, 환언하면 예측 잔여 또는 오차를 나타낼 수 있다. 예측 잔여를 나타내는 필요한 데이터량은 통상적으로 입력 블록을 나타내는 데 필요한 데이터량보다 작을 수 있기 때문에, 잔여 블록은 높은 압축비를 달성하도록 인코딩될 수 있다.

손실 코딩을 사용할지 또는 무손실 코딩을 사용할지에 따라 인코더(100)에는 적어도 2가지의 가능한 경로가 있다. 손실 모드에 대해 먼저 설명한다. 도 1에 도시된 바와 같이, 손실 모드에서, 잔여 픽셀을 포함하는 잔여 블록이 변환 모듈(102)에 공급될 수 있다. 그 결과, 공간 도메인 내의 잔여 픽셀은 변환 행렬을 적용함으로써 주파수 도메인의 변환 계수로 변환될 수 있다. 변환은 2차원 변환, 예를 들어 이산 코사인 변환(DCT)와 거의 유사하거나 동일한 변환을 통해 실현될 수 있다. 또한, 변환 모듈(102)의 뒤를 잇는 양자화 모듈(104)에서는, 하이-인덱스 변환 계수의 수가 제로로 감소될 수 있으며, 이것은 후속의 엔트로피 인코딩 단계에서는 건너뛸 수 있다. 양자화 후, 양자화된 변환 계수는 엔트로피 인코더(150)에 의해 엔트로피 인코딩될 수 있다. 엔트로피 인코더(150)는 임의의 엔트로피 인코딩 방식을 적용할 수 있는데, 예를 들어, 문맥-적응형 이진수 산술 코딩(context-adaptive binary arithmetic coding: CABAC) 인코딩, 지수 골룸 인코딩, 또는 고정 길이 인코딩을 적용할 수 있으며, 이것들의 임의의 조합을 적용할 수도 있다. 엔트로피 인코딩 후, 인코딩된 블록은 비트스트림의 일부로서 인코더(100)에 의해 전송될 수 있다. 비트스트림은 패킷으로 분할되고 캡슐화된 다음 임의의 이용 가능한 네트워크 프로토콜을 사용해서 전송될 수 있다.

인코더(100)에서, 잔여 블록은 일련의 동작, 예를 들어, 도시된 바와 같은 변환, 양자화, 역양자화, 역변환을 거친 후 잔여 블록 Ⅱ로 변환된다. 이러한 동작 중 일부 또는 전부는 완전하게 가역일 수 없기 때문에, 변환 프로세스 동안 정보 손실이 일어날 수 있다. 그러므로 잔여 블록 Ⅱ는 단지 대응하는 잔여 블록의 근사치일 수 있고, 높은 압축 효율을 위한 논-제로 잔여 픽셀(non-zero residual pixel)을 통상적으로 덜 포함한다. 또한, 다른 설명할 게 있는 게 아니라면, 대응하는 블록은 픽처의 동일한 상대적 위치에 위치하는 블록을 나타낼 수 있다. 이 방법에서, 재구성된 블록이 입력 블록의 손실 버전일 수 있으므로 인코더(100)는 손실 코딩 모드를 실행할 수 있다.

재구성된 블록은 예측 블록을 생성하기 위한 기준 블록으로 사용될 수 있다. 재구성된 블록의 위치에 따라, 예측은 인터-프레임 예측 및 인트라-프레임 예측으로 (간단히 말해 인터 예측 및 인트라 예측으로) 분류될 수 있다. 사용 시, 연속적인 비디오 프레임 또는 슬라이스는 실질적으로 상관될 수 있으므로, 프레임 내의 블록은 이전에 코딩된 프레임 내의 대응하는 블록으로부터 실질적으로 가변하지 않는다. 인터 예측은 프레임 또는 픽처의 시퀀스에서의 시간적 과잉(temporal redundancy)을 이용하여, 예를 들어 연속적인 프레임의 대응하는 블록 간의 유사성을 이용하여 압축 데이터를 감소시킬 수 있다. 인터 예측은 움직임 추정(motion estimation: ME) 모듈(140) 및 그 뒤를 잇는 움직임 보상(motion compensation: MC) 모듈(142)에 의해 실행될 수 있다. 인터 예측에서, 움직임-보상 알고리즘은 인코딩 순서에 따라 현재 프레임을 선행하는 하나 이상의 기준 프레임에 위치하는 대응하는 블록에 기초해서 현재 프레임 내의 현재 블록에 대한 움직임 벡터를 계산하도록 실행될 수 있다.

(예를 들어, 블로킹 결함을 감소시킴으로써) 재구성된 비디오 프레임의 품질을 향상시키기 위해, 루프내 필터링 단계를 예측 이전에 수행될 수 있다. 예를 들어, 인터 예측에서는, 디블로킹 필터(120)를 재구성된 블록의 가장자리에 위치하는 픽셀에 적용하여 블로킹 결함을 감소시킬 수 있다. 디블로킹 필터(120)를 실행한 후, 루프내 필터링 단계에서는 샘플 적응형 오프셋(SAO) 모듈(122)이 더 포함될 수 있으며, 이것은 재구성된 픽셀의 값을 수정하도록 구성될 수도 있다. 적응형 루프 필터(ALF)(124)는 SAO 모듈(122) 후에 적용될 수 있고 결과적인 처리된 블록은 인터 예측 보상에서 사용하기 위해 프레임 버퍼(126)에 저장될 수 있다.

마찬가지로, 비디오 프레임 내에서, 하나의 블록 또는 교차하는 일부의 블록 내의 픽셀 값이 약간만 가변하도록 및/또는 반복 텍스처를 나타내도록 픽셀은 동일한 프레임 내의 다른 픽셀과 상관될 수 있다. 동일한 프레임 내의 이웃 블록 간의 공간 상관관계를 이용하기 위해, 인트라 예측 추정(intra-prediction estimation: IPE) 모듈(130) 및 그 뒤를 잇는 인트라 예측(intra prediction: IP) 모듈(132)이 인트라 예측을 실행하여 하나 이상의 이전에 코딩된 이웃의 블록(재구성된 블록을 포함함)과 예측 블록을 보간할 수 있다. 인코더 및 디코더는 예측 블록을 독립적으로 보간할 수 있으며, 이에 의해 프레임 및/또는 이미지의 상당 부분을 상대적으로 적은 수의 기준 블록, 예를 들어 프레임의 좌상 모서리(upper-left hand corner)에 위치하는 (그리고 확장하는) 블록의 통신으로부터 재구성할 수 있다. 선택 모듈(134)은 인터 예측과 인트라 예측 간을 선택하여 입력 블록을 위한 최상의 예측 모드를 선택할 수 있다. 일반적으로, 당업자가 이해하고 있는 바와 같이, 예를 들어 예측된 블록과 원래의 블록 간의 절대 차의 최소 합을 생성하는 예측 모드를 뽑아내는 비율 왜곡 최적화(rate distortion optimization: RDO)를 사용하여 최상의 예측 모드를 결정할 수 있다.

다음으로, 무손실 코딩에 대해 설명한다. 무손실 코딩 모드에서는, 도 1에 도시된 바와 같이, 루프내 필터(디블로킹(120), SAO(122), 및 ALF 필터(124))뿐만 아니라 변환 모듈(102), 양자화 모듈(104), 역양자화 모듈 (106), 및 역변환 모듈(108)도 우회한다. 변환 모듈(102) 및 양자화 모듈(104)은 블록 기반 프로세싱을 사용할 수 있으며, 이것은 인트라 예측을 가지는 손실 코딩 모드에 있어서 블록 내의 픽셀의 예측이 이웃 블록 내의 기준 픽셀만을 기초로 한다는 것을 의미한다. 그 블록 내의 기준 블록은 그 블록 내의 픽셀 값의 예측에 이용될 수 없다. 대조적으로, 인트라 예측을 가지는 손실 코딩 모드에 있어서는 변환 모듈 및 양자화 모듈이 우회되기 때문에 블록 내의 픽셀의 예측은 그 블록 내의 다른 픽셀에 기초할 수 있다. 이 목적을 위해, 샘플 기반 각도 예측()은 무손실 코딩에 사용될 수 있다.

SAP에서, PU 내의 모든 샘플은 B. Bross 등에 의해 "High Efficiency Video Coding(HEVC) 텍스트 specification draft 6" JCT-VC 문서, JCTVC-H1003, 캘리포니아, 산 요세, 2012년 2월(이하 "HEVC Draft 6"라고 언급함)정의된 바와 같이 동일한 예측 각도를 공유할 수 있으며 상기 문헌의 내용은 본 명세서에 원용되어 병합된다. 또한, 예측 각도의 시그널링은 HEVC Draft 6의 그것과 동일할 수 있다. 여기에 개시된 방법에서 PU에 대해 픽셀 단위로 각도 예측을 수행하여 더 높은 인트라 예측 정확성을 달성한다는 점이 차이일 수 있다. 즉, 현재 PU에 대한 예측 블록은 샘플 예측 각도를 사용하여 샘플 단위로 SAP를 수행함으로써 생성될 수 있다.

SAP 방법에서는, PU 내의 샘플을 미리 정한 순서에 따라 처리하고 이에 따라 PU 내의 현재 샘플이 그 바로 이웃으로부터 예측될 때 인접 샘플을 이용할 수 있다. 도 2a는 수직 SAP에 대한 수평 스캐닝 샘플링 처리를 도시하고 도 2b는 수직 SAP에 대한 수직 스캐닝 샘플링 처리를 도시한다. 도 2a 및 도 2b에 도시된 바와 같이, 수평 스캐닝 및 수직 스캐닝 처리 순서는 수직 및 수평 각도 예측에 각각 적용될 수 있다. 현재 PU의 상 및 좌 PU 경계 주위에 있는 기준 샘플의 처리는 HEVC Draft 6에 정의되어 있는 바와 동일할 수 있는 반면, 현재 PU의 우 및 하 PU 경계 주위에 있는 기준 샘플은 현재 PU의 최근접 경계 샘플로부터 간단하게 패딩된다(도 2a 및 도 2b의 패딩된 샘플을 참조하라).

도 3a는 양의 각을 가지는 수직 SAP를 나타내고, 도 3b는 양의 각을 가지는 수평 SAP를 나타낸다. 도 3a 및 도 3b에 각각 도시된 바와 같이, 양의 각을 가지는 수직 또는 수평 SAP 동안 현재 PU의 우 및 하 PU 경계 주위에 있는 패딩된 샘플이 필요할 수 있다. 도 3a 및 도 3b에서, x는 예측될 픽셀을 나타내고, a 및 b는 (실제 또는 예측된) 이웃 샘플 값을 나타낸다.

양의 각을 가지는 수직 SAP 및 4x4 PU를 예를 들어 설명한다. 도 4는 4x4 PU의 실시예를 나타내는데, 샘플(픽셀 값)은 S(i,j)(i=0,1,2,3 및 j=0,1,2,3)로 표시된다. Pad(i)(i=0,1,2)는 종래기술을 사용하여 최근접의 샘플을 사용함으로써 유도되는 패딩된 기준 샘플을 나타내며, 패딩된 기준 샘플은 다음과 같이 표현될 수 있다:

Pad(i)=S(i,3) 단, i=0,1,2

양의 예측 각도를 가지는 수직 SAP에 있어서, S(i,3)(i=1,2,3)에 대한 예측 값은 P(i,3)으로 표시되며, 다음과 같이 표현되며, 예측 각도의 값과는 독립적이다:

P(i,3)=S(i-1,3) 단, i=1,2,3 (1)

그러므로 효과에 있어서 샘플 P(i,3)(i=1,2,3)에 대한 수직 예측 각도는 항상 0도일 수 있는 반면 다른 샘플들은 다른 예측 각도를 사용할 수 있다. 달리 말하면, 예측 값 P(i,3)(i=1,2,3)은 0의 예측 각도를 가진다. 그 결과는 수평 SAP와 동일하다. 이러한 관측을 바탕으로, 수직 SAP에서의 바로 위의 픽셀이 아닌 또는 수직 SAP에서의 바로 위의 픽셀이 아닌, 그 대응하는 이웃 샘플 또는 픽셀을 사용해서 소정의 경계 샘플 각각을 예측하는 것이 바람직하다.

픽셀 기반 예측에서 PU 내의 경계 샘플의 개선된 예측을 위한 방법 및 장치에 대해 개시한다. 인접하는 샘플의 복사이고 따라서 과잉 정보를 나타내는 경계 샘플의 예측에서 패딩된 샘플을 사용하는 대신, 경계 샘플은 이웃 샘플을 사용해서 예측될 수 있다. 경계 샘플의 개선된 예측은 PU 내의 다른 픽셀과 결합되어 무손실 코딩 모드에서 유효 픽셀 기반 예측 방식을 제공할 수 있다.

전술한 관측을 바탕으로, 수직 SAP에서의 바로 위의 픽셀이 아닌 또는 수직 SAP에서의 바로 위의 픽셀이 아닌, 그 대응하는 이웃 샘플 또는 픽셀을 사용해서, 경계 샘플, 예를 들어, 4x4 PU에 있어서 수직 SAP의 S(i,3)(i=1,2,3) 및 4x4 PU에 있어서 수평 SAP의 S(3,i)(i=1,2,3)의 각각을 예측하는 것이 바람직할 수 있다. 도 5는 크기 NxN의 PU에 대한 샘플 행렬의 실시예를 나타낸다. 수직 SAP를 예로 들어 설명한다. 굵은 선 박스 내의 경계 샘플, 즉 S(i,N-1)(i=1,...,N-1)을 예측하기 위해, 이하의 적응형 예측기를 사용할 수 있다. X는 경계 샘플, 즉 X=S(i,N-1)(1≤i≤(N-1)) 중 하나를 나타낸다. P(x)는 샘플 X의 예측된 값을 나타내는 것으로 한다. X의 좌, 상, 좌상 인접하는 이웃 샘플을 A, B, C로 각각 표시한다. 도 6은 샘플 A, B, C, 및 X 간의 관계를 나타낸다. 샘플 X는 다음과 같이 예측될 수 있다:

(2)

수직 SAP에 있어서 수평 스캐닝 순서에 대한 식(2)의 사용을 나타내기 위해, 샘플 S(1,N-1)을 예측해야 하는 것으로 가정한다(즉, X=S(1,N-1)). 이웃 샘플 S(1,N-2), S(0,N-1) 및 S(0,N-2)는 도 2a의 수평 스캐닝 순서를 사용해서 예측되었으며, 따라서 P(S(1,N-2)), P(S(0,N-1)) 및 P(S(0,N-2))가 생성된다. 식(2)의 표기 및 도 6을 사용하면, P(X=S(1,N-2))의 결정 시에 A=P(S(1,N-2)), B=P(S(0,N-1)) 및 C=P(S(0,N-2))이다.

수평 SAP에 있어서 수직 스캐닝 순서에 대한 식(2)의 사용을 나타내기 위해, 샘플 S(N-1,1)을 예측해야 하는 것으로 가정한다(즉, X=S(N-1,1)). SAP 예측에 있어서 S(N-1,1) 아래의 이용 가능한 이웃 샘플이 없으므로 식(2)을 사용한다. 이웃 샘플 S(N-1,0), S(N-2,0) 및 S(N-2,1)는 도 2b의 수직 스캐닝 순서를 사용해서 예측되었으며, 따라서 P(S(N-1,0)), P(S(N-2,0)) 및 P(S(N-2,1))가 생성된다. 식(2)의 표기 및 도 6을 사용하면, 식(2)을 사용해서 P(X=S(N-1,1))의 결정 시에 A=P(S(N-1,0)), B=P(S(N-2,1)) 및 C=P(S(N-2,0))이다. 일반적으로, 수평 SAP가 사용되면, 식(2)에서의 적응형 예측기를 사용하는 경계 샘플은 S(N-1,i)(i=1,...,N-1)일 수 있다. 전술한 경계 샘플 중 하나를 예측하기 위해, 식(2)에서 언급된 것과 동일한 예측기가 사용될 수 있다.

식(2)은 소정의 경계 샘플 S(i,N-1) 또는 S(N-1,i)(i=1,...,N-1)에 대한 이웃 샘플 값에 기초하여 샘플 값을 예측하는 단지 하나의 이용 가능한 방식이다. 다른 가능성은 값 A,B,C의 중간 또는 평균을 계산하는 것을 포함한다.

샘플이 경계 샘플 S(i,N-1)(수직 SAP의 경우) 또는 S(N-1,i)(수평 SAP의 경우)(i=1,...,N-1) 중 하나가 아니면, 임의의 종래 SAP 기술이 사용될 수 있다. 도 7a는 양의 각을 사용하는 수직 SAP를 나타내고, α로 표시되어 있으며, 7b는 양의 각을 사용하는 수평 SAP를 나타내며, 마찬가지로 α로 표시되어 있다. 도 7a 및 도 7b에서, X는 예측될 픽셀 값을 나타내고 A 및 B는 이웃 픽셀에 대한 실제 또는 예측된 픽셀 값을 나타낸다, 두 경우에 있어서, X는 A와 B의 가중된 (또는 선형) 조합일 수 있다. 예를 들어, X는 다음과 같이 표현될 수 있으며,

X = (1 - S) * A + s * S (3)

여기서, s는 범위 [0,1]에서의 가중 인자이다. 가중 인자는 α가 작을 때 A에 더 많은 가중을 부여하고, B에 부여되는 가중은 α가 증가할수록 증가한다. 가중 인자 S는 예를 들어 tan(α)와 같을 수 있으며, 단 0≤α≤45이다. HEVC에서 규정된 인트라 예측 방법은 이러한 가중 인자를 계산하는 이러한 가능한 방법 중 하나이다.

도 8은 무손실 모드에서 PU를 인코딩하는 방법(700)의 실시예에 대한 흐름도이다. 방법은 블록(710)에서 시작한다. 블록(710)에서, PU에 대한 처리 순서를 결정한다. 처리 순서는 예를 들어 도 2a에 도시된 바와 같은 수평 처리 순서일 수 있고 예를 들어 도 2b에 도시된 바와 같은 수직 처리 순서일 수도 있다. 다음 블록(720)에서 PU 내의 경계 샘플에 대한 예측된 값을 계산한다. 예측될 경계 샘플은 수평 처리 순서의 경우 (즉, 수직 SAP가 다른 샘플에 대해 사용될 때) S(i,N-1)(i=1,2,...N-1)로 표시될 수 있고, 수직 처리 순서의 경우 (즉, 수평 SAP가 다른 샘플에 대해 사용될 때) S(N-1,i)(i=1,2,...N-1)로 표시될 수 있다. 즉, 예측될 특별한 샘플은 스캐닝 또는 처리 순서에 따라 다르다. PU는 도 5에 도시된 바와 같이 배치될 수 있다. 경계 샘플에 대한 예측된 값은 예를 들어 도 6에 도시된 바와 같이 식(2)을 사용해서 대응하는 좌, 상, 및 좌상의 이웃 샘플에 기초해서 계산될 수 있다. 다음 블록(730)에서 PU 내의 남아 있는 샘플에 대한 예측된 값(즉, 전술한 경계 샘플이 아닌 PU 내의 모든 샘플)을 SAP를 사용해서 계산한다. 예측 각도에 의존하는 조합과 함께 사용될 수 있는 임의의 종래 SAP 기술은 2개의 이웃 샘플의 선형 조합으로서 샘플을 예측한다. 식(3)은 SAP 기술의 일례를 도시한다. 블록(720 및 730)은 순서대로 또는 병렬로 수행될 수 있다. 블록(740)에서, PU 내의 모든 샘플에 대한 예측된 값은 예측 PU 또는 예측 블록을 제공하도록 결정되며, 잔여 블록은 도 1에 도시된 바와 같이 계산될 수 있는데, 이것은 입력 블록과 계산된 예측 블록 간의 차이일 수 있다. 최종적으로, 블록(750)에서, 잔여 블록은 도 1에 도시된 바와 같이 엔트로피 인코딩을 사용해서 인코딩될 수 있다. 변환 블록(102) 및 양자화 블록(104)이 무손실 모드에서 우회되고, 이에 따라 잔여 블록은 엔트로피 인코더(150)에 직접 제공될 수 있다는 것을 회상하라. 엔트로피 인코딩된 값은 비트스트림에 삽입될 수 있다. PU는 휘도 및 색차 샘플을 포함할 수 있다. 방법(700)은 휘도 샘플에만 적용될 수도 있고, 색차 샘플에만 적용될 수도 있으며, 휘도 샘플 및 색차 샘플 모두에 적용될 수도 있다.

도 9는 무손실 디코딩 모드에서 디코딩 방법(760)의 실시예에 대한 흐름도이다. 여기서 비디오 인코딩 방식에 대해 상세히 설명하면 당업자는 여기서 설명된 인코딩을 역으로 또는 "원상태로 되돌리는" 디코딩을 수행할 수 있을 것이다. 그렇지만, 방법(760)은 설명을 위해 그리고 편의상 제공된다. 방법(760)은 블록(765)에서 시작하고 이 블록에서 비디오 스트림의 일부가 엔트로피 디코딩을 사용해서 디코딩되어 잔여 블록을 생성한다. 블록(770)에서 예측 블록은 하나 이상의 이전에 디코딩된 이웃 블록 내의 잔여 블록에 외부의 복수의 기준 픽셀에 기초하여 재구성된다. 처리 순서에 기초해서 식별된 경계 샘플은 대응하는 좌, 상, 및 좌상의 이웃의 재구성된 샘플을 사용해서 재구성될 수 있다. 예측 블록 내의 남아 있는 샘플은 SAP(수평 처리 순서에 대한 수직 SAP 및 수직 처리 순서에 대한 수평 SAP)를 사용해서 재구성될 수 있다. 블록(775)에서 예측 블록은 잔여 블록에 부가되어 비디오 프레임 내의 원래의 블록(예를 들어, 입력 PU)의 추정치를 획득할 수 있다. 원래의 블록은 휘도 샘플 또는 색차 샘플일 수 있다.

HEVC Draft 5에서, 코딩 유닛이 무손실 코딩 모드를 적용할 때, 인트라 Luma 예측 잔여를 위한 이진화 방식은 인트라 Luma 변환 계수 레벨을 위한 이진화 방식과 동일하다. 2 세트의 데이터 간의 상이한 통계치로 인해, 이진화 방식은 기존의 방식에 대한 큰 변화 없이도 Luma 예측 잔여를 더 향상시킬 수 있다.

변환 계수 레벨의 인코딩 프로세스는 2개의 주요 부분: 레벨을 빈(bin)의 시퀀스로 변환하는 이진화 및 (예를 들어, 엔트로피 인코더를 사용해서 엔트로피 인코딩으로서 집합적으로 실행되는) 빈을 비트로 압축하는 이진 산술 엔트로피 코딩을 포함한다. 도 10은 비디오 코덱에서 실행되는 이진화 방식(780)에 대한 실시예를 나타내는 도면이다. 예측 잔여의 절댓값에 따라(X로 표시되어 있음), 그 이진 표현은 하나, 둘, 셋 부분을 포함할 수 있다. 잔여 블록은, 예를 들어 도 1에 도시된 바와 같이, 복수의 예측 잔여를 포함할 수 있다. 전술한 바와 같이, 예측 잔여는 원래의 픽셀과 예측 픽셀 간의 차이일 수 있다. 실시예에서, X가 1 또는 1이면, X는 1이 "0"으로 이진화되고 2가 "10"으로 이진화되는 유니터리 코드(unitary code)를 사용하는 한 부분으로 이진화될 수 있다. 이러한 인코딩을 최대 길이가 2인 연쇄 유니터리 코드(TU)라 할 수 있다. X≥3이면, 값 3은 이진 문자열 "11"을 사용해서 먼저 이진화되고, 값 (X-3)은 연쇄 골룸-라이스(Golumb-Rice: TR) 코드를 사용해서 추가로 이진화된다. TR 코드에 있어서, 표현될 수 있는 최댓값은 M으로 표시된다. (X-3)≤M이면, (M-3)은 TR에 의해 표시될 수 있다. 그렇지만, (X-3)≥(M+1)이면, 값 (M+1)은 무차별(all-one) 이진 문자열로 먼저 이진화된다. 그런 다음 (M-3-(M+1))의 나머지는 파라미터 K=0인 지수-골룸(EG) 코드를 사용해서 인코딩되며, 이러한 코드를 EGO이라고 한다. EG 코드는 범용 코드의 일례이며, 이는 당업자가 이해하는 바와 같이 양의 정수를 이진 코드워드에 맵핑한다. EG 코드 대신 다른 범용 코드도 사용될 수 있다.

전술한 이진화 방법은 양자화된 변환 계수를 코딩하기 위해 원래 설계되어 있으며, 통상적으로 작은 값을 가진다는 것에 유의하라. 그렇지만, 무손실 코딩 경우에 휘도 성분에 대한 이진화 동작에 대한 입력은 변환 및 양자화 없이 인트라 예측 잔여일 수 있으며, 이것은 인트라 코딩된 변환 계수의 통계 특성과는 다른 통계 특성을 보인다.

SlideEditing 테스트 시퀀스를 예로 들어 보면, QP=27을 사용해서 코딩할 때, 무손실 코딩에서 그 인트라 Luma 예측 잔여의 히스토그램 및 그 양자화된 변환 계수의 히스토그램이 도 11 및 도 12에 각각 도시되어 있다. 이러한 결과에 나타난 바와 같이, 큰 Luma 예측 잔여는 변환 계수에 비해 무손실 코딩의 경우 빈도가 상대적으로 높은 것으로 나타난다.

예측 잔여 값이 크면, EG0 코드를 가지는 이진화를 위해 남은 값 역시 상대적으로 클 수 있으며, 결과적으로 표현이 충분하지 않다. K 파라미터가 작은 EG 코드에 비해 더 높은 순위의 EG 코드를 사용해서 큰 값을 나타내는 것이 더 유효할 수 있다. 그렇지만, K 파라미터는 작은 값에 대해 코딩 페널티(coding penalty)를 유입할 수 있기 때문에 너무 크게 될 수 없다.

예측 잔여의 통계치를 고려하는 적응형 이진화를 수행하는 방법 및 장치에 대해 여기서 개시한다. 적응형 이진화는 종래의 이진화 방식에 비해 무손실 코딩 방식의 예측 잔여의 통계에 더 나을 수도 있다. 여기서 설명되는 바와 같은 적응형 이진화는 이전에 이진화된 인트라 예측 잔여의 평균 레벨에 따라 EG 코드의 K의 값을 적응하는 과정을 포함한다.

도 13은 비디오 코덱에서 실행되는 이진화 방식(790)에 대한 실시예를 나타내는 도면이다. 도 12의 방식(780)에 설명된 바와 같이, (X-3)≥(M+1)이면, 값 (M+1)은 무차별 이진 문자열로 먼저 이진화된다. 그런 다음 (M-3-(M+1))의 나머지는 K=0(즉, EG0 코드)인 EG 코드를 사용해서 인코딩된다. 대조적으로, 도 13의 방식(790)은 후술하는 바와 같이 (X-3)≥(M+1)이면 EG 코드의 파라미터 K(여기서 때때로 EG 파라미터라고 한다)를 적응시킬 수 있다. 파라미터 K를 가지는 EG 코딩을 때때로 EGK라고 한다. 조건 (X-3)≥(M+1)이 충족되지 않으면, 인코딩은 도 12에서와 동일하다.

도 14는 무손실 인코딩 모드에서 이진화를 위한 방법(800)의 실시예에 대한 흐름도이다. 방법(800)은 블록(810)에서 시작하며, 여기서 EG 파라미터는 사전설정된 값, 예를 들어, 0 또는 3으로 초기화된다. 또한 블록(810)에서 N으로 표시된 카운더, 및 A로 표시된 누산기, (방법(800)의 나중 부분에서 사용되는 변수들)는 제로에 설정될 수 있다. 다음 블록(820)에서 제1 예측 잔여는 선택된 EG 파라미터를 가지는 EG 코딩을 사용해서 인코딩된다. 예를 들어, EG 파라미터가 k=3이면, EG3 코딩이 사용된다. 방법(800)은 (X-3)≥(M+1)을 충족하는 예측 잔여를 적용하고, 이러한 예측 잔여에 있어서 값 (M+1)은 무차별 이진 문자열로 이진화된다. 값 (M-3-(M+1))의 나머지는 EG 코드를 사용해서 인코딩될 수 있다. 블록(830)에서 카운터 N은 파라미터 K를 가지는 EG 코드를 사용해서 코딩된 예측 잔여의 수로 갱신되며, 계수 그룹의 현재의 하나를 포함하며(통상적으로 한 블록의 16개의 예측 잔여), 여기서 0≤K≤K_max이며, K_max는 최대 허용 값이다. 다음 블록(840)에서 누산기 A는 파라미터 K를 사용하는 가장 최근에 코딩된 값을 사용해서 갱신된다. 누산기 A는 (X-3)≥(M+1)이면 (X-3-(M+1))의 형태의 이전의 인코딩으로부터 그 코딩된 값들의 합으로 갱신되며, 계수 그룹 내의 현재의 하나를 포함한다. 블록(850)에서 파라미터 K의 값이 갱신된다. 실시예의 수는 파라미터 K를 갱신하는 데 사용될 수 있으며, 이하의 6개의 대안의 실시예 중 하나를 포함한다.

파라미터 K를 갱신하는 제1 실시예는 다음과 같다:

for(int i=0; ((N＜＜i)＜A)&&(i＜K_max); i++)인 경우

K=i (식1)

이며, 여기서 신택스는 당업자라면 이해할 수 있을 것이다. 즉, (N＜＜i)는 정수 N의 이진수 대표를 i 비트만큼 좌측으로 이동시킨다는 것을 나타내며, i++는 i를 1씩 증가시키는 것을 나타내며, "&&"는 논리 AND 연산자를 나타낸다. K 파라미터를 갱신하는 동작은 단지 하나의 가산, 최대 (K_max+1) 증가 연산, 최대 K_max 좌측 이동 연산, 및 최대 2K_max 비교 연산만을 포함하므로 작은 동작일 수 있다.

파라미터 K를 갱신하는 제2 실시예는 다음과 같다:

for(int i=0; (N＜＜i)＜A; i++)인 경우

K=max(i,K_max) (식2)

파라미터 K를 갱신하는 제3 실시예는 다음과 같다:

for(int i=0; ((N＜＜i)＜(w*A))&&(i＜K_max); i++)인 경우

K=i (식3)

이며, 여기서 w는 적응 속도를 조정하는 사전설정된 파라미터이다. (식1)에서의 방법은 w=1을 사용하는 (식3)에서의 방법에 대응할 수 있다. w>1이면, 적응 속도는 w=1을 사용하는 방법보다 빠를 수 있다. w<1이면, 적응 속도는 w=1을 사용하는 방법보다 느릴 수 있다.

파라미터 K를 갱신하는 제4 실시예는 다음과 같다:

for(int i=0; (N＜＜i)＜(w*A); i++)인 경우

K=max(i,K_max) (식4)

적응 비율을 미세화하기 원하는 경우에는 양의 계수 어레이 c[i](i=0,...,K_max)가 도입될 수 있다. 파라미터 K를 갱신하는 제5 실시예는 다음과 같다:

for(int i=0; ((c[i]*(N＜＜i))＜A)&&(i＜K_max); i++)인 경우

K=I (식5)

c[i]=1(i=0,...,K_max)은 (식1)에서의 방법에 대응할 수 있다.

파라미터 K를 갱신하는 제6 실시예는 다음과 같다:

for(int i=0; (c[i]*(N＜＜i))＜A; i++)인 경우

K=max(i,K_max) (식6)

(식1) 내지 (식6)에서 언급된 실시예는 Luma 성분에만 적용될 수 있다. 대안으로, (식1) 내지 (식6)에서 언급된 실시예는 Luma 및 Chroma 성분 모두에 적용될 수도 있다. 블록(860)에서 그 갱신된 파라미터 K를 사용해서 다음 세대 잔여 값이 인코딩되고 그 결과가 비트스트림에 삽입된다. 결정 블록(870)에서 인코딩될 임의의 예측 잔여가 남아 있는지를 결정한다. 남아 있으면, 흐름도(800)는 블록(830)으로 복귀하고 다음 예측 잔여에 대해 블록(830-860)이 반복된다. 남아 있지 않으면, 방법(800)은 종료된다. 방법(800)을 샘플 단위 또는 값 단위로 해서 파라미터 K를 갱신하는 것과 관련해서 설명하고 있으나, 그 대신 파라미터 K를 블록 단위로 해서 갱신할 수도 있다. (X-3)≥(M+1)를 충족하지 않는 임의의 예측 잔여에 있어서는, 예측 잔여가 도 12 및 도 13과 관련해서 설명된 바와 같은 TU 및 TR을 사용해서 인코딩된다. 파라미터 K의 적응은 계수 그룹, 예를 들어, 4x4 잔여 블록 내에서 수행될 수 있으며, 이 경우 N 및 A는 잔여 블록의 시작 시에 초기화되며, 단계(830-860)는 잔여 블록 내의 픽셀에 대해 반복될 수 있다. 파라미터 K는 각각의 잔여 블록의 시작 시에 다시 초기화될 수 있거나, 대안으로 파라미터 K는 프레임의 시작 시에 한 번 초기화될 수 있고 파라미터 K는 잔여 블록에서 잔여 블록으로 이어질 수 있다(예를 들어, 잔여 블록의 시작 시의 파라미터 K가 이전의 잔여 블록의 종료 시의 파라미터 K와 동일하다)

당업자라면 이해할 수 있는 바와 같이, 엔트로피 인코딩은 방법(800)에 설명된 동작과 유사한 동작을 사용하여 수신된 비트스트림을 디코딩할 수 있다. 도 15는 도 14의 방법(800)에서 생성된 비트스트림을 디코딩하는 방법(1400)의 실시예에 대한 흐름도이다. 방법(1400)의 단계는 방법(800)의 단계와 유사하되, 이진 문자열을 생성하기 위해 예측 잔여를 인코딩하는 대신, 예측 잔여를 생성하기 위해 블록(1420) 및 블록(1460)이, 수신된 비트스트림 내의 수신된 이진 문자열을 디코딩하는 단계를 포함한다는 점이 다르다.

전술한 방식은 컴퓨터와 같은 네트워크 구성요소 또는 처리 능력, 메모리 자원, 및 네트워크 처리 성능이 충분한 네트워크 구성요소 상에서, 이러한 네트워크 구성요소에 있는 필요한 작업부하를 취급하도록 실행될 수 있다. 도 16은 여기에 개시된 비디오 코덱 또는 방법, 예를 들어, 인코더(100), PU를 실행하는 방법(700), 및 PU를 디코딩하는 방법(760), 무손실 코딩 모드에서의 이진화를 위한 방법(800), 및 디코딩을 위한 방법(1400)의 하나 이상의 실시예를 실행하는 데 적합한 네트워크 구성요소 또는 노드(1500)의 실시예에 대한 개략도이다. 네트워크 노드(1500)는 프로세서(1502)를 포함하며, 상기 프로세서는 세컨더리 저장 장치(1504), 리드 온리 메모리(ROM)(1506), 랜덤 액세스 메모리(RAM)(1508)를 포함하는 메모리 장치, 입출력(I/O) 장치(1510), 및 전송기/수신기(또는 트랜시버)(1512)와 통신한다. 입출력(I/O) 장치(1510) 및/또는 전송기/수신기(또는 트랜시버)(1512)는 선택사항일 수도 있으며 포함되지 않는 경우에는 네트워크 노드(1500)가 인코딩된 비트스트림 또는 디코딩된 비디오 스트림이 메모리에 저장될 수 있다. 프로세서(1502)는 하나 이상의 중앙처리장치(CPU) 칩, 코어(예를 들어, 멀티코어 프로세서), 필드-프로그래머블 게이트 어레이(FPGA), 주문형 반도체(ASIC), 및/또는 디지털 신호 프로세서(DSP)로서 실현될 수 있다. 프로세서(1502)는 하드웨어 또는 하드웨어와 소프트웨어의 조합을 사용해서 실현될 수 있다.

세컨더리 저장 장치(1504)는 통상적으로 하나 이상의 디스크 드라이브 또는 테이프 드라이브를 포함하고 데이터의 비휘발성 저장에 사용되며 RAM(1508)이 모든 작업 데이터를 유지하기에 충분히 크기 않을 경우에는 오버-플로 데이터 저장 장치로서 사용된다. 세컨더리 저장 장치(1504)는 이러한 프로그램들이 실행을 위해 선택될 때 RAM(1508)에 로딩되는 프로그램을 저장하는 데 사용될 수 있다. ROM(1506)은 프로그램 실행 동안 판독되는 명령을 저장하는 데 사용되며 데이터를 저장하는 데 사용되기도 한다. ROM(1506)은 통상적으로 세컨더리 저장 장치(1504)의 큰 메모리 용량보다는 작은 메모리 용량을 가지는 비휘발성 메모리 장치이다. RAM(1508)은 휘발성 데이터를 저장하는 데 사용되며 명령을 저장하는 데 사용되기도 한다. ROM(1506) 및 RAM(1508)에 액세스하는 것은 모두 세컨더리 저장 장치(1504)에 액세스하는 것보다 통상적으로 빠르다.

전송기/수신기(1512)는 네트워크 노드(1500)의 출력 및/또는 입력 장치의 역할을 한다. 예를 들어, 전송기/수신기(1512)가 전송기로서 작동하면, 네트워크 노드(1500)로부터 데이터를 전송할 수 있다. 전송기/수신기(1512)가 수신기로서 작동하면, 네트워크 노드(1500)에 데이터를 수신할 수 있다. 전송기/수신기(1512)는 모델, 모뎀 뱅크, 이더넷 카드, 범용 직렬 버스(USB) 인터페이스 카드, 직렬 인터페이스, 토큰 링 카드, 섬유 분산 데이터 인터페이스(fiber distributed data interface: FDDI) 카드, 무선 근거리 통신망(WLAN) 카드, 코드분할다중접속(CDMA), 이동통신용 글로벌 시스템(GSM), 롱텀에볼루션(LTE), 와이맥스(WiMAX)와 같은 무선 트랜시버 카드, 및/또는 그외 에어 인터페이스 프로토콜 무선 트랜시버 카드, 및 그외 잘 알려진 네트워크 장치의 형태를 취할 수 있다. 전송기/수신기(1512)는 인터넷 또는 하나 이상의 인트라넷과의 통신을 위해 프로세서(1502)에 진입로를 제공할 수 있다. 네트워크 노드(1500)가 비디오 인코더로서 작동하는 경우, 프로세서(1502)는 비트스트림을 인코딩할 수 있다. 프로세서(1502)는 또한 전송용 비트스트림을 패킷으로 분할하여 캡슐화하며(즉, 포맷하며) 그 포맷된 비트스트림을 전송기/수신기(1512)에 제공할 수 있다. 전송기/수신기(1512)는 그런 다음 그 포맷된 비트스트림을 전송할 것이다. 마찬가지로, 네트워크 노드(1500)가 비디오 디코더로서 작동하면, 전송기/수신기는 포맷된 비트스트림을 수신할 수 있다.

I/O 장치(1510)는 비디오 모니터, 액정 디스플레이(LCD), 터치 스크린 디스플레이, 또는 비디오를 표시하기 위한 다른 유형의 디스플레이를 포함할 수 있으며, 비디오를 캡처하기 위한 비디오 레코딩 장치를 포함할 수 있다. I/O 장치(1510)는 또한 하나 이상의 키보드, 마우스, 또는 트랙볼, 또는 그외 잘 알려진 입력 장치를 포함할 수 있다. 네트워크 노드(1500)가 비디오 인코더로서 작동하는 경우, 인코딩될 비디오 스트림은 I/O 장치(1510)에 의해 제공될 수 있거나 다른 방식으로 제공될 수 있다. 마찬가지로, 네트워크 노드(1500)가 비디오 인코더로서 작동하는 경우, 디코딩될 비디오 스트림은 I/O 장치(1510)를 통해 수신될 수 있거나 또는 다른 방식으로 제공될 수 있다.

실행 가능한 명령을 프로그래밍하고 및/또는 네트워크 노드(1500)에 로딩함으로써, 프로세서(1502), 세컨더리 저장 장치(1504), RAM(1508), 및 ROM(1506) 중 적어도 하나가 변경되고, 네트워크 노드(1500)가 특별한 머신 또는 장치(예를 들어, 본 개시에서 언급하는 기능성을 가진 비디오 코덱)로 전환한다는 것을 이해해야 한다. 실행 가능한 명령은 세컨더리 저장 장치(1504), ROM(1506), 및/또는 RAM(1508) 상에 저장되고 실행용 프로세서(1502)에 로딩될 수 있다. 실행 가능한 소프트웨어를 컴퓨터에 로딩함으로써 실현될 수 있는 기능성이 공지의 설계 규칙에 의해 하드웨어 실현으로 변환될 수 있다는 것은 전기 공학 및 소프트웨어 공학에 기본적인 것이다. 개념을 소프트웨어로 실현할지 또는 하드웨어로 실현할지에 대한 결정은 소프트웨어 영역으로부터 하드웨어 영역으로 해석하는 데 참여하는 임의의 이슈보다는 통상적으로 설계의 안정성 및 생성될 유닛의 수에 달려 있다. 일반적으로, 변경을 빈번하게 해야 하는 설계는 소프트웨어로 실현되는 것이 바람직한데, 이는 하드웨어 실현을 리스피닝(re-spinning)하는 것이 소프트웨어 설계를 리스피닝하는 것보다 비용이 많이 들기 때문이다. 일반적으로, 예를 들어, 주문형 반도체(ASIC)에서는, 부피를 크게 해서 생성하는 것이 안정한 설계는 하드웨어로 실현하는 것이 바람직한데, 이는 큰 생성 수행에 있어서는 하드웨어 실현이 소프트웨어 실현보다 저렴하기 때문이다. 흔히 설계는 소프트웨어 형태로 개발되고 테스트된 후 공지의 설계 규칙에 의해 나중에 소프트웨어의 명령을 고정시키는 주문형 반도체 내의 등가의 하드웨어 실현으로 전환된다. 새로운 ASIC에 의해 제어되는 머신이 특별한 머신 또는 장치인 것과 동일한 방식에서는, 마찬가지로 실행 가능한 명령으로 프로그래밍되고 및/또는 로딩되는 컴퓨터를 특별한 머신 또는 장치로 볼 수 있다.

적어도 하나의 실시예에 대해 설명하였으며, 당업자가 수행하는 실시예(들) 및/또는 실시예(들)의 특징에 대한 변형, 조합, 및/또는 수정은 본 개시의 범위 내에 있다. 실시예(들)의 특징들을 조합, 통합, 및/또는 생략함으로써 생기는 대안의 실시예도 본 개시의 범위 내에 있다. 수치상의 범위 또는 한계를 명시적으로 나타내는 경우, 그러한 표현 범위 또는 한계는 명시적으로 설명된 범위 또는 한계 내에 부합하는 정도의 반복적인 범위 또는 한계를 포함하는 것으로 파악되어야 한다(예를 들어, 약 1부터 약 10까지는 2, 3, 4 등을 포함하고; 0.10보다 크다는 것은 0.11, 0.12, 0.13 등을 포함한다). 예를 들어, 하한 R_l과 상한 R_u를 가지는 수치상의 범위를 설명할 때마다, 그 범위에 부합하는 임의의 수치는 구체적으로 개시된다. 특히, 범위 내에서 이어지는 수치는 구체적으로 개시된다: R = R_l + k*(R_u - R_l)이고, 여기서 k는 1 퍼센트부터 100 퍼센트까지 1 퍼센트씩 증가하는 변수이고, 즉 k는 1 퍼센트, 2 퍼센트, 3 퍼센트, 4 퍼센트, 7 퍼센트, ..., 70 퍼센트, 71 퍼센트, 72 퍼센트, ..., 95 퍼센트, 96 퍼센트, 97 퍼센트, 98 퍼센트, 99 퍼센트, 또는 100 퍼센트이다. 또한, 위에서 규정한 바와 같이 2개의 R 숫자로 규정된 임의의 수치 범위 역시 구체적으로 개시된다. 용어 "관하여"의 사용은 다른 말이 없으면, 후속의 수의 ±10%를 의미한다. 청구의 범위의 임의의 요소와 관련해서 "선택적으로"란 용어는, 그 요소가 필요하거나, 또는 대안으로 그 요소가 필요하지 않으며, 양자의 대안이 청구의 범위 내의 범위에 있다는 의미이다. 포함하는, 구비하는, 및 가지는과 같이 넓은 용어를 사용하는 것은 이루어져 있는 필수적으로 이루어져 있는, 및 실질적으로 이루어져 있는과 같이 좁은 용어를 지원하는 것으로 파악되어야 한다. 따라서, 보호의 범위는 위에서 설정된 설명에 의해 제한되는 것이 아니라, 청구의 범위의 요지에 대한 모든 등가를 포함하는 그 범위를 따르는 청구의 범위에 의해 규정된다. 각각의 모든 청구항은 명세서에의 추가의 개시로서 통합되며 청구의 범위는 본 발명의 실시예(들)이다. 본 개시에서 참고문헌에 대한 논의는 종래기술이므로 허용되지 않으며, 특히 본 출원의 우선일 이후의 공개일을 가지는 참고문헌은 특히 그러하다. 본 개시에 언급된 모든 특허, 특허 어플리케이션, 및 공개문헌에 대한 설명은 본 명세서로써 참고문헌에 의해 예시, 과정, 또는 그외 본 개시에 대한 상세한 보충을 제공하는 정도로 통합된다.

몇몇 실시예에 대해 본 개시에 제공되었으나, 개시된 시스템 및 방법은 본 개시의 정신 및 범위를 벗어남이 없이 많은 다른 특정한 형태로 구현될 수 있다는 것을 이해해야 한다. 제공된 예는 설명으로서 파악되어야지 제한으로서 파악되어서는 안 되며, 그 의도는 여기에 주어진 상세한 설명에 대한 제한이 아니다는 것이다. 예를 들어, 다양한 요소 및 구성요소는 다른 시스템에 결합 또는 통합될 수 있거나 소정의 특징은 생략될 수 있거나 실현되지 않을 수도 있다.

또한, 다양한 실시예에 독립 또는 별도로 설명되고 도해된 기술, 시스템, 서브시스템 및 방법은 본 개시의 범위를 벗어남이 없이 다른 시스템, 모듈, 기술 또는 방법과 결합되거나 통합될 수 있다. 결합되거나 직접 결합되거나 서로 통신하는 것으로 도시되고 설명된 다른 항목들은 전기적으로, 기계적으로, 또는 그렇지 않은 다른 방식으로든 간에 일부의 인터페이스, 장치, 또는 중간의 구성요소를 통해 직접적으로 결합 또는 통신될 수 있다. 변경, 대체, 및 대안의 다른 예들은 당업자에 의해 확인될 수 있으며 여기에 개시된 정신 및 범위를 벗어남이 없이 이루어질 수 있다.

Claims

적어도 하나의 인코딩된 예측 잔여 값의 값에 따라 지수-골룸(Exopnential-Golomb: EG) 파라미터의 값을 적응적으로 갱신하는 단계; 및
상기 EG 파라미터의 값을 사용하는 EG 코드를 사용해서 무손실 모드에서 예측 잔여 값을 인코딩하는 단계
를 포함하고,
상기 EG 파라미터는,
상기 EG 파라미터의 값을 사용해서 코딩된 적어도 하나의 예측 잔여의 수만큼 카운터를 증가시킴으로써; 그리고
상기 적어도 하나의 예측 잔여의 이전에 코딩된 값의 합을 사용해서 누산기를 갱신함으로써 적응적으로 갱신되고,
상기 EG 파라미터의 값을 초깃값(initial value)으로 초기화하는 단계; 및
상기 초깃값을 사용하는 EG 코딩을 사용해서 제1 예측 잔여 값을 인코딩하는 단계
를 더 포함하며,
상기 카운터를 갱신하는 과정 및 상기 누산기를 갱신하는 과정은 상기 인코딩된 제1 예측 잔여 값을 고려하고,
상기 EG 파라미터의 값은,
for(int i=0; ((N＜＜i)＜(w*A))&&(i＜K_max); i++)인 경우
K=i
로 결정되며, 여기서 w는 적응 속도를 조정하는 사전설정된 파라미터이고, K는 EG 파라미터의 값을 나타내고, N은 카운터를 나타내고, A는 누산기를 나타내며, K_max는 K의 최대 허용 값인, 방법.
적어도 하나의 인코딩된 예측 잔여 값의 값에 따라 지수-골룸(Exopnential-Golomb: EG) 파라미터의 값을 적응적으로 갱신하는 단계; 및
상기 EG 파라미터의 값을 사용하는 EG 코드를 사용해서 무손실 모드에서 예측 잔여 값을 인코딩하는 단계
를 포함하고,
상기 EG 파라미터는,
상기 EG 파라미터의 값을 사용해서 코딩된 적어도 하나의 예측 잔여의 수만큼 카운터를 증가시킴으로써; 그리고
상기 적어도 하나의 예측 잔여의 이전에 코딩된 값의 합을 사용해서 누산기를 갱신함으로써 적응적으로 갱신되고,
상기 EG 파라미터의 값을 초깃값(initial value)으로 초기화하는 단계; 및
상기 초깃값을 사용하는 EG 코딩을 사용해서 제1 예측 잔여 값을 인코딩하는 단계
를 더 포함하며,
상기 카운터를 갱신하는 과정 및 상기 누산기를 갱신하는 과정은 상기 인코딩된 제1 예측 잔여 값을 고려하고,
상기 EG 파라미터의 값은,
for(int i=0; (N＜＜i)＜(w*A); i++)인 경우
K=max(i,K_max)
로 결정되며, 여기서 w는 적응 속도를 조정하는 사전설정된 파라미터이고, K는 EG 파라미터의 값을 나타내고, N은 카운터를 나타내고, A는 누산기를 나타내며, K_max는 K의 최대 허용 값인, 방법.
제1항 또는 제2항에 있어서,
잔여 블록 인코딩하기 전에 상기 카운터를 제로로 초기화하는 단계 - 상기 잔여 블록은 상기 예측 잔여 값을 포함하는 복수의 예측 잔여 값을 포함함 - ; 및
상기 잔여 블록을 인코딩하기 전에 상기 누산기를 제로로 초기화하는 단계
를 더 포함하며,
상기 잔여 블록의 최종 EG 파라미터가 상기 잔여 블록 직후의 다음 잔여 블록에 대한 초기 EG 파라미터가 되도록 이어지는, 방법.
제1항 또는 제2항에 있어서,
잔여 블록을 인코딩하기 전에 상기 카운터를 제로로 초기화하는 단계 - 상기 잔여 블록은 상기 예측 잔여 값을 포함하는 복수의 예측 잔여 값을 포함함 - ; 및
상기 잔여 블록을 인코딩하기 전에 상기 누산기를 제로로 초기화하는 단계
를 포함하며,
상기 잔여 블록 후의 다음 잔여 블록에 대한 초기 EG 파라미터가 상기 잔여 블록에 대한 최종 EG 파라미터와는 독립적인 값으로 초기화되는, 방법.
프로세서를 포함하며,
상기 프로세서는,
적어도 하나의 인코딩된 예측 잔여 값의 값에 따라 지수-골룸(Exopnential-Golomb: EG) 파라미터를 적응적으로 갱신하며; 그리고
상기 EG 파라미터를 가지는 EG 코드를 사용해서 무손실 모드에서 예측 잔여 값을 인코딩하도록 구성되어 있고,
상기 EG 파라미터는,
상기 EG 파라미터의 값을 사용해서 코딩된 적어도 하나의 예측 잔여의 수만큼 카운터를 증가시킴으로써; 그리고
상기 적어도 하나의 예측 잔여의 이전에 코딩된 값의 합을 사용해서 누산기를 갱신함으로써 적응적으로 갱신되고,
상기 프로세서는,
상기 EG 파라미터의 값을 초깃값(initial value)으로 초기화하며; 그리고
상기 초깃값을 사용하는 EG 코딩을 사용해서 제1 예측 잔여를 인코딩하도록 추가록 구성되어 있으며,
상기 카운터를 갱신하는 과정 및 상기 누산기를 갱신하는 과정은 상기 인코딩된 제1 예측 잔여를 고려하고,
상기 EG 파라미터의 값은,
for(int i=0; ((N＜＜i)＜(w*A))&&(i＜K_max); i++)인 경우
K=i
로 결정되며, 여기서 w는 적응 속도를 조정하는 사전설정된 파라미터이고, K는 EG 파라미터의 값을 나타내고, N은 카운터를 나타내고, A는 누산기를 나타내며, K_max는 K의 최대 허용 값인, 장치.
프로세서를 포함하며,
상기 프로세서는,
적어도 하나의 인코딩된 예측 잔여 값의 값에 따라 지수-골룸(Exopnential-Golomb: EG) 파라미터를 적응적으로 갱신하며; 그리고
상기 EG 파라미터를 가지는 EG 코드를 사용해서 무손실 모드에서 예측 잔여 값을 인코딩하도록 구성되어 있고,
상기 EG 파라미터는,
상기 EG 파라미터의 값을 사용해서 코딩된 적어도 하나의 예측 잔여의 수만큼 카운터를 증가시킴으로써; 그리고
상기 적어도 하나의 예측 잔여의 이전에 코딩된 값의 합을 사용해서 누산기를 갱신함으로써 적응적으로 갱신되고,
상기 프로세서는,
상기 EG 파라미터의 값을 초깃값(initial value)으로 초기화하며; 그리고
상기 초깃값을 사용하는 EG 코딩을 사용해서 제1 예측 잔여를 인코딩하도록 추가록 구성되어 있으며,
상기 카운터를 갱신하는 과정 및 상기 누산기를 갱신하는 과정은 상기 인코딩된 제1 예측 잔여를 고려하고,
상기 EG 파라미터의 값은,
for(int i=0; (N＜＜i)＜(w*A); i++)인 경우
K=max(i,K_max)
로 결정되며, 여기서 w는 적응 속도를 조정하는 사전설정된 파라미터이고, K는 EG 파라미터의 값을 나타내고, N은 카운터를 나타내고, A는 누산기를 나타내며, K_max는 K의 최대 허용 값인, 장치.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제