KR101829515B1

KR101829515B1 - 영상 복호 장치, 영상 복호 방법 및 기록 매체

Info

Publication number: KR101829515B1
Application number: KR1020157012839A
Authority: KR
Inventors: 겐타 센자키; 유조 센다; 게이이치 조노; 히로후미 아오키
Original assignee: 닛본 덴끼 가부시끼가이샤
Priority date: 2011-01-13
Filing date: 2012-01-05
Publication date: 2018-02-14
Also published as: EP3833026A1; JP5787002B2; CN103329535A; JP2014187701A; CN107105260B; CN105187825A; JP2015222976A; KR20150083134A; ES2864874T3; EP3833026B1; CN106878730B; US20160029025A1; KR101738322B1; PL2665272T3; CN103329535B; KR20150063582A; JP2016226019A; BR122015017257A2; BR122020018528B1; US20130336397A1

Abstract

영상 부호화 장치는, 인터 예측을 이용하여 영상 부호화를 행하는 영상 부호화 장치로서, 소정의 최소 인터 PU 사이즈(PA)와, 부호화 대상 CU의 CU 사이즈(PB)에 의거하여 부호화 대상 CU의 인터 PU 파티션 타입을 제어하는 부호화 제어 수단(11)을 구비한다. 영상 복호 장치는, 소정의 최소 인터 PU 사이즈(PA)와, 복호 대상 CU의 사이즈(PB)에 의거하여 복호 대상 CU의 인터 PU 파티션을 제어하는 복호 제어 수단을 구비한다.

Description

영상 복호 장치, 영상 복호 방법 및 기록 매체 {VIDEO DECODING DEVICE, VIDEO DECODING METHOD, AND RECORDING MEDIUM}

본 발명은 계층 구조의 부호화 유닛을 이용하는 영상 부호화 장치, 영상 복호 장치, 영상 부호화 방법, 영상 복호 방법 및 프로그램에 관한 것이다.

비특허문헌 1은 일반적인 영상 부호화 방식 및 영상 복호 방식을 개시하고 있다.

비특허문헌 1에 기재되어 있는 영상 부호화 장치는 도 15에 나타내는 바와 같이 구성된다. 이하, 도 15에 나타내지는 영상 부호화 장치를 일반적인 영상 부호화 장치라고 부른다.

도 15를 참조해서, 디지털화된 영상의 각 프레임을 입력으로 하여 비트스트림을 출력하는, 일반적인 영상 부호화 장치의 구성과 동작을 설명한다.

도 15에 나타내진 영상 부호화 장치는, 변환/양자화기(101), 엔트로피 부호화기(102), 역변환/역양자화기(103), 버퍼(104), 예측기(105), 다중화기(106), 및 부호화 제어기(108)를 구비한다.

도 15에 나타내는 영상 부호화 장치는, 프레임을 매크로블럭(MB: Macro BLock)이라고 불리는 16×16 화소 사이즈의 블럭으로 분할하고, 프레임의 좌상(左上)으로부터 순서대로 각 MB를 부호화한다.

도 16은, 프레임의 공간 해상도가 QCIF(Quarter Common Intermediate Format)인 경우의 블럭 분할의 예를 나타내는 설명도이다. 이하, 설명의 간략화를 위해, 휘도의 화소값에만 착안해서 각 장치의 동작을 설명한다.

블럭으로 분할된 입력 영상은, 예측기(105)로부터 공급되는 예측 신호가 감해져서 예측 오차 화상이 되고, 변환/양자화기(101)에 입력된다. 예측 신호에는, 인트라(intra) 예측 신호와 인터 예측 신호의 2종류가 있다. 또, 인터 예측 신호를 프레임간 예측 신호라고도 부른다.

각각의 예측 신호를 설명한다. 인트라 예측 신호는, 버퍼(104)에 저장된 현재의 픽처(picture)와 표시 시각이 동일한 재구축 픽처의 화상에 의거하여 생성되는 예측 신호이다.

비특허문헌 1의 8.3.1 Intra_4×4 prediction process for luma samples, 8.3.2 Intra_8×8 prediction process for luma samples, 및 8.3.3 Intra_16×16 prediction process for luma samples를 인용하면, 3종류의 블럭 사이즈의 인트라 예측 Intra_4×4, Intra_8×8, Intra_16×16이 있다.

Intra_4×4와 Intra_8×8은, 도 17의 (a)와 (c)를 참조하면, 각각 4×4 블럭 사이즈와 8×8 블럭 사이즈의 인트라 예측임을 알 수 있다. 단, 도면의 원(○)은 인트라 예측에 이용되는 참조 화소, 즉, 현재의 픽처와 표시 시간이 동일한 재구축 픽처의 화소이다.

Intra_4×4의 인트라 예측에서는, 재구축한 주변 화소를 그대로 참조 화소로 하여, 도 17의 (b)에 나타내는 9종류의 방향으로 참조 화소를 패딩(외삽)해서 예측 신호가 형성된다. Intra_8×8의 인트라 예측에서는, 도 17의 (c)의 우향 화살표 밑에 기재된 로우패스 필터(1/2, 1/4, 1/2)에 의해 재구축 픽처의 화상의 주변 화소를 평활화한 화소를 참조 화소로 하여, 도 17의 (b)에 나타내는 9종류의 방향으로 참조 화소를 외삽해서 예측 신호가 형성된다.

한편, Intra_16×16은, 도 18의 (a)를 참조하면, 16×16 블럭 사이즈의 인트라 예측임을 알 수 있다. 도 17의 경우와 마찬가지로 도면의 원(○)은 인트라 예측에 이용되는 참조 화소, 즉, 현재의 픽처와 표시 시각이 동일한 재구축 픽처의 화소이다. Intra_16×16의 인트라 예측에서는, 재구축 픽처의 화상의 주변 화소를 그대로 참조 화소로 하여, 도 18의 (b)에 나타내는 4종류의 방향으로 참조 화소를 외삽해서 예측 신호가 형성된다.

이하, 인트라 예측 신호를 이용하여 부호화되는 MB 및 블럭을 각각 인트라 MB 및 인트라 블럭이라고 부르고, 인트라 예측의 블럭 사이즈를 인트라 예측 블럭 사이즈라고 부르며, 또한, 외삽의 방향을 인트라 예측 방향이라고 부른다. 또, 인트라 예측 블럭 사이즈 및 인트라 예측 방향은 인트라 예측에 관한 예측 파라미터이다.

인터 예측 신호는, 버퍼(104)에 저장된 현재의 픽처와 표시 시각이 다른 재구축 픽처의 화상으로부터 생성되는 예측 신호이다. 이하, 인터 예측 신호를 이용하여 부호화되는 MB 및 블럭을 각각 인터 MB 및 인터 블럭이라고 부른다. 인터 예측의 블럭 사이즈(인터 예측 블럭 사이즈)로서, 예를 들면 16×16, 16×8, 8×16, 8×8, 8×4, 4×8, 4×4를 선택할 수 있다.

도 19는, 16×16의 블럭 사이즈를 예로 한 인터 예측의 예를 나타내는 설명도이다. 도 19에 나타내는 모션 벡터 MV=(mv_x, mv_y)는, 부호화 대상 블럭에 대한 참조 픽처의 인터 예측 블럭(인터 예측 신호)의 평행 이동량을 나타내는 예측이다. AVC에서는, 부호화 대상 블럭의 부호화 대상 픽처에 대한 인터 예측 신호의 참조 픽처의 방향을 표시하는 인터 예측의 방향에 더해서, 부호화 대상 블럭의 인터 예측에 이용되는 참조 픽처를 식별하기 위한 참조 픽처 인덱스도 인터 예측의 예측 파라미터이다. AVC에서는, 버퍼(104)에 저장된 복수 매의 참조 픽처를 인터 예측에 이용할 수 있기 때문이다.

AVC의 인터 예측에서는, 1/4 화소 정밀도로 모션 벡터를 구할 수 있다. 도 20은, 모션 보상 예측에 있어서의 휘도 신호의 보간 처리를 나타내는 설명도이다. 도 20에 있어서, A는 정수 화소 위치의 화소 신호, b, c, d는 1/2 화소 정밀도의 소수 화소 위치의 화소 신호, e₁, e₂, e₃은 1/4 화소 정밀도의 소수 화소 위치의 화소 신호를 나타낸다. 화소 신호 b는, 수평 방향의 정수 화소 위치의 화소에 대하여 6탭의 필터를 적용해서 생성된다. 마찬가지로, 화소 신호 c는, 수직 방향의 정수 화소 위치의 화소에 대하여 6탭의 필터를 적용해서 생성된다. 화소 신호 d는, 수평 또는 수직 방향의 1/2 화소 정밀도의 소수 화소 위치의 화소에 대하여 6탭의 필터를 적용해서 생성된다. 6탭의 필터 계수는 [1, -5, 20, 20, -5, 1]/32로 표시된다. 화소 신호 e₁, e₂, 및 e₃은, 각각, 근방의 정수 화소 위치 또는 소수 화소 위치의 화소에 대하여 2탭 필터 [1, 1]/2를 적용해서 생성된다.

인트라 MB만으로 부호화된 픽처는 I픽처라고 불린다. 인트라 MB뿐만 아니라 인터 MB도 포함해서 부호화된 픽처는 P픽처라고 불린다. 인터 예측에 1매의 참조 픽처뿐만 아니라, 동시에 2매의 참조 픽처를 더 이용하는 인터 MB를 포함해서 부호화된 픽처는 B픽처라고 불린다. 또한 B픽처에 있어서, 부호화 대상 블럭의 부호화 대상 픽처에 대한 인터 예측 신호의 참조 픽처의 방향이 과거인 인터 예측을 전방향 예측, 부호화 대상 블럭의 부호화 대상 픽처에 대한 인터 예측 신호의 참조 픽처의 방향이 미래인 인터 예측을 후방향 예측, 과거와 미래를 포함하는 참조 픽처를 동시에 2매 이용하는 인터 예측을 쌍방향 예측이라고 각각 부른다. 또, 인터 예측의 방향(인터 예측 방향)은 인터 예측의 예측 파라미터이다.

예측기(105)는, 부호화 제어기(108)의 지시에 따라, 입력 영상의 신호와 예측 신호를 비교하고, 예측 오차 화상 블럭의 에너지가 최소가 되는 예측 파라미터를 결정한다. 부호화 제어기(108)는, 결정한 예측 파라미터를 엔트로피 부호화기(102)에 공급한다.

변환/양자화기(101)는, 예측 오차 화상을 주파수 변환하고, 주파수 변환 계수를 얻는다.

또한, 변환/양자화기(101)는, 소정의 양자화 스텝 폭 Qs로, 주파수 변환 계수를 양자화한다. 이하, 양자화된 주파수 변환 계수를 변환 양자화값이라고 부른다.

엔트로피 부호화기(102)는, 예측 파라미터와 변환 양자화값을 엔트로피 부호화한다. 예측 파라미터는, 상기한 예측 모드(인트라 예측, 인터 예측), 인트라 예측 블럭 사이즈, 인트라 예측 방향, 인터 예측 블럭 사이즈, 및 모션 벡터 등, MB 및 블럭의 예측에 관련된 정보이다.

역변환/역양자화기(103)는, 양자화 스텝 폭 Qs로, 변환 양자화값을 역양자화한다. 또한, 역변환/역양자화기(103)는, 역양자화한 주파수 변환 계수를 역주파수 변환한다. 역주파수 변환된 재구축 예측 오차 화상은, 예측 신호가 더해지고, 버퍼(104)에 공급된다.

버퍼(104)는 공급되는 재구축 화상을 저장한다. 1프레임 분의 재구축 화상을 재구축 픽처라고 부른다.

다중화기(106)는, 엔트로피 부호화기(102)의 출력 데이터, 및 부호화 파라미터를 다중화해서 출력한다.

상술한 동작에 의거하여, 영상 부호화 장치에 있어서의 다중화기(106)는, 비트스트림(bitstream)을 생성한다.

비특허문헌 1에 기재되어 있는 영상 복호 장치는, 도 21에 나타나 있는 바와 같이 구성된다. 이하, 도 21에 나타내지는 영상 복호 장치를 일반적인 영상 복호 장치라고 부른다.

도 21을 참조해서, 비트스트림을 입력으로 하여 복호된 영상 프레임을 출력하는, 일반적인 영상 복호 장치의 구성과 동작을 설명한다.

도 21에 나타내진 영상 복호 장치는, 다중화 해제기(201), 엔트로피 복호기(202), 역변환/역양자화기(203), 예측기(204), 및 버퍼(205)을 구비한다.

다중화 해제기(201)는, 입력되는 비트스트림을 다중화 해제하고, 엔트로피 부호화된 영상 비트스트림을 추출한다.

엔트로피 복호기(202)는, 영상 비트스트림을 엔트로피 복호한다. 엔트로피 복호기(202)는, MB 및 블럭의 예측 파라미터 및 변환 양자화값을 엔트로피 복호하고, 역변환/역양자화기(203) 및 예측기(204)에 공급한다.

역변환/역양자화기(203)는, 양자화 스텝 폭으로, 변환 양자화값을 역양자화한다. 또한, 역변환/역양자화기(203)는, 역양자화한 주파수 변환 계수를 역주파수 변환한다.

역주파수 변환 후, 예측기(204)는, 엔트로피 복호한 MB 및 블럭의 예측 파라미터에 의거하여, 버퍼(205)에 저장된 재구축 픽처의 화상을 이용해서 예측 신호를 생성한다.

예측 신호 생성 후, 역변환/역양자화기(203)에서 역주파수 변환된 재구축 예측 오차 화상은, 예측기(204)로부터 공급되는 예측 신호가 더해지고, 재구축 화상으로서 버퍼(205)에 공급된다.

그리고, 버퍼(205)에 저장된 재구축 픽처가 디코드 화상(디코드 영상)으로서 출력된다.

상술한 동작에 의거하여 일반적인 영상 복호 장치는 디코드 화상을 생성한다.

ISO/IEC 14496-10 Advanced Video Coding "Test Model under Consideration", Document: JCTVC-B205, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 2nd Meeting: Geneva, CH, 21-28 July, 2010

그런데, 비특허문헌 2는 Test Model under Consideration 방식(TMuC 방식)을 개시하고 있다. TMuC 방식은, 비특허문헌 1에 개시된 방식과는 달리, 도 24에 나타내는 계층 구조의 부호화 유닛(Coding Tree Block(CTB))을 이용한다. 본 명세서에 있어서, CTB의 블럭을 Coding Unit(CU: 부호화 유닛)이라고 부른다.

또, 최대의 CU를 Largest Coding Unit(LCU), 최소의 CU를 Smallest Coding Unit(SCU)이라고 부른다. 또한 TMuC 방식에 있어서는, CU에 대한 예측 유닛으로서 Prediction Unit(PU)이라고 하는 개념(도 23 참조)이 도입되어 있다. PU는 예측의 기본 단위이며, 도 23에 나타내지는 {2N×2N, 2N×N, N×2N, N×N, 2N×nU, 2N×nD, nL×2N, nR×2N}의 8종류의 PU 파티션 타입이 정의되어 있다. 인터 예측이 이용되는 PU를 인터 PU, 인트라 예측이 이용되는 PU를 인트라 PU라고 부른다. 인터 예측이 이용되는 PU 파티션을 인터 PU 파티션, 인트라 예측이 이용되는 PU 파티션을 인트라 PU 파티션이라고 부른다. 인트라 PU 파티션은 도 23에 나타내진 형상 중 2N×2N, 및 N×N의 정방형만이 서포트되어 있다. 이하, CU 및 PU의 1변의 길이를 각각 CU 사이즈 및 PU 사이즈라고 부른다.

또한, TMuC 방식에서는 소수 정밀도의 예측 화상을 구하기 위해서 최대로 12탭의 필터를 이용할 수 있다. 화소 위치와 필터의 계수의 관계는 이하대로이다.

[표 1]

화소 위치에 대해서, 도 24를 이용하여 설명한다. 도 24에 있어서, A, E를 정수 화소 위치의 화소라고 한다. 이때, b가 1/4화소 위치의 화소, c가 1/2화소 위치의 화소, d가 3/4화소 위치의 화소이다. 수직 방향도 마찬가지로 된다.

도 20에 나타내는 화소 b 또는 화소 c는, 수평 또는 수직 방향의 1/2화소 위치용 필터를 1회 적용함으로써 생성된다. 화소 e₁은 1/4화소 위치용의 필터를 1회 적용함으로써 생성된다.

도 25를 참조하여, 화소 e₂나 화소 e₃과 같이, 그 화소 위치가 수평 수직 양쪽 모두 소수 정밀도 위치이며, 그 중 적어도 어느 쪽인가가 1/4화소 위치일 경우의 소수 화소 생성의 예를 설명한다. 도 25에 있어서, 화소 A를 정수 화소 위치의 화소, 화소 c를 구하려는 소수 화소 위치의 화소라고 한다. 이때, 우선, 화소 b가 수직 방향의 1/4화소 위치용 필터를 적용함으로써 생성된다. 계속해서, 화소 c가, 소수 화소 b에 대하여, 수평 방향의 3/4화소 위치용 필터를 적용함으로써 생성된다. 또, 비특허문헌 2의 8.3 Interpolation Methods에는, 소수 화소 생성의 보다 상세한 설명이 기재되어 있다.

TMuC 방식에서는 모든 계층의 CU의 PU 헤더에서 PU 파티션 타입을 나타내는 신택스(syntax)(비특허문헌 2의 4.1.10 Prediction unit syntax의 표기를 따르면, 인트라 예측의 경우에는 intra_split_flag, 인터 예측의 경우에는 inter_partitioning_idc)를 출력 비트스트림에 매립한다. 이후, intra_split_flag 신택스를 인트라 PU 파티션 타입 신택스, inter_partitioning_idc 신택스를 인터 PU 파티션 타입 신택스라고 부른다.

각각의 LCU 내에 작은 사이즈의 CU가 많이 존재할 때, 비트스트림에 포함되는 인터 PU 파티션 타입 신택스의 비트수의 비율이 높아져서, 압축 영상의 품질이 저하하는 과제가 있다.

또한, TMuC 방식에서는 인터 PU 파티션의 사이즈가 작을수록, 참조 픽처에 대한 메모리 액세스가 증가해서, 메모리 대역을 압박하는 과제가 있다. 특히, TMuC 방식에서는 12탭의 필터를 이용하여 소수 화소를 생성하기 때문에, 메모리 대역을 보다 압박한다.

도 26은, 12탭 필터를 이용할 때의 메모리 액세스 영역을 설명하기 위한 설명도이다. 도 26 (A)는 N×N의 PU 파티션 타입이 선택되었을 때의, 1개의 인터 PU 파티션의 메모리 액세스 영역, 도 26 (B)는 2N×2N의 인터 PU 파티션 타입이 선택되었을 때의 메모리 액세스 영역을 표시한다.

N×N이 선택되었을 때, 도 26 (A)에 있어서의 파선으로 둘러싸인 사이즈의 메모리 액세스를 0, 1, 2, 3의 인터 PU 파티션마다 합계 4회 행하기 때문에, 메모리 액세스량은, 4(N+11)²= 4N² + 88N + 484에 참조 픽처의 비트량을 승산한 값이 된다. 2N×2N의 인터 PU 파티션의 메모리 액세스량이 (2N+11)² = 4N² + 44N + 121에 참조 픽처의 비트량을 승산한 값이기 때문에, N×N의 인터 PU 파티션의 메모리 액세스량은 2N×2N의 메모리 액세스량보다 커진다.

예를 들면, N=4, 편방향 예측, 화소값의 비트 정밀도가 8bit일 때의 8×8 CU에 있어서의 인터 PU의 메모리 액세스량을 고려한다. 2N×2N의 인터 PU 파티션에 있어서의 메모리 액세스량은 19×19×1×8bit = 2888bit인 것에 대해, N×N의 인터 PU 파티션에 있어서의 메모리 액세스량은 15×15×4×8bit = 7200bit가 되어, 약 2.5배의 메모리 액세스량이 된다.

또한, LCU 단위에서는, LCU의 블럭 사이즈가 128×128일 때, LCU를 1개의 인터 PU 파티션에 의해 예측할 때의 메모리 액세스량은 139×139×1×8bit = 154568bit인 것에 대해, LCU를 모두 4×4 인터 PU 파티션에 의해 예측할 때(즉, LCU를 1024개의 인터 PU 파티션에 의해 예측할 때)의 메모리 액세스량은 15×15×1024×8bit = 1843200bit가 되어, 약 12배의 메모리 액세스량이 된다.

본 발명은, 소정 면적당의 메모리 대역을 삭감하는 것을 목적으로 한다.

본 발명에 따른 영상 부호화 장치는, 인터 예측을 이용하여 영상 부호화를 행하는 영상 부호화 장치로서, 최소 인터 PU 사이즈와, 부호화 대상 CU의 CU 사이즈에 의거하여 부호화 대상 CU의 인터 PU 파티션 타입을 제어하는 부호화 제어 수단을 구비하는 것을 특징으로 한다.

본 발명에 따른 영상 복호 장치는, 인터 예측을 이용하여 영상 복호를 행하는 영상 복호 장치로서, 최소 인터 PU 사이즈와, 복호 대상 CU의 사이즈에 의거하여 복호 대상 CU의 인터 PU 파티션을 제어하는 복호 제어 수단을 구비하는 것을 특징으로 한다.

본 발명에 따른 영상 부호화 방법은, 인터 예측을 이용하여 영상 부호화를 행하는 영상 부호화 방법으로서, 최소 인터 PU 사이즈와, 부호화 대상 CU의 CU 사이즈에 의거하여 부호화 대상 CU의 인터 PU 파티션 타입을 제어하는 것을 특징으로 한다.

본 발명에 따른 영상 복호 방법은, 인터 예측을 이용하여 영상 복호를 행하는 영상 복호 방법으로서, 최소 인터 PU 사이즈와, 복호 대상 CU의 사이즈에 의거하여 복호 대상 CU의 인터 PU 파티션을 제어하는 것을 특징으로 한다.

본 발명에 따른 영상 부호화 프로그램은, 인터 예측을 이용하여 영상 부호화를 행하는 컴퓨터에, 최소 인터 PU 사이즈와, 부호화 대상 CU의 CU 사이즈에 의거하여 부호화 대상 CU의 인터 PU 파티션 타입을 제어하는 처리를 실행시키는 것을 특징으로 한다.

본 발명에 따른 영상 복호 프로그램은, 인터 예측을 이용하여 영상 복호를 행하는 컴퓨터에, 최소 인터 PU 사이즈와, 복호 대상 CU의 사이즈에 의거하여 복호 대상 CU의 인터 PU 파티션을 제어하는 처리를 실행시키는 것을 특징으로 한다.

본 발명에 의하면, 작은 인터 PU 파티션의 사용을 제한해서 메모리 대역을 삭감할 수 있다.

도 1은 제1 실시형태의 영상 부호화 장치의 블럭도.
도 2는 PU 파티션 타입의 후보의 결정 처리를 나타내는 플로차트.
도 3은 시퀀스 파라미터 세트에 있어서의 최소 인터 PU 사이즈에 관한 정보를 나타내는 리스트의 설명도.
도 4는 PU 헤더 기입의 동작을 나타내는 플로차트.
도 5는 PU 신택스에 있어서의 inter_partitioning_idc 신택스에 관한 정보를 나타내는 리스트의 설명도.
도 6은 제2 실시형태의 영상 복호 장치의 블럭도.
도 7은 PU 헤더 판독의 동작을 나타내는 플로차트.
도 8은 픽처 파라미터 세트에 있어서의 최소 인터 PU 사이즈에 관한 정보를 나타내는 리스트의 설명도.
도 9는 슬라이스 헤더에 있어서의 최소 인터 PU 사이즈에 관한 정보를 나타내는 리스트의 설명도.
도 10은 제4 실시형태의 영상 복호 장치의 블럭도.
도 11은 에러 검출의 동작을 나타내는 플로차트.
도 12는 본 발명에 따른 영상 부호화 장치 및 영상 복호 장치의 기능을 실현 가능한 정보 처리 시스템의 구성예를 나타내는 블럭도.
도 13은 본 발명에 따른 영상 부호화 장치의 주요부를 나타내는 블럭도.
도 14는 본 발명에 따른 영상 복호 장치의 주요부를 나타내는 블럭도.
도 15는 일반적인 영상 부호화 장치의 블럭도.
도 16은 블록 분할의 예를 나타내는 설명도.
도 17은 Intra_4×4와 Intra_8×8의 인트라 예측을 설명하기 위한 설명도.
도 18은 Intra_16×16의 인트라 예측을 설명하기 위한 설명도.
도 19는 인터 예측의 예를 나타내는 설명도.
도 20은 모션 보상 예측에 있어서의 휘도 신호의 보간 처리를 나타내는 설명도.
도 21은 일반적인 영상 복호 장치의 블럭도.
도 22는 CTB를 설명하기 위한 설명도.
도 23은 PU를 설명하기 위한 설명도.
도 24는 소수 화소 위치를 설명하기 위한 설명도.
도 25는 TMuC 방식의 12탭 필터를 이용한 소수 화소 생성 방법을 설명하기 위한 설명도.
도 26은 12탭 필터를 이용하여 소수 화소를 생성할 때의 메모리 액세스 범위를 설명하기 위한 설명도.

상술한 일반적 기술의 과제를 해결하기 위해서, 본 발명에서는, 계층 구조의 부호화 유닛을 이용하는 것을 특징으로 하는 영상 부호화에 있어서, CU의 depth(즉, CU 사이즈)에 의거하여 인터 PU 파티션을 제한함으로써 과제를 해결한다. 본 발명의 일례에서는, 2N×2N 이외의 인터 PU 파티션이 사용 가능한 CU 사이즈를 제한함으로써 과제를 해결한다. 본 발명의 다른 일례에서는, PU 헤더의 인터 PU 파티션 타입 신택스 전송을 제한함으로써 과제를 해결한다. 본 발명의 상기의 예에 있어서, 비트스트림에 포함되는 인터 PU 파티션 타입 신택스의 비트 수의 비율이 낮게 억제되어 압축 영상의 품질을 향상시키면서, 메모리 대역을 억제할 수 있다.

실시형태 1.

제1 실시형태에서는, 외부 설정되는 소정의 최소 인터 PU 사이즈에 의거하여 인터 PU 파티션 타입을 제어하는 부호화 제어 수단, 및 최소 인터 PU 사이즈에 관한 정보를 영상 복호 장치에 시그널링하기 위한, 최소 인터 PU 사이즈에 관한 정보를 비트스트림에 매립하는 수단을 구비하는 영상 부호화 장치를 나타낸다.

본 실시형태에서는, 이용 가능한 CU 사이즈를 128, 64, 32, 16, 8(즉, LCU 사이즈가 128, SCU 사이즈가 8이다), 최소 인터 PU 사이즈(minInterPredUnitSize)를 8로 한다.

또한, 본 실시형태에서는, 최소 인터 PU 사이즈에 관한 정보(min_inter_pred_unit_hierarchy_depth)로서, 최소 인터 PU 사이즈(8)를 SCU 사이즈(8)로 나눈 값의 "2"를 밑으로 하는 log(대수)로 한다. 따라서, 본 실시형태에서는, 비트스트림에 다중화되는 min_inter_pred_unit_hierarchy_depth의 값은, 0(=log₂(8/8))이 된다.

도 1에 나타내는 바와 같이, 본 실시형태의 영상 부호화 장치는, 도 15에 나타내진 일반적인 영상 부호화 장치와 마찬가지로, 변환/양자화기(101), 엔트로피 부호화기(102), 역변환/역양자화기(103), 버퍼(104), 예측기(105), 다중화기(106), 및 부호화 제어기(107)를 구비한다.

도 1에 나타내는 본 실시형태의 영상 부호화 장치에서는, 도 15에 나타내는 영상 부호화 장치와는 달리, minInterPredUnitSize보다 큰 CU 사이즈로 인터 PU 파티션 타입 신택스를 전송하기 위해서, minInterPredUnitSize가 부호화 제어기(107)에 공급되고 있으며, 또한, minInterPredUnitSize를 영상 복호 장치에 시그널링하기 위해서, minInterPredUnitSize가 다중화기(106)에도 공급되고 있다.

부호화 제어기(107)는, 부호화 왜곡(입력 신호와 재구축 픽처의 오차 화상의 에너지)과 발생 비트량으로부터 계산되는 코스트(Rate-Distortion 코스트: R-D 코스트)를 예측기(105)에 계산시킨다. 부호화 제어기(107)는, R-D 코스트가 최소가 되는, CU 분할 형상(도 22에 나타나 있는 바와 같이, split_coding_unit_flag에 의해 결정하는 분할 형상), 및 각 CU의 예측 파라미터를 결정한다. 부호화 제어기(107)는, 결정한 split_coding_unit_flag 및 각 CU의 예측 파라미터를 예측기(105) 및 엔트로피 부호화기(102)에 공급한다. 예측 파라미터는, 예측 모드(pred_mode), 인트라 PU 파티션 타입(intra_split_flag), 인트라 예측 방향, 인터 PU 파티션 타입(inter_partitioning_idc), 및 모션 벡터 등, 부호화 대상 CU의 예측에 관련된 정보이다.

단, 본 실시형태의 부호화 제어기(107)는, 일례로서, minInterPredUnitSize보다 큰 CU 사이즈의 CU에 대하여, 예측 파라미터로서 최적인 PU 파티션 타입을, 인트라 예측의 {2N×2N, N×N}, 인터 예측의 {2N×2N, 2N×N, N×2N, N×N, 2N×nU, 2N×nD, nL×2N, nR×2N}의 합계 10종류로부터 선택한다. 부호화 제어기(107)는, minInterPredUnitSize와 같은 CU 사이즈의 CU에 대하여, 예측 파라미터로서 최적인 PU 파티션 타입을, 인트라 예측의 {2N×2N, N×N}, 인터 예측의 {2N×2N}의 합계 3종류로부터 선택한다. 부호화 제어기(107)는, minInterPredUnitSize 미만의 CU 사이즈의 CU에 대하여, 예측 파라미터로서 최적인 PU 파티션 타입을 인트라 예측의 {2N×2N, N×N}의 합계 2종류로부터 선택한다.

도 2는, PU 파티션 타입의 후보의 결정에 관한 본 실시형태의 부호화 제어기(107)의 동작을 나타내는 플로차트이다.

도 2에 나타내는 바와 같이, 부호화 제어기(107)는, 스텝 S101에서, 부호화 대상 CU의 CU 사이즈가 minInterPredUnitSize보다 크다고 판정했을 때, 스텝 S102에서, PU 파티션 타입의 후보를 인트라 예측 {2N×2N, N×N}과 인터 예측 {2N×2N, 2N×N, N×2N, N×N, 2N×nU, 2N×nD, nL×2N, nR×2N}의 합계 10종류로 설정하고, 스텝 S106에서 R-D 코스트에 의거하여 예측 파라미터를 결정한다.

스텝 S101에서 부호화 제어기(107)가 부호화 대상 CU의 CU 사이즈가 minInterPredUnitSize 이하라고 판정했을 때, 스텝 S103으로 진행한다.

부호화 제어기(107)는, 스텝 S103에서 부호화 대상 CU의 CU 사이즈가 minInterPredUnitSize와 같다고 판정했을 때, 스텝 S104에서, PU 파티션 타입의 후보를 인트라 예측 {2N×2N, N×N}과 인터 예측 {2N×2N}의 합계 3종류로 설정하고, 스텝 S106에서 R-D 코스트에 의거하여 예측 파라미터를 결정한다.

부호화 제어기(107)는, 스텝 S103에서 부호화 대상 CU의 CU 사이즈가 minInterPredUnitSize 미만이라고 판정했을 때, 스텝 S105에서, PU 파티션 타입의 후보를 인트라 예측의 {2N×2N, N×N}의 합계 2종류로 설정하고, 스텝 S106에서 R-D 코스트에 의거하여 예측 파라미터로서 최적인 PU 파티션 타입을 결정한다.

예측기(105)는, 부호화 제어기(107)가 결정한 각 CU의 예측 파라미터에 대응하는 예측 신호를 선정한다.

부호화 제어기(107)가 결정한 형상의 각 CU의 입력 영상은, 예측기(105)로부터 공급되는 예측 신호가 감해져서 예측 오차 화상이 되고, 변환/양자화기(101)에 입력된다.

또한, 변환/양자화기(101)는, 양자화 스텝 폭 Qs로, 주파수 변환 계수를 양자화하고, 변환 양자화값을 얻는다.

엔트로피 부호화기(102)는, 부호화 제어기(107)로부터 공급되는 split_coding_unit_flag(도 22 참조), 예측 파라미터, 및 변환/양자화기(101)로부터 공급되는 변환 양자화값을 엔트로피 부호화한다.

다중화기(106)는, 최소 인터 PU 사이즈에 관한 정보(min_inter_pred_unit_hierarchy_depth), 및 엔트로피 부호화기(102)의 출력 데이터를 다중화해서 출력한다. 비특허문헌 2의 4.1.2 Sequence parameter set RBSP syntax의 표기를 따르면, 다중화기(106)는, 도 3에 나타내는 리스트에 표시되는 바와 같이, 시퀀스 파라미터 세트의 log2_min_coding_unit_size_minus3 신택스와 max_coding_unit_hierarchy_depth 신택스에 후속시켜서, min_inter_pred_unit_hierarchy_depth 신택스(minInterPredUnitSize를 SCU 사이즈로 나눈 값의 "2"를 밑으로 하는 log(대수), 본 실시형태에서는 0)를 다중화한다. 단, log2_min_coding_unit_size_minus3 신택스 및 max_coding_unit_hierarchy_depth 신택스는, 각각, SCU 사이즈(minCodingUnitSize) 및 LCU 사이즈(maxCodingUnitSize)를 결정하기 위한 정보이다. minCodingUnitSize와 maxCodingUnitSize는, 각각, 이하와 같이 계산된다.

minCodingUnitSize = 1 <<(log2_min_coding_unit_size_minus3 + 3)

maxCodingUnitSize = 1 <<(log2_min_coding_unit_size_minus3 + 3 + max_coding_unit_hierarchy_depth)

또한, min_inter_pred_unit_hierarchy_depth 신택스와 minCodingUnitSize에는 이하의 관계가 있다.

min_inter_pred_unit_hierarchy_depth = log₂(minInterPredUnitSize/ minCodingUnitSize)

상술한 동작에 의거하여, 본 발명의 영상 부호화 장치는 비트스트림을 생성한다.

본 실시형태의 영상 부호화 장치는, 최소 인터 PU 사이즈 미만의 인터 PU가 출현하지 않도록, 소정의 최소 인터 PU 사이즈, 및 부호화 대상 CU의 CU 사이즈에 의거하여 부호화 대상 CU의 인터 PU 파티션을 제어한다.

최소 인터 PU 사이즈 미만의 인터 PU가 출현하지 않도록 함으로써, 메모리 대역이 삭감된다. 또한, 최소 인터 PU 사이즈 미만의 인터 PU가 출현하지 않도록 함으로써, 시그널링되는 인터 PU 파티션 타입 신택스의 개수가 삭감되므로, 비트스트림에서 차지하는 PU 헤더의 부호량의 비율이 작아져서 영상의 품질이 개선된다.

본 실시형태의 영상 부호화 장치에 있어서의 부호화 제어 수단은, 외부 설정되는 소정의 최소 인터 PU 사이즈에 의거하여 인터 PU 파티션을 제어한다. 일례로서, 2N×2N 이외의 인터 PU 파티션 타입을, 소정의 사이즈보다 큰 CU 사이즈의 CU에서만 사용하도록 제어한다. 따라서, 2N×2N의 인터 PU 파티션의 발생 확률이 증가해서 엔트로피가 감소하기 때문에, 엔트로피 부호화의 효율이 상승한다. 따라서, 메모리 대역을 삭감하면서 압축 영상의 품질을 유지할 수 있다.

또한, 본 실시형태의 영상 부호화 장치는, 영상 복호에 관해서도 마찬가지로 인터 PU 파티션 타입 신택스를 비트스트림으로부터 판독하도록, 외부 설정되는 소정의 최소 인터 PU 사이즈에 관한 정보를 비트스트림에 매립하는 수단을 구비한다. 따라서, 영상 복호 장치에 소정의 사이즈가 시그널링되게 되고, 영상 부호화 장치와 영상 복호 장치의 상호 운용성을 높일 수 있다.

실시형태 2.

제2 실시형태의 영상 부호화 장치는, 외부 설정되는 소정의 최소 인터 PU 사이즈에 의거하여 인터 PU 파티션 타입을 제어하고, 또한, 상기의 소정의 최소 인터 PU 사이즈에 의거하여, 인터 PU 파티션 타입 신택스의 엔트로피 부호화를 제어하는 부호화 제어 수단, 및 상기의 최소 인터 PU 사이즈에 관한 정보를 영상 복호 장치에 시그널링하기 위한, 최소 인터 PU 사이즈에 관한 정보를 비트스트림에 매립하는 수단을 구비한다.

본 실시형태에서는, 인터 PU 파티션 타입 신택스를 전송하는 CU의 CU 사이즈는, 상기의 최소 인터 PU 사이즈(minInterPredUnitSize)보다 크다고 한다. 또한, 본 실시형태에서는, 이용 가능한 CU 사이즈를 128, 64, 32, 16, 8(즉, LCU 사이즈가 128, SCU 사이즈가 8이다), minInterPredUnitSize를 8로 한다. 따라서, 본 실시형태에서는, 인터 PU 파티션 타입 신택스를 비트스트림에 매립하는 CU 사이즈는 128, 64, 32, 16이 된다.

본 실시형태의 영상 부호화 장치의 구성은, 도 1에 나타내진 제1 실시형태의 영상 부호화 장치의 구성과 마찬가지이다.

도 1에 나타내는 바와 같이, 본 실시형태의 영상 부호화 장치에서는, 도 15에 나타내는 영상 부호화 장치와는 달리, minInterPredUnitSize보다 큰 CU 사이즈로 인터 PU 파티션 타입 신택스를 전송하기 위해서 minInterPredUnitSize가 부호화 제어기(107)에 공급되고 있고, 또한, minInterPredUnitSize를 영상 복호 장치에 시그널링하기 위해서, minInterPredUnitSize가 다중화기(106)에도 공급되고 있다.

부호화 제어기(107)는, 부호화 왜곡(입력 신호와 재구축 픽처의 오차 화상의 에너지)과 발생 비트량으로부터 계산되는 R-D 코스트를 예측기(105)에 계산시킨다. 부호화 제어기(107)는, R-D 코스트가 최소가 되는, CU분할 형상(도 22에 나타나 있는 바와 같이, split_coding_unit_flag에 의해 결정하는 분할 형상), 및 각 CU의 예측 파라미터를 결정한다. 부호화 제어기(107)는, 결정한 split_coding_unit_flag 및 각 CU의 예측 파라미터를 예측기(105) 및 엔트로피 부호화기(102)에 공급한다. 예측 파라미터는, 예측 모드(pred_mode), 인트라 PU 파티션 타입(intra_split_flag), 인트라 예측 방향, 인터 PU 파티션 타입(inter_partitioning_idc), 및 모션 벡터 등, 부호화 대상 CU의 예측에 관련된 정보이다.

본 실시형태의 부호화 제어기(107)는, 제1 실시형태와 마찬가지로, minInterPredUnitSize보다 큰 CU 사이즈의 CU에 대해서는, 예측 파라미터로서 최적인 PU 파티션 타입을, 인트라 예측의 {2N×2N, N×N}, 인터 예측의 {2N×2N, 2N×N, N×2N, N×N, 2N×nU, 2N×nD, nL×2N, nR×2N}의 합계 10종류로부터 선택한다. 부호화 제어기(107)는, minInterPredUnitSize와 같은 CU 사이즈의 CU에 대하여, 예측 파라미터로서 최적인 PU 파티션 타입을, 인트라 예측의 {2N×2N, N×N}, 인터 예측의 {2N×2N}의 합계 3종류로부터 선택한다. 부호화 제어기(107)는, minInterPredUnitSize 미만의 CU 사이즈의 CU에 대하여, 예측 파라미터로서 최적인 PU 파티션 타입을, 인트라 예측의 {2N×2N, N×N}으로부터 선택한다.

단, 본 실시형태의 부호화 제어기(107)는, 엔트로피 부호화 대상 CU의 예측 모드가 인터 예측이며, 또한, 그 CU 사이즈가 minInterPredUnitSize 이하인 경우에는, inter_partitioning_idc를 엔트로피 부호화하지 않도록 엔트로피 부호화기(102)를 제어한다.

엔트로피 부호화기(102)는, 부호화 제어기(107)로부터 공급되는 split_coding_unit_flag(도 22 참조), 예측 파라미터, 및 변환/양자화기(101)로부터 공급되는 변환 양자화값을 엔트로피 부호화한다. 단, 상술한 바와 같이, 본 실시형태의 엔트로피 부호화기(102)는, 엔트로피 부호화 대상 CU의 예측 모드가 인터 예측이며, 또한, 그 CU 사이즈가 minInterPredUnitSize 이하인 경우에는, inter_partitioning_idc를 엔트로피 부호화하지 않는다.

역변환/역양자화기(103)는, 소정의 양자화 스텝 폭 Qs로, 변환 양자화값을 역양자화한다. 또한, 역변환/역양자화기(103)는, 역양자화한 주파수 변환 계수를 역주파수 변환한다. 역주파수 변환된 재구축 예측 오차 화상은, 예측 신호가 더해져서, 버퍼(104)에 공급된다.

다중화기(106)는, 최소 인터 PU 사이즈에 관한 정보(min_inter_pred_unit_hierarchy_depth), 및 엔트로피 부호화기(102)의 출력 데이터를 다중화해서 출력한다. 비특허문헌 2의 4.1.2 Sequence parameter set RBSP syntax의 표기를 따르면, 다중화기(106)는, 도 3에 나타내는 리스트에 표시되는 바와 같이, 시퀀스 파라미터 세트의 log2_min_coding_unit_size_minus3 신택스와 max_coding_unit_hierarchy_depth 신택스에 후속시켜서, min_inter_pred_unit_hierarchy_depth 신택스(minInterPredUnitSize를 SCU 사이즈로 나눈 값의 "2"를 밑으로 하는 log(대수), 본 실시형태에 있어서는 0)를 다중화한다. 단, log2_min_coding_unit_size_minus3 신택스 및 max_coding_unit_hierarchy_depth 신택스는, 각각, SCU 사이즈(minCodingUnitSize) 및 LCU 사이즈(maxCodingUnitSize)를 결정하기 위한 정보이다. minCodingUnitSize와 maxCodingUnitSize는, 각각, 이하와 같이 계산된다.

minCodingUnitSize = 1 <<(log2_min_coding_unit_size_minus3 + 3)

상술한 동작에 의거하여, 본 실시형태의 영상 부호화 장치는 비트스트림을 생성한다.

다음으로, 본 실시형태의 특징인 인터 PU 파티션 타입 신택스 기입의 동작을 도 4의 플로차트를 참조해서 설명한다.

도 4에 나타내는 바와 같이, 엔트로피 부호화기(102)는, 스텝 S201에서, split_coding_unit_flag를 엔트로피 부호화한다. 또한, 스텝 S202에서, 엔트로피 부호화기(102)는, 예측 모드를 엔트로피 부호화한다. 즉, pred_mode 신택스를 엔트로피 부호화한다. 스텝 S203에서 부호화 대상 CU의 예측 모드가 인터 예측이라고 판정하고, 또한, 스텝 S204에서 CU 사이즈가 minInterPredUnitSize 이하의 사이즈라고 판정했을 경우에는, 부호화 제어기(107)는, 엔트로피 부호화기(102)에 있어서의 inter_partitioning_idc 신택스의 엔트로피 부호화를 스킵하도록 제어한다. 또, 스텝 S203에서 부호화 대상 CU의 예측 모드가 인트라 예측이라고 판정했을 경우, 또는, 스텝 S204에서 CU 사이즈가 minInterPredUnitSize보다 크다고 판정했을 경우에는, 스텝 S205에서, 부호화 제어기(107)는, 엔트로피 부호화기(102)가 당해 부호화 대상 CU의 PU 파티션 타입 정보를 엔트로피 부호화하도록 제어한다.

또, 상술한 pred_mode 신택스, 및 inter_partitioning_idc 신택스는, 비특허문헌 2의 4.1.10 Prediction unit syntax의 표기를 따르면, 도 5에 나타내는 리스트에 표시되는 바와 같이 시그널링된다. "if(currPredUnitSize > minInterPredUnitSize)"의 조건에 의해, minInterPredUnitSize보다 큰 사이즈의 CU의 PU 헤더에 있어서만, inter_partitioning_idc 신택스가 시그널링되는 것이, 본 실시형태의 특징이다.

본 실시형태의 영상 부호화 장치는, 시그널링되는 인터 PU 파티션 타입 신택스의 개수를 삭감하도록, 부호화 대상 CU의 CU 사이즈가 소정의 최소 인터 PU 사이즈 이하일 때에, 당해 부호화 대상 CU의 PU 헤더 레이어의 인터 PU 파티션 타입 신택스를 엔트로피 부호화시키지 않는다. 시그널링되는 인터 PU 파티션 타입 신택스의 개수를 삭감함으로써, 비트스트림을 차지하는 PU 헤더의 부호량의 비율이 작아지므로, 영상의 품질이 더 개선된다.

또한, 본 실시형태의 영상 부호화 장치는, 최소 인터 PU 사이즈 미만의 인터 PU가 출현하지 않도록, 부호화 대상 CU의 CU 사이즈가 소정의 최소 인터 PU 사이즈를 넘을 때에, 당해 부호화 대상 CU의 PU 헤더 레이어의 인터 PU 파티션 타입 신택스를 소정의 인터 PU 파티션 타입으로 설정해서 엔트로피 부호화시킨다. 최소 인터 PU 사이즈 미만의 인터 PU가 출현하지 않음으로써, 메모리 대역이 삭감된다.

실시형태 3.

제3 실시형태의 영상 복호 장치는, 제2 실시형태의 영상 부호화 장치가 생성한 비트스트림을 복호한다.

본 실시형태의 영상 복호 장치는, 비트스트림에 다중화된 최소 인터 PU 사이즈 정보를 다중화 해제하는 수단, 다중화 해제한 최소 인터 PU 사이즈 정보에 의거하여 인터 PU 파티션 타입을 판독하는 소정의 CU 사이즈를 결정하는 CU 사이즈 결정 수단, 및 CU 사이즈 결정 수단이 결정한 CU 사이즈로 인터 PU 파티션 타입을 비트스트림으로부터 판독하는 판독 수단을 구비하는 것을 특징으로 한다.

도 6에 나타내는 바와 같이, 본 실시형태의 영상 복호 장치는, 다중화 해제기(201), 엔트로피 복호기(202), 역변환/역양자화기(203), 예측기(204), 버퍼(205), 및 복호 제어기(206)를 구비한다.

다중화 해제기(201)는, 입력되는 비트스트림을 다중화 해제하고, 최소 인터 PU 사이즈 정보, 및 엔트로피 부호화된 영상 비트스트림을 추출한다. 다중화 해제기(201)는, 도 3에 나타내는 리스트에 나타나 있는 바와 같이, 시퀀스 파라미터에 있어서, log2_min_coding_unit_size_minus3 신택스와 max_coding_unit_hierarchy_depth 신택스에 후속하는 min_inter_pred_unit_hierarchy_depth 신택스를 다중화 해제한다. 또한, 다중화 해제기(201)는, 다중화 해제한 신택스의 값을 이용하여, 인터 PU 파티션 타입 신택스(inter_partitioning_idc 신택스)가 전송되는 최소 인터 PU 사이즈(minInterPredUnitSize)를 이하와 같이 결정한다.

minInterPredUnitSize = 1 <<(log2_min_coding_unit_size_minus3 + 3 + min_inter_pred_unit_hierarchy_depth)

즉, 본 실시형태의 다중화 해제기(201)는, 다중화 해제한 최소 인터 PU 사이즈 정보에 의거하여 인터 PU 파티션 타입 신택스를 판독하는 CU 사이즈를 결정하는 역할도 맡고 있다.

또한, 다중화 해제기(201)는, 최소 인터 PU 사이즈를 복호 제어기(206)에 공급한다.

엔트로피 복호기(202)는, 영상 비트스트림을 엔트로피 복호한다. 엔트로피 복호기(202)는, 엔트로피 복호한 변환 양자화값을 역변환/역양자화기(203)에 공급한다. 엔트로피 복호기(202)는, 엔트로피 복호한 split_coding_unit_flag 및 예측 파라미터를 복호 제어기(206)에 공급한다.

단, 본 실시형태의 복호 제어기(206)는, 복호 대상 CU의 예측 모드가 인터 예측이며, 또한, 그 CU 사이즈가 minInterPredUnitSize일 때에는, 엔트로피 복호기(202)에 당해 복호 대상 CU의 인터 PU 파티션 타입 신택스의 엔트로피 복호를 스킵시킨다. 또한, 복호 제어기(206)는 당해 복호 대상 CU의 인터 PU 파티션 타입을 2N×2N으로 설정한다. 또, 복호 대상 CU의 CU 사이즈가 minInterPredUnitSize 미만일 때, 그 CU의 예측 모드는 인트라 예측으로만 된다.

역변환/역양자화기(203)는, 소정의 양자화 스텝 폭으로, 휘도 및 색차의 변환 양자화값을 역양자화한다. 또한, 역변환/역양자화기(203)는, 역양자화한 주파수 변환 계수를 역주파수 변환한다.

역주파수 변환 후, 예측기(204)는, 복호 제어기(206)로부터 공급되는 예측 파라미터에 의거하여 버퍼(205)에 저장된 재구축 픽처의 화상을 이용하여 예측 신호를 생성한다.

역변환/역양자화기(203)에서 역주파수 변환된 재구축 예측 오차 화상은, 예측기(204)로부터 공급되는 예측 신호가 더해져서, 재구축 픽처로서 버퍼(205)에 공급된다.

그리고, 버퍼(205)에 저장된 재구축 픽처가 디코드 화상으로서 출력된다.

상술한 동작에 의거하여 본 실시형태의 영상 복호 장치는 디코드 화상을 생성한다.

다음으로, 본 실시형태의 특징인 인터 PU 파티션 타입 신택스 판독의 동작을 도 7의 플로차트를 참조해서 설명한다.

도 7에 나타내는 바와 같이, 엔트로피 복호기(202)는, 스텝 S301에서, split_coding_unit_flag를 엔트로피 복호해서 CU의 사이즈를 확정한다. 또한, 스텝 S302에서, 엔트로피 복호기(202)는, 예측 모드를 엔트로피 복호한다. 즉, 엔트로피 복호기(202)는, pred_mode 신택스를 엔트로피 복호한다. 또한, 스텝 S303에서, 예측 모드가 인터 예측이라고 판정하고, 또한, 스텝 S304에서, 확정한 CU 사이즈가 minInterPredUnitSize 이하라고 판정했을 때, 스텝 S305에서, 복호 제어기(206)는, 엔트로피 복호기(202)에 있어서의 인터 PU 파티션 타입의 엔트로피 복호를 스킵하도록 제어하고, 당해 CU의 PU 파티션 타입을 2N×2N으로 설정하도록 제어한다(inter_partitioning_idc = 0으로 한다).

또, 스텝 S303에서, 예측 모드가 인트라 예측이라고 판정했을 경우, 또는, 스텝 S304에서, 확정한 CU 사이즈가 minInterPredUnitSize보다 크다고 판정했을 경우, 복호 제어기(206)는, 스텝 S306에서, 엔트로피 복호기(202)에 있어서의 당해 복호 대상 CU의 PU 파티션 타입의 엔트로피 복호를 스킵하지 않도록 제어하고, 당해 CU의 PU 파티션 타입을 엔트로피 복호 결과의 PU 파티션 타입으로 설정한다.

또한, 제1 실시형태 및 제2 실시형태의 영상 부호화 장치는, 제1 실시형태에서 이용된 최소 인터 PU 사이즈 정보(min_inter_pred_unit_hierarchy_depth)를, 도 8에 나타내는 리스트나 도 9에 나타내는 리스트에 표시되어 있는 바와 같이, 픽처 파라미터 세트나 슬라이스 헤더에 있어서 다중화할 수 있다. 마찬가지로, 본 실시형태의 영상 복호 장치는, 픽처 파라미터 세트나 슬라이스 헤더로부터 min_inter_pred_unit_hierarchy_depth 신택스를 다중화 해제할 수 있다.

또한, 제1 실시형태 및 제2 실시형태의 영상 부호화 장치는, min_inter_pred_unit_hierarchy_depth 신택스를, LCU 사이즈(maxCodingUnitSize)를 최소 인터 PU 사이즈(minInterPredUnitSize)로 나눈 값의 "2"를 밑으로 하는 log(대수)로 해도 된다. 즉, 하기 식을 이용해도 된다.

min_inter_pred_unit_hierarchy_depth = log₂(maxCodingUnitSize/ minInterPredUnitSize)

이 경우, 본 실시형태의 영상 복호 장치는, 최소 인터 PU 사이즈를, min_inter_pred_unit_hierarchy_depth 신택스에 의거하여 이하와 같이 계산할 수 있다.

minInterPredUnitSize = 1 << (log2_min_coding_unit_size_minus3 + 3 + max_coding_unit_hierarchy_depth - min_inter_pred_unit_hierarchy_depth)

본 실시형태의 영상 복호 장치에서는, 최소 인터 PU 사이즈 미만의 인터 PU가 출현하지 않으므로, 메모리 대역이 삭감된다.

실시형태 4.

제4 실시형태의 영상 복호 장치는, 제1 실시형태의 영상 부호화 장치가 생성한 비트스트림을 복호한다.

본 실시형태의 영상 복호 장치는, 비트스트림에 다중화된 최소 인터 PU 사이즈 정보를 다중화 해제하는 수단, 및 다중화 해제한 최소 인터 PU 사이즈 정보에 의거하여 복호 대상 CU를 포함하는 비트스트림에 액세스하는 액세스 유닛에 있어서의 에러를 검출하는 에러 검출 수단을 구비하는 것을 특징으로 한다. 액세스 유닛은, 비특허문헌 1의 3.1 access unit에 있어서 정의되어 있는 바와 같이, 1픽처분의 부호화 데이터를 저장하는 단위이다. 에러는, 소정 면적당 허용하는 모션 벡터의 개수에 의거하는 제약에 대한 위반을 의미한다.

도 10에 나타내는 바와 같이, 본 실시형태의 영상 복호 장치는, 다중화 해제기(201), 엔트로피 복호기(202), 역변환/역양자화기(203), 예측기(204), 버퍼(205), 및 에러 검출기(207)를 구비한다.

다중화 해제기(201)는 제3 실시형태에 있어서의 다중화 해제기(201)와 마찬가지로 동작하고, 입력되는 비트스트림을 다중화 해제하고, 최소 인터 PU 사이즈 정보, 및 엔트로피 부호화된 영상 비트스트림을 추출한다. 또한, 최소 인터 PU 사이즈를 구해서, 최소 인터 PU 사이즈를 에러 검출기(207)에 공급한다.

엔트로피 복호기(202)는, 영상 비트스트림을 엔트로피 복호한다. 엔트로피 복호기(202)는, 엔트로피 복호한 변환 양자화값을 역변환/역양자화기(203)에 공급한다. 엔트로피 복호기(202)는, 엔트로피 복호한 split_coding_unit_flag 및 예측 파라미터를 에러 검출기(207)에 공급한다.

에러 검출기(207)는, 다중화 해제기(201)로부터 공급되는 최소 인터 PU 사이즈에 의거하여, 엔트로피 복호기(202)로부터 공급되는 예측 파라미터의 에러 검출을 행하고, 그 결과를 예측기(204)에 공급한다. 에러 검출의 동작은 후술된다. 또, 에러 검출기(207)는, 제3 실시형태에 있어서의 복호 제어기(206)의 역할도 맡는다.

역변환/역양자화기(203)는, 제3 실시형태에 있어서의 역변환/역양자화기(203)와 마찬가지로 동작한다.

예측기(204)는, 에러 검출기(207)로부터 공급되는 예측 파라미터에 의거하여, 버퍼(205)에 저장된 재구축 픽처의 화상을 이용하여 예측 신호를 생성한다.

버퍼(205)는, 제3 실시형태에 있어서의 버퍼(205)와 마찬가지로 동작한다.

상술한 동작에 의거하여, 본 실시형태의 영상 복호 장치는 디코드 화상을 생성한다.

도 11의 플로차트를 참조해서, 복호 대상 CU를 포함하는 비트스트림에 액세스하는 액세스 유닛의 에러를 검출하는, 본 실시형태의 영상 복호 장치의 에러 검출 동작을 설명한다.

스텝 S401에서, 에러 검출기(207)는, CU 사이즈, 예측 모드, PU 파티션 타입을 확정한다.

스텝 S402에서, 에러 검출기(207)는, 복호 대상 CU의 PU의 예측 모드를 판정한다. 예측 모드가 인트라 예측일 경우에는, 처리를 종료한다. 예측 모드가 인터 예측일 경우, 스텝 S403으로 진행된다.

스텝 S403에서, 에러 검출기(207)는, 복호 대상 CU의 PU 사이즈와 최소 인터 PU 사이즈를 비교한다. 당해 복호 대상 CU의 PU 사이즈가 최소 인터 PU 사이즈 이상일 경우에는, 처리를 종료한다. 당해 복호 대상 CU의 PU 사이즈가 최소 인터 PU 사이즈 미만일 경우에는, 스텝 S404로 진행된다.

스텝 S404에서, 에러 검출기(207)는, 에러가 있다고 판단하고, 에러를 외부에 통지한다. 에러 검출기(207)는, 예를 들면 에러가 발생한 당해 복호 대상 CU의 어드레스를 출력한다.

이상의 동작에 의해, 에러 검출기(207)는, 복호 대상 CU를 포함하는 비트스트림에 액세스하는 액세스 유닛의 에러를 검출한다.

또, 상기의 각 실시형태를, 하드웨어로 구성하는 것도 가능하지만, 컴퓨터 프로그램에 의해 실현하는 것도 가능하다.

도 12에 나타내는 정보 처리 시스템은, 프로세서(1001), 프로그램 메모리(1002), 영상 데이터를 저장하기 위한 기억 매체(1003) 및 비트스트림을 저장하기 위한 기억 매체(1004)를 구비한다. 기억 매체(1003)와 기억 매체(1004)는, 별개의 기억 매체여도 되고, 동일한 기억 매체로 이루어지는 기억 영역이어도 된다. 기억 매체로서, 하드디스크 등의 자기 기억 매체를 이용할 수 있다.

도 12에 나타내진 정보 처리 시스템에 있어서, 프로그램 메모리(1002)에는, 도 1, 도 6, 도 10의 각각에 나타내진 각 블럭(버퍼의 블럭을 제외)의 기능을 실현하기 위한 프로그램이 저장된다. 그리고, 프로세서(1001)는, 프로그램 메모리(1002)에 저장되어 있는 프로그램에 따라서 처리를 실행함으로써, 도 1, 도 6, 도 10의 각각에 나타내진 영상 부호화 장치 또는 영상 복호 장치의 기능을 실현한다.

도 13은, 본 발명에 따른 영상 부호화 장치의 주요부를 나타내는 블럭도이다. 도 13에 나타내는 바와 같이, 본 발명에 따른 영상 부호화 장치는, 인터 예측을 이용하여 영상 부호화를 행하는 영상 부호화 장치로서, 소정의 최소 인터 PU 사이즈(PA)와, 부호화 대상 CU의 CU 사이즈(PB)에 의거하여, 부호화 대상 CU의 인터 PU 파티션 타입을 제어하는 부호화 제어 수단(11)(일례로서, 도 1에 나타내는 부호화 제어기(107))을 구비한다.

도 14는, 본 발명에 따른 영상 복호 장치의 주요부를 나타내는 블럭도이다. 도 14에 나타내는 바와 같이, 본 발명에 따른 영상 복호 장치는, 인터 예측을 이용하여 영상 복호를 행하는 영상 복호 장치로서, 소정의 최소 인터 PU 사이즈(PA)와, 복호 대상 CU의 사이즈(PB)에 의거하여, 복호 대상 CU의 인터 PU 파티션을 제어하는 복호 제어 수단(21)(일례로서, 도 6 및 도 10에 나타내는 복호 제어기(207))을 구비한다.

이상, 실시형태 및 실시예를 참조해서 본 발명을 설명했지만, 본 발명은 상기 실시형태 및 실시예에 한정되지 않는다. 본 발명의 구성이나 상세에는, 본 발명의 범위 내에서 당업자가 이해할 수 있는 다양한 변경을 할 수 있다.

이 출원은, 2011년 1월 13일에 출원된 일본특허출원 2011-4964호를 기초로 하는 우선권을 주장하고, 그 개시의 전부를 여기에 포함한다.

11 부호화 제어 수단
21 복호 제어 수단
101 변환/양자화기
102 엔트로피 부호화기
103 역변환/역양자화기
104 버퍼
105 예측기
106 다중화기
107, 108 부호화 제어기
201 다중화 해제기
202 엔트로피 복호기
203 역변환/역양자화기
204 예측기
205 버퍼
206 복호 제어기
207 에러 검출기
1001 프로세서
1002 프로그램 메모리
1003 기억 매체
1004 기억 매체

Claims

인터 예측을 이용하여 영상 복호를 행하는 영상 복호 장치로서,
복호 대상 CU의 예측 모드가 인터 예측이고, 상기 복호 대상 CU의 사이즈가 최소 CU 사이즈와 같은 경우에, 상기 복호 대상 CU의 파티션 타입을, 상기 복호 대상 CU를 분할하여 획득되는 PU의 사이즈가 최소 사이즈인 것을 나타내는 N×N 이외의 타입으로 설정하는 복호 제어 수단을 포함하는 영상 복호 장치.
인터 예측을 이용하여 영상 복호를 행하는 영상 복호 방법으로서,
복호 대상 CU의 예측 모드가 인터 예측이고, 상기 복호 대상 CU의 사이즈가 최소 CU 사이즈와 같은 경우에, 상기 복호 대상 CU의 파티션 타입을, 상기 복호 대상 CU를 분할하여 획득되는 PU의 사이즈가 최소 사이즈인 것을 나타내는 N×N 이외의 타입으로 설정하는 영상 복호 방법.
인터 예측을 이용하여 영상 복호를 행하는 프로그램이 저장된 컴퓨터 판독 가능한 기록 매체로서, 상기 프로그램은, 컴퓨터에,
복호 대상 CU의 예측 모드가 인터 예측이고, 상기 복호 대상 CU의 사이즈가 최소 CU 사이즈와 같은 경우에, 상기 복호 대상 CU의 파티션 타입을, 상기 복호 대상 CU를 분할하여 획득되는 PU의 사이즈가 최소 사이즈인 것을 나타내는 N×N 이외의 타입으로 설정하는 처리를 실행시키는 컴퓨터 판독 가능한 기록 매체.