KR102348641B1

KR102348641B1 - 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법

Info

Publication number: KR102348641B1
Application number: KR1020217015583A
Authority: KR
Inventors: 류이치 가노; 다카히로 니시; 다다마사 도마
Original assignee: 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Priority date: 2017-04-06
Filing date: 2018-04-04
Publication date: 2022-01-07
Also published as: JP7237215B2; CN113891085A; US12108039B2; CN113891085B; US20220264090A1; JP2021073802A; KR20220003675A; JP7044913B2; CN113891077B; CN114040199A; CN114071139B; TWI833248B; JP7559194B2; KR102434891B1; CN114071139A; JP2024023737A; JP2022082602A; TW202239203A; JP2023071815A; US20230403394A1

Abstract

부호화 장치(100)는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 양자화 파라미터에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고(S161), 결정된 필터 특성을 갖는 디블로킹 필터 처리를 행한다(S162). 예를 들면, 필터 특성의 결정에서는, 양자화 파라미터가 클수록 디블로킹 필터 처리의 영향이 커지도록 필터 특성을 결정해도 된다.

Description

부호화 장치, 복호 장치, 부호화 방법 및 복호 방법{ENCODING DEVICE, DECODING DEVICE, ENCODING METHOD, AND DECODING METHOD}

본 개시는, 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법에 관한 것이다.

HEVC(High-Efficiency Video Coding)로 불리는 영상 부호화 표준 규격이, JCT-VC(Joint Collaborative Team on Video Coding)에 의해 표준화되어 있다.

[선행기술문헌]

[비특허문헌]

(비특허문헌 1)H.265(ISO/IEC 23008-2 HEVC(High Efficiency Video Coding))

이러한 부호화 및 복호 기술에서는, 한층 더한 개선이 요구되고 있다.

그래서, 본 개시는, 한층 더한 개선을 실현할 수 있는 부호화 장치, 복호 장치, 부호화 방법 또는 복호 방법을 제공하는 것을 목적으로 한다.

본 개시의 일 양태에 따른 부호화 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 양자화 파라미터에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다. 본 발명은, 처리 회로와, 상기 처리 회로에 접속된 메모리를 구비하고, 상기 처리 회로는, 상기 메모리를 이용하여, 각 값의 변화량이 각 역치를 초과하지 않는 클립 처리를 이용해, 제1 블록과 제2 블록의 경계를 가로질러 일렬로 늘어선, 상기 제1 블록 및 상기 제2 블록 내의 복수의 화소의 값을 변경함으로써, 상기 제1 블록과 상기 제2 블록의 상기 경계에 필터 처리를 행하고, 상기 복수의 화소는, 복수의 제1종 화소와, 상기 복수의 제1종 화소와는 상이한 복수의 제2종 화소를 포함하며, 상기 제1 블록 내 및 상기 제2 블록 내의 상기 복수의 제1종 화소를 위한 상기 각 역치는, 상기 제1 블록 및 상기 제2 블록의 사이즈에 의거하여, 상기 경계에 관해서 비대칭으로 선택되는, 부호화 장치를 제공한다.

본 개시의 일 양태에 따른 복호 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 양자화 파라미터에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

또한, 이들의 전반적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록 매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록 매체의 임의의 조합으로 실현되어도 된다.

본 개시는, 한층 더한 개선을 실현할 수 있는 부호화 장치, 복호 장치, 부호화 방법 또는 복호 방법을 제공할 수 있다.

도 1은, 실시 형태 1에 따른 부호화 장치의 기능 구성을 나타내는 블럭도이다.
도 2는, 실시 형태 1에 있어서의 블록 분할의 일례를 나타내는 도면이다.
도 3은, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다.
도 4a는, ALF에서 이용되는 필터의 형상의 일례를 나타내는 도면이다.
도 4b는, ALF에서 이용되는 필터의 형상의 다른 일례를 나타내는 도면이다.
도 4c는, ALF에서 이용되는 필터의 형상의 다른 일례를 나타내는 도면이다.
도 5a는, 인트라 예측에 있어서의 67개의 인트라 예측 모드를 나타내는 도면이다.
도 5b는, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 플로차트이다.
도 5c는, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 개념도이다.
도 5d는, FRUC의 일례를 나타내는 도면이다.
도 6은, 움직임 궤도를 따르는 2개의 블록간에서의 패턴 매칭(바이래터럴 매칭)을 설명하기 위한 도면이다.
도 7은, 커런트 픽처 내의 템플릿과 참조 픽처 내의 블록의 사이에서의 패턴 매칭(템플릿 매칭)을 설명하기 위한 도면이다.
도 8은, 등속 직선 운동을 가정한 모델을 설명하기 위한 도면이다.
도 9a는, 복수의 인접 블록의 움직임 벡터에 기초한 서브 블록 단위의 움직임 벡터의 도출을 설명하기 위한 도면이다.
도 9b는, 머지 모드에 의한 움직임 벡터 도출 처리의 개요를 설명하기 위한 도면이다.
도 9c는, DMVR 처리의 개요를 설명하기 위한 개념도이다.
도 9d는, LIC 처리에 의한 휘도 보정 처리를 이용한 예측 화상 생성 방법의 개요를 설명하기 위한 도면이다.
도 10은, 실시 형태 1에 따른 복호 장치의 기능 구성을 나타내는 블럭도이다.
도 11은, 실시 형태 1에 따른 디블로킹 필터 처리의 플로차트이다.
도 12는, 실시 형태 1에 따른 블록 경계에 있어서의 화소 배치예를 나타내는 도면이다.
도 13은, 실시 형태 1에 따른 디블로킹 필터 처리의 플로차트이다.
도 14는, 실시 형태 2에 따른 디블로킹 필터 처리의 플로차트이다.
도 15는, 실시 형태 2에 따른 블록 내의 화소 위치와 오차의 관계를 나타내는 도면이다.
도 16은, 실시 형태 3에 따른 디블로킹 필터 처리의 플로차트이다.
도 17은, 실시 형태 3에 따른 DCT-II의 변환 기저를 나타내는 도면이다.
도 18은, 실시 형태 3에 따른 DST-VII의 변환 기저를 나타내는 도면이다.
도 19는, 실시 형태 4에 따른 디블로킹 필터 처리의 플로차트이다.
도 20은, 실시 형태 5에 따른 디블로킹 필터 처리의 플로차트이다.
도 21은, 실시 형태 5에 따른 인트라 예측 방향과 블록 경계의 방향에 의거하는 가중치의 일례를 나타내는 도면이다.
도 22는, 실시 형태 6에 따른 디블로킹 필터 처리의 플로차트이다.
도 23은, 실시 형태 6에 따른 양자화 파라미터에 의거하는 가중치의 일례를 나타내는 도면이다.
도 24는, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템의 전체 구성도이다.
도 25는, 스케일러블 부호화 시의 부호화 구조의 일례를 나타내는 도면이다.
도 26은, 스케일러블 부호화 시의 부호화 구조의 일례를 나타내는 도면이다.
도 27은, web 페이지의 표시 화면예를 나타내는 도면이다.
도 28은, web 페이지의 표시 화면예를 나타내는 도면이다.
도 29는, 스마트폰의 일례를 나타내는 도면이다.
도 30은, 스마트폰의 구성예를 나타내는 블럭도이다.

화상 부호화 방식 중 하나인 H.265/HEVC의 디블로킹 필터 처리에서는 블록 경계를 사이에 두고 대칭인 특성을 갖는 필터가 적용되고 있다. 이에 의해, 예를 들면 블록 경계를 사이에 두고 한쪽에 위치하는 화소의 오차가 작고, 블록 경계를 사이에 두고 다른쪽에 위치하는 화소의 오차가 큰 경우와 같은, 오차 분포가 불연속인 경우에, 대칭으로 필터 처리를 실시해 버림으로써 오차의 저감 효율이 저하되어 버리는 경우가 있다. 여기서, 오차란, 원화상과 재구성 화상의 화소값의 차이다.

본 개시의 일 양태에 따른 부호화 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다.

예를 들면, 상기 필터 특성의 결정에서는, 원화상과의 오차가 클 가능성이 높은 화소일수록 당해 디블로킹 필터 처리의 영향이 커지도록 상기 비대칭인 필터 특성을 결정해도 된다.

이에 따르면, 당해 부호화 장치는, 오차가 큰 화소에 대한 필터 처리의 영향을 크게 할 수 있으므로, 당해 화소의 오차를 보다 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 장치는, 오차가 작은 화소에 대한 필터 처리의 영향을 작게 할 수 있으므로, 당해 화소의 오차가 증가하는 것을 억제할 수 있을 가능성이 있다.

예를 들면, 상기 필터 특성의 결정에서는, 기준 필터의 필터 계수를, 상기 블록 경계를 사이에 두고 비대칭으로 변경함으로써 상기 비대칭인 필터 특성을 결정해도 된다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 블록 경계를 사이에 두고 비대칭인 가중치를 결정하고, 상기 디블로킹 필터 처리에서는, 필터 계수를 이용한 필터 연산을 행하고, 상기 필터 연산의 전후의 화소값의 변화량에, 결정된 상기 비대칭인 가중치에 의해 가중을 행해도 된다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 블록 경계를 사이에 두고 비대칭인 오프셋 값을 결정하고, 상기 디블로킹 필터 처리에서는, 필터 계수를 이용한 필터 연산을 행하고, 상기 필터 연산 후의 화소값에, 결정된 상기 비대칭인 오프셋 값을 더해도 된다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 블록 경계를 사이에 두고 비대칭인 기준치를 결정하고, 상기 디블로킹 필터 처리에서는, 필터 계수를 이용한 필터 연산을 행하고, 상기 필터 연산의 전후의 화소값의 변화량이, 상기 기준치를 초과하는 경우에는, 상기 변화량을 상기 기준치로 클립해도 된다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 디블로킹 필터 처리를 행할지의 여부를 판정하는 조건을, 상기 블록 경계를 사이에 두고 비대칭으로 설정해도 된다.

본 개시의 일 양태에 따른 복호 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다.

이에 따르면, 당해 복호 장치는, 오차가 큰 화소에 대한 필터 처리의 영향을 크게 할 수 있으므로, 당해 화소의 오차를 보다 저감할 수 있을 가능성이 있다. 또한, 당해 복호 장치는, 오차가 작은 화소에 대한 필터 처리의 영향을 작게 할 수 있으므로, 당해 화소의 오차가 증가하는 것을 억제할 수 있을 가능성이 있다.

본 개시의 일 양태에 따른 부호화 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다.

본 개시의 일 양태에 따른 복호 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다.

본 개시의 일 양태에 따른 부호화 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록 경계를 사이에 둔 화소값에 의거하여, 상기 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 장치는, 블록 경계를 사이에 둔 화소값에 의거하여, 적절한 필터 특성을 결정할 수 있다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 화소값의 차에 의거하여, 상기 필터 특성을 결정해도 된다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 화소값의 차가 클수록 상기 블록 경계를 사이에 둔 상기 필터 특성의 차이를 크게 해도 된다.

이에 따르면, 당해 부호화 장치는, 예를 들면, 블록 경계와 화상 내의 오브젝트의 에지가 일치하고 있는 경우 등, 불필요한 평활화가 행해지는 것을 억제할 수 있을 가능성이 있다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 화소값의 차와, 양자화 파라미터에 의거하는 역치를 비교하여, 상기 화소값의 차가 상기 역치보다 큰 경우, 상기 화소값의 차가 상기 역치보다 작은 경우보다, 상기 블록 경계를 사이에 둔 상기 필터 특성의 차이를 크게 해도 된다.

이에 따르면, 당해 부호화 장치는, 양자화 파라미터의 오차에 대한 영향을 가미한 필터 특성을 결정할 수 있다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 화소값의 차가 클수록 상기 블록 경계를 사이에 둔 상기 필터 특성의 차이를 작게 해도 된다.

이에 따르면, 당해 복호 장치는, 예를 들면, 블록 경계가 주관적으로 눈에 띄기 쉬운 때에, 평활화가 비대칭성에 의해 약화되어 버리는 것을 억제할 수 있어, 주관 성능의 열화를 억제할 수 있을 가능성이 있다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 화소값의 분산에 의거하여, 상기 필터 특성을 결정해도 된다.

본 개시의 일 양태에 따른 복호 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 블록 경계를 사이에 둔 화소값에 의거하여, 상기 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 복호 장치는, 블록 경계를 사이에 둔 화소값의 차에 의거하여, 적절한 필터 특성을 결정할 수 있을 가능성이 있다.

이에 따르면, 당해 복호 장치는, 양자화 파라미터의 오차에 대한 영향을 가미한 필터 특성을 결정할 수 있다.

이에 따르면, 당해 복호 장치는, 예를 들면, 블록 경계와 화상 내의 오브젝트의 에지가 일치하고 있는 경우 등, 불필요한 평활화가 행해지는 것을 억제할 수 있을 가능성이 있다.

본 개시의 일 양태에 따른 부호화 방법은, 블록 경계를 사이에 둔 화소값에 의거하여, 상기 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 방법은, 블록 경계를 사이에 둔 화소값의 차에 의거하여, 적절한 필터 특성을 결정할 수 있다.

본 개시의 일 양태에 따른 복호 방법은, 블록 경계를 사이에 둔 화소값에 의거하여, 상기 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 복호 방법은, 블록 경계를 사이에 둔 화소값의 차에 의거하여, 적절한 필터 특성을 결정할 수 있다.

본 개시의 일 양태에 따른 부호화 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 인트라 예측의 예측 방향과 블록 경계의 각도에 의거하여, 상기 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 장치는, 인트라 예측의 예측 방향과 블록 경계의 각도에 의거하여, 적절한 필터 특성을 결정할 수 있다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 각도가 수직에 가까울수록 상기 블록 경계를 사이에 둔 상기 필터 특성의 차이를 크게 해도 된다.

예를 들면, 상기 필터 특성의 결정에서는, 상기 각도가 수평에 가까울수록 상기 블록 경계를 사이에 둔 상기 필터 특성의 차이를 작게 해도 된다.

본 개시의 일 양태에 따른 복호 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 인트라 예측의 예측 방향과 블록 경계의 각도에 의거하여, 상기 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 복호 장치는, 인트라 예측의 예측 방향과 블록 경계의 각도에 의거하여, 적절한 필터 특성을 결정할 수 있을 가능성이 있다.

본 개시의 일 양태에 따른 부호화 방법은, 인트라 예측의 예측 방향과 블록 경계의 각도에 의거하여, 상기 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 방법은, 인트라 예측의 예측 방향과 블록 경계의 각도에 의거하여, 적절한 필터 특성을 결정할 수 있다.

본 개시의 일 양태에 따른 복호 방법은, 인트라 예측의 예측 방향과 블록 경계의 각도에 의거하여, 상기 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 복호 방법은, 인트라 예측의 예측 방향과 블록 경계의 각도에 의거하여, 적절한 필터 특성을 결정할 수 있다.

본 개시의 일 양태에 따른 부호화 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 대상 화소의 블록 내의 위치에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 상기 대상 화소에, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 장치는, 대상 화소의 블록 내의 위치에 의거하여, 적절한 필터 특성을 결정할 수 있다.

예를 들면, 상기 필터 특성의 결정에서는, 인트라 예측의 참조 화소에 먼 화소일수록 당해 필터 처리의 영향이 커지도록 상기 필터 특성을 결정해도 된다.

예를 들면, 상기 필터 특성의 결정에서는, 우측 하부의 화소의 상기 디블로킹 필터 처리의 영향이, 좌측 상부의 화소의 상기 디블로킹 필터 처리의 영향보다 커지도록 상기 필터 특성을 결정해도 된다.

본 개시의 일 양태에 따른 복호 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 대상 화소의 블록 내의 위치에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 상기 대상 화소에, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 복호 장치는, 대상 화소의 블록 내의 위치에 의거하여, 적절한 필터 특성을 결정할 수 있다.

본 개시의 일 양태에 따른 부호화 방법은, 대상 화소의 블록 내의 위치에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 상기 대상 화소에, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 방법은, 대상 화소의 블록 내의 위치에 의거하여, 적절한 필터 특성을 결정할 수 있다.

본 개시의 일 양태에 따른 복호 방법은, 대상 화소의 블록 내의 위치에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 상기 대상 화소에, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 복호 방법은, 대상 화소의 블록 내의 위치에 의거하여, 적절한 필터 특성을 결정할 수 있다.

본 개시의 일 양태에 따른 부호화 장치는, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 양자화 파라미터에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 부호화 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 장치는, 양자화 파라미터에 의거하여, 적절한 필터 특성을 결정할 수 있다.

예를 들면, 상기 필터 특성의 결정에서는, 양자화 파라미터가 클수록 상기 디블로킹 필터 처리의 영향이 커지도록 상기 필터 특성을 결정해도 된다.

예를 들면, 상기 필터 특성의 결정에서는, 좌측 상부의 화소의 상기 양자화 파라미터의 변화에 수반하는 상기 영향의 변화가, 우측 하부의 화소의 상기 양자화 파라미터의 변화에 수반하는 상기 영향의 변화보다 커지도록 상기 필터 특성을 결정해도 된다.

이에 따르면, 당해 부호화 장치는, 오차가 큰 화소에 대한 필터 처리의 영향을 크게 할 수 있으므로, 당해 화소의 오차를 보다 저감할 수 있을 가능성이 있다.

이에 따르면, 당해 복호 장치는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 복호 장치는, 양자화 파라미터에 의거하여, 적절한 필터 특성을 결정할 수 있다.

이에 따르면, 당해 복호 장치는, 오차가 큰 화소에 대한 필터 처리의 영향을 크게 할 수 있으므로, 당해 화소의 오차를 보다 저감할 수 있을 가능성이 있다.

본 개시의 일 양태에 따른 부호화 방법은, 양자화 파라미터에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행해도 된다.

이에 따르면, 당해 부호화 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 부호화 방법은, 양자화 파라미터에 의거하여, 적절한 필터 특성을 결정할 수 있다.

본 개시의 일 양태에 따른 복호 방법은, 양자화 파라미터에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정하고, 결정된 상기 필터 특성을 갖는 디블로킹 필터 처리를 행한다.

이에 따르면, 당해 복호 방법은, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터 처리를 행함으로써, 오차를 저감할 수 있을 가능성이 있다. 또한, 당해 복호 방법은, 양자화 파라미터에 의거하여, 적절한 필터 특성을 결정할 수 있다.

또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록 매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록 매체의 임의의 조합으로 실현되어도 된다.

이하, 실시 형태에 대해서 도면을 참조하면서 구체적으로 설명한다.

또한, 이하에서 설명하는 실시 형태는, 모두 포괄적 또는 구체적인 예를 나타내는 것이다. 이하의 실시 형태에서 나타나는 수치, 형상, 재료, 구성 요소, 구성 요소의 배치 위치 및 접속 형태, 단계, 단계의 순서 등은 일례이며, 청구의 범위를 한정하는 주지는 아니다. 또한, 이하의 실시 형태에서의 구성 요소 중, 최상위 개념을 나타내는 독립 청구항에 기재되어 있지 않은 구성 요소에 대해서는, 임의의 구성 요소로서 설명된다.

(실시 형태 1)

우선, 후술하는 본 개시의 각 양태에서 설명하는 처리 및/또는 구성을 적용 가능한 부호화 장치 및 복호화 장치의 일례로서, 실시 형태 1의 개요를 설명한다. 단, 실시 형태 1은, 본 개시의 각 양태에서 설명하는 처리 및/또는 구성을 적용 가능한 부호화 장치 및 복호화 장치의 일례에 지나지 않고, 본 개시의 각 양태에서 설명하는 처리 및/또는 구성은, 실시 형태 1과는 상이한 부호화 장치 및 복호화 장치에서도 실시 가능하다.

실시 형태 1에 대하여 본 개시의 각 양태에서 설명하는 처리 및/또는 구성을 적용하는 경우, 예를 들면 이하의 어느 하나를 행해도 된다.

(1) 실시 형태 1의 부호화 장치 또는 복호화 장치에 대하여, 당해 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중, 본 개시의 각 양태에서 설명하는 구성 요소에 대응하는 구성 요소를, 본 개시의 각 양태에서 설명하는 구성 요소로 치환하는 것

(2) 실시 형태 1의 부호화 장치 또는 복호화 장치에 대하여, 당해 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소에 대해서 기능 또는 실시하는 처리의 추가, 치환, 삭제 등의 임의의 변경을 실시한 다음, 본 개시의 각 양태에서 설명하는 구성 요소에 대응하는 구성 요소를, 본 개시의 각 양태에서 설명하는 구성 요소로 치환하는 것

(3) 실시 형태 1의 부호화 장치 또는 복호화 장치가 실시하는 방법에 대하여, 처리의 추가, 및/또는 당해 방법에 포함되는 복수의 처리 중 일부의 처리에 대해서 치환, 삭제 등의 임의의 변경을 실시한 다음, 본 개시의 각 양태에서 설명하는 처리에 대응하는 처리를, 본 개시의 각 양태에서 설명하는 처리로 치환하는 것

(4) 실시 형태 1의 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소를, 본 개시의 각 양태에서 설명하는 구성 요소, 본 개시의 각 양태에서 설명하는 구성 요소가 구비하는 기능의 일부를 구비하는 구성 요소, 또는 본 개시의 각 양태에서 설명하는 구성 요소가 실시하는 처리의 일부를 실시하는 구성 요소와 조합하여 실시하는 것

(5) 실시 형태 1의 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소가 구비하는 기능의 일부를 구비하는 구성 요소, 또는 실시 형태 1의 부호화 장치 또는 복호화 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소가 실시하는 처리의 일부를 실시하는 구성 요소를, 본 개시의 각 양태에서 설명하는 구성 요소, 본 개시의 각 양태에서 설명하는 구성 요소가 구비하는 기능의 일부를 구비하는 구성 요소, 또는 본 개시의 각 양태에서 설명하는 구성 요소가 실시하는 처리의 일부를 실시하는 구성 요소와 조합하여 실시하는 것

(6) 실시 형태 1의 부호화 장치 또는 복호화 장치가 실시하는 방법에 대하여, 당해 방법에 포함되는 복수의 처리 중, 본 개시의 각 양태에서 설명하는 처리에 대응하는 처리를, 본 개시의 각 양태에서 설명하는 처리로 치환하는 것

(7) 실시 형태 1의 부호화 장치 또는 복호화 장치가 실시하는 방법에 포함되는 복수의 처리 중 일부의 처리를, 본 개시의 각 양태에서 설명하는 처리와 조합하여 실시하는 것

또한, 본 개시의 각 양태에서 설명하는 처리 및/또는 구성의 실시 방법은, 상기의 예에 한정되는 것은 아니다. 예를 들면, 실시 형태 1에서 개시하는 동화상/화상 부호화 장치 또는 동화상/화상 복호화 장치와는 상이한 목적으로 이용되는 장치에서 실시되어도 되고, 각 양태에서 설명한 처리 및/또는 구성을 단독으로 실시해도 된다. 또한, 상이한 양태에서 설명한 처리 및/또는 구성을 조합하여 실시해도 된다.

[부호화 장치의 개요]

우선, 실시 형태 1에 따른 부호화 장치의 개요를 설명한다. 도 1은, 실시 형태 1에 따른 부호화 장치(100)의 기능 구성을 나타내는 블럭도이다. 부호화 장치(100)는, 동화상/화상을 블록 단위로 부호화하는 동화상/화상 부호화 장치이다.

도 1에 나타내는 바와 같이, 부호화 장치(100)는, 화상을 블록 단위로 부호화하는 장치로서, 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 블록 메모리(118), 루프 필터부(120), 프레임 메모리(122), 인트라 예측부(124), 인터 예측부(126), 예측 제어부(128)를 구비한다.

부호화 장치(100)는, 예를 들면, 범용 프로세서 및 메모리에 의해 실현된다. 이 경우, 메모리에 저장된 소프트웨어 프로그램이 프로세서에 의해 실행되었을 때에, 프로세서는, 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)로서 기능한다. 또한, 부호화 장치(100)는, 분할부(102), 감산부(104), 변환부(106), 양자화부(108), 엔트로피 부호화부(110), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에 대응하는 전용의 1 이상의 전자 회로로서 실현되어도 된다.

이하에, 부호화 장치(100)에 포함되는 각 구성 요소에 대해서 설명한다.

[분할부]

분할부(102)는, 입력 동화상에 포함되는 각 픽처를 복수의 블록으로 분할하고, 각 블록을 감산부(104)에 출력한다. 예를 들면, 분할부(102)는, 우선, 픽처를 고정 사이즈(예를 들면 128×128)의 블록으로 분할한다. 이 고정 사이즈의 블록은, 부호화 트리 유닛(CTU)으로 불리는 경우가 있다. 그리고, 분할부(102)는, 재귀적인 4진 트리(quadtree) 및/또는 2진 트리(binary tree) 블록 분할에 기초하여, 고정 사이즈의 블록의 각각을 가변 사이즈(예를 들면 64×64 이하)의 블록으로 분할한다. 이 가변 사이즈의 블록은, 부호화 유닛(CU), 예측 유닛(PU) 혹은 변환 유닛(TU)으로 불리는 경우가 있다. 또한, 본 실시 형태에서는, CU, PU 및 TU는 구별될 필요는 없으며, 픽처 내의 일부 또는 모든 블록이 CU, PU, TU의 처리 단위가 되어도 된다.

도 2는, 실시 형태 1에 있어서의 블록 분할의 일례를 나타내는 도면이다. 도 2에 있어서, 실선은 4진 트리 블록 분할에 의한 블록 경계를 나타내고, 파선은 2진 트리 블록 분할에 의한 블록 경계를 나타낸다.

여기에서는, 블록(10)은, 128×128 화소의 정사각형 블록(128×128 블록)이다. 이 128×128 블록(10)은, 우선, 4개의 정사각형의 64×64 블록으로 분할된다(4진 트리 블록 분할).

좌측 상부의 64×64 블록은, 추가로 2개의 직사각형의 32×64 블록으로 수직으로 분할되고, 좌측의 32×64 블록은 추가로 2개의 직사각형의 16×64 블록으로 수직으로 분할된다(2진 트리 블록 분할). 그 결과, 좌측 상부의 64×64 블록은, 2개의 16×64 블록(11, 12)과, 32×64 블록(13)으로 분할된다.

우측 상부의 64×64 블록은, 2개의 직사각형의 64×32 블록(14, 15)으로 수평으로 분할된다(2진 트리 블록 분할).

좌측 하부의 64×64 블록은, 4개의 정사각형의 32×32 블록으로 분할된다(4진 트리 블록 분할). 4개의 32×32 블록 중 좌측 상부의 블록 및 우측 하부의 블록은 추가로 분할된다. 좌측 상부의 32×32 블록은, 2개의 직사각형의 16×32 블록으로 수직으로 분할되고, 우측의 16×32 블록은 추가로 2개의 16×16 블록으로 수평으로 분할된다(2진 트리 블록 분할). 우측 하부의 32×32 블록은, 2개의 32×16 블록으로 수평으로 분할된다(2진 트리 블록 분할). 그 결과, 좌측 하부의 64×64 블록은, 16×32 블록(16)과, 2개의 16×16 블록(17, 18)과, 2개의 32×32 블록(19, 20)과, 2개의 32×16 블록(21, 22)으로 분할된다.

우측 하부의 64×64 블록(23)은 분할되지 않는다.

이상과 같이, 도 2에서는, 블록(10)은, 재귀적인 4진 트리 및 2진 트리 블록 분할에 기초하여, 13개의 가변 사이즈의 블록(11~23)으로 분할된다. 이러한 분할은, QTBT(quad-tree plus binary tree) 분할로 불리는 경우가 있다.

또한, 도 2에서는, 하나의 블록이 4개 또는 2개의 블록으로 분할되었지만(4진 트리 또는 2진 트리 블록 분할), 분할은 이에 한정되지 않는다. 예를 들면, 하나의 블록이 3개의 블록으로 분할되어도 된다(3진 트리 블록 분할). 이러한 3진 트리 블록 분할을 포함하는 분할은, MBT(multi type tree) 분할로 불리는 경우가 있다.

[감산부]

감산부(104)는, 분할부(102)에 의해 분할된 블록 단위로 원 신호(원 샘플)로부터 예측 신호(예측 샘플)를 감산한다. 즉, 감산부(104)는, 부호화 대상 블록(이하, 커런트 블록이라고 한다)의 예측 오차(잔차라고도 한다)를 산출한다. 그리고, 감산부(104)는, 산출된 예측 오차를 변환부(106)에 출력한다.

원 신호는, 부호화 장치(100)의 입력 신호이며, 동화상을 구성하는 각 픽처의 화상을 나타내는 신호(예를 들면 휘도(luma) 신호 및 2개의 색차(chroma) 신호)이다. 이하에서, 화상을 나타내는 신호를 샘플이라고도 하는 경우도 있다.

[변환부]

변환부(106)는, 공간 영역의 예측 오차를 주파수 영역의 변환 계수로 변환하고, 변환 계수를 양자화부(108)에 출력한다. 구체적으로는, 변환부(106)는, 예를 들면 공간 영역의 예측 오차에 대하여 미리 정해진 이산 코사인 변환(DCT) 또는 이산 사인 변환(DST)을 행한다.

또한, 변환부(106)는, 복수의 변환 타입 중에서 적응적으로 변환 타입을 선택하고, 선택된 변환 타입에 대응하는 변환 기저 함수(transform basis function)를 이용하여, 예측 오차를 변환 계수로 변환해도 된다. 이러한 변환은, EMT(explicit multiple core transform) 또는 AMT(adaptive multiple transform)로 불리는 경우가 있다.

복수의 변환 타입은, 예를 들면, DCT-II, DCT-V, DCT-VIII, DST-I 및 DST-VII을 포함한다. 도 3은, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다. 도 3에서 N은 입력 화소의 수를 나타낸다. 이들 복수의 변환 타입 중에서의 변환 타입의 선택은, 예를 들면, 예측의 종류(인트라 예측 및 인터 예측)에 의존해도 되고, 인트라 예측 모드에 의존해도 된다.

이러한 EMT 또는 AMT를 적용할지 여부를 나타내는 정보(예를 들면 AMT 플래그로 불린다) 및 선택된 변환 타입을 나타내는 정보는, CU 레벨에서 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.

또한, 변환부(106)는, 변환 계수(변환 결과)를 재변환해도 된다. 이러한 재변환은, AST(adaptive secondary transform) 또는 NSST(non-separable secondary transform)로 불리는 경우가 있다. 예를 들면, 변환부(106)는, 인트라 예측 오차에 대응하는 변환 계수의 블록에 포함되는 서브 블록(예를 들면 4×4 서브 블록)마다 재변환을 행한다. NSST를 적용할지 여부를 나타내는 정보 및 NSST에 이용되는 변환 행렬에 관한 정보는, CU 레벨에서 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.

여기서, Separable한 변환이란, 입력의 차원의 수만큼 방향마다 분리하여 복수회 변환을 행하는 방식이며, Non-Separable한 변환이란, 입력이 다차원이었을 때에 2개 이상의 차원을 통합해 1차원으로 간주하여, 통합하여 변환을 행하는 방식이다.

예를 들면, Non-Separable한 변환의 일례로서, 입력이 4×4의 블록이었을 경우에는 그것을 16개의 요소를 가진 하나의 배열로 간주하고, 그 배열에 대하여 16×16의 변환 행렬로 변환 처리를 행하는 것을 들 수 있다.

또한, 마찬가지로 4×4의 입력 블록을 16개의 요소를 가진 하나의 배열로 간주한 후에, 그 배열에 대하여 Givens 회전을 복수회 행하는 것(Hypercube Givens Transform)도 Non-Separable한 변환의 예이다.

[양자화부]

양자화부(108)는, 변환부(106)로부터 출력된 변환 계수를 양자화한다. 구체적으로는, 양자화부(108)는, 커런트 블록의 변환 계수를 소정의 주사 순서로 주사하고, 주사된 변환 계수에 대응하는 양자화 파라미터(QP)에 기초하여 당해 변환 계수를 양자화한다. 그리고, 양자화부(108)는, 커런트 블록의 양자화된 변환 계수(이하, 양자화 계수라고 한다)를 엔트로피 부호화부(110) 및 역양자화부(112)에 출력한다.

소정의 순서는, 변환 계수의 양자화/역양자화를 위한 순서이다. 예를 들면, 소정의 주사 순서는, 주파수의 오름차순(저주파에서 고주파의 순) 또는 내림차순(고주파에서 저주파의 순)으로 정의된다.

양자화 파라미터란, 양자화 단계(양자화 폭)를 정의하는 파라미터이다. 예를 들면, 양자화 파라미터의 값이 증가하면 양자화 단계도 증가한다. 즉, 양자화 파라미터의 값이 증가하면 양자화 오차가 증대된다.

[엔트로피 부호화부]

엔트로피 부호화부(110)는, 양자화부(108)로부터의 입력인 양자화 계수를 가변 길이 부호화함으로써 부호화 신호(부호화 비트 스트림)를 생성한다. 구체적으로는, 엔트로피 부호화부(110)는, 예를 들면, 양자화 계수를 2치화하고, 2치 신호를 산술 부호화한다.

[역양자화부]

역양자화부(112)는, 양자화부(108)로부터의 입력인 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(112)는, 커런트 블록의 양자화 계수를 소정의 주사 순서로 역양자화한다. 그리고, 역양자화부(112)는, 커런트 블록의 역양자화된 변환 계수를 역변환부(114)에 출력한다.

[역변환부]

역변환부(114)는, 역양자화부(112)로부터의 입력인 변환 계수를 역변환함으로써 예측 오차를 복원한다. 구체적으로는, 역변환부(114)는, 변환 계수에 대하여, 변환부(106)에 의한 변환에 대응하는 역변환을 행함으로써, 커런트 블록의 예측 오차를 복원한다. 그리고, 역변환부(114)는, 복원된 예측 오차를 가산부(116)에 출력한다.

또한, 복원된 예측 오차는, 양자화에 의해 정보가 손실되어 있으므로, 감산부(104)가 산출한 예측 오차와 일치하지 않는다. 즉, 복원된 예측 오차에는, 양자화 오차가 포함되어 있다.

[가산부]

가산부(116)는, 역변환부(114)로부터의 입력인 예측 오차와 예측 제어부(128)로부터의 입력인 예측 샘플을 가산함으로써 커런트 블록을 재구성한다. 그리고, 가산부(116)는, 재구성된 블록을 블록 메모리(118) 및 루프 필터부(120)에 출력한다. 재구성 블록은, 로컬 복호 블록으로 불리는 경우도 있다.

[블록 메모리]

블록 메모리(118)는, 인트라 예측에서 참조되는 블록으로서 부호화 대상 픽처(이하, 커런트 픽처라고 한다) 내의 블록을 저장하기 위한 기억부이다. 구체적으로는, 블록 메모리(118)는, 가산부(116)로부터 출력된 재구성 블록을 저장한다.

[루프 필터부]

루프 필터부(120)는, 가산부(116)에 의해 재구성된 블록에 루프 필터링을 실시하고, 필터링된 재구성 블록을 프레임 메모리(122)에 출력한다. 루프 필터란, 부호화 루프 내에서 이용되는 필터(인루프 필터)이며, 예를 들면, 디블로킹·필터(DF), 샘플 어댑티브 오프셋(SAO) 및 어댑티브 루프 필터(ALF) 등을 포함한다.

ALF에서는, 부호화 왜곡을 제거하기 위한 최소 제곱 오차 필터가 적용되며, 예를 들면 커런트 블록 내의 2×2 서브 블록마다, 국소적인 구배(gradient)의 방향 및 활성도(activity)에 기초하여 복수의 필터 중에서 선택된 하나의 필터가 적용된다.

구체적으로는, 우선, 서브 블록(예를 들면 2×2 서브 블록)이 복수의 클래스(예를 들면 15 또는 25 클래스)로 분류된다. 서브 블록의 분류는, 구배의 방향 및 활성도에 기초하여 행해진다. 예를 들면, 구배의 방향치(D)(예를 들면 0~2 또는 0~4)와 구배의 활성치(A)(예를 들면 0~4)를 이용하여 분류치(C)(예를 들면 C=5D＋A)가 산출된다. 그리고, 분류치(C)에 기초하여, 서브 블록이 복수의 클래스(예를 들면 15 또는 25 클래스)로 분류된다.

구배의 방향치(D)는, 예를 들면, 복수의 방향(예를 들면 수평, 수직 및 2개의 대각 방향)의 구배를 비교함으로써 도출된다. 또한, 구배의 활성치(A)는, 예를 들면, 복수의 방향의 구배를 가산하고, 가산 결과를 양자화함으로써 도출된다.

이러한 분류의 결과에 기초하여, 복수의 필터 중에서 서브 블록을 위한 필터가 결정된다.

ALF에서 이용되는 필터의 형상으로서는 예를 들면 원대칭 형상이 이용된다. 도 4a~도 4c는, ALF에서 이용되는 필터의 형상의 복수의 예를 나타내는 도면이다. 도 4a는, 5×5 다이아몬드 형상 필터를 나타내고, 도 4b는, 7×7 다이아몬드 형상 필터를 나타내고, 도 4c는, 9×9 다이아몬드 형상 필터를 나타낸다. 필터의 형상을 나타내는 정보는 픽처 레벨에서 신호화된다. 또한, 필터의 형상을 나타내는 정보의 신호화는, 픽처 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 CU 레벨)이어도 된다.

ALF의 온/오프는, 예를 들면, 픽처 레벨 또는 CU 레벨에서 결정된다. 예를 들면, 휘도에 대해서는 CU 레벨에서 ALF를 적용할지의 여부가 결정되고, 색차에 대해서는 픽처 레벨에서 ALF를 적용할지의 여부가 결정된다. ALF의 온/오프를 나타내는 정보는, 픽처 레벨 또는 CU 레벨에서 신호화된다. 또한, ALF의 온/오프를 나타내는 정보의 신호화는, 픽처 레벨 또는 CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.

선택 가능한 복수의 필터(예를 들면 15 또는 25까지의 필터)의 계수 세트는, 픽처 레벨에서 신호화된다. 또한, 계수 세트의 신호화는, 픽처 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨, CU 레벨 또는 서브 블록 레벨)이어도 된다.

[프레임 메모리]

프레임 메모리(122)는, 인터 예측에 이용되는 참조 픽처를 저장하기 위한 기억부이며, 프레임 버퍼로 불리는 경우도 있다. 구체적으로는, 프레임 메모리(122)는, 루프 필터부(120)에 의해 필터링된 재구성 블록을 저장한다.

[인트라 예측부]

인트라 예측부(124)는, 블록 메모리(118)에 저장된 커런트 픽처 내의 블록을 참조하여 커런트 블록의 인트라 예측(화면내 예측이라고도 한다)을 행함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(124)는, 커런트 블록에 인접하는 블록의 샘플(예를 들면 휘도값, 색차값)을 참조하여 인트라 예측을 행함으로써 인트라 예측 신호를 생성하고, 인트라 예측 신호를 예측 제어부(128)에 출력한다.

예를 들면, 인트라 예측부(124)는, 미리 규정된 복수의 인트라 예측 모드 중 하나를 이용하여 인트라 예측을 행한다. 복수의 인트라 예측 모드는, 1 이상의 비방향성 예측 모드와, 복수의 방향성 예측 모드를 포함한다.

1 이상의 비방향성 예측 모드는, 예를 들면 H.265/HEVC(High-Efficiency Video Coding) 규격(비특허문헌 1)에서 규정된 Planar 예측 모드 및 DC 예측 모드를 포함한다.

복수의 방향성 예측 모드는, 예를 들면 H.265/HEVC 규격에서 규정된 33방향의 예측 모드를 포함한다. 또한, 복수의 방향성 예측 모드는, 33방향에 더하여 추가로 32방향의 예측 모드(총 65개의 방향성 예측 모드)를 포함해도 된다. 도 5a는, 인트라 예측에서의 67개의 인트라 예측 모드(2개의 비방향성 예측 모드 및 65개의 방향성 예측 모드)를 나타내는 도면이다. 실선 화살표는, H.265/HEVC 규격에서 규정된 33방향을 나타내고, 파선 화살표는, 추가된 32방향을 나타낸다.

또한, 색차 블록의 인트라 예측에 있어서, 휘도 블록이 참조되어도 된다. 즉, 커런트 블록의 휘도 성분에 기초하여, 커런트 블록의 색차 성분이 예측되어도 된다. 이러한 인트라 예측은, CCLM(cross-component linear model) 예측으로 불리는 경우가 있다. 이러한 휘도 블록을 참조하는 색차 블록의 인트라 예측 모드(예를 들면 CCLM 모드로 불린다)는, 색차 블록의 인트라 예측 모드 중 하나로서 추가되어도 된다.

인트라 예측부(124)는, 수평/수직 방향의 참조 화소의 구배에 기초하여 인트라 예측 후의 화소값을 보정해도 된다. 이러한 보정을 수반하는 인트라 예측은, PDPC(position dependent intra prediction combination)로 불리는 경우가 있다. PDPC의 적용 유무를 나타내는 정보(예를 들면 PDPC 플래그로 불린다)는, 예를 들면 CU 레벨에서 신호화된다. 또한, 이 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨 또는 CTU 레벨)이어도 된다.

[인터 예측부]

인터 예측부(126)는, 프레임 메모리(122)에 저장된 참조 픽처로서 커런트 픽처와는 다른 참조 픽처를 참조하여 커런트 블록의 인터 예측(화면간 예측이라고도 한다)을 행함으로써, 예측 신호(인터 예측 신호)를 생성한다. 인터 예측은, 커런트 블록 또는 커런트 블록 내의 서브 블록(예를 들면 4×4 블록)의 단위로 행해진다. 예를 들면, 인터 예측부(126)는, 커런트 블록 또는 서브 블록에 대해서 참조 픽처 내에서 움직임 탐색(motion estimation)을 행한다. 그리고, 인터 예측부(126)는, 움직임 탐색에 의해 얻어진 움직임 정보(예를 들면 움직임 벡터)를 이용하여 움직임 보상을 행함으로써 커런트 블록 또는 서브 블록의 인터 예측 신호를 생성한다. 그리고, 인터 예측부(126)는, 생성된 인터 예측 신호를 예측 제어부(128)에 출력한다.

움직임 보상에 이용된 움직임 정보는 신호화된다. 움직임 벡터의 신호화에는, 예측 움직임 벡터(motion vector predictor)가 이용되어도 된다. 즉, 움직임 벡터와 예측 움직임 벡터의 사이의 차분이 신호화되어도 된다.

또한, 움직임 탐색에 의해 얻어진 커런트 블록의 움직임 정보뿐만 아니라, 인접 블록의 움직임 정보도 이용하여, 인터 예측 신호가 생성되어도 된다. 구체적으로는, 움직임 탐색에 의해 얻어진 움직임 정보에 기초한 예측 신호와, 인접 블록의 움직임 정보에 기초한 예측 신호를 가중 가산함으로써, 커런트 블록 내의 서브 블록 단위로 인터 예측 신호가 생성되어도 된다. 이러한 인터 예측(움직임 보상)은, OBMC(overlapped block motion compensation)로 불리는 경우가 있다.

이러한 OBMC 모드에서는, OBMC를 위한 서브 블록의 사이즈를 나타내는 정보(예를 들면 OBMC 블록 사이즈로 불린다)는, 시퀀스 레벨에서 신호화된다. 또한, OBMC 모드를 적용할지 여부를 나타내는 정보(예를 들면 OBMC 플래그로 불린다)는, CU 레벨에서 신호화된다. 또한, 이들 정보의 신호화의 레벨은, 시퀀스 레벨 및 CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.

OBMC 모드에 대해서 보다 구체적으로 설명한다. 도 5b 및 도 5c는, OBMC 처리에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 플로차트 및 개념도이다.

우선, 부호화 대상 블록에 할당된 움직임 벡터(MV)를 이용하여 통상의 움직임 보상에 의한 예측 화상(Pred)을 취득한다.

다음에, 부호화가 끝난 좌측 인접 블록의 움직임 벡터(MV_L)를 부호화 대상 블록에 적용하여 예측 화상(Pred_L)을 취득하고, 상기 예측 화상과 Pred_L을 가중치를 부여하여 중첩함으로써 예측 화상의 1회째의 보정을 행한다.

마찬가지로, 부호화가 끝난 상측 인접 블록의 움직임 벡터(MV_U)를 부호화 대상 블록에 적용하여 예측 화상(Pred_U)을 취득하고, 상기 1회째의 보정을 행한 예측 화상과 Pred_U를 가중치를 부여하여 중첩함으로써 예측 화상의 2회째의 보정을 행하고, 그것을 최종적인 예측 화상으로 한다.

또한, 여기에서는 좌측 인접 블록과 상측 인접 블록을 이용한 2단계의 보정 방법을 설명했으나, 우측 인접 블록이나 하측 인접 블록을 이용하여 2단계보다 많은 횟수의 보정을 행하는 구성으로 하는 것도 가능하다.

또한, 중첩을 행하는 영역은 블록 전체의 화소 영역이 아니라, 블록 경계 근방의 일부의 영역만이어도 된다.

또한, 여기에서는 1매의 참조 픽처로부터의 예측 화상 보정 처리에 대해서 설명했으나, 복수매의 참조 픽처로부터 예측 화상을 보정하는 경우도 마찬가지이며, 각각의 참조 픽처로부터 보정한 예측 화상을 취득한 후에, 얻어진 예측 화상을 추가로 중첩함으로써 최종적인 예측 화상으로 한다.

또한, 상기 처리 대상 블록은, 예측 블록 단위여도 되고, 예측 블록을 더 분할한 서브 블록 단위여도 된다.

OBMC 처리를 적용할지 여부의 판정 방법으로서, 예를 들면, OBMC 처리를 적용할지 여부를 나타내는 신호인 obmc_flag를 이용하는 방법이 있다. 구체적인 일례로서는, 부호화 장치에 있어서, 부호화 대상 블록이 움직임이 복잡한 영역에 속해 있는지 여부를 판정하여, 움직임이 복잡한 영역에 속해 있는 경우는 obmc_flag로서 값 1을 설정하여 OBMC 처리를 적용하여 부호화를 행하고, 움직임이 복잡한 영역에 속해 있지 않은 경우는 obmc_flag로서 값 0을 설정하여 OBMC 처리를 적용하지 않고 부호화를 행한다. 한편, 복호화 장치에서는, 스트림에 기술된 obmc_flag를 복호화함으로써, 그 값에 따라 OBMC 처리를 적용할지의 여부를 전환하여 복호화를 행한다.

또한, 움직임 정보는 신호화되지 않고, 복호 장치측에서 도출되어도 된다. 예를 들면, H.265/HEVC 규격에서 규정된 머지 모드가 이용되어도 된다. 또한 예를 들면, 복호 장치측에서 움직임 탐색을 행함으로써 움직임 정보가 도출되어도 된다. 이 경우, 커런트 블록의 화소값을 이용하지 않고 움직임 탐색이 행해진다.

여기서, 복호 장치측에서 움직임 탐색을 행하는 모드에 대해서 설명한다. 이 복호 장치측에서 움직임 탐색을 행하는 모드는, PMMVD(pattern matched motion vector derivation) 모드 또는 FRUC(frame rate up-conversion) 모드로 불리는 경우가 있다.

FRUC 처리의 일례를 도 5d에 나타낸다. 우선, 커런트 블록에 공간적 또는 시간적으로 인접하는 부호화 완료 블록의 움직임 벡터를 참조하여, 각각이 예측 움직임 벡터를 갖는 복수의 후보 리스트(머지 리스트와 공통이어도 된다)가 생성된다. 다음에, 후보 리스트에 등록되어 있는 복수의 후보 MV 중에서 베스트 후보 MV를 선택한다. 예를 들면, 후보 리스트에 포함되는 각 후보의 평가치가 산출되고, 평가치에 기초하여 하나의 후보가 선택된다.

그리고, 선택된 후보의 움직임 벡터에 기초하여, 커런트 블록을 위한 움직임 벡터가 도출된다. 구체적으로는, 예를 들면, 선택된 후보의 움직임 벡터(베스트 후보 MV)가 그대로 커런트 블록을 위한 움직임 벡터로서 도출된다. 또한 예를 들면, 선택된 후보의 움직임 벡터에 대응하는 참조 픽처 내의 위치의 주변 영역에 있어서, 패턴 매칭을 행함으로써, 커런트 블록을 위한 움직임 벡터가 도출되어도 된다. 즉, 베스트 후보 MV의 주변의 영역에 대하여 동일한 방법으로 탐색을 행하고, 더욱 평가치가 좋은 값이 되는 MV가 있는 경우는, 베스트 후보 MV를 상기 MV로 갱신하여, 그것을 커런트 블록의 최종적인 MV로 해도 된다. 또한, 당해 처리를 실시하지 않는 구성으로 하는 것도 가능하다.

서브 블록 단위로 처리를 행하는 경우도 완전히 동일한 처리로 해도 된다.

또한, 평가치는, 움직임 벡터에 대응하는 참조 픽처 내의 영역과, 소정의 영역의 사이의 패턴 매칭에 의해 재구성 화상의 차분치를 구함으로써 산출된다. 또한, 차분치에 더하여 그 이외의 정보를 이용하여 평가치를 산출해도 된다.

패턴 매칭으로서는, 제1 패턴 매칭 또는 제2 패턴 매칭이 이용된다. 제1 패턴 매칭 및 제2 패턴 매칭은, 각각 바이래터럴 매칭(bilateral matching) 및 템플릿 매칭(template matching)으로 불리는 경우가 있다.

제1 패턴 매칭에서는, 상이한 2개의 참조 픽처 내의 2개의 블록으로서 커런트 블록의 움직임 궤도(motion trajectory)를 따르는 2개의 블록의 사이에서 패턴 매칭이 행해진다. 따라서, 제1 패턴 매칭에서는, 상술한 후보의 평가치의 산출을 위한 소정의 영역으로서, 커런트 블록의 움직임 궤도를 따르는 다른 참조 픽처 내의 영역이 이용된다.

도 6은, 움직임 궤도를 따르는 2개의 블록간에서의 패턴 매칭(바이래터럴 매칭)의 일례를 설명하기 위한 도면이다. 도 6에 나타내는 바와 같이, 제1 패턴 매칭에서는, 커런트 블록(Cur block)의 움직임 궤도를 따르는 2개의 블록으로서 상이한 2개의 참조 픽처(Ref0, Ref1) 내의 2개의 블록의 페어 중에서 가장 매칭되는 페어를 탐색함으로써 2개의 움직임 벡터(MV0, MV1)가 도출된다. 구체적으로는, 커런트 블록에 대하여, 후보 MV로 지정된 제1 부호화 완료 참조 픽처(Ref0) 내의 지정 위치에 있어서의 재구성 화상과, 상기 후보 MV를 표시 시간 간격으로 스케일링한 대칭 MV로 지정된 제2 부호화 완료 참조 픽처(Ref1) 내의 지정 위치에 있어서의 재구성 화상의 차분을 도출하고, 얻어진 차분치를 이용하여 평가치를 산출한다. 복수의 후보 MV 중에서 가장 평가치가 좋은 값이 되는 후보 MV를 최종 MV로서 선택하면 된다.

연속적인 움직임 궤도의 가정하에서는, 2개의 참조 블록을 지시하는 움직임 벡터(MV0, MV1)는, 커런트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1)의 사이의 시간적인 거리(TD0, TD1)에 대하여 비례한다. 예를 들면, 커런트 픽처가 시간적으로 2개의 참조 픽처의 사이에 위치하고, 커런트 픽처로부터 2개의 참조 픽처에의 시간적인 거리가 동일한 경우, 제1 패턴 매칭에서는, 경영(鏡映) 대칭인 쌍방향의 움직임 벡터가 도출된다.

제2 패턴 매칭에서는, 커런트 픽처 내의 템플릿(커런트 픽처 내에서 커런트 블록에 인접하는 블록(예를 들면 상측 및/또는 좌측 인접 블록))과 참조 픽처 내의 블록의 사이에서 패턴 매칭이 행해진다. 따라서, 제2 패턴 매칭에서는, 상술한 후보의 평가치의 산출을 위한 소정의 영역으로서, 커런트 픽처 내의 커런트 블록에 인접하는 블록이 이용된다.

도 7은, 커런트 픽처 내의 템플릿과 참조 픽처 내의 블록의 사이에서의 패턴 매칭(템플릿 매칭)의 일례를 설명하기 위한 도면이다. 도 7에 나타내는 바와 같이, 제2 패턴 매칭에서는, 커런트 픽처(Cur Pic) 내에서 커런트 블록(Cur block)에 인접하는 블록과 가장 매칭되는 블록을 참조 픽처(Ref0) 내에서 탐색함으로써 커런트 블록의 움직임 벡터가 도출된다. 구체적으로는, 커런트 블록에 대하여, 좌측 인접 및 상측 인접의 양쪽 혹은 어느 한쪽의 부호화 완료 영역의 재구성 화상과, 후보 MV로 지정된 부호화 완료 참조 픽처(Ref0) 내의 동등 위치에 있어서의 재구성 화상의 차분을 도출하고, 얻어진 차분치를 이용하여 평가치를 산출하여, 복수의 후보 MV 중에서 가장 평가치가 좋은 값이 되는 후보 MV를 베스트 후보 MV로서 선택하면 된다.

이러한 FRUC 모드를 적용할지 여부를 나타내는 정보(예를 들면 FRUC 플래그로 불린다)는, CU 레벨에서 신호화된다. 또한, FRUC 모드가 적용되는 경우(예를 들면 FRUC 플래그가 참인 경우), 패턴 매칭의 방법(제1 패턴 매칭 또는 제2 패턴 매칭)을 나타내는 정보(예를 들면 FRUC 모드 플래그로 불린다)가 CU 레벨에서 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.

여기서, 등속 직선 운동을 가정한 모델에 기초하여 움직임 벡터를 도출하는 모드에 대해서 설명한다. 이 모드는, BIO(bi-directional optical flow) 모드로 불리는 경우가 있다.

도 8은, 등속 직선 운동을 가정한 모델을 설명하기 위한 도면이다. 도 8에서, (v_x, v_y)는, 속도 벡터를 나타내고, τ₀, τ₁은, 각각 커런트 픽처(Cur Pic)와 2개의 참조 픽처(Ref₀, Ref₁)의 사이의 시간적인 거리를 나타낸다. (MVx₀, MVy₀)은, 참조 픽처 Ref₀에 대응하는 움직임 벡터를 나타내고, (MVx₁, MVy₁)은, 참조 픽처 Ref₁에 대응하는 움직임 벡터를 나타낸다.

이때 속도 벡터(v_x, v_y)의 등속 직선 운동의 가정하에서는, (MVx₀, MVy₀) 및 (MVx₁, MVy₁)은, 각각 (v_xτ₀, v_yτ₀) 및 (-v_xτ₁, -v_yτ₁)로 표시되고, 이하의 옵티컬 플로우 등식 (1)이 성립된다.

여기서, I^(k)는, 움직임 보상 후의 참조 화상 k(k=0, 1)의 휘도값을 나타낸다. 이 옵티컬 플로우 등식은, (i) 휘도값의 시간 미분과, (ii) 수평 방향의 속도 및 참조 화상의 공간 구배의 수평 성분의 곱과, (iii) 수직 방향의 속도 및 참조 화상의 공간 구배의 수직 성분의 곱의 합이, 제로와 동일한 것을 나타낸다. 이 옵티컬 플로우 등식과 에르미트 보간(Hermite interpolation)의 조합에 기초하여, 머지 리스트 등으로부터 얻어지는 블록 단위의 움직임 벡터가 화소 단위로 보정된다.

또한, 등속 직선 운동을 가정한 모델에 기초한 움직임 벡터의 도출과는 상이한 방법으로, 복호 장치측에서 움직임 벡터가 도출되어도 된다. 예를 들면, 복수의 인접 블록의 움직임 벡터에 기초하여 서브 블록 단위로 움직임 벡터가 도출되어도 된다.

여기서, 복수의 인접 블록의 움직임 벡터에 기초하여 서브 블록 단위로 움직임 벡터를 도출하는 모드에 대해서 설명한다. 이 모드는, 아핀 움직임 보상 예측(affine motion compensation prediction) 모드로 불리는 경우가 있다.

도 9a는, 복수의 인접 블록의 움직임 벡터에 기초한 서브 블록 단위의 움직임 벡터의 도출을 설명하기 위한 도면이다. 도 9a에서, 커런트 블록은, 16의 4×4 서브 블록을 포함한다. 여기에서는, 인접 블록의 움직임 벡터에 기초하여 커런트 블록의 좌상각(左上角) 제어 포인트의 움직임 벡터 v₀이 도출되고, 인접 서브 블록의 움직임 벡터에 기초하여 커런트 블록의 우상각(右上角) 제어 포인트의 움직임 벡터 v₁이 도출된다. 그리고, 2개의 움직임 벡터 v₀ 및 v₁을 이용하여, 이하의 식 (2)에 의해, 커런트 블록 내의 각 서브 블록의 움직임 벡터(v_x, v_y)가 도출된다.

여기서, x 및 y는, 각각 서브 블록의 수평 위치 및 수직 위치를 나타내고, w는, 미리 정해진 가중 계수를 나타낸다.

이러한 아핀 움직임 보상 예측 모드에서는, 좌상 및 우상각 제어 포인트의 움직임 벡터의 도출 방법이 상이한 몇 개의 모드를 포함해도 된다. 이러한 아핀 움직임 보상 예측 모드를 나타내는 정보(예를 들면 아핀 플래그로 불린다)는, CU 레벨에서 신호화된다. 또한, 이 아핀 움직임 보상 예측 모드를 나타내는 정보의 신호화는, CU 레벨에 한정될 필요는 없으며, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 타일 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.

[예측 제어부]

예측 제어부(128)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 하나를 선택하고, 선택한 신호를 예측 신호로서 감산부(104) 및 가산부(116)에 출력한다.

여기서, 머지 모드에 의해 부호화 대상 픽처의 움직임 벡터를 도출하는 예를 설명한다. 도 9b는, 머지 모드에 의한 움직임 벡터 도출 처리의 개요를 설명하기 위한 도면이다.

우선, 예측 MV의 후보를 등록한 예측 MV 리스트를 생성한다. 예측 MV의 후보로서는, 부호화 대상 블록의 공간적으로 주변에 위치하는 복수의 부호화 완료 블록이 갖는 MV인 공간 인접 예측 MV, 부호화 완료 참조 픽처에 있어서의 부호화 대상 블록의 위치를 투영한 부근의 블록이 갖는 MV인 시간 인접 예측 MV, 공간 인접 예측 MV와 시간 인접 예측 MV의 MV 값을 조합하여 생성한 MV인 결합 예측 MV, 및 값이 제로인 MV인 제로 예측 MV 등이 있다.

다음에, 예측 MV 리스트에 등록되어 있는 복수의 예측 MV 중에서 하나의 예측 MV를 선택함으로써, 부호화 대상 블록의 MV로서 결정한다.

또한 가변 길이 부호화부에서는, 어느 예측 MV를 선택했는지를 나타내는 신호인 merge_idx를 스트림에 기술하여 부호화한다.

또한, 도 9b에서 설명한 예측 MV 리스트에 등록하는 예측 MV는 일례이며, 도면 중의 개수와는 다른 개수이거나, 도면 중의 예측 MV의 일부의 종류를 포함하지 않는 구성이거나, 도면 중의 예측 MV의 종류 이외의 예측 MV를 추가한 구성이어도 된다.

또한, 머지 모드에 의해 도출한 부호화 대상 블록의 MV를 이용하여, 후술하는 DMVR 처리를 행함으로써 최종적인 MV를 결정해도 된다.

여기서, DMVR 처리를 이용하여 MV를 결정하는 예에 대해서 설명한다.

도 9c는, DMVR 처리의 개요를 설명하기 위한 개념도이다.

우선, 처리 대상 블록에 설정된 최적 MVP를 후보 MV로 하여, 상기 후보 MV에 따라, L0 방향의 처리 완료 픽처인 제1 참조 픽처, 및 L1 방향의 처리 완료 픽처인 제2 참조 픽처로부터 참조 화소를 각각 취득하고, 각 참조 화소의 평균을 취함으로써 템플릿을 생성한다.

다음에, 상기 템플릿을 이용하여, 제1 참조 픽처 및 제2 참조 픽처의 후보 MV의 주변 영역을 각각 탐색하여, 가장 비용이 최소가 되는 MV를 최종적인 MV로서 결정한다. 또한, 비용값은 템플릿의 각 화소값과 탐색 영역의 각 화소값의 차분치 및 MV 값 등을 이용하여 산출한다.

또한, 부호화 장치 및 복호화 장치에서는, 여기서 설명한 처리의 개요는 기본적으로 공통이다.

또한, 여기서 설명한 처리 바로 그것이 아니어도, 후보 MV의 주변을 탐색하여 최종적인 MV를 도출할 수 있는 처리이면, 다른 처리를 이용해도 된다.

여기서, LIC 처리를 이용하여 예측 화상을 생성하는 모드에 대해서 설명한다.

도 9d는, LIC 처리에 의한 휘도 보정 처리를 이용한 예측 화상 생성 방법의 개요를 설명하기 위한 도면이다.

우선, 부호화 완료 픽처인 참조 픽처로부터 부호화 대상 블록에 대응하는 참조 화상을 취득하기 위한 MV를 도출한다.

다음에, 부호화 대상 블록에 대하여, 좌측 인접 및 상측 인접의 부호화 완료 주변 참조 영역의 휘도 화소값과, MV로 지정된 참조 픽처 내의 동등 위치에 있어서의 휘도 화소값을 이용하여, 참조 픽처와 부호화 대상 픽처에서 휘도값이 어떻게 변화했는지를 나타내는 정보를 추출하여 휘도 보정 파라미터를 산출한다.

MV로 지정된 참조 픽처 내의 참조 화상에 대하여 상기 휘도 보정 파라미터를 이용하여 휘도 보정 처리를 행함으로써, 부호화 대상 블록에 대한 예측 화상을 생성한다.

또한, 도 9d에서의 상기 주변 참조 영역의 형상은 일례이며, 이것 이외의 형상을 이용해도 된다.

또한, 여기에서는 1매의 참조 픽처로부터 예측 화상을 생성하는 처리에 대해서 설명했으나, 복수매의 참조 픽처로부터 예측 화상을 생성하는 경우도 마찬가지이며, 각각의 참조 픽처로부터 취득한 참조 화상에 동일한 방법으로 휘도 보정 처리를 행하고 나서 예측 화상을 생성한다.

LIC 처리를 적용할지 여부의 판정 방법으로서, 예를 들면, LIC 처리를 적용할지 여부를 나타내는 신호인 lic_flag를 이용하는 방법이 있다. 구체적인 일례로서는, 부호화 장치에 있어서, 부호화 대상 블록이 휘도 변화가 발생하고 있는 영역에 속해 있는지 여부를 판정하여, 휘도 변화가 발생하고 있는 영역에 속해 있는 경우는 lic_flag로서 값 1을 설정하여 LIC 처리를 적용하여 부호화를 행하고, 휘도 변화가 발생하고 있는 영역에 속해 있지 않은 경우는 lic_flag로서 값 0을 설정하여 LIC 처리를 적용하지 않고 부호화를 행한다. 한편, 복호화 장치에서는, 스트림에 기술된 lic_flag를 복호화함으로써, 그 값에 따라 LIC 처리를 적용할지의 여부를 전환하여 복호화를 행한다.

LIC 처리를 적용할지 여부의 판정의 다른 방법으로서, 예를 들면, 주변 블록에서 LIC 처리를 적용했는지의 여부에 따라서 판정하는 방법도 있다. 구체적인 일례로서는, 부호화 대상 블록이 머지 모드였던 경우, 머지 모드 처리에 있어서의 MV의 도출 시에 선택한 주변의 부호화 완료 블록이 LIC 처리를 적용하여 부호화했는지의 여부를 판정하고, 그 결과에 따라 LIC 처리를 적용할지의 여부를 전환하여 부호화를 행한다. 또한, 이 예의 경우, 복호화에 있어서의 처리도 완전히 동일하게 된다.

[복호 장치의 개요]

다음에, 상기의 부호화 장치(100)로부터 출력된 부호화 신호(부호화 비트 스트림)를 복호 가능한 복호 장치의 개요에 대해서 설명한다. 도 10은, 실시 형태 1에 따른 복호 장치(200)의 기능 구성을 나타내는 블럭도이다. 복호 장치(200)는, 동화상/화상을 블록 단위로 복호하는 동화상/화상 복호 장치이다.

도 10에 나타내는 바와 같이, 복호 장치(200)는, 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 블록 메모리(210), 루프 필터부(212), 프레임 메모리(214), 인트라 예측부(216), 인터 예측부(218), 예측 제어부(220)를 구비한다.

복호 장치(200)는, 예를 들면, 범용 프로세서 및 메모리에 의해 실현된다. 이 경우, 메모리에 저장된 소프트웨어 프로그램이 프로세서에 의해 실행되었을 때에, 프로세서는, 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 루프 필터부(212), 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)로서 기능한다. 또한, 복호 장치(200)는, 엔트로피 복호부(202), 역양자화부(204), 역변환부(206), 가산부(208), 루프 필터부(212), 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)에 대응하는 전용의 1 이상의 전자 회로로서 실현되어도 된다.

이하에, 복호 장치(200)에 포함되는 각 구성 요소에 대해서 설명한다.

[엔트로피 복호부]

엔트로피 복호부(202)는, 부호화 비트 스트림을 엔트로피 복호한다. 구체적으로는, 엔트로피 복호부(202)는, 예를 들면, 부호화 비트 스트림으로부터 2치 신호로 산술 복호한다. 그리고, 엔트로피 복호부(202)는, 2치 신호를 다치화(debinarize)한다. 이에 의해, 엔트로피 복호부(202)는, 블록 단위로 양자화 계수를 역양자화부(204)에 출력한다.

[역양자화부]

역양자화부(204)는, 엔트로피 복호부(202)로부터의 입력인 복호 대상 블록(이하, 커런트 블록이라고 한다)의 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(204)는, 커런트 블록의 양자화 계수의 각각에 대해서, 당해 양자화 계수에 대응하는 양자화 파라미터에 기초하여 당해 양자화 계수를 역양자화한다. 그리고, 역양자화부(204)는, 커런트 블록의 역양자화된 양자화 계수(즉 변환 계수)를 역변환부(206)에 출력한다.

[역변환부]

역변환부(206)는, 역양자화부(204)로부터의 입력인 변환 계수를 역변환함으로써 예측 오차를 복원한다.

예를 들면 부호화 비트 스트림으로부터 해독된 정보가 EMT 또는 AMT를 적용하는 것을 나타내는 경우(예를 들면 AMT 플래그가 참), 역변환부(206)는, 해독된 변환 타입을 나타내는 정보에 기초하여 커런트 블록의 변환 계수를 역변환한다.

또한 예를 들면, 부호화 비트 스트림으로부터 해독된 정보가 NSST를 적용하는 것을 나타내는 경우, 역변환부(206)는, 변환 계수에 역재변환을 적용한다.

[가산부]

가산부(208)는, 역변환부(206)로부터의 입력인 예측 오차와 예측 제어부(220)로부터의 입력인 예측 샘플을 가산함으로써 커런트 블록을 재구성한다. 그리고, 가산부(208)는, 재구성된 블록을 블록 메모리(210) 및 루프 필터부(212)에 출력한다.

[블록 메모리]

블록 메모리(210)는, 인트라 예측에서 참조되는 블록으로서 복호 대상 픽처(이하, 커런트 픽처라고 한다) 내의 블록을 저장하기 위한 기억부이다. 구체적으로는, 블록 메모리(210)는, 가산부(208)로부터 출력된 재구성 블록을 저장한다.

[루프 필터부]

루프 필터부(212)는, 가산부(208)에 의해 재구성된 블록에 루프 필터링을 실시하고, 필터링된 재구성 블록을 프레임 메모리(214) 및 표시 장치 등에 출력한다.

부호화 비트 스트림으로부터 해독된 ALF의 온/오프를 나타내는 정보가 ALF의 온을 나타내는 경우, 국소적인 구배의 방향 및 활성도에 기초하여 복수의 필터 중에서 하나의 필터가 선택되고, 선택된 필터가 재구성 블록에 적용된다.

[프레임 메모리]

프레임 메모리(214)는, 인터 예측에 이용되는 참조 픽처를 저장하기 위한 기억부이며, 프레임 버퍼로 불리는 경우도 있다. 구체적으로는, 프레임 메모리(214)는, 루프 필터부(212)에 의해 필터링된 재구성 블록을 저장한다.

[인트라 예측부]

인트라 예측부(216)는, 부호화 비트 스트림으로부터 해독된 인트라 예측 모드에 기초하여, 블록 메모리(210)에 저장된 커런트 픽처 내의 블록을 참조하여 인트라 예측을 행함으로써, 예측 신호(인트라 예측 신호)를 생성한다. 구체적으로는, 인트라 예측부(216)는, 커런트 블록에 인접하는 블록의 샘플(예를 들면 휘도값, 색차값)을 참조하여 인트라 예측을 행함으로써 인트라 예측 신호를 생성하고, 인트라 예측 신호를 예측 제어부(220)에 출력한다.

또한, 색차 블록의 인트라 예측에 있어서 휘도 블록을 참조하는 인트라 예측 모드가 선택되어 있는 경우는, 인트라 예측부(216)는, 커런트 블록의 휘도 성분에 기초하여, 커런트 블록의 색차 성분을 예측해도 된다.

또한, 부호화 비트 스트림으로부터 해독된 정보가 PDPC의 적용을 나타내는 경우, 인트라 예측부(216)는, 수평/수직 방향의 참조 화소의 구배에 기초하여 인트라 예측 후의 화소값을 보정한다.

[인터 예측부]

인터 예측부(218)는, 프레임 메모리(214)에 저장된 참조 픽처를 참조하여, 커런트 블록을 예측한다. 예측은, 커런트 블록 또는 커런트 블록 내의 서브 블록(예를 들면 4×4 블록)의 단위로 행해진다. 예를 들면, 인터 예측부(218)는, 부호화 비트 스트림으로부터 해독된 움직임 정보(예를 들면 움직임 벡터)를 이용하여 움직임 보상을 행함으로써 커런트 블록 또는 서브 블록의 인터 예측 신호를 생성하고, 인터 예측 신호를 예측 제어부(220)에 출력한다.

또한, 부호화 비트 스트림으로부터 해독된 정보가 OBMC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 움직임 탐색에 의해 얻어진 커런트 블록의 움직임 정보뿐만 아니라, 인접 블록의 움직임 정보도 이용하여, 인터 예측 신호를 생성한다.

또한, 부호화 비트 스트림으로부터 해독된 정보가 FRUC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 부호화 스트림으로부터 해독된 패턴 매칭의 방법(바이래터럴 매칭 또는 템플릿 매칭)에 따라 움직임 탐색을 행함으로써 움직임 정보를 도출한다. 그리고, 인터 예측부(218)는, 도출된 움직임 정보를 이용하여 움직임 보상을 행한다.

또한, 인터 예측부(218)는, BIO 모드가 적용되는 경우에, 등속 직선 운동을 가정한 모델에 기초하여 움직임 벡터를 도출한다. 또한, 부호화 비트 스트림으로부터 해독된 정보가 아핀 움직임 보상 예측 모드를 적용하는 것을 나타내는 경우에는, 인터 예측부(218)는, 복수의 인접 블록의 움직임 벡터에 기초하여 서브 블록 단위로 움직임 벡터를 도출한다.

[예측 제어부]

예측 제어부(220)는, 인트라 예측 신호 및 인터 예측 신호 중 어느 하나를 선택하고, 선택한 신호를 예측 신호로서 가산부(208)에 출력한다.

[디블로킹 필터 처리]

다음에, 이상과 같이 구성된 부호화 장치(100) 및 복호 장치(200)에서 행해지는 디블로킹 필터 처리에 대해서 도면을 참조하면서 구체적으로 설명한다. 또한, 이하에서는, 부호화 장치(100)가 구비하는 루프 필터부(120)의 동작을 주로 설명하지만, 복호 장치(200)가 구비하는 루프 필터부(212)의 동작도 동일하다.

상술한 바와 같이, 부호화 장치(100)는, 화상을 부호화할 때에, 인트라 예측부(124) 또는 인터 예측부(126)가 생성하는 예측 신호를 원 신호로부터 감산함으로써 예측 오차를 산출한다. 부호화 장치(100)는, 예측 오차에 대하여 직교 변환 처리, 및 양자화 처리 등을 실시함으로써 양자화 계수를 생성한다. 또한, 부호화 장치(100)는, 얻어진 양자화 계수를 역양자화 및 역직교 변환함으로써 예측 오차를 복원한다. 여기서, 양자화 처리는 불가역의 처리이므로, 복원된 예측 오차는, 변환 전의 예측 오차에 대하여 오차(양자화 오차)를 갖는다.

루프 필터부(120)에서 행해지는 디블로킹 필터 처리는, 이 양자화 오차를 저감하는 등의 목적으로 실시되는 필터 처리의 일종이다. 디블로킹 필터 처리는, 블록 노이즈를 제거하기 위해서 블록 경계에 적용된다. 또한, 이하에서는, 이 디블로킹 필터 처리를 단순히 필터 처리라고도 기재한다.

도 11은, 루프 필터부(120)가 실시하는 디블로킹 필터 처리의 일례를 나타내는 플로차트이다. 예를 들면, 도 11에 나타내는 처리는 블록 경계마다 행해진다.

우선, 루프 필터부(120)는, 디블로킹 필터 처리의 거동을 결정하기 위해서 블록 경계 강도(Bs)를 계산한다(S101). 구체적으로는, 루프 필터부(120)는, Bs를, 필터 대상이 되는 블록의 예측 모드 또는 움직임 벡터의 성질 등을 이용하여 결정한다. 예를 들면, 경계를 사이에 둔 블록 중 적어도 한쪽이 인트라 예측 블록이라면 Bs=2로 설정된다. 또한, (1) 경계를 사이에 둔 블록 중 적어도 한쪽의 블록이 우위인 직교 변환 계수를 포함한다, (2) 블록 경계를 사이에 둔 양 블록의 움직임 벡터의 차분이 역치 이상이다, 및 (3) 블록 경계를 사이에 둔 양 블록의 움직임 벡터의 개수 또는 참조 화상이 상이하다라고 하는 (1)~(3)의 조건 중 적어도 하나가 충족되어 있다면 Bs=1로 설정된다. (1)~(3)의 조건 중 어느 것에도 해당되지 않는다면 Bs=0으로 설정된다.

다음에, 루프 필터부(120)는, 설정된 Bs가 제1 역치보다 큰지를 판정한다(S102). Bs가 제1 역치 이하인 경우(S102에서 No), 루프 필터부(120)는, 필터 처리를 행하지 않는다(S107).

한편, 설정된 Bs가 제1 역치보다 큰 경우(S102에서 Yes), 루프 필터부(120)는, 블록 경계의 양측의 블록 내의 화소값을 이용하여, 경계 영역의 화소 변동(d)을 계산한다(S103). 도 12를 이용하여 이 처리에 대해서 설명한다. 블록 경계의 화소값을 도 12와 같이 정의하면, 루프 필터부(120)는, 예를 들면, d=｜p30-2×p20+p10｜+｜p33-2×p23+p13｜+｜q30-2×q20+q10｜+｜q33-2×q23+q13｜을 계산한다.

다음에, 루프 필터부(120)는, 계산된 d가 제2 역치보다 큰지를 판정한다(S104). d가 제2 역치 이하인 경우(S104에서 No), 루프 필터부(120)는 필터 처리를 행하지 않는다(S107). 또한, 제1 역치와 제2 역치는 상이하다.

계산된 d가 제2 역치보다 큰 경우(S104에서 Yes), 루프 필터부(120)는, 필터 특성을 결정하고(S105), 결정한 필터 특성의 필터 처리를 행한다(S106). 예를 들면 (1, 2, 2, 2, 1)/8이라는 5탭의 필터가 이용된다. 즉, 도 12에 나타내는 p10에 대해서는, (1×p30+2×p20+2×p10+2×q10+1×q20)/8의 연산이 행해진다. 여기서 필터 처리 시에는, 과도한 평활화가 되지 않도록 변위가 일정 범위 내에 들어가도록 클립(Clip) 처리가 행해진다. 여기서 말하는 클립 처리란, 예를 들면 클립 처리의 역치가 tc이고, 필터 전의 화소값이 q인 경우, 필터 후의 화소값은 q±tc의 범위 밖에 취할 수 없도록 하는 역치 처리이다.

이하, 본 실시 형태에 따른 루프 필터부(120)에 의한 디블로킹 필터 처리에 있어서, 블록 경계를 사이에 두고 비대칭인 필터를 적용하는 예에 대해서 설명한다.

도 13은, 본 실시 형태에 따른 디블로킹 필터 처리의 일례를 나타내는 플로차트이다. 또한, 도 13에 나타내는 처리는, 블록 경계마다 행해져도 되고, 1 이상의 화소를 포함하는 단위 화소마다 행해져도 된다.

우선, 루프 필터부(120)는, 부호화 파라미터를 취득하고, 취득한 부호화 파라미터를 이용하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정한다(S111). 본 개시에서는, 취득한 부호화 파라미터는, 예를 들면 오차 분포를 특징짓고 있는 것으로 한다.

여기서, 필터 특성이란, 필터 계수 및 필터 처리의 제어에 이용하는 파라미터 등이다. 또한, 부호화 파라미터는, 필터 특성의 결정에 이용할 수 있는 파라미터이면 무엇이든 된다. 부호화 파라미터는, 오차 그 자체를 나타내는 정보여도 되고, 오차에 관련하는(예를 들면 오차의 대소 관계를 좌우하는) 정보 또는 파라미터여도 된다.

또한, 이하에서는, 부호화 파라미터에 의거하여, 오차가 크거나 또는 작다고 판정된 화소, 즉, 오차가 크거나 또는 작을 가능성이 높은 화소를, 단순히 오차가 크거나 또는 작은 화소라고도 기재한다.

여기서, 판정 처리가 그때마다 행해질 필요는 없으며, 미리 정해진, 부호화 파라미터와 필터 특성을 관련짓는 룰에 따라 처리가 행해져도 된다.

또한, 통계적으로 보아 오차가 작을 가능성이 높은 화소여도, 화소마다 보면 오차가 클 가능성이 높은 화소의 오차보다 오차가 커지는 경우는 있을 수 있다.

다음에, 루프 필터부(120)는, 결정된 필터 특성을 갖는 필터 처리를 실행한다(S112).

여기서, 단계 S111에서 결정되는 필터 특성은 반드시 비대칭일 필요는 없고, 대칭인 설계까지 가능하게 되어 있다. 또한, 이하에서는, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖는 필터를 비대칭 필터라고도 부르며, 블록 경계를 사이에 두고 대칭인 필터 특성을 갖는 필터를 대칭 필터라고도 부른다.

구체적으로는, 오차가 작다고 판정된 화소는 주위의 오차가 큰 화소의 영향을 받기 어려워지도록, 오차가 크다고 판정된 화소는 주위의 오차가 작은 화소의 영향을 받기 쉬워지도록라고 하는 두 가지 점을 고려하여 필터 특성이 결정된다. 즉, 오차가 큰 화소일수록 필터 처리의 영향이 커지도록 필터 특성이 결정된다. 예를 들면, 오차가 큰 화소일수록 필터 처리의 전후의 화소값의 변화량이 커지도록 필터 특성이 결정된다. 이에 의해, 오차가 작을 가능성이 높은 화소에 대해서는, 값이 크게 변동함으로써 참값으로부터 벗어나는 것을 막을 수 있다. 반대로 오차가 클 가능성이 높은 화소에 대해서는, 오차가 작은 화소의 영향을 강하게 받아 값을 변동시킴으로써 오차를 저감할 수 있다.

또한, 이하에서는, 필터에 의한 변위를 변화시키는 요소를 필터의 가중치라고 정의한다. 바꾸어 말하면, 가중치란, 대상 화소에의 필터 처리의 영향의 정도를 나타낸다. 가중치를 크게 한다는 것은, 당해 화소에의 필터 처리의 영향이 커지는 것을 의미한다. 바꾸어 말하면, 필터 처리 후의 화소값이 다른 화소의 영향을 받기 쉽게 한다고 하는 것이다. 구체적으로는, 가중치를 크게 한다는 것은, 필터 처리의 전후의 화소값의 변화량이 커지도록, 또는, 필터 처리가 행해지기 쉬워지도록 필터 특성을 결정하는 것이다.

즉, 루프 필터부(120)는, 오차가 큰 화소일수록 가중치를 크게 한다. 또한, 오차가 큰 화소일수록 가중치를 크게 한다는 것은, 오차에 의거하여, 연속적으로 가중치를 변경하는 것에 한정하지 않고, 단계적으로 가중치를 변경하는 경우도 포함한다. 즉, 제1 화소의 가중치는, 제1 화소보다 오차가 큰 제2 화소의 가중치보다 작으면 된다. 또한, 이하에서도 동일한 표현을 이용한다.

또한, 최종적으로 결정된 필터 특성에 있어서, 오차가 큰 화소일수록 가중치가 클 필요는 없다. 즉, 루프 필터부(120)는, 예를 들면, 종래의 수법에 의해 결정된 기준이 되는 필터 특성을, 오차가 큰 화소일수록 가중치가 커지는 경향으로 수정하면 된다.

이하, 비대칭으로 가중치를 변경하는 구체적인 복수의 수법을 설명한다. 또한, 이하에 나타내는 수법 중 어느 하나가 이용되어도 되고, 복수의 수법을 조합한 수법이 이용되어도 된다.

제1 수법으로서, 루프 필터부(120)는, 오차가 큰 화소일수록 필터 계수를 작게 한다. 예를 들면, 루프 필터부(120)는, 오차가 큰 화소의 필터 계수를 작게 하고, 오차가 작은 화소의 필터 계수를 크게 한다.

예를 들면 도 12에 나타내는 화소 p1에 행하는 디블로킹 필터 처리의 예를 설명한다. 이하에서는, 본 수법을 적용하지 않고, 예를 들면, 종래의 수법으로 결정된 필터를 기준 필터라고 부른다. 기준 필터는, 블록 경계와 수직인 5탭의 필터이며, (p3, p2, p1, q1, q2)에 걸쳐서 늘어나는 필터인 것으로 한다. 또한, 필터 계수는 (1, 2, 2, 2, 1)/8인 것으로 한다. 또한, 블록 P의 오차가 클 가능성이 높고, 블록 Q의 오차가 작을 가능성이 높은 것으로 한다. 이 경우, 오차가 큰 블록 P가, 오차가 작은 블록 Q의 영향을 받기 쉬워지도록 필터 계수가 설정된다. 구체적으로는, 오차가 작은 화소에 이용되는 필터 계수가 크고, 오차가 큰 화소에 이용되는 필터 계수가 작게 설정된다. 예를 들면, 필터 계수로서 (0.5, 1.0, 1.0, 2.0, 1.5)/6이 이용된다.

다른 예로서, 오차가 작은 화소의 필터 계수에 0을 이용해도 된다. 예를 들면, 필터 계수로서 (0, 0, 1, 2, 2)/5가 이용되어도 된다. 즉, 필터 탭이 변경되어도 된다. 반대로, 현재 0으로 되어 있는 필터 계수를 0 이외의 값으로 해도 된다. 예를 들면, 필터 계수로서 (1, 2, 2, 2, 1, 1)/9 등이 이용되어도 된다. 즉, 루프 필터부(120)는, 오차가 작은 측에 필터 탭을 늘려도 된다.

또한, 기준 필터는, 상기의 (1, 2, 2, 2, 1)/8과 같이, 대상 화소를 중심으로 좌우 대칭인 필터가 아니어도 된다. 이러한 경우에는, 루프 필터부(120)는, 그 필터를 추가로 조정한다. 예를 들면, Q 블록의 좌단의 화소에 이용하는 기준 필터의 필터 계수가 (1, 2, 3, 4, 5)/15이고, 블록 P의 우단의 화소에 이용하는 기준 필터의 필터 계수가 (5, 4, 3, 2, 1)/15이다. 즉, 이 경우, 블록 경계를 사이에 둔 화소 사이에서, 좌우 반전된 필터 계수가 이용된다. 이와 같은 블록 경계를 사이에 두고 반전 대칭인 필터 특성도 「블록 경계를 사이에 두고 대칭인 필터 특성」이라고 할 수 있다. 즉, 블록 경계를 사이에 두고 비대칭인 필터 특성이란, 블록 경계를 사이에 두고 반전 대칭이 아닌 필터 특성이다.

또한, 상기와 동일하게, 블록 P의 오차가 크고, 블록 Q의 오차가 작은 경우에는, 루프 필터부(120)는, 예를 들면, 블록 P의 우단의 화소에 이용하는 기준 필터의 필터 계수인 (5, 4, 3, 2, 1)/15를 (2.5, 2.0, 1.5, 2.0, 1.0)/9로 변경한다.

이와 같이, 디블로킹 필터 처리에서는, 필터 계수가 블록 경계를 사이에 두고 비대칭으로 변화하고 있는 필터가 이용된다. 예를 들면, 루프 필터부(120)는, 미리 정해진 기준에 따라, 블록 경계를 사이에 두고 대칭인 필터 특성을 갖는 기준 필터를 결정한다. 루프 필터부(120)는, 당해 기준 필터를, 블록 경계를 사이에 두고 비대칭인 필터 특성을 갖도록 변경한다. 구체적으로는, 루프 필터부(120)는, 기준 필터의 필터 계수 중, 오차가 작은 적어도 하나의 화소의 필터 계수를 크게 하는 것, 및 오차가 큰 적어도 하나의 화소의 필터 계수를 작게 하는 것 중 적어도 한쪽을 행한다.

다음에, 비대칭으로 가중치를 변경하는 제2 수법에 대해서 설명한다. 우선, 루프 필터부(120)는, 기준 필터를 이용한 필터 연산을 행한다. 다음에, 루프 필터부(120)는, 기준 필터를 이용한 필터 연산의 전후의 화소값의 변화량인 기준 변화량(Δ0)에, 블록 경계를 사이에 두고 비대칭인 가중을 행한다. 또한, 이하에서는, 구별을 위해서, 기준 필터를 이용한 처리를 필터 연산이라고 부르고, 필터 연산과, 그 후의 보정 처리(예를 들면, 비대칭인 가중)를 포함하는 일련의 처리를 필터 처리(디블로킹 필터 처리)라고 부른다.

예를 들면, 루프 필터부(120)는, 오차가 작은 화소에 대해서는, 기준 변화량(Δ0)에 1보다 작은 계수를 곱함으로써, 보정 후의 변화량(Δ1)을 산출한다. 또한, 루프 필터부(120)는, 오차가 큰 화소에 대해서는, 기준 변화량(Δ0)에 1보다 큰 계수를 곱함으로써, 보정 후의 변화량(Δ1)을 산출한다. 다음에, 루프 필터부(120)는, 필터 연산 전의 화소값에, 보정 후의 변화량(Δ1)을 가산함으로써, 필터 처리 후의 화소값을 생성한다. 또한, 루프 필터부(120)는, 오차가 작은 화소에 대한 처리와, 오차가 큰 화소에 대한 처리 중 한쪽만을 행해도 된다.

예를 들면, 상기와 동일하게, 블록 P의 오차가 크고, 블록 Q의 오차가 작은 것으로 한다. 이 경우, 루프 필터부(120)는, 오차가 작은 블록 Q에 포함되는 화소에 대해서는, 예를 들면, 기준 변화량(Δ0)을 0.8배 함으로써 보정 후의 변화량(Δ1)을 산출한다. 또한, 루프 필터부(120)는, 오차가 큰 블록 P에 포함되는 화소에 대해서는, 예를 들면, 기준 변화량(Δ0)을 1.2배 함으로써 보정 후의 변화량(Δ1)을 산출한다. 이렇게 함으로써, 오차가 작은 화소의 값의 변동을 작게 할 수 있다. 또한, 오차가 큰 화소의 값의 변동을 크게 할 수 있다.

또한, 오차가 작은 화소의 기준 변화량(Δ0)에 곱해지는 계수와, 오차가 큰 화소의 기준 변화량(Δ0)에 곱해지는 계수의 비율로서 1:1이 선택되는 경우가 있어도 된다. 이 경우, 필터 특성은 블록 경계를 사이에 두고 대칭이 된다.

또한, 루프 필터부(120)는, 기준 변화량(Δ0)에 곱해지는 계수를, 기준 계수에 상수를 곱함으로써 산출해도 된다. 이 경우, 루프 필터부(120)는, 오차가 큰 화소에 대해서는, 오차가 작은 화소보다 큰 상수를 이용한다. 결과적으로, 오차가 큰 화소에 대한 화소값의 변화량이 증가하고, 오차가 작을 가능성이 높은 화소에 대한 화소값의 변화량이 감소한다. 예를 들면, 루프 필터부(120)는, 블록 경계와 인접한 화소에 대해서는, 상수로서 1.2 또는 0.8을 이용하고, 블록 경계와 인접하는 화소로부터 1화소 떨어진 화소에 대해서는, 상수로서 1.1 또는 0.9를 이용한다. 또한, 기준 계수는, 예를 들면, (A×(q1-p1)-B×(q2-p2)+C)/D에 의해 구해진다. 여기서, A, B, C, D는 상수이다. 예를 들면, A=9, B=3, C=8, D=16이다. 또한, p1, p2, q1, q2는 블록 경계를 사이에 두고 도 12에 나타내는 위치 관계의 화소의 화소값이다.

다음에, 비대칭으로 가중치를 변경하는 제3 수법에 대해서 설명한다. 루프 필터부(120)는, 제2 수법과 동일하게, 기준 필터의 필터 계수를 이용한 필터 연산을 행한다. 다음에, 루프 필터부(120)는, 필터 연산 후의 화소값에, 블록 경계를 사이에 두고 비대칭인 오프셋 값을 더한다. 구체적으로는, 루프 필터부(120)는, 오차가 큰 화소의 값이, 오차가 작을 가능성이 높은 화소의 값에 가까워짐과 더불어, 당해 오차가 큰 화소의 변위가 커지도록, 오차가 큰 화소의 화소값에 양의 오프셋 값을 더한다. 또한, 루프 필터부(120)는, 오차가 작은 화소의 값이, 오차가 큰 화소의 값에 가까워지지 않도록 함과 더불어, 당해 오차가 작은 화소의 변위가 작아지도록, 오차가 작은 화소의 화소값에 음의 오프셋을 더한다. 결과적으로, 오차가 큰 화소에 대한 화소값의 변화량이 증가하고, 오차가 작은 화소에 대한 화소값의 변화량이 감소한다. 또한, 루프 필터부(120)는, 오차가 작은 화소에 대한 처리와 오차가 큰 화소에 대한 처리 중 한쪽만을 행해도 된다.

예를 들면, 루프 필터부(120)는, 오차가 큰 블록에 포함되는 화소에 대해서는, 기준 변화량(Δ0)의 절대값에 양의 오프셋 값(예를 들면 1)을 가산함으로써 보정 후의 변화량(Δ1)을 산출한다. 또한, 루프 필터부(120)는, 오차가 작은 블록에 포함되는 화소에 대해서는, 기준 변화량(Δ0)의 절대값에 음의 오프셋 값(예를 들면 -1)을 가산함으로써 보정 후의 변화량(Δ1)을 산출한다. 다음에, 루프 필터부(120)는, 필터 연산 전의 화소값에, 보정 후의 변화량(Δ1)을 가산함으로써, 필터 처리 후의 화소값을 생성한다. 또한, 루프 필터부(120)는, 변화량에 오프셋 값을 더하는 것이 아니라, 필터 연산 후의 화소값에 오프셋 값을 더해도 된다. 또한, 오프셋 값은 블록 경계를 사이에 두고 대칭이 아니어도 된다.

또한, 루프 필터부(120)는, 필터 탭이 블록 경계로부터 복수 화소에 걸쳐서 늘어나는 경우에는, 어느 특정의 화소에 대한 가중치만을 변경해도 되고, 모든 화소에 대한 가중치를 변경해도 된다. 또한, 루프 필터부(120)는, 블록 경계로부터 대상 화소까지의 거리에 따라, 가중치를 변경해도 된다. 예를 들면, 루프 필터부(120)는, 블록 경계로부터 2화소까지 걸리는 필터 계수를 비대칭으로 하고, 그 이후의 화소에 걸리는 필터 계수를 대칭으로 해도 된다. 또한, 필터의 가중치는 복수의 화소에 대하여 공통이어도 되고, 화소마다 설정되어도 된다.

다음에, 비대칭으로 가중치를 변경하는 제4 수법에 대해서 설명한다. 루프 필터부(120)는, 기준 필터의 필터 계수를 이용한 필터 연산을 행한다. 다음에, 루프 필터부(120)는, 필터 연산의 전후의 화소값의 변화량(Δ)이, 기준치인 클립 폭을 초과하는 경우에는, 변화량(Δ)을 클립 폭으로 클립한다. 루프 필터부(120)는, 클립 폭을, 블록 경계를 사이에 두고 비대칭으로 설정한다.

구체적으로는, 루프 필터부(120)는, 오차가 큰 화소에 대한 클립 폭을, 오차가 작은 화소의 클립 폭보다 크게 한다. 예를 들면, 루프 필터부(120)는, 오차가 큰 화소에 대한 클립 폭을, 오차가 작은 화소의 클립 폭의 상수배로 한다. 클립 폭을 변화시킨 결과, 오차가 작은 화소의 값은 크게 변화할 수 없게 된다. 또한, 오차가 큰 화소의 값은 크게 변화하는 것이 가능해진다.

또한, 루프 필터부(120)는, 클립 폭의 비를 지정하는 것이 아니라, 클립 폭의 절대값을 조정해도 된다. 예를 들면, 루프 필터부(120)는, 오차가 큰 화소에 대한 클립 폭을, 미리 정해진 기준 클립 폭의 배로 고정한다. 루프 필터부(120)는, 오차가 큰 화소의 클립 폭과, 오차가 작은 화소의 클립 폭의 비를 1.2:0.8로 설정한다. 구체적으로는, 예를 들면, 기준 클립 폭이 10이고, 필터 연산의 전후의 변화량(Δ)이 12인 것으로 한다. 이 경우, 기준 클립 폭이 그대로 이용되는 경우에는, 역치 처리에 의해, 변화량(Δ)은 10으로 보정된다. 한편, 대상 화소가 오차가 큰 화소인 경우에는, 예를 들면, 기준 클립 폭이 1.5배 된다. 이에 의해, 클립 폭은 15가 되므로 역치 처리가 행해지지 않고, 변화량(Δ)은 12가 된다.

다음에, 비대칭으로 가중치를 변경하는 제5 수법에 대해서 설명한다. 루프 필터부(120)는, 필터 처리를 행할지의 여부를 판정하는 조건을, 블록 경계를 사이에 두고 비대칭으로 설정한다. 여기서, 필터 처리를 행할지의 여부를 판정하는 조건이란, 예를 들면, 도 11에 나타내는 제1 역치 또는 제2 역치이다.

구체적으로는, 루프 필터부(120)는, 오차가 큰 화소에 대해서는, 필터 처리가 행해지기 쉬워지도록 조건을 설정하고, 오차가 작은 화소에 대해서는, 필터 처리가 행해지기 어려워지도록 조건을 설정한다. 예를 들면, 루프 필터부(120)는, 오차가 작은 화소에 대한 역치를 오차가 큰 화소의 역치보다 높게 한다. 예를 들면, 루프 필터부(120)는, 오차가 작은 화소에 대한 역치를 오차가 큰 화소의 역치의 상수배로 한다.

또한, 루프 필터부(120)는, 역치의 비를 지정할 뿐만 아니라, 역치의 절대값을 조정해도 된다. 예를 들면, 루프 필터부(120)는, 오차가 작은 화소에 대한 역치를 미리 정해진 기준 역치의 배로 고정하고, 오차가 작은 화소의 역치와, 오차가 큰 화소의 역치의 비를 1.2:0.8로 설정해도 된다.

구체적으로는, 단계 104에서의 제2 역치의 기준 역치가 10이고, 블록 내의 화소값으로부터 계산된 d가 12인 것으로 한다. 제2 역치로서 기준 역치가 그대로 이용되는 경우에는, 필터 처리를 행하는 것으로 판정된다. 한편, 대상 화소가 오차가 작은 화소인 경우, 예를 들면, 제2 역치로서 기준 역치를 1.5배 한 값이 이용된다. 이 경우, 제2 역치는 15가 되어, d보다 커진다. 이에 의해, 필터 처리를 행하지 않는 것으로 판정된다.

또한, 상기 제1~제5 수법에서 이용한 오차에 의거하는 가중치를 나타내는 상수 등은, 부호화 장치(100) 및 복호 장치(200)에 있어서 미리 정해진 값이어도 되고, 가변이어도 된다. 구체적으로는, 이 상수란, 제1 수법에 있어서의 필터 계수 또는 기준 필터의 필터 계수에 곱해지는 계수, 제2 수법에 있어서의 기준 변화량(Δ0)에 곱해지는 계수 또는 기준 계수에 곱해지는 상수, 제3 수법에 있어서의 오프셋 값, 제4 수법에 있어서의 클립 폭 또는 기준 클립 폭에 곱해지는 상수, 및 제5 수법에 있어서의 역치 또는 기준 역치에 곱해지는 상수 등이다.

상수가 가변인 경우에는, 당해 상수를 나타내는 정보가, 예를 들면, 시퀀스 또는 슬라이스 단위의 파라미터로서 비트 스트림에 포함되어, 부호화 장치(100)로부터 복호 장치(200)로 송신되어도 된다. 또한, 상수를 나타내는 정보는, 상수 그 자체를 나타내는 정보여도 되고, 기준치와의 비 또는 차를 나타내는 정보여도 된다.

또한, 오차에 따라, 계수 또는 상수를 변경하는 방법으로서, 예를 들면, 리니어로 변경하는 방법, 이차 함수적으로 변경하는 방법, 지수 함수적으로 변경하는 방법, 또는, 오차와 상수의 관계를 나타내는 룩업 테이블을 이용하는 방법 등이 있다.

또한, 오차가 기준 이상인 경우, 또는, 오차가 기준 이하인 경우에는, 상수로서 고정값을 이용해도 된다. 예를 들면, 루프 필터부(120)는, 오차가 소정의 범위 이하인 경우에는, 변수를 제1 값으로 설정하고, 오차가 소정의 범위 이상인 경우에는, 변수를 제2 값으로 설정하고, 오차가 소정의 범위 내인 경우에는, 오차에 따라 변수를 제1 값으로부터 제2 값까지 연속적으로 변경해도 된다.

또한, 루프 필터부(120)는, 오차가 소정의 기준을 초과한 경우에는, 비대칭 필터를 사용하지 않고, 대칭 필터(기준 필터)를 사용해도 된다.

또한, 루프 필터부(120)는, 룩업 테이블 등을 이용하는 경우에 있어서, 오차가 큰 경우와 작은 경우의 양쪽의 테이블을 유지해도 되고, 한쪽의 테이블만을 유지하고, 당해 테이블의 내용으로부터 미리 정해진 룰에 따라, 다른쪽의 상수를 산출해도 된다.

이상과 같이, 본 실시 형태에 따른 부호화 장치(100) 및 복호 장치(200)는, 비대칭 필터를 이용함으로써, 재구성 화상의 오차를 저감할 수 있으므로, 부호화 효율을 향상시킬 수 있다.

본 양태를 본 개시에 있어서의 다른 양태의 적어도 일부와 조합하여 실시해도 된다. 또한, 본 양태의 플로차트에 기재된 일부의 처리, 장치의 일부의 구성, 신택스의 일부 등을 다른 양태와 조합하여 실시해도 된다.

(실시 형태 2)

실시 형태 2~실시 형태 6에서는, 상술한 오차 분포를 특징짓는 부호화 파라미터의 구체적인 예에 대해서 설명한다. 본 실시 형태에서는, 루프 필터부(120)는, 대상 화소의 블록 내의 위치에 따라 필터 특성을 결정한다.

도 14는, 본 실시 형태에 따른 디블로킹 필터 처리의 일례를 나타내는 플로차트이다. 우선, 루프 필터부(120)는, 오차 분포를 특징짓는 부호화 파라미터로서, 대상 화소의 블록 내의 위치를 나타내는 정보를 취득한다. 루프 필터부(120)는, 당해 위치에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정한다(S121).

다음에, 루프 필터부(120)는, 결정된 필터 특성을 갖는 필터 처리를 실행한다(S122).

여기서, 인트라 예측의 참조 화소로부터 먼 화소는 인트라 예측의 참조 화소로부터 가까운 화소보다 오차가 클 가능성이 높다. 따라서, 루프 필터부(120)는, 인트라 예측의 참조 화소에 먼 화소일수록 당해 필터 처리의 전후의 화소값의 변화량이 커지도록 필터 특성을 결정한다.

예를 들면, H.265/HEVC 또는 JEM의 경우는, 도 15에 나타내는 바와 같이, 참조 화소로부터 가까운 화소란 블록 내의 좌측 상부에 존재하는 화소이고, 참조 화소로부터 먼 화소란 블록 내의 우측 하부에 존재하는 화소이다. 따라서, 루프 필터부(120)는, 블록 내의 우측 하부의 화소의 가중치가, 좌측 상부의 화소의 가중치보다 커지도록 필터 특성을 결정한다.

구체적으로는, 루프 필터부(120)는, 인트라 예측의 참조 화소로부터 먼 화소에 대해서는, 실시 형태 1에서 설명한 바와 같이, 필터 처리의 영향이 커지도록 필터 특성을 결정한다. 즉, 루프 필터부(120)는, 인트라 예측의 참조 화소로부터 먼 화소의 가중치를 크게 한다. 여기서, 가중치를 크게 한다는 것은, 상술한 바와 같이, (1) 필터 계수를 작게 한다, (2) 경계를 사이에 둔 화소(즉 인트라 예측의 참조 화소로부터 가까운 화소)의 필터 계수를 크게 한다, (3) 변화량에 곱하는 계수를 크게 한다, (4) 변화량의 오프셋 값을 크게 한다, (5) 클립 폭을 크게 한다, 및 (6) 필터 처리가 실행되기 쉽도록 역치를 수정한다, 중 적어도 하나를 실시하는 것이다. 한편, 루프 필터부(120)는, 인트라 예측의 참조 화소로부터 가까운 화소에 대해서는, 필터 처리의 영향이 작아지도록 필터 특성을 결정한다. 즉, 루프 필터부(120)는, 인트라 예측의 참조 화소로부터 가까운 화소의 가중치를 작게 한다. 여기서, 가중치를 작게 한다는 것은, 상술한 바와 같이, (1) 필터 계수를 크게 한다, (2) 경계를 사이에 둔 화소(즉 인트라 예측의 참조 화소로부터 가까운 화소)의 필터 계수를 작게 한다, (3) 변화량에 곱하는 계수를 작게 한다, (4) 변화량의 오프셋 값을 작게 한다, (5) 클립 폭을 작게 한다, 및 (6) 필터 처리가 실행되기 어렵도록 역치를 수정한다, 중 적어도 하나를 실시하는 것이다.

또한, 인트라 예측이 이용되고 있는 경우에 상기 처리를 행하고, 인터 예측이 이용되고 있는 블록에는 상기 처리를 행하지 않아도 된다. 단, 인트라 예측 블록의 성질이 인터 예측에도 끌어당겨지는 경우가 있기 때문에, 인터 예측 블록에 대해서도 상기 처리가 행해져도 된다.

또한, 루프 필터부(120)는, 특정의 블록 내의 위치를 임의로 지정하여 가중치를 변경해도 된다. 예를 들면, 루프 필터부(120)는, 상기와 같이, 블록 내의 우측 하부의 화소의 가중치를 크게 하고, 블록 내의 좌측 상부의 화소의 가중치를 작게 해도 된다. 또한, 루프 필터부(120)는, 좌측 상부 및 우측 하부에 한정하지 않고, 블록 내의 위치를 임의로 지정하여 가중치를 변경해도 된다.

또한, 도 15에 나타내는 바와 같이, 좌우 방향의 인접 블록 경계에서는, 좌측의 블록의 오차가 커지고, 우측의 블록의 오차가 작아진다. 따라서, 루프 필터부(120)는, 좌우 방향의 인접 블록 경계에 대해서는, 좌측의 블록의 가중치를 크게 하고, 우측의 블록의 가중치를 작게 해도 된다.

마찬가지로, 상하 방향의 인접 블록 경계에서는, 상측의 블록의 오차가 커지고, 하측의 블록의 오차가 작아진다. 따라서, 루프 필터부(120)는, 상하 방향의 인접 블록 경계에 대해서는, 상측의 블록의 가중치를 크게 하고, 하측의 블록의 가중치를 작게 해도 된다.

또한, 루프 필터부(120)는, 인트라 예측의 참조 화소로부터의 거리에 따라 가중치를 변화시켜도 된다. 또한, 루프 필터부(120)는, 블록 경계 단위로 가중치를 결정해도 되고, 화소 단위로 가중치를 결정해도 된다. 참조 화소로부터 멀어지면 멀어질수록 오차가 커지기 쉽다. 따라서, 루프 필터부(120)는, 참조 화소로부터 멀어지면 멀어질수록 가중치의 구배가 급해지도록 필터 특성을 결정한다. 또한, 루프 필터부(120)는, 블록의 우변의 상측에서의 가중치의 구배가 하측에서의 가중치의 구배보다 완만해지도록 필터 특성을 결정한다.

(실시 형태 3)

본 실시 형태에서는, 루프 필터부(120)는, 직교 변환 기저에 따라 필터 특성을 결정한다.

도 16은, 본 실시 형태에 따른 디블로킹 필터 처리의 일례를 나타내는 플로차트이다. 우선, 루프 필터부(120)는, 오차 분포를 특징짓는 부호화 파라미터로서, 대상 블록에 이용된 직교 변환 기저를 나타내는 정보를 취득한다. 루프 필터부(120)는, 당해 직교 변환 기저에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정한다(S131).

다음에, 루프 필터부(120)는, 결정된 필터 특성을 갖는 필터 처리를 실행한다(S132).

부호화 장치(100)는, 직교 변환을 행할 때의 변환 기저인 직교 변환 기저를, 복수의 후보 중에서 하나를 선택한다. 복수의 후보는, 예를 들면, DCT-II 등의 0차의 변환 기저가 플랫한 기저와, DST-VII 등의 0차의 변환 기저가 플랫하지 않은 기저를 포함한다. 도 17은, DCT-II의 변환 기저를 나타내는 도면이다. 도 18은, DCT-VII의 변환 기저를 나타내는 도면이다.

DCT-II의 0차 기저는, 블록 내의 위치에 관계없이 일정하다. 즉, DCT-II가 이용되고 있는 경우에는, 블록 내의 오차는 일정하다. 따라서, 루프 필터부(120)는, 블록 경계를 사이에 둔 양쪽의 블록이 DCT-II로 변환되어 있는 경우에는, 비대칭 필터를 이용하지 않고, 대칭 필터를 이용한 필터 처리를 행한다.

한편, DST-VII의 0차 기저는, 좌측 또는 상측의 블록 경계로부터의 거리가 멀어짐에 따라 값이 커진다. 즉, 좌측 또는 상측의 블록 경계로부터의 거리가 멀어짐에 따라 오차가 커질 가능성이 높다. 따라서, 루프 필터부(120)는, 블록 경계를 사이에 둔 2개의 블록 중 적어도 한쪽이 DST-VII로 변환되어 있는 경우에는, 비대칭 필터를 이용한다. 구체적으로는, 루프 필터부(120)는, 저차(예를 들면 0차)의 기저의 블록 내에 있어서의 값이 작은 화소일수록 필터 처리의 영향이 작아지도록 필터 특성을 결정한다.

구체적으로는, 블록 경계를 사이에 둔 양쪽의 블록이 DST-VII로 변환되어 있는 경우에는, 루프 필터부(120)는, 블록 내의 우측 하부의 화소에 대해서는, 상술한 수법에 의해, 필터 처리의 영향이 커지도록 필터 특성을 결정한다. 또한, 루프 필터부(120)는, 블록 내의 좌측 상부의 화소에 대해서는, 필터 처리의 영향이 커지도록 필터 특성을 결정한다.

또한, DST-VII과 DCT-II가 상하로 인접해 있는 경우에도, 루프 필터부(120)는, 블록 경계에 인접하는, DST-VII이 사용된 상측 블록의 하부의 화소에의 필터의 가중치가, DCT-II가 사용된 하측 블록의 상부의 화소에의 필터의 가중치와 비교하여 커지도록 필터 특성을 결정한다. 그러나, 이 경우의 저차의 기저의 진폭의 차는, DST-VII끼리가 인접해 있는 경우의 저차의 기저의 진폭의 차보다 작다. 따라서, 루프 필터부(120)는, 이 경우의 가중치의 경사가 DST-VII끼리가 인접해 있는 경우의 가중치의 경사보다 작아지도록 필터 특성을 설정한다. 루프 필터부(120)는, 예를 들면, DCT-II와 DCT-II가 인접해 있는 경우의 가중치를 1:1(대칭 필터)로 설정하고, DST-VII과 DST-VII이 인접해 있는 경우의 가중치를 1.3:0.7로 설정하고, DST-VII과 DCT-II가 인접해 있을 때의 가중치를 1.2:0.8로 설정한다.

(실시 형태 4)

본 실시 형태에서는, 루프 필터부(120)는, 블록 경계를 사이에 둔 화소값에 따라 필터 특성을 결정한다.

도 19는, 본 실시 형태에 따른 디블로킹 필터 처리의 일례를 나타내는 플로차트이다. 우선, 루프 필터부(120)는, 오차 분포를 특징짓는 부호화 파라미터로서, 블록 경계를 사이에 둔 블록 내의 화소값을 나타내는 정보를 취득한다. 루프 필터부(120)는, 당해 화소값에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정한다(S141).

다음에, 루프 필터부(120)는, 결정된 필터 특성을 갖는 필터 처리를 실행한다(S142).

예를 들면, 루프 필터부(120)는, 화소값의 차(d0)가 클수록 블록 경계를 사이에 둔 필터 특성의 차이를 크게 한다. 구체적으로는, 루프 필터부(120)는, 필터 처리의 영향의 차이가 커지도록 필터 특성을 결정한다. 예를 들면, 루프 필터부(120)는, d0>(양자화 파라미터)×(상수)가 만족되는 경우에는 가중치를 1.4:0.6으로 설정하고, 상기 관계가 만족되지 않는 경우에는 가중치를 1.2:0.8로 설정한다. 즉, 루프 필터부(120)는, 화소값의 차(d0)와, 양자화 파라미터에 의거하는 역치를 비교하여, 화소값의 차(d0)가 역치보다 큰 경우, 화소값의 차(d0)가 역치보다 작은 경우보다, 블록 경계를 사이에 둔 필터 특성의 차이를 크게 한다.

다른 예로서, 예를 들면 루프 필터부(120)는, 블록 경계를 사이에 둔 양 블록 내의 화소값의 분산의 평균치(b0)가 클수록 블록 경계를 사이에 둔 필터 특성의 차이를 크게 한다. 구체적으로는, 루프 필터부(120)는, 필터 처리의 영향의 차이가 커지도록 필터 특성을 결정해도 된다. 예를 들면, 루프 필터부(120)는 b0>(양자화 파라미터)×(상수)가 만족되는 경우에는 가중치를 1.4:0.6으로 설정하고, 상기 관계가 만족되지 않는 경우에는 가중치를 1.2:0.8로 설정한다. 즉, 루프 필터부(120)는, 화소값의 분산(b0)과, 양자화 파라미터에 의거하는 역치를 비교하여, 화소값의 분산(b0)이 역치보다 큰 경우, 화소값의 분산(b0)이 역치보다 작은 경우보다, 블록 경계를 사이에 둔 필터 특성의 차이를 크게 해도 된다.

또한, 인접하는 블록 중, 어느 블록의 가중치를 크게 할지, 즉, 어느 블록의 오차가 보다 큰지는, 상술한 실시 형태 2 또는 3의 수법, 혹은, 후술하는 실시 형태 6의 수법 등에 의해 특정할 수 있다. 즉, 루프 필터부(120)는, 소정의 룰(예를 들면, 실시 형태 2, 3 또는 6의 수법)에 따라, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정한다. 다음에, 루프 필터부(120)는, 화소값의 차(d0)에 의거하여, 블록 경계를 사이에 둔 필터 특성의 차이가 커지도록 당해 결정한 필터 특성을 변경한다. 즉, 루프 필터부(120)는, 오차가 큰 화소의 가중치와 오차가 작은 화소의 가중치의 비 또는 차를 크게 한다.

여기서, 화소값의 차(d0)가 큰 경우에는, 블록 경계와 화상 내의 오브젝트의 에지가 일치하고 있는 경우일 가능성이 있기 때문에, 이러한 케이스에 있어서, 블록 경계를 사이에 둔 필터 특성의 차이를 작게 함으로써, 불필요한 평활화가 행해지는 것을 억제할 수 있다.

또한, 루프 필터부(120)는, 상기와는 반대로, 화소값의 차(d0)가 클수록 블록 경계를 사이에 둔 필터 특성의 차이를 작게 해도 된다. 구체적으로는, 루프 필터부(120)는, 필터 처리의 영향의 차이가 작아지도록 필터 특성을 결정한다. 예를 들면, 루프 필터부(120)는, d0>(양자화 파라미터)×(상수)가 만족되는 경우에는 가중치를 1.2:0.8로 설정하고, 상기 관계가 만족되지 않는 경우에는 가중치를 1.4:0.6으로 설정한다. 또한, 상기 관계가 만족되는 경우에 가중치가 1:1(대칭 필터)로 설정되어도 된다. 즉, 루프 필터부(120)는, 화소값의 차(d0)와, 양자화 파라미터에 의거하는 역치를 비교하여, 화소값의 차(d0)가 역치보다 큰 경우, 화소값의 차(d0)가 역치보다 작은 경우보다, 블록 경계를 사이에 둔 필터 특성의 차이를 작게 한다.

예를 들면, 화소값의 차(d0)가 크다고 하는 것은, 블록 경계가 눈에 띄기 쉽다는 것이기 때문에, 이러한 케이스에 있어서, 블록 경계를 사이에 둔 필터 특성의 차이를 작게 함으로써, 비대칭인 필터에 의해 평활화가 약해지는 것을 억제할 수 있다.

또한, 이들 두 처리는 동시에 행해져도 된다. 예를 들면, 루프 필터부(120)는, 화소값의 차(d0)가 제1 역치 미만인 경우에는 제1 가중치를 이용하고, 화소값의 차(d0)가 제1 역치 이상 제2 역치 미만인 경우에는 제1 가중치보다 차가 큰 제2 가중치를 이용하고, 화소값의 차(d0)가 제2 역치 이상인 경우에는 제2 가중치보다 차가 작은 제3 가중치를 이용해도 된다.

또한, 화소값의 차(d0)는, 경계를 사이에 둔 화소값의 차분 그 자체여도 되고, 화소값의 차의 평균 또는 분산이어도 된다. 예를 들면, 화소값의 차(d0)는, (A×(q1-p1)-B×(q2-p2)+C)/D에 의해 구해진다. 여기서, A, B, C, D는 상수이다. 예를 들면, A=9, B=3, C=8, D=16이다. 또한, p1, p2, q1, q2는 블록 경계를 사이에 두고 도 12에 나타내는 위치 관계의 화소의 화소값이다.

또한, 이 화소값의 차(d0) 및 가중치의 설정은, 화소 단위로 행해져도 되고, 블록 경계 단위로 행해져도 되며, 복수 블록을 포함하는 블록군 단위(예를 들면 LCU(Largest Coding Unit) 단위)로 행해져도 된다.

(실시 형태 5)

본 실시 형태에서는, 루프 필터부(120)는, 인트라 예측 방향과 블록 경계 방향에 따라 필터 특성을 결정한다.

도 20은, 본 실시 형태에 따른 디블로킹 필터 처리의 일례를 나타내는 플로차트이다. 우선, 루프 필터부(120)는, 오차 분포를 특징짓는 부호화 파라미터로서, 인트라 예측의 예측 방향과 블록 경계의 각도를 나타내는 정보를 취득한다. 루프 필터부(120)는, 당해 각도에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정한다(S151).

다음에, 루프 필터부(120)는, 결정된 필터 특성을 갖는 필터 처리를 실행한다(S152).

구체적으로는, 루프 필터부(120)는, 상기 각도가 수직에 가까울수록 블록 경계를 사이에 둔 필터 특성의 차이를 크게 하고, 상기 각도가 수평에 가까울수록 블록 경계를 사이에 둔 필터 특성의 차이를 작게 한다. 보다 구체적으로는, 인트라 예측 방향이 블록 경계에 대하여 수직에 가까운 경우는, 블록 경계를 사이에 둔 양측의 화소에 대한 필터의 가중치의 차가 커지고, 인트라 예측 방향이 블록 경계에 대하여 수평에 가까운 경우는, 블록 경계를 사이에 둔 양측의 화소에 대한 필터의 가중치의 차가 작아지도록 필터 특성을 결정한다. 도 21은, 인트라 예측 방향과 블록 경계의 방향의 관계에 대한 가중치의 예를 나타내는 도면이다.

또한, 인접하는 블록 중, 어느 블록의 가중치를 크게 할지, 즉, 어느 블록의 오차가 보다 큰지는, 상술한 실시 형태 2 또는 3의 수법, 혹은, 후술하는 실시 형태 6의 수법 등에 의해 특정할 수 있다. 즉, 루프 필터부(120)는, 소정의 룰(예를 들면, 실시 형태 2, 3 또는 6의 수법)에 따라, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정한다. 다음에, 루프 필터부(120)는, 인트라 예측 방향과 블록 경계의 방향에 의거하여, 블록 경계를 사이에 둔 필터 특성의 차이가 커지도록 당해 결정한 필터 특성을 변경한다.

또한, 부호화 장치(100) 및 복호 장치(200)는, 인트라 예측 방향을, 예를 들면, 인트라 예측 모드를 이용하여 특정한다.

또한, 인트라 예측 모드가 Planar 모드 또는 DC 모드인 경우에는, 루프 필터부(120)는, 블록 경계의 방향을 고려하지 않아도 된다. 예를 들면, 루프 필터부(120)는, 인트라 예측 모드가 Planar 모드 또는 DC 모드인 경우에는, 블록 경계의 방향에 관계없이, 미리 정해진 가중치 또는 가중치의 차를 이용해도 된다. 또는, 루프 필터부(120)는, 인트라 예측 모드가 Planar 모드 또는 DC 모드인 경우에는, 대칭 필터를 이용해도 된다.

(실시 형태 6)

본 실시 형태에서는, 루프 필터부(120)는, 양자화의 폭을 나타내는 양자화 파라미터에 따라 필터 특성을 결정한다.

도 22는, 본 실시 형태에 따른 디블로킹 필터 처리의 일례를 나타내는 플로차트이다. 우선, 루프 필터부(120)는, 오차 분포를 특징짓는 부호화 파라미터로서, 대상 블록의 양자화 시에 이용된 양자화 파라미터를 나타내는 정보를 취득한다. 루프 필터부(120)는, 당해 양자화 파라미터에 의거하여, 블록 경계를 사이에 두고 비대칭인 필터 특성을 결정한다(S161).

다음에, 루프 필터부(120)는, 결정된 필터 특성을 갖는 필터 처리를 실행한다(S162).

여기서, 양자화 파라미터가 클수록, 오차가 커질 가능성이 높다. 따라서, 루프 필터부(120)는, 양자화 파라미터가 클수록 필터 처리의 영향이 커지도록 필터 특성을 결정한다.

도 23은, 양자화 파라미터에 대한 가중치의 예를 나타내는 도면이다. 도 23에 나타내는 바와 같이, 루프 필터부(120)는, 블록 내의 좌측 상부의 화소에 대한 가중치를 양자화 파라미터의 증가에 따라 증가시킨다. 한편, 루프 필터부(120)는, 블록 내의 우측 하부의 화소에 대한, 양자화 파라미터의 증가에 따른 가중치의 증가를 작게 한다. 즉, 루프 필터부(120)는, 좌측 상부의 화소의 양자화 파라미터의 변화에 수반하는 필터 처리의 영향의 변화가, 우측 하부의 화소의 양자화 파라미터의 변화에 수반하는 필터 처리의 영향의 변화보다 커지도록 필터 특성을 결정한다.

여기서, 블록 내의 좌측 상부의 화소는, 블록 내의 우측 하부의 화소에 비해, 양자화 파라미터의 영향을 받기 쉽다. 따라서, 상기와 같은 처리를 행함으로써, 적절히 오차를 저감할 수 있다.

또한, 루프 필터부(120)는, 경계를 사이에 두는 2개의 블록의 각각에 대하여, 당해 블록의 양자화 파라미터에 의거하여 당해 블록의 가중치를 결정해도 되고, 2개의 블록의 양자화 파라미터의 평균치를 산출하고, 당해 평균치에 의거하여 2개의 블록의 가중치를 결정해도 된다. 또는, 루프 필터부(120)는, 한쪽의 블록의 양자화 파라미터에 의거하여, 2개의 블록의 가중치를 결정해도 된다. 예를 들면, 루프 필터부(120)는, 상기 수법을 이용하여, 한쪽의 블록의 양자화 파라미터에 의거하여, 당해 한쪽의 블록의 가중치를 결정한다. 다음에, 루프 필터부(120)는, 결정된 가중치에 의거하여, 미리 정해진 룰에 따라, 다른쪽의 블록의 가중치를 결정한다.

또한, 루프 필터부(120)는, 2개의 블록의 양자화 파라미터가 상이한 경우, 또는, 2개의 블록의 양자화 파라미터의 차가 역치를 초과하는 경우, 대칭 필터를 이용해도 된다.

또한, 도 23에서는, 일차 함수를 이용하여 가중치가 설정되어 있지만, 일차 함수 이외의 임의의 함수, 또는 테이블이 이용되어도 된다. 예를 들면, 양자화 파라미터와 양자화 단계(양자화 폭)의 관계를 나타내는 커브가 이용되어도 된다.

또한, 루프 필터부(120)는, 양자화 파라미터가 역치를 초과하는 경우에는, 비대칭 필터를 이용하지 않고, 대칭 필터를 이용해도 된다.

또한, 양자화 파라미터가 소수점 정밀도로 기재되어 있는 경우에는, 루프 필터부(120)는, 양자화 파라미터에 반올림, 올림, 또는 버림 등의 연산을 행하고, 연산 후의 양자화 파라미터를 상기 처리에 이용해도 된다. 또는, 루프 필터부(120)는, 소수점 단위까지 고려하여 상기 처리를 행해도 된다.

이상과 같이, 실시 형태 2~6에 있어서, 오차를 판정하는 복수의 수법에 대해서 개별적으로 설명했지만, 이들 수법 중 2 이상을 조합해도 된다. 이 경우, 루프 필터부(120)는, 조합한 2 이상의 요소에 대하여 가중을 행해도 된다.

이하, 변형예에 대해서 설명한다.

상기에서 설명한 부호화 파라미터의 예 이외가 이용되어도 된다. 예를 들면, 부호화 파라미터는, 직교 변환의 종류(Wavelet, DFT 또는 중복 변환 등), 블록 사이즈(블록의 폭 및 높이), 움직임 벡터의 방향, 움직임 벡터의 길이, 또는 인터 예측에 이용되는 참조 픽처의 매수, 기준 필터의 특성을 나타내는 정보여도 된다. 또한, 그들은 조합하여 이용되어도 된다. 예를 들면, 루프 필터부(120)는, 블록 경계의 길이가 16화소 이하이고 또한 인트라 예측의 참조 화소로부터 필터 대상 화소가 가까운 경우에만 비대칭 필터를 이용하고, 다른 경우에는 대칭 필터를 이용해도 된다. 다른 예로서, 복수의 필터 후보 중 소정의 어느 하나의 타입의 필터가 이용된 경우에만 비대칭 처리를 행해도 된다. 예를 들면, 기준 필터에 의한 변위가 (A×(q1-p1)-B×(q2-p2)+C)/D에 의해 계산되는 경우에만 비대칭 필터를 이용해도 된다. 여기서, A, B, C, D는 상수이다. 예를 들면, A=9, B=3, C=8, D=16이다. 또한, p1, p2, q1, q2는 블록 경계를 사이에 두고 도 12에 나타내는 위치 관계의 화소의 화소값이다.

또한, 루프 필터부(120)는, 휘도 신호와 색차 신호 중 한쪽에 대하여 상기 처리를 행해도 되고, 양쪽에 대하여 상기 처리를 행해도 된다. 또한, 루프 필터부(120)는, 휘도 신호와 색차 신호에 대하여 공통의 처리를 행해도 되고, 상이한 처리를 행해도 된다. 예를 들면, 루프 필터부(120)는, 휘도 신호와 색차 신호에 대하여 상이한 가중치를 이용해도 되고, 상이한 룰에 따라 가중치를 결정해도 된다.

또한, 상기 처리에서 이용되는 각종 파라미터는, 부호화 장치(100)에서 결정되어도 되고, 미리 설정된 고정값이어도 된다.

또한, 상기 처리를 행하거나, 행하지 않거나, 또는 상기 처리의 내용은, 소정 단위로 전환되어도 된다. 소정 단위란, 예를 들면, 슬라이스 단위, 타일 단위, 웨이브 프런트 분할 단위, 또는 CTU 단위이다. 또한, 상기 처리의 내용이란, 상기에서 나타낸 복수의 수법 중 어느 것을 이용할지, 혹은 가중치 등을 나타내는 파라미터, 또는, 이들을 결정하기 위한 파라미터이다.

또한, 루프 필터부(120)는, 상기 처리를 행하는 영역을, CTU의 경계, 슬라이스의 경계, 또는 타일의 경계로 한정해도 된다.

또한, 대칭 필터와 비대칭 필터에서, 필터의 탭수는 상이해도 된다.

또한, 루프 필터부(120)는, 프레임 종별(I 프레임, P 프레임, B 프레임)에 따라, 상기 처리를 행할지의 여부, 또는 상기 처리의 내용을 변경해도 된다.

또한, 루프 필터부(120)는, 전단 또는 후단의 특정의 처리가 행해졌는지의 여부에 따라, 상기 처리를 행할지의 여부를, 또는 상기 처리의 내용을 결정해도 된다.

또한, 루프 필터부(120)는, 블록에 이용되는 예측 모드의 종류에 따라 상이한 처리를 행해도 되고, 특정의 예측 모드가 이용되는 블록에 대해서만 상기 처리를 행해도 된다. 예를 들면, 루프 필터부(120)는, 인트라 예측이 이용되는 블록과, 인터 예측이 이용되는 블록과, 머지된 블록에서 상이한 처리를 행해도 된다.

또한, 부호화 장치(100)는, 상기 처리를 행할지의 여부, 또는 상기 처리의 내용을 나타내는 파라미터인 필터 정보를 부호화해도 된다. 즉, 부호화 장치(100)는, 필터 정보를 포함하는 부호화 비트 스트림을 생성해도 된다. 이 필터 정보는, 휘도 신호에 상기 처리를 행할지의 여부를 나타내는 정보, 색차 신호에 상기 처리를 행할지의 여부를 나타내는 정보, 또는, 예측 모드마다 처리를 상이하게 할지의 여부를 나타내는 정보 등을 포함해도 된다.

또한, 복호 장치(200)는, 부호화 비트 스트림에 포함되는 필터 정보에 의거하여, 상기 처리를 행해도 된다. 예를 들면, 복호 장치(200)는, 필터 정보에 의거하여, 상기 처리를 행할지의 여부, 또는, 상기 처리의 내용을 결정해도 된다.

(실시 형태 7)

이상의 각 실시 형태에 있어서, 기능 블록의 각각은, 통상, MPU 및 메모리 등에 의해 실현 가능하다. 또한, 기능 블록의 각각에 의한 처리는, 통상, 프로세서 등의 프로그램 실행부가, ROM 등의 기록 매체에 기록된 소프트웨어(프로그램)를 읽어내어 실행함으로써 실현된다. 당해 소프트웨어는 다운로드 등에 의해 배포되어도 되고, 반도체 메모리 등의 기록 매체에 기록하여 배포되어도 된다. 또한, 각 기능 블록을 하드웨어(전용 회로)에 의해 실현하는 것도 당연히 가능하다.

또한, 각 실시 형태에서 설명한 처리는, 단일의 장치(시스템)를 이용하여 집중 처리함으로써 실현해도 되고, 또는, 복수의 장치를 이용하여 분산 처리함으로써 실현해도 된다. 또한, 상기 프로그램을 실행하는 프로세서는, 단수여도 되고, 복수여도 된다. 즉, 집중 처리를 행해도 되고, 또는 분산 처리를 행해도 된다.

본 개시의 양태는, 이상의 실시예에 한정되지 않고, 여러 가지 변경이 가능하며, 그들도 본 개시의 양태의 범위 내에 포함된다.

또한 여기서, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 또는 동화상 복호화 방법(화상 복호 방법)의 응용예와 그것을 이용한 시스템을 설명한다. 당해 시스템은, 화상 부호화 방법을 이용한 화상 부호화 장치, 화상 복호 방법을 이용한 화상 복호 장치, 및 둘 다 구비하는 화상 부호화 복호 장치를 갖는 것을 특징으로 한다. 시스템에 있어서의 다른 구성에 대해서, 경우에 따라 적절히 변경할 수 있다.

[사용예]

도 24는, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템(ex100)의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 에어리어를 원하는 크기로 분할하고, 각 셀 내에 각각 고정 무선국인 기지국(ex106, ex107, ex108, ex109, ex110)이 설치되어 있다.

이 컨텐츠 공급 시스템(ex100)에서는, 인터넷(ex101)에, 인터넷 서비스 프로바이더(ex102) 또는 통신망(ex104), 및 기지국(ex106~ex110)을 통해, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 및 스마트폰(ex115) 등의 각 기기가 접속된다. 당해 컨텐츠 공급 시스템(ex100)은, 상기의 어느 하나의 요소를 조합하여 접속하도록 해도 된다. 고정 무선국인 기지국(ex106~ex110)을 통하지 않고, 각 기기가 전화망 또는 근거리 무선 등을 통해 직접적 또는 간접적으로 서로 접속되어 있어도 된다. 또한, 스트리밍 서버(ex103)는, 인터넷(ex101) 등을 통해, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 및 스마트폰(ex115) 등의 각 기기와 접속된다. 또한, 스트리밍 서버(ex103)는, 위성(ex116)을 통해, 비행기(ex117) 내의 핫 스팟 내의 단말 등과 접속된다.

또한, 기지국(ex106~ex110) 대신에, 무선 액세스 포인트 또는 핫 스팟 등이 이용되어도 된다. 또한, 스트리밍 서버(ex103)는, 인터넷(ex101) 또는 인터넷 서비스 프로바이더(ex102)를 통하지 않고 직접 통신망(ex104)과 접속되어도 되고, 위성(ex116)을 통하지 않고 직접 비행기(ex117)와 접속되어도 된다.

카메라(ex113)는 디지털 카메라 등의 정지 화상 촬영, 및 동영상 촬영이 가능한 기기이다. 또한, 스마트폰(ex115)은, 일반적으로 2G, 3G, 3.9G, 4G, 그리고 향후에는 5G라 불리는 이동 통신 시스템의 방식에 대응한 스마트폰기, 휴대전화기, 또는 PHS(Personal Handyphone System) 등이다.

가전(ex114)은, 냉장고, 또는 가정용 연료 전지 코제너레이션 시스템에 포함되는 기기 등이다.

컨텐츠 공급 시스템(ex100)에서는, 촬영 기능을 갖는 단말이 기지국(ex106) 등을 통해서 스트리밍 서버(ex103)에 접속됨으로써, 라이브 전송 등이 가능해진다. 라이브 전송에서는, 단말(컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115), 및 비행기(ex117) 내의 단말 등)은, 사용자가 당해 단말을 이용하여 촬영한 정지 화상 또는 동영상 컨텐츠에 대하여 상기 각 실시 형태에서 설명한 부호화 처리를 행하고, 부호화에 의해 얻어진 영상 데이터와, 영상에 대응하는 소리를 부호화한 소리 데이터와 다중화하고, 얻어진 데이터를 스트리밍 서버(ex103)에 송신한다. 즉, 각 단말은, 본 개시의 일 양태에 따른 화상 부호화 장치로서 기능한다.

한편, 스트리밍 서버(ex103)는 요구가 있었던 클라이언트에 대하여 송신된 컨텐츠 데이터를 스트림 전송한다. 클라이언트는, 상기 부호화 처리된 데이터를 복호화하는 것이 가능한, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115), 또는 비행기(ex117) 내의 단말 등이다. 전송된 데이터를 수신한 각 기기는, 수신한 데이터를 복호화 처리하여 재생한다. 즉, 각 기기는, 본 개시의 일 양태에 따른 화상 복호 장치로서 기능한다.

[분산 처리]

또한, 스트리밍 서버(ex103)는 복수의 서버 또는 복수의 컴퓨터로서, 데이터를 분산하여 처리하거나 기록하거나 전송하는 것이어도 된다. 예를 들면, 스트리밍 서버(ex103)는, CDN(Contents Delivery Network)에 의해 실현되고, 전 세계에 분산된 다수의 에지 서버와 에지 서버 사이를 잇는 네트워크에 의해 컨텐츠 전송이 실현되어 있어도 된다. CDN에서는, 클라이언트에 따라 물리적으로 가까운 에지 서버가 동적으로 할당된다. 그리고, 당해 에지 서버에 컨텐츠가 캐시 및 전송됨으로써 지연을 줄일 수 있다. 또한, 어떠한 에러가 발생한 경우 또는 트래픽의 증가 등에 의해 통신 상태가 바뀌는 경우에 복수의 에지 서버에서 처리를 분산하거나, 다른 에지 서버로 전송 주체를 전환하거나, 장애가 생긴 네트워크 부분을 우회하여 전송을 계속할 수 있으므로, 고속 또한 안정된 전송을 실현할 수 있다.

또한, 전송 자체의 분산 처리에 그치지 않고, 촬영한 데이터의 부호화 처리를 각 단말에서 행해도 되고, 서버측에서 행해도 되며, 서로 분담하여 행해도 된다. 일례로서, 일반적으로 부호화 처리에서는, 처리 루프가 2번 행해진다. 1번째 루프에서 프레임 또는 장면 단위에서의 화상의 복잡함, 또는, 부호량이 검출된다. 또한, 2번째 루프에서는 화질을 유지하여 부호화 효율을 향상시키는 처리가 행해진다. 예를 들면, 단말이 1번째 부호화 처리를 행하고, 컨텐츠를 수취한 서버측이 2번째 부호화 처리를 행함으로써, 각 단말에서의 처리 부하를 줄이면서도 컨텐츠의 질과 효율을 향상시킬 수 있다. 이 경우, 거의 실시간으로 수신하여 복호하는 요구가 있으면, 단말이 행한 1번째의 부호화가 끝난 데이터를 다른 단말에서 수신하여 재생할 수도 있으므로, 보다 더 유연한 실시간 전송도 가능해진다.

다른 예로서, 카메라(ex113) 등은, 화상으로부터 특징량 추출을 행하고, 특징량에 관한 데이터를 메타데이터로서 압축하여 서버에 송신한다. 서버는, 예를 들면 특징량으로부터 오브젝트의 중요성을 판단하여 양자화 정밀도를 전환하는 등, 화상의 의미에 따른 압축을 행한다. 특징량 데이터는 서버에서의 재차의 압축 시의 움직임 벡터 예측의 정밀도 및 효율 향상에 특히 유효하다. 또한, 단말에서 VLC(가변 길이 부호화) 등의 간이적인 부호화를 행하고, 서버에서 CABAC(콘텍스트 적응형 2치 산술 부호화 방식) 등 처리 부하가 큰 부호화를 행해도 된다.

또 다른 예로서, 스타디움, 쇼핑몰, 또는 공장 등에 있어서는, 복수의 단말에 의해 거의 동일한 장면이 촬영된 복수의 영상 데이터가 존재하는 경우가 있다. 이 경우에는, 촬영을 행한 복수의 단말과, 필요에 따라 촬영을 하지 않은 다른 단말 및 서버를 이용하여, 예를 들면 GOP(Group of Picture) 단위, 픽처 단위, 또는 픽처를 분할한 타일 단위 등으로 부호화 처리를 각각 할당하여 분산 처리를 행한다. 이에 의해, 지연을 줄여, 보다 더 실시간성을 실현할 수 있다.

또한, 복수의 영상 데이터는 거의 동일 장면이기 때문에, 각 단말에서 촬영된 영상 데이터를 서로 참조할 수 있도록, 서버에서 관리 및/또는 지시를 해도 된다. 또는, 각 단말로부터의 부호화가 끝난 데이터를, 서버가 수신하여 복수의 데이터간에서 참조 관계를 변경, 또는 픽처 자체를 보정 혹은 교체하여 다시 부호화해도 된다. 이에 의해, 하나하나의 데이터의 질과 효율을 높인 스트림을 생성할 수 있다.

또한, 서버는, 영상 데이터의 부호화 방식을 변경하는 트랜스코드를 행한 다음 영상 데이터를 전송해도 된다. 예를 들면, 서버는, MPEG계의 부호화 방식을 VP계로 변환해도 되고, H.264를 H.265로 변환해도 된다.

이와 같이, 부호화 처리는, 단말 또는 1 이상의 서버에 의해 행하는 것이 가능하다. 따라서, 이하에서는, 처리를 행하는 주체로서 「서버」 또는 「단말」 등의 기재를 이용하지만, 서버에서 행해지는 처리의 일부 또는 모두가 단말에서 행해져도 되고, 단말에서 행해지는 처리의 일부 또는 모두가 서버에서 행해져도 된다. 또한, 이들에 관해서는, 복호 처리에 대해서도 동일하다.

[3D, 멀티 앵글]

최근에는, 서로 거의 동기한 복수의 카메라(ex113) 및/또는 스마트폰(ex115) 등의 단말에 의해 촬영된 상이한 장면, 또는, 동일 장면을 상이한 앵글에서 촬영한 화상 혹은 영상을 통합하여 이용하는 경우도 늘고 있다. 각 단말에서 촬영한 영상은, 별도 취득한 단말간의 상대적인 위치 관계, 또는, 영상에 포함되는 특징점이 일치하는 영역 등에 기초하여 통합된다.

서버는, 2차원 동화상을 부호화할 뿐만 아니라, 동화상의 장면 해석 등에 기초하여 자동적으로 또는 사용자가 지정한 시각에 있어서, 정지 화상을 부호화하여, 수신 단말에 송신해도 된다. 서버는, 또한, 촬영 단말간의 상대적인 위치 관계를 취득할 수 있는 경우에는, 2차원 동화상뿐만 아니라, 동일 장면이 상이한 앵글에서 촬영된 영상에 기초하여, 당해 장면의 3차원 형상을 생성할 수 있다. 또한, 서버는, 포인트 클라우드 등에 의해 생성한 3차원 데이터를 별도로 부호화해도 되고, 3차원 데이터를 이용하여 인물 또는 오브젝트를 인식 혹은 추적한 결과에 기초하여, 수신 단말에 송신하는 영상을, 복수의 단말에서 촬영한 영상으로부터 선택 또는 재구성하여 생성해도 된다.

이와 같이 하여, 사용자는, 각 촬영 단말에 대응하는 각 영상을 임의로 선택하여 장면을 즐길 수도 있고, 복수 화상 또는 영상을 이용하여 재구성된 3차원 데이터로부터 임의 시점(視點)의 영상을 잘라낸 컨텐츠를 즐길 수도 있다. 또한, 영상과 마찬가지로 소리도 복수의 상이한 앵글로부터 수음(收音)되고, 서버는, 영상에 맞추어 특정의 앵글 또는 공간으로부터의 소리를 영상과 다중화하여 송신해도 된다.

또한, 최근에는 Virtual Reality(VR) 및 Augmented Reality(AR) 등, 현실 세계와 가상 세계를 대응지은 컨텐츠도 보급되어 오고 있다. VR의 화상의 경우, 서버는, 오른쪽눈용 및 왼쪽눈용의 시점 화상을 각각 작성하고, Multi-View Coding(MVC) 등에 의해 각 시점 영상간에서 참조를 허용하는 부호화를 행해도 되고, 서로 참조하지 않고 별도 스트림으로서 부호화해도 된다. 별도 스트림의 복호 시에는, 사용자의 시점에 따라 가상적인 3차원 공간이 재현되도록 서로 동기시켜 재생하면 된다.

AR의 화상의 경우에는, 서버는, 현실 공간의 카메라 정보에, 가상 공간 상의 가상 물체 정보를, 3차원적 위치 또는 사용자의 시점의 움직임에 기초하여 중첩한다. 복호 장치는, 가상 물체 정보 및 3차원 데이터를 취득 또는 유지하고, 사용자의 시점의 움직임에 따라 2차원 화상을 생성하고, 부드럽게 연결함으로써 중첩 데이터를 작성해도 된다. 또는, 복호 장치는 가상 물체 정보의 의뢰에 더하여 사용자의 시점의 움직임을 서버에 송신하고, 서버는, 서버에 유지되는 3차원 데이터로부터 수신한 시점의 움직임에 맞추어 중첩 데이터를 작성하고, 중첩 데이터를 부호화하여 복호 장치에 전송해도 된다. 또한, 중첩 데이터는, RGB 이외에 투과도를 나타내는 α값을 갖고, 서버는, 3차원 데이터로부터 작성된 오브젝트 이외의 부분의 α값을 0 등으로 설정하고, 당해 부분이 투과하는 상태에서 부호화해도 된다. 혹은, 서버는, 크로마키와 같이 소정의 값의 RGB값을 배경으로 설정하고, 오브젝트 이외의 부분은 배경색으로 한 데이터를 생성해도 된다.

동일하게 전송된 데이터의 복호 처리는 클라이언트인 각 단말에서 행해도 되고, 서버측에서 행해도 되고, 서로 분담하여 행해도 된다. 일례로서, 어느 단말이, 일단 서버에 수신 리퀘스트를 보내고, 그 리퀘스트에 따른 컨텐츠를 다른 단말에서 수신하여 복호 처리를 행하고, 디스플레이를 갖는 장치에 복호가 끝난 신호가 송신되어도 된다. 통신 가능한 단말 자체의 성능에 관계없이 처리를 분산하여 적절한 컨텐츠를 선택함으로써 화질이 좋은 데이터를 재생할 수 있다. 또한, 다른 예로서 큰 사이즈의 화상 데이터를 TV 등으로 수신하면서, 감상자의 개인 단말에 픽처가 분할된 타일 등 일부의 영역이 복호되어 표시되어도 된다. 이에 의해, 전체 상을 공유화하면서, 자신의 담당 분야 또는 보다 더 상세하게 확인하고 싶은 영역을 가까이에서 확인할 수 있다.

또한 앞으로는, 실내외에 관계없이 근거리, 중거리, 또는 장거리의 무선 통신이 복수 사용 가능한 상황 하에서, MPEG-DASH 등의 전송 시스템 규격을 이용하여, 접속중인 통신에 대하여 적절한 데이터를 전환하면서 심리스하게 컨텐츠를 수신하는 것이 예상된다. 이에 의해, 사용자는, 자신의 단말뿐만 아니라 실내외에 설치된 디스플레이 등의 복호 장치 또는 표시 장치를 자유롭게 선택하면서 실시간으로 전환할 수 있다. 또한, 자신의 위치 정보 등에 기초하여, 복호하는 단말 및 표시하는 단말을 전환하면서 복호를 행할 수 있다. 이에 의해, 목적지로의 이동 중에, 표시 가능한 디바이스가 매입(埋入)된 이웃 건물의 벽면 또는 지면의 일부에 지도 정보를 표시시키면서 이동하는 것도 가능해진다. 또한, 부호화 데이터가 수신 단말로부터 단시간에 액세스할 수 있는 서버에 캐시되어 있거나, 또는, 컨텐츠·딜리버리·서비스에 있어서의 에지 서버에 카피되어 있는 등의 네트워크 상에서의 부호화 데이터에의 액세스 용이성에 기초하여, 수신 데이터의 비트레이트를 전환하는 것도 가능하다.

[스케일러블 부호화]

컨텐츠의 전환에 관하여, 도 25에 나타내는, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법을 응용하여 압축 부호화된 스케일러블한 스트림을 이용하여 설명한다. 서버는, 개별 스트림으로서 내용은 동일하고 질이 상이한 스트림을 복수 갖고 있어도 상관없지만, 도시하는 바와 같이 레이어로 나누어 부호화를 행함으로써 실현되는 시간적/공간적 스케일러블한 스트림의 특징을 살려, 컨텐츠를 전환하는 구성이어도 된다. 즉, 복호측이 성능이라는 내적 요인과 통신 대역의 상태 등의 외적 요인에 따라 어느 레이어까지 복호할지를 결정함으로써, 복호측은, 저해상도의 컨텐츠와 고해상도의 컨텐츠를 자유롭게 전환하여 복호할 수 있다. 예를 들면 이동 중에 스마트폰(ex115)으로 시청하고 있던 영상을, 귀가 후에 인터넷 TV 등의 기기로 이어서 시청하고자 하는 경우에는, 당해 기기는, 동일한 스트림을 상이한 레이어까지 복호하면 되므로, 서버측의 부담을 경감할 수 있다.

또한, 상기와 같이, 레이어마다 픽처가 부호화되어 있고, 베이스 레이어의 상위에 인핸스먼트 레이어가 존재하는 스케일러빌리티를 실현하는 구성 이외에, 인핸스먼트 레이어가 화상의 통계 정보 등에 기초한 메타 정보를 포함하고, 복호측이, 메타 정보에 기초하여 베이스 레이어의 픽처를 초해상함으로써 고화질화한 컨텐츠를 생성해도 된다. 초해상이란, 동일 해상도에 있어서의 SN비의 향상, 및 해상도의 확대 중 어느 것이어도 된다. 메타 정보는, 초해상 처리에 이용하는 선형 혹은 비선형의 필터 계수를 특정하기 위한 정보, 또는, 초해상 처리에 이용하는 필터 처리, 기계 학습 혹은 최소 제곱 연산에서의 파라미터값을 특정하는 정보 등을 포함한다.

또는, 화상 내의 오브젝트 등의 의미에 따라 픽처가 타일 등으로 분할되어 있고, 복호측이, 복호할 타일을 선택함으로써 일부의 영역만을 복호하는 구성이어도 된다. 또한, 오브젝트의 속성(인물, 자동차, 볼 등)과 영상 내의 위치(동일 화상에 있어서의 좌표 위치 등)를 메타 정보로서 저장함으로써, 복호측은, 메타 정보에 기초하여 원하는 오브젝트의 위치를 특정하고, 그 오브젝트를 포함하는 타일을 결정할 수 있다. 예를 들면, 도 26에 나타내는 바와 같이, 메타 정보는, HEVC에 있어서의 SEI 메시지 등 화소 데이터와는 상이한 데이터 저장 구조를 이용하여 저장된다. 이 메타 정보는, 예를 들면, 메인 오브젝트의 위치, 사이즈, 또는 색채 등을 나타낸다.

또한, 스트림, 시퀀스 또는 랜덤 액세스 단위 등, 복수의 픽처로 구성되는 단위로 메타 정보가 저장되어도 된다. 이에 의해, 복호측은, 특정 인물이 영상 내에 출현하는 시각 등을 취득할 수 있고, 픽처 단위의 정보와 합침으로써, 오브젝트가 존재하는 픽처, 및 픽처 내에서의 오브젝트의 위치를 특정할 수 있다.

[Web 페이지의 최적화]

도 27은, 컴퓨터(ex111) 등에서의 web 페이지의 표시 화면예를 나타내는 도면이다. 도 28은, 스마트폰(ex115) 등에서의 web 페이지의 표시 화면예를 나타내는 도면이다. 도 27 및 도 28에 나타내는 바와 같이 web 페이지가, 화상 컨텐츠에의 링크인 링크 화상을 복수 포함하는 경우가 있으며, 열람하는 디바이스에 따라 그 외관은 상이하다. 화면 상에 복수의 링크 화상이 보이는 경우에는, 사용자가 명시적으로 링크 화상을 선택할 때까지, 또는 화면의 중앙 부근에 링크 화상이 가까워지거나 혹은 링크 화상 전체가 화면 내에 들어올때까지는, 표시장치(복호 장치)는, 링크 화상으로서 각 컨텐츠가 갖는 정지 화상 또는 I픽처를 표시하거나, 복수의 정지 화상 또는 I픽처 등으로 gif 애니메이션과 같은 영상을 표시하거나, 베이스 레이어만 수신하여 영상을 복호 및 표시하거나 한다.

사용자에 의해 링크 화상이 선택된 경우, 표시장치는, 베이스 레이어를 최우선으로 하여 복호한다. 또한, web 페이지를 구성하는 HTML에 스케일러블한 컨텐츠임을 나타내는 정보가 있으면, 표시장치는, 인핸스먼트 레이어까지 복호해도 된다. 또한, 실시간성을 담보하기 위해서, 선택되기 전 또는 통신 대역이 매우 엄격한 경우에는, 표시장치는, 전방 참조의 픽처(I픽처, P픽처, 전방 참조만의 B픽처)만을 복호 및 표시함으로써, 선두 픽처의 복호 시각과 표시 시각의 사이의 지연(컨텐츠의 복호 개시로부터 표시 개시까지의 지연)을 저감할 수 있다. 또한, 표시장치는, 픽처의 참조 관계를 일부러 무시하여 모든 B픽처 및 P픽처를 전방 참조로 하여 거칠게 복호하고, 시간이 지나 수신한 픽처가 증가함에 따라 정상적인 복호를 행해도 된다.

[자동 주행]

또한, 자동차의 자동 주행 또는 주행 지원을 위해 2차원 또는 3차원의 지도 정보 등의 정지 화상 또는 영상 데이터를 송수신하는 경우, 수신 단말은, 1 이상의 레이어에 속하는 화상 데이터에 더하여, 메타 정보로서 날씨 또는 공사 정보 등도 수신하고, 이들을 대응지어 복호해도 된다. 또한, 메타 정보는, 레이어에 속해도 되고, 단순히 화상 데이터와 다중화되어도 된다.

이 경우, 수신 단말을 포함하는 자동차, 드론 또는 비행기 등이 이동하기 때문에, 수신 단말은, 당해 수신 단말의 위치 정보를 수신 요구 시에 송신함으로써, 기지국(ex106~ex110)을 전환하면서 심리스한 수신 및 복호를 실현할 수 있다. 또한, 수신 단말은, 사용자의 선택, 사용자의 상황 또는 통신 대역 상태에 따라, 메타 정보를 어느 정도 수신할지, 또는 지도 정보를 어느 정도 갱신해 나갈지를 동적으로 전환하는 것이 가능해진다.

이상과 같이 하여, 컨텐츠 공급 시스템(ex100)에서는, 사용자가 송신한 부호화된 정보를 실시간으로 클라이언트가 수신하여 복호하고, 재생할 수 있다.

[개인 컨텐츠의 전송]

또한, 컨텐츠 공급 시스템(ex100)에서는, 영상 전송 업자에 의한 고화질이며 장시간인 컨텐츠뿐만 아니라, 개인에 의한 저화질이며 단시간인 컨텐츠의 유니캐스트, 또는 멀티캐스트 전송이 가능하다. 또한, 이러한 개인 컨텐츠는 앞으로도 증가해 갈 것으로 생각된다. 개인 컨텐츠를 더욱 뛰어난 컨텐츠로 하기 위해서, 서버는, 편집 처리를 행하고 나서 부호화 처리를 행해도 된다. 이는 예를 들면, 이하와 같은 구성으로 실현할 수 있다.

촬영 시에 실시간 또는 축적하여 촬영 후에, 서버는, 원화상 또는 부호화가 끝난 데이터로부터 촬영 에러, 장면 탐색, 의미의 해석, 및 오브젝트 검출 등의 인식 처리를 행한다. 그리고, 서버는, 인식 결과에 기초하여 수동 또는 자동으로, 핀트 어긋남 또는 손떨림 등을 보정하거나, 명도가 다른 픽처에 비해 낮거나 또는 초점이 맞지 않은 장면 등의 중요성이 낮은 장면을 삭제하거나, 오브젝트의 에지를 강조하거나, 색조를 변화시키는 등의 편집을 행한다. 서버는, 편집 결과에 기초하여 편집 후의 데이터를 부호화한다. 또한 촬영 시각이 너무 길면 시청률이 떨어진다는 것도 알려져 있어, 서버는, 촬영 시간에 따라 특정 시간 범위 내의 컨텐츠가 되도록 상기와 같이 중요성이 낮은 장면뿐만 아니라 움직임이 적은 장면 등을, 화상 처리 결과에 기초하여 자동으로 클립해도 된다. 또는, 서버는, 장면의 의미 해석의 결과에 기초하여 다이제스트를 생성하여 부호화해도 된다.

또한, 개인 컨텐츠에는, 그대로는 저작권, 저작자 인격권, 또는 초상권 등의 침해가 되는 것이 찍혀 있는 케이스도 있고, 공유하는 범위가 의도한 범위를 초과해버리는 등 개인에게 있어 불편한 경우도 있다. 따라서, 예를 들면, 서버는, 화면의 주변부의 사람의 얼굴, 또는 집안 등을 일부러 초점이 맞지 않는 화상으로 변경하여 부호화해도 된다. 또한, 서버는, 부호화 대상 화상 내에, 미리 등록한 인물과는 다른 인물의 얼굴이 찍혀 있는지 여부를 인식하고, 찍혀 있는 경우에는, 얼굴 부분에 모자이크를 거는 등의 처리를 행해도 된다. 또는, 부호화의 전처리 또는 후처리로서, 저작권 등의 관점에서 사용자가 화상을 가공하고자 하는 인물 또는 배경 영역을 지정하고, 서버는, 지정된 영역을 다른 영상으로 치환하거나, 또는 초점을 흐리는 등의 처리를 행하는 것도 가능하다. 인물이라면, 동화상에 있어서 인물을 트래킹하면서, 얼굴 부분의 영상을 치환할 수 있다.

또한, 데이터량이 작은 개인 컨텐츠의 시청은 실시간성의 요구가 강하기 때문에, 대역폭에도 따르지만, 복호 장치는, 우선 베이스 레이어를 최우선으로 수신하여 복호 및 재생을 행한다. 복호 장치는, 이 사이에 인핸스먼트 레이어를 수신하고, 재생이 루프되는 경우 등 2회 이상 재생되는 경우에, 인핸스먼트 레이어도 포함시켜 고화질의 영상을 재생해도 된다. 이와 같이 스케일러블한 부호화가 행해지고 있는 스트림이라면, 미선택 시 또는 보기 시작한 단계에서는 거친 동영상이지만, 서서히 스트림이 스마트해져 화상이 양호해지는 체험을 제공할 수 있다. 스케일러블 부호화 이외에도, 1회째에 재생되는 거친 스트림과, 1회째의 동영상을 참조하여 부호화되는 2회째의 스트림이 하나의 스트림으로서 구성되어 있어도 동일한 체험을 제공할 수 있다.

[그 외의 사용예]

또한, 이들 부호화 또는 복호 처리는, 일반적으로 각 단말이 갖는 LSI(ex500)에서 처리된다. LSI(ex500)는, 원 칩이어도 되고 복수 칩으로 이루어지는 구성이어도 된다. 또한, 동화상 부호화 또는 복호용 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플렉시블 디스크, 또는 하드 디스크 등)에 장착하고, 그 소프트웨어를 이용하여 부호화 또는 복호 처리를 행해도 된다. 또한, 스마트폰(ex115)이 카메라가 부착된 경우에는, 그 카메라로 취득한 동영상 데이터를 송신해도 된다. 이때의 동영상 데이터는 스마트폰(ex115)이 갖는 LSI(ex500)에서 부호화 처리된 데이터이다.

또한, LSI(ex500)는, 어플리케이션 소프트를 다운로드하여 액티베이트하는 구성이어도 된다. 이 경우, 단말은, 우선, 당해 단말이 컨텐츠의 부호화 방식에 대응하고 있는지, 또는, 특정 서비스의 실행 능력을 갖는지를 판정한다. 단말이 컨텐츠의 부호화 방식에 대응하고 있지 않은 경우, 또는, 특정 서비스의 실행 능력을 갖지 않는 경우, 단말은, 코덱 또는 어플리케이션 소프트를 다운로드하고, 그 후, 컨텐츠 취득 및 재생한다.

또한, 인터넷(ex101)을 통한 컨텐츠 공급 시스템(ex100)에 한정하지 않고, 디지털 방송용 시스템에도 상기 각 실시 형태의 적어도 동화상 부호화 장치(화상 부호화 장치) 또는 동화상 복호화 장치(화상 복호 장치) 중 어느 하나를 장착할 수 있다. 위성 등을 이용하여 방송용 전파에 영상과 소리가 다중화된 다중화 데이터를 실어 송수신하기 때문에, 컨텐츠 공급 시스템(ex100)의 유니캐스트가 하기 쉬운 구성에 대하여 멀티캐스트에 적합하다고 하는 차이가 있지만 부호화 처리 및 복호 처리에 관해서는 동일한 응용이 가능하다.

[하드웨어 구성]

도 29는, 스마트폰(ex115)을 나타내는 도면이다. 또한, 도 30은, 스마트폰(ex115)의 구성예를 나타내는 도면이다. 스마트폰(ex115)은, 기지국(ex110)과의 사이에서 전파를 송수신하기 위한 안테나(ex450)와, 영상 및 정지 화상을 찍는 것이 가능한 카메라부(ex465)와, 카메라부(ex465)에서 촬상한 영상, 및 안테나(ex450)에서 수신한 영상 등이 복호된 데이터를 표시하는 표시부(ex458)를 구비한다. 스마트폰(ex115)은, 또한, 터치 패널 등인 조작부(ex466)와, 음성 또는 음향을 출력하기 위한 스피커 등인 음성 출력부(ex457)와, 음성을 입력하기 위한 마이크 등인 음성 입력부(ex456)와, 촬영한 영상 혹은 정지 화상, 녹음한 음성, 수신한 영상 혹은 정지 화상, 메일 등의 부호화된 데이터, 또는, 복호화된 데이터를 보존 가능한 메모리부(ex467)와, 사용자를 특정하고, 네트워크를 비롯해 각종 데이터에의 액세스의 인증을 하기 위한 SIM(ex468)과의 인터페이스부인 슬롯부(ex464)를 구비한다. 또한, 메모리부(ex467) 대신에 외장형 메모리가 이용되어도 된다.

또한, 표시부(ex458) 및 조작부(ex466) 등을 통괄적으로 제어하는 주제어부(ex460)와, 전원 회로부(ex461), 조작 입력 제어부(ex462), 영상 신호 처리부(ex455), 카메라 인터페이스부(ex463), 디스플레이 제어부(ex459), 변조/복조부(ex452), 다중/분리부(ex453), 음성 신호 처리부(ex454), 슬롯부(ex464), 및 메모리부(ex467)가 버스(ex470)를 통해 접속되어 있다.

전원 회로부(ex461)는, 사용자의 조작에 의해 전원 키가 온 상태로 되면, 배터리 팩으로부터 각 부에 대하여 전력을 공급함으로써 스마트폰(ex115)을 동작 가능한 상태로 기동한다.

스마트폰(ex115)은, CPU, ROM 및 RAM 등을 갖는 주제어부(ex460)의 제어에 기초하여, 통화 및 데이터 통신 등의 처리를 행한다. 통화 시에는, 음성 입력부(ex456)에서 수음한 음성 신호를 음성 신호 처리부(ex454)에서 디지털 음성 신호로 변환하고, 이것을 변조/복조부(ex452)에서 스펙트럼 확산 처리하고, 송신/수신부(ex451)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex450)를 통해 송신한다. 또한 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변조/복조부(ex452)에서 스펙트럼 역확산 처리하고, 음성 신호 처리부(ex454)에서 아날로그 음성 신호로 변환한 후, 이것을 음성 출력부(ex457)로부터 출력한다. 데이터 통신 모드시에는, 본체부의 조작부(ex466) 등의 조작에 의해 텍스트, 정지 화상, 또는 영상 데이터가 조작 입력 제어부(ex462)를 통해 주제어부(ex460)로 송출되고, 동일하게 송수신 처리가 행해진다. 데이터 통신 모드시에 영상, 정지 화상, 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부(ex455)는, 메모리부(ex467)에 보존되어 있는 영상 신호 또는 카메라부(ex465)로부터 입력된 영상 신호를 상기 각 실시 형태에서 나타낸 동화상 부호화 방법에 의해 압축 부호화하고, 부호화된 영상 데이터를 다중/분리부(ex453)로 송출한다. 또한, 음성 신호 처리부(ex454)는, 영상 또는 정지 화상 등을 카메라부(ex465)에서 촬상 중에 음성 입력부(ex456)에서 수음한 음성 신호를 부호화하고, 부호화된 음성 데이터를 다중/분리부(ex453)로 송출한다. 다중/분리부(ex453)는, 부호화가 끝난 영상 데이터와 부호화가 끝난 음성 데이터를 소정의 방식으로 다중화하고, 변조/복조부(변조/복조 회로부)(ex452), 및 송신/수신부(ex451)에서 변조 처리 및 변환 처리를 실시하여 안테나(ex450)를 통해 송신한다.

전자 메일 또는 채팅에 첨부된 영상, 또는 웹 페이지 등에 링크된 영상을 수신한 경우, 안테나(ex450)를 통해 수신된 다중화 데이터를 복호하기 위해서, 다중/분리부(ex453)는, 다중화 데이터를 분리함으로써, 다중화 데이터를 영상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누고, 동기 버스(ex470)를 통해 부호화된 영상 데이터를 영상 신호 처리부(ex455)에 공급함과 더불어, 부호화된 음성 데이터를 음성 신호 처리부(ex454)에 공급한다. 영상 신호 처리부(ex455)는, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법에 대응한 동화상 복호화 방법에 의해 영상 신호를 복호하고, 디스플레이 제어부(ex459)를 통해 표시부(ex458)로부터, 링크된 동화상 파일에 포함되는 영상 또는 정지 화상이 표시된다. 또한 음성 신호 처리부(ex454)는, 음성 신호를 복호하고, 음성 출력부(ex457)로부터 음성이 출력된다. 또한 실시간 스트리밍이 보급되어 있기 때문에, 사용자의 상황에 따라서는 음성의 재생이 사회적으로 바람직하지 않은 경우도 발생할 수 있다. 그 때문에, 초기값으로서는, 음성 신호는 재생하지 않고 영상 데이터만을 재생하는 구성 쪽이 바람직하다. 사용자가 영상 데이터를 클릭하는 등 조작을 행한 경우에만 음성을 동기하여 재생해도 된다.

또한 여기에서는 스마트폰(ex115)을 예로 설명했으나, 단말로서는 부호화기 및 복호화기를 모두 가지는 송수신형 단말 외에, 부호화기만을 가지는 송신 단말, 및 복호화기만을 가지는 수신 단말이라고 하는 세 가지의 실장 형식을 생각할 수 있다. 또한, 디지털 방송용 시스템에 있어서, 영상 데이터에 음성 데이터 등이 다중화된 다중화 데이터를 수신 또는 송신하는 것으로 설명했으나, 다중화 데이터에는, 음성 데이터 이외에 영상에 관련하는 문자 데이터 등이 다중화되어도 되고, 다중화 데이터가 아니라 영상 데이터 자체가 수신 또는 송신되어도 된다.

또한, CPU를 포함하는 주제어부(ex460)가 부호화 또는 복호 처리를 제어하는 것으로 설명했으나, 단말은 GPU를 구비하는 경우도 많다. 따라서, CPU와 GPU에서 공통화된 메모리, 또는 공통으로 사용할 수 있도록 어드레스가 관리되어 있는 메모리에 의해, GPU의 성능을 살려 넓은 영역을 일괄하여 처리하는 구성이어도 된다. 이에 의해 부호화 시간을 단축할 수 있어, 실시간성을 확보하고, 저지연을 실현할 수 있다. 특히 움직임 탐색, 디블록 필터, SAO(Sample Adaptive Offset), 및 변환·양자화의 처리를, CPU가 아니라, GPU에서 픽처 등의 단위로 일괄하여 행하면 효율적이다.

본 개시는, 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법에 적용할 수 있다.

100: 부호화 장치 102: 분할부
104: 감산부 106: 변환부
108: 양자화부 110: 엔트로피 부호화부
112, 204: 역양자화부 114, 206: 역변환부
116, 208: 가산부 118, 210: 블록 메모리
120, 212: 루프 필터부 122, 214: 프레임 메모리
124, 216: 인트라 예측부 126, 218: 인터 예측부
128, 220: 예측 제어부 200: 복호 장치
202: 엔트로피 복호부

Claims

처리 회로와,
상기 처리 회로에 접속된 메모리를 구비하고,
상기 처리 회로는, 상기 메모리를 이용하여,
제1 휘도 블록과 제2 휘도 블록의 제1 경계에 대하여 필터 처리를 행하고,
제1 색차 블록과 제2 색차 블록의 제2 경계에 대하여 필터 처리를 행하고,
상기 제1 경계에 대한 필터 처리에 있어,
상기 제1 경계에 수직으로 교차하는 직선상에 늘어선, 상기 제1 휘도 블록 및 상기 제2 휘도 블록에 포함되는 복수의 휘도 샘플의 값의 변화 후의 값이 각 제1 클립 폭 내가 되는(변화 후의 값과 제1 클립 폭이 동일한 경우를 포함) 클립 처리를 이용하여, 상기 복수의 휘도 샘플 값을 변경하는 디블록 필터 처리를 행하고,
상기 각 제1 클립 폭은, 상기 제1 휘도 블록 및 상기 제2 휘도 블록의 사이즈에 기초하여, 상기 제1 경계에 대하여 비대칭으로 설정되는, 복호 장치.
청구항 1에 있어서,
상기 제1 휘도 블록에 포함된 제1 위치의 화소에 대한 상기 제1 클립 폭과, 상기 제2 휘도 블록에 포함되며, 또한, 상기 제1 경계를 사이에 두고 상기 제1 위치와 대칭 위치에 있는 제2 위치의 화소에 대한 상기 제1 클립 폭이 상이한, 복호 장치.
처리 회로와,
상기 처리 회로에 접속된 메모리를 구비하고,
상기 처리 회로는, 상기 메모리를 이용하여,
제1 휘도 블록과 제2 휘도 블록의 제1 경계에 대하여 필터 처리를 행하고,
제1 색차 블록과 제2 색차 블록의 제2 경계에 대하여 필터 처리를 행하고,
상기 제1 경계에 대한 필터 처리에 있어,
상기 제1 경계에 수직으로 교차하는 직선상에 늘어선, 상기 제1 휘도 블록 및 상기 제2 휘도 블록에 포함되는 복수의 휘도 샘플의 값의 변화 후의 값이 각 제1 클립 폭 내가 되는(변화 후의 값과 제1 클립 폭이 동일한 경우를 포함) 클립 처리를 이용하여, 상기 복수의 휘도 샘플 값을 변경하는 디블록 필터 처리를 행하고,
상기 각 제1 클립 폭은, 상기 제1 휘도 블록 및 상기 제2 휘도 블록의 사이즈에 기초하여, 상기 제1 경계에 대하여 비대칭으로 설정되는, 부호화 장치.
청구항 3에 있어서,
상기 제1 휘도 블록에 포함된 제1 위치의 화소에 대한 상기 제1 클립 폭과, 상기 제2 휘도 블록에 포함되며, 또한, 상기 제1 경계를 사이에 두고 상기 제1 위치와 대칭 위치에 있는 제2 위치의 화소에 대한 상기 제1 클립 폭이 상이한, 부호화 장치.
비트스트림을 저장하는 기록 매체로서,
상기 비트스트림은, 휘도의 재구성 화상에 기초하여 부호화된 휘도 화상과, 색차의 재구성 화상에 기초하여 부호화된 색차 화상을 포함하며,
상기 휘도의 재구성 화상에 포함된 제1 휘도 블록과 제2 휘도 블록의 제1 경계 및 상기 색차의 재구성 화상에 포함된 제1 색차 블록과 제2 색차 블록의 제2 경계에는 필터 처리가 실시되어 있으며,
상기 제1 휘도 블록과 상기 제2 휘도 블록은,
상기 제1 경계에 수직으로 교차하는 직선상에 늘어선, 상기 제1 휘도 블록 및 상기 제2 휘도 블록에 포함되는 복수의 휘도 샘플을 포함하고,
상기 복수의 휘도 샘플은, 변화 후의 값이 각 제1 클립 폭 내가 되는(변화 후의 값과 제1 클립 폭이 동일한 경우를 포함) 클립 처리를 이용하여, 값이 변경되어 있으며,
상기 비트스트림은 상기 제1 휘도 블록 및 상기 제2 휘도 블록의 사이즈에 관한 정보를 포함하며,
상기 각 제1 클립 폭은, 상기 사이즈에 기초하여, 상기 제1 경계에 대하여 비대칭으로 설정되는, 기록 매체.
청구항 5에 있어서,
상기 제1 휘도 블록에 포함된 제1 위치의 화소에 대한 상기 제1 클립 폭과, 상기 제2 휘도 블록에 포함되며, 또한, 상기 제1 경계를 사이에 두고 상기 제1 위치와 대칭 위치에 있는 제2 위치의 화소에 대한 상기 제1 클립 폭이 상이한, 기록 매체.