KR101837882B1

KR101837882B1 - 화상 처리 장치 및 화상 처리 방법

Info

Publication number: KR101837882B1
Application number: KR1020167024219A
Authority: KR
Inventors: 가즈시 사토
Original assignee: 벨로스 미디어 인터내셔널 리미티드
Priority date: 2010-12-09
Filing date: 2011-10-14
Publication date: 2018-03-12
Also published as: BR112013013513B1; KR20160108577A; RU2016122534A3; CN105282552A; CN105791844A; EP4199518B1; PH12015501376A1; US20140369620A1; MY165377A; EP3113493B2; CA2997241C; RU2013125499A; CO6710956A2; HK1219599A1; RU2598593C2; EP2955921B1; CA2997244A1; US20190327472A1; KR101837796B1; CN103238328B

Abstract

본 발명의 과제는, 양자화 행렬의 수가 많아지는 경우의 부호량의 증가를 억제하는 것이다.
크기가 상이한 복수의 변환 단위로부터, 복호되는 화상 데이터의 역직교 변환을 위하여 사용되는 변환 단위를 선택하는 선택부와, 제1 크기의 변환 단위에 대응하는 제1 양자화 행렬로부터, 제2 크기의 변환 단위에 대응하는 제2 양자화 행렬을 생성하는 생성부와, 상기 선택부에 의해 상기 제2 크기의 변환 단위가 선택된 경우에, 상기 생성부에 의해 생성된 상기 제2 양자화 행렬을 사용하여 상기 화상 데이터의 변환 계수 데이터를 역양자화하는 역양자화부를 구비하는 화상 처리 장치를 제공한다.

Description

화상 처리 장치 및 화상 처리 방법{IMAGE PROCESSING DEVICE AND IMAGE PROCESSING METHOD}

본 발명은 화상 처리 장치 및 화상 처리 방법에 관한 것이다.

영상 부호화 방식의 표준 사양의 하나인 H.264/AVC에서는, High Profile 이상의 프로파일에 있어서, 화상 데이터의 양자화 시에 직교 변환 계수의 성분마다 상이한 양자화 스텝을 사용할 수 있다. 직교 변환 계수 성분마다의 양자화 스텝은, 직교 변환의 단위와 동등한 사이즈로 정의되는 양자화 행렬(스케일링 리스트라고도 함) 및 기준의 스텝값에 기초하여 설정될 수 있다.

도 19는, H.264/AVC에 있어서 미리 정의되어 있는 4종류의 양자화 행렬의 기정값(디폴트값)을 나타내고 있다. 예를 들어, 인트라 예측 모드에서 변환 단위의 사이즈가 4×4인 경우에는 행렬SL01이 양자화 행렬의 기정값이다. 인터 예측 모드에서 변환 단위의 크기가 4×4인 경우에는 행렬SL02가 양자화 행렬의 기정값이다. 인트라 예측 모드에서 변환 단위의 크기가 8×8인 경우에는 행렬SL03이 양자화 행렬의 기정값이다. 인터 예측 모드에서 변환 단위의 크기가 8×8인 경우에는 행렬SL04가 양자화 행렬의 기정값이다. 또한, 유저는 시퀀스 파라미터 세트 또는 픽처 파라미터 세트에 있어서, 도 19에 나타낸 기정값과는 상이한 독자의 양자화 행렬을 지정할 수 있다. 양자화 행렬이 사용되지 않을 경우에는, 양자화 시에 사용되는 양자화 스텝은 모든 성분에 대하여 동등한 값이 된다.

H.264/AVC에 이어지는 차세대의 영상 부호화 방식으로서 표준화가 진행되고 있는 HEVC(High Efficiency Video Coding)에서는, 종래의 매크로 블록에 상당하는 부호화 단위(CU: Coding Unit)라고 하는 개념이 도입되어 있다(하기 비특허문헌 1 참조). 부호화 단위 크기의 범위는, 시퀀스 파라미터 세트에 있어서, LCU(Largest Coding Unit) 및 SCU(Smallest Coding Unit)라고 하는 2의 거듭제곱값의 세트로 지정된다. 그리고, split_flag을 사용하여 LCU 및 SCU에서 지정된 범위 내의 구체적인 부호화 단위의 크기가 특정된다.

HEVC에서는, 1개의 부호화 단위는 1개 이상의 직교 변환의 단위, 즉 1개 이상의 변환 단위(Transform Unit: TU)로 분할될 수 있다. 변환 단위의 크기로는 4×4, 8×8, 16×16 및 32×32 중 어느 하나가 이용 가능하다. 따라서, 양자화 행렬도 또한, 이들 변환 단위의 후보 크기마다 지정될 수 있다.

그런데, H.264/AVC에서는, JM(Joint Model)이라고 불리는 공개된 참조 소프트웨어(http://iphome.hhi.de/suehring/tml/index.htm)에 있어서 사양화되어 있는 바와 같이, 1픽처 내에서 하나의 변환 단위의 크기에 대해서 하나의 양자화 행렬만을 지정하는 것이 가능하였다. 이에 비해, 하기 비특허문헌 2는, 1픽처 내에서 하나의 변환 단위의 크기에 대하여 복수의 양자화 행렬의 후보를 지정하고, RD(Rate-Distortion)의 최적화의 관점에서 블록마다 적절하게 양자화 행렬을 선택하는 것을 제안하고 있다.

<선행기술문헌>

(비특허문헌 1)JCTVC-B205, "Test Model under Consideration", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 2nd Meeting: Geneva, CH, 21-28 July, 2010

(비특허문헌 2)VCEG-AD 06, "Adaptive Quantization Matrix Selection on KTA Software", ITU-Telecommunications Standardization Sector STUDY GROUP 16 Question 6 Video Coding Experts Group (VCEG) 30th Meeting: Hangzhou, China, 23-24 October, 2006

그러나, 선택 가능한 변환 단위 크기의 종류가 많아지면, 대응하는 양자화 행렬의 수도 증가하고, 양자화 행렬의 부호량의 증가가 부호화 효율의 저하를 초래할 수 있다. 또한, 이러한 부호화 효율의 저하는, 변환 단위의 크기마다 지정 가능한 양자화 행렬의 수가 1개에서 복수가 되면, 보다 현저해질 우려도 있다.

따라서, 본 개시에 관한 기술은, 양자화 행렬의 수가 많아지는 경우의 부호량의 증가를 억제할 수 있는 화상 처리 장치 및 화상 처리 방법을 제공하려고 하는 것이다.

어떤 실시 형태에 따르면, 크기가 상이한 복수의 변환 단위로부터, 복호되는 화상 데이터의 역직교 변환을 위하여 사용되는 변환 단위를 선택하는 선택부와, 제1 크기의 변환 단위에 대응하는 제1 양자화 행렬로부터, 제2 크기의 변환 단위에 대응하는 제2 양자화 행렬을 생성하는 생성부와, 상기 선택부에 의해 상기 제2 크기의 변환 단위가 선택된 경우에, 상기 생성부에 의해 생성된 상기 제2 양자화 행렬을 사용하여 상기 화상 데이터의 변환 계수 데이터를 역양자화하는 역양자화부를 구비하는 화상 처리 장치가 제공된다.

상기 화상 처리 장치는 전형적으로는 화상을 복호하는 화상 복호 장치로서 실현될 수 있다.

또한, 상기 생성부는, 상기 제1 양자화 행렬을 특정하는 행렬 정보, 및 상기 제1 양자화 행렬로부터 예측되는 상기 제2 크기의 예측 행렬과 상기 제2 양자화 행렬의 차분을 나타내는 차분 정보를 사용하여 상기 제2 양자화 행렬을 생성해도 된다.

또한, 상기 생성부는, 시퀀스 파라미터 세트 또는 픽처 파라미터 세트로부터 상기 행렬 정보 및 상기 차분 정보를 취득해도 된다.

또한, 상기 생성부는, 상기 예측 행렬과 상기 제2 양자화 행렬의 차분이 존재하지 않는 것을 나타내는 제1 플래그가 시퀀스 파라미터 세트 또는 픽처 파라미터 세트로부터 취득된 경우에는 상기 예측 행렬을 상기 제2 양자화 행렬로 해도 된다.

또한, 상기 제1 크기는 상기 복수의 변환 단위의 크기 중 최소의 크기이어도 된다.

또한, 상기 제2 크기는 상기 제1 크기보다도 크고, 상기 생성부는 상기 제1 양자화 행렬에 있어서 서로 인접하는 제1 요소와 제2 요소의 사이의 요소로서 상기 제1 요소 또는 상기 제2 요소를 복제함으로써 상기 예측 행렬을 산출해도 된다.

또한, 상기 제2 크기는 상기 제1 크기보다도 크고, 상기 생성부는 상기 제1 양자화 행렬에 있어서 서로 인접하는 제1 요소와 제2 요소의 사이의 요소를 선형 보간함으로써 상기 예측 행렬을 산출해도 된다.

또한, 상기 제2 크기는 한 변에 있어서 상기 제1 크기의 2배이어도 된다.

또한, 상기 제2 크기는 상기 제1 크기보다도 작고, 상기 생성부는 상기 제1 양자화 행렬의 요소를 씨닝함으로써 상기 예측 행렬을 산출해도 된다.

또한, 상기 제2 크기는 상기 제1 크기보다도 작고, 상기 생성부는 상기 제1 양자화 행렬에 있어서 서로 인접하는 복수의 요소의 평균을 계산함으로써 상기 예측 행렬을 산출해도 된다.

또한, 상기 생성부는, 상기 제2 양자화 행렬에 대하여 유저에 의해 정의된 행렬의 사용을 지정하는 제2 플래그가 시퀀스 파라미터 세트 또는 픽처 파라미터 세트로부터 취득된 경우에 상기 제1 양자화 행렬로부터 상기 제2 양자화 행렬을 생성해도 된다.

또한, 다른 실시 형태에 따르면, 크기가 상이한 복수의 변환 단위로부터, 복호되는 화상 데이터의 역직교 변환을 위하여 사용되는 변환 단위를 선택하는 것과, 제1 크기의 변환 단위에 대응하는 제1 양자화 행렬로부터, 제2 크기의 변환 단위에 대응하는 제2 양자화 행렬을 생성하는 것과, 상기 제2 크기의 변환 단위가 선택된 경우에 상기 제1 양자화 행렬로부터 생성된 상기 제2 양자화 행렬을 사용하여 상기 화상 데이터의 변환 계수 데이터를 역양자화하는 것을 포함하는 화상 처리 방법이 제공된다.

또한, 다른 실시 형태에 따르면, 크기가 상이한 복수의 변환 단위로부터, 부호화되는 화상 데이터의 직교 변환을 위하여 사용되는 변환 단위를 선택하는 선택부와, 상기 선택부에 의해 선택된 변환 단위로 상기 화상 데이터를 직교 변환함으로써 생성된 변환 계수 데이터를, 상기 선택된 변환 단위에 대응하는 양자화 행렬을 사용하여 양자화하는 양자화부와, 제1 크기의 변환 단위에 대응하는 제1 양자화 행렬로부터 제2 크기의 변환 단위에 대응하는 제2 양자화 행렬을 생성하기 위한 정보를 부호화하는 부호화부를 구비하는 화상 처리 장치가 제공된다.

상기 화상 처리 장치는 전형적으로는 화상을 부호화하는 화상 부호화 장치로서 실현될 수 있다.

또한, 다른 실시 형태에 따르면, 크기가 상이한 복수의 변환 단위로부터, 부호화되는 화상 데이터의 직교 변환을 위하여 사용되는 변환 단위를 선택하는 것과, 선택된 변환 단위로 상기 화상 데이터를 직교 변환함으로써 생성된 변환 계수 데이터를, 상기 선택된 변환 단위에 대응하는 양자화 행렬을 사용하여 양자화하는 것과, 제1 크기의 변환 단위에 대응하는 제1 양자화 행렬로부터 제2 크기의 변환 단위에 대응하는 제2 양자화 행렬을 생성하기 위한 정보를 부호화하는 것을 포함하는 화상 처리 방법이 제공된다.

이상 설명한 바와 같이, 본 개시에 관한 화상 처리 장치 및 화상 처리 방법에 의하면, 양자화 행렬의 수가 많아지는 경우의 부호량의 증가를 억제할 수 있다.

도 1은 일실시 형태에 관한 화상 부호화 장치의 구성의 일례를 나타내는 블록도이다.
도 2는 일실시 형태에 관한 직교 변환·양자화부의 상세한 구성의 일례를 나타내는 블록도이다.
도 3은 일실시 형태에 관한 행렬 처리부의 더욱 상세한 구성의 일례를 나타내는 블록도이다.
도 4는 일실시 형태에 있어서 시퀀스 파라미터 세트 내에 삽입되는 정보의 일례를 나타내는 설명도이다.
도 5는 일실시 형태에 있어서 픽처 파라미터 세트 내에 삽입되는 정보의 일례를 나타내는 설명도이다.
도 6a는 일실시 형태에 관한 부호화시의 처리 흐름의 제1 예를 나타내는 흐름도의 전반부이다.
도 6b는 일실시 형태에 관한 부호화시의 처리 흐름의 제1 예를 나타내는 흐름도의 후반부이다.
도 7a는 일실시 형태에 관한 부호화시의 처리 흐름의 제2 예를 나타내는 흐름도의 전반부이다.
도 7b는 일실시 형태에 관한 부호화시의 처리 흐름의 제2 예를 나타내는 흐름도의 후반부이다.
도 8은 일실시 형태에 관한 화상 복호 장치의 구성의 일례를 나타내는 블록도이다.
도 9는 일실시 형태에 관한 역양자화·역직교 변환부의 상세한 구성의 일례를 나타내는 블록도이다.
도 10은 일실시 형태에 관한 행렬 생성부의 더욱 상세한 구성의 일례를 나타내는 블록도이다.
도 11a는 일실시 형태에 관한 복호시의 처리 흐름의 제1 예를 나타내는 흐름도의 전반부이다.
도 11b는 일실시 형태에 관한 복호시의 처리 흐름의 제1 예를 나타내는 흐름도의 후반부이다.
도 12a는 일실시 형태에 관한 복호시의 처리 흐름의 제2 예를 나타내는 흐름도의 전반부이다.
도 12b는 일실시 형태에 관한 복호시의 처리 흐름의 제2 예를 나타내는 흐름도의 후반부이다.
도 13a는 하나의 변형예에 관한 부호화시의 처리 흐름의 일례를 나타내는 흐름도의 전반부이다.
도 13b는 하나의 변형예에 관한 부호화시의 처리 흐름의 일례를 나타내는 흐름도의 후반부이다.
도 14a는 하나의 변형예에 관한 복호시의 처리 흐름의 일례를 나타내는 흐름도의 전반부이다.
도 14b는 하나의 변형예에 관한 복호시의 처리 흐름의 일례를 나타내는 흐름도의 후반부이다.
도 15는 텔레비전 장치의 개략적인 구성의 일례를 나타내는 블록도이다.
도 16은 휴대 전화기의 개략적인 구성의 일례를 나타내는 블록도이다.
도 17은 기록 재생 장치의 개략적인 구성의 일례를 나타내는 블록도이다.
도 18은 촬상 장치의 개략적인 구성의 일례를 나타내는 블록도이다.
도 19는 H.264/AVC에 있어서 미리 정의되어 있는 양자화 행렬의 기정값을 나타내는 설명도이다.

이하에 첨부 도면을 참조하면서 본 개시가 적합한 실시 형태에 대하여 상세하게 설명한다. 또한, 본 명세서 및 도면에 있어서, 실질적으로 동일한 기능 구성을 갖는 구성 요소에 대해서는 동일한 부호를 부여함으로써 중복 설명을 생략한다.

또한, 이하의 순서에 따라서 당해 「발명을 실시하기 위한 형태」를 설명한다.

1. 일실시 형태에 관한 화상 부호화 장치의 구성예

1-1. 전체적인 구성예

1-2. 직교 변환·양자화부의 구성예

1-3. 행렬 처리부의 상세한 구성예

1-4. 부호화되는 정보의 예

2. 일실시 형태에 관한 부호화시의 처리 흐름

3. 일실시 형태에 관한 화상 복호 장치의 구성예

3-1. 전체적인 구성예

3-2. 역양자화·역직교 변환부의 구성예

3-3. 행렬 생성부의 상세한 구성예

4. 일실시 형태에 관한 복호시의 처리 흐름

5. 변형예

6. 응용예

7. 정리

<1. 일실시 형태에 관한 화상 부호화 장치의 구성예>

본 절에서는 일실시 형태에 관한 화상 부호화 장치의 구성예에 대하여 설명한다.

[1-1. 전체적인 구성예]

도 1은 일실시 형태에 관한 화상 부호화 장치(10)의 구성의 일례를 나타내는 블록도이다. 도 1을 참조하면, 화상 부호화 장치(10)는 A/D(Analogue to Digital) 변환부(11), 재배열 버퍼(12), 감산부(13), 직교 변환·양자화부(14), 가역 부호화부(16), 축적 버퍼(17), 레이트 제어부(18), 역양자화부(21), 역직교 변환부(22), 가산부(23), 디블록 필터(24), 프레임 메모리(25), 셀렉터(26), 인트라 예측부(30), 움직임 탐색부(40) 및 모드 선택부(50)를 구비한다.

A/D 변환부(11)는 아날로그 형식으로 입력되는 화상 신호를 디지털 형식의 화상 데이터로 변환하고, 일련의 디지털 화상 데이터를 재배열 버퍼(12)로 출력한다.

재배열 버퍼(12)는 A/D 변환부(11)로부터 입력되는 일련의 화상 데이터에 포함되는 화상을 재배열한다. 재배열 버퍼(12)는, 부호화 처리에 관한 GOP(Group of Pictures) 구조에 따라서 화상을 재배열한 후, 재배열 후의 화상 데이터를 감산부(13), 인트라 예측부(30) 및 움직임 탐색부(40)로 출력한다.

감산부(13)에는, 재배열 버퍼(12)로부터 입력되는 화상 데이터, 및 나중에 설명하는 모드 선택부(50)에 의해 선택되는 예측 화상 데이터가 공급된다. 감산부(13)는, 재배열 버퍼(12)로부터 입력되는 화상 데이터와 모드 선택부(50)로부터 입력되는 예측 화상 데이터의 차분인 예측 오차 데이터를 산출하고, 산출한 예측 오차 데이터를 직교 변환·양자화부(14)로 출력한다.

직교 변환·양자화부(14)는, 감산부(13)로부터 입력되는 예측 오차 데이터에 대하여 직교 변환 및 양자화를 행하고, 양자화된 변환 계수 데이터(이하, 양자화 데이터라고 함)를 가역 부호화부(16) 및 역양자화부(21)로 출력한다. 직교 변환·양자화부(14)로부터 출력되는 양자화 데이터의 비트 레이트는, 레이트 제어부(18)로부터의 레이트 제어 신호에 기초하여 제어된다. 직교 변환·양자화부(14)의 상세한 구성에 대해서 나중에 다시 설명한다.

가역 부호화부(16)에는, 직교 변환·양자화부(14)로부터 입력되는 양자화 데이터 및 복호측에서 양자화 행렬을 생성하기 위한 정보, 및 , 모드 선택부(50)에 의해 선택되는 인트라 예측 또는 인터 예측에 관한 정보가 공급된다. 인트라 예측에 관한 정보는, 예를 들어 블록마다 최적인 인트라 예측 모드를 나타내는 예측 모드 정보를 포함할 수 있다. 또한, 인터 예측에 관한 정보는, 예를 들어 블록마다의 움직임 벡터의 예측을 위한 예측 모드 정보, 차분 움직임 벡터 정보 및 참조 화상 정보 등을 포함할 수 있다.

가역 부호화부(16)는, 양자화 데이터에 대하여 가역 부호화 처리를 행함으로써 부호화 스트림을 생성한다. 가역 부호화부(16)에 의한 가역 부호화는, 예를 들어 가변장 부호화, 또는 산술 부호화 등이어도 된다. 또한, 가역 부호화부(16)는, 상세하게 후술하는 양자화 행렬을 생성하기 위한 정보를, 부호화 스트림의 헤더(예를 들어, 시퀀스 파라미터 세트 및 픽처 파라미터 세트) 내에 다중화한다. 또한, 가역 부호화부(16)는, 상술한 인트라 예측에 관한 정보 또는 인터 예측에 관한 정보를 부호화 스트림의 헤더 내에 다중화한다. 그리고, 가역 부호화부(16)는 생성한 부호화 스트림을 축적 버퍼(17)로 출력한다.

축적 버퍼(17)는, 가역 부호화부(16)로부터 입력되는 부호화 스트림을 반도체 메모리 등의 기억 매체를 사용하여 일시적으로 축적한다. 그리고, 축적 버퍼(17)는, 축적한 부호화 스트림을 전송로(또는 화상 부호화 장치(10)로부터의 출력선)의 대역에 따른 레이트로 출력한다.

레이트 제어부(18)는 축적 버퍼(17)의 빈 용량을 감시한다. 그리고, 레이트 제어부(18)는, 축적 버퍼(17)의 빈 용량에 따라서 레이트 제어 신호를 생성하고, 생성한 레이트 제어 신호를 직교 변환·양자화부(14)로 출력한다. 예를 들어, 레이트 제어부(18)는, 축적 버퍼(17)의 빈 용량이 적을 때에는 양자화 데이터의 비트 레이트를 저하시키기 위한 레이트 제어 신호를 생성한다. 또한, 예를 들어 레이트 제어부(18)는, 축적 버퍼(17)의 빈 용량이 충분히 클 때에는 양자화 데이터의 비트 레이트를 높이기 위한 레이트 제어 신호를 생성한다.

역양자화부(21)는 직교 변환·양자화부(14)로부터 입력되는 양자화 데이터에 대하여 역양자화 처리를 행한다. 그리고, 역양자화부(21)는 역양자화 처리에 의해 취득되는 변환 계수 데이터를 역직교 변환부(22)로 출력한다.

역직교 변환부(22)는, 역양자화부(21)로부터 입력되는 변환 계수 데이터에 대하여 역직교 변환 처리를 행함으로써 예측 오차 데이터를 복원한다. 그리고, 역직교 변환부(22)는 복원한 예측 오차 데이터를 가산부(23)로 출력한다.

가산부(23)는, 역직교 변환부(22)로부터 입력되는 복원된 예측 오차 데이터와 모드 선택부(50)로부터 입력되는 예측 화상 데이터를 가산함으로써 복호 화상 데이터를 생성한다. 그리고, 가산부(23)는, 생성한 복호 화상 데이터를 디블록 필터(24) 및 프레임 메모리(25)로 출력한다.

디블록 필터(24)는, 화상의 부호화시에 발생하는 블록 왜곡을 감소시키기 위한 필터링 처리를 행한다. 디블록 필터(24)는, 가산부(23)로부터 입력되는 복호 화상 데이터를 필터링함으로써 블록 왜곡을 제거하고, 필터링 후의 복호 화상 데이터를 프레임 메모리(25)로 출력한다.

프레임 메모리(25)는, 가산부(23)로부터 입력되는 복호 화상 데이터 및 디블록 필터(24)로부터 입력되는 필터링 후의 복호 화상 데이터를 기억 매체를 사용하여 기억한다.

셀렉터(26)는, 인트라 예측을 위하여 사용되는 필터링 전의 복호 화상 데이터를 프레임 메모리(25)로부터 판독하고, 판독한 복호 화상 데이터를 참조 화상 데이터로서 인트라 예측부(30)에 공급한다. 또한, 셀렉터(26)는, 인터 예측을 위하여 사용되는 필터링 후의 복호 화상 데이터를 프레임 메모리(25)로부터 판독하고, 판독한 복호 화상 데이터를 참조 화상 데이터로서 움직임 탐색부(40)에 공급한다.

인트라 예측부(30)는, 재배열 버퍼(12)로부터 입력되는 부호화 대상의 화상 데이터 및 셀렉터(26)를 통하여 공급되는 복호 화상 데이터에 기초하여 각 인트라 예측 모드의 인트라 예측 처리를 행한다. 예를 들어, 인트라 예측부(30)는 각 인트라 예측 모드에 의한 예측 결과를 소정의 비용 함수를 사용하여 평가한다. 그리고, 인트라 예측부(30)는, 비용 함수값이 최소가 되는 인트라 예측 모드, 즉 압축률이 가장 높아지는 인트라 예측 모드를 최적인 인트라 예측 모드로서 선택한다. 또한, 인트라 예측부(30)는, 당해 최적의 인트라 예측 모드를 나타내는 예측 모드 정보, 예측 화상 데이터 및 비용 함수값 등의 인트라 예측에 관한 정보를 모드 선택부(50)로 출력한다.

움직임 탐색부(40)는, 재배열 버퍼(12)로부터 입력되는 부호화 대상의 화상 데이터 및 셀렉터(26)를 통하여 공급되는 복호 화상 데이터에 기초하여 인터 예측 처리(프레임간 예측 처리)를 행한다. 예를 들어, 움직임 탐색부(40)는 각 예측 모드에 의한 예측 결과를 소정의 비용 함수를 사용하여 평가한다. 이어서, 움직임 탐색부(40)는, 비용 함수값이 최소가 되는 예측 모드, 즉 압축률이 가장 높아지는 예측 모드를 최적인 예측 모드로서 선택한다. 또한, 움직임 탐색부(40)는 당해 최적의 예측 모드에 따라서 예측 화상 데이터를 생성한다. 그리고, 움직임 탐색부(40)는, 선택한 최적인 예측 모드를 나타내는 예측 모드 정보를 포함하는 인터 예측에 관한 정보, 예측 화상 데이터 및 비용 함수값 등의 인터 예측에 관한 정보를 모드 선택부(50)로 출력한다.

모드 선택부(50)는, 인트라 예측부(30)로부터 입력되는 인트라 예측에 관한 비용 함수값과 움직임 탐색부(40)로부터 입력되는 인터 예측에 관한 비용 함수값을 비교한다. 그리고, 모드 선택부(50)는 인트라 예측 및 인터 예측 중 비용 함수값이 보다 적은 예측 방법을 선택한다. 모드 선택부(50)는, 인트라 예측을 선택한 경우에는 인트라 예측에 관한 정보를 가역 부호화부(16)로 출력함과 함께, 예측 화상 데이터를 감산부(13) 및 가산부(23)로 출력한다. 또한, 모드 선택부(50)는, 인터 예측을 선택한 경우에는, 인터 예측에 관한 상술한 정보를 가역 부호화부(16)로 출력함과 함께, 예측 화상 데이터를 감산부(13) 및 가산부(23)로 출력한다.

[1-2. 직교 변환·양자화부의 구성예]

도 2는 도 1에 도시한 화상 부호화 장치(10)의 직교 변환·양자화부(14)의 상세한 구성의 일례를 나타내는 블록도이다. 도 2를 참조하면, 직교 변환·양자화부(14)는 선택부(110), 직교 변환부(120), 양자화부(130), 양자화 행렬 버퍼(140) 및 행렬 처리부(15)를 갖는다.

(1)선택부

선택부(110)는, 크기가 상이한 복수의 변환 단위로부터, 부호화되는 화상 데이터의 직교 변환을 위하여 사용되는 변환 단위(TU)를 선택한다. 선택부(110)에 의해 선택될 수 있는 변환 단위 크기의 후보는, 예를 들어 H.264/AVC에서는 4×4 및 8×8을 포함하고, HEVC에서는 4×4, 8×8, 16×16 및 32×32를 포함한다. 선택부(110)는, 예를 들어 부호화되는 화상의 크기 또는 화질, 또는 장치의 성능 등에 따라서 어느 한쪽의 변환 단위를 선택해도 된다. 선택부(110)에 의한 변환 단위의 선택은 장치를 개발하는 유저에 의해 핸드 튜닝되어도 된다. 그리고, 선택부(110)는, 선택한 변환 단위의 크기를 지정하는 정보를 직교 변환부(120), 양자화부(130), 가역 부호화부(16) 및 역양자화부(21)로 출력한다.

(2)직교 변환부

직교 변환부(120)는, 선택부(110)에 의해 선택된 변환 단위로, 감산부(13)로부터 공급되는 화상 데이터(즉, 예측 오차 데이터)를 직교 변환한다. 직교 변환부(120)에 의해 실행되는 직교 변환은, 예를 들어 이산 코사인 변환(Discrete Cosine Transform: DCT) 또는 카루넨 루베 변환 등이어도 된다. 그리고, 직교 변환부(120)는 직교 변환 처리에 의해 취득되는 변환 계수 데이터를 양자화부(130)로 출력한다.

(3)양자화부

양자화부(130)는, 선택부(110)에 의해 선택된 변환 단위에 대응하는 양자화 행렬을 사용하여 직교 변환부(120)에 의해 생성된 변환 계수 데이터를 양자화한다. 또한, 양자화부(130)는, 레이트 제어부(18)로부터의 레이트 제어 신호에 기초하여 양자화 스텝을 전환함으로써 출력되는 양자화 데이터의 비트 레이트를 변화시킨다.

또한, 양자화부(130)는, 선택부(110)에 의해 선택될 수 있는 복수의 변환 단위에 각각 대응하는 양자화 행렬의 세트를 양자화 행렬 버퍼(140)에 기억시킨다. 예를 들어, HEVC와 같이 4×4, 8×8, 16×16 및 32×32이라는 4종류의 크기의 변환 단위의 후보가 존재하는 경우에는, 이들 4종류의 크기에 각각 대응하는 4종류의 양자화 행렬의 세트가 양자화 행렬 버퍼(140)에 의해 기억될 수 있다. 또한, 어떤 크기에 대하여 도 19에 예시한 바와 같은 미리 정해진 양자화 행렬이 사용될 경우에는, 미리 정해진 양자화 행렬이 사용되는 것(유저에 의해 정의된 양자화 행렬을 사용하지 않는 것)을 나타내는 플래그만이 당해 크기와 관련지어서 양자화 행렬 버퍼(140)에 의해 기억되어도 된다.

양자화부(130)에 의해 사용될 가능성이 있는 양자화 행렬의 세트는 전형적으로는 부호화 스트림의 시퀀스마다 설정될 수 있다. 또한, 양자화부(130)는 시퀀스마다 설정한 양자화 행렬의 세트를 픽처마다 갱신해도 된다. 이러한 양자화 행렬의 세트의 설정 및 갱신을 제어하기 위한 정보는, 예를 들어 시퀀스 파라미터 세트 및 픽처 파라미터 세트에 삽입될 수 있다.

(4)양자화 행렬 버퍼

양자화 행렬 버퍼(140)는, 반도체 메모리 등의 기억 매체를 사용하여 선택부(110)에 의해 선택될 수 있는 복수의 변환 단위에 각각 대응하는 양자화 행렬의 세트를 일시적으로 기억한다. 양자화 행렬 버퍼(140)에 의해 기억되는 양자화 행렬의 세트는 다음에 설명하는 행렬 처리부(150)에 의한 처리 시에 참조된다.

(5)행렬 처리부

행렬 처리부(150)는, 부호화 스트림의 시퀀스마다 및 픽처마다 양자화 행렬 버퍼(140)에 기억되어 있는 양자화 행렬의 세트를 참조하고, 어느 하나의 크기 변환 단위에 대응하는 양자화 행렬로부터 다른 하나 이상의 크기 변환 단위에 대응하는 양자화 행렬을 생성하기 위한 정보를 생성한다. 양자화 행렬 생성의 기초가 되는 변환 단위의 크기는 전형적으로는 복수의 변환 단위의 크기 중 최소의 크기이어도 된다. 즉, HEVC와 같이 4×4, 8×8, 16×16 및 32×32이라는 4종류의 크기 변환 단위의 후보가 존재하는 경우에는, 4×4의 양자화 행렬로부터 다른 크기의 양자화 행렬을 생성하기 위한 정보가 생성될 수 있다. 행렬 처리부(15)에 의해 생성되는 정보는, 예를 들어 나중에 설명하는 기초 행렬 정보 및 차분 행렬 정보를 포함할 수 있다. 그리고, 행렬 처리부(150)에 의해 생성된 정보는 가역 부호화부(16)로 출력되고, 부호화 스트림의 헤더 내에 삽입될 수 있다.

또한, 본 명세서에서는, 주로 최소 크기의 양자화 행렬로부터 보다 큰 크기의 양자화 행렬이 생성되는 예에 대하여 설명한다. 그러나, 이러한 예에 한정되지 않고, 최소가 아닌 크기의 양자화 행렬로부터, 보다 작은 크기의 양자화 행렬 및/또는 보다 큰 크기의 양자화 행렬이 생성되어도 된다.

[1-3. 행렬 처리부의 상세한 구성예]

도 3은 도 2에 도시한 직교 변환·양자화부(14)의 행렬 처리부(150)의 더욱 상세한 구성의 일례를 나타내는 블록도이다. 도 3을 참조하면, 행렬 처리부(150)는 예측부(152) 및 차분 연산부(154)를 포함한다.

(1)예측부

예측부(152)는, 양자화 행렬 버퍼(140)에 기억되어 있는 양자화 행렬의 세트를 취득하고, 취득한 세트에 포함되는 제1 양자화 행렬로부터 보다 큰 크기의 제2 양자화 행렬을 예측한다. 예를 들어, 4×4의 양자화 행렬(SL1)을 다음과 같이 정의한다:

예측부(152)에 의해 양자화 행렬(SL1)로부터 예측되는 8×8의 예측 행렬(PSL2)은, 예를 들어 다음의 예측식(2)에 따라 산출될 수 있다:

예측식(2)를 참조하면, 예측 행렬(PSL2)은, 양자화 행렬(SL1)에 있어서 서로 인접하는 2개의 요소의 사이의 요소로서 당해 2개의 요소 중 어느 하나를 복제함으로써 생성된 행렬이다.

그 대신에, 예측 행렬(PSL2)은 다음 예측식(3)에 따라서 양자화 행렬(SL1)로부터 산출되어도 된다:

예측식(3)을 참조하면, 예측 행렬(PSL2)은, 양자화 행렬(SL1)에 있어서 서로 인접하는 2개의 요소의 사이의 요소를 당해 2개의 요소로부터 선형 보간함으로써 생성된 행렬이다. 또한, 예측식(3)의 예측 행렬(PSL2)의 우측 단부의 요소는 그 하나 좌측의 요소부터 복제되어 있지만, 그들 우측 단부의 요소는 복제가 아니라 선형 외삽에 의해 산출되어도 된다. 마찬가지로, 예측식(3)의 예측 행렬(PSL2)의 하단부의 요소도 또한, 그 하나 상측의 요소로부터 복제되는 대신에 선형 외삽에 의해 산출되어도 된다. 예를 들어, 예측 행렬(PSL2)의 8행 8열의 성분(PSL2₈, ₈)은 예측식(3)에서는 a₃₃이지만, 선형 외삽에 따라 다음과 같이 산출될 수도 있다:

예측식(2)는 예측식(3)과 비교하여 적은 계산 비용으로 예측 행렬(PSL2)을 생성할 수 있는 식이다. 한편, 예측식(3)을 이용하면, 보다 본래 사용되는 양자화 행렬에 가까운 매끄러운 예측 행렬을 얻는 것이 가능하다. 따라서, 예측식(3)을 이용하면, 나중에 설명하는 차분 행렬의 각 요소를 0에 가깝게 해서 부호화되는 정보량을 삭감할 수 있다.

또한, 예측식 (2) 및 (3)은 사용 가능한 예측식의 예에 지나지 않고, 다른 임의의 예측식도 또한 사용되어도 된다.

예측부(152)는, 양자화 행렬(SL1)로부터 예측 행렬(PSL2)을 생성하면, 생성한 예측 행렬(PSL2)을 차분 연산부(154)로 출력한다. 또한, 예측부(152)는, 예를 들어 양자화 행렬의 세트에 포함되는 8×8의 양자화 행렬(SL2)로부터 16×16의 예측 행렬(PSL3)을 예측하고, 예측 행렬(PSL3)을 차분 연산부(154)로 출력한다. 또한, 예측부(152)는, 양자화 행렬의 세트에 포함되는 16×16의 양자화 행렬(SL3)로부터 32×32의 예측 행렬(PSL4)을 예측하고, 예측 행렬(PSL4)을 차분 연산부(154)로 출력한다. 이들 예측 행렬PSL3 및 예측 행렬PSL4의 예측도 또한, 상술한 예측식 (2) 또는 (3)과 동등한 예측식을 따라서 행해도 된다. 또한, 예측부(152)는, 상술한 예측 행렬(PSL2, PSL3 및 PSL4)의 생성의 기초로 한 4×4의 양자화 행렬(SL1)을 특정하는 기초 행렬 정보를 가역 부호화부(16)로 출력한다.

(2)차분 연산부

차분 연산부(154)는, 예측부(152)로부터 입력되는 예측 행렬(PSL2, PSL3 및 PSL4)과 대응하는 양자화 행렬(SL2, SL3 및 SL4)의 차분을 나타내는 차분 행렬(DSL2, DSL3 및 DSL4)을 수학식 (5) 내지 (7)을 따라서 각각 산출한다:

그리고, 차분 연산부(154)는 이들 차분 행렬(DSL2, DSL3 및 DSL4)을 나타내는 차분 행렬 정보를 가역 부호화부(16)로 출력한다.

또한, 행렬 처리부(150)는, 어떤 크기에 대하여 미리 정해진 양자화 행렬이 사용되는 경우에는, 당해 크기의 양자화 행렬의 예측 및 차분 연산을 실행하지 않고, 미리 정해진 양자화 행렬이 사용되는 것을 나타내는 플래그만을 대응하는 크기와 관련지어서 가역 부호화부(16)로 출력한다. 또한, 차분 연산부(154)는, 예측 행렬과 양자화 행렬의 차분이 0인 경우에는, 차분 행렬 정보를 출력하는 대신에 차분이 존재하지 않는 것을 나타내는 플래그만을 가역 부호화부(16)로 출력할 수 있다. 또한, 행렬 처리부(150)는, 픽처 절환의 타이밍에서 양자화 행렬이 갱신되지 않는 경우에는, 양자화 행렬이 갱신되지 않는 것을 나타내는 플래그만을 가역 부호화부(16)로 출력할 수 있다.

[1-4. 부호화되는 정보의 예]

(1)시퀀스 파라미터 세트

도 4는 본 실시 형태에 있어서 시퀀스 파라미터 세트 내에 삽입되는 정보의 일례를 나타내는 설명도이다. 도 4를 참조하면, 양자화 행렬의 크기(변환 단위(TU)의 크기)마다 부호화되는 정보로서 「행렬 종류별 플래그」, 「차분 플래그」 및 「(부호화되는) 행렬 정보」라고 하는 3종류의 정보가 나타나 있다.

행렬 종류별 플래그는, 각 크기에 대해서 유저에 의해 정의되는 양자화 행렬 및 미리 정해진 양자화 행렬 중 어느 것이 사용될지를 지정하는 플래그이다. 어떤 크기에 대하여 행렬 종류별 플래그가 「1」이면, 그 크기의 양자화 행렬은 유저에 의해 정의된다. 또한, 어떤 크기에 대하여 행렬 종류별 플래그가 「0」이면, 그 크기의 양자화 행렬은 미리 정해진 양자화 행렬이다. 행렬 종류별 플래그가 「0」인 경우, 행렬 정보 및 차분 행렬 정보 및 다음에 설명하는 차분 플래그는 모두 부호화되지 않는다.

차분 플래그는, 각 크기에 대해서 행렬 종류별 플래그가 「1:유저 정의」인 경우에 예측 행렬과 양자화 행렬의 차분이 존재하는지 여부를 나타내는 플래그이다. 어떤 크기에 대하여 차분 플래그가 「1」이면, 그 크기의 예측 행렬과 양자화 행렬의 차분이 존재하고, 차분 행렬 정보가 부호화된다. 어떤 크기에 대하여 차분 플래그가 「0」이면, 그 크기의 차분 행렬 정보는 부호화되지 않는다. 또한, 예측의 기초가 되는 크기(예를 들어 4×4)에 대해서는 행렬 종류별 플래그에 의하지 않고 차분 플래그는 부호화되지 않는다.

(2)픽처 파라미터 세트

도 5는 본 실시 형태에 있어서 픽처 파라미터 세트 내에 삽입되는 정보의 일례를 나타내는 설명도이다. 도 5를 참조하면, 양자화 행렬의 크기(변환 단위(TU)의 크기)마다 부호화되는 정보로서 「갱신 플래그」, 「행렬 종류별 플래그」, 「차분 플래그」 및 「(부호화되는) 행렬 정보」라고 하는 4종류의 정보가 나타나 있다. 이 중 행렬 종류별 플래그 및 차분 플래그의 의미는, 도 4를 사용하여 설명한 시퀀스 파라미터 세트의 동일한 명칭의 플래그와 마찬가지이다.

갱신 플래그는 각 크기에 대하여 픽처 절환의 타이밍에서 양자화 행렬을 갱신해야할지 여부를 나타내는 플래그이다. 어떤 크기에 대하여 갱신 플래그가 「1」이면, 그 크기의 양자화 행렬은 갱신된다. 갱신 플래그가 「0」이면, 그 크기의 양자화 행렬은 갱신되지 않고, 앞의 픽처 또는 현재의 시퀀스에 설정된 양자화 행렬이 그대로 사용된다. 갱신 플래그가 「0」인 경우에는, 그 크기에 대하여 행렬 종류별 플래그, 차분 플래그 및 차분 행렬 정보(4×4의 경우에는 행렬 정보)는 부호화되지 않는다.

<2. 일실시 형태에 관한 부호화시의 처리 흐름>

도 6a 및 도 6b는 본 실시 형태에 관한 부호화시의 처리 흐름의 제1 예를 나타내는 흐름도이다. 당해 흐름도에 나타난 처리는 주로 부호화 스트림의 시퀀스마다 행렬 처리부(150) 및 가역 부호화부(16)에 의해 실행될 수 있다.

도 6a를 참조하면, 우선, 행렬 처리부(150)는 당해 시퀀스에 있어서 양자화부(130)에 의해 사용되는 양자화 행렬의 세트를 양자화 행렬 버퍼(140)로부터 취득한다(스텝S100). 여기에서는 일례로서 4×4, 8×8, 16×16 및 32×32의 각 크기에 대응하는 양자화 행렬이 양자화 행렬의 세트에 포함되는 것으로 한다.

이어서, 행렬 처리부(150)는 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S102). 여기서 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=1) 및 4×4의 양자화 행렬을 나타내는 기초 행렬 정보를 부호화한다(스텝S106). 한편, 4×4의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=0)만을 부호화한다(스텝S108).

이어서, 행렬 처리부(150)는 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S112). 여기서 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 예를 들어 상술한 예측식 (2) 또는 (3)에 따라 4×4의 양자화 행렬로부터 8×8의 예측 행렬을 산출한다(스텝S114). 그리고, 가역 부호화부(16)는 행렬 종류별 플래그(=1), 차분 플래그 및 8×8의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있는 경우만)를 부호화한다(스텝S116). 한편, 8×8의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=0)만을 부호화한다(스텝S118).

이어서, 도 6b를 참조하면, 행렬 처리부(150)는 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S122). 여기서 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 8×8의 양자화 행렬로부터 16×16의 예측 행렬을 산출한다(스텝S124). 그리고, 가역 부호화부(16)는 행렬 종류별 플래그(=1), 차분 플래그 및 16×16의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있는 경우만)를 부호화한다(스텝S126). 한편, 16×16의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=0)만을 부호화한다(스텝S128).

이어서, 행렬 처리부(150)는 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S132). 여기서 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 16×16의 양자화 행렬로부터 32×32의 예측 행렬을 산출한다(스텝S134). 그리고, 가역 부호화부(16)는, 행렬 종류별 플래그(=1), 차분 플래그 및 32×32의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있을 경우만)를 부호화한다(스텝S136). 한편, 32×32의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=0)만을 부호화한다(스텝S138).

도 7a 및 도 7b는 본 실시 형태에 관한 부호화시의 처리 흐름의 제2 예를 나타내는 흐름도이다. 당해 흐름도에 나타난 처리는 주로 부호화 스트림의 픽처마다 행렬 처리부(150) 및 가역 부호화부(16)에 의해 실행될 수 있다.

도 7a를 참조하면, 우선, 행렬 처리부(150)는 당해 픽처에 있어서 양자화부(130)에 의해 사용되는 양자화 행렬의 세트를 양자화 행렬 버퍼(140)로부터 취득한다(스텝S150). 여기에서도 도 6a 및 도 6b의 예와 마찬가지로 4×4, 8×8, 16×16 및 32×32의 각 크기에 대응하는 양자화 행렬이 양자화 행렬의 세트에 포함되는 것으로 한다.

이어서, 행렬 처리부(150)는 4×4의 양자화 행렬이 당해 픽처에 있어서 갱신될지 여부를 판정한다(스텝S152). 양자화 행렬이 갱신되지 않을 경우에는, 가역 부호화부(16)는 갱신 플래그(=0)만을 부호화한다(스텝S158). 한편, 양자화 행렬이 갱신될 경우에는, 처리는 스텝S154로 진행한다. 양자화 행렬이 갱신될 경우에는, 행렬 처리부(150)는 새로운 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S154). 여기서 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 가역 부호화부(16)는 갱신 플래그(=1), 행렬 종류별 플래그(=1) 및 4×4의 양자화 행렬을 나타내는 기초 행렬 정보를 부호화한다(스텝S156). 한편, 4×4의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 갱신 플래그(=1) 및 행렬 종류별 플래그(=0)를 부호화한다(스텝S158).

이어서, 행렬 처리부(150)는 8×8의 양자화 행렬이 당해 픽처에 있어서 갱신될지 여부를 판정한다(스텝S160). 양자화 행렬이 갱신되지 않을 경우에는, 가역 부호화부(16)는 갱신 플래그(=0)만을 부호화한다(스텝S168). 한편, 양자화 행렬이 갱신될 경우에는, 처리는 스텝S162로 진행한다. 양자화 행렬이 갱신될 경우에는, 행렬 처리부(150)는 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S162). 여기서 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 4×4의 양자화 행렬이 갱신되었는지 여부에 의하지 않고, 새로운 픽처의 4×4의 양자화 행렬로부터 8×8의 예측 행렬을 산출한다(스텝S164). 그리고, 가역 부호화부(16)는 갱신 플래그(=1), 행렬 종류별 플래그(=1), 차분 플래그 및 8×8의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있는 경우만)를 부호화한다(스텝S166). 한편, 8×8의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 갱신 플래그(=1) 및 행렬 종류별 플래그(=0)를 부호화한다(스텝S168).

이어서, 도 7b을 참조하면, 행렬 처리부(150)는 16×16의 양자화 행렬이 당해 픽처에 있어서 갱신될지 여부를 판정한다(스텝S170). 양자화 행렬이 갱신되지 않을 경우에는, 가역 부호화부(16)는 갱신 플래그(=0)만을 부호화한다(스텝S178). 한편, 양자화 행렬이 갱신될 경우에는, 처리는 스텝S172로 진행한다. 양자화 행렬이 갱신될 경우에는, 행렬 처리부(150)는 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S172). 여기서 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 8×8의 양자화 행렬이 갱신되었는지 여부에 의하지 않고, 새로운 픽처의 8×8의 양자화 행렬로부터 16×16의 예측 행렬을 산출한다(스텝S174). 그리고, 가역 부호화부(16)는 갱신 플래그(=1), 행렬 종류별 플래그(=1), 차분 플래그 및 16×16의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있을 경우만)를 부호화한다(스텝S176). 한편, 16×16의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 갱신 플래그(=1) 및 행렬 종류별 플래그(=0)를 부호화한다(스텝S178).

이어서, 행렬 처리부(150)는 32×32의 양자화 행렬이 당해 픽처에 있어서 갱신될지 여부를 판정한다(스텝S180). 양자화 행렬이 갱신되지 않을 경우에는, 가역 부호화부(16)는 갱신 플래그(=0)만을 부호화한다(스텝S188). 한편, 양자화 행렬이 갱신될 경우에는, 처리는 스텝S182로 진행한다. 양자화 행렬이 갱신될 경우에는, 행렬 처리부(150)는 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S182). 여기서 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 16×16의 양자화 행렬이 갱신되었는지 여부에 의하지 않고, 새로운 픽처의 16×16의 양자화 행렬로부터 32×32의 예측 행렬을 산출한다(스텝S184). 그리고, 가역 부호화부(16)는 갱신 플래그(=1), 행렬 종류별 플래그(=1), 차분 플래그 및 32×32의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있는 경우만)를 부호화한다(스텝S186). 한편, 32×32의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 갱신 플래그(=1) 및 행렬 종류별 플래그(=0)를 부호화한다(스텝S188).

이와 같이, 어느 하나의 양자화 행렬에 기초하여 다른 양자화 행렬을 예측하는 방법을 사용함으로써 부호화측으로부터 복호측에 복수의 변환 단위 크기에 대응하는 복수의 양자화 행렬을 전송할 필요성이 해소된다. 따라서, 양자화 행렬의 수가 많아지는 경우에도 부호량의 증가가 효과적으로 억제된다.

<3. 일실시 형태에 관한 화상 복호 장치의 구성예>

본 절에서는 일실시 형태에 관한 화상 복호 장치의 구성예에 대하여 설명한다.

[3-1. 전체적인 구성예]

도 8은 일실시 형태에 관한 화상 복호 장치(60)의 구성의 일례를 나타내는 블록도이다. 도 8을 참조하면, 화상 복호 장치(60)는 축적 버퍼(61), 가역 복호부(62), 역양자화·역직교 변환부(63), 가산부(65), 디블록 필터(66), 재배열 버퍼(67), D/A (Digital to Analogue) 변환부(68), 프레임 메모리(69), 셀렉터(70 및 71), 인트라 예측부(80) 및 움직임 보상부(90)를 구비한다.

축적 버퍼(61)는 전송로를 통하여 입력되는 부호화 스트림을 기억 매체를 사용하여 일시적으로 축적한다.

가역 복호부(62)는 축적 버퍼(61)로부터 입력되는 부호화 스트림을 부호화 시에 사용된 부호화 방식에 따라서 복호한다. 또한, 가역 복호부(62)는 부호화 스트림의 헤더 영역에 다중화되어 있는 정보를 복호한다. 부호화 스트림의 헤더 영역에 다중화되어 있는 정보란, 예를 들어 상술한 양자화 행렬을 생성하기 위한 기초 행렬 정보 및 차분 행렬 정보, 및 블록 헤더 내의 인트라 예측에 관한 정보 및 인터 예측에 관한 정보를 포함할 수 있다. 가역 복호부(62)는 복호 후의 양자화 데이터 및 양자화 행렬을 생성하기 위한 정보를 역양자화·역직교 변환부(63)로 출력한다. 또한, 가역 복호부(62)는 인트라 예측에 관한 정보를 인트라 예측부(80)로 출력한다. 또한, 가역 복호부(62)는 인터 예측에 관한 정보를 움직임 보상부(90)로 출력한다.

역양자화·역직교 변환부(63)는 가역 복호부(62)로부터 입력되는 양자화 데이터에 대하여 역양자화 및 역직교 변환을 행함으로써 예측 오차 데이터를 생성한다. 그리고, 역양자화·역직교 변환부(63)는 생성한 예측 오차 데이터를 가산부(65)로 출력한다.

가산부(65)는 역양자화·역직교 변환부(63)로부터 입력되는 예측 오차 데이터와 셀렉터(71)로부터 입력되는 예측 화상 데이터를 가산함으로써 복호 화상 데이터를 생성한다. 그리고, 가산부(65)는 생성한 복호 화상 데이터를 디블록 필터(66) 및 프레임 메모리(69)로 출력한다.

디블록 필터(66)는 가산부(65)로부터 입력되는 복호 화상 데이터를 필터링함으로써 블록 왜곡을 제거하고, 필터링 후의 복호 화상 데이터를 재배열 버퍼(67) 및 프레임 메모리(69)로 출력한다.

재배열 버퍼(67)는 디블록 필터(66)로부터 입력되는 화상을 재배열함으로써 시계열의 일련의 화상 데이터를 생성한다. 그리고, 재배열 버퍼(67)는 생성한 화상 데이터를 D/A 변환부(68)로 출력한다.

D/A 변환부(68)는 재배열 버퍼(67)로부터 입력되는 디지털 형식의 화상 데이터를 아날로그 형식의 화상 신호로 변환한다. 그리고, D/A 변환부(68)는, 예를 들어 화상 복호 장치(60)와 접속되는 디스플레이(도시하지 않음)에 아날로그 화상 신호를 출력함으로써 화상을 표시시킨다.

프레임 메모리(69)는 가산부(65)로부터 입력되는 필터링 전의 복호 화상 데이터 및 디블록 필터(66)로부터 입력되는 필터링 후의 복호 화상 데이터를 기억 매체를 사용하여 기억한다.

셀렉터(70)는, 가역 복호부(62)에 의해 취득되는 모드 정보에 따라서 화상 내의 블록마다 프레임 메모리(69)로부터의 화상 데이터의 출력처를 인트라 예측부(80)와 움직임 보상부(90)의 사이에서 전환한다. 예를 들어, 셀렉터(70)는, 인트라 예측 모드가 지정된 경우에는, 프레임 메모리(69)로부터 공급되는 필터링 전의 복호 화상 데이터를 참조 화상 데이터로서 인트라 예측부(80)로 출력한다. 또한, 셀렉터(70)는, 인터 예측 모드가 지정된 경우에는, 프레임 메모리(69)로부터 공급되는 필터링 후의 복호 화상 데이터를 참조 화상 데이터로서 움직임 보상부(90)로 출력한다.

셀렉터(71)는, 가역 복호부(62)에 의해 취득되는 모드 정보에 따라서 화상 내의 블록마다 가산부(65)에 공급해야할 예측 화상 데이터의 출력원을 인트라 예측부(80)와 움직임 보상부(90)의 사이에서 전환한다. 예를 들어, 셀렉터(71)는, 인트라 예측 모드가 지정된 경우에는, 인트라 예측부(80)로부터 출력되는 예측 화상 데이터를 가산부(65)에 공급한다. 셀렉터(71)는, 인터 예측 모드가 지정된 경우에는, 움직임 보상부(90)로부터 출력되는 예측 화상 데이터를 가산부(65)에 공급한다.

인트라 예측부(80)는, 가역 복호부(62)로부터 입력되는 인트라 예측에 관한 정보와 프레임 메모리(69)로부터의 참조 화상 데이터에 기초하여 화소값의 화면 내 예측을 행하고, 예측 화상 데이터를 생성한다. 그리고, 인트라 예측부(80)는 생성한 예측 화상 데이터를 셀렉터(71)로 출력한다.

움직임 보상부(90)는, 가역 복호부(62)로부터 입력되는 인터 예측에 관한 정보와 프레임 메모리(69)로부터의 참조 화상 데이터에 기초하여 움직임 보상 처리를 행하고, 예측 화상 데이터를 생성한다. 그리고, 움직임 보상부(90)는 생성한 예측 화상 데이터를 셀렉터(71)로 출력한다.

[3-2. 역양자화·역직교 변환부의 구성예]

도 9는 도 8에 도시한 화상 복호 장치(60)의 역양자화·역직교 변환부(63)의 상세한 구성의 일례를 나타내는 블록도이다. 도 9를 참조하면, 역양자화·역직교 변환부(63)는 행렬 생성부(210), 선택부(230), 역양자화부(240) 및 역직교 변환부(250)를 갖는다.

(1)행렬 생성부

행렬 생성부(210)는 부호화 스트림의 시퀀스마다 및 픽처마다 어떤 하나의 크기의 변환 단위에 대응하는 양자화 행렬로부터 다른 하나 이상의 크기의 변환 단위에 대응하는 양자화 행렬을 생성한다. 양자화 행렬의 생성의 기초가 되는 변환 단위의 크기는 전형적으로는 복수의 변환 단위의 크기 중 최소의 크기이어도 된다. 본 실시 형태에서는, 행렬 생성부(210)는 최소의 크기인 4×4의 양자화 행렬로부터, 보다 큰 크기에 관한 차분 행렬 정보를 사용하여 8×8, 16×16 및 32×32의 양자화 행렬을 생성한다.

(2)선택부

선택부(230)는, 크기가 상이한 복수의 변환 단위로부터, 복호되는 화상 데이터의 역직교 변환을 위하여 사용되는 변환 단위(TU)를 선택한다. 선택부(230)에 의해 선택될 수 있는 변환 단위 크기의 후보는, 예를 들어 H.264/AVC에서는 4×4 및 8×8을 포함하고, HEVC에서는 4×4, 8×8, 16×16 및 32×32를 포함한다. 선택부(230)는, 예를 들어 부호화 스트림의 헤더 내에 포함되는 LCU, SCU 및 split_flag에 기초하여 변환 단위를 선택해도 된다. 그리고, 선택부(230)는, 선택한 변환 단위의 크기를 지정하는 정보를 역양자화부(240) 및 역직교 변환부(250)로 출력한다.

(3)역양자화부

역양자화부(240)는, 선택부(230)에 의해 선택된 변환 단위에 대응하는 양자화 행렬을 사용하여 화상의 부호화 시에 양자화된 변환 계수 데이터를 역양자화한다. 여기서 역양자화 처리를 위하여 사용되는 양자화 행렬은 행렬 생성부(210)에 의해 생성되는 행렬을 포함한다. 즉, 예를 들어 선택부(230)에 의해 8×8, 16×16 또는 32×32의 변환 단위가 선택된 경우에는, 선택된 변환 단위에 대응하는 양자화 행렬로서 행렬 생성부(210)에 의해 4×4의 양자화 행렬로부터 생성된 양자화 행렬이 사용될 수 있다. 그리고, 역양자화부(240)는 역양자화한 변환 계수 데이터를 역직교 변환부(250)로 출력한다.

(4)역직교 변환부

역직교 변환부(250)는, 부호화 시에 사용된 직교 변환 방식에 따라 역양자화부(240)에 의해 역양자화된 변환 계수 데이터를 상기 선택된 변환 단위로 역직교 변환함으로써 예측 오차 데이터를 생성한다. 그리고, 역직교 변환부(250)는 생성한 예측 오차 데이터를 가산부(65)로 출력한다.

[3-3. 행렬 생성부의 상세한 구성예]

도 10은 도 9에 도시한 역양자화·역직교 변환부(63)의 행렬 생성부(210)의 더욱 상세한 구성의 일례를 나타내는 블록도이다. 도 10을 참조하면, 행렬 생성부(210)는 기초 행렬 취득부(212), 차분 취득부(214), 예측부(216), 재구축부(218) 및 양자화 행렬 버퍼(220)를 포함한다.

(1)기초 행렬 취득부

기초 행렬 취득부(212)는 가역 복호부(62)로부터 입력되는 기초 행렬 정보를 취득한다. 본 실시 형태에 있어서, 기초 행렬 정보는 상술한 바와 같이 최소의 크기인 4×4의 양자화 행렬(SL1)을 특정하는 정보이다. 그리고, 기초 행렬 취득부(212)는 취득한 기초 행렬 정보로부터 특정되는 4×4의 양자화 행렬(SL1)을 양자화 행렬 버퍼(220)에 기억시킨다. 또한, 기초 행렬 취득부(212)는, 시퀀스마다 또는 픽처마다 취득되는 행렬 종류별 플래그가 「0」이면, 기초 행렬 정보를 취득하지 않고, 미리 정해진 4×4의 양자화 행렬을 양자화 행렬 버퍼(220)에 기억시킨다. 또한, 기초 행렬 취득부(212)는, 픽처마다 취득되는 갱신 플래그가 「0」이면, 이전의 처리에 의해 양자화 행렬 버퍼(220)에 기억시킨 양자화 행렬(SL1)을 갱신하지 않는다. 또한, 기초 행렬 취득부(212)는 4×4의 양자화 행렬(SL1)을 예측부(216)로 출력한다.

(2)차분 취득부

차분 취득부(214)는 가역 복호부(62)로부터 입력되는 차분 행렬 정보를 취득한다. 본 실시 형태에 있어서, 차분 행렬 정보는, 상술한 바와 같이 4×4의 양자화 행렬(SL1)로부터 예측되는 예측 행렬(PSL2, PSL3 및 PSL4)과 양자화 행렬(SL2, SL3 및 SL4)의 차분을 나타내는 차분 행렬(DSL2, DSL3 및 DSL4)을 특정하는 정보이다. 차분 취득부(214)는 차분 행렬 정보에 의해 특정되는 차분 행렬(DSL2, DSL3 및 DSL4)을 재구축부(218)로 출력한다. 또한, 차분 취득부(214)는, 시퀀스마다 또는 픽처마다 취득되는 행렬 종류별 플래그가 「0」이며 또는 차분 플래그가 「0」이면, 차분 행렬 정보를 취득하지 않고, 대응하는 크기의 차분 행렬을 0행렬로 한다. 또한, 차분 취득부(214)는, 픽처마다 취득되는 갱신 플래그가 「0」이면, 대응하는 크기에 대하여 차분 행렬을 출력하지 않는다.

(3)예측부

예측부(216)는, 기초 행렬 취득부(212)로부터 입력되는 기초 행렬, 즉 본 실시 형태에 있어서는 4×4의 양자화 행렬(SL1)로부터, 화상의 부호화 시에 사용된 예측식(예를 들어, 상술한 예측식 (2) 또는 (3))에 따라 보다 큰 크기의 8×8의 예측 행렬(PSL2)을 산출한다. 또한, 예측부(216)는, 산출된 8×8의 예측 행렬(PSL2)을 사용하여 재구축부(218)에 의해 재구축되는 양자화 행렬(SL2)로부터 16×16의 예측 행렬(PSL3)을 산출한다. 또한, 예측부(216)는, 산출된 16×16의 예측 행렬(PSL3)을 사용하여 재구축부(218)에 의해 재구축되는 양자화 행렬(SL3)로부터 32×32의 예측 행렬(PSL4)을 산출한다. 예측부(216)는 예측 행렬(PSL2, PSL3 및 PSL4)을 각각 재구축부(218)로 출력한다. 또한, 예측부(216)는, 행렬 종류별 플래그가 「0」인 크기에 대해서는 예측 행렬을 생성하지 않고, 보다 큰 크기의 예측 행렬의 산출을 위해서 미리 정해진 양자화 행렬을 사용한다. 또한, 기초 행렬 취득부(212)는, 갱신 플래그가 「0」인 크기에 대해서도 예측 행렬을 생성하지 않고, 보다 큰 크기의 예측 행렬의 산출을 위해서 이전의 처리에서 생성된 양자화 행렬을 사용한다.

(4)재구축부

재구축부(218)는, 예측부(216)로부터 입력되는 예측 행렬(PSL2, PSL3 및 PSL4)과 차분 취득부(214)로부터 입력되는 차분 행렬(DSL2, DSL3 및 DSL4)을 가산함으로써 양자화 행렬(SL2, SL3 및 SL4)을 각각 재구축한다:

그리고, 재구축부(218)는 재구축한 8×8, 16×16 및 32×32의 양자화 행렬(SL2, SL3 및 SL4)을 양자화 행렬 버퍼(220)에 기억시킨다. 또한, 재구축부(218)는, 시퀀스마다 또는 픽처마다 취득되는 행렬 종류별 플래그가 「0」이면, 대응하는 크기의 양자화 행렬로서 미리 정해진 양자화 행렬을 양자화 행렬 버퍼(220)에 기억시킨다. 또한, 기초 행렬 취득부(212)는, 픽처마다 취득되는 갱신 플래그가 「0」이면, 이전의 처리에 의해 양자화 행렬 버퍼(220)에 기억시킨 대응하는 크기의 양자화 행렬(SL2, SL3 또는 SL4)을 갱신하지 않는다.

(5)양자화 행렬 버퍼

양자화 행렬 버퍼(220)는, 기초 행렬 취득부(212)에 의해 특정되는 양자화 행렬(SL1), 및 재구축부(218)에 의해 재구축되는 양자화 행렬(SL2, SL3 및 SL4)을 일시적으로 기억한다. 양자화 행렬 버퍼(220)에 의해 기억되는 이들 양자화 행렬(SL1, SL2, SL3 및 SL4)은, 양자화된 변환 계수 데이터의 역양자화부(240)에 의한 역양자화 처리를 위하여 사용된다.

또한, 본 항에서 설명한 화상 복호 장치(60)의 역양자화·역직교 변환부(63)의 구성은, 도 1에 도시한 화상 부호화 장치(10)의 역양자화부(21) 및 역직교 변환부(22)에도 적용될 수 있다.

<4. 일실시 형태에 관한 복호시의 처리 흐름>

도 11a 및 도 11b는 본 실시 형태에 관한 복호시의 처리 흐름의 제1 예를 나타내는 흐름도이다. 당해 흐름도에 나타난 처리는 주로 부호화 스트림의 시퀀스마다 행렬 생성부(210)에 의해 실행될 수 있다.

도 11a를 참조하면, 우선, 행렬 생성부(210)는, 당해 시퀀스의 시퀀스 파라미터 세트에 포함되는 행렬 종류별 플래그에 기초하여 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S202). 여기서 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 기초 행렬 정보를 사용해서 4×4의 양자화 행렬을 설정한다(즉, 양자화 행렬 버퍼(220)에 기억시킴)(스텝S204). 한편, 4×4의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 4×4의 양자화 행렬을 설정한다(스텝S206).

이어서, 행렬 생성부(210)는 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S212). 여기서 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 예를 들어 상술한 예측식 (2) 또는 (3)을 따라서 4×4의 양자화 행렬로부터 8×8의 예측 행렬을 산출하고, 산출한 예측 행렬과 8×8의 차분 행렬을 가산한다. 그에 의해 8×8의 양자화 행렬이 재구축된다(스텝S214). 또한, 8×8의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 8×8의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 8×8의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 8×8의 양자화 행렬을 설정한다(스텝S216).

이어서, 도 11b를 참조하면, 행렬 생성부(210)는 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S222). 여기서 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 8×8의 양자화 행렬로부터 16×16의 예측 행렬을 산출하고, 산출한 예측 행렬과 16×16의 차분 행렬을 가산한다. 그에 의해 16×16의 양자화 행렬이 재구축된다(스텝S224). 또한, 16×16의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 16×16의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 16×16의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 16×16의 양자화 행렬을 설정한다(스텝S226).

이어서, 행렬 생성부(210)는 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S232). 여기서 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 16×16의 양자화 행렬로부터 32×32의 예측 행렬을 산출하고, 산출한 예측 행렬과 32×32의 차분 행렬을 가산한다. 그에 의해 32×32의 양자화 행렬이 재구축된다(스텝S234). 또한, 32×32의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 32×32의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 32×32의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 32×32의 양자화 행렬을 설정한다(스텝S236).

도 12a 및 도 12b는 본 실시 형태에 관한 복호시의 처리 흐름의 제2 예를 나타내는 흐름도이다. 당해 흐름도에 나타난 처리는 주로 부호화 스트림의 픽처마다 행렬 생성부(210)에 의해 실행될 수 있다.

도 12a를 참조하면, 우선, 행렬 생성부(210)는, 픽처 파라미터 세트에 포함되는 갱신 플래그에 기초하여 4×4의 양자화 행렬이 당해 픽처에 있어서 갱신될지 여부를 판정한다(스텝S250). 여기서, 4×4의 양자화 행렬이 갱신되지 않을 경우에는 스텝S252 내지 S256의 처리는 스킵된다. 4×4의 양자화 행렬이 갱신될 경우에는, 행렬 생성부(210)는 행렬 종류별 플래그에 기초하여 새로운 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S252). 여기서 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 기초 행렬 정보를 사용해서 4×4의 양자화 행렬을 설정한다(스텝S254). 한편, 4×4의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 4×4의 양자화 행렬을 설정한다(스텝S256).

이어서, 행렬 생성부(210)는, 갱신 플래그에 기초하여 8×8의 양자화 행렬이 당해 픽처에 있어서 갱신될지 여부를 판정한다(스텝S260). 여기서, 8×8의 양자화 행렬이 갱신되지 않을 경우에는 스텝S262 내지 S266의 처리는 스킵된다. 8×8의 양자화 행렬이 갱신될 경우에는, 행렬 생성부(210)는 행렬 종류별 플래그에 기초하여 새로운 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S262). 여기서 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 4×4의 양자화 행렬이 갱신되었는지 여부에 의하지 않고, 새로운 픽처의 4×4의 양자화 행렬로부터 8×8의 예측 행렬을 산출하고, 산출한 예측 행렬과 8×8의 차분 행렬을 가산한다. 그에 의해 8×8의 양자화 행렬이 재구축된다(스텝S264). 또한, 8×8의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 8×8의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 8×8의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 8×8의 양자화 행렬을 설정한다(스텝S266).

이어서, 도 12b를 참조하면, 행렬 생성부(210)는 갱신 플래그에 기초하여 16×16의 양자화 행렬이 당해 픽처에 있어서 갱신될지 여부를 판정한다(스텝S270). 여기서, 16×16의 양자화 행렬이 갱신되지 않을 경우에는 스텝S272 내지 S276의 처리는 스킵된다. 16×16의 양자화 행렬이 갱신될 경우에는, 행렬 생성부(210)는 행렬 종류별 플래그에 기초하여 새로운 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S272). 여기서 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 8×8의 양자화 행렬이 갱신되었는지 여부에 의하지 않고, 새로운 픽처의 8×8의 양자화 행렬로부터 16×16의 예측 행렬을 산출하고, 산출한 예측 행렬과 16×16의 차분 행렬을 가산한다. 그에 의해 16×16의 양자화 행렬이 재구축된다(스텝S274). 또한, 16×16의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 16×16의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 16×16의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 16×16의 양자화 행렬을 설정한다(스텝S276).

이어서, 행렬 생성부(210)는, 갱신 플래그에 기초하여 32×32의 양자화 행렬이 당해 픽처에 있어서 갱신될지 여부를 판정한다(스텝S280). 여기서, 32×32의 양자화 행렬이 갱신되지 않을 경우에는 스텝S282 내지 S286의 처리는 스킵된다. 32×32의 양자화 행렬이 갱신될 경우에는, 행렬 생성부(210)는 행렬 종류별 플래그에 기초하여 새로운 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S282). 여기서 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 16×16의 양자화 행렬이 갱신되었는지 여부에 의하지 않고, 새로운 픽처의 16×16의 양자화 행렬로부터 32×32의 예측 행렬을 산출하고, 산출한 예측 행렬과 32×32의 차분 행렬을 가산한다. 그에 의해 32×32의 양자화 행렬이 재구축된다(스텝S284). 또한, 32×32의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 32×32의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 32×32의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 32×32의 양자화 행렬을 설정한다(스텝S286).

이와 같이, 어느 하나의 양자화 행렬에 기초하여 다른 양자화 행렬을 예측하는 방법을 사용함으로써 예측 대상의 양자화 행렬에 대하여 차분의 정보만이 부호화측으로부터 복호측에 전송되는 경우에도 복호측에서 적절하게 양자화 행렬을 재구축할 수 있다. 따라서, 양자화 행렬의 수가 많아지는 경우에도 부호량의 증가가 효과적으로 억제된다.

또한, 본 명세서에서는, 주로 하나의 변환 단위의 크기에 대해서 1종의 양자화 행렬만이 설정되는 예를 설명하였다. 그러나, 이러한 예에 한정되지 않고, 하나의 변환 단위의 크기에 대하여 복수 종류의 양자화 행렬이 설정되어도 된다. 그 경우, 시퀀스 파라미터 세트 및 픽처 파라미터 세트에는 복수 종류의 양자화 행렬 중 어느 하나의 양자화 행렬을 보다 큰 크기의 양자화 행렬 예측의 기초로 해야할지를 나타내는 추가적인 플래그가 포함될 수 있다. 또한, 하나의 변환 단위의 크기에 대하여 복수 종류의 양자화 행렬이 설정되고, 1픽처 내에서 슬라이스마다 또는 블록마다 양자화 행렬이 선택적으로 전환되어도 된다.

<5. 변형예>

또한, 상술한 바와 같이, 본 명세서에서 개시한 기술은, 보다 큰 크기의 양자화 행렬로부터 보다 작은 크기의 양자화 행렬을 예측하는 방식으로 실현되어도 된다. 예를 들어, 8×8의 양자화 행렬(SL2)을 다음과 같이 정의한다:

화상 부호화 장치(10)의 직교 변환·양자화부(14)의 예측부(152)는 이러한 양자화 행렬(SL2)로부터, 예를 들어 다음의 예측식(12)를 따라서 4×4의 예측 행렬(PSL1)을 산출할 수 있다:

예측식(12)를 참조하면, 예측 행렬(PSL1)은 양자화 행렬(SL2)의 요소를 1행 걸러서 또한 1열 걸러서 씨닝함으로써 생성된 행렬이다. 씨닝되는 요소의 위치는 예측식(12)의 예에 한정되지 않고, 다른 위치이어도 된다. 또한, 씨닝되는 요소의 수를 증가시킴으로써 1변의 크기가 4분의 1 이하인 예측 행렬을 양자화 행렬로부터 생성할 수도 있다.

그 대신에, 예측 행렬(PSL1)은 다음 예측식(13)을 따라서 양자화 행렬(SL2)로부터 산출되어도 된다:

예측식(13)을 참조하면, 예측 행렬(PSL1)은 양자화 행렬(SL2)에 있어서 상하 좌우로 서로 인접하는 4개의 요소의 평균을 예측 행렬(PSL1)의 하나의 요소로서 계산함으로써 생성된 행렬이다. 또한, 상하 좌우로 서로 인접하는 보다 많은(예를 들어 16개) 요소의 평균을 계산함으로써 1변의 크기가 4분의 1 이하인 예측 행렬을 양자화 행렬로부터 생성할 수도 있다. 또한, 예측식(13)과 같은 평균값 대신에 중앙값, 최소값 또는 최대값 등이라는 다른 종류의 대표값이 복수의 요소로부터 계산되어도 된다.

보다 큰 크기의 양자화 행렬로부터 보다 작은 크기의 예측 행렬이 산출될 경우에도, 차분 연산부(154)는 예측부(152)로부터 입력되는 예측 행렬과 대응하는 양자화 행렬의 차분을 나타내는 차분 행렬을 산출하고, 산출한 차분 행렬을 나타내는 차분 행렬 정보를 가역 부호화부(16)로 출력한다. 그리고, 화상 복호 장치(60)의 역양자화·역직교 변환부(63)의 행렬 생성부(210)는, 기초 행렬 정보에 의해 특정되는 양자화 행렬로부터 보다 작은 크기의 양자화 행렬을 상술한 어느 한쪽의 예측식 및 차분 행렬 정보를 사용하여 생성한다.

도 13a 및 도 13b는 본 변형예에 관한 부호화시의 처리 흐름의 일례를 나타내는 흐름도이다. 당해 흐름도에 나타난 처리는 주로 부호화 스트림의 시퀀스마다 행렬 처리부(150) 및 가역 부호화부(16)에 의해 실행될 수 있다.

도 13a를 참조하면, 우선, 행렬 처리부(150)는 당해 시퀀스에 있어서 양자화부(130)에 의해 사용되는 양자화 행렬의 세트를 양자화 행렬 버퍼(140)로부터 취득한다(스텝S300). 여기에서는 일례로서 4×4, 8×8, 16×16 및 32×32의 각 크기에 대응하는 양자화 행렬이 양자화 행렬의 세트에 포함되는 것으로 한다.

이어서, 행렬 처리부(150)는 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S302). 여기서 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=1) 및 32×32의 양자화 행렬을 나타내는 기초 행렬 정보를 부호화한다(스텝S306). 한편, 32×32의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=0)만을 부호화한다(스텝S308).

이어서, 행렬 처리부(150)는 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S312). 여기서 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 예를 들어 상술한 예측식(12) 또는 (13)에 따라서 32×32의 양자화 행렬로부터 16×16의 예측 행렬을 산출한다(스텝S314). 그리고, 가역 부호화부(16)는 행렬 종류별 플래그(=1), 차분 플래그 및 16×16의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있는 경우만)를 부호화한다(스텝S316). 한편, 16×16의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=0)만을 부호화한다(스텝S318).

이어서, 도 13b를 참조하면, 행렬 처리부(150)는 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S322). 여기서 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 16×16의 양자화 행렬로부터 8×8의 예측 행렬을 산출한다(스텝S324). 그리고, 가역 부호화부(16)는 행렬 종류별 플래그(=1), 차분 플래그 및 8×8의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있는 경우만)를 부호화한다(스텝S326). 한편, 8×8의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=0)만을 부호화한다(스텝S328).

이어서, 행렬 처리부(150)는 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S332). 여기서 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 처리부(150)는 8×8의 양자화 행렬로부터 4×4의 예측 행렬을 산출한다(스텝S334). 그리고, 가역 부호화부(16)는, 행렬 종류별 플래그(=1), 차분 플래그 및 4×4의 양자화 행렬과 산출된 예측 행렬의 차분을 나타내는 차분 행렬 정보(차분이 있는 경우만)를 부호화한다(스텝S336). 한편, 4×4의 양자화 행렬이 미리 정해진 행렬인 경우에는, 가역 부호화부(16)는 행렬 종류별 플래그(=0)만을 부호화한다(스텝S338).

이와 같이, 본 변형예에서는, 양자화 행렬을 SPS에서 정의할 때, 크기가 큰 양자화 행렬부터 순서대로 예측 행렬의 산출 및 부호화가 행해질 수 있다. 양자화 행렬을 PPS에서 갱신할 경우에도, 마찬가지로 크기가 큰 양자화 행렬부터 순서대로 예측 행렬의 산출 및 부호화가 행해져도 된다.

도 14a 및 도 14b는 본 실시 형태에 관한 복호시의 처리 흐름의 일례를 나타내는 흐름도이다. 당해 흐름도에 나타난 처리는 주로 부호화 스트림의 시퀀스마다 행렬 생성부(210)에 의해 실행될 수 있다.

도 14a를 참조하면, 우선, 행렬 생성부(210)는 당해 시퀀스의 시퀀스 파라미터 세트에 포함되는 행렬 종류별 플래그에 기초하여 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S402). 여기서 32×32의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 기초 행렬 정보를 사용해서 32×32의 양자화 행렬을 설정한다(즉, 양자화 행렬 버퍼(220)에 기억시킴)(스텝S404). 한편, 32×32의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 32×32의 양자화 행렬을 설정한다(스텝S406).

이어서, 행렬 생성부(210)는 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S412). 여기서 16×16의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 예를 들어 상술한 예측식(12) 또는 (13)에 따라서 32×32의 양자화 행렬로부터 16×16의 예측 행렬을 산출하고, 산출한 예측 행렬과 16×16의 차분 행렬을 가산한다. 그에 의해 16×16의 양자화 행렬이 재구축된다(스텝S414). 또한, 16×16의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 16×16의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 16×16의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 16×16의 양자화 행렬을 설정한다(스텝S416).

이어서, 도 14b를 참조하면, 행렬 생성부(210)는 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S422). 여기서 8×8의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 16×16의 양자화 행렬로부터 8×8의 예측 행렬을 산출하고, 산출한 예측 행렬과 8×8의 차분 행렬을 가산한다. 그에 의해 8×8의 양자화 행렬이 재구축된다(스텝S424). 또한, 8×8의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 8×8의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 8×8의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 8×8의 양자화 행렬을 설정한다(스텝S426).

이어서, 행렬 생성부(210)는 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인지 여부를 판정한다(스텝S432). 여기서 4×4의 양자화 행렬이 유저에 의해 정의되는 행렬인 경우에는, 행렬 생성부(210)는 8×8의 양자화 행렬로부터 4×4의 예측 행렬을 산출하고, 산출한 예측 행렬과 4×4의 차분 행렬을 가산한다. 그에 의해 4×4의 양자화 행렬이 재구축된다(스텝S434). 또한, 4×4의 차분 플래그가 「0」이면, 차분 행렬은 0행렬이며, 4×4의 예측 행렬이 그대로 양자화 행렬로서 설정될 수 있다. 한편, 4×4의 양자화 행렬이 미리 정해진 행렬인 경우에는, 행렬 생성부(210)는 미리 정해진 4×4의 양자화 행렬을 설정한다(스텝S436).

이와 같이, 본 변형예에서는, 양자화 행렬을 SPS로부터 복호할 때, 크기가 큰 양자화 행렬부터 순서대로 행렬이 재구축될 수 있다. 양자화 행렬을 PPS에서 갱신할 경우에도, 마찬가지로 크기가 큰 양자화 행렬부터 순서대로 행렬이 재구축되면 된다.

<6. 응용예>

상술한 실시 형태에 관한 화상 부호화 장치(10) 및 화상 복호 장치(60)는 위성 방송, 케이블 TV 등의 유선 방송, 인터넷 상에서의 배신 및 셀룰러 통신에 의한 단말기에의 배신 등에 있어서의 송신기 또는 수신기, 광 디스크, 자기 디스크 및 플래시 메모리 등의 매체에 화상을 기록하는 기록 장치, 또는, 이들 기억 매체로부터 화상을 재생하는 재생 장치 등의 다양한 전자 기기에 응용될 수 있다. 이하, 4개의 응용예에 대하여 설명한다.

[6-1. 제1 응용예]

도 15는 상술한 실시 형태를 적용한 텔레비전 장치의 개략적인 구성의 일례를 나타내고 있다. 텔레비전 장치(900)는 안테나(901), 튜너(902), 디멀티플렉서(903), 디코더(904), 영상 신호 처리부(905), 표시부(906), 음성 신호 처리부(907), 스피커(908), 외부 인터페이스(909), 제어부(910), 유저 인터페이스(911) 및 버스(912)를 구비한다.

튜너(902)는 안테나(901)를 통하여 수신되는 방송 신호로부터 원하는 채널의 신호를 추출하고, 추출한 신호를 복조한다. 그리고, 튜너(902)는 복조에 의해 얻어진 부호화 비트 스트림을 디멀티플렉서(903)로 출력한다. 즉, 튜너(902)는 화상이 부호화되어 있는 부호화 스트림을 수신하는 텔레비전 장치(900)에 있어서의 전송 수단으로서의 역할을 갖는다.

디멀티플렉서(903)는 부호화 비트 스트림으로부터 시청 대상 프로그램의 영상 스트림 및 음성 스트림을 분리하고, 분리한 각 스트림을 디코더(904)로 출력한다. 또한, 디멀티플렉서(903)는 부호화 비트 스트림으로부터 EPG(Electronic Program Guide) 등의 보조적인 데이터를 추출하고, 추출한 데이터를 제어부(910)에 공급한다. 또한, 디멀티플렉서(903)는 부호화 비트 스트림이 스크램블되어 있는 경우에는 디스크램블을 행해도 된다.

디코더(904)는 디멀티플렉서(903)로부터 입력되는 영상 스트림 및 음성 스트림을 복호한다. 그리고, 디코더(904)는 복호 처리에 의해 생성되는 영상 데이터를 영상 신호 처리부(905)로 출력한다. 또한, 디코더(904)는 복호 처리에 의해 생성되는 음성 데이터를 음성 신호 처리부(907)로 출력한다.

영상 신호 처리부(905)는 디코더(904)로부터 입력되는 영상 데이터를 재생하고, 표시부(906)에 영상을 표시시킨다. 또한, 영상 신호 처리부(905)는 네트워크를 통하여 공급되는 어플리케이션 화면을 표시부(906)에 표시시켜도 된다. 또한, 영상 신호 처리부(905)는 영상 데이터에 대해서, 설정에 따라서, 예를 들어 노이즈 제거 등의 추가적인 처리를 행해도 된다. 또한, 영상 신호 처리부(905)는, 예를 들어 메뉴, 버튼 또는 커서 등의 GUI(Graphical User Interface)의 화상을 생성하고, 생성한 화상을 출력 화상에 중첩해도 된다.

표시부(906)는 영상 신호 처리부(905)로부터 공급되는 구동 신호에 의해 구동되고, 표시 디바이스(예를 들어, 액정 디스플레이, 플라즈마 디스플레이 또는 OLED 등)의 영상면 상에 영상 또는 화상을 표시한다.

음성 신호 처리부(907)는 디코더(904)로부터 입력되는 음성 데이터에 대하여 D/A 변환 및 증폭 등의 재생 처리를 행하고, 스피커(908)로부터 음성을 출력시킨다. 또한, 음성 신호 처리부(907)는 음성 데이터에 대하여 노이즈 제거 등의 추가적인 처리를 행해도 된다.

외부 인터페이스(909)는 텔레비전 장치(900)와 외부 기기 또는 네트워크를 접속하기 위한 인터페이스이다. 예를 들어, 외부 인터페이스(909)를 통하여 수신되는 영상 스트림 또는 음성 스트림이 디코더(904)에 의해 복호되어도 된다. 즉, 외부 인터페이스(909)도 또한, 화상이 부호화되어 있는 부호화 스트림을 수신하는 텔레비전 장치(900)에 있어서의 전송 수단으로서의 역할을 갖는다.

제어부(910)는 CPU(Central Processing Unit) 등의 프로세서, 및 RAM(Random Access Memory) 및 ROM(Read Only Memory) 등의 메모리를 갖는다. 메모리는 CPU에 의해 실행되는 프로그램, 프로그램 데이터, EPG 데이터, 및 네트워크를 통하여 취득되는 데이터 등을 기억한다. 메모리에 의해 기억되는 프로그램은, 예를 들어 텔레비전 장치(900)의 기동 시에 CPU에 의해 판독되고 실행된다. CPU는 프로그램을 실행함으로써, 예를 들어 유저 인터페이스(911)로부터 입력되는 조작 신호에 따라서 텔레비전 장치(900)의 동작을 제어한다.

유저 인터페이스(911)는 제어부(910)와 접속된다. 유저 인터페이스(911)는, 예를 들어 유저가 텔레비전 장치(900)를 조작하기 위한 버튼 및 스위치, 및 원격 제어 신호의 수신부 등을 갖는다. 유저 인터페이스(911)는 이들 구성 요소를 거쳐 유저에 의한 조작을 검출해서 조작 신호를 생성하고, 생성한 조작 신호를 제어부(910)로 출력한다.

버스(912)는 튜너(902), 디멀티플렉서(903), 디코더(904), 영상 신호 처리부(905), 음성 신호 처리부(907), 외부 인터페이스(909) 및 제어부(910)를 서로 접속한다.

이와 같이 구성된 텔레비전 장치(900)에 있어서, 디코더(904)는 상술한 실시 형태에 관한 화상 복호 장치(60)의 기능을 갖는다. 그에 의해 텔레비전 장치(900)에서의 화상의 복호 시에 양자화 행렬의 수가 많아지는 경우의 부호량의 증가를 억제할 수 있다.

[6-2. 제2 응용예]

도 16은 상술한 실시 형태를 적용한 휴대 전화기의 개략적인 구성의 일례를 나타내고 있다. 휴대 전화기(920)는 안테나(921), 통신부(922), 음성 코덱(923), 스피커(924), 마이크로폰(925), 카메라부(926), 화상 처리부(927), 다중 분리부(928), 기록 재생부(929), 표시부(930), 제어부(931), 조작부(932) 및 버스(933)를 구비한다.

안테나(921)는 통신부(922)에 접속된다. 스피커(924) 및 마이크로폰(925)은 음성 코덱(923)에 접속된다. 조작부(932)는 제어부(931)에 접속된다. 버스(933)는 통신부(922), 음성 코덱(923), 카메라부(926), 화상 처리부(927), 다중 분리부(928), 기록 재생부(929), 표시부(930) 및 제어부(931)를 서로 접속한다.

휴대 전화기(920)는 음성 통화 모드, 데이터 통신 모드, 촬영 모드 및 화상 통화 모드를 포함하는 여러가지 동작 모드에서 음성 신호의 송수신, 전자 메일 또는 화상 데이터의 송수신, 화상의 촬상 및 데이터의 기록 등의 동작을 행한다.

음성 통화 모드에서 마이크로폰(925)에 의해 생성되는 아날로그 음성 신호는 음성 코덱(923)에 공급된다. 음성 코덱(923)은 아날로그 음성 신호를 음성 데이터로 변환하고, 변환된 음성 데이터를 A/D 변환하여 압축한다. 그리고, 음성 코덱(923)은 압축 후의 음성 데이터를 통신부(922)로 출력한다. 통신부(922)는 음성 데이터를 부호화 및 변조하여 송신 신호를 생성한다. 그리고, 통신부(922)는 생성한 송신 신호를 안테나(921)를 통하여 기지국(도시하지 않음)에 송신한다. 또한, 통신부(922)는 안테나(921)를 통하여 수신되는 무선 신호를 증폭하여 및 주파수 변환하여 수신 신호를 취득한다. 그리고, 통신부(922)는 수신 신호를 복조 및 복호하여 음성 데이터를 생성하고, 생성한 음성 데이터를 음성 코덱(923)으로 출력한다. 음성 코덱(923)은 음성 데이터를 신장하여 및 D/A 변환하여 아날로그 음성 신호를 생성한다. 그리고, 음성 코덱(923)은 생성한 음성 신호를 스피커(924)에 공급하여 음성을 출력시킨다.

또한, 데이터 통신 모드에서, 예를 들어 제어부(931)는 조작부(932)를 개재하는 유저에 의한 조작에 따라서 전자 메일을 구성하는 문자 데이터를 생성한다. 또한, 제어부(931)는 문자를 표시부(930)에 표시시킨다. 또한, 제어부(931)는 조작부(932)를 개재하는 유저로부터의 송신 지시에 따라서 전자 메일 데이터를 생성하고, 생성한 전자 메일 데이터를 통신부(922)로 출력한다. 통신부(922)는 전자 메일 데이터를 부호화 및 변조하여 송신 신호를 생성한다. 그리고, 통신부(922)는 생성한 송신 신호를 안테나(921)를 통하여 기지국(도시하지 않음)에 송신한다. 또한, 통신부(922)는 안테나(921)를 통하여 수신되는 무선 신호를 증폭하여 및 주파수 변환하여 수신 신호를 취득한다. 그리고, 통신부(922)는 수신 신호를 복조 및 복호하여 전자 메일 데이터를 복원하고, 복원한 전자 메일 데이터를 제어부(931)로 출력한다. 제어부(931)는 표시부(930)에 전자 메일의 내용을 표시시킴과 함께, 전자 메일 데이터를 기록 재생부(929)의 기억 매체에 기억시킨다.

기록 재생부(929)는 판독 기입 가능한 임의의 기억 매체를 갖는다. 예를 들어, 기억 매체는 RAM 또는 플래시 메모리 등의 내장형의 기억 매체이어도 되고, 하드 디스크, 자기 디스크, 광자기 디스크, 광 디스크, USB 메모리, 또는 메모리 카드 등의 외부 장착형의 기억 매체이어도 된다.

또한, 촬영 모드에서, 예를 들어 카메라부(926)는 피사체를 촬상하여 화상 데이터를 생성하고, 생성한 화상 데이터를 화상 처리부(927)로 출력한다. 화상 처리부(927)는 카메라부(926)로부터 입력되는 화상 데이터를 부호화하고, 부호화 스트림을 기록 재생부(929)의 기억 매체에 기억시킨다.

또한, 화상 통화 모드에서, 예를 들어 다중 분리부(928)는 화상 처리부(927)에 의해 부호화된 영상 스트림과, 음성 코덱(923)으로부터 입력되는 음성 스트림을 다중화하고, 다중화한 스트림을 통신부(922)로 출력한다. 통신부(922)는 스트림을 부호화 및 변조하여 송신 신호를 생성한다. 그리고, 통신부(922)는 생성한 송신 신호를 안테나(921)를 통하여 기지국(도시하지 않음)에 송신한다. 또한, 통신부(922)는 안테나(921)를 통하여 수신되는 무선 신호를 증폭하여 및 주파수 변환하여 수신 신호를 취득한다. 이들 송신 신호 및 수신 신호에는 부호화 비트 스트림이 포함될 수 있다. 그리고, 통신부(922)는 수신 신호를 복조 및 복호하여 스트림을 복원하고, 복원한 스트림을 다중 분리부(928)로 출력한다. 다중 분리부(928)는 입력되는 스트림으로부터 영상 스트림 및 음성 스트림을 분리하고, 영상 스트림을 화상 처리부(927), 음성 스트림을 음성 코덱(923)으로 출력한다. 화상 처리부(927)는 영상 스트림을 복호하여 영상 데이터를 생성한다. 영상 데이터는 표시부(930)에 공급되고, 표시부(930)에 의해 일련의 화상이 표시된다. 음성 코덱(923)은 음성 스트림을 신장하여 및 D/A 변환하여 아날로그 음성 신호를 생성한다. 그리고, 음성 코덱(923)은 생성한 음성 신호를 스피커(924)에 공급하여 음성을 출력시킨다.

이와 같이 구성된 휴대 전화기(920)에 있어서, 화상 처리부(927)는 상술한 실시 형태에 관한 화상 부호화 장치(10) 및 화상 복호 장치(60)의 기능을 갖는다. 그에 의해, 휴대 전화기(920)에서의 화상의 부호화 및 복호 시에 양자화 행렬의 수가 많아지는 경우의 부호량의 증가를 억제할 수 있다.

[6-3. 제3 응용예]

도 17은 상술한 실시 형태를 적용한 기록 재생 장치의 개략적인 구성의 일례를 나타내고 있다. 기록 재생 장치(940)는, 예를 들어 수신한 방송 프로그램의 음성 데이터 및 영상 데이터를 부호화하여 기록 매체에 기록한다. 또한, 기록 재생 장치(940)는, 예를 들어 다른 장치로부터 취득되는 음성 데이터 및 영상 데이터를 부호화하여 기록 매체에 기록해도 된다. 또한, 기록 재생 장치(940)는, 예를 들어 유저의 지시에 따라서 기록 매체에 기록되어 있는 데이터를 모니터 및 스피커 상에서 재생한다. 이 때, 기록 재생 장치(940)는 음성 데이터 및 영상 데이터를 복호한다.

기록 재생 장치(940)는 튜너(941), 외부 인터페이스(942), 인코더(943), HDD(Hard Disk Drive)(944), 디스크 드라이브(945), 셀렉터(946), 디코더(947), OSD(On-Screen Display)(948), 제어부(949) 및 유저 인터페이스(950)를 구비한다.

튜너(941)는 안테나(도시하지 않음)를 통하여 수신되는 방송 신호로부터 원하는 채널의 신호를 추출하고, 추출한 신호를 복조한다. 그리고, 튜너(941)는 복조에 의해 얻어진 부호화 비트 스트림을 셀렉터(946)로 출력한다. 즉, 튜너(941)는 기록 재생 장치(940)에 있어서의 전송 수단으로서의 역할을 갖는다.

외부 인터페이스(942)는 기록 재생 장치(940)와 외부 기기 또는 네트워크를 접속하기 위한 인터페이스이다. 외부 인터페이스(942)는, 예를 들어 IEEE1394 인터페이스, 네트워크 인터페이스, USB 인터페이스, 또는 플래시 메모리 인터페이스 등이어도 된다. 예를 들어, 외부 인터페이스(942)를 통하여 수신되는 영상 데이터 및 음성 데이터는 인코더(943)에 입력된다. 즉, 외부 인터페이스(942)는 기록 재생 장치(940)에 있어서의 전송 수단으로서의 역할을 갖는다.

인코더(943)는 외부 인터페이스(942)로부터 입력되는 영상 데이터 및 음성 데이터가 부호화되어 있지 않은 경우에 영상 데이터 및 음성 데이터를 부호화한다. 그리고, 인코더(943)는 부호화 비트 스트림을 셀렉터(946)로 출력한다.

HDD(944)는 영상 및 음성 등의 콘텐츠 데이터가 압축된 부호화 비트 스트림, 각종 프로그램 및 그 밖의 데이터를 내부의 하드 디스크에 기록한다. 또한, HDD(944)는 영상 및 음성의 재생 시에 이들 데이터를 하드 디스크로부터 판독한다.

디스크 드라이브(945)는 장착되어 있는 기록 매체에의 데이터의 기록 및 판독을 행한다. 디스크 드라이브(945)에 장착되는 기록 매체는, 예를 들어 DVD 디스크(DVD-Video, DVD- RAM, DVD-R, DVD-RW, DVD+R, DVD+RW 등) 또는 Blu-ray(등록 상표) 디스크 등이어도 된다.

셀렉터(946)는, 영상 및 음성의 기록 시에는 튜너(941) 또는 인코더(943)로부터 입력되는 부호화 비트 스트림을 선택하고, 선택한 부호화 비트 스트림을 HDD(944) 또는 디스크 드라이브(945)로 출력한다. 또한, 셀렉터(946)는, 영상 및 음성의 재생 시에는 HDD(944) 또는 디스크 드라이브(945)로부터 입력되는 부호화 비트 스트림을 디코더(947)로 출력한다.

디코더(947)는 부호화 비트 스트림을 복호하여 영상 데이터 및 음성 데이터를 생성한다. 그리고, 디코더(947)는 생성한 영상 데이터를 OSD(948)로 출력한다. 또한, 디코더(904)는 생성한 음성 데이터를 외부 스피커로 출력한다.

OSD(948)는 디코더(947)로부터 입력되는 영상 데이터를 재생하여 영상을 표시한다. 또한, OSD(948)는 표시하는 영상에, 예를 들어 메뉴, 버튼 또는 커서 등의 GUI의 화상을 중첩해도 된다.

제어부(949)는 CPU 등의 프로세서, 및 RAM 및 ROM 등의 메모리를 갖는다. 메모리는 CPU에 의해 실행되는 프로그램 및 프로그램 데이터 등을 기억한다. 메모리에 의해 기억되는 프로그램은, 예를 들어 기록 재생 장치(940)의 기동 시에 CPU에 의해 판독되고 실행된다. CPU는 프로그램을 실행함으로써, 예를 들어 유저 인터페이스(950)로부터 입력되는 조작 신호에 따라서 기록 재생 장치(940)의 동작을 제어한다.

유저 인터페이스(950)는 제어부(949)와 접속된다. 유저 인터페이스(950)는, 예를 들어 유저가 기록 재생 장치(940)를 조작하기 위한 버튼 및 스위치, 및 원격 제어 신호의 수신부 등을 갖는다. 유저 인터페이스(950)는 이들 구성 요소를 개재하여 유저에 의한 조작을 검출하여 조작 신호를 생성하고, 생성한 조작 신호를 제어부(949)로 출력한다.

이와 같이 구성된 기록 재생 장치(940)에 있어서, 인코더(943)는 상술한 실시 형태에 관한 화상 부호화 장치(10)의 기능을 갖는다. 또한, 디코더(947)는 상술한 실시 형태에 관한 화상 복호 장치(60)의 기능을 갖는다. 그에 의해, 기록 재생 장치(940)에서의 화상의 부호화 및 복호 시에 양자화 행렬의 수가 많아지는 경우의 부호량의 증가를 억제할 수 있다.

[6-4. 제4 응용예]

도 18은 상술한 실시 형태를 적용한 촬상 장치의 개략적인 구성의 일례를 나타내고 있다. 촬상 장치(960)는 피사체를 촬상하여 화상을 생성하고, 화상 데이터를 부호화하여 기록 매체에 기록한다.

촬상 장치(960)는 광학 블록(961), 촬상부(962), 신호 처리부(963), 화상 처리부(964), 표시부(965), 외부 인터페이스(966), 메모리(967), 미디어 드라이브(968), OSD(969), 제어부(970), 유저 인터페이스(971) 및 버스(972)를 구비한다.

광학 블록(961)은 촬상부(962)에 접속된다. 촬상부(962)는 신호 처리부(963)에 접속된다. 표시부(965)는 화상 처리부(964)에 접속된다. 유저 인터페이스(971)는 제어부(970)에 접속된다. 버스(972)는 화상 처리부(964), 외부 인터페이스(966), 메모리(967), 미디어 드라이브(968), OSD(969) 및 제어부(970)를 서로 접속한다.

광학 블록(961)은 포커스 렌즈 및 조리개 기구 등을 갖는다. 광학 블록(961)은 피사체의 광학상을 촬상부(962)의 촬상면에 결상시킨다. 촬상부(962)는 CCD 또는 CMOS 등의 이미지 센서를 갖고, 촬상면에 결상한 광학상을 광전 변환에 의해 전기 신호로서의 화상 신호로 변환한다. 그리고, 촬상부(962)는 화상 신호를 신호 처리부(963)로 출력한다.

신호 처리부(963)는 촬상부(962)로부터 입력되는 화상 신호에 대하여 니 보정, 감마 보정, 색 보정 등의 다양한 카메라 신호 처리를 행한다. 신호 처리부(963)는 카메라 신호 처리 후의 화상 데이터를 화상 처리부(964)로 출력한다.

화상 처리부(964)는 신호 처리부(963)로부터 입력되는 화상 데이터를 부호화하고, 부호화 데이터를 생성한다. 그리고, 화상 처리부(964)는 생성한 부호화 데이터를 외부 인터페이스(966) 또는 미디어 드라이브(968)로 출력한다. 또한, 화상 처리부(964)는 외부 인터페이스(966) 또는 미디어 드라이브(968)로부터 입력되는 부호화 데이터를 복호하고, 화상 데이터를 생성한다. 그리고, 화상 처리부(964)는 생성한 화상 데이터를 표시부(965)로 출력한다. 또한, 화상 처리부(964)는 신호 처리부(963)로부터 입력되는 화상 데이터를 표시부(965)로 출력하여 화상을 표시시켜도 된다. 또한, 화상 처리부(964)는 OSD(969)로부터 취득되는 표시용 데이터를 표시부(965)로 출력하는 화상에 중첩해도 된다.

OSD(969)는, 예를 들어 메뉴, 버튼 또는 커서 등의 GUI의 화상을 생성하고, 생성한 화상을 화상 처리부(964)로 출력한다.

외부 인터페이스(966)는, 예를 들어 USB 입출력 단자로서 구성된다. 외부 인터페이스(966)는, 예를 들어 화상의 인쇄 시에 촬상 장치(960)와 프린터를 접속한다. 또한, 외부 인터페이스(966)에는 필요에 따라서 드라이브가 접속된다. 드라이브에는, 예를 들어 자기 디스크 또는 광 디스크 등의 리무버블 미디어가 장착되고, 리무버블 미디어로부터 판독되는 프로그램이 촬상 장치(960)에 인스톨될 수 있다. 또한, 외부 인터페이스(966)는 LAN 또는 인터넷 등의 네트워크에 접속되는 네트워크 인터페이스로서 구성되어도 된다. 즉, 외부 인터페이스(966)는 촬상 장치(960)에 있어서의 전송 수단으로서의 역할을 갖는다.

미디어 드라이브(968)에 장착되는 기록 매체는, 예를 들어 자기 디스크, 광자기 디스크, 광 디스크, 또는 반도체 메모리 등의 판독 기입 가능한 임의의 리무버블 미디어이면 된다. 또한, 미디어 드라이브(968)에 기록 매체가 고정적으로 장착되고, 예를 들어 내장형 하드디스크 드라이브 또는 SSD(Solid State Drive)와 같은 비가반성의 기억부가 구성되어도 된다.

제어부(970)는 CPU 등의 프로세서, 및 RAM 및 ROM 등의 메모리를 갖는다. 메모리는 CPU에 의해 실행되는 프로그램 및 프로그램 데이터 등을 기억한다. 메모리에 의해 기억되는 프로그램은, 예를 들어 촬상 장치(960)의 기동 시에 CPU에 의해 판독되고 실행된다. CPU는 프로그램을 실행함으로써, 예를 들어 유저 인터페이스(971)로부터 입력되는 조작 신호에 따라서 촬상 장치(960)의 동작을 제어한다.

유저 인터페이스(971)는 제어부(970)와 접속된다. 유저 인터페이스(971)는, 예를 들어 유저가 촬상 장치(960)를 조작하기 위한 버튼 및 스위치 등을 갖는다. 유저 인터페이스(971)는 이들 구성 요소를 개재하여 유저에 의한 조작을 검출하여 조작 신호를 생성하고, 생성한 조작 신호를 제어부(970)로 출력한다.

이와 같이 구성된 촬상 장치(960)에 있어서, 화상 처리부(964)는 상술한 실시 형태에 관한 화상 부호화 장치(10) 및 화상 복호 장치(60)의 기능을 갖는다. 그에 의해, 촬상 장치(960)에서의 화상의 부호화 및 복호 시에 양자화 행렬의 수가 많아지는 경우의 부호량의 증가를 억제할 수 있다.

<7. 정리>

여기까지, 도 1 내지 도 18을 사용하여 일실시 형태에 관한 화상 부호화 장치(10) 및 화상 복호 장치(60)에 대하여 설명하였다. 본 실시 형태에 따르면, 크기가 상이한 복수의 변환 단위에 대응하는 복수의 양자화 행렬이 사용되는 경우에, 제1 크기의 변환 단위에 대응하는 제1 양자화 행렬로부터 제2 크기의 변환 단위에 대응하는 제2 양자화 행렬이 예측의 방법을 이용하여 생성된다. 따라서, 제2 양자화 행렬의 전체를 부호화할 필요성이 해소되어 양자화 행렬의 수가 많아지는 경우에도 부호량의 증가를 억제할 수 있다.

또한, 본 실시 형태에 따르면, 제2 양자화 행렬은, 제1 양자화 행렬을 특정하는 행렬 정보 및 예측 행렬과 제2 양자화 행렬의 차분을 나타내는 차분 정보(차분 행렬 정보)를 사용하여 생성된다. 따라서, 제2 양자화 행렬에 대해서, 당해 행렬과 예측 행렬의 차분만을 부호화하는 것만으로 화상의 복호측에 있어서 적절한 제2 양자화 행렬을 얻을 수 있다.

또한, 본 실시 형태에 따르면, 예측 행렬과 제2 양자화 행렬의 차분이 존재하지 않는 것을 나타내는 제1 플래그가 시퀀스 파라미터 세트 또는 픽처 파라미터 세트로부터 취득된 경우에는, 제2 양자화 행렬로부터 예측되는 예측 행렬이 제2 양자화 행렬이 된다. 이 경우에는, 제2 양자화 행렬에 대하여 차분 정보조차 부호화되지 않으므로 부호량의 새로운 삭감이 가능하다.

또한, 제1 양자화 행렬의 크기는 복수의 변환 단위의 크기 중 최소의 크기이면 된다. 이러한 구성에 의하면, 최소의 크기의 양자화 행렬 이외의 다른 양자화 행렬에 대하여 행렬의 전체를 부호화하지 않아도 되므로, 양자화 행렬의 수가 많아지는 경우에도 부호량의 증가를 한층 효과적으로 억제할 수 있다.

또한, 본 명세서에서는, 양자화 행렬을 생성하기 위한 정보가 부호화 스트림의 헤더에 다중화되어 부호화측으로부터 복호측에 전송되는 예에 대하여 설명하였다. 그러나, 이들 정보를 전송하는 방법은 이러한 예에 한정되지 않는다. 예를 들어, 이들 정보는 부호화 비트 스트림에 다중화되지 않고, 부호화 비트 스트림과 관련지어진 별개의 데이터로서 전송되어도 또는 기록되어도 된다. 여기서, 「관련짓는다」라는 용어는, 비트 스트림에 포함되는 화상(슬라이스 또는 블록 등, 화상의 일부이어도 됨)과 당해 화상에 대응하는 정보를 복호 시에 링크시킬 수 있도록 하는 것을 의미한다. 즉, 정보는 화상(또는 비트 스트림)과는 다른 전송로 상에서 전송되어도 된다. 또한, 정보는 화상(또는 비트 스트림)과는 다른 기록 매체(또는 동일한 기록 매체의 다른 기록 영역)에 기록되어도 된다. 또한, 정보와 화상(또는 비트 스트림)은, 예를 들어 복수 프레임, 1프레임, 또는 프레임 내의 일부분 등의 임의의 단위로 서로 관련지어져도 된다.

이상, 첨부 도면을 참조하면서 본 개시의 적합한 실시 형태에 대하여 상세하게 설명했지만, 본 개시의 기술적 범위는 이러한 예에 한정되지 않는다. 본 개시의 기술의 분야에 있어서의 통상의 지식을 갖는 자이면, 특허 청구 범위에 기재된 기술적 사상의 범주 내에서 각종 변경예 또는 수정예에 상도할 수 있는 것은 명확하며, 이들에 대해서도 당연히 본 개시의 기술적 범위에 속하는 것으로 이해된다.

10 : 화상 처리 장치(화상 부호화 장치)
16 : 부호화부
110 : 선택부
120 : 직교 변환부
130 : 양자화부
60 : 화상 처리 장치(화상 복호 장치)
210 : 행렬 생성부
230 : 선택부
240 : 역양자화부
250 : 역직교 변환부

Claims

8×8의 양자화 행렬에 있어서 서로 인접하는 제1 요소와 제2 요소 사이의 요소로서 상기 제1 요소 또는 상기 제2 요소를 복제함으로써, 32×32의 변환 단위에 대응하는 32×32의 양자화 행렬을 설정하는 설정부와,
상기 설정부에 의해 설정된 32×32의 상기 양자화 행렬을 사용하여, 양자화된 변환 계수 데이터를 역양자화하는 역양자화부를 구비하고,
상기 양자화된 변환 계수 데이터는 부호화 단위를 분할함으로써 형성된 변환 단위별로 역양자화되는, 화상 처리 장치.
제1항에 있어서, 상기 설정부는, 8×8의 상기 양자화 행렬이

인 것으로 하고, 32×32의 상기 양자화 행렬을

로 설정하는, 화상 처리 장치.
제1항 또는 제2항에 있어서, 32×32의 상기 변환 단위로, 상기 역양자화부에 의해 역양자화된 변환 계수 데이터를 역직교 변환하여, 화상 데이터를 생성하는 역직교 변환부를 더 구비하는, 화상 처리 장치.
8×8의 양자화 행렬에 있어서 서로 인접하는 제1 요소와 제2 요소 사이의 요소로서 상기 제1 요소 또는 상기 제2 요소를 복제함으로써, 32×32의 변환 단위에 대응하는 32×32의 양자화 행렬을 설정하는 스텝과,
설정된 32×32의 상기 양자화 행렬을 사용하여, 양자화된 변환 계수 데이터를 역양자화하는 스텝을 포함하고,
상기 양자화된 변환 계수 데이터는 부호화 단위를 분할함으로써 형성된 변환 단위별로 역양자화되는, 화상 처리 방법.
제4항에 있어서, 8×8의 상기 양자화 행렬이

인 것으로 하고, 32×32의 상기 양자화 행렬은

로 설정되는, 화상 처리 방법.
제4항 또는 제5항에 있어서, 32×32의 상기 변환 단위로, 역양자화된 변환 계수 데이터를 역직교 변환하여, 화상 데이터를 생성하는 스텝을 더 포함하는, 화상 처리 방법.