KR20150063379A - 부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법 - Google Patents

부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법 Download PDF

Info

Publication number
KR20150063379A
KR20150063379A KR1020157006851A KR20157006851A KR20150063379A KR 20150063379 A KR20150063379 A KR 20150063379A KR 1020157006851 A KR1020157006851 A KR 1020157006851A KR 20157006851 A KR20157006851 A KR 20157006851A KR 20150063379 A KR20150063379 A KR 20150063379A
Authority
KR
South Korea
Prior art keywords
information
unit
reference image
image
flag
Prior art date
Application number
KR1020157006851A
Other languages
English (en)
Inventor
가즈시 사토
슈오 루
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20150063379A publication Critical patent/KR20150063379A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 기술은, 계층 구조를 갖는 화상의 참조 화상에 관한 정보를 공유 또는 예측할 수 있도록 하는 부호화 장치 및 부호화 방법 및 복호 장치 및 복호 방법에 관한 것이다. 인핸스먼트 부호화부는, 인핸스먼트 화상을 부호화할 때에 사용하는 참조 화상에 관한 정보로서의 참조 화상 특정 정보와, 베이스 화상의 참조 화상에 관한 정보로서의 참조 화상 특정 정보를 사용하여, 인핸스먼트 화상의 참조 화상 특정 정보의 생성에 사용하는 참조 화상 특정 생성 정보를 설정한다. 인핸스먼트 부호화부는 인핸스먼트 화상을, 참조 화상을 사용하여 부호화하여, 부호화 데이터를 생성한다. 전송부는, 부호화 데이터와 참조 화상 특정 생성 정보를 전송한다. 본 기술은, 예를 들어 부호화 장치에 적용할 수 있다.

Description

부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법{ENCODING DEVICE, ENCODING METHOD, DECODING DEVICE, AND DECODING METHOD}
본 기술은, 부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법에 관한 것이며, 특히, 계층 구조를 갖는 화상의 참조 화상에 관한 정보를 공유 또는 예측할 수 있도록 한 부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법에 관한 것이다.
최근, 화상 정보를 디지털로서 취급하며, 이때 효율이 높은 정보의 전송, 축적을 목적으로서, 화상 정보 특유의 용장성을 이용해서, 이산 코사인 변환 등의 직교 변환과 움직임 보상에 의해 압축하는 MPEG(Moving Picture Experts Group phase) 등의 방식에 준거한 장치가 방송국 등의 정보 배신, 및 일반 가정에 있어서의 정보 수신의 양쪽에 있어서 보급되고 있다.
특히, MPEG2(ISO/IEC13818-2) 방식은, 범용 화상 부호화 방식으로서 정의되어 있으며, 비월 주사 화상 및 순차 주사 화상의 양쪽, 및 표준 해상도 화상 및 고정밀 화상을 망라하는 표준으로, 프로페셔널 용도 및 컨슈머 용도의 광범위한 애플리케이션에 현재 널리 사용되고 있다. MPEG2 방식을 사용함으로써, 예를 들어 720×480 화소를 갖는 표준 해상도의 비월 주사 화상이면 4 내지 8Mbps, 1920×1088 화소를 갖는 고해상도의 비월 주사 화상이면 18 내지 22MBps의 부호량(비트 레이트)을 할당함으로써, 높은 압축률과 양호한 화질의 실현이 가능하다.
MPEG2는 주로 방송용에 적합한 고화질 부호화를 대상으로 하고 있었지만, MPEG1보다 낮은 부호량(비트 레이트), 즉 보다 높은 압축률의 부호화 방식에는 대응하고 있지 않았다. 휴대 단말기의 보급에 의해, 향후 그러한 부호화 방식의 요구는 높아질 것으로 생각되며, 이에 대응해서 MPEG4 부호화 방식의 표준화가 행해졌다. MPEG4의 화상 부호화 방식에 관해서는, 1998년 12월에 ISO/IEC 14496-2로서 규격이 국제 표준으로 승인되었다.
또한, 최근, 당초 텔레비전 회의용의 화상 부호화를 목적으로서, H.26L(ITU-T Q6/16VCEG)이라는 표준의 규격화가 진행되고 있다. H.26L은 MPEG2나 MPEG4와 같은 종래의 부호화 방식에 비해, 그 부호화, 복호화에 보다 많은 연산량이 요구되지만, 더 높은 부호화 효율이 실현되는 것이 알려져 있다.
또한, 현재, MPEG4의 활동의 일환으로서, 이 H.26L을 베이스로 H.26L에서는 서포트되지 않는 기능도 도입해서, 더 높은 부호화 효율을 실현하는 표준화가 Joint Model of Enhanced-Compression Video Coding으로서 행해지고 있다. 이 표준화는, 2003년 3월에 H.264 및 MPEG-4 Part10(AVC(Advanced Video Coding))이라는 이름하에 국제 표준화되었다.
또한, 그 확장으로서, RGB나 YUV422, YUV444와 같은, 업무용에 필요한 부호화 툴이나, MPEG-2로 규정되어 있었던 8×8DCT나 양자화 매트릭스도 포함한 FRExt(Fidelity Range Extension)의 표준화가 2005년 2월에 완료되었다. 이에 의해, AVC 방식이 영화에 포함되는 필름 노이즈도 양호하게 표현하는 것이 가능한 부호화 방식이 되어, BD(Blu-ray(등록 상표) Disc) 등의 폭넓은 애플리케이션에 사용되는 단계가 되었다.
그러나, 요즘, 하이비전 화상의 4배인 4000×2000 화소 정도의 화상을 압축하고자 하거나, 또는 인터넷과 같은 한정된 전송 용량의 환경에 있어서 하이비전 화상을 배신하고자 하는, 고압축률 부호화에 대한 요구가 한층 더 높아지고 있다. 이로 인해, ITU-T 산하의 VCEG(Video Coding Expert Group)에 있어서, 부호화 효율의 개선에 관한 검토가 계속되고 있다.
또한, 현재, AVC보다 한층 더 부호화 효율의 향상을 목적으로 하여, ITU-T와, ISO/IEC의 공동의 표준화 단체인 JCTVC(Joint Collaboration Team - Video Coding)에 의해, HEVC(High Efficiency Video Coding)라 불리는 부호화 방식의 표준화가 진행되고 있다. 2012년 8월 현재, 초안(Draft)으로서 비특허문헌 1이 발행되어 있다.
그런데, MPEG-2, AVC와 같은 화상 부호화 방식은, 화상을 계층화해서 부호화하는 scalable 기능을 갖고 있었다. scalable 기능에 의하면, 트랜스 코드 처리를 행하지 않고, 복호측의 처리 능력에 따른 부호화 데이터를 전송할 수 있다.
구체적으로는, 예를 들어 휴대 전화와 같은 처리 능력이 낮은 단말기에 대해서는, 베이스가 되는 계층인 베이스 레이어(base layer)의 화상의 부호화 스트림만을 전송할 수 있다. 한편, 텔레비전 수상기나 퍼스널 컴퓨터와 같은 처리 능력이 높은 단말기에 대해서는, 베이스 레이어와, 베이스 레이어 이외의 계층인 인핸스먼트 레이어(enhancement layer)의 화상의 부호화 스트림을 전송할 수 있다.
또한, HEVC 방식에 있어서도 scalable 기능은 구비되어 있으며, 비특허문헌 1에 기재되어 있는 바와 같이, HEVC 방식에서는 SPS(Sequence Parameter Set), PPS(Picture Parameter Set) 이외에, scalable 기능에 관한 파라미터를 포함하는 VPS(Video Parameter Set)가 규정되어 있다.
도 1은, HEVC version1에 있어서의 VPS의 신택스의 일례를 도시하는 도면이다.
HEVC version1에 있어서는, 화상을 프레임 레이트로 계층화해서 부호화하는 scalable 기능(이하, temporal scalability라 함)만이 구비되어 있기 때문에, 도 1에 도시한 바와 같이, VPS에서는 temporal scalability에 관한 파라미터만이 정의되어 있다.
또한, HEVC version2에 있어서는, temporal scalability 이외의 scalable 기능에도 대응하기 위한 표준화가 행해질 예정이다.
Benjamin Bross, Woo-Jin Han, Jens-Rainer Ohm, Gary J. Sullivan, Thomas Wiegand, "High efficiency video coding(HEVC) text specification draft 8", JCTVC-I1003_d7, 2012.7.11-7.20
scalable 기능을 사용해서 부호화가 행해지는 경우, 베이스 레이어의 화상과 인핸스먼트 레이어의 화상이 대응하고 있을 때, 양쪽 화상의 참조 화상에 관한 정보는 상관성이 높다고 생각된다.
그러나, 종래의 HEVC 방식에서는, 계층마다 참조 화상에 관한 정보가 설정되기 때문에 부호화 효율이 나쁘다.
본 기술은 이러한 상황을 감안해서 이루어진 것이며, 계층 구조를 갖는 화상의 참조 화상에 관한 정보를 공유 또는 예측할 수 있도록 하는 것이다.
본 기술의 제1 측면의 부호화 장치는, 계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상의 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용해서, 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보를 설정하는 설정부와, 상기 제1 계층의 화상을 상기 제1 참조 화상을 사용해서 부호화해서, 부호화 데이터를 생성하는 부호화부와, 상기 부호화부에 의해 생성된 상기 부호화 데이터와, 상기 설정부에 의해 설정된 상기 참조 화상 생성 정보를 전송하는 전송부를 구비하는 부호화 장치이다.
본 기술의 제1 측면의 부호화 방법은, 본 기술의 제1 측면의 부호화 장치에 대응한다.
본 기술의 제1 측면에 있어서는, 계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상의 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용해서, 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보가 설정되고, 상기 제1 계층의 화상이 상기 제1 참조 화상을 사용해서 부호화되어, 부호화 데이터가 생성되고, 상기 부호화 데이터와 상기 참조 화상 생성 정보가 전송된다.
본 기술의 제2 측면의 복호 장치는, 계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상의 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용해서 생성된 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보와, 상기 제1 계층의 화상의 부호화 데이터를 수취하는 수취부와, 상기 참조 화상 생성 정보를 사용해서 상기 제1 참조 화상 정보를 생성하는 생성부와, 상기 생성부에 의해 생성된 상기 제1 참조 화상 정보에 기초해서, 상기 제1 계층의 화상의 부호화 데이터를 상기 제1 참조 화상을 사용해서 복호하는 복호부를 구비하는 복호 장치이다.
본 기술의 제2 측면의 복호 방법은, 본 기술의 제2 측면의 복호 장치에 대응한다.
본 기술의 제2 측면에 있어서는, 계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상의 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용해서 생성된 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보와, 상기 제1 계층의 화상의 부호화 데이터가 수취되고, 상기 참조 화상 생성 정보를 사용해서 상기 제1 참조 화상 정보가 생성되며, 생성된 상기 제1 참조 화상 정보에 기초해서, 상기 제1 계층의 화상의 부호화 데이터가 상기 제1 참조 화상을 사용해서 복호된다.
또한, 제1 측면의 부호화 장치 및 제2 측면의 복호 장치는, 컴퓨터에 프로그램을 실행시킴으로써 실현할 수 있다.
또한, 제1 측면의 부호화 장치 및 제2 측면의 복호 장치를 실현하기 위해 컴퓨터에 실행시키는 프로그램은, 전송 매체를 통하여 전송함으로써, 또는 기록 매체에 기록해서 제공할 수 있다.
제1 측면의 부호화 장치 및 제2 측면의 복호 장치는 독립된 장치여도 좋고, 1개의 장치를 구성하고 있는 내부 블록이어도 좋다.
본 기술에 의하면, 계층 구조를 갖는 화상의 참조 화상에 관한 정보를 공유 또는 예측할 수 있다.
도 1은 HEVC version1에 있어서의 VPS의 신택스의 일례를 도시하는 도면이다.
도 2는 spatial scalability를 설명하는 도면이다.
도 3은 temporal scalability를 설명하는 도면이다.
도 4는 SNR scalability를 설명하는 도면이다.
도 5는 본 기술을 적용한 제1 실시 형태의 개요를 설명하는 도면이다.
도 6은 본 기술을 적용한 부호화 장치의 제1 실시 형태의 구성예를 도시하는 블록도이다.
도 7은 베이스 스트림의 SPS의 신택스의 예를 도시하는 도면이다.
도 8은 베이스 스트림의 SPS의 신택스의 예를 도시하는 도면이다.
도 9는 베이스 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 10은 베이스 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 11은 베이스 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 12는 베이스 스트림의 RPS의 신택스의 예를 도시하는 도면이다.
도 13은 도 6의 인핸스먼트 부호화부의 구성예를 도시하는 블록도이다.
도 14는 도 13의 부호화부의 구성예를 도시하는 블록도이다.
도 15는 CU를 설명하는 도면이다.
도 16은 도 14의 참조 화상 설정부의 구성예를 도시하는 블록도이다.
도 17은 도 13의 설정부에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 18은 도 13의 설정부에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 19는 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 구성예를 도시하는 도면이다.
도 20은 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 구성예를 도시하는 도면이다.
도 21은 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 구성예를 도시하는 도면이다.
도 22는 인핸스먼트 스트림의 RPS의 신택스의 예를 도시하는 도면이다.
도 23은 VPS의 신택스의 예를 도시하는 도면이다.
도 24는 도 6의 부호화 장치의 계층 부호화 처리를 설명하는 흐름도이다.
도 25는 도 24의 인핸스먼트 스트림 생성 처리의 상세를 설명하는 흐름도이다.
도 26은 도 25의 부호화 처리의 상세를 설명하는 흐름도이다.
도 27은 도 25의 부호화 처리의 상세를 설명하는 흐름도이다.
도 28은 도 26의 생성 처리의 상세를 설명하는 흐름도이다.
도 29는 본 기술을 적용한 복호 장치의 제1 실시 형태의 구성예를 도시하는 블록도이다.
도 30은 도 29의 인핸스먼트 복호부의 구성예를 도시하는 블록도이다.
도 31은 도 30의 복호부의 구성예를 도시하는 블록도이다.
도 32는 도 31의 참조 화상 설정부의 구성예를 도시하는 블록도이다.
도 33은 도 29의 복호 장치의 계층 복호 처리를 설명하는 흐름도이다.
도 34는 도 30의 인핸스먼트 화상 생성 처리를 설명하는 흐름도이다.
도 35는 도 34의 복호 처리의 상세를 설명하는 흐름도이다.
도 36은 도 35의 생성 처리의 상세를 설명하는 흐름도이다.
도 37은 본 기술을 적용한 제2 실시 형태의 개요를 설명하는 도면이다.
도 38은 가중치 부여 예측을 설명하는 도면이다.
도 39는 본 기술을 적용한 부호화 장치의 제2 실시 형태의 구성예를 도시하는 블록도이다.
도 40은 AVC 방식에 있어서의 PPS의 신택스의 예를 도시하는 도면이다.
도 41은 AVC 방식에 있어서의 PPS의 신택스의 예를 도시하는 도면이다.
도 42는 베이스 스트림의 PPS의 신택스의 예를 도시하는 도면이다.
도 43은 베이스 스트림의 PPS의 신택스의 예를 도시하는 도면이다.
도 44는 AVC 방식에 있어서의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 45는 AVC 방식에 있어서의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 46은 AVC 방식에 있어서의 가중치 부여 정보의 신택스의 예를 도시하는 도면이다.
도 47은 베이스 스트림의 가중치 부여 정보의 신택스의 예를 도시하는 도면이다.
도 48은 도 39의 인핸스먼트 부호화부의 구성예를 도시하는 블록도이다.
도 49는 도 48의 부호화부의 구성예를 도시하는 블록도이다.
도 50은 도 49의 가중 버퍼와 가중 설정부의 구성예를 도시하는 블록도이다.
도 51은 인핸스먼트 스트림의 가중치 부여 정보의 신택스의 예를 도시하는 도면이다.
도 52는 인핸스먼트 스트림의 가중치 부여 정보의 신택스의 예를 도시하는 도면이다.
도 53은 도 48의 인핸스먼트 스트림 생성 처리를 설명하는 흐름도이다.
도 54는 도 53의 부호화 처리의 상세를 설명하는 흐름도이다.
도 55는 도 53의 부호화 처리의 상세를 설명하는 흐름도이다.
도 56은 도 54의 생성 처리의 상세를 설명하는 흐름도이다.
도 57은 본 기술을 적용한 복호 장치의 제2 실시 형태의 구성예를 도시하는 블록도이다.
도 58은 도 57의 인핸스먼트 복호부의 구성예를 도시하는 블록도이다.
도 59는 도 58의 복호부의 구성예를 도시하는 블록도이다.
도 60은 도 59의 가중 버퍼와 가중 설정부의 구성예를 도시하는 블록도이다.
도 61은 도 57의 복호 장치의 계층 복호 처리를 설명하는 흐름도이다.
도 62는 도 59의 복호부의 복호 처리의 상세를 설명하는 흐름도이다.
도 63은 도 62의 생성 처리의 상세를 설명하는 흐름도이다.
도 64는 본 기술을 적용한 제3 실시 형태의 개요를 설명하는 도면이다.
도 65는 본 기술을 적용한 부호화 장치의 제3 실시 형태의 구성예를 도시하는 블록도이다.
도 66은 도 65의 인핸스먼트 부호화부의 구성예를 도시하는 블록도이다.
도 67은 도 66의 부호화부의 구성예를 도시하는 블록도이다.
도 68은 도 66의 설정부에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 69는 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 70은 부호화 장치에 있어서의 효과를 설명하는 도면이다.
도 71은 도 65의 부호화 장치의 계층 부호화 처리를 설명하는 흐름도이다.
도 72는 도 71의 계층 부호화 처리에 있어서의 SPS 설정 처리의 상세를 설명하는 흐름도이다.
도 73은 도 71의 인핸스먼트 부호화 처리에 있어서의 카피 플래그 설정 처리의 상세를 설명하는 흐름도이다.
도 74는 본 개시를 적용한 복호 장치의 제3 실시 형태의 구성예를 도시하는 블록도이다.
도 75는 도 74의 인핸스먼트 복호부의 구성예를 도시하는 블록도이다.
도 76은 도 75의 복호부의 구성예를 도시하는 블록도이다.
도 77은 도 74의 인핸스먼트 복호부의 인핸스먼트 화상 생성 처리를 설명하는 흐름도이다.
도 78은 도 77의 SPS 추출 처리의 상세를 설명하는 흐름도이다.
도 79는 도 77의 인핸스먼트 복호 처리에 있어서의 생성 처리의 상세를 설명하는 흐름도이다.
도 80은 다른 카피 플래그 설정 시의 SPS의 신택스의 예를 도시하는 도면이다.
도 81은 다른 카피 플래그 설정 시의 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 82는 다른 카피 플래그 설정 시의 SPS 설정 처리를 설명하는 흐름도이다.
도 83은 다른 카피 플래그 설정 시의 카피 플래그 설정 처리를 설명하는 흐름도이다.
도 84는 다른 카피 플래그 설정 시의 SPS 추출 처리를 설명하는 흐름도이다.
도 85는 다른 카피 플래그 설정 시의 생성 처리를 설명하는 흐름도이다.
도 86은 제3 실시 형태에 있어서의 VPS의 확장부의 신택스의 예를 도시하는 도면이다.
도 87은 설정 모드 사용 시의 SPS의 신택스의 예를 도시하는 도면이다.
도 88은 설정 모드 사용 시의 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 89는 설정 모드 사용 시의 SPS 설정 처리를 설명하는 흐름도이다.
도 90은 설정 모드 사용 시의 카피 플래그 설정 처리를 설명하는 흐름도이다.
도 91은 설정 모드 사용 시의 SPS 추출 처리를 설명하는 흐름도이다.
도 92는 설정 모드 사용 시의 생성 처리를 설명하는 흐름도이다.
도 93은 부호화 방식에 기초한 공통 카피 플래그 설정 시의 SPS의 신택스의 예를 도시하는 도면이다.
도 94는 본 기술을 적용한 부호화 장치의 제4 실시 형태의 구성예를 도시하는 블록도이다.
도 95는 도 94의 인핸스먼트 부호화부의 구성예를 도시하는 블록도이다.
도 96은 도 95의 부호화부의 구성예를 도시하는 블록도이다.
도 97은 도 95의 설정부에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 98은 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 99는 일부 RPS 카피 플래그용의 RPS의 신택스의 예를 도시하는 도면이다.
도 100은 도 94의 부호화 장치의 SPS 설정 처리를 설명하는 흐름도이다.
도 101은 도 94의 부호화 장치의 카피 플래그 설정 처리의 상세를 설명하는 흐름도이다.
도 102는 본 개시를 적용한 복호 장치의 제4 실시 형태의 구성예를 도시하는 블록도이다.
도 103은 도 102의 인핸스먼트 복호부의 구성예를 도시하는 블록도이다.
도 104는 도 103의 복호부의 구성예를 도시하는 블록도이다.
도 105는 도 102의 복호 장치의 SPS 추출 처리의 상세를 설명하는 흐름도이다.
도 106은 도 102의 복호 장치의 생성 처리의 상세를 설명하는 흐름도이다.
도 107은 공통 RPS 설정 시의 RPS의 신택스의 예를 도시하는 도면이다.
도 108은 공통 RPS 설정 시의 SPS 설정 처리를 설명하는 흐름도이다.
도 109는 공통 RPS 설정 시의 카피 플래그 설정 처리의 상세를 설명하는 흐름도이다.
도 110은 공통 RPS 설정 시의 SPS 추출 처리를 설명하는 흐름도이다.
도 111은 다시점 화상 부호화 방식의 예를 도시하는 도면이다.
도 112는 scalable 기능에 의한 부호화의 다른 예를 도시한다.
도 113은 컴퓨터의 하드웨어의 구성예를 도시하는 블록도이다.
도 114는 본 기술을 적용한 텔레비전 장치의 개략 구성예를 도시하는 도면이다.
도 115는 본 기술을 적용한 휴대 전화기의 개략 구성예를 도시하는 도면이다.
도 116은 본 기술을 적용한 기록 재생 장치의 개략 구성예를 도시하는 도면이다.
도 117은 본 기술을 적용한 촬상 장치의 개략 구성예를 도시하는 도면이다.
도 118은 스케일러블 부호화 이용의 일례를 도시하는 블록도이다.
도 119는 스케일러블 부호화 이용의 다른 예를 도시하는 블록도이다.
도 120은 스케일러블 부호화 이용의 또 다른 예를 도시하는 블록도이다.
<scalable 기능의 설명>
(spatial scalability의 설명)
도 2는, spatial scalability를 설명하는 도면이다.
도 2에 도시한 바와 같이, spatial scalability는 화상을 공간 해상도로 계층화해서 부호화하는 scalable 기능이다. 구체적으로는, spatial scalability에서는, 저해상도의 화상이 베이스 레이어의 화상으로서 부호화되고, 고해상도의 화상과 저해상도의 화상의 차분의 화상이 인핸스먼트 레이어의 화상으로서 부호화된다.
따라서, 부호화 장치는, 처리 능력이 낮은 복호 장치에 대해서 베이스 레이어의 화상의 부호화 데이터만을 전송함으로써, 복호 장치는 저해상도의 화상을 생성할 수 있다. 또한, 부호화 장치는, 처리 능력이 높은 복호 장치에 대해서 베이스 레이어와 인핸스먼트 레이어의 화상의 부호화 데이터를 전송함으로써, 복호 장치는, 베이스 레이어와 인핸스먼트 레이어의 화상을 복호해서 합성하고, 고해상도의 화상을 생성할 수 있다.
(temporal scalability의 설명)
도 3은, temporal scalability를 설명하는 도면이다.
상술한 바와 같이, temporal scalability는, 화상을 프레임 레이트로 계층화해서 부호화하는 scalable 기능이다. 구체적으로는, 도 3에 도시한 바와 같이, temporal scalability에서는, 예를 들어 저프레임 레이트(도 3의 예에서는 7.5fps)의 화상이 베이스 레이어의 화상으로서 부호화된다. 또한, 중프레임 레이트(도 3의 예에서는 15fps)의 화상과 저프레임 레이트의 화상의 차분의 화상이 인핸스먼트 레이어의 화상으로서 부호화된다. 또한, 고프레임 레이트(도 3의 예에서는 30fps)의 화상과 중프레임 레이트의 화상의 차분의 화상이 인핸스먼트 레이어의 화상으로서 부호화된다.
따라서, 부호화 장치는, 처리 능력이 낮은 복호 장치에 대해서 베이스 레이어의 화상 부호화 데이터만을 전송함으로써, 복호 장치는 저프레임 레이트의 화상을 생성할 수 있다. 또한, 부호화 장치는, 처리 능력이 높은 복호 장치에 대해서 베이스 레이어와 인핸스먼트 레이어의 화상의 부호화 데이터를 전송함으로써, 복호 장치는, 베이스 레이어와 인핸스먼트 레이어의 화상을 복호해서 합성하고, 고프레임 레이트 또는 중프레임 레이트의 화상을 생성할 수 있다.
(SNR scalability의 설명)
도 4는, SNR scalability를 설명하는 도면이다.
도 4에 도시한 바와 같이, SNR scalability는 화상을 SNR(signal-noise ratio)로 계층화해서 부호화하는 scalable 기능이다. 구체적으로는, SNR scalability에서는, 저SNR의 화상이 베이스 레이어의 화상으로서 부호화되고, 고SNR의 화상과 저SNR의 화상의 차분의 화상이 인핸스먼트 레이어의 화상으로서 부호화된다.
따라서, 부호화 장치는, 처리 능력이 낮은 복호 장치에 대해서 베이스 레이어의 화상의 부호화 데이터만을 전송함으로써, 복호 장치는 저SNR의 화상, 즉 저화질의 화상을 생성할 수 있다. 또한, 부호화 장치는, 처리 능력이 높은 복호 장치에 대해서 베이스 레이어와 인핸스먼트 레이어의 화상의 부호화 데이터를 전송함으로써, 복호 장치는 베이스 레이어와 인핸스먼트 레이어의 화상을 복호해서 합성하고, 고SNR의 화상, 즉 고화질의 화상을 생성할 수 있다.
또한, 도시는 생략하지만 scalable 기능으로서는, spatial scalability, temporal scalability, SNR scalability의 이외도 존재한다.
예를 들어, scalable 기능으로서는, 화상을 비트수로 계층화해서 부호화하는bit-depth scalability도 있다. 이 경우, 예를 들어 8bit 비디오의 화상이 베이스 레이어의 화상이 되고, 10bit 비디오의 화상과 8bit 비디오의 화상의 차분이 인핸스먼트 레이어의 화상이 되어, 부호화된다.
또한, scalable 기능으로서는, 화상을 색차 신호의 포맷으로 계층화해서 부호화하는 chroma scalability도 있다. 이 경우, 예를 들어 YUV420의 화상이 베이스 레이어의 화상이 되고, YUV422의 화상과 YUV420의 화상의 차분의 화상이 인핸스먼트 레이어의 화상이 되어, 부호화된다.
또한, 이하에서는, 설명의 편의상, 인핸스먼트 레이어가 1개인 경우에 대해서 설명한다.
<제1 실시 형태>
(제1 실시 형태의 개요의 설명)
도 5는, 본 기술을 적용한 제1 실시 형태의 개요를 설명하는 도면이다.
도 5에 도시한 바와 같이, 제1 실시 형태에서는, 참조 화상에 관한 정보로서의 참조 화상을 특정하는 정보(이하, 참조 화상 특정 정보라 함)가 동일 계층간 뿐만 아니라, 상이한 계층간에서 공유 또는 예측된다.
(부호화 장치의 제1 실시 형태의 구성예)
도 6은, 본 기술을 적용한 부호화 장치의 제1 실시 형태의 구성예를 도시하는 블록도이다.
도 6의 부호화 장치(10)는, 베이스 부호화부(11), 인핸스먼트 부호화부(12), 합성부(13) 및 전송부(14)에 의해 구성되고, scalable 기능을 사용해서 HEVC 방식에 준하는 방식으로 화상을 부호화한다.
부호화 장치(10)의 베이스 부호화부(11)에는, 외부로부터 베이스 레이어의 화상(이하, 베이스 화상이라 함)이 입력된다. 베이스 부호화부(11)는, 종래의 HEVC 방식의 부호화 장치와 마찬가지로 구성되며, 베이스 화상을 HEVC 방식으로 부호화한다. 단, 베이스 부호화부(11)는, 베이스 화상의 부호화 시에 사용된 참조 화상의 참조 화상 특정 정보를 인핸스먼트 부호화부(12)에 공급한다. 베이스 부호화부(11)는, 부호화의 결과 얻어지는 부호화 데이터, SPS, PPS 등을 포함하는 부호화 스트림을 베이스 스트림으로서 합성부(13)에 공급한다.
인핸스먼트 부호화부(12)에는, 외부로부터 인핸스먼트 레이어의 화상(이하, 인핸스먼트 화상이라 함)이 입력된다. 인핸스먼트 부호화부(12)는, 인핸스먼트 화상을 HEVC 방식에 준하는 방식으로 부호화한다. 또한, 인핸스먼트 부호화부(12)는 베이스 화상의 참조 화상 특정 정보와, 인핸스먼트 화상의 부호화 시에 사용된 참조 화상의 참조 화상 특정 정보를 사용해서, 인핸스먼트 화상의 참조 화상 특정 정보의 생성에 사용하는 참조 화상 특정 생성 정보(참조 화상 생성 정보)를 생성한다.
인핸스먼트 부호화부(12)는, 인핸스먼트 화상의 부호화 데이터에 참조 화상 특정 생성 정보 등을 부가해서 부호화 스트림을 생성하고, 인핸스먼트 스트림으로서 합성부(13)에 공급한다.
합성부(13)는, 베이스 부호화부(11)로부터 공급되는 베이스 스트림과 인핸스먼트 부호화부(12)로부터 공급되는 인핸스먼트 스트림을 합성하고, VPS 등을 부가해서, 전체 계층의 부호화 스트림을 생성한다. 합성부(13)는, 전체 계층의 부호화 스트림을 전송부(14)에 공급한다.
전송부(14)는, 합성부(13)로부터 공급되는 전체 계층의 부호화 스트림을 후술하는 복호 장치에 전송한다.
또한, 여기에서는, 부호화 장치(10)는 전체 계층의 부호화 스트림을 전송하는 것으로 하지만, 필요에 따라 베이스 스트림만을 전송할 수도 있다.
(베이스 스트림의 SPS의 신택스의 예)
도 7 및 도 8은, 베이스 스트림에 포함되는 SPS의 신택스의 예를 도시하는 도면이다.
도 8의 9행째 내지 11행째에 도시한 바와 같이, 베이스 스트림의 SPS에는 그 SPS에 대응하는 GOP(Group of Picture)의 short term의 참조 화상 특정 정보인 RPS(reference picture set)에 관한 정보가 포함된다. 구체적으로는, SPS에는, 그 SPS에 포함되는 RPS의 수(num_short_term_ref_pic_sets)와, RPS(short_term_ref_pic_set)가 포함된다. RPS에는, 0부터 순서대로 인덱스가 부여되어 있다.
또한, 12행째 내지 17행째에 도시한 바와 같이, SPS에는 long term의 참조 화상 특정 정보에 관한 정보가 기술된다. 구체적으로는, SPS에는, long term의 참조 화상이 사용 가능한 것인지 여부를 나타내는 long term 플래그(long_term_ref_pics_present_flag)가 포함된다.
또한, long term 플래그가, long term의 참조 화상이 사용 가능한 것을 나타내는 1인 경우, SPS에는, 그 SPS에 포함되는 long term의 참조 화상 특정 정보의 수(num_long_term_ref_pics_sps)가 포함된다. 또한, long term의 참조 화상 특정 정보로서의 참조 화상의 POC(Picture Order Count)의 최하위 비트를 나타내는 정보(lt_ref_pic_poc_lsb_sps)가 포함된다. 또한, 참조 화상 특정 정보에서 특정되는 참조 화상이 자기 자신에 의해 참조되지 않는지 여부를 나타내는 참조 플래그(used_by_curr_pic_lt_sps_flag)가 기술된다. long term의 참조 화상 특정 정보에는 0부터 순서대로 인덱스가 부여된다.
또한, 이하에서는, RPS와 long term의 참조 화상 특정 정보를 특별히 구별할 필요가 없는 경우, 간단히 참조 화상 특정 정보라 한다.
(베이스 스트림의 슬라이스 헤더의 신택스의 예)
도 9 내지 도 11은, 베이스 스트림에 포함되는 부호화 데이터에 슬라이스 단위로 부가되는 헤더인 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 9의 18행째에 도시한 바와 같이, 베이스 스트림의 슬라이스 헤더에는, 대응하는 슬라이스의 RPS가 SPS에 포함되는 RPS인 것을 나타내는 RPS 플래그(short_term_ref_pic_set_sps_flag)가 포함된다.
또한, 19행째와 20행째에 도시한 바와 같이, RPS 플래그가 대응하는 슬라이스의 RPS가 SPS에 포함되는 RPS가 아닌 것을 나타내는 0인 경우, 슬라이스 헤더에는, 대응하는 슬라이스의 RPS가, 인덱스가 num_short_term_ref_pic_sets인 RPS(short_term_ref_pic_set(num_short_term_ref_pic_sets))로서 포함된다.
21행째 및 22행째에 도시한 바와 같이, RPS 플래그가, 대응하는 슬라이스의 RPS가 SPS에 포함되는 RPS인 것을 나타내는 1인 경우, 슬라이스 헤더에는, 대응하는 슬라이스의 RPS의 인덱스(short_term_ref_pic_set_idx)가 포함된다.
또한, 23행째 내지 26행째에 도시한 바와 같이, 슬라이스 헤더에는, 대응하는 SPS에 포함되는 long term 플래그가 1인 경우, 그 SPS에 포함되는 long term의 참조 화상 특정 정보의 수인 SPS 내수(num_long_term_sps)와, 그 슬라이스 헤더에 포함되는 long term의 참조 화상 특정 정보의 수인 SPS 외수(num_long_term_pics)가 포함된다.
또한, 27행째 내지 29행째에 도시한 바와 같이, 슬라이스 헤더에는, 대응하는 슬라이스에 있어서의 long term의 참조 화상 특정 정보 중, SPS에 포함되는long term의 참조 화상 특정 정보의 인덱스(lt_idx_sps)가 포함된다. 또한, 30행째 내지 32행째에 도시한 바와 같이, 슬라이스 헤더에는, 대응하는 슬라이스에 있어서의 long term의 참조 화상 특정 정보 중, SPS에 포함되지 않는 long term의 참조 화상 특정 정보로서의 참조 화상의 POC의 최하위 비트를 나타내는 정보(poc_lsb_sps)와 참조 플래그(used_by_curr_pic_lt_flag)가 포함된다.
(베이스 스트림의 RPS의 신택스의 예)
도 12는, 베이스 스트림의 RPS의 신택스의 예를 도시하는 도면이다.
도 12의 2행째에 도시한 바와 같이, RPS에는 inter_ref_pic_set_prediction_flag가 포함된다. inter_ref_pic_set_prediction_flag는, 부호화 대상 화상의 GOP 내의 부호화 대상의 화상보다 부호화 순으로 앞의 화상인 전화상의 참조 화상 특정 정보를, 부호화 대상의 화상의 참조 화상 특정 정보로서 사용하는지를 나타내는 참조 정보이다.
참조 정보는, 전화상의 참조 화상 특정 정보를 부호화 대상의 화상의 참조 화상 특정 정보로서 사용하는 것을 나타내는 경우 1이며, 전화상의 참조 화상 특정 정보를 부호화 대상의 화상의 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 경우 0이다.
도 12의 3행째 내지 5행째에 도시한 바와 같이, inter_ref_pic_set_prediction_flag가 1인 경우, RPS에는, 전화상을 특정하는 전화상 특정 정보(delta_idx_minus1)가 포함된다. delta_idx_minus1은, 구체적으로는 부호화 대상의 화상의 부호화 번호(Coding Order)로부터 전화상의 부호화 번호를 감산한 값으로부터 1을 감산한 값이다. 여기서, 부호화 번호란, GOP 내의 각 화상에 대해서, 부호화 순으로 작은 값부터 부여되는 번호이다.
또한, 도 12의 6행째와 7행째에 도시한 바와 같이, RPS에는, 전화상의 참조 화상 특정 정보(의 POC)와 부호화 대상의 화상의 참조 화상 특정 정보(의 POC)의 차분의 부호(delta_rps_sign), 그 차분의 절댓값(abs_delta_rps_minus1)이 포함된다.
또한, 도 12의 8행째와 9행째에 도시한 바와 같이, RPS에는, 참조 화상 특정 정보에서 특정되는 참조 화상을 사용하는지 여부를 나타내는 플래그(used_by_curr_pic_lt_flag)가 포함된다. 또한, 10행째와 11행째에 도시한 바와 같이, 플래그(used_by_curr_pic_lt_flag)가, 참조 화상 특정 정보에서 특정되는 참조 화상을 사용하지 않는 것을 나타내는 0인 경우, RPS에는, 그 참조 화상이 RPS에 포함되는지 여부를 나타내는 플래그(use_delta_flag)가 포함된다.
또한, 도 12의 14행째 내지 23행째에 도시한 바와 같이, inter_ref_pic_set_prediction_flag가 0인 경우, RPS에는, 참조 화상의 수나 POC를 나타내는 정보 등이 포함된다.
(인핸스먼트 부호화부의 구성예)
도 13은, 도 6의 인핸스먼트 부호화부(12)의 구성예를 도시하는 블록도이다.
도 13의 인핸스먼트 부호화부(12)는, 부호화부(21)와 설정부(22)에 의해 구성된다.
인핸스먼트 부호화부(12)의 부호화부(21)는, 외부로부터 입력되는 프레임 단위의 인핸스먼트 화상을 입력 신호로 한다. 부호화부(21)는, 베이스 부호화부(11)로부터의 참조 화상 특정 정보, 설정부(22)로부터의 참조 화상 특정 생성 정보 등을 참조해서, HEVC 방식에 준하는 방식으로 입력 신호를 부호화한다. 부호화부(21)는, 그 결과 얻어지는 부호화 데이터를 설정부(22)에 공급한다.
설정부(22)는, 참조 화상 특정 생성 정보를 설정한다. 이 참조 화상 특정 생성 정보 중의 참조 화상 특정 정보나 참조 화상 특정 정보의 차분에는, 0부터 순서대로 인덱스가 부여되어 있다. 설정부(22)는, 참조 화상 특정 생성 정보를 부호화부(21)에 공급한다. 또한, 설정부(22)는, 참조 화상 특정 생성 정보를 포함하는 SPS, PPS 등을 설정한다.
설정부(22)는, 설정된 SPS 및 PPS와, 부호화부(21)로부터 공급되는 부호화 데이터로부터 부호화 스트림을 생성하고, 인핸스먼트 스트림으로서 합성부(13)에 공급한다.
(부호화부의 구성예)
도 14는, 도 13의 부호화부(21)의 구성예를 도시하는 블록도이다.
도 14의 부호화부(21)는, A/D 변환부(31), 화면 재배열 버퍼(32), 연산부(33), 직교 변환부(34), 양자화부(35), 가역 부호화부(36), 축적 버퍼(37), 역양자화부(38), 역직교 변환부(39), 가산부(40), 디블록 필터(41), 적응 오프셋 필터(42), 적응 루프 필터(43), 프레임 메모리(44), 스위치(45), 인트라 예측부(46), 움직임 예측·보상부(47), 예측 화상 선택부(48), 참조 버퍼(49), 참조 화상 설정부(50) 및 레이트 제어부(51)에 의해 구성된다.
구체적으로는, 부호화부(21)의 A/D 변환부(31)는, 입력 신호로서 입력된 프레임 단위의 화상을 A/D 변환하고, 화면 재배열 버퍼(32)에 출력해서 기억시킨다. 화면 재배열 버퍼(32)는, 기억한 표시의 순서의 프레임 단위의 화상을, GOP 구조에 따라 부호화를 위한 순서대로 재배열하고, 연산부(33), 인트라 예측부(46) 및 움직임 예측·보상부(47)에 출력한다.
연산부(33)는 부호화부로서 기능하며, 예측 화상 선택부(48)로부터 공급되는 예측 화상과, 화면 재배열 버퍼(32)로부터 출력된 부호화 대상의 화상의 차분을 연산함으로써 부호화를 행한다. 구체적으로는, 연산부(33)는 화면 재배열 버퍼(32)로부터 출력된 부호화 대상의 화상으로부터, 예측 화상 선택부(48)로부터 공급되는 예측 화상을 감산함으로써 부호화를 행한다. 연산부(33)는, 그 결과 얻어지는 화상을 잔차 정보로서 직교 변환부(34)에 출력한다. 또한, 예측 화상 선택부(48)로부터 예측 화상이 공급되지 않는 경우, 연산부(33)는 화면 재배열 버퍼(32)로부터 판독된 화상을 그대로 잔차 정보로서 직교 변환부(34)에 출력한다.
직교 변환부(34)는, 연산부(33)로부터의 잔차 정보를 직교 변환하고, 생성된 직교 변환 계수를 양자화부(35)에 공급한다.
양자화부(35)는, 직교 변환부(34)로부터 공급되는 직교 변환 계수에 대해서 양자화를 행하고, 그 결과 얻어지는 계수를 가역 부호화부(36)에 공급한다.
가역 부호화부(36)는, 최적 인트라 예측 모드를 나타내는 정보(이하, 인트라 예측 모드 정보라 함)를 인트라 예측부(46)로부터 취득한다. 또한, 가역 부호화부(36)는, 움직임 예측·보상부(47)로부터 공급되는 최적 인터 예측 모드를 나타내는 정보(이하, 인터 예측 모드 정보라 함)와 움직임 벡터 등을 움직임 예측·보상부(47)로부터 취득한다. 또한, 가역 부호화부(36)는, 참조 화상 특정 생성 정보, RPS 플래그 등을 참조 화상 설정부(50)로부터 취득한다.
또한, 가역 부호화부(36)는, 적응 오프셋 필터(42)부터 오프셋 필터에 관한 오프셋 필터 정보를 취득하고, 적응 루프 필터(43)로부터 필터 계수를 취득한다.
가역 부호화부(36)는, 양자화부(35)로부터 공급되는 양자화된 계수에 대해서, 가변 길이 부호화(예를 들어, CAVLC(Context-Adaptive Variable Length Coding) 등), 산술 부호화(예를 들어, CABAC(Context-Adaptive Binary Arithmetic Coding) 등) 등의 가역 부호화를 행한다.
또한, 가역 부호화부(36)는, 인트라 예측 모드 정보, 또는 인터 예측 모드 정보, 움직임 벡터, 참조 화상 특정 생성 정보, 및 RPS 플래그, 오프셋 필터 정보, 및 필터 계수를, 부호화에 관한 부호화 정보로서 가역 부호화한다. 가역 부호화부(36)는, 가역 부호화된 부호화 정보를 슬라이스 헤더로 하고, 가역 부호화된 계수를 부호화 데이터로 해서, 부호화 데이터에 슬라이스 헤더를 부가한다. 가역 부호화부(36)는, 슬라이스 헤더가 부가된 부호화 데이터를 축적 버퍼(37)에 공급하고, 축적시킨다.
축적 버퍼(37)는, 가역 부호화부(36)로부터 공급되는 부호화 데이터를 일시적으로 기억한다. 또한, 축적 버퍼(37)는, 기억하고 있는 부호화 데이터를 도 13의 설정부(22)에 공급한다.
또한, 양자화부(35)로부터 출력된 양자화된 계수는, 역양자화부(38)에도 입력된다. 역양자화부(38)는, 양자화부(35)에 의해 양자화된 계수에 대해서 역양자화를 행하고, 그 결과 얻어지는 직교 변환 계수를 역직교 변환부(39)에 공급한다.
역직교 변환부(39)는, 역양자화부(38)로부터 공급되는 직교 변환 계수에 대해서 4차의 역직교 변환을 행하고, 그 결과 얻어지는 잔차 정보를 가산부(40)에 공급한다.
가산부(40)는, 역직교 변환부(39)로부터 공급되는 잔차 정보와, 예측 화상 선택부(48)로부터 공급되는 예측 화상을 가산해서, 국부적으로 복호된 화상을 얻는다. 또한, 예측 화상 선택부(48)로부터 예측 화상이 공급되지 않는 경우, 가산부(40)는 역직교 변환부(39)로부터 공급되는 잔차 정보를 국부적으로 복호된 화상으로 한다. 가산부(40)는, 국부적으로 복호된 화상을 디블록 필터(41)에 공급함과 함께, 프레임 메모리(44)에 공급해서 축적시킨다.
디블록 필터(41)는, 가산부(40)로부터 공급되는 국부적으로 복호된 화상에 대해서, 블록 노이즈를 제거하는 적응 디블록 필터 처리를 행하고, 그 결과 얻어지는 화상을 적응 오프셋 필터(42)에 공급한다.
적응 오프셋 필터(42)는, 디블록 필터(41)에 의한 적응 디블록 필터 처리 후의 화상에 대해서, 주로 링잉을 제거하는 적응 오프셋 필터(SAO(Sample adaptive offset)) 처리를 행한다.
구체적으로는, 적응 오프셋 필터(42)는, 최대의 부호화 단위인 LCU(Largest Coding Unit)마다 적응 오프셋 필터 처리의 종류를 결정하고, 그 적응 오프셋 필터 처리에서 사용되는 오프셋을 구한다. 적응 오프셋 필터(42)는, 구해진 오프셋을 사용해서, 적응 디블록 필터 처리 후의 화상에 대해서 결정된 종류의 적응 오프셋 필터 처리를 행한다. 그리고, 적응 오프셋 필터(42)는, 적응 오프셋 필터 처리 후의 화상을 적응 루프 필터(43)에 공급한다.
또한, 적응 오프셋 필터(42)는, 오프셋을 저장하는 버퍼를 갖고 있다. 적응 오프셋 필터(42)는, LCU마다, 적응 오프셋 필터 처리에 사용된 오프셋이 이미 버퍼에 저장되어 있는지 여부를 판정한다.
적응 오프셋 필터(42)는, 적응 오프셋 필터 처리에 사용된 오프셋이 이미 버퍼에 저장되어 있다고 판정한 경우, 오프셋이 버퍼에 저장되어 있는지를 나타내는 저장 플래그를, 오프셋이 버퍼에 저장되어 있는 것을 나타내는 값(여기서는 1)으로 설정한다.
그리고, 적응 오프셋 필터(42)는, LCU마다, 1로 설정된 저장 플래그, 버퍼에 있어서의 오프셋의 저장 위치를 나타내는 인덱스, 및 행해진 적응 오프셋 필터 처리의 종류를 나타내는 종류 정보를 오프셋 필터 정보로서 가역 부호화부(36)에 공급한다.
한편, 적응 오프셋 필터(42)는, 적응 오프셋 필터 처리에 사용된 오프셋이 아직 버퍼에 저장되어 있지 않은 경우, 그 오프셋을 버퍼에 저장한다. 또한, 적응 오프셋 필터(42)는, 저장 플래그를 오프셋이 버퍼에 저장되어 있지 않은 것을 나타내는 값(여기서는 0)으로 설정한다. 그리고, 적응 오프셋 필터(42)는, LCU마다, 0으로 설정된 저장 플래그, 오프셋 및 종류 정보를 오프셋 필터 정보로서 가역 부호화부(36)에 공급한다.
적응 루프 필터(43)는, 예를 들어 2차원의 위너 필터(Wiener Filter)에 의해 구성된다. 적응 루프 필터(43)는, 적응 오프셋 필터(42)로부터 공급되는 적응 오프셋 필터 처리 후의 화상에 대해서, 예를 들어 LCU마다 적응 루프 필터(ALF(Adaptive Loop Filter)) 처리를 행한다.
구체적으로는, 적응 루프 필터(43)는, LCU마다, 화면 재배열 버퍼(32)로부터 출력되는 화상인 원(原) 화상과 적응 루프 필터 처리 후의 화상의 잔차가 최소가 되도록, 적응 루프 필터 처리에서 사용되는 필터 계수를 산출한다. 그리고, 적응 루프 필터(43)는, 적응 오프셋 필터 처리 후의 화상에 대해서, 산출된 필터 계수를 사용해서 LCU마다 적응 루프 필터 처리를 행한다.
적응 루프 필터(43)는, 적응 루프 필터 처리 후의 화상을 프레임 메모리(44)에 공급한다. 또한, 적응 루프 필터(43)는, 필터 계수를 가역 부호화부(36)에 공급한다.
또한, 여기에서는, 적응 루프 필터 처리는 LCU마다 행해지는 것으로 하지만, 적응 루프 필터 처리의 처리 단위는 LCU로 한정되지 않는다. 단, 적응 오프셋 필터(42)와 적응 루프 필터(43)의 처리 단위를 맞춤으로써, 처리를 효율적으로 행할 수 있다.
프레임 메모리(44)는, 적응 루프 필터(43)로부터 공급되는 화상과, 가산부(40)로부터 공급되는 화상을 축적한다. 프레임 메모리(44)에 축적된 화상은, 참조 화상으로서 스위치(45)를 통하여 인트라 예측부(46) 또는 움직임 예측·보상부(47)에 출력된다.
인트라 예측부(46)는, 프레임 메모리(44)로부터 스위치(45)를 통하여 판독된 참조 화상을 사용해서, 후보가 되는 모든 인트라 예측 모드의 인트라 예측 처리를 행한다.
또한, 인트라 예측부(46)는, 화면 재배열 버퍼(32)로부터 판독된 화상과, 인트라 예측 처리의 결과 생성되는 예측 화상에 기초해서, 후보가 되는 모든 인트라 예측 모드에 대해서 비용 함수값(상세는 후술함)을 산출한다. 그리고, 인트라 예측부(46)는, 비용 함수값이 최소가 되는 인트라 예측 모드를 최적 인트라 예측 모드로 결정한다.
인트라 예측부(46)는, 최적 인트라 예측 모드에서 생성된 예측 화상, 및 대응하는 비용 함수값을 예측 화상 선택부(48)에 공급한다. 인트라 예측부(46)는, 예측 화상 선택부(48)로부터 최적 인트라 예측 모드에서 생성된 예측 화상의 선택이 통지된 경우, 인트라 예측 모드 정보를 가역 부호화부(36)에 공급한다.
또한, 비용 함수값은, RD(Rate Distortion) 비용이라고도 하며, 예를 들어 H.264/AVC 방식에 있어서의 참조 소프트웨어인 JM(Joint Model)에서 정해져 있는 바와 같은 High Complexity 모드나, Low Complexity 모드 중 어느 한쪽의 방법에 기초해서 산출된다. 또한, H.264/AVC 방식에 있어서의 참조 소프트웨어는, http://iphome.hhi.de/suehring/tml/index.htm에 있어서 공개되어 있다.
구체적으로는, 비용 함수값의 산출 방법으로서 High Complexity 모드가 채용되는 경우, 후보가 되는 모든 예측 모드에 대해서 임시로 복호까지가 행해지고, 하기 수학식 1로 표시되는 비용 함수값이 각 예측 모드에 대해서 산출된다.
Figure pct00001
D는 원 화상과 복호 화상의 차분(왜곡), R은 직교 변환의 계수까지 포함한 발생 부호량, λ는 양자화 파라미터 QP의 함수로서 부여되는 라그랑제(lagrange) 미정승수이다.
한편, 비용 함수값의 산출 방법으로서 Low Complexity 모드가 채용되는 경우, 후보가 되는 모든 예측 모드에 대해서 예측 화상의 생성, 및 부호화 정보의 부호량의 산출이 행해지고, 하기 수학식 2로 표시되는 비용 함수가 각 예측 모드에 대해서 산출된다.
Figure pct00002
D는 원 화상과 예측 화상의 차분(왜곡), Header_Bit는 부호화 정보의 부호량, QPtoQuant는 양자화 파라미터 QP의 함수로서 부여되는 함수이다.
Low Complexity 모드에서는, 모든 예측 모드에 대해서 예측 화상을 생성하는 것만으로 좋고, 복호 화상을 생성할 필요가 없기 때문에, 연산량이 적어도 된다.
움직임 예측·보상부(47)는, 후보가 되는 모든 인터 예측 모드의 움직임 예측·보상 처리를 행한다. 구체적으로는, 움직임 예측·보상부(47)는, 화면 재배열 버퍼(32)로부터 공급되는 화상과, 프레임 메모리(44)로부터 스위치(45)를 통하여 판독되는 참조 화상에 기초해서, 후보가 되는 모든 인터 예측 모드의 움직임 벡터를 검출한다. 또한, 참조 화상은, 예를 들어 유저에 의해 설정된다. 움직임 예측·보상부(47)는, 검출된 움직임 벡터에 기초해서 참조 화상에 보상 처리를 실시하고, 예측 화상을 생성한다.
이때, 움직임 예측·보상부(47)는, 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초해서, 후보가 되는 모든 인터 예측 모드에 대해서 비용 함수값을 산출하고, 비용 함수값이 최소가 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측·보상부(47)는, 최적 인터 예측 모드의 비용 함수값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다. 또한, 움직임 예측·보상부(47)는, 예측 화상 선택부(48)로부터 최적 인터 예측 모드에서 생성된 예측 화상의 선택이 통지된 경우, 인터 예측 모드 정보, 대응하는 움직임 벡터 등을 가역 부호화부(36)에 출력하고, 참조 화상 특정 정보를 참조 화상 설정부(50)에 출력한다.
예측 화상 선택부(48)는, 인트라 예측부(46) 및 움직임 예측·보상부(47)로부터 공급되는 비용 함수값에 기초해서, 최적 인트라 예측 모드와 최적 인터 예측 모드 중, 대응하는 비용 함수값이 작은 쪽을 최적 예측 모드로 결정한다. 그리고, 예측 화상 선택부(48)는, 최적 예측 모드의 예측 화상을 연산부(33) 및 가산부(40)에 공급한다. 또한, 예측 화상 선택부(48)는, 최적 예측 모드의 예측 화상의 선택을 인트라 예측부(46) 또는 움직임 예측·보상부(47)에 통지한다.
참조 버퍼(49)는, 도 6의 베이스 부호화부(11)로부터 공급되는 베이스 화상의 부호화 시에 사용된 참조 화상의 참조 화상 특정 정보를 기억한다.
참조 화상 설정부(50)는, 움직임 예측·보상부(47)로부터 공급되는 참조 화상 특정 정보와, 참조 버퍼(49)에 기억되어 있는 참조 화상 특정 정보를 비교해서, 인핸스먼트 화상의 참조 화상 특정 정보의 예측 모드를 결정한다. 여기에서는, 참조 화상 특정 정보의 예측 모드로서는, 카피 모드, 차분 예측 모드 및 비예측 모드가 있는 것으로 한다.
카피 모드란, 인핸스먼트 화상의 참조 화상 특정 정보로서, 참조하는 다른 레이어(여기에서는, 베이스 레이어)인 참조 레이어의 참조 화상 특정 정보를 사용하는 예측 모드이다. 차분 예측 모드란, 인핸스먼트 화상의 참조 화상 특정 정보와 참조 레이어의 참조 화상 특정 정보의 차분과, 참조 레이어의 참조 화상 특정 정보를 가산함으로써, 인핸스먼트 화상의 참조 화상 특정 정보를 예측하는 예측 모드이다. 비예측 모드란, 인핸스먼트 화상의 참조 화상 특정 정보를 참조 레이어의 참조 화상 특정 정보와 독립해서 설정하는 예측 모드이다.
참조 화상 설정부(50)는, 참조 화상 특정 정보의 예측 모드가 카피 모드인 경우, 도 13의 설정부(22)로부터 공급되는 참조 화상 특정 생성 정보로서의 참조 화상 특정 정보의 예측 모드가 카피 모드일 때, RPS 플래그로서의 1을 가역 부호화부(36)에 공급한다. 한편, 설정부(22)로부터 공급되는 참조 화상 특정 생성 정보로서의 참조 화상 특정 정보의 예측 모드가 카피 모드가 아닐 때, RPS 플래그로서의 0을 가역 부호화부(36)에 공급함과 함께, 카피 모드를 참조 화상 특정 생성 정보로서 설정하여, 가역 부호화부(36)에 공급한다.
또한, 참조 화상 설정부(50)는, 참조 화상 특정 정보의 예측 모드가 차분 예측 모드인 경우, 인핸스먼트 화상의 참조 화상 특정 정보와 베이스 화상의 참조 화상 특정 정보의 차분을 연산한다. 그리고, 참조 화상 설정부(50)는, 연산된 참조 화상 특정 정보의 차분과, 설정부(22)로부터 공급되는 참조 화상 특정 생성 정보로서의 참조 화상 특정 정보의 차분을 비교한다.
그리고, 참조 화상 설정부(50)는 양쪽의 차분이 동일한 경우, 대응하는 인덱스를 인식하고, RPS 플래그로서의 1을 가역 부호화부(36)에 공급함과 함께, 인덱스를 참조 화상 특정 생성 정보로서 설정하여, 가역 부호화부(36)에 공급한다.
한편, 양쪽의 차분이 동일하지 않은 경우, 참조 화상 설정부(50)는 RPS 플래그로서의 0을 가역 부호화부(36)에 공급함과 함께, 연산된 참조 화상 특정 정보의 차분을 참조 화상 특정 생성 정보로서 설정하여, 가역 부호화부(36)에 공급한다.
또한, 참조 화상 설정부(50)는, 참조 화상 특정 정보의 예측 모드가 비예측 모드인 경우, 인핸스먼트 화상의 참조 화상 특정 정보와, 설정부(22)로부터 공급되는 참조 화상 특정 생성 정보로서의 참조 화상 특정 정보를 비교한다. 그리고, 참조 화상 설정부(50)는, 양쪽의 참조 화상 특정 정보가 동일한 경우, 대응하는 인덱스를 인식하고, RPS 플래그로서의 1을 가역 부호화부(36)에 공급함과 함께, 인덱스를 참조 화상 특정 생성 정보로서 설정하여, 가역 부호화부(36)에 공급한다.
한편, 양쪽의 참조 화상 특정 정보가 동일하지 않은 경우, 참조 화상 설정부(50)는, RPS 플래그로서의 0을 가역 부호화부(36)에 공급함과 함께, 인핸스먼트 화상의 참조 화상 특정 정보를 참조 화상 특정 생성 정보로서 설정하여, 가역 부호화부(36)에 공급한다.
레이트 제어부(51)는, 축적 버퍼(37)에 축적된 부호화 데이터에 기초해서, 오버플로우 혹은 언더플로우가 발생하지 않도록 양자화부(35)의 양자화 동작의 레이트를 제어한다.
(부호화 처리 단위의 설명)
도 15는, HEVC 방식에 있어서의 부호화 단위인 Coding UNIT(CU)을 설명하는 도면이다.
HEVC 방식에서는, 4000 화소×2000 화소의 UHD(Ultra High Definition) 등과 같은 큰 화면 프레임의 화상도 대상으로 하고 있기 때문에, 부호화 단위의 사이즈를 16 화소×16 화소로 고정하는 것은 최적이 아니다. 따라서, HEVC 방식에서는, 부호화 단위로서 CU가 정의되어 있다.
CU는 Coding Tree Block(CTB)이라고도 불리며, AVC 방식에 있어서의 매크로 블록과 마찬가지의 역할을 한다. 구체적으로는, CU는 인트라 예측 또는 인터 예측의 단위인 Prediction Unit(PU)으로 분할되거나, 직교 변환의 단위인 Transform Unit(TU)으로 분할된다. 단, CU의 사이즈는, 시퀀스마다 가변의 2의 거듭제곱 화소로 표시되는 정사각형이다. 또한, 현재 HEVC 방식에 있어서는, TU의 사이즈로서 4×4 화소, 8×8 화소 이외에, 16×16 화소 및 32×32 화소도 사용하는 것이 가능하다.
도 15의 예에서는, 최대 사이즈의 CU인 LCU(Largest Coding Unit)의 사이즈가 128이며, 최소 사이즈의 CU인 SCU(Smallest Coding Unit)의 사이즈가 8이다. 따라서, N마다 계층화된 2N×2N의 사이즈의 CU의 계층 심도(depth)는 0 내지 4가 되고, 계층 심도수는 5가 된다. 또한, 2N×2N의 사이즈의 CU는, split_flag의 값이 1인 경우, 1개 아래의 계층인 N×N의 사이즈의 CU로 분할된다.
LCU와 SCU의 사이즈를 지정하는 정보는, SPS에 포함된다. 또한, CU의 상세에 대해서는, 비특허문헌 1에 기재되어 있다.
(참조 화상 설정부의 구성예)
도 16은, 도 14의 참조 화상 설정부(50)의 구성예를 도시하는 블록도이다.
도 16의 참조 화상 설정부(50)는, 취득부(71), 판정부(72) 및 생성부(73)에 의해 구성된다.
참조 화상 설정부(50)의 취득부(71)는, 도 14의 움직임 예측·보상부(47)로부터 참조 화상 특정 정보를 취득하고, 판정부(72)와 생성부(73)에 공급한다.
판정부(72)는, 참조 버퍼(49)로부터 베이스 화상의 참조 화상 특정 정보를 판독한다. 판정부(72)는, 판독된 베이스 화상의 참조 화상 특정 정보와, 취득부(71)로부터 공급되는 참조 화상 특정 정보를 비교한다. 그리고, 판정부(72)는, 판독된 베이스 화상의 참조 화상 특정 정보와, 취득부(71)로부터 공급되는 참조 화상 특정 정보가 동일한 경우, 참조 화상 특정 정보의 예측 모드를 카피 모드로 결정한다. 판정부(72)는, 카피 모드를 생성부(73)에 공급한다.
또한, 판정부(72)는, 도 13의 설정부(22)로부터 참조 화상 특정 생성 정보로서 공급되는 참조 화상 특정 정보의 예측 모드가 카피 모드인지 여부를 판정한다. 참조 화상 특정 생성 정보로서 공급되는 참조 화상 특정 정보의 예측 모드가 카피 모드라고 판정된 경우, 판정부(72)는 RPS 플래그로서의 1을 도 14의 가역 부호화부(36)에 공급한다. 한편, 참조 화상 특정 생성 정보로서 공급되는 참조 화상 특정 정보의 예측 모드가 카피 모드가 아니라고 판정된 경우, 판정부(72)는 RPS 플래그로서의 0을 가역 부호화부(36)에 공급함과 함께, 카피 모드를 참조 화상 특정 생성 정보로서 가역 부호화부(36)에 공급한다.
생성부(73)는, 판정부(72)로부터 카피 모드가 공급되지 않는 경우, 참조 버퍼(49)로부터 베이스 화상의 참조 화상 특정 정보를 판독한다. 생성부(73)는, 유저로부터의 입력에 기초해서, 참조 화상 특정 정보의 예측 모드를 차분 예측 모드 또는 비예측 모드로 결정하고, 참조 화상 특정 생성 정보로서 가역 부호화부(36)에 공급한다.
참조 화상 특정 정보의 예측 모드가 차분 예측 모드로 결정된 경우, 생성부(73)는 판독된 베이스 화상의 참조 화상 특정 정보와, 취득부(71)로부터 공급되는 참조 화상 특정 정보의 차분을 연산한다. 그리고, 생성부(73)는, 연산된 참조 화상 특정 정보의 차분과, 설정부(22)로부터 공급되는 참조 화상 특정 생성 정보로서의 참조 화상 특정 정보의 차분을 비교한다.
생성부(73)는 양쪽의 차분이 동일한 경우, 대응하는 인덱스를 인식하고, RPS 플래그로서의 1을 가역 부호화부(36)에 공급함과 함께, 인덱스를 참조 화상 특정 생성 정보로서 가역 부호화부(36)에 공급한다.
한편, 양쪽의 차분이 동일하지 않은 경우, 생성부(73)는 RPS 플래그로서의 0을 가역 부호화부(36)에 공급함과 함께, 연산된 차분을 참조 화상 특정 생성 정보로서 가역 부호화부(36)에 공급한다.
또한, 참조 화상 특정 정보의 예측 모드가 비예측 모드로 결정된 경우, 생성부(73)는 취득부(71)로부터 공급되는 참조 화상 특정 정보와, 설정부(22)로부터 공급되는 참조 화상 특정 생성 정보로서의 참조 화상 특정 정보를 비교한다. 그리고, 생성부(73)는, 양쪽의 참조 화상 특정 정보가 동일한 경우, 대응하는 인덱스를 인식하고, RPS 플래그로서의 1을 가역 부호화부(36)에 공급함과 함께, 인덱스를 참조 화상 특정 생성 정보로서 가역 부호화부(36)에 공급한다.
한편, 양쪽의 참조 화상 특정 정보가 동일하지 않은 경우, 생성부(73)는 RPS 플래그로서의 0을 가역 부호화부(36)에 공급함과 함께, 취득부(71)로부터 공급되는 참조 화상 특정 정보를 참조 화상 특정 생성 정보로서 가역 부호화부(36)에 공급한다.
(인핸스먼트 스트림의 SPS의 신택스의 예)
도 17 및 도 18은, 도 13의 설정부(22)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 18의 9행째에 도시한 바와 같이, SPS에는, 참조 화상 특정 생성 정보로서 RPS의 예측 모드를 나타내는 RPS 예측 모드 정보(short_term_ref_pic_pred_mode)가 포함된다. RPS 예측 모드 정보는 카피 모드를 나타내는 경우 0이고, 차분 예측 모드를 나타내는 경우 1이고, 비예측 모드를 나타내는 경우 2이다.
10행째 내지 13행째에 도시한 바와 같이, RPS 예측 모드 정보가 0 이외인 경우, SPS에는, RPS의 예측 모드마다 RPS나 RPS의 차분이 포함된다. RPS나 RPS의 차분에는, 0부터 순서대로 인덱스가 부여되어 있다.
15행째에 도시한 바와 같이, SPS에는 베이스 스트림의 SPS와 마찬가지로, long term 플래그(long_term_ref_pics_present_flag)가 포함된다. 16행째와 17행째에 도시한 바와 같이 long term 플래그가 1인 경우, SPS에는, 참조 화상 특정 생성 정보로서 long term의 참조 화상 특정 정보의 예측 모드를 나타내는 long term 예측 모드 정보(long_term_ref_pic_pred_mode)가 포함된다. long term 예측 모드 정보(long_term_ref_pic_pred_mode)는 카피 모드를 나타내는 경우 0이고, 차분 예측 모드를 나타내는 경우 1이고, 비예측 모드를 나타내는 경우 2이다.
18행째 내지 22행째에 도시한 바와 같이, long term 예측 모드 정보가 2인 경우, SPS에는, 베이스 스트림의 SPS와 마찬가지인 long term의 참조 화상 특정 정보의 수, long term의 참조 화상 특정 정보 및 참조 플래그가 참조 화상 특정 생성 정보로서 포함된다. long term의 참조 화상 특정 정보에는 0부터 순서대로 인덱스가 부여된다.
한편, long term 예측 모드 정보가 1인 경우, 24 내지 27행째에 도시한 바와 같이, SPS에는, 그 SPS에 포함되는 long term의 참조 화상 특정 정보의 수와 참조 레이어의 SPS에 포함되는 long term의 참조 화상 특정 정보의 수와의 차분(diff_num_long_term_ref_pics_sps), 동일한 인덱스가 부여된, long term의 참조 화상 특정 정보와 참조 레이어의 SPS에 포함되는 long term의 참조 화상 특정 정보의 차분(diff_lt_ref_pic_poc_lsb_sps)이 참조 화상 특정 생성 정보로서 포함된다.
또한, long term 예측 모드 정보가 1인 경우, 인핸스먼트 스트림의 SPS에는 참조 플래그는 포함되지 않고, 참조 플래그는 참조 레이어의 참조 플래그가 된다.
(인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예)
도 19 내지 도 21은, 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 구성예를 도시하는 도면이다.
도 19의 18행째에 도시한 바와 같이, 인핸스먼트 스트림의 슬라이스 헤더에는, 베이스 스트림의 슬라이스 헤더와 마찬가지로 RPS 플래그가 포함된다. 또한, 19행째와 20행째에 도시한 바와 같이 RPS 플래그가 0인 경우, 슬라이스 헤더에는, 대응하는 슬라이스의 RPS 모드 정보가 참조 화상 특정 생성 정보로서 포함된다.
도 19의 21행째와 22행째에 도시한 바와 같이, RPS 예측 모드 정보가 0 이외인 경우, 슬라이스 헤더에는, 대응하는 슬라이스의 RPS 또는 RPS의 차분이, RPS의 예측 모드마다 인덱스가 num_short_term_ref_pic_sets인 short_term_ref_pic_set로서 포함된다.
또한, 도 19의 23행째와 24행째에 도시한 바와 같이, RPS 예측 모드 정보가 0 이외이며, RPS 플래그가 1인 경우, 슬라이스 헤더에는, 대응하는 슬라이스의 RPS 또는 RPS의 차분의 인덱스(short_term_ref_pic_set_idx)가 포함된다.
또한, 도 19의 25행째와 26행째에 도시한 바와 같이, SPS에 포함되는 long term 플래그가 1인 경우, 슬라이스 헤더에는, 참조 화상 특정 생성 정보로서 long term 예측 모드 정보가 포함된다.
도 19의 27행째 내지 30행째에 도시한 바와 같이, long term 예측 모드 정보가 2인 경우, 슬라이스 헤더에는, 베이스 스트림과 마찬가지로 SPS 내수와 SPS 외수가 참조 화상 특정 생성 정보로서 포함된다.
또한, 도 19의 31행째 내지 36행째에 도시한 바와 같이, 슬라이스 헤더에는, 베이스 스트림과 마찬가지로 인덱스(lt_idx_sps), 정보(poc_lsb_sps) 및 참조 플래그(used_by_curr_pic_lt_flag)가 참조 화상 특정 생성 정보로서 포함된다.
또한, 도 19의 38행째에 도시한 바와 같이, 슬라이스 헤더에는, long term의 참조 화상의 POC의 최상위 비트를 나타내는 최상위 비트 정보(delta_poc_msb_cycle_lt)가 존재하는지 여부를 나타내는 최상위 비트 플래그(delta_poc_msb_present_flag)가 포함된다. 또한, 39행째와 40행째에 도시한 바와 같이, 최상위 비트 플래그가, 최상위 비트 정보가 존재하는 것을 나타내는 1인 경우, 슬라이스 헤더에는 최상위 비트 정보가 포함된다.
한편, 도 19의 42행째 내지 45행째에 도시한 바와 같이, long term 예측 모드 정보가 1인 경우, 슬라이스 헤더에는, 대응하는 슬라이스의 SPS 내수와 참조 레이어의 SPS 내수의 차분(diff_num_long_term_sps)과, 대응하는 슬라이스의 SPS 외수와 참조 레이어의 SPS 외수의 차분(diff_num_long_term_pics)이 참조 화상 특정 생성 정보로서 포함된다.
또한, 도 19의 46행째 및 도 20의 1행째 내지 4행째에 도시한 바와 같이, 슬라이스 헤더에는 인덱스(lt_idx_sps)와, 정보(poc_lsb_lt)와 참조 레이어의 정보(poc_lsb_lt)와의 차분(diff_poc_lsb_lt)이 참조 화상 특정 생성 정보로서 포함된다.
또한, long term 예측 모드 정보가 1인 경우, 인핸스먼트 스트림의 슬라이스 헤더에는, 참조 플래그와 최상위 비트 플래그는 포함되지 않고, 참조 플래그와 최상위 비트 플래그는, 각각 참조 레이어의 참조 플래그, 최상위 비트 플래그가 된다.
또한, 도 20의 6행째와 7행째에 도시한 바와 같이, 최상위 비트 플래그가 1인 경우, 슬라이스 헤더에는, 대응하는 슬라이스의 최상위 비트 정보와 참조 레이어의 최상위 비트 정보와의 차분(diff_delta_poc_msb_cycle_lt)이 포함된다.
(인핸스먼트 스트림의 RPS의 신택스의 예)
도 22는, 인핸스먼트 스트림의 RPS의 신택스의 예를 도시하는 도면이다.
도 22의 2행째에 도시한 바와 같이, 인핸스먼트 스트림의 RPS에는, 베이스 스트림의 RPS와 마찬가지로 참조 정보가 포함된다. 3행째 내지 13행째에 도시한 바와 같이 참조 정보가 1이며, RPS 예측 모드가 2인 경우, 인핸스먼트 스트림의 RPS에는, 베이스 스트림의 RPS와 마찬가지로 전화상 특정 정보, 부호(delta_rps_sign), 절댓값(abs_delta_rps_minus1), 플래그(used_by_curr_pic_lt_flag) 및 플래그(use_delta_flag)가 참조 화상 특정 생성 정보로서 포함된다.
또한, 14행째 내지 17행째에 도시한 바와 같이 참조 정보가 1이며, RPS 예측 모드가 1인 경우, RPS에는, 대응하는 슬라이스의 전화상 특정 정보와 참조 레이어의 전화상 특정 정보의 차분(diff_delta_idx_minus1), 및 대응하는 슬라이스의 절댓값(abs_delta_rps_minus1)과 참조 레이어의 절댓값(abs_delta_rps_minus1)의 차분(diff_abs_delta_rps_minus1)이 포함된다.
또한, long term 예측 모드 정보가 1인 경우, 인핸스먼트 스트림의 슬라이스 헤더에는, 부호(delta_rps_sign), 플래그(used_by_curr_pic_lt_flag) 및 플래그(use_delta_flag)는 포함되지 않고, 부호(delta_rps_sign), 플래그(used_by_curr_pic_lt_flag) 및 플래그(use_delta_flag)는, 각각 참조 레이어의 부호(delta_rps_sign), 플래그(used_by_curr_pic_lt_flag) 및 플래그(use_delta_flag)가 된다.
한편, 21행째 내지 32행째에 도시한 바와 같이, 참조 정보가 0이며, RPS 예측 모드가 2인 경우, RPS에는, 베이스 스트림의 RPS와 마찬가지로 참조 화상의 수나 POC 등의 정보가 포함된다. 또한, 33행째 내지 40행째에 도시한 바와 같이, 참조 정보가 0이며, RPS 예측 모드가 1인 경우, RPS에는, 대응하는 슬라이스의 참조 화상의 수나 POC 등의 정보와, 참조 레이어의 참조 화상의 수나 POC 등의 정보와의 차분이 포함된다.
(VPS의 신택스의 예)
도 23은, VPS의 신택스의 예를 도시하는 도면이다.
도 23의 6행째에 도시한 바와 같이, VPS에는, scalability의 레이어수를 나타내는 정보(vps_max_layer_minus1)가 포함된다. 또한, 7행째에 도시한 바와 같이, VPS에는, 종래와 마찬가지로 temporal scalability의 레이어수를 나타내는 정보(vps_max_sub_layer_minus1)가 포함된다.
또한, 15행째에 도시한 바와 같이, VPS에는, 인덱스가 0인 베이스 레이어를 특정하는 정보로서의 베이스 레이어와 참조 레이어의 차분(diff_ref_layer[0])으로서 0이 포함된다. 또한, 16행째 및 17행째에 도시한 바와 같이, VPS에는, 각 인핸스먼트 레이어의 차분(diff_ref_layer)이 포함된다.
여기서, 현재의 레이어를 curr_layer로 하고, 참조 레이어를 ref_layer로 하면, 참조 레이어 ref_layer는 차분 diff_ref_layer를 사용해서 하기 수학식 (3)으로 표시된다.
Figure pct00003
따라서, 인핸스먼트 레이어의 차분(diff_ref_layer)이 0인 경우, 인핸스먼트 스트림은, 베이스 스트림과 마찬가지로 다른 레이어의 참조 화상 특정 정보 등을 참조하지 않고 생성된다.
(부호화 장치의 처리의 설명)
도 24는, 도 6의 부호화 장치(10)의 계층 부호화 처리를 설명하는 흐름도이다. 이 계층 부호화 처리는, 외부로부터 베이스 화상과 인핸스먼트 화상이 입력되었을 때 개시된다.
도 24의 스텝 S1에 있어서, 부호화 장치(10)의 베이스 부호화부(11)는, 외부로부터 입력된 베이스 화상을 HEVC 방식으로 부호화한다. 베이스 부호화부(11)는, 베이스 화상의 부호화 시에 사용된 참조 화상의 참조 화상 특정 정보를 인핸스먼트 부호화부(12)에 공급한다. 베이스 부호화부(11)는, 부호화의 결과 얻어지는 부호화 데이터, SPS, PPS 등을 포함하는 베이스 스트림을 베이스 스트림으로서 합성부(13)에 공급한다.
스텝 S2에 있어서, 인핸스먼트 부호화부(12)는, 외부로부터 입력된 인핸스먼트 화상으로부터 인핸스먼트 스트림을 생성하는 인핸스먼트 스트림 생성 처리를 행한다. 이 인핸스먼트 스트림 생성 처리의 상세는, 후술하는 도 25를 참조해서 설명한다.
스텝 S3에 있어서, 합성부(13)는, 베이스 부호화부(11)로부터 공급되는 베이스 스트림과 인핸스먼트 부호화부(12)로부터 공급되는 인핸스먼트 스트림을 합성하고, VPS 등을 부가해서, 전체 계층의 부호화 스트림을 생성한다. 합성부(13)는, 전체 계층의 부호화 스트림을 전송부(14)에 공급한다.
스텝 S4에 있어서, 전송부(14)는, 합성부(13)로부터 공급되는 전체 계층의 부호화 스트림을 후술하는 복호 장치에 전송한다.
도 25는, 도 24의 스텝 S2의 인핸스먼트 스트림 생성 처리의 상세를 설명하는 흐름도이다.
도 25의 스텝 S10에 있어서, 인핸스먼트 부호화부(12)의 설정부(22)는, 참조 화상 특정 생성 정보를 설정하고, 부호화부(21)에 공급한다. 스텝 S11에 있어서, 부호화부(21)는, 외부로부터 입력 신호로서 입력되는 프레임 단위의 인핸스먼트 화상을 HEVC 방식에 준하는 방식으로 부호화하는 부호화 처리를 행한다. 이 부호화 처리의 상세는, 후술하는 도 26 및 도 27을 참조해서 설명한다.
스텝 S12에 있어서, 설정부(22)는, 스텝 S10에서 설정된 참조 화상 특정 생성 정보를 포함하는 SPS를 설정한다. 스텝 S13에 있어서, 설정부(22)는 PPS를 설정한다. 스텝 S14에 있어서, 설정부(22)는, 설정된 SPS 및 PPS와, 부호화부(21)로부터 공급되는 부호화 데이터로부터 인핸스먼트 스트림을 생성한다.
스텝 S15에 있어서, 설정부(22)는 인핸스먼트 스트림을 합성부(13)에 공급하고, 처리를 종료한다.
도 26 및 도 27은, 도 25의 스텝 S11의 부호화 처리의 상세를 설명하는 흐름도이다.
도 26의 스텝 S31에 있어서, 부호화부(21)의 A/D 변환부(31)는, 입력 신호로서 입력된 프레임 단위의 화상을 A/D 변환하고, 화면 재배열 버퍼(32)에 출력해서 기억시킨다.
스텝 S32에 있어서, 화면 재배열 버퍼(32)는, 기억한 표시의 순서의 프레임의 화상을, GOP 구조에 따라 부호화를 위한 순서대로 재배열한다. 화면 재배열 버퍼(32)는, 재배열 후의 프레임 단위의 화상을 연산부(33), 인트라 예측부(46) 및 움직임 예측·보상부(47)에 공급한다.
스텝 S33에 있어서, 인트라 예측부(46)는, 후보가 되는 모든 인트라 예측 모드의 인트라 예측 처리를 행한다. 또한, 인트라 예측부(46)는, 화면 재배열 버퍼(32)로부터 판독된 화상과, 인트라 예측 처리의 결과 생성되는 예측 화상에 기초해서, 후보가 되는 모든 인트라 예측 모드에 대해서 비용 함수값을 산출한다. 그리고, 인트라 예측부(46)는, 비용 함수값이 최소가 되는 인트라 예측 모드를 최적 인트라 예측 모드로 결정한다. 인트라 예측부(46)는, 최적 인트라 예측 모드에서 생성된 예측 화상, 및 대응하는 비용 함수값을 예측 화상 선택부(48)에 공급한다.
또한, 움직임 예측·보상부(47)는, 후보가 되는 모든 인터 예측 모드의 움직임 예측·보상 처리를 행한다. 또한, 움직임 예측·보상부(47)는, 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초해서, 후보가 되는 모든 인터 예측 모드에 대해서 비용 함수값을 산출하고, 비용 함수값이 최소가 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측·보상부(47)는, 최적 인터 예측 모드의 비용 함수값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다.
스텝 S34에 있어서, 예측 화상 선택부(48)는, 스텝 S33의 처리에 의해 인트라 예측부(46) 및 움직임 예측·보상부(47)로부터 공급되는 비용 함수값에 기초해서, 최적 인트라 예측 모드와 최적 인터 예측 모드 중 비용 함수값이 최소가 되는 쪽을 최적 예측 모드로 결정한다. 그리고, 예측 화상 선택부(48)는, 최적 예측 모드의 예측 화상을 연산부(33) 및 가산부(40)에 공급한다.
스텝 S35에 있어서, 예측 화상 선택부(48)는 최적 예측 모드가 최적 인터 예측 모드인지 여부를 판정한다. 스텝 S35에서 최적 예측 모드가 최적 인터 예측 모드라고 판정된 경우, 예측 화상 선택부(48)는, 최적 인터 예측 모드에서 생성된 예측 화상의 선택을 움직임 예측·보상부(47)에 통지한다.
그리고, 스텝 S36에 있어서, 움직임 예측·보상부(47)는 인터 예측 모드 정보와 움직임 벡터를 가역 부호화부(36)에 공급한다. 스텝 S37에 있어서, 참조 버퍼(49)는, 베이스 부호화부(11)로부터 공급되는 베이스 화상의 참조 화상 특정 정보를 기억한다. 스텝 S38에 있어서, 참조 화상 설정부(50)는, 움직임 예측·보상 처리에 있어서 사용된 참조 화상의 참조 화상 특정 생성 정보를 생성하는 생성 처리를 행한다. 이 생성 처리의 상세는, 후술하는 도 28을 참조해서 설명한다.
한편, 스텝 S35에서 최적 예측 모드가 최적 인터 예측 모드가 아니라고 판정된 경우, 즉 최적 예측 모드가 최적 인트라 예측 모드인 경우, 예측 화상 선택부(48)는, 최적 인트라 예측 모드에서 생성된 예측 화상의 선택을 인트라 예측부(46)에 통지한다. 그리고, 스텝 S39에 있어서, 인트라 예측부(46)는, 인트라 예측 모드 정보를 가역 부호화부(36)에 공급하고, 처리를 스텝 S40으로 진행시킨다.
스텝 S40에 있어서, 연산부(33)는, 화면 재배열 버퍼(32)로부터 공급되는 화상으로부터, 예측 화상 선택부(48)로부터 공급되는 예측 화상을 감산함으로써 부호화를 행한다. 연산부(33)는, 그 결과 얻어지는 화상을 잔차 정보로서 직교 변환부(34)에 출력한다.
스텝 S41에 있어서, 직교 변환부(34), 연산부(33)로부터의 잔차 정보에 대해서 직교 변환을 실시하고, 그 결과 얻어지는 직교 변환 계수를 양자화부(35)에 공급한다.
스텝 S42에 있어서, 양자화부(35)는, 직교 변환부(34)로부터 공급되는 계수를 양자화하고, 그 결과 얻어지는 계수를 가역 부호화부(36)와 역양자화부(38)에 공급한다.
도 27의 스텝 S43에 있어서, 역양자화부(38)는, 양자화부(35)로부터 공급되는 양자화된 계수를 역양자화하고, 그 결과 얻어지는 직교 변환 계수를 역직교 변환부(39)에 공급한다.
스텝 S44에 있어서, 역직교 변환부(39)는, 역양자화부(38)로부터 공급되는 직교 변환 계수에 대해서 역직교 변환을 실시하고, 그 결과 얻어지는 잔차 정보를 가산부(40)에 공급한다.
스텝 S45에 있어서, 가산부(40)는, 역직교 변환부(39)로부터 공급되는 잔차 정보와, 예측 화상 선택부(48)로부터 공급되는 예측 화상을 가산하고, 국부적으로 복호된 화상을 얻는다. 가산부(40)는, 얻어진 화상을 디블록 필터(41)에 공급함과 함께, 프레임 메모리(44)에 공급한다.
스텝 S46에 있어서, 디블록 필터(41)는, 가산부(40)로부터 공급되는 국부적으로 복호된 화상에 대해서 디블로킹 필터 처리를 행한다. 디블록 필터(41)는, 그 결과 얻어지는 화상을 적응 오프셋 필터(42)에 공급한다.
스텝 S47에 있어서, 적응 오프셋 필터(42)는, 디블록 필터(41)로부터 공급되는 화상에 대해서 LCU마다 적응 오프셋 필터 처리를 행한다. 적응 오프셋 필터(42)는, 그 결과 얻어지는 화상을 적응 루프 필터(43)에 공급한다. 또한, 적응 오프셋 필터(42)는, LCU마다 저장 플래그, 인덱스 또는 오프셋 및 종류 정보를 오프셋 필터 정보로서 가역 부호화부(36)에 공급한다.
스텝 S48에 있어서, 적응 루프 필터(43)는, 적응 오프셋 필터(42)로부터 공급되는 화상에 대해서 LCU마다 적응 루프 필터 처리를 행한다. 적응 루프 필터(43)는, 그 결과 얻어지는 화상을 프레임 메모리(44)에 공급한다. 또한, 적응 루프 필터(43)는, 적응 루프 필터 처리에서 사용된 필터 계수를 가역 부호화부(36)에 공급한다.
스텝 S49에 있어서, 프레임 메모리(44)는, 적응 루프 필터(43)로부터 공급되는 화상과 가산부(40)로부터 공급되는 화상을 축적한다. 프레임 메모리(44)에 축적된 화상은, 참조 화상으로서 스위치(45)를 통하여 인트라 예측부(46) 또는 움직임 예측·보상부(47)에 출력된다.
스텝 S50에 있어서, 가역 부호화부(36)는 인트라 예측 모드 정보, 또는 인터 예측 모드 정보, 움직임 벡터, 참조 화상 특정 생성 정보, 및 RPS 플래그, 오프셋 필터 정보, 및 필터 계수를 부호화 정보로서 가역 부호화한다.
스텝 S51에 있어서, 가역 부호화부(36)는, 양자화부(35)로부터 공급되는 양자화된 계수를 가역 부호화한다. 그리고, 가역 부호화부(36)는, 스텝 S50의 처리에서 가역 부호화된 부호화 정보와 가역 부호화된 계수로부터 부호화 데이터를 생성하고, 축적 버퍼(37)에 공급한다.
스텝 S52에 있어서, 축적 버퍼(37)는, 가역 부호화부(36)로부터 공급되는 부호화 데이터를 일시적으로 축적한다.
스텝 S53에 있어서, 레이트 제어부(51)는, 축적 버퍼(37)에 축적된 부호화 데이터에 기초해서, 오버플로우 혹은 언더플로우가 발생하지 않도록 양자화부(35)의 양자화 동작의 레이트를 제어한다.
스텝 S54에 있어서, 축적 버퍼(37)는, 기억하고 있는 부호화 데이터를 도 13의 설정부(22)에 출력한다. 그리고, 처리는 도 25의 스텝 S11로 복귀되어, 스텝 S12로 진행된다.
또한, 도 26 및 도 27의 부호화 처리에서는, 설명을 간단화하기 위해, 항상 인트라 예측 처리와 움직임 예측·보상 처리가 행해지도록 했지만, 실제로는 픽처 타입 등에 의해 어느 한쪽만이 행해지는 경우도 있다.
도 28은, 도 26의 스텝 S38의 생성 처리의 상세를 설명하는 흐름도이다.
도 28의 스텝 S70에 있어서, 참조 화상 설정부(50)의 취득부(71)는, 움직임 예측·보상부(47)로부터 인핸스먼트 화상의 참조 화상 특정 정보를 취득하고, 판정부(72)와 생성부(73)에 공급한다. 스텝 S71에 있어서, 판정부(72)와 생성부(73)는, 참조 버퍼(49)로부터 베이스 화상의 참조 화상 특정 정보를 판독한다.
스텝 S72에 있어서, 판정부(72)는, 인핸스먼트 화상의 참조 화상 특정 정보가 베이스 화상의 참조 화상 특정 정보와 동일한 것인지 여부를 판정한다. 스텝 S72에서, 인핸스먼트 화상의 참조 화상 특정 정보가 베이스 화상의 참조 화상 특정 정보와 동일하다고 판정된 경우, 스텝 S73에 있어서, 판정부(72)는 참조 화상 특정 정보의 예측 모드를 카피 모드로 결정한다.
스텝 S74에 있어서, 판정부(72)는, 도 13의 설정부(22)로부터 참조 화상 특정 생성 정보로서 카피 모드가 공급되었는지 여부를 판정한다. 스텝 S74에서 참조 화상 특정 생성 정보로서 카피 모드가 공급되었다고 판정된 경우, 스텝 S75에 있어서, 판정부(72)는 RPS 플래그를 1로 설정하여, 도 14의 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 26의 스텝 S38로 복귀되어, 스텝 S40으로 진행된다.
한편, 스텝 S74에서 참조 화상 특정 생성 정보로서 카피 모드가 공급되어 있지 않다고 판정된 경우, 처리는 스텝 S76으로 진행된다. 스텝 S76에 있어서, 판정부(72)는, RPS 플래그를 0으로 설정해서 가역 부호화부(36)에 공급함과 함께, 카피 모드를 참조 화상 특정 생성 정보로서 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 26의 스텝 S38로 복귀되어, 스텝 S40으로 진행된다.
한편, 스텝 S72에서, 인핸스먼트 화상의 참조 화상 특정 정보가 베이스 화상의 참조 화상 특정 정보와 동일하지 않다고 판정된 경우, 처리는 스텝 S77로 진행된다. 스텝 S77에 있어서, 생성부(73)는, 유저로부터의 입력에 기초해서 참조 화상 특정 정보의 예측 모드를 차분 예측 모드로 할지 여부를 판정한다.
스텝 S77에서 참조 화상 특정 정보의 예측 모드를 차분 예측 모드로 한다고 판정한 경우, 처리는 스텝 S78로 진행된다. 스텝 S78에 있어서, 생성부(73)는, 참조 화상 특정 정보의 예측 모드를 차분 예측 모드로 결정한다.
스텝 S79에 있어서, 생성부(73)는, 베이스 화상과 인핸스먼트 화상의 참조 화상 특정 정보의 차분을 구한다. 스텝 S80에 있어서, 생성부(73)는, 스텝 S79에서 연산된 차분이, 설정부(22)로부터 공급되는 인덱스가 부여된 참조 화상 특정 정보의 차분과 동일한 것인지 여부를 판정한다.
스텝 S80에서, 스텝 S79에서 연산된 차분이, 인덱스가 부여된 참조 화상 특정 정보의 차분과 동일하다고 판정된 경우, 처리는 스텝 S81로 진행된다. 스텝 S81에 있어서, 생성부(73)는, RPS 플래그를 1로 설정해서 가역 부호화부(36)에 공급함과 함께, 스텝 S79에서 연산된 참조 화상 특정 정보의 차분과 동일한 차분에 대응하는 인덱스를 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 26의 스텝 S38로 복귀되어, 스텝 S40으로 진행된다.
한편, 스텝 S80에서, 스텝 S79에서 연산된 차분이, 인덱스가 부여된 참조 화상 특정 정보의 차분과 동일하지 않다고 판정된 경우, 처리는 스텝 S82로 진행된다. 스텝 S82에 있어서, 생성부(73)는, RPS 플래그를 0으로 설정해서 가역 부호화부(36)에 공급함과 함께, 차분 예측 모드와 스텝 S79에서 연산된 참조 화상 특정 정보의 차분을 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 26의 스텝 S38로 복귀되어, 스텝 S40으로 진행된다.
또한, 스텝 S77에서 참조 화상 특정 정보의 예측 모드를 차분 예측 모드로 하지 않는다고 판정한 경우, 생성부(73)는, 참조 화상 특정 정보의 예측 모드를 비 예측 모드로 결정하고, 처리를 스텝 S83으로 진행시킨다.
스텝 S83에 있어서, 생성부(73)는, 인핸스먼트 화상의 참조 화상 특정 정보는, 설정부(22)로부터 공급되는 인덱스가 부여된 참조 화상 특정 정보와 동일한 것인지 여부를 판정한다. 스텝 S83에서, 인핸스먼트 화상의 참조 화상 특정 정보가 인덱스가 부여된 참조 화상 특정 정보와 동일하다고 판정된 경우, 처리는 스텝 S84로 진행된다.
스텝 S84에 있어서, 생성부(73)는, RPS 플래그를 1로 설정해서 가역 부호화부(36)에 공급함과 함께, 인핸스먼트 화상의 참조 화상 특정 정보와 동일한 참조 화상 특정 정보에 대응하는 인덱스를 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 26의 스텝 S38로 복귀되어, 스텝 S40으로 진행된다.
한편, 스텝 S83에서, 인핸스먼트 화상의 참조 화상 특정 정보가, 인덱스가 부여된 참조 화상 특정 정보와 동일하지 않다고 판정된 경우, 처리는 스텝 S85로 진행된다. 스텝 S85에 있어서, 생성부(73)는, RPS 플래그를 0으로 설정해서 가역 부호화부(36)에 공급함과 함께, 비예측 모드와 참조 화상 특정 정보를 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 26의 스텝 S38로 복귀되어, 스텝 S40으로 진행된다.
이상과 같이, 부호화 장치(10)는, 참조 화상 특정 생성 정보를 설정하므로, 베이스 레이어와 인핸스먼트 레이어 사이에서 참조 화상 특정 정보를 공유 또는 예측할 수 있다. 따라서, 인핸스먼트 스트림의 정보량을 삭감하고, 부호화 효율을 향상시킬 수 있다.
(복호 장치의 제1 실시 형태의 구성예)
도 29는, 도 6의 부호화 장치(10)로부터 전송되는 전체 계층의 부호화 스트림을 복호하는, 본 기술을 적용한 복호 장치의 제1 실시 형태의 구성예를 도시하는 블록도이다.
도 29의 복호 장치(90)는, 수취부(91), 분리부(92), 베이스 복호부(93) 및 인핸스먼트 복호부(94)에 의해 구성된다.
수취부(91)는, 도 6의 부호화 장치(10)로부터 전송되어 오는 전체 계층의 부호화 스트림을 수취하고, 분리부(92)에 공급한다.
분리부(92)는, 수취부(91)로부터 공급되는 전체 계층의 부호화 스트림으로부터 VPS를 추출하고, 그 VPS에 포함되는 차분(diff_ref_layer)에 기초해서 인핸스먼트 스트림의 참조 레이어의 유무를 인식한다. 여기에서는, 부호화 장치(10)가 베이스 레이어를 인핸스먼트 스트림의 참조 레이어로 하고 있기 때문에, 분리부(92)는 참조 레이어의 유를 인식한다.
분리부(92)는, 참조 레이어의 유를 인식한 경우, 참조 레이어의 부호화 스트림을 복호하는 베이스 복호부(93)에, 인핸스먼트 스트림을 복호하는 인핸스먼트 복호부(94)로의 참조 화상 특정 정보의 공급을 지시한다.
또한, 분리부(92)는, 전체 계층의 부호화 스트림으로부터 베이스 스트림을 분리해서 베이스 복호부(93)에 공급하고, 인핸스먼트 스트림을 분리해서 인핸스먼트 복호부(94)에 공급한다.
베이스 복호부(93)는, 종래의 HEVC 방식의 복호 장치와 마찬가지로 구성되며, 분리부(92)로부터 공급되는 베이스 스트림을 HEVC 방식으로 복호하고, 베이스 화상을 생성한다. 단, 베이스 복호부(93)는, 베이스 화상의 복호 시에 사용된 참조 화상의 참조 화상 특정 정보를 인핸스먼트 복호부(94)에 공급한다. 베이스 복호부(93)는, 생성된 베이스 화상을 출력한다.
인핸스먼트 복호부(94)는, 분리부(92)로부터 공급되는 인핸스먼트 스트림을 HEVC 방식에 준하는 방식으로 복호하고, 인핸스먼트 화상을 생성한다. 이때, 인핸스먼트 복호부(94)는, 베이스 복호부(93)로부터 공급되는 참조 화상 특정 정보를 참조해서 인핸스먼트 스트림을 복호한다. 인핸스먼트 복호부(94)는, 생성된 인핸스먼트 화상을 출력한다.
(인핸스먼트 복호부의 구성예)
도 30은, 도 29의 인핸스먼트 복호부(94)의 구성예를 도시하는 블록도이다.
도 30의 인핸스먼트 복호부(94)는, 추출부(111)와 복호부(112)에 의해 구성된다.
인핸스먼트 복호부(94)의 추출부(111)는, 도 29의 분리부(92)로부터 공급되는 인핸스먼트 스트림으로부터 SPS, PPS, 부호화 데이터 등을 추출하고, 복호부(112)에 공급한다.
복호부(112)는, 도 29의 베이스 복호부(93)로부터 공급되는 베이스 화상의 참조 화상 특정 정보를 참조해서, 추출부(111)로부터 공급되는 부호화 데이터를 HEVC 방식에 준하는 방식으로 복호한다. 이때, 복호부(112)는, 필요에 따라 추출부(111)로부터 공급되는 SPS나 PPS 등도 참조한다. 복호부(112)는, 복호의 결과 얻어지는 화상을 인핸스먼트 화상으로서 출력한다.
(복호부의 구성예)
도 31은, 도 30의 복호부(112)의 구성예를 도시하는 블록도이다.
도 31의 복호부(112)는, 축적 버퍼(131), 가역 복호부(132), 역양자화부(133), 역직교 변환부(134), 가산부(135), 디블록 필터(136), 적응 오프셋 필터(137), 적응 루프 필터(138), 화면 재배열 버퍼(139), D/A 변환부(140), 프레임 메모리(141), 스위치(142), 인트라 예측부(143), 참조 버퍼(144), 참조 화상 설정부(145), 움직임 보상부(146) 및 스위치(147)에 의해 구성된다.
복호부(112)의 축적 버퍼(131)는, 도 30의 추출부(111)로부터 부호화 데이터를 수취하고, 축적한다. 축적 버퍼(131)는, 축적되어 있는 부호화 데이터를 가역 복호부(132)에 공급한다.
가역 복호부(132)는, 축적 버퍼(131)로부터의 부호화 데이터에 대해서 가변 길이 복호나, 산술 복호 등의 가역 복호를 실시함으로써, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(132)는, 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(132)는, 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보 등을 움직임 보상부(146)에 공급한다.
또한, 가역 복호부(132)는, 부호화 정보로서의 참조 화상 특정 생성 정보, RPS 플래그 등을 참조 화상 설정부(145)에 공급한다. 또한, 가역 복호부(132)는, 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(147)에 공급한다. 가역 복호부(132)는, 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
역양자화부(133), 역직교 변환부(134), 가산부(135), 디블록 필터(136), 적응 오프셋 필터(137), 적응 루프 필터(138), 프레임 메모리(141), 스위치(142), 인트라 예측부(143) 및 움직임 보상부(146)는, 도 14의 역양자화부(38), 역직교 변환부(39), 가산부(40), 디블록 필터(41), 적응 오프셋 필터(42), 적응 루프 필터(43), 프레임 메모리(44), 스위치(45), 인트라 예측부(46) 및 움직임 예측·보상부(47)와 각각 마찬가지의 처리를 행하고, 이에 의해 화상이 복호된다.
구체적으로는, 역양자화부(133)는, 가역 복호부(132)로부터의 양자화된 계수를 역양자화하고, 그 결과 얻어지는 직교 변환 계수를 역직교 변환부(134)에 공급한다.
역직교 변환부(134)는, 역양자화부(133)로부터의 직교 변환 계수에 대해서 역직교 변환을 행한다. 역직교 변환부(134)는, 역직교 변환의 결과 얻어지는 잔차 정보를 가산부(135)에 공급한다.
가산부(135)는 복호부로서 기능하며, 역직교 변환부(134)로부터 공급되는 복호 대상의 화상으로서의 잔차 정보와, 스위치(147)로부터 공급되는 예측 화상을 가산함으로써 복호를 행한다. 가산부(135)는, 복호의 결과 얻어지는 화상을 디블록 필터(136)에 공급함과 함께, 프레임 메모리(141)에 공급한다. 또한, 스위치(147)로부터 예측 화상이 공급되지 않는 경우, 가산부(135)는, 역직교 변환부(134)로부터 공급되는 잔차 정보인 화상을 복호의 결과 얻어지는 화상으로서 디블록 필터(136)에 공급함과 함께, 프레임 메모리(141)에 공급해서 축적시킨다.
디블록 필터(136)는, 가산부(135)로부터 공급되는 화상에 대해서 적응 디블록 필터 처리를 행하고, 그 결과 얻어지는 화상을 적응 오프셋 필터(137)에 공급한다.
적응 오프셋 필터(137)는, 가역 복호부(132)로부터 공급되는 오프셋을 순서대로 저장하는 버퍼를 갖는다. 또한, 적응 오프셋 필터(137)는, LCU마다, 가역 복호부(132)로부터 공급되는 오프셋 필터 정보에 기초해서, 디블록 필터(136)에 의한 적응 디블록 필터 처리 후의 화상에 대해서 적응 오프셋 필터 처리를 행한다.
구체적으로는, 오프셋 필터 정보에 포함되는 저장 플래그가 0인 경우, 적응 오프셋 필터(137)는, LCU 단위의 디블록 필터 처리 후의 화상에 대해서 그 오프셋 필터 정보에 포함되는 오프셋을 사용해서, 종류 정보가 나타내는 종류의 적응 오프셋 필터 처리를 행한다.
한편, 오프셋 필터 정보에 포함되는 저장 플래그가 1인 경우, 적응 오프셋 필터(137)는, LCU 단위의 디블록 필터 처리 후의 화상에 대해서, 그 오프셋 필터 정보에 포함되는 인덱스가 나타내는 위치에 저장되는 오프셋을 판독한다. 그리고, 적응 오프셋 필터(137)는, 판독된 오프셋을 사용해서, 종류 정보가 나타내는 종류의 적응 오프셋 필터 처리를 행한다. 적응 오프셋 필터(137)는, 적응 오프셋 필터 처리 후의 화상을 적응 루프 필터(138)에 공급한다.
적응 루프 필터(138)는, 적응 오프셋 필터(137)로부터 공급되는 화상에 대해서, 가역 복호부(132)로부터 공급되는 필터 계수를 사용해서 LCU마다 적응 루프 필터 처리를 행한다. 적응 루프 필터(138)는, 그 결과 얻어지는 화상을 프레임 메모리(141) 및 화면 재배열 버퍼(139)에 공급한다.
화면 재배열 버퍼(139)는, 적응 루프 필터(138)로부터 공급되는 화상을 프레임 단위로 기억한다. 화면 재배열 버퍼(139)는, 기억한 부호화를 위한 순서의 프레임 단위의 화상을 원래의 표시의 순서대로 재배열해서, D/A 변환부(140)에 공급한다.
D/A 변환부(140)는, 화면 재배열 버퍼(139)로부터 공급되는 프레임 단위의 화상을 D/A 변환하고, 인핸스먼트 화상으로서 출력한다. 프레임 메모리(141)는, 적응 루프 필터(138)로부터 공급되는 화상과 가산부(135)로부터 공급되는 화상을 축적한다. 프레임 메모리(141)에 축적된 화상은 참조 화상으로서 판독되어, 스위치(142)를 통하여 인트라 예측부(143) 또는 움직임 보상부(146)에 공급된다.
인트라 예측부(143)는, 프레임 메모리(141)로부터 스위치(142)를 통하여 판독된 참조 화상을 사용해서, 가역 복호부(132)로부터 공급되는 인트라 예측 모드 정보가 나타내는 인트라 예측 모드의 인트라 예측 처리를 행한다. 인트라 예측부(143)는, 그 결과 생성되는 예측 화상을 스위치(147)에 공급한다.
참조 버퍼(144)는, 도 29의 베이스 복호부(93)로부터 공급되는 베이스 화상의 부호화 데이터의 복호 시에 사용된 참조 화상의 참조 화상 특정 정보를 기억한다.
참조 화상 설정부(145)는, 가역 복호부(132)로부터 공급되는 RPS 플래그에 기초해서, 추출부(111)로부터 공급되는 SPS에 포함되는 참조 화상 특정 생성 정보, 또는 가역 복호부(132)로부터 공급되는 참조 화상 특정 생성 정보를 복호 대상의 부호화 데이터의 참조 화상 특정 생성 정보로 한다. 참조 화상 설정부(145)는, 필요에 따라 참조 버퍼(144)로부터 베이스 화상의 참조 화상 특정 정보를 판독한다. 참조 화상 설정부(145)는, 복호 대상의 부호화 데이터의 참조 화상 특정 생성 정보와, 판독된 베이스 화상의 참조 화상 특정 정보에 기초해서 참조 화상 특정 정보를 생성하고, 움직임 보상부(146)에 공급한다.
움직임 보상부(146)는, 프레임 메모리(141)로부터 스위치(142)를 통하여, 참조 화상 설정부(145)로부터 공급되는 참조 화상 특정 정보에 의해 특정되는 참조 화상을 판독한다. 움직임 보상부(146)는, 가역 복호부(132)로부터 공급되는 움직임 벡터와 참조 화상을 사용해서, 가역 복호부(132)로부터 공급되는 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 움직임 보상 처리를 행한다. 움직임 보상부(146)는, 그 결과 생성되는 예측 화상을 스위치(147)에 공급한다.
스위치(147)는, 가역 복호부(132)로부터 인트라 예측 모드 정보가 공급된 경우, 인트라 예측부(143)로부터 공급되는 예측 화상을 가산부(135)에 공급한다. 한편, 가역 복호부(132)로부터 인터 예측 모드 정보가 공급된 경우, 스위치(147)는 움직임 보상부(146)로부터 공급되는 예측 화상을 가산부(135)에 공급한다.
(참조 화상 설정부의 구성예)
도 32는, 도 31의 참조 화상 설정부(145)의 구성예를 도시하는 블록도이다.
도 32의 참조 화상 설정부(145)는, 정보 버퍼(161), 모드 버퍼(162) 및 생성부(163)에 의해 구성된다.
정보 버퍼(161)는, 도 31의 가역 복호부(132)로부터 참조 화상 특정 생성 정보로서 공급되는 참조 화상 특정 정보의 예측 모드 이외의 정보와 RPS 플래그를 기억한다. 모드 버퍼(162)는, 가역 복호부(132)로부터 참조 화상 특정 생성 정보로서 공급되는 참조 화상 특정 정보의 예측 모드를 기억한다.
생성부(163)는, 정보 버퍼(161)로부터 RPS 플래그를 판독한다. 생성부(163)는, RPS 플래그에 기초해서, 도 30의 추출부(111)로부터 공급되는 참조 화상 특정 생성 정보, 또는 가역 복호부(132)로부터 공급되는 참조 화상 특정 생성 정보를, 복호 대상의 부호화 데이터의 참조 화상 특정 생성 정보로 결정한다. 생성부(163)는, 복호 대상의 부호화 데이터의 참조 화상 특정 생성 정보가 가역 복호부(132)로부터 공급되는 참조 화상 특정 생성 정보인 경우, 정보 버퍼(161)로부터 참조 화상 특정 정보의 예측 모드 이외의 정보를 판독하고, 모드 버퍼(162)로부터 참조 화상 특정 정보의 예측 모드를 판독한다.
생성부(163)는, 복호 대상의 부호화 데이터의 참조 화상 특정 생성 정보로서의 참조 화상 특정 정보의 예측 모드가 카피 모드 또는 차분 예측 모드인 경우, 참조 버퍼(144)로부터 베이스 화상의 참조 화상 특정 정보를 판독한다. 생성부(163)는, 참조 화상 특정 정보의 예측 모드가 카피 모드인 경우, 판독된 베이스 화상의 참조 화상 특정 정보를 인핸스먼트 화상의 참조 화상 특정 정보로서 생성하고, 도 31의 움직임 보상부(146)에 공급한다.
한편, 참조 화상 특정 정보의 예측 모드가 차분 예측 모드이며, 참조 화상 특정 정보의 예측 모드 이외의 정보가 인덱스인 경우, 생성부(163)는, 도 30의 추출부(111)로부터 참조 화상 특정 생성 정보로서 공급되는, 그 인덱스가 부여된 참조 화상 특정 정보의 차분을 인식한다. 생성부(163)는, 인식된 참조 화상 특정 정보의 차분과, 판독된 베이스 화상의 참조 화상 특정 정보를 가산하고, 그 결과 얻어지는 가산값을 인핸스먼트 화상의 참조 화상 특정 정보로서 생성하고, 움직임 보상부(146)에 공급한다.
또한, 참조 화상 특정 정보의 예측 모드가 차분 예측 모드이며, 참조 화상 특정 정보의 예측 모드 이외의 정보가 참조 화상 특정 정보의 차분인 경우, 생성부(163)는, 그 차분과, 판독된 베이스 화상의 참조 화상 특정 정보를 가산한다. 생성부(163)는, 그 결과 얻어지는 가산값을 인핸스먼트 화상의 참조 화상 특정 정보로서 생성하고, 움직임 보상부(146)에 공급한다.
또한, 참조 화상 특정 정보의 예측 모드가 비예측 모드이며, 참조 화상 특정 정보의 예측 모드 이외의 정보가 인덱스인 경우, 생성부(163)는, 도 30의 추출부(111)로부터 참조 화상 특정 생성 정보로서 공급되는, 그 인덱스가 부여된 참조 화상 특정 정보를 인식한다. 생성부(163)는, 인식된 참조 화상 특정 정보를 인핸스먼트 화상의 참조 화상 특정 정보로서 생성하고, 움직임 보상부(146)에 공급한다.
또한, 참조 화상 특정 정보의 예측 모드가 비예측 모드이며, 참조 화상 특정 정보의 예측 모드 이외의 정보가 참조 화상 특정 정보인 경우, 생성부(163)는, 그 참조 화상 특정 정보를 인핸스먼트 화상의 참조 화상 특정 정보로서 생성하고, 움직임 보상부(146)에 공급한다.
(복호 장치의 처리의 설명)
도 33은, 도 29의 복호 장치(90)의 계층 복호 처리를 설명하는 흐름도이다.
도 33의 스텝 S100에 있어서, 복호 장치(90)의 수취부(91)는, 도 6의 부호화 장치(10)로부터 전송되어 오는 전체 계층의 부호화 스트림을 수취하고, 분리부(92)에 공급한다. 스텝 S101에 있어서, 분리부(92)는, 수취부(91)로부터 공급되는 부호화 스트림으로부터 VPS를 추출한다.
스텝 S102에 있어서, 분리부(92)는, VPS에 포함되는 차분(diff_ref_layer)에 기초해서 인핸스먼트 스트림의 참조 레이어의 유를 인식한다. 스텝 S103에 있어서, 분리부(92)는, 참조 레이어의 부호화 스트림을 복호하는 베이스 복호부(93)에, 인핸스먼트 스트림을 복호하는 인핸스먼트 복호부(94)로의 참조 화상 특정 정보의 공급을 지시한다.
스텝 S104에 있어서, 분리부(92)는, 전체 계층의 부호화 스트림으로부터 베이스 스트림과 인핸스먼트 스트림을 분리한다. 분리부(92)는, 베이스 스트림을 베이스 복호부(93)에 공급하고, 인핸스먼트 스트림을 인핸스먼트 복호부(94)에 공급한다.
스텝 S105에 있어서, 베이스 복호부(93)는, 분리부(92)로부터 공급되는 베이스 스트림을 HEVC 방식으로 복호하고, 베이스 화상을 생성한다. 이때, 베이스 복호부(93)는, 베이스 화상의 복호 시에 사용된 참조 화상의 참조 화상 특정 정보를 인핸스먼트 복호부(94)에 공급한다. 베이스 복호부(93)는, 생성된 베이스 화상을 출력한다.
스텝 S106에 있어서, 인핸스먼트 복호부(94)는, 베이스 복호부(93)로부터 공급되는 참조 화상 특정 정보를 참조해서, 분리부(92)로부터 공급되는 인핸스먼트 스트림으로부터 인핸스먼트 화상을 생성하는 인핸스먼트 화상 생성 처리를 행한다. 이 인핸스먼트 화상 생성 처리의 상세는, 후술하는 도 34를 참조해서 설명한다.
도 34는, 도 30의 인핸스먼트 복호부(94)의 인핸스먼트 화상 생성 처리를 설명하는 흐름도이다.
도 34의 스텝 S111에 있어서, 인핸스먼트 복호부(94)의 추출부(111)는, 분리부(92)로부터 공급되는 인핸스먼트 스트림으로부터 SPS, PPS, 부호화 데이터 등을 추출하고, 복호부(112)에 공급한다.
스텝 S112에 있어서, 복호부(112)는, 필요에 따라 추출부(111)로부터 공급되는 SPS나 PPS, 베이스 복호부(93)로부터 공급되는 참조 화상 특정 정보 등을 참조해서, 추출부(111)로부터 공급되는 부호화 데이터를 HEVC 방식에 준하는 방식으로 복호하는 복호 처리를 행한다. 이 복호 처리의 상세는, 후술하는 도 35를 참조해서 설명한다. 그리고, 처리는 종료한다.
도 35는, 도 34의 스텝 S112의 복호 처리의 상세를 설명하는 흐름도이다.
도 35의 스텝 S131에 있어서, 인핸스먼트 복호부(112)의 축적 버퍼(131)는, 도 30의 추출부(111)로부터 프레임 단위의 부호화 데이터를 수취하고, 축적한다. 축적 버퍼(131)는, 축적되어 있는 부호화 데이터를 가역 복호부(132)에 공급한다.
스텝 S132에 있어서, 가역 복호부(132)는, 축적 버퍼(131)로부터의 부호화 데이터를 가역 복호하고, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(132)는, 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(132)는, 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보 등을 움직임 보상부(146)에 공급한다.
또한, 가역 복호부(132)는, 부호화 정보로서의 참조 화상 특정 생성 정보, RPS 플래그 등을 참조 화상 설정부(145)에 공급한다. 또한, 가역 복호부(132)는, 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(147)에 공급한다. 가역 복호부(132)는, 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
스텝 S133에 있어서, 역양자화부(133)는, 가역 복호부(132)로부터의 양자화된 계수를 역양자화하고, 그 결과 얻어지는 직교 변환 계수를 역직교 변환부(134)에 공급한다.
스텝 S134에 있어서, 움직임 보상부(146)는, 가역 복호부(132)로부터 인터 예측 모드 정보가 공급되었는지 여부를 판정한다. 스텝 S134에서 인터 예측 모드 정보가 공급되었다고 판정된 경우, 처리는 스텝 S135로 진행된다.
스텝 S135에 있어서, 참조 버퍼(144)는, 도 29의 베이스 복호부(93)로부터 공급되는 베이스 화상의 부호화 데이터의 복호 시에 사용된 참조 화상의 참조 화상 특정 정보를 기억한다.
스텝 S136에 있어서, 참조 화상 설정부(145)는, 가역 복호부(132)로부터 공급되는 참조 화상 특정 생성 정보, RPS 플래그, 참조 버퍼(144)에 기억되어 있는 베이스 화상의 참조 화상 특정 정보 등에 기초해서, 인핸스먼트 화상의 참조 화상 특정 정보를 생성하는 생성 처리를 행한다. 이 생성 처리의 상세는, 후술하는 도 36을 참조해서 설명한다.
스텝 S137에 있어서, 움직임 보상부(146)는, 참조 화상 설정부(145)로부터 공급되는 참조 화상 특정 정보에 기초해서 참조 화상을 판독하고, 움직임 벡터와 참조 화상을 사용해서 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 움직임 보상 처리를 행한다. 움직임 보상부(146)는, 그 결과 생성되는 예측 화상을 스위치(147)를 통하여 가산부(135)에 공급하고, 처리를 스텝 S139로 진행시킨다.
한편, 스텝 S134에서 인터 예측 모드 정보가 공급되어 있지 않다고 판정된 경우, 즉 인트라 예측 모드 정보가 인트라 예측부(143)에 공급된 경우, 처리는 스텝 S138로 진행된다.
스텝 S138에 있어서, 인트라 예측부(143)는, 프레임 메모리(141)로부터 스위치(142)를 통하여 판독된 참조 화상을 사용하여, 인트라 예측 모드 정보가 나타내는 인트라 예측 모드의 인트라 예측 처리를 행한다. 인트라 예측부(143)는, 인트라 예측 처리의 결과 생성되는 예측 화상을 스위치(147)를 통하여 가산부(135)에 공급하고, 처리를 스텝 S139로 진행시킨다.
스텝 S139에 있어서, 역직교 변환부(134)는, 역양자화부(133)로부터의 직교 변환 계수에 대해서 역직교 변환을 실시하고, 그 결과 얻어지는 잔차 정보를 가산부(135)에 공급한다.
스텝 S140에 있어서, 가산부(135)는, 역직교 변환부(134)로부터 공급되는 잔차 정보와, 스위치(147)로부터 공급되는 예측 화상을 가산한다. 가산부(135)는, 그 결과 얻어지는 화상을 디블록 필터(136)에 공급함과 함께, 프레임 메모리(141)에 공급한다.
스텝 S141에 있어서, 디블록 필터(136)는, 가산부(135)로부터 공급되는 화상에 대해서 디블로킹 필터 처리를 행하고, 블록 노이즈를 제거한다. 디블록 필터(136)는, 그 결과 얻어지는 화상을 적응 오프셋 필터(137)에 공급한다.
스텝 S142에 있어서, 적응 오프셋 필터(137)는, 가역 복호부(132)로부터 공급되는 오프셋 필터 정보에 기초해서, 디블록 필터(136)에 의한 디블록 필터 처리 후의 화상에 대해서 LCU마다 적응 오프셋 필터 처리를 행한다. 적응 오프셋 필터(137)는, 적응 오프셋 필터 처리 후의 화상을 적응 루프 필터(138)에 공급한다.
스텝 S143에 있어서, 적응 루프 필터(138)는, 적응 오프셋 필터(137)로부터 공급되는 화상에 대해서, 가역 복호부(132)로부터 공급되는 필터 계수를 사용해서 LCU마다 적응 루프 필터 처리를 행한다. 적응 루프 필터(138)는, 그 결과 얻어지는 화상을 프레임 메모리(141) 및 화면 재배열 버퍼(139)에 공급한다.
스텝 S144에 있어서, 프레임 메모리(141)는, 가산부(135)로부터 공급되는 화상과, 적응 루프 필터(138)로부터 공급되는 화상을 축적한다. 프레임 메모리(141)에 축적된 화상은, 참조 화상으로서 스위치(142)를 통하여 인트라 예측부(143) 또는 움직임 보상부(146)에 공급된다.
스텝 S145에 있어서, 화면 재배열 버퍼(139)는, 적응 루프 필터(138)로부터 공급되는 화상을 프레임 단위로 기억하고, 기억한 부호화를 위한 순서의 프레임 단위의 화상을 원래의 표시의 순서대로 재배열해서, D/A 변환부(140)에 공급한다.
스텝 S146에 있어서, D/A 변환부(140)는, 화면 재배열 버퍼(139)로부터 공급되는 프레임 단위의 화상을 D/A 변환하고, 인핸스먼트 화상으로서 출력한다. 그리고, 처리는 도 34의 스텝 S112로 복귀되어, 종료한다.
도 36은, 도 35의 스텝 S136의 생성 처리의 상세를 설명하는 흐름도이다.
도 36의 스텝 S161에 있어서, 참조 화상 설정부(145)의 정보 버퍼(161)(도 32)는, 도 31의 가역 복호부(132)로부터 참조 화상 특정 생성 정보로서 공급되는 RPS 플래그와 참조 화상 특정 정보의 예측 모드 이외의 정보를 기억한다. 스텝 S162에 있어서, 모드 버퍼(162)는, 가역 복호부(132)로부터 참조 화상 특정 생성 정보로서 공급되는 참조 화상 특정 정보의 예측 모드를 기억한다.
스텝 S163에 있어서, 생성부(163)는, 정보 버퍼(161)로부터 RPS 플래그를 판독한다. 스텝 S164에 있어서, 생성부(163)는, RPS 플래그가 1인지 여부를 판정한다.
스텝 S164에서 RPS 플래그가 1이라고 판정된 경우, 스텝 S165에 있어서, 생성부(163)는, 도 30의 추출부(111)로부터 공급되는 참조 화상 특정 생성 정보를 복호 대상의 부호화 데이터의 참조 화상 특정 생성 정보로 결정한다.
스텝 S166에 있어서, 생성부(163)는, 정보 버퍼(161)로부터 참조 화상 특정 정보의 예측 모드 이외의 정보를 판독하고, 모드 버퍼(162)로부터 참조 화상 특정 정보의 예측 모드를 판독한다. 그리고, 처리는 스텝 S168로 진행된다.
한편, 스텝 S164에서 RPS 플래그가 1이 아닌, 즉 0이라고 판정된 경우, 스텝 S167에 있어서, 생성부(163)는 가역 복호부(132)로부터 공급되는 참조 화상 특정 생성 정보를 복호 대상의 부호화 데이터의 참조 화상 특정 생성 정보로 결정한다. 그리고, 처리는 스텝 S168로 진행된다.
스텝 S168에 있어서, 생성부(163)는, 복호 대상의 부호화 데이터의 참조 화상 특정 생성 정보로서의 참조 화상 특정 정보의 예측 모드가 비예측 모드인지 여부를 판정한다. 스텝 S168에서 참조 화상 특정 정보의 예측 모드가 비예측 모드라고 판정된 경우, 스텝 S169에 있어서, 생성부(163)는 참조 버퍼(144)로부터 베이스 화상의 참조 화상 특정 정보를 판독한다.
스텝 S170에 있어서, 생성부(163)는, 참조 화상 특정 정보의 예측 모드가 카피 모드인지 여부를 판정한다.
스텝 S170에서 참조 화상 특정 정보의 예측 모드가 카피 모드라고 판정된 경우, 스텝 S171에 있어서, 생성부(163)는 판독된 베이스 화상의 참조 화상 특정 정보를, 인핸스먼트 화상의 참조 화상 특정 정보로 결정한다. 생성부(163)는, 결정된 인핸스먼트 화상의 참조 화상 특정 정보를 도 31의 움직임 보상부(146)에 공급한다. 그리고, 처리는 도 35의 스텝 S136으로 복귀되어, 스텝 S137로 진행된다.
한편, 스텝 S170에서 참조 화상 특정 정보의 예측 모드가 카피 모드가 아닌, 즉 차분 예측 모드라고 판정된 경우, 스텝 S172에 있어서, 생성부(163)는 참조 화상 특정 정보의 예측 모드 이외의 정보가 인덱스인지 여부를 판정한다.
스텝 S172에서 참조 화상 특정 정보의 예측 모드 이외의 정보가 인덱스라고 판정된 경우, 처리는 스텝 S173으로 진행된다. 스텝 S173에 있어서, 생성부(163)는, 추출부(111)로부터 참조 화상 특정 생성 정보로서 공급되는, 그 인덱스가 부여된 참조 화상 특정 정보의 차분을 인식하고, 처리를 스텝 S174로 진행시킨다.
한편, 스텝 S172에서 참조 화상 특정 정보의 예측 모드 이외의 정보가 인덱스가 아닌, 즉 참조 화상 특정 정보의 차분이라고 판정된 경우, 처리는 스텝 S174로 진행된다.
스텝 S174에 있어서, 생성부(163)는 참조 화상 특정 정보의 차분과, 판독된 베이스 화상의 참조 화상 특정 정보를 가산하고, 그 결과 얻어지는 가산값을 인핸스먼트 화상의 참조 화상 특정 정보로 결정한다. 생성부(163)는, 결정된 인핸스먼트 화상의 참조 화상 특정 정보를 움직임 보상부(146)에 공급한다. 그리고, 처리는 도 35의 스텝 S136으로 복귀되어, 스텝 S137로 진행된다.
또한, 스텝 S168에서 참조 화상 특정 정보의 예측 모드가 비예측 모드라고 판정된 경우, 스텝 S175에 있어서, 생성부(163)는 참조 화상 특정 정보의 예측 모드 이외의 정보가 인덱스인지 여부를 판정한다.
스텝 S175에서 참조 화상 특정 정보의 예측 모드 이외의 정보가 인덱스라고 판정된 경우, 처리는 스텝 S176으로 진행된다. 스텝 S176에 있어서, 생성부(163)는, 추출부(111)로부터 참조 화상 특정 생성 정보로서 공급되는, 그 인덱스가 부여된 참조 화상 특정 정보를 인식하고, 처리를 스텝 S177로 진행시킨다.
한편, 스텝 S175에서 참조 화상 특정 정보의 예측 모드 이외의 정보가 인덱스가 아닌, 즉 참조 화상 특정 정보의 예측 모드 이외의 정보가 참조 화상 특정 정보라고 판정된 경우, 처리는 스텝 S177로 진행된다.
스텝 S177에 있어서, 생성부(163)는, 스텝 S175에서 인식된 참조 화상 특정 정보 또는 참조 화상 특정 정보의 예측 모드 이외의 정보로서의 참조 화상 특정 정보를, 인핸스먼트 화상의 참조 화상 특정 정보로서 움직임 보상부(146)에 공급한다. 그리고, 처리는 도 35의 스텝 S136으로 복귀되어, 스텝 S137로 진행된다.
이상과 같이, 복호 장치(90)는, 참조 화상 특정 생성 정보를 사용해서 인핸스먼트 화상의 참조 화상 특정 정보를 생성하므로, 베이스 레이어와 인핸스먼트 레이어 사이에서 참조 화상 특정 정보를 공유 또는 예측할 수 있다. 따라서, 인핸스먼트 스트림의 정보량을 삭감하고, 부호화 효율을 향상시킬 수 있다.
또한, 제1 실시 형태에 있어서, scalable 기능의 종류에 따라 참조 레이어의 유무가 결정되도록 해도 좋다. 이 경우, 예를 들어 scalable 기능이 계층간에서 픽처 타입의 alignment를 취하는 유스 케이스가 많고,픽처의 참조 관계가 계층간에서 동일할 가능성이 높은, SNR Scalability, Spatial Scalability, Chroma Format Scalability, Bit Scalability 또는 Depth Scalability인 경우, 참조 레이어가 설정된다.
<제2 실시 형태>
(제2 실시 형태의 개요의 설명)
도 37은 본 기술을 적용한 제2 실시 형태의 개요를 설명하는 도면이다.
도 37에 도시한 바와 같이, 제2 실시 형태에서는 참조 화상에 관한 정보로서의, 가중치 부여 예측(Weighted Prediction)에 있어서의 가중 계수와 오프셋값을 포함하는 가중치 부여 정보가, 다른 계층 사이에서 공유 또는 예측된다.
도 38은 가중치 부여 예측을 설명하는 도면이다.
도 38에 도시한 바와 같이, AVC 방식이나 HEVC 방식에서는 인터 예측 시에 가중치 부여 예측이 행해진다. 가중치 부여 예측이란, 참조 화상에 대해 가중치 부여를 행하여 예측 화상을 생성하는 처리이다. 구체적으로는, 예를 들어 부호화 대상의 프레임 X보다 부호화순으로 앞의 2개의 프레임 Y1과 프레임 Y0의 복호 화상이 참조 화상으로서 사용되는 경우, 가중치 부여 예측에서는 프레임 X의 예측 화상 X'가, 이하의 수학식 4에 의해 구해진다.
Figure pct00004
또한, 수학식 4에 있어서, w0과 w1은 가중 계수이고, d는 오프셋값이다. 이 가중 계수는 AVC 방식에 있어서의 Implicit Weighted Prediction이라는 가중치 부여 예측에서는 POC로부터 산출된다. 한편, AVC 방식에 있어서의 Explicit Weighted Prediction이라는 가중치 부여 예측, 또는 HEVC 방식에 있어서의 가중치 부여 예측에서는, 가중 계수와 오프셋값은 부호화 스트림에 포함되어 전송된다.
가중치 부여 예측을 행함으로써, 페이드 인, 페이드 아웃, 크로스 페이드 등에 의해, 참조 화상과 부호화 대상의 화상 사이에서 휘도의 변화가 발생하는 경우라도, 예측 화상과 부호화 대상의 화상의 차분을 삭감할 수 있다. 그 결과, 부호화 효율을 향상시킬 수 있다.
이에 대해, 가중치 부여 예측이 행해지지 않은 경우, 페이드 인, 페이드 아웃, 크로스 페이드 등에 의해 참조 화상과 부호화 대상의 화상 사이에 발생하는 휘도의 변화가, 그대로 예측 화상과 부호화 대상의 화상의 차분이 되어, 부호화 효율이 나쁘다.
여기서, scalable 기능에 의한 부호화에 있어서, 각 계층의 화상에서는 SNR, 공간 해상도, 프레임 레이트, 비트수(bit depth), 색차 신호의 포맷 등이 다르지만, 내용은 동일하다고 생각된다.
따라서, 어떤 계층의 화상에 대해 페이드 인, 페이드 아웃, 크로스 페이드 등이 실시되어 있는 경우, 다른 계층의 화상에 대해서도 페이드 인, 페이드 아웃, 크로스 페이드 등이 실시되어 있다고 생각된다. 따라서, 각 계층의 화상에 적합한 가중치 부여 정보에는 상관이 있다고 생각된다. 따라서, 제2 실시 형태에서는 가중치 부여 정보를 다른 계층 사이에서 공유 또는 예측함으로써, 부호화 효율을 향상시킨다.
(부호화 장치의 제2 실시 형태의 구성예)
도 39는 본 기술을 적용한 부호화 장치의 제2 실시 형태의 구성예를 도시하는 블록도이다.
도 39에 도시하는 구성 중, 도 6의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 39의 부호화 장치(180)의 구성은 베이스 부호화부(11) 대신에 베이스 부호화부(181)가 설치되는 점, 인핸스먼트 부호화부(12) 대신에 인핸스먼트 부호화부(182)가 설치되는 점 및 VPS가 도 1에 도시한 VPS인 점이 도 6의 구성과 다르다. 부호화 장치(180)는 인핸스먼트 화상의 가중치 부여 정보의 생성에 사용하는 가중치 부여 생성 정보(참조 화상 생성 정보)를 생성하여, 인핸스먼트 스트림에 포함한다.
구체적으로는, 부호화 장치(180)의 베이스 부호화부(181)에는 외부로부터 베이스 화상이 입력된다. 베이스 부호화부(181)는 종래의 HEVC 방식의 부호화 장치와 마찬가지로 구성되어, 베이스 화상을 HEVC 방식으로 부호화한다. 단, 베이스 부호화부(181)는 베이스 화상의 부호화 시에 사용된 가중치 부여 정보 등을 인핸스먼트 부호화부(182)에 공급한다. 베이스 부호화부(181)는 부호화의 결과 얻어지는 부호화 데이터, SPS, PPS 등을 포함하는 부호화 스트림을, 베이스 스트림으로서 합성부(13)에 공급한다.
인핸스먼트 부호화부(182)에는 외부로부터 인핸스먼트 화상이 입력된다. 인핸스먼트 부호화부(182)는 인핸스먼트 화상을 HEVC 방식에 준하는 방식으로 부호화한다. 또한, 인핸스먼트 부호화부(182)는 베이스 화상의 가중치 부여 정보와, 인핸스먼트 화상의 부호화 시에 사용된 가중치 부여 정보를 사용하여, 가중치 부여 정보 생성 정보를 생성한다.
인핸스먼트 부호화부(182)는 인핸스먼트 화상의 부호화 데이터에 가중치 부여 정보 등을 부가하여 부호화 스트림을 생성하고, 인핸스먼트 스트림으로서 합성부(13)에 공급한다.
(베이스 스트림의 PPS의 신택스의 예)
도 40 및 도 41은 AVC 방식에 있어서의 PPS의 신택스의 예를 도시하는 도면이고, 도 42 및 도 43은 베이스 스트림의 PPS의 신택스의 예를 도시하는 도면이다.
도 40의 28행째에 도시한 바와 같이, AVC 방식의 PPS에는 P 슬라이스에 대해 가중치 부여 예측을 행할지 여부를 나타내는 플래그(weighted_pred_flag)가 포함된다. 또한, 29행째에 도시한 바와 같이, AVC 방식의 PPS에는 B 슬라이스에 대해 쌍방향의 가중치 부여 예측을 행할지 여부를 나타내는 정보(weighted_bipred_idc)가 포함된다. 또한, 쌍방향의 가중치 부여 예측이란, 부호화 대상의 화상보다 부호화순으로 앞의 화상과 뒤의 화상을 참조 화상으로 하는 가중치 부여 예측이다.
또한, 도 42의 17행째에 도시한 바와 같이, 베이스 스트림의 PPS에는 플래그(weighted_pred_flag)가 포함된다. 또한, 18행째에 도시한 바와 같이, 베이스 스트림의 PPS에는 B 슬라이스에 대해 가중치 부여 예측을 행할지 여부를 나타내는 플래그(weighted_bipred_flag)가 포함된다.
(베이스 스트림의 슬라이스 헤더의 신택스의 예)
도 44 및 도 45는 AVC 방식에 있어서의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다. 베이스 스트림의 슬라이스 헤더의 신택스는 도 9 내지 도 11의 신택스와 마찬가지이다.
도 44의 42행째에 도시한 바와 같이, AVC 방식의 슬라이스 헤더에는 가중치 부여 정보에 관한 정보(pred_weight_table)가 포함된다.
또한, 도 10의 19행째에 도시한 바와 같이, 베이스 스트림의 슬라이스 헤더에도 가중치 부여 정보에 관한 정보(pred_weight_table)가 포함된다.
(베이스 스트림의 가중치 부여 정보의 신택스의 예)
도 46은 AVC 방식에 있어서의 가중치 부여 정보의 신택스의 예를 도시하는 도면이고, 도 47은 베이스 스트림의 가중치 부여 정보의 신택스의 예를 도시하는 도면이다.
도 46의 2행째에 도시한 바와 같이, AVC 방식에 있어서의 가중치 부여 정보에는 휘도 신호의 가중 계수의 분모(luma_log2_weight_denom)가 포함된다. 또한, 4행째에 도시한 바와 같이, AVC 방식에 있어서의 가중치 부여 정보에는 색차 신호의 가중 계수의 분모(chroma_log2_weight_denom)가 포함된다.
이에 대해, 도 47의 2행째에 도시한 바와 같이, 베이스 스트림의 가중치 부여 정보에도 휘도 신호의 가중 계수의 분모(luma_log2_weight_denom)가 포함된다. 또한, 4행째에 도시한 바와 같이, 베이스 스트림의 가중치 부여 정보에는 휘도 신호의 가중 계수와 색차 신호의 가중 계수의 분모의 차분(delta_chroma_log2_weight_denom)이 포함된다. 이 차분(delta_chroma_log2_weight_denom)을 사용하여, 색차 신호의 가중 계수(chroma_log2_weight_denom)는 이하의 수학식 5로 연산된다.
Figure pct00005
또한, 도 46의 6행째와 22행째에 도시한 바와 같이, AVC 방식에 있어서의 가중치 부여 정보에는 휘도 신호에 대한 가중치 부여 정보가 존재하는지 여부를 나타내는 플래그(luma_weight_l0_flag, luma_weight_l1_flag)가 포함된다.
7행째 및 8행째 및 23행째 및 24행째에 도시한 바와 같이, 플래그(luma_weight_l0_flag, luma_weight_l1_flag)가, 휘도 신호에 대한 가중치 부여 정보가 존재하는 것을 나타내는 1인 경우, AVC 방식에 있어서의 가중치 부여 정보에는 휘도 신호의 가중 계수(luma_weight_l0, luma_weight_l1)가 포함된다. 또한, 9행째 및 25행째에 도시한 바와 같이, 휘도 신호의 오프셋(luma_offset_l0, luma_offset_l1)이 포함된다.
이에 대해, 도 47의 6행째와 23행째에 도시한 바와 같이, 베이스 스트림의 가중치 부여 정보에도 플래그(luma_weight_l0_flag, luma_weight_l1_flag)가 포함된다. 11행째 및 12행째 및 28행째 및 29행째에 도시한 바와 같이, 플래그(luma_weight_l0_flag, luma_weight_l1_flag)가 1인 경우, 베이스 스트림의 가중치 부여 정보에는 휘도 신호의 가중 계수의 정보(delta_luma_weight_l0, delta_luma_weight_l1)가 포함된다.
이 휘도 신호의 가중 계수의 정보(delta_luma_weight_l0, delta_luma_weight_l1)를 사용하여, 휘도 신호의 가중 계수(luma_weight_l0, luma_weight_l1)는 이하의 수학식 6으로 연산된다.
Figure pct00006
Figure pct00007
또한, 도 47의 13행째 및 30행째에 도시한 바와 같이, 베이스 스트림의 가중치 부여 정보에도 휘도 신호의 오프셋(luma_offset_l0, luma_offset_l1)이 포함된다.
또한, 도 46의 12행째와 28행째에 도시한 바와 같이, AVC 방식에 있어서의 가중치 부여 정보에는 색차 신호에 대한 가중치 부여 정보가 존재하는지 여부를 나타내는 플래그(chroma_weight_l0_flag, chroma_weight_l1_flag)가 포함된다.
플래그(chroma_weight_l0_flag, chroma_weight_l1_flag)가, 색차 신호에 대한 가중치 부여 정보가 존재하는 것을 나타내는 1인 경우, 13행째 내지 15행째 및 29행째 내지 31행째에 도시한 바와 같이, AVC 방식에 있어서의 가중치 부여 정보에는 색차 신호의 가중 계수(chroma_weight_l0, chroma_weight_l1)가 포함된다. 또한, 16행째 및 32행째에 도시한 바와 같이, 색차 신호의 오프셋(chroma_offset_l0, chroma_offset_l1)이 포함된다.
이에 비해, 도 47의 9행째와 26행째에 도시한 바와 같이, 베이스 스트림의 가중치 부여 정보에도 플래그(chroma_weight_l0_flag, chroma_weight_l1_flag)가 포함된다. 15행째 내지 17행째 및 32행째 내지 34행째에 도시한 바와 같이, 플래그(chroma_weight_l0_flag, chroma_weight_l1_flag)가 1인 경우, 베이스 스트림의 가중치 부여 정보에는 색차 신호의 가중 계수의 정보(delta_chroma_weight_l0, delta_chroma_weight_l1)가 포함된다.
이 색차 신호의 가중 계수의 정보(delta_chroma_weight_l0, delta_chroma_weight_l1)를 사용하여, 색차 신호의 가중 계수(chroma_weight_l0, chroma_weight_l1)는 이하의 수학식 7로 연산된다.
Figure pct00008
또한, 도 47의 18행째 및 35행째에 도시한 바와 같이, 베이스 스트림의 가중치 부여 정보에는 색차 신호의 오프셋의 정보(delta_chroma_offset_l0, delta_chroma_offset_l1)가 포함된다. 이 색차 신호의 오프셋의 정보(delta_chroma_offset_l0, delta_chroma_offset_l1)를 사용하여, 색차 신호의 오프셋(chroma_offset_l0, chroma_offset_l1)은 이하의 수학식 8로 연산된다.
Figure pct00009
(인핸스먼트 부호화부의 구성예)
도 48은 도 39의 인핸스먼트 부호화부(182)의 구성예를 도시하는 블록도이다.
도 48의 인핸스먼트 부호화부(182)는 부호화부(201)와 설정부(202)에 의해 구성된다.
인핸스먼트 부호화부(182)의 부호화부(201)는 외부로부터 입력되는 프레임 단위의 인핸스먼트 화상을 입력 신호로 한다. 부호화부(201)는 베이스 부호화부(11)로부터의 가중치 부여 정보 등을 참조하여, HEVC 방식에 준하는 방식으로 입력 신호를 부호화한다. 부호화부(201)는 그 결과 얻어지는 부호화 데이터를 설정부(202)에 공급한다.
설정부(202)는 SPS, PPS 등을 설정한다. 또한, 이 PPS에는 플래그(weighted_pred_flag)와 플래그(weighted_bipred_flag)가 포함되지 않고, 참조 레이어의 부호화 스트림인 베이스 스트림의 PPS에 포함되는 플래그(weighted_pred_flag)와 플래그(weighted_bipred_flag)가, 인핸스먼트 화상의 플래그(weighted_pred_flag)와 플래그(weighted_bipred_flag)로서 사용된다.
따라서, 베이스 화상의 참조 화상에 대해 가중치 부여가 행해진 경우, 인핸스먼트 화상의 참조 화상에 대해 가중치 부여가 행해지고, 베이스 화상의 참조 화상에 대해 가중치 부여가 행해지지 않는 경우, 인핸스먼트 화상의 참조 화상에 대해 가중치 부여가 행해지지 않는다.
설정부(202)는 설정된 SPS 및 PPS와, 부호화부(201)로부터 공급되는 부호화 데이터로부터 부호화 스트림을 생성하여, 인핸스먼트 스트림으로서 합성부(13)에 공급한다.
(부호화부의 구성예)
도 49는 도 48의 부호화부(201)의 구성예를 도시하는 블록도이다.
도 49에 도시하는 구성 중, 도 14의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 49의 부호화부(201)의 구성은 움직임 예측ㆍ보상부(47), 참조 버퍼(49), 참조 화상 설정부(50), 가역 부호화부(36) 대신에, 움직임 예측ㆍ보상부(221), 가중 버퍼(222), 가중 설정부(223), 가역 부호화부(224)가 설치되는 점이 도 14의 구성과 다르다.
움직임 예측ㆍ보상부(221)는 가중치 부여 처리부로서 기능하고, 가중 설정부(223)로부터의 가중치 부여 예측의 지시에 기초하여, 후보가 되는 모든 인터 예측 모드의 가중치 부여 예측을 사용한 움직임 예측ㆍ보상 처리를 행한다. 구체적으로는, 움직임 예측ㆍ보상부(221)는 화면 재배열 버퍼(32)로부터 공급되는 화상과, 프레임 메모리(44)로부터 스위치(45)를 통해 판독되는 참조 화상에 기초하여, 후보가 되는 모든 인터 예측 모드의 움직임 벡터를 검출한다. 또한, 참조 화상은, 예를 들어 유저에 의해 설정된다.
움직임 예측ㆍ보상부(221)는 검출된 움직임 벡터에 기초하여 참조 화상에 보상 처리를 실시한다. 움직임 예측ㆍ보상부(221)는 가중치 부여 예측에 있어서의 가중치 부여 정보를 산출한다. 움직임 예측ㆍ보상부(221)는 산출된 가중치 부여 정보를 사용하여 보상 처리 후의 참조 화상에 대해 가중치 부여 예측을 행하여, 예측 화상을 생성한다.
이때, 움직임 예측ㆍ보상부(221)는 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초하여, 후보가 되는 모든 인터 예측 모드에 대해 비용 함숫값을 산출하고, 비용 함숫값이 최소로 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측ㆍ보상부(221)는 최적 인터 예측 모드의 비용 함숫값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다.
또한, 움직임 예측ㆍ보상부(221)는 예측 화상 선택부(48)로부터 최적 인터 예측 모드로 생성된 예측 화상의 선택이 통지된 경우, 인터 예측 모드 정보, 대응하는 움직임 벡터, 참조 화상 특정 정보 등을 가역 부호화부(224)에 출력한다. 또한, 움직임 예측ㆍ보상부(221)는 가중치 부여 예측에 있어서의 가중치 부여 정보를 가중 설정부(223)에 공급한다.
가중 버퍼(222)는 도 39의 베이스 부호화부(181)로부터 공급되는 베이스 스트림의 PPS에 포함되는 플래그(weighted_bipred_flag)와 플래그(weighted_pred_flag)를 기억한다. 또한, 가중 버퍼(222)는 베이스 부호화부(181)로부터 공급되는 베이스 스트림의 슬라이스 헤더에 포함되는 가중치 부여 정보를 기억한다.
가중 설정부(223)는 가중 버퍼(222)로부터 플래그(weighted_pred_flag)와 플래그(weighted_bipred_flag)를 판독한다. 가중 설정부(223)는 플래그(weighted_pred_flag), 플래그(weighted_bipred_flag) 및 현재의 부호화 대상의 화상의 슬라이스의 종류에 기초하여, 움직임 예측ㆍ보상부(221)에 가중치 부여 예측을 지시한다.
가중 설정부(223)는 움직임 예측ㆍ보상부(221)로부터 공급되는 가중치 부여 정보와, 가중 버퍼(222)에 기억되어 있는 가중치 부여 정보를 비교하여, 인핸스먼트 화상의 가중치 부여 정보의 예측 모드를 결정한다. 여기서는, 가중치 부여 정보의 예측 모드로서는, 카피 모드, 차분 예측 모드 및 비예측 모드가 있는 것으로 한다.
카피 모드란, 인핸스먼트 화상의 가중치 부여 정보로서, 참조 레이어(여기서는, 베이스 레이어)의 가중치 부여 정보를 사용하는 예측 모드이다. 차분 예측 모드란, 인핸스먼트 화상과 참조 레이어의 가중치 부여 정보의 차분과, 참조 레이어의 가중치 부여 정보를 가산함으로써, 인핸스먼트 화상의 가중치 부여 정보를 생성하는 예측 모드이다. 비예측 모드란, 인핸스먼트 화상의 가중치 부여 정보를 참조 레이어의 가중치 부여 정보와 독립하여 설정하는 예측 모드이다.
가중 설정부(223)는 가중치 부여 정보의 예측 모드가 카피 모드인 경우, 카피 모드를 가중치 부여 생성 정보로서 설정하여, 가역 부호화부(224)에 공급한다. 또한, 가중 설정부(223)는 가중치 부여 정보의 예측 모드가 차분 예측 모드인 경우, 인핸스먼트 화상의 가중치 부여 정보와 베이스 화상의 가중치 부여 정보의 차분을 연산한다. 그리고, 가중 설정부(223)는 연산된 가중치 부여 정보의 차분과 차분 예측 모드를, 가중치 부여 생성 정보로서 설정하여, 가역 부호화부(224)에 공급한다.
또한, 가중 설정부(223)는 가중치 부여 정보의 예측 모드가 비예측 모드인 경우, 인핸스먼트 화상의 가중치 부여 정보를 가중치 부여 생성 정보로서 설정하여, 가역 부호화부(224)에 공급한다.
가역 부호화부(224)는 도 14의 가역 부호화부(36)와 마찬가지로, 인트라 예측 모드 정보를 인트라 예측부(46)로부터 취득한다. 또한, 가역 부호화부(224)는 움직임 예측ㆍ보상부(221)로부터 공급되는 인터 예측 모드 정보, 움직임 벡터, 참조 화상 특정 정보 등을 움직임 예측ㆍ보상부(221)로부터 취득한다. 또한, 가역 부호화부(224)는 가중치 부여 생성 정보를 가중 설정부(223)로부터 취득한다.
또한, 가역 부호화부(224)는 가역 부호화부(36)와 마찬가지로, 적응 오프셋 필터(42)로부터 오프셋 필터 정보를 취득하고, 적응 루프 필터(43)로부터 필터 계수를 취득한다.
가역 부호화부(224)는 가역 부호화부(36)와 마찬가지로, 양자화부(35)로부터 공급되는 양자화된 계수에 대해 가역 부호화를 행한다. 또한, 가역 부호화부(224)는 인트라 예측 모드 정보, 또는 인터 예측 모드 정보, 움직임 벡터, 참조 화상 특정 정보 및 가중치 부여 생성 정보, 오프셋 필터 정보 및 필터 계수를, 부호화에 관한 부호화 정보로서 가역 부호화한다.
가역 부호화부(224)는 가역 부호화부(36)와 마찬가지로, 가역 부호화된 부호화 정보를 슬라이스 헤더로 하고, 가역 부호화된 계수를 부호화 데이터로 하고, 부호화 데이터에 슬라이스 헤더를 부가한다. 가역 부호화부(224)는 가역 부호화부(36)와 마찬가지로, 슬라이스 헤더가 부가된 부호화 데이터를 축적 버퍼(37)에 공급하여, 축적시킨다.
(가중 버퍼와 가중 설정부의 구성예)
도 50은 도 49의 가중 버퍼(222)와 가중 설정부(223)의 구성예를 도시하는 블록도이다.
도 50의 가중 버퍼(222)는 정보 버퍼(241)와 플래그 버퍼(242)에 의해 구성된다.
가중 버퍼(222)의 정보 버퍼(241)는 도 39의 베이스 부호화부(181)로부터 공급되는 베이스 스트림의 슬라이스 헤더에 포함되는 가중치 부여 정보를 기억한다. 플래그 버퍼(242)는 베이스 부호화부(181)로부터 공급되는 베이스 스트림의 PPS에 포함되는 플래그(weighted_bipred_flag)와 플래그(weighted_pred_flag)를 기억한다.
도 50의 가중 설정부(223)는 제어부(261), 정보 버퍼(262), 판정부(263) 및 설정부(264)에 의해 구성된다.
가중 설정부(223)의 제어부(261)는 플래그 버퍼(242)로부터 플래그(weighted_pred_flag)와 플래그(weighted_bipred_flag)를 판독한다. 가중 설정부(223)는 플래그(weighted_pred_flag), 플래그(weighted_bipred_flag) 및 현재의 부호화 대상의 화상의 슬라이스 종류에 기초하여, 도 49의 움직임 예측ㆍ보상부(221)에 가중치 부여 예측을 지시한다.
정보 버퍼(262)는 움직임 예측ㆍ보상부(221)로부터 가중치 부여 정보를 취득하여, 기억한다. 판정부(263)는 정보 버퍼(241)로부터 베이스 화상의 가중치 부여 정보를 판독하고, 정보 버퍼(262)로부터 인핸스먼트 화상의 가중치 부여 정보를 판독한다. 판정부(263)는 판독된 베이스 화상의 가중치 부여 정보와 인핸스먼트 화상의 가중치 부여 정보를 비교한다.
그리고, 판정부(263)는 베이스 화상의 가중치 부여 정보와 인핸스먼트 화상의 가중치 부여 정보가 동일한 경우, 가중치 부여 정보의 예측 모드를 카피 모드로 결정한다. 판정부(263)는 카피 모드를 설정부(264)에 공급한다. 또한, 판정부(263)는 카피 모드를 가중치 부여 생성 정보로서 설정하여, 도 49의 가역 부호화부(224)에 공급한다.
설정부(264)는 판정부(263)로부터 카피 모드가 공급되지 않은 경우, 정보 버퍼(241)로부터 베이스 화상의 가중치 부여 정보를 판독하고, 정보 버퍼(262)로부터 인핸스먼트 화상의 가중치 부여 정보를 판독한다. 설정부(264)는 유저로부터의 입력에 기초하여, 가중치 부여 정보의 예측 모드를 차분 예측 모드 또는 비예측 모드로 결정한다.
가중치 부여 정보의 예측 모드가 차분 예측 모드로 결정된 경우, 설정부(264)는 판독된 베이스 화상의 가중치 부여 정보와 인핸스먼트 화상의 가중치 부여 정보의 차분을 연산한다. 그리고, 가중 설정부(223)는 연산된 가중치 부여 정보의 차분과 차분 예측 모드를 가중치 부여 생성 정보로서 설정하여, 가역 부호화부(224)에 공급한다.
한편, 가중치 부여 정보의 예측 모드가 비예측 모드로 결정된 경우, 설정부(264)는 인핸스먼트 화상의 가중치 부여 정보와 비예측 모드를 가중치 부여 생성 정보로서 설정하여, 가역 부호화부(36)에 공급한다.
(인핸스먼트 스트림의 슬라이스 헤더의 신택스)
인핸스먼트 스트림의 슬라이스 헤더의 신택스는 가중치 부여 정보를 제외하고, 베이스 스트림의 슬라이스 헤더의 신택스와 마찬가지이므로, 가중치 부여 정보에 관한 정보(pred_weight_table)의 신택스에 대해서만 설명한다.
도 51 및 도 52는 인핸스먼트 스트림의 가중치 부여 정보의 신택스의 예를 도시하는 도면이다.
도 51의 2행째에 도시한 바와 같이, 가중치 부여 정보에 관한 정보에는 가중치 부여 정보의 예측 모드(pred_mode)가 포함된다. 가중치 부여 정보의 예측 모드는 카피 모드를 나타내는 경우 0이고, 차분 예측 모드를 나타내는 경우 1이고, 비예측 모드를 나타내는 경우 2이다.
3행째와 4행째에 도시한 바와 같이, 가중치 부여 정보의 예측 모드가 2 이외인 경우, 즉 가중치 부여 정보의 예측 모드가 카피 모드 또는 차분 예측 모드인 경우, 베이스 레이어와 참조 레이어의 차분(diff_ref_layer_minus1)이 포함된다. 여기서, 현재의 레이어를 curr_layer로 하고, 참조 레이어를 ref_layer로 하면, 참조 레이어 ref_layer는 차분 diff_ref_layer_minus1을 사용하여 이하의 수학식 9로 나타낸다.
Figure pct00010
또한, 5행째 및 6행째에 도시한 바와 같이, 가중치 부여 정보의 예측 모드가 1인 경우, 가중치 부여 정보에 관한 정보에는, 대응하는 슬라이스와 참조 레이어의 분모(luma_log2_weight_denom)의 차분(diff_luma_log2_weight_denom)이 포함된다. 또한, 8행째에 도시한 바와 같이, 대응하는 슬라이스와 참조 레이어의 차분(delta_chroma_log2_weight_denom)의 차분(diff_delta_chroma_log2_weight_denom)이 포함된다.
또한, 가중치 부여 정보에 관한 정보에는 플래그(luma_weight_l0_flag, luma_weight_l1_flag)와 플래그(chroma_weight_l0_flag, chroma_weight_l1_flag)는 포함되지 않는다.
즉, 상술한 바와 같이, scalable 기능에 의한 부호화에서는, 어떤 계층의 화상에 대해 페이드 인, 페이드 아웃, 크로스 페이드 등이 실시되어 있는 경우, 다른 계층의 화상에 대해서도 페이드 인, 페이드 아웃, 크로스 페이드 등이 실시되어 있다고 생각된다. 따라서, 참조 레이어의 베이스 화상에 대해 가중치 부여 예측이 행해지는 경우에는, 인핸스먼트 화상에 대해서도 가중치 부여 예측이 행해지는 것이 부호화 효율상 바람직하다.
따라서, 인핸스먼트 화상의 플래그(luma_weight_l0_flag, luma_weight_l1_flag)와 플래그(chroma_weight_l0_flag, chroma_weight_l1_flag)는 전송되지 않고, 참조 레이어의 플래그(luma_weight_l0_flag, luma_weight_l1_flag)와 플래그(chroma_weight_l0_flag, chroma_weight_l1_flag)가 사용된다.
또한, 10행째 내지 12행째와 22행째 내지 24행째에 도시한 바와 같이, 참조 레이어의 플래그(luma_weight_l0_flag, luma_weight_l1_flag)가 1인 경우, 가중치 부여 정보에 관한 정보에는 대응하는 슬라이스와 참조 레이어의 휘도 신호의 가중 계수의 정보(delta_luma_weight_l0, delta_luma_weight_l1)의 차분(diff_delta_luma_weight_l0, diff_delta_luma_weight_l1)이 포함된다. 또한, 대응하는 슬라이스와 참조 레이어의 휘도 신호의 오프셋(luma_offset_l0, luma_offset_l1)의 차분(diff_luma_offset_l0, diff_luma_offset_l1)이 포함된다.
또한, 14행째 내지 17행째와 26행째 내지 29행째에 도시한 바와 같이, 참조 레이어의 플래그(chroma_weight_l0_flag, chroma_weight_l1_flag)가 1인 경우, 가중치 부여 정보에 관한 정보에는 대응하는 슬라이스와 참조 레이어의 색차 신호의 가중 계수의 정보(delta_chroma_weight_l0, delta_chroma_weight_l1)의 차분(diff_delta_chroma_weight_l0, diff_delta_chroma_weight_l1)이 포함된다. 또한, 대응하는 슬라이스와 참조 레이어의 색차 신호의 오프셋(chroma_offset_l0, chroma_offset_l1)의 차분(diff_chroma_offset_l0, diff_chroma_offset_l1)이 포함된다.
한편, 가중치 부여 정보의 예측 모드가 2인 경우, 도 51의 33행째 내지 37행째 및 도 52에 도시한 바와 같이, 가중치 부여 정보에 관한 정보에는 베이스 스트림의 가중치 부여 정보와 동일한 정보가 포함된다.
또한, 가중치 부여 정보에 관한 정보(pred_weight_table)는 VPS, SPS 등의 슬라이스 헤더보다 위의 계층에 계층 단위로 포함되도록 해도 된다.
(부호화 장치의 처리의 설명)
도 39의 부호화 장치(180)의 계층 부호화 처리는 베이스 부호화부(181)로부터 인핸스먼트 부호화부(182)에 공급되는 정보가, 가중치 부여 정보, 플래그(weighted_pred_flag) 및 플래그(weighted_bipred_flag)인 점 및 도 24의 스텝 S2의 인핸스먼트 스트림 생성 처리를 제외하고 도 24의 계층 부호화 처리와 마찬가지이므로, 인핸스먼트 스트림 생성 처리에 대해서만 설명한다.
도 53은 도 48의 인핸스먼트 부호화부(182)의 인핸스먼트 스트림 생성 처리를 설명하는 흐름도이다.
도 53의 스텝 S191에 있어서, 인핸스먼트 부호화부(182)의 부호화부(201)는 외부로부터 입력 신호로서 입력되는 프레임 단위의 인핸스먼트 화상을 HEVC 방식에 준하는 방식으로 부호화하는 부호화 처리를 행한다. 이 부호화 처리의 상세는 후술하는 도 54 및 도 55를 참조하여 설명한다.
스텝 S192에 있어서, 설정부(202)는 SPS를 설정한다. 스텝 S193에 있어서, 설정부(202)는 플래그(weighted_pred_flag)와 플래그(weighted_bipred_flag)를 포함하지 않는 PPS를 설정한다. 스텝 S194 및 S195의 처리는 도 25의 스텝 S14 및 15의 처리와 마찬가지이므로, 설명은 생략한다.
도 54 및 도 55는 도 53의 스텝 S191의 부호화 처리의 상세를 설명하는 흐름도이다.
도 54의 스텝 S211 및 S212의 처리는 도 26의 스텝 S31 및 S32의 처리와 마찬가지이므로 설명은 생략한다.
스텝 S213에 있어서, 가중 버퍼(222)의 정보 버퍼(241)는 도 39의 베이스 부호화부(181)로부터 공급되는 가중치 부여 정보를 기억하고, 플래그 버퍼(242)는 플래그(weighted_bipred_flag)와 플래그(weighted_pred_flag)를 기억한다.
스텝 S214에 있어서, 제어부(261)는 플래그 버퍼(242)에 기억되어 있는 플래그(weighted_pred_flag) 및 플래그(weighted_bipred_flag) 및 현재의 부호화 대상의 화상의 슬라이스 종류에 기초하여, 가중치 부여 예측을 행할지 여부를 판정한다.
스텝 S214에서 가중치 부여 예측을 행한다고 판정된 경우, 제어부(261)는 움직임 예측ㆍ보상부(221)에 가중치 부여 예측을 지시하고, 처리를 스텝 S215로 진행시킨다.
스텝 S215에 있어서, 인트라 예측부(46)는 후보가 되는 모든 인트라 예측 모드의 인트라 예측 처리를 행한다. 또한, 인트라 예측부(46)는 화면 재배열 버퍼(32)로부터 판독된 화상과, 인트라 예측 처리의 결과 생성되는 예측 화상에 기초하여, 후보가 되는 모든 인트라 예측 모드에 대해 비용 함숫값을 산출한다. 그리고, 인트라 예측부(46)는 비용 함숫값이 최소로 되는 인트라 예측 모드를, 최적 인트라 예측 모드로 결정한다. 인트라 예측부(46)는 최적 인트라 예측 모드로 생성된 예측 화상 및 대응하는 비용 함숫값을, 예측 화상 선택부(48)에 공급한다.
또한, 움직임 예측ㆍ보상부(221)는 후보가 되는 모든 인터 예측 모드의 가중치 부여 예측을 사용한 움직임 예측ㆍ보상 처리를 행한다. 또한, 움직임 예측ㆍ보상부(221)는 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초하여, 후보가 되는 모든 인터 예측 모드에 대해 비용 함숫값을 산출하고, 비용 함숫값이 최소로 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측ㆍ보상부(221)는 최적 인터 예측 모드의 비용 함숫값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다.
한편, 스텝 S214에서 가중치 부여 예측을 행하지 않는다고 판정된 경우, 제어부(261)는 처리를 스텝 S216으로 진행시킨다.
스텝 S216에 있어서, 인트라 예측부(46)는 스텝 S215의 처리와 마찬가지로, 후보가 되는 모든 인트라 예측 모드의 인트라 예측 처리를 행하여, 비용 함숫값을 산출한다. 그리고, 인트라 예측부(46)는 비용 함숫값이 최소로 되는 인트라 예측 모드를, 최적 인트라 예측 모드로 결정하고, 최적 인트라 예측 모드로 생성된 예측 화상 및 대응하는 비용 함숫값을, 예측 화상 선택부(48)에 공급한다.
또한, 움직임 예측ㆍ보상부(221)는 후보가 되는 모든 인터 예측 모드의 움직임 예측ㆍ보상 처리를 행한다. 또한, 움직임 예측ㆍ보상부(221)는 화면 재배열 버퍼(32)로부터 공급되는 화상과 예측 화상에 기초하여, 후보가 되는 모든 인터 예측 모드에 대해 비용 함숫값을 산출하여, 비용 함숫값이 최소로 되는 인터 예측 모드를 최적 인터 예측 모드로 결정한다. 그리고, 움직임 예측ㆍ보상부(221)는 최적 인터 예측 모드의 비용 함숫값과, 대응하는 예측 화상을 예측 화상 선택부(48)에 공급한다.
스텝 S215 및 S216의 처리 후, 처리는 스텝 S217로 진행된다. 스텝 S217 및 S218의 처리는 도 26의 스텝 S34 및 S35의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S219에 있어서, 움직임 예측ㆍ보상부(221)는 인터 예측 모드 정보, 움직임 벡터 및 참조 화상 특정 정보를 가역 부호화부(36)에 공급한다. 스텝 S220에 있어서, 움직임 예측ㆍ보상부(221)는 가중치 부여 예측을 행하였는지 여부를 판정한다. 스텝 S220에서 가중치 부여 예측을 행하였다고 판정된 경우, 스텝 S221에 있어서, 움직임 예측ㆍ보상부(221)는 그 가중치 부여 예측에 있어서의 가중치 부여 정보를 가중 설정부(223)에 공급한다.
스텝 S222에 있어서, 가중 설정부(223)는 가중치 부여 생성 정보를 생성하는 생성 처리를 행한다. 이 생성 처리의 상세는 후술하는 도 56을 참조하여 설명한다. 스텝 S222의 처리 후, 처리는 스텝 S224로 진행된다.
한편, 스텝 S220에서 가중치 부여 예측을 행하고 있지 않다고 판정된 경우, 스텝 S221 및 S222의 처리는 스킵되고, 처리는 스텝 S224로 진행된다.
스텝 S223 내지 S238의 처리는 부호화 정보가 인트라 예측 모드 정보, 또는 인터 예측 모드 정보, 움직임 벡터, 참조 화상 특정 정보 및 가중치 부여 생성 정보, 오프셋 필터 정보 및 필터 계수인 점을 제외하고, 도 26 및 도 27의 스텝 S39 내지 S54의 처리와 마찬가지이므로, 설명은 생략한다.
도 56은 도 54의 스텝 S222의 생성 처리의 상세를 설명하는 흐름도이다.
도 56의 스텝 S251에 있어서, 가중 설정부(223)의 정보 버퍼(262)는 도 49의 움직임 예측ㆍ보상부(47)로부터 인핸스먼트 화상의 가중치 부여 정보를 취득하여, 기억한다. 스텝 S252에 있어서, 판정부(263)는 정보 버퍼(262)에 기억되어 있는 인핸스먼트 화상의 가중치 부여 정보가, 정보 버퍼(241)에 기억되어 있는 베이스 화상의 가중치 부여 정보와 동일한지 여부를 판정한다.
스텝 S252에서 인핸스먼트 화상의 가중치 부여 정보가 베이스 화상의 가중치 부여 정보와 동일하다고 판정된 경우, 스텝 S253에 있어서, 판정부(263)는 가중치 부여 정보의 예측 모드를 카피 모드로 결정한다. 스텝 S254에 있어서, 판정부(263)는 카피 모드를 설정부(264)에 공급한다. 또한, 판정부(263)는 카피 모드를 가중치 부여 생성 정보로 설정하여, 도 49의 가역 부호화부(224)에 공급한다. 그리고, 처리는 도 54의 스텝 S222로 돌아가고, 스텝 S224로 진행된다.
한편, 스텝 S252에서 인핸스먼트 화상의 가중치 부여 정보가 베이스 화상의 가중치 부여 정보와 동일하지 않다고 판정된 경우, 처리는 스텝 S255로 진행된다. 스텝 S255에 있어서, 설정부(264)는 유저로부터의 입력에 기초하여, 가중치 부여 정보의 예측 모드를 차분 예측 모드로 할지 여부를 판정한다.
스텝 S255에서 가중치 부여 정보의 예측 모드를 차분 예측 모드로 한다고 판정된 경우, 스텝 S256에 있어서, 설정부(264)는 가중치 부여 정보의 예측 모드를 차분 예측 모드로 결정한다.
스텝 S257에 있어서, 설정부(264)는 인핸스먼트 화상의 가중치 부여 정보와 베이스 화상의 가중치 부여 정보의 차분을 구한다. 스텝 S258에 있어서, 가중 설정부(223)는 스텝 S257에서 구해진 가중치 부여 정보의 차분과 차분 예측 모드를 가중치 부여 생성 정보로서 설정하여, 가역 부호화부(224)에 공급한다. 그리고, 처리는 도 54의 스텝 S222로 돌아가고, 스텝 S224로 진행된다.
한편, 스텝 S255에서 가중치 부여 정보의 예측 모드를 차분 예측 모드로 하지 않는다고 판정된 경우, 스텝 S259에 있어서, 설정부(264)는 가중치 부여 정보의 예측 모드를 비예측 모드로 결정한다.
스텝 S260에 있어서, 설정부(264)는 인핸스먼트 화상의 가중치 부여 정보와 비예측 모드를 가중치 부여 생성 정보로서 설정하여, 가역 부호화부(36)에 공급한다. 그리고, 처리는 도 54의 스텝 S222로 돌아가고, 스텝 S224로 진행된다.
이상과 같이, 부호화 장치(180)는 가중치 부여 생성 정보를 설정하므로, 베이스 레이어와 인핸스먼트 레이어 사이에서 가중치 부여 정보를 공유 또는 예측할 수 있다. 따라서, 인핸스먼트 스트림의 정보량을 삭감하여, 부호화 효율을 향상시킬 수 있다.
(복호 장치의 제2 실시 형태의 구성예)
도 57은 도 39의 부호화 장치(180)로부터 전송되는 전체 계층의 부호화 스트림을 복호하는, 본 기술을 적용한 복호 장치의 제2 실시 형태의 구성예를 도시하는 블록도이다.
도 57에 도시하는 구성 중, 도 29의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 57의 복호 장치(280)의 구성은 분리부(92), 베이스 복호부(93), 인핸스먼트 복호부(94) 대신에, 분리부(281), 베이스 복호부(282), 인핸스먼트 복호부(283)가 설치되는 점이 도 29의 구성과 다르다.
복호 장치(280)의 분리부(281)는 수취부(91)로부터 공급되는 전체 계층의 부호화 스트림으로부터 베이스 스트림을 분리하여 베이스 복호부(282)에 공급하고, 인핸스먼트 스트림을 분리하여 인핸스먼트 복호부(283)에 공급한다.
베이스 복호부(282)는 종래의 HEVC 방식의 복호 장치와 마찬가지로 구성되고, 분리부(281)로부터 공급되는 베이스 스트림을 HEVC 방식으로 복호하여, 베이스 화상을 생성한다. 단, 베이스 복호부(282)는 베이스 화상의 복호 시에 사용된 가중치 부여 정보 및 베이스 스트림의 PPS에 포함되는 플래그(weighted_bipred_flag) 및 플래그(weighted_pred_flag)를, 인핸스먼트 복호부(283)에 공급한다. 베이스 복호부(282)는 생성된 베이스 화상을 출력한다.
인핸스먼트 복호부(283)는 분리부(281)로부터 공급되는 인핸스먼트 스트림을 HEVC 방식에 준하는 방식으로 복호하여, 인핸스먼트 화상을 생성한다. 이때, 인핸스먼트 복호부(283)는 베이스 복호부(282)로부터 공급되는 가중치 부여 정보, 플래그(weighted_bipred_flag) 및 플래그(weighted_pred_flag)를 참조하여 인핸스먼트 스트림을 복호한다. 인핸스먼트 복호부(283)는 생성된 인핸스먼트 화상을 출력한다.
(인핸스먼트 복호부의 구성예)
도 58은 도 57의 인핸스먼트 복호부(283)의 구성예를 도시하는 블록도이다.
도 58의 인핸스먼트 복호부(283)는 추출부(301)와 복호부(302)에 의해 구성된다.
인핸스먼트 복호부(283)의 추출부(301)는 도 57의 분리부(281)로부터 공급되는 인핸스먼트 스트림으로부터, SPS, PPS, 부호화 데이터 등을 추출하여, 복호부(302)에 공급한다.
복호부(302)는 도 57의 베이스 복호부(282)로부터 공급되는 베이스 화상의 가중치 부여 정보, 플래그(weighted_bipred_flag) 및 플래그(weighted_pred_flag)를 참조하여, 추출부(301)로부터 공급되는 부호화 데이터를 HEVC 방식에 준하는 방식으로 복호한다. 이때, 복호부(302)는 필요에 따라서, 추출부(301)로부터 공급되는 SPS나 PPS 등도 참조한다. 복호부(302)는 복호의 결과 얻어지는 화상을, 인핸스먼트 화상으로서 출력한다.
(복호부의 구성예)
도 59는 도 58의 복호부(302)의 구성예를 도시하는 블록도이다.
도 59에 도시하는 구성 중, 도 31의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 59의 복호부(302)의 구성은 가역 복호부(132), 참조 버퍼(144), 참조 화상 설정부(145), 움직임 보상부(146) 대신에, 가역 복호부(320), 가중 버퍼(321), 가중 설정부(322), 움직임 보상부(323)가 설치되는 점이 도 31의 구성과 다르다.
복호부(302)의 가역 복호부(320)는 축적 버퍼(131)로부터의 부호화 데이터에 대해, 가변 길이 복호나, 산술 복호 등의 가역 복호를 실시함으로써, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(320)는 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(320)는 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보, 참조 화상 특정 정보 등을 움직임 보상부(146)에 공급한다.
또한, 가역 복호부(320)는 부호화 정보로서의 가중치 부여 생성 정보를 가중 설정부(322)에 공급한다. 또한, 가역 복호부(320)는 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(147)에 공급한다. 가역 복호부(320)는 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
가중 버퍼(321)는 도 57의 베이스 복호부(282)로부터 공급되는 베이스 화상의 가중치 부여 정보, 플래그(weighted_bipred_flag) 및 플래그(weighted_pred_flag)를 기억한다.
가중 설정부(322)는 가중 버퍼(321)에 기억되어 있는 플래그(weighted_bipred_flag) 및 플래그(weighted_pred_flag) 및 현재의 복호 대상의 화상의 슬라이스의 종류에 기초하여, 움직임 보상부(323)에 가중치 부여 예측을 지시한다.
또한, 가중 설정부(322)는 가중 버퍼(321)에 기억되어 있는 베이스 화상의 가중치 부여 정보와, 가역 복호부(320)로부터 공급되는 가중치 부여 생성 정보에 기초하여, 인핸스먼트 화상의 가중치 부여 정보를 생성한다. 가중 설정부(322)는 생성된 가중치 부여 정보를 움직임 보상부(323)에 공급한다.
움직임 보상부(323)는 프레임 메모리(141)로부터 스위치(142)를 통해, 가역 복호부(320)로부터 공급되는 참조 화상 특정 정보에 의해 특정되는 참조 화상을 판독한다. 움직임 보상부(323)는 가중 설정부(322)로부터 공급되는 가중치 부여 예측의 지시에 기초하여, 움직임 벡터, 참조 화상 및 가중 설정부(322)로부터의 가중치 부여 정보를 사용하여, 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 가중치 부여 예측을 사용한 움직임 보상 처리를 행한다.
구체적으로는, 움직임 보상부(323)는 가중치 부여 처리부로서 기능하여, 움직임 벡터에 기초하여 참조 화상에 보상 처리를 실시하고, 가중치 부여 정보를 사용하여 보상 처리 후의 참조 화상에 대해 가중치 부여 예측을 행하여, 예측 화상을 생성한다. 움직임 보상부(323)는 예측 화상을 스위치(147)에 공급한다.
(가중 버퍼와 가중 설정부의 구성예)
도 60은 도 59의 가중 버퍼(321)와 가중 설정부(322)의 구성예를 도시하는 블록도이다.
도 60의 가중 버퍼(321)는 정보 버퍼(341)와 플래그 버퍼(342)에 의해 구성된다.
가중 버퍼(321)의 정보 버퍼(341)는 도 57의 베이스 복호부(282)로부터 공급되는 베이스 스트림의 슬라이스 헤더에 포함되는 가중치 부여 정보를 기억한다. 플래그 버퍼(342)는 베이스 복호부(282)로부터 공급되는 베이스 스트림의 PPS에 포함되는 플래그(weighted_bipred_flag)와 플래그(weighted_pred_flag)를 기억한다.
도 60의 가중 설정부(322)는 제어부(351), 모드 버퍼(352), 정보 버퍼(353) 및 생성부(354)에 의해 구성된다.
가중 설정부(322)의 제어부(351)는 플래그 버퍼(342)로부터 플래그(weighted_pred_flag)와 플래그(weighted_bipred_flag)를 판독한다. 가중 설정부(322)는 플래그(weighted_pred_flag), 플래그(weighted_bipred_flag) 및 현재의 복호 대상의 화상의 슬라이스의 종류에 기초하여, 움직임 보상부(323)에 가중치 부여 예측을 지시한다.
모드 버퍼(352)는 도 59의 가역 복호부(320)로부터 공급되는 가중치 부여 생성 정보 중 가중치 부여 정보의 예측 모드를 취득하여, 기억한다. 정보 버퍼(353)는 가역 복호부(320)로부터 공급되는 가중치 부여 생성 정보 중 가중치 부여 정보 또는 가중치 부여 정보의 차분을 취득하여, 기억한다.
생성부(354)는 모드 버퍼(352)로부터 가중치 부여 정보의 예측 모드를 판독한다. 생성부(354)는 가중치 부여 정보의 예측 모드가 카피 모드 또는 차분 예측 모드인 경우, 정보 버퍼(341)로부터 베이스 화상의 가중치 부여 정보를 판독한다. 가중치 부여 정보의 예측 모드가 카피 모드인 경우, 생성부(354)는 베이스 화상의 가중치 부여 정보를 인핸스먼트 화상의 가중치 부여 정보로서 생성한다.
한편, 가중치 부여 정보의 예측 모드가 차분 예측 모드인 경우, 생성부(354)는 정보 버퍼(353)로부터 가중치 부여 정보의 차분을 판독한다. 생성부(354)는 가중치 부여 정보의 차분과 베이스 화상의 가중치 부여 정보를 가산하고, 그 결과 얻어지는 가산값을 인핸스먼트 화상의 가중치 부여 정보로서 생성한다.
또한, 가중치 부여 정보의 예측 모드가 비예측 모드인 경우, 생성부(354)는 정보 버퍼(353)로부터 가중치 부여 정보를 판독하고, 그 가중치 부여 정보를 인핸스먼트 화상의 가중치 부여 정보로서 생성한다. 생성부(354)는 생성된 인핸스먼트 화상의 가중치 부여 정보를 움직임 보상부(323)에 공급한다.
(복호 장치의 처리의 설명)
도 61은 도 57의 복호 장치(280)의 계층 복호 처리를 설명하는 흐름도이다.
도 61의 스텝 S280에 있어서, 복호 장치(280)의 수취부(91)는 도 39의 부호화 장치(180)로부터 전송되어 오는 전체 계층의 부호화 스트림을 수취하여, 분리부(281)에 공급한다.
스텝 S281에 있어서, 분리부(281)는 전체 계층의 부호화 스트림으로부터 베이스 스트림과 인핸스먼트 스트림을 분리한다. 분리부(281)는 베이스 스트림을 베이스 복호부(282)에 공급하고, 인핸스먼트 스트림을 인핸스먼트 복호부(283)에 공급한다.
스텝 S282에 있어서, 베이스 복호부(282)는 분리부(281)로부터 공급되는 베이스 스트림을 HEVC 방식으로 복호하여, 베이스 화상을 생성한다. 이때, 베이스 복호부(282)는 베이스 화상의 복호 시에 사용된 가중치 부여 정보 및 베이스 스트림의 PPS에 포함되는 플래그(weighted_bipred_flag) 및 플래그(weighted_pred_flag)를 인핸스먼트 복호부(283)에 공급한다. 베이스 복호부(282)는 생성된 베이스 화상을 출력한다.
스텝 S283에 있어서, 인핸스먼트 복호부(283)는 베이스 복호부(282)로부터 공급되는 가중치 부여 정보, 플래그(weighted_bipred_flag) 및 플래그(weighted_pred_flag)를 참조하여, 인핸스먼트 화상 생성 처리를 행한다. 이 인핸스먼트 화상 생성 처리는 도 34의 스텝 S112의 복호 처리를 제외하고 도 34의 인핸스먼트 화상 생성 처리와 마찬가지이므로, 이하에는 복호 처리에 대해서만 설명한다.
도 62는 도 59의 복호부(302)의 복호 처리의 상세를 설명하는 흐름도이다.
도 62의 스텝 S301에 있어서, 인핸스먼트 복호부(283)의 축적 버퍼(131)는 도 58의 추출부(301)로부터 프레임 단위의 부호화 데이터를 수취하여, 축적한다. 축적 버퍼(131)는 축적되어 있는 부호화 데이터를 가역 복호부(320)에 공급한다.
스텝 S302에 있어서, 가역 복호부(320)는 축적 버퍼(131)로부터의 부호화 데이터를 가역 복호하여, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(320)는 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(320)는 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보, 참조 화상 특정 정보 등을 움직임 보상부(323)에 공급한다.
또한, 가역 복호부(320)는 부호화 정보로서의 가중치 부여 생성 정보를 가중 설정부(322)에 공급한다. 또한, 가역 복호부(320)는 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(147)에 공급한다. 가역 복호부(320)는 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
스텝 S303 및 S304의 처리는 도 35의 스텝 S133 및 S134의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S305에 있어서, 가중 버퍼(321)의 정보 버퍼(341)(도 60)는 도 57의 베이스 복호부(282)로부터 공급되는 베이스 화상의 가중치 부여 정보를 기억하고, 플래그 버퍼(342)는 플래그(weighted_bipred_flag)와 플래그(weighted_pred_flag)를 기억한다.
스텝 S306에 있어서, 제어부(351)는 플래그 버퍼(342)에 기억되어 있는 플래그(weighted_bipred_flag) 및 플래그(weighted_pred_flag) 및 현재의 복호 대상의 화상의 슬라이스의 종류에 기초하여, 가중치 부여 예측을 행할지 여부를 판정한다.
스텝 S306에서 가중치 부여 예측을 행한다고 판정된 경우, 제어부(351)는 움직임 보상부(323)에 가중치 부여 예측을 지시하고, 처리를 스텝 S307로 진행시킨다. 스텝 S307에 있어서, 가중 설정부(322)는 가역 복호부(320)로부터 공급되는 가중치 부여 생성 정보, 가중 버퍼(321)에 기억되어 있는 베이스 화상의 가중치 부여 정보 등에 기초하여, 인핸스먼트 화상의 가중치 부여 정보를 생성하는 생성 처리를 행한다. 이 생성 처리의 상세는 후술하는 도 63을 참조하여 설명한다.
스텝 S308에 있어서, 움직임 보상부(323)는 가역 복호부(320)로부터 공급되는 참조 화상 특정 정보에 기초하여 참조 화상을 판독하고, 움직임 벡터, 참조 화상 및 가중 설정부(322)로부터의 가중치 부여 정보를 사용하여, 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 가중치 부여 예측을 사용한 움직임 보상 처리를 행한다. 움직임 보상부(146)는 그 결과 생성되는 예측 화상을, 스위치(147)를 통해 가산부(135)에 공급하고, 처리를 스텝 S311로 진행시킨다.
한편, 스텝 S306에서 가중치 부여 예측을 행하지 않는다고 판정된 경우, 스텝 S309에 있어서, 움직임 보상부(323)는 가역 복호부(320)로부터 공급되는 참조 화상 특정 정보에 기초하여 참조 화상을 판독하고, 움직임 벡터와 참조 화상을 사용하여, 인터 예측 모드 정보가 나타내는 최적 인터 예측 모드의 움직임 보상 처리를 행한다. 움직임 보상부(146)는 그 결과 생성되는 예측 화상을, 스위치(147)를 통해 가산부(135)에 공급하고, 처리를 스텝 S311로 진행시킨다.
스텝 S310 내지 S318의 처리는 도 35의 스텝 S138 내지 S146의 처리와 마찬가지이므로, 설명은 생략한다.
도 63은 도 62의 스텝 S307의 생성 처리의 상세를 설명하는 흐름도이다.
도 63의 스텝 S330에 있어서, 가중 설정부(322)의 모드 버퍼(352)는 도 59의 가역 복호부(320)로부터 공급되는 가중치 부여 생성 정보 중 가중치 부여 정보의 예측 모드를 취득하여, 기억한다.
스텝 S331에 있어서, 생성부(354)는 모드 버퍼(352)에 기억되어 있는 가중치 부여 정보의 예측 모드가 비예측 모드인지 여부를 판정한다.
스텝 S331에서 가중치 부여 정보의 예측 모드가 비예측 모드가 아니라고 판정된 경우, 즉 가중치 부여 정보의 예측 모드가 카피 모드 또는 차분 예측 모드인 경우, 처리는 스텝 S332로 진행된다. 스텝 S332에 있어서, 정보 버퍼(341)로부터 베이스 화상의 가중치 부여 정보를 판독한다.
스텝 S333에 있어서, 생성부(354)는 가중치 부여 정보의 예측 모드가 카피 모드인지 여부를 판정한다. 스텝 S333에서 가중치 부여 정보의 예측 모드가 카피 모드라고 판정된 경우, 스텝 S334에 있어서, 생성부(354)는 베이스 화상의 가중치 부여 정보를 인핸스먼트 화상의 가중치 부여 정보로서 생성하여, 움직임 보상부(323)에 공급한다. 그리고, 생성 처리는 종료한다.
한편, 스텝 S333에서 가중치 부여 정보의 예측 모드가 카피 모드가 아니라고 판정된 경우, 즉 가중치 부여 정보의 예측 모드가 차분 예측 모드인 경우, 처리는 스텝 S335로 진행된다. 스텝 S335에 있어서, 정보 버퍼(353)는 가역 복호부(320)로부터 공급되는 가중치 부여 생성 정보 중 가중치 부여 정보의 차분을 취득하여, 기억한다. 스텝 S336에 있어서, 생성부(354)는 정보 버퍼(353)로부터 가중치 부여 정보의 차분을 판독한다.
스텝 S337에 있어서, 생성부(354)는 가중치 부여 정보의 차분과 베이스 화상의 가중치 부여 정보를 가산하여, 그 결과 얻어지는 가산값을 인핸스먼트 화상의 가중치 부여 정보로서 생성한다. 생성부(354)는 생성된 인핸스먼트 화상의 가중치 부여 정보를 움직임 보상부(323)에 공급하고, 생성 처리를 종료한다.
또한, 스텝 S331에서 가중치 부여 정보의 예측 모드가 비예측 모드라고 판정된 경우, 스텝 S338에 있어서, 정보 버퍼(353)는 가역 복호부(320)로부터 공급되는 가중치 부여 생성 정보 중 가중치 부여 정보를 취득하여, 기억한다. 스텝 S339에 있어서, 생성부(354)는 정보 버퍼(353)로부터 가중치 부여 정보를 판독한다.
스텝 S340에 있어서, 생성부(354)는 스텝 S339에서 판독된 가중치 부여 정보를 인핸스먼트 화상의 가중치 부여 정보로서 생성하여, 움직임 보상부(323)에 공급한다. 그리고, 생성 처리는 종료한다.
이상과 같이, 복호 장치(280)는 가중치 부여 생성 정보를 사용하여 인핸스먼트 화상의 가중치 부여 정보를 생성하므로, 베이스 레이어와 인핸스먼트 레이어 사이에서 가중치 부여 정보를 공유 또는 예측할 수 있다. 따라서, 인핸스먼트 스트림의 정보량을 삭감하여, 부호화 효율을 향상시킬 수 있다.
또한, 제2 실시 형태에 있어서도, 제1 실시 형태와 마찬가지로, VPS가, 도 23에 도시한 VPS이도록 해도 된다.
또한, 제1 실시 형태 및 제2 실시 형태에서는, 레이어수는 2인 것으로 하였지만, 레이어수는 2 이상이어도 된다. 또한, 참조 레이어는 픽처 단위로 설정되어도 되고, GOP 단위로 설정되어도 된다. 이는, 후술하는 제3 및 제4 실시 형태에 있어서도 마찬가지이다.
또한, 제1 실시 형태 및 제2 실시 형태에서는 베이스 화상이 HEVC 방식으로 부호화되었지만, AVC 방식으로 부호화되도록 해도 된다. 이 경우, 제2 실시 형태에서는 수학식 5 내지 수학식 8에 의해, 베이스 화상의 AVC 방식에 있어서의 가중치 부여 정보에 관한 정보(pred_weight_table)가, HEVC 방식에 있어서의 가중치 부여 정보에 관한 정보(pred_weight_table)로 변환되어 사용된다.
<제3 실시 형태>
(제3 실시 형태의 개요의 설명)
도 64는 본 기술을 적용한 제3 실시 형태의 개요를 설명하는 도면이다.
도 64에 도시한 바와 같이, 베이스 화상(BL)과 인핸스먼트 화상(EL)의 GOP(Group of Picture) 구조는 동일한 경우가 많다. 즉, 동시각의 베이스 화상과 인핸스먼트 화상의 슬라이스 타입 및 시간 방향의 참조 관계는 통상 동일하다. 따라서, 제3 실시 형태에서는 참조 화상 특정 정보가, 다른 계층 사이에서 공유된다. 구체적으로는, 인핸스먼트 화상의 소정의 슬라이스의 참조 화상 특정 정보로서, 그 슬라이스와 코로케이티드한 베이스 화상의 슬라이스 참조 화상 특정 정보가 사용된다.
또한, 코로케이티드란, 화면 상의 위치가 대응하는 것을 의미한다. 예를 들어, 인핸스먼트 화상의 슬라이스와 코로케이티드한 베이스 화상의 슬라이스는 그 인핸스먼트 화상의 슬라이스의 선두의 LCU와 화면 상의 위치가 대응하는 베이스 화상의 LCU를 포함하는 슬라이스이다.
(부호화 장치의 제3 실시 형태의 구성예)
도 65는 본 기술을 적용한 부호화 장치의 제3 실시 형태의 구성예를 도시하는 블록도이다.
도 65에 도시하는 구성 중, 도 6의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 65의 부호화 장치(400)의 구성은 인핸스먼트 부호화부(12) 대신에 인핸스먼트 부호화부(411)가 설치되는 점이 도 6의 구성과 다르다. 부호화 장치(400)는 참조 화상 특정 정보의 모두를 베이스 화상과 인핸스먼트 화상 사이에서 공유한다.
구체적으로는, 부호화 장치(400)의 인핸스먼트 부호화부(411)에는 외부로부터 인핸스먼트 화상이 입력된다. 인핸스먼트 부호화부(411)는 인핸스먼트 화상을 HEVC 방식에 준하는 방식으로 부호화한다.
또한, 인핸스먼트 부호화부(411)는 베이스 부호화부(11)로부터 공급되는 베이스 화상의 참조 화상 특정 정보를 사용하여, 카피 플래그를 참조 화상 특정 생성 정보(참조 화상 생성 정보)로서 설정한다. 그리고, 인핸스먼트 부호화부(411)는 카피 플래그 등을 부호화 결과에 부가하여 부호화 데이터를 생성한다. 또한, 카피 플래그란, 베이스 화상의 참조 화상 특정 정보의 모두를 인핸스먼트 화상의 참조 화상 특정 정보로서 사용할지 여부를 나타내는 플래그이다.
인핸스먼트 부호화부(411)는 부호화 데이터, SPS, PPS 등을 포함하는 부호화 스트림을, 인핸스먼트 스트림으로서 합성부(13)에 공급한다.
또한, 여기서는, 부호화 장치(400)는 전체 계층의 부호화 스트림을 전송하는 것으로 하지만, 필요에 따라서, 베이스 스트림만을 전송할 수도 있다.
(인핸스먼트 부호화부의 구성예)
도 66은 도 65의 인핸스먼트 부호화부(411)의 구성예를 도시하는 블록도이다.
도 66의 인핸스먼트 부호화부(411)는 설정부(431)와 부호화부(432)에 의해 구성된다.
인핸스먼트 부호화부(411)의 설정부(431)는 필요에 따라서, 카피 플래그를 포함하는 SPS, PPS 등의 파라미터 세트를 설정한다. 설정부(431)는 설정된 파라미터 세트를 부호화부(432)에 공급한다.
부호화부(432)는 외부로부터 입력되는 프레임 단위의 인핸스먼트 화상을 입력 신호로 하고, HEVC 방식에 준하는 방식으로 부호화한다. 또한, 부호화부(432)는 부호화 시에 사용된 참조 화상 특정 정보와, 베이스 부호화부(11)로부터의 참조 화상 특정 정보에 기초하여, 카피 플래그를 설정한다.
부호화부(432)는 설정된 카피 플래그와 설정부(431)로부터 공급되는 SPS에 포함되는 카피 플래그에 기초하여, 부호화 결과에 카피 플래그 등을 부가하여, 부호화 데이터를 생성한다. 그리고, 부호화부(432)는 부호화 데이터와 설정부(431)로부터 공급되는 파라미터 세트로부터 인핸스먼트 스트림을 생성하여, 도 65의 합성부(13)에 공급한다.
(부호화부의 구성예)
도 67은 도 66의 부호화부(432)의 구성예를 도시하는 블록도이다.
도 67에 도시하는 구성 중, 도 14의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 67의 부호화부(432)의 구성은 가역 부호화부(36), 축적 버퍼(37), 참조 화상 설정부(50) 대신에, 가역 부호화부(451), 축적 버퍼(452), 참조 화상 설정부(453)가 설치되는 점이 도 14의 구성과 다르다.
가역 부호화부(451)는 인트라 예측 모드 정보를 인트라 예측부(46)로부터 취득한다. 또한, 가역 부호화부(451)는 움직임 예측ㆍ보상부(47)로부터 공급되는 인터 예측 모드 정보와 움직임 벡터 등을 움직임 예측ㆍ보상부(47)로부터 취득한다. 또한, 가역 부호화부(451)는 RPS 플래그, 카피 플래그 등을 참조 화상 설정부(453)로부터 취득한다. 또한, 가역 부호화부(451)는 적응 오프셋 필터(42)로부터 오프셋 필터 정보를 취득하고, 적응 루프 필터(43)로부터 필터 계수를 취득한다.
가역 부호화부(451)는 양자화부(35)로부터 공급되는 양자화된 계수에 대해 가역 부호화를 행한다. 또한, 가역 부호화부(451)는 인트라 예측 모드 정보, 또는 인터 예측 모드 정보, 움직임 벡터, RPS 플래그 및 카피 플래그, 오프셋 필터 정보 및 필터 계수를, 부호화 정보로서 가역 부호화한다. 가역 부호화부(451)는 가역 부호화된 부호화 정보를 가역 부호화된 계수에 부가하여, 부호화 데이터로 한다. 가역 부호화부(451)는 부호화 데이터를 축적 버퍼(452)에 공급하여, 축적시킨다.
축적 버퍼(452)는 가역 부호화부(451)로부터 공급되는 부호화 데이터를, 일시적으로 기억한다. 또한, 축적 버퍼(452)는 기억하고 있는 부호화 데이터를, 도 66의 설정부(431)로부터 공급되는 파라미터 세트와 함께, 인핸스먼트 스트림으로서 합성부(13)(도 65)에 공급한다.
참조 화상 설정부(453)는 움직임 예측ㆍ보상부(47)로부터 공급되는 참조 화상 특정 정보와, 참조 버퍼(49)에 기억되어 있는 참조 화상 특정 정보를 비교하여 카피 플래그를 설정한다. 그리고, 참조 화상 설정부(453)는 설정된 카피 플래그가 설정부(431)로부터 공급되는 SPS에 포함되는 카피 플래그와 다른 경우, 설정된 카피 플래그를 가역 부호화부(451)에 공급한다.
또한, 참조 화상 설정부(453)는 설정된 카피 플래그에 기초하여, 움직임 예측ㆍ보상부(47)로부터 공급되는 참조 화상 특정 정보와 SPS에 포함되는 참조 화상 특정 정보를 비교하여 RPS 플래그를 설정하여, 가역 부호화부(451)에 공급한다. 또한, 참조 화상 설정부(453)는 RPS 플래그에 기초하여, 움직임 예측ㆍ보상부(47)로부터 공급되는 참조 화상 특정 정보를 가역 부호화부(451)에 공급하거나, 그 참조 화상 특정 정보와 동일한 SPS에 포함되는 참조 화상 특정 정보를 특정하는 인덱스를 가역 부호화부(451)에 공급한다.
(인핸스먼트 스트림의 SPS의 신택스의 제1 예)
도 68은 도 66의 설정부(431)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 68의 3행째에 도시한 바와 같이, 인핸스먼트 스트림의 SPS에는 카피 플래그(inter_layer_copy_flag)가 설정된다. 카피 플래그는 베이스 화상의 참조 화상 특정 정보를 인핸스먼트 화상의 참조 화상 특정 정보로서 사용하는 것을 나타내는 경우 1이고, 베이스 화상의 참조 화상 특정 정보를 인핸스먼트 화상의 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 경우 0이다.
또한, 도 68의 4 내지 14행째에 도시한 바와 같이, 카피 플래그가 0인 경우, 베이스 스트림의 SPS와 마찬가지로, RPS에 관한 정보와 long term의 참조 화상 특정 정보에 관한 정보가 설정된다.
(인핸스먼트 스트림의 슬라이스 헤더의 신택스의 제1 예)
도 69는 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 69의 5행째에 도시한 바와 같이, 인핸스먼트 스트림의 슬라이스 헤더에는 대응하는 슬라이스의 카피 플래그가 SPS에 포함되는 카피 플래그와 다른 경우, 카피 플래그가 설정된다. 또한, 6 내지 15행째에 도시한 바와 같이, 대응하는 슬라이스의 카피 플래그가 0인 경우, 베이스 스트림의 슬라이스 헤더와 마찬가지로, RPS 플래그와 RPS 또는 RPS의 인덱스가 설정되고, long term 플래그에 따라서 long term의 참조 화상 특정 정보가 설정된다.
(효과의 설명)
도 70은 부호화 장치(400)에 있어서의 효과를 설명하는 도면이다.
상술한 바와 같이, 부호화 장치(400)에서는 카피 플래그가 SPS로 설정되어, 각 슬라이스의 카피 플래그가 SPS의 카피 플래그와 다른 경우, 그 슬라이스의 슬라이스 헤더에 카피 플래그가 설정된다. 따라서, 후술하는 복호 장치는 슬라이스 헤더에 카피 플래그가 포함되는 경우에만 카피 플래그를 갱신하면 되므로, 카피 플래그를 사용한 참조 화상 특정 정보의 인식 처리를 용이하게 행할 수 있다.
이에 대해, Do-Kyoung Kwon, Madhukar Budagavi, Minhua Zhou, "Interlayer slice header syntax element prediction in SHVC", JCTVC-L0231, 2013.1.14-1.23에서는 SPS에 카피 플래그를 설정하지 않고, 도 70의 5행째에 도시한 바와 같이, 각 슬라이스 헤더에 항상 카피 플래그(inter_layer_rps_prediction_flag)를 설정하는 것이 제안되어 있다. 이 경우, 복호 장치는 슬라이스 단위로 카피 플래그를 갱신할 필요가 있으므로, 카피 플래그를 사용한 참조 화상 특정 정보의 인식 처리가 복잡해진다.
(부호화 장치의 처리의 제1 예의 설명)
도 71은 도 65의 부호화 장치(400)의 계층 부호화 처리를 설명하는 흐름도이다.
도 71의 스텝 S361에 있어서, 부호화 장치(400)의 베이스 부호화부(11)는 외부로부터 입력된 베이스 화상을 HEVC 방식으로 부호화하고, 파라미터 세트를 부가함으로써 베이스 스트림을 생성한다. 그리고, 베이스 부호화부(11)는 베이스 스트림을 합성부(13)에 공급한다.
스텝 S362에 있어서, 베이스 부호화부(11)는 베이스 화상의 참조 화상 특정 정보를 인핸스먼트 부호화부(411)에 출력한다.
스텝 S363에 있어서, 인핸스먼트 부호화부(411)의 설정부(431)(도 66)는 인핸스먼트 화상의 파라미터 세트를 설정한다. 스텝 S364에 있어서, 부호화부(432)는 외부로부터 입력된 인핸스먼트 화상을 부호화하는 인핸스먼트 부호화 처리를 행한다.
이 인핸스먼트 부호화 처리는 도 26의 스텝 S38의 생성 처리 대신에, 카피 플래그 등을 설정하는 카피 플래그 설정 처리를 행하는 점 및 도 27의 스텝 S54의 처리가 행해지지 않은 점을 제외하고, 도 26 및 도 27의 부호화 처리와 마찬가지이다. 따라서, 카피 플래그 설정 처리에 대해서만, 후술하는 도 73을 참조하여 상세하게 설명한다.
스텝 S365에 있어서, 부호화부(432)의 축적 버퍼(452)(도 67)는 스텝 S364에서 생성된 부호화 데이터와, 설정부(431)로부터 공급되는 파라미터 세트로부터 인핸스먼트 스트림을 생성하여, 합성부(13)에 출력한다.
스텝 S366에 있어서, 합성부(13)는 베이스 부호화부(11)로부터 공급되는 베이스 스트림과 인핸스먼트 부호화부(411)로부터 공급되는 인핸스먼트 스트림을 합성하여, VPS 등을 부가하고, 전체 계층의 부호화 스트림을 생성한다. 합성부(13)는 전체 계층의 부호화 스트림을 전송부(14)에 공급한다.
스텝 S367에 있어서, 전송부(14)는 합성부(13)로부터 공급되는 전체 계층의 부호화 스트림을 후술하는 복호 장치에 전송하고, 처리를 종료한다.
도 72는 도 71의 스텝 S363의 처리 중 SPS를 설정하는 SPS 설정 처리의 상세를 설명하는 흐름도이다.
도 72의 스텝 S381에 있어서, 설정부(431)는 카피 플래그를 SPS로 설정한다. 스텝 S382에 있어서, 설정부(431)는 SPS로 설정된 카피 플래그가 1인지 여부를 판정한다.
스텝 S382에서 카피 플래그가 1이 아니라고 판정된 경우, 즉 카피 플래그가 0인 경우, 스텝 S383에 있어서, 설정부(431)는 RPS를 SPS로 설정한다.
스텝 S384에 있어서, 설정부(431)는 long term 플래그를 SPS로 설정한다. 스텝 S385에 있어서, 설정부(431)는 SPS로 설정된 long term 플래그가 1인지 여부를 판정한다. 스텝 S385에서 long term 플래그가 1이라고 판정된 경우, 스텝 S386에 있어서, 설정부(431)는 long term의 참조 화상 특정 정보를 설정하고, 처리를 종료한다.
한편, 스텝 S382에서 카피 플래그가 1이라고 판정된 경우, 또는 스텝 S385에서 long term 플래그가 1이 아니라고 판정된 경우, 처리는 종료한다.
도 73은 도 71의 스텝 S364의 인핸스먼트 부호화 처리에 있어서의 카피 플래그 설정 처리의 상세를 설명하는 흐름도이다. 이 카피 플래그 설정 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 73의 스텝 S390에 있어서, 도 67의 참조 화상 설정부(453)는 움직임 예측ㆍ보상부(47)로부터 인핸스먼트 화상의 참조 화상 특정 정보를 취득한다. 스텝 S391에 있어서, 참조 화상 설정부(453)는 참조 버퍼(49)로부터 베이스 화상의 참조 화상 특정 정보를 판독한다.
스텝 S392에 있어서, 참조 화상 설정부(453)는 인핸스먼트 화상의 참조 화상 특정 정보가 베이스 화상의 참조 화상 특정 정보와 동일한지 여부를 판정한다. 스텝 S392에서 인핸스먼트 화상과 베이스 화상의 참조 화상 특정 정보가 동일하다고 판정된 경우, 스텝 S393에 있어서, 참조 화상 설정부(453)는 카피 플래그를 1로 설정한다.
스텝 S394에 있어서, 참조 화상 설정부(453)는 도 66의 설정부(431)로부터 공급되는 SPS의 카피 플래그가 1인지 여부를 판정한다. 스텝 S394에서 카피 플래그가 1이라고 판정된 경우, 처리는 종료한다.
한편, 스텝 S394에서 카피 플래그가 1이 아니라고 판정된 경우, 참조 화상 설정부(453)는 설정된 카피 플래그를 가역 부호화부(451)에 공급하고, 처리를 종료한다.
한편, 스텝 S392에서 인핸스먼트 화상과 베이스 화상의 참조 화상 특정 정보가 동일하지 않다고 판정된 경우, 스텝 S396에 있어서, 참조 화상 설정부(453)는 카피 플래그를 0으로 설정한다. 스텝 S397에 있어서, 참조 화상 설정부(453)는 설정부(431)로부터 공급되는 SPS의 카피 플래그가 1인지 여부를 판정한다.
스텝 S397에서 SPS의 카피 플래그가 1이라고 판정된 경우, 스텝 S398에 있어서, 참조 화상 설정부(453)는 설정된 카피 플래그를 가역 부호화부(451)에 공급하고, 처리를 스텝 S399로 진행시킨다.
한편, 스텝 S397에서 SPS의 카피 플래그가 1이 아니라고 판정된 경우, 즉 SPS의 카피 플래그가, 설정된 카피 플래그와 동일한 0인 경우, 스텝 S398의 처리는 스킵하고, 처리는 스텝 S399로 진행된다.
스텝 S399에 있어서, 참조 화상 설정부(453)는 움직임 예측ㆍ보상부(47)로부터 공급되는 참조 화상 특정 정보 중 RPS가 SPS의 RPS와 동일한지 여부를 판정한다. 스텝 S399에서 움직임 예측ㆍ보상부(47)로부터의 RPS가 SPS의 RPS와 동일하다고 판정된 경우, 스텝 S400에 있어서, 참조 화상 설정부(453)는 RPS 플래그를 1로 설정한다.
스텝 S401에 있어서, 참조 화상 설정부(453)는 움직임 예측ㆍ보상부(47)로부터의 RPS와 동일한 SPS의 RPS의 인덱스를 가역 부호화부(451)에 공급하고, 처리를 스텝 S404로 진행시킨다.
한편, 스텝 S399에서 움직임 예측ㆍ보상부(47)로부터의 RPS가 SPS의 RPS와 동일하지 않다고 판정된 경우, 스텝 S402에 있어서, 참조 화상 설정부(453)는 RPS 플래그를 0으로 설정한다.
스텝 S403에 있어서, 참조 화상 설정부(453)는 움직임 예측ㆍ보상부(47)로부터의 RPS를 가역 부호화부(451)에 공급하고, 처리를 스텝 S404로 진행시킨다.
스텝 S404에 있어서, 참조 화상 설정부(453)는 SPS에 포함되는 long term 플래그가 1인지 여부를 판정한다. 스텝 S404에서 long term 플래그가 1이라고 판정된 경우, 처리는 스텝 S405로 진행된다.
스텝 S405에 있어서, 참조 화상 설정부(453)는 움직임 예측ㆍ보상부(47)로부터 공급되는 참조 화상 특정 정보 중 long term의 참조 화상 특정 정보 등을 가역 부호화부(451)에 공급한다. 구체적으로는, 참조 화상 설정부(453)는 움직임 예측ㆍ보상부(47)로부터의 long term의 참조 화상 특정 정보 중 SPS의 long term의 참조 화상 특정 정보와 다른 것과, 동일한 것의 인덱스를 가역 부호화부(451)에 공급한다. 그리고, 처리는 종료한다.
이상과 같이, 부호화 장치(400)는 카피 플래그를 설정하므로, 베이스 레이어와 인핸스먼트 레이어 사이에서 참조 화상 특정 정보를 공유할 수 있다. 따라서, 인핸스먼트 스트림의 정보량을 삭감하여, 부호화 효율을 향상시킬 수 있다.
(복호 장치의 제3 실시 형태의 구성예)
도 74는 도 65의 부호화 장치(400)로부터 전송되는 전체 계층의 부호화 스트림을 복호하는, 본 개시를 적용한 복호 장치의 제3 실시 형태의 구성예를 도시하는 블록도이다.
도 74에 도시하는 구성 중, 도 29의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 74의 복호 장치(470)의 구성은 인핸스먼트 복호부(94) 대신에 인핸스먼트 복호부(471)가 설치되는 점이, 도 29의 복호 장치(90)의 구성과 다르다.
복호 장치(470)의 인핸스먼트 복호부(471)는 분리부(92)로부터 공급되는 인핸스먼트 스트림을 HEVC 방식에 준하는 방식으로 복호하여, 인핸스먼트 화상을 생성한다. 이때, 인핸스먼트 복호부(471)는 베이스 복호부(93)로부터 공급되는 베이스 화상의 참조 화상 특정 정보와 SPS나 슬라이스 헤더에 포함되는 카피 플래그 등을 참조한다. 인핸스먼트 복호부(471)는 생성된 인핸스먼트 화상을 출력한다.
(인핸스먼트 복호부의 구성예)
도 75는 도 74의 인핸스먼트 복호부(471)의 구성예를 도시하는 블록도이다.
도 75에 도시하는 구성 중, 도 30의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 75의 인핸스먼트 복호부(471)의 구성은 복호부(112) 대신에 복호부(491)가 설치되는 점이, 도 30의 인핸스먼트 복호부(94)의 구성과 다르다.
인핸스먼트 복호부(471)의 복호부(491)는 도 74의 베이스 복호부(93)로부터의 베이스 화상의 참조 화상 특정 정보와, 추출부(111)로부터의 SPS나 슬라이스 헤더에 포함되는 카피 플래그를 참조하여, 추출부(111)로부터의 부호화 데이터를 HEVC 방식에 준하는 방식으로 복호한다. 복호부(491)는 복호의 결과 얻어지는 화상을, 인핸스먼트 화상으로서 출력한다.
(복호부의 구성예)
도 76은 도 75의 복호부(491)의 구성예를 도시하는 블록도이다.
도 76에 도시하는 구성 중, 도 31의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 76의 복호부(491)의 구성은 가역 복호부(132) 대신에 가역 복호부(511)가 설치되는 점 및 참조 화상 설정부(145) 대신에 참조 화상 설정부(512)가 설치되는 점이 도 31의 복호부(112)의 구성과 다르다.
복호부(491)의 가역 복호부(511)는 축적 버퍼(131)로부터의 부호화 데이터에 대해 가역 복호를 실시함으로써, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(511)는 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(511)는 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보 등을 움직임 보상부(146)에 공급한다.
또한, 가역 복호부(511)는 부호화 정보로서의 카피 플래그, RPS 플래그, 참조 화상 특정 정보, RPS의 인덱스 등을 참조 화상 설정부(512)에 공급한다. 또한, 가역 복호부(511)는 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(147)에 공급한다. 가역 복호부(511)는 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
참조 화상 설정부(512)는 도 75의 추출부(111)로부터 공급되는 SPS에 포함되는 카피 플래그와 참조 화상 특정 정보를 유지한다. 참조 화상 설정부(512)는 가역 복호부(511)로부터 카피 플래그, 참조 화상 특정 정보가 공급되었을 때, 유지하고 있는 카피 플래그, 참조 화상 특정 정보를 갱신한다.
그리고, 참조 화상 설정부(512)는 유지하고 있는 카피 플래그에 기초하여, 참조 버퍼(144)로부터 베이스 화상의 참조 화상 특정 정보를 판독하고, 처리 대상의 슬라이스의 참조 화상 특정 정보로 결정한다. 또한, 참조 화상 설정부(512)는 카피 플래그와 가역 복호부(511)로부터의 RPS 플래그에 기초하여, 갱신 후의 참조 화상 특정 정보, 또는 유지하고 있는 가역 복호부(511)로부터의 인덱스의 참조 화상 특정 정보를, 처리 대상의 슬라이스의 참조 화상 특정 정보로 결정한다.
(복호 장치의 처리의 제1 예의 설명)
도 74의 복호 장치(470)의 계층 복호 처리는 도 33의 스텝 S106의 인핸스먼트 화상 생성 처리를 제외하고 도 33의 계층 복호 처리와 마찬가지이다. 따라서, 이하에는, 인핸스먼트 화상 생성 처리에 대해서만 설명한다.
도 77은 도 74의 인핸스먼트 복호부(471)의 인핸스먼트 화상 생성 처리를 설명하는 흐름도이다.
도 77의 스텝 S431에 있어서, 인핸스먼트 복호부(471)의 추출부(111)는 도 74의 분리부(92)로부터 공급되는 인핸스먼트 스트림으로부터, SPS, PPS 등의 파라미터 세트와 부호화 데이터를 추출하여, 복호부(491)에 공급한다.
스텝 S432에 있어서, 복호부(491)의 참조 화상 설정부(512)는 추출부(111)로부터 공급되는 SPS로부터 카피 플래그 등을 추출하는 SPS 추출 처리를 행한다. 이 SPS 추출 처리의 상세는 후술하는 도 78을 참조하여 설명한다.
스텝 S433에 있어서, 복호부(491)는 SPS나 슬라이스 헤더에 포함되는 카피 플래그, 베이스 복호부(93)로부터의 참조 화상 특정 정보 등을 참조하여, 추출부(111)로부터의 부호화 데이터를 HEVC 방식에 준하는 방식으로 복호하는 인핸스먼트 복호 처리를 행한다. 이 인핸스먼트 복호 처리는 도 35의 스텝 S136의 생성 처리를 제외하고 도 35의 복호 처리와 마찬가지이다. 따라서, 이하에는 생성 처리에 대해서만, 후술하는 도 79를 참조하여 상세하게 설명한다.
도 78은 도 77의 스텝 S432의 SPS 추출 처리의 상세를 설명하는 흐름도이다.
도 78의 스텝 S451에 있어서, 참조 화상 설정부(512)는 추출부(111)로부터 공급되는 SPS로부터 카피 플래그를 추출하여, 유지한다. 스텝 S452에 있어서, 참조 화상 설정부(512)는 추출된 카피 플래그가 1인지 여부를 판정한다.
스텝 S452에서 카피 플래그가 1이 아니라고 판정된 경우, 즉 카피 플래그가 0인 경우, 스텝 S453에 있어서, 참조 화상 설정부(512)는 SPS로부터 RPS를 추출하여, 유지한다. 스텝 S454에 있어서, 참조 화상 설정부(512)는 SPS로부터 long term 플래그를 추출한다.
스텝 S455에 있어서, 참조 화상 설정부(512)는 long term 플래그가 1인지 여부를 판정하여, 1이라고 판정한 경우, 처리를 스텝 S456으로 진행시킨다. 스텝 S456에 있어서, 참조 화상 설정부(512)는 SPS로부터 long term의 참조 화상 특정 정보를 추출하여, 유지한다. 그리고, 처리는 도 77의 스텝 S432로 돌아가고, 스텝 S433으로 진행된다.
한편, 스텝 S452에서 카피 플래그가 1이라고 판정된 경우, 또는 스텝 S455에서 long term 플래그가 1이 아니라고 판정된 경우, 처리는 도 77의 스텝 S432로 돌아가고, 스텝 S433으로 진행된다.
도 79는 도 77의 스텝 S433의 인핸스먼트 복호 처리에 있어서의 생성 처리의 상세를 설명하는 흐름도이다. 이 생성 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 79의 스텝 S471에 있어서, 참조 화상 설정부(512)는 가역 복호부(511)로부터 카피 플래그가 공급되었는지 여부를 판정한다. 스텝 S471에서 카피 플래그가 공급되었다고 판정된 경우, 스텝 S472에 있어서, 참조 화상 설정부(512)는 유지하고 있는 SPS에 포함되는 카피 플래그를, 가역 복호부(511)로부터의 카피 플래그로 갱신한다. 그리고, 처리는 스텝 S473으로 진행된다.
한편, 스텝 S471에서 카피 플래그가 공급되어 있지 않다고 판정된 경우, 처리는 스텝 S473으로 진행된다.
스텝 S473에 있어서, 참조 화상 설정부(512)는 유지되어 있는 카피 플래그가 1인지 여부를 판정하여, 카피 플래그가 1이라고 판정한 경우, 처리를 스텝 S474로 진행시킨다.
스텝 S474에 있어서, 참조 화상 설정부(512)는 참조 버퍼(144)로부터 베이스 화상의 참조 화상 특정 정보를 판독한다. 스텝 S475에 있어서, 참조 화상 설정부(512)는 베이스 화상의 참조 화상 특정 정보를 처리 대상의 슬라이스의 참조 화상 특정 정보로 결정한다. 그리고, 참조 화상 설정부(512)는 결정된 참조 화상 특정 정보를 움직임 보상부(146)에 공급하고, 처리를 종료한다.
한편, 스텝 S473에서 카피 플래그가 1이 아니라고 판정된 경우, 즉 카피 플래그가 0인 경우, 처리는 스텝 S476으로 진행된다. 스텝 S476에 있어서, 참조 화상 설정부(512)는 RPS 플래그가 1인지 여부를 판정한다. 스텝 S476에서 RPS 플래그가 1이라고 판정된 경우, 스텝 S477에 있어서, 참조 화상 설정부(512)는 가역 복호부(511)로부터 공급되는 참조 화상 특정 정보의 인덱스를 취득한다.
스텝 S478에 있어서, 참조 화상 설정부(512)는 유지하고 있는 SPS에 포함되는 참조 화상 특정 정보 중 취득된 인덱스가 부여된 참조 화상 특정 정보를 처리 대상의 슬라이스의 참조 화상 특정 정보로 결정하여, 움직임 보상부(146)에 공급한다.
또한, 이때, SPS에 포함되는 long term 플래그가 1인 경우에는, 가역 복호부(511)로부터 공급되는 long term의 참조 화상 특정 정보도, 처리 대상의 슬라이스의 참조 화상 특정 정보로서 결정되어, 움직임 보상부(146)에 공급된다. 스텝 S478의 처리 후, 처리는 종료한다.
한편, 스텝 S476에서 RPS 플래그가 1이 아니라고 판정된 경우, 스텝 S479에 있어서, 참조 화상 설정부(512)는 가역 복호부(511)로부터 공급되는 참조 화상 특정 정보를 취득한다. 그리고, 참조 화상 설정부(512)는 이 참조 화상 특정 정보로, 유지하고 있는 SPS에 포함되는 참조 화상 특정 정보를 갱신한다.
스텝 S480에 있어서, 참조 화상 설정부(512)는 갱신 후의 참조 화상 특정 정보를 처리 대상의 슬라이스의 참조 화상 특정 정보로 결정하여, 움직임 보상부(146)에 공급한다. 그리고, 처리는 종료한다.
생성 처리의 종료 후, 참조 화상 설정부(512)에 유지되어 있는 카피 플래그 및 참조 화상 특정 정보는 SPS에 포함되는 카피 플래그 및 참조 화상 특정 정보로 복귀된다.
이상과 같이, 복호 장치(470)는 카피 플래그를 사용하여 인핸스먼트 화상의 참조 화상 특정 정보를 생성하므로, 베이스 레이어와 인핸스먼트 레이어 사이에서 참조 화상 특정 정보를 공유할 수 있다. 따라서, 베이스 레이어와 인핸스먼트 레이어 사이에서 참조 화상 특정 정보를 공유함으로써 부호화 효율을 향상시킨 인핸스먼트 스트림을 복호할 수 있다.
또한, 상술한 설명에서는 RPS와 long term의 참조 화상 특정 정보에 공통의 카피 플래그가 설정되었지만, 따로따로 카피 플래그가 설정되도록 할 수도 있다. 이 경우를 제3 실시 형태의 제2 예로서 이하에 설명한다. 또한, 이하에는, 제3 실시 형태의 제2 예의 경우를, 별도 카피 플래그 설정 시라고 하고, 제1 예의 경우를, 공통 카피 플래그 설정 시라고 한다.
(인핸스먼트 스트림의 SPS의 신택스의 제2 예)
도 80은 별도 카피 플래그 설정 시에 도 66의 설정부(431)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 80의 3행째에 도시한 바와 같이, SPS에는 RPS용 카피 플래그인 RPS 카피 플래그(inter_layer_short_copy_flag)가 설정된다. RPS 카피 플래그는 베이스 화상의 RPS를 인핸스먼트 화상의 RPS로서 사용하는 것을 나타내는 경우 1이고, 베이스 화상의 RPS를 인핸스먼트 화상의 RPS로서 사용하지 않는 것을 나타내는 경우 0이다.
또한, 도 80의 4 내지 8행째에 도시한 바와 같이, RPS 카피 플래그가 0인 경우, SPS에는 베이스 스트림의 SPS와 마찬가지로, RPS에 관한 정보가 설정된다.
도 80의 9행째에 도시한 바와 같이, SPS에는 long term 플래그가 설정된다. 10행째 및 11행째에 도시한 바와 같이, long term 플래그가 1인 경우, long term의 참조 화상 특정 정보용 카피 플래그인 long term 카피 플래그(inter_layer_long_copy_flag)가 설정된다.
long term 카피 플래그는 베이스 화상의 long term의 참조 화상 특정 정보를 인핸스먼트 화상의 long term의 참조 화상 특정 정보로서 사용하는 것을 나타내는 경우 1이다. 한편, 베이스 화상의 long term의 참조 화상 특정 정보를 인핸스먼트 화상의 long term의 참조 화상 특정 정보로서 사용하지 않는 것을 나타내는 경우 0이다.
도 80의 12 내지 17행째에 도시한 바와 같이, long term 카피 플래그가 0인 경우, SPS에는 long term의 참조 화상 특정 정보의 수(num_long_term_ref_pics_sps)와 long term의 참조 화상 특정 정보가 설정된다.
(인핸스먼트 스트림의 슬라이스 헤더의 신택스의 제2 예)
도 81은 별도 카피 플래그 설정 시의 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 81의 5행째에 도시한 바와 같이, 인핸스먼트 스트림의 슬라이스 헤더에는 대응하는 슬라이스의 RPS 카피 플래그가 SPS에 포함되는 RPS 카피 플래그와 다른 경우, RPS 카피 플래그가 설정된다. 또한, 도 81의 6 내지 12행째에 도시한 바와 같이, 대응하는 슬라이스의 RPS 카피 플래그가 0인 경우, 베이스 스트림의 슬라이스 헤더와 마찬가지로, RPS 플래그와, RPS 또는 RPS의 인덱스가 설정된다.
또한, 도 81의 13 내지 17행째에 도시한 바와 같이, long term 플래그가 1인 경우, 슬라이스 헤더에는 long term 카피 플래그가 설정되고, long term 카피 플래그가 0인 경우 long term의 참조 화상 특정 정보가 설정된다.
(부호화 장치의 처리의 제2 예의 설명)
별도 카피 플래그 설정 시의 계층 부호화 처리는 SPS 설정 처리와 카피 플래그 설정 처리를 제외하고, 도 71의 계층 부호화 처리와 마찬가지이다. 따라서, 이하에는 SPS 설정 처리와 카피 플래그 설정 처리에 대해서만 설명한다.
도 82는 별도 카피 플래그 설정 시의 SPS 설정 처리를 설명하는 흐름도이다.
도 82의 스텝 S501에 있어서, 설정부(431)는 RPS 카피 플래그를 SPS로 설정한다. 스텝 S502에 있어서, 설정부(431)는 SPS로 설정된 RPS 카피 플래그가 1인지 여부를 판정한다.
스텝 S502에서 RPS 카피 플래그가 1이 아니라고 판정된 경우, 즉 RPS 카피 플래그가 0인 경우, 스텝 S503에 있어서, 설정부(431)는 RPS를 SPS로 설정하고, 처리를 스텝 S504로 진행시킨다. 한편, 스텝 S502에서 RPS 카피 플래그가 1이라고 판정된 경우, 처리는 스텝 S504로 진행된다.
스텝 S504에 있어서, 설정부(431)는 long term 플래그를 SPS로 설정한다. 스텝 S505에 있어서, 설정부(431)는 SPS로 설정된 long term 플래그가 1인지 여부를 판정한다. 스텝 S505에서 long term 플래그가 1이라고 판정된 경우, 스텝 S506에 있어서, 설정부(431)는 long term 카피 플래그를 SPS로 설정한다.
스텝 S507에 있어서 SPS로 설정된 long term 카피 플래그가 1인지 여부를 판정한다. 스텝 S507에서 long term 카피 플래그가 1이 아니라고 판정된 경우, 즉 long term 카피 플래그가 0인 경우, 스텝 S508에 있어서, 설정부(431)는 long term의 참조 화상 특정 정보를 설정하고, 처리를 종료한다.
한편, 스텝 S505에서 long term 플래그가 1이 아니라고 판정된 경우, 또는 스텝 S507에서 long term 카피 플래그가 1이라고 판정된 경우, 처리는 종료한다.
도 83은 별도 카피 플래그 설정 시의 카피 플래그 설정 처리를 설명하는 흐름도이다. 이 카피 플래그 설정 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 83의 스텝 S521 및 S522의 처리는 도 73의 스텝 S390 및 S391의 처리와 마찬가지이므로, 설명은 생략한다. 또한, 스텝 S523 내지 S534의 처리는 카피 플래그가 RPS 카피 플래그를 대신하는 점 및 참조 화상 특정 정보가 RPS를 대신하는 점을 제외하고 도 73의 스텝 S392 내지 S403의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S525에서 SPS의 RPS 카피 플래그가 1이라고 판정된 경우 및 스텝 S526, S532, S534의 처리 후, 처리는 스텝 S535로 진행된다.
스텝 S535에 있어서, 도 67의 참조 화상 설정부(453)는 인핸스먼트 화상의 long term의 참조 화상 특정 정보가 베이스 화상의 long term의 참조 화상 특정 정보와 동일한지 여부를 판정한다. 스텝 S535에서 인핸스먼트 화상과 베이스 화상의 long term의 참조 화상 특정 정보가 동일하다고 판정된 경우, 스텝 S536에 있어서, 참조 화상 설정부(453)는 long term 카피 플래그를 1로 설정한다.
스텝 S537에 있어서, 참조 화상 설정부(453)는 도 66의 설정부(431)로부터 공급되는 SPS의 long term 카피 플래그가 1인지 여부를 판정한다. 스텝 S537에서 SPS의 long term 카피 플래그가 1이라고 판정된 경우, 처리는 종료한다.
한편, 스텝 S537에서 SPS의 long term 카피 플래그가 1이 아니라고 판정된 경우, 즉 SPS의 long term 카피 플래그가 0인 경우, 스텝 S538에 있어서, 참조 화상 설정부(453)는 설정된 long term 카피 플래그를 가역 부호화부(451)에 공급한다. 그리고, 처리는 종료한다.
또한, 스텝 S535에서 인핸스먼트 화상과 베이스 화상의 long term의 참조 화상 특정 정보가 동일하지 않다고 판정된 경우, 스텝 S539에 있어서, 참조 화상 설정부(453)는 long term 카피 플래그를 0으로 설정한다.
스텝 S540에 있어서, 참조 화상 설정부(453)는 SPS의 long term 카피 플래그가 1인지 여부를 판정한다. 스텝 S540에서 SPS의 long term 카피 플래그가 1이라고 판정된 경우, 스텝 S541에 있어서, 참조 화상 설정부(453)는 설정된 long term 카피 플래그를 가역 부호화부(451)에 공급하고, 처리를 스텝 S542로 진행시킨다.
한편, 스텝 S540에서 SPS의 long term 카피 플래그가 1이 아니라고 판정된 경우, 즉 SPS의 long term 카피 플래그가 0인 경우, 처리는 스텝 S542로 진행된다.
스텝 S542 및 S543의 처리는 도 73의 스텝 S404 및 S405의 처리와 마찬가지이므로, 설명은 생략한다. 스텝 S543의 처리 후, 처리는 종료한다.
(복호 장치의 처리의 제2 예의 설명)
별도 카피 플래그 설정 시의 계층 복호 처리는 SPS 추출 처리와 생성 처리를 제외하고, 공통 카피 플래그 설정 시의 계층 복호 처리와 마찬가지이다. 따라서, 이하에는 SPS 추출 처리와 생성 처리에 대해서만 설명한다.
도 84는 별도 카피 플래그 설정 시의 SPS 추출 처리를 설명하는 흐름도이다.
도 84의 스텝 S561에 있어서, 참조 화상 설정부(512)는 추출부(111)로부터 공급되는 SPS로부터 RPS 카피 플래그를 추출하여, 유지한다. 스텝 S562에 있어서, 참조 화상 설정부(512)는 추출된 RPS 카피 플래그가 1인지 여부를 판정한다.
스텝 S562에서 RPS 카피 플래그가 1이 아니라고 판정된 경우, 즉 RPS 카피 플래그가 0인 경우, 스텝 S563에 있어서, 참조 화상 설정부(512)는 SPS로부터 RPS를 추출하여, 유지한다. 그리고 처리는 스텝 S564로 진행된다.
한편, 스텝 S562에서 RPS 카피 플래그가 1이라고 판정된 경우, 처리는 스텝 S564로 진행된다.
스텝 S564에 있어서, 참조 화상 설정부(512)는 SPS로부터 long term 플래그를 추출한다.
스텝 S565에 있어서, 참조 화상 설정부(512)는 추출된 long term 플래그가 1인지 여부를 판정하여, 1이라고 판정한 경우, 처리를 스텝 S566으로 진행시킨다. 스텝 S566에 있어서, 참조 화상 설정부(512)는 SPS로부터 long term 카피 플래그를 추출하여, 유지한다.
스텝 S567에 있어서, 참조 화상 설정부(512)는 long term 카피 플래그가 1인지 여부를 판정하여, 1이 아니라고 판정한 경우, 즉 0인 경우, 처리를 스텝 S568로 진행시킨다. 스텝 S568에 있어서, 참조 화상 설정부(512)는 SPS로부터 long term의 참조 화상 특정 정보를 추출하여 유지하고, 처리를 종료한다.
한편, 스텝 S565에서 long term 플래그가 1이 아니라고 판정된 경우, 또는 스텝 S567에서 long term 카피 플래그가 1이라고 판정된 경우, 처리는 종료한다.
도 85는 별도 카피 플래그 설정 시의 생성 처리를 설명하는 흐름도이다. 이 생성 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 85의 스텝 S581에 있어서, 참조 화상 설정부(512)는 가역 복호부(511)로부터 RPS 카피 플래그가 공급되었는지 여부를 판정한다. 스텝 S581에서 RPS 카피 플래그가 공급되었다고 판정된 경우, 스텝 S582에 있어서, 참조 화상 설정부(512)는 유지하고 있는 SPS에 포함되는 RPS 카피 플래그를, 가역 복호부(511)로부터의 RPS 카피 플래그로 갱신한다. 그리고, 처리는 스텝 S583으로 진행된다.
한편, 스텝 S581에서 RPS 카피 플래그가 공급되어 있지 않다고 판정된 경우, 처리는 스텝 S583으로 진행된다.
스텝 S583에 있어서, 참조 화상 설정부(512)는 가역 복호부(511)로부터 long term 카피 플래그가 공급되었는지 여부를 판정한다. 스텝 S583에서 long term 카피 플래그가 공급되었다고 판정된 경우, 스텝 S584에 있어서, 참조 화상 설정부(512)는 유지하고 있는 SPS에 포함되는 long term 카피 플래그를, 가역 복호부(511)로부터의 long term 카피 플래그로 갱신한다. 그리고, 처리는 스텝 S585로 진행된다.
한편, 스텝 S583에서 long term 카피 플래그가 공급되어 있지 않다고 판정된 경우, 처리는 스텝 S585로 진행된다.
스텝 S585 내지 S592의 처리는 카피 플래그가 RPS 카피 플래그를 대신하는 점, 참조 화상 특정 정보가 RPS를 대신하는 점 및 처리 대상의 슬라이스의 long term의 참조 화상 특정 정보가 결정되지 않은 점을 제외하고, 도 79의 스텝 S473 내지 S480의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S587, S590 및 S592의 처리 후, 처리는 스텝 S593으로 진행된다.
스텝 S593에 있어서, 참조 화상 설정부(512)는 long term 카피 플래그가 1인지 여부를 판정한다. 스텝 S593에서 long term 카피 플래그가 1이라고 판정된 경우, 스텝 S594에 있어서, 참조 화상 설정부(512)는 참조 버퍼(144)로부터 베이스 화상의 long term의 참조 화상 특정 정보를 판독한다.
스텝 S595에 있어서, 참조 화상 설정부(512)는 베이스 화상의 long term의 참조 화상 특정 정보를 처리 대상의 슬라이스의 long term의 참조 화상 특정 정보로 결정한다. 그리고, 참조 화상 설정부(512)는 결정된 long term의 참조 화상 특정 정보를 움직임 보상부(146)에 공급하고, 처리를 종료한다.
한편, 스텝 S593에서 long term 카피 플래그가 1이 아니라고 판정된 경우, 즉 long term 카피 플래그가 0인 경우, 처리는 스텝 S596으로 진행된다. 스텝 S596에 있어서, 참조 화상 설정부(512)는 가역 복호부(511)로부터 공급되는 long term의 참조 화상 특정 정보의 인덱스를 취득한다.
스텝 S597에 있어서, 참조 화상 설정부(512)는 유지하고 있는 SPS에 포함되는 long term의 참조 화상 특정 정보 중 취득된 인덱스가 부여된 long term의 참조 화상 특정 정보를, 처리 대상의 슬라이스의 long term의 참조 화상 특정 정보로 결정한다. 또한, 참조 화상 설정부(512)는 가역 복호부(511)로부터 공급되는 long term의 참조 화상 특정 정보도 처리 대상의 슬라이스의 long term의 참조 화상 특정 정보로 결정한다. 그리고, 참조 화상 설정부(512)는 처리 대상의 슬라이스의 long term의 참조 화상 특정 정보를 움직임 보상부(146)에 공급하고, 처리를 종료한다.
생성 처리의 종료 후, 참조 화상 설정부(512)에 유지되어 있는 RPS 카피 플래그, long term 카피 플래그 및 참조 화상 특정 정보는 SPS에 포함되는 RPS 카피 플래그, long term 카피 플래그 및 참조 화상 특정 정보로 돌아간다.
이상과 같이, 별도 카피 플래그 설정 시에는, 베이스 화상의 RPS와 long term의 참조 화상 특정 정보 중 어느 한쪽만이 인핸스먼트 화상의 것으로서 사용될 때에, 그 한쪽을 중복해서 설정할 필요가 없다. 따라서, 부호화 효율이 향상된다.
여기서, 베이스 화상의 RPS와 long term의 참조 화상 특정 정보 중 어느 한쪽만이 인핸스먼트 화상의 것으로서 사용되는 경우로서는, 예를 들어 ref_idx_framework 모드로 인핸스먼트 화상의 참조 화상이 설정되는 경우가 있다. 이 경우, 베이스 화상이 인핸스먼트 화상의 long term의 참조 화상으로서 사용되므로, RPS가 베이스 화상과 인핸스먼트 화상 사이에서 동일해도, long term의 참조 화상 특정 정보는 베이스 화상과 인핸스먼트 화상 사이에서 다르다.
또한, 이 경우, 인핸스먼트 화상의 long term의 참조 화상의 수가 베이스 화상에 비해 많아지고, 프레임 메모리[44(141)]의 사이즈가 증대된다. 따라서, 그 사이즈를 억제하기 위해 인핸스먼트 화상의 long term의 참조 화상의 일부를 삭제하는 것을 생각할 수 있지만, 삭제되는 참조 화상은 고정밀도의 예측이 가능한 베이스 화상 이외의 참조 화상이다. 따라서, 이 경우에도, long term의 참조 화상 특정 정보는 베이스 화상과 인핸스먼트 화상 사이에서 다르다.
또한, 인핸스먼트 화상의 해상도가 베이스 화상의 해상도보다 크고, 프레임 메모리[44(141)]의 사이즈를 억제하기 위해, 인핸스먼트 화상의 short term 또는 long term 중 어느 한쪽의 참조 화상을 삭감하는 경우도 있다. 이 경우, short term 또는 long term 중 어느 한쪽의 참조 화상 특정 정보가, 베이스 화상과 인핸스먼트 화상 사이에서 다르다.
또한, 베이스 화상이 참조 화상으로서 사용되는 경우, 베이스 화상에 의해 고정밀도의 예측을 행할 수 있을 가능성이 높으므로, 인핸스먼트 화상의 short term 또는 long term 중 어느 한쪽의 참조 화상을 삭감함으로써, 프레임 메모리[44(141)]의 사이즈를 억제하는 경우도 있다. 이 경우, short term 또는 long term 중 어느 한쪽의 참조 화상 특정 정보가, 베이스 화상과 인핸스먼트 화상 사이에서 다르다.
상술한 바와 같이, ref_idx_framework 모드로 인핸스먼트 화상의 참조 화상이 설정되는 경우, long term의 참조 화상 특정 정보는 베이스 화상과 인핸스먼트 화상 사이에서 다르다.
따라서, RPS와 long term의 참조 화상 특정 정보로 따로따로 카피 플래그를 설정하는 것은 아니고, ref_idx_framework 모드 시에 long term의 참조 화상 특정 정보에 대한 카피 플래그를 무효로 함으로써, 카피 플래그가 0으로 되는 것에 의한 RPS의 중복 설정을 회피하도록 해도 된다. 이 경우를 제3 실시 형태의 제3 예로서 이하에 설명한다. 또한, 이하에는 제3 실시 형태의 제3 예의 경우를, 설정 모드 사용 시라고 한다.
(VPS의 신택스의 예)
도 86은 제3 실시 형태에 있어서의 VPS의 확장부(vps_extension)의 신택스의 예를 도시하는 도면이다.
또한, 제3 실시 형태에 있어서의 VPS의 VPS 확장부 이외의 신택스는 제1 및 제2 실시 형태에 있어서의 VPS와 마찬가지이다.
도 86의 4행째에 도시한 바와 같이, VPS의 확장부에는 베이스 화상의 부호화 방식이 AVC 방식인지 여부를 나타내는 AVC 플래그(avc_base_layer_flag)가 설정된다. AVC 플래그는 베이스 화상의 부호화 방식이 AVC 방식인 경우 1이고, HEVC 방식인 경우 0이다.
또한, 7행째에 도시한 바와 같이, VPS의 확장부에는 인핸스먼트 화상의 참조 화상의 설정 모드로서 사용되어 있는 scalable 기능 특유의 설정 모드의 종류를 나타내는 설정 모드 정보(scalability_mask)가 설정된다. 설치 모드 정보는, 예를 들어 인핸스먼트 화상의 참조 화상의 설정 모드로서 ref_idx_framework 모드가 사용되어 있는 경우 1이다.
이와 같이, 인핸스먼트 화상의 참조 화상의 설정 모드가 ref_idx_framework 모드인지 여부를 나타내는 정보는 설정 모드 정보로서 VPS로 설정된다. 따라서, 이 설정 모드 정보를 사용하여, long term의 참조 화상 특정 정보에 대한 카피 플래그를 무효로 할 수 있다.
(인핸스먼트 스트림의 SPS의 신택스의 제3 예)
도 87은 설정 모드 사용 시에 도 66의 설정부(431)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 87의 3행째에 도시한 바와 같이, 인핸스먼트 스트림의 SPS에는 도 68의 경우와 마찬가지로 카피 플래그(inter_layer_copy_flag)가 설정된다. 또한, 4 내지 8행째에 도시한 바와 같이, SPS에는 도 68의 경우와 마찬가지로, RPS에 관한 정보가 설정된다.
또한, 9 내지 17행째에 도시한 바와 같이, 카피 플래그가 0이거나, 또는 설정 모드 정보가 1인 경우, SPS에는 도 68의 경우와 마찬가지로 long term의 참조 화상 특정 정보에 관한 정보가 설정된다. 즉, 카피 플래그가 1이어도, 설정 모드 정보가 1인 경우에는, 카피 플래그가 무효로 되어, SPS에는 long term의 참조 화상 특정 정보에 관한 정보가 설정된다.
(인핸스먼트 스트림의 슬라이스 헤더의 신택스의 제3 예)
도 88은 설정 모드 사용 시의 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예를 도시하는 도면이다.
도 88의 5행째에 도시한 바와 같이, 인핸스먼트 스트림의 슬라이스 헤더에는 대응하는 슬라이스의 카피 플래그가 SPS에 포함되는 카피 플래그와 다른 경우, 도 69의 경우와 마찬가지로, 카피 플래그가 설정된다. 또한, 도 88의 6 내지 12행째에 도시한 바와 같이, 도 69의 경우와 마찬가지로, 대응하는 슬라이스의 카피 플래그가 0인 경우, RPS 플래그와 RPS 또는 RPS의 인덱스가 설정된다.
또한, 도 88의 13 내지 16행째에 도시한 바와 같이, long term 플래그가 1인 경우, 카피 플래그가 0이거나, 또는 설정 모드 정보가 1일 때, long term의 참조 화상 특정 정보가 설정된다.
(부호화 장치의 처리의 제3 예의 설명)
설정 모드 사용 시의 계층 부호화 처리는 SPS 설정 처리와 카피 플래그 설정 처리를 제외하고, 도 71의 계층 부호화 처리와 마찬가지이다. 따라서, 이하에는 SPS 설정 처리와 카피 플래그 설정 처리에 대해서만 설명한다.
도 89는 설정 모드 사용 시의 SPS 설정 처리를 설명하는 흐름도이다.
도 89의 스텝 S611 내지 S613의 처리는 RPS 카피 플래그가 카피 플래그를 대신하는 점을 제외하고, 도 82의 스텝 S501 내지 S503의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S613의 처리 후, 또는 스텝 S612에서 카피 플래그가 1이라고 판정된 경우, 처리는 스텝 S614로 진행된다.
스텝 S614에 있어서, 설정부(431)는 카피 플래그가 0인지, 또는 VPS로 설정된 설정 모드 정보가 1인지 여부를 판정한다.
스텝 S614에서 카피 플래그가 0이거나, 또는 설정 모드 정보가 1이라고 판정된 경우, 처리는 스텝 S615로 진행된다. 스텝 S615 내지 S617의 처리는 도 72의 스텝 S384 내지 S386의 처리와 마찬가지이므로, 설명은 생략한다.
한편, 스텝 S614에서 카피 플래그가 0이 아니고, 또한 설정 모드 정보가 1이 아니라고 판정된 경우, 즉 카피 플래그가 1이고, 또한 설정 모드 정보가 0인 경우, 처리는 종료한다.
도 90은 설정 모드 사용 시의 카피 플래그 설정 처리를 설명하는 흐름도이다. 이 카피 플래그 설정 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 90의 스텝 S631 및 S632의 처리는 도 73의 스텝 S390 및 S391의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S633에 있어서, 도 67의 참조 화상 설정부(453)는 설정부(431)로부터 공급되는 VPS로 설정되어 있는 설정 모드 정보가 1인지 여부를 판정한다. 스텝 S633에서 설정 모드 정보가 1이라고 판정된 경우, 스텝 S634에 있어서, 참조 화상 설정부(453)는 인핸스먼트 화상의 RPS가 베이스 화상의 RPS와 동일한지 여부를 판정한다.
스텝 S634에서 인핸스먼트 화상과 베이스 화상의 RPS가 동일하다고 판정된 경우, 스텝 S635에 있어서, 참조 화상 설정부(453)는 카피 플래그를 1로 설정하고, 처리를 스텝 S640으로 진행시킨다.
한편, 스텝 S634에서 인핸스먼트 화상과 베이스 화상의 RPS가 동일하지 않다고 판정된 경우, 스텝 S636에 있어서, 참조 화상 설정부(453)는 카피 플래그를 0으로 설정하고, 처리를 스텝 S640으로 진행시킨다.
또한, 스텝 S633에서 설정 모드 정보가 1이 아니라고 판정된 경우, 즉 설정 모드 정보가 0인 경우, 처리는 스텝 S637로 진행된다. 스텝 S637 내지 S639의 처리는 도 73의 스텝 S392, S393 및 S396의 처리와 마찬가지이므로, 설명은 생략한다. 스텝 S638 및 S639의 처리 후, 처리는 스텝 S640으로 진행된다.
스텝 S640에 있어서, 참조 화상 설정부(453)는 설정부(431)로부터 공급되는 SPS의 카피 플래그와 설정된 카피 플래그가 동일한지 여부를 판정한다. 스텝 S640에서 SPS의 카피 플래그와 설정된 카피 플래그가 동일하다고 판정된 경우, 처리는 스텝 S642로 진행된다.
한편, 스텝 S640에서 SPS의 카피 플래그와 설정된 카피 플래그가 동일하지 않다고 판정된 경우, 스텝 S641에 있어서, 참조 화상 설정부(453)는 설정된 카피 플래그를 가역 부호화부(451)에 공급하고, 처리를 스텝 S642로 진행시킨다.
스텝 S642에 있어서, 참조 화상 설정부(453)는 설정된 카피 플래그가 1인지 여부를 판정한다. 스텝 S642에서 설정된 카피 플래그가 1이라고 판정된 경우, 스텝 S643에 있어서, 참조 화상 설정부(453)는 설정 모드 정보가 1인지 여부를 판정한다.
스텝 S643에서 설정 모드 정보가 1이 아니라고 판정된 경우, 즉 설정 모드 정보가 0인 경우, 처리는 종료한다. 한편, 스텝 S643에서 설정 모드 정보가 1이라고 판정된 경우, 처리는 스텝 S649로 진행된다.
또한, 스텝 S642에서 설정된 카피 플래그가 1이 아니라고 판정된 경우, 즉 설정된 카피 플래그가 0인 경우, 처리는 스텝 S644로 진행된다. 스텝 S644 내지 S650의 처리는 도 73의 스텝 S399 내지 S405의 처리와 마찬가지이므로, 설명은 생략한다.
이상과 같이, 설정 모드 사용 시에는, 설정 모드 정보가 1일 때, long term의 참조 화상 특정 정보에 대한 카피 플래그가 무효로 되므로, RPS가 베이스 화상과 인핸스먼트 화상 사이에서 동일한지 여부에 의해 카피 플래그를 설정할 수 있다. 따라서, 설정 모드 정보가 1이기 때문에 long term의 참조 화상 특정 정보가 베이스 화상과 인핸스먼트 화상 사이에서 다른 경우, 카피 플래그를 1로 설정하여, RPS를 베이스 화상과 인핸스먼트 화상 사이에서 공유할 수 있다. 그 결과, 부호화 효율이 향상된다.
(복호 장치의 처리의 제3 예의 설명)
설정 모드 사용 시의 계층 복호 처리는 SPS 추출 처리와 생성 처리를 제외하고, 공통 카피 플래그 설정 시의 계층 복호 처리와 마찬가지이다. 따라서, 이하에는 SPS 추출 처리와 생성 처리에 대해서만 설명한다.
도 91은 설정 모드 사용 시의 SPS 추출 처리를 설명하는 흐름도이다.
도 91의 스텝 S671 내지 S673의 처리는 도 78의 스텝 S451 내지 S453의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S673의 처리 후, 또는 스텝 S672에서 카피 플래그가 1이라고 판정된 경우, 처리는 스텝 S674로 진행된다.
스텝 S674에 있어서, 참조 화상 설정부(512)는 추출부(111)로부터 공급되는 SPS에 포함되는 카피 플래그가 0인지, 또는 VPS에 포함되는 설정 모드 정보가 1인지 여부를 판정한다.
스텝 S674에서 카피 플래그가 0이거나, 또는 설정 모드 정보가 1이라고 판정된 경우, 처리는 스텝 S675로 진행된다. 스텝 S675 내지 S677의 처리는 도 78의 스텝 S454 내지 S456의 처리와 마찬가지이므로, 설명은 생략한다.
한편, 스텝 S674에서 카피 플래그가 0이 아니고, 또한 설정 모드 정보가 1이 아니라고 판정된 경우, 즉, 카피 플래그가 1이고, 또한 설정 모드 정보가 0인 경우, 처리는 종료한다.
도 92는 설정 모드 사용 시의 생성 처리를 설명하는 흐름도이다. 이 생성 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 92의 스텝 S691 및 S692의 처리는 도 79의 스텝 S471 및 S472의 처리와 마찬가지이므로, 설명은 생략한다. 스텝 S693 내지 S700의 처리는 RPS 카피 플래그가 카피 플래그를 대신하는 점을 제외하고, 도 85의 스텝 S585 내지 S592의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S701에 있어서, 참조 화상 설정부(512)는 분리부(92)에 의해 추출된 VPS에 포함되는 설정 모드 정보가 1인지 여부를 판정한다. 스텝 S701에서 설정 모드 정보가 1이 아니라고 판정된 경우, 즉 설정 모드 정보가 0인 경우, 처리는 스텝 S702로 진행된다.
스텝 S702 내지 S706의 처리는 long term 카피 플래그가 카피 플래그를 대신하는 점을 제외하고, 도 85의 스텝 S593 내지 S597의 처리와 마찬가지이므로, 설명은 생략한다.
한편, 스텝 S701에서 설정 모드 정보가 1이라고 판정된 경우, 처리는 스텝 S705로 진행된다.
또한, 상술한 설명에서는, 베이스 화상의 부호화 방식은 HEVC 방식인 것으로 하였지만, AVC 방식 등의 HEVC 방식 이외의 부호화 방식이도록 할 수도 있다. 이 경우, 베이스 화상과 인핸스먼트 화상의 참조 화상 특정 정보를 공유할 수는 없다. 따라서, 베이스 화상과 인핸스먼트 화상의 부호화 방식이 동일한 경우에만 카피 플래그가 설정되어, 베이스 화상과 인핸스먼트 화상의 참조 화상 특정 정보가 공유되도록 해도 된다.
이 경우를 제3 실시 형태의 제4 예로서 이하에 설명한다. 또한, 여기서는, 공통 카피 플래그 설정 시의 경우에 대해 설명하지만, 별도 카피 플래그 설정 시나 설정 모드 사용 시의 경우에 있어서도 마찬가지로 행할 수 있다. 또한, 이하에는 제3 실시 형태의 제4 예를 부호화 방식에 기초하는 공통 카피 플래그 설정 시라고 한다.
(인핸스먼트 스트림의 SPS의 신택스의 제4 예)
도 93은 부호화 방식에 기초하는 공통 카피 플래그 설정 시에 도 66의 설정부(431)에 의해 설정되는 SPS의 신택스의 예를 도시하는 도면이다.
도 93의 2행째 및 3행째에 도시한 바와 같이, 도 86의 VPS의 확장부에 설정되는 AVC 플래그(avc_base_layer_flag)가 0인 경우, 즉 부호화 방식이 AVC 방식이 아닌 경우, SPS에는 카피 플래그가 설정된다. 또한, 4행째 및 14행째에 도시한 바와 같이, AVC 플래그가 1이거나, 또는 카피 플래그가 0인 경우, SPS에는 베이스 스트림의 SPS와 마찬가지로, RPS에 관한 정보와 long term의 참조 화상 특정 정보에 관한 정보가 설정된다.
(부호화 장치의 처리의 제4 예의 설명)
부호화 방식에 기초하는 공통 카피 플래그 설정 시의 계층 부호화 처리는 SPS 설정 처리와 카피 플래그 설정 처리를 제외하고, 도 71의 계층 부호화 처리와 마찬가지이다.
부호화 방식에 기초하는 공통 카피 플래그 설정 시의 SPS 설정 처리는 도 72의 SPS 설정 처리 전에 설정부(431)가 VPS로 설정되는 AVC 플래그가 1인지 여부를 판정하는 점을 제외하고, 도 72의 SPS 설정 처리와 마찬가지이다. AVC 플래그가 1이 아니라고 판정된 경우, 도 72의 SPS 설정 처리가 행해지고, AVC 플래그가 0이라고 판정된 경우, 처리는 스텝 S383으로 진행된다.
또한, 부호화 방식에 기초하는 공통 카피 플래그 설정 시의 카피 플래그 설정 처리는 도 73의 카피 플래그 설정 처리 전에 참조 화상 설정부(453)가 설정부(431)로부터 공급되는 VPS로 설정되는 AVC 플래그가 1인지 여부를 판정하는 점을 제외하고, 도 73의 카피 플래그 설정 처리와 마찬가지이다. AVC 플래그가 1이 아니라고 판정된 경우, 도 73의 카피 플래그 설정 처리가 행해지고, AVC 플래그가 1이라고 판정된 경우, 처리는 스텝 S399로 진행된다.
(복호 장치의 처리의 제4 예의 설명)
부호화 방식에 기초하는 공통 카피 플래그 설정 시의 계층 복호 처리는 SPS 추출 처리와 생성 처리를 제외하고, 공통 카피 플래그 설정 시의 계층 복호 처리와 마찬가지이다.
부호화 방식에 기초하는 공통 카피 플래그 설정 시의 SPS 추출 처리는, 도 78의 SPS 추출 처리 전에 참조 화상 설정부(512)가 분리부(92)에 의해 추출된 VPS에 포함되는 AVC 플래그가 1인지 여부를 판정하는 점을 제외하고, 도 78의 SPS 추출 처리와 마찬가지이다. AVC 플래그가 1이 아니라고 판정된 경우, 도 78의 SPS 추출 처리가 행해지고, AVC 플래그가 0이라고 판정된 경우, 처리는 스텝 S453으로 진행된다.
또한, 부호화 방식에 기초하는 공통 카피 플래그 설정 시의 생성 처리는 도 79의 생성 처리 전에 참조 화상 설정부(512)가, AVC 플래그가 1인지 여부를 판정하는 점을 제외하고, 도 79의 생성 처리와 마찬가지이다. AVC 플래그가 1이 아니라고 판정된 경우, 도 79의 생성 처리가 행해지고, AVC 플래그가 1이라고 판정된 경우, 처리는 스텝 S476으로 진행된다.
<제4 실시 형태>
(부호화 장치의 제4 실시 형태의 구성예)
도 94는 본 기술을 적용한 부호화 장치의 제4 실시 형태의 구성예를 도시하는 블록도이다.
도 94에 도시된 구성 중, 도 6의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 94의 부호화 장치(530)의 구성은, 인핸스먼트 부호화부(12) 대신 인핸스먼트 부호화부(531)가 설치되는 점이 도 6의 구성과 상이하다. 부호화 장치(530)는 RPS의 적어도 일부를 베이스 화상과 인핸스먼트 화상의 사이에서 공유한다.
구체적으로는, 부호화 장치(530)의 인핸스먼트 부호화부(531)에는 외부로부터 인핸스먼트 화상이 입력된다. 인핸스먼트 부호화부(531)는 인핸스먼트 화상을 HEVC 방식에 준하는 방식으로 부호화한다.
또한, 인핸스먼트 부호화부(531)는 베이스 부호화부(11)로부터 공급되는 베이스 화상의 RPS를 사용하여, 일부 RPS 카피 플래그를 참조 화상 특정 생성 정보(참조 화상 생성 정보)로서 설정한다. 그리고, 인핸스먼트 부호화부(531)는 일부 RPS 카피 플래그 등을 부호화 결과에 부가하여 부호화 데이터를 생성한다. 또한, 일부 RPS 카피 플래그는, 베이스 화상의 RPS의 적어도 일부를 인핸스먼트 화상의 RPS로서 사용하는지 여부를 나타내는 플래그이다.
인핸스먼트 부호화부(531)는 부호화 데이터, SPS, PPS 등을 포함하는 부호화 스트림을, 인핸스먼트 스트림으로서 합성부(13)에 공급한다.
또한, 여기에서는, 부호화 장치(530)는 전체 계층의 부호화 스트림을 전송하는 것으로 하지만, 필요에 따라 베이스 스트림만을 전송할 수도 있다.
(인핸스먼트 부호화부의 구성예)
도 95는 도 94의 인핸스먼트 부호화부(531)의 구성예를 도시하는 블록도이다.
도 95의 인핸스먼트 부호화부(531)는 설정부(551)와 부호화부(552)에 의해 구성된다.
인핸스먼트 부호화부(531)의 설정부(551)는 필요에 따라 일부 RPS 카피 플래그를 포함하는 SPS, PPS 등의 파라미터 세트를 설정한다. 설정부(551)는 설정된 파라미터 세트를 부호화부(552)에 공급한다.
부호화부(552)는 외부로부터 입력되는 프레임 단위의 인핸스먼트 화상을 입력 신호로서, HEVC 방식에 준하는 방식으로 부호화한다. 또한, 부호화부(552)는 부호화 시에 사용된 RPS와 베이스 부호화부(11)로부터의 RPS에 기초하여, 일부 RPS 카피 플래그를 설정한다.
부호화부(552)는 설정된 일부 RPS 카피 플래그와 설정부(551)로부터 공급되는 SPS에 포함되는 일부 RPS 카피 플래그에 기초하여, 부호화 결과에 일부 RPS 카피 플래그 등을 부가하여, 부호화 데이터를 생성한다. 그리고, 부호화부(552)는 부호화 데이터와 설정부(551)로부터 공급되는 파라미터 세트로부터 인핸스먼트 스트림을 생성하여, 도 94의 합성부(13)에 공급한다.
(부호화부의 구성예)
도 96은 도 95의 부호화부(552)의 구성예를 도시하는 블록도이다.
도 96에 도시된 구성 중, 도 14의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 96의 부호화부(552)의 구성은, 가역 부호화부(36), 축적 버퍼(37), 참조 화상 설정부(50) 대신에 가역 부호화부(571), 축적 버퍼(452), 참조 화상 설정부(572)가 설치되는 점이 도 14의 구성과 상이하다.
가역 부호화부(571)는 인트라 예측 모드 정보를 인트라 예측부(46)로부터 취득한다. 또한, 가역 부호화부(571)는 움직임 예측·보상부(47)로부터 공급되는 인터 예측 모드 정보와 움직임 벡터 등을 움직임 예측·보상부(47)로부터 취득한다. 또한, 가역 부호화부(571)는 RPS 플래그, 일부 RPS 카피 플래그 등을 참조 화상 설정부(572)로부터 취득한다. 또한, 가역 부호화부(571)는 적응 오프셋 필터(42)로부터 오프셋 필터 정보를 취득하고, 적응 루프 필터(43)로부터 필터 계수를 취득한다.
가역 부호화부(571)는 양자화부(35)로부터 공급되는 양자화된 계수에 대하여 가역 부호화를 행한다. 또한, 가역 부호화부(571)는 인트라 예측 모드 정보 또는 인터 예측 모드 정보, 움직임 벡터, RPS 플래그 및 일부 RPS 카피 플래그, 오프셋 필터 정보 및 필터 계수를 부호화 정보로서 가역 부호화한다. 가역 부호화부(571)는 가역 부호화된 부호화 정보를 가역 부호화된 계수에 부가하여, 부호화 데이터로 한다. 가역 부호화부(571)는 부호화 데이터를 축적 버퍼(452)에 공급하여, 축적시킨다.
참조 화상 설정부(572)는 움직임 예측·보상부(47)로부터 공급되는 RPS와, 참조 버퍼(49)에 기억되어 있는 RPS를 비교하여 일부 RPS 카피 플래그를 설정한다. 그리고, 참조 화상 설정부(572)는 설정된 일부 RPS 카피 플래그가 도 95의 설정부(551)로부터 공급되는 SPS에 포함되는 일부 RPS 카피 플래그와 상이한 경우, 설정된 일부 RPS 카피 플래그를 가역 부호화부(571)에 공급한다.
또한, 참조 화상 설정부(572)는 움직임 예측·보상부(47)로부터 공급되는 RPS, 베이스 화상의 RPS 및 일부 RPS 카피 플래그에 기초하여, 그 일부 RPS 카피 플래그용의 RPS를 생성한다. 그리고, 참조 화상 설정부(572)는 생성된 일부 RPS 카피 플래그용의 RPS와 SPS에 포함되는 일부 RPS 카피 플래그용의 RPS를 비교하여 RPS 플래그를 설정하여, 가역 부호화부(571)에 공급한다. 또한, 참조 화상 설정부(572)는 RPS 플래그에 기초하여, 생성된 일부 RPS 카피 플래그용의 RPS를 가역 부호화부(571)에 공급하거나, 그 RPS와 동일한 SPS에 포함되는 일부 RPS 카피 플래그용의 RPS를 특정하는 인덱스를 가역 부호화부(571)에 공급하거나 한다.
(인핸스먼트 스트림의 SPS의 신택스의 제1 예)
도 97은 도 95의 설정부(551)에 의해 설정되는 SPS의 신택스의 예를 나타내는 도면이다.
도 97의 3행째에 도시한 바와 같이, 인핸스먼트 스트림의 SPS에는 일부 RPS 카피 플래그(inter_layer_prediction_flag)가 설정된다. 일부 RPS 카피 플래그는, 베이스 화상의 RPS의 적어도 일부를 인핸스먼트 화상의 RPS로서 사용하는 것을 나타내는 경우 1이며, 베이스 화상의 RPS 모두를 인핸스먼트 화상의 RPS로서 사용하지 않는 것을 나타내는 경우 0이다.
또한, 4행째에 도시한 바와 같이, 베이스 스트림의 SPS와 마찬가지로, 그 SPS에 포함되는 RPS의 수(num_short_term_ref_pic_sets)가 설정된다. 또한, 5행째 및 6행째에 도시한 바와 같이, SPS로 설정되는 일부 RPS 카피 플래그용의 RPS(shrot_term_ref_pic_set(i, inter_layer_prediction_flag)가 설정된다. 또한, 7 내지 13행째에 도시한 바와 같이, 베이스 스트림의 RPS와 마찬가지로, long term의 참조 화상 특정 정보에 관한 정보가 설정된다.
(인핸스먼트 스트림의 슬라이스 헤더의 신택스의 제1 예)
도 98은 인핸스먼트 스트림의 슬라이스 헤더의 신택스의 예를 나타내는 도면이다.
도 98의 5행째에 도시한 바와 같이, 인핸스먼트 스트림의 슬라이스 헤더에는, 대응하는 슬라이스의 일부 RPS 카피 플래그가 SPS에 포함되는 일부 RPS 카피 플래그와 상이한 경우, 일부 RPS 카피 플래그가 설정된다. 6행째에 도시한 바와 같이, 베이스 스트림의 슬라이스 헤더와 마찬가지로, RPS 플래그가 설정된다.
또한, 7행째 및 8행째에 도시한 바와 같이, RPS 플래그가 0인 경우, 대응하는 슬라이스의 일부 RPS 카피 플래그용의 RPS가 설정된다. 9행째 및 10행째에 도시한 바와 같이, RPS 플래그가 1인 경우, 대응하는 슬라이스의 일부 RPS 카피 플래그용의 RPS와 동일한, SPS에 포함되는 일부 RPS 카피 플래그용의 RPS의 인덱스가 설정된다. 또한, 11행째 및 12행째에 도시한 바와 같이, 베이스 스트림의 슬라이스 헤더와 마찬가지로, long term 플래그에 따라 long term의 참조 화상 특정 정보가 설정된다.
(RPS의 신택스의 제1 예)
도 99는 일부 RPS 카피 플래그용의 RPS의 신택스의 예를 나타내는 도면이다.
도 99의 3행째에 도시한 바와 같이, 일부 RPS 카피 플래그용의 RPS에는 참조 정보(inter_ref_pic_set_prediction_flag)가 설정된다. 여기에서는, 참조 정보는, 동일 레이어간뿐만 아니라, 상이한 레이어간의 참조의 유무를 나타낸다. 즉, 참조 정보가 1인 경우, 참조 정보는, 전 화상 또는 베이스 화상의 RPS를 인핸스먼트 화상의 RPS로서 사용하는 것을 나타낸다. 한편, 참조 정보가 0인 경우, 참조 정보는, 전 화상 및 베이스 화상의 RPS를 인핸스먼트 화상의 RPS로서 사용하지 않는 것을 나타낸다.
4 내지 10행째에 도시한 바와 같이, 참조 정보가 1이면서, 또한 일부 RPS 카피 플래그가 0인 경우, 즉, 전 화상의 RPS를 인핸스먼트 화상의 RPS로서 사용하는 경우, 전 화상 특정 정보(delta_idx_minus1), 부호(delta_rps_sign) 및 절댓값(abs_delta_rps_minus1)이 설정된다.
또한, 11 내지 14행째에 도시한 바와 같이, 참조 정보가 1인 경우, 플래그(used_by_curr_pic_lt_flag(used_by_curr_pic_flag))가 설정되고, 플래그(used_by_curr_pic_flag)가 0인 경우, 플래그(use_delta_flag)가 더 설정된다. 한편, 15 내지 25행째에 도시한 바와 같이, 참조 정보가 0인 경우, 참조 화상의 수나 POC를 나타내는 정보 등이 설정된다.
이상에 의해, 일부 RPS 카피 플래그가 0인 경우용의 RPS에는 참조 정보가 1인 경우, 전 화상 특정 정보(delta_idx_minus1), 부호(delta_rps_sign) 및 절댓값(abs_delta_rps_minus1)이 설정된다. 또한, 플래그(used_by_curr_pic_lt_flag)가 설정됨과 함께, 플래그(used_by_curr_pic_flag)에 따라 플래그(use_delta_flag)가 설정된다. 참조 정보가 0인 경우에는, 일부 RPS 카피 플래그가 0인 경우용의 RPS에는, 참조 화상의 수나 POC를 나타내는 정보 등이 설정된다.
한편, 일부 RPS 카피 플래그가 1인 경우용의 RPS에는 플래그(used_by_curr_pic_flag)가 설정됨과 함께, 플래그(used_by_curr_pic_flag)에 따라 플래그(use_delta_flag)가 설정된다.
즉, 일부 RPS 카피 플래그가 1인 경우, RPS의 참조처의 화상은 동시각의 베이스 화상으로 고정되어 있기 때문에, 베이스 화상을 특정하는 정보는 설정되지 않는다. 또한, 이 경우, 베이스 화상의 RPS의 적어도 일부가 인핸스먼트 화상의 RPS로서 그대로 사용되기 때문에, RPS의 차분에 관한 부호(delta_rps_sign)와 절댓값(abs_delta_rps_minus1)도 설정되지 않는다. 그 결과, 부호화 효율이 향상된다.
또한, 일부 RPS 카피 플래그가 1인 경우, 플래그(used_by_curr_pic_flag)(사용 정보)가 설정된다. 이에 의해, 베이스 화상의 참조 화상마다, 그 참조 화상의 RPS가 인핸스먼트 화상의 RPS로서 사용되는지를 지정할 수 있다.
또한, 일부 RPS 카피 플래그가 1인 경우 참조 정보는 반드시 1로 되기 때문에, 참조 정보가 0인 경우에는 존재하지 않는다.
(부호화 장치의 처리의 제1 예의 설명)
도 94의 부호화 장치(530)의 계층 부호화 처리는, SPS 설정 처리와 카피 플래그 설정 처리를 제외하고, 도 71의 계층 부호화 처리와 마찬가지이다. 따라서, 이하에서는, SPS 설정 처리와 카피 플래그 설정 처리에 대해서만 설명한다.
도 100은 부호화 장치(530)의 SPS 설정 처리를 설명하는 흐름도이다.
도 100의 스텝 S721에 있어서, 도 95의 설정부(551)는 일부 RPS 카피 플래그를 SPS로 설정한다. 스텝 S722에 있어서, 설정부(551)는 일부 RPS 카피 플래그가 1인지 여부를 판정한다. 스텝 S722에서 일부 RPS 카피 플래그가 1이라고 판정된 경우, 스텝 S723에 있어서, 설정부(551)는 RPS의 수(num_short_term_ref_pic_sets)의 일부 RPS 카피 플래그가 1인 경우용의 RPS를 SPS로 설정한다.
구체적으로는, 설정부(551)는 참조 정보로서의 1과 플래그(used_by_curr_pic_lt_flag)를 포함하는 일부 RPS 카피 플래그용의 RPS를, RPS의 수(num_short_term_ref_pic_sets)만 SPS로 설정한다. 또한, 플래그(used_by_curr_pic_flag)가 0인 경우, 플래그(use_delta_flag)도 일부 RPS 카피 플래그용의 RPS로 설정된다.
한편, 스텝 S722에서 일부 RPS 카피 플래그가 1이 아니라고 판정된 경우, 즉 일부 RPS 카피 플래그가 0인 경우, 처리는 스텝 S724로 진행된다. 스텝 S724에 있어서, 설정부(551)는 RPS의 수(num_short_term_ref_pic_sets)의 일부 RPS 카피 플래그가 0인 경우용의 RPS를 SPS로 설정한다.
구체적으로는, 설정부(551)는 참조 정보를 포함하고, 참조 정보가 1인 경우 전 화상 특정 정보(delta_idx_minus1), 부호(delta_rps_sign), 절댓값(abs_delta_rps_minus1) 및 플래그(used_by_curr_pic_flag)를 포함하고, 참조 정보가 0인 경우 참조 화상의 수나 POC를 나타내는 정보 등을 포함하는 일부 RPS 카피 플래그용의 RPS를 RPS의 수(num_short_term_ref_pic_sets)만 SPS로 설정한다. 또한, 플래그(used_by_curr_pic_flag)가 0인 경우, 플래그(use_delta_flag)도 일부 RPS 카피 플래그용의 RPS로 설정된다.
스텝 S723 또는 S724의 처리 후, 처리는 스텝 S725로 진행된다. 스텝 S725 내지 S727의 처리는, 도 72의 스텝 S384 내지 S386의 처리와 마찬가지이므로, 설명은 생략한다.
도 101은 부호화 장치(530)의 카피 플래그 설정 처리의 상세를 설명하는 흐름도이다. 이 카피 플래그 설정 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 101의 스텝 S741 및 S742의 처리는, 참조 화상 특정 정보가 RPS를 대신하는 점을 제외하고, 도 73의 스텝 S390 및 S391의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S743에 있어서, 참조 화상 설정부(572)는 인핸스먼트 화상의 RPS 모두가 베이스 화상의 RPS에 포함되어 있는지 여부를 판정한다. 스텝 S743에서 인핸스먼트 화상의 RPS 모두가 베이스 화상의 RPS에 포함되어 있다고 판정된 경우, 스텝 S744에 있어서, 참조 화상 설정부(572)는 일부 RPS 카피 플래그를 1로 설정한다.
또한, 참조 화상 설정부(572)는 인핸스먼트 화상의 RPS와 베이스 화상의 RPS로부터, 인핸스먼트 화상의 일부 RPS 카피 플래그가 1인 경우용의 RPS를 생성한다.
구체적으로는, 참조 화상 설정부(572)는 베이스 화상의 RPS에서 특정되는 참조 화상 중 인핸스먼트 화상의 RPS에서 특정되는 참조 화상과 동일한 참조 화상의 플래그(used_by_curr_pic_flag)를 1로 설정하고, 상이한 참조 화상의 플래그(used_by_curr_pic_flag)를 0으로 설정한 일부 RPS 카피 플래그가 1인 경우용의 RPS를 생성한다.
그리고, 스텝 S745에 있어서, 참조 화상 설정부(572)는 도 95의 설정부(551)로부터 공급되는 SPS의 일부 RPS 카피 플래그가 1인지 여부를 판정한다. 스텝 S745에서 일부 RPS 카피 플래그가 1이라고 판정된 경우, 처리는 스텝 S746으로 진행된다.
스텝 S746에 있어서, 참조 화상 설정부(572)는 SPS의 일부 RPS 카피 플래그가 1인 경우용의 RPS와, 인핸스먼트 화상의 일부 RPS 카피 플래그가 1인 경우용의 RPS가 동일한지 여부를 판정한다. 스텝 S746에서 SPS와 인핸스먼트 화상의 RPS가 동일하다고 판정된 경우, 스텝 S747로 진행된다.
스텝 S747에 있어서, 참조 화상 설정부(572)는 RPS 플래그로서의 1과 인핸스먼트 화상의 RPS와 동일한 SPS의 일부 RPS 카피 플래그가 1인 경우용의 RPS의 인덱스를 가역 부호화부(571)에 공급하고, 처리를 종료한다.
한편, 스텝 S745에서 일부 RPS 카피 플래그가 1이 아니라고 판정된 경우, 즉, 일부 RPS 카피 플래그가 0인 경우, 처리는 스텝 S748로 진행된다. 스텝 S748에 있어서, 참조 화상 설정부(572)는 설정된 일부 RPS 카피 플래그로서의 0을 가역 부호화부(571)에 공급하여, 처리를 스텝 S749로 진행시킨다.
또한, 스텝 S746에서 SPS와 인핸스먼트 화상의 RPS가 동일하지 않다고 판정된 경우, 처리는 스텝 S749로 진행된다.
스텝 S749에 있어서, 참조 화상 설정부(572)는 RPS 플래그로서의 0과 일부 RPS 카피 플래그가 1인 경우용의 RPS를 가역 부호화부(571)에 공급하고, 처리를 종료한다.
한편, 스텝 S743에서 인핸스먼트 화상의 RPS의 적어도 일부가 베이스 화상의 RPS에 포함되어 있지 않다고 판정된 경우, 스텝 S750에 있어서, 참조 화상 설정부(572)는 일부 RPS 카피 플래그를 0으로 설정한다. 또한, 참조 화상 설정부(572)는 인핸스먼트 화상의 RPS와 전 화상의 RPS로부터, 인핸스먼트 화상의 일부 RPS 카피 플래그가 0인 경우용의 RPS를 생성한다.
스텝 S751에 있어서, 참조 화상 설정부(572)는 설정부(551)로부터 공급되는 SPS의 일부 RPS 카피 플래그가 0인지 여부를 판정한다.
스텝 S751에서 SPS의 일부 RPS 카피 플래그가 0이라고 판정된 경우, 처리는 스텝 S752로 진행된다. 한편, 스텝 S751에서 SPS의 일부 RPS 카피 플래그가 0이 아니라고 판정된 경우, 즉 SPS의 일부 RPS 카피 플래그가 1이라고 판정된 경우, 처리는 스텝 S754로 진행된다.
스텝 S752 내지 S755의 처리는, 일부 RPS 카피 플래그가 1인 경우용의 RPS가, 일부 RPS 카피 플래그가 0인 경우용의 RPS를 대신하는 점을 제외하고, 스텝 S746 내지 S749의 처리와 마찬가지이므로, 설명은 생략한다.
이상과 같이, 부호화 장치(530)는 일부 RPS 카피 플래그를 설정한다. 따라서, 베이스 화상과 인핸스먼트 화상의 RPS가 완전히 일치하지 않는 경우에도 인핸스먼트 화상의 RPS가 베이스 화상의 RPS에 포함되어 있는 경우에는 베이스 레이어와 인핸스먼트 레이어 사이에서 RPS를 공유할 수 있다. 그 결과, 인핸스먼트 스트림의 정보량을 삭감하여, 부호화 효율을 향상시킬 수 있다.
또한, 부호화 장치(530)는 플래그(used_by_curr_pic_flag)를 설정하므로, 베이스 레이어와 인핸스먼트 레이어에서 공유하는 RPS의 부분을 지정할 수 있다.
(복호 장치의 제4 실시 형태의 구성예)
도 102는 도 94의 부호화 장치(530)로부터 전송되는 전체 계층의 부호화 스트림을 복호하는, 본 개시를 적용한 복호 장치의 제4 실시 형태의 구성예를 도시하는 블록도이다.
도 102에 도시된 구성 중, 도 29의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 102의 복호 장치(590)의 구성은 인핸스먼트 복호부(94) 대신 인핸스먼트 복호부(591)가 설치되는 점이, 도 29의 복호 장치(90)의 구성과 상이하다.
복호 장치(590)의 인핸스먼트 복호부(591)는 분리부(92)로부터 공급되는 인핸스먼트 스트림을 HEVC 방식에 준하는 방식으로 복호하여, 인핸스먼트 화상을 생성한다. 이때, 인핸스먼트 복호부(591)는 베이스 복호부(93)로부터 공급되는 베이스 화상의 RPS와 SPS나 슬라이스 헤더에 포함되는 일부 RPS 카피 플래그 등을 참조한다. 인핸스먼트 복호부(591)는 생성된 인핸스먼트 화상을 출력한다.
(인핸스먼트 복호부의 구성예)
도 103은 도 102의 인핸스먼트 복호부(591)의 구성예를 도시하는 블록도이다.
도 103에 도시된 구성 중, 도 30의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 103의 인핸스먼트 복호부(591)의 구성은, 복호부(112) 대신 복호부(611)가 설치되는 점이, 도 30의 인핸스먼트 복호부(94)의 구성과 상이하다.
인핸스먼트 복호부(591)의 복호부(611)는, 도 102의 베이스 복호부(93)로부터 공급되는 베이스 화상의 RPS와, 추출부(111)로부터의 SPS나 슬라이스 헤더에 포함되는 일부 RPS 카피 플래그를 참조하여, 추출부(111)로부터의 부호화 데이터를 HEVC 방식에 준하는 방식으로 복호한다. 복호부(611)는 복호의 결과 얻어지는 화상을, 인핸스먼트 화상으로서 출력한다.
(복호부의 구성예)
도 104는 도 103의 복호부(611)의 구성예를 도시하는 블록도이다.
도 104에 도시된 구성 중, 도 31의 구성과 동일한 구성에는 동일한 부호를 부여하고 있다. 중복되는 설명에 대해서는 적절히 생략한다.
도 104의 복호부(611)의 구성은, 가역 복호부(132) 대신 가역 복호부(631)가 설치되는 점 및 참조 화상 설정부(145) 대신 참조 화상 설정부(632)가 설치되는 점이 도 31의 복호부(112)의 구성과 상이하다.
복호부(611)의 가역 복호부(631)는 축적 버퍼(131)로부터의 부호화 데이터에 대하여 가역 복호를 실시함으로써, 양자화된 계수와 부호화 정보를 얻는다. 가역 복호부(631)는 양자화된 계수를 역양자화부(133)에 공급한다. 또한, 가역 복호부(631)는 부호화 정보로서의 인트라 예측 모드 정보 등을 인트라 예측부(143)에 공급하고, 움직임 벡터, 인터 예측 모드 정보 등을 움직임 보상부(146)에 공급한다.
또한, 가역 복호부(631)는 부호화 정보로서의 일부 RPS 카피 플래그, RPS 플래그, 그 일부 RPS 카피 플래그용의 RPS 또는 RPS의 인덱스 등을 참조 화상 설정부(632)에 공급한다. 또한, 가역 복호부(631)는 부호화 정보로서의 인트라 예측 모드 정보 또는 인터 예측 모드 정보를 스위치(147)에 공급한다. 가역 복호부(631)는 부호화 정보로서의 오프셋 필터 정보를 적응 오프셋 필터(137)에 공급하고, 필터 계수를 적응 루프 필터(138)에 공급한다.
참조 화상 설정부(632)는 도 103의 추출부(111)로부터 공급되는 SPS에 포함되는 일부 RPS 카피 플래그와, 그 일부 RPS 카피 플래그용의 RPS를 유지한다. 참조 화상 설정부(632)는 가역 복호부(631)로부터 일부 RPS 카피 플래그, 일부 RPS 카피 플래그용의 RPS가 공급되었을 때, 유지하고 있는 일부 RPS 카피 플래그, 일부 RPS 카피 플래그용의 RPS를 갱신한다.
그리고, 참조 화상 설정부(632)는 유지하고 있는 일부 RPS 카피 플래그에 기초하여, 참조 버퍼(144)로부터 베이스 화상의 RPS를 판독한다. 또한, 참조 화상 설정부(632)는 가역 복호부(631)로부터의 RPS 플래그에 기초하여, 유지하고 있는 일부 RPS 카피 플래그용의 RPS 또는 유지하고 있는 가역 복호부(631)로부터 공급되는 인덱스의 일부 RPS 카피 플래그용의 RPS를 취득한다.
참조 화상 설정부(632)는 일부 RPS 카피 플래그가 1인 경우, 베이스 화상의 RPS와 일부 RPS 카피 플래그가 1인 경우용의 RPS에 기초하여, 베이스 화상의 RPS 중 적어도 일부를 처리 대상의 슬라이스 RPS로 결정한다. 한편, 참조 화상 설정부(632)는 일부 RPS 카피 플래그가 0인 경우, 일부 RPS 카피 플래그가 0인 경우용의 RPS를 처리 대상의 슬라이스 RPS로 결정한다.
(복호 장치의 처리의 제1 예의 설명)
도 102의 복호 장치(590)의 계층 복호 처리는, SPS 추출 처리와 생성 처리를 제외하고 복호 장치(470)의 계층 복호 처리와 마찬가지이다. 따라서, 이하에서는, SPS 추출 처리와 생성 처리에 대해서만 설명한다.
도 105는 복호 장치(590)의 SPS 추출 처리의 상세를 설명하는 흐름도이다.
도 105의 스텝 S771에 있어서, 도 104의 참조 화상 설정부(632)는 일부 RPS 카피 플래그를 SPS로부터 추출하여, 유지한다.
스텝 S772에 있어서, 참조 화상 설정부(632)는 일부 RPS 카피 플래그가 1인지 여부를 판정한다. 스텝 S772에서 일부 RPS 카피 플래그가 1이라고 판정된 경우, 스텝 S773에 있어서, 참조 화상 설정부(632)는 RPS의 수(num_short_term_ref_pic_sets)의 일부 RPS 카피 플래그가 1인 경우용의 RPS를 SPS로부터 추출하여, 유지한다.
한편, 스텝 S772에서 일부 RPS 카피 플래그가 1이 아니라고 판정된 경우, 즉 일부 RPS 카피 플래그가 0인 경우, 처리는 스텝 S774로 진행된다. 스텝 S774에 있어서, 참조 화상 설정부(632)는 RPS의 수(num_short_term_ref_pic_sets)의 일부 RPS 카피 플래그가 0인 경우용의 RPS를 SPS로부터 추출하여, 유지한다.
스텝 S773 또는 S774의 처리 후, 처리는 스텝 S775로 진행된다. 스텝 S775 내지 S777의 처리는, 도 78의 스텝 S454 내지 S456의 처리와 마찬가지이므로, 설명은 생략한다.
도 106은 복호 장치(590)의 생성 처리의 상세를 설명하는 흐름도이다. 이 생성 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 106의 스텝 S800 내지 S802의 처리는, 카피 플래그가 일부 RPS 카피 플래그를 대신하는 점을 제외하고, 도 79의 스텝 S471 내지 S473의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S802에서 일부 RPS 카피 플래그가 1이라고 판정된 경우, 스텝 S803에 있어서, 참조 화상 설정부(632)는 참조 버퍼(144)로부터 베이스 화상의 RPS를 판독한다.
스텝 S804에 있어서, 참조 화상 설정부(632)는 가역 복호부(631)로부터 공급되는 RPS 플래그가 1인지 여부를 판정한다.
스텝 S804에서 RPS 플래그가 1이라고 판정된 경우, 스텝 S805에 있어서, 참조 화상 설정부(632)는 가역 복호부(631)로부터 공급되는 RPS의 인덱스를 취득한다.
스텝 S806에 있어서, 참조 화상 설정부(632)는 유지하고 있는 RPS 중, 취득된 인덱스가 부여된 일부 RPS 카피 플래그가 1인 경우용의 RPS에 기초하여, 베이스 화상의 RPS로부터 처리 대상의 슬라이스 RPS를 결정한다. 구체적으로는, 참조 화상 설정부(632)는 베이스 화상의 RPS 중, 일부 RPS 카피 플래그가 1인 경우용의 RPS에 포함되는 플래그(used_by_curr_pic_lt_flag)가 1인 참조 화상을 특정하는 정보만을, 처리 대상의 슬라이스 RPS로 결정한다. 그리고, 처리는 종료한다.
한편, 스텝 S804에서 RPS 플래그가 1이 아니라고 판정된 경우, 즉 RPS 플래그가 0인 경우, 스텝 S807에 있어서, 참조 화상 설정부(632)는 가역 복호부(631)로부터 공급되는 일부 RPS 카피 플래그가 1인 경우용의 RPS를 취득한다. 이 RPS에 의해, 참조 화상 설정부(632)에 유지되어 있는 SPS에 포함되는 일부 RPS 카피 플래그용의 RPS가 갱신된다.
스텝 S808에 있어서, 참조 화상 설정부(632)는 갱신 후의 일부 RPS 카피 플래그가 1인 경우용의 RPS에 기초하여, 스텝 S806의 처리와 마찬가지로, 베이스 화상의 RPS로부터 처리 대상의 슬라이스 RPS를 결정한다. 그리고, 처리는 종료한다.
한편, 스텝 S802에서 일부 RPS 카피 플래그가 1이 아니라고 판정된 경우, 즉 일부 RPS 카피 플래그가 0인 경우, 처리는 스텝 S809로 진행된다. 스텝 S809, S810 및 스텝 S812의 처리는, 일부 RPS 카피 플래그가 1인 경우용의 RPS가, 일부 RPS 카피 플래그가 0인 경우용의 RPS를 대신하는 점을 제외하고, 스텝 S804, S805 및 S807의 처리와 동일하므로, 설명은 생략한다.
스텝 S810의 처리 후, 스텝 S811에 있어서, 참조 화상 설정부(632)는 유지하고 있는 RPS 중, 취득된 인덱스가 부여된 일부 RPS 카피 플래그가 0인 경우용의 RPS를, 처리 대상의 슬라이스 RPS로 결정한다. 그리고, 처리는 종료한다.
한편, 스텝 S812의 처리 후, 스텝 S813에 있어서, 참조 화상 설정부(632)는 갱신 후의 일부 RPS 카피 플래그가 0인 경우용의 RPS를, 처리 대상의 슬라이스 RPS로 결정한다. 그리고, 처리는 종료한다.
또한, 생성 처리의 종료 후, 참조 화상 설정부(632)에 유지되어 있는 일부 RPS 카피 플래그 및 RPS는, SPS에 포함되는 일부 RPS 카피 플래그 및 RPS로 되돌려진다.
이상과 같이, 복호 장치(590)는 일부 RPS 카피 플래그를 사용하여 인핸스먼트 화상의 RPS를 생성한다. 따라서, 베이스 화상과 인핸스먼트 화상의 RPS가 완전히 일치하지 않는 경우에도 인핸스먼트 화상의 RPS가 베이스 화상의 RPS에 포함되어 있는 경우에는 베이스 레이어와 인핸스먼트 레이어의 사이에서 RPS를 공유함으로써 부호화 효율을 향상시킨 인핸스먼트 스트림을 복호할 수 있다.
또한, 복호 장치(590)는 플래그(used_by_curr_pic_flag)를 수취하므로, 베이스 레이어와 인핸스먼트 레이어에서 공유하는 RPS의 부분을 인식할 수 있다.
또한, 상술한 설명에서는, RPS가, 일부 RPS 카피 플래그가 1인 경우용의 RPS와 일부 RPS 카피 플래그가 0인 경우용의 RPS로 구별되어 설정되었지만, 구별되지 않고 설정되도록 할 수도 있다. 이 경우를 제4 실시 형태의 제2 예로서 이하에 설명한다. 또한, 이하에서는, 제4 실시 형태의 제2 예의 경우를, 공통 RPS 설정 시라고 한다.
(RPS의 신택스의 제2 예)
도 107은 공통 RPS 설정 시의 RPS의 신택스의 예를 나타내는 도면이다.
공통 RPS 설정 시에는, 도 97의 SPS나 도 98의 슬라이스 헤더의 일부 RPS 카피 플래그용의 RPS로서, 도 107의 RPS가 설정된다.
도 107의 RPS에서는, 3행째에 도시한 바와 같이, 도 99의 경우와 마찬가지로, 참조 정보(inter_ref_pic_set_prediction_flag)가 설정된다. 또한, 4행째 및 5행째에 도시한 바와 같이, 참조 정보가 1인 경우, RPS에는 일부 RPS 카피 플래그가 설정된다. 즉, 참조 정보가 0인 경우 일부 RPS 카피 플래그는 반드시 0이기 때문에, 참조 정보가 1인 경우에만 일부 RPS 카피 플래그가 설정된다.
또한, 6 내지 11행째에 도시한 바와 같이, 일부 RPS 카피 플래그가 0인 경우, 즉 참조 정보가 1이면서, 또한 일부 RPS 카피 플래그가 0인 경우, 도 99의 경우와 마찬가지로, RPS에는 전 화상 특정 정보(delta_idx_minus1), 부호(delta_rps_sign) 및 절댓값(abs_delta_rps_minus1)이 설정된다.
또한, 12 내지 15행째에 도시한 바와 같이, 참조 정보가 1인 경우, RPS에는 도 99의 경우와 마찬가지로, 플래그(used_by_curr_pic_flag)와, 플래그(used_by_curr_pic_flag)에 따른 플래그(use_delta_flag)가 설정된다.
또한, 16 내지 27행째에 도시한 바와 같이, 참조 정보가 0인 경우, RPS에는 도 99의 경우와 마찬가지로, 참조 화상의 수나 POC를 나타내는 정보 등이 설정된다.
(부호화 장치의 처리의 제2 예의 설명)
공통 RPS 설정 시의 계층 부호화 처리는, SPS 설정 처리와 카피 플래그 설정 처리를 제외하고, 도 71의 계층 부호화 처리와 마찬가지이다. 따라서, 이하에서는, SPS 설정 처리와 카피 플래그 설정 처리에 대해서만 설명한다.
도 108은 공통 RPS 설정 시의 SPS 설정 처리를 설명하는 흐름도이다.
도 108의 스텝 S831에 있어서, 도 95의 설정부(551)는 일부 RPS 카피 플래그를 SPS로 설정한다. 스텝 S832에 있어서, 설정부(551)는 RPS의 수(num_short_term_ref_pic_sets)의 RPS를 SPS로 설정한다. 구체적으로는, 설정부(551)는 참조 정보가 설정되고, 참조 정보가 1인 경우 일부 RPS 카피 플래그가 설정되고, 참조 정보와 일부 RPS 카피 플래그에 따른 정보가 설정되는 RPS를 RPS의 수(num_short_term_ref_pic_sets)만 SPS로 설정한다.
스텝 S833 내지 S835의 처리는, 도 72의 스텝 S384 내지 S386의 처리와 마찬가지이므로, 설명은 생략한다.
도 109는 공통 RPS 설정 시의 카피 플래그 설정 처리의 상세를 설명하는 흐름도이다. 이 카피 플래그 설정 처리는, 예를 들어 슬라이스 단위로 행해진다.
도 109의 스텝 S851 내지 S855의 처리는, 도 101의 스텝 S741 내지 S744 및 S750의 처리와 마찬가지이므로, 설명은 생략한다.
스텝 S854 또는 S855의 처리 후, 처리는 스텝 S856으로 진행된다. 스텝 S856에 있어서, 참조 화상 설정부(572)는 도 95의 설정부(551)로부터 공급되는 SPS의 일부 RPS 카피 플래그와, 스텝 S854 또는 스텝 S855에서 설정된 일부 RPS 카피 플래그가 동일한지 여부를 판정한다.
스텝 S856에서 일부 RPS 카피 플래그가 동일하다고 판정된 경우, 스텝 S857에 있어서, 참조 화상 설정부(572)는 SPS의 RPS와 인핸스먼트 화상의 RPS가 동일한지 여부를 판정한다. 스텝 S857에서 SPS와 인핸스먼트 화상의 RPS가 동일하다고 판정된 경우, 스텝 S858로 진행된다.
스텝 S858에 있어서, 참조 화상 설정부(572)는 RPS 플래그로서의 1과 RPS의 인덱스를 가역 부호화부(571)에 공급하고, 처리를 종료한다.
한편, 스텝 S856에서 일부 RPS 카피 플래그가 동일하지 않다고 판정된 경우, 스텝 S859에 있어서, 참조 화상 설정부(572)는 설정된 일부 RPS 카피 플래그를 가역 부호화부(571)에 공급하여, 처리를 스텝 S860으로 올라가게 한다.
또한, 스텝 S857에서 SPS와 인핸스먼트 화상의 RPS가 동일하지 않다고 판정된 경우, 처리는 스텝 S860으로 진행된다.
스텝 S860에 있어서, 참조 화상 설정부(572)는 RPS 플래그로서의 0과 RPS를 가역 부호화부(571)에 공급하고, 처리를 종료한다.
(복호 장치의 처리의 제2 예의 설명)
공통 RPS 설정 시의 계층 복호 처리는, SPS 추출 처리와 생성 처리를 제외하고, 복호 장치(470)의 계층 복호 처리와 마찬가지이다. 따라서, 이하에서는, SPS 추출 처리와 생성 처리에 대해서만 설명한다.
도 110은 공통 RPS 설정 시의 SPS 추출 처리를 설명하는 흐름도이다.
도 110의 스텝 S881에 있어서, 도 104의 참조 화상 설정부(632)는 일부 RPS 카피 플래그를 SPS로부터 추출하여, 유지한다. 스텝 S882에 있어서, 참조 화상 설정부(632)는 RPS를 SPS로부터 추출하여, 유지한다.
스텝 S883 내지 S885의 처리는, 도 78의 스텝 S454 내지 S456의 처리와 마찬가지이므로, 설명은 생략한다.
공통 RPS 설정 시의 생성 처리는, 일부 RPS 카피 플래그가 1인 경우용의 RPS와 일부 RPS 카피 플래그가 0인 경우용의 RPS가, RPS를 대신하는 점을 제외하고, 도 106의 생성 처리와 마찬가지이다.
또한, 제4 실시 형태에 있어서도, 제3 실시 형태와 마찬가지로, 베이스 화상의 부호화 방식을, AVC 방식 등의 HEVC 방식 이외의 부호화 방식으로 할 수도 있다. 이 경우, 베이스 화상과 인핸스먼트 화상의 부호화 방식이 동일한 경우에만 일부 RPS 카피 플래그가 설정되어, 베이스 화상과 인핸스먼트 화상의 RPS의 적어도 일부가 공유된다.
<다시점 화상 부호화·다시점 화상 복호에의 적용>
상술한 일련의 처리는, 다시점 화상 부호화·다시점 화상 복호에 적용할 수 있다. 도 111은 다시점 화상 부호화 방식의 일례를 나타낸다.
도 111에 도시된 바와 같이, 다시점 화상은, 복수의 시점의 화상을 포함하고, 그 복수의 시점 중 소정의 1개의 시점의 화상이, 베이스 뷰의 화상으로 지정되어 있다. 베이스 뷰의 화상 이외의 각 시점의 화상은, 논베이스 뷰의 화상으로서 취급된다. Scalable 기능에 의해 다시점 화상 부호화가 행하여지는 경우, 베이스 뷰의 화상은, 베이스 레이어 화상으로서 부호화되고, 논베이스 뷰의 화상이 인핸스먼트 화상으로서 부호화된다.
도 111과 같은 다시점 화상 부호화를 행하는 경우, 각 뷰(동일 뷰)에 있어서, 양자화 파라미터의 차분을 취할 수도 있다:
Figure pct00011
다시점 화상 부호화를 행하는 경우, 각 뷰(상이한 뷰)에 있어서, 양자화 파라미터의 차분을 취할 수도 있다:
Figure pct00012
이 경우, 상기 (1) 내지 (4)를 조합하여 사용할 수도 있다. 예를 들어, 논베이스 뷰에서는, 베이스 뷰와 논베이스 뷰 사이에 있어서 슬라이스 레벨로 양자화 파라미터의 차분을 취하는 방법(3-1과 2-3을 조합함), 베이스 뷰와 논베이스 뷰 사이에 있어서 LCU 레벨로 양자화 파라미터의 차분을 취하는 방법(3-2과 2-1을 조합함)을 생각할 수 있다. 이와 같이, 차분을 반복하여 적용함으로써, 다시점 부호화를 행한 경우에 있어서도 부호화 효율을 향상시킬 수 있다.
상술한 방법과 마찬가지로, 상기한 각 dQP에 대하여, 값이 0이 아닌 dQP가 존재하는지 여부를 식별하는 플래그를 세트할 수도 있다.
<Scalable 기능에 의한 부호화의 다른 예>
도 112는 Scalable 기능에 의한 부호화의 다른 예를 나타낸다.
도 112에 도시된 바와 같이, Scalable 기능에 의한 부호화에서는, 각 레이어(동일 레이어)에 있어서, 양자화 파라미터의 차분을 취할 수도 있다:
Figure pct00013
또한, 각 레이어(상이한 레이어)에 있어서, 양자화 파라미터의 차분을 취할 수도 있다:
Figure pct00014
이 경우, 상기 (1) 내지 (4)를 조합하여 사용할 수도 있다. 예를 들어, 논베이스 레이어에서는, 베이스 레이어와 논베이스 레이어 사이에 있어서 슬라이스 레벨로 양자화 파라미터의 차분을 취하는 방법(3-1과 2-3을 조합함), 베이스 레이어와 논베이스 레이어 사이에 있어서 LCU 레벨로 양자화 파라미터의 차분을 취하는 방법(3-2과 2-1을 조합함)을 생각할 수 있다. 이와 같이, 차분을 반복하여 적용함으로써, 계층 부호화를 행한 레벨에서 경우에 있어서도, 부호화 효율을 향상시킬 수 있다.
상술한 방법과 마찬가지로, 상기한 각 dQP에 대하여, 값이 0이 아닌 dQP가 존재하는지 여부를 식별하는 플래그를 세트할 수도 있다.
<제5 실시 형태>
(본 기술을 적용한 컴퓨터의 설명)
상술한 일련의 처리는, 하드웨어에 의해 실행할 수도 있고, 소프트웨어에 의해 실행할 수도 있다. 일련의 처리를 소프트웨어에 의해 실행하는 경우에는, 그 소프트웨어를 구성하는 프로그램이 컴퓨터에 인스톨된다. 여기서, 컴퓨터에는 전용 하드웨어에 내장되어 있는 컴퓨터나, 각종 프로그램을 인스톨함으로써, 각종 기능을 실행하는 것이 가능한, 예를 들어 범용 퍼스널 컴퓨터 등이 포함된다.
도 113은 상술한 일련의 처리를 프로그램에 의해 실행하는 컴퓨터의 하드웨어의 구성예를 도시하는 블록도이다.
컴퓨터에 있어서, CPU(Central Processing Unit)(801), ROM(Read Only Memory)(802), RAM(Random Access Memory)(803)은 버스(804)에 의해 서로 접속되어 있다.
버스(804)에는 입출력 인터페이스(805)가 더 접속되어 있다. 입출력 인터페이스(805)에는 입력부(806), 출력부(807), 기억부(808), 통신부(809) 및 드라이브(810)가 접속되어 있다.
입력부(806)는 키보드, 마우스, 마이크로폰 등을 포함한다. 출력부(807)는 디스플레이, 스피커 등을 포함한다. 기억부(808)는 하드 디스크나 불휘발성 메모리 등을 포함한다. 통신부(809)는 네트워크 인터페이스 등을 포함한다. 드라이브(810)는 자기 디스크, 광 디스크, 광자기 디스크, 또는 반도체 메모리 등의 리무버블 미디어(811)를 구동한다.
이상과 같이 구성되는 컴퓨터에서는, CPU(801)가, 예를 들어 기억부(808)에 기억되어 있는 프로그램을 입출력 인터페이스(805) 및 버스(804)를 통하여, RAM(803)에 로드하여 실행함으로써, 상술한 일련의 처리가 행하여진다.
컴퓨터(CPU(801))가 실행하는 프로그램은, 예를 들어 패키지 미디어 등으로서의 리무버블 미디어(811)에 기록하여 제공할 수 있다. 또한, 프로그램은 로컬 에리어 네트워크, 인터넷, 디지털 위성 방송이라고 하는, 유선 또는 무선의 전송 매체를 통하여 제공할 수 있다.
컴퓨터에서는, 프로그램은, 리무버블 미디어(811)를 드라이브(810)에 장착함으로써, 입출력 인터페이스(805)를 통하여 기억부(808)에 인스톨할 수 있다. 또한, 프로그램은 유선 또는 무선의 전송 매체를 통하여, 통신부(809)에 의해 수신하여, 기억부(808)에 인스톨할 수 있다. 기타, 프로그램은 ROM(802)이나 기억부(808)에, 미리 인스톨해 둘 수 있다.
또한, 컴퓨터가 실행하는 프로그램은, 본 명세서에서 설명하는 순서를 따라 시계열로 처리가 행하여지는 프로그램이어도 좋고, 병렬로, 혹은 호출이 행하여졌을 때 등의 필요한 타이밍에 처리가 행하여지는 프로그램이어도 좋다.
<제6 실시 형태>
(텔레비전 장치의 구성예)
도 114는 본 기술을 적용한 텔레비전 장치의 개략 구성을 예시하고 있다. 텔레비전 장치(900)는 안테나(901), 튜너(902), 디멀티플렉서(903), 디코더(904), 영상 신호 처리부(905), 표시부(906), 음성 신호 처리부(907), 스피커(908), 외부 인터페이스부(909)를 갖고 있다. 텔레비전 장치(900)는 제어부(910), 유저 인터페이스부(911) 등을 더 갖고 있다.
튜너(902)는 안테나(901)로 수신된 방송파 신호로부터 원하는 채널을 선국하여 복조를 행하여, 얻어진 부호화 비트 스트림을 디멀티플렉서(903)에 출력한다.
디멀티플렉서(903)는 부호화 비트 스트림으로부터 시청 대상인 프로그램의 영상이나 음성의 패킷을 추출하고, 추출된 패킷의 데이터를 디코더(904)에 출력한다. 또한, 디멀티플렉서(903)는 EPG(Electronic Program Guide) 등의 데이터의 패킷을 제어부(910)에 공급한다. 또한, 스크램블이 행해지고 있는 경우, 디멀티플렉서 등으로 스크램블의 해제를 행한다.
디코더(904)는 패킷의 복호화 처리를 행하고, 복호 처리화에 의해 생성된 영상 데이터를 영상 신호 처리부(905), 음성 데이터를 음성 신호 처리부(907)에 출력한다.
영상 신호 처리부(905)는 영상 데이터에 대하여, 노이즈 제거나 유저 설정에 따른 영상 처리 등을 행한다. 영상 신호 처리부(905)는 표시부(906)에 표시시키는 프로그램의 영상 데이터나, 네트워크를 통하여 공급되는 애플리케이션에 기초하는 처리에 의한 화상 데이터 등을 생성한다. 또한, 영상 신호 처리부(905)는 항목의 선택 등의 메뉴 화면 등을 표시하기 위한 영상 데이터를 생성하고, 그것을 프로그램의 영상 데이터에 중첩한다. 영상 신호 처리부(905)는 이와 같이 하여 생성된 영상 데이터에 기초하여 구동 신호를 생성하여 표시부(906)를 구동한다.
표시부(906)는 영상 신호 처리부(905)로부터의 구동 신호에 기초하여 표시 디바이스(예를 들어 액정 표시 소자 등)를 구동하여, 프로그램의 영상 등을 표시시킨다.
음성 신호 처리부(907)는 음성 데이터에 대하여 노이즈 제거 등의 소정의 처리를 실시하고, 처리 후의 음성 데이터의 D/A 변환 처리나 증폭 처리를 행하여 스피커(908)에 공급함으로써 음성 출력을 행한다.
외부 인터페이스부(909)는 외부 기기나 네트워크와 접속하기 위한 인터페이스이며, 영상 데이터나 음성 데이터 등의 데이터 송수신을 행한다.
제어부(910)에는 유저 인터페이스부(911)가 접속되어 있다. 유저 인터페이스부(911)는 조작 스위치나 리모트 컨트롤 신호 수신부 등으로 구성되어 있고, 유저 조작에 따른 조작 신호를 제어부(910)에 공급한다.
제어부(910)는 CPU(Central Processing Unit)나 메모리 등을 사용하여 구성되어 있다. 메모리는, CPU에 의해 실행되는 프로그램이나 CPU가 처리를 행하는 데 있어서 필요한 각종 데이터, EPG 데이터, 네트워크를 통하여 취득된 데이터 등을 기억한다. 메모리에 기억되어 있는 프로그램은, 텔레비전 장치(900)의 기동 시 등의 소정 타이밍에 CPU에 의해 판독되어 실행된다. CPU는 프로그램을 실행함으로써, 텔레비전 장치(900)가 유저 조작에 따른 동작으로 되도록 각 부를 제어한다.
또한, 텔레비전 장치(900)에서는, 튜너(902), 디멀티플렉서(903), 영상 신호 처리부(905), 음성 신호 처리부(907), 외부 인터페이스부(909) 등과 제어부(910)를 접속하기 위하여 버스(912)가 설치되어 있다.
이렇게 구성된 텔레비전 장치에서는, 디코더(904)에 본원의 복호 장치(복호 방법)의 기능이 설정된다. 이로 인해, 계층 구조를 갖는 화상의 참조 화상에 관한 정보를 공유 또는 예측할 수 있다.
<제7 실시 형태>
(휴대 전화기의 구성예)
도 115는 본 기술을 적용한 휴대 전화기의 개략 구성을 예시하고 있다. 휴대 전화기(920)는 통신부(922), 음성 코덱(923), 카메라부(926), 화상 처리부(927), 다중 분리부(928), 기록 재생부(929), 표시부(930), 제어부(931)를 갖고 있다. 이들은, 버스(933)를 통하여 서로 접속되어 있다.
또한, 통신부(922)에는 안테나(921)가 접속되어 있고, 음성 코덱(923)에는 스피커(924)와 마이크로폰(925)이 접속되어 있다. 또한 제어부(931)에는 조작부(932)가 접속되어 있다.
휴대 전화기(920)는 음성 통화 모드나 데이터 통신 모드 등의 각종 모드에서, 음성 신호의 송수신, 전자 메일이나 화상 데이터의 송수신, 화상 촬영 또는 데이터 기록 등의 각종 동작을 행한다.
음성 통화 모드에 있어서, 마이크로폰(925)으로 생성된 음성 신호는, 음성 코덱(923)에 의해 음성 데이터로의 변환이나 데이터 압축이 행하여져 통신부(922)에 공급된다. 통신부(922)는 음성 데이터의 변조 처리나 주파수 변환 처리 등을 행하여, 송신 신호를 생성한다. 또한, 통신부(922)는 송신 신호를 안테나(921)에 공급하여 도시하지 않은 기지국으로 송신한다. 또한, 통신부(922)는 안테나(921)로 수신한 수신 신호의 증폭이나 주파수 변환 처리 및 복조 처리 등을 행하여, 얻어진 음성 데이터를 음성 코덱(923)에 공급한다. 음성 코덱(923)은 음성 데이터의 데이터 신장이나 아날로그 음성 신호로의 변환을 행하여 스피커(924)에 출력한다.
또한, 데이터 통신 모드에 있어서, 메일 송신을 행하는 경우, 제어부(931)는 조작부(932)의 조작에 의해 입력된 문자 데이터를 접수하고, 입력된 문자를 표시부(930)에 표시한다. 또한, 제어부(931)는 조작부(932)에 있어서의 유저 지시 등에 기초하여 메일 데이터를 생성하여 통신부(922)에 공급한다. 통신부(922)는 메일 데이터의 변조 처리나 주파수 변환 처리 등을 행하여, 얻어진 송신 신호를 안테나(921)로부터 송신한다. 또한, 통신부(922)는 안테나(921)로 수신한 수신 신호의 증폭이나 주파수 변환 처리 및 복조 처리 등을 행하여, 메일 데이터를 복원한다. 이 메일 데이터를, 표시부(930)에 공급하여, 메일 내용 표시를 행한다.
또한, 휴대 전화기(920)는 수신한 메일 데이터를, 기록 재생부(929)에 의해 기억 매체에 기억시키는 것도 가능하다. 기억 매체는, 재기입 가능한 임의의 기억 매체이다. 예를 들어, 기억 매체는, RAM이나 내장형 플래시 메모리 등의 반도체 메모리, 하드 디스크, 자기 디스크, 광자기 디스크, 광 디스크, USB 메모리 또는 메모리 카드 등의 리무버블 미디어이다.
데이터 통신 모드에 있어서 화상 데이터를 송신하는 경우, 카메라부(926)에 의해 생성된 화상 데이터를 화상 처리부(927)에 공급한다. 화상 처리부(927)는 화상 데이터의 부호화 처리를 행하여, 부호화 데이터를 생성한다.
다중 분리부(928)는 화상 처리부(927)에 의해 생성된 부호화 데이터와, 음성 코덱(923)으로부터 공급된 음성 데이터를 소정의 방식으로 다중화하여 통신부(922)에 공급한다. 통신부(922)는 다중화 데이터의 변조 처리나 주파수 변환 처리 등을 행하여, 얻어진 송신 신호를 안테나(921)로부터 송신한다. 또한, 통신부(922)는 안테나(921)로 수신한 수신 신호의 증폭이나 주파수 변환 처리 및 복조 처리 등을 행하여, 다중화 데이터를 복원한다. 이 다중화 데이터를 다중 분리부(928)에 공급한다. 다중 분리부(928)는 다중화 데이터의 분리를 행하여, 부호화 데이터를 화상 처리부(927), 음성 데이터를 음성 코덱(923)에 공급한다. 화상 처리부(927)는 부호화 데이터의 복호화 처리를 행하여, 화상 데이터를 생성한다. 이 화상 데이터를 표시부(930)에 공급하여, 수신된 화상의 표시를 행한다. 음성 코덱(923)은, 음성 데이터를 아날로그 음성 신호로 변환하여 스피커(924)에 공급하여, 수신된 음성을 출력한다.
이렇게 구성된 휴대 전화 장치에서는, 화상 처리부(927)에 본원의 부호화 장치 및 복호 장치(부호화 방법 및 복호 방법)의 기능이 설정된다. 이로 인해, 계층 구조를 갖는 화상의 참조 화상에 관한 정보를 공유 또는 예측할 수 있다.
<제8 실시 형태>
(기록 재생 장치의 구성예)
도 116은 본 기술을 적용한 기록 재생 장치의 개략 구성을 예시하고 있다. 기록 재생 장치(940)는 예를 들어 수신한 방송 프로그램의 오디오 데이터와 비디오 데이터를 기록 매체에 기록하고, 그 기록된 데이터를 유저의 지시에 따른 타이밍에 유저에게 제공한다. 또한, 기록 재생 장치(940)는 예를 들어 다른 장치로부터 오디오 데이터나 비디오 데이터를 취득하여, 그들을 기록 매체에 기록시킬 수도 있다. 또한, 기록 재생 장치(940)는 기록 매체에 기록되어 있는 오디오 데이터나 비디오 데이터를 복호하여 출력함으로써, 모니터 장치 등에 있어서 화상 표시나 음성 출력을 행할 수 있도록 한다.
기록 재생 장치(940)는 튜너(941), 외부 인터페이스부(942), 인코더(943), HDD(Hard Disk Drive)부(944), 디스크 드라이브(945), 셀렉터(946), 디코더(947), OSD(On-Screen Display)부(948), 제어부(949), 유저 인터페이스부(950)를 갖고 있다.
튜너(941)는 도시하지 않은 안테나로 수신된 방송 신호로부터 원하는 채널을 선국한다. 튜너(941)는 원하는 채널의 수신 신호를 복조하여 얻어진 부호화 비트 스트림을 셀렉터(946)에 출력한다.
외부 인터페이스부(942)는 IEEE1394 인터페이스, 네트워크 인터페이스부, USB 인터페이스, 플래시 메모리 인터페이스 등의 적어도 어느 하나로 구성되어 있다. 외부 인터페이스부(942)는 외부 기기나 네트워크, 메모리 카드 등과 접속하기 위한 인터페이스이며, 기록하는 영상 데이터나 음성 데이터 등의 데이터 수신을 행한다.
인코더(943)는 외부 인터페이스부(942)로부터 공급된 영상 데이터나 음성 데이터가 부호화되어 있지 않을 때 소정의 방식으로 부호화를 행하여, 부호화 비트 스트림을 셀렉터(946)에 출력한다.
HDD부(944)는 영상이나 음성 등의 콘텐츠 데이터, 각종 프로그램이나 그 밖의 데이터 등을 내장의 하드 디스크에 기록하고, 또한 재생 시 등에 그들을 당해 하드 디스크로부터 판독한다.
디스크 드라이브(945)는 장착되어 있는 광 디스크에 대한 신호의 기록 및 재생을 행한다. 광 디스크, 예를 들어 DVD 디스크(DVD-Video, DVD-RAM, DVD-R, DVD-RW, DVD+R, DVD+RW 등)나 Blu-ray(등록 상표) 디스크 등이다.
셀렉터(946)는 영상이나 음성의 기록 시에는 튜너(941) 또는 인코더(943)로부터의 어느 하나의 부호화 비트 스트림을 선택하여, HDD부(944)나 디스크 드라이브(945) 중 어느 하나에 공급한다. 또한, 셀렉터(946)는 영상이나 음성의 재생 시에, HDD부(944) 또는 디스크 드라이브(945)로부터 출력된 부호화 비트 스트림을 디코더(947)에 공급한다.
디코더(947)는 부호화 비트 스트림의 복호화 처리를 행한다. 디코더(947)는 복호 처리화를 행함으로써 생성된 영상 데이터를 OSD부(948)에 공급한다. 또한, 디코더(947)는 복호 처리화를 행함으로써 생성된 음성 데이터를 출력한다.
OSD부(948)는 항목의 선택 등의 메뉴 화면 등을 표시하기 위한 영상 데이터를 생성하고, 그것을 디코더(947)로부터 출력된 영상 데이터에 중첩하여 출력한다.
제어부(949)에는 유저 인터페이스부(950)가 접속되어 있다. 유저 인터페이스부(950)는 조작 스위치나 리모트 컨트롤 신호 수신부 등으로 구성되어 있고, 유저 조작에 따른 조작 신호를 제어부(949)에 공급한다.
제어부(949)는 CPU나 메모리 등을 사용하여 구성되어 있다. 메모리는, CPU에 의해 실행되는 프로그램이나 CPU가 처리를 행하는 데 있어서 필요한 각종 데이터를 기억한다. 메모리에 기억되어 있는 프로그램은, 기록 재생 장치(940)의 기동시 등의 소정 타이밍에 CPU에 의해 판독되어 실행된다. CPU는 프로그램을 실행함으로써, 기록 재생 장치(940)가 유저 조작에 따른 동작으로 되도록 각 부를 제어한다.
이렇게 구성된 기록 재생 장치에서는, 디코더(947)에 본원의 복호 장치(복호 방법)의 기능이 설정된다. 이로 인해, 계층 구조를 갖는 화상의 참조 화상에 관한 정보를 공유 또는 예측할 수 있다.
<제9 실시 형태>
(촬상 장치의 구성예)
도 117은 본 기술을 적용한 촬상 장치의 개략 구성을 예시하고 있다. 촬상 장치(960)는 피사체를 촬상하여, 피사체의 화상을 표시부에 표시시키거나, 그것을 화상 데이터로서, 기록 매체에 기록한다.
촬상 장치(960)는 광학 블럭(961), 촬상부(962), 카메라 신호 처리부(963), 화상 데이터 처리부(964), 표시부(965), 외부 인터페이스부(966), 메모리부(967), 미디어 드라이브(968), OSD부(969), 제어부(970)를 갖고 있다. 또한, 제어부(970)에는, 유저 인터페이스부(971)가 접속되어 있다. 또한, 화상 데이터 처리부(964)나 외부 인터페이스부(966), 메모리부(967), 미디어 드라이브(968), OSD부(969), 제어부(970) 등)는 버스(972)를 통하여 접속되어 있다.
광학 블럭(961)은, 포커스 렌즈나 조리개 기구 등을 사용하여 구성되어 있다. 광학 블럭(961)은 피사체의 광학상을 촬상부(962)의 촬상면에 결상시킨다. 촬상부(962)는 CCD 또는 CMOS 이미지 센서를 사용하여 구성되어 있고, 광전 변환에 의해 광학상에 따른 전기 신호를 생성하여 카메라 신호 처리부(963)에 공급한다.
카메라 신호 처리부(963)는 촬상부(962)로부터 공급된 전기 신호에 대하여 니 보정이나 감마 보정, 색보정 등의 다양한 카메라 신호 처리를 행한다. 카메라 신호 처리부(963)는 카메라 신호 처리 후의 화상 데이터를 화상 데이터 처리부(964)에 공급한다.
화상 데이터 처리부(964)는 카메라 신호 처리부(963)로부터 공급된 화상 데이터의 부호화 처리를 행한다. 화상 데이터 처리부(964)는 부호화 처리를 행함으로써 생성된 부호화 데이터를 외부 인터페이스부(966)나 미디어 드라이브(968)에 공급한다. 또한, 화상 데이터 처리부(964)는 외부 인터페이스부(966)나 미디어 드라이브(968)로부터 공급된 부호화 데이터의 복호화 처리를 행한다. 화상 데이터 처리부(964)는 복호화 처리를 행함으로써 생성된 화상 데이터를 표시부(965)에 공급한다. 또한, 화상 데이터 처리부(964)는 카메라 신호 처리부(963)로부터 공급된 화상 데이터를 표시부(965)에 공급하는 처리나, OSD부(969)로부터 취득한 표시용 데이터를 화상 데이터에 중첩시켜 표시부(965)에 공급한다.
OSD부(969)는 기호, 문자 또는 도형을 포함하는 메뉴 화면이나 아이콘 등의 표시용 데이터를 생성하여 화상 데이터 처리부(964)에 출력한다.
외부 인터페이스부(966)는 예를 들어 USB 입출력 단자 등으로 구성되고, 화상의 인쇄를 행하는 경우에 프린터와 접속된다. 또한, 외부 인터페이스부(966)에는 필요에 따라 드라이브가 접속되고, 자기 디스크, 광 디스크 등의 리무버블 미디어가 적절히 장착되어, 그들로부터 판독된 컴퓨터 프로그램이 필요에 따라 인스톨된다. 또한, 외부 인터페이스부(966)는 LAN이나 인터넷 등의 소정의 네트워크에 접속되는 네트워크 인터페이스를 갖는다. 제어부(970)는 예를 들어 유저 인터페이스부(971)로부터의 지시에 따라, 미디어 드라이브(968)로부터 부호화 데이터를 판독하고, 그것을 외부 인터페이스부(966)로부터 네트워크를 통하여 접속되는 다른 장치에 공급시킬 수 있다. 또한, 제어부(970)는 네트워크를 통하여 다른 장치로부터 공급되는 부호화 데이터나 화상 데이터를, 외부 인터페이스부(966)를 통하여 취득하고, 그것을 화상 데이터 처리부(964)에 공급하거나 할 수 있다.
미디어 드라이브(968)에 의해 구동되는 기록 미디어로서는, 예를 들어 자기 디스크, 광자기 디스크, 광 디스크 또는 반도체 메모리 등의, 판독 기입 가능한 임의의 리무버블 미디어가 사용된다. 또한, 기록 미디어는, 리무버블 미디어로서의 종류도 임의이며, 테이프 디바이스이어도 좋고, 디스크이어도 좋고, 메모리 카드이어도 좋다. 물론, 비접촉 IC(Integrated Circuit) 카드 등이어도 좋다.
또한, 미디어 드라이브(968)와 기록 미디어를 일체화하여, 예를 들어 내장형 하드디스크 드라이브나 SSD(Solid State Drive) 등과 같이, 비가반성의 기억 매체에 의해 구성되도록 해도 좋다.
제어부(970)는 CPU를 사용하여 구성되어 있다. 메모리부(967)는 제어부(970)에 의해 실행되는 프로그램이나 제어부(970)가 처리를 행하는 데 있어서 필요한 각종 데이터 등을 기억한다. 메모리부(967)에 기억되어 있는 프로그램은, 촬상 장치(960)의 기동 시 등의 소정 타이밍에 제어부(970)에 의해 판독되어 실행된다. 제어부(970)는 프로그램을 실행함으로써, 촬상 장치(960)가 유저 조작에 따른 동작으로 되도록 각 부를 제어한다.
이렇게 구성된 촬상 장치에서는, 화상 데이터 처리부(964)에 본원의 부호화 장치 및 복호 장치(부호화 방법 및 복호 방법)의 기능이 설정된다. 이로 인해, 계층 구조를 갖는 화상의 참조 화상에 관한 정보를 공유 또는 예측할 수 있다.
<스케일러블 부호화의 응용예>
(제1 시스템)
이어서, scalable 기능에 의한 부호화인 스케일러블 부호화(계층 부호화)된 스케일러블 부호화 데이터의 구체적인 이용 예에 대하여 설명한다. 스케일러블 부호화는, 예를 들어 도 118에 도시된 예와 같이 전송하는 데이터의 선택을 위하여 이용된다.
도 118에 도시된 데이터 전송 시스템(1000)에 있어서, 배신 서버(1002)는 스케일러블 부호화 데이터 기억부(1001)에 기억되어 있는 스케일러블 부호화 데이터를 판독하고, 네트워크(1003)를 통하여, 퍼스널 컴퓨터(1004), AV 기기(1005), 태블릿 디바이스(1006) 및 휴대 전화기(1007) 등의 단말 장치에 배신한다.
그 때, 배신 서버(1002)는 단말 장치의 능력이나 통신 환경 등에 따라, 적절한 품질의 부호화 데이터를 선택하여 전송한다. 배신 서버(1002)가 불필요하게 고품질의 데이터를 전송해도, 단말 장치에 있어서 고화질의 화상을 얻어진다고 만은 할 수 없고, 지연이나 오버플로우의 발생 요인이 될 우려가 있다. 또한, 불필요에 통신 대역을 점유하거나, 단말 장치의 부하를 불필요하게 증대시키거나 해 버릴 우려도 있다. 반대로, 배신 서버(1002)가 불필요하게 저품질의 데이터를 전송해도, 단말 장치에 있어서 충분한 화질의 화상을 얻지 못할 우려가 있다. 그로 인해, 배신 서버(1002)는 스케일러블 부호화 데이터 기억부(1001)에 기억되어 있는 스케일러블 부호화 데이터를, 적절히 단말 장치의 능력이나 통신 환경 등에 대하여 적절한 품질의 부호화 데이터로서 판독하여, 전송한다.
예를 들어, 스케일러블 부호화 데이터 기억부(1001)는 스케일러블에 부호화된 스케일러블 부호화 데이터(BL+EL)(1011)를 기억한다고 하자. 이 스케일러블 부호화 데이터(BL+EL)(1011)는 베이스 레이어와 인핸스먼트 레이어 양쪽을 포함하는 부호화 데이터이며, 복호함으로써, 베이스 레이어의 화상 및 인핸스먼트 레이어의 화상 양쪽을 얻을 수 있는 데이터이다.
배신 서버(1002)는 데이터를 전송하는 단말 장치의 능력이나 통신 환경 등에 따라, 적절한 레이어를 선택하여, 그 레이어의 데이터를 판독한다. 예를 들어, 배신 서버(1002)는 처리 능력이 높은 퍼스널 컴퓨터(1004)나 태블릿 디바이스(1006)에 대해서는, 고품질의 스케일러블 부호화 데이터(BL+EL)(1011)를 스케일러블 부호화 데이터 기억부(1001)로부터 판독하여, 그대로 전송한다. 이에 반하여, 예를 들어 배신 서버(1002)는 처리 능력이 낮은 AV 기기(1005)나 휴대 전화기(1007)에 대해서는, 스케일러블 부호화 데이터(BL+EL)(1011)로부터 베이스 레이어의 데이터를 추출하여, 스케일러블 부호화 데이터(BL+EL)(1011)와 동일한 콘텐츠의 데이터이지만, 스케일러블 부호화 데이터(BL+EL)(1011)보다도 저품질의 스케일러블 부호화 데이터(BL)(1012)로서 전송한다.
이렇게 스케일러블 부호화 데이터를 사용함으로써, 데이터량을 용이하게 조정할 수 있으므로, 지연이나 오버플로우의 발생을 억제하거나, 단말 장치나 통신 매체의 부하의 불필요한 증대를 억제하거나 할 수 있다. 또한, 스케일러블 부호화 데이터(BL+EL)(1011)는 레이어간의 용장성이 저감되어 있으므로, 각 레이어의 부호화 데이터를 개별의 데이터로 하는 경우보다도 그 데이터량을 저감시킬 수 있다. 따라서, 스케일러블 부호화 데이터 기억부(1001)의 기억 영역을 보다 효율적으로 사용할 수 있다.
또한, 퍼스널 컴퓨터(1004) 내지 휴대 전화기(1007)와 같이, 단말 장치에는 다양한 장치를 적용할 수 있으므로, 단말 장치의 하드웨어 성능은 장치에 따라 상이하다. 또한, 단말 장치가 실행하는 애플리케이션도 다양하므로, 그 소프트웨어의 능력도 다양하다. 또한, 통신 매체가 되는 네트워크(1003)도, 예를 들어 인터넷이나 LAN(Local Area Network) 등, 유선 혹은 무선, 또는 그 양쪽을 포함하는 모든 통신 회선망을 적용할 수 있어, 그 데이터 전송 능력은 다양하다. 또한, 다른 통신 등에 의해서도 변화될 우려가 있다.
따라서, 배신 서버(1002)는 데이터 전송을 개시하기 전에, 데이터의 전송처가 되는 단말기 장치와 통신을 행하여, 단말 장치의 하드웨어 성능이나, 단말 장치가 실행하는 애플리케이션(소프트웨어)의 성능 등과 같은 단말 장치의 능력에 관한 정보, 및 네트워크(1003)의 이용 가능 대역폭 등의 통신 환경에 관한 정보를 얻도록 해도 좋다. 그리고, 배신 서버(1002)가, 여기에서 얻은 정보를 기초로, 적절한 레이어를 선택하도록 해도 좋다.
또한, 레이어의 추출은, 단말 장치에 있어서 행하도록 해도 좋다. 예를 들어, 퍼스널 컴퓨터(1004)가, 전송된 스케일러블 부호화 데이터(BL+EL)(1011)를 복호하여, 베이스 레이어의 화상을 표시해도 좋고, 인핸스먼트 레이어의 화상을 표시해도 좋다. 또한, 예를 들어 퍼스널 컴퓨터(1004)가, 전송된 스케일러블 부호화 데이터(BL+EL)(1011)로부터, 베이스 레이어의 스케일러블 부호화 데이터(BL)(1012)를 추출하여, 기억하거나, 다른 장치에 전송하거나, 복호하여 베이스 레이어의 화상을 표시하거나 하도록 해도 좋다.
물론, 스케일러블 부호화 데이터 기억부(1001), 배신 서버(1002), 네트워크(1003) 및 단말 장치의 수는 모두 임의이다. 또한, 이상에 있어서는, 배신 서버(1002)가 데이터를 단말 장치에 전송하는 예에 대하여 설명했지만, 이용예는 이것에 한정되지 않는다. 데이터 전송 시스템(1000)은, 스케일러블 부호화된 부호화 데이터를 단말 장치에 전송할 때, 단말 장치의 능력이나 통신 환경 등에 따라, 적절한 레이어를 선택하여 전송하는 시스템이면, 임의의 시스템에 적용할 수 있다.
(제2 시스템)
또한, 스케일러블 부호화는, 예를 들어 도 119에 도시된 예와 같이, 복수의 통신 매체를 통하는 전송을 위하여 이용된다.
도 119에 도시된 데이터 전송 시스템(1100)에 있어서, 방송국(1101)은, 지상파 방송(1111)에 의해 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)를 전송한다. 또한, 방송국(1101)은 유선 혹은 무선 또는 그 양쪽의 통신망으로 이루어지는 임의의 네트워크(1112)를 통하여, 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 전송한다(예를 들어 패킷화하여 전송함).
단말 장치(1102)는 방송국(1101)이 방송하는 지상파 방송(1111)의 수신 기능을 갖고, 이 지상파 방송(1111)을 통하여 전송되는 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)를 수취한다. 또한, 단말 장치(1102)는 네트워크(1112)를 통한 통신을 행하는 통신 기능을 더 갖고, 이 네트워크(1112)를 통하여 전송되는 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 수취한다.
단말 장치(1102)는 예를 들어 유저 지시 등에 따라, 지상파 방송(1111)을 통하여 취득한 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)를, 복호하여 베이스 레이어의 화상을 얻거나, 기억하거나, 다른 장치에 전송하거나 한다.
또한, 단말 장치(1102)는 예를 들어 유저 지시 등에 따라, 지상파 방송(1111)을 통하여 취득한 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)와, 네트워크(1112)를 통하여 취득한 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 합성하여, 스케일러블 부호화 데이터(BL+EL)를 얻거나, 그것을 복호하여 인핸스먼트 레이어의 화상을 얻거나, 기억하거나, 다른 장치에 전송하거나 한다.
이상과 같이, 스케일러블 부호화 데이터는, 예를 들어 레이어마다 상이한 통신 매체를 통하여 전송시킬 수 있다. 따라서, 부하를 분산시킬 수 있어, 지연이나 오버플로우의 발생을 억제할 수 있다.
또한, 상황에 따라 전송에 사용하는 통신 매체를 레이어마다 선택할 수 있도록 해도 좋다. 예를 들어, 데이터량이 비교적 많은 베이스 레이어의 스케일러블 부호화 데이터(BL)(1121)를 대역폭이 넓은 통신 매체를 통하여 전송시키고, 데이터량이 비교적 적은 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 대역폭이 좁은 통신 매체를 통하여 전송시키도록 해도 좋다. 또한, 예를 들어 인핸스먼트 레이어의 스케일러블 부호화 데이터(EL)(1122)를 전송하는 통신 매체를, 네트워크(1112)로 할지, 지상파 방송(1111)으로 할지를, 네트워크(1112)의 이용 가능 대역폭에 따라 전환하도록 해도 좋다. 물론, 임의의 레이어의 데이터에 대하여 마찬가지이다.
이렇게 제어함으로써, 데이터 전송에 있어서의 부하의 증대를 보다 억제할 수 있다.
물론, 레이어수는 임의이며, 전송에 이용하는 통신 매체의 수도 임의이다. 또한, 데이터 배신처가 되는 단말 장치(1102)의 수도 임의이다. 또한, 이상에 있어서는, 방송국(1101)으로부터의 방송을 예로 들어 설명했지만, 이용예는 이것에 한정되지 않는다. 데이터 전송 시스템(1100)은, 스케일러블 부호화된 부호화 데이터를, 레이어를 단위로 하여 복수로 분할하여, 복수의 회선을 통하여 전송하는 시스템이면, 임의의 시스템에 적용할 수 있다.
(제3 시스템)
또한, 스케일러블 부호화는, 예를 들어 도 120에 도시된 예와 같이, 부호화 데이터의 기억에 이용된다.
도 120에 도시한 촬상 시스템(1200)에 있어서, 촬상 장치(1201)는 피사체(1211)를 촬상하여 얻어진 화상 데이터를 스케일러블 부호화하고, 스케일러블 부호화 데이터(BL+EL)(1221)로서, 스케일러블 부호화 데이터 기억 장치(1202)에 공급한다.
스케일러블 부호화 데이터 기억 장치(1202)는 촬상 장치(1201)로부터 공급되는 스케일러블 부호화 데이터(BL+EL)(1221)를 상황에 따른 품질로 기억한다. 예를 들어, 통상 시의 경우, 스케일러블 부호화 데이터 기억 장치(1202)는 스케일러블 부호화 데이터(BL+EL)(1221)로부터 베이스 레이어의 데이터를 추출하여, 저품질이고 데이터량이 적은 베이스 레이어의 스케일러블 부호화 데이터(BL)(1222)로서 기억한다. 이에 반하여, 예를 들어 주목 시의 경우, 스케일러블 부호화 데이터 기억 장치(1202)는 고품질이고 데이터량이 많은 스케일러블 부호화 데이터(BL+EL)(1221)인 상태로 기억한다.
이와 같이 함으로써, 스케일러블 부호화 데이터 기억 장치(1202)는 필요한 경우에만, 화상을 고화질로 보존할 수 있으므로, 화질 열화에 의한 화상의 가치의 저감을 억제하면서, 데이터량의 증대를 억제할 수 있어, 기억 영역의 이용 효율을 향상시킬 수 있다.
예를 들어, 촬상 장치(1201)가 감시 카메라이라고 하자. 촬상 화상에 감시 대상(예를 들어 침입자)이 찍혀 있지 않은 경우(통상 시의 경우), 촬상 화상의 내용은 중요하지 않을 가능성이 높으므로, 데이터량의 저감이 우선되어, 그 화상 데이터(스케일러블 부호화 데이터))는 저품질로 기억된다. 이에 반하여, 촬상 화상에 감시 대상이 피사체(1211)로서 찍혀 있는 경우(주목 시의 경우), 그 촬상 화상의 내용은 중요할 가능성이 높으므로, 화질이 우선되어, 그 화상 데이터(스케일러블 부호화 데이터)는 고품질로 기억된다.
또한, 통상 시인지 주목 시인지는, 예를 들어 스케일러블 부호화 데이터 기억 장치(1202)가 화상을 해석함으로써 판정해도 좋다. 또한, 촬상 장치(1201)가 판정하고, 그 판정 결과를 스케일러블 부호화 데이터 기억 장치(1202)에 전송하도록 해도 좋다.
또한, 통상 시인지 주목 시인지의 판정 기준은 임의이며, 판정 기준으로 하는 화상의 내용은 임의이다. 물론, 화상의 내용 이외의 조건을 판정 기준으로 할 수도 있다. 예를 들어, 수록한 음성의 크기나 파형 등에 따라 전환하도록 해도 좋고, 소정의 시일마다로 전환하도록 해도 좋고, 유저 지시 등의 외부로부터의 지시에 의해 전환하도록 해도 좋다.
또한, 이상에 있어서는, 통상 시와 주목 시의 2개의 상태를 전환하는 예를 설명했지만, 상태의 수는 임의이며, 예를 들어 통상 시, 약간 주목 시, 주목 시, 매우 주목 시 등과 같이, 3개 이상의 상태를 전환하도록 해도 좋다. 단, 이 전환하는 상태의 상한수는, 스케일러블 부호화 데이터의 레이어수에 의존한다.
또한, 촬상 장치(1201)가, 스케일러블 부호화의 레이어수를, 상태에 따라 결정하도록 해도 좋다. 예를 들어, 통상 시의 경우, 촬상 장치(1201)가 저품질이고 데이터량이 적은 베이스 레이어의 스케일러블 부호화 데이터(BL)(1222)를 생성하여 스케일러블 부호화 데이터 기억 장치(1202)에 공급하도록 해도 좋다. 또한, 예를 들어 주목 시의 경우, 촬상 장치(1201)가, 고품질이고 데이터량이 많은 베이스 레이어의 스케일러블 부호화 데이터(BL+EL)(1221)를 생성하여, 스케일러블 부호화 데이터 기억 장치(1202)에 공급하도록 해도 좋다.
이상에 있어서는, 감시 카메라를 예로 들어 설명했지만, 이 촬상 시스템(1200)의 용도는 임의이며, 감시 카메라에 한정되지 않는다.
또한, 본 명세서에서는, 참조 화상 특정 정보나 가중치 부여 생성 정보 등의 각종 정보가 부호화 스트림에 다중화되어, 부호화측으로부터 복호측으로 전송되는 예에 대하여 설명했다. 그러나, 이들 정보를 전송하는 방법은 이러한 예에 한정되지 않는다. 예를 들어, 이들 정보는 부호화 비트 스트림에 다중화되지 않고, 부호화 비트 스트림과 관련지어진 별개의 데이터로서 전송되거나 또는 기록되어도 좋다. 여기서, 「관련짓는다」라는 용어는, 비트 스트림에 포함되는 화상(슬라이스 혹은 블럭 등, 화상의 일부이어도 됨)과 당해 화상에 대응하는 정보를 복호 시에 링크시킬 수 있도록 하는 것을 의미한다. 즉, 정보는, 화상(또는 비트 스트림)과는 다른 전송로 상에서 전송되어도 좋다. 또한, 정보는, 화상(또는 비트 스트림)과는 다른 기록 매체(또는 동일한 기록 매체의 다른 기록 에리어)에 기록되어도 좋다. 또한, 정보와 화상(또는 비트 스트림)은, 예를 들어 복수 프레임, 1프레임, 또는 프레임 내의 일부분 등이 임의의 단위로 서로 관련지어져도 좋다.
본 기술은, MPEG, H.26x 등과 같이, 이산 코사인 변환 등의 직교 변환과 움직임 보상에 의해 압축된 비트 스트림을, 위성 방송, 케이블 TV, 인터넷, 휴대 전화 등의 네트워크 미디어를 통하여 수신할 때 또는 광자기 디스크, 플래시 메모리와 같은 기억 미디어 상에서 처리할 때에 사용되는 부호화 장치나 복호 장치에 적용할 수 있다.
또한, 본 명세서에서는, HEVC 방식에 준하는 방식으로 부호화 및 복호하는 경우를 예로서 설명했지만, 본 기술의 적용 범위는 이것에 제한하지 않는다. Spatial Scalability, SNR Scalability와 같이, 베이스 화상과 인핸스먼트 화상이 1대1로 대응하도록 부호화 대상의 화상을 계층화하여, 인터 예측을 사용하여 부호화하는 부호화 장치 및 대응하는 복호 장치이면, 다른 방식의 부호화 장치 및 복호 장치에 적용할 수도 있다.
또한, 본 기술의 실시 형태는, 상술한 실시 형태에 한정되는 것은 아니며, 본 기술의 요지를 일탈하지 않는 범위에서 다양한 변경이 가능하다.
예를 들어, 본 기술은, 1개의 기능을 네트워크를 통하여 복수의 장치로 분담, 공동으로 처리하는 클라우드 컴퓨팅의 구성을 취할 수 있다.
또한, 상술한 흐름도에서 설명한 각 스텝은, 1개의 장치로 실행하는 것 외에, 복수의 장치로 분담하여 실행할 수 있다.
또한, 1개의 스텝에 복수의 처리가 포함되는 경우에는, 그 1개의 스텝에 포함되는 복수의 처리는 1개의 장치로 실행하는 것 외에, 복수의 장치로 분담하여 실행할 수 있다.
또한, 제1 실시 형태와 제2 실시 형태를 조합해도 좋다. 이 경우, 계층간에서 참조 화상 특정 정보와 가중치 부여 정보가 공유 또는 예측된다.
또한, 본 기술은, 이하와 같은 구성도 취할 수 있다.
(1)
계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상의 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용하여, 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보를 설정하는 설정부와,
상기 제1 계층의 화상을 상기 제1 참조 화상을 사용하여 부호화하여, 부호화 데이터를 생성하는 부호화부와,
상기 부호화부에 의해 생성된 상기 부호화 데이터와, 상기 설정부에 의해 설정된 상기 참조 화상 생성 정보를 전송하는 전송부를 구비하는 부호화 장치.
(2)
상기 설정부는, 상기 제1 참조 화상 정보와 상기 제2 참조 화상 정보가 동일한 경우, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 정보로서 상기 제2 참조 화상 정보를 사용하는 것을 나타내는 정보를 설정하는 상기 (1)에 기재된 부호화 장치.
(3)
상기 설정부는, 상기 제1 참조 화상 정보와 상기 제2 참조 화상 정보가 동일하지 않은 경우, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 정보와 상기 제2 참조 화상 정보의 차분과, 상기 제2 참조 화상 정보와 상기 차분으로부터 상기 제1 참조 화상 정보를 예측하는 것을 나타내는 정보를 설정하는 상기 (1) 또는 (2)에 기재된 부호화 장치.
(4)
상기 전송부는, 상기 제1 계층을 특정하는 정보를 전송하는 상기 (1) 내지 (3) 중 어느 하나에 기재된 부호화 장치.
(5)
상기 제1 참조 화상 정보는, 상기 제1 참조 화상을 특정하는 정보이며,
상기 제2 참조 화상 정보는, 상기 제2 참조 화상을 특정하는 정보인 상기 (2)에 기재된 부호화 장치.
(6)
상기 설정부는, 상기 참조 화상 생성 정보를 SPS(Sequence Parameter Set) 단위로 설정하는 상기 (5)에 기재된 부호화 장치.
(7)
상기 설정부는,
short term의 상기 제1 참조 화상을 특정하는 정보인 제1 참조 화상 특정 정보와, short term의 상기 제2 참조 화상을 특정하는 정보인 제2 참조 화상 특정 정보가 동일한 경우, short term의 상기 참조 화상 생성 정보로서, 상기 short term의 제1 참조 화상 특정 정보로서 상기 short term의 제2 참조 화상 특정 정보를 사용하는 것을 나타내는 정보를 설정하고,
long term의 상기 제1 참조 화상 특정 정보와 long term의 상기 제2 참조 화상 특정 정보가 동일한 경우, long term의 상기 참조 화상 생성 정보로서, 상기 long term의 제1 참조 화상 특정 정보로서 상기 long term의 제2 참조 화상 특정 정보를 사용하는 것을 나타내는 정보를 설정하는 상기 (5) 또는 (6)에 기재된 부호화 장치.
(8)
상기 설정부는, 상기 제1 참조 화상의 설정 모드에 기초하여, short term의 상기 제1 참조 화상을 특정하는 정보인 제1 참조 화상 특정 정보와, short term의 상기 제2 참조 화상을 특정하는 정보인 제2 참조 화상 특정 정보가 동일한 경우, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 특정 정보로서 상기 제2 참조 화상 특정 정보를 사용하는 것을 나타내는 정보를 설정하는 상기 (5) 또는 (6)에 기재된 부호화 장치.
(9)
상기 설정부는, 상기 제2 계층의 화상 부호화 방식에 기초하여, 상기 참조 화상 생성 정보를 설정하는 상기 (5) 내지 (8) 중 어느 하나에 기재된 부호화 장치.
(10)
상기 설정부는, short term의 상기 제1 참조 화상을 특정하는 정보인 제1 참조 화상 특정 정보 모두가, short term의 상기 제2 참조 화상을 특정하는 정보인 제2 참조 화상 특정 정보에 포함되는 경우, 상기 참조 화상 생성 정보로서, 상기 short term의 제1 참조 화상 특정 정보로서 상기 short term의 제2 참조 화상 특정 정보의 일부를 사용하는 것을 나타내는 정보를 설정하는 상기 (5) 또는 (6)에 기재된 부호화 장치.
(11)
상기 설정부는, 상기 short term의 제1 참조 화상 특정 정보 모두가, 상기 short term의 제2 참조 화상 특정 정보에 포함되는 경우, 상기 제2 참조 화상마다, 상기 short term의 제2 참조 화상 특정 정보가 상기 short term의 제1 참조 화상 특정 정보로서 사용되는지를 나타내는 사용 정보를 설정하고,
상기 전송부는, 상기 설정부에 의해 설정된 상기 사용 정보를 전송하는 상기 (10)에 기재된 부호화 장치.
(12)
가중 계수를 포함하는 가중치 부여 정보를 사용하여 상기 제1 참조 화상에 대하여 가중치 부여를 행하는 가중치 부여 처리부를 더 구비하고,
상기 제1 참조 화상 정보는, 상기 제1 참조 화상의 상기 가중치 부여 정보이며,
상기 제2 참조 화상 정보는, 상기 제2 참조 화상의 가중치 부여 정보이며,
상기 부호화부는, 상기 가중치 부여 처리부에 의해 가중치 부여가 행하여진 상기 제1 참조 화상을 사용하여 상기 제1 계층의 화상을 부호화하는 상기 (1) 내지 (4) 중 어느 하나에 기재된 부호화 장치.
(13)
상기 가중치 부여 처리부는, 상기 제2 참조 화상에 대하여 가중치 부여가 행해진 경우, 상기 제1 참조 화상에 대하여 상기 가중치 부여를 행하는 상기 (12)에 기재된 부호화 장치.
(14)
부호화 장치가,
계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용하여, 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보를 설정하는 설정 스텝과,
상기 제1 계층의 화상을 상기 제1 참조 화상을 사용하여 부호화하여, 부호화 데이터를 생성하는 부호화 스텝과,
상기 부호화 스텝의 처리에 의해 생성된 상기 부호화 데이터와, 상기 설정 스텝의 처리에 의해 설정된 상기 참조 화상 생성 정보를 전송하는 전송 스텝을 포함하는 부호화 방법.
(15)
계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용하여 생성된, 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보와, 상기 제1 계층의 화상 부호화 데이터를 수취하는 수취부와,
상기 참조 화상 생성 정보를 사용하여 상기 제1 참조 화상 정보를 생성하는 생성부와,
상기 생성부에 의해 생성된 상기 제1 참조 화상 정보에 기초하여, 상기 제1 계층의 화상 부호화 데이터를 상기 제1 참조 화상을 사용하여 복호하는 복호부를 구비하는 복호 장치.
(16)
상기 수취부는, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 정보로서 상기 제2 참조 화상 정보를 사용하는 것을 나타내는 정보를 수취하고,
상기 생성부는, 상기 수취부에 의해 수취된 상기 참조 화상 생성 정보에 기초하여, 상기 제2 참조 화상 정보를 상기 제1 참조 화상 정보로서 생성하는 상기 (15)에 기재된 복호 장치.
(17)
상기 수취부는, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 정보와 상기 제2 참조 화상 정보의 차분과, 상기 제2 참조 화상 정보와 상기 차분과로부터 상기 제1 참조 화상 정보를 예측하는 것을 나타내는 정보를 수취하고,
상기 생성부는, 상기 수취부에 의해 수취된 상기 정보에 기초하여, 상기 제2 참조 화상 정보와 상기 수취부에 의해 수취된 상기 차분을 가산하고, 그 결과 얻어지는 가산값을 상기 제1 참조 화상 정보로서 생성하는 상기 (15) 또는 (16)에 기재된 복호 장치.
(18)
상기 수취부는, 상기 제1 계층을 특정하는 정보를 수취하고,
상기 생성부는, 상기 제1 계층을 특정하는 정보에 기초하여 상기 제1 참조 화상 정보를 생성하는 상기 (15) 내지 (17) 중 어느 하나에 기재된 복호 장치.
(19)
상기 제1 참조 화상 정보는, 상기 제1 참조 화상을 특정하는 정보이며,
상기 제2 참조 화상 정보는, 상기 제2 참조 화상을 특정하는 정보인 상기 (16)에 기재된 복호 장치.
(20)
상기 수취부는, SPS(Sequence Parameter Set) 단위로 설정된 상기 참조 화상 생성 정보를 수취하는 상기 (19)에 기재된 복호 장치.
(21)
상기 수취부는, short term의 상기 제1 참조 화상을 특정하는 정보인 제1 참조 화상 특정 정보로서, short term의 상기 제2 참조 화상을 특정하는 정보인 제2 참조 화상 특정 정보를 사용하는 것을 나타내는 short term의 상기 참조 화상 생성 정보와, long term의 상기 제1 참조 화상 특정 정보로서, long term의 상기 제2 참조 화상 특정 정보를 사용하는 것을 나타내는 long term의 상기 참조 화상 생성 정보를 수취하고,
상기 생성부는, 상기 수취부에 의해 수취된 short term의 상기 참조 화상 생성 정보에 기초하여, 상기 short term의 제2 참조 화상 특정 정보를 상기 short term의 제1 참조 화상 특정 정보로서 생성하고, 상기 수취부에 의해 수취된 long term의 상기 참조 화상 생성 정보에 기초하여, 상기 long term의 제2 참조 화상 특정 정보를 상기 long term의 제1 참조 화상 특정 정보로서 생성하는 상기 (19) 또는 (20)에 기재된 복호 장치.
(22)
상기 수취부는, 상기 제1 참조 화상의 설정 모드에 기초하여 설정된, short term의 상기 제1 참조 화상을 특정하는 정보인 제1 참조 화상 특정 정보로서, short term의 상기 제2 참조 화상을 특정하는 정보인 제2 참조 화상 특정 정보를 사용하는 것을 나타내는 정보를, 상기 참조 화상 생성 정보로서 수취하고,
상기 생성부는, 상기 수취부에 의해 수취된 상기 참조 화상 생성 정보에 기초하여, 상기 short term의 제2 참조 화상 특정 정보를 상기 short term의 제1 참조 화상 특정 정보로서 생성하고, 상기 참조 화상 생성 정보와 상기 설정 모드에 기초하여, 상기 long term의 제2 참조 화상 특정 정보를 상기 long term의 제1 참조 화상 특정 정보로서 생성하는 상기 (19) 또는 (20)에 기재된 복호 장치.
(23)
상기 수취부는, 상기 제2 계층의 화상 부호화 방식에 기초하여 설정된 상기 참조 화상 생성 정보를 수취하는 상기 (19) 내지 (22) 중 어느 하나에 기재된 복호 장치.
(24)
상기 수취부는, short term의 상기 제1 참조 화상을 특정하는 정보인 제1 참조 화상 특정 정보로서, short term의 상기 제2 참조 화상을 특정하는 정보인 제2 참조 화상 특정 정보의 일부를 사용하는 것을 나타내는 정보를 상기 참조 화상 생성 정보로서 수취하고,
상기 생성부는, 상기 수취부에 의해 수취된 상기 참조 화상 생성 정보에 기초하여, 상기 short term의 제2 참조 화상 특정 정보의 일부를 상기 short term의 제1 참조 화상 특정 정보로서 생성하는 상기 (19) 또는 (20)에 기재된 복호 장치.
(25)
상기 수취부는, 상기 제2 참조 화상마다, 상기 short term의 제2 참조 화상 특정 정보가 상기 short term의 제1 참조 화상 특정 정보로서 사용되는지를 나타내는 사용 정보를 수취하고,
상기 생성부는, 상기 수취부에 의해 수취된 상기 참조 화상 생성 정보와 사용 정보에 기초하여, 상기 short term의 제2 참조 화상 특정 정보의 일부를 상기 short term의 제1 참조 화상 특정 정보로서 생성하는 상기 (24)에 기재된 복호 장치.
(26)
가중 계수를 포함하는 가중치 부여 정보를 사용하여 상기 제1 참조 화상에 대하여 가중치 부여를 행하는 가중치 부여 처리부를 더 구비하고,
상기 제1 참조 화상 정보는, 상기 제1 참조 화상의 상기 가중치 부여 정보이며,
상기 제2 참조 화상 정보는, 상기 제2 참조 화상의 가중치 부여 정보이며,
상기 가중치 부여 처리부는, 상기 생성부에 의해 생성된 상기 제1 참조 화상 정보를 사용하여 상기 제1 참조 화상에 대하여 가중치 부여를 행하고,
상기 복호부는, 상기 가중치 부여 처리부에 의해 가중치 부여가 행하여진 상기 제1 참조 화상을 사용하여 상기 제1 계층의 화상 부호화 데이터를 복호하는 상기 (15) 내지 (18) 중 어느 하나에 기재된 복호 장치.
(27)
상기 가중치 부여 처리부는, 상기 제2 참조 화상에 대하여 가중치 부여가 행해진 경우, 상기 제1 참조 화상에 대하여 상기 가중치 부여를 행하는 상기 (26)에 기재된 복호 장치.
(28)
복호 장치가,
계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용하여 생성된 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보와, 상기 제1 계층의 화상 부호화 데이터를 수취하는 수취 스텝과,
상기 참조 화상 생성 정보를 사용하여 상기 제1 참조 화상 정보를 생성하는 생성 스텝과,
상기 생성 스텝의 처리에 의해 생성된 상기 제1 참조 화상 정보에 기초하여, 상기 제1 계층의 화상 부호화 데이터를 상기 제1 참조 화상을 사용하여 복호하는 복호 스텝을 포함하는 복호 방법.
10 부호화 장치
14 전송부
33 연산부
50 참조 화상 설정부
90 복호 장치
91 수취부
135 가산부
163 생성부
180 부호화 장치
221 움직임 예측·보상부
223 가중치 설정부
280 복호 장치
323 움직임 보상부
354 생성부

Claims (16)

  1. 계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용하여, 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보를 설정하는 설정부와,
    상기 제1 계층의 화상을 상기 제1 참조 화상을 사용하여 부호화하여, 부호화 데이터를 생성하는 부호화부와,
    상기 부호화부에 의해 생성된 상기 부호화 데이터와, 상기 설정부에 의해 설정된 상기 참조 화상 생성 정보를 전송하는 전송부를 구비하는, 부호화 장치.
  2. 제1항에 있어서, 상기 설정부는, 상기 제1 참조 화상 정보와 상기 제2 참조 화상 정보가 동일한 경우, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 정보로서 상기 제2 참조 화상 정보를 사용하는 것을 나타내는 정보를 설정하는, 부호화 장치.
  3. 제1항에 있어서, 상기 설정부는, 상기 제1 참조 화상 정보와 상기 제2 참조 화상 정보가 동일하지 않은 경우, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 정보와 상기 제2 참조 화상 정보의 차분과, 상기 제2 참조 화상 정보와 상기 차분으로부터 상기 제1 참조 화상 정보를 예측하는 것을 나타내는 정보를 설정하는, 부호화 장치.
  4. 제1항에 있어서, 상기 전송부는, 상기 제1 계층을 특정하는 정보를 전송하는, 부호화 장치.
  5. 제1항에 있어서, 상기 제1 참조 화상 정보는, 상기 제1 참조 화상을 특정하는 정보이며,
    상기 제2 참조 화상 정보는, 상기 제2 참조 화상을 특정하는 정보인, 부호화 장치.
  6. 제1항에 있어서, 가중 계수를 포함하는 가중치 부여 정보를 사용하여 상기 제1 참조 화상에 대하여 가중치 부여를 행하는 가중치 부여 처리부를 더 구비하고,
    상기 제1 참조 화상 정보는, 상기 제1 참조 화상의 상기 가중치 부여 정보이며,
    상기 제2 참조 화상 정보는, 상기 제2 참조 화상의 가중치 부여 정보이며,
    상기 부호화부는, 상기 가중치 부여 처리부에 의해 가중치 부여가 행하여진 상기 제1 참조 화상을 사용하여 상기 제1 계층의 화상을 부호화하는, 부호화 장치.
  7. 제6항에 있어서, 상기 가중치 부여 처리부는, 상기 제2 참조 화상에 대하여 가중치 부여가 행해진 경우, 상기 제1 참조 화상에 대하여 상기 가중치 부여를 행하는, 부호화 장치.
  8. 부호화 장치가,
    계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용하여, 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보를 설정하는 설정 스텝과,
    상기 제1 계층의 화상을 상기 제1 참조 화상을 사용하여 부호화하여, 부호화 데이터를 생성하는 부호화 스텝과,
    상기 부호화 스텝의 처리에 의해 생성된 상기 부호화 데이터와, 상기 설정 스텝의 처리에 의해 설정된 상기 참조 화상 생성 정보를 전송하는 전송 스텝을 포함하는, 부호화 방법.
  9. 계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용하여 생성된, 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보와, 상기 제1 계층의 화상 부호화 데이터를 수취하는 수취부와,
    상기 참조 화상 생성 정보를 사용하여 상기 제1 참조 화상 정보를 생성하는 생성부와,
    상기 생성부에 의해 생성된 상기 제1 참조 화상 정보에 기초하여, 상기 제1 계층의 화상 부호화 데이터를 상기 제1 참조 화상을 사용하여 복호하는 복호부를 구비하는, 복호 장치.
  10. 제9항에 있어서, 상기 수취부는, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 정보로서 상기 제2 참조 화상 정보를 사용하는 것을 나타내는 정보를 수취하고,
    상기 생성부는, 상기 수취부에 의해 수취된 상기 참조 화상 생성 정보에 기초하여, 상기 제2 참조 화상 정보를 상기 제1 참조 화상 정보로서 생성하는, 복호 장치.
  11. 제9항에 있어서, 상기 수취부는, 상기 참조 화상 생성 정보로서, 상기 제1 참조 화상 정보와 상기 제2 참조 화상 정보의 차분과, 상기 제2 참조 화상 정보와 상기 차분으로부터 상기 제1 참조 화상 정보를 예측하는 것을 나타내는 정보를 수취하고,
    상기 생성부는, 상기 수취부에 의해 수취된 상기 정보에 기초하여, 상기 제2 참조 화상 정보와 상기 수취부에 의해 수취된 상기 차분을 가산하고, 그 결과 얻어지는 가산값을 상기 제1 참조 화상 정보로서 생성하는, 복호 장치.
  12. 제9항에 있어서, 상기 수취부는, 상기 제1 계층을 특정하는 정보를 수취하고,
    상기 생성부는, 상기 수취부에 의해 수취된 상기 제1 계층을 특정하는 정보에 기초하여 상기 제1 참조 화상 정보를 생성하는, 복호 장치.
  13. 제9항에 있어서, 상기 제1 참조 화상 정보는, 상기 제1 참조 화상을 특정하는 정보이며,
    상기 제2 참조 화상 정보는, 상기 제2 참조 화상을 특정하는 정보인, 복호 장치.
  14. 제9항에 있어서, 가중 계수를 포함하는 가중치 부여 정보를 사용하여 상기 제1 참조 화상에 대하여 가중치 부여를 행하는 가중치 부여 처리부를 더 구비하고,
    상기 제1 참조 화상 정보는, 상기 제1 참조 화상의 상기 가중치 부여 정보이며,
    상기 제2 참조 화상 정보는, 상기 제2 참조 화상의 가중치 부여 정보이며,
    상기 가중치 부여 처리부는, 상기 생성부에 의해 생성된 상기 제1 참조 화상 정보를 사용하여 상기 제1 참조 화상에 대하여 가중치 부여를 행하고,
    상기 복호부는, 상기 가중치 부여 처리부에 의해 가중치 부여가 행하여진 상기 제1 참조 화상을 사용하여 상기 제1 계층의 화상 부호화 데이터를 복호하는, 복호 장치.
  15. 제14항에 있어서, 상기 가중치 부여 처리부는, 상기 제2 참조 화상에 대하여 가중치 부여가 행해진 경우, 상기 제1 참조 화상에 대하여 상기 가중치 부여를 행하는, 복호 장치.
  16. 복호 장치가,
    계층 구조를 갖는 화상의 제1 계층의 화상을 부호화할 때에 사용하는 제1 참조 화상에 관한 정보인 제1 참조 화상 정보와, 제2 계층의 화상 제2 참조 화상에 관한 정보인 제2 참조 화상 정보를 사용하여 생성된 상기 제1 참조 화상 정보의 생성에 사용하는 참조 화상 생성 정보와, 상기 제1 계층의 화상 부호화 데이터를 수취하는 수취 스텝과,
    상기 참조 화상 생성 정보를 사용하여 상기 제1 참조 화상 정보를 생성하는 생성 스텝과,
    상기 생성 스텝의 처리에 의해 생성된 상기 제1 참조 화상 정보에 기초하여, 상기 제1 계층의 화상 부호화 데이터를 상기 제1 참조 화상을 사용하여 복호하는 복호 스텝을 포함하는, 복호 방법.
KR1020157006851A 2012-09-28 2013-09-20 부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법 KR20150063379A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JPJP-P-2012-218303 2012-09-28
JP2012218303 2012-09-28
JP2013077661 2013-04-03
JPJP-P-2013-077661 2013-04-03
PCT/JP2013/075518 WO2014050748A1 (ja) 2012-09-28 2013-09-20 符号化装置および符号化方法、並びに、復号装置および復号方法

Publications (1)

Publication Number Publication Date
KR20150063379A true KR20150063379A (ko) 2015-06-09

Family

ID=50388152

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157006851A KR20150063379A (ko) 2012-09-28 2013-09-20 부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법

Country Status (9)

Country Link
US (2) US10085038B2 (ko)
EP (1) EP2899983B1 (ko)
JP (2) JP6274108B2 (ko)
KR (1) KR20150063379A (ko)
CN (3) CN104813663B (ko)
BR (1) BR112015006313A2 (ko)
MX (1) MX345239B (ko)
RU (2) RU2646340C2 (ko)
WO (1) WO2014050748A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591321B2 (en) 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets
CN109379603A (zh) 2013-04-07 2019-02-22 杜比国际公司 用信号通知输出层集的改变
US9967581B2 (en) * 2014-05-29 2018-05-08 Apple Inc. Video quality adaptation with frame rate conversion
JP6597041B2 (ja) * 2015-08-18 2019-10-30 富士ゼロックス株式会社 サーバー装置及び情報処理システム
CN117041551A (zh) 2016-04-29 2023-11-10 世宗大学校产学协力团 用于对图像信号进行编码/解码的方法和设备
ES2802817B2 (es) * 2016-07-05 2023-06-22 Kt Corp Metodo y aparato para procesar senal de video
US10264263B2 (en) 2016-07-06 2019-04-16 Morpho Detection, Llc Systems and methods for compressing image data generated by a computed tomography (CT) imaging system
KR20210068451A (ko) * 2018-10-02 2021-06-09 인터디지털 브이씨 홀딩스 인코포레이티드 일반화된 양방향 예측 및 가중 예측
KR20210127709A (ko) * 2019-03-07 2021-10-22 디지털인사이트 주식회사 영상 부호화/복호화 방법 및 장치
CN117376552A (zh) * 2019-09-16 2024-01-09 Lg电子株式会社 解码设备、编码设备和发送设备
JP7475908B2 (ja) 2020-03-17 2024-04-30 シャープ株式会社 予測画像生成装置、動画像復号装置及び動画像符号化装置

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005506815A (ja) * 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間拡張可能圧縮のための方法及び装置
EP1833262A1 (en) * 2002-01-18 2007-09-12 Kabushiki Kaisha Toshiba Video encoding method and apparatus and video decoding method and apparatus
KR100931915B1 (ko) * 2002-01-23 2009-12-15 노키아 코포레이션 비디오 코딩시 이미지 프레임들의 그루핑
KR100693669B1 (ko) * 2003-03-03 2007-03-09 엘지전자 주식회사 피일드 매크로 블록의 레퍼런스 픽쳐 결정 방법
JP4854046B2 (ja) 2005-04-06 2012-01-11 トムソン ライセンシング エンハンスメント層ビデオ・データを符号化する方法および装置
EP2234405A3 (en) * 2005-04-13 2011-03-16 NTT DoCoMo, Inc. Image prediction on the basis of a frequency band analysis of the to be predicted image
CN101228795B (zh) * 2005-07-21 2011-09-07 汤姆森许可贸易公司 针对加权预测的可分级视频解码方法及设备
RU2368095C1 (ru) * 2005-07-22 2009-09-20 Мицубиси Электрик Корпорейшн Кодер изображения и декодер изображения, способ кодирования изображения и способ декодирования изображения, программа кодирования изображения и программа декодирования изображения и компьютерно-считываемый носитель записи, на котором записана программа кодирования изображения, и компьютерно-считываемый носитель записи, на котором записана программа декодирования изображения
KR20070038396A (ko) * 2005-10-05 2007-04-10 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
EP1949702A2 (en) 2005-10-12 2008-07-30 Thomson Licensing Methods and apparatus for weighted prediction in scalable video encoding and decoding
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
EP1806930A1 (en) * 2006-01-10 2007-07-11 Thomson Licensing Method and apparatus for constructing reference picture lists for scalable video
US8577168B2 (en) * 2006-12-28 2013-11-05 Vidyo, Inc. System and method for in-loop deblocking in scalable video coding
JP5026092B2 (ja) * 2007-01-12 2012-09-12 三菱電機株式会社 動画像復号装置および動画像復号方法
EP2123052B1 (en) * 2007-01-18 2010-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable video data stream
EP2051527A1 (en) * 2007-10-15 2009-04-22 Thomson Licensing Enhancement layer residual prediction for bit depth scalability using hierarchical LUTs
JP5261774B2 (ja) * 2007-10-25 2013-08-14 日本電信電話株式会社 動画像スケーラブル符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
TWI468020B (zh) * 2009-02-19 2015-01-01 Sony Corp Image processing apparatus and method
JP2011015262A (ja) * 2009-07-03 2011-01-20 Panasonic Corp 画像復号化装置
KR20110065089A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5563346B2 (ja) * 2010-03-29 2014-07-30 パナソニック株式会社 送電装置及びそれに用いられる波形モニタ回路
CN102186084B (zh) * 2011-06-07 2013-07-31 东莞电子科技大学电子信息工程研究院 一种可伸缩视频编码svc的空间增强层码率控制实现方法
ITMI20111388A1 (it) * 2011-07-26 2013-01-27 Presezzi Extrusion S P A Dispositivo perfezionato applicabile a presse per l'estrusione di metalli atto a consentire una rapida sostituzione del tacco e/o dell'asta applicati a tali presse.
US8863391B2 (en) * 2011-07-27 2014-10-21 Progressive International Corporation Egg slicer
JP6110410B2 (ja) * 2012-01-31 2017-04-05 ヴィド スケール インコーポレイテッド スケーラブルな高効率ビデオコーディング(hevc)のための参照ピクチャセット(rps)シグナリング
US9392274B2 (en) * 2012-03-22 2016-07-12 Qualcomm Incorporated Inter layer texture prediction for video coding
US20150103898A1 (en) * 2012-04-09 2015-04-16 Vid Scale, Inc. Weighted prediction parameter signaling for video coding
US9516308B2 (en) * 2012-04-27 2016-12-06 Qualcomm Incorporated Parameter set updates in video coding
EP2824287B1 (en) * 2013-07-08 2020-05-13 Ansaldo Energia IP UK Limited Pressure casing of a turbomachine

Also Published As

Publication number Publication date
EP2899983A1 (en) 2015-07-29
RU2666305C1 (ru) 2018-09-06
MX345239B (es) 2017-01-23
US20150222921A1 (en) 2015-08-06
JP6274108B2 (ja) 2018-02-07
JPWO2014050748A1 (ja) 2016-08-22
CN108521574A (zh) 2018-09-11
EP2899983B1 (en) 2018-11-21
RU2015110063A (ru) 2016-10-10
EP2899983A4 (en) 2016-06-08
BR112015006313A2 (pt) 2017-07-04
US20180270503A1 (en) 2018-09-20
JP6432809B2 (ja) 2018-12-05
CN104813663A (zh) 2015-07-29
CN104813663B (zh) 2018-05-22
US10499079B2 (en) 2019-12-03
JP2018085757A (ja) 2018-05-31
MX2015003435A (es) 2015-06-22
US10085038B2 (en) 2018-09-25
CN108337524A (zh) 2018-07-27
RU2646340C2 (ru) 2018-03-02
WO2014050748A1 (ja) 2014-04-03

Similar Documents

Publication Publication Date Title
JP6432809B2 (ja) 復号装置および復号方法
JP6219823B2 (ja) 画像処理装置および方法、並びに記録媒体
KR102165220B1 (ko) 부호화 장치 및 부호화 방법
JP5954587B2 (ja) 画像処理装置および方法
US20230247217A1 (en) Image processing apparatus and method
JPWO2013031315A1 (ja) 画像処理装置及び画像処理方法
WO2012176684A1 (ja) 画像処理装置および方法
US10873758B2 (en) Image processing device and method
JP2015005899A (ja) 復号装置および復号方法、並びに、符号化装置および符号化方法
WO2014103774A1 (ja) 画像処理装置および方法
WO2012173022A1 (ja) 画像処理装置および方法
WO2014141899A1 (ja) 画像処理装置および方法
WO2014050732A1 (ja) 符号化装置および符号化方法、並びに、復号装置および復号方法
WO2014002900A1 (ja) 画像処理装置および画像処理方法
WO2013015118A1 (ja) 画像処理装置および方法
WO2014203762A1 (ja) 復号装置および復号方法、並びに、符号化装置および符号化方法
WO2014156705A1 (ja) 復号装置および復号方法、並びに、符号化装置および符号化方法
US20160037184A1 (en) Image processing device and method

Legal Events

Date Code Title Description
A201 Request for examination
WITB Written withdrawal of application