KR20240004427A - 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법 - Google Patents

부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법 Download PDF

Info

Publication number
KR20240004427A
KR20240004427A KR1020237037641A KR20237037641A KR20240004427A KR 20240004427 A KR20240004427 A KR 20240004427A KR 1020237037641 A KR1020237037641 A KR 1020237037641A KR 20237037641 A KR20237037641 A KR 20237037641A KR 20240004427 A KR20240004427 A KR 20240004427A
Authority
KR
South Korea
Prior art keywords
picture
resolution
unit
inter prediction
block
Prior art date
Application number
KR1020237037641A
Other languages
English (en)
Inventor
비르지니 드루젼
기요후미 아베
다카히로 니시
다다마사 도마
Original Assignee
파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 filed Critical 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Publication of KR20240004427A publication Critical patent/KR20240004427A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • H04N19/433Hardware specially adapted for motion estimation or compensation characterised by techniques for memory access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

부호화 장치(100)는, 회로와, 회로에 접속된 메모리를 구비하고, 회로는, 동작에 있어서, 픽처의 해상도를 표시 순 및 부호화 순 중 한쪽 순서로 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가 인터 예측 픽처의 해상도와는 상이한 경우, 참조 픽처의 해상도와 인터 예측 픽처의 해상도의 차이에 따라, 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 부호화한다.

Description

부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
본 개시는, 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법에 관한 것이다.
비디오 코딩 기술은, H.261 및 MPEG-1로부터, H.264/AVC(Advanced Video Coding), MPEG-LA, H.265/HEVC(High Efficiency Video Coding), 및 H.266/VVC(Versatile Video Codec)로 진보하고 있다. 이 진보에 따라, 다양한 용도에 있어서 계속 증가하는 디지털 비디오 데이터량을 처리하기 위해, 비디오 코딩 기술의 개량 및 최적화를 제공하는 것이 항상 필요해지고 있다. 본 개시는, 비디오 코딩에 있어서의 더 나은 진보, 개량 및 최적화에 관한 것이다.
또한, 비특허문헌 1은, 상술된 비디오 코딩 기술에 관한 종래의 규격의 일례에 관한 것이다.
H.265(ISO/IEC 23008-2 HEVC)/HEVC(High Efficiency Video Coding)
상기와 같은 부호화 방식에 관하여, 부호화 효율의 개선, 화질의 개선, 처리량의 삭감, 회로 규모의 삭감, 또는, 필터, 블록, 사이즈, 움직임 벡터, 참조 픽처 또는 참조 블록 등의 요소 또는 동작의 적절한 선택 등을 위해, 새로운 방식의 제안이 요망된다.
본 개시는, 예를 들면, 부호화 효율의 개선, 화질의 개선, 처리량의 삭감, 회로 규모의 삭감, 처리 속도의 개선, 및, 요소 또는 동작의 적절한 선택 등 중에서 하나 이상에 공헌할 수 있는 구성 또는 방법을 제공한다. 또한, 본 개시는, 상기 이외의 이익에 공헌할 수 있는 구성 또는 방법을 포함할 수 있다.
예를 들면, 본 개시의 일 양태에 따른 부호화 장치는, 회로와, 상기 회로에 접속된 메모리를 구비하고, 상기 회로는, 동작에 있어서, 픽처의 해상도를 표시 순 및 부호화 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 부호화한다.
본 개시에 있어서의 각 실시 형태, 또는 그 일부의 구성 혹은 방법 각각은, 예를 들면, 부호화 효율의 개선, 화질의 개선, 부호화/복호의 처리량의 삭감, 회로 규모의 삭감, 또는, 부호화/복호의 처리 속도의 개선 등 중, 적어도 어느 하나를 가능하게 한다. 혹은, 본 개시에 있어서의 각 실시 형태, 또는 그 일부의 구성 혹은 방법 각각은, 부호화 및 복호에 있어서, 필터, 블록, 사이즈, 움직임 벡터, 참조 픽처, 참조 블록 등의 구성 요소/동작의 적절한 선택 등을 가능하게 한다. 또한, 본 개시는, 상기 이외의 이익을 제공할 수 있는 구성 또는 방법의 개시도 포함한다. 예를 들면, 처리량의 증가를 억제하면서, 부호화 효율을 개선하는 구성 또는 방법 등이다.
본 개시의 일 양태에 있어서의 추가적인 이점 및 효과는, 명세서 및 도면으로부터 명백해진다. 이러한 이점 및/또는 효과는, 몇 가지 실시 형태 그리고 명세서 및 도면에 기재된 특징에 의해 각각 얻어지는데, 1개 또는 그 이상의 이점 및/또는 효과를 얻기 위해 꼭 전부가 제공될 필요는 없다.
또한, 이들의 전반적 또는 구체적인 양태는, 시스템, 집적 회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록 매체로 실현되어도 되고, 시스템, 방법, 집적 회로, 컴퓨터 프로그램 및 기록 매체의 임의의 조합으로 실현되어도 된다.
본 개시의 일 양태에 따른 구성 또는 방법은, 예를 들면, 부호화 효율의 개선, 화질의 개선, 처리량의 삭감, 회로 규모의 삭감, 처리 속도의 개선, 및, 요소 또는 동작의 적절한 선택 등 중에서 하나 이상에 공헌할 수 있다. 또한, 본 개시의 일 양태에 따른 구성 또는 방법은, 상기 이외의 이익에 공헌해도 된다.
도 1은, 실시 형태에 따른 전송 시스템의 구성의 일례를 나타내는 개략도이다.
도 2는, 스트림에 있어서의 데이터의 계층 구조의 일례를 나타내는 도면이다.
도 3은, 슬라이스의 구성의 일례를 나타내는 도면이다.
도 4는, 타일의 구성의 일례를 나타내는 도면이다.
도 5는, 스케일러블 부호화 시의 부호화 구조의 일례를 나타내는 도면이다.
도 6은, 스케일러블 부호화 시의 부호화 구조의 일례를 나타내는 도면이다.
도 7은, 실시 형태에 따른 부호화 장치의 구성의 일례를 나타내는 블록도이다.
도 8은, 부호화 장치의 실장예를 나타내는 블록도이다.
도 9는, 부호화 장치에 의한 전체적인 부호화 처리의 일례를 나타내는 플로차트이다.
도 10은, 블록 분할의 일례를 나타내는 도면이다.
도 11은, 분할부의 구성의 일례를 나타내는 도면이다.
도 12는, 분할 패턴의 예를 나타내는 도면이다.
도 13a는, 분할 패턴의 신택스 트리의 일례를 나타내는 도면이다.
도 13b는, 분할 패턴의 신택스 트리의 다른 예를 나타내는 도면이다.
도 14는, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다.
도 15는, SVT의 일례를 나타내는 도면이다.
도 16은, 변환부에 의한 처리의 일례를 나타내는 플로차트이다.
도 17은, 변환부에 의한 처리의 다른 예를 나타내는 플로차트이다.
도 18은, 양자화부의 구성의 일례를 나타내는 블록도이다.
도 19는, 양자화부에 의한 양자화의 일례를 나타내는 플로차트이다.
도 20은, 엔트로피 부호화부의 구성의 일례를 나타내는 블록도이다.
도 21은, 엔트로피 부호화부에 있어서의 CABAC의 흐름을 나타내는 도면이다.
도 22는, 루프 필터부의 구성의 일례를 나타내는 블록도이다.
도 23a는, ALF(adaptive loop filter)로 사용되는 필터의 형상의 일례를 나타내는 도면이다.
도 23b는, ALF로 사용되는 필터의 형상의 다른 일례를 나타내는 도면이다.
도 23c는, ALF로 사용되는 필터의 형상의 다른 일례를 나타내는 도면이다.
도 23d는, Y 샘플(제1 성분)이 Cb의 CCALF 및 Cr의 CCALF(제1 성분과는 상이한 복수의 성분)에 사용되는 예를 나타내는 도면이다.
도 23e는, 다이아몬드 형상 필터를 나타내는 도면이다.
도 23f는, JC-CCALF의 예를 나타내는 도면이다.
도 23g는, JC-CCALF의 weight_index 후보의 예를 나타내는 도면이다.
도 24는, DBF로서 기능하는 루프 필터부의 상세한 구성의 일례를 나타내는 블록도이다.
도 25는, 블록 경계에 대해 대칭인 필터 특성을 갖는 디블로킹·필터의 예를 나타내는 도면이다.
도 26은, 디블로킹·필터 처리가 행해지는 블록 경계의 일례를 설명하기 위한 도면이다.
도 27은, Bs값의 일례를 나타내는 도면이다.
도 28은, 부호화 장치의 예측부에서 행해지는 처리의 일례를 나타내는 플로차트이다.
도 29는, 부호화 장치의 예측부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
도 30은, 부호화 장치의 예측부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
도 31은, 인트라 예측에 있어서의 67개의 인트라 예측 모드의 일례를 나타내는 도면이다.
도 32는, 인트라 예측부에 의한 처리의 일례를 나타내는 플로차트이다.
도 33은, 각 참조 픽처의 일례를 나타내는 도면이다.
도 34는, 참조 픽처 리스트의 일례를 나타내는 개념도이다.
도 35는, 인터 예측의 기본적인 처리의 흐름을 나타내는 플로차트이다.
도 36은, MV 도출의 일례를 나타내는 플로차트이다.
도 37은, MV 도출의 다른 예를 나타내는 플로차트이다.
도 38a는, MV 도출의 각 모드의 분류의 일례를 나타내는 도면이다.
도 38b는, MV 도출의 각 모드의 분류의 일례를 나타내는 도면이다.
도 39는, 노멀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 40은, 노멀 머지 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 41은, 노멀 머지 모드에 의한 MV 도출 처리의 일례를 설명하기 위한 도면이다.
도 42는, HMVP(History-based Motion Vector Prediction/Predictor) 모드에 의한 MV 도출 처리의 일례를 설명하기 위한 도면이다.
도 43은, FRUC(frame rate up conversion)의 일례를 나타내는 플로차트이다.
도 44는, 움직임 궤도를 따르는 2개의 블록 사이에서의 패턴 매칭(바이래터럴 매칭)의 일례를 설명하기 위한 도면이다.
도 45는, 커런트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)의 일례를 설명하기 위한 도면이다.
도 46a는, 2개의 제어 포인트를 사용하는 아핀 모드에 있어서의 서브 블록 단위의 MV의 도출의 일례를 설명하기 위한 도면이다.
도 46b는, 3개의 제어 포인트를 사용하는 아핀 모드에 있어서의 서브 블록 단위의 MV의 도출의 일례를 설명하기 위한 도면이다.
도 47a는, 아핀 모드에 있어서의 제어 포인트의 MV 도출의 일례를 설명하기 위한 개념도이다.
도 47b는, 아핀 모드에 있어서의 제어 포인트의 MV 도출의 일례를 설명하기 위한 개념도이다.
도 47c는, 아핀 모드에 있어서의 제어 포인트의 MV 도출의 일례를 설명하기 위한 개념도이다.
도 48a는, 2개의 제어 포인트를 갖는 아핀 모드를 설명하기 위한 도면이다.
도 48b는, 3개의 제어 포인트를 갖는 아핀 모드를 설명하기 위한 도면이다.
도 49a는, 부호화 완료 블록과 커런트 블록에서 제어 포인트의 수가 상이한 경우의, 제어 포인트의 MV 도출 방법의 일례를 설명하기 위한 개념도이다.
도 49b는, 부호화 완료 블록과 커런트 블록에서 제어 포인트의 수가 상이한 경우의, 제어 포인트의 MV 도출 방법의 다른 예를 설명하기 위한 개념도이다.
도 50은, 아핀 머지 모드의 처리의 일례를 나타내는 플로차트이다.
도 51은, 아핀 인터 모드의 처리의 일례를 나타내는 플로차트이다.
도 52a는, 2개의 삼각형의 예측 화상의 생성을 설명하기 위한 도면이다.
도 52b는, 제1 파티션의 제1 부분, 그리고, 제1 샘플 세트 및 제2 샘플 세트의 예를 나타내는 개념도이다.
도 52c는, 제1 파티션의 제1 부분을 나타내는 개념도이다.
도 53은, 트라이앵글 모드의 일례를 나타내는 플로차트이다.
도 54는, 서브 블록 단위로 MV가 도출되는 ATMVP(Advanced Temporal Motion Vector Prediction/Predictor) 모드의 일례를 나타내는 도면이다.
도 55는, 머지 모드 및 DMVR(dynamic motion vector refreshing)의 관계를 나타내는 도면이다.
도 56은, DMVR의 일례를 설명하기 위한 개념도이다.
도 57은, MV를 결정하기 위한 DMVR의 다른 일례를 설명하기 위한 개념도이다.
도 58a는, DMVR에 있어서의 움직임 탐색의 일례를 나타내는 도면이다.
도 58b는, DMVR에 있어서의 움직임 탐색의 일례를 나타내는 플로차트이다.
도 59는, 예측 화상의 생성의 일례를 나타내는 플로차트이다.
도 60은, 예측 화상의 생성의 다른 예를 나타내는 플로차트이다.
도 61은, OBMC(overlapped block motion compensation)에 의한 예측 화상 보정 처리의 일례를 설명하기 위한 플로차트이다.
도 62는, OBMC에 의한 예측 화상 보정 처리의 일례를 설명하기 위한 개념도이다.
도 63은, 등속 직선 운동을 가정한 모델을 설명하기 위한 도면이다.
도 64는, BIO에 따른 인터 예측의 일례를 나타내는 플로차트이다.
도 65는, BIO에 따른 인터 예측을 행하는 인터 예측부의 구성의 일례를 나타내는 도면이다.
도 66a는, LIC(local illumination compensation)에 의한 휘도 보정 처리를 사용한 예측 화상 생성 방법의 일례를 설명하기 위한 도면이다.
도 66b는, LIC에 의한 휘도 보정 처리를 사용한 예측 화상 생성 방법의 일례를 나타내는 플로차트이다.
도 67은, 실시 형태에 따른 복호 장치의 구성을 나타내는 블록도이다.
도 68은, 복호 장치의 실장예를 나타내는 블록도이다.
도 69는, 복호 장치에 의한 전체적인 복호 처리의 일례를 나타내는 플로차트이다.
도 70은, 분할 결정부와 다른 구성 요소의 관계를 나타내는 도면이다.
도 71은, 엔트로피 복호부의 구성의 일례를 나타내는 블록도이다.
도 72는, 엔트로피 복호부에 있어서의 CABAC의 흐름을 나타내는 도면이다.
도 73은, 역양자화부의 구성의 일례를 나타내는 블록도이다.
도 74는, 역양자화부에 의한 역양자화의 일례를 나타내는 플로차트이다.
도 75는, 역변환부에 의한 처리의 일례를 나타내는 플로차트이다.
도 76은, 역변환부에 의한 처리의 다른 예를 나타내는 플로차트이다.
도 77은, 루프 필터부의 구성의 일례를 나타내는 블록도이다.
도 78은, 복호 장치의 예측부에서 행해지는 처리의 일례를 나타내는 플로차트이다.
도 79는, 복호 장치의 예측부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
도 80a는, 복호 장치의 예측부에서 행해지는 처리의 다른 예의 일부를 나타내는 플로차트이다.
도 80b는, 복호 장치의 예측부에서 행해지는 처리의 다른 예의 잔부를 나타내는 플로차트이다.
도 81은, 복호 장치의 인트라 예측부에 의한 처리의 일례를 나타내는 도면이다.
도 82는, 복호 장치에 있어서의 MV 도출의 일례를 나타내는 플로차트이다.
도 83은, 복호 장치에 있어서의 MV 도출의 다른 예를 나타내는 플로차트이다.
도 84는, 복호 장치에 있어서의 노멀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 85는, 복호 장치에 있어서의 노멀 머지 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 86은, 복호 장치에 있어서의 FRUC 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 87은, 복호 장치에 있어서의 아핀 머지 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 88은, 복호 장치에 있어서의 아핀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 89는, 복호 장치에 있어서의 트라이앵글 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
도 90은, 복호 장치에 있어서의 DMVR에 의한 움직임 탐색의 예를 나타내는 플로차트이다.
도 91은, 복호 장치에 있어서의 DMVR에 의한 움직임 탐색의 상세한 일례를 나타내는 플로차트이다.
도 92는, 복호 장치에 있어서의 예측 화상의 생성의 일례를 나타내는 플로차트이다.
도 93은, 복호 장치에 있어서의 예측 화상의 생성의 다른 예를 나타내는 플로차트이다.
도 94는, 복호 장치에 있어서의 OBMC에 의한 예측 화상의 보정의 예를 나타내는 플로차트이다.
도 95는, 복호 장치에 있어서의 BIO에 의한 예측 화상의 보정의 예를 나타내는 플로차트이다.
도 96은, 복호 장치에 있어서의 LIC에 의한 예측 화상의 보정의 예를 나타내는 플로차트이다.
도 97은, 고해상도에서 저해상도로의 해상도의 변화를 나타내는 개략도이다.
도 98a는, 해상도 변경 처리의 일례를 나타내는 개략도이다.
도 98b는, 해상도 변경 처리의 다른 예를 나타내는 개략도이다.
도 98c는, 해상도 변경 처리의 또 다른 예를 나타내는 개략도이다.
도 99는, 복수의 파라미터의 관계를 나타내는 개략도이다.
도 100a는, k>1의 제약에 적합한 비디오 스트림의 예를 나타내는 개략도이다.
도 100b는, k>1의 제약에 적합하지 않은 비디오 스트림의 예를 나타내는 개략도이다.
도 101은, 픽처 부호화 방법 및 픽처 복호 방법의 예를 나타내는 플로차트이다.
도 102는, 픽처 시퀀스를 비트 스트림에 부호화하는 부호화 방법의 예를 나타내는 플로차트이다.
도 103은, DASH 프로토콜에 준거하는 서버 장치 및 수신 장치를 나타내는 개념도이다.
도 104a는, 레이트 제어를 사용하는 부호화 방법의 예의 일부를 나타내는 플로차트이다.
도 104b는, 레이트 제어를 사용하는 부호화 방법의 예의 잔부를 나타내는 플로차트이다.
도 105는, 방송 수신 장치용 복호 방법의 예를 나타내는 플로차트이다.
도 106a는, 규정 해상도 세트를 사용하는 부호화 방법의 예의 일부를 나타내는 플로차트이다.
도 106b는, 규정 해상도 세트를 사용하는 부호화 방법의 예의 잔부를 나타내는 플로차트이다.
도 107a는, 레이트 제어 및 규정 해상도 세트를 사용하는 부호화 방법의 예의 일부를 나타내는 플로차트이다.
도 107b는, 레이트 제어 및 규정 해상도 세트를 사용하는 부호화 방법의 예의 잔부를 나타내는 플로차트이다.
도 108은, 실시 형태에 따른 부호화 장치가 행하는 동작을 나타내는 플로차트이다.
도 109는, 실시 형태에 따른 복호 장치가 행하는 동작을 나타내는 플로차트이다.
도 110은, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템의 전체 구성도이다.
도 111은, web 페이지의 표시 화면예를 나타내는 도면이다.
도 112는, web 페이지의 표시 화면예를 나타내는 도면이다.
도 113은, 스마트폰의 일례를 나타내는 도면이다.
도 114는, 스마트폰의 구성예를 나타내는 블록도이다.
[서론(Introduction)]
비디오를 구성하는 복수의 픽처가 순차적으로 부호화될 때에, 픽처의 해상도가, 당해 픽처보다 부호화 순 또는 표시 순으로 앞의 선행 픽처의 해상도로부터 변경되어도 된다. 인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가, 인터 예측 픽처의 해상도와는 상이한 경우, 참조 픽처의 참조 화상이 리샘플링되고, 리샘플링된 참조 화상을 사용하여, 인터 예측 픽처의 화상이 부호화될 수 있다.
이로 인해, 인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가, 당해 인터 예측 픽처의 해상도와는 상이한 경우에도, 인터 예측을 사용하는 것이 가능하다.
그러나, 해상도의 빈번한 변경에 의해, 계산 리소스 및 메모리 리소스의 소비가 커져, 부호화 장치 및 복호 장치의 부담이 커진다. 또, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스를 항상 확보해 두는 것은 어렵다. 또, 임의의 타이밍에 해상도의 변경이 발생하는 경우, 부호화 장치 및 복호 장치의 시험을 행하는 것도 용이하지 않다.
그래서, 예를 들면, 본 개시의 일 양태에 따른 부호화 장치는, 회로와, 상기 회로에 접속된 메모리를 구비하고, 상기 회로는, 동작에 있어서, 픽처의 해상도를 표시 순 및 부호화 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 부호화한다.
이로 인해, 부호화 장치는, 해상도의 빈번한 변경을 억제할 수 있는 경우가 있다. 따라서, 부호화 장치는, 계산 리소스 및 메모리 리소스의 소비를 억제할 수 있는 경우가 있으며, 부담을 경감할 수 있는 경우가 있다. 또, 부호화 장치는, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스가 항상 확보되는 것을 억제할 수 있는 경우가 있다. 또, 부호화 장치는, 시험의 곤란함을 저감할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, 상기 픽처가, k번째의 랜덤 액세스 픽처마다의 상기 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만, 상기 픽처의 해상도를 변경하는 것이 허용되며, 상기 k는, 1보다 큰 정수이다.
이로 인해, 부호화 장치는, 해상도의 변경을 더 억제할 수 있는 경우가 있다. 따라서, 부호화 장치는, 계산 리소스 및 메모리 리소스의 소비를 더 억제할 수 있는 경우가 있으며, 부담을 더 경감할 수 있는 경우가 있다.
또, 예를 들면, 상기 회로는, 복수의 픽처를 비트 스트림에 순차적으로 부호화하고, 상기 비트 스트림의 비트량을 모니터링하며, 모니터링된 상기 비트량에 따라, 상기 픽처의 해상도의 변경을 제어한다.
이로 인해, 부호화 장치는, 비트 스트림의 비트량에 따라 해상도를 변경할 수 있는 경우가 있으며, 해상도의 변경에 따라 비트 스트림의 비트량을 조정할 수 있는 경우가 있다.
또, 예를 들면, 상기 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 부호화하고, 계속해서, 상기 하나 이상의 랜덤 액세스 픽처에 포함되는 랜덤 액세스 픽처로서, 표시 순으로 상기 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 부호화하며, 계속해서, 상기 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 부호화하고, 계속해서, 상기 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 부호화하며, 상기 제약에서는, 상기 적어도 하나의 리딩 픽처의 해상도는, 상기 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되지 않고, 상기 랜덤 액세스 픽처의 해상도는, 상기 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되며, 상기 적어도 하나의 제2 트레일링 픽처의 해상도는, 상기 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않는다.
이로 인해, 부호화 장치는, 표시 순에 있어서, 랜덤 액세스 픽처에서만 해상도를 변경할 수 있는 경우가 있다. 따라서, 부호화 장치는, 표시 순을 따라, 해상도의 변경을 원활하게 행할 수 있는 경우가 있다.
또, 예를 들면, 상기 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 부호화하고, 계속해서, 상기 하나 이상의 랜덤 액세스 픽처에 포함되는 랜덤 액세스 픽처로서, 표시 순으로 상기 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 부호화하며, 계속해서, 상기 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 부호화하고, 계속해서, 상기 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 부호화하며, 상기 제약에서는, 상기 랜덤 액세스 픽처의 해상도는, 상기 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되고, 상기 적어도 하나의 리딩 픽처의 해상도는, 상기 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않고, 상기 적어도 하나의 제2 트레일링 픽처의 해상도는, 상기 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되지 않는다.
이로 인해, 부호화 장치는, 부호화 순에 있어서, 랜덤 액세스 픽처에서만 해상도를 변경할 수 있는 경우가 있다. 따라서, 부호화 장치는, 부호화 순을 따라, 해상도의 변경을 원활하게 행할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, DASH(Dynamic Adaptive Streaming over HTTP) 프로토콜로 정해지는 복수의 세그먼트 각각에 대해서, 당해 세그먼트 내에서 상기 픽처의 해상도를 변경하는 것이 허용되지 않는다.
이로 인해, 부호화 장치는, 해상도의 변경을 세그먼트 단위로 제한할 수 있는 경우가 있다. 따라서, 이로 인해, 부호화 장치는, 해상도의 빈번한 변경을 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, DASH 프로토콜로 정해지는 복수의 레프리젠테이션 각각에 있어서, 역치보다 짧은 간격으로 상기 픽처의 해상도를 변경하는 것이 허용되지 않는다.
이로 인해, 부호화 장치는, 같은 레프리젠테이션에 있어서, 짧은 간격으로 해상도를 변경하는 것을 억제할 수 있는 경우가 있다. 따라서, 이로 인해, 부호화 장치는, 해상도의 빈번한 변경을 더 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, 상기 픽처의 해상도가 복수의 해상도 후보 중 어느 하나로 제한된다.
이로 인해, 부호화 장치는, 복수의 해상도 후보 중 어느 하나로 해상도를 제한할 수 있는 경우가 있다. 따라서, 부호화 장치는, 처리의 복잡화를 억제할 수 있는 경우가 있다. 또, 부호화 장치는, 시험의 곤란함을 저감할 수 있는 경우가 있다.
또, 예를 들면, 상기 복수의 해상도 후보는, 상기 선행 픽처의 해상도를 복수의 고정 비율로 스케일링함으로써 정해지는 복수의 해상도 후보를 포함한다.
이로 인해, 부호화 장치는, 변경 전의 해상도로부터 고정 비율을 사용하여 원활하게 해상도를 변경할 수 있는 경우가 있다. 또, 부호화 장치는, 고정 비율을 사용하여 원활하게 참조 화상을 리샘플링할 수 있는 경우가 있다. 따라서, 부호화 장치는, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 복수의 고정 비율은, 2배, 3/2배, 4/3배, 3/4배, 2/3배 및 1/2배 중 적어도 하나를 포함한다.
이로 인해, 부호화 장치는, 참조 화상을 리샘플링하는 것이 용이한 비율로 해상도를 변경할 수 있는 경우가 있다. 따라서, 부호화 장치는, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 복수의 해상도 후보는, 7680×4320 화소, 5120×2880 화소, 3840×2160 화소, 2560×1440 화소, 1920×1080 화소, 1280×720 화소 및 960×540 화소로 정해지는 복수의 해상도 후보를 포함한다.
이로 인해, 부호화 장치는, 범용적인 해상도를 이용할 수 있는 경우가 있으며, 범용성을 유지할 수 있는 경우가 있다.
또, 예를 들면, 상기 복수의 해상도 후보는, 상기 선행 픽처의 해상도에 대해 복수의 고정 차분값의 가산 또는 감산을 적용함으로써 정해지는 복수의 해상도 후보를 포함한다.
이로 인해, 부호화 장치는, 변경 전의 해상도, 및, 고정 차분값에 따라, 변경 후의 해상도를 적절하게 제한할 수 있는 경우가 있으며, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, 시퀀스 파라미터 세트에 있어서 상한으로서 지정되는 최대 해상도가, 상기 시퀀스 파라미터 세트가 적용되는 복수의 픽처 중 적어도 하나의 픽처에 적용되는 픽처 파라미터 세트에 있어서 상기 적어도 하나의 픽처의 해상도로서 지정되는 해상도와 같은 것으로 제한되고, 상기 회로는, 상기 제약에 따라 정해지는 상기 최대 해상도를 상기 시퀀스 파라미터 세트에 부호화하며, 상기 적어도 하나의 픽처의 해상도로서 지정되는 상기 해상도를 상기 픽처 파라미터 세트에 부호화한다.
이로 인해, 부호화 장치는, 시퀀스 파라미터 세트에 있어서 너무 큰 최대 해상도가 지정되는 것을 억제할 수 있는 경우가 있다. 따라서, 부호화 장치는, 너무 큰 계산 리소스 및 메모리 리소스가 확보되는 것을 억제할 수 있는 경우가 있다.
또, 예를 들면, 본 개시의 일 양태에 따른 복호 장치는, 회로와, 상기 회로에 접속된 메모리를 구비하고, 상기 회로는, 동작에 있어서, 픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 복호에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 복호한다.
이로 인해, 복호 장치는, 해상도의 빈번한 변경을 억제할 수 있는 경우가 있다. 따라서, 복호 장치는, 계산 리소스 및 메모리 리소스의 소비를 억제할 수 있는 경우가 있으며, 부담을 경감할 수 있는 경우가 있다. 또, 복호 장치는, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스가 항상 확보되는 것을 억제할 수 있는 경우가 있다. 또, 복호 장치는, 시험의 곤란함을 저감할 수 있는 경우가 있다.
또, 예를 들면, 상기 회로는, 복호 화상을 표시하기 위한 후처리에 대해 계산 리소스 및 메모리 리소스 중 적어도 하나를 상기 제약에 따라 할당한다.
이로 인해, 복호 장치는, 복호 화상을 표시하기 위한 후처리에 대해 필요 또한 충분한 계산 리소스 또는 메모리 리소스를 제약에 따라 준비할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, 상기 픽처가, k번째의 랜덤 액세스 픽처마다의 상기 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만, 상기 픽처의 해상도를 변경하는 것이 허용되며, 상기 k는, 1보다 큰 정수이다.
이로 인해, 복호 장치는, 해상도의 변경을 더 억제할 수 있는 경우가 있다. 따라서, 복호 장치는, 계산 리소스 및 메모리 리소스의 소비를 더 억제할 수 있는 경우가 있으며, 부담을 더 경감할 수 있는 경우가 있다.
또, 예를 들면, 상기 회로는, 복수의 픽처를 비트 스트림으로부터 순차적으로 복호하고, 상기 비트 스트림의 비트량을 모니터링하며, 모니터링된 상기 비트량에 따라, 상기 픽처의 해상도의 변경을 제어한다.
이로 인해, 복호 장치는, 비트 스트림의 비트량에 따라 해상도를 변경할 수 있는 경우가 있으며, 해상도의 변경에 따라 비트 스트림의 비트량을 조정할 수 있는 경우가 있다.
또, 예를 들면, 상기 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 복호하고, 계속해서, 상기 하나 이상의 랜덤 액세스 픽처에 포함되는 랜덤 액세스 픽처로서, 표시 순으로 상기 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 복호하며, 계속해서, 상기 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 복호하고, 계속해서, 상기 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 복호하며, 상기 제약에서는, 상기 적어도 하나의 리딩 픽처의 해상도는, 상기 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되지 않고, 상기 랜덤 액세스 픽처의 해상도는, 상기 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되며, 상기 적어도 하나의 제2 트레일링 픽처의 해상도는, 상기 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않는다.
이로 인해, 복호 장치는, 표시 순에 있어서, 랜덤 액세스 픽처에서만 해상도를 변경할 수 있는 경우가 있다. 따라서, 복호 장치는, 표시 순을 따라, 해상도의 변경을 원활하게 행할 수 있는 경우가 있다.
또, 예를 들면, 상기 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 복호하고, 계속해서, 상기 하나 이상의 랜덤 액세스 픽처에 포함되는 랜덤 액세스 픽처로서, 표시 순으로 상기 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 복호하며, 계속해서, 상기 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 복호하고, 계속해서, 상기 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 복호하며, 상기 제약에서는, 상기 랜덤 액세스 픽처의 해상도는, 상기 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되고, 상기 적어도 하나의 리딩 픽처의 해상도는, 상기 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않고, 상기 적어도 하나의 제2 트레일링 픽처의 해상도는, 상기 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되지 않는다.
이로 인해, 복호 장치는, 복호 순에 있어서, 랜덤 액세스 픽처에서만 해상도를 변경할 수 있는 경우가 있다. 따라서, 복호 장치는, 복호 순을 따라, 해상도의 변경을 원활하게 행할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, DASH(Dynamic Adaptive Streaming over HTTP) 프로토콜로 정해지는 복수의 세그먼트 각각에 대해서, 당해 세그먼트 내에서 상기 픽처의 해상도를 변경하는 것이 허용되지 않는다.
이로 인해, 복호 장치는, 해상도의 변경을 세그먼트 단위로 제한할 수 있는 경우가 있다. 따라서, 이로 인해, 복호 장치는, 해상도의 빈번한 변경을 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, DASH 프로토콜로 정해지는 복수의 레프리젠테이션 각각에 있어서, 역치보다 짧은 간격으로 상기 픽처의 해상도를 변경하는 것이 허용되지 않는다.
이로 인해, 복호 장치는, 같은 레프리젠테이션에 있어서, 짧은 간격으로 해상도를 변경하는 것을 억제할 수 있는 경우가 있다. 따라서, 이로 인해, 복호 장치는, 해상도의 빈번한 변경을 더 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, 상기 픽처의 해상도가 복수의 해상도 후보 중 어느 하나로 제한된다.
이로 인해, 복호 장치는, 복수의 해상도 후보 중 어느 하나로 해상도를 제한할 수 있는 경우가 있다. 따라서, 복호 장치는, 처리의 복잡화를 억제할 수 있는 경우가 있다. 또, 복호 장치는, 시험의 곤란함을 저감할 수 있는 경우가 있다.
또, 예를 들면, 상기 복수의 해상도 후보는, 상기 선행 픽처의 해상도를 복수의 고정 비율로 스케일링함으로써 정해지는 복수의 해상도 후보를 포함한다.
이로 인해, 복호 장치는, 변경 전의 해상도로부터 고정 비율을 사용하여 원활하게 해상도를 변경할 수 있는 경우가 있다. 또, 복호 장치는, 고정 비율을 사용하여 원활하게 참조 화상을 리샘플링할 수 있는 경우가 있다. 따라서, 복호 장치는, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 복수의 고정 비율은, 2배, 3/2배, 4/3배, 3/4배, 2/3배 및 1/2배 중 적어도 하나를 포함한다.
이로 인해, 복호 장치는, 참조 화상을 리샘플링 하는 것이 용이한 비율로 해상도를 변경할 수 있는 경우가 있다. 따라서, 복호 장치는, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 복수의 해상도 후보는, 7680×4320 화소, 5120×2880 화소, 3840×2160 화소, 2560×1440 화소, 1920×1080 화소, 1280×720 화소 및 960×540 화소로 정해지는 복수의 해상도 후보를 포함한다.
이로 인해, 복호 장치는, 범용적인 해상도를 이용할 수 있는 경우가 있으며, 범용성을 유지할 수 있는 경우가 있다.
또, 예를 들면, 상기 복수의 해상도 후보는, 상기 선행 픽처의 해상도에 대해 복수의 고정 차분값의 가산 또는 감산을 적용함으로써 정해지는 복수의 해상도 후보를 포함한다.
이로 인해, 복호 장치는, 변경 전의 해상도, 및, 고정 차분값에 따라, 변경 후의 해상도를 적절하게 제한할 수 있는 경우가 있으며, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기 제약에서는, 시퀀스 파라미터 세트에 있어서 상한으로서 지정되는 최대 해상도가, 상기 시퀀스 파라미터 세트가 적용되는 복수의 픽처 중 적어도 하나의 픽처에 적용되는 픽처 파라미터 세트에 있어서 상기 적어도 하나의 픽처의 해상도로서 지정되는 해상도와 같은 것으로 제한되고, 상기 회로는, 상기 제약에 따라 정해지는 상기 최대 해상도를 상기 시퀀스 파라미터 세트로부터 복호하며, 상기 적어도 하나의 픽처의 해상도로서 지정되는 상기 해상도를 상기 픽처 파라미터 세트로부터 복호한다.
이로 인해, 복호 장치는, 시퀀스 파라미터 세트에 있어서 너무 큰 최대 해상도가 지정되는 것을 억제할 수 있는 경우가 있다. 따라서, 복호 장치는, 너무 큰 계산 리소스 및 메모리 리소스가 확보되는 것을 억제할 수 있는 경우가 있다.
또, 예를 들면, 본 개시의 일 양태에 따른 부호화 방법은, 픽처의 해상도를 표시 순 및 부호화 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 부호화한다.
이로 인해, 해상도의 빈번한 변경을 억제하는 것이 가능해지는 경우가 있다. 따라서, 계산 리소스 및 메모리 리소스의 소비를 억제하는 것이 가능해지는 경우가 있으며, 부담을 경감하는 것이 가능해지는 경우가 있다. 또, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스가 항상 확보되는 것을 억제하는 것이 가능해지는 경우가 있다. 또, 시험의 곤란함을 저감하는 것이 가능해지는 경우가 있다.
또, 예를 들면, 본 개시의 일 양태에 따른 복호 방법은, 픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 복호에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 복호한다.
이로 인해, 해상도의 빈번한 변경을 억제하는 것이 가능해지는 경우가 있다. 따라서, 계산 리소스 및 메모리 리소스의 소비를 억제하는 것이 가능해지는 경우가 있으며, 부담을 경감하는 것이 가능해지는 경우가 있다. 또, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스가 항상 확보되는 것을 억제하는 것이 가능해지는 경우가 있다. 또, 시험의 곤란함을 저감하는 것이 가능해지는 경우가 있다.
또, 예를 들면, 본 개시의 일 양태에 따른 비일시적인 컴퓨터 판독 가능한 기록 매체는, 비트 스트림을 기억하는 비일시적인 컴퓨터 판독 가능한 기록 매체로서, 상기 비트 스트림은, 복수의 픽처와, 상기 복수의 픽처를 상기 비트 스트림으로부터 복호하는 복호 처리를 행하기 위한 복수의 파라미터를 포함하고, 상기 복호 처리에서는, 상기 복수의 파라미터에 따르는 동작에 있어서, 픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 복호에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 복호한다.
이로 인해, 해상도의 빈번한 변경을 억제하는 것이 가능해지는 경우가 있다. 따라서, 계산 리소스 및 메모리 리소스의 소비를 억제하는 것이 가능해지는 경우가 있으며, 부담을 경감하는 것이 가능해지는 경우가 있다. 또, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스가 항상 확보되는 것을 억제하는 것이 가능해지는 경우가 있다. 또, 시험의 곤란함을 저감하는 것이 가능해지는 경우가 있다.
또, 예를 들면, 상기 복수의 파라미터는, 상기 복수의 픽처 중 하나 이상의 픽처의 해상도의 변경이 허용되는지 여부를 나타내는 제1 파라미터와, 상기 픽처의 해상도를 나타내는 제2 파라미터를 포함하고, 상기 제1 파라미터에 따라 상기 하나 이상의 픽처의 해상도의 변경이 허용되고, 상기 픽처가 상기 하나 이상의 픽처에 포함되며, 상기 제약에 따라 상기 픽처의 해상도의 변경이 허용되는 경우, 상기 제2 파라미터에 따라 상기 픽처의 해상도가 변경된다.
이로 인해, 해상도의 변경에 관한 제약 및 복수의 파라미터에 따라, 해상도의 빈번한 변경을 억제하면서, 해상도를 변경하는 것이 가능해지는 경우가 있다.
또, 예를 들면, 본 개시의 일 양태에 따른 부호화 장치는, 입력부와, 분할부와, 인트라 예측부와, 인터 예측부와, 루프 필터부와, 변환부와, 양자화부와, 엔트로피 부호화부와, 출력부를 구비한다.
상기 입력부에는, 커런트 픽처가 입력된다. 상기 분할부는, 상기 커런트 픽처를 복수의 블록으로 분할한다.
상기 인트라 예측부는, 상기 커런트 픽처에 포함되는 참조 화상을 사용하여, 상기 커런트 픽처에 포함되는 커런트 블록의 예측 신호를 생성한다. 상기 인터 예측부는, 상기 커런트 픽처와는 상이한 참조 픽처에 포함되는 참조 화상을 사용하여, 상기 커런트 픽처에 포함되는 커런트 블록의 예측 신호를 생성한다. 상기 루프 필터부는, 상기 커런트 픽처에 포함되는 커런트 블록의 재구성 블록에 필터를 적용한다.
상기 변환부는, 상기 커런트 픽처에 포함되는 커런트 블록의 원신호와, 상기 인트라 예측부 또는 상기 인터 예측부에 의해 생성된 예측 신호의 예측 오차를 변환하여, 변환 계수를 생성한다. 상기 양자화부는, 상기 변환 계수를 양자화하여, 양자화 계수를 생성한다. 상기 엔트로피 부호화부는, 상기 양자화 계수에 대해 가변 길이 부호화를 적용하여, 부호화 비트 스트림을 생성한다. 그리고, 상기 출력부로부터, 가변 길이 부호화가 적용된 상기 양자화 계수와, 제어 정보를 포함하는 상기 부호화 비트 스트림이 출력된다.
또, 예를 들면, 상기 인터 예측부는, 동작에 있어서, 픽처의 해상도를 표시 순 및 부호화 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 부호화한다.
또, 예를 들면, 본 개시의 일 양태에 따른 복호 장치는, 입력부와, 엔트로피 복호부와, 역양자화부와, 역변환부와, 인트라 예측부와, 인터 예측부와, 루프 필터부와, 출력부를 구비한다.
상기 입력부에는, 부호화 비트 스트림이 입력된다. 상기 엔트로피 복호부는, 상기 부호화 비트 스트림에 대해 가변 길이 복호를 적용하여, 양자화 계수를 도출한다. 상기 역양자화부는, 상기 양자화 계수를 역양자화하여, 변환 계수를 도출한다. 상기 역변환부는, 상기 변환 계수를 역변환하여, 예측 오차를 도출한다.
상기 인트라 예측부는, 커런트 픽처에 포함되는 참조 화상을 사용하여, 상기 커런트 픽처에 포함되는 커런트 블록의 예측 신호를 생성한다. 상기 인터 예측부는, 상기 커런트 픽처와는 상이한 참조 픽처에 포함되는 참조 화상을 사용하여, 상기 커런트 픽처에 포함되는 커런트 블록의 예측 신호를 생성한다.
상기 루프 필터부는, 상기 커런트 픽처에 포함되는 커런트 블록의 재구성 블록에 필터를 적용한다. 그리고, 상기 출력부로부터, 상기 커런트 픽처가 출력된다.
또, 예를 들면, 상기 인터 예측부는, 동작에 있어서, 픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 복호에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 복호한다.
또한, 이들의 포괄적 또는 구체적인 양태는, 시스템, 장치, 방법, 집적 회로, 컴퓨터 프로그램, 또는, 컴퓨터 판독 가능한 CD-ROM 등의 비일시적인 기록 매체로 실현되어도 되고, 시스템, 장치, 방법, 집적 회로, 컴퓨터 프로그램, 및, 기록 매체의 임의의 조합으로 실현되어도 된다.
[용어의 정의]
각 용어는 일례로서 이하와 같은 정의여도 된다.
(1) 화상
화소의 집합에 의해 구성된 데이터의 단위이며, 픽처나 픽처보다 작은 블록으로 이루어지고, 동화상 이외에, 정지 화상도 포함한다.
(2) 픽처
화소의 집합에 의해 구성되는 화상의 처리 단위이며, 프레임이나 필드로 불리는 경우도 있다.
(3) 블록
특정 수의 화소를 포함하는 집합의 처리 단위이며, 이하의 예로 드는 바와 같이, 명칭은 상관없다. 또, 형상도 상관없고, 예를 들면, M×N 화소로 이루어지는 직사각형, M×M 화소로 이루어지는 정사각형은 물론, 삼각형, 원형, 그 외의 형상도 포함한다.
(블록의 예)
·슬라이스/타일/브릭
·CTU/슈퍼 블록/기본 분할 단위
·VPDU/하드웨어의 처리 분할 단위
·CU/처리 블록 단위/예측 블록 단위(PU)/직교 변환 블록 단위(TU)/유닛
·서브 블록
(4) 화소/샘플
화상을 구성하는 최소 단위의 점으로서, 정수 위치의 화소뿐만 아니라 정수 위치의 화소에 의거하여 생성된 소수 위치의 화소도 포함한다.
(5) 화소값/샘플값
화소가 갖는 고유의 값으로서, 휘도값, 색차값, RGB의 계조는 물론, depth값, 또는 0, 1의 2치도 포함한다.
(6) 플래그
1비트 이외에, 복수 비트의 경우도 포함하며, 예를 들면, 2비트 이상의 파라미터나 인덱스여도 된다. 또, 이진수를 사용한 2치뿐만 아니라, 그 외의 진수를 사용한 다치여도 된다.
(7) 신호
정보를 전달하기 위해 기호화, 부호화한 것으로서, 이산화(離散化)된 디지털 신호 이외에, 연속값을 취하는 아날로그 신호도 포함한다.
(8) 스트림/비트 스트림
디지털 데이터의 데이터열 또는 디지털 데이터의 흐름을 말한다. 스트림/비트 스트림은, 1개의 스트림 이외에, 복수의 계층으로 나뉘어 복수의 스트림에 의해 구성되어도 된다. 또, 단수의 전송로에서 시리얼 통신에 의해 전송되는 경우 이외에, 복수의 전송로에서 패킷 통신에 의해 전송되는 경우도 포함한다.
(9) 차/차분
스칼라량의 경우, 단순 차(x-y) 이외에, 차의 연산이 포함되어 있으면 충분하며, 차의 절대값(|x-y|), 제곱 차(x^2-y^2), 차의 평방근(√(x-y)), 가중치 차(ax-by:a, b는 상수), 오프셋 차(x-y+a:a는 오프셋)를 포함한다.
(10) 합
스칼라량의 경우, 단순 합(x+y) 이외에, 합의 연산이 포함되어 있으면 충분하며, 합의 절대값(|x+y|), 제곱 합(x^2+y^2), 합의 평방근(√(x+y)), 가중치 합(ax+by:a, b는 상수), 오프셋 합(x+y+a:a는 오프셋)을 포함한다.
(11) 의거하여(based on)
의거하는 대상이 되는 요소 이외를 가미하는 경우도 포함한다. 또, 직접 결과를 구하는 경우 이외에, 중간적인 결과를 경유하여 결과를 구하는 경우도 포함한다.
(12) 사용하여(used, using)
사용하는 대상이 되는 요소 이외를 가미하는 경우도 포함한다. 또, 직접 결과를 구하는 경우 이외에, 중간적인 결과를 경유하여 결과를 구하는 경우도 포함한다.
(13) 금지한다(prohibit, forbid)
허용되지 않는다와 바꾸어 말할 수 있다. 또, 금지하지 않은 것 또는 허용되는 것은, 꼭 의무를 의미하는 것은 아니다.
(14) 제한한다(limit, restriction/restrict/restricted)
허용되지 않는다와 바꾸어 말할 수 있다. 또, 금지하지 않은 것 또는 허용되는 것은, 꼭 의무를 의미하는 것은 아니다. 또한, 양적 또는 질적으로 일부가 금지되어 있으면 충분하며, 전면적으로 금지하는 경우도 포함된다.
(15) 색차(chroma)
샘플 배열 또는 단일한 샘플이, 원색에 관련된 2개의 색차(colour difference) 신호 중 하나를 나타내는 것을 지정하는, 기호 Cb 및 Cr로 표시되는 형용사이다. chroma라는 용어 대신에, chrominance라는 용어를 사용할 수도 있다.
(16) 휘도(luma)
샘플 배열 또는 단일한 샘플이 원색에 관련된 모노크롬 신호를 나타내는 것을 지정하는, 기호 또는 아래 첨자 Y 또는 L로 표시되는 형용사이다. luma라는 용어 대신에, luminance라는 용어를 사용할 수도 있다.
[기재에 관한 해설]
도면에 있어서, 동일한 참조 번호는 동일 또는 유사한 구성 요소를 나타낸다. 또, 도면에 있어서의 구성 요소의 사이즈 및 상대 위치는, 꼭 일정한 축척으로 그려져 있지 않다.
이하, 실시 형태에 대해서 도면을 참조하면서 구체적으로 설명한다. 또한, 이하에서 설명하는 실시 형태는, 모두 포괄적 또는 구체적인 예를 나타내는 것이다. 이하의 실시 형태에서 나타나는 수치, 형상, 재료, 구성 요소, 구성 요소의 배치 위치 및 접속 형태, 단계, 단계의 관계 및 순서 등은 일례이며, 청구의 범위를 한정하는 주지가 아니다.
이하에서는, 부호화 장치 및 복호화 장치의 실시 형태를 설명한다. 실시 형태는, 본 개시의 각 양태에서 설명하는 처리 및/또는 구성을 적용 가능한 부호화 장치 및 복호화 장치의 예이다. 처리 및/또는 구성은, 실시 형태와는 상이한 부호화 장치 및 복호화 장치에 있어서도 실시 가능하다. 예를 들면, 실시 형태에 대해 적용되는 처리 및/또는 구성에 관하여, 예를 들면 이하 중 어느 하나를 실시해도 된다.
(1) 본 개시의 각 양태에서 설명하는 실시 형태의 부호화 장치 또는 복호 장치의 복수의 구성 요소 중 어느 하나는, 본 개시의 각 양태 중 어느 하나에서 설명하는 다른 구성 요소로 치환 또는 조합되어도 된다.
(2) 실시 형태의 부호화 장치 또는 복호 장치에 있어서, 당해 부호화 장치 또는 복호 장치의 복수의 구성 요소 중 일부의 구성 요소에 의해 행해지는 기능 또는 처리에, 기능 또는 처리의 추가, 치환, 삭제 등의 임의의 변경이 이루어져도 된다. 예를 들면, 어느 하나의 기능 또는 처리는, 본 개시의 각 양태 중 어느 하나에서 설명하는 다른 기능 또는 처리로, 치환 또는 조합되어도 된다.
(3) 실시 형태의 부호화 장치 또는 복호 장치가 실시하는 방법에 있어서, 당해 방법에 포함되는 복수의 처리 중 일부의 처리에 대해서, 추가, 치환 및 삭제 등의 임의의 변경이 이루어져도 된다. 예를 들면, 방법에 있어서의 어느 하나의 처리는, 본 개시의 각 양태 중 어느 하나에서 설명하는 다른 처리로, 치환 또는 조합되어도 된다.
(4) 실시 형태의 부호화 장치 또는 복호 장치를 구성하는 복수의 구성 요소 중 일부의 구성 요소는, 본 개시의 각 양태 중 어느 하나에서 설명하는 구성 요소와 조합되어도 되고, 본 개시의 각 양태 중 어느 하나에서 설명하는 기능의 일부를 구비하는 구성 요소와 조합되어도 되고, 본 개시의 각 양태에서 설명하는 구성 요소가 실시하는 처리의 일부를 실시하는 구성 요소와 조합되어도 된다.
(5) 실시 형태의 부호화 장치 또는 복호 장치의 기능의 일부를 구비하는 구성 요소, 또는, 실시 형태의 부호화 장치 또는 복호 장치의 처리의 일부를 실시하는 구성 요소는, 본 개시의 각 양태 중 어느 하나에서 설명하는 구성 요소와, 본 개시의 각 양태 중 어느 하나에서 설명하는 기능의 일부를 구비하는 구성 요소와, 또는, 본 개시의 각 양태 중 어느 하나에서 설명하는 처리의 일부를 실시하는 구성 요소와 조합 또는 치환되어도 된다.
(6) 실시 형태의 부호화 장치 또는 복호 장치가 실시하는 방법에 있어서, 당해 방법에 포함되는 복수의 처리 중 어느 하나는, 본 개시의 각 양태 중 어느 하나에서 설명하는 처리로, 또는, 마찬가지의 어느 하나의 처리로, 치환 또는 조합되어도 된다.
(7) 실시 형태의 부호화 장치 또는 복호 장치가 실시하는 방법에 포함되는 복수의 처리 중 일부의 처리는, 본 개시의 각 양태 중 어느 하나에서 설명하는 처리와 조합되어도 된다.
(8) 본 개시의 각 양태에서 설명하는 처리 및/또는 구성의 실시 방법은, 실시 형태의 부호화 장치 또는 복호 장치로 한정되는 것은 아니다. 예를 들면, 처리 및/또는 구성은, 실시 형태에 있어서 개시하는 동화상 부호화 또는 동화상 복호와는 상이한 목적으로 이용되는 장치에 있어서 실시되어도 된다.
[시스템 구성]
도 1은, 본 실시 형태에 따른 전송 시스템의 구성의 일례를 나타내는 개략도이다.
전송 시스템(Trs)은, 화상을 부호화함으로써 생성되는 스트림을 전송하고, 전송된 스트림을 복호하는 시스템이다. 이러한 전송 시스템(Trs)은, 예를 들면 도 1에 나타내는 바와 같이, 부호화 장치(100), 네트워크(Nw), 및 복호 장치(200)를 포함한다.
부호화 장치(100)에는 화상이 입력된다. 부호화 장치(100)는, 그 입력된 화상을 부호화함으로써 스트림을 생성하고, 그 스트림을 네트워크(Nw)에 출력한다. 스트림에는, 예를 들면, 부호화된 화상과, 그 부호화된 화상을 복호하기 위한 제어 정보가 포함되어 있다. 이 부호화에 의해 화상은 압축된다.
또한, 부호화 장치(100)에 입력되는, 부호화되기 전의 원래의 화상은, 원화상, 원신호, 또는 원샘플이라고도 불린다. 또, 화상은, 동화상 또는 정지 화상이어도 된다. 또, 화상은, 시퀀스, 픽처 및 블록 등의 상위 개념으로서, 별도로 규정되지 않는 한, 공간적 및 시간적인 영역의 제한을 받지 않는다. 또, 화상은, 화소 또는 화소값의 배열로 이루어지며, 그 화상을 나타내는 신호, 또는 화소값은, 샘플이라고도 불린다. 또, 스트림은, 비트 스트림, 부호화 비트 스트림, 압축 비트 스트림, 또는 부호화 신호로 불려도 된다. 또한, 부호화 장치는, 화상 부호화 장치 또는 동화상 부호화 장치로 불려도 되고, 부호화 장치(100)에 의한 부호화의 방법은, 부호화 방법, 화상 부호화 방법, 또는 동화상 부호화 방법으로 불려도 된다.
네트워크(Nw)는, 부호화 장치(100)가 생성한 스트림을 복호 장치(200)에 전송한다. 네트워크(Nw)는, 인터넷, 광역 네트워크(WAN:Wide Area Network), 소규모 네트워크(LAN:Local Area Network), 또는 이들의 조합이어도 된다. 네트워크(Nw)는, 꼭 쌍방향 통신망에 한정하지 않고, 지상 디지털 방송, 또는 위성 방송 등의 방송파를 전송하는 일방향 통신망이어도 된다. 또, 네트워크(Nw)는, DVD(Digital Versatile Disc), BD(Blu-Ray Disc(등록 상표)) 등의 스트림을 기록한 기억 매체에 의해 대체되어도 된다.
복호 장치(200)는, 네트워크(Nw)가 전송한 스트림을 복호함으로써, 예를 들면 비압축 화상인 복호 화상을 생성한다. 예를 들면, 복호 장치는, 부호화 장치(100)에 의한 부호화 방법에 대응하는 복호 방법에 따라 스트림을 복호한다.
또한, 복호 장치는, 화상 복호 장치 또는 동화상 복호 장치로 불려도 되고, 복호 장치(200)에 의한 복호의 방법은, 복호 방법, 화상 복호 방법, 또는 동화상 복호 방법으로 불려도 된다.
[데이터 구조]
도 2는, 스트림에 있어서의 데이터의 계층 구조의 일례를 나타내는 도면이다. 스트림은, 예를 들면 비디오 시퀀스를 포함한다. 이 비디오 시퀀스는, 예를 들면 도 2의 (a)에 나타내는 바와 같이, VPS(Video Parameter Set)와, SPS(Sequence Parameter Set)와, PPS(Picture Parameter Set)와, SEI(Supplemental Enhancement Information)와, 복수의 픽처를 포함한다.
VPS는, 복수의 레이어로 구성되어 있는 동화상에 있어서, 복수의 레이어에 공통되는 부호화 파라미터와, 동화상에 포함되는 복수의 레이어, 또는 개개의 레이어에 관련된 부호화 파라미터를 포함한다.
SPS는, 시퀀스에 대해 사용되는 파라미터, 즉, 시퀀스를 복호하기 위해 복호 장치(200)가 참조하는 부호화 파라미터를 포함한다. 예를 들면, 그 부호화 파라미터는, 픽처의 폭 또는 높이를 나타내도 된다. 또한, SPS는 복수 존재해도 된다.
PPS는, 픽처에 대해 사용되는 파라미터, 즉, 시퀀스 내의 각 픽처를 복호하기 위해 복호 장치(200)가 참조하는 부호화 파라미터를 포함한다. 예를 들면, 그 부호화 파라미터는, 픽처의 복호에 사용되는 양자화 폭의 기준값과, 가중치 예측의 적용을 나타내는 플래그를 포함해도 된다. 또한, PPS는 복수 존재해도 된다. 또, SPS와 PPS는, 단순히 파라미터 세트로 불리는 경우가 있다.
픽처는, 도 2의 (b)에 나타내는 바와 같이, 픽처 헤더와, 하나 이상의 슬라이스를 포함하고 있어도 된다. 픽처 헤더는, 그 하나 이상의 슬라이스를 복호하기 위해 복호 장치(200)가 참조하는 부호화 파라미터를 포함한다.
슬라이스는, 도 2의 (c)에 나타내는 바와 같이, 슬라이스 헤더와, 하나 이상의 브릭을 포함한다. 슬라이스 헤더는, 그 하나 이상의 브릭을 복호하기 위해 복호 장치(200)가 참조하는 부호화 파라미터를 포함한다.
브릭은, 도 2의 (d)에 나타내는 바와 같이, 하나 이상의 CTU(Coding Tree Unit)를 포함한다.
또한, 픽처는, 슬라이스를 포함하지 않고, 그 슬라이스 대신에, 타일 그룹을 포함하고 있어도 된다. 이 경우, 타일 그룹은, 하나 이상의 타일을 포함한다. 또, 브릭에 슬라이스가 포함되어 있어도 된다.
CTU는, 슈퍼 블록 또는 기본 분할 단위라고도 불린다. 이러한 CTU는, 도 2의 (e)에 나타내는 바와 같이, CTU 헤더와, 하나 이상의 CU(Coding Unit)를 포함한다. CTU 헤더는, 하나 이상의 CU를 복호하기 위해 복호 장치(200)가 참조하는 부호화 파라미터를 포함한다.
CU는, 복수의 작은 CU로 분할되어도 된다. 또, CU는, 도 2의 (f)에 나타내는 바와 같이, CU 헤더와, 예측 정보와, 잔차 계수 정보를 포함한다. 예측 정보는, 그 CU를 예측하기 위한 정보이며, 잔차 계수 정보는, 후술하는 예측 잔차를 나타내는 정보이다. 또한, CU는, 기본적으로 PU(Prediction Unit) 및 TU(Transform Unit)와 동일하지만, 예를 들면 후술하는 SBT에서는, 그 CU보다 작은 복수의 TU를 포함하고 있어도 된다. 또, CU는, 그 CU를 구성하는 VPDU(Virtual Pipeline Decoding Unit)마다 처리되어도 된다. VPDU는, 예를 들면, 하드웨어에 있어서 파이프라인 처리를 행할 때에, 1 스테이지에서 처리할 수 있는 고정적인 단위이다.
또한, 스트림은, 도 2에 나타내는 각 계층 중 어느 일부의 계층을 갖지 않아도 된다. 또, 이들 계층의 순서는, 바뀌어도 되고, 어느 하나의 계층은 다른 계층으로 치환되어도 된다. 또, 부호화 장치(100) 또는 복호 장치(200) 등의 장치에 의해 현시점에서 행해지는 처리의 대상이 되고 있는 픽처를, 커런트 픽처라고 한다. 그 처리가 부호화이면, 커런트 픽처는, 부호화 대상 픽처와 동의(同義)이며, 그 처리가 복호이면, 커런트 픽처는, 복호 대상 픽처와 동의이다. 또, 부호화 장치(100) 또는 복호 장치(200) 등의 장치에 의해 현시점에서 행해지는 처리의 대상이 되고 있는 예를 들면 CU 또는 CU 등의 블록을, 커런트 블록이라고 한다. 그 처리가 부호화이면, 커런트 블록은, 부호화 대상 블록과 동의이며, 그 처리가 복호이면, 커런트 블록은, 복호 대상 블록과 동의이다.
[픽처의 구성 슬라이스/타일]
픽처를 병렬로 디코딩하기 위해, 픽처는 슬라이스 단위 또는 타일 단위로 구성되는 경우가 있다.
슬라이스는, 픽처를 구성하는 기본적인 부호화의 단위이다. 픽처는, 예를 들면 하나 이상의 슬라이스로 구성된다. 또, 슬라이스는, 하나 이상의 연속하는 CTU로 이루어진다.
도 3은, 슬라이스의 구성의 일례를 나타내는 도면이다. 예를 들면, 픽처는, 11×8개의 CTU를 포함하고, 또한, 4개의 슬라이스(슬라이스 1-4)로 분할된다. 슬라이스 1은, 예를 들면 16개의 CTU로 이루어지고, 슬라이스 2는, 예를 들면 21개의 CTU로 이루어지며, 슬라이스 3은, 예를 들면 29개의 CTU로 이루어지고, 슬라이스 4는, 예를 들면 22개의 CTU로 이루어진다. 여기서, 픽처 내의 각 CTU는, 어느 하나의 슬라이스에 속한다. 슬라이스의 형상은, 픽처를 수평 방향으로 분할한 형태가 된다. 슬라이스의 경계는, 화면 끝일 필요는 없고, 화면 내의 CTU의 경계 중 어느 곳이어도 된다. 슬라이스 중의 CTU의 처리 순(부호화 순 또는 복호 순)은, 예를 들면 래스터·스캔 순이다. 또, 슬라이스는, 슬라이스 헤더와 부호화 데이터를 포함한다. 슬라이스 헤더에는, 슬라이스의 선두의 CTU 어드레스, 슬라이스·타입 등 그 슬라이스의 특징이 기술되어도 된다.
타일은, 픽처를 구성하는 직사각형 영역의 단위이다. 각 타일에는 TileId로 불리는 번호가 래스터·스캔 순으로 배정되어도 된다.
도 4는, 타일의 구성의 일례를 나타내는 도면이다. 예를 들면, 픽처는, 11×8개의 CTU를 포함하고, 또한, 4개의 직사각형 영역의 타일(타일 1-4)로 분할된다. 타일이 사용되는 경우, 타일이 사용되지 않는 경우와 비교하여 CTU의 처리 순이 변경된다. 타일이 사용되지 않는 경우, 픽처 내의 복수의 CTU는 예를 들면 래스터·스캔 순으로 처리된다. 타일이 사용되는 경우에는, 복수의 타일 각각에 있어서, 적어도 1개의 CTU가 예를 들면 래스터·스캔 순으로 처리된다. 예를 들면, 도 4에 나타내는 바와 같이, 타일 1에 포함되는 복수의 CTU의 처리 순은, 타일 1의 1열째 좌단에서부터 타일 1의 1열째 우단까지 향하고, 다음에, 타일 1의 2열째 좌단에서부터 타일 1의 2열째 우단까지 향하는 순이다.
또한, 1개의 타일은, 하나 이상의 슬라이스를 포함하는 경우가 있으며, 1개의 슬라이스는, 하나 이상의 타일을 포함하는 경우가 있다.
또한, 픽처는 타일 세트 단위로 구성되어 있어도 된다. 타일 세트는, 하나 이상의 타일 그룹을 포함해도 되고, 하나 이상의 타일을 포함해도 된다. 픽처는, 타일 세트, 타일 그룹, 및 타일 중 어느 하나 만으로 구성되어 있어도 된다. 예를 들면, 타일 세트마다 복수의 타일을 래스터 순으로 주사하는 순서를, 타일의 기본 부호화 순서로 한다. 각 타일 세트 내에서 기본 부호화 순서가 연속하는 하나 이상의 타일의 집합을 타일 그룹으로 한다. 이러한 픽처는, 후술하는 분할부(102)(도 7 참조)에 의해 구성되어도 된다.
[스케일러블 부호화]
도 5 및 도 6은, 스케일러블한 스트림의 구성의 일례를 나타내는 도면이다.
부호화 장치(100)는, 도 5에 나타내는 바와 같이, 복수의 픽처 각각을, 복수의 레이어 중 어느 하나로 나누어 부호화함으로써, 시간적/공간적 스케일러블한 스트림을 생성해도 된다. 예를 들면, 부호화 장치(100)는, 레이어마다 픽처를 부호화함으로써, 베이스 레이어의 상위에 인핸스먼트 레이어가 존재하는 스케일러빌리티를 실현한다. 이러한 각 픽처의 부호화를, 스케일러블 부호화라고 한다. 이로 인해, 복호 장치(200)는, 그 스트림을 복호함으로써 표시되는 화상의 화질을 전환할 수 있다. 즉, 복호 장치(200)는, 스스로의 성능이라는 내적 요인과, 통신 대역 상태 등의 외적 요인에 따라, 어느 레이어까지 복호할지를 결정한다. 그 결과, 복호 장치(200)는, 동일한 컨텐츠를 저해상도 컨텐츠와 고해상도 컨텐츠로 자유롭게 전환하여 복호할 수 있다. 예를 들면, 그 스트림의 이용자는, 이동 중에, 스마트폰을 사용하여, 그 스트림의 동화상을 중간까지 시청하고, 귀가 후에, 인터넷 TV 등의 기기를 사용하여, 그 동화상을 계속해서 시청한다. 또한, 상술한 스마트폰 및 기기 각각에는, 서로 성능이 동일 또는 상이한 복호 장치(200)가 내장되어 있다. 이 경우에는, 그 기기가 그 스트림 중 상위 레이어까지를 복호하면, 이용자는, 귀가 후에는 고화질의 동화상을 시청할 수 있다. 이로 인해, 부호화 장치(100)는, 동일 내용으로 화질이 상이한 복수의 스트림을 생성할 필요가 없어, 처리 부하를 저감할 수 있다.
또한, 인핸스먼트 레이어는, 화상의 통계 정보 등에 의거한 메타 정보를 포함하고 있어도 된다. 복호 장치(200)는, 메타 정보에 의거하여 베이스 레이어의 픽처를 초해상함으로써 고화질화된 동화상을 생성해도 된다. 초해상이란, 동일 해상도에 있어서의 SN(Signal-to-Noise)비의 향상, 및, 해상도의 확대 중 어느 쪽이어도 된다. 메타 정보는, 초해상 처리에 사용하는 선형 혹은 비선형의 필터 계수를 특정하기 위한 정보, 또는, 초해상 처리에 사용하는 필터 처리, 기계 학습 혹은 최소 제곱 연산에 있어서의 파라미터값을 특정하는 정보 등을 포함하고 있어도 된다.
또는, 픽처 내의 각 오브젝트 등의 의미에 따라, 그 픽처는 타일 등으로 분할되어 있어도 된다. 이 경우, 복호 장치(200)는, 복호의 대상이 되는 타일을 선택함으로써, 픽처 중 일부의 영역만을 복호해도 된다. 또, 오브젝트의 속성(인물, 차, 볼 등)과, 픽처 내의 위치(동일 픽처에 있어서의 좌표 위치 등)가, 메타 정보로서 보관되어 있어도 된다. 이 경우, 복호 장치(200)는, 메타 정보에 의거하여 원하는 오브젝트의 위치를 특정하고, 그 오브젝트를 포함하는 타일을 결정할 수 있다. 예를 들면, 도 6에 나타내는 바와 같이, 메타 정보는, HEVC에 있어서의 SEI 등의, 화소 데이터와는 상이한 데이터 보관 구조를 사용하여 보관된다. 이 메타 정보는, 예를 들면, 메인 오브젝트의 위치, 사이즈, 또는 색채 등을 나타낸다.
또, 스트림, 시퀀스 또는 랜덤 액세스 단위 등, 복수의 픽처로 구성되는 단위로 메타 정보가 보관되어도 된다. 이로 인해, 복호 장치(200)는, 특정 인물이 동화상 내에 출현하는 시각 등을 취득할 수 있으며, 그 시각과 픽처 단위의 정보를 사용함으로써, 오브젝트가 존재하는 픽처와, 그 픽처 내에서의 오브젝트의 위치를 특정할 수 있다.
[부호화 장치]
다음에, 실시 형태에 따른 부호화 장치(100)를 설명한다. 도 7은, 실시 형태에 따른 부호화 장치(100)의 구성의 일례를 나타내는 블록도이다. 부호화 장치(100)는, 화상을 블록 단위로 부호화한다.
도 7에 나타내는 바와 같이, 부호화 장치(100)는, 화상을 블록 단위로 부호화하는 장치로서, 분할부(102)와, 감산부(104)와, 변환부(106)와, 양자화부(108)와, 엔트로피 부호화부(110)와, 역양자화부(112)와, 역변환부(114)와, 가산부(116)와, 블록 메모리(118)와, 루프 필터부(120)와, 프레임 메모리(122)와, 인트라 예측부(124)와, 인터 예측부(126)와, 예측 제어부(128)와, 예측 파라미터 생성부(130)를 구비한다. 또한, 인트라 예측부(124) 및 인터 예측부(126) 각각은, 예측 처리부의 일부로서 구성되어 있다.
[부호화 장치의 실장예]
도 8은, 부호화 장치(100)의 실장예를 나타내는 블록도이다. 부호화 장치(100)는, 프로세서(a1) 및 메모리(a2)를 구비한다. 예를 들면, 도 7에 나타난 부호화 장치(100)의 복수의 구성 요소는, 도 8에 나타난 프로세서(a1) 및 메모리(a2)에 의해 실장된다.
프로세서(a1)는, 정보 처리를 행하는 회로이며, 메모리(a2)에 액세스 가능한 회로이다. 예를 들면, 프로세서(a1)는, 화상을 부호화하는 전용 또는 범용 전자 회로이다. 프로세서(a1)는, CPU와 같은 프로세서여도 된다. 또, 프로세서(a1)는, 복수의 전자 회로의 집합체여도 된다. 또, 예를 들면, 프로세서(a1)는, 도 7에 나타난 부호화 장치(100)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소를 제외한, 복수의 구성 요소의 역할을 완수해도 된다.
메모리(a2)는, 프로세서(a1)가 화상을 부호화하기 위한 정보가 기억되는 전용 또는 범용 메모리이다. 메모리(a2)는, 전자 회로여도 되고, 프로세서(a1)에 접속되어 있어도 된다. 또, 메모리(a2)는, 프로세서(a1)에 포함되어 있어도 된다. 또, 메모리(a2)는, 복수의 전자 회로의 집합체여도 된다. 또, 메모리(a2)는, 자기 디스크 또는 광 디스크 등이어도 되고, 스토리지 또는 기록 매체 등으로 표현되어도 된다. 또, 메모리(a2)는, 불휘발성 메모리여도 되고, 휘발성 메모리여도 된다.
예를 들면, 메모리(a2)에는, 부호화되는 화상이 기억되어도 되고, 부호화된 화상에 대응하는 스트림이 기억되어도 된다. 또, 메모리(a2)에는, 프로세서(a1)가 화상을 부호화하기 위한 프로그램이 기억되어 있어도 된다.
또, 예를 들면, 메모리(a2)는, 도 7에 나타난 부호화 장치(100)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소의 역할을 완수해도 된다. 구체적으로는, 메모리(a2)는, 도 7에 나타난 블록 메모리(118) 및 프레임 메모리(122)의 역할을 완수해도 된다. 보다 구체적으로는, 메모리(a2)에는, 재구성 화상(구체적으로는, 재구성 완료 블록 또는 재구성 완료 픽처 등)이 기억되어도 된다.
또한, 부호화 장치(100)에 있어서, 도 7에 나타난 복수의 구성 요소 전부가 실장되지 않아도 되고, 상술된 복수의 처리 전부가 행해지지 않아도 된다. 도 7에 나타난 복수의 구성 요소의 일부는, 다른 장치에 포함되어 있어도 되고, 상술된 복수의 처리의 일부는, 다른 장치에 의해 실행되어도 된다.
이하, 부호화 장치(100)의 전체적인 처리의 흐름을 설명한 후에, 부호화 장치(100)에 포함되는 각 구성 요소에 대해서 설명한다.
[부호화 처리의 전체 플로]
도 9는, 부호화 장치(100)에 의한 전체적인 부호화 처리의 일례를 나타내는 플로차트이다.
우선, 부호화 장치(100)의 분할부(102)는, 원화상에 포함되는 픽처를 복수의 고정 사이즈의 블록(128×128 화소)으로 분할한다(단계 Sa_1). 그리고, 분할부(102)는, 그 고정 사이즈의 블록에 대해 분할 패턴을 선택한다(단계 Sa_2). 즉, 분할부(102)는, 고정 사이즈의 블록을, 그 선택된 분할 패턴을 구성하는 복수의 블록으로, 추가로 분할한다. 그리고, 부호화 장치(100)는, 그 복수의 블록 각각에 대해 단계 Sa_3~Sa_9의 처리를 행한다.
인트라 예측부(124) 및 인터 예측부(126)로 이루어지는 예측 처리부와, 예측 제어부(128)는, 커런트 블록의 예측 화상을 생성한다(단계 Sa_3). 또한, 예측 화상은, 예측 신호, 예측 블록 또는 예측 샘플이라고도 불린다.
다음에, 감산부(104)는, 커런트 블록과 예측 화상의 차분을 예측 잔차로서 생성한다(단계 Sa_4). 또한, 예측 잔차는, 예측 오차라고도 불린다.
다음에, 변환부(106) 및 양자화부(108)는, 그 예측 화상에 대해 변환 및 양자화를 행함으로써, 복수의 양자화 계수를 생성한다(단계 Sa_5).
다음에, 엔트로피 부호화부(110)는, 그 복수의 양자화 계수와, 예측 화상의 생성에 관한 예측 파라미터에 대해 부호화(구체적으로는 엔트로피 부호화)를 행함으로써, 스트림을 생성한다(단계 Sa_6).
다음에, 역양자화부(112) 및 역변환부(114)는, 복수의 양자화 계수에 대해 역양자화 및 역변환을 행함으로써, 예측 잔차를 복원한다(단계 Sa_7).
다음에, 가산부(116)는, 그 복원된 예측 잔차에 예측 화상을 가산함으로써 커런트 블록을 재구성한다(단계 Sa_8). 이로 인해, 재구성 화상이 생성된다. 또한, 재구성 화상은, 재구성 블록이라고도 불리며, 특히 부호화 장치(100)에 의해 생성되는 재구성 화상은, 로컬 복호 블록 또는 로컬 복호 화상이라고도 불린다.
이 재구성 화상이 생성되면, 루프 필터부(120)는, 그 재구성 화상에 대해 필터링을 필요에 따라 행한다(단계 Sa_9).
그리고, 부호화 장치(100)는, 픽처 전체의 부호화가 완료되었는지 여부를 판정하고(단계 Sa_10), 완료되지 않았다고 판정하는 경우(단계 Sa_10의 No), 단계 Sa_2에서부터의 처리를 반복하여 실행한다.
또한, 상술한 예에서는, 부호화 장치(100)는, 고정 사이즈의 블록에 대해 1개의 분할 패턴을 선택하고, 그 분할 패턴에 따라 각 블록의 부호화를 행하는데, 복수의 분할 패턴 각각에 따라 각 블록의 부호화를 행해도 된다. 이 경우에는, 부호화 장치(100)는, 복수의 분할 패턴 각각에 대한 코스트를 평가하고, 예를 들면 가장 작은 코스트의 분할 패턴에 따른 부호화에 의해 얻어지는 스트림을, 최종적으로 출력되는 스트림으로서 선택해도 된다.
또, 이들 단계 Sa_1~Sa_10의 처리는, 부호화 장치(100)에 의해 시퀀셜하게 행해져도 되고, 그들 처리 중 일부의 복수의 처리가 병렬로 행해져도 되고, 순서가 바뀌어도 된다.
이러한 부호화 장치(100)에 의한 부호화 처리는, 예측 부호화와 변환 부호화를 사용한 하이브리드 부호화이다. 또, 예측 부호화는, 감산부(104), 변환부(106), 양자화부(108), 역양자화부(112), 역변환부(114), 가산부(116), 루프 필터부(120), 블록 메모리(118), 프레임 메모리(122), 인트라 예측부(124), 인터 예측부(126), 및 예측 제어부(128)로 이루어지는 부호화 루프에 의해 행해진다. 즉, 인트라 예측부(124) 및 인터 예측부(126)로 이루어지는 예측 처리부는, 부호화 루프의 일부를 구성한다.
[분할부]
분할부(102)는, 원화상에 포함되는 각 픽처를 복수의 블록으로 분할하고, 각 블록을 감산부(104)에 출력한다. 예를 들면, 분할부(102)는, 우선, 픽처를 고정 사이즈(예를 들면 128×128 화소)의 블록으로 분할한다. 이 고정 사이즈의 블록은, 부호화 트리 유닛(CTU)으로 불리는 경우가 있다. 그리고, 분할부(102)는, 예를 들면 재귀적인 4진 트리(quadtree) 및/또는 2진 트리(binary tree) 블록 분할에 의거하여, 고정 사이즈의 블록 각각을 가변 사이즈(예를 들면 64×64 화소 이하)의 블록으로 분할한다. 즉, 분할부(102)는, 분할 패턴을 선택한다. 이 가변 사이즈의 블록은, 부호화 유닛(CU), 예측 유닛(PU) 혹은 변환 유닛(TU)으로 불리는 경우가 있다. 또한, 여러 가지 실장예에서는, CU, PU 및 TU는 구별될 필요는 없고, 픽처 내의 일부 또는 모든 블록이 CU, PU, 또는 TU의 처리 단위가 되어도 된다.
도 10은, 실시 형태에 있어서의 블록 분할의 일례를 나타내는 도면이다. 도 10에 있어서, 실선은 4진 트리 블록 분할에 의한 블록 경계를 나타내고, 파선은 2진 트리 블록 분할에 의한 블록 경계를 나타낸다.
여기에서는, 블록(10)은, 128×128 화소의 정사각형 블록이다. 이 블록(10)은, 우선, 4개의 64×64 화소의 정사각형 블록으로 분할된다(4진 트리 블록 분할).
좌상측의 64×64 화소의 정사각형 블록은, 추가로 각각 32×64 화소로 이루어지는 2개의 직사각형 블록으로 수직으로 분할되고, 좌측의 32×64 화소의 직사각형 블록은, 추가로 각각 16×64 화소로 이루어지는 2개의 직사각형 블록으로 수직으로 분할된다(2진 트리 블록 분할). 그 결과, 좌상측의 64×64 화소의 정사각형 블록은, 2개의 16×64 화소의 직사각형 블록(11 및 12)과, 32×64 화소의 직사각형 블록(13)으로 분할된다.
우상측의 64×64 화소의 정사각형 블록은, 각각 64×32 화소로 이루어지는 2개의 직사각형 블록(14 및 15)으로 수평으로 분할된다(2진 트리 블록 분할).
좌하측의 64×64 화소의 정사각형 블록은, 각각 32×32 화소로 이루어지는 4개의 정사각형 블록으로 분할된다(4진 트리 블록 분할). 각각 32×32 화소로 이루어지는 4개의 정사각형 블록 중 좌상측의 블록 및 우하측의 블록은, 추가로 분할된다. 좌상측의 32×32 화소의 정사각형 블록은, 각각 16×32 화소로 이루어지는 2개의 직사각형 블록으로 수직으로 분할되고, 우측의 16×32 화소로 이루어지는 직사각형 블록은, 추가로, 각각 16×16 화소로 이루어지는 2개의 정사각형 블록으로 수평으로 분할된다(2진 트리 블록 분할). 우하측의 32×32 화소로 이루어지는 정사각형 블록은, 각각 32×16 화소로 이루어지는 2개의 직사각형 블록으로 수평으로 분할된다(2진 트리 블록 분할). 그 결과, 좌하측의 64×64 화소의 정사각형 블록은, 16×32 화소의 직사각형 블록(16)과, 각각 16×16 화소의 2개의 정사각형 블록(17 및 18)과, 각각 32×32 화소의 2개의 정사각형 블록(19 및 20)과, 각각 32×16 화소의 2개의 직사각형 블록(21 및 22)으로 분할된다.
우하측의 64×64 화소로 이루어지는 블록(23)은 분할되지 않는다.
이상과 같이, 도 10에서는, 블록(10)은, 재귀적인 4진 트리 및 2진 트리 블록 분할에 의거하여, 13개의 가변 사이즈의 블록(11~23)으로 분할된다. 이러한 분할은, QTBT(quad-tree plus binary tree) 분할로 불리는 경우가 있다.
또한, 도 10에서는, 1개의 블록이 4개 또는 2개의 블록으로 분할되고 있었는데(4진 트리 또는 2진 트리 블록 분할), 분할은 이들에 한정되지 않는다. 예를 들면, 1개의 블록이 3개의 블록으로 분할되어도 된다(3진 트리 블록 분할). 이러한 3진 트리 블록 분할을 포함하는 분할은, MBT(multi type tree) 분할로 불리는 경우가 있다.
도 11은, 분할부(102)의 구성의 일례를 나타내는 도면이다. 도 11에 나타내는 바와 같이, 분할부(102)는, 블록 분할 결정부(102a)를 구비하고 있어도 된다. 블록 분할 결정부(102a)는, 일례로서 이하의 처리를 행해도 된다.
블록 분할 결정부(102a)는, 예를 들면, 블록 메모리(118) 또는 프레임 메모리(122)로부터 블록 정보를 수집하고, 그 블록 정보에 의거하여 상술한 분할 패턴을 결정한다. 분할부(102)는, 그 분할 패턴에 따라 원화상을 분할하고, 그 분할에 의해 얻어지는 하나 이상의 블록을 감산부(104)에 출력한다.
또, 블록 분할 결정부(102a)는, 예를 들면, 상술한 분할 패턴을 나타내는 파라미터를 변환부(106), 역변환부(114), 인트라 예측부(124), 인터 예측부(126) 및 엔트로피 부호화부(110)에 출력한다. 변환부(106)는, 그 파라미터에 의거하여 예측 잔차를 변환해도 되고, 인트라 예측부(124) 및 인터 예측부(126)는, 그 파라미터에 의거하여 예측 화상을 생성해도 된다. 또, 엔트로피 부호화부(110)는, 그 파라미터에 대해 엔트로피 부호화를 행해도 된다.
분할 패턴에 관한 파라미터는, 일례로서 이하와 같이 스트림에 기입되어도 된다.
도 12는, 분할 패턴의 예를 나타내는 도면이다. 분할 패턴에는, 예를 들면 블록을 수평 방향 및 수직 방향 각각으로 2개로 분할하는 4분할(QT)과, 블록을 1대 2대 1의 비율로 같은 방향으로 분할하는 3분할(HT 또는 VT)과, 블록을 1대 1의 비율로 같은 방향으로 분할하는 2분할(HB 또는 VB)과, 분할하지 않는(NS) 것이 있다.
또한, 4분할 및 분할하지 않는 경우에는, 분할 패턴은, 블록 분할 방향을 갖지 않고, 2분할 및 3분할인 경우에는, 분할 패턴은, 분할 방향 정보를 갖고 있다.
도 13a 및 도 13b는, 분할 패턴의 신택스 트리의 일례를 나타내는 도면이다. 도 13a의 예에서는, 우선, 처음에, 분할을 행할지 여부를 나타내는 정보(S:Split 플래그)가 존재하고, 다음에, 4분할을 행할지 여부를 나타내는 정보(QT:QT 플래그)가 존재한다. 다음에 3분할을 행할지 2분할을 행할지를 나타내는 정보(TT:TT 플래그 또는 BT:BT 플래그)가 존재하고, 마지막에 분할 방향을 나타내는 정보(Ver:Vertical 플래그 또는 Hor:Horizontal 플래그)가 존재하고 있다. 또한, 이러한 분할 패턴에 의한 분할에 의해 얻어지는 하나 이상의 블록 각각에 대해, 추가로 동일한 처리로 분할을 반복하여 적용해도 된다. 즉, 일례로서, 분할을 행할지 여부, 4분할을 행할지 여부, 분할 방법은 수평 방향인지 수직 방향인지, 및 3분할을 행할지 2분할을 행할지의 판정을 재귀적으로 실시하고, 실시한 판정 결과를 도 13a에 나타내는 신택스 트리에 개시한 부호화 순서에 따라 스트림에 부호화해도 된다.
또, 도 13a에 나타내는 신택스 트리에서는, S, QT, TT, Ver의 순으로 그들의 정보가 배치되어 있는데, S, QT, Ver, BT의 순으로 그들의 정보가 배치되어 있어도 된다. 즉, 도 13b의 예에서는, 우선, 분할을 행할지 여부를 나타내는 정보(S:Split 플래그)가 존재하고, 다음에, 4분할을 행할지 여부를 나타내는 정보(QT:QT 플래그)가 존재한다. 다음에 분할 방향을 나타내는 정보(Ver:Vertical 플래그 또는 Hor:Horizontal 플래그)가 존재하고, 마지막에 2분할을 행할지 3분할을 행할지를 나타내는 정보(BT:BT 플래그 또는 TT:TT 플래그)가 존재하고 있다.
또한, 여기서 설명한 분할 패턴은 일례이며, 설명한 분할 패턴 이외의 것을 사용해도 되고, 설명한 분할 패턴의 일부만을 사용해도 된다.
[감산부]
감산부(104)는, 분할부(102)로부터 입력되어, 분할부(102)에 의해 분할된 블록 단위로, 원화상으로부터 예측 화상(예측 제어부(128)로부터 입력되는 예측 화상)을 감산한다. 즉, 감산부(104)는, 커런트 블록의 예측 잔차를 산출한다. 그리고, 감산부(104)는, 산출된 예측 잔차를 변환부(106)에 출력한다.
원화상은, 부호화 장치(100)의 입력 신호이며, 예를 들면, 동화상을 구성하는 각 픽처의 화상을 나타내는 신호(예를 들면 휘도(luma) 신호 및 2개의 색차(chroma) 신호)이다.
[변환부]
변환부(106)는, 공간 영역의 예측 잔차를 주파수 영역의 변환 계수로 변환하고, 변환 계수를 양자화부(108)에 출력한다. 구체적으로는, 변환부(106)는, 예를 들면 공간 영역의 예측 잔차에 대해 미리 정해진 이산 코사인 변환(DCT) 또는 이산 사인 변환(DST)을 행한다.
또한, 변환부(106)는, 복수의 변환 타입 중에서 적응적으로 변환 타입을 선택하고, 선택된 변환 타입에 대응하는 변환 기저 함수(transform basis function)를 사용하여, 예측 잔차를 변환 계수로 변환해도 된다. 이러한 변환은, EMT(explicit multiple core transform) 또는 AMT(adaptive multiple transform)로 불리는 경우가 있다. 또, 변환 기저 함수는, 단순히 기저로 불리는 경우가 있다.
복수의 변환 타입은, 예를 들면, DCT-II, DCT-V, DCT-VIII, DST-I 및 DST-VII를 포함한다. 또한, 이들 변환 타입은, DCT2, DCT5, DCT8, DST1 및 DST7로 각각 표기되어도 된다. 도 14는, 각 변환 타입에 대응하는 변환 기저 함수를 나타내는 표이다. 도 14에 있어서 N은 입력 화소의 수를 나타낸다. 이들 복수의 변환 타입 중에서의 변환 타입의 선택은, 예를 들면, 예측의 종류(인트라 예측 및 인터 예측 등)에 의존해도 되고, 인트라 예측 모드에 의존해도 된다.
이러한 EMT 또는 AMT를 적용할지 여부를 나타내는 정보(예를 들면 EMT 플래그 또는 AMT 플래그로 불린다)와, 선택된 변환 타입을 나타내는 정보는, 통상, CU 레벨에서 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨)이어도 된다.
또, 변환부(106)는, 변환 계수(즉 변환 결과)를 재변환해도 된다. 이러한 재변환은, AST(adaptive secondary transform) 또는 NSST(non-separable secondary transform)로 불리는 경우가 있다. 예를 들면, 변환부(106)는, 인트라 예측 잔차에 대응하는 변환 계수의 블록에 포함되는 서브 블록(예를 들면 4×4 화소의 서브 블록)마다 재변환을 행한다. NSST를 적용할지 여부를 나타내는 정보와, NSST에 사용되는 변환 행렬에 관한 정보는, 통상, CU 레벨에서 신호화된다. 또한, 이들 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨)이어도 된다.
변환부(106)에는, Separable한 변환과, Non-Separable한 변환이 적용되어도 된다. Separable한 변환이란, 입력의 차원의 수만큼 방향마다 분리하여 복수 회 변환을 행하는 방식이며, Non-Separable한 변환이란, 입력이 다차원이었을 때에 2개 이상의 차원을 통합하여 1차원으로 간주하여, 통합하여 변환을 행하는 방식이다.
예를 들면, Non-Separable한 변환의 일례로서, 입력이 4×4 화소의 블록이었을 경우에는 그것을 16개의 요소를 가진 하나의 배열로 간주하고, 그 배열에 대해 16×16의 변환 행렬로 변환 처리를 행하는 것을 들 수 있다.
또, Non-Separable한 변환의 또 다른 예에서는, 4×4 화소의 입력 블록을 16개의 요소를 가진 하나의 배열로 간주한 후에, 그 배열에 대해 Givens 회전을 복수 회 행하는 변환(Hypercube Givens Transform)이 행해져도 된다.
변환부(106)에서의 변환에서는, CU 내의 영역에 따라 주파수 영역으로 변환하는 변환 기저 함수의 변환 타입을 전환할 수도 있다. 일례로서, SVT(Spatially Varying Transform)가 있다.
도 15는, SVT의 일례를 나타내는 도면이다.
SVT에서는, 도 15에 나타내는 바와 같이, 수평 방향 혹은 수직 방향으로 CU를 2등분하고, 어느 한쪽의 영역만 주파수 영역으로의 변환을 행한다. 변환 타입은, 영역마다 설정되어도 되고, 예를 들면, DST7과 DCT8이 사용된다. 예를 들면, CU가 수직 방향으로 2등분됨으로써 얻어지는 2개의 영역 중, 위치 0의 영역에 대해서는 DST7 및 DCT8이 사용될 수 있다. 또는, 그 2개의 영역 중, 위치 1의 영역에 대해서는 DST7이 사용된다. 마찬가지로, CU가 수평 방향으로 2등분됨으로써 얻어지는 2개의 영역 중, 위치 0의 영역에 대해서는 DST7 및 DCT8이 사용된다. 또는, 그 2개의 영역 중, 위치 1의 영역에 대해서는 DST7이 사용된다. 이러한 도 15에 나타내는 예에서는, CU 내의 2개의 영역 중, 어느 한쪽만 변환이 행해지고, 다른 한쪽에는 변환이 행해지지 않는데, 2개의 영역 각각에 대해 변환을 행해도 된다. 또, 분할 방법에는, 2등분뿐만 아니라, 4등분도 있어도 된다. 또, 분할 방법을 나타내는 정보를 부호화하여 CU 분할과 마찬가지로 시그널링 하는 등, 보다 유연하게 할 수도 있다. 또한, SVT는, SBT(Sub-block Transform)로 부르는 경우도 있다.
상술한 AMT 및 EMT는, MTS(Multiple Transform Selection)로 불려도 된다. MTS를 적용하는 경우는, DST7 또는 DCT8 등의 변환 타입을 선택할 수 있으며, 선택된 변환 타입을 나타내는 정보는, CU마다 인덱스 정보로서 부호화되어도 된다. 한편, CU의 형상에 의거하여, 인덱스 정보를 부호화하지 않고 직교 변환에 사용하는 변환 타입을 선택하는 처리로서, IMTS(Implicit MTS)로 불리는 처리가 있다. IMTS를 적용하는 경우는, 예를 들면 CU의 형상이 직사각형이면, 직사각형의 단변 측은 DST7, 장변 측은 DCT2를 사용하여, 각각 직교 변환한다. 또 예를 들면 CU의 형상이 정사각형인 경우는, 시퀀스 내에서 MTS가 유효이면 DCT2를 사용하고, MTS가 무효이면 DST7을 사용하여 직교 변환을 행한다. DCT2 및 DST7은 일례이며, 다른 변환 타입을 사용해도 되고, 사용하는 변환 타입의 조합을 상이한 조합으로 하는 것도 가능하다. IMTS는, 인트라 예측의 블록에서만 사용 가능하게 해도 되고, 인트라 예측의 블록 및 인터 예측의 블록 모두 사용 가능하게 해도 된다.
이상에서는, 직교 변환에 사용하는 변환 타입을 선택적으로 전환하는 선택 처리로서, MTS, SBT, 및 IMTS의 3개의 처리에 대해서 설명했는데, 3개의 선택 처리는 전부 유효로 해도 되고, 선택적으로 일부의 선택 처리만을 유효로 해도 된다. 개개의 선택 처리를 유효로 할지 여부는, SPS 등 헤더 내의 플래그 정보 등으로 식별할 수 있다. 예를 들면, 3개의 선택 처리가 전부 유효이면, CU 단위로, 3개의 선택 처리에서 1개를 선택하여 직교 변환을 행한다. 또한, 변환 타입을 선택적으로 전환하는 선택 처리는, 이하의 4개의 기능 [1]~[4] 중 적어도 하나의 기능을 실현할 수 있으면, 상기 3개의 선택 처리와는 상이한 선택 처리를 사용해도 되고, 상기 3개의 선택 처리 각각을 다른 처리로 치환해도 된다. 기능 [1]은, CU 내의 전체 범위를 직교 변환하고, 변환에 사용한 변환 타입을 나타내는 정보를 부호화하는 기능이다. 기능 [2]는, CU의 전체 범위를 직교 변환하고, 변환 타입을 나타내는 정보는 부호화하지 않고 소정의 룰에 의거하여 변환 타입을 결정하는 기능이다. 기능 [3]은, CU의 일부분의 영역을 직교 변환하고, 변환에 사용한 변환 타입을 나타내는 정보를 부호화하는 기능이다. 기능 [4]는, CU의 일부분의 영역을 직교 변환하고, 변환에 사용한 변환 타입을 나타내는 정보는 부호화하지 않고 소정의 룰에 의거하여 변환 타입을 결정하는 기능 등이다.
또한, MTS, IMTS, 및 SBT 각각의 적용 유무는 처리 단위마다 결정되어도 된다. 예를 들면, 시퀀스 단위, 픽처 단위, 브릭 단위, 슬라이스 단위, CTU 단위, 또는 CU 단위로 적용 유무를 결정해도 된다.
또한, 본 개시에 있어서의 변환 타입을 선택적으로 전환하는 툴은, 변환 처리에 사용하는 기저를 적응적으로 선택하는 방법, 선택 처리, 또는 기저를 선택하는 프로세스로 바꾸어 말해도 된다. 또, 변환 타입을 선택적으로 전환하는 툴은, 변환 타입을 적응적으로 선택하는 모드로 바꾸어 말해도 된다.
도 16은, 변환부(106)에 의한 처리의 일례를 나타내는 플로차트이다.
예를 들면, 변환부(106)는, 직교 변환을 행할지 여부를 판정한다(단계 St_1). 여기서, 변환부(106)는, 직교 변환을 행한다고 판정하면(단계 St_1의 Yes), 복수의 변환 타입으로부터, 직교 변환에 사용하는 변환 타입을 선택한다(단계 St_2). 다음에, 변환부(106)는, 그 선택한 변환 타입을 커런트 블록의 예측 잔차에 적용함으로써 직교 변환을 행한다(단계 St_3). 그리고, 변환부(106)는, 그 선택한 변환 타입을 나타내는 정보를 엔트로피 부호화부(110)에 출력함으로써, 그 정보를 부호화시킨다(단계 St_4). 한편, 변환부(106)는, 직교 변환을 행하지 않는다고 판정하면(단계 St_1의 No), 직교 변환을 행하지 않는 것을 나타내는 정보를 엔트로피 부호화부(110)에 출력함으로써, 그 정보를 부호화시킨다(단계 St_5). 또한, 단계 St_1에 있어서의 직교 변환을 행할지 여부의 판정은, 예를 들면, 변환 블록의 사이즈, CU에 적용된 예측 모드 등에 의거하여 판정되어도 된다. 또, 직교 변환에 사용하는 변환 타입을 나타내는 정보는 부호화되지 않고, 미리 규정된 변환 타입을 사용하여 직교 변환을 행해도 된다.
도 17은, 변환부(106)에 의한 처리의 다른 예를 나타내는 플로차트이다. 또한, 도 17에 나타내는 예는, 도 16에 나타내는 예와 마찬가지로, 직교 변환에 사용하는 변환 타입을 선택적으로 전환하는 방법을 적용하는 경우의 직교 변환의 예이다.
일례로서, 제1 변환 타입군은, DCT2, DST7 및 DCT8을 포함해도 된다. 또 일례로서, 제2 변환 타입군은 DCT2를 포함하고 있어도 된다. 또, 제1 변환 타입군과 제2 변환 타입군에 포함되는 변환 타입은, 일부가 중복되어 있어도 되고, 전부 상이한 변환 타입이어도 된다.
구체적으로는, 변환부(106)는, 변환 사이즈가 소정값 이하인지 여부를 판정한다(단계 Su_1). 여기서, 소정값 이하라고 판정하면(단계 Su_1의 Yes), 변환부(106)는, 제1 변환 타입군에 포함되는 변환 타입을 사용하여 커런트 블록의 예측 잔차를 직교 변환한다(단계 Su_2). 다음에, 변환부(106)는, 제1 변환 타입군에 포함되는 하나 이상의 변환 타입 중, 어느 변환 타입을 사용할지를 나타내는 정보를 엔트로피 부호화부(110)에 출력함으로써, 그 정보를 부호화시킨다(단계 Su_3). 한편, 변환부(106)는, 변환 사이즈가 소정값 이하가 아니라고 판정하면(단계 Su_1의 No), 제2 변환 타입군을 사용하여 커런트 블록의 예측 잔차를 직교 변환한다(단계 Su_4).
단계 Su_3에 있어서, 직교 변환에 사용되는 변환 타입을 나타내는 정보는, 커런트 블록의 수직 방향에 적용하는 변환 타입 및 수평 방향에 적용하는 변환 타입의 조합을 나타내는 정보여도 된다. 또, 제1 변환 타입군은 1개의 변환 타입만을 포함하고 있어도 되고, 직교 변환에 사용되는 변환 타입을 나타내는 정보는 부호화되지 않아도 된다. 제2 변환 타입군이 복수의 변환 타입을 포함하고 있어도 되고, 제2 변환 타입군에 포함되는 하나 이상의 변환 타입 중, 직교 변환에 사용되는 변환 타입을 나타내는 정보가 부호화되어도 된다.
또, 변환 사이즈에만 의거하여 변환 타입이 결정되어도 된다. 또한, 변환 사이즈에 의거하여, 직교 변환에 사용하는 변환 타입을 결정하는 처리이면, 변환 사이즈가 소정값 이하인지 여부의 판정으로 한정되지 않는다.
[양자화부]
양자화부(108)는, 변환부(106)로부터 출력된 변환 계수를 양자화한다. 구체적으로는, 양자화부(108)는, 커런트 블록의 복수의 변환 계수를 소정의 주사 순서로 주사하고, 주사된 변환 계수에 대응하는 양자화 파라미터(QP)에 의거하여 당해 변환 계수를 양자화한다. 그리고, 양자화부(108)는, 커런트 블록의 양자화된 복수의 변환 계수(이하, 양자화 계수라고 한다)를 엔트로피 부호화부(110) 및 역양자화부(112)에 출력한다.
소정의 주사 순서는, 변환 계수의 양자화/역양자화를 위한 순서이다. 예를 들면, 소정의 주사 순서는, 주파수의 오름차순(저주파에서 고주파의 순) 또는 내림차순(고주파에서 저주파의 순)으로 정의된다.
양자화 파라미터(QP)란, 양자화 스텝(양자화 폭)을 정의하는 파라미터이다. 예를 들면, 양자화 파라미터의 값이 증가하면 양자화 스텝도 증가한다. 즉, 양자화 파라미터의 값이 증가하면 양자화 계수의 오차(양자화 오차)가 증대한다.
또, 양자화에는, 양자화 매트릭스가 사용되는 경우가 있다. 예를 들면, 4×4 및 8×8 등의 주파수 변환 사이즈와, 인트라 예측 및 인터 예측 등의 예측 모드와, 휘도 및 색차 등의 화소 성분에 대응하여 여러 종류의 양자화 매트릭스가 사용되는 경우가 있다. 또한, 양자화란, 미리 정해진 간격으로 샘플링한 값을 미리 정해진 레벨에 대응지어서 디지털화하는 것을 말하며, 이 기술 분야에서는, 반올림, 라운딩, 또는 스케일링이라는 표현이 사용되는 경우도 있다.
양자화 매트릭스를 사용하는 방법으로서, 부호화 장치(100) 측에서 직접 설정된 양자화 매트릭스를 사용하는 방법과, 디폴트의 양자화 매트릭스(디폴트 매트릭스)를 사용하는 방법이 있다. 부호화 장치(100) 측에서는, 양자화 매트릭스를 직접 설정함으로써, 화상의 특징에 따른 양자화 매트릭스를 설정할 수 있다. 그러나, 이 경우, 양자화 매트릭스의 부호화에 의해, 부호량이 증가한다는 단점이 있다. 또한, 디폴트의 양자화 매트릭스 또는 부호화된 양자화 매트릭스를 그대로 사용하는 것이 아니라, 디폴트의 양자화 매트릭스 또는 부호화된 양자화 매트릭스에 의거하여 커런트 블록의 양자화에 사용하는 양자화 매트릭스를 생성해도 된다.
한편, 양자화 매트릭스를 사용하지 않고, 고역 성분의 계수도 저역 성분의 계수도 똑같이 양자화하는 방법도 있다. 또한, 이 방법은, 계수가 전부 같은 값인 양자화 매트릭스(플랫한 매트릭스)를 사용하는 방법과 같다.
양자화 매트릭스는, 예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨에서 부호화되어도 된다.
양자화부(108)는, 양자화 매트릭스를 사용하는 경우에는, 예를 들면, 변환 계수마다, 양자화 파라미터 등으로부터 구해지는 양자화 폭 등을, 양자화 매트릭스의 값을 사용하여 스케일링한다. 양자화 매트릭스를 사용하지 않고 행하는 양자화 처리란, 양자화 파라미터 등으로부터 구해지는 양자화 폭에 의거하여 변환 계수를 양자화하는 처리여도 된다. 또한, 양자화 매트릭스를 사용하지 않고 행하는 양자화 처리에 있어서, 양자화 폭에 대해, 블록 내의 전체 변환 계수에 대해 공통이 되는 소정의 값을 곱셈해도 된다.
도 18은, 양자화부(108)의 구성의 일례를 나타내는 블록도이다.
양자화부(108)는, 예를 들면, 차분 양자화 파라미터 생성부(108a)와, 예측 양자화 파라미터 생성부(108b)와, 양자화 파라미터 생성부(108c)와, 양자화 파라미터 기억부(108d)와, 양자화 처리부(108e)를 구비한다.
도 19는, 양자화부(108)에 의한 양자화의 일례를 나타내는 플로차트이다.
일례로서, 양자화부(108)는, 도 19에 나타내는 플로차트에 의거하여 CU마다 양자화를 실시해도 된다. 구체적으로는, 양자화 파라미터 생성부(108c)는, 양자화를 행할지 여부를 판정한다(단계 Sv_1). 여기서, 양자화를 행한다고 판정하면(단계 Sv_1의 Yes), 양자화 파라미터 생성부(108c)는, 커런트 블록의 양자화 파라미터를 생성하고(단계 Sv_2), 그 양자화 파라미터를 양자화 파라미터 기억부(108d)에 보관한다(단계 Sv_3).
다음에, 양자화 처리부(108e)는, 단계 Sv_2에서 생성된 양자화 파라미터를 사용하여 커런트 블록의 변환 계수를 양자화한다(단계 Sv_4). 그리고, 예측 양자화 파라미터 생성부(108b)는, 커런트 블록과는 상이한 처리 단위의 양자화 파라미터를 양자화 파라미터 기억부(108d)로부터 취득한다(단계 Sv_5). 예측 양자화 파라미터 생성부(108b)는, 그 취득한 양자화 파라미터에 의거하여, 커런트 블록의 예측 양자화 파라미터를 생성한다(단계 Sv_6). 차분 양자화 파라미터 생성부(108a)는, 양자화 파라미터 생성부(108c)에 의해 생성된, 커런트 블록의 양자화 파라미터와, 예측 양자화 파라미터 생성부(108b)에 의해 생성된, 커런트 블록의 예측 양자화 파라미터의 차분을 산출한다(단계 Sv_7). 이 차분의 산출에 의해, 차분 양자화 파라미터가 생성된다. 차분 양자화 파라미터 생성부(108a)는, 그 차분 양자화 파라미터를 엔트로피 부호화부(110)에 출력함으로써, 그 차분 양자화 파라미터를 부호화시킨다(단계 Sv_8).
또한, 차분 양자화 파라미터는, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨에서 부호화되어도 된다. 또, 양자화 파라미터의 초기값을, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨에서 부호화해도 된다. 이 때, 양자화 파라미터는 양자화 파라미터의 초기값과 차분 양자화 파라미터를 사용하여 생성되어도 된다.
또한, 양자화부(108)는, 복수의 양자화기를 구비하고 있어도 되고, 복수의 양자화 방법으로부터 선택한 양자화 방법을 사용하여 변환 계수를 양자화하는 dependent quantization을 적용해도 된다.
[엔트로피 부호화부]
도 20은, 엔트로피 부호화부(110)의 구성의 일례를 나타내는 블록도이다.
엔트로피 부호화부(110)는, 양자화부(108)로부터 입력된 양자화 계수와, 예측 파라미터 생성부(130)로부터 입력된 예측 파라미터에 대해 엔트로피 부호화를 행함으로써 스트림을 생성한다. 그 엔트로피 부호화에는, 예를 들면, CABAC(Context-based Adaptive Binary Arithmetic Coding)가 사용된다. 구체적으로는, 엔트로피 부호화부(110)는, 예를 들면, 이치화부(110a)와, 콘텍스트 제어부(110b)와, 이치 산술 부호화부(110c)를 구비한다. 이치화부(110a)는, 양자화 계수 및 예측 파라미터 등의 다치 신호를 이치 신호로 변환하는 이치화를 행한다. 이치화의 방식에는, 예를 들면, Truncated Rice Binarization, Exponential Golomb codes, Fixed Length Binarization 등이 있다. 콘텍스트 제어부(110b)는, 신택스 요소의 특징 또는 주위의 상황에 따른 콘텍스트값, 즉 이치 신호의 발생 확률을 도출한다. 이 콘텍스트값의 도출 방법에는, 예를 들면, 바이패스, 신택스 요소 참조, 상측·좌측 인접 블록 참조, 계층 정보 참조, 및, 그 외 등이 있다. 이치 산술 부호화부(110c)는, 그 도출된 콘텍스트값을 사용하여 이치화 신호에 대해 산술 부호화를 행한다.
도 21은, 엔트로피 부호화부(110)에 있어서의 CABAC의 흐름을 나타내는 도면이다.
우선, 엔트로피 부호화부(110)에 있어서의 CABAC에서는, 초기화가 행해진다. 이 초기화에서는, 이치 산술 부호화부(110c)에 있어서의 초기화와, 초기 콘텍스트값의 설정이 행해진다. 그리고, 이치화부(110a) 및 이치 산술 부호화부(110c)는, 예를 들면 CTU의 복수의 양자화 계수 각각에 대해 순서대로, 이치화와 산술 부호화를 실행한다. 이 때, 콘텍스트 제어부(110b)는, 산술 부호화가 행해질 때마다 콘텍스트값의 갱신을 행한다. 그리고, 콘텍스트 제어부(110b)는, 후처리로서, 콘텍스트값을 퇴피시킨다. 이 퇴피된 콘텍스트값은, 예를 들면 다음 CTU에 대한 콘텍스트값의 초기값을 위해 사용된다.
[역양자화부]
역양자화부(112)는, 양자화부(108)로부터 입력된 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(112)는, 커런트 블록의 양자화 계수를 소정의 주사 순서로 역양자화한다. 그리고, 역양자화부(112)는, 커런트 블록의 역양자화된 변환 계수를 역변환부(114)에 출력한다.
[역변환부]
역변환부(114)는, 역양자화부(112)로부터 입력된 변환 계수를 역변환함으로써 예측 잔차를 복원한다. 구체적으로는, 역변환부(114)는, 변환 계수에 대해, 변환부(106)에 의한 변환에 대응하는 역변환을 행함으로써, 커런트 블록의 예측 잔차를 복원한다. 그리고, 역변환부(114)는, 복원된 예측 잔차를 가산부(116)에 출력한다.
또한, 복원된 예측 잔차는, 통상, 양자화에 의해 정보가 손실되어 있으므로, 감산부(104)가 산출한 예측 오차와 일치하지 않는다. 즉, 복원된 예측 잔차에는, 통상, 양자화 오차가 포함되어 있다.
[가산부]
가산부(116)는, 역변환부(114)로부터 입력된 예측 잔차와 예측 제어부(128)로부터 입력된 예측 화상을 가산함으로써 커런트 블록을 재구성한다. 그 결과, 재구성 화상이 생성된다. 그리고, 가산부(116)는, 재구성 화상을 블록 메모리(118) 및 루프 필터부(120)에 출력한다.
[블록 메모리]
블록 메모리(118)는, 예를 들면, 인트라 예측에서 참조되는 블록이며 커런트 픽처 내의 블록을 보관하기 위한 기억부이다. 구체적으로는, 블록 메모리(118)는, 가산부(116)로부터 출력된 재구성 화상을 보관한다.
[프레임 메모리]
프레임 메모리(122)는, 예를 들면, 인터 예측에 사용되는 참조 픽처를 보관하기 위한 기억부이며, 프레임 버퍼로 불리는 경우도 있다. 구체적으로는, 프레임 메모리(122)는, 루프 필터부(120)에 의해 필터링된 재구성 화상을 보관한다.
[루프 필터부]
루프 필터부(120)는, 가산부(116)로부터 출력되는 재구성 화상에 루프 필터 처리를 실시하고, 그 필터 처리된 재구성 화상을 프레임 메모리(122)에 출력한다. 루프 필터란, 부호화 루프 내에서 사용되는 필터(인루프 필터)이며, 예를 들면, 어댑티브 루프 필터(ALF), 디블로킹·필터(DF 또는 DBF), 및 샘플 어댑티브 오프셋(SAO) 등을 포함한다.
도 22는, 루프 필터부(120)의 구성의 일례를 나타내는 블록도이다.
루프 필터부(120)는, 예를 들면 도 22에 나타내는 바와 같이, 디블로킹·필터 처리부(120a)와, SAO 처리부(120b)와, ALF 처리부(120c)를 구비한다. 디블로킹·필터 처리부(120a)는, 재구성 화상에 대해 상술한 디블로킹·필터 처리를 실시한다. SAO 처리부(120b)는, 디블로킹·필터 처리 후의 재구성 화상에 대해 상술한 SAO 처리를 실시한다. 또, ALF 처리부(120c)는, SAO 처리 후의 재구성 화상에 대해 상술한 ALF 처리를 적용한다. ALF 및 디블로킹·필터의 상세에 대해서는, 후술한다. SAO 처리는, 링잉(엣지 주변에서 화소값이 물결치듯이 왜곡되는 현상)의 저감과, 화소값 편차의 보정에 의해, 화질을 개선하는 처리이다. 이 SAO 처리에는, 예를 들면, 엣지·오프셋 처리 및 밴드·오프셋 처리 등이 있다. 또한, 루프 필터부(120)는, 도 22에 개시한 모든 처리부를 구비하고 있지 않아도 되고, 일부의 처리부만을 구비하고 있어도 된다. 또, 루프 필터부(120)는, 도 22에 개시한 처리 순과는 상이한 순서로 상술한 각 처리를 행하는 구성이어도 된다.
[루프 필터부>어댑티브 루프 필터]
ALF에서는, 부호화 왜곡을 제거하기 위한 최소 제곱 오차 필터가 적용되며, 예를 들면 커런트 블록 내의 2×2 화소의 서브 블록마다, 국소적인 구배(gradient)의 방향 및 활성도(activity)에 의거하여 복수의 필터 중에서 선택된 1개의 필터가 적용된다.
구체적으로는, 우선, 서브 블록(예를 들면 2×2 화소의 서브 블록)이 복수의 클래스(예를 들면 15 또는 25 클래스)로 분류된다. 서브 블록의 분류는, 예를 들면, 구배의 방향 및 활성도에 의거하여 행해진다. 구체적인 예에서는, 구배의 방향값 D(예를 들면 0~2 또는 0~4)와 구배의 활성값 A(예를 들면 0~4)를 사용하여 분류값 C(예를 들면 C=5D+A)가 산출된다. 그리고, 분류값 C에 의거하여, 서브 블록이 복수의 클래스로 분류된다.
구배의 방향값 D는, 예를 들면, 복수의 방향(예를 들면 수평, 수직 및 2개의 대각 방향)의 구배를 비교함으로써 도출된다. 또, 구배의 활성값 A는, 예를 들면, 복수의 방향의 구배를 가산하고, 가산 결과를 양자화함으로써 도출된다.
이러한 분류의 결과에 의거하여, 복수의 필터 중에서 서브 블록을 위한 필터가 결정된다.
ALF로 사용되는 필터의 형상으로서는 예를 들면 원대칭 형상이 이용된다. 도 23a~도 23c는, ALF로 사용되는 필터의 형상의 복수의 예를 나타내는 도면이다. 도 23a는, 5×5 다이아몬드 형상 필터를 나타내고, 도 23b는, 7×7 다이아몬드 형상 필터를 나타내며, 도 23c는, 9×9 다이아몬드 형상 필터를 나타낸다. 필터의 형상을 나타내는 정보는, 통상, 픽처 레벨에서 신호화된다. 또한, 필터의 형상을 나타내는 정보의 신호화는, 픽처 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 브릭 레벨, CTU 레벨 또는 CU 레벨)이어도 된다.
ALF의 온/오프는, 예를 들면, 픽처 레벨 또는 CU 레벨에서 결정되어도 된다. 예를 들면, 휘도에 대해서는 CU 레벨에서 ALF를 적용할지 여부가 결정되어도 되고, 색차에 대해서는 픽처 레벨에서 ALF를 적용할지 여부가 결정되어도 된다. ALF의 온/오프를 나타내는 정보는, 통상, 픽처 레벨 또는 CU 레벨에서 신호화된다. 또한, ALF의 온/오프를 나타내는 정보의 신호화는, 픽처 레벨 또는 CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨)이어도 된다.
또, 상술한 바와 같이, 복수의 필터 중에서 1개의 필터가 선택되어 서브 블록에 ALF 처리가 실시된다. 그 복수의 필터(예를 들면 15 또는 25까지의 필터) 각각에 대해서, 그 필터에 사용되는 복수의 계수로 이루어지는 계수 세트는, 통상, 픽처 레벨에서 신호화된다. 또한, 계수 세트의 신호화는, 픽처 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 슬라이스 레벨, 브릭 레벨, CTU 레벨, CU 레벨 또는 서브 블록 레벨)이어도 된다.
[루프 필터>크로스 컴포넌트 어댑티브 루프 필터(Cross Component Adaptive Loop Filter)]
도 23d는, Y 샘플(제1 성분)이 Cb의 CCALF 및 Cr의 CCALF(제1 성분과는 상이한 복수의 성분)에 사용되는 예를 나타내는 도면이다. 도 23e는, 다이아몬드 형상 필터를 나타내는 도면이다.
CC-ALF의 하나의 예는, 선형의 다이아몬드형 필터(도 23d, 도 23e)를 각 색차 컴포넌트의 휘도 채널에 적용함으로써 동작한다. 예를 들면, 필터 계수는 APS로 송신되고, 2^10의 팩터로 스케일링되어, 고정 소수점 표현을 위해 반올림된다. 필터의 적용은, 가변 블록 사이즈로 제어되고, 샘플의 블록마다 수신되는 콘텍스트 부호화 완료 플래그로 통지된다. 블록 사이즈와 CC-ALF 유효화 플래그는, 각 색차 컴포넌트의 슬라이스 레벨에서 수신된다. CC-ALF의 신택스와 시맨틱스는, Appendix에 있어서 제공된다. 기서(寄書)에서는, (색차 샘플에 있어서) 16×16, 32×32, 64×64, 128×128의 블록 사이즈가 서포트되고 있다.
[루프 필터>결합 색차 크로스 컴포넌트 어댑티브 루프 필터(Joint Chroma Cross Component Adaptive Loop Filter)]
도 23f는, JC-CCALF의 예를 나타내는 도면이다. 도 23g는, JC-CCALF의 weight_index 후보의 예를 나타내는 도면이다.
JC-CCALF의 하나의 예는, 1개의 CCALF 필터만을 사용하여, 1개의 색 성분만의 색차 조정 신호로서 1개의 CCALF 필터 출력을 생성하고, 같은 색차 조정 신호의 적절하게 가중된 버젼을 다른 색 성분에 적용한다. 이와 같이 하여, 기존의 CCALF의 복잡함이 대략 절반이 된다.
가중치는, 부호(sign) 플래그 및 가중 인덱스로 부호화된다. 가중 인덱스(weight_index로 나타낸다)는, 3비트로 부호화되고, JC-CCALF 웨이트 JcCcWeight의 크기를 지정한다. 0과 같게 할 수는 없다. JcCcWeight의 크기는 다음과 같이 결정된다.
·weight_index가 4 이하인 경우, JcCcWeight는 weight_index>>2와 같다.
·그 이외의 경우, JcCcWeight는 4/(weight_index-4)와 같다.
Cb 및 Cr의 ALF 필터링의 블록 레벨의 온/오프 제어는 개별적이다. 이것은, CCALF와 같고, 블록 레벨의 온/오프 제어 플래그의 2개의 개별 세트가 부호화된다. 여기에서는, CCALF와는 달리, Cb, Cr의 온/오프 제어 블록 사이즈는 같기 때문에, 1개의 블록 사이즈 변수만이 부호화된다.
[루프 필터부>디블로킹·필터]
디블로킹·필터 처리에서는, 루프 필터부(120)는, 재구성 화상의 블록 경계에 필터 처리를 행함으로써, 그 블록 경계에 생기는 왜곡을 감소시킨다.
도 24는, 디블로킹·필터 처리부(120a)의 상세한 구성의 일례를 나타내는 블록도이다.
디블로킹·필터 처리부(120a)는, 예를 들면, 경계 판정부(1201)와, 필터 판정부(1203)와, 필터 처리부(1205)와, 처리 판정부(1208)와, 필터 특성 결정부(1207)와, 스위치(1202, 1204 및 1206)를 구비한다.
경계 판정부(1201)는, 디블로킹·필터 처리되는 화소(즉 대상 화소)가 블록 경계 부근에 존재하고 있는지 여부를 판정한다. 그리고, 경계 판정부(1201)는, 그 판정 결과를 스위치(1202) 및 처리 판정부(1208)에 출력한다.
스위치(1202)는, 대상 화소가 블록 경계 부근에 존재하고 있다고 경계 판정부(1201)에 의해 판정된 경우에는, 필터 처리 전의 화상을, 스위치(1204)에 출력한다. 반대로, 스위치(1202)는, 경계 판정부(1201)에 의해 대상 화소가 블록 경계 부근에 존재하지 않는다고 판정된 경우에는, 필터 처리 전의 화상을 스위치(1206)에 출력한다. 또한, 필터 처리 전의 화상은, 대상 화소와, 그 대상 화소의 주변에 있는 적어도 하나의 주변 화소로 이루어지는 화상이다.
필터 판정부(1203)는, 대상 화소의 주변에 있는 적어도 하나의 주변 화소의 화소값에 의거하여, 대상 화소에 대해 디블로킹·필터 처리를 행할지 여부를 판정한다. 그리고, 필터 판정부(1203)는, 그 판정 결과를 스위치(1204) 및 처리 판정부(1208)에 출력한다.
스위치(1204)는, 대상 화소에 디블로킹·필터 처리를 행한다고 필터 판정부(1203)에 의해 판정된 경우에는, 스위치(1202)를 통해 취득한 필터 처리 전의 화상을, 필터 처리부(1205)에 출력한다. 반대로, 스위치(1204)는, 대상 화소에 디블로킹·필터 처리를 행하지 않는다고 필터 판정부(1203)에 의해 판정된 경우에는, 스위치(1202)를 통해 취득한 필터 처리 전의 화상을 스위치(1206)에 출력한다.
필터 처리부(1205)는, 스위치(1202 및 1204)를 통해 필터 처리 전의 화상을 취득한 경우에는, 필터 특성 결정부(1207)에 의해 결정된 필터 특성을 갖는 디블로킹·필터 처리를, 대상 화소에 대해 실행한다. 그리고, 필터 처리부(1205)는, 그 필터 처리 후의 화소를 스위치(1206)에 출력한다.
스위치(1206)는, 처리 판정부(1208)에 의한 제어에 따라, 디블로킹·필터 처리되지 않은 화소와, 필터 처리부(1205)에 의해 디블로킹·필터 처리된 화소를 선택적으로 출력한다.
처리 판정부(1208)는, 경계 판정부(1201) 및 필터 판정부(1203) 각각의 판정 결과에 의거하여, 스위치(1206)를 제어한다. 즉, 처리 판정부(1208)는, 대상 화소가 블록 경계 부근에 존재하고 있다고 경계 판정부(1201)에 의해 판정되고, 또한, 대상 화소에 디블로킹·필터 처리를 행한다고 필터 판정부(1203)에 의해 판정된 경우에는, 디블로킹·필터 처리된 화소를 스위치(1206)로부터 출력시킨다. 또, 상술한 경우 이외에는, 처리 판정부(1208)는, 디블로킹·필터 처리되지 않은 화소를 스위치(1206)로부터 출력시킨다. 이러한 화소의 출력이 반복하여 행해짐으로써, 필터 처리 후의 화상이 스위치(1206)로부터 출력된다. 또한, 도 24에 나타내는 구성은, 디블로킹·필터 처리부(120a)에 있어서의 구성의 일례이며, 디블로킹·필터 처리부(120a)는, 그 외의 구성을 갖고 있어도 된다.
도 25는, 블록 경계에 대해 대칭인 필터 특성을 갖는 디블로킹·필터의 예를 나타내는 도면이다.
디블로킹·필터 처리에서는, 예를 들면, 화소값과 양자화 파라미터를 사용하여, 특성이 상이한 2개의 디블로킹·필터, 즉 스트롱 필터 및 위크 필터 중 어느 1개가 선택된다. 스트롱 필터에서는, 도 25에 나타내는 바와 같이, 블록 경계를 사이에 두고 화소 p0~p2와, 화소 q0~q2가 존재하는 경우, 화소 q0~q2 각각의 화소값은, 이하의 식에 나타내는 연산을 행함으로써, 화소값 q'0~q'2로 변경된다.
q'0=(p1+2×p0+2×q0+2×q1+q2+4)/8
q'1=(p0+q0+q1+q2+2)/4
q'2=(p0+q0+q1+3×q2+2×q3+4)/8
또한, 상술한 식에 있어서, p0~p2 및 q0~q2는, 화소 p0~p2 및 화소 q0~q2 각각의 화소값이다. 또, q3은, 화소 q2에 블록 경계와 반대 측에 인접하는 화소 q3의 화소값이다. 또, 상술한 각 식의 우변에 있어서, 디블로킹·필터 처리에 사용되는 각 화소의 화소값에 곱해지는 계수가, 필터 계수이다.
또한, 디블로킹·필터 처리에서는, 연산 후의 화소값이 역치를 넘어 변화되지 않도록, 클립 처리가 행해져도 된다. 이 클립 처리에서는, 상술한 식에 의한 연산 후의 화소값은, 양자화 파라미터로부터 결정되는 역치를 사용하여, 「연산 전의 화소값±2×역치」로 클립된다. 이로 인해, 과도한 평활화를 막을 수 있다.
도 26은, 디블로킹·필터 처리가 행해지는 블록 경계의 일례를 설명하기 위한 도면이다. 도 27은, BS값의 일례를 나타내는 도면이다.
디블로킹·필터 처리가 행해지는 블록 경계는, 예를 들면, 도 26에서 나타내는 8×8 화소의 블록의 CU, PU 또는 TU의 경계이다. 디블로킹·필터 처리는, 예를 들면, 4행 또는 4열을 단위로 행해진다. 우선, 도 26에 나타내는 블록 P 및 블록 Q에 대해, 도 27과 같이 Bs(Boundary Strength)값이 결정된다.
도 27의 Bs값에 따라, 동일한 화상에 속하는 블록 경계여도, 상이한 강도의 디블로킹·필터 처리를 행할지 여부가 결정되어도 된다. 색차 신호에 대한 디블로킹·필터 처리는, Bs값이 2인 경우에 행해진다. 휘도 신호에 대한 디블로킹·필터 처리는, Bs값이 1 이상이며, 소정의 조건이 만족된 경우에 행해진다. 또한, Bs값의 판정 조건은 도 27에 나타낸 것으로 한정되지 않고, 다른 파라미터에 의거하여 결정되어도 된다.
[예측부(인트라 예측부·인터 예측부·예측 제어부)]
도 28은, 부호화 장치(100)의 예측부에서 행해지는 처리의 일례를 나타내는 플로차트이다. 또한, 일례로서 예측부는, 인트라 예측부(124), 인터 예측부(126), 및 예측 제어부(128)의 전부 또는 일부의 구성 요소로 이루어진다. 예측 처리부는, 예를 들면 인트라 예측부(124) 및 인터 예측부(126)를 포함한다.
예측부는, 커런트 블록의 예측 화상을 생성한다(단계 Sb_1). 또한, 예측 화상에는, 예를 들면 인트라 예측 화상(인트라 예측 신호) 또는 인터 예측 화상(인터 예측 신호)이 있다. 구체적으로는, 예측부는, 다른 블록에 대한 예측 화상의 생성, 예측 잔차의 생성, 양자화 계수의 생성, 예측 잔차의 복원, 및 예측 화상의 가산이 행해짐으로써 이미 얻어져 있는 재구성 화상을 사용하여, 커런트 블록의 예측 화상을 생성한다.
재구성 화상은, 예를 들면, 참조 픽처의 화상이어도 되고, 커런트 블록을 포함하는 픽처인 커런트 픽처 내의 부호화 완료 블록(즉, 상술한 다른 블록)의 화상이어도 된다. 커런트 픽처 내의 부호화 완료 블록은, 예를 들면 커런트 블록의 인접 블록이다.
도 29는, 부호화 장치(100)의 예측부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
예측부는, 제1 방식으로 예측 화상을 생성하고(단계 Sc_1a), 제2 방식으로 예측 화상을 생성하며(단계 Sc_1b), 제3 방식으로 예측 화상을 생성한다(단계 Sc_1c). 제1 방식, 제2 방식, 및 제3 방식은, 예측 화상을 생성하기 위한 서로 상이한 방식이며, 각각 예를 들면, 인터 예측 방식, 인트라 예측 방식, 및, 그들 이외의 예측 방식이어도 된다. 이들 예측 방식에서는, 상술한 재구성 화상을 사용해도 된다.
다음에, 예측부는, 단계 Sc_1a, Sc_1b, 및 Sc_1c 각각에서 생성된 예측 화상을 평가한다(단계 Sc_2). 예를 들면, 예측부는, 단계 Sc_1a, Sc_1b, 및 Sc_1c 각각에서 생성된 예측 화상에 대해 코스트 C를 산출하고, 그들 예측 화상의 코스트 C를 비교함으로써, 그들 예측 화상을 평가한다. 또한, 코스트 C는, R-D 최적화 모델의 식, 예를 들면, C=D+λ×R에 의해 산출된다. 이 식에 있어서, D는, 예측 화상의 부호화 왜곡이며, 예를 들면, 커런트 블록의 화소값과 예측 화상의 화소값의 차분 절대값 합 등에 의해 나타내어진다. 또, R은, 스트림의 비트 레이트이다. 또, λ는, 예를 들면 라그랑쥬의 미정 곱수이다.
다음에, 예측부는, 단계 Sc_1a, Sc_1b, 및 Sc_1c 각각에서 생성된 예측 화상 중 어느 1개를 선택한다(단계 Sc_3). 즉, 예측부는, 최종적인 예측 화상을 얻기 위한 방식 또는 모드를 선택한다. 예를 들면, 예측부는, 그들 예측 화상에 대해 산출된 코스트 C에 의거하여, 가장 작은 코스트 C의 예측 화상을 선택한다. 또는, 단계 Sc_2의 평가 및 단계 Sc_3에 있어서의 예측 화상의 선택은, 부호화의 처리에 사용되는 파라미터에 의거하여 행해져도 된다. 부호화 장치(100)는, 그 선택된 예측 화상, 방식 또는 모드를 특정하기 위한 정보를 스트림에 신호화해도 된다. 그 정보는, 예를 들면 플래그 등이어도 된다. 이로 인해, 복호 장치(200)는, 그 정보에 의거하여, 부호화 장치(100)에 있어서 선택된 방식 또는 모드에 따라 예측 화상을 생성할 수 있다. 또한, 도 29에 나타내는 예에서는, 예측부는, 각 방식으로 예측 화상을 생성한 후에, 어느 하나의 예측 화상을 선택한다. 그러나, 예측부는, 그들 예측 화상을 생성하기 전에, 상술한 부호화의 처리에 사용되는 파라미터에 의거하여, 방식 또는 모드를 선택하고, 그 방식 또는 모드에 따라 예측 화상을 생성해도 된다.
예를 들면, 제1 방식 및 제2 방식은, 각각 인트라 예측 및 인터 예측이며, 예측부는, 이들 예측 방식에 따라 생성되는 예측 화상으로부터, 커런트 블록에 대한 최종적인 예측 화상을 선택해도 된다.
도 30은, 부호화 장치(100)의 예측부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
우선, 예측부는, 인트라 예측에 의해 예측 화상을 생성하고(단계 Sd_1a), 인터 예측에 의해 예측 화상을 생성한다(단계 Sd_1b). 또한, 인트라 예측에 의해 생성된 예측 화상을, 인트라 예측 화상이라고도 하고, 인터 예측에 의해 생성된 예측 화상을, 인터 예측 화상이라고도 한다.
다음에, 예측부는, 인트라 예측 화상 및 인터 예측 화상 각각을 평가한다(단계 Sd_2). 이 평가에는, 상술한 코스트 C가 사용되어도 된다. 그리고, 예측부는, 인트라 예측 화상 및 인터 예측 화상으로부터, 가장 작은 코스트 C가 산출된 예측 화상을, 커런트 블록의 최종적인 예측 화상으로서 선택해도 된다(단계 Sd_3). 즉, 커런트 블록의 예측 화상을 생성하기 위한 예측 방식 또는 모드가 선택된다.
[인트라 예측부]
인트라 예측부(124)는, 블록 메모리(118)에 보관된 커런트 픽처 내의 블록을 참조하여 커런트 블록의 인트라 예측(화면 내 예측이라고도 한다)을 행함으로써, 커런트 블록의 예측 화상(즉 인트라 예측 화상)을 생성한다. 구체적으로는, 인트라 예측부(124)는, 커런트 블록에 인접하는 블록의 화소값(예를 들면 휘도값, 색차값)을 참조하여 인트라 예측을 행함으로써 인트라 예측 화상을 생성하고, 인트라 예측 화상을 예측 제어부(128)에 출력한다.
예를 들면, 인트라 예측부(124)는, 미리 규정된 복수의 인트라 예측 모드 중 하나를 사용하여 인트라 예측을 행한다. 복수의 인트라 예측 모드는, 통상, 하나 이상의 비방향성 예측 모드와, 복수의 방향성 예측 모드를 포함한다.
하나 이상의 비방향성 예측 모드는, 예를 들면 H.265/HEVC 규격에서 규정된 Planar 예측 모드 및 DC 예측 모드를 포함한다.
복수의 방향성 예측 모드는, 예를 들면 H.265/HEVC 규격에서 규정된 33방향의 예측 모드를 포함한다. 또한, 복수의 방향성 예측 모드는, 33방향에 더하여 추가로 32방향의 예측 모드(합계 65개의 방향성 예측 모드)를 포함해도 된다. 도 31은, 인트라 예측에 있어서의 총 67개의 인트라 예측 모드(2개의 비방향성 예측 모드 및 65개의 방향성 예측 모드)를 나타내는 도면이다. 실선 화살표는, H.265/HEVC 규격에서 규정된 33방향을 나타내고, 파선 화살표는, 추가된 32방향을 나타낸다(2개의 비방향성 예측 모드는 도 31에는 도시되어 있지 않다).
여러 가지 실장예에서는, 색차 블록의 인트라 예측에 있어서, 휘도 블록이 참조되어도 된다. 즉, 커런트 블록의 휘도 성분에 의거하여, 커런트 블록의 색차 성분이 예측되어도 된다. 이러한 인트라 예측은, CCLM(cross-component linear model) 예측으로 불리는 경우가 있다. 이러한 휘도 블록을 참조하는 색차 블록의 인트라 예측 모드(예를 들면 CCLM 모드로 불린다)는, 색차 블록의 인트라 예측 모드의 하나로서 더해져도 된다.
인트라 예측부(124)는, 수평/수직 방향의 참조 화소의 구배에 의거하여 인트라 예측 후의 화소값을 보정해도 된다. 이러한 보정을 수반하는 인트라 예측은, PDPC(position dependent intra prediction combination)로 불리는 경우가 있다. PDPC의 적용 유무를 나타내는 정보(예를 들면 PDPC 플래그로 불린다)는, 통상, CU 레벨에서 신호화된다. 또한, 이 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨)이어도 된다.
도 32는, 인트라 예측부(124)에 의한 처리의 일례를 나타내는 플로차트이다.
인트라 예측부(124)는, 복수의 인트라 예측 모드로부터 1개의 인트라 예측 모드를 선택한다(단계 Sw_1). 그리고, 인트라 예측부(124)는, 선택한 인트라 예측 모드에 따라 예측 화상을 생성한다(단계 Sw_2). 다음에, 인트라 예측부(124)는, MPM(Most Probable Modes)을 결정한다(단계 Sw_3). MPM은, 예를 들면 6개의 인트라 예측 모드로 이루어진다. 그 6개의 인트라 예측 모드 중 2개의 모드는, Planar 예측 모드 및 DC 예측 모드여도 되고, 나머지 4개의 모드는, 방향성 예측 모드여도 된다. 그리고, 인트라 예측부(124)는, 단계 Sw_1에서 선택한 인트라 예측 모드가 MPM에 포함되는지 여부를 판정한다(단계 Sw_4).
여기서, 선택한 인트라 예측 모드가 MPM에 포함된다고 판정하면(단계 Sw_4의 Yes), 인트라 예측부(124)는, MPM 플래그를 1로 설정하고(단계 Sw_5), MPM 중, 선택한 인트라 예측 모드를 나타내는 정보를 생성한다(단계 Sw_6). 또한, 1로 설정된 MPM 플래그와, 그 인트라 예측 모드를 나타내는 정보는 각각, 예측 파라미터로서 엔트로피 부호화부(110)에 의해 부호화된다.
한편, 선택한 인트라 예측 모드가 MPM에 포함되지 않는다고 판정하면(단계 Sw_4의 No), 인트라 예측부(124)는, MPM 플래그를 0으로 설정한다(단계 Sw_7). 또는, 인트라 예측부(124)는, MPM 플래그를 설정하지 않는다. 그리고, 인트라 예측부(124)는, MPM에 포함되지 않는 하나 이상의 인트라 예측 모드 중, 선택한 인트라 예측 모드를 나타내는 정보를 생성한다(단계 Sw_8). 또한, 0으로 설정된 MPM 플래그와, 그 인트라 예측 모드를 나타내는 정보는 각각, 예측 파라미터로서 엔트로피 부호화부(110)에 의해 부호화된다. 그 인트라 예측 모드를 나타내는 정보는, 예를 들면 0~60 중 어느 하나의 값을 나타낸다.
[인터 예측부]
인터 예측부(126)는, 프레임 메모리(122)에 보관된 참조 픽처로서 커런트 픽처와는 상이한 참조 픽처를 참조하여 커런트 블록의 인터 예측(화면간 예측이라고도 한다)을 행함으로써, 예측 화상(인터 예측 화상)을 생성한다. 인터 예측은, 커런트 블록 또는 커런트 블록 내의 커런트 서브 블록의 단위로 행해진다. 서브 블록은 블록에 포함되어 있어, 블록보다 작은 단위이다. 서브 블록의 사이즈는, 4×4 화소여도 되고, 8×8 화소여도 되고, 그 이외의 사이즈여도 된다. 서브 블록의 사이즈는, 슬라이스, 브릭, 또는 픽처 등의 단위로 전환되어도 된다.
예를 들면, 인터 예측부(126)는, 커런트 블록 또는 커런트 서브 블록에 대해서 참조 픽처 내에서 움직임 탐색(motion estimation)을 행하고, 그 커런트 블록 또는 커런트 서브 블록에 가장 일치하는 참조 블록 또는 서브 블록을 찾아낸다. 그리고, 인터 예측부(126)는, 참조 블록 또는 서브 블록으로부터 커런트 블록 또는 서브 블록으로의 움직임 또는 변화를 보상하는 움직임 정보(예를 들면 움직임 벡터)를 취득한다. 인터 예측부(126)는, 그 움직임 정보에 의거하여, 움직임 보상(또는 움직임 예측)을 행하고, 커런트 블록 또는 서브 블록의 인터 예측 화상을 생성한다. 인터 예측부(126)는, 생성된 인터 예측 화상을 예측 제어부(128)에 출력한다.
움직임 보상에 사용된 움직임 정보는, 다양한 형태로 인터 예측 화상으로서 신호화되어도 된다. 예를 들면, 움직임 벡터가 신호화되어도 된다. 다른 예로서, 움직임 벡터와 예측 움직임 벡터(motion vector predictor)의 차분이 신호화되어도 된다.
[참조 픽처 리스트]
도 33은, 각 참조 픽처의 일례를 나타내는 도면이며, 도 34는, 참조 픽처 리스트의 일례를 나타내는 개념도이다. 참조 픽처 리스트는, 프레임 메모리(122)에 기억되어 있는 하나 이상의 참조 픽처를 나타내는 리스트이다. 또한, 도 33에 있어서, 직사각형은 픽처를 나타내고, 화살표는 픽처의 참조 관계를 나타내며, 횡축은 시간을 나타내고, 직사각형 안의 I, P 및 B는 각각, 인트라 예측 픽처, 단예측 픽처 및 쌍예측 픽처를 나타내며, 직사각형 안의 숫자는 복호 순을 나타낸다. 도 33에 나타내는 바와 같이, 각 픽처의 복호 순은, I0, P1, B2, B3, B4이며, 각 픽처의 표시 순은, I0, B3, B2, B4, P1이다. 도 34에 나타내는 바와 같이, 참조 픽처 리스트는, 참조 픽처의 후보를 나타내는 리스트이며, 예를 들면 1개의 픽처(또는 슬라이스)가 하나 이상의 참조 픽처 리스트를 가져도 된다. 예를 들면, 커런트 픽처가, 단예측 픽처이면 1개의 참조 픽처 리스트를 사용하고, 커런트 픽처가 쌍예측 픽처이면 2개의 참조 픽처 리스트를 사용한다. 도 33 및 도 34의 예에서는, 커런트 픽처 currPic인 픽처 B3은, L0 리스트 및 L1 리스트의 2개의 참조 픽처 리스트를 갖는다. 커런트 픽처 currPic가 픽처 B3인 경우, 그 커런트 픽처 currPic의 참조 픽처의 후보는, I0, P1 및 B2이며, 각 참조 픽처 리스트(즉 L0 리스트 및 L1 리스트)는 이들 픽처를 나타낸다. 인터 예측부(126) 또는 예측 제어부(128)는, 각 참조 픽처 리스트 중의 어느 픽처를 실제로 참조할지 여부를 참조 픽처 인덱스 refidxLx에 의해 지정한다. 도 34에서는, 참조 픽처 인덱스 refIdxL0 및 refIdxL1에 의해 참조 픽처 P1 및 B2가 지정되어 있다.
이러한 참조 픽처 리스트를, 시퀀스 단위, 픽처 단위, 슬라이스 단위, 브릭 단위, CTU 단위, 또는 CU 단위로 생성해도 된다. 또, 참조 픽처 리스트에 나타나는 참조 픽처 중, 인터 예측에 있어서 참조되는 참조 픽처를 나타내는 참조 픽처 인덱스를, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨, CTU 레벨, 또는 CU 레벨에서 부호화해도 된다. 또, 복수의 인터 예측 모드에 있어서, 공통의 참조 픽처 리스트를 사용해도 된다.
[인터 예측의 기본 플로]
도 35는, 인터 예측의 기본적인 흐름을 나타내는 플로차트이다.
인터 예측부(126)는, 우선, 예측 화상을 생성한다(단계 Se_1~Se_3). 다음에, 감산부(104)는, 커런트 블록과 예측 화상의 차분을 예측 잔차로서 생성한다(단계 Se_4).
여기서, 인터 예측부(126)는, 예측 화상의 생성에서는, 예를 들면, 커런트 블록의 움직임 벡터(MV)의 결정(단계 Se_1 및 Se_2)과, 움직임 보상(단계 Se_3)을 행함으로써, 그 예측 화상을 생성한다. 또, 인터 예측부(126)는, MV의 결정에서는, 예를 들면, 후보 움직임 벡터(후보 MV)의 선택(단계 Se_1)과, MV의 도출(단계 Se_2)을 행함으로써, 그 MV를 결정한다. 후보 MV의 선택은, 예를 들면, 인터 예측부(126)가 후보 MV 리스트를 생성하고, 후보 MV 리스트로부터 적어도 하나의 후보 MV를 선택함으로써 행해진다. 또한, 후보 MV 리스트에는, 과거에 도출된 MV가 후보 MV로서 추가되어도 된다. 또, MV의 도출에서는, 인터 예측부(126)는, 적어도 하나의 후보 MV로부터, 또한 적어도 하나의 후보 MV를 선택함으로써, 그 선택된 적어도 하나의 후보 MV를, 커런트 블록의 MV로서 결정해도 된다. 혹은, 인터 예측부(126)는, 그 선택된 적어도 하나의 후보 MV 각각에 대해서, 그 후보 MV로 지시되는 참조 픽처의 영역을 탐색함으로써, 커런트 블록의 MV를 결정해도 된다. 또한, 이 참조 픽처의 영역을 탐색하는 것을, 움직임 탐색(motion estimation)이라고 칭해도 된다.
또, 상술한 예에서는, 단계 Se_1~Se_3은, 인터 예측부(126)에 의해 행해지는데, 예를 들면 단계 Se_1 또는 단계 Se_2 등의 처리는, 부호화 장치(100)에 포함되는 다른 구성 요소에 의해 행해져도 된다.
또한, 각각의 인터 예측 모드에 있어서의 처리마다 후보 MV 리스트를 작성해도 되고, 복수의 인터 예측 모드에 있어서 공통의 후보 MV 리스트를 사용해도 된다. 또, 단계 Se_3 및 Se_4의 처리는, 도 9에 나타내는 단계 Sa_3 및 Sa_4의 처리에 각각 상당한다. 또, 단계 Se_3의 처리는, 도 30의 단계 Sd_1b의 처리에 상당한다.
[MV 도출의 플로]
도 36은, MV 도출의 일례를 나타내는 플로차트이다.
인터 예측부(126)는, 움직임 정보(예를 들면 MV)를 부호화하는 모드로, 커런트 블록의 MV를 도출해도 된다. 이 경우, 예를 들면 움직임 정보가 예측 파라미터로서 부호화되고, 신호화되어도 된다. 즉, 부호화된 움직임 정보가 스트림에 포함된다.
혹은, 인터 예측부(126)는, 움직임 정보를 부호화하지 않는 모드로 MV를 도출해도 된다. 이 경우에는, 움직임 정보는 스트림에 포함되지 않는다.
여기서, MV 도출의 모드에는, 후술하는 노멀 인터 모드, 노멀 머지 모드, FRUC 모드 및 아핀 모드 등이 있다. 이들 모드 중, 움직임 정보를 부호화하는 모드에는, 노멀 인터 모드, 노멀 머지 모드, 및 아핀 모드(구체적으로는, 아핀 인터 모드 및 아핀 머지 모드) 등이 있다. 또한, 움직임 정보에는, MV뿐만 아니라, 후술하는 예측 MV 선택 정보가 포함되어도 된다. 또, 움직임 정보를 부호화하지 않는 모드에는, FRUC 모드 등이 있다. 인터 예측부(126)는, 이들 복수의 모드로부터, 커런트 블록의 MV를 도출하기 위한 모드를 선택하고, 그 선택된 모드를 사용하여 커런트 블록의 MV를 도출한다.
도 37은, MV 도출의 다른 예를 나타내는 플로차트이다.
인터 예측부(126)는, 차분 MV를 부호화하는 모드로, 커런트 블록의 MV를 도출해도 된다. 이 경우, 예를 들면 차분 MV가 예측 파라미터로서 부호화되고, 신호화된다. 즉, 부호화된 차분 MV가 스트림에 포함된다. 이 차분 MV는, 커런트 블록의 MV와, 그 예측 MV의 차이다. 또한, 예측 MV는, 예측 움직임 벡터이다.
혹은, 인터 예측부(126)는, 차분 MV를 부호화하지 않는 모드로 MV를 도출해도 된다. 이 경우에는, 부호화된 차분 MV는 스트림에 포함되지 않는다.
여기서, 상술한 바와 같이 MV의 도출의 모드에는, 후술하는 노멀 인터, 노멀 머지 모드, FRUC 모드 및 아핀 모드 등이 있다. 이들 모드 중, 차분 MV를 부호화하는 모드에는, 노멀 인터 모드 및 아핀 모드(구체적으로는, 아핀 인터 모드) 등이 있다. 또, 차분 MV를 부호화하지 않는 모드에는, FRUC 모드, 노멀 머지 모드 및 아핀 모드(구체적으로는, 아핀 머지 모드) 등이 있다. 인터 예측부(126)는, 이들 복수의 모드로부터, 커런트 블록의 MV를 도출하기 위한 모드를 선택하고, 그 선택된 모드를 사용하여 커런트 블록의 MV를 도출한다.
[MV 도출의 모드]
도 38a 및 도 38b는, MV 도출의 각 모드의 분류의 일례를 나타내는 도면이다. 예를 들면 도 38a에 나타내는 바와 같이, 움직임 정보를 부호화할지 여부, 및, 차분 MV를 부호화할지 여부에 따라, MV 도출의 모드는 크게 3개의 모드로 분류된다. 3개의 모드는, 인터 모드, 머지 모드, 및 FRUC(frame rate up-conversion) 모드이다. 인터 모드는, 움직임 탐색을 행하는 모드로서, 움직임 정보 및 차분 MV를 부호화하는 모드이다. 예를 들면 도 38b에 나타내는 바와 같이, 인터 모드는, 아핀 인터 모드 및 노멀 인터 모드를 포함한다. 머지 모드는, 움직임 탐색을 행하지 않는 모드로서, 주변의 부호화 완료 블록으로부터 MV를 선택하고, 그 MV를 사용하여 커런트 블록의 MV를 도출하는 모드이다. 이 머지 모드는, 기본적으로, 움직임 정보를 부호화하고, 차분 MV를 부호화하지 않는 모드이다. 예를 들면 도 38b에 나타내는 바와 같이, 머지 모드는, 노멀 머지 모드(통상 머지 모드 또는 레귤러 머지 모드라고 부르는 경우도 있다), MMVD(Merge with Motion Vector Difference) 모드, CIIP(Combined inter merge/intra prediction) 모드, 트라이앵글 모드, ATMVP 모드, 및 아핀 머지 모드를 포함한다. 여기서, 머지 모드에 포함되는 각 모드 중 MMVD 모드에서는, 예외적으로, 차분 MV가 부호화된다. 또한, 상술한 아핀 머지 모드 및 아핀 인터 모드는, 아핀 모드에 포함되는 모드이다. 아핀 모드는, 아핀 변환을 상정하여, 커런트 블록을 구성하는 복수의 서브 블록 각각의 MV를, 커런트 블록의 MV로서 도출하는 모드이다. FRUC 모드는, 부호화 완료 영역간에서 탐색을 행함으로써, 커런트 블록의 MV를 도출하는 모드로서, 움직임 정보 및 차분 MV 어느 쪽도 부호화하지 않는 모드이다. 또한, 이들 각 모드의 상세에 대해서는, 후술한다.
또한, 도 38a 및 도 38b에 나타내는 각 모드의 분류는 일례이며, 이에 한정되지 않는다. 예를 들면, CIIP 모드로 차분 MV가 부호화되는 경우에는, 그 CIIP 모드는 인터 모드로 분류된다.
[MV 도출>노멀 인터 모드]
노멀 인터 모드는, 후보 MV에 의해 나타내어지는 참조 픽처의 영역으로부터, 커런트 블록의 화상에 유사한 블록을 찾아냄으로써, 커런트 블록의 MV를 도출하는 인터 예측 모드이다. 또, 이 노멀 인터 모드에서는, 차분 MV가 부호화된다.
도 39는, 노멀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
인터 예측부(126)는, 우선, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 부호화 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Sg_1). 즉, 인터 예측부(126)는, 후보 MV 리스트를 작성한다.
다음에, 인터 예측부(126)는, 단계 Sg_1에서 취득된 복수의 후보 MV 중에서, N개(N은 2 이상의 정수)의 후보 MV 각각을 예측 MV 후보로서, 미리 정해진 우선 순위에 따라 추출한다(단계 Sg_2). 또한, 그 우선 순위는, N개의 후보 MV 각각에 대해 미리 정해져 있다.
다음에, 인터 예측부(126)는, 그 N개의 예측 MV 후보 중에서 1개의 예측 MV 후보를, 커런트 블록의 예측 MV로서 선택한다(단계 Sg_3). 이 때, 인터 예측부(126)는, 선택된 예측 MV를 식별하기 위한 예측 MV 선택 정보를 스트림에 부호화한다. 즉, 인터 예측부(126)는, 예측 파라미터 생성부(130)를 통해, 예측 MV 선택 정보를 예측 파라미터로서 엔트로피 부호화부(110)에 출력한다.
다음에, 인터 예측부(126)는, 부호화 완료 참조 픽처를 참조하여, 커런트 블록의 MV를 도출한다(단계 Sg_4). 이 때, 인터 예측부(126)는, 또한, 그 도출된 MV와 예측 MV의 차분값을 차분 MV로서 스트림에 부호화한다. 즉, 인터 예측부(126)는, 예측 파라미터 생성부(130)를 통해, 차분 MV를 예측 파라미터로서 엔트로피 부호화부(110)에 출력한다. 또한, 부호화 완료 참조 픽처는, 부호화 후에 재구성된 복수의 블록으로 이루어지는 픽처이다.
마지막으로, 인터 예측부(126)는, 그 도출된 MV와 부호화 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Sg_5). 단계 Sg_1~Sg_5의 처리는, 각 블록에 대해 실행된다. 예를 들면, 슬라이스에 포함되는 모든 블록 각각에 대해 단계 Sg_1~Sg_5의 처리가 실행되면, 그 슬라이스에 대한 노멀 인터 모드를 사용한 인터 예측이 종료된다. 또, 픽처에 포함되는 모든 블록 각각에 대해 단계 Sg_1~Sg_5의 처리가 실행되면, 그 픽처에 대한 노멀 인터 모드를 사용한 인터 예측이 종료된다. 또한, 단계 Sg_1~Sg_5의 처리는, 슬라이스에 포함되는 모든 블록에 대해 실행되지 않고, 일부의 블록에 대해 실행되면, 그 슬라이스에 대한 노멀 인터 모드를 사용한 인터 예측이 종료되어도 된다. 단계 Sg_1~Sg_5의 처리는, 마찬가지로, 픽처에 포함되는 일부의 블록에 대해 실행되면, 그 픽처에 대한 노멀 인터 모드를 사용한 인터 예측이 종료되어도 된다.
또한, 예측 화상은, 상술한 인터 예측 신호이다. 또, 부호화 신호에 포함되는, 예측 화상의 생성에 사용된 인터 예측 모드(상술한 예에서는 노멀 인터 모드)를 나타내는 정보는, 예를 들면 예측 파라미터로서 부호화된다.
또한, 후보 MV 리스트는, 다른 모드에 사용되는 리스트와 공통으로 사용되어도 된다. 또, 후보 MV 리스트에 관한 처리를, 다른 모드에 사용되는 리스트에 관한 처리에 적용해도 된다. 이 후보 MV 리스트에 관한 처리는, 예를 들면, 후보 MV 리스트로부터의 후보 MV의 추출 혹은 선택, 후보 MV의 재정렬 또는, 후보 MV의 삭제 등이다.
[MV 도출>노멀 머지 모드]
노멀 머지 모드는, 후보 MV 리스트로부터 후보 MV를 커런트 블록의 MV로서 선택함으로써, 그 MV를 도출하는 인터 예측 모드이다. 또한, 노멀 머지 모드는, 좁은 의미의 머지 모드로서, 단순히 머지 모드로 불리는 경우도 있다. 본 실시 형태에서는, 노멀 머지 모드와 머지 모드를 구별하고, 머지 모드를 넓은 의미로 사용한다.
도 40은, 노멀 머지 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
인터 예측부(126)는, 우선, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 부호화 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Sh_1). 즉, 인터 예측부(126)는, 후보 MV 리스트를 작성한다.
다음에, 인터 예측부(126)는, 단계 Sh_1에서 취득된 복수의 후보 MV 중에서 1개의 후보 MV를 선택함으로써, 커런트 블록의 MV를 도출한다(단계 Sh_2). 이 때, 인터 예측부(126)는, 선택된 후보 MV를 식별하기 위한 MV 선택 정보를 스트림에 부호화한다. 즉, 인터 예측부(126)는, 예측 파라미터 생성부(130)를 통해, MV 선택 정보를 예측 파라미터로서 엔트로피 부호화부(110)에 출력한다.
마지막으로, 인터 예측부(126)는, 그 도출된 MV와 부호화 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Sh_3). 단계 Sh_1~Sh_3의 처리는 예를 들면 각 블록에 대해 실행된다. 예를 들면, 슬라이스에 포함되는 모든 블록 각각에 대해 단계 Sh_1~Sh_3의 처리가 실행되면, 그 슬라이스에 대한 노멀 머지 모드를 사용한 인터 예측이 종료된다. 또, 픽처에 포함되는 모든 블록 각각에 대해 단계 Sh_1~Sh_3의 처리가 실행되면, 그 픽처에 대한 노멀 머지 모드를 사용한 인터 예측이 종료된다. 또한, 단계 Sh_1~Sh_3의 처리는, 슬라이스에 포함되는 모든 블록에 대해 실행되지 않고, 일부의 블록에 대해 실행되면, 그 슬라이스에 대한 노멀 머지 모드를 사용한 인터 예측이 종료되어도 된다. 단계 Sh_1~Sh_3의 처리는, 마찬가지로, 픽처에 포함되는 일부의 블록에 대해 실행되면, 그 픽처에 대한 노멀 머지 모드를 사용한 인터 예측이 종료되어도 된다.
또, 스트림에 포함되는, 예측 화상의 생성에 사용된 인터 예측 모드(상술한 예에서는 노멀 머지 모드)를 나타내는 정보는, 예를 들면 예측 파라미터로서 부호화된다.
도 41은, 노멀 머지 모드에 의한 커런트 픽처의 MV 도출 처리의 일례를 설명하기 위한 도면이다.
우선, 인터 예측부(126)는, 후보 MV를 등록한 후보 MV 리스트를 생성한다. 후보 MV로서는, 커런트 블록의 공간적으로 주변에 위치하는 복수의 부호화 완료 블록이 갖는 MV인 공간 인접 후보 MV, 부호화 완료 참조 픽처에 있어서의 커런트 블록의 위치를 투영한 부근의 블록이 갖는 MV인 시간 인접 후보 MV, 공간 인접 후보 MV와 시간 인접 후보 MV의 MV값을 조합하여 생성한 MV인 결합 후보 MV, 및 값이 제로인 MV인 제로 후보 MV 등이 있다.
다음에, 인터 예측부(126)는, 후보 MV 리스트에 등록되어 있는 복수의 후보 MV 중에서 1개의 후보 MV를 선택함으로써, 그 1개의 후보 MV를 커런트 블록의 MV로서 결정한다.
또한, 엔트로피 부호화부(110)는, 어느 후보 MV를 선택했는지를 나타내는 신호인 merge_idx를 스트림에 기술하여 부호화한다.
또한, 도 41에서 설명한 후보 MV 리스트에 등록하는 후보 MV는 일례이며, 도면 중의 개수와는 상이한 개수이거나, 도면 중의 후보 MV의 일부의 종류를 포함하지 않는 구성이거나, 도면 중의 후보 MV의 종류 이외의 후보 MV를 추가한 구성이어도 된다.
노멀 머지 모드에 의해 도출한 커런트 블록의 MV를 사용하여, 후술하는 DMVR(dynamic motion vector refreshing)을 행함으로써 최종적인 MV를 결정해도 된다. 또한, 노멀 머지 모드에서는, 차분 MV는 부호화되지 않지만, MMVD 모드에서는, 차분 MV는 부호화된다. MMVD 모드는, 노멀 머지 모드와 마찬가지로 후보 MV 리스트로부터 1개의 후보 MV를 선택하지만, 차분 MV를 부호화한다. 이러한 MMVD는, 도 38b에 나타내는 바와 같이, 노멀 머지 모드와 함께 머지 모드로 분류되어도 된다. 또한, MMVD 모드에서의 차분 MV는, 인터 모드에서 사용하는 차분 MV와 같지 않아도 되고, 예를 들면, MMVD 모드에서의 차분 MV의 도출은, 인터 모드에서의 차분 MV의 도출에 비해 처리량이 작은 처리여도 된다.
또, 인터 예측으로 생성한 예측 화상과 인트라 예측으로 생성한 예측 화상을 중첩하여, 커런트 블록의 예측 화상을 생성하는 CIIP(Combined inter merge/intra prediction) 모드를 행해도 된다.
또한, 후보 MV 리스트를, 후보 리스트라고 칭해도 된다. 또, merge_idx는, MV 선택 정보이다.
[MV 도출>HMVP 모드]
도 42는, HMVP 모드에 의한 커런트 픽처의 MV 도출 처리의 일례에 대해서 설명하기 위한 도면이다.
노멀 머지 모드에서는, 부호화 완료 블록(예를 들면 CU)을 참조하여 생성된 후보 MV 리스트 중에서 1개의 후보 MV를 선택함으로써, 커런트 블록인 예를 들면 CU의 MV를 결정한다. 여기서, 다른 후보 MV가 그 후보 MV 리스트에 등록되어도 된다. 이러한 다른 후보 MV가 등록되는 모드는, HMVP 모드로 불린다.
HMVP 모드에서는, 노멀 머지 모드의 후보 MV 리스트와는 별도로, HMVP용 FIFO(First-In First-Out) 버퍼를 사용하여 후보 MV를 관리하고 있다.
FIFO 버퍼에는, 과거에 처리한 블록의 MV 등의 움직임 정보가 최근인 것부터 순서대로 보관되어 있다. 이 FIFO 버퍼의 관리에서는, 1개의 블록의 처리가 행해질 때마다, 가장 최근의 블록(즉 직전에 처리된 CU)의 MV가 FIFO 버퍼에 보관되고, 대신에 FIFO 버퍼 내의 가장 오래된 CU(즉 가장 먼저 처리된 CU)의 MV가 FIFO 버퍼로부터 삭제된다. 도 42에 나타내는 예에서는, HMVP1이 가장 최근의 블록의 MV이며, HMVP5가 가장 오래된 블록의 MV이다.
그리고, 예를 들면, 인터 예측부(126)는, FIFO 버퍼에 관리되어 있는 각 MV에 대해서, HMVP1에서부터 순서대로, 그 MV가, 노멀 머지 모드의 후보 MV 리스트에 이미 등록되어 있는 모든 후보 MV와 상이한 MV인지 여부를 체크한다. 그리고, 인터 예측부(126)는, 모든 후보 MV와 상이하다고 판단한 경우에, 그 FIFO 버퍼에 관리되어 있는 MV를, 노멀 머지 모드의 후보 MV 리스트에 후보 MV로서 추가해도 된다. 이 때 FIFO 버퍼로부터 등록되는 후보 MV는 1개여도 되고, 복수 개여도 된다.
이와 같이 HMVP 모드를 사용함으로써, 커런트 블록의 공간적 혹은 시간적으로 인접하는 블록의 MV뿐만 아니라, 과거에 처리된 블록의 MV도 후보에 더하는 것이 가능해진다. 그 결과, 노멀 머지 모드의 후보 MV의 베리에이션이 확대됨으로써 부호화 효율을 향상시킬 수 있을 가능성이 높아진다.
또한, 상술한 MV는, 움직임 정보여도 된다. 즉, 후보 MV 리스트 및 FIFO 버퍼에 보관되는 정보는, MV의 값뿐만 아니라, 참조하는 픽처의 정보, 참조하는 방향 및 매수 등을 나타내는 정보를 포함하고 있어도 된다. 또, 상술한 블록은, 예를 들면 CU이다.
또한, 도 42의 후보 MV 리스트 및 FIFO 버퍼는 일례이며, 후보 MV 리스트 및 FIFO 버퍼는, 도 42와는 상이한 사이즈의 리스트 또는 버퍼이거나, 도 42와는 상이한 순서로 후보 MV를 등록하는 구성이어도 된다. 또, 여기서 설명한 처리는 부호화 장치(100)에 있어서도 복호 장치(200)에 있어서도 공통이다.
또한, HMVP 모드는, 노멀 머지 모드 이외의 모드에 대해서도, 적용할 수 있다. 예를 들면, FIFO 버퍼에, 과거에 아핀 모드로 처리한 블록의 MV 등의 움직임 정보를 최근인 것부터 순서대로 보관하고, 후보 MV로서 사용해도 된다. HMVP 모드를 아핀 모드에 적용한 모드를, 히스토리 아핀 모드로 불러도 된다.
[MV 도출>FRUC 모드]
움직임 정보는, 부호화 장치(100) 측으로부터 신호화되지 않고, 복호 장치(200) 측에서 도출되어도 된다. 예를 들면, 복호 장치(200) 측에서 움직임 탐색을 행함으로써 움직임 정보가 도출되어도 된다. 이 경우, 복호 장치(200) 측에서는, 커런트 블록의 화소값을 사용하지 않고 움직임 탐색이 행해진다. 이러한 복호 장치(200) 측에서 움직임 탐색을 행하는 모드에는, FRUC(frame rate up-conversion) 모드 또는 PMMVD(pattern matched motion vector derivation) 모드 등이 있다.
FRUC 처리의 일례를 도 43에 나타낸다. 우선, 커런트 블록에 공간적 또는 시간적으로 인접하는 각 부호화 완료 블록의 MV를 참조하여, 그들 MV를 후보 MV로서 나타내는 리스트(즉, 후보 MV 리스트로서, 노멀 머지 모드의 후보 MV 리스트와 공통이어도 된다)가 생성된다(단계 Si_1). 다음에, 후보 MV 리스트에 등록되어 있는 복수의 후보 MV 중에서 베스트 후보 MV가 선택된다(단계 Si_2). 예를 들면, 후보 MV 리스트에 포함되는 각 후보 MV의 평가값이 산출되고, 그 평가값에 의거하여 1개의 후보 MV가 베스트 후보 MV로서 선택된다. 그리고, 선택된 베스트 후보 MV에 의거하여, 커런트 블록을 위한 MV가 도출된다(단계 Si_4). 구체적으로는, 예를 들면, 선택된 베스트 후보 MV가 그대로 커런트 블록을 위한 MV로서 도출된다. 또 예를 들면, 선택된 베스트 후보 MV에 대응하는 참조 픽처 내의 위치의 주변 영역에 있어서, 패턴 매칭을 행함으로써, 커런트 블록을 위한 MV가 도출되어도 된다. 즉, 베스트 후보 MV의 주변의 영역에 대해, 참조 픽처에 있어서의 패턴 매칭 및 평가값을 사용한 탐색을 행하고, 더 평가값이 좋은 값이 되는 MV가 있었을 경우는, 베스트 후보 MV를 그 MV로 갱신하고, 그것을 커런트 블록의 최종적인 MV로 해도 된다. 보다 좋은 평가값을 갖는 MV로의 갱신을 실시하지 않아도 된다.
마지막으로, 인터 예측부(126)는, 그 도출된 MV와 부호화 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Si_5). 단계 Si_1~Si_5의 처리는 예를 들면 각 블록에 대해 실행된다. 예를 들면, 슬라이스에 포함되는 모든 블록 각각에 대해 단계 Si_1~Si_5의 처리가 실행되면, 그 슬라이스에 대한 FRUC 모드를 사용한 인터 예측이 종료된다. 또, 픽처에 포함되는 모든 블록 각각에 대해 단계 Si_1~Si_5의 처리가 실행되면, 그 픽처에 대한 FRUC 모드를 사용한 인터 예측이 종료된다. 또한, 단계 Si_1~Si_5의 처리는, 슬라이스에 포함되는 모든 블록에 대해 실행되지 않고, 일부의 블록에 대해 실행되면, 그 슬라이스에 대한 FRUC 모드를 사용한 인터 예측이 종료되어도 된다. 단계 Si_1~Si_5의 처리는, 마찬가지로, 픽처에 포함되는 일부의 블록에 대해 실행되면, 그 픽처에 대한 FRUC 모드를 사용한 인터 예측이 종료되어도 된다.
서브 블록 단위에서도 상술한 블록 단위와 동일하게 처리되어도 된다.
평가값은, 여러 가지 방법에 의해 산출되어도 된다. 예를 들면, MV에 대응하는 참조 픽처 내의 영역의 재구성 화상과, 소정의 영역(그 영역은, 예를 들면, 이하에 나타내는 바와 같이, 다른 참조 픽처의 영역 또는 커런트 픽처의 인접 블록의 영역이어도 된다)의 재구성 화상을 비교한다. 그리고, 2개의 재구성 화상의 화소값의 차분을 산출하여, MV의 평가값에 사용해도 된다. 또한, 차분값에 더하여 그 이외의 정보를 사용하여 평가값을 산출해도 된다.
다음에, 패턴 매칭에 대해서 상세하게 설명한다. 우선, 후보 MV 리스트(머지 리스트라고도 한다)에 포함되는 1개의 후보 MV가, 패턴 매칭에 의한 탐색의 스타트 포인트로서 선택된다. 패턴 매칭으로서는, 제1 패턴 매칭 또는 제2 패턴 매칭이 사용되어도 된다. 제1 패턴 매칭 및 제2 패턴 매칭은, 각각, 바이래터럴 매칭(bilateral matching) 및 템플릿 매칭(template matching)으로 불리는 경우가 있다.
[MV 도출>FRUC>바이래터럴 매칭]
제1 패턴 매칭에서는, 상이한 2개의 참조 픽처 내의 2개의 블록으로서 커런트 블록의 움직임 궤도(motion trajectory)를 따르는 2개의 블록 사이에서 패턴 매칭이 행해진다. 따라서, 제1 패턴 매칭에서는, 상술한 후보 MV의 평가값의 산출을 위한 소정의 영역으로서, 커런트 블록의 움직임 궤도를 따르는 다른 참조 픽처 내의 영역이 사용된다.
도 44는, 움직임 궤도를 따르는 2개의 참조 픽처에 있어서의 2개의 블록 사이에서의 제1 패턴 매칭(바이래터럴 매칭)의 일례를 설명하기 위한 도면이다. 도 44에 나타내는 바와 같이, 제1 패턴 매칭에서는, 커런트 블록(Cur block)의 움직임 궤도를 따르는 2개의 블록으로서 상이한 2개의 참조 픽처(Ref0, Ref1) 내의 2개의 블록의 페어 중에서 가장 매칭되는 페어를 탐색함으로써 2개의 MV(MV0, MV1)가 도출된다. 구체적으로는, 커런트 블록에 대해, 후보 MV로 지정된 제1 부호화 완료 참조 픽처(Ref0) 내의 지정 위치에 있어서의 재구성 화상과, 그 후보 MV를 표시 시간 간격으로 스케일링한 대칭 MV로 지정된 제2 부호화 완료 참조 픽처(Ref1) 내의 지정 위치에 있어서의 재구성 화상의 차분이 도출되고, 얻어진 차분값을 사용하여 평가값이 산출된다. 복수의 후보 MV 중에서 가장 평가값이 좋은 값이 되는 후보 MV가 베스트 후보 MV로서 선택되면 된다.
연속적인 움직임 궤도의 가정 하에서는, 2개의 참조 블록을 가리키는 MV(MV0, MV1)는, 커런트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1) 사이의 시간적인 거리(TD0, TD1)에 대해 비례한다. 예를 들면, 커런트 픽처가 시간적으로 2개의 참조 픽처 사이에 위치하고, 커런트 픽처로부터 2개의 참조 픽처로의 시간적인 거리가 같은 경우, 제1 패턴 매칭에서는, 경영(鏡映) 대칭인 쌍방향의 MV가 도출된다.
[MV 도출>FRUC>템플릿 매칭]
제2 패턴 매칭(템플릿 매칭)에서는, 커런트 픽처 내의 템플릿(커런트 픽처 내에서 커런트 블록에 인접하는 블록(예를 들면 상측 및/또는 좌측 인접 블록))과 참조 픽처 내의 블록 사이에서 패턴 매칭이 행해진다. 따라서, 제2 패턴 매칭에서는, 상술한 후보 MV의 평가값의 산출을 위한 소정의 영역으로서, 커런트 픽처 내의 커런트 블록에 인접하는 블록이 사용된다.
도 45는, 커런트 픽처 내의 템플릿과 참조 픽처 내의 블록 사이에서의 패턴 매칭(템플릿 매칭)의 일례를 설명하기 위한 도면이다. 도 45에 나타내는 바와 같이, 제2 패턴 매칭에서는, 커런트 픽처(Cur Pic) 내에서 커런트 블록(Cur block)에 인접하는 블록과 가장 매칭되는 블록을 참조 픽처(Ref0) 내에서 탐색함으로써 커런트 블록의 MV가 도출된다. 구체적으로는, 커런트 블록에 대해, 좌측 인접 및 상측 인접 양쪽 혹은 어느 한쪽의 부호화 완료 영역의 재구성 화상과, 후보 MV로 지정된 부호화 완료 참조 픽처(Ref0) 내의 동등 위치에 있어서의 재구성 화상의 차분이 도출되고, 얻어진 차분값을 사용하여 평가값이 산출된다. 복수의 후보 MV 중에서 가장 평가값이 좋은 값이 되는 후보 MV가 베스트 후보 MV로서 선택되면 된다.
이러한 FRUC 모드를 적용할지 여부를 나타내는 정보(예를 들면 FRUC 플래그로 불린다)는, CU 레벨에서 신호화되어도 된다. 또, FRUC 모드가 적용되는 경우(예를 들면 FRUC 플래그가 참인 경우), 적용 가능한 패턴 매칭의 방법(제1 패턴 매칭 또는 제2 패턴 매칭)을 나타내는 정보가 CU 레벨에서 신호화되어도 된다. 또한, 이들 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
[MV 도출>아핀 모드]
아핀 모드는, affine 변환을 사용하여 MV를 생성하는 모드이며, 예를 들면, 복수의 인접 블록의 MV에 의거하여 서브 블록 단위로 MV를 도출해도 된다. 이 모드는, 아핀 움직임 보상 예측(affine motion compensation prediction) 모드로 불리는 경우가 있다.
도 46a는, 복수의 인접 블록의 MV에 의거한 서브 블록 단위의 MV의 도출의 일례를 설명하기 위한 도면이다. 도 46a에 있어서, 커런트 블록은, 예를 들면, 16개의 4×4 화소로 이루어지는 서브 블록을 포함한다. 여기에서는, 인접 블록의 MV에 의거하여 커런트 블록의 좌상각(左上角) 제어 포인트의 움직임 벡터 v0이 도출되고, 마찬가지로, 인접 서브 블록의 MV에 의거하여 커런트 블록의 우상각(右上角) 제어 포인트의 움직임 벡터 v1이 도출된다. 그리고, 이하의 식 (1A)에 의해, 2개의 움직임 벡터 v0 및 v1을 투영하여, 커런트 블록 내의 각 서브 블록의 움직임 벡터(vx, vy)가 도출된다.
여기서, x 및 y는, 각각, 서브 블록의 수평 위치 및 수직 위치를 나타내고, w는, 미리 정해진 가중 계수를 나타낸다.
이러한 아핀 모드를 나타내는 정보(예를 들면 아핀 플래그로 불린다)는, CU 레벨에서 신호화되어도 된다. 또한, 이 아핀 모드를 나타내는 정보의 신호화는, CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
또, 이러한 아핀 모드는, 좌상각 및 우상각 제어 포인트의 MV의 도출 방법이 상이한 몇 가지 모드를 포함해도 된다. 예를 들면, 아핀 모드에는, 아핀 인터(아핀 노멀 인터라고도 한다) 모드와, 아핀 머지 모드의 2개의 모드가 있다.
도 46b는, 3개의 제어 포인트를 사용하는 아핀 모드에 있어서의 서브 블록 단위의 MV의 도출의 일례를 설명하기 위한 도면이다. 도 46b에 있어서, 커런트 블록은, 예를 들면, 16개의 4×4 화소로 이루어지는 서브 블록을 포함한다. 여기에서는, 인접 블록의 MV에 의거하여 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0이 도출된다. 마찬가지로, 인접 블록의 MV에 의거하여 커런트 블록의 우상각 제어 포인트의 움직임 벡터 v1이 도출되고, 인접 블록의 MV에 의거하여 커런트 블록의 좌하각 제어 포인트의 움직임 벡터 v2가 도출된다. 그리고, 이하의 식 (1B)에 의해, 3개의 움직임 벡터 v0, v1 및 v2를 투영하여, 커런트 블록 내의 각 서브 블록의 움직임 벡터(vx, vy)가 도출된다.
여기서, x 및 y는, 각각, 서브 블록 중심의 수평 위치 및 수직 위치를 나타내고, w 및 h는, 미리 정해진 가중 계수를 나타낸다. w는, 커런트 블록의 폭, h는, 커런트 블록의 높이를 나타내도 된다.
서로 상이한 제어 포인트 수(예를 들면, 2개와 3개)를 사용하는 아핀 모드는, CU 레벨에서 전환하여 신호화되어도 된다. 또한, CU 레벨에서 사용하고 있는 아핀 모드의 제어 포인트 수를 나타내는 정보를, 다른 레벨(예를 들면, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨, CTU 레벨 또는 서브 블록 레벨)에서 신호화해도 된다.
또, 이러한 3개의 제어 포인트를 갖는 아핀 모드는, 좌상각, 우상각 및 좌하각 제어 포인트의 MV의 도출 방법이 상이한 몇 가지 모드를 포함해도 된다. 예를 들면, 3개의 제어 포인트를 갖는 아핀 모드에는, 상술한 2개의 제어 포인트를 갖는 아핀 모드와 마찬가지로, 아핀 인터 모드와, 아핀 머지 모드의 2개의 모드가 있다.
또한, 아핀 모드에 있어서, 커런트 블록에 포함되는 각 서브 블록의 사이즈는, 4×4 화소로 한정되지 않고, 다른 크기여도 된다. 예를 들면, 각 서브 블록의 사이즈는, 8×8 화소여도 된다.
[MV 도출>아핀 모드>제어 포인트]
도 47a, 도 47b 및 도 47c는, 아핀 모드에 있어서의 제어 포인트의 MV 도출의 일례를 설명하기 위한 개념도이다.
아핀 모드에서는, 도 47a에 나타내는 바와 같이, 예를 들면, 커런트 블록에 인접하는 부호화 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측) 중, 아핀 모드로 부호화된 블록에 대응하는 복수의 MV에 의거하여, 커런트 블록의 제어 포인트 각각의 예측 MV가 산출된다. 구체적으로는, 부호화 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측)의 순서로 이들 블록이 검사되고, 아핀 모드로 부호화된 최초의 유효한 블록이 특정된다. 이 특정된 블록에 대응하는 복수의 MV에 의거하여, 커런트 블록의 제어 포인트의 MV가 산출된다.
예를 들면, 도 47b에 나타내는 바와 같이, 커런트 블록의 좌측에 인접하는 블록 A가 2개의 제어 포인트를 갖는 아핀 모드로 부호화되어 있는 경우는, 블록 A를 포함하는 부호화 완료 블록의 좌상각 및 우상각의 위치에 투영한 움직임 벡터 v3 및 v4가 도출된다. 그리고, 도출된 움직임 벡터 v3 및 v4로부터, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1이 산출된다.
예를 들면, 도 47c에 나타내는 바와 같이, 커런트 블록의 좌측에 인접하는 블록 A가 3개의 제어 포인트를 갖는 아핀 모드로 부호화되어 있는 경우는, 블록 A를 포함하는 부호화 완료 블록의 좌상각, 우상각 및 좌하각의 위치에 투영한 움직임 벡터 v3, v4 및 v5가 도출된다. 그리고, 도출된 움직임 벡터 v3, v4 및 v5로부터, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1과, 좌하각 제어 포인트의 움직임 벡터 v2가 산출된다.
또한, 도 47a~도 47c에 나타내는 MV의 도출 방법은, 후술하는 도 50에 나타내는 단계 Sk_1에 있어서의 커런트 블록의 각 제어 포인트의 MV의 도출에 사용되어도 되고, 후술하는 도 51에 나타내는 단계 Sj_1에 있어서의 커런트 블록의 각 제어 포인트의 예측 MV의 도출에 사용되어도 된다.
도 48a 및 도 48b는, 아핀 모드에 있어서의 제어 포인트 MV의 도출의 다른 일례를 설명하기 위한 개념도이다.
도 48a는, 2개의 제어 포인트를 갖는 아핀 모드를 설명하기 위한 도면이다.
이 아핀 모드에서는, 도 48a에 나타내는 바와 같이, 커런트 블록에 인접하는 부호화 완료 블록 A, 블록 B 및 블록 C 각각의 MV로부터 선택된 MV가, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0으로서 사용된다. 마찬가지로, 커런트 블록에 인접하는 부호화 완료 블록 D 및 블록 E 각각의 MV로부터 선택된 MV가, 커런트 블록의 우상각 제어 포인트의 움직임 벡터 v1로서 사용된다.
도 48b는, 3개의 제어 포인트를 갖는 아핀 모드를 설명하기 위한 도면이다.
이 아핀 모드에서는, 도 48b에 나타내는 바와 같이, 커런트 블록에 인접하는 부호화 완료 블록 A, 블록 B 및 블록 C 각각의 MV로부터 선택된 MV가, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0으로서 사용된다. 마찬가지로, 커런트 블록에 인접하는 부호화 완료 블록 D 및 블록 E 각각의 MV로부터 선택된 MV가, 커런트 블록의 우상각 제어 포인트의 움직임 벡터 v1로서 사용된다. 또한, 커런트 블록에 인접하는 부호화 완료 블록 F 및 블록 G 각각의 MV로부터 선택된 MV가, 커런트 블록의 좌하각 제어 포인트의 움직임 벡터 v2로서 사용된다.
또한, 도 48a 및 도 48b에 나타내는 MV의 도출 방법은, 후술하는 도 50에 나타내는 단계 Sk_1에 있어서의 커런트 블록의 각 제어 포인트의 MV의 도출에 사용되어도 되고, 후술하는 도 51의 단계 Sj_1에 있어서의 커런트 블록의 각 제어 포인트의 예측 MV의 도출에 사용되어도 된다.
여기서, 예를 들면, 상이한 제어 포인트 수(예를 들면, 2개와 3개)의 아핀 모드를 CU 레벨에서 전환하여 신호화하는 경우 등에 있어서, 부호화 완료 블록과 커런트 블록에서 제어 포인트의 수가 상이한 경우가 있다.
도 49a 및 도 49b는, 부호화 완료 블록과 커런트 블록에서 제어 포인트의 수가 상이한 경우의, 제어 포인트의 MV 도출 방법의 일례를 설명하기 위한 개념도이다.
예를 들면, 도 49a에 나타내는 바와 같이, 커런트 블록이 좌상각, 우상각 및 좌하각의 3개의 제어 포인트를 갖고, 커런트 블록의 좌측에 인접하는 블록 A가 2개의 제어 포인트를 갖는 아핀 모드로 부호화되어 있다. 이 경우는, 블록 A를 포함하는 부호화 완료 블록의 좌상각 및 우상각의 위치에 투영한 움직임 벡터 v3 및 v4가 도출된다. 그리고, 도출된 움직임 벡터 v3 및 v4로부터, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1이 산출된다. 또한, 도출된 움직임 벡터 v0 및 v1로부터, 좌하각 제어 포인트의 움직임 벡터 v2가 산출된다.
예를 들면, 도 49b에 나타내는 바와 같이, 커런트 블록이 좌상각 및 우상각의 2개의 제어 포인트를 갖고, 커런트 블록의 좌측에 인접하는 블록 A가 3개의 제어 포인트를 갖는 아핀 모드로 부호화되어 있다. 이 경우는, 블록 A를 포함하는 부호화 완료 블록의 좌상각, 우상각 및 좌하각의 위치에 투영한 움직임 벡터 v3, v4 및 v5가 도출된다. 그리고, 도출된 움직임 벡터 v3, v4 및 v5로부터, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1이 산출된다.
또한, 도 49a 및 도 49b에 나타내는 MV의 도출 방법은, 후술하는 도 50에 나타내는 단계 Sk_1에 있어서의 커런트 블록의 각 제어 포인트의 MV의 도출에 사용되어도 되고, 후술하는 도 51의 단계 Sj_1에 있어서의 커런트 블록의 각 제어 포인트의 예측 MV의 도출에 사용되어도 된다.
[MV 도출>아핀 모드>아핀 머지 모드]
도 50은, 아핀 머지 모드의 일례를 나타내는 플로차트이다.
아핀 머지 모드에서는, 우선, 인터 예측부(126)는, 커런트 블록의 제어 포인트 각각의 MV를 도출한다(단계 Sk_1). 제어 포인트는, 도 46a에 나타내는 바와 같이, 커런트 블록의 좌상각 및 우상각의 포인트, 혹은 도 46b에 나타내는 바와 같이, 커런트 블록의 좌상각, 우상각 및 좌하각의 포인트이다. 이 때, 인터 예측부(126)는, 도출된 2개 또는 3개의 MV를 식별하기 위한 MV 선택 정보를 스트림에 부호화해도 된다.
예를 들면, 도 47a~도 47c에 나타내는 MV의 도출 방법을 사용하는 경우, 인터 예측부(126)는, 도 47a에 나타내는 바와 같이, 부호화 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측)의 순서로 이들 블록을 검사하고, 아핀 모드로 부호화된 최초의 유효한 블록을 특정한다.
인터 예측부(126)는, 특정된 아핀 모드로 부호화된 최초의 유효한 블록을 사용하여, 제어 포인트의 MV를 도출한다. 예를 들면, 블록 A가 특정되어, 블록 A가 2개의 제어 포인트를 갖는 경우, 도 47b에 나타내는 바와 같이, 인터 예측부(126)는, 블록 A를 포함하는 부호화 완료 블록의 좌상각 및 우상각의 움직임 벡터 v3 및 v4로부터, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1을 산출한다. 예를 들면, 인터 예측부(126)는, 부호화 완료 블록의 좌상각 및 우상각의 움직임 벡터 v3 및 v4를, 커런트 블록에 투영함으로써, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1을 산출한다.
혹은, 블록 A가 특정되어, 블록 A가 3개의 제어 포인트를 갖는 경우, 도 47c에 나타내는 바와 같이, 인터 예측부(126)는, 블록 A를 포함하는 부호화 완료 블록의 좌상각, 우상각 및 좌하각의 움직임 벡터 v3, v4 및 v5로부터, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1과, 좌하각 제어 포인트의 움직임 벡터 v2를 산출한다. 예를 들면, 인터 예측부(126)는, 부호화 완료 블록의 좌상각, 우상각 및 좌하각의 움직임 벡터 v3, v4 및 v5를, 커런트 블록에 투영함으로써, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1과, 좌하각 제어 포인트의 움직임 벡터 v2를 산출한다.
또한, 상술한 도 49a에 나타내는 바와 같이, 블록 A가 특정되어, 블록 A가 2개의 제어 포인트를 갖는 경우에, 3개의 제어 포인트의 MV를 산출해도 되고, 상술한 도 49b에 나타내는 바와 같이, 블록 A가 특정되어, 블록 A가 3개의 제어 포인트를 갖는 경우에, 2개의 제어 포인트의 MV를 산출해도 된다.
다음에, 인터 예측부(126)는, 커런트 블록에 포함되는 복수의 서브 블록 각각에 대해서, 움직임 보상을 행한다. 즉, 인터 예측부(126)는, 그 복수의 서브 블록 각각에 대해서, 2개의 움직임 벡터 v0 및 v1과 상술한 식 (1A)를 사용하여, 혹은 3개의 움직임 벡터 v0, v1 및 v2와 상술한 식 (1B)를 사용하여, 그 서브 블록의 MV를 아핀 MV로서 산출한다(단계 Sk_2). 그리고, 인터 예측부(126)는, 그들 아핀 MV 및 부호화 완료 참조 픽처를 사용하여 그 서브 블록에 대해 움직임 보상을 행한다(단계 Sk_3). 커런트 블록에 포함되는 모든 서브 블록 각각에 대해 단계 Sk_2 및 Sk_3의 처리가 실행되면, 그 커런트 블록에 대한 아핀 머지 모드를 사용한 예측 화상의 생성의 처리가 종료된다. 즉, 커런트 블록에 대해 움직임 보상이 행해지고, 그 커런트 블록의 예측 화상이 생성된다.
또한, 단계 Sk_1에서는, 상술한 후보 MV 리스트가 생성되어도 된다. 후보 MV 리스트는, 예를 들면, 각 제어 포인트에 대해 복수의 MV 도출 방법을 사용하여 도출한 후보 MV를 포함하는 리스트여도 된다. 복수의 MV 도출 방법은, 도 47a~도 47c에 나타내는 MV의 도출 방법, 도 48a 및 도 48b에 나타내는 MV의 도출 방법, 도 49a 및 도 49b에 나타내는 MV의 도출 방법, 및, 그 외의 MV의 도출 방법의 임의의 조합이어도 된다.
또한, 후보 MV 리스트는, 아핀 모드 이외의, 서브 블록 단위로 예측을 행하는 모드의 후보 MV를 포함해도 된다.
또한, 후보 MV 리스트로서, 예를 들면, 2개의 제어 포인트를 갖는 아핀 머지 모드의 후보 MV와, 3개의 제어 포인트를 갖는 아핀 머지 모드의 후보 MV를 포함하는 후보 MV 리스트를 생성해도 된다. 또는, 2개의 제어 포인트를 갖는 아핀 머지 모드의 후보 MV를 포함하는 후보 MV 리스트와, 3개의 제어 포인트를 갖는 아핀 머지 모드의 후보 MV를 포함하는 후보 MV 리스트를 각각 생성해도 된다. 또는, 2개의 제어 포인트를 갖는 아핀 머지 모드와, 3개의 제어 포인트를 갖는 아핀 머지 모드 중 한쪽 모드의 후보 MV를 포함하는 후보 MV 리스트를 생성해도 된다. 후보 MV는, 예를 들면, 부호화 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측)의 MV여도 되고, 그들 블록 중 유효한 블록의 MV여도 된다.
또한, MV 선택 정보로서, 후보 MV 리스트 중 어느 후보 MV인지를 나타내는 인덱스를 보내도 된다.
[MV 도출>아핀 모드>아핀 인터 모드]
도 51은, 아핀 인터 모드의 일례를 나타내는 플로차트이다.
아핀 인터 모드에서는, 우선, 인터 예측부(126)는, 커런트 블록의 2개 또는 3개의 제어 포인트 각각의 예측 MV (v0, v1) 또는 (v0, v1, v2)를 도출한다(단계 Sj_1). 제어 포인트는, 도 46a 또는 도 46b에 나타내는 바와 같이, 커런트 블록의 좌상각, 우상각 혹은 좌하각의 포인트이다.
예를 들면, 도 48a 및 도 48b에 나타내는 MV의 도출 방법을 사용하는 경우, 인터 예측부(126)는, 도 48a 또는 도 48b에 나타내는 커런트 블록의 각 제어 포인트 근방의 부호화 완료 블록 중 어느 하나의 블록의 MV를 선택함으로써, 커런트 블록의 제어 포인트의 예측 MV (v0, v1) 또는 (v0, v1, v2)를 도출한다. 이 때, 인터 예측부(126)는, 선택된 2개 또는 3개의 예측 MV를 식별하기 위한 예측 MV 선택 정보를 스트림에 부호화한다.
예를 들면, 인터 예측부(126)는, 커런트 블록에 인접하는 부호화 완료 블록으로부터 어느 블록의 MV를 제어 포인트의 예측 MV로서 선택할지를, 코스트 평가 등을 사용하여 결정하고, 어느 예측 MV를 선택했는지를 나타내는 플래그를 비트 스트림에 기술해도 된다. 즉, 인터 예측부(126)는, 예측 파라미터 생성부(130)를 통해, 플래그 등의 예측 MV 선택 정보를 예측 파라미터로서 엔트로피 부호화부(110)에 출력한다.
다음에, 인터 예측부(126)는, 단계 Sj_1에서 선택 또는 도출된 예측 MV를 각각 갱신하면서(단계 Sj_2), 움직임 탐색을 행한다(단계 Sj_3 및 Sj_4). 즉, 인터 예측부(126)는, 갱신되는 예측 MV에 대응하는 각 서브 블록의 MV를 아핀 MV로서, 상술한 식 (1A) 또는 식 (1B)를 사용하여 산출한다(단계 Sj_3). 그리고, 인터 예측부(126)는, 그들 아핀 MV 및 부호화 완료 참조 픽처를 사용하여 각 서브 블록에 대해 움직임 보상을 행한다(단계 Sj_4). 단계 Sj_3 및 Sj_4의 처리는, 단계 Sj_2에서 예측 MV가 갱신될 때마다, 커런트 블록 내의 모든 블록에 대해 실행된다. 그 결과, 인터 예측부(126)는, 움직임 탐색 루프에 있어서, 예를 들면 가장 작은 코스트가 얻어지는 예측 MV를, 제어 포인트의 MV로서 결정한다(단계 Sj_5). 이 때, 인터 예측부(126)는, 또한, 그 결정된 MV와 예측 MV의 차분값을 차분 MV로서 스트림에 부호화한다. 즉, 인터 예측부(126)는, 예측 파라미터 생성부(130)를 통해, 차분 MV를 예측 파라미터로서 엔트로피 부호화부(110)에 출력한다.
마지막으로, 인터 예측부(126)는, 그 결정된 MV와 부호화 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Sj_6).
또한, 단계 Sj_1에서는, 상술한 후보 MV 리스트가 생성되어도 된다. 후보 MV 리스트는, 예를 들면, 각 제어 포인트에 대해 복수의 MV 도출 방법을 사용하여 도출한 후보 MV를 포함하는 리스트여도 된다. 복수의 MV 도출 방법은, 도 47a~도 47c에 나타내는 MV의 도출 방법, 도 48a 및 도 48b에 나타내는 MV의 도출 방법, 도 49a 및 도 49b에 나타내는 MV의 도출 방법, 및, 그 외의 MV의 도출 방법의 임의의 조합이어도 된다.
또한, 후보 MV 리스트는, 아핀 모드 이외의, 서브 블록 단위로 예측을 행하는 모드의 후보 MV를 포함해도 된다.
또한, 후보 MV 리스트로서, 2개의 제어 포인트를 갖는 아핀 인터 모드의 후보 MV와, 3개의 제어 포인트를 갖는 아핀 인터 모드의 후보 MV를 포함하는 후보 MV 리스트를 생성해도 된다. 또는, 2개의 제어 포인트를 갖는 아핀 인터 모드의 후보 MV를 포함하는 후보 MV 리스트와, 3개의 제어 포인트를 갖는 아핀 인터 모드의 후보 MV를 포함하는 후보 MV 리스트를 각각 생성해도 된다. 또는, 2개의 제어 포인트를 갖는 아핀 인터 모드와, 3개의 제어 포인트를 갖는 아핀 인터 모드 중 한쪽 모드의 후보 MV를 포함하는 후보 MV 리스트를 생성해도 된다. 후보 MV는, 예를 들면, 부호화 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측)의 MV여도 되고, 그들 블록 중 유효한 블록의 MV여도 된다.
또한, 예측 MV 선택 정보로서, 후보 MV 리스트 중 어느 후보 MV인지를 나타내는 인덱스를 보내도 된다.
[MV 도출>트라이앵글 모드]
인터 예측부(126)는, 상술한 예에서는, 직사각형의 커런트 블록에 대해 1개의 직사각형의 예측 화상을 생성한다. 그러나, 인터 예측부(126)는, 그 직사각형의 커런트 블록에 대해 직사각형과 상이한 형상의 복수의 예측 화상을 생성하고, 그들 복수의 예측 화상을 결합함으로써, 최종적인 직사각형의 예측 화상을 생성해도 된다. 직사각형과 상이한 형상은, 예를 들면 삼각형이어도 된다.
도 52a는, 2개의 삼각형의 예측 화상의 생성을 설명하기 위한 도면이다.
인터 예측부(126)는, 커런트 블록 내의 삼각형의 제1 파티션에 대해, 그 제1 파티션의 제1 MV를 사용하여 움직임 보상을 행함으로써, 삼각형의 예측 화상을 생성한다. 마찬가지로, 인터 예측부(126)는, 커런트 블록 내의 삼각형의 제2 파티션에 대해, 그 제2 파티션의 제2 MV를 사용하여 움직임 보상을 행함으로써, 삼각형의 예측 화상을 생성한다. 그리고, 인터 예측부(126)는, 이들 예측 화상을 결합함으로써, 커런트 블록과 같은 직사각형의 예측 화상을 생성한다.
또한, 제1 파티션의 예측 화상으로서, 제1 MV를 사용하여 커런트 블록에 대응하는 직사각형의 제1 예측 화상을 생성해도 된다. 또, 제2 파티션의 예측 화상으로서, 제2 MV를 사용하여 커런트 블록에 대응하는 직사각형의 제2 예측 화상을 생성해도 된다. 제1 예측 화상과 제2 예측 화상을 가중 가산함으로써, 커런트 블록의 예측 화상을 생성해도 된다. 또한, 가중 가산하는 부위는, 제1 파티션과 제2 파티션의 경계를 사이에 두는 일부의 영역만이어도 된다.
도 52b는, 제2 파티션과 겹치는 제1 파티션의 제1 부분, 그리고, 보정 처리의 일부로서 가중될 수 있는 제1 샘플 세트 및 제2 샘플 세트의 예를 나타내는 개념도이다. 제1 부분은, 예를 들면, 제1 파티션의 폭 또는 높이의 4분의 1이어도 된다. 다른 예에 있어서, 제1 부분은, 제1 파티션의 모서리에 인접하는 N개의 샘플에 대응하는 폭을 갖고 있어도 된다. 여기서, N은, 제로보다 큰 정수이며, 예를 들면, N은, 정수 2여도 된다. 도 52b는, 제1 파티션의 폭의 4분의 1의 폭의 직사각형 부분을 갖는 직사각형 파티션을 나타낸다. 여기서, 제1 샘플 세트는, 제1 부분의 외측의 샘플과 제1 부분의 내측의 샘플을 포함하며, 제2 샘플 세트는, 제1 부분 내의 샘플을 포함한다. 도 52b의 중앙의 예는, 제1 파티션의 높이의 4분의 1의 높이의 직사각형 부분을 갖는 직사각형 파티션을 나타낸다. 여기서, 제1 샘플 세트는, 제1 부분의 외측의 샘플과 제1 부분의 내측의 샘플을 포함하며, 제2 샘플 세트는, 제1 부분 내의 샘플을 포함한다. 도 52b의 우측의 예는, 2개의 샘플에 대응하는 높이의 다각형 부분을 갖는 삼각형 파티션을 나타낸다. 여기서, 제1 샘플 세트는, 제1 부분의 외측의 샘플과 제1 부분의 내측의 샘플을 포함하며, 제2 샘플 세트는, 제1 부분 내의 샘플을 포함한다.
제1 부분은, 인접 파티션과 겹치는 제1 파티션의 부분이어도 된다. 도 52c는, 인접 파티션의 일부와 겹치는 제1 파티션의 일부인 제1 파티션의 제1 부분을 나타내는 개념도이다. 설명을 간단하게 하기 위해, 공간적으로 인접하는 직사각형 파티션과 겹치는 부분을 갖는 직사각형 파티션이 나타나 있다. 삼각형 파티션 등의 다른 형상을 갖는 파티션이 사용되어도 되고, 겹치는 부분은, 공간적으로 또는 시간적으로 인접하는 파티션과 겹쳐져 있어도 된다.
또, 인터 예측을 사용하여 2개의 파티션 각각에 대해 예측 화상을 생성하는 예가 나타나 있는데, 인트라 예측을 사용하여 적어도 하나의 파티션에 대해 예측 화상이 생성되어도 된다.
도 53은, 트라이앵글 모드의 일례를 나타내는 플로차트이다.
트라이앵글 모드에서는, 우선, 인터 예측부(126)는, 커런트 블록을 제1 파티션과 제2 파티션으로 분할한다(단계 Sx_1). 이 때, 인터 예측부(126)는, 각 파티션으로의 분할에 관한 정보인 파티션 정보를 예측 파라미터로서 스트림에 부호화해도 된다. 즉, 인터 예측부(126)는, 예측 파라미터 생성부(130)를 통해, 파티션 정보를 예측 파라미터로서 엔트로피 부호화부(110)에 출력해도 된다.
다음에, 인터 예측부(126)는, 우선, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 부호화 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Sx_2). 즉, 인터 예측부(126)는, 후보 MV 리스트를 작성한다.
그리고, 인터 예측부(126)는, 단계 Sx_2에서 취득된 복수의 후보 MV 중에서, 제1 파티션의 후보 MV 및 제2 파티션의 후보 MV를, 제1 MV 및 제2 MV로서 각각 선택한다(단계 Sx_3). 이 때, 인터 예측부(126)는, 선택된 후보 MV를 식별하기 위한 MV 선택 정보를 예측 파라미터로서 스트림에 부호화해도 된다. 즉, 인터 예측부(126)는, 예측 파라미터 생성부(130)를 통해, MV 선택 정보를 예측 파라미터로서 엔트로피 부호화부(110)에 출력해도 된다.
다음에, 인터 예측부(126)는, 그 선택된 제1 MV와 부호화 완료 참조 픽처를 사용하여 움직임 보상을 행함으로써, 제1 예측 화상을 생성한다(단계 Sx_4). 마찬가지로, 인터 예측부(126)는, 선택된 제2 MV와 부호화 완료 참조 픽처를 사용하여 움직임 보상을 행함으로써, 제2 예측 화상을 생성한다(단계 Sx_5).
마지막으로, 인터 예측부(126)는, 제1 예측 화상과 제2 예측 화상을 가중 가산함으로써, 커런트 블록의 예측 화상을 생성한다(단계 Sx_6).
또한, 도 52a에 나타내는 예에서는, 제1 파티션 및 제2 파티션은 각각 삼각형인데, 사다리꼴이어도 되고, 각각 서로 상이한 형상이어도 된다. 또한, 도 52a에 나타내는 예에서는, 커런트 블록이 2개의 파티션으로 구성되어 있는데, 3개 이상의 파티션으로 구성되어 있어도 된다.
또, 제1 파티션 및 제2 파티션은 중복되어 있어도 된다. 즉, 제1 파티션 및 제2 파티션은 같은 화소 영역을 포함하고 있어도 된다. 이 경우, 제1 파티션에 있어서의 예측 화상과 제2 파티션에 있어서의 예측 화상을 사용하여 커런트 블록의 예측 화상을 생성해도 된다.
또, 이 예에서는 2개의 파티션 모두 인터 예측으로 예측 화상이 생성되는 예를 나타냈는데, 적어도 하나의 파티션에 대해서 인트라 예측에 의해 예측 화상을 생성해도 된다.
또한, 제1 MV를 선택하기 위한 후보 MV 리스트와 제2 MV를 선택하기 위한 후보 MV 리스트는 상이해도 되고, 같은 후보 MV 리스트여도 된다.
또한, 파티션 정보는, 적어도 커런트 블록을 복수의 파티션으로 분할하는 분할 방향을 나타내는 인덱스를 포함하고 있어도 된다. MV 선택 정보는, 선택된 제1 MV를 나타내는 인덱스 및 선택된 제2 MV를 나타내는 인덱스를 포함하고 있어도 된다. 1개의 인덱스가 복수의 정보를 나타내도 된다. 예를 들면, 파티션 정보의 일부 또는 전체와, MV 선택 정보의 일부 또는 전체를 통합하여 나타내는 1개의 인덱스가 부호화되어도 된다.
[MV 도출>ATMVP 모드]
도 54는, 서브 블록 단위로 MV가 도출되는 ATMVP 모드의 일례를 나타내는 도면이다.
ATMVP 모드는, 머지 모드로 분류되는 모드이다. 예를 들면, ATMVP 모드에서는, 노멀 머지 모드에 사용되는 후보 MV 리스트에, 서브 블록 단위의 후보 MV가 등록된다.
구체적으로는, ATMVP 모드에서는, 우선, 도 54에 나타내는 바와 같이, 커런트 블록의 좌하측에 인접하는 블록의 MV(MV0)에 의해 지정되는 부호화 완료 참조 픽처에 있어서, 그 커런트 블록에 대응지어진 시간 MV 참조 블록이 특정된다. 다음에, 커런트 블록 내에 있어서의 각 서브 블록에 대해서, 그 시간 MV 참조 블록 내의 그 서브 블록에 대응하는 영역의 부호화 시에 사용된 MV를 특정한다. 이와 같이 특정된 MV가, 커런트 블록의 서브 블록의 후보 MV로서 후보 MV 리스트에 포함된다. 이러한 각 서브 블록의 후보 MV가 후보 MV 리스트로부터 선택되는 경우에는, 그 후보 MV를 서브 블록의 MV로서 사용한 움직임 보상이 그 서브 블록에 대해 실행된다. 이로 인해, 각 서브 블록의 예측 화상이 생성된다.
또한, 도 54에 나타내는 예에서는, 주변 MV 참조 블록으로서, 커런트 블록의 좌하측에 인접하는 블록을 사용했는데, 그 이외의 블록을 사용해도 된다. 또, 서브 블록의 사이즈는, 4×4 화소여도 되고, 8×8 화소여도 되고, 그 이외의 사이즈여도 된다. 서브 블록의 사이즈는, 슬라이스, 브릭, 또는 픽처 등의 단위로 전환되어도 된다.
[움직임 탐색>DMVR]
도 55는, 머지 모드 및 DMVR의 관계를 나타내는 도면이다.
인터 예측부(126)는, 머지 모드로 커런트 블록의 MV를 도출한다(단계 Sl_1). 다음에, 인터 예측부(126)는, MV의 탐색, 즉 움직임 탐색을 행할지 여부를 판정한다(단계 Sl_2). 여기서, 인터 예측부(126)는, 움직임 탐색을 행하지 않는다고 판정하면(단계 Sl_2의 No), 단계 Sl_1에서 도출된 MV를, 커런트 블록에 대한 최종 MV로서 결정한다(단계 Sl_4). 즉, 이 경우에는, 머지 모드로 커런트 블록의 MV가 결정된다.
한편, 단계 Sl_1에서 움직임 탐색을 행한다고 판정하면(단계 Sl_2의 Yes), 인터 예측부(126)는, 단계 Sl_1에서 도출된 MV에 의해 나타내어지는 참조 픽처의 주변 영역을 탐색함으로써, 커런트 블록에 대해 최종 MV를 도출한다(단계 Sl_3). 즉, 이 경우에는, DMVR로 커런트 블록의 MV가 결정된다.
도 56은, MV를 결정하기 위한 DMVR의 일례를 설명하기 위한 개념도이다.
우선, 예를 들면 머지 모드에 있어서, 커런트 블록에 대해 후보 MV(L0 및 L1)를 선택한다. 그리고, 후보 MV(L0)에 따라, L0 리스트의 부호화 완료 픽처인 제1 참조 픽처(L0)로부터 참조 화소를 특정한다. 마찬가지로, 후보 MV(L1)에 따라, L1 리스트의 부호화 완료 픽처인 제2 참조 픽처(L1)로부터 참조 화소를 특정한다. 이들 참조 화소의 평균을 취함으로써 템플릿을 생성한다.
다음에, 그 템플릿을 사용하여, 제1 참조 픽처(L0) 및 제2 참조 픽처(L1)의 후보 MV의 주변 영역을 각각 탐색하고, 코스트가 최소가 되는 MV를, 커런트 블록의 최종적인 MV로서 결정한다. 또한, 코스트는, 예를 들면, 템플릿의 각 화소값과 탐색 영역의 각 화소값의 차분값 및 후보 MV값 등을 사용하여 산출해도 된다.
여기서 설명한 처리 그것이 아니어도, 후보 MV의 주변을 탐색하여 최종적인 MV를 도출할 수 있는 처리이면, 어떠한 처리를 사용해도 된다.
도 57은, MV를 결정하기 위한 DMVR의 다른 일례를 설명하기 위한 개념도이다. 도 57에 나타내는 본 예는, 도 56에 나타내는 DMVR의 일례와는 달리, 템플릿을 생성하지 않고 코스트가 산출된다.
우선, 인터 예측부(126)는, 후보 MV 리스트로부터 취득한 후보 MV인 초기 MV에 의거하여, L0 리스트와 L1 리스트 각각의 참조 픽처에 포함되는 참조 블록 주변을 탐색한다. 예를 들면, 도 57에 나타내는 바와 같이, L0 리스트의 참조 블록에 대응하는 초기 MV는, InitMV_L0이며, L1 리스트의 참조 블록에 대응하는 초기 MV는, InitMV_L1이다. 인터 예측부(126)는, 움직임 탐색에서는, 우선, L0 리스트의 참조 픽처에 대한 탐색 위치를 설정한다. 그 설정되는 탐색 위치를 나타내는 차분 벡터, 구체적으로는, 초기 MV(즉 InitMV_L0)에 의해 나타내어지는 위치로부터 그 탐색 위치로의 차분 벡터는, MVd_L0이다. 그리고, 인터 예측부(126)는, L1 리스트의 참조 픽처에 있어서의 탐색 위치를 결정한다. 이 탐색 위치는, 초기 MV(즉 InitMV_L1)에 의해 나타내어지는 위치로부터 그 탐색 위치로의 차분 벡터에 의해 나타내어진다. 구체적으로는, 인터 예측부(126)는, MVd_L0의 미러링에 의해 그 차분 벡터를 MVd_L1로서 결정한다. 즉, 인터 예측부(126)는, L0 리스트와 L1 리스트 각각의 참조 픽처에 있어서, 초기 MV가 나타내는 위치로부터 대칭이 되는 위치를 탐색 위치로 한다. 인터 예측부(126)는, 탐색 위치마다, 그 탐색 위치에 있어서의 블록 내의 화소값의 차분 절대값의 총합(SAD) 등을 코스트로서 산출하고, 그 코스트가 최소가 되는 탐색 위치를 찾아낸다.
도 58a는, DMVR에 있어서의 움직임 탐색의 일례를 나타내는 도면이고, 도 58b는, 그 움직임 탐색의 일례를 나타내는 플로차트이다.
우선, 인터 예측부(126)는, Step1에서, 초기 MV가 나타내는 탐색 위치(개시점이라고도 한다)와, 그 주위에 있는 8개의 탐색 위치에 있어서의 코스트를 산출한다. 그리고, 인터 예측부(126)는, 개시점 이외의 탐색 위치의 코스트가 최소인지 여부를 판정한다. 여기서, 인터 예측부(126)는, 개시점 이외의 탐색 위치의 코스트가 최소라고 판정하면, 코스트가 최소가 되는 탐색 위치로 이동하여, Step2의 처리를 행한다. 한편, 인터 예측부(126)는, 개시점의 코스트가 최소이면, Step2의 처리를 스킵하여 Step3의 처리를 행한다.
Step2에서는, 인터 예측부(126)는, Step1의 처리 결과에 따라 이동한 탐색 위치를 새로운 개시점으로 하여, Step1의 처리와 동일한 탐색을 행한다. 그리고, 인터 예측부(126)는, 그 개시점 이외의 탐색 위치의 코스트가 최소인지 여부를 판정한다. 여기서, 인터 예측부(126)는, 개시점 이외의 탐색 위치의 코스트가 최소이면, Step4의 처리를 행한다. 한편, 인터 예측부(126)는, 개시점의 코스트가 최소이면, Step3의 처리를 행한다.
Step4에서는, 인터 예측부(126)는, 그 개시점의 탐색 위치를 최종 탐색 위치로서 취급하고, 초기 MV가 나타내는 위치와 그 최종 탐색 위치의 차분을 차분 벡터로서 결정한다.
Step3에서는, 인터 예측부(126)는, Step1 또는 Step2의 개시점의 상하 좌우에 있는 4점에 있어서의 코스트에 의거하여, 코스트가 최소가 되는 소수 정밀도의 화소 위치를 결정하고, 그 화소 위치를 최종 탐색 위치로 한다. 그 소수 정밀도의 화소 위치는, 상하 좌우에 있는 4점의 벡터((0, 1), (0, -1), (-1, 0), (1, 0))를, 그 4점 각각의 탐색 위치에 있어서의 코스트를 가중치로서 가중 가산함으로써 결정된다. 그리고, 인터 예측부(126)는, 초기 MV가 나타내는 위치와 그 최종 탐색 위치의 차분을 차분 벡터로서 결정한다.
[움직임 보상>BIO/OBMC/LIC]
움직임 보상에서는, 예측 화상을 생성하고, 그 예측 화상을 보정하는 모드가 있다. 그 모드는, 예를 들면, 후술하는 BIO, OBMC, 및 LIC이다.
도 59는, 예측 화상의 생성의 일례를 나타내는 플로차트이다.
인터 예측부(126)는, 예측 화상을 생성하고(단계 Sm_1), 상술한 것 중 어느 하나의 모드에 의해 그 예측 화상을 보정한다(단계 Sm_2).
도 60은, 예측 화상의 생성의 다른 예를 나타내는 플로차트이다.
인터 예측부(126)는, 커런트 블록의 MV를 도출한다(단계 Sn_1). 다음에, 인터 예측부(126)는, 그 MV를 사용하여 예측 화상을 생성하고(단계 Sn_2), 보정 처리를 행할지 여부를 판정한다(단계 Sn_3). 여기서, 인터 예측부(126)는, 보정 처리를 행한다고 판정하면(단계 Sn_3의 Yes), 그 예측 화상을 보정함으로써 최종적인 예측 화상을 생성한다(단계 Sn_4). 또한, 후술하는 LIC에서는, 단계 Sn_4에 있어서, 휘도 및 색차가 보정되어도 된다. 한편, 인터 예측부(126)는, 보정 처리를 행하지 않는다고 판정하면(단계 Sn_3의 No), 그 예측 화상을 보정하지 않고 최종적인 예측 화상으로서 출력한다(단계 Sn_5).
[움직임 보상>OBMC]
움직임 탐색에 의해 얻어진 커런트 블록의 움직임 정보뿐만 아니라, 인접 블록의 움직임 정보도 사용하여, 인터 예측 화상이 생성되어도 된다. 구체적으로는, (참조 픽처 내의) 움직임 탐색에 의해 얻어진 움직임 정보에 의거한 예측 화상과, (커런트 픽처 내의) 인접 블록의 움직임 정보에 의거한 예측 화상을 가중 가산함으로써, 커런트 블록 내의 서브 블록 단위로 인터 예측 화상이 생성되어도 된다. 이러한 인터 예측(움직임 보상)은, OBMC(ovulerlapped block motion compensation) 또는 OBMC 모드로 불리는 경우가 있다.
OBMC 모드에서는, OBMC를 위한 서브 블록의 사이즈를 나타내는 정보(예를 들면 OBMC 블록 사이즈로 불린다)는, 시퀀스 레벨에서 신호화되어도 된다. 또한, OBMC 모드를 적용할지 여부를 나타내는 정보(예를 들면 OBMC 플래그로 불린다)는, CU 레벨에서 신호화되어도 된다. 또한, 이들 정보의 신호화의 레벨은, 시퀀스 레벨 및 CU 레벨로 한정될 필요는 없고, 다른 레벨(예를 들면 픽처 레벨, 슬라이스 레벨, 브릭 레벨, CTU 레벨 또는 서브 블록 레벨)이어도 된다.
OBMC 모드에 대해서, 보다 구체적으로 설명한다. 도 61 및 도 62는, OBMC에 의한 예측 화상 보정 처리의 개요를 설명하기 위한 플로차트 및 개념도이다.
우선, 도 62에 나타내는 바와 같이, 커런트 블록에 할당된 MV를 사용하여 통상의 움직임 보상에 의한 예측 화상(Pred)을 취득한다. 도 62에 있어서, 화살표 “MV”는 참조 픽처를 가리키고, 예측 화상을 얻기 위해 커런트 픽처의 커런트 블록이 무엇을 참조하고 있는지를 나타내고 있다.
다음에, 부호화 완료 좌측 인접 블록에 대해 이미 도출된 MV(MV_L)를 커런트 블록에 적용(재이용)하여 예측 화상(Pred_L)을 취득한다. MV(MV_L)는, 커런트 블록으로부터 참조 픽처를 가리키는 화살표 “MV_L”에 의해 나타내어진다. 그리고, 2개의 예측 화상 Pred와 Pred_L를 중첩함으로써 예측 화상의 1회째의 보정을 행한다. 이것은, 인접 블록 간의 경계를 혼합하는 효과를 갖는다.
마찬가지로, 부호화 완료 상측 인접 블록에 대해 이미 도출된 MV(MV_U)를 커런트 블록에 적용(재이용)하여 예측 화상(Pred_U)을 취득한다. MV(MV_U)는, 커런트 블록으로부터 참조 픽처를 가리키는 화살표 “MV_U”에 의해 나타내어진다. 그리고, 예측 화상 Pred_U를 1회째의 보정을 행한 예측 화상(예를 들면, Pred와 Pred_L)에 중첩함으로써 예측 화상의 2회째의 보정을 행한다. 이것은, 인접 블록 간의 경계를 혼합하는 효과를 갖는다. 2회째의 보정에 의해 얻어진 예측 화상은, 인접 블록과의 경계가 혼합된(스무딩된), 커런트 블록의 최종적인 예측 화상이다.
또한, 상술한 예는, 좌측 인접 및 상측 인접의 블록을 사용한 2패스의 보정 방법인데, 그 보정 방법은, 우측 인접 및/또는 하측 인접의 블록도 사용한 3패스 또는 그 이상의 패스의 보정 방법이어도 된다.
또한, 중첩을 행하는 영역은 블록 전체의 화소 영역이 아니라, 블록 경계 근방의 일부의 영역만이어도 된다.
또한, 여기에서는 1매의 참조 픽처로부터, 추가적인 예측 화상 Pred_L 및 Pred_U를 중첩함으로써 1매의 예측 화상 Pred를 얻기 위한 OBMC의 예측 화상 보정 처리에 대해서 설명했다. 그러나, 복수의 참조 화상에 의거하여 예측 화상이 보정되는 경우에는, 동일한 처리가 복수의 참조 픽처 각각에 적용되어도 된다. 이러한 경우, 복수의 참조 픽처에 의거한 OBMC의 화상 보정을 행함으로써, 각각의 참조 픽처로부터, 보정된 예측 화상을 취득한 후에, 그 취득된 복수의 보정 예측 화상을 추가로 중첩함으로써 최종적인 예측 화상을 취득한다.
또한, OBMC에서는, 커런트 블록의 단위는, PU 단위여도 되고, PU를 추가로 분할한 서브 블록 단위여도 된다.
OBMC를 적용할지 여부의 판정 방법으로서, 예를 들면, OBMC를 적용할지 여부를 나타내는 신호인 obmc_flag를 사용하는 방법이 있다. 구체적인 일례로서는, 부호화 장치(100)는, 커런트 블록이 움직임이 복잡한 영역에 속해 있는지 여부를 판정해도 된다. 부호화 장치(100)는, 움직임이 복잡한 영역에 속해 있는 경우는, obmc_flag로서 값 1을 설정하여 OBMC를 적용하여 부호화를 행하고, 움직임이 복잡한 영역에 속해 있지 않은 경우는, obmc_flag로서 값 0을 설정하여 OBMC를 적용하지 않고 블록의 부호화를 행한다. 한편, 복호 장치(200)에서는, 스트림에 기술된 obmc_flag를 복호함으로써, 그 값에 따라 OBMC를 적용할지 여부를 전환하여 복호를 행한다.
[움직임 보상>BIO]
다음에, MV를 도출하는 방법에 대해서 설명한다. 우선, 등속 직선 운동을 가정한 모델에 의거하여 MV를 도출하는 모드에 대해서 설명한다. 이 모드는, BIO(bi-directional optical flow) 모드로 불리는 경우가 있다. 또, 이 bi-directional optical flow는, BIO 대신에, BDOF로 표기되어도 된다.
도 63은, 등속 직선 운동을 가정한 모델을 설명하기 위한 도면이다. 도 63에 있어서, (vx, vy)는, 속도 벡터를 나타내고, τ0, τ1은, 각각, 커런트 픽처(Cur Pic)와 2개의 참조 픽처(Ref0, Ref1) 사이의 시간적인 거리를 나타낸다. (MVx0, MVy0)은, 참조 픽처 Ref0에 대응하는 MV를 나타내고, (MVx1, MVy1)는, 참조 픽처 Ref1에 대응하는 MV를 나타낸다.
이 때 속도 벡터(vx, vy)의 등속 직선 운동의 가정 하에서는, (MVx0, MVy0) 및 (MVx1, MVy1)은, 각각, (vxτ0, vyτ0) 및 (-vxτ1, -vyτ1)로 표시되고, 이하의 옵티컬 플로 등식 (2)가 성립된다.
여기서, I(k)는, 움직임 보상 후의 참조 화상 k(k=0, 1)의 휘도값을 나타낸다. 이 옵티컬 플로 등식은, (i) 휘도값의 시간 미분과, (ii) 수평 방향의 속도 및 참조 화상의 공간 구배의 수평 성분의 곱과, (iii) 수직 방향의 속도 및 참조 화상의 공간 구배의 수직 성분의 곱의 합이, 제로와 같은 것을 나타낸다. 이 옵티컬 플로 등식과 에르미트 보간(Hermite interpolation)의 조합에 의거하여, 후보 MV 리스트 등으로부터 얻어지는 블록 단위의 움직임 벡터가 화소 단위로 보정되어도 된다.
또한, 등속 직선 운동을 가정한 모델에 의거한 움직임 벡터의 도출과는 상이한 방법으로, 복호 장치(200) 측에서 MV가 도출되어도 된다. 예를 들면, 복수의 인접 블록의 MV에 의거하여 서브 블록 단위로 움직임 벡터가 도출되어도 된다.
도 64는, BIO에 따른 인터 예측의 일례를 나타내는 플로차트이다. 또, 도 65는, 그 BIO에 따른 인터 예측을 행하는 인터 예측부(126)의 구성의 일례를 나타내는 도면이다.
도 65에 나타내는 바와 같이, 인터 예측부(126)는, 예를 들면, 메모리(126a)와, 보간 화상 도출부(126b)와, 구배 화상 도출부(126c)와, 옵티컬 플로 도출부(126d)와, 보정값 도출부(126e)와, 예측 화상 보정부(126f)를 구비한다. 또한, 메모리(126a)는, 프레임 메모리(122)여도 된다.
인터 예측부(126)는, 커런트 블록을 포함하는 픽처(Cur Pic)와 상이한 2매의 참조 픽처(Ref0, Ref1)를 사용하여, 2개의 움직임 벡터(M0, M1)를 도출한다. 그리고, 인터 예측부(126)는, 그 2개의 움직임 벡터(M0, M1)를 사용하여 커런트 블록의 예측 화상을 도출한다(단계 Sy_1). 또한, 움직임 벡터 M0은, 참조 픽처 Ref0에 대응하는 움직임 벡터(MVx0, MVy0)이며, 움직임 벡터 M1은, 참조 픽처 Ref1에 대응하는 움직임 벡터(MVx1, MVy1)이다.
다음에, 보간 화상 도출부(126b)는, 메모리(126a)를 참조하여, 움직임 벡터 M0 및 참조 픽처 L0을 사용하여 커런트 블록의 보간 화상 I0을 도출한다. 또, 보간 화상 도출부(126b)는, 메모리(126a)를 참조하여, 움직임 벡터 M1 및 참조 픽처 L1을 사용하여 커런트 블록의 보간 화상 I1을 도출한다(단계 Sy_2). 여기서, 보간 화상 I0은, 커런트 블록에 대해 도출되는, 참조 픽처 Ref0에 포함되는 화상이며, 보간 화상 I1은, 커런트 블록에 대해 도출되는, 참조 픽처 Ref1에 포함되는 화상이다. 보간 화상 I0 및 보간 화상 I1은 각각, 커런트 블록과 같은 사이즈여도 된다. 또는, 보간 화상 I0 및 보간 화상 I1은 각각, 후술하는 구배 화상을 적절하게 도출하기 위해, 커런트 블록보다 큰 화상이어도 된다. 또한, 보간 화상 I0 및 I1은, 움직임 벡터(M0, M1) 및 참조 픽처(L0, L1)와, 움직임 보상 필터를 적용하여 도출된 예측 화상을 포함하고 있어도 된다.
또, 구배 화상 도출부(126c)는, 보간 화상 I0 및 보간 화상 I1로부터, 커런트 블록의 구배 화상(Ix0, Ix1, Iy0, Iy1)을 도출한다(단계 Sy_3). 또한, 수평 방향의 구배 화상은, (Ix0, Ix1)이며, 수직 방향의 구배 화상은, (Iy0, Iy1)이다. 구배 화상 도출부(126c)는, 예를 들면, 보간 화상에 대해 구배 필터를 적용함으로써, 그 구배 화상을 도출해도 된다. 구배 화상은, 수평 방향 또는 수직 방향을 따른 화소값의 공간적인 변화량을 나타내는 것이면 된다.
다음에, 옵티컬 플로 도출부(126d)는, 커런트 블록을 구성하는 복수의 서브 블록 단위로, 보간 화상(I0, I1) 및 구배 화상(Ix0, Ix1, Iy0, Iy1)을 사용하여 상술한 속도 벡터인 옵티컬 플로(vx, vy)를 도출한다(단계 Sy_4). 옵티컬 플로는, 화소의 공간적인 이동량을 보정하는 계수이며, 국소 움직임 추정값, 보정 움직임 벡터, 또는 보정 가중치 벡터로 불려도 된다. 일례로서, 서브 블록은, 4×4 화소의 서브 CU여도 된다. 또한, 옵티컬 플로의 도출은, 서브 블록 단위가 아니라, 화소 단위 등의 다른 단위로 행해져도 된다.
다음에, 인터 예측부(126)는, 옵티컬 플로(vx, vy)를 사용하여 커런트 블록의 예측 화상을 보정한다. 예를 들면, 보정값 도출부(126e)는, 옵티컬 플로(vx, vy)를 사용하여 커런트 블록에 포함되는 화소의 값의 보정값을 도출한다(단계 Sy_5). 그리고, 예측 화상 보정부(126f)는, 보정값을 사용하여 커런트 블록의 예측 화상을 보정해도 된다(단계 Sy_6). 또한, 보정값은 각 화소 단위로 도출되어도 되고, 복수의 화소 단위 또는 서브 블록 단위로 도출되어도 된다.
또한, BIO의 처리 플로는, 도 64에 개시한 처리로 한정되지 않는다. 도 64에 개시한 처리의 일부의 처리만을 실시해도 되고, 상이한 처리를 추가 또는 치환해도 되고, 상이한 처리 순으로 실행해도 된다.
[움직임 보상>LIC]
다음에, LIC(local illumination compensation)를 사용하여 예측 화상(예측)을 생성하는 모드의 일례에 대해서 설명한다.
도 66a는, LIC에 의한 휘도 보정 처리를 사용한 예측 화상 생성 방법의 일례를 설명하기 위한 도면이다. 또, 도 66b는, 그 LIC를 사용한 예측 화상 생성 방법의 일례를 나타내는 플로차트이다.
우선, 인터 예측부(126)는, 부호화 완료 참조 픽처로부터 MV를 도출하고, 커런트 블록에 대응하는 참조 화상을 취득한다(단계 Sz_1).
다음에, 인터 예측부(126)는, 커런트 블록에 대해, 참조 픽처와 커런트 픽처에서 휘도값이 어떻게 변화했는지를 나타내는 정보를 추출한다(단계 Sz_2). 이 추출은, 커런트 픽처에 있어서의 부호화 완료 좌측 인접 참조 영역(주변 참조 영역) 및 부호화 완료 상측 인접 참조 영역(주변 참조 영역)의 휘도 화소값과, 도출된 MV로 지정된 참조 픽처 내의 동등 위치에 있어서의 휘도 화소값에 의거하여 행해진다. 그리고, 인터 예측부(126)는, 휘도값이 어떻게 변화했는지를 나타내는 정보를 사용하여, 휘도 보정 파라미터를 산출한다(단계 Sz_3).
인터 예측부(126)는, MV로 지정된 참조 픽처 내의 참조 화상에 대해 그 휘도 보정 파라미터를 적용하는 휘도 보정 처리를 행함으로써, 커런트 블록에 대한 예측 화상을 생성한다(단계 Sz_4). 즉, MV로 지정된 참조 픽처 내의 참조 화상인 예측 화상에 대해, 휘도 보정 파라미터에 의거한 보정이 행해진다. 이 보정에서는, 휘도가 보정되어도 되고, 색차가 보정되어도 된다. 즉, 색차가 어떻게 변화했는지를 나타내는 정보를 사용하여 색차의 보정 파라미터가 산출되고, 색차의 보정 처리가 행해져도 된다.
또한, 도 66a에 있어서의 주변 참조 영역의 형상은 일례이며, 이 이외의 형상을 사용해도 된다.
또, 여기에서는 1매의 참조 픽처로부터 예측 화상을 생성하는 처리에 대해서 설명했는데, 복수 매의 참조 픽처로부터 예측 화상을 생성하는 경우도 마찬가지이고, 각각의 참조 픽처로부터 취득한 참조 화상에, 상술한 것과 동일한 방법으로 휘도 보정 처리를 행하고 나서 예측 화상을 생성해도 된다.
LIC를 적용할지 여부의 판정 방법으로서, 예를 들면, LIC를 적용할지 여부를 나타내는 신호인 lic_flag를 사용하는 방법이 있다. 구체적인 일례로서는, 부호화 장치(100)에 있어서, 커런트 블록이, 휘도 변화가 발생하고 있는 영역에 속해 있는지 여부를 판정하고, 휘도 변화가 발생하고 있는 영역에 속해 있는 경우는 lic_flag로서 값 1을 설정하여 LIC를 적용하여 부호화를 행하고, 휘도 변화가 발생하고 있는 영역에 속해 있지 않은 경우는 lic_flag로서 값 0을 설정하여 LIC를 적용하지 않고 부호화를 행한다. 한편, 복호 장치(200)에서는, 스트림에 기술된 lic_flag를 복호함으로써, 그 값에 따라 LIC를 적용할지 여부를 전환하여 복호를 행해도 된다.
LIC를 적용할지 여부의 판정의 다른 방법으로서, 예를 들면, 주변 블록에서 LIC를 적용했는지 여부에 따라 판정하는 방법도 있다. 구체적인 일례로서는, 커런트 블록이 머지 모드로 처리되어 있는 경우, 인터 예측부(126)는, 머지 모드에 있어서의 MV의 도출 시에 선택한 주변의 부호화 완료 블록이 LIC를 적용하여 부호화 되었는지 여부를 판정한다. 인터 예측부(126)는, 그 결과에 따라 LIC를 적용할지 여부를 전환하여 부호화를 행한다. 또한, 이 예의 경우에서도, 같은 처리가 복호 장치(200) 측의 처리에 적용된다.
LIC(휘도 보정 처리)에 대해서 도 66a 및 도 66b를 사용하여 설명했는데, 이하, 그 상세를 설명한다.
우선, 인터 예측부(126)는, 부호화 완료 픽처인 참조 픽처로부터 커런트 블록에 대응하는 참조 화상을 취득하기 위한 MV를 도출한다.
다음에, 인터 예측부(126)는, 커런트 블록에 대해, 좌측 인접 및 상측 인접의 부호화 완료 주변 참조 영역의 휘도 화소값과, MV로 지정된 참조 픽처 내의 동등 위치에 있어서의 휘도 화소값을 사용하여, 참조 픽처와 커런트 픽처에서 휘도값이 어떻게 변화했는지를 나타내는 정보를 추출하여 휘도 보정 파라미터를 산출한다. 예를 들면, 커런트 픽처 내의 주변 참조 영역 내의 어느 화소의 휘도 화소값을 p0으로 하고, 당해 화소와 동등 위치의, 참조 픽처 내의 주변 참조 영역 내의 화소의 휘도 화소값을 p1로 한다. 인터 예측부(126)는, 주변 참조 영역 내의 복수의 화소에 대해, A×p1+B=p0을 최적화하는 계수 A 및 B를 휘도 보정 파라미터로서 산출한다.
다음에, 인터 예측부(126)는, MV로 지정된 참조 픽처 내의 참조 화상에 대해 휘도 보정 파라미터를 사용하여 휘도 보정 처리를 행함으로써, 커런트 블록에 대한 예측 화상을 생성한다. 예를 들면, 참조 화상 내의 휘도 화소값을 p2로 하고, 휘도 보정 처리 후의 예측 화상의 휘도 화소값을 p3으로 한다. 인터 예측부(126)는, 참조 화상 내의 각 화소에 대해, A×p2+B=p3을 산출함으로써 휘도 보정 처리 후의 예측 화상을 생성한다.
또한, 도 66a에 나타내는 주변 참조 영역의 일부가 사용되어도 된다. 예를 들면, 상측 인접 화소 및 좌측 인접 화소 각각으로부터 솎아 낸 소정 수의 화소를 포함하는 영역을 주변 참조 영역으로서 사용해도 된다. 또, 주변 참조 영역은, 커런트 블록에 인접하는 영역으로 한정하지 않고, 커런트 블록에 인접하지 않는 영역이어도 된다. 또, 도 66a에 나타내는 예에서는, 참조 픽처 내의 주변 참조 영역은, 커런트 픽처 내의 주변 참조 영역으로부터, 커런트 픽처의 MV로 지정되는 영역인데, 다른 MV로 지정되는 영역이어도 된다. 예를 들면, 당해 다른 MV는, 커런트 픽처 내의 주변 참조 영역의 MV여도 된다.
또한, 여기에서는, 부호화 장치(100)에 있어서의 동작을 설명했는데, 복호 장치(200)에 있어서의 동작도 마찬가지이다.
또한, LIC는 휘도뿐만 아니라, 색차에 적용해도 된다. 이 때, Y, Cb, 및 Cr 각각에 대해 개별적으로 보정 파라미터를 도출해도 되고, 어느 하나에 대해 공통의 보정 파라미터를 사용해도 된다.
또, LIC 처리는 서브 블록 단위로 적용해도 된다. 예를 들면, 커런트 서브 블록의 주변 참조 영역과, 커런트 서브 블록의 MV로 지정된 참조 픽처 내의 참조 서브 블록의 주변 참조 영역을 사용하여 보정 파라미터를 도출해도 된다.
[예측 제어부]
예측 제어부(128)는, 인트라 예측 화상(인트라 예측부(124)로부터 출력되는 화상 또는 신호) 및 인터 예측 화상(인터 예측부(126)로부터 출력되는 화상 또는 신호) 중 어느 하나를 선택하고, 선택한 예측 화상을 감산부(104) 및 가산부(116)에 출력한다.
[예측 파라미터 생성부]
예측 파라미터 생성부(130)는, 인트라 예측, 인터 예측, 및 예측 제어부(128)에 있어서의 예측 화상의 선택 등에 관한 정보를 예측 파라미터로서 엔트로피 부호화부(110)에 출력해도 된다. 엔트로피 부호화부(110)는, 예측 파라미터 생성부(130)로부터 입력되는 그 예측 파라미터, 양자화부(108)로부터 입력되는 양자화 계수에 의거하여, 스트림을 생성해도 된다. 예측 파라미터는 복호 장치(200)에 사용되어도 된다. 복호 장치(200)는, 스트림을 수신하여 복호하고, 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에 있어서 행해지는 예측 처리와 같은 처리를 행해도 된다. 예측 파라미터는, 선택 예측 신호(예를 들면, MV, 예측 타입, 또는, 인트라 예측부(124) 또는 인터 예측부(126)에서 사용된 예측 모드), 또는, 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에 있어서 행해지는 예측 처리에 의거한, 혹은 그 예측 처리를 나타내는, 임의의 인덱스, 플래그, 혹은 값을 포함하고 있어도 된다.
[복호 장치]
다음에, 상기의 부호화 장치(100)로부터 출력된 스트림을 복호 가능한 복호 장치(200)에 대해서 설명한다. 도 67은, 실시 형태에 따른 복호 장치(200)의 구성의 일례를 나타내는 블록도이다. 복호 장치(200)는, 부호화된 화상인 스트림을 블록 단위로 복호하는 장치이다.
도 67에 나타내는 바와 같이, 복호 장치(200)는, 엔트로피 복호부(202)와, 역양자화부(204)와, 역변환부(206)와, 가산부(208)와, 블록 메모리(210)와, 루프 필터부(212)와, 프레임 메모리(214)와, 인트라 예측부(216)와, 인터 예측부(218)와, 예측 제어부(220)와, 예측 파라미터 생성부(222)와, 분할 결정부(224)를 구비한다. 또한, 인트라 예측부(216) 및 인터 예측부(218) 각각은, 예측 처리부의 일부로서 구성되어 있다.
[복호 장치의 실장예]
도 68은, 복호 장치(200)의 실장예를 나타내는 블록도이다. 복호 장치(200)는, 프로세서(b1) 및 메모리(b2)를 구비한다. 예를 들면, 도 67에 나타난 복호 장치(200)의 복수의 구성 요소는, 도 68에 나타난 프로세서(b1) 및 메모리(b2)에 의해 실장된다.
프로세서(b1)는, 정보 처리를 행하는 회로이며, 메모리(b2)에 액세스 가능한 회로이다. 예를 들면, 프로세서(b1)는, 스트림을 복호하는 전용 또는 범용 전자 회로이다. 프로세서(b1)는, CPU와 같은 프로세서여도 된다. 또, 프로세서(b1)는, 복수의 전자 회로의 집합체여도 된다. 또, 예를 들면, 프로세서(b1)는, 도 67 등에 나타난 복호 장치(200)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소를 제외한, 복수의 구성 요소의 역할을 완수해도 된다.
메모리(b2)는, 프로세서(b1)가 스트림을 복호하기 위한 정보가 기억되는 전용 또는 범용 메모리이다. 메모리(b2)는, 전자 회로여도 되고, 프로세서(b1)에 접속되어 있어도 된다. 또, 메모리(b2)는, 프로세서(b1)에 포함되어 있어도 된다. 또, 메모리(b2)는, 복수의 전자 회로의 집합체여도 된다. 또, 메모리(b2)는, 자기 디스크 또는 광 디스크 등이어도 되고, 스토리지 또는 기록 매체 등으로 표현되어도 된다. 또, 메모리(b2)는, 불휘발성 메모리여도 되고, 휘발성 메모리여도 된다.
예를 들면, 메모리(b2)에는, 화상이 기억되어도 되고, 스트림이 기억되어도 된다. 또, 메모리(b2)에는, 프로세서(b1)가 스트림을 복호하기 위한 프로그램이 기억되어 있어도 된다.
또, 예를 들면, 메모리(b2)는, 도 67 등에 나타난 복호 장치(200)의 복수의 구성 요소 중, 정보를 기억하기 위한 구성 요소의 역할을 완수해도 된다. 구체적으로는, 메모리(b2)는, 도 67에 나타난 블록 메모리(210) 및 프레임 메모리(214)의 역할을 완수해도 된다. 보다 구체적으로는, 메모리(b2)에는, 재구성 화상(구체적으로는, 재구성 완료 블록 또는 재구성 완료 픽처 등)이 기억되어도 된다.
또한, 복호 장치(200)에 있어서, 도 67 등에 나타난 복수의 구성 요소 전부가 실장되지 않아도 되고, 상술된 복수의 처리 전부가 행해지지 않아도 된다. 도 67 등에 나타난 복수의 구성 요소의 일부는, 다른 장치에 포함되어 있어도 되고, 상술된 복수의 처리의 일부는, 다른 장치에 의해 실행되어도 된다.
이하, 복호 장치(200)의 전체적인 처리의 흐름을 설명한 후에, 복호 장치(200)에 포함되는 각 구성 요소에 대해서 설명한다. 또한, 복호 장치(200)에 포함되는 각 구성 요소 중, 부호화 장치(100)에 포함되는 구성 요소와 동일한 처리를 행하는 것에 대해서는, 상세한 설명을 생략한다. 예를 들면, 복호 장치(200)에 포함되는, 역양자화부(204), 역변환부(206), 가산부(208), 블록 메모리(210), 프레임 메모리(214), 인트라 예측부(216), 인터 예측부(218), 예측 제어부(220), 및 루프 필터부(212)는, 부호화 장치(100)에 포함되는, 역양자화부(112), 역변환부(114), 가산부(116), 블록 메모리(118), 프레임 메모리(122), 인트라 예측부(124), 인터 예측부(126), 예측 제어부(128), 및 루프 필터부(120)와, 각각 동일한 처리를 행한다.
[복호 처리의 전체 플로]
도 69는, 복호 장치(200)에 의한 전체적인 복호 처리의 일례를 나타내는 플로차트이다.
우선, 복호 장치(200)의 분할 결정부(224)는, 엔트로피 복호부(202)로부터 입력되는 파라미터에 의거하여, 픽처에 포함되는 복수의 고정 사이즈의 블록(128×128 화소) 각각의 분할 패턴을 결정한다(단계 Sp_1). 이 분할 패턴은, 부호화 장치(100)에 의해 선택된 분할 패턴이다. 그리고, 복호 장치(200)는, 그 분할 패턴을 구성하는 복수의 블록 각각에 대해 단계 Sp_2~Sp_6의 처리를 행한다.
엔트로피 복호부(202)는, 커런트 블록의 부호화된 양자화 계수 및 예측 파라미터를 복호(구체적으로는 엔트로피 복호)한다(단계 Sp_2).
다음에, 역양자화부(204) 및 역변환부(206)는, 복수의 양자화 계수에 대해 역양자화 및 역변환을 행함으로써, 그 커런트 블록의 예측 잔차를 복원한다(단계 Sp_3).
다음에, 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)로 이루어지는 예측 처리부는, 커런트 블록의 예측 화상을 생성한다(단계 Sp_4).
다음에, 가산부(208)는, 예측 잔차에 예측 화상을 가산함으로써 커런트 블록을 재구성 화상(복호 화상 블록이라고도 한다)으로 재구성한다(단계 Sp_5).
그리고, 이 재구성 화상이 생성되면, 루프 필터부(212)는, 그 재구성 화상에 대해 필터링을 행한다(단계 Sp_6).
그리고, 복호 장치(200)는, 픽처 전체의 복호가 완료되었는지 여부를 판정하고(단계 Sp_7), 완료되지 않았다고 판정하는 경우(단계 Sp_7의 No), 단계 Sp_1에서부터의 처리를 반복하여 실행한다.
또한, 이들 단계 Sp_1~Sp_7의 처리는, 복호 장치(200)에 의해 시퀀셜하게 행해져도 되고, 그들 처리 중 일부의 복수의 처리가 병렬로 행해져도 되고, 순서가 바뀌어도 된다.
[분할 결정부]
도 70은, 분할 결정부(224)와 다른 구성 요소의 관계를 나타내는 도면이다. 분할 결정부(224)는, 일례로서 이하의 처리를 행해도 된다.
분할 결정부(224)는, 예를 들면, 블록 메모리(210) 또는 프레임 메모리(214)로부터 블록 정보를 수집하고, 또한, 엔트로피 복호부(202)로부터 파라미터를 취득한다. 그리고, 분할 결정부(224)는, 그 블록 정보 및 파라미터에 의거하여 고정 사이즈의 블록의 분할 패턴을 결정해도 된다. 그리고, 분할 결정부(224)는, 그 결정된 분할 패턴을 나타내는 정보를 역변환부(206), 인트라 예측부(216) 및 인터 예측부(218)에 출력해도 된다. 역변환부(206)는, 분할 결정부(224)로부터의 정보에 의해 나타내어지는 분할 패턴에 의거하여 변환 계수에 대해 역변환을 행해도 된다. 인트라 예측부(216) 및 인터 예측부(218)는, 분할 결정부(224)로부터의 정보에 의해 나타내어지는 분할 패턴에 의거하여 예측 화상을 생성해도 된다.
[엔트로피 복호부]
도 71은, 엔트로피 복호부(202)의 구성의 일례를 나타내는 블록도이다.
엔트로피 복호부(202)는, 스트림을 엔트로피 복호함으로써, 양자화 계수, 예측 파라미터, 및 분할 패턴에 관한 파라미터 등을 생성한다. 그 엔트로피 복호에는, 예를 들면, CABAC가 사용된다. 구체적으로는, 엔트로피 복호부(202)는, 예를 들면, 이치 산술 복호부(202a)와, 콘텍스트 제어부(202b)와, 다치화부(202c)를 구비한다. 이치 산술 복호부(202a)는, 콘텍스트 제어부(202b)에 의해 도출된 콘텍스트값을 사용하여 스트림을 이치 신호로 산술 복호한다. 콘텍스트 제어부(202b)는, 부호화 장치(100)의 콘텍스트 제어부(110b)와 마찬가지로, 신택스 요소의 특징 또는 주위의 상황에 따른 콘텍스트값, 즉 이치 신호의 발생 확률을 도출한다. 다치화부(202c)는, 이치 산술 복호부(202a)로부터 출력되는 이치 신호를, 상술한 양자화 계수 등을 나타내는 다치 신호로 변환하는 다치화(debinarize)를 행한다. 이 다치화는, 상술한 이치화의 방식에 따라 행해진다.
엔트로피 복호부(202)는, 블록 단위로 양자화 계수를 역양자화부(204)에 출력한다. 엔트로피 복호부(202)는, 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)에, 스트림(도 1 참조)에 포함되어 있는 예측 파라미터를 출력해도 된다. 인트라 예측부(216), 인터 예측부(218) 및 예측 제어부(220)는, 부호화 장치(100) 측에 있어서의 인트라 예측부(124), 인터 예측부(126) 및 예측 제어부(128)에서 행해지는 처리와 같은 예측 처리를 실행할 수 있다.
[엔트로피 복호부]
도 72는, 엔트로피 복호부(202)에 있어서의 CABAC의 흐름을 나타내는 도면이다.
우선, 엔트로피 복호부(202)에 있어서의 CABAC에서는, 초기화가 행해진다. 이 초기화에서는, 이치 산술 복호부(202a)에 있어서의 초기화와, 초기 콘텍스트값의 설정이 행해진다. 그리고, 이치 산술 복호부(202a) 및 다치화부(202c)는, 예를 들면 CTU의 부호화 데이터에 대해, 산술 복호와 다치화를 실행한다. 이 때, 콘텍스트 제어부(202b)는, 산술 복호가 행해질 때마다 콘텍스트값의 갱신을 행한다. 그리고, 콘텍스트 제어부(202b)는, 후처리로서, 콘텍스트값을 퇴피시킨다. 이 퇴피된 콘텍스트값은, 예를 들면 다음 CTU에 대한 콘텍스트값의 초기값을 위해 사용된다.
[역양자화부]
역양자화부(204)는, 엔트로피 복호부(202)로부터의 입력인 커런트 블록의 양자화 계수를 역양자화한다. 구체적으로는, 역양자화부(204)는, 커런트 블록의 양자화 계수 각각에 대해서, 당해 양자화 계수에 대응하는 양자화 파라미터에 의거하여 당해 양자화 계수를 역양자화한다. 그리고, 역양자화부(204)는, 커런트 블록의 역양자화된 양자화 계수(즉 변환 계수)를 역변환부(206)에 출력한다.
도 73은, 역양자화부(204)의 구성의 일례를 나타내는 블록도이다.
역양자화부(204)는, 예를 들면, 양자화 파라미터 생성부(204a)와, 예측 양자화 파라미터 생성부(204b)와, 양자화 파라미터 기억부(204d)와, 역양자화 처리부(204e)를 구비한다.
도 74는, 역양자화부(204)에 의한 역양자화의 일례를 나타내는 플로차트이다.
역양자화부(204)는, 일례로서, 도 74에 나타내는 플로에 의거하여 CU마다 역양자화 처리를 실시해도 된다. 구체적으로는, 양자화 파라미터 생성부(204a)는, 역양자화를 행할지 여부를 판정한다(단계 Sv_11). 여기서, 역양자화를 행한다고 판정하면(단계 Sv_11의 Yes), 양자화 파라미터 생성부(204a)는, 커런트 블록의 차분 양자화 파라미터를 엔트로피 복호부(202)로부터 취득한다(단계 Sv_12).
다음에, 예측 양자화 파라미터 생성부(204b)는, 커런트 블록과는 상이한 처리 단위의 양자화 파라미터를 양자화 파라미터 기억부(204d)로부터 취득한다(단계 Sv_13). 예측 양자화 파라미터 생성부(204b)는, 그 취득한 양자화 파라미터에 의거하여, 커런트 블록의 예측 양자화 파라미터를 생성한다(단계 Sv_14).
그리고, 양자화 파라미터 생성부(204a)는, 엔트로피 복호부(202)로부터 취득된, 커런트 블록의 차분 양자화 파라미터와, 예측 양자화 파라미터 생성부(204b)에 의해 생성된, 커런트 블록의 예측 양자화 파라미터를 가산한다(단계 Sv_15). 이 가산에 의해, 커런트 블록의 양자화 파라미터가 생성된다. 또, 양자화 파라미터 생성부(204a)는, 그 커런트 블록의 양자화 파라미터를 양자화 파라미터 기억부(204d)에 보관한다(단계 Sv_16).
다음에, 역양자화 처리부(204e)는, 단계 Sv_15에서 생성된 양자화 파라미터를 사용하여 커런트 블록의 양자화 계수를 변환 계수로 역양자화한다(단계 Sv_17).
또한, 차분 양자화 파라미터는, 비트 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨에서 복호되어도 된다. 또, 양자화 파라미터의 초기값을, 시퀀스 레벨, 픽처 레벨, 슬라이스 레벨, 브릭 레벨 또는 CTU 레벨에서 복호해도 된다. 이 때, 양자화 파라미터는 양자화 파라미터의 초기값과 차분 양자화 파라미터를 사용하여 생성되어도 된다.
또한, 역양자화부(204)는 복수의 역양자화기를 구비하고 있어도 되고, 복수의 역양자화 방법으로부터 선택한 역양자화 방법을 사용하여 양자화 계수를 역양자화해도 된다.
[역변환부]
역변환부(206)는, 역양자화부(204)로부터의 입력인 변환 계수를 역변환함으로써 예측 잔차를 복원한다.
예를 들면 스트림으로부터 해독된 정보가 EMT 또는 AMT를 적용하는 것을 나타내는 경우(예를 들면 AMT 플래그가 참), 역변환부(206)는, 해독된 변환 타입을 나타내는 정보에 의거하여 커런트 블록의 변환 계수를 역변환한다.
또 예를 들면, 스트림으로부터 해독된 정보가 NSST를 적용하는 것을 나타내는 경우, 역변환부(206)는, 변환 계수에 역재변환을 적용한다.
도 75는, 역변환부(206)에 의한 처리의 일례를 나타내는 플로차트이다.
예를 들면, 역변환부(206)는, 직교 변환을 행하지 않는 것을 나타내는 정보가 스트림에 존재하는지 여부를 판정한다(단계 St_11). 여기서, 그 정보가 존재하지 않는다고 판정하면(단계 St_11의 No), 역변환부(206)는, 엔트로피 복호부(202)에 의해 복호된, 변환 타입을 나타내는 정보를 취득한다(단계 St_12). 다음에, 역변환부(206)는, 그 정보에 의거하여, 부호화 장치(100)의 직교 변환에 사용된 변환 타입을 결정한다(단계 St_13). 그리고, 역변환부(206)는, 그 결정한 변환 타입을 사용하여 역직교 변환을 행한다(단계 St_14).
도 76은, 역변환부(206)에 의한 처리의 다른 예를 나타내는 플로차트이다.
예를 들면, 역변환부(206)는, 변환 사이즈가 소정값 이하인지 여부를 판정한다(단계 Su_11). 여기서, 소정값 이하라고 판정하면(단계 Su_11의 Yes), 역변환부(206)는, 제1 변환 타입군에 포함되는 하나 이상의 변환 타입 중, 어느 변환 타입이 부호화 장치(100)에 의해 사용되었는지를 나타내는 정보를 엔트로피 복호부(202)로부터 취득한다(단계 Su_12). 또한, 이러한 정보는, 엔트로피 복호부(202)에 의해 복호되어 역변환부(206)에 출력된다.
역변환부(206)는, 그 정보에 의거하여, 부호화 장치(100)에 있어서의 직교 변환에 사용된 변환 타입을 결정한다(단계 Su_13). 그리고, 역변환부(206)는, 그 결정한 변환 타입을 사용하여 커런트 블록의 변환 계수를 역직교 변환한다(단계 Su_14). 한편, 역변환부(206)는, 단계 Su_11에 있어서, 변환 사이즈가 소정값 이하가 아니라고 판정하면(단계 Su_11의 No), 제2 변환 타입군을 사용하여 커런트 블록의 변환 계수를 역직교 변환한다(단계 Su_15).
또한, 역변환부(206)에 의한 역직교 변환은, 일례로서 TU마다 도 75 또는 도 76에 나타내는 플로에 따라 실시되어도 된다. 또, 직교 변환에 사용한 변환 타입을 나타내는 정보를 복호하지 않고, 미리 규정된 변환 타입을 사용하여 역직교 변환을 행해도 된다. 또, 변환 타입은, 구체적으로는 DST7 또는 DCT8 등이며, 역직교 변환에서는, 그 변환 타입에 대응하는 역변환 기저 함수가 사용된다.
[가산부]
가산부(208)는, 역변환부(206)로부터의 입력인 예측 잔차와 예측 제어부(220)로부터의 입력인 예측 화상을 가산함으로써 커런트 블록을 재구성한다. 즉, 커런트 블록의 재구성 화상이 생성된다. 그리고, 가산부(208)는, 커런트 블록의 재구성 화상을 블록 메모리(210) 및 루프 필터부(212)에 출력한다.
[블록 메모리]
블록 메모리(210)는, 인트라 예측에서 참조되는 블록으로서, 커런트 픽처 내의 블록을 보관하기 위한 기억부이다. 구체적으로는, 블록 메모리(210)는, 가산부(208)로부터 출력된 재구성 화상을 보관한다.
[루프 필터부]
루프 필터부(212)는, 가산부(208)에 의해 생성된 재구성 화상에 루프 필터링을 실시하고, 필터링이 실시된 재구성 화상을 프레임 메모리(214) 및 표시 장치 등에 출력한다.
스트림으로부터 해독된 ALF의 온/오프를 나타내는 정보가 ALF의 온을 나타내는 경우, 국소적인 구배의 방향 및 활성도에 의거하여 복수의 필터 중에서 1개의 필터가 선택되고, 선택된 필터가 재구성 화상에 적용된다.
도 77은, 루프 필터부(212)의 구성의 일례를 나타내는 블록도이다. 또한, 루프 필터부(212)는, 부호화 장치(100)의 루프 필터부(120)와 동일한 구성을 갖는다.
루프 필터부(212)는, 예를 들면 도 77에 나타내는 바와 같이, 디블로킹·필터 처리부(212a)와, SAO 처리부(212b)와, ALF 처리부(212c)를 구비한다. 디블로킹·필터 처리부(212a)는, 재구성 화상에 대해 상술한 디블로킹·필터 처리를 실시한다. SAO 처리부(212b)는, 디블로킹·필터 처리 후의 재구성 화상에 대해 상술한 SAO 처리를 실시한다. 또, ALF 처리부(212c)는, SAO 처리 후의 재구성 화상에 대해 상술한 ALF 처리를 적용한다. 또한, 루프 필터부(212)는, 도 77에 개시한 모든 처리부를 구비하지 않아도 되고, 일부의 처리부만을 구비하고 있어도 된다. 또, 루프 필터부(212)는, 도 77에 개시한 처리 순과는 상이한 순서로 상술한 각 처리를 행하는 구성이어도 된다.
[프레임 메모리]
프레임 메모리(214)는, 인터 예측에 사용되는 참조 픽처를 보관하기 위한 기억부이며, 프레임 버퍼로 불리는 경우도 있다. 구체적으로는, 프레임 메모리(214)는, 루프 필터부(212)에 의해 필터링이 실시된 재구성 화상을 보관한다.
[예측부(인트라 예측부·인터 예측부·예측 제어부)]
도 78은, 복호 장치(200)의 예측부에서 행해지는 처리의 일례를 나타내는 플로차트이다. 또한, 일례로서 예측부는, 인트라 예측부(216), 인터 예측부(218), 및 예측 제어부(220)의 전부 또는 일부의 구성 요소로 이루어진다. 예측 처리부는, 예를 들면 인트라 예측부(216) 및 인터 예측부(218)를 포함한다.
예측부는, 커런트 블록의 예측 화상을 생성한다(단계 Sq_1). 이 예측 화상은, 예측 신호 또는 예측 블록이라고도 한다. 또한, 예측 신호에는, 예를 들면 인트라 예측 신호 또는 인터 예측 신호가 있다. 구체적으로는, 예측부는, 다른 블록에 대한 예측 화상의 생성, 예측 잔차의 복원, 및 예측 화상의 가산이 행해짐으로써 이미 얻어져 있는 재구성 화상을 사용하여, 커런트 블록의 예측 화상을 생성한다. 복호 장치(200)의 예측부는, 부호화 장치(100)의 예측부에 의해 생성되는 예측 화상과 동일한 예측 화상을 생성한다. 즉, 그들 예측부에 사용되는 예측 화상의 생성 방법은, 서로 공통 또는 대응하고 있다.
재구성 화상은, 예를 들면, 참조 픽처의 화상이어도 되고, 커런트 블록을 포함하는 픽처인 커런트 픽처 내의 복호 완료 블록(즉, 상술한 다른 블록)의 화상이어도 된다. 커런트 픽처 내의 복호 완료 블록은, 예를 들면 커런트 블록의 인접 블록이다.
도 79는, 복호 장치(200)의 예측부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
예측부는, 예측 화상을 생성하기 위한 방식 또는 모드를 판정한다(단계 Sr_1). 예를 들면, 이 방식 또는 모드는, 예를 들면 예측 파라미터 등에 의거하여 판정되어도 된다.
예측부는, 예측 화상을 생성하기 위한 모드로서 제1 방식을 판정한 경우에는, 그 제1 방식에 따라 예측 화상을 생성한다(단계 Sr_2a). 또, 예측부는, 예측 화상을 생성하기 위한 모드로서 제2 방식을 판정한 경우에는, 그 제2 방식에 따라 예측 화상을 생성한다(단계 Sr_2b). 또, 예측부는, 예측 화상을 생성하기 위한 모드로서 제3 방식을 판정한 경우에는, 그 제3 방식에 따라 예측 화상을 생성한다(단계 Sr_2c).
제1 방식, 제2 방식, 및 제3 방식은, 예측 화상을 생성하기 위한 서로 상이한 방식이며, 각각 예를 들면, 인터 예측 방식, 인트라 예측 방식, 및, 그들 이외의 예측 방식이어도 된다. 이들 예측 방식에서는, 상술한 재구성 화상을 사용해도 된다.
도 80a 및 도 80b는, 복호 장치(200)의 예측부에서 행해지는 처리의 다른 예를 나타내는 플로차트이다.
예측부는, 일례로서 도 80a 및 도 80b에 나타내는 플로에 따라 예측 처리를 행해도 된다. 또한, 도 80a 및 도 80b에 나타내는 인트라 블록 카피는, 인터 예측에 속하는 1개의 모드로서, 커런트 픽처에 포함되는 블록이 참조 화상 또는 참조 블록으로서 참조되는 모드이다. 즉, 인트라 블록 카피에서는, 커런트 픽처와 상이한 픽처는 참조되지 않는다. 또, 도 80a에 나타내는 PCM 모드는, 인트라 예측에 속하는 1개의 모드로서, 변환 및 양자화가 행해지지 않는 모드이다.
[인트라 예측부]
인트라 예측부(216)는, 스트림으로부터 해독된 인트라 예측 모드에 의거하여, 블록 메모리(210)에 보관된 커런트 픽처 내의 블록을 참조하여 인트라 예측을 행함으로써, 커런트 블록의 예측 화상(즉 인트라 예측 화상)을 생성한다. 구체적으로는, 인트라 예측부(216)는, 커런트 블록에 인접하는 블록의 화소값(예를 들면 휘도값, 색차값)을 참조하여 인트라 예측을 행함으로써 인트라 예측 화상을 생성하고, 인트라 예측 화상을 예측 제어부(220)에 출력한다.
또한, 색차 블록의 인트라 예측에 있어서 휘도 블록을 참조하는 인트라 예측 모드가 선택되어 있는 경우는, 인트라 예측부(216)는, 커런트 블록의 휘도 성분에 의거하여, 커런트 블록의 색차 성분을 예측해도 된다.
또, 스트림으로부터 해독된 정보가 PDPC의 적용을 나타내는 경우, 인트라 예측부(216)는, 수평/수직 방향의 참조 화소의 구배에 의거하여 인트라 예측 후의 화소값을 보정한다.
도 81은, 복호 장치(200)의 인트라 예측부(216)에 의한 처리의 일례를 나타내는 도면이다.
인트라 예측부(216)는, 우선, 1을 나타내는 MPM 플래그가 스트림에 존재하는지 여부를 판정한다(단계 Sw_11). 여기서, 1을 나타내는 MPM 플래그가 존재한다고 판정하면(단계 Sw_11의 Yes), 인트라 예측부(216)는, MPM 중, 부호화 장치(100)에 있어서 선택된 인트라 예측 모드를 나타내는 정보를 엔트로피 복호부(202)로부터 취득한다(단계 Sw_12). 또한, 그 정보는, 엔트로피 복호부(202)에 의해 복호되어 인트라 예측부(216)에 출력된다. 다음에, 인트라 예측부(216)는, MPM을 결정한다(단계 Sw_13). MPM은, 예를 들면 6개의 인트라 예측 모드로 이루어진다. 그리고, 인트라 예측부(216)는, 그 MPM에 포함되는 복수의 인트라 예측 모드 중에서, 단계 Sw_12에서 취득된 정보에 의해 나타내어지는 인트라 예측 모드를 결정한다(단계 Sw_14).
한편, 인트라 예측부(216)는, 단계 Sw_11에 있어서, 1을 나타내는 MPM 플래그가 스트림에 존재하지 않는다고 판정하면(단계 Sw_11의 No), 부호화 장치(100)에 있어서 선택된 인트라 예측 모드를 나타내는 정보를 취득한다(단계 Sw_15). 즉, 인트라 예측부(216)는, MPM에 포함되지 않는 하나 이상의 인트라 예측 모드 중, 부호화 장치(100)에 있어서 선택된 인트라 예측 모드를 나타내는 정보를 엔트로피 복호부(202)로부터 취득한다. 또한, 그 정보는, 엔트로피 복호부(202)에 의해 복호되어 인트라 예측부(216)에 출력된다. 그리고, 인트라 예측부(216)는, 그 MPM에 포함되지 않은 하나 이상의 인트라 예측 모드 중에서, 단계 Sw_15에서 취득된 정보에 의해 나타내어지는 인트라 예측 모드를 결정한다(단계 Sw_17).
인트라 예측부(216)는, 단계 Sw_14 또는 단계 Sw_17에 있어서 결정된 인트라 예측 모드에 따라 예측 화상을 생성한다(단계 Sw_18).
[인터 예측부]
인터 예측부(218)는, 프레임 메모리(214)에 보관된 참조 픽처를 참조하여, 커런트 블록을 예측한다. 예측은, 커런트 블록 또는 커런트 블록 내의 서브 블록의 단위로 행해진다. 또한, 서브 블록은 블록에 포함되어 있어, 블록보다 작은 단위이다. 서브 블록의 사이즈는, 4×4 화소여도 되고, 8×8 화소여도 되고, 그 이외의 사이즈여도 된다. 서브 블록의 사이즈는, 슬라이스, 브릭, 또는 픽처 등의 단위로 전환되어도 된다.
예를 들면, 인터 예측부(218)는, 스트림(예를 들면, 엔트로피 복호부(202)로부터 출력되는 예측 파라미터)으로부터 해독된 움직임 정보(예를 들면 MV)를 사용하여 움직임 보상을 행함으로써 커런트 블록 또는 서브 블록의 인터 예측 화상을 생성하고, 인터 예측 화상을 예측 제어부(220)에 출력한다.
스트림으로부터 해독된 정보가 OBMC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 움직임 탐색에 의해 얻어진 커런트 블록의 움직임 정보뿐만 아니라, 인접 블록의 움직임 정보도 사용하여, 인터 예측 화상을 생성한다.
또, 스트림으로부터 해독된 정보가 FRUC 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 스트림으로부터 해독된 패턴 매칭의 방법(바이래터럴 매칭 또는 템플릿 매칭)에 따라 움직임 탐색을 행함으로써 움직임 정보를 도출한다. 그리고, 인터 예측부(218)는, 도출된 움직임 정보를 사용하여 움직임 보상(예측)을 행한다.
또, 인터 예측부(218)는, BIO 모드가 적용되는 경우에, 등속 직선 운동을 가정한 모델에 의거하여 MV를 도출한다. 또, 스트림으로부터 해독된 정보가 아핀 모드를 적용하는 것을 나타내는 경우에는, 인터 예측부(218)는, 복수의 인접 블록의 MV에 의거하여 서브 블록 단위로 MV를 도출한다.
[MV 도출의 플로]
도 82는, 복호 장치(200)에 있어서의 MV 도출의 일례를 나타내는 플로차트이다.
인터 예측부(218)는, 예를 들면, 움직임 정보(예를 들면 MV)를 복호할지 여부를 판정한다. 예를 들면, 인터 예측부(218)는, 스트림에 포함되는 예측 모드에 따라 판정해도 되고, 스트림에 포함되는 그 외의 정보에 의거하여 판정해도 된다. 여기서, 인터 예측부(218)는, 움직임 정보를 복호한다고 판정하면, 그 움직임 정보를 복호하는 모드로, 커런트 블록의 MV를 도출한다. 한편, 인터 예측부(218)는, 움직임 정보를 복호하지 않는다고 판정하면, 움직임 정보를 복호하지 않는 모드로 MV를 도출한다.
여기서, MV 도출의 모드에는, 후술하는 노멀 인터 모드, 노멀 머지 모드, FRUC 모드 및 아핀 모드 등이 있다. 이들 모드 중, 움직임 정보를 복호하는 모드에는, 노멀 인터 모드, 노멀 머지 모드, 및 아핀 모드(구체적으로는, 아핀 인터 모드 및 아핀 머지 모드) 등이 있다. 또한, 움직임 정보에는, MV뿐만 아니라, 후술하는 예측 MV 선택 정보가 포함되어도 된다. 또, 움직임 정보를 복호하지 않는 모드에는, FRUC 모드 등이 있다. 인터 예측부(218)는, 이들 복수의 모드로부터, 커런트 블록의 MV를 도출하기 위한 모드를 선택하고, 그 선택된 모드를 사용하여 커런트 블록의 MV를 도출한다.
도 83은, 복호 장치(200)에 있어서의 MV 도출의 다른 예를 나타내는 플로차트이다.
인터 예측부(218)는, 예를 들면, 차분 MV를 복호할지 여부를 판정한다. 예를 들면, 인터 예측부(218)는, 스트림에 포함되는 예측 모드에 따라 판정해도 되고, 스트림에 포함되는 그 외의 정보에 의거하여 판정해도 된다. 여기서, 인터 예측부(218)는, 차분 MV를 복호한다고 판정하면, 차분 MV를 복호하는 모드로, 커런트 블록의 MV를 도출해도 된다. 이 경우, 예를 들면 스트림에 포함되는 차분 MV가 예측 파라미터로서 복호된다.
한편, 인터 예측부(218)는, 차분 MV를 복호하지 않는다고 판정하면, 차분 MV를 복호하지 않는 모드로 MV를 도출한다. 이 경우에는, 부호화된 차분 MV는 스트림에 포함되지 않는다.
여기서, 상술한 바와 같이 MV의 도출의 모드에는, 후술하는 노멀 인터, 노멀 머지 모드, FRUC 모드 및 아핀 모드 등이 있다. 이들 모드 중, 차분 MV를 부호화하는 모드에는, 노멀 인터 모드 및 아핀 모드(구체적으로는, 아핀 인터 모드) 등이 있다. 또, 차분 MV를 부호화하지 않는 모드에는, FRUC 모드, 노멀 머지 모드 및 아핀 모드(구체적으로는, 아핀 머지 모드) 등이 있다. 인터 예측부(218)는, 이들 복수의 모드로부터, 커런트 블록의 MV를 도출하기 위한 모드를 선택하고, 그 선택된 모드를 사용하여 커런트 블록의 MV를 도출한다.
[MV 도출>노멀 인터 모드]
예를 들면, 스트림으로부터 해독된 정보가 노멀 인터 모드를 적용하는 것을 나타내는 경우, 인터 예측부(218)는, 스트림으로부터 해독된 정보에 의거하여, 노멀 머지 모드로 MV를 도출하고, 그 MV를 사용하여 움직임 보상(예측)을 행한다.
도 84는, 복호 장치(200)에 있어서의 노멀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
복호 장치(200)의 인터 예측부(218)는, 블록마다, 그 블록에 대해 움직임 보상을 행한다. 이 때에는, 인터 예측부(218)는, 우선, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 복호 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Sg_11). 즉, 인터 예측부(218)는, 후보 MV 리스트를 작성한다.
다음에, 인터 예측부(218)는, 단계 Sg_11에서 취득된 복수의 후보 MV 중에서, N개(N은 2 이상의 정수)의 후보 MV 각각을 예측 움직임 벡터 후보(예측 MV 후보라고도 한다)로서, 미리 결정된 우선 순위에 따라 추출한다(단계 Sg_12). 또한, 그 우선 순위는, N개의 예측 MV 후보 각각에 대해 미리 정해져 있다.
다음에, 인터 예측부(218)는, 입력된 스트림으로부터 예측 MV 선택 정보를 복호하고, 그 복호된 예측 MV 선택 정보를 사용하여, 그 N개의 예측 MV 후보 중에서 1개의 예측 MV 후보를, 커런트 블록의 예측 MV로서 선택한다(단계 Sg_13).
다음에, 인터 예측부(218)는, 입력된 스트림으로부터 차분 MV를 복호하고, 그 복호된 차분 MV인 차분값과, 선택된 예측 MV를 가산함으로써, 커런트 블록의 MV를 도출한다(단계 Sg_14).
마지막으로, 인터 예측부(218)는, 그 도출된 MV와 복호 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Sg_15). 단계 Sg_11~Sg_15의 처리는, 각 블록에 대해 실행된다. 예를 들면, 슬라이스에 포함되는 모든 블록 각각에 대해 단계 Sg_11~Sg_15의 처리가 실행되면, 그 슬라이스에 대한 노멀 인터 모드를 사용한 인터 예측이 종료된다. 또, 픽처에 포함되는 모든 블록 각각에 대해 단계 Sg_11~Sg_15의 처리가 실행되면, 그 픽처에 대한 노멀 인터 모드를 사용한 인터 예측이 종료된다. 또한, 단계 Sg_11~Sg_15의 처리는, 슬라이스에 포함되는 모든 블록에 대해 실행되지 않고, 일부의 블록에 대해 실행되면, 그 슬라이스에 대한 노멀 인터 모드를 사용한 인터 예측이 종료되어도 된다. 단계 Sg_11~Sg_15의 처리는, 마찬가지로, 픽처에 포함되는 일부의 블록에 대해 실행되면, 그 픽처에 대한 노멀 인터 모드를 사용한 인터 예측이 종료되어도 된다.
[MV 도출>노멀 머지 모드]
예를 들면, 스트림으로부터 해독된 정보가 노멀 머지 모드의 적용을 나타내는 경우, 인터 예측부(218)는, 노멀 머지 모드로 MV를 도출하고, 그 MV를 사용하여 움직임 보상(예측)을 행한다.
도 85는, 복호 장치(200)에 있어서의 노멀 머지 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
인터 예측부(218)는, 우선, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 복호 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Sh_11). 즉, 인터 예측부(218)는, 후보 MV 리스트를 작성한다.
다음에, 인터 예측부(218)는, 단계 Sh_11에서 취득된 복수의 후보 MV 중에서 1개의 후보 MV를 선택함으로써, 커런트 블록의 MV를 도출한다(단계 Sh_12). 구체적으로는, 인터 예측부(218)는, 예를 들면 스트림에 예측 파라미터로서 포함되는 MV 선택 정보를 취득하고, 그 MV 선택 정보에 의해 식별되는 후보 MV를, 커런트 블록의 MV로서 선택한다.
마지막으로, 인터 예측부(218)는, 그 도출된 MV와 복호 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Sh_13). 단계 Sh_11~Sh_13의 처리는 예를 들면 각 블록에 대해 실행된다. 예를 들면, 슬라이스에 포함되는 모든 블록 각각에 대해 단계 Sh_11~Sh_13의 처리가 실행되면, 그 슬라이스에 대한 노멀 머지 모드를 사용한 인터 예측이 종료된다. 또, 픽처에 포함되는 모든 블록 각각에 대해 단계 Sh_11~Sh_13의 처리가 실행되면, 그 픽처에 대한 노멀 머지 모드를 사용한 인터 예측이 종료된다. 또한, 단계 Sh_11~Sh_13의 처리는, 슬라이스에 포함되는 모든 블록에 대해 실행되지 않고, 일부의 블록에 대해 실행되면, 그 슬라이스에 대한 노멀 머지 모드를 사용한 인터 예측이 종료되어도 된다. 단계 Sh_11~Sh_13의 처리는, 마찬가지로, 픽처에 포함되는 일부의 블록에 대해 실행되면, 그 픽처에 대한 노멀 머지 모드를 사용한 인터 예측이 종료되어도 된다.
[MV 도출>FRUC 모드]
예를 들면, 스트림으로부터 해독된 정보가 FRUC 모드의 적용을 나타내는 경우, 인터 예측부(218)는, FRUC 모드로 MV를 도출하고, 그 MV를 사용하여 움직임 보상(예측)을 행한다. 이 경우, 움직임 정보는, 부호화 장치(100) 측으로부터 신호화되지 않고, 복호 장치(200) 측에서 도출된다. 예를 들면, 복호 장치(200)는, 움직임 탐색을 행함으로써 움직임 정보를 도출해도 된다. 이 경우, 복호 장치(200)는, 커런트 블록의 화소값을 사용하지 않고 움직임 탐색을 행한다.
도 86은, 복호 장치(200)에 있어서의 FRUC 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
우선, 인터 예측부(218)는, 커런트 블록에 공간적 또는 시간적으로 인접하는 각 복호 완료 블록의 MV를 참조하여, 그들 MV를 후보 MV로서 나타내는 리스트(즉, 후보 MV 리스트로서, 노멀 머지 모드의 후보 MV 리스트와 공통이어도 된다)를 생성한다(단계 Si_11). 다음에, 인터 예측부(218)는, 후보 MV 리스트에 등록되어 있는 복수의 후보 MV 중에서 베스트 후보 MV를 선택한다(단계 Si_12). 예를 들면, 인터 예측부(218)는, 후보 MV 리스트에 포함되는 각 후보 MV의 평가값을 산출하고, 그 평가값에 의거하여 1개의 후보 MV를 베스트 후보 MV로서 선택한다. 그리고, 인터 예측부(218)는, 선택된 베스트 후보 MV에 의거하여, 커런트 블록을 위한 MV를 도출한다(단계 Si_14). 구체적으로는, 예를 들면, 선택된 베스트 후보 MV가 그대로 커런트 블록을 위한 MV로서 도출된다. 또 예를 들면, 선택된 베스트 후보 MV에 대응하는 참조 픽처 내의 위치의 주변 영역에 있어서, 패턴 매칭을 행함으로써, 커런트 블록을 위한 MV가 도출되어도 된다. 즉, 베스트 후보 MV의 주변의 영역에 대해, 참조 픽처에 있어서의 패턴 매칭 및 평가값을 사용한 탐색을 행하고, 더 평가값이 좋은 값이 되는 MV가 있었을 경우는, 베스트 후보 MV를 그 MV로 갱신하고, 그것을 커런트 블록의 최종적인 MV로 해도 된다. 보다 좋은 평가값을 갖는 MV로의 갱신을 실시하지 않아도 된다.
마지막으로, 인터 예측부(218)는, 그 도출된 MV와 복호 완료 참조 픽처를 사용하여 커런트 블록에 대해 움직임 보상을 행함으로써, 그 커런트 블록의 예측 화상을 생성한다(단계 Si_15). 단계 Si_11~Si_15의 처리는 예를 들면 각 블록에 대해 실행된다. 예를 들면, 슬라이스에 포함되는 모든 블록 각각에 대해 단계 Si_11~Si_15의 처리가 실행되면, 그 슬라이스에 대한 FRUC 모드를 사용한 인터 예측이 종료된다. 또, 픽처에 포함되는 모든 블록 각각에 대해 단계 Si_11~Si_15의 처리가 실행되면, 그 픽처에 대한 FRUC 모드를 사용한 인터 예측이 종료된다. 서브 블록 단위에서도 상술한 블록 단위와 동일하게 처리되어도 된다.
[MV 도출>아핀 머지 모드]
예를 들면, 스트림으로부터 해독된 정보가 아핀 머지 모드의 적용을 나타내는 경우, 인터 예측부(218)는, 아핀 머지 모드로 MV를 도출하고, 그 MV를 사용하여 움직임 보상(예측)을 행한다.
도 87은, 복호 장치(200)에 있어서의 아핀 머지 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
아핀 머지 모드에서는, 우선, 인터 예측부(218)는, 커런트 블록의 제어 포인트 각각의 MV를 도출한다(단계 Sk_11). 제어 포인트는, 도 46a에 나타내는 바와 같이, 커런트 블록의 좌상각 및 우상각의 포인트, 혹은 도 46b에 나타내는 바와 같이, 커런트 블록의 좌상각, 우상각 및 좌하각의 포인트이다.
예를 들면, 도 47a~도 47c에 나타내는 MV의 도출 방법을 사용하는 경우, 인터 예측부(218)는, 도 47a에 나타내는 바와 같이, 복호 완료 블록 A(좌측), 블록 B(상측), 블록 C(우상측), 블록 D(좌하측) 및 블록 E(좌상측)의 순서로 이들 블록을 검사하고, 아핀 모드로 복호된 최초의 유효한 블록을 특정한다.
인터 예측부(218)는, 특정된 아핀 모드로 복호된 최초의 유효한 블록을 사용하여, 제어 포인트의 MV를 도출한다. 예를 들면, 블록 A가 특정되어, 블록 A가 2개의 제어 포인트를 갖는 경우, 도 47b에 나타내는 바와 같이, 인터 예측부(218)는, 블록 A를 포함하는 복호 완료 블록의 좌상각 및 우상각의 움직임 벡터 v3 및 v4를 커런트 블록에 투영함으로써, 커런트 블록의 좌상각 제어 포인트의 움직임 벡터 v0과, 우상각 제어 포인트의 움직임 벡터 v1을 산출한다. 이로 인해, 각 제어 포인트의 MV가 도출된다.
또한, 도 49a에 나타내는 바와 같이, 블록 A가 특정되어, 블록 A가 2개의 제어 포인트를 갖는 경우에, 3개의 제어 포인트의 MV를 산출해도 되고, 도 49b에 나타내는 바와 같이, 블록 A가 특정되어, 블록 A가 3개의 제어 포인트를 갖는 경우에, 2개의 제어 포인트의 MV를 산출해도 된다.
또, 스트림에 예측 파라미터로서 MV 선택 정보가 포함되어 있는 경우에는, 인터 예측부(218)는, 그 MV 선택 정보를 사용하여 커런트 블록의 각 제어 포인트의 MV를 도출해도 된다.
다음에, 인터 예측부(218)는, 커런트 블록에 포함되는 복수의 서브 블록 각각에 대해서, 움직임 보상을 행한다. 즉, 인터 예측부(218)는, 그 복수의 서브 블록 각각에 대해서, 2개의 움직임 벡터 v0 및 v1과 상술한 식 (1A)를 사용하여, 혹은 3개의 움직임 벡터 v0, v1 및 v2와 상술한 식 (1B)를 사용하여, 그 서브 블록의 MV를 아핀 MV로서 산출한다(단계 Sk_12). 그리고, 인터 예측부(218)는, 그들 아핀 MV 및 복호 완료 참조 픽처를 사용하여 그 서브 블록에 대해 움직임 보상을 행한다(단계 Sk_13). 커런트 블록에 포함되는 모든 서브 블록 각각에 대해 단계 Sk_12 및 Sk_13의 처리가 실행되면, 그 커런트 블록에 대한 아핀 머지 모드를 사용한 인터 예측이 종료된다. 즉, 커런트 블록에 대해 움직임 보상이 행해지고, 그 커런트 블록의 예측 화상이 생성된다.
또한, 단계 Sk_11에서는, 상술한 후보 MV 리스트가 생성되어도 된다. 후보 MV 리스트는, 예를 들면, 각 제어 포인트에 대해 복수의 MV 도출 방법을 사용하여 도출한 후보 MV를 포함하는 리스트여도 된다. 복수의 MV 도출 방법은, 도 47a~도 47c에 나타내는 MV의 도출 방법, 도 48a 및 도 48b에 나타내는 MV의 도출 방법, 도 49a 및 도 49b에 나타내는 MV의 도출 방법, 및, 그 외의 MV의 도출 방법의 임의의 조합이어도 된다.
또한, 후보 MV 리스트는, 아핀 모드 이외의, 서브 블록 단위로 예측을 행하는 모드의 후보 MV를 포함해도 된다.
또한, 후보 MV 리스트로서, 예를 들면, 2개의 제어 포인트를 갖는 아핀 머지 모드의 후보 MV와, 3개의 제어 포인트를 갖는 아핀 머지 모드의 후보 MV를 포함하는 후보 MV 리스트를 생성해도 된다. 또는, 2개의 제어 포인트를 갖는 아핀 머지 모드의 후보 MV를 포함하는 후보 MV 리스트와, 3개의 제어 포인트를 갖는 아핀 머지 모드의 후보 MV를 포함하는 후보 MV 리스트를 각각 생성해도 된다. 또는, 2개의 제어 포인트를 갖는 아핀 머지 모드와, 3개의 제어 포인트를 갖는 아핀 머지 모드 중 어느 한쪽 모드의 후보 MV를 포함하는 후보 MV 리스트를 생성해도 된다.
[MV 도출>아핀 인터 모드]
예를 들면, 스트림으로부터 해독된 정보가 아핀 인터 모드의 적용을 나타내는 경우, 인터 예측부(218)는, 아핀 인터 모드로 MV를 도출하고, 그 MV를 사용하여 움직임 보상(예측)을 행한다.
도 88은, 복호 장치(200)에 있어서의 아핀 인터 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
아핀 인터 모드에서는, 우선, 인터 예측부(218)는, 커런트 블록의 2개 또는 3개의 제어 포인트 각각의 예측 MV (v0, v1) 또는 (v0, v1, v2)를 도출한다(단계 Sj_11). 제어 포인트는, 예를 들면 도 46a 또는 도 46b에 나타내는 바와 같이, 커런트 블록의 좌상각, 우상각 혹은 좌하각의 포인트이다.
인터 예측부(218)는, 스트림에 예측 파라미터로서 포함되는 예측 MV 선택 정보를 취득하고, 그 예측 MV 선택 정보에 의해 식별되는 MV를 사용하여, 커런트 블록의 각 제어 포인트의 예측 MV를 도출한다. 예를 들면, 도 48a 및 도 48b에 나타내는 MV의 도출 방법을 사용하는 경우, 인터 예측부(218)는, 도 48a 또는 도 48b에 나타내는 커런트 블록의 각 제어 포인트 근방의 복호 완료 블록 중, 예측 MV 선택 정보에 의해 식별되는 블록의 MV를 선택함으로써, 커런트 블록의 제어 포인트의 예측 MV (v0, v1) 또는 (v0, v1, v2)를 도출한다.
다음에, 인터 예측부(218)는, 예를 들면, 스트림에 예측 파라미터로서 포함되는 각 차분 MV를 취득하고, 커런트 블록의 각 제어 포인트의 예측 MV와, 그 예측 MV에 대응하는 차분 MV를 가산한다(단계 Sj_12). 이로 인해, 커런트 블록의 각 제어 포인트의 MV가 도출된다.
다음에, 인터 예측부(218)는, 커런트 블록에 포함되는 복수의 서브 블록 각각에 대해서, 움직임 보상을 행한다. 즉, 인터 예측부(218)는, 그 복수의 서브 블록 각각에 대해서, 2개의 움직임 벡터 v0 및 v1과 상술한 식 (1A)를 사용하여, 혹은 3개의 움직임 벡터 v0, v1 및 v2와 상술한 식 (1B)를 사용하여, 그 서브 블록의 MV를 아핀 MV로서 산출한다(단계 Sj_13). 그리고, 인터 예측부(218)는, 그들 아핀 MV 및 복호 완료 참조 픽처를 사용하여 그 서브 블록에 대해 움직임 보상을 행한다(단계 Sj_14). 커런트 블록에 포함되는 모든 서브 블록 각각에 대해 단계 Sj_13 및 Sj_14의 처리가 실행되면, 그 커런트 블록에 대한 아핀 머지 모드를 사용한 인터 예측이 종료된다. 즉, 커런트 블록에 대해 움직임 보상이 행해지고, 그 커런트 블록의 예측 화상이 생성된다.
또한, 단계 Sj_11에서는, 단계 Sk_11과 마찬가지로, 상술한 후보 MV 리스트가 생성되어도 된다.
[MV 도출>트라이앵글 모드]
예를 들면, 스트림으로부터 해독된 정보가 트라이앵글 모드의 적용을 나타내는 경우, 인터 예측부(218)는, 트라이앵글 모드로 MV를 도출하고, 그 MV를 사용하여 움직임 보상(예측)을 행한다.
도 89는, 복호 장치(200)에 있어서의 트라이앵글 모드에 의한 인터 예측의 예를 나타내는 플로차트이다.
트라이앵글 모드에서는, 우선, 인터 예측부(218)는, 커런트 블록을 제1 파티션과 제2 파티션으로 분할한다(단계 Sx_11). 이 때, 인터 예측부(218)는, 각 파티션으로의 분할에 관한 정보인 파티션 정보를 예측 파라미터로서 스트림으로부터 취득해도 된다. 그리고, 인터 예측부(218)는, 그 파티션 정보에 따라, 커런트 블록을 제1 파티션과 제2 파티션으로 분할해도 된다.
다음에, 인터 예측부(218)는, 우선, 시간적 또는 공간적으로 커런트 블록의 주위에 있는 복수의 복호 완료 블록의 MV 등의 정보에 의거하여, 그 커런트 블록에 대해 복수의 후보 MV를 취득한다(단계 Sx_12). 즉, 인터 예측부(218)는, 후보 MV 리스트를 작성한다.
그리고, 인터 예측부(218)는, 단계 Sx_11에서 취득된 복수의 후보 MV 중에서, 제1 파티션의 후보 MV 및 제2 파티션의 후보 MV를, 제1 MV 및 제2 MV로서 각각 선택한다(단계 Sx_13). 이 때, 인터 예측부(218)는, 선택된 후보 MV를 식별하기 위한 MV 선택 정보를 예측 파라미터로서 스트림으로부터 취득해도 된다. 그리고, 인터 예측부(218)는, 그 MV 선택 정보에 따라 제1 MV 및 제2 MV를 선택해도 된다.
다음에, 인터 예측부(218)는, 그 선택된 제1 MV와 복호 완료 참조 픽처를 사용하여 움직임 보상을 행함으로써, 제1 예측 화상을 생성한다(단계 Sx_14). 마찬가지로, 인터 예측부(218)는, 선택된 제2 MV와 복호 완료 참조 픽처를 사용하여 움직임 보상을 행함으로써, 제2 예측 화상을 생성한다(단계 Sx_15).
마지막으로, 인터 예측부(218)는, 제1 예측 화상과 제2 예측 화상을 가중 가산함으로써, 커런트 블록의 예측 화상을 생성한다(단계 Sx_16).
[움직임 탐색>DMVR]
예를 들면, 스트림으로부터 해독된 정보가 DMVR의 적용을 나타내는 경우, 인터 예측부(218)는, DMVR로 움직임 탐색을 행한다.
도 90은, 복호 장치(200)에 있어서의 DMVR에 의한 움직임 탐색의 예를 나타내는 플로차트이다.
인터 예측부(218)는, 우선, 머지 모드로 커런트 블록의 MV를 도출한다(단계 Sl_11). 다음에, 인터 예측부(218)는, 단계 Sl_11에서 도출된 MV에 의해 나타내어지는 참조 픽처의 주변 영역을 탐색함으로써, 커런트 블록에 대해 최종 MV를 도출한다(단계 Sl_12). 즉, DMVR에 의해 커런트 블록의 MV가 결정된다.
도 91은, 복호 장치(200)에 있어서의 DMVR에 의한 움직임 탐색의 상세한 일례를 나타내는 플로차트이다.
우선, 인터 예측부(218)는, 도 58a에 나타내는 Step1에서, 초기 MV가 나타내는 탐색 위치(개시점이라고도 한다)와, 그 주위에 있는 8개의 탐색 위치에 있어서의 코스트를 산출한다. 그리고, 인터 예측부(218)는, 개시점 이외의 탐색 위치의 코스트가 최소인지 여부를 판정한다. 여기서, 인터 예측부(218)는, 개시점 이외의 탐색 위치의 코스트가 최소라고 판정하면, 코스트가 최소가 되는 탐색 위치로 이동하여, 도 58a에 나타내는 Step2의 처리를 행한다. 한편, 인터 예측부(218)는, 개시점의 코스트가 최소이면, 도 58a에 나타내는 Step2의 처리를 스킵하여 Step3의 처리를 행한다.
도 58a에 나타내는 Step2에서는, 인터 예측부(218)는, Step1의 처리 결과에 따라 이동한 탐색 위치를 새로운 개시점으로 하여, Step1의 처리와 동일한 탐색을 행한다. 그리고, 인터 예측부(218)는, 그 개시점 이외의 탐색 위치의 코스트가 최소인지 여부를 판정한다. 여기서, 인터 예측부(218)는, 개시점 이외의 탐색 위치의 코스트가 최소이면, Step4의 처리를 행한다. 한편, 인터 예측부(218)는, 개시점의 코스트가 최소이면, Step3의 처리를 행한다.
Step4에서는, 인터 예측부(218)는, 그 개시점의 탐색 위치를 최종 탐색 위치로서 취급하고, 초기 MV가 나타내는 위치와 그 최종 탐색 위치의 차분을 차분 벡터로서 결정한다.
도 58a에 나타내는 Step3에서는, 인터 예측부(218)는, Step1 또는 Step2의 개시점의 상하 좌우에 있는 4점에 있어서의 코스트에 의거하여, 코스트가 최소가 되는 소수 정밀도의 화소 위치를 결정하고, 그 화소 위치를 최종 탐색 위치로 한다. 그 소수 정밀도의 화소 위치는, 상하 좌우에 있는 4점의 벡터((0, 1), (0, -1), (-1, 0), (1, 0))를, 그 4점 각각의 탐색 위치에 있어서의 코스트를 가중치로서 가중 가산함으로써 결정된다. 그리고, 인터 예측부(218)는, 초기 MV가 나타내는 위치와 그 최종 탐색 위치의 차분을 차분 벡터로서 결정한다.
[움직임 보상>BIO/OBMC/LIC]
예를 들면, 스트림으로부터 해독된 정보가 예측 화상의 보정의 적용을 나타내는 경우, 인터 예측부(218)는, 예측 화상을 생성하면, 그 보정의 모드에 따라 예측 화상을 보정한다. 그 모드는, 예를 들면, 상술한 BIO, OBMC, 및 LIC 등이다.
도 92는, 복호 장치(200)에 있어서의 예측 화상의 생성의 일례를 나타내는 플로차트이다.
인터 예측부(218)는, 예측 화상을 생성하고(단계 Sm_11), 상술한 것 중 어느 하나의 모드에 의해 그 예측 화상을 보정한다(단계 Sm_12).
도 93은, 복호 장치(200)에 있어서의 예측 화상의 생성의 다른 예를 나타내는 플로차트이다.
인터 예측부(218)는, 커런트 블록의 MV를 도출한다(단계 Sn_11). 다음에, 인터 예측부(218)는, 그 MV를 사용하여 예측 화상을 생성하고(단계 Sn_12), 보정 처리를 행할지 여부를 판정한다(단계 Sn_13). 예를 들면, 인터 예측부(218)는, 스트림에 포함되는 예측 파라미터를 취득하고, 그 예측 파라미터에 의거하여, 보정 처리를 행할지 여부를 판정한다. 이 예측 파라미터는, 예를 들면, 상술한 각 모드를 적용할지 여부를 나타내는 플래그이다. 여기서, 인터 예측부(218)는, 보정 처리를 행한다고 판정하면(단계 Sn_13의 Yes), 그 예측 화상을 보정함으로써 최종적인 예측 화상을 생성한다(단계 Sn_14). 또한, LIC에서는, 단계 Sn_14에 있어서, 예측 화상의 휘도 및 색차가 보정되어도 된다. 한편, 인터 예측부(218)는, 보정 처리를 행하지 않는다고 판정하면(단계 Sn_13의 No), 그 예측 화상을 보정하지 않고 최종적인 예측 화상으로서 출력한다(단계 Sn_15).
[움직임 보상>OBMC]
예를 들면, 스트림으로부터 해독된 정보가 OBMC의 적용을 나타내는 경우, 인터 예측부(218)는, 예측 화상을 생성하면, OBMC에 따라 예측 화상을 보정한다.
도 94는, 복호 장치(200)에 있어서의 OBMC에 의한 예측 화상의 보정의 예를 나타내는 플로차트이다. 또한, 도 94의 플로차트는, 도 62에 나타내는 커런트 픽처 및 참조 픽처를 사용한 예측 화상의 보정의 흐름을 나타낸다.
우선, 인터 예측부(218)는, 도 62에 나타내는 바와 같이, 커런트 블록에 할당된 MV를 사용하여 통상의 움직임 보상에 의한 예측 화상(Pred)을 취득한다.
다음에, 인터 예측부(218)는, 복호 완료 좌측 인접 블록에 대해 이미 도출된 MV(MV_L)를 커런트 블록에 적용(재이용)하여 예측 화상(Pred_L)을 취득한다. 그리고, 인터 예측부(218)는, 2개의 예측 화상 Pred와 Pred_L을 중첩함으로써 예측 화상의 1회째의 보정을 행한다. 이것은, 인접 블록 간의 경계를 혼합하는 효과를 갖는다.
마찬가지로, 인터 예측부(218)는, 복호 완료 상측 인접 블록에 대해 이미 도출된 MV(MV_U)를 커런트 블록에 적용(재이용)하여 예측 화상(Pred_U)을 취득한다. 그리고, 인터 예측부(218)는, 예측 화상 Pred_U를 1회째의 보정을 행한 예측 화상(예를 들면, Pred와 Pred_L)에 중첩함으로써 예측 화상의 2회째의 보정을 행한다. 이것은, 인접 블록 간의 경계를 혼합하는 효과를 갖는다. 2회째의 보정에 의해 얻어진 예측 화상은, 인접 블록과의 경계가 혼합된(스무딩된), 커런트 블록의 최종적인 예측 화상이다.
[움직임 보상>BIO]
예를 들면, 스트림으로부터 해독된 정보가 BIO의 적용을 나타내는 경우, 인터 예측부(218)는, 예측 화상을 생성하면, BIO에 따라 예측 화상을 보정한다.
도 95는, 복호 장치(200)에 있어서의 BIO에 의한 예측 화상의 보정의 예를 나타내는 플로차트이다.
인터 예측부(218)는, 도 63에 나타내는 바와 같이, 커런트 블록을 포함하는 픽처(Cur Pic)와 상이한 2매의 참조 픽처(Ref0, Ref1)를 사용하여, 2개의 움직임 벡터(M0, M1)를 도출한다. 그리고, 인터 예측부(218)는, 그 2개의 움직임 벡터(M0, M1)를 사용하여 커런트 블록의 예측 화상을 도출한다(단계 Sy_11). 또한, 움직임 벡터 M0은, 참조 픽처 Ref0에 대응하는 움직임 벡터(MVx0, MVy0)이며, 움직임 벡터 M1은, 참조 픽처 Ref1에 대응하는 움직임 벡터(MVx1, MVy1)이다.
다음에, 인터 예측부(218)는, 움직임 벡터 M0 및 참조 픽처 L0을 사용하여 커런트 블록의 보간 화상 I0을 도출한다. 또, 인터 예측부(218)는, 움직임 벡터 M1 및 참조 픽처 L1을 사용하여 커런트 블록의 보간 화상 I1을 도출한다(단계 Sy_12). 여기서, 보간 화상 I0은, 커런트 블록에 대해 도출되는, 참조 픽처 Ref0에 포함되는 화상이며, 보간 화상 I1은, 커런트 블록에 대해 도출되는, 참조 픽처 Ref1에 포함되는 화상이다. 보간 화상 I0 및 보간 화상 I1은 각각, 커런트 블록과 같은 사이즈여도 된다. 또는, 보간 화상 I0 및 보간 화상 I1은 각각, 후술하는 구배 화상을 적절하게 도출하기 위해, 커런트 블록보다 큰 화상이어도 된다. 또한, 보간 화상 I0 및 I1은, 움직임 벡터(M0, M1) 및 참조 픽처(L0, L1)와, 움직임 보상 필터를 적용하여 도출된 예측 화상을 포함하고 있어도 된다.
또, 인터 예측부(218)는, 보간 화상 I0 및 보간 화상 I1로부터, 커런트 블록의 구배 화상(Ix0, Ix1, Iy0, Iy1)을 도출한다(단계 Sy_13). 또한, 수평 방향의 구배 화상은, (Ix0, Ix1)이고, 수직 방향의 구배 화상은, (Iy0, Iy1)이다. 인터 예측부(218)는, 예를 들면, 보간 화상에 대해 구배 필터를 적용함으로써, 그 구배 화상을 도출해도 된다. 구배 화상은, 수평 방향 또는 수직 방향을 따른 화소값의 공간적인 변화량을 나타내는 것이면 된다.
다음에, 인터 예측부(218)는, 커런트 블록을 구성하는 복수의 서브 블록 단위로, 보간 화상(I0, I1) 및 구배 화상(Ix0, Ix1, Iy0, Iy1)을 사용하여 상술한 속도 벡터인 옵티컬 플로(vx, vy)를 도출한다(단계 Sy_14). 일례로서, 서브 블록은, 4×4 화소의 서브 CU여도 된다.
다음에, 인터 예측부(218)는, 옵티컬 플로(vx, vy)를 사용하여 커런트 블록의 예측 화상을 보정한다. 예를 들면, 인터 예측부(218)는, 옵티컬 플로(vx, vy)를 사용하여 커런트 블록에 포함되는 화소의 값의 보정값을 도출한다(단계 Sy_15). 그리고, 인터 예측부(218)는, 보정값을 사용하여 커런트 블록의 예측 화상을 보정해도 된다(단계 Sy_16). 또한, 보정값은 각 화소 단위로 도출되어도 되고, 복수의 화소 단위 또는 서브 블록 단위로 도출되어도 된다.
또한, BIO의 처리 플로는, 도 95에 개시한 처리로 한정되지 않는다. 도 95에 개시한 처리의 일부의 처리만을 실시해도 되고, 상이한 처리를 추가 또는 치환해도 되고, 상이한 처리 순으로 실행해도 된다.
[움직임 보상>LIC]
예를 들면, 스트림으로부터 해독된 정보가 LIC의 적용을 나타내는 경우, 인터 예측부(218)는, 예측 화상을 생성하면, LIC에 따라 예측 화상을 보정한다.
도 96은, 복호 장치(200)에 있어서의 LIC에 의한 예측 화상의 보정의 예를 나타내는 플로차트이다.
우선, 인터 예측부(218)는, MV를 사용하여, 복호 완료 참조 픽처로부터 커런트 블록에 대응하는 참조 화상을 취득한다(단계 Sz_11).
다음에, 인터 예측부(218)는, 커런트 블록에 대해, 참조 픽처와 커런트 픽처에서 휘도값이 어떻게 변화했는지를 나타내는 정보를 추출한다(단계 Sz_12). 이 추출은, 도 66a에 나타내는 바와 같이, 커런트 픽처에 있어서의 복호 완료 좌측 인접 참조 영역(주변 참조 영역) 및 복호 완료 상측 인접 참조 영역(주변 참조 영역)의 휘도 화소값과, 도출된 MV로 지정된 참조 픽처 내의 동등 위치에 있어서의 휘도 화소값에 의거하여 행해진다. 그리고, 인터 예측부(218)는, 휘도값이 어떻게 변화했는지를 나타내는 정보를 사용하여, 휘도 보정 파라미터를 산출한다(단계 Sz_13).
인터 예측부(218)는, MV로 지정된 참조 픽처 내의 참조 화상에 대해 그 휘도 보정 파라미터를 적용하는 휘도 보정 처리를 행함으로써, 커런트 블록에 대한 예측 화상을 생성한다(단계 Sz_14). 즉, MV로 지정된 참조 픽처 내의 참조 화상인 예측 화상에 대해, 휘도 보정 파라미터에 의거한 보정이 행해진다. 이 보정에서는, 휘도가 보정되어도 되고, 색차가 보정되어도 된다.
[예측 제어부]
예측 제어부(220)는, 인트라 예측 화상 및 인터 예측 화상 중 어느 하나를 선택하고, 선택한 예측 화상을 가산부(208)에 출력한다. 전체적으로, 복호 장치(200) 측의 예측 제어부(220), 인트라 예측부(216) 및 인터 예측부(218)의 구성, 기능, 및 처리는, 부호화 장치(100) 측의 예측 제어부(128), 인트라 예측부(124) 및 인터 예측부(126)의 구성, 기능, 및 처리와 대응하고 있어도 된다.
[해상도에 관한 제약]
몇 가지 양태 및 예를 사용하여, 해상도에 관한 제약을 이하에 설명한다.
(제1 양태)
RPR(Reference Picture Resampling:참조 픽처 리샘플링)이 빈발함으로써, 표시를 포함하는 후단 처리의 사이즈의 전환이 빈번히 일어나, 제어가 복잡화될 가능성이 있다. 또, RPR이 빈발함으로써, 커런트 픽처 및 참조 픽처에 대한 메모리 액세스 방법의 전환(메모리 맵의 전환)이 빈번히 일어나, 제어가 복잡화될 가능성이 있다.
제1 양태에서는, 전환의 빈도를 줄이기 위해, 랜덤 액세스 픽처 또는 그들의 배수(즉, k번째의 랜덤 액세스 픽처)에서만 해상도 변경을 가능하게 하는 예를 나타낸다. 이로 인해, 제약이 없는 경우에 비해, 제어를 간이화할 수 있다.
(제2 양태)
RPR의 전환 패턴이 다수 있으면, 그들에 대응하는 수의, 표시를 포함하는 후단 처리의 매칭 사이즈의 패턴이 필요해져, 실장이 복잡화된다. 또, RPR의 전환 패턴이 다수 있으면, 그들에 대응하는 수의, 커런트 픽처 및 참조 픽처에 대한 메모리 액세스 방법의 전환(메모리 맵의 전환)의 패턴이 필요해져, 실장이 복잡화된다.
제2 양태에서는, 전환 패턴수를 줄이기 위해, 규정 해상도 세트 중에서만, 해상도 변경(예를 들면, RPR)을 유효하게 하는 예를 나타낸다. 이로 인해, 제약이 없는 경우에 비해, 실장을 간이화할 수 있다.
(제3 양태)
GOP(Group Of Pictures:픽처 그룹)에 있어서 실제로는 사용되지 않는 큰 사이즈가 SPS에 기술되어 있는 경우, 복호 장치(200)는 SPS의 사이즈에 따라 메모리 리소스 등을 확보하여, 쓸데없이 대량의 리소스를 확보하지 않으면 안된다.
제3 양태에서는, 보다 정확한 리소스 스케줄링을 가능하게 하기 위해, 픽처 해상도에 관한 SPS 및 PPS 파라미터를 보다 모순없이 시그널링하는 예를 나타낸다. 예를 들면, SPS에 있어서 시그널링된 해상도가, 픽처 파라미터 세트에 있어서 시그널링된 해상도의 최대값보다 커지는 것이 허용되지 않는다.
상술한 3개의 양태를 사용하여, 픽처 시퀀스를 부호화/복호하기 위한 리소스가 보다 효율적으로 이용되어도 된다. 이들 3개의 양태는, 각각 개별적으로 사용되어도 된다. 그러나, 이들(이들 중 어느 2개, 또는, 3개 전부)이 조합되어도 된다. 본 개시의 몇 가지 구체적인 예에서는, 이하에 상세히 설명하는 바와 같이, 이들 양태에 대해서 다룬다. 특히, 몇 가지 특정한 예는, 수신 장치(복호 장치(200))의 처리를 경감하기 위해, 참조 픽처 리샘플링을 사용하는 비트 스트림을 제약하는 것에 관한 것이다. 또한, 픽처 시퀀스란, 복수의 픽처의 총칭이다.
또, 몇 가지 예는, 픽처 해상도 변경이, k번째(k는 양의 정수)의 랜덤 액세스 포인트마다의 픽처에 대해 허용되지만, k번째의 랜덤 액세스 포인트마다가 아닌 픽처에 대해 금지되는 제약을 적용하면서 픽처 시퀀스를 부호화 및/또는 복호하는 것에 관한 것이다. 픽처 해상도 변경이란, 랜덤 액세스 포인트의 픽처보다 앞의 픽처(인터 부호화 픽처)의 제1 해상도로부터, 랜덤 액세스 포인트의 픽처(인트라 부호화 픽처) 및 랜덤 액세스 포인트의 픽처보다 뒤의 픽처(인터 부호화 픽처)의 제2 해상도로의 변경이다.
[픽처 해상도의 변경]
VVC(Versatile Video Coding)는, 랜덤 액세스 인트라 예측 픽처로 한정하지는 않는 시퀀스 내의 어느 하나의 픽처에 있어서, 픽처 시퀀스의 픽처 해상도 변경의 가능성을 유효하게 한다. 이러한 특징을 유효하게 하기 위해, 도 97에 나타내는 바와 같이, 해상도가 같지 않은 참조 픽처를 갖는 것을 어느 픽처에 대해서도 허용한다.
도 97은, 인터 예측 픽처 간에 있어서의 참조 픽처 리샘플링을 나타낸다. 특히, 도 97에는, 픽처 시퀀스(300)의 일부가 나타나 있으며, 6개의 픽처를 포함하고 있다. 픽처(310)는, 제1 해상도를 갖고, 픽처(320)는, 제1 해상도보다 낮은 제2 해상도를 갖는다. 픽처(310)도 픽처(320)도 인터 예측되며(즉, 시간 예측을 포함하는 예측 모드로 예측되며), 시간 종속 관계의 순으로 나열된다.
이 예에 있어서, 제1 픽처에서 제2 픽처로의 화살표는, 제2 픽처가 제1 픽처를 참조로서 사용하는 것을 의미한다(그에 따라, 제1 픽처에 의해 제2 픽처가 예측된다). 도 97로부터 알 수 있듯이, 해상도 변경은, 3개의 픽처(310) 다음에, 3개의 픽처(320) 중 최초의 픽처에 있어서 발생한다.
이러한 인터 예측 픽처 간에 있어서의 해상도 변경은, 예를 들면, 움직임 보상 처리의 보간 필터를 리샘플링 필터로서도 사용하여, 참조 픽처를 리샘플링하는 것을 필요로 한다. VVC는, 이러한 툴을 제공하고 있다. 이 툴은, RPR(Reference Picture Resampling)로 불리며, 비디오 회의와 같은, 전형적으로는 그다지 랜덤 액세스 픽처가 사용되지 않고, 또한, 예를 들면 기기에 따라 비디오 스트림의 해상도가 상이한 다양한 화자가 있을 가능성이 있는 애플리케이션용으로 픽처 해상도 변경을 용이하게 하기 위해 도입되었다. 이로 인해, 적극적으로 이야기하는 사람에 따라 빈번히 해상도가 변경될 가능성이 있다.
VVC RPR의 개념은, 비디오 회의 애플리케이션용으로 개발되었지만, 전형적으로는 랜덤 액세스 픽처를 정기적으로(통상, 적어도 몇 초마다) 사용한다고 생각되는 방송 또는 스트리밍 애플리케이션에도 사용될 수 있다.
몇 가지 특정한 방송 애플리케이션에서는, 이른바 오픈 GOP(open Group Of Pictures) 구조가 채용되고 있다. 이 경우, 랜덤 액세스 픽처보다 부호화 순으로 뒤이며 또한 표시 순으로 앞에 위치하고 있는 복수의 픽처는, 이전 GOP에 속해 있는 복수의 픽처를 사용하여 예측되어도 된다. 그로 인해, GOP는, 표시 순으로 2개의 랜덤 액세스 픽처 간에 위치하는 복수의 픽처로서 정의된다. 단, GOP는, GOP의 서두인 랜덤 액세스 픽처를 포함한다. 또한, GOP의 다른 정의로서, 부호화 순으로 2개의 랜덤 액세스 픽처 간에 위치하는 복수의 픽처로 하는 경우도 있다.
표시 순으로 랜덤 액세스 픽처 다음에, 같은 GOP 내의 모든 후속 픽처가, 랜덤 액세스 픽처 또는 그것보다 뒤의 픽처만을 사용하여 예측된다. 그로 인해, 그 포인트에서의 랜덤 액세스가 가능해진다.
용어에 대해서, 랜덤 액세스 인트라 예측 픽처란, 공간적으로 예측(인트라 예측)되는 픽처이고, 그 픽처의 복호, 및, 표시 순으로 그 다음의 픽처의 복호가, 비트 스트림의 다른 픽처의 먼저 행해진 복호에 의존하지 않기 때문에, 랜덤 액세스가 가능해지는 픽처이다. 전형적으로는, 랜덤 액세스 인트라 예측 픽처는, 어떠한 인터 예측 부분도 포함하지 않고, 엔트로피 부호화/복호가 픽처의 서두에 리스타트된다.
랜덤 액세스 인트라 예측 픽처는, IRAP(Intra Random Access Point) 픽처로 표현되는 경우가 있다. 또, 랜덤 액세스 인트라 예측 픽처는, 랜덤 액세스 포인트 픽처, 랜덤 액세스 픽처, 랜덤 액세스 포인트, 또는, IRAP로 표현되는 경우가 있다. 또, GOP는, 랜덤 액세스 단위에 대응한다.
용어 「표시 순」는, 비트 스트림으로부터 복호된 픽처가 재생을 위해 표시되는 순서를 가리킨다. 보다 일반적인 용어로는, 표시 순은, 픽처 부호화를 위해 픽처가 부호화 장치(100)에 입력되는 순서(입력 순), 및, 픽처가 복호 장치(200)로부터 출력되는 순서(출력 순)에 상당한다.
부호화 순은, 픽처가 부호화되는 순서이며, 복호 순은, 픽처가 복호되는 순서이다. 기본적으로, 부호화 순은, 복호 순과 같다. 한편, 부호화 순은, 표시 순과는 상이한 경우도 많다.
[참조 픽처 리샘플링에 대한 수신 장치에 바람직한 제약(제1 양태)]
RPR은 유용한 특징이지만, RPR이 빈발하면, 특히 수신 장치 측에 있어서, 실장에 관한 몇 가지 문제를 일으킬 가능성이 있다. 이들 문제에 대처하기 위해, 이하에서는, 해상도 변경에 관련된 몇 가지 제약이 도입된다.
[랜덤 액세스 포인트에서의 해상도의 변경]
본 개시의 일 양태에 의하면, 장치(부호화 장치(100))는, 픽처 시퀀스를 비트 스트림에 부호화하기 위해 제공된다. 구체적으로는, 장치는, 픽처 시퀀스를 비트 스트림에 부호화하도록 구성된 처리 회로를 구비한다. 또, 처리 회로는, (부호화에 있어서의) 제약을 적용하도록 구성되어 있다. 여기서, 제약에 따르는 픽처 해상도 변경은, k번째(k는 양의 정수)의 랜덤 액세스 포인트마다의 픽처에 대해 허용되고, k번째의 랜덤 액세스 포인트마다가 아닌 픽처에 대해 금지된다.
「k번째의 랜덤 액세스 포인트마다」에 대해서, 의미하는 바는, 예를 들면, 1번째의 랜덤 액세스 포인트마다, 2번째의 랜덤 액세스 포인트마다, 또는, 3번째의 랜덤 액세스 포인트마다 등이다.
즉, 「k번째의 랜덤 액세스 포인트마다」는, k-1개의 랜덤 액세스 포인트를 사이에 두고 특정되는 랜덤 액세스 포인트에 대응하고, 각 k개의 랜덤 액세스 포인트 중 1개의 랜덤 액세스 포인트에 대응한다.
예를 들면, 「k번째의 랜덤 액세스 포인트마다」는, k=1인 경우, 각 랜덤 액세스 포인트에 대응한다. 또, 「k번째의 랜덤 액세스 포인트마다」는, k=2인 경우, 각 2개의 랜덤 액세스 포인트 중 1개의 랜덤 액세스 포인트에 대응하며, k=3인 경우, 각 3개의 랜덤 액세스 포인트 중 1개의 랜덤 액세스 포인트에 대응한다.
또한, 초기 오프셋이 주어져도 된다. 이것은, 해상도 변경이 허용되는 초회의 랜덤 액세스 포인트가, 꼭 시퀀스의 시작부터 세어 k번째의 랜덤 액세스 포인트는 아닌 것, 즉, 실제로는, k보다 크거나 또는 작은 순번에 대응하는 랜덤 액세스 포인트일 가능성을 의미한다.
픽처 해상도 변경이란, 픽처의 해상도를, 앞의 픽처의 해상도로부터 변경하는 것이다. 「앞」이란, 부호화 순 및/또는 입력 순으로, 순번이 빠른 것을 나타낸다. 픽처 해상도 변경의 구체예는, 부호화 순 및/또는 입력 순으로 랜덤 액세스 포인트의 픽처보다 앞의 (하나 이상의) 픽처의 제1 해상도로부터, 랜덤 액세스 포인트의 픽처, 및, 부호화 순 및/또는 입력 순으로 랜덤 액세스 포인트의 픽처보다 뒤의 (하나 이상의) 픽처의 제2 해상도로의 변경이다.
상기 구성에 의해, 예를 들면, 랜덤 액세스 픽처, 및, 오픈 GOP(Group Of Pictures) 부호화 구조를 빈번히 사용하는 방송 및 브로드밴드 전송 애플리케이션과 같은 특정한 경우에도, 참조 픽처 리샘플링을 유효하게 할 수 있다. 구체적인 제약으로서, 랜덤 액세스 픽처에서만 픽처 해상도 변경이 허용된다. 이 변경은, 도 98a, 도 98b 및 도 98c의 3개의 실장예에 나타내는 바와 같이, 전형적인 방송 비디오 해상도 사이에서 실시되어도 된다. 도 98a, 도 98b 및 도 98c 각각은, 각 직사각형이 픽처를 나타내고, HD 해상도에서 4K 해상도로 해상도가 변화하는 도면이다.
용어 「4K 해상도」란, 통상, 대략 4000 화소(예를 들면 휘도 샘플)의 수직 또는 수평 사이즈에 대응하는 약 8메가 화소의 픽처 해상도를 가리킨다. 4K 픽처의 구체적인 수직 및 수평 사이즈는 상이해도 되고, 예를 들면, 4K 픽처는, 4096×2160, 3996×2160, 3996×1716, 3840×2160, 3840×2400 등 다양한 상이한 애스펙트비를 더 가져도 된다. 이들 수에 따라, 열수×행수, 즉, 화소(샘플) 단위로의 수평×수직 해상도가 지정된다.
용어 「HD 해상도」 또는 「풀 HD 해상도」는, 전형적으로는, 1픽처 당 약 2메가 화소가 되는 1920×1080의 픽처 해상도를 가리킨다. 그러나, 이 용어는, 약 2메가 화소의 다른 애스펙트비에 대해 적용되어도 된다. 도 98a, 도 98b 및 도 98c 각각에 나타나는 예에서는, HD 해상도가 1920×1080 화소로서 정의되고, 4K 해상도가 3840×2160 화소로서 정의되어도 된다. 그러나, 본 개시는, 어떠한 특정 해상도로도 한정되지 않고, 임의의 해상도 변경에 적용될 수 있다.
도 98a, 도 98b 및 도 98c는, 3개의 시나리오를 나타내고 있다. 각 시나리오는, 표시 순으로 나열된 픽처를 나타낸다(표시 순은, 부호화 장치(100)에 대한 입력 순, 및, 복호 장치(200)에 대한 출력 순에 상당한다). 이 예에 있어서의 픽처는, 시간 스케일러빌리티를 서포트하기 때문에, 4개의 템포럴 서브 레이어(tId:0~3)에 있어서 부호화된다. 시간 스케일러빌리티가, 예를 들면, VVC 내로서 실장되어도 된다. 도 98a, 도 98b 및 도 98c에 있어서의 용어 「tId」는, 템포럴 ID, 즉, 템포럴 서브 레이어의 ID를 나타낸다. 그러나, 템포럴 서브 레이어 부호화는, 예로서만 나타난다. 본 개시는, 시간 스케일러빌리티가 있는지 여부에 상관없이 스트림에 적용 가능하다.
실장예에 있어서, 부호화는, VVC 코덱을 사용하여 행해지고, 해상도 변경은, 이하의 (1) 및 (2) 양쪽 또는 한쪽에 의해, 비트 스트림 내에 나타내어진다.
(1) pps_pic_width_in_luma_samples 및/또는 pps_pic_height_in_luma_samples
(2) pps_scaling_win_left_offset, pps_scaling_win_right_offset, pps_scaling_win_top_offset 및 pps_scaling_win_bottom_offset 중 하나 이상
예를 들면, VVC에 의거한 실장의 경우, 시퀀스 파라미터 세트(SPS)의 신택스 요소 sps_ref_pic_resampling_enabled_flag 및 sps_res_change_in_clvs_allowed_flag가 둘 다 1과 같이 설정된다. 이로 인해, 같은 VVC 레이어 내에서 참조 픽처 리샘플링을 사용하는 것이 가능하다. 파라미터 sps_ref_pic_resampling_enabled_flag는, 이 파라미터의 캐리어인 SPS를 참조하는 시퀀스에 대한 참조 픽처 리샘플링의 유효 및 무효를 나타내는 2개의 값 중 한쪽을 취할 수 있다.
1과 같은 sps_ref_pic_resampling_enabled_flag에 의해, 참조 픽처 리샘플링이 유효인 것이 지정된다. 이 경우, SPS를 참조하는 커런트 픽처가, 이하의 (1)~(7)의 7개의 파라미터 중 커런트 픽처의 파라미터와는 상이한 하나 이상의 파라미터를 갖는 참조 픽처를 참조하는 슬라이스를 가질 가능성이 있다.
(1) pps_pic_width_in_luma_samples
(2) pps_pic_height_in_luma_samples
(3) pps_scaling_win_left_offset
(4) pps_scaling_win_right_offset
(5) pps_scaling_win_top_offset
(6) pps_scaling_win_bottom_offset
(7) sps_num_subpics_minus1
0과 같은 sps_ref_pic_resampling_enabled_flag에 의해, 참조 픽처 리샘플링이 무효인 것이 지정된다. 이 경우, SPS를 참조하는 커런트 픽처가, 상기의 7개의 파라미터 중 커런트 픽처의 파라미터와는 상이한 하나 이상의 파라미터를 갖는 참조 픽처를 참조하는 슬라이스를 갖는 경우는 없다.
파라미터 sps_res_change_in_clvs_allowed_flag는, SPS를 참조하는 특정의 CLVS(Coded Layer Video Sequence)에 대한 참조 픽처 리샘플링의 유효 및 무효를 나타낸다.
특히, sps_res_change_in_clvs_allowed_flag가 1과 같은 경우, SPS를 참조하는 CLVS 내에서 픽처 공간 해상도가 변화해도 된다. 이로 인해, 싱글 레이어 비트 스트림 내에서의 해상도 변경을 유효로 하는 것이 지정된다. sps_res_change_in_clvs_allowed_flag가 0과 같은 경우, SPS를 참조하는 CLVS 내에서 픽처 공간 해상도는 변화하지 않지만, 레이어 사이에서는 변화해도 된다. 이로 인해, 상이한 레이어 사이에서의 공간 스케일러빌리티를 유효로 하는 것이 지정된다.
그리고, 해상도 변경 자체는, 예를 들면, 픽처 파라미터 세트(PPS)의 pps_pic_width_in_luma_samples 및 pps_pic_height_in_luma_samples의 값을 이전 GOP의 해상도로부터 새로운 GOP의 해상도로 변경함으로써 시그널링된다. PPS 파라미터 pps_pic_width_in_luma_samples 및 pps_pic_height_in_luma_samples는, 각각, 당해 PPS를 참조하는 픽처의 폭 및 높이를 나타낸다.
또한, 몇 가지 생각할 수 있는 실장에 있어서, 폭에만 의거하거나, 또는, 높이에만 의거하여 해상도가 인식 가능한 경우, 그들 중 한쪽만이 시그널링되고, 다른 쪽이 시그널링되지 않아도 된다.
본 개시의 일 양태에서는, 참조처의 PPS에 있어서의 2개의 신택스 요소 pps_pic_width_in_luma_samples 및 pps_pic_height_in_luma_samples의 값으로의 변경이, 랜덤 액세스 포인트에서만 허용된다. 전형적으로는, 이 변경은, VVC IRAP(Intra Random Access Point) 픽처에서만 허용된다.
VVC 스케일링 윈도우가 사용되는 경우, 참조처의 PPS에 있어서 스케일링 윈도우용 오프셋의 파라미터로서 지정되는 이하의 신택스 요소도, 랜덤 액세스 포인트에서만 변경하는 것이 허용된다.
(1) pps_scaling_win_left_offset
(2) pps_scaling_win_right_offset
(3) pps_scaling_win_top_offset
(4) pps_scaling_win_bottom_offset
상기의 파라미터에 의해, 스케일링비를 계산하기 위해 픽처 사이즈에 적용되는 오프셋이 지정된다. 이들 파라미터가 존재하지 않는 경우, 이들 파라미터의 값은, 각각, 이하의 컨포먼스 윈도우 파라미터와 같다고 추측된다.
(1) pps_conf_win_left_offset
(2) pps_conf_win_right_offset
(3) pps_conf_win_top_offset
(4) pps_conf_win_bottom_offset
도 99는, 복수의 파라미터의 관계를 나타내는 개념도이다. 픽처의 전체 범위의 폭은, pps_pic_width_in_luma_samples로 표현되며, 픽처의 전체 범위의 높이는, pps_pic_height_in_luma_samples로 표현된다.
또, 픽처의 참조 범위의 폭은, pps_pic_width_in_luma_samples로부터 pps_scaling_win_left_offset 및 pps_scaling_win_right_offset을 제거함으로써 얻어진다. 또, 픽처의 참조 범위의 높이는, pps_pic_height_in_luma_samples로부터 pps_scaling_win_left_offset 및 pps_scaling_win_right_offset을 제거함으로써 얻어진다.
픽처의 해상도는, 픽처의 전체 범위의 사이즈에 의해 표현되어도 되고, 픽처의 참조 범위의 사이즈에 의해 표현되어도 된다. 그리고, 커런트 픽처의 부호화 또는 복호에 있어서, 커런트 픽처와 참조 픽처 사이에서 해상도가 상이한 경우, 커런트 픽처와 참조 픽처 사이에서 해상도가 실질적으로 같아지도록, 참조 픽처가 리샘플링된다.
구체적으로는, 참조 픽처의 해상도에 대한 커런트 픽처의 해상도의 비율에 따라 참조 픽처의 참조 화상이 스케일링되도록, 참조 픽처의 참조 화상이 리샘플링된다. 예를 들면, 커런트 픽처의 해상도가 참조 픽처의 해상도보다 큰 경우, 움직임 보상 필터에 의해, 참조 픽처의 참조 화상이, 업 샘플링된다. 또, 커런트 픽처의 해상도가 참조 픽처의 해상도보다 작은 경우, 움직임 보상 필터에 의해, 참조 픽처의 참조 화상이, 다운 샘플링된다.
커런트 픽처의 전체 범위의 사이즈와, 참조 픽처의 전체 범위의 사이즈가 같아도, 참조 픽처의 참조 범위를 정하기 위한 오프셋에 의해, 참조 픽처의 참조 범위 내의 참조 화상이 리샘플링될 수 있다. 구체적으로는, 참조 픽처의 참조 범위와 커런트 픽처의 전체 범위 사이에서 해상도가 실질적으로 같아지도록, 참조 픽처의 참조 범위의 화상이 리샘플링되어도 된다. 오프셋은, 예를 들면, 줌 등에 따라 참조 픽처의 일부분을 커런트 픽처의 전체의 예측 화상에 적용하는 경우에 유용하다.
픽처의 해상도의 변경은, 오프셋이 일정한 경우에, 픽처의 전체 범위의 사이즈가 변경됨으로써 제어되어도 된다. 혹은, 픽처의 해상도의 변경은, 픽처의 전체 범위가 일정한 경우에, 픽처의 참조 범위의 사이즈가 변경됨으로써 제어되어도 된다. 특히, 본 개시의 몇 가지 예에서는, 랜덤 액세스 포인트에서만 픽처의 해상도가 변경된다.
랜덤 액세스 포인트에서만 픽처의 해상도를 변경한다는 이 제약은, 도 98a, 도 98b 및 도 98c에 있어서의 3개의 예를 커버한다.
도 98a의 예에 있어서, 부호화 장치(100)의 처리 회로는, (4K 해상도의) 제2 픽처 그룹의 인트라 부호화 랜덤 액세스 픽처(도면에 있어서의 IRAP-4K)를 부호화하도록 구성된다. 부호화 장치(100)의 처리 회로는, 또한, 계속해서, 입력 순으로 제2 픽처 그룹보다 앞의 제1 픽처 그룹(이전 GOP)에 속하는 리딩 픽처(리딩 인터 예측 픽처)(330)를 부호화하도록 구성된다. 부호화 장치(100)의 처리 회로는, 또한, 계속해서, 제2 픽처 그룹에 속하는 트레일링 픽처(트레일링 인터 예측 픽처)를 부호화하도록 구성된다.
리딩 픽처(330)의 해상도는, IRAP 및 트레일링 픽처의 해상도와 일치하지 않는다. 이것은, 도 98a로부터 알 수 있다. 도 98a에 있어서, 리딩 픽처(330)는 HD 해상도를 갖고, IRAP, 및, 입력 순으로 IRAP보다 뒤의 트레일링 픽처는, 4K 해상도를 갖는다. 리딩 픽처(330)는, 제2 픽처 그룹으로부터 하나 이상의 픽처(전형적으로는 IRAP 픽처)를 참조 픽처로서 사용해도 된다.
여기서의 용어 「픽처 그룹(Group Of Pictures:GOP)」는, 몇 가지 선행하는 코덱으로부터 주지와 같이, (클로즈드) GOP여도 되지만, 꼭 (클로즈드) GOP로 한정하지는 않는다. 도 98a에서 상기와 같이 예시되어 있는 바와 같이, 오픈 GOP도 서포트될 수 있다.
본 개시에서는, 용어 「픽처 그룹」을, 보다 넓은 의미로, 인트라 예측(또는 전혀 예측되지 않는) 랜덤 액세스 픽처와 하나 이상의 인터 예측 픽처를 포함하는 연속 픽처의 세트로서 사용한다. 일반적으로, 픽처(비디오) 시퀀스에 있어서의 복수의 픽처 그룹은, (픽처량이라고 하는 관점에서) 같은 사이즈를 갖고 있어도 되고, 상이한 사이즈를 갖고 있어도 된다. 본 개시는, 픽처 그룹의 어떠한 특정 구조로도 한정되지 않는다.
또한, 인터 예측 픽처는, 인트라 모드로 부호화되는 몇 가지 영역 또는 블록(부호화 유닛)을 더 포함하고 있어도 된다. 그러나, 인트라 예측 픽처는, 전형적으로는, 인터 예측되는 어떠한 부분도 블록도 포함하지 않는다. IRAP 픽처는, 전형적으로는, 인트라 예측 픽처로서, 부호화 순으로 IRAP 또는 그 뒤의 몇 가지 포인트에 있어서 참조 픽처 버퍼를 비워서 IRAP로부터의 랜덤 액세스를 유효로 하는 것에 대한 추가 룰을 갖는다.
도 98a에서는, 리딩 픽처(330)를 갖는 오픈 GOP가 사용되고 있는데, 리딩 픽처(330)는, IRAP 및 그 트레일링 픽처와는 상이한 해상도를 사용한다. 이 예에서는, 참조 픽처 리샘플링이 적용되고, 해상도 변경은, 부호화 순이 아니라 표시 순(입력 순)으로 IRAP에 있어서 발생한다. 왜냐하면, 리딩 픽처(330)는 IRAP 픽처 다음에 부호화되기 때문이다. 이 예에서는, 표시 제어기는, IRAP 표시의 타이밍을 해상도 변경의 타이밍과 용이하게 동기시킬 수 있다.
복호 장치(200)는, 비트 스트림을 복호하고, 제약을 사용하여 그 리소스를 계획해도 된다. 오픈 GOP 시나리오에 있어서, 트레일링 픽처는, 참조 픽처로서 리딩 픽처(330)를 사용하지 않는다. 그렇지 않으면, IRAP에서 비디오에 랜덤 액세스 하는 것이 가능하지 않다고 생각된다. 왜냐하면, 오픈 GOP 시나리오에 있어서, 리딩 픽처(330)는, 전형적으로는, 참조 픽처로서 이전 GOP로부터도 픽처를 사용하기 때문이다.
랜덤 액세스를 유효하게 하기 위해, (클로즈드 GOP의 경우) IRAP에 있어서, 또는, (오픈 GOP의 경우) 트레일링 픽처의 복호를 개시할 때에, IRAP 이외의 모든 픽처를 제거하여 참조 픽처 버퍼를 비운다. 그 경우에서도, 도 98a에서는, 참조 픽처 리샘플링이 사용된다. 왜냐하면, 리딩 픽처(330)는, 참조 픽처로서, 상이한 해상도의 IRAP 픽처를 사용하기 때문이다.
도 98b는, 랜덤 액세스 포인트에서만 해상도 변경이 발생할 가능성이 있는 제약의 다른 실장예를 나타내고 있다. 따라서, 처리 회로는, 제2 픽처 그룹의 인트라 부호화 랜덤 액세스 픽처(도면에 있어서의 IRAP-4K)를 부호화하도록 구성된다. 처리 회로는, 또한, 계속해서, 입력 순으로 제2 픽처 그룹보다 앞의 제1 픽처 그룹(이전 GOP)에 속하는 리딩 픽처(리딩 인터 예측 픽처)(340)를 부호화하도록 구성된다. 처리 회로는, 또한, 계속해서, 제2 픽처 그룹에 속하는 트레일링 픽처(트레일링 인터 예측 픽처)를 부호화하도록 구성된다.
도 98a의 실시예와는 달리, 도 98b의 실시예는, IRAP와 같은 해상도(4K)를 갖는 리딩 픽처(340)를 나타내고 있다. 그럼에도 불구하고, 이들 리딩 픽처(340)는, 부호화 순으로는 IRAP보다 더 뒤이지만, 입력 순으로는 뒤가 아니다. 오픈 GOP 시나리오에 있어서, 리딩 픽처(340)는, 제1 픽처 그룹(이전 GOP)의 하나 이상의 픽처를 참조 픽처로서 사용해도 된다.
리딩 픽처(340)의 해상도는, 제2 픽처 그룹에 있어서의 IRAP의 해상도(본 예에서는 4K) 및 트레일링 픽처의 해상도와 같지만, 제1 픽처 그룹에 있어서의 나머지 픽처의 해상도(본 예에서는 HD)와 같지 않다.
IRAP 및 리딩 픽처(340)의 해상도는 같기 때문에, IRAP를 참조 픽처로서 사용하는 경우, 부호화 장치(100)(및 복호 장치(200))에 있어서 리샘플링은 필요없다. 그러나, 부호화/복호 중에 제1 픽처 그룹에 있어서의 나머지 픽처(이전 GOP에 있어서의 트레일링 픽처) 중 어느 하나를 참조 픽처로서 사용하는 경우에는, 참조 픽처의 리샘플링이 필요할지도 모른다. 특히, 도 98b에서는, 리딩 픽처(340)가 이전 GOP로부터의 픽처를 참조로서 사용하고 있는 경우, 참조 픽처의 리샘플링이 사용될 수 있다.
그러나, 리딩 픽처(340)가 IRAP만을 참조로서 사용하는 경우에는, 참조 픽처의 리샘플링은 필요없다. 도 98b에 있어서, 해상도 변경은, 부호화 순으로는 IRAP 픽처에 있어서 발생하지만, 표시 순(부호화 장치(100)에 있어서의 입력 순, 및, 복호 장치(200)에 있어서의 출력 순)으로는 최초의 리딩 픽처(340)에 있어서 발생한다. 부호화 장치(100) 및 복호 장치(200)는, 표시 순으로는, 이 최초의 리딩 픽처(340)를 제외하고, GOP 내에서 해상도를 변경할 필요는 없다.
도 98c는, 다른 예로서, 클로즈드 픽처 그룹에 있어서 부호화되는 픽처 시퀀스를 비트 스트림이 포함하는 예를 나타내고 있다. 제2 클로즈드 픽처 그룹은, 인트라 부호화 랜덤 액세스 픽처 IRAP와, 입력 순 및 출력 순 양쪽에서 IRAP에 후속하는 하나 이상의 인터 예측 픽처를 포함한다. 이들 인터 예측 픽처는, 도면에 있어서, 트레일링 픽처-4K로서 참조된다. 클로즈드 픽처 그룹이란, 픽처 그룹에 있어서의 하나 이상의 인터 예측 픽처가, 당해 픽처 그룹으로부터의 픽처만을 참조 픽처로서 사용하는 픽처 그룹이다.
따라서, 도 98c의 예에서는, 리딩 픽처는 사용되지 않고, 제1 픽처 그룹은, 도시되지 않은 IRAP 픽처, 및, 도면에 있어서 이전 GOP의 트레일링 픽처-HD로서 표시되는 트레일링 픽처만을 갖는다. 해상도 변경은, 부호화 순과 표시 순 양쪽에서 IRAP 픽처에 있어서 발생하고, 참조 픽처의 리샘플링은 필요없다. 도 98c의 예는, 도 98a 및 도 98b 양쪽의 예의 이점을 공유하지만, 부호화 효율이라는 점에서는, 오픈 GOP 구조보다 효율이 나쁠 가능성이 있다.
정리하면, 도 98a에서는, 복호 순이 아니라 출력 순(비디오 코딩에서는 표시 순으로서 사용되는 용어)으로 IRAP에 있어서 해상도 변경이 있다. 왜냐하면, IRAP 픽처와 해상도가 상이한 리딩 픽처가 IRAP 다음에 복호되기 때문이다. 도 98b에서는, 출력 순이 아니라 복호 순으로 IRAP에 있어서 해상도 변경이 있다. 왜냐하면, IRAP 픽처와는 해상도가 같은 리딩 픽처가 IRAP 픽처 전에 출력되기 때문이다. 도 98c에서는, 복호 순 및 출력 순 양쪽에서 IRAP에 있어서 해상도 변경이 있다.
상술한 제약에 의하면, 커런트 픽처가 리딩 픽처인 경우에만, 커런트 픽처와 참조 픽처 사이에서 해상도가 상이할 가능성이 있다. 따라서, 커런트 픽처가 리딩 픽처인 경우에만, 참조 픽처를 리샘플링하는 것이 허용되어도 된다.
또한, 리딩 픽처는, IRAP 픽처보다 표시 순으로 앞이며 또한 부호화 순으로 뒤인 픽처로서 정의될 수 있다. 트레일링 픽처는, IRAP 픽처보다 표시 순 및 부호화 순으로 뒤인 픽처로서 정의될 수 있다.
[제한된 빈도로의 해상도의 변경]
상술한 제약에 의하면, 해상도 변경은, k번째(k는, 1 이상의 정수)의 랜덤 액세스 포인트마다의 픽처에 대해, (부호화 순/복호 순 또는 입력 순/출력 순으로) IRAP에 있어서만 발생하는 것이 허용되며, 다른 픽처에 대해 허용되지 않는다. 본 개시의 일례에 의하면, 당해 k는, 1보다 큰 미리 설정된 정수여도 된다. 즉, 1보다 큰 k의 설정에 의해, 해상도 변경의 빈도가 제한되어도 된다. 이로 인해, 빈발하는 해상도 변경이 억제되며, 특히, 방송 및 브로드밴드 애플리케이션에 있어서의 픽처의 표시 및 후처리 시에 수신 장치에서 발생하는 문제가 경감된다.
예를 들면, 본 개시의 일 양태에 있어서, 2개의 연속하는 해상도 변경이, pps_pic_width_in_luma_samples 및 pps_pic_height_in_luma_samples의 2개의 연속하는 변경, 또는, 참조된 PPS에서 사용된다면 스케일링 윈도우 오프셋으로의 2개의 연속하는 변경에 의해 발생한다. 이러한 2개의 연속하는 해상도 변경 사이의 시간 간격은, 초의 값보다 작아지는 것이 허용되지 않고, 몇 가지 랜덤 액세스 기간에 상당할 것이다.
시간 간격의 제한에 적합한 값은, 5초여도 된다. 이 값, 비디오의 대략 초마다 랜덤 액세스 픽처가 삽입되는 경우의 4~5개의 랜덤 액세스 픽처에 상당한다. 그러나, 본 개시는 이들 숫자로 한정되지 않는다. 통상, 랜덤 액세스 픽처의 빈도는, 상이할 가능성이 있으며, 비디오 회의, 스트리밍 또는 방송 등의 애플리케이션에 맞춰진다. 그 때문에, 방송 및 브로드밴드 애플리케이션용으로 해상도의 변경이 제한되는 시간 간격 사이즈가 규정되어도 된다. 시간 간격 사이즈는, IRAP 수(k) 또는 초로 정의되어도 된다.
이 제약에 의하면, 도 100a에 나타내는 예는, 예를 들면 방송 및 브로드밴드 애플리케이션용의 제약에 따르는 비트 스트림(예를 들면, 제약에 따르는 VVC 비트 스트림)이며, 도 100b에 나타내는 예는, 예를 들면 방송 및 브로드밴드 애플리케이션용의 제약에 따르는 비트 스트림이 아니다. 도 100a 및 도 100b는, 비트 스트림 내의 해상도 변경의 2개의 예를 나타내고 있다.
도 100a에서는, 최초의 GOP가 HD 해상도이고, 4K 해상도의 5개의 GOP(350)가 그것에 이어지고, 다시 한 번, HD 해상도의 다른 GOP가 그것들에 이어진다. 따라서, 도 100a는, 생각할 수 있는 요건 k=5, k=3 및/또는 k=2와 일치한다. 도 100b에서는, 최초의 GOP가 HD 해상도이고, 4K 해상도의 하나의 GOP가 그것에 이어지고, 그리고, HD 해상도의 하나의 GOP가 그것에 이어지며, 4K 해상도의 3개의 GOP가 그것에 이어지고, 마지막으로, HD 해상도의 GOP가 그것들에 이어진다. 이 스트림은, 어느 k>1에도 일치하지 않는다.
어떤 실장예에서는, 2개의 연속하는 해상도 변경 간의 최소 허용 시간 간격이, IRAP 픽처가 고정 기간을 사용하여 비트 스트림에 삽입되어 있는 경우의 고정 랜덤 액세스 기간의 배수값이어도 된다. 이 경우, 최소 허용 시간 간격 및/또는 고정 랜덤 액세스 기간이, 시간 단위(초)로 정의되어도 된다. 다른 실장에서는, 2개의 연속하는 해상도 변경 간의 최소 허용 시간 간격이, 가변 랜덤 액세스 기간의 배수값이어도 된다. 이러한 실장에 의해, 해상도 변경의 빈도를 더 삭감할 수 있다고 생각된다.
또한, 랜덤 액세스 기간은, 랜덤 액세스 포인트로부터 다음 랜덤 액세스 포인트까지의 기간에 대응하고, IRAP 기간으로도 표현된다. 또, 상기와 같이, 최소 허용 시간 간격은, 꼭 초 등의 시간의 단위로 정해지지 않아도 되고, 픽처 수 등에 의해 규정되어도 된다. 따라서, 최소 허용 시간 간격은, 최소 허용 간격 또는 최소 간격으로 표현되어도 된다.
상술한 제약(예를 들면, k는 1 이상)은, 부호화 대상의 픽처 시퀀스를 생성하는 일부, 또는, 부호화 전의 픽처 시퀀스의 전처리로서, 부호화 장치(100)에 있어서 실장되어도 된다.
부호화 방법의 실장예를 도 101에 제공한다. 우선, 부호화 대상의 픽처 시퀀스가 취득된다(S410). 이러한 취득은, 컨텐츠 생성기로부터, 즉, 스트리밍 또는 비디오 회의 애플리케이션 등에 의해 조작되는 (웹 카메라 등의) 카메라로부터의 취득이어도 된다.
시퀀스는, (k 및 원하는 IRAP 기간으로 정의된) 원하는 위치에 이미 해상도 변경을 갖고 있어도 된다. 예를 들면, 부호화 대상의 픽처 시퀀스는, 랜덤 액세스 기간의 k배마다에만 해상도 변경을 갖고 있는 것이 보증되어도 된다. 해당하지 않으면, 전처리(S420)의 사항으로서, 이 제한에 적합시키기 위해, 몇 가지 픽처가 리스케일링되어도 된다. 리스케일링은, 업 스케일링(예를 들면, 업 샘플링)이어도 되고 다운 스케일링(예를 들면, 다운 샘플링)이어도 된다. 리스케일링 수법은, 당해 기술 분야에 있어서 주지의 것이고, 주지의 수법 중 어느 하나가 용이하게 적용될 수 있다.
그리고, 부호화 장치(100)는, 부호화(S430)에 있어서, 상술한 랜덤 액세스 기간 및 k를 사용함으로써 제약을 적용하여, 입력 시퀀스를 부호화한다. 부호화는, 비트 스트림을 생성하기 위한 VVC 또는 다른 규격 코덱에 따라도 된다.
비트 스트림은, 도 101의 오른쪽 측에 도시된 복호 방법에 따라 복호되어도 된다. 구체적으로는, 예를 들면, 방송 브로드밴드 채널 등의 채널로부터, 또는, 스트리밍 혹은 비디오 회의 등을 통해, 비트 스트림이 취득된다(S415).
비트 스트림 또는 추가 제어 정보는, 복호 장치(200)에 제약(k 및/또는 IRAP 기간)의 적용을 나타내도 된다. 복호 장치(200)는, 그 리소스를 적절하게 설정한다(예를 들면, 제약된 기간의 해상도에 따라 메모리 및 처리 능력을 할당한다)(S425). 또한, 설정(S425)은, 몇 가지 복호 장치에서 행해져도 되고, 다른 복호 장치에서 행해지지 않아도 된다. 즉, 설정(S425)은, 행해져도 되고, 행해지지 않아도 된다.
그리고, 단계 S435에 있어서, 픽처 시퀀스가 비트 스트림으로부터 복호된다. 복호(S435) 자체는, 꼭 제약의 명시적인 정보를 필요로 하지 않는다.
부호화 장치(100)에 대응하는 방송 부호화 장치용 방법의 보다 상세한 실장예를 도 102에 나타낸다. 도 102는, 상이한 해상도를 사용하는 여러 대의 카메라로부터 올 가능성이 있는 비디오 신호를 입력으로서 취할 수 있으며, 그것으로부터 VVC 비트 스트림을 생성할 수 있는 방송 부호화 장치의 처리예를 나타내는 플로차트이다.
우선, 컨텐츠의 새로운 부분의 부호화의 개시 시에, 단계 S505에 있어서, 직전의 해상도 변경의 시각(타임 인스턴트)을 나타내는 변수 tResChange가 -x초와 같이 설정된다. 여기서, x는, 연속하는 해상도 변경 간의 최소 허용 시간 간격의 값, 예를 들면, 도 102의 예에서는 x=5초로 설정된다. 상술한 바와 같이, 시간 간격은, 초 등의 시간 단위, 또는, 픽처 수 혹은 GOP 수 등으로 측정되어 나타내어져도 된다. 혹은, tResChange를 제로로 초기화해도 된다.
그리고, 단계 S510에 있어서, 폭 currW(커런트 폭) 및 높이 currH(커런트 높이)의 해상도를 갖는 카메라 currC(예를 들면, 컨텐츠를 촬상하는 복수의 카메라 중 커런트 카메라)로부터의 픽처가 부호화된다.
다음에, 단계 S520에 있어서, 폭 newW 및 높이 newH의 해상도를 갖는 카메라 altC로부터의 부호화 대상 픽처가 있는지가 판정된다. 이 판정 단계 S520은, 어느 카메라가 액티브한지 체크하는 것을 나타낸다. 예를 들면, 입력 비디오 신호를 전송하고 있는 카메라가 바뀌면, 폭 newW 및 높이 newH의 해상도로 currC와는 상이한 카메라(대체 카메라 altC로서 표시된다)로부터 추가로 픽처가 도착한다. 이 경우(단계 S520에서 Yes), 단계 S530에 있어서, currW 및 newW의 값이 같은지와, currH 및 newH의 값이 같은지가 체크된다.
해당하면(단계 S530에서 Yes), 해상도 변경없이 부호화가 계속되고, 단계 S540에 있어서, 커런트 카메라를 나타내는 변수 currC는, 단순히 altC로 설정된다. 그렇지 않으면(단계 S530에서 No), 단계 S550에 있어서, 커런트 매체 시간(커런트 미디어 타임)을 나타내는 변수 t가 결정된다. 전형적으로는, t는, 카메라 altC로부터 오는 최초의 픽처보다 표시 순(부호화 장치(100)에서는 입력 순)으로 앞의 프레임 수를 컨텐츠의 프레임 레이트로 나눈 것으로서 산출된다고 생각된다.
그리고, 단계 S560에 있어서, 직전의 해상도 변경 이후의 시간 간격(t마이너스tResChange에 상당)이 어느 정도 큰지가 체크된다. t마이너스tResChange의 값이 x초(도 102의 예에서는 x는 5와 같다)보다 작으면(단계 S560에서 No), 해상도 변경은 허용되지 않는다. 따라서, 이 경우, 단계 S580에 있어서 카메라 altC로부터의 픽처가 폭 currW 및 높이 currH의 해상도로 리샘플링되고 나서, 단계 S540에 있어서 currC가 altC로 설정되어 부호화(S510)가 계속된다.
t마이너스tResChange의 값이 x초(도 102의 예에서는 x는 5와 같다) 이상이면(단계 S560에서 Yes), 폭 newW 및 높이 newH의 해상도의 IRAP 픽처가 비트 스트림에 삽입된다. 그리고, 카메라 currC로부터의 아직 부호화되지 않은 나머지 픽처가, 참조 픽처 리샘플링을 사용하여 IRAP 픽처의 리딩 픽처로서 폭 currW 및 높이 currH의 전(前) 해상도로 부호화된다(S570).
그리고, 단계 S590에 있어서, 변수 currW, currH 및 tResChange가 각각 newW, newH 및 t의 새로운 값으로 갱신되고 나서, 단계 S540에 있어서 currC가 altC로 설정되어, 부호화(S510)가 계속된다.
다른 카메라 altC로부터의 부호화 대상 픽처가 없는 경우, 즉, 어느 카메라로부터도 더 이상의 픽처가 부호화 장치(100)에 도착하지 않는 경우(단계 S520에서 No), 부호화 비트 스트림을 출력으로서 처리가 종료된다.
또한, 도 102의 예는, 본 개시를 한정하는 것은 아니다. 이것은, 방송 또는 다른 애플리케이션에 적합한 부호화 장치(100)의 상세한 예이다. 그러나, 개별의 실장은, 다양한 점에서 상이해도 된다. 예를 들면, t마이너스tResChange가 x를 초과하는지를 테스트하는 대신에, tResChange마이너스t가 테스트되어도 된다. 도 102의 예에서는, 도 98a과 유사한 비트 스트림이 생성된다. 상술한 바와 같이, 제약은 다양한 상이한 방법으로 실장되어도 되고, 도 98b 및 도 98c에서 예시된 바와 같은 비트 스트림이 생성되어도 된다.
[DASH에 의거한 실장예]
DASH(Dynamic Adaptive Streaming over HTTP)는, MPEG-DASH로서도 알려져 있는, 종래의 HTTP 웹 서버로부터 전송되는 인터넷을 통한 미디어 컨텐츠의 스트리밍을 가능하게 하는 적응 비트 레이트 스트리밍 기술이다. MPEG-DASH는, 컨텐츠(예를 들면, 픽처 시퀀스)를, HTTP를 통해 제공되는 작은 세그먼트의 시퀀스로 분해함으로써 작용한다.
각 세그먼트에는, 컨텐츠(예를 들면, 영화 또는 생방송 등)의 재생 시간에 있어서의 짧은 간격이 포함된다. 컨텐츠는, 복수의 상이한 비트 레이트로 사용 가능하게 되어도 된다. 즉, 대체 세그먼트가, 다양한 비트 레이트로 부호화되고, 재생 시간에 있어서의 얼라이먼트된 짧은 간격을 커버한다. 컨텐츠가 MPEG-DASH 클라이언트에 의해 재생되고 있는 동안, 클라이언트는, 비트 레이트 적응 알고리즘을 사용하여, 재생 시에 실속(失速) 또는 리버퍼링 이벤트를 발생시키지 않고 재생에 시간을 맞출 수 있도록 다운로드될 수 있는 세그먼트로서, 가능한 한 비트 레이트가 높은 세그먼트를 자동적으로 선택해도 된다. 즉, DASH는, 적응 비트 레이트의 가능성을 이미 실장하고 있다.
해상도 변경의 제약이 실장된 상기 복수의 예 중 어느 하나에 의거할 수 있는 예에 의하면, DASH 베이스의 전송에 있어서, 2개의 연속하는 해상도 변경 간의 최소 허용 시간 간격도, 세그먼트 사이즈 또는 세그먼트 사이즈의 배수과 같은 값이어도 된다. 상술한 바와 같이, DASH 베이스의 컨텐츠 전송에서는, 비트 스트림을 복수의 세그먼트로 분할하고, 각 세그먼트는, 상이한 DASH 레프리젠테이션의 (예를 들면, 상술한 바와 같이 비트 레이트가 상이한) 세그먼트 사이에서 전환 가능하도록 IRAP 픽처에서 시작된다.
예를 들면, 장치(부호화 장치(100))에는, 상술한 바와 같은 처리 회로가 설치된다. 처리 회로는, 또한, 픽처 시퀀스의 제1 레프리젠테이션인 제1 비트 스트림을 부호화하고, 동일 픽처 시퀀스의 제2 레프리젠테이션인 제2 비트 스트림을 상이한 품질 또는 해상도로 부호화하도록 구성되어도 된다. 처리 회로는, 또한, 제1 레프리젠테이션 또는 제2 레프리젠테이션의 리퀘스트를 수신 장치로부터 DASH 프로토콜을 통해 수신하고, 리퀘스트에 따라, 제1 비트 스트림 또는 제2 비트 스트림을 수신 장치에 DASH 프로토콜을 통해 송신하도록 구성되어도 된다.
즉, 본 개시의 부호화 장치(100)는, DASH도 서포트하고 있어도 된다. 제1 부호화 비트 스트림 및 제2 부호화 비트 스트림은, 동수(동량)의 DASH 세그먼트를 포함해도 된다. 상술한 예를 뒷받침하기 위해, 제1 부호화 비트 스트림 및/또는 제2 부호화 비트 스트림의 2개의 연속하는 해상도 변경 간의 최소 허용 시간 간격은, 세그먼트 사이즈 또는 세그먼트 사이즈의 배수와 같다. 즉, 상기 k개의 GOP는, 1 이상의 정수 개의 세그먼트를 포함하도록 제약되어도 된다.
DASH 베이스의 서비스는, 전형적으로는, 동일 컨텐츠의 상이한 레프리젠테이션을 이미 준비하고 있다. 각 레프리젠테이션은, 상이한 비트 레이트나, 경우에 따라서는 상이한 해상도를 갖는다. DASH 수신 장치에는, 어느 DASH 세그먼트를 다운로드하고 복호하여 표시할지의 선택권이 있다. DASH 서비스는, DASH 레프리젠테이션 내에서 해상도를 전혀 변경하지 않을 지도 모르고, 혹은, DASH 레프리젠테이션 내의 2개의 연속하는 해상도 변경 간의 간격이 본 개시와 같이 제약될지도 모른다. 그러나, DASH 수신 장치는, 복수의 DASH 레프리젠테이션의 전환에 의해, 다운로드되는 비트 스트림의 해상도를 보다 빈번히 자유롭게 변경할 수 있다.
예를 들면, DASH 서비스가 0.5초의 기간의 DASH 세그먼트를 사용하여, DASH 레프리젠테이션 내의 2개의 연속하는 해상도 변경 간의 간격이 5초 이상으로 제약된다. 이 경우에도, DASH 수신 장치는, 해상도가 상이한 DASH 레프리젠테이션 간의 전환을 보다 빈번히 행한다고 결정해도 된다. 즉, DASH 수신 장치는, DASH 레프리젠테이션 간의 전환을 빈번히 행하여, 도 100b 등의 비트 스트림을 다운로드해도 된다.
한편, 이러한 빈번한 해상도 변경을 취급할 수 없는 DASH 수신 장치는, 최소 허용 시간 간격 중에 1개의 DASH 레프리젠테이션의 세그먼트만을 다운로드하는 것에 따라야 할 것이다. 왜냐하면, 제약에 의해, 단일 DASH 레프리젠테이션 내에서는 빈번한 해상도 변경이 없는 것이 보증되기 때문이다.
DASH 베이스의 전송에서는 종래와 같이, 필요해지는 최소 성능보다 우수한 성능을 DASH 수신 장치가 갖고 있으면, DASH 수신 장치에는 제약을 무시하는 선택권이 있다. 따라서, DASH가 이미 순응성을 제공하고 있었다고 해도, 부호화 장치(100)에 상당하는 DASH 부호화 장치에 제약을 부과하여, 단일 레프리젠테이션 내의 해상도 변경을 DASH 세그먼트의 배수(1, 2, 3 또는 그 이상)에 상당하는 최소 허용 시간 간격 후에 허용하는 것은 유익한 경우가 있다. 또, 몇 가지 실장예에 있어서의 제약은, 상술한 제약에 상당해도 된다. 즉, (픽처 그룹의 배수 다음의) IRAP의 배수(k)에서만 해상도 변경이 행해져도 된다.
도 103은, DASH 프로토콜에 준거하는 서버 장치 및 수신 장치를 나타내는 개념 도이다. 이 예에 있어서, 부호화 장치(100)에 대응하는 서버 장치(1001)는, 통상 비트 레이트용 레프리젠테이션 A, 및, 저(低) 비트 레이트용 레프리젠테이션 B를 보유한다. 레프리젠테이션 A는, 세그먼트 A-1, A-2, A-3, A-4, ···, A-m을 포함한다. 레프리젠테이션 B는, 세그먼트 B-1, B-2, B-3, B-4, ···, B-m을 포함한다.
서버 장치(1001)는, 복호 장치(200)에 대응하는 수신 장치(1002)로부터 리퀘스트를 수신하고, 리퀘스트에 따라 세그먼트 열을 수신 장치(1002)에 송신한다. 이 예에 있어서, 서버 장치(1001)는, 세그먼트 A-1, A-2, B-3, B-4,···A-m을 수신 장치(1002)에 송신한다.
각 세그먼트는, 하나 이상의 GOP를 포함한다. 각 GOP는, 단일한 세그먼트에만 속한다. 예를 들면, 각 세그먼트 내에서는, 해상도의 변경이 허용되지 않고, 세그먼트 사이에서는, 해상도의 변경이 허용된다.
또, 여기에서는, 2개의 레프리젠테이션 A, B가 나타나 있는데, 레프리젠테이션 수는 2로 한정되지 않는다. 또, 레프리젠테이션마다 상이한 해상도가 설정되어도 된다. 또, 각 레프리젠테이션 내에서는, j개 이상의 세그먼트의 간격으로만 해상도의 변경이 허용되어도 된다. 그리고, 각 세그먼트 내에서 해상도의 변경이 허용되지 않는 경우, 각 레프리젠테이션 내에서는, 세그먼트 단위로, j개 이상의 세그먼트의 간격으로만 해상도의 변경이 허용되어도 된다.
예를 들면, 수신 장치(1002)가, 같은 레프리젠테이션의 복수의 세그먼트를 리퀘스트한 경우, j개 이상의 세그먼트의 간격으로만 해상도가 변경될 수 있다. 한편, 수신 장치(1002)가, 서로 상이한 복수의 레프리젠테이션을 전환하면서, 복수의 세그먼트를 리퀘스트한 경우, 보다 빈번히 해상도가 변경될 수 있다.
수신 장치(1002)가, 높은 빈도의 해상도 변경에 대응하는 능력을 갖고 있는 경우, 복수의 레프리젠테이션을 빈번히 전환하여 복수의 세그먼트를 리퀘스트해도 된다. 한편, 수신 장치(1002)가, 높은 빈도의 해상도 변경에 대응하는 능력을 갖지 않은 경우, 복수의 레프리젠테이션을 빈번히 전환하지 않고 복수의 세그먼트를 리퀘스트해도 된다.
[레이트 제어를 위한 해상도 변경]
실장예에 의하면, 레이트 제어를 행하기 위한 수단으로서 해상도 변경을 채용해도 된다. 예를 들면, 상기 부호화 장치(100) 측의 장치에 있어서, 처리 회로는, 또한, 부호화 비트 스트림에 있어서의 비트량을 모니터링하도록 구성되어도 된다. 그리고, 모니터링된 비트량에 의거하여, 처리 회로는, 제1 해상도 또는 제2 해상도를 선택하고, 선택된 해상도로 픽처 시퀀스를 부호화해도 된다. 여기서, 비트량의 모니터링은, 레이트의 모니터링에 상당한다.
체크되어야 할 요건으로서, 당해 요건에 따라 해상도를 변경할지 여부가 판정되고, 달성해야 할 레이트에 대해 정의되는 요건이 몇 가지 있어도 된다. 이들 요건은, 어떠한 소정의 시간 간격에 걸쳐 일정값을 초과하지 않는 단위 시간(초 등) 당 비트 수 등에 의거해도 된다. 이러한 레이트 제어 기구의 상세하고 한정되지 않는 예를 이하에 나타낸다. 레이트 제어 기구는, 또한, IRAP 또는 IRAP의 배수(k번째의 IRAP)에서의 해상도 변경에 관한 상술한 복수의 예 중 어느 하나에 있어서 정의된 제약에 따라도 된다.
도 104a 및 도 104b는, 레이트 제어를 사용하며, 또한, 폭 baseW 및 높이 baseH의 해상도를 갖는 비디오 신호(픽처 시퀀스)를 입력으로서 취하는 방송 부호화 장치(부호화 장치(100))의 처리예를 나타내는 플로차트이다. 우선, 단계 S610에 있어서, 커런트 해상도의 폭 및 높이를 각각 나타내는 변수 currW 및 currH가, 각각 baseW 및 baseH와 같이 설정된다.
단계 S615에서는, 직전의 해상도 변경의 시각(타임 인스턴트)을 나타내는 변수 tResChange가 -x초와 같이 설정된다. 여기서, x는, 연속하는 해상도 변경 간의 최소 허용 시간 간격의 값(예를 들면, x=5초)으로 설정된다. 혹은, tResChange가 제로로 초기화되어도 된다. 부호화 픽처 버퍼(Coded Picture Buffer)에 있어서의 비트 수를 나타내는 변수 BufferFullness는, (똑같이 단계 S615에 있어서) 제로와 같이 설정된다.
이들 초기화 후, 신호(픽처 시퀀스) 중 하나의 GOP(Group Of Pictures)가, 폭 currW 및 높이 currH의 해상도로 부호화되고(S620), 부호화 픽처 버퍼에 있어서의 비트 수가, 변수 BufferFullness에 있어서 트래킹(추적)된다.
단계 S625에서는, 아직 부호화 대상 픽처가 있는지가 판정된다. 아직 부호화 대상 픽처가 있는 경우(단계 S625에서 Yes), 단계 S628에 있어서, BufferFullness의 값이 LowThresBFullness로서 나타내어진 하방 역치보다 크고, 또한, StdThresBFullness로서 나타내어진 표준 역치 이하인지가 체크된다. 이로 인해, 부호화 픽처 버퍼에 있어서의 비트 수를 애플리케이션에서 결정된 범위 내에 넣는 것에 커런트 비트 스트림 레이트가 적합한지가 체크된다.
해당하면(단계 S628에서 Yes), 해상도 변경없이 부호화(S620)가 계속되고, 다음 GOP가 폭 currW 및 높이 currH의 해상도로 부호화된다. 그렇지 않으면(단계 S628에서 No), 커런트 매체 시간(커런트 미디어 타임)을 나타내는 변수 t가 결정되고, 비트 스트림의 비트 레이트를 증감시키기 위한 해상도 변경이 적절한지가 조사된다. 전형적으로는, t는, 도 102를 참조하여 이미 서술된 것과 마찬가지로, 표시 순으로 앞의 프레임 수를 컨텐츠의 프레임 레이트로 나눈 것으로서 산출된다고 생각된다(S630).
그리고, 단계 S635에 있어서, 직전의 해상도 변경 이후의 시간 간격이 어느 정도 큰지가 체크된다. t마이너스tResChange의 값이 x초보다 작으면(단계 S635에서 No), 해상도 변경은 허용되지 않기 때문에, 해상도 변경없이 부호화(S620)가 계속될 필요가 있으며, 다음 GOP가 폭 currW 및 높이 currH의 해상도로 부호화된다.
t마이너스tResChange의 값이 x초 이상이면(단계 S635에서 Yes), 단계 S638에 있어서, BufferFullness를 하방 역치 LowThresBFullness와 비교함으로써, 커런트 비트 스트림 레이트가 적절한지가 보다 상세하게 체크된다. BufferFullness가 역치 LowThresBFullness보다 작은 경우(단계 S638에서 Yes), 비트 스트림 레이트는 실제로는 너무 낮으므로, 레이트 제어의 목적으로 컨텐츠 해상도를 낮출 필요는 없다.
그 경우, 단계 S640에 있어서, 새로운 폭 및 높이를 나타내는 변수 newW 및 newH는, 각각 baseW 및 baseH의 원래의 입력값으로 리셋된다. 폭 newW 및 높이 newH의 해상도의 IRAP 픽처가 비트 스트림에 삽입되고(S650), 부호화에서는, 참조 픽처 리샘플링을 사용하여 새로운 해상도의 새로운 GOP가 개시된다. 단계 S660에 있어서, 변수 currW 및 currH가 각각 신(新) 해상도 newW 및 newH로 갱신되고, 해상도 변경이 발생하는 새로운 값 t로 변수 tResChange가 갱신되고 나서, 폭 currW 및 높이 currH의 해상도로 부호화(S620)가 계속된다.
BufferFullness가 역치 LowThresBFullness보다 큰 경우(단계 S638에서 No)는, BufferFullness가 표준 역치 StdThresBFullness보다 크다는 것도 의미하므로, 비트 스트림의 비트 레이트를 낮추기 위해, 컨텐츠의 해상도를 낮추어야 한다. 해상도를 낮추는 하나의 방법으로서, 단계 S670와 같이, 커런트 폭 및/또는 높이를 예를 들면 2 등의 규정의 계수(factor)로 나누는 방법이 있다.
그리고, 단계 S675에 있어서, 비트 레이트가 너무 높은지를 테스트한다. 비트 레이트가 실제로는 꽤 높은 경우, BufferFullness는, HighThresBFullness로서 나타내어지는 제2 상방 역치보다 더 크다. 이 경우(단계 S675에서 No), 단계 S680에 나타내는 바와 같이, 커런트 폭 및/또는 높이를 규정의 계수로 2회(또는 그 이상의 횟수) 나눔으로써 커런트 해상도를 보다 한층 낮추는 것은 더 유익하다고 생각된다. 소정의 버퍼 범위와 계수에 의거하여 커런트 해상도를 더 낮추기 위해, 또 다른 판정이 추가되어도 된다. 즉, 본 개시는, BufferFullness의 사이즈에 따른 규정의 계수 또는 그 배수의 선택을 포함해도 된다.
BufferFullness가, 표준 역치 StdThresBFullness보다 크고, 제2 상방 역치 HighThresBFullness 이하인 경우(단계 S675에서 Yes), 상기의 처리(단계 S680)는, 스킵된다.
폭 newW 및 높이 newH의 신 해상도가 결정되면(단계 S670 또는 S680), 입력 비디오 신호는, 폭 baseW 및 높이 baseH의 오리지날 해상도로부터 폭 newW 및 높이 newH의 새롭게 산출된 해상도로 리샘플링된다(S690). 그 후, 단계 S650에 있어서, 폭 newW 및 높이 newH의 해상도의 IRAP 픽처가 비트 스트림에 삽입되고, 참조 픽처 리샘플링을 사용하는 새로운 해상도의 새로운 GOP가 개시된다.
더이상 부호화 대상 픽처가 없는 경우(단계 S625에서 No), 부호화 비트 스트림을 출력으로서 처리가 종료된다.
또한, 상기의 상세예는, 일부 변경되어도 된다. 예를 들면, 상기의 상세예에서는, 3개의 역치(LowThresBFullness, HighThresBFullness 및 StdThresBFullness)가 사용되고 있다. 그러나, 2개의 역치(예를 들면, StdThresBFullness, 및, LowThresBFullness와 HighThresBFullness 중 한쪽)만이 사용되어도 된다. 혹은, 1개의 역치(예를 들면, StdThresBFullness)만이 사용되어도 된다. 또, 다양한 비트 레이트 범위를 구성하기 위한 보다 많은 역치가 사용되어도 된다.
또, 복호 장치(200)에 있어서도, 부호화 장치(100)의 상기 처리와 마찬가지로, 비트량의 모니터링을 행해도 된다. 그러나, 복호 장치(200)는, 부호화 장치(100)가 행한 해상도의 변경에 따라 처리를 행함으로써, 비트량의 모니터링의 처리를 생략할 수 있다.
[비트 스트림 수신 장치에서의 동작]
복호 장치(200)에 대응하는 수신 장치의 동작은, 도 101을 참조하면서 이미 간단하게 설명했다. 비트 스트림의 수신 장치는, 단순하게 비트 스트림을 취득하여, 비트 스트림 내에 제공되거나, 또는, 보충 사이드 정보로서 제공된 제어 정보에 따라 비트 스트림을 복호해도 된다. 그러나, 부호화 장치(100)에 의해 적용된 상기 제약과 같은 제약이 복호 장치(200)에 대응하는 수신 장치에 의해 적용되어도 된다. 예를 들면, 제약의 정보에 의거하여 복호가 설정되어도 된다.
예를 들면, 비트 스트림을 픽처 시퀀스로 복호하는 복호 장치(200)(비트 스트림 수신 장치에 상당)가 제공되어도 된다. 당해 복호 장치(200)는, 비트 스트림을, 1회 이상의 픽처 해상도 변경을 포함하는 픽처 시퀀스로 복호하도록 구성된 처리 회로를 구비한다. 복호에 있어서, 제약이 적용된다. 여기서, 제약에 따르는 픽처 해상도 변경은, k번째(k는 정의 정수)의 랜덤 액세스 포인트마다의 픽처에 대해 허용되고, k번째의 랜덤 액세스 포인트마다가 아닌 픽처에 대해 금지된다.
또, 상기 부호화 장치(100)를 참조하여 서술한 바와 같이, 픽처 해상도 변경이란, 복호 순 및/또는 출력 순으로 랜덤 액세스 포인트의 픽처보다 앞의 픽처의 제1 해상도로부터, 랜덤 액세스 포인트의 픽처, 및, 복호 순 및/또는 출력 순으로 랜덤 액세스 포인트의 픽처보다 뒤의 픽처의 제2 해상도로의 변경이다.
도 105는, 제약에 의거한 복호를 위한 계산 리소스 및/또는 메모리 리소스의 할당에 있어서 제약을 적용하도록 처리 회로가 구성된 예를 나타낸 플로차트이다. 도 105는, 참조 픽처 리샘플링을 사용하는 비트 스트림을 수신하고, IRAP 또는 IRAP의 배수에서만의 해상도 변경의 상기 제약(경우에 따라서는, 상기에서 예시된 어떠한 또 다른 제약)에 따르는 처리의 플로차트이다.
우선, 단계 S710에 있어서, 신택스 요소 sps_pic_width_max_in_luma_samples 및 sps_pic_height_max_in_luma_samples가 판독됨으로써, 비트 스트림의 최대 해상도가 SPS로부터 판독된다. 신택스 요소 sps_pic_width_max_in_luma_samples 및 sps_pic_height_max_in_luma_samples는, 각각 SPS를 참조하는 각 복호 완료 픽처의 최대 폭 및 최대 높이를 휘도 샘플 단위로 나타낸다.
그리고, 또한 단계 S710에서는, 비트 스트림 내의 픽처의 최대 폭을 나타내는 변수 MaxW가, sps_pic_width_max_in_luma_samples와 같이 설정된다. 또, 비트 스트림 내의 픽처의 최대 높이를 나타내는 변수 MaxH가, sps_pic_height_max_in_luma_samples와 같이 설정된다. 그리고, 복호 리소스가, MaxW 및 MaxH에 의거하여 할당된다. 또, 커런트 폭을 나타내는 변수 currW가, MaxW와 같이 설정된다. 또, 커런트 높이를 나타내는 변수 currH가, MaxH와 같이 설정된다. 그리고, 후처리 리소스가, currW, currH, 및, 표시(출력) 해상도에 의거하여 할당된다.
그리고, 비트 스트림의 복호는, IRAP 픽처에서 시작된다. 단계 S720에 있어서, IRAP 픽처에서 참조되는 PPS로부터 해상도가 판독된다. IRAP 픽처 및 그것에 이어지는 픽처의 폭을 나타내는 변수 newW는, pps_pic_width_in_luma_samples와 같이 설정되고, IRAP 픽처 및 그것에 이어지는 픽처의 높이를 나타내는 변수 newH는, pps_pic_height_in_luma_samples와 같이 설정된다.
파라미터 pps_pic_width_in_luma_samples 및 pps_pic_height_in_luma_samples는, PPS로부터 판독된 해상도를 나타내고, PPS를 참조하는 각 복호 완료 픽처의 폭 및 높이를 휘도 샘플 단위로 나타낸다.
또한, 이 예는, VVC에 준거하는 예에 지나지 않는다. 본 개시는, VVC로 한정되지 않고, 임의의 코덱 내에 또는 임의의 코덱으로 실장되어도 된다. 따라서, 해상도는, 색차 샘플로 나타내어져도 되고, 다른 방법(예를 들면, 규정 해상도 후보 세트의 요소로서 등)으로 나타내어져도 된다.
그리고, 단계 S730에 있어서, 신 해상도 newW×newH가 커런트 해상도 currW×currH와 같은지가 체크된다. 해당하지 않으면(단계 S730에서 No), 단계 S740에 있어서, 새로운 후처리 리소스가 newW, newH 및 표시 해상도에 의거하여 할당되고, 변수 currW 및 currH가, 각각 newW 및 newH와 같이 설정됨으로써 갱신된다.
그리고, 단계 S750에서는, 비트 스트림의 다음 x초 내의 픽처가 복호되어 후처리된다. 여기서, x는, 연속하는 해상도 변경 간의 최소 허용 시간 간격을 나타낸다. 예를 들면, 도 102 및 도 105(여기서 설명하는 복호 장치(200)에 의해 복호되는 복호 가능한 비트 스트림을 생성할 수 있는 부호화 장치(100))의 예에서는, x=5초이다.
그리고, 단계 S760에 있어서, 다음 IRAP 픽처까지, 픽처가 복호되어 후처리 된다.
신 해상도 newW×newH가 커런트 해상도 currW×currH와 같다고 판정된 경우(단계 S730에서 Yes), 새로운 후처리 리소스를 할당하는 단계는 스킵될 수 있다. 그리고, 단계 S760에 있어서, 다음 IRAP 픽처까지, 픽처가 복호되어 후처리 된다. 그리고, 처리가 종료되는 비트 스트림의 마지막에 도달하지 않는 한, IRAP 픽처에서 참조되는 PPS에 있어서 시그널링되는 해상도의 체크(S720)로 처리가 되돌아온다.
예를 들면, 후처리 리소스는, 메모리 리소스 또는 계산 리소스를 포함해도 된다. 후처리는, 화상의 리샘플링, 화상의 색 공간 또는 다이나믹 레인지의 표시 성능으로의 매핑, 및, 포스트 필터링, 선명화 또는 필름 그레인 노이즈의 부가 등의 화질 개선을 위한 임의의 알고리즘 중 하나 이상을 포함해도 된다.
본 개시에 따른 구성에 의해, 방송 및 브로드밴드 애플리케이션에도 참조 픽처 리샘플링을 이용할 수 있을 가능성이 있다. 그로 인해, 비트 스트림의 비트 레이트의 보다 나은 제어를 얻기 위해 신호의 해상도의 부분적인 변경이 유익해질 수 있는 레이트 제어의 경우, 또는, 해상도가 상이한 다양한 소스로부터 신호가 오는 경우, 수신 장치가 후처리 리소스를 빈번히 적응시킬 필요가 없다는 것을 확실하게 함으로써 수신 장치에 그다지 영향을 주지 않고, 부호화 효율이 개선될 수 있다.
[규정 해상도 세트(제2 양태)]
VVC 규격은, 예측 대상 픽처와 그 참조 픽처 사이의 임의의 값의 스케일링비로 동작하도록 설계되어 있다. 그 때문에, 준거하는 복호 장치(200)는, 어떠한 임의의 해상도 변경에 대해서도 서포트에 있어서 문제를 가져서는 안 된다. 그러나, 표시 및 후처리에 있어서, 임의의 해상도 사이에서의 전환은, 곤란할지도 모른다.
본 개시의 양태에 의하면, 규정 해상도 세트 내에서의 전환만이 허용된다. 이 양태는, 픽처 시퀀스 내의 해상도 변경의 위치에 대한 제약을 지정하는 양태의 예와 조합되어도 된다. 특히, 본 양태는, 부호화 및 그에 대응하여 복호에 부과되는 추가 제약이어도 된다. 그러나, 규정 해상도 세트에 대한 해상도의 제한은, 또, 상술한 제약을 사용하는 것과 관계없이 개별적으로 사용되어도 된다.
본 개시의 일례에 의하면, 픽처 시퀀스를 부호화하는 부호화 장치(100)는, 처리 회로(상기의 복수의 예와 같은 처리 회로여도 된다)를 포함한다. 처리 회로는, 픽처 시퀀스의 부호화에 있어서, 미리 설정된 소정 해상도 세트 중 복수의 해상도로만 픽처 해상도 변경이 허용되는 제약을 적용하도록 구성된다.
예를 들면, 미리 설정된 세트는, 수평 또는 수직 방향으로 1, 2 또는 3/2의 비율로 스케일링함으로써 커런트 해상도로부터 취득 가능한 해상도를 포함한다. 수신 장치(복호 장치(200)) 및/또는 송신 장치(부호화 장치(100))에서의 복잡함을 제한하기 위해 용이하게 리스케일링할 수 있는 해상도를 제공하는 것은 유익할지도 모른다.
예를 들면, 2의 비율로의 다운 샘플링은, 커런트 해상도의 행 및/또는 열을 단순히 생략(스킵)함으로써 행해질 수 있다. 2의 비율로의 업 샘플링은, 예를 들면, 바로 옆의 (인접) 샘플의 값과의 평균을 취함으로써 용이하게 실장되어도 된다. 대체로 2개 또는 4개의 인접 샘플이 있으므로, 평균값을 구하기 위한 필요한 나눗셈은, 우측 바이너리 시프트에 의해 용이하게 실장될 수 있다.
본 개시의 일례에 의하면, 미리 설정된 세트는, 수평 또는 수직 방향으로 소정의 정수 또는 분수로 스케일링하는 것, 및/또는, 샘플 수에 있어서 픽처의 폭 및/또는 높이의 값을 인크리먼트 또는 디크리먼트함으로써, 커런트 해상도로부터 취득되는 해상도를 포함한다. 예를 들면, 인크리먼트 또는 디크리먼트되는 값의 양은, 취득 해상도를 커런트 해상도의 정수배 또는 분수배로 하는 것이다.
즉, 미리 설정된 세트는, 커런트 해상도를 복수의 고정 비율로 스케일링함으로써 정해지는 복수의 해상도를 포함해도 되고, 커런트 해상도에 대해 복수의 고정 차분값의 가산 또는 감산을 적용함으로써 정해지는 복수의 해상도를 포함해도 된다.
이하에, 이 양태에 관하여 더 상세하게 설명한다. 여기서의 규정 해상도 세트란, 규정 해상도만을 포함하는 세트이다. 여기서의 규정이란, 예를 들면, 스트리밍 규격 또는 방송 규격, 혹은, 특허로 보호된 스트리밍 애플리케이션 등이어도 되는 규격에 있어서의 사양을 의미한다. 이것은, 부호화를 행하기 전에, 유저에 의해 미리 결정되어도 된다. 규정 해상도 세트는, 8K, 4K 및 HD 등의 일반적인 방송 및 브로드밴드 해상도를 사용하여 유리하게 형성되어도 된다. 참조 픽처 리샘플링에 대해 최적의(또는 적어도 유익한) 허용 규정 해상도 세트를 선택하기 위해, 일반적인 규정 해상도에 대한 규정 비율 세트를 사용할 수 있다.
일례로서, 움직임 보상에 사용되는 VVC 리샘플링 보간 필터는, 커런트 픽처의 사이즈의 2배, 커런트 픽처의 사이즈의 3/2배, 또는, 커런트 픽처와 같은 사이즈의 참조 픽처를 상정하여 최적화되어 있다. 이들 비율은, 참조 픽처 리샘플링을 사용할 때에 가장 좋은 압축 효율을 제공하는 것일 가능성이 높기 때문에, 이들 비율을 사용하여 규정 해상도 세트가 결정되어도 된다. 구체적으로는, 휘도 샘플에 있어서의, 전 해상도의 사이즈의 2배, 전 해상도의 사이즈의 1.5배, 전 해상도의 사이즈의 2/3, 또는, 전 해상도의 사이즈의 절반의 픽처 해상도로 전환하는 것만이 허용되어도 된다.
본 양태에 있어서, 사이즈란, 휘도 샘플에 있어서의 폭만, 또는, 휘도 샘플에 있어서의 높이만, 또는, 휘도 샘플에 있어서의 폭 및 높이 양쪽을 의미해도 된다. 상술한 바와 같이, 본 개시는, 사이즈의 단위로 한정되지 않는다. 예를 들면, 휘도 샘플 대신에 색차 샘플로 사이즈가 카운트되어도 되고, 다른 방법으로 사이즈가 카운트되어도 된다.
방송 및 브로드밴드 애플리케이션에서 사용되는 일반적인 해상도를 고려하여, 본 양태에 따르는 방송 또는 브로드밴드 VVC 비트 스트림은, 이하의 해상도(이들 중 2개 이상 또는 전부) 사이의 변경으로 제한되어도 된다.
(1) 7680×4320(일반적으로 8K 또는 UHD-2로 불리고 있다), 및, 5120×2880
(2) 7680×4320(일반적으로 8K 또는 UHD-2로 불리고 있다), 및, 3840×2160(일반적으로 4K 또는 UHD-1로 불리고 있다)
(3) 3840×2160(일반적으로 4K 또는 UHD-1로 불리고 있다), 및, 2560×1440
(4) 3840×2160(일반적으로 4K 또는 UHD-1로 불리고 있다), 및, 1920×1080(일반적으로 풀 HD로 불리고 있다)
(5) 1920×1080(일반적으로 풀 HD로 불리고 있다), 및, 1280×720(일반적으로 HD ready로 불리고 있다)
(6) 1920×1080(일반적으로 풀 HD로 불리고 있다), 및, 960×540
본 양태에 있어서, 수신 장치는, 상기의 (1), (3) 및 (5)의 경우, 해상도를 3/2배로 높이거나, 혹은, 해상도를 2/3로 낮추는 것만으로, 해상도를 전환할 수 있다. 혹은, 수신 장치는, 상기의 (2), (4) 및 (6)의 경우, 해상도를 2배로 높이거나, 혹은, 해상도를 1/2로 낮추는 것만으로, 해상도를 전환할 수 있다.
이러한 구성에 의하면, 해상도 7680×4320에서 해상도 1920×1080으로 낮추는 전환은, 2개의 허용되는 변경 (2) 및 (4)를 조합함으로써 간접적으로만 가능하다고 생각된다. 구체적으로는, 우선, IRAP 픽처에 있어서 7680×4320에서 3840×2160으로 해상도가 절반이 되고, 비디오의 x초(예를 들면 5초 등) 후, 다른 IRAP 픽처에 있어서 3840×2160에서 1920×1080으로 해상도를 절반으로 함으로써 2회째의 전환이 행해진다.
혹은, 상기와 같은 간접적인 전환이 허용되는 2개의 해상도 간의 직접적인 전환이 허용되어도 된다. 즉, 간접적인 전환이 허용되는 2개의 해상도 간의 전환이 1개의 IRAP 픽처에 있어서 행해져도 된다.
또, 상기의 (1)~(6)의 조합에 따르지 않고, 상기의 (1)~(6)에 기재된 복수의 해상도 중 임의의 2개의 해상도 간의 전환이 허용되어도 된다. 또, 상기의 (1)~(6)의 조합에 따르지 않고, 상기의 (1)~(6)에 기재된 복수의 해상도 중에서 1세트 이상의 전환 가능한 해상도의 조합이 새롭게 정해져도 된다.
예를 들면, 해상도를 5120×2880에서 3840×2160으로 낮추는 전환 및, 해상도를 2560×1440에서 1920×1080으로 낮추는 전환 등이 허용되어도 된다. 이러한 전환은, 해상도를 3/4배로 낮추는 것에 상당한다. 또 반대로, 해상도를 3840×2160에서 5120×2880으로 높이는 전환 및, 해상도를 1920×1080에서 2560×1440으로 높이는 전환 등이 허용되어도 된다. 이러한 전환은, 해상도를 4/3배로 높이는 것에 상당한다.
규정 허용 해상도 세트를 지정하는 다른 예는, 폭 및/또는 높이에서 빠지거나, 또는, 폭 및/또는 높이에 더해지는 값을 사용하는 것이도 된다. 그로 인해, 이 값의 배수도 허용된다. 이하는, 이러한 값의 몇 가지 예이다.
(1) 1920의 배수에 의한 폭의 축소에 의해 허용되는 해상도 폭의 값:7680, 5760, 3840, 1920
(2) 1080의 배수에 의한 높이의 축소에 의해 허용되는 해상도 높이의 값:4320, 3240, 2160, 1080
(3) 960의 배수에 의한 폭의 축소에 의해 허용되는 해상도 폭의 값:3840, 2880, 1920, 960
(4) 540의 배수에 의한 높이의 축소에 의해 허용되는 해상도 높이의 값:2160, 1620, 1080, 540
(5) 480의 배수에 의한 폭의 축소에 의해 허용되는 해상도 폭의 값:1920, 1440, 960, 480
(6) 270의 배수에 의한 높이의 축소에 의해 허용되는 해상도 높이의 값:1080, 810, 540, 270
몇 가지 실장에서는, 상기 축소예 중 하나만을 허용해도 된다. 다른 실장에서는, 이들 축소예 중 2개 이상 또는 전부를 허용해도 된다. 동일하게 해석되는 또 다른 축소예가 있어도 된다. 예를 들면, 통상, 곱셈 또는 1회 이상의 덧셈에 의해, 규정 사이즈 S의 배수를 허용하여 취득해도 된다.
도 106a 및 도 106b는, 상이한 해상도를 사용하여 몇 개의 카메라로부터 올 가능성이 있는 비디오 신호를 입력으로서 취득할 수 있으며, 그것으로부터 VVC 비트 스트림을 본 양태의 실장예에 따라 생성할 수 있는 방송 부호화 장치(부호화 장치(100))의 처리예를 나타내는 플로차트이다.
우선, 컨텐츠의 새로운 부분의 부호화가 개시되면, 직전의 해상도 변경의 시각(타임 인스턴트)을 나타내는 변수 tResChange는 -x초와 같이 설정된다(S805). 여기서, x는, 연속하는 해상도 변경 간의 최소 허용 시간 간격의 값으로 설정되며, 예를 들면, 도 106a 및 도 106b의 예에서는 x=5초로 설정된다. 여기에서는 상술한 예와 같이, 예시로서만 5초가 선택되었다. 당업자에게는 명백하듯이, x의 실제의 값은, 5보다 작아도 되고(예를 들면 2 또는 3초), 또는, 커도 된다(예를 들면, 6, 7 또는 10초 등).
그리고, 단계 S810에 있어서, 커런트 카메라를 나타내는 카메라 currC로부터의 신호가 폭 currW 및 높이 currH의 해상도로 부호화된다. 단계 S815에 있어서, 해상도 newW 및 newH의 다른 카메라 altC로부터의 부호화 대상 픽처가 있는지가 체크된다. 예를 들면, 입력 비디오 신호를 전송하고 있는 카메라가 갑자기 바뀌면, 폭 newW 및 높이 newH의 해상도를 갖고, altC로 표시되며, currC와는 상이한 카메라로부터, 추가로 픽처가 도착한다. 이 경우(단계 S815에서 Yes), 단계 S818에 있어서, currW의 값과 newW의 값이 같은지, 및, currH의 값과 newH의 값이 같은지가 체크된다.
해당하면(단계 S818에서 Yes), 해상도 변경없이 부호화가 계속되고, 단계 S820에 있어서, 커런트 카메라를 나타내는 변수 currC는, 단순히 altC로 설정된다(이 단계는, 같은 currW 및 currH를 유지하게 되므로, 여기에서는 상술한 예와 같이 생략되어도 된다). 그렇지 않으면(단계 S818에서 No), 단계 S830에 있어서, 커런트 매체 시간(커런트 미디어 타임)을 나타내는 변수 t가 결정된다. 전형적으로는, t는, 표시 순으로, 카메라 altC로부터 오는 최초의 픽처보다 앞의 프레임 수를 컨텐츠의 프레임 레이트로 나눈 것으로서 산출된다고 생각된다.
그리고, 단계 S835에 있어서, 직전의 해상도 변경 이후의 시간 간격이 어느 정도 큰지가 체크된다. t마이너스tResChange의 값이 x초(단, 도 106a 및 도 106b의 예에서는 x는 5와 같다)보다 작으면(단계 S835에서 No), 해상도 변경은 허용되지 않는다. 따라서, 이 경우, 단계 S840에 있어서 카메라 altC로부터의 픽처가 폭 currW 및 높이 currH의 해상도로 리샘플링되고 나서, currC가 altC로 설정되어 부호화(S810)가 계속된다.
t마이너스tResChange의 값이 x초(도 106a 및 도 106b의 예에서는 x는 5와 같다) 이상이면(단계 S835에서 Yes), 단계 S850에 있어서, 스케일링비가 산출된다. 구체적으로는, 참조 IRAP 픽처의 폭(새로운 폭)과 그 리딩 픽처의 폭(이전 폭)의 폭의 스케일링비를 나타내는 변수 ratioW가, newW 나누기 currW로 산출된다. 또, 참조 IRAP 픽처의 높이(새로운 높이)와 그 리딩 픽처의 높이(이전 높이)의 높이의 스케일링비를 나타내는 변수 ratioH가 newH 나누기 currH로 산출된다.
그리고, 단계 S855에 있어서, ratioW 및 ratioH가 허용치 중 하나와 같은지가 체크된다. 도 106a 및 도 106b의 예에서는, 허용치는 2, 3/2, 2/3 또는 1/2이다. 이들은, 상술된 바와 같은 미리 설정된 세트의 규정 해상도로 이어지므로 허용되는 값이다.
해당하면(단계 S855에서 Yes), 폭 newW 및 높이 newH의 해상도의 IRAP 픽처가 비트 스트림에 삽입된다(S860). 그리고, 카메라 currC로부터의 아직 부호화되지 않은 나머지 픽처가, 참조 픽처 리샘플링을 사용하여 IRAP 픽처의 리딩 픽처로서 폭 currW 및 높이 currH의 전 해상도로 부호화된다. 그리고, 단계 S865에 있어서, 변수 currW, currH 및 tResChange가 각각 newW, newH 및 t의 새로운 값으로 갱신되고 나서, 단계 S820 및 S810에 있어서, currC가 altC로 설정되어 부호화가 계속된다.
ratioW 또는 ratioH의 값이 허용치 중 하나가 아닌 경우(단계 S855에서 No), 단계 S870에 있어서, 가장 가까운 허용치가 변수 selRatioW 및 selRatioH로 각각 결정된다. 단계 S875에 있어서, selRatioW 곱하기 currW로 대체 폭 altW가 산출되고, selRatioH 곱하기 currH로 대체 높이 altH가 산출된다.
그리고, 단계 S880에 있어서, 카메라 altC로부터의 신호가, 대체 해상도 altW×altH로 리샘플링 되고 나서, 대응 단계 S890에 있어서, 폭 altW 및 높이 altH의 해상도의 IRAP 픽처가 비트 스트림에 삽입된다. 그리고, 카메라 currC로부터의 아직 부호화되지 않은 나머지 픽처가, 참조 픽처 리샘플링을 사용하여 IRAP 픽처의 리딩 픽처로서 폭 currW 및 높이 currH의 전 해상도로 부호화된다.
그리고, 단계 S895에 있어서, 변수 currW, currH 및 tResChange가 각각 altW, altH 및 t의 값으로 갱신되고 나서, currC가 altC로 설정되어, 부호화(S810)가 계속된다(단계 S820도 참조). 다른 카메라 altC로부터의 부호화 대상 픽처가 없는 경우, 즉, 어느 카메라로부터도 더 이상의 픽처가 부호화 장치(100)에 도착하지 않는 경우(단계 S815에서 No), 부호화 비트 스트림을 출력으로서 처리가 종료된다.
[규정 해상도 세트의 경우의 레이트 제어]
실장예에 의하면, 도 104a 및 도 104b를 참조하여 상술한 예와 마찬가지로, 레이트 매칭은, 해상도 변경의 수단에 의해 레이트를 제어할 수 있다는 것을 이용한다. 규정 해상도 세트에 대한 상술된 제약을 적용하면, 레이트 매칭을 더 심플화할 수 있다.
도 107a 및 도 107b는, 레이트 제어를 사용하며, 또한, 폭 baseW 및 높이 baseH의 해상도를 갖는 비디오 신호를 입력으로서 취하는 방송 부호화 장치(부호화 장치(100))의 처리예를 나타내는 플로차트이다. 폭 baseW 및 높이 baseH의 해상도는, 참조 픽처 리샘플링에 대해 허용 해상도 중 하나인 것으로 가정된다. 우선, 단계 S910에 있어서, 커런트 해상도의 폭 및 높이를 각각 나타내는 변수 currW 및 currH가, 각각 baseW 및 baseH와 같이 설정된다.
단계 S920에서는, 직전의 해상도 변경의 시각(타임 인스턴트)을 나타내는 변수 tResChange가 -x초와 같이 설정된다. 여기서, x는, 연속하는 해상도 변경 간의 최소 허용 시간 간격의 값으로 설정된다. 혹은, tResChange가 제로로 초기화되어도 된다. 단계 S920에 있어서, 부호화 픽처 버퍼에 있어서의 비트 수를 나타내는 변수 BufferFullness는, 제로와 같이 설정된다.
그리고, 단계 S930에 있어서, 신호 중 하나의 GOP(Group Of Pictures)가, 폭 currW 및 높이 currH의 해상도로 부호화되고, 부호화 픽처 버퍼에 있어서의 비트 수가, 변수 BufferFullness에 있어서 트래킹(추적) 된다.
단계 S935에서는, 아직 부호화 대상 픽처가 있는지가 테스트된다. 아직 부호화 대상 픽처가 있는 경우(단계 S935에서 Yes), 단계 S938에 있어서, 애플리케이션에 의해 결정된 원하는 범위 내에 BufferFullness의 값이 있는지가 체크된다.
애플리케이션은, 예를 들면, 특정의 스트리밍, 방송 또는 비디오 회의 애플리케이션 등이어도 된다. 이러한 애플리케이션에는, 어떤 허용 범위 내에 일정한 비트 레이트를 포함한다는 요건이 있어도 된다. 이러한 요건은, 예를 들면, 부호화 비트 스트림을 전송하는 경우의 채널 리소스의 적절한 양을 확보해 두기 위해 유익할지도 모른다. 또, 이러한 요건은, 재생을 위한 복호 장치(200)(예를 들면, 재생 장치 또는 수신 장치 등), 및/또는, 부호화 장치(100)의 하드웨어 설계에 유익할지도 모른다.
해당하면(단계 S938에서 Yes), 해상도 변경없이 부호화(S930)가 계속되고, 다음 GOP가 폭 currW 및 높이 currH의 해상도로 부호화된다. 그렇지 않으면(단계 S938에서 No), 단계 S940에 있어서, 커런트 매체 시간(커런트 미디어 타임)을 나타내는 변수 t가 결정되고, 비트 스트림의 비트 레이트를 증감시키기 위한 해상도 변경이 적절한지가 조사된다. 전형적으로는, t는, 상술한 예에서 이미 서술된 바와 같이, 표시 순으로 지금까지 부호화된 프레임 수를 컨텐츠의 프레임 레이트로 나눈 것으로서 산출된다고 생각된다.
그리고, 단계 S945에 있어서, 직전의 해상도 변경 이후의 시간 간격이 어느 정도 큰지가 체크된다. t마이너스tResChange의 값이 x초보다 작으면(단계 S945에서 No), 해상도 변경은 허용되지 않기 때문에, 해상도 변경없이 부호화가 계속되고, 다음 GOP가 폭 currW 및 높이 currH의 해상도로 부호화된다(S930).
t마이너스tResChange의 값이 x초 이상이면(단계 S945에서 Yes), 단계 S948에 있어서, BufferFullness가 원하는 범위보다 아래인지 위인지를 체크함으로써, 커런트 비트 스트림 레이트가 적절한지가 보다 상세하게 체크된다. BufferFullness가 원하는 범위보다 아래인 경우(단계 S948에서 Yes), 비트 스트림 레이트가 실제로는 너무 낮다. 이 경우, 단계 S950에 있어서, 비트 스트림의 비트 레이트를 높이기 위해, currW보다 큰 폭 newW와 currH보다 큰 높이 newH의 보다 큰 해상도가 허용 해상도 세트로부터 선택된다.
BufferFullness가 원하는 범위보다 위인 경우(단계 S948에서 No), 비트 스트림의 비트 레이트를 낮추기 위해, 컨텐츠의 해상도를 낮춰야 한다. 따라서, 단계 S960에 있어서, currW보다 작은 폭 newW와 currH보다 작은 높이 newH의 보다 작은 해상도가 허용 해상도 세트로부터 선택된다.
폭 newW 및 높이 newH의 신 해상도가 결정되면, 단계 S970에 있어서, 폭 baseW 및 높이 baseH의 오리지날 해상도로부터 폭 newW 및 높이 newH의 신 해상도로 입력 비디오 신호가 리샘플링된다. 그 후, (단계 S980에 있어서) 폭 newW 및 높이 newH의 해상도의 IRAP 픽처가 비트 스트림에 삽입되고, 참조 픽처 리샘플링을 사용하는 새로운 해상도의 새로운 GOP가 개시된다.
단계 S990에 있어서, 변수 currW 및 currH가 각각 신 해상도 newW 및 newH로 갱신되고, 해상도 변경이 발생하는 새로운 값 t로 변수 tResChange가 갱신되고 나서, 폭 currW 및 높이 currH의 해상도로 부호화(S930)가 계속된다.
더이상 부호화 대상 픽처가 없는 경우(단계 S935에서 No), 부호화 비트 스트림을 출력으로서 처리가 종료된다.
제약된 해상도 세트에 관한 본 양태에 따른 구성에 의해, 일반적인 방송 및 브로드밴드 해상도에 대해, 제한된 허용 해상도 세트 내에서만, 참조 픽처 리샘플링이 사용될 가능성이 있다. 따라서, 표시 및 후처리에 있어서의 해상도의 전환이 용이해져, 임의의 해상도를 서포트할 필요가 없다. 또, 해상도 변경을 사용하는 것을 포함하여, 더 효율적인 레이트 제어가 행해질 수 있다.
[시퀀스 파라미터 세트에 있어서의 해상도의 시그널링(제3 양태)]
VVC 규격은, PPS에 있어서 시그널링된 해상도와는 상이한 SPS에 있어서의 해상도의 시그널링을 허용하여, 참조 픽처 리샘플링을 유효하게 한다. 비디오 코딩 규격에서는, 전형적으로는, 해상도는 시퀀스 파라미터 세트(SPS)에 있어서 시그널링된다. 왜냐하면, 새로운 IRAP 픽처가 SPS 정보를 덮어쓰기할 때까지, 해상도가 부호화 비디오 시퀀스 전체에 적용되기 때문이다. 그러나, 참조 픽처 리샘플링이 유효하게 되면, 부호화 비디오 시퀀스 내의 각 픽처는, 이론상, 상이한 해상도를 가질 수 있으므로, 픽처 파라미터 세트(PPS) 내에서 어느 픽처에 대해서도 해상도 시그널링이 필요하다.
SPS 및 PPS 신택스 요소에 대한 유일한 제약은, 비트 스트림 내에서 참조 PPS에 있어서 시그널링되는 해상도는, SPS에 있어서 시그널링되는 해상도 이하가 아니면 안된다는 것이다. 즉, 이하의 2개의 관계가 만족되지 않으면 안된다.
(1) sps_pic_width_max_in_luma_samples≥pps_pic_width_in_luma_samples
(2) sps_pic_height_max_in_luma_samples≥pps_pic_height_in_luma_samples
본 양태에서는, 픽처 해상도를 시그널링하는 SPS 신택스 요소는, 모든 참조 PPS에 있어서의 픽처 해상도를 시그널링하는 PPS 신택스 요소의 최대값과 같지 않으면 안된다고 하는 추가 제약이 설정된다. 즉, 비트 스트림 내의 적어도 하나의 픽처는, 폭 sps_pic_width_max_in_luma_samples 및 높이 sps_pic_height_max_in_luma_samples의 해상도를 사용할 필요가 있다.
바꾸어 말하면, 본 양태에 있어서, 비트 스트림은, 픽처 시퀀스에 대한 수직 및/또는 수평 방향의 최대 픽처 해상도를 포함하는 시퀀스 파라미터 세트(SPS)를 포함한다. 또한, 비트 스트림은, 픽처에 대한 수직 및/또는 수평 방향의 픽처 해상도를 포함하는 적어도 하나의 픽처 파라미터 세트(PPS)를 포함한다. SPS에 있어서 시그널링되는 해상도는, 당해 SPS를 참조하는 어느 하나의 PPS에 있어서 나타낼 가능성이 있는 최대 해상도보다 크지 않다.
본 양태는, 시퀀스 레벨(예를 들면, SPS마다) 및 픽처 레벨(예를 들면, PPS)로 파라미터를 나타내는 어떤 비디오 코덱에도 적용 가능하고, 예시된 VVC로 한정되지 않는다. (상술한 제약과 같이) 이 제약은, 예를 들면, 비디오 코딩 파라미터를 구성하는 스트리밍 규격에 의해 실시되어도 된다.
제약을 인식하는 복호 장치(200)는, 예를 들면, 비트 스트림을 복호하기 위해 필요 이상의 리소스를 할당할 필요가 없는 등, 처리 리소스의 스케줄링에 있어서 그 제약을 고려해도 된다. 그러나, 본 개시는, 그것으로 한정되지 않고, 비디오 코덱의 신택스 포맷에 제약이 임베드되어도 된다. 그에 따라, PPS 및 SPS의 보다 컴팩트하고 효율적인 부호화가 제공된다.
또한, 본 양태에서 나타나는 제약은, 상술한 제약과 조합해도 되지만, 꼭 조합할 필요는 없는 제약이다. 예를 들면, 본 개시의 다른 양태에서는, IRAP 픽처에서 해상도가 변화될 수 있다. 또, SPS는, 랜덤 액세스 단위, 즉 GOP 단위로 정해질 수 있다. 따라서, 본 개시의 다른 양태와 조합하는 경우, IRAP 픽처에서의 변화 전 또는 변화 후의 해상도가, SPS에 있어서 시그널링되는 해상도에 일치하도록 제한되어도 된다.
예를 들면, IRAP 픽처에서 해상도가 떨어지는 경우, 리딩 픽처의 해상도가, 폭 sps_pic_width_max_in_luma_samples 및 높이 sps_pic_height_max_in_luma_samples로 제한되어도 된다. IRAP 픽처에서 해상도가 높아지는 경우, IRAP 및 그것에 이어지는 픽처의 해상도가, 폭 sps_pic_width_max_in_luma_samples 및 높이 sps_pic_height_max_in_luma_samples로 제한되어도 된다.
본 양태에 따른 구성에 의해, 수신 장치(복호 장치(200))는, 참조 픽처 리샘플링을 사용하여 비트 스트림을 복호할 때에 필요 이상의 복호 리소스를 할당할 필요가 없다.
상기의 복수의 양태에서 나타난 바와 같이, 본 개시는, 수신 장치의 처리를 경감하기 위해, 참조 픽처 리샘플링을 사용하는 비트 스트림을 제약하는 것에 관한 것이다. 특히, RPR이 빈발함으로써, 표시를 포함하는 후단 처리의 사이즈의 전환이 빈번히 일어날 가능성이 있어, 제어가 복잡화된다. 또, RPR이 빈발함으로써, 커런트 픽처 및 참조 픽처에 대한 메모리 액세스 방법의 전환(메모리 맵의 전환)이 빈번히 일어나, 제어가 복잡화된다.
이 문제에 대응하기 위해, 제1 양태에서는, 비트 스트림 구조(그리고, 이러한 비트 스트림 구조를 생성 및 복호하기 위한 대응하는 부호화 장치(100) 및 복호 장치(200)의 동작)는, 랜덤 액세스 픽처 또는 랜덤 액세스 픽처의 배수에서만 해상도 변경을 포함할 수 있다. 따라서, 수신 장치는, 리소스의 재할당이 필요한 타이밍을 랜덤 액세스 포인트의 타이밍만으로 삭감할 수 있다.
이 방법으로, 해상도 변경의 빈도는 일정값 이하로 유지된다. 한편, DASH 수신 장치는, 제약에 따를 필요가 없이, 비트 스트림 내의 2개의 해상도 변경 간의 최소 허용 시간 간격보다 빈번히, 상이한 해상도의 DASH 레프리젠테이션 사이에서 전환을 행해도 된다.
RPR의 전환 패턴이 다수 있으면, 그것들에 대응하는 수의, 표시를 포함하는 후단 처리의 매칭 사이즈의 패턴이 필요해지므로 다른 문제가 발생할 가능성이 있고, 실장이 복잡화된다. 또, RPR의 전환 패턴이 다수 있으면, 그것들에 대응하는 수의, 커런트 픽처 및 참조 픽처에 대한 메모리 액세스 방법의 전환(메모리 맵의 전환)의 패턴이 필요해질 가능성이 있어, 실장이 복잡화된다.
제2 양태에서는, 이 문제에 대응하기 위해, 비트 스트림 내의 참조 픽처 리샘플링은, 소정 해상도 세트 내에서만 허용된다. 소정 해상도 세트 내의 2개의 해상도 간의 스케일링비로서 허용되는 값은, ×2, ×3/2, ×2/3, 또는, ×1/2 등의 허용치 세트로 제한되어도 된다. 부호화 장치(100)에 있어서의 비디오 신호의 리샘플링을 사용하여, 제약을 만족하고, 및/또는, 레이트 제어를 유효하게 해도 된다.
GOP에 있어서 실제로는 사용되지 않는 큰 사이즈가 SPS에 기술되어 있는 경우, 복호 장치(200)는 SPS의 사이즈에 따라 메모리 리소스 등을 확보하여, 쓸데없이 대량의 리소스를 확보하지 않으면 안된다는 다른 문제가 발생할 가능성이 있다. 제3 양태에서는, 시퀀스 파라미터 세트에 시그널링된 해상도가, 픽처 파라미터 세트에 시그널링된 해상도의 최대값보다 커지는 것은 허용되지 않는다. 해상도는, 휘도 샘플 단위로, 픽처의 폭만, 픽처의 높이만, 또는, 폭과 높이 양쪽으로서 이해된다.
[또 다른 하드웨어 및 소프트웨어 실장]
또한, 처리 회로(부호화 장치(100)에서의 것 및/또는 복호 장치(200)에서의 것)는, 소프트웨어 및/또는 하드웨어의 임의의 조합을 사용하여 구성되어도 된다. 예를 들면, 처리 회로는, 메모리로부터 페치된 소프트웨어(코드 명령)를 사용하여 구성된 하나 이상의 프로세서여도 된다. 그에 따라, 부호화 장치(100) 및 복호 장치(200)는, 메모리를 구비해도 된다. 이하에, 부호화 장치(100) 및 복호 장치(200)의 실장예를 더 설명한다. 부호화 장치(100) 및 복호 장치(200)의 처리 회로는, 또한, 방법으로서 여기에 기재된 임의의 단계를 행하도록 구성되어도 된다.
예를 들면, 부호화 장치(100)는, 회로와, 회로에 접속된 메모리를 구비해도 된다. 회로는, 동작에 있어서, 랜덤 액세스 인트라 예측 픽처에서만 해상도 변경을 허용함으로써, 수신 장치(복호 장치(200))가 취급하기 쉬운 제약을 갖는 비트 스트림에 있어서 참조 픽처 리샘플링을 사용한다.
또, 복호 장치(200)는, 회로와, 회로에 접속된 메모리를 구비해도 된다. 회로는, 동작에 있어서, 랜덤 액세스 인트라 예측 픽처에서만 리소스의 재할당이 필요해지는 방법으로, 참조 픽처 리샘플링을 사용하여 비트 스트림을 복호한다.
본 개시는, 하나 이상의 프로세서에 의한 실장으로 한정되지 않는다. 전용 하드웨어 또는 프로그램 가능한 하드웨어가 포함되어도 되고, 그러한 조합이어도 된다. 통상, 부호화 장치(100)는, 임의의 하드웨어 및/또는 소프트웨어를 사용하여 실장된 모듈을 구비해도 된다. 이러한 모듈은, 예를 들면, 이하와 같은 것이어도 된다.
(1) 적어도 하나의 화상이 입력되는 입력 단자
(2) 적어도 하나의 화상에 포함되는 제1 화상을 복수의 블록으로 분할하는 블록 분할기
(3) 제1 화상에 포함되는 참조 픽처를 사용하여, 제1 화상에 포함되는 블록을 예측하는 인트라 예측기
(4) 제1 화상과는 상이한 제2 화상에 포함되는 참조 블록을 사용하여, 제1 화상에 포함되는 블록을 예측하는 인터 예측기
(5) 제1 화상에 포함되는 블록에 필터를 적용하는 루프 필터
(6) 인트라 예측기 또는 인터 예측기에 의해 생성된 예측 신호와 원신호의 예측 오차를 변환하여 변환 계수를 생성하는 변환기
(7) 변환 계수를 양자화하여 양자화 계수를 생성하는 양자화기
(8) 양자화 계수를 가변 길이 부호화함으로써 부호화 비트 스트림을 생성하는 엔트로피 부호화기
(9) 부호화된 양자화 계수와 제어 정보를 포함하는 부호화 비트 스트림이 출력되는 출력 단자
여기서, 랜덤 액세스 인트라 예측 픽처에서만 해상도 변경을 허용함으로써, 수신 장치(복호 장치(200))가 취급하기 쉬운 제약을 따라, 참조 픽처 리샘플링을 사용하는 비트 스트림이 생성된다.
그에 따라, 복호 장치(200)에는, 이하의 모듈이 설치되어도 된다.
(1) 부호화 비트 스트림이 입력되는 입력 단자
(2) 부호화 비트 스트림을 복호하여 양자화 계수를 출력하는 (엔트로피 복호기 등의) 복호기
(3) 양자화 계수를 역양자화하여 변환 계수를 출력하는 역양자화기
(4) 변환 계수를 역변환하여 예측 오차를 출력하는 역변환기
(5) 제1 화상에 포함되는 참조 픽처를 사용하여, 화상에 포함되는 블록을 예측하는 인트라 예측기
(6) 제1 화상과는 상이한 제2 화상에 포함되는 참조 블록을 사용하여, 제1 화상에 포함되는 블록을 예측하는 인터 예측기
(7) 제1 화상에 포함되는 블록에 필터를 적용하는 루프 필터
(8) 제1 화상을 포함하는 픽처가 출력되는 출력 단자
여기서, 랜덤 액세스 인트라 예측 픽처에서만 리소스의 재할당이 필요해지는 방법으로, 참조 픽처 리샘플링을 사용하여 비트 스트림이 복호된다.
마찬가지로, 랜덤 액세스 인트라 예측 픽처에서만 해상도 변경을 허용함으로써, 수신 장치(복호 장치(200))가 취급하기 쉬운 제약을 따라, 참조 픽처 리샘플링을 사용하는 비트 스트림을 생성하는 단계를 포함하는 부호화 방법이 제공되어도 된다. 또, 랜덤 액세스 인트라 예측 픽처에서만 리소스의 재할당이 필요해지는 방법으로, 참조 픽처 리샘플링을 사용하여 비트 스트림을 복호하는 단계를 포함하는 복호 방법이 제공되어도 된다.
[구성 및 처리의 대표예]
상기에 나타난 부호화 장치(100) 및 복호 장치(200)의 구성 및 처리의 대표예를 이하에 나타낸다.
도 108은, 부호화 장치(100)가 행하는 동작을 나타내는 플로차트이다. 예를 들면, 부호화 장치(100)는, 회로, 및, 회로에 접속된 메모리를 구비한다. 부호화 장치(100)가 구비하는 회로 및 메모리는, 도 8에 나타나는 프로세서(a1) 및 메모리(a2)에 대응하고 있어도 된다. 부호화 장치(100)의 회로는, 동작에 있어서, 이하를 행한다.
예를 들면, 부호화 장치(100)의 회로는, 제약에 따라, 픽처의 해상도를 표시 순 및 부호화 순 중 한쪽 순서로 앞의 선행 픽처의 해상도로부터 변경할지 여부를 제어한다(S1081). 이 제약에서는, 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용된다.
또, 참조 픽처의 해상도가 인터 예측 픽처의 해상도와는 상이한 경우, 부호화 장치(100)의 회로는, 참조 픽처의 해상도와 인터 예측 픽처의 해상도의 차이에 따라, 참조 픽처의 참조 화상을 리샘플링한다. 여기서, 참조 픽처는, 인터 예측 픽처의 부호화에 사용되는 참조 픽처이다. 그리고, 부호화 장치(100)의 회로는, 리샘플링된 참조 화상을 사용하여 인터 예측 픽처의 화상을 부호화한다(S1082).
이로 인해, 부호화 장치(100)는, 해상도의 빈번한 변경을 억제할 수 있는 경우가 있다. 따라서, 부호화 장치(100)는, 계산 리소스 및 메모리 리소스의 소비를 억제할 수 있는 경우가 있으며, 부담을 경감할 수 있는 경우가 있다. 또, 부호화 장치(100)는, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스가 항상 확보되는 것을 억제할 수 있는 경우가 있다. 또, 부호화 장치(100)는, 시험의 곤란함을 저감할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, 픽처가, k번째의 랜덤 액세스 픽처마다의 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만, 픽처의 해상도를 변경하는 것이 허용되어도 된다. 여기서, k는, 1보다 큰 정수이다.
이로 인해, 부호화 장치(100)는, 해상도의 변경을 더 억제할 수 있는 경우가 있다. 따라서, 부호화 장치(100)는, 계산 리소스 및 메모리 리소스의 소비를 더 억제할 수 있는 경우가 있으며, 부담을 더 경감할 수 있는 경우가 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 복수의 픽처를 비트 스트림에 순차적으로 부호화해도 된다. 또, 부호화 장치(100)의 회로는, 비트 스트림의 비트량을 모니터링해도 된다. 그리고, 부호화 장치(100)의 회로는, 모니터링된 비트량에 따라, 픽처의 해상도의 변경을 제어해도 된다.
이로 인해, 부호화 장치(100)는, 비트 스트림의 비트량에 따라 해상도를 변경할 수 있는 경우가 있으며, 해상도의 변경에 따라 비트 스트림의 비트량을 조정할 수 있는 경우가 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 부호화해도 된다. 계속해서, 부호화 장치(100)의 회로는, 표시 순으로 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 부호화해도 된다.
계속해서, 부호화 장치(100)의 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 부호화해도 된다. 계속해서, 부호화 장치(100)의 회로는, 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 부호화해도 된다.
상기의 제약에 있어서, 적어도 하나의 리딩 픽처의 해상도는, 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되지 않아도 된다. 또, 랜덤 액세스 픽처의 해상도는, 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되어도 된다. 또, 적어도 하나의 제2 트레일링 픽처의 해상도는, 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않아도 된다.
이로 인해, 부호화 장치(100)는, 표시 순에 있어서, 랜덤 액세스 픽처에서만 해상도를 변경할 수 있는 경우가 있다. 따라서, 부호화 장치(100)는, 표시 순을 따라, 해상도의 변경을 원활하게 행할 수 있는 경우가 있다.
또, 예를 들면, 부호화 장치(100)의 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 부호화해도 된다. 계속해서, 부호화 장치(100)의 회로는, 표시 순으로 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 부호화해도 된다.
계속해서, 부호화 장치(100)의 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 부호화해도 된다. 계속해서, 부호화 장치(100)의 회로는, 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 부호화해도 된다.
상기의 제약에 있어서, 랜덤 액세스 픽처의 해상도는, 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되어도 된다. 또, 적어도 하나의 리딩 픽처의 해상도는, 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않아도 된다. 또, 적어도 하나의 제2 트레일링 픽처의 해상도는, 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되지 않아도 된다.
이로 인해, 부호화 장치(100)는, 부호화 순에 있어서, 랜덤 액세스 픽처에서만 해상도를 변경할 수 있는 경우가 있다. 따라서, 부호화 장치(100)는, 부호화 순을 따라, 해상도의 변경을 원활하게 행할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, DASH 프로토콜로 정해지는 복수의 세그먼트 각각에 대해서, 당해 세그먼트 내에서 픽처의 해상도를 변경하는 것이 허용되지 않아도 된다.
이로 인해, 부호화 장치(100)는, 해상도의 변경을 세그먼트 단위로 제한할 수 있는 경우가 있다. 따라서, 이로 인해, 부호화 장치(100)는, 해상도의 빈번한 변경을 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, DASH 프로토콜로 정해지는 복수의 레프리젠테이션 각각에 있어서, 역치보다 짧은 간격으로 픽처의 해상도를 변경하는 것이 허용되지 않아도 된다.
이로 인해, 부호화 장치(100)는, 같은 레프리젠테이션에 있어서, 짧은 간격으로 해상도를 변경하는 것을 억제할 수 있는 경우가 있다. 따라서, 이로 인해, 부호화 장치(100)는, 해상도의 빈번한 변경을 더 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, 픽처의 해상도가 복수의 해상도 후보 중 어느 하나로 제한되어도 된다.
이로 인해, 부호화 장치(100)는, 복수의 해상도 후보 중 어느 하나로 해상도를 제한할 수 있는 경우가 있다. 따라서, 부호화 장치(100)는, 처리의 복잡화를 억제할 수 있는 경우가 있다. 또, 부호화 장치(100)는, 시험의 곤란함을 저감할 수 있는 경우가 있다.
또, 예를 들면, 복수의 해상도 후보는, 선행 픽처의 해상도를 복수의 고정 비율로 스케일링함으로써 정해지는 복수의 해상도 후보를 포함해도 된다.
이로 인해, 부호화 장치(100)는, 변경 전의 해상도로부터 고정 비율을 사용하여 원활하게 해상도를 변경할 수 있는 경우가 있다. 또, 부호화 장치(100)는, 고정 비율을 사용하여 원활하게 참조 화상을 리샘플링 할 수 있는 경우가 있다. 따라서, 부호화 장치(100)는, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 복수의 고정 비율은, 2배, 3/2배, 4/3배, 3/4배, 2/3배 및 1/2배 중 적어도 하나를 포함해도 된다.
이로 인해, 부호화 장치(100)는, 참조 화상을 리샘플링 하는 것이 용이한 비율로 해상도를 변경할 수 있는 경우가 있다. 따라서, 부호화 장치(100)는, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 복수의 해상도 후보는, 7680×4320 화소, 5120×2880 화소, 3840×2160 화소, 2560×1440 화소, 1920×1080 화소, 1280×720 화소 및 960×540 화소로 정해지는 복수의 해상도 후보를 포함해도 된다.
이로 인해, 부호화 장치(100)는, 범용적인 해상도를 이용할 수 있는 경우가 있으며, 범용성을 유지할 수 있는 경우가 있다.
또, 예를 들면, 복수의 해상도 후보는, 선행 픽처의 해상도에 대해 복수의 고정 차분값의 가산 또는 감산을 적용함으로써 정해지는 복수의 해상도 후보를 포함해도 된다.
이로 인해, 부호화 장치(100)는, 변경 전의 해상도, 및, 고정 차분값에 따라, 변경 후의 해상도를 적절하게 제한할 수 있는 경우가 있으며, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, 시퀀스 파라미터 세트에 있어서 상한으로서 지정되는 최대 해상도가, 픽처 파라미터 세트에 있어서 적어도 하나의 픽처의 해상도로서 지정되는 해상도와 같은 것으로 제한되어도 된다. 이 픽처 파라미터 세트는, 시퀀스 파라미터 세트가 적용되는 복수의 픽처 중 적어도 하나의 픽처에 적용되는 픽처 파라미터 세트이다.
그리고, 부호화 장치(100)의 회로는, 제약에 따라 정해지는 최대 해상도를 시퀀스 파라미터 세트에 부호화하고, 적어도 하나의 픽처의 해상도로서 지정되는 해상도를 픽처 파라미터 세트에 부호화해도 된다.
이로 인해, 부호화 장치(100)는, 시퀀스 파라미터 세트에 있어서 너무 큰 최대 해상도가 지정되는 것을 억제할 수 있는 경우가 있다. 따라서, 부호화 장치(100)는, 너무 큰 계산 리소스 및 메모리 리소스가 확보되는 것을 억제할 수 있는 경우가 있다.
또, 예를 들면, 부호화 장치(100)의 인터 예측부(126)가, 부호화 장치(100)의 회로로서, 상술된 동작을 행해도 된다. 또, 인터 예측부(126)는, 다른 구성 요소와 협동하여, 상술된 동작을 행해도 된다.
도 109는, 복호 장치(200)가 행하는 동작을 나타내는 플로차트이다. 예를 들면, 복호 장치(200)는, 회로, 및, 회로에 접속된 메모리를 구비한다. 복호 장치(200)가 구비하는 회로 및 메모리는, 도 68에 나타나는 프로세서(b1) 및 메모리(b2)에 대응하고 있어도 된다. 복호 장치(200)의 회로는, 동작에 있어서, 이하를 행한다.
예를 들면, 복호 장치(200)의 회로는, 제약에 따라, 픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 앞의 선행 픽처의 해상도로부터 변경할지 여부를 제어한다(S1091). 이 제약에서는, 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용된다.
또, 참조 픽처의 해상도가 인터 예측 픽처의 해상도와는 상이한 경우, 복호 장치(200)의 회로는, 참조 픽처의 해상도와 인터 예측 픽처의 해상도의 차이에 따라, 참조 픽처의 참조 화상을 리샘플링한다. 여기서, 참조 픽처는, 인터 예측 픽처의 복호에 사용되는 참조 픽처이다. 그리고, 복호 장치(200)의 회로는, 리샘플링된 참조 화상을 사용하여 인터 예측 픽처의 화상을 복호한다(S1092).
이로 인해, 복호 장치(200)는, 해상도의 빈번한 변경을 억제할 수 있는 경우가 있다. 따라서, 복호 장치(200)는, 계산 리소스 및 메모리 리소스의 소비를 억제할 수 있는 경우가 있으며, 부담을 경감할 수 있는 경우가 있다. 또, 복호 장치(200)는, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스가 항상 확보되는 것을 억제할 수 있는 경우가 있다. 또, 복호 장치(200)는, 시험의 곤란함을 저감할 수 있는 경우가 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 복호 화상을 표시하기 위한 후처리에 대해 계산 리소스 및 메모리 리소스 중 적어도 하나를 상기의 제약에 따라 할당해도 된다.
이로 인해, 복호 장치(200)는, 복호 화상을 표시하기 위한 후처리에 대해 필요 또한 충분한 계산 리소스 또는 메모리 리소스를 제약에 따라 준비할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, 픽처가, k번째의 랜덤 액세스 픽처마다의 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만, 픽처의 해상도를 변경하는 것이 허용되어도 된다. 여기서, k는, 1보다 큰 정수이다.
이로 인해, 복호 장치(200)는, 해상도의 변경을 더 억제할 수 있는 경우가 있다. 따라서, 복호 장치(200)는, 계산 리소스 및 메모리 리소스의 소비를 더 억제할 수 있는 경우가 있으며, 부담을 더 경감할 수 있는 경우가 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 복수의 픽처를 비트 스트림으로부터 순차적으로 복호해도 된다. 또, 복호 장치(200)의 회로는, 비트 스트림의 비트량을 모니터링해도 된다. 그리고, 복호 장치(200)의 회로는, 모니터링된 비트량에 따라, 픽처의 해상도의 변경을 제어해도 된다.
이로 인해, 복호 장치(200)는, 비트 스트림의 비트량에 따라 해상도를 변경할 수 있는 경우가 있으며, 해상도의 변경에 따라 비트 스트림의 비트량을 조정할 수 있는 경우가 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 복호해도 된다. 계속해서, 복호 장치(200)의 회로는, 표시 순으로 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 복호해도 된다.
계속해서, 복호 장치(200)의 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 복호해도 된다. 계속해서, 복호 장치(200)의 회로는, 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 복호해도 된다.
상기의 제약에 있어서, 적어도 하나의 리딩 픽처의 해상도는, 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되지 않아도 된다. 또, 랜덤 액세스 픽처의 해상도는, 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되어도 된다. 또, 적어도 하나의 제2 트레일링 픽처의 해상도는, 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않아도 된다.
이로 인해, 복호 장치(200)는, 표시 순에 있어서, 랜덤 액세스 픽처에서만 해상도를 변경할 수 있는 경우가 있다. 따라서, 복호 장치(200)는, 표시 순을 따라, 해상도의 변경을 원활하게 행할 수 있는 경우가 있다.
또, 예를 들면, 복호 장치(200)의 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 복호해도 된다. 계속해서, 복호 장치(200)의 회로는, 표시 순으로 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 복호해도 된다.
계속해서, 복호 장치(200)의 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 복호해도 된다. 계속해서, 복호 장치(200)의 회로는, 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 복호해도 된다.
상기의 제약에 있어서, 랜덤 액세스 픽처의 해상도는, 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되어도 된다. 또, 적어도 하나의 리딩 픽처의 해상도는, 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않아도 된다. 또, 적어도 하나의 제2 트레일링 픽처의 해상도는, 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되지 않아도 된다.
이로 인해, 복호 장치(200)는, 복호 순에 있어서, 랜덤 액세스 픽처에서만 해상도를 변경할 수 있는 경우가 있다. 따라서, 복호 장치(200)는, 복호 순을 따라, 해상도의 변경을 원활하게 행할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, DASH 프로토콜로 정해지는 복수의 세그먼트 각각에 대해서, 당해 세그먼트 내에서 픽처의 해상도를 변경하는 것이 허용되지 않아도 된다.
이로 인해, 복호 장치(200)는, 해상도의 변경을 세그먼트 단위로 제한할 수 있는 경우가 있다. 따라서, 이로 인해, 복호 장치(200)는, 해상도의 빈번한 변경을 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, DASH 프로토콜로 정해지는 복수의 레프리젠테이션 각각에 있어서, 역치보다 짧은 간격으로 픽처의 해상도를 변경하는 것이 허용되지 않아도 된다.
이로 인해, 복호 장치(200)는, 같은 레프리젠테이션에 있어서, 짧은 간격으로 해상도를 변경하는 것을 억제할 수 있는 경우가 있다. 따라서, 이로 인해, 복호 장치(200)는, 해상도의 빈번한 변경을 더 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, 픽처의 해상도가 복수의 해상도 후보 중 어느 하나로 제한되어도 된다.
이로 인해, 복호 장치(200)는, 복수의 해상도 후보 중 어느 하나로 해상도를 제한할 수 있는 경우가 있다. 따라서, 복호 장치(200)는, 처리의 복잡화를 억제할 수 있는 경우가 있다. 또, 복호 장치(200)는, 시험의 곤란함을 저감할 수 있는 경우가 있다.
또, 예를 들면, 복수의 해상도 후보는, 선행 픽처의 해상도를 복수의 고정 비율로 스케일링함으로써 정해지는 복수의 해상도 후보를 포함해도 된다.
이로 인해, 복호 장치(200)는, 변경 전의 해상도로부터 고정 비율을 사용하여 원활하게 해상도를 변경할 수 있는 경우가 있다. 또, 복호 장치(200)는, 고정 비율을 사용하여 원활하게 참조 화상을 리샘플링할 수 있는 경우가 있다. 따라서, 복호 장치(200)는, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 복수의 고정 비율은, 2배, 3/2배, 4/3배, 3/4배, 2/3배 및 1/2배 중 적어도 하나를 포함해도 된다.
이로 인해, 복호 장치(200)는, 참조 화상을 리샘플링하는 것이 용이한 비율로 해상도를 변경할 수 있는 경우가 있다. 따라서, 복호 장치(200)는, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 복수의 해상도 후보는, 7680×4320 화소, 5120×2880 화소, 3840×2160 화소, 2560×1440 화소, 1920×1080 화소, 1280×720 화소 및 960×540 화소로 정해지는 복수의 해상도 후보를 포함해도 된다.
이로 인해, 복호 장치(200)는, 범용적인 해상도를 이용할 수 있는 경우가 있으며, 범용성을 유지할 수 있는 경우가 있다.
또, 예를 들면, 복수의 해상도 후보는, 선행 픽처의 해상도에 대해 복수의 고정 차분값의 가산 또는 감산을 적용함으로써 정해지는 복수의 해상도 후보를 포함해도 된다.
이로 인해, 복호 장치(200)는, 변경 전의 해상도, 및, 고정 차분값에 따라, 변경 후의 해상도를 적절하게 제한할 수 있는 경우가 있으며, 처리의 복잡화를 억제할 수 있는 경우가 있다.
또, 예를 들면, 상기의 제약에서는, 시퀀스 파라미터 세트에 있어서 상한으로서 지정되는 최대 해상도가, 픽처 파라미터 세트에 있어서 적어도 하나의 픽처의 해상도로서 지정되는 해상도와 같은 것으로 제한되어도 된다. 이 픽처 파라미터 세트는, 시퀀스 파라미터 세트가 적용되는 복수의 픽처 중 적어도 하나의 픽처에 적용되는 픽처 파라미터 세트이다.
그리고, 복호 장치(200)의 회로는, 제약에 따라 정해지는 최대 해상도를 시퀀스 파라미터 세트로부터 복호하고, 적어도 하나의 픽처의 해상도로서 지정되는 해상도를 픽처 파라미터 세트로부터 복호해도 된다.
이로 인해, 복호 장치(200)는, 시퀀스 파라미터 세트에 있어서 너무 큰 최대 해상도가 지정되는 것을 억제할 수 있는 경우가 있다. 따라서, 복호 장치(200)는, 너무 큰 계산 리소스 및 메모리 리소스가 확보되는 것을 억제할 수 있는 경우가 있다.
또, 예를 들면, 복호 장치(200)의 인터 예측부(218)가, 복호 장치(200)의 회로로서, 상술된 동작을 행해도 된다. 또, 인터 예측부(218)는, 다른 구성 요소와 협동하여, 상술된 동작을 행해도 된다.
또, 예를 들면, 본 개시의 일 양태에 따른 비일시적인 컴퓨터 판독 가능한 기록 매체는, 비트 스트림을 기억하고 있어도 된다. 비트 스트림은, 복수의 픽처와, 복수의 픽처를 비트 스트림으로부터 복호하는 복호 처리를 행하기 위한 복수의 파라미터를 포함하고 있어도 된다.
복호 처리에서는, 복수의 파라미터에 따르는 동작에 있어서, 제약에 따라, 픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 앞의 선행 픽처의 해상도로부터 변경할지 여부가 제어되어, 인터 예측 픽처의 화상이 복호되어도 된다. 제약에서는, 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되어도 된다.
참조 픽처의 해상도가 인터 예측 픽처의 해상도와는 상이한 경우, 참조 픽처의 해상도와 인터 예측 픽처의 해상도의 차이에 따라, 참조 픽처의 참조 화상이 리샘플링되어도 된다. 여기서, 참조 픽처는, 인터 예측 픽처의 복호에 사용되는 참조 픽처이다. 그리고, 리샘플링된 참조 화상을 사용하여 인터 예측 픽처의 화상이 복호되어도 된다.
이로 인해, 해상도의 빈번한 변경을 억제하는 것이 가능해지는 경우가 있다. 따라서, 계산 리소스 및 메모리 리소스의 소비를 억제하는 것이 가능해지는 경우가 있으며, 부담을 경감하는 것이 가능해지는 경우가 있다. 또, 해상도의 변경에 대응하는 계산 리소스 및 메모리 리소스가 항상 확보되는 것을 억제하는 것이 가능해지는 경우가 있다. 또, 시험의 곤란함을 저감하는 것이 가능해지는 경우가 있다.
또, 예를 들면, 복수의 파라미터는, 복수의 픽처 중 하나 이상의 픽처의 해상도의 변경이 허용되는지 여부를 나타내는 제1 파라미터와, 픽처의 해상도를 나타내는 제2 파라미터를 포함하고 있어도 된다. 제1 파라미터에 따라 하나 이상의 픽처의 해상도의 변경이 허용되고, 픽처가 하나 이상의 픽처에 포함되며, 제약에 따라 픽처의 해상도의 변경이 허용되는 경우, 제2 파라미터에 따라 픽처의 해상도가 변경되어도 된다.
이로 인해, 해상도의 변경에 관한 제약 및 복수의 파라미터에 따라, 해상도의 빈번한 변경을 억제하면서, 해상도를 변경하는 것이 가능해지는 경우가 있다.
또한, 리샘플링되는 참조 화상은, 참조 픽처에 있어서의 참조 블록의 참조 화상이어도 된다. 또, 참조 화상을 사용하여 부호화 또는 복호되는 화상은, 인터 예측 픽처에 있어서의 블록의 화상이어도 된다.
또, 참조 화상의 리샘플링에 있어서, 참조 픽처의 해상도에 대한 인터 예측 픽처의 해상도의 비율에 따라 참조 픽처의 참조 화상이 스케일링되어도 된다. 예를 들면, 참조 픽처의 해상도에 대한 인터 예측 픽처의 해상도의 비율이 x배이면, x배로 참조 픽처의 참조 화상이 스케일링되어도 된다.
또, 픽처의 해상도를 제한하기 위한 해상도 후보는, 규정 해상도에 대응하고 있어도 된다.
또, 제1 파라미터는, sps_res_change_in_clvs_allowed_flag에 대응하고 있어도 된다. 제2 파라미터는, pps_pic_width_in_luma_samples, pps_pic_height_in_luma_samples, pps_scaling_win_left_offset, pps_scaling_win_right_offset, pps_scaling_win_top_offset 및 pps_scaling_win_bottom_offset 중 하나 이상에 대응하고 있어도 된다.
[그 외의 예]
상술된 각 예에 있어서의 부호화 장치(100) 및 복호 장치(200)는, 각각, 화상 부호화 장치 및 화상 복호 장치로서 이용되어도 되고, 동화상 부호화 장치 및 동화상 복호 장치로서 이용되어도 된다.
혹은, 부호화 장치(100) 및 복호 장치(200)는, 인터 예측 장치로서 이용되어도 된다. 즉, 부호화 장치(100) 및 복호 장치(200)는, 각각, 인터 예측부(126) 및 인터 예측부(218)에만 대응하고 있어도 된다. 그리고, 다른 구성 요소는, 다른 장치에 포함되어 있어도 된다.
또, 부호화 장치(100)는, 입력부 및 출력부를 구비하고 있어도 된다. 예를 들면, 부호화 장치(100)의 입력부에 하나 이상의 픽처가 입력되고, 부호화 장치(100)의 출력부로부터 부호화 비트 스트림이 출력된다. 복호 장치(200)도, 입력부 및 출력부를 구비하고 있어도 된다. 예를 들면, 복호 장치(200)의 입력부에 부호화 비트 스트림이 입력되고, 복호 장치(200)의 출력부로부터 하나 이상의 픽처가 출력된다. 부호화 비트 스트림은, 가변 길이 부호화가 적용된 양자화 계수와, 제어 정보를 포함하고 있어도 된다.
또, 부호화한다는 표현은, 보관한다, 포함한다, 기입한다, 기술한다, 신호화한다, 송출한다, 통지한다, 또는, 저장한다 등의 표현으로 치환되어도 된다. 예를 들면, 정보를 부호화하는 것은, 비트 스트림에 정보를 포함시키는 것이어도 된다. 또, 정보를 비트 스트림에 부호화하는 것은, 정보를 부호화하여, 부호화된 정보를 포함하는 비트 스트림을 생성하는 것을 의미해도 된다.
또, 복호한다는 표현은, 읽어낸다, 해독한다, 판독한다, 읽어들인다, 도출한다, 취득한다, 수취한다, 추출한다, 또는, 복원한다 등의 표현으로 치환되어도 된다. 예를 들면, 정보를 복호하는 것은, 비트 스트림으로부터 정보를 취득하는 것이어도 된다. 또, 비트 스트림으로부터 정보를 복호하는 것은, 비트 스트림을 복호하여, 비트 스트림에 포함되는 정보를 취득하는 것을 의미해도 된다.
또, 상술된 각 예의 적어도 일부가, 부호화 방법으로서 이용되어도 되고, 복호 방법으로서 이용되어도 되며, 인터 예측 방법으로서 이용되어도 되고, 그 외의 방법으로서 이용되어도 된다.
또, 각 구성 요소는, 전용 하드웨어로 구성되거나, 각 구성 요소에 적합한 소프트웨어 프로그램을 실행함으로써 실현되어도 된다. 각 구성 요소는, CPU 또는 프로세서 등의 프로그램 실행부가, 하드 디스크 또는 반도체 메모리 등의 기록 매체에 기록된 소프트웨어 프로그램을 읽어내어 실행함으로써 실현되어도 된다.
구체적으로는, 부호화 장치(100) 및 복호 장치(200) 각각은, 처리 회로(Processing Circuitry)와, 당해 처리 회로에 전기적으로 접속된, 당해 처리 회로로부터 액세스 가능한 기억 장치(Storage)를 구비하고 있어도 된다. 예를 들면, 처리 회로는 프로세서(a1 또는 b1)에 대응하고, 기억 장치는 메모리(a2 또는 b2)에 대응한다.
처리 회로는, 전용 하드웨어 및 프로그램 실행부 중 적어도 한쪽을 포함하고, 기억 장치를 사용하여 처리를 실행한다. 또, 기억 장치는, 처리 회로가 프로그램 실행부를 포함하는 경우에는, 당해 프로그램 실행부에 의해 실행되는 소프트웨어 프로그램을 기억한다. 여기서, 상술한 소프트웨어 프로그램의 일례는, 비트 스트림이다. 비트 스트림은, 복호된 픽처의 데이터와, 픽처의 데이터를 복호하는 복호 처리를 행하기 위한 신택스를 포함한다. 비트 스트림은, 신택스에 의거한 처리를 복호 장치로 하여금 실행하게 함으로써, 픽처의 데이터를 복호 가능하게 한다.
여기서, 상술된 부호화 장치(100) 또는 복호 장치(200) 등을 실현하는 소프트웨어는, 다음과 같은 프로그램이다.
예를 들면, 이 프로그램은, 컴퓨터로 하여금, 픽처의 해상도를 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 부호화하는 부호화 방법을 실행하게 해도 된다. 또한, 여기서의 「앞」은, 표시 순으로 앞이어도 되고, 부호화 순으로 앞이어도 된다.
또, 예를 들면, 이 프로그램은, 컴퓨터로 하여금, 픽처의 해상도를 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고, 인터 예측 픽처의 복호에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 복호하는 복호 방법을 실행하게 해도 된다. 또한, 여기서의 「앞」은, 표시 순으로 앞이어도 되고, 복호 순으로 앞이어도 된다.
또, 각 구성 요소는, 상술한 바와 같이, 회로여도 된다. 이들 회로는, 전체적으로 1개의 회로를 구성해도 되고, 각각 개별 회로여도 된다. 또, 각 구성 요소는, 범용적인 프로세서로 실현되어도 되고, 전용 프로세서로 실현되어도 된다.
또, 특정 구성 요소가 실행하는 처리를 다른 구성 요소가 실행해도 된다. 또, 처리를 실행하는 순서가 변경되어도 되고, 복수의 처리가 병행되어 실행되어도 된다. 또, 부호화 복호 장치가, 부호화 장치(100) 및 복호 장치(200)를 구비하고 있어도 된다.
또, 설명에 사용된 제1 및 제2 등의 서수는, 적절히, 바꿔 붙여져도 된다. 또, 구성 요소 등에 대해, 서수가 새로 부여되어도 되고, 제거되어도 된다. 또, 이들 서수는, 요소를 식별하기 위해, 요소에 붙여지는 경우가 있으며, 의미가 있는 순서에 대응하지 않는 경우가 있다.
또, 역치 이상이라는 표현과, 역치보다 크다는 표현은, 서로 바꿔 읽어도 된다. 또, 역치 이하라는 표현과, 역치보다 작다는 표현은, 서로 바꿔 읽어도 된다.
이상, 부호화 장치(100) 및 복호 장치(200)의 양태에 대해서, 복수의 예에 의거하여 설명했는데, 부호화 장치(100) 및 복호 장치(200)의 양태는, 이들 예로 한정되는 것은 아니다. 본 개시의 취지를 일탈하지 않는 한, 당업자가 생각해 내는 각종 변형을 각 예에 실시한 것이나, 상이한 예에 있어서의 구성 요소를 조합하여 구축되는 형태도, 부호화 장치(100) 및 복호 장치(200)의 양태의 범위 내에 포함되어도 된다.
여기서 개시된 1 이상의 양태를 본 개시에 있어서의 다른 양태의 적어도 일부와 조합하여 실시해도 된다. 또, 여기서 개시된 1 이상의 양태의 플로차트에 기재된 일부의 처리, 장치의 일부의 구성, 신택스의 일부 등을 다른 양태와 조합하여 실시해도 된다.
[실시 및 응용]
이상의 각 실시 형태에 있어서, 기능적 또는 작용적인 블록 각각은, 통상, MPU(micro processing unit) 및 메모리 등에 의해 실현 가능하다. 또, 기능 블록 각각에 의한 처리는, ROM 등의 기록 매체에 기록된 소프트웨어(프로그램)를 읽어내어 실행하는 프로세서 등의 프로그램 실행부로서 실현되어도 된다. 당해 소프트웨어는, 배포되어도 된다. 당해 소프트웨어는, 반도체 메모리 등의 다양한 기록 매체에 기록되어도 된다. 또한, 각 기능 블록을 하드웨어(전용 회로)에 의해 실현하는 것도 가능하다.
각 실시 형태에 있어서 설명한 처리는, 단일한 장치(시스템)를 사용하여 집중 처리함으로써 실현해도 되고, 또는, 복수의 장치를 사용하여 분산 처리함으로써 실현해도 된다. 또, 상기 프로그램을 실행하는 프로세서는, 단수여도 되고, 복수여도 된다. 즉, 집중 처리를 행해도 되고, 또는 분산 처리를 행해도 된다.
본 개시의 양태는, 이상의 실시예로 한정되지 않고, 여러 가지 변경이 가능하며, 그들도 본 개시의 양태의 범위 내에 포함된다.
또한 여기서, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 또는 동화상 복호화 방법(화상 복호 방법)의 응용예, 및, 그 응용예를 실시하는 여러 가지 시스템을 설명한다. 이러한 시스템은, 화상 부호화 방법을 사용한 화상 부호화 장치, 화상 복호 방법을 사용한 화상 복호 장치, 또는, 양쪽을 구비하는 화상 부호화 복호 장치를 갖는 것을 특징으로 해도 된다. 이러한 시스템의 다른 구성에 대해서, 경우에 따라 적절하게 변경할 수 있다.
[사용예]
도 110은, 컨텐츠 전송 서비스를 실현하는 적절한 컨텐츠 공급 시스템(ex100)의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 에리어를 원하는 크기로 분할하고, 각 셀 내에 각각, 도시된 예에 있어서의 고정 무선국인 기지국(ex106, ex107, ex108, ex109, ex110)이 설치되어 있다.
이 컨텐츠 공급 시스템(ex100)에서는, 인터넷(ex101)에, 인터넷 서비스 프로바이더(ex102) 또는 통신망(ex104), 및 기지국(ex106~ex110)을 통해, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 및 스마트폰(ex115) 등의 각 기기가 접속된다. 당해 컨텐츠 공급 시스템(ex100)은, 상기 중 어느 하나의 장치를 조합하여 접속하도록 해도 된다. 여러 가지 실시에 있어서, 기지국(ex106~ex110)을 통하지 않고, 각 기기가 전화망 또는 근거리 무선 등을 통해 직접적 또는 간접적으로 서로 접속되어 있어도 된다. 또, 스트리밍 서버(ex103)는, 인터넷(ex101) 등을 통해, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 및 스마트폰(ex115) 등의 각 기기와 접속되어도 된다. 또, 스트리밍 서버(ex103)는, 위성(ex116)을 통해, 비행기(ex117) 내의 핫 스팟 내의 단말 등과 접속되어도 된다.
또한, 기지국(ex106~ex110) 대신에, 무선 액세스 포인트 또는 핫 스팟 등이 사용되어도 된다. 또, 스트리밍 서버(ex103)는, 인터넷(ex101) 또는 인터넷 서비스 프로바이더(ex102)를 통하지 않고 직접 통신망(ex104)과 접속되어도 되고, 위성(ex116)을 통하지 않고 직접 비행기(ex117)와 접속되어도 된다.
카메라(ex113)는 디지털 카메라 등의 정지 화상 촬영, 및 동화상 촬영이 가능한 기기이다. 또, 스마트폰(ex115)은, 2G, 3G, 3.9G, 4G, 그리고 향후 5G로 불리는 이동 통신 시스템의 방식에 대응한 스마트폰기, 휴대 전화기, 또는 PHS(Personal Handyphone System) 등이다.
가전(ex114)은, 냉장고, 또는 가정용 연료 전지 코제너레이션 시스템에 포함되는 기기 등이다.
컨텐츠 공급 시스템(ex100)에서는, 촬영 기능을 갖는 단말이 기지국(ex106) 등을 통해 스트리밍 서버(ex103)에 접속됨으로써, 라이브 전송 등이 가능해진다. 라이브 전송에서는, 단말(컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115), 및 비행기(ex117) 내의 단말 등)은, 유저가 당해 단말을 사용하여 촬영한 정지 화상 또는 동화상 컨텐츠에 대해 상기 각 실시 형태에서 설명한 부호화 처리를 행해도 되고, 부호화에 의해 얻어진 영상 데이터와, 영상에 대응하는 소리를 부호화한 소리 데이터와 다중화해도 되고, 얻어진 데이터를 스트리밍 서버(ex103)에 송신해도 된다. 즉, 각 단말은, 본 개시의 일 양태에 따른 화상 부호화 장치로서 기능한다.
한편, 스트리밍 서버(ex103)는 요구가 있었던 클라이언트에 대해 송신된 컨텐츠 데이터를 스트림 전송한다. 클라이언트는, 상기 부호화 처리된 데이터를 복호화하는 것이 가능한, 컴퓨터(ex111), 게임기(ex112), 카메라(ex113), 가전(ex114), 스마트폰(ex115), 또는 비행기(ex117) 내의 단말 등이다. 전송된 데이터를 수신한 각 기기는, 수신한 데이터를 복호화 처리하여 재생한다. 즉, 각 기기는, 본 개시의 일 양태에 따른 화상 복호 장치로서 기능해도 된다.
[분산 처리]
또, 스트리밍 서버(ex103)는 복수의 서버 또는 복수의 컴퓨터로서, 데이터를 분산하여 처리하거나 기록하거나 전송하는 것이어도 된다. 예를 들면, 스트리밍 서버(ex103)는, CDN(Contents Delivery Network)에 의해 실현되고, 전 세계에 분산된 다수의 에지 서버와 에지 서버 사이를 연결하는 네트워크에 의해 컨텐츠 전송이 실현되고 있어도 된다. CDN에서는, 클라이언트에 따라 물리적으로 가까운 에지 서버가 동적으로 할당된다. 그리고, 당해 에지 서버에 컨텐츠가 캐시 및 전송됨으로써 지연을 줄일 수 있다. 또, 몇 가지 타입의 에러가 발생한 경우 또는 트래픽의 증가 등에 의해 통신 상태가 바뀌는 경우에 복수의 에지 서버에서 처리를 분산하거나, 다른 에지 서버로 전송 주체를 전환하거나, 장애가 발생한 네트워크의 부분을 우회하여 전송을 계속할 수 있으므로, 고속이면서 안정된 전송을 실현할 수 있다.
또, 전송 자체의 분산 처리에 그치지 않고, 촬영한 데이터의 부호화 처리를 각 단말에서 행해도 되고, 서버 측에서 행해도 되며, 서로 분담하여 행해도 된다. 일례로서, 일반적으로 부호화 처리에서는, 처리 루프가 2번 행해진다. 첫 번째 루프에서 프레임 또는 신(scene) 단위로의 화상의 복잡함, 또는, 부호량이 검출된다. 또, 두 번째 루프에서는 화질을 유지하여 부호화 효율을 향상시키는 처리가 행해진다. 예를 들면, 단말이 첫 번째 부호화 처리를 행하고, 컨텐츠를 수취한 서버 측이 두 번째 부호화 처리를 행함으로써, 각 단말에서의 처리 부하를 줄이면서도 컨텐츠의 질과 효율을 향상시킬 수 있다. 이 경우, 거의 실시간으로 수신하여 복호하는 요구가 있으면, 단말이 행한 첫 번째 부호화 완료 데이터를 다른 단말에서 수신하여 재생할 수도 있으므로, 보다 유연한 실시간 전송도 가능해진다.
다른 예로서, 카메라(ex113) 등은, 화상으로부터 특징량 추출을 행하고, 특징량에 관한 데이터를 메타데이터로서 압축하여 서버에 송신한다. 서버는, 예를 들면 특징량으로부터 오브젝트의 중요성을 판단하여 양자화 정밀도를 전환하는 등, 화상의 의미(또는 내용의 중요성)에 따른 압축을 행한다. 특징량 데이터는 서버에서의 재차 압축 시의 움직임 벡터 예측의 정밀도 및 효율 향상에 특히 유효하다. 또, 단말에서 VLC(가변 길이 부호화) 등의 간이적인 부호화를 행하고, 서버에서 CABAC(콘텍스트 적응형 이치 산술 부호화 방식) 등 처리 부하가 큰 부호화를 행해도 된다.
또 다른 예로서, 스타디움, 쇼핑몰, 또는 공장 등에 있어서는, 복수의 단말에 의해 거의 동일한 신이 촬영된 복수의 영상 데이터가 존재하는 경우가 있다. 이 경우에는, 촬영을 행한 복수의 단말과, 필요에 따라 촬영을 하지 않은 다른 단말 및 서버를 사용하여, 예를 들면 GOP(Group of Picture) 단위, 픽처 단위, 또는 픽처를 분할한 타일 단위 등으로 부호화 처리를 각각 할당하여 분산 처리를 행한다. 이로 인해, 지연을 줄이고, 보다 실시간성을 실현할 수 있다.
복수의 영상 데이터는 거의 동일 신이기 때문에, 각 단말에서 촬영된 영상 데이터를 서로 참조할 수 있도록, 서버에서 관리 및/또는 지시를 해도 된다. 또, 각 단말로부터의 부호화 완료 데이터를, 서버가 수신하여 복수의 데이터 사이에서 참조 관계를 변경, 또는 픽처 자체를 보정 혹은 교체하여 다시 부호화해도 된다. 이로 인해, 하나 하나의 데이터의 질과 효율을 높인 스트림을 생성할 수 있다.
또, 서버는, 영상 데이터의 부호화 방식을 변경하는 트랜스 코드를 행한 다음에 영상 데이터를 전송해도 된다. 예를 들면, 서버는, MPEG계 부호화 방식을 VP계(예를 들면 VP9)로 변환해도 되고, H.264를 H.265로 변환해도 된다.
이와 같이, 부호화 처리는, 단말, 또는 1 이상의 서버에 의해 행하는 것이 가능하다. 따라서, 이하에서는, 처리를 행하는 주체로서 「서버」 또는 「단말」 등의 기재를 사용하는데, 서버에서 행해지는 처리의 일부 또는 전부가 단말에서 행해져도 되고, 단말에서 행해지는 처리의 일부 또는 전부가 서버에서 행해져도 된다. 또, 이들에 관해서는, 복호 처리에 대해서도 마찬가지이다.
[3D, 멀티 앵글]
서로 거의 동기한 복수의 카메라(ex113) 및/또는 스마트폰(ex115) 등의 단말에 의해 촬영된 상이한 신, 또는, 동일 신을 상이한 앵글로부터 촬영한 화상 혹은 영상을 통합하여 이용하는 것이 증가해오고 있다. 각 단말에서 촬영한 영상은, 별도로 취득한 단말 간의 상대적인 위치 관계, 또는, 영상에 포함되는 특징점이 일치하는 영역 등에 의거하여 통합된다.
서버는, 2차원의 동화상을 부호화할 뿐만 아니라, 동화상의 신 해석 등에 의거하여 자동적으로, 또는, 유저가 지정한 시각에 있어서, 정지 화상을 부호화하고, 수신 단말에 송신해도 된다. 서버는, 또한, 촬영 단말 간의 상대적인 위치 관계를 취득할 수 있는 경우에는, 2차원의 동화상뿐만 아니라, 동일 신이 상이한 앵글로부터 촬영된 영상에 의거하여, 당해 신의 3차원 형상을 생성할 수 있다. 서버는, 포인트 클라우드 등에 의해 생성된 3차원의 데이터를 별도로 부호화해도 되고, 3차원 데이터를 사용하여 인물 또는 오브젝트를 인식 혹은 추적한 결과에 의거하여, 수신 단말에 송신하는 영상을, 복수의 단말에서 촬영한 영상으로부터, 선택, 또는, 재구성하여 생성해도 된다.
이와 같이 하여, 유저는, 각 촬영 단말에 대응하는 각 영상을 임의로 선택하여 신을 즐길 수도 있고, 복수 화상 또는 영상을 사용하여 재구성된 3차원 데이터로부터 선택 시점(視點)의 영상을 잘라낸 컨텐츠를 즐길 수도 있다. 또한, 영상과 함께, 소리도 복수의 상이한 앵글로부터 수음(收音)되고, 서버는, 특정 앵글 또는 공간으로부터의 소리를 대응하는 영상과 다중화하여, 다중화된 영상과 소리를 송신해도 된다.
또, 최근에는 Virtual Reality(VR) 및 Augmented Reality(AR) 등, 현실 세계와 가상 세계를 대응지은 컨텐츠도 보급해 오고 있다. VR 화상의 경우, 서버는, 우안용 및 좌안용의 시점 화상을 각각 작성하여, Multi-View Coding(MVC) 등에 의해 각 시점 영상 사이에서 참조를 허용하는 부호화를 행해도 되고, 서로 참조하지 않고 개별 스트림으로서 부호화해도 된다. 개별 스트림의 복호 시에는, 유저의 시점에 따라 가상적인 3차원 공간이 재현되도록 서로 동기시켜 재생하면 된다.
AR 화상의 경우에는, 서버는, 현실 공간의 카메라 정보에, 가상 공간 상의 가상 물체 정보를, 3차원적 위치 또는 유저의 시점의 움직임에 의거하여 중첩한다. 복호 장치는, 가상 물체 정보 및 3차원 데이터를 취득 또는 보유하여, 유저의 시점의 움직임에 따라 2차원 화상을 생성하고, 매끄럽게 연결함으로써 중첩 데이터를 작성해도 된다. 또는, 복호 장치는 가상 물체 정보의 의뢰에 더하여 유저의 시점의 움직임을 서버에 송신해도 된다. 서버는, 서버에 보유되는 3차원 데이터로부터 수신한 시점의 움직임에 맞추어 중첩 데이터를 작성하고, 중첩 데이터를 부호화하여 복호 장치에 전송해도 된다. 또한, 중첩 데이터는, RGB 이외에 투과도를 나타내는 α값을 갖고, 서버는, 3차원 데이터로부터 작성된 오브젝트 이외의 부분의 α값이 0 등으로 설정되고, 당해 부분이 투과하는 상태에서, 부호화해도 된다. 혹은, 서버는, 크로마키와 같이 소정 값의 RGB값을 배경으로 설정하고, 오브젝트 이외의 부분은 배경색으로 한 데이터를 생성해도 된다.
마찬가지로 전송된 데이터의 복호 처리는 클라이언트인 각 단말에서 행해도 되고, 서버 측에서 행해도 되고, 서로 분담하여 행해도 된다. 일례로서, 어떤 단말이, 일단 서버에 수신 리퀘스트를 보내고, 그 리퀘스트에 따른 컨텐츠를 다른 단말에서 수신하여 복호 처리를 행하여, 디스플레이를 갖는 장치에 복호 완료된 신호가 송신되어도 된다. 통신 가능한 단말 자체의 성능에 상관없이 처리를 분산하여 적절한 컨텐츠를 선택함으로써 화질이 좋은 데이터를 재생할 수 있다. 또, 다른 예로서 큰 사이즈의 화상 데이터를 TV 등으로 수신하면서, 감상자의 개인 단말에 픽처가 분할된 타일 등 일부의 영역이 복호되어 표시되어도 된다. 이로 인해, 전체 상(像)을 공유화하면서, 자신의 담당 분야 또는 보다 상세하게 확인하고 싶은 영역을 가까이에서 확인할 수 있다.
실내외의 근거리, 중거리, 또는 장거리의 무선 통신이 복수 사용 가능한 상황 하에서, MPEG-DASH(Dynamic Adaptive Streaming over HTTP) 등의 전송 시스템 규격을 이용하여, 심리스로 컨텐츠를 수신하는 것이 가능할지도 모른다. 유저는, 유저의 단말, 실내외에 배치된 디스플레이 등의 복호 장치 또는 표시 장치를 자유롭게 선택하면서 실시간으로 전환해도 된다. 또, 자신의 위치 정보 등을 사용하여, 복호하는 단말 및 표시하는 단말을 전환하면서 복호를 행할 수 있다. 이로 인해, 유저가 목적지로 이동하고 있는 동안에, 표시 가능한 디바이스가 매입(埋入)된 인근 건물의 벽면 또는 지면의 일부에 정보를 매핑 및 표시하는 것이 가능해진다. 또, 부호화 데이터가 수신 단말로부터 단시간에 액세스할 수 있는 서버에 캐시되어 있거나, 또는, 컨텐츠·딜리버리·서비스에 있어서의 에지 서버에 카피되어 있는 등의, 네트워크 상에서의 부호화 데이터로의 액세스 용이성에 의거하여, 수신 데이터의 비트 레이트를 전환하는 것도 가능하다.
[Web 페이지의 최적화]
도 111은, 컴퓨터(ex111) 등에 있어서의 web 페이지의 표시 화면예를 나타내는 도면이다. 도 112는, 스마트폰(ex115) 등에 있어서의 web 페이지의 표시 화면예를 나타내는 도면이다. 도 111 및 도 112에 나타내는 바와 같이 web 페이지가, 화상 컨텐츠에 대한 링크인 링크 화상을 복수 포함하는 경우가 있으며, 열람하는 디바이스에 따라 그 보이는 방식이 상이하다. 화면 상에 복수의 링크 화상이 보이는 경우에는, 유저가 명시적으로 링크 화상을 선택할 때까지, 또는 화면의 중앙 부근에 링크 화상이 가까워지거나 혹은 링크 화상 전체가 화면 내에 들어갈 때까지, 표시 장치(복호 장치)는, 링크 화상으로서 각 컨텐츠가 갖는 정지 화상 또는 I 픽처를 표시해도 되고, 복수의 정지 화상 또는 I 픽처 등으로 gif 애니메이션과 같은 영상을 표시해도 되고, 베이스 레이어만 수신하여, 영상을 복호 및 표시해도 된다.
유저에 의해 링크 화상이 선택된 경우, 표시 장치는, 베이스 레이어를 최우선으로 하면서 복호를 행한다. 또한, web 페이지를 구성하는 HTML(HyperText Markup Language)에 스케일러블한 컨텐츠임을 나타내는 정보가 있으면, 표시 장치는, 인핸스먼트 레이어까지 복호해도 된다. 또, 실시간성을 담보하기 위해, 선택되기 전 또는 통신 대역이 매우 열악한 경우에는, 표시 장치는, 전방 참조의 픽처(I 픽처, P 픽처, 전방 참조만인 B 픽처)만을 복호 및 표시함으로써, 선두 픽처의 복호 시각과 표시 시각 사이의 지연(컨텐츠의 복호 개시부터 표시 개시까지의 지연)을 저감할 수 있다. 또한, 표시 장치는, 픽처의 참조 관계를 일부러 무시하고, 모든 B 픽처 및 P 픽처를 전방 참조로 하여 거칠게 복호하고, 시간이 지나 수신한 픽처가 증가함에 따라 정상적인 복호를 행해도 된다.
[자동 주행]
또, 자동차의 자동 주행 또는 주행 지원을 위해 2차원 또는 3차원의 지도 정보 등과 같은 정지 화상 또는 영상 데이터를 송수신하는 경우, 수신 단말은, 1 이상의 레이어에 속하는 화상 데이터에 더하여, 메타 정보로서 기후 또는 공사 정보 등도 수신하고, 이들을 대응지어 복호해도 된다. 또한, 메타 정보는, 레이어에 속해도 되고, 단순히 화상 데이터와 다중화되어도 된다.
이 경우, 수신 단말을 포함하는 자동차, 드론 또는 비행기 등이 이동하기 때문에, 수신 단말은, 당해 수신 단말의 위치 정보를 송신함으로써, 기지국(ex106~ex110)을 전환하면서 심리스한 수신 및 복호의 실행을 실현할 수 있다. 또, 수신 단말은, 유저의 선택, 유저의 상황 및/또는 통신 대역의 상태에 따라, 메타 정보를 어느 정도 수신할지, 또는 지도 정보를 어느 정도 갱신해 갈지를 동적으로 전환하는 것이 가능해진다.
컨텐츠 공급 시스템(ex100)에서는, 유저가 송신한 부호화된 정보를 실시간으로 클라이언트가 수신하여 복호하고, 재생할 수 있다.
[개인 컨텐츠의 전송]
또, 컨텐츠 공급 시스템(ex100)에서는, 영상 전송 업자에 의한 고화질이며 장시간의 컨텐츠뿐만 아니라, 개인에 의한 저화질이며 단시간의 컨텐츠의 유니캐스트, 또는 멀티캐스트 전송이 가능하다. 이러한 개인 컨텐츠는 향후에도 증가해 갈 것으로 생각된다. 개인 컨텐츠를 보다 우수한 컨텐츠로 하기 위해, 서버는, 편집 처리를 행하고 나서 부호화 처리를 행해도 된다. 이것은, 예를 들면, 이하와 같은 구성을 사용하여 실현할 수 있다.
촬영 시에 실시간 또는 축적하여 촬영 후에, 서버는, 원화상 데이터 또는 부호화 완료 데이터로부터 촬영 에러, 신 탐색, 의미의 해석, 및 오브젝트 검출 등의 인식 처리를 행한다. 그리고, 서버는, 인식 결과에 의거하여 수동 또는 자동으로, 핀트 어긋남 또는 손떨림 등을 보정하거나, 명도가 다른 픽처에 비해 낮거나 또는 초점이 맞지 않는 신 등의 중요성이 낮은 신을 삭제하거나, 오브젝트의 에지를 강조하거나, 색조를 변화시키는 등의 편집을 행한다. 서버는, 편집 결과에 의거하여 편집 후의 데이터를 부호화한다. 또 촬영 시각이 너무 길면 시청률이 낮아지는 것도 알려져 있으며, 서버는, 촬영 시간에 따라 특정 시간 범위 내의 컨텐츠가 되도록 상기와 같이 중요성이 낮은 신뿐만 아니라 움직임이 적은 신 등을, 화상 처리 결과에 의거하여 자동으로 클립해도 된다. 또는, 서버는, 신의 의미 해석의 결과에 의거하여 다이제스트를 생성하여 부호화해도 된다.
개인 컨텐츠에는, 그 상태로는 저작권, 저작자 인격권, 또는 초상권 등의 침해가 되는 것이 찍혀 있는 케이스도 있고, 공유하는 범위가 의도한 범위를 초과해 버리는 등 개인에게 있어서 불편한 경우도 있다. 따라서, 예를 들면, 서버는, 화면의 주변부의 사람의 얼굴, 또는 집안 등을 일부러 초점이 맞지 않는 화상으로 변경하여 부호화해도 된다. 또, 서버는, 부호화 대상 화상 내에, 미리 등록한 인물과는 상이한 인물의 얼굴이 찍혀 있는지 여부를 인식하여, 찍혀 있는 경우에는, 얼굴 부분에 모자이크를 하는 등의 처리를 행해도 된다. 또는, 부호화의 전처리 또는 후처리로서, 저작권 등의 관점에서 유저가 화상을 가공하고 싶은 인물 또는 배경 영역을 지정해도 된다. 서버는, 지정된 영역을 다른 영상으로 치환하거나, 또는 초점을 흐리는 등의 처리를 행해도 된다. 인물이면, 동화상에 있어서 인물을 트래킹하여, 인물의 얼굴 부분의 영상을 치환할 수 있다.
데이터량이 작은 개인 컨텐츠의 시청은 실시간성의 요구가 강하기 때문에, 대역폭에도 따르지만, 복호 장치는, 우선 베이스 레이어를 최우선으로 수신하여 복호 및 재생을 행한다. 복호 장치는, 이 사이에 인핸스먼트 레이어를 수신하고, 재생이 루프되는 경우 등 2회 이상 재생되는 경우에, 인핸스먼트 레이어도 포함하여 고화질의 영상을 재생해도 된다. 이와 같이 스케일러블한 부호화가 행해지고 있는 스트림이면, 미선택 시 또는 보기 시작한 단계에서는 거친 동화상이지만, 서서히 스트림이 스마트해져 화상이 좋아지는 체험을 제공할 수 있다. 스케일러블 부호화 이외에도, 1회째에 재생되는 거친 스트림과, 1회째의 동화상을 참조하여 부호화되는 2회째의 스트림이 하나의 스트림으로서 구성되어 있어도 동일한 체험을 제공할 수 있다.
[그 외의 실시 응용예]
또, 이들 부호화 또는 복호 처리는, 일반적으로 각 단말이 갖는 LSI(ex500)에 있어서 처리된다. LSI(large scale integration circuitry)(ex500)(도 110 참조)는, 원 칩이어도 되고 복수 칩으로 이루어지는 구성이어도 된다. 또한, 동화상 부호화 또는 복호용 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플렉시블 디스크, 또는 하드 디스크 등)에 장착하고, 그 소프트웨어를 사용하여 부호화 또는 복호 처리를 행해도 된다. 또한, 스마트폰(ex115)이 카메라가 달린 경우에는, 그 카메라로 취득한 동화상 데이터를 송신해도 된다. 이때의 동화상 데이터는 스마트폰(ex115)이 갖는 LSI(ex500)에서 부호화 처리된 데이터이다.
또한, LSI(ex500)는, 애플리케이션 소프트를 다운로드하여 액티베이트하는 구성이어도 된다. 이 경우, 단말은, 우선, 당해 단말이 컨텐츠의 부호화 방식에 대응하고 있는지, 또는, 특정 서비스의 실행 능력을 갖는지를 판정한다. 단말이 컨텐츠의 부호화 방식에 대응하고 있지 않은 경우, 또는, 특정 서비스의 실행 능력을 갖지 않는 경우, 단말은, 코덱 또는 애플리케이션 소프트를 다운로드하고, 그 후, 컨텐츠 취득 및 재생한다.
또, 인터넷(ex101)을 통한 컨텐츠 공급 시스템(ex100)에 한정하지 않고, 디지털 방송용 시스템에도 상기 각 실시 형태의 적어도 동화상 부호화 장치(화상 부호화 장치) 또는 동화상 복호화 장치(화상 복호 장치) 중 어느 하나를 장착할 수 있다. 위성 등을 이용하여 방송용 전파에 영상과 소리가 다중화된 다중화 데이터를 실어 송수신하기 때문에, 컨텐츠 공급 시스템(ex100)의 유니캐스트를 하기 쉬운 구성에 대해 멀티캐스트용이라는 차이가 있으나 부호화 처리 및 복호 처리에 관해서는 동일한 응용이 가능하다.
[하드웨어 구성]
도 113은, 도 110에 나타난 스마트폰(ex115)을 더 상세하게 나타내는 도면이다. 또, 도 114는, 스마트폰(ex115)의 구성예를 나타내는 도면이다. 스마트폰(ex115)은, 기지국(ex110)과의 사이에서 전파를 송수신하기 위한 안테나(ex450)와, 영상 및 정지 화상을 촬영하는 것이 가능한 카메라부(ex465)와, 카메라부(ex465)에서 촬상한 영상, 및 안테나(ex450)에서 수신한 영상 등이 복호된 데이터를 표시하는 표시부(ex458)를 구비한다. 스마트폰(ex115)은, 또한, 터치 패널 등인 조작부(ex466)와, 음성 또는 음향을 출력하기 위한 스피커 등인 음성 출력부(ex457)와, 음성을 입력하기 위한 마이크 등인 음성 입력부(ex456)와, 촬영한 영상 혹은 정지 화상, 녹음한 음성, 수신한 영상 혹은 정지 화상, 메일 등의 부호화된 데이터, 또는, 복호화된 데이터를 저장 가능한 메모리부(ex467)와, 유저를 특정하고, 네트워크를 비롯하여 각종 데이터에 대한 액세스의 인증을 하기 위한 SIM(Subscriber Identity Module)(ex468)과의 인터페이스부인 슬롯부(ex464)를 구비한다. 또한, 메모리부(ex467) 대신에 외장 메모리가 사용되어도 된다.
표시부(ex458) 및 조작부(ex466) 등을 통괄적으로 제어하는 주제어부(ex460)와, 전원 회로부(ex461), 조작 입력 제어부(ex462), 영상 신호 처리부(ex455), 카메라 인터페이스부(ex463), 디스플레이 제어부(ex459), 변조/복조부(ex452), 다중/분리부(ex453), 음성 신호 처리부(ex454), 슬롯부(ex464), 및 메모리부(ex467)가 동기 버스(ex470)를 통해 접속되어 있다.
전원 회로부(ex461)는, 유저의 조작에 의해 전원 키가 온 상태가 되면, 스마트폰(ex115)을 동작 가능한 상태로 기동하고, 배터리 팩으로부터 각 부에 대해 전력을 공급한다.
스마트폰(ex115)은, CPU, ROM 및 RAM 등을 갖는 주제어부(ex460)의 제어에 의거하여, 통화 및 데이터 통신 등의 처리를 행한다. 통화 시에는, 음성 입력부(ex456)에서 수음한 음성 신호를 음성 신호 처리부(ex454)에서 디지털 음성 신호로 변환하고, 변조/복조부(ex452)에서 스펙트럼 확산 처리를 실시하며, 송신/수신부(ex451)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시하고, 그 결과의 신호를, 안테나(ex450)를 통해 송신한다. 또 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변조/복조부(ex452)에서 스펙트럼 역확산 처리하며, 음성 신호 처리부(ex454)에서 아날로그 음성 신호로 변환한 후, 이를 음성 출력부(ex457)로부터 출력한다. 데이터 통신 모드 시에는, 본체부의 조작부(ex466) 등의 조작에 의거하여 텍스트, 정지 화상, 또는 영상 데이터가 조작 입력 제어부(ex462)를 통해 주제어부(ex460)에 송출된다. 동일한 송수신 처리가 행해진다. 데이터 통신 모드 시에 영상, 정지 화상, 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부(ex455)는, 메모리부(ex467)에 저장되어 있는 영상 신호 또는 카메라부(ex465)로부터 입력된 영상 신호를 상기 각 실시 형태에서 나타낸 동화상 부호화 방법에 의해 압축 부호화하고, 부호화된 영상 데이터를 다중/분리부(ex453)에 송출한다. 음성 신호 처리부(ex454)는, 영상 또는 정지 화상을 카메라부(ex465)에서 촬상 중에 음성 입력부(ex456)에서 수음한 음성 신호를 부호화하고, 부호화된 음성 데이터를 다중/분리부(ex453)에 송출한다. 다중/분리부(ex453)는, 부호화 완료 영상 데이터와 부호화 완료 음성 데이터를 소정의 방식으로 다중화하고, 변조/복조부(변조/복조 회로부)(ex452), 및 송신/수신부(ex451)에서 변조 처리 및 변환 처리를 실시하여 안테나(ex450)를 통해 송신한다.
전자 메일 또는 채팅에 첨부된 영상, 또는 웹페이지에 링크된 영상을 수신한 경우 등에 있어서, 안테나(ex450)를 통해 수신된 다중화 데이터를 복호하기 위해, 다중/분리부(ex453)는, 다중화 데이터를 분리함으로써, 다중화 데이터를 영상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누고, 동기 버스(ex470)를 통해 부호화된 영상 데이터를 영상 신호 처리부(ex455)에 공급함과 더불어, 부호화된 음성 데이터를 음성 신호 처리부(ex454)에 공급한다. 영상 신호 처리부(ex455)는, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법에 대응한 동화상 복호화 방법에 의해 영상 신호를 복호하고, 디스플레이 제어부(ex459)를 통해 표시부(ex458)로부터, 링크된 동화상 파일에 포함되는 영상 또는 정지 화상이 표시된다. 음성 신호 처리부(ex454)는, 음성 신호를 복호하고, 음성 출력부(ex457)로부터 음성이 출력된다. 실시간 스트리밍이 점점 보급되기 시작하고 있기 때문에, 유저의 상황에 따라서는 음성의 재생이 사회적으로 적합하지 않은 경우도 있을 수 있다. 그 때문에, 초기값으로는, 음성 신호는 재생하지 않고 영상 데이터만을 재생하는 구성이 바람직하고, 유저가 영상 데이터를 클릭하는 등 조작을 행한 경우에만 음성을 동기하여 재생해도 된다.
또 여기서는 스마트폰(ex115)을 예로 설명했는데, 단말로서는 부호화기 및 복호화기를 둘 다 갖는 송수신형 단말 이외에, 부호화기만을 갖는 송신 단말, 및, 복호화기만을 갖는 수신 단말과 같은 세 가지의 다른 실장 형식을 생각할 수 있다. 디지털 방송용 시스템에 있어서, 영상 데이터에 음성 데이터가 다중화된 다중화 데이터를 수신 또는 송신하는 것으로서 설명했다. 단, 다중화 데이터에는, 음성 데이터 이외에 영상에 관련된 문자 데이터 등이 다중화되어도 된다. 또, 다중화 데이터가 아닌 영상 데이터 자체가 수신 또는 송신되어도 된다.
또한, CPU를 포함하는 주제어부(ex460)가 부호화 또는 복호 처리를 제어하는 것으로서 설명했는데, 여러 가지 단말은 GPU(Graphics Processing Unit)를 구비하는 경우도 많다. 따라서, CPU와 GPU에서 공통화된 메모리, 또는 공통으로 사용할 수 있도록 어드레스가 관리되어 있는 메모리에 의해, GPU의 성능을 살려 넓은 영역을 일괄적으로 처리하는 구성이어도 된다. 이로 인해 부호화 시간을 단축할 수 있고, 실시간성을 확보하여, 저(低) 지연을 실현할 수 있다. 특히 움직임 탐색, 디블록 필터, SAO(Sample Adaptive Offset), 및 변환·양자화 처리를, CPU가 아니라, GPU에서 픽처 등의 단위로 일괄적으로 행하면 효율적이다.
본 개시는, 예를 들면, 텔레비전 수상기, 디지털 비디오 리코더, 자동차 내비게이션, 휴대 전화, 디지털 카메라, 디지털 비디오 카메라, TV 회의 시스템, 또는, 전자 미러 등에 이용 가능하다.
100: 부호화 장치
102: 분할부
102a: 블록 분할 결정부
104: 감산부
106: 변환부
108: 양자화부
108a: 차분 양자화 파라미터 생성부
108b, 204b: 예측 양자화 파라미터 생성부
108c, 204a: 양자화 파라미터 생성부
108d, 204d: 양자화 파라미터 기억부
108e: 양자화 처리부
110: 엔트로피 부호화부
110a: 이치화부
110b, 202b: 콘텍스트 제어부
110c: 이치 산술 부호화부
112, 204: 역양자화부
114, 206: 역변환부
116, 208: 가산부
118, 210: 블록 메모리
120, 212: 루프 필터부
120a, 212a: 디블로킹·필터 처리부
120b, 212b: SAO 처리부
120c, 212c: ALF 처리부
122, 214: 프레임 메모리
124, 216: 인트라 예측부
126, 218: 인터 예측부
126a, a2, b2: 메모리
126b: 보간 화상 도출부
126c: 구배 화상 도출부
126d: 옵티컬 플로 도출부
126e: 보정값 도출부
126f: 예측 화상 보정부
128, 220: 예측 제어부
130, 222: 예측 파라미터 생성부
200: 복호 장치
202: 엔트로피 복호부
202a: 이치 산술 복호부
202c: 다치화부
204e: 역양자화 처리부
224: 분할 결정부
300: 픽처 시퀀스
310, 320: 픽처(복수의 픽처)
330, 340: 리딩 픽처(복수의 리딩 픽처)
350: GOP(복수의 GOP)
1001: 서버 장치
1002: 수신 장치
1201: 경계 판정부
1202, 1204, 1206: 스위치
1203: 필터 판정부
1205: 필터 처리부
1207: 필터 특성 결정부
1208: 처리 판정부
a1, b1: 프로세서

Claims (19)

  1. 회로와,
    상기 회로에 접속된 메모리를 구비하고,
    상기 회로는, 동작에 있어서,
    픽처의 해상도를 표시 순 및 부호화 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고,
    인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 부호화하는,
    부호화 장치.
  2. 청구항 1에 있어서,
    상기 제약에서는, 상기 픽처가, k번째의 랜덤 액세스 픽처마다의 상기 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만, 상기 픽처의 해상도를 변경하는 것이 허용되며,
    상기 k는, 1보다 큰 정수인, 부호화 장치.
  3. 청구항 1 또는 청구항 2에 있어서,
    상기 회로는,
    복수의 픽처를 비트 스트림에 순차적으로 부호화하고,
    상기 비트 스트림의 비트량을 모니터링하며,
    모니터링된 상기 비트량에 따라, 상기 픽처의 해상도의 변경을 제어하는, 부호화 장치.
  4. 청구항 1 또는 청구항 2에 있어서,
    상기 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 부호화하고, 계속해서, 상기 하나 이상의 랜덤 액세스 픽처에 포함되는 랜덤 액세스 픽처로서, 표시 순으로 상기 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 부호화하며, 계속해서, 상기 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 부호화하고, 계속해서, 상기 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 부호화하며,
    상기 제약에서는,
    상기 적어도 하나의 리딩 픽처의 해상도는, 상기 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되지 않고,
    상기 랜덤 액세스 픽처의 해상도는, 상기 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되며,
    상기 적어도 하나의 제2 트레일링 픽처의 해상도는, 상기 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않는, 부호화 장치.
  5. 청구항 1 또는 청구항 2에 있어서,
    상기 회로는, 제1 픽처 그룹에 속하는 적어도 하나의 제1 트레일링 픽처를 부호화하고, 계속해서, 상기 하나 이상의 랜덤 액세스 픽처에 포함되는 랜덤 액세스 픽처로서, 표시 순으로 상기 제1 픽처 그룹보다 뒤의 제2 픽처 그룹에 속하는 랜덤 액세스 픽처를 부호화하며, 계속해서, 상기 제1 픽처 그룹에 속하는 적어도 하나의 리딩 픽처를 부호화하고, 계속해서, 상기 제2 픽처 그룹에 속하는 적어도 하나의 제2 트레일링 픽처를 부호화하며,
    상기 제약에서는,
    상기 랜덤 액세스 픽처의 해상도는, 상기 적어도 하나의 제1 트레일링 픽처의 해상도와는 상이한 것이 허용되고,
    상기 적어도 하나의 리딩 픽처의 해상도는, 상기 랜덤 액세스 픽처의 해상도와는 상이한 것이 허용되지 않고,
    상기 적어도 하나의 제2 트레일링 픽처의 해상도는, 상기 적어도 하나의 리딩 픽처의 해상도와는 상이한 것이 허용되지 않는, 부호화 장치.
  6. 청구항 1 또는 청구항 2에 있어서,
    상기 제약에서는, DASH(Dynamic Adaptive Streaming over HTTP) 프로토콜로 정해지는 복수의 세그먼트 각각에 대해서, 당해 세그먼트 내에서 상기 픽처의 해상도를 변경하는 것이 허용되지 않는, 부호화 장치.
  7. 청구항 6에 있어서,
    상기 제약에서는, DASH 프로토콜로 정해지는 복수의 레프리젠테이션 각각에 있어서, 역치보다 짧은 간격으로 상기 픽처의 해상도를 변경하는 것이 허용되지 않는, 부호화 장치.
  8. 청구항 1 또는 청구항 2에 있어서,
    상기 제약에서는, 상기 픽처의 해상도가 복수의 해상도 후보 중 어느 하나로 제한되는, 부호화 장치.
  9. 청구항 8에 있어서,
    상기 복수의 해상도 후보는, 상기 선행 픽처의 해상도를 복수의 고정 비율로 스케일링함으로써 정해지는 복수의 해상도 후보를 포함하는, 부호화 장치.
  10. 청구항 9에 있어서,
    상기 복수의 고정 비율은, 2배, 3/2배, 4/3배, 3/4배, 2/3배 및 1/2배 중 적어도 하나를 포함하는, 부호화 장치.
  11. 청구항 8에 있어서,
    상기 복수의 해상도 후보는, 7680×4320 화소, 5120×2880 화소, 3840×2160 화소, 2560×1440 화소, 1920×1080 화소, 1280×720 화소 및 960×540 화소로 정해지는 복수의 해상도 후보를 포함하는, 부호화 장치.
  12. 청구항 8에 있어서,
    상기 복수의 해상도 후보는, 상기 선행 픽처의 해상도에 대해 복수의 고정 차분값의 가산 또는 감산을 적용함으로써 정해지는 복수의 해상도 후보를 포함하는, 부호화 장치.
  13. 청구항 1 또는 청구항 2에 있어서,
    상기 제약에서는, 시퀀스 파라미터 세트에 있어서 상한으로서 지정되는 최대 해상도가, 상기 시퀀스 파라미터 세트가 적용되는 복수의 픽처 중 적어도 하나의 픽처에 적용되는 픽처 파라미터 세트에 있어서 상기 적어도 하나의 픽처의 해상도로서 지정되는 해상도와 같은 것으로 제한되고,
    상기 회로는, 상기 제약에 따라 정해지는 상기 최대 해상도를 상기 시퀀스 파라미터 세트에 부호화하며, 상기 적어도 하나의 픽처의 해상도로서 지정되는 상기 해상도를 상기 픽처 파라미터 세트에 부호화하는, 부호화 장치.
  14. 회로와,
    상기 회로에 접속된 메모리를 구비하고,
    상기 회로는, 동작에 있어서,
    픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고,
    인터 예측 픽처의 복호에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 복호하는,
    복호 장치.
  15. 청구항 14에 있어서,
    상기 회로는, 복호 화상을 표시하기 위한 후처리에 대해 계산 리소스 및 메모리 리소스 중 적어도 하나를 상기 제약에 따라 할당하는, 복호 장치.
  16. 픽처의 해상도를 표시 순 및 부호화 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고,
    인터 예측 픽처의 부호화에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 부호화하는,
    부호화 방법.
  17. 픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고,
    인터 예측 픽처의 복호에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 복호하는,
    복호 방법.
  18. 비트 스트림을 기억하는 비일시적인 컴퓨터 판독 가능한 기록 매체로서,
    상기 비트 스트림은, 복수의 픽처와, 상기 복수의 픽처를 상기 비트 스트림으로부터 복호하는 복호 처리를 행하기 위한 복수의 파라미터를 포함하고,
    상기 복호 처리에서는, 상기 복수의 파라미터에 따르는 동작에 있어서,
    픽처의 해상도를 표시 순 및 복호 순 중 한쪽 순서로 상기 픽처보다 앞의 선행 픽처의 해상도로부터 변경할지 여부를, 상기 픽처가 하나 이상의 랜덤 액세스 픽처 중 어느 하나인 경우에만 변경이 허용되는 제약에 따라 제어하고,
    인터 예측 픽처의 복호에 사용되는 참조 픽처의 해상도가 상기 인터 예측 픽처의 해상도와는 상이한 경우, 상기 참조 픽처의 해상도와 상기 인터 예측 픽처의 해상도의 차이에 따라, 상기 참조 픽처의 참조 화상을 리샘플링하고, 리샘플링된 상기 참조 화상을 사용하여 상기 인터 예측 픽처의 화상을 복호하는,
    비일시적인 컴퓨터 판독 가능한 기록 매체.
  19. 청구항 18에 있어서,
    상기 복수의 파라미터는, 상기 복수의 픽처 중 하나 이상의 픽처의 해상도의 변경이 허용되는지 여부를 나타내는 제1 파라미터와, 상기 픽처의 해상도를 나타내는 제2 파라미터를 포함하고,
    상기 제1 파라미터에 따라 상기 하나 이상의 픽처의 해상도의 변경이 허용되고, 상기 픽처가 상기 하나 이상의 픽처에 포함되며, 상기 제약에 따라 상기 픽처의 해상도의 변경이 허용되는 경우, 상기 제2 파라미터에 따라 상기 픽처의 해상도가 변경되는, 비일시적인 컴퓨터 판독 가능한 기록 매체.
KR1020237037641A 2021-05-07 2022-04-12 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법 KR20240004427A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21172831.6A EP4087238A1 (en) 2021-05-07 2021-05-07 Encoder, decoder, encoding method, and decoding method
EP21172831.6 2021-05-07
PCT/JP2022/017641 WO2022234767A1 (ja) 2021-05-07 2022-04-12 符号化装置、復号装置、符号化方法、および復号方法

Publications (1)

Publication Number Publication Date
KR20240004427A true KR20240004427A (ko) 2024-01-11

Family

ID=75870534

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237037641A KR20240004427A (ko) 2021-05-07 2022-04-12 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법

Country Status (7)

Country Link
US (1) US20240064330A1 (ko)
EP (2) EP4087238A1 (ko)
JP (1) JPWO2022234767A1 (ko)
KR (1) KR20240004427A (ko)
CN (1) CN117242778A (ko)
BR (1) BR112023022027A2 (ko)
WO (1) WO2022234767A1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200077096A1 (en) * 2018-08-31 2020-03-05 Jonatan Samuelsson Compression of segmented video
CN113875232A (zh) * 2019-05-16 2021-12-31 北京字节跳动网络技术有限公司 视频编解码中的自适应颜色格式转换
TWI789632B (zh) * 2019-09-24 2023-01-11 弗勞恩霍夫爾協會 用於參考圖像重新取樣擴展之編碼器與解碼器、編碼方法及解碼方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
H.265(ISO/IEC 23008-2 HEVC)/HEVC(High Efficiency Video Coding)

Also Published As

Publication number Publication date
US20240064330A1 (en) 2024-02-22
EP4336838A1 (en) 2024-03-13
WO2022234767A1 (ja) 2022-11-10
JPWO2022234767A1 (ko) 2022-11-10
EP4087238A1 (en) 2022-11-09
BR112023022027A2 (pt) 2023-12-26
CN117242778A (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
CN109155863B (zh) 编码装置、解码装置、编码方法及解码方法
KR102648038B1 (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
JP7422811B2 (ja) 非一時的記憶媒体
CN112425171A (zh) 编码装置、解码装置、编码方法和解码方法
JP7315480B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
CN111684805A (zh) 编码装置、解码装置、编码方法和解码方法
CN112889277A (zh) 编码装置、解码装置、编码方法和解码方法
CN110892720A (zh) 编码装置、编码方法、解码装置及解码方法
CN112292857A (zh) 编码装置、解码装置、编码方法和解码方法
CN114762347A (zh) 编码装置、解码装置、编码方法和解码方法
CN110692242A (zh) 编码装置、解码装置、编码方法和解码方法
CN113056909A (zh) 编码装置、解码装置、编码方法和解码方法
JP2024063232A (ja) 符号化装置及び符号化方法
CN112640465A (zh) 编码装置、解码装置、编码方法和解码方法
JP7401309B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
CN114521331A (zh) 编码装置、解码装置、编码方法和解码方法
CN114175663A (zh) 编码装置、解码装置、编码方法和解码方法
JP7479436B2 (ja) 復号装置及び復号方法
KR20210052464A (ko) 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법
CN111247806A (zh) 编码装置、解码装置、编码方法和解码方法
CN112640469A (zh) 编码装置、解码装置、编码方法和解码方法
WO2022234767A1 (ja) 符号化装置、復号装置、符号化方法、および復号方法
WO2023026645A1 (ja) 符号化装置、復号装置、符号化方法、および復号方法
JP7482864B2 (ja) 符号化装置、復号装置、符号化方法、および復号方法
WO2023013736A1 (ja) 符号化装置、復号装置、符号化方法、および復号方法